Información



TOPICOS SELECTOS DE BASES DE DATOS

CINVESTAV-Tamaulipas
Instructor:  Dr. Ví­ctor J. Sosa Sosa

         email:  vjsosa(at)tamps.cinvestav.mx

Antecedentes:


Las Bases de Datos (BD), si bien representan a una tecnología que ya cuenta con más de 40 años de historia, aún sigue desarrollándose y diversificándose. La razón de este desarrollo continuo se debe principalmente a que en la actualidad las BD abordan problemas en los que se integran tecnologí­as que tienen una amplia aceptación, entre ellas podemos mencionar la tecnologí­a de Orientación a Objetos, presente en las BD Orientadas a Objetos (BDOO), la tecnologí­a de Redes de Computadoras, presente en las BD Distribuidas (BDD), la tecnologí­a de Georeferenciación y Vectorización encontradas en las BD Espaciales utilizadas en los Sistemas de Información Geográfica (SIGs), las tecnologías de acceso a información semi-estrucutrada y la Web soportadas por las BD XML, las tecnologí­as para gestión de grandes almacenes de datos reflejada en las BD Multidimencionales, etc. Dado que el universo en el que se desenvuelven las BD es muy extenso, serí­a imposible tratar de cubrirlo en un sólo curso, por lo que este curso se diseña con el fin de abordar algunos Tópicos Selectos, en donde la selección y profundidad de cada tema se ajusta de acuerdo a criterios de relevancia, actualidad y pertinencia emanados de necesidades que surgen de los trabajos de investigación generados en el Cinvestav en el Área de BD .



Objetivo:


Familiarizar a los estudiantes con los fundamentos, las bondades, problemas y retos que hay detrás de las BDs actuales al momento de relacionarse con tecnologías como las Redes de Computadoras, la Orientación a Objetos, las tecnologías de Georeferenciación, el manejo de Almacenes de Datos, la Web y el manejo de datos semi estructurados (XML) y no estructurados.  



 Contenido:

El curso de divide en temas principales en los que se profundizará acorde a las necesidades particulares  de investigación en el área.

Tema I.  Bases de Datos Distribuidas (BDD)

    1.1 Fundamentos de los Sistemas de BDD (SBDD)
    1.2 Arquitectura Cliente/Servidor
          1.2.1 Ejemplo de Java JDBC
    1.3 Diseño de BDD
    1.4 Procesamiento de consultas
    1.5 Manejo de Transacciones


Tema II. Bases de Datos Semi-estructuradas (XML)

   III.1 Definición de datos semi-estructurados
   III.2 Introducción a XML
   III.3 Consultando datos con XPath, XQuery y SQL/XML
   III.4 Motores de consulta XML
  - Breve Introducción y Bibliografía para Bases de Datos XML aquí
  - Página de Ronald Bourret (XML Databases)

Tema III. Creación y Explotación de Almacenes de Datos (DW)

  IV.1 Introducción a los Almacenes de Datos
  IV.2 Procesamiento Analítico en Línea (OLAP)
  IV.3 Modelos de Datos: ROLAP, MOLAP, HOLAP
  IV.4 Operadores Multidimensionales
  IV.5 Minería de Datos
  Info. Adicional: Presentación de Ricardo Bernabeu y Mariano Garcia (DW-BI-Intro)

Tema IV. Sistemas de Información Geográfica (SIG)

  V.1 Fundamentos
  V.2 Componentes de un SIG
  V.3 Estándares
  V.4 Aplicaciones

Tema V. Bases de Datos Objetos-Relacional

  VI.1 Introducción a los Sistemas de Bases de Datos Orientadas a Objetos
  VII.2 Abstracción de Datos
  VII.3 Modelo Orientado a Objetos
  VII.4  Propuestas de Sistemas Gestores de BDOO

Tema VI. Bases de Datos P2P (Exposición)

  VI.1 Introducción a los Servicios de Gestión de Datos en Redes P2P
  VII.2 Infraestructura
  VII.3 Mapeo de Esquemas en Sistemas P2P
  VII.4  Procesamiento de Consultas en Sistemas P2P

Tema VII. Gestión de Datos en la Web  (Exposición)

  VI.1 Introducción a Gestión de Datos en la Web
  VII.2 Manejo de BD en forma de grafos
  VII.3 Recolección y Búsqueda de información en la Web

Tema para Exposición Especial:
* Integración de Datos (ID)

 Evaluación:

Tareas:  30%
Exposiciones: 10%
Examen: 30%
Proyecto final: 30%

Software:

* Servidores de Bases de Datos:  MySQLOracle Express, SQL Server Express, DB2 Express-C.
* XML Engines: Oracle Berkeley DB XMLXbirdeXist-dbQizx
* Software abierto para crear y explotar almacenes de datos: Pentaho
* Máquina Virtual Java con JSDK

* Servidor de aplicaciones Tomcat

* Conector JDBC
* EDIs:  Netbeans  Eclipse


Bibliografía:

[Ozsu 11] Tamer Özsu and Patrick Valduriez. Principles of Distributed Database Systems, 3rd Edition Springer. ISBN-10: 1441988335. Mar 12, 2011.

[Molina 08] Garcia-Molina, Hector; Ullman, Jeffrey D.; Widom, Jennifer D.DATABASE SYSTEMS The Complete Book. Prentice Hall. ISBN: 0130980439. 2008.

[Powell 06] Gavin Powell. Beginning XML Databases. Wrox Publisher. ISBN-10: 0471791202. ISBN-13: 978-0471791201. 2006.

[Han 11] Jiawei Han, Micheline Kamber and Jian Pei. Data Mining: Concepts and Techniques (3er. Edition). Publisher Morgan Kaufmann; July 8, 2011. ISBN-10: 0123814790.  ISBN-13: 978-0123814791.

[Witten 11] Ian H. Witten, Eibe Frank and Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques (3er. Edition). Publisher Morgan Kaufmann. Jan. 20, 2011. ISBN-10: 0123748569.  ISBN-13: 978-0123748560.

[Dunren 06] Dunren Che, Karl Aberer and Tamer Özsu. Query optimization in XML structured-document databases. The International Journal on Very Large Data Bases. Volume 15 ,  Issue 3  (September 2006).  Pages: 263 - 289.  ISSN:1066-8888. Springer-Verlag New York, Inc.  Secaucus, NJ, USA .  2006

[Surajit 01] Surajit Chaudhuri and Kyuseok Shim. Storage and Retrieval of XML Data Using Relational Databases. Proceedings of the 27th International Conference on Very Large Data Bases. pag.730-740. 2001. ISBN:1-55860-804-4. Morgan Kaufmann Publishers Inc.  San Francisco, CA, USA

[Brown 00] Paul Geoffrey Brown. Object-Relational Database Development: A Plumber's Guide. Prentice Hall. ISBN-10: 0130194603. ISBN-13: 978-0130194602. 2000.

[Ozsu 98] Öszu, Tamar and Valduriez, P. Principles of Distributed Database Systems 2nd Ed. Prentice Hall, 1998.

[Bell 92] Bell, D. A. and Grimson, J. B. Distributed Database Systems. Addisson-Wesley, 1992.

[Janert 10] Philipp K. Janert. Data Analysis with Open Source Tools. Publisher: O'Reilly Media; 1 edition (November 25, 2010). ISBN-10: 0596802358. ISBN-13: 978-0596802356.

[Dua 11] Sumeet Dua and Xian Du. Data Mining and Machine Learning in Cybersecurity. Auerbach Publications; 1 edition (April 25, 2011). ISBN-10: 1439839425. ISBN-13: 978-1439839423.

[Mamoulis 09] N. Mamoulis, T. Seidl, Torben B. Pedersen, K. Torp and I. Assent. Advances in Spatial and Temporal Databases: 11th International Symposium, SSTD 2009 Aalborg, Denmark. Lectures Notes in Computer Science. Springer. 2009.

[Ceri 84] Ceri, S. and Pelagatti, G. Distributed Databes - Principles and Systems. McGraw Hill, 1984.

[Elmagarmid 90] Elmagarmid, A. K. and Pu, C. (guest eds.) ACM Computing Surveys. Special issue on heterogeneous databases, September 1990, 22(3).

[Ozsu 91] Öszu, Tamar and Valduriez, P. "Distributed Database Systems: where are we now?", IEEE Computer, August 1991, 24(8).