Home Teaching - Bioinformatics September 02, 2010   

Bioinformática

Objetivo general
  • El objetivo de este curso es que el estudiante adquiera los conocimientos y habilidades necesarios para efectuar el análisis computacional de datos biológicos, con el fin de enunciar predicciones funcionales o estructurales sobre los mismos. Para ello durante el curso se abordarán las principales áreas de la Bioinformática: bases de datos biológicas, alineamiento de secuencias, predicción de genes y promotores, filogenética molecular, bioinformática estructural, genómica y proteómica.
Contenido temático
  • Introducción a la Bioinformática
  • Bases de datos biológicas
  • Alineamiento de secuencias
  • Predicción de genes y promotores
  • Filogenética molecular
  • Bioinformática estructural
  • Genómica y proteómica
Lineamientos de evaluación
  • Tareas y trabajos de investigación, 40%
  • 6 exámenes, 30%
  • Proyecto final, 30%
Bibliografía
  • Jin Xiong. Essential Bioinformatics. Cambridge University Press, 1st edition (March 13, 2006), ISBN-10: 0521600820.
  • Neil C. Jones and Pavel A. Pevzner. An Introduction to Bioinformatics Algorithms. The MIT Press; 1st edition (August 1, 2004), ISBN-10: 0262101068.
  • Cynthia Gibas and Per Jambeck. Developing Bioinformatics Computer Skills. O'Reilly Media, Inc., 1st edition (April 15, 2001), ISBN-10: 1565926641.
Calendario de exámenes
Examen Fecha Temas
1 20/05/2010
  • Conceptos básicos de biología molecular
  • Bases de datos biológicas
2 08/06/2010
  • Alineamiento de pares de secuencias
  • Búsqueda de similitud en bases de datos
  • Alineamiento múltiple de secuencias
  • Perfiles y modelos ocultos de Markov
3 17/06/2010
  • Predicción de motivos y dominios en proteínas
  • Predicción de genes
  • Predicción de promotores y elementos reguladores
4 13/07/2010
  • Conceptos básicos de filogenética molecular
  • Construcción de árboles filogenéticos: Métodos basados en distancias
  • Construcción de árboles filogenéticos: Métodos basados en Parsimonia
  • Construcción de árboles filogenéticos: Métodos basados en Verosimilitud
5 22/07/10
  • Conceptos básicos de bioinformática estructural
  • Visualización, comparación y clasificación de estructuras de proteínas
  • Predicción de estructuras secundarias de proteínas
  • Predicción de estructuras terciarias de proteínas
  • Predicción de estructuras de ARN
6 03/08/10
  • Examen final acumulativo

Material de clase
Sesión Fecha Tema Material
1 06/05/10 Presentación del curso
Introducción a la Bioinformática
Conceptos básicos de biología molecular, I
Tarea 1: Leer el siguiente artículo y preparar una síntesis (en Latex) en máximo 5 páginas. Es indispensable que proporcione sus conclusiones personales (en al menos una página).

Jacques Cohen, Bioinformatics: An introduction for computer scientists. ACM Computing Surveys, Volume 36, Issue 2, pages 122-158 (June 2004).

Fecha de entrega: 13 de mayo antes de las 8h00
.
2 11/05/10 Conceptos básicos de biología molecular, II
Lecturas recomendadas:
  • Secciónes 3.8 a 3.11 del libro de Jones y Pevzner, An Introduction to Bioinformatics Algorithms (ver diapositivas 4 y 5 de la presentación del curso)
  • El libro de Gonick y Wheelis. The Cartoon Guide to Genetics
.
- 13/05/10 Suspensión .
3 18/05/10 Bases de datos biológicas
- 20/05/10 Examen 1 .
4 25/05/10 Alineamiento de pares de secuencias
Lectura recomendada:
  • Páginas 38 a 49 del libro de Xiong, sobre Penalización de huecos, Matrices de puntajes y Validez estadística del alineamiento de secuencias
.
Tarea 2: Implemente en el lenguaje de su preferencia el algoritmo de programación dinámica para alineamiento de pares de secuencias visto en clase. El algoritmo recibe como entrada dos secuencias (posiblemente de longitudes diferentes) tomadas de una BD biológica disponible en Internet y regresa el mejor alineamiento así como su puntaje.
Debera entregar el código fuente documentado y un reporte (en Latex) indicando los detalles de su implementación y las instrucciones para utilizarlo.

Fecha de entrega: 1 de junio antes de las 8h00
.
5 27/05/10 Búsqueda de similitud en bases de datos
Tarea 3: Utilizando la siguiente plantilla prepare en equipo una presentación que cubra el material del capítulo 6, 7 u 8 del libro de texto

Fechas de entrega: 3, 8 y 10 de junio
6 01/06/10 Alineamiento múltiple de secuencias
Tarea 4: Proponga una fórmula para encontrar el número de palabras de 3 caracteres en una cadena de longitud n. Pruebe por inducción dicha fórmula.

Fechas de entrega: 3 de junio antes de las 8h00
.
7 03/06/10 Perfiles y modelos ocultos de Markov
Examen 2: Lectura del capítulo 11 del libro de Jones y Pevzner sobre modelos ocultos de Markov. Solucionar los problemas 11.2, 11.3 y 11.4

Fechas de entrega: 8 de junio antes de las 8h00
.
8 08/06/10 Predicción de motivos y dominios en proteínas
9 10/06/10 Predicción de genes
10 15/06/10 Predicción de promotores y elementos reguladores
Tarea 5: Implemente en el lenguaje de su preferencia los siguientes algoritmos: Fuerza Bruta, Branch & bound y Descenso en profundidad (Steepest descent) para resolver el problema de la cadena mediana (median string problem). La entrada a estos algoritmos debe ser una lista de secuencias de ADN (en formato FASTA) y un parámetro entero w, que denota la longitud del motivo que el algoritmo buscará. La salida es otro conjunto de secuencias, cada una compuesta de w caracteres.
Deberá entregar el código fuente documentado y un reporte (en Latex) indicando los detalles de su implementación, las instrucciones para utilizarlo y un estudio experimental comparando los tres algoritmos mediante al menos 10 casos de prueba de tamaños diferentes.

Fecha de entrega: 22 de junio antes de las 8h00
.
11 17/06/10 Conceptos básicos de filogenética molecular
Lectura recomendada:
  • Whelan, S., Lio, P and Goldman, N. 2001. Molecular phylogenetics: State of the art methods for looking into the past. Trends Genet. 17:262-72.
.
Examen 3 .
12 22/06/10 Construcción de árboles filogenéticos: Métodos basados en distancias
- 24/06/10 Exposición sobre el artículo Generalized Gene Adjacencies, Graph Bandwidth, and Clusters in Yeast Evolution. Qian Zhu, Zaky Adam, Vicky Choi, and David Sankoff. IEEE/ACM Transactions on Computational Biology and Bioinformatics, Vol. 6, No. 2, pag. 213-220, 2009.
- 29/06/10 Suspensión .
- 01/07/10 Suspensión .
13 06/07/10 Construcción de árboles filogenéticos: Métodos basados en caracteres (Parsimonia y Verosimilitud)
Tarea 6: Utilizando la siguiente plantilla prepare una presentación que cubra el material de uno de los capítulos del 13 al 19 del libro de texto

Fechas de entrega: 12, 13, 15, 20, 22, 27 y 29 de julio.
Tarea 7: Implemente en el lenguaje C de programación un algoritmo de descenso estricto (hillclimbing) para el problema de máxima parsimonia con las siguientes funciones de vecindad: Nearest Neighbor Interchange (NNI), Subtree Pruning Regrafting (SPR), and Tree-Bisection-Reconnection (TBR). Verifique los detalles en las diapositivas 45-49 de la presentación de la sesión 13.

Fecha de entrega: 20 27 29 de julio antes de las 8h00
.
14 08/07/10 Conceptos básicos de bioinformática estructural
15 12/07/10 Visualización, comparación y clasificación de estructuras de proteínas
Lectura recomendada:
  • MINRMS: an efficient algorithm for determining protein structure similarity using root-mean-squared-distance. Andrew I. Jewett, Conrad C. Huang and Thomas E. Ferrin. Bioinformatics Vol. 19 no. 5, pages 625-634, 2003.
16 13/07/10 Predicción de estructuras secundarias de proteínas
Lectura recomendada:
  • Bidirectional Recurrent Neural Networks. Mike Schuster and Kuldip K. Paliwal. IEEE Transactions On Signal Processing, Vol. 45, No. 11, pages 2673-2681, 1997.
  • Training Neural Networks for Protein Secondary Structure Prediction: The Effects of Imbalanced Data Set. Viviane Palodeto, Hernán Terenzi, and Jefferson Luiz Brum Marques. In D.S. Huang et al. (Eds.): ICIC 2009, LNAI 5755, pp. 258-265, 2009.
Examen 4 .
17 15/07/10 Predicción de estructuras terciarias de proteínas
Lectura recomendada:
  • The Genetic Algorithm Approach to Protein Structure Prediction. Ron Unger. Structure and Bonding, Vol. 110 (2004): 153-175.
18 20/07/10 Predicción de estructuras de ARN
Lectura recomendada:
  • RNA Secondary Structure Prediction Based on Forest Representation and Genetic Algorithm. Taotao Zhang, Maozu Guo and Quan Zou. Proceedings of the Third International Conference on Natural Computation (ICNC 2007), pp. 370-374, 2007.
19 22/07/10 Mapeo, ensamblaje y comparación de genomas
Examen 5 .
20 27/07/10 Genómica funcional
21 29/07/10 Proteómica
22 03/08/10 Examen 6 .
23 10/08/10 Avance 01 del proyecto final (primera parte) .
24 12/08/10 Avance 01 del proyecto final (segunda parte) .
25 19/08/09 Avance 02 del proyecto final (por correo electrónico) .
26 26/08/10 Entrega del proyecto final completo (código, reporte y artículo en inglés) .



® 2009 Eduardo Rodriguez-Tello