Planificación de MinerÃa de Datos en Bioinformática (2020)
Información básica
Carrera |
IngenierÃa en Informática |
Departamento |
Formación Complementaria |
Sitio Web |
No especificada |
Plan de Estudios | |
Plan 2006 | |
Carácter | PerÃodo |
Cuatrimestral | 1° Cuatrimestre |
Docente Responsable | |
Georgina Silvia Stegmayer |
Equipo docente
Nombre y Apellido |
Milone, Diego Humberto |
Stegmayer, Georgina Silvia |
Carga horaria
Carga horaria total | 60 | hs |
TeorÃa | 20 | hs |
Resolución de ejercicios | 8 | hs |
Proyecto y diseño | 6 | hs |
Evaluaciones | 8 | hs |
Formación experimental | 6 | hs |
Resolución de problemas de ingenierÃa | 8 | hs |
Otras actividades | 4 | hs |
Contenidos mÃnimos
Dado el actual crecimiento de la cantidad de datos a analizar (la denominada “big-data”) en diversas áreas de aplicación, en particular la biología, la informática ha pasado a jugar un rol fundamental para el análisis, interpretación e inferencia de conocimiento a patir de esos datos. Esto se suma al auge actual de la disciplina bioinformática, en la cual se aplican técnicas de minería de datos para el análisis de datos de origen biológico (tales como expresión de genes, perfiles metabólicos, proteínas, entre otros). Existen muchos conceptos, metodologías y técnicas de la minería de datos que pueden potenciar y enriquecer las posibilidades que posee el alumno pronto a recibirse, sobre todo para enfrentar problemas en dominios que difieren de aquellos que tradicionalmente se desarrollan durante el dictado |
Objetivos
Objetivo general:
|
Conocimientos especÃficos previos para cursar la asignatura
Programación y cálculo básico. La optativa está pensada para alumnos de 4to y 5to año de Ing. en Informática. |
MetodologÃa de enseñanza
Las 4 horas semanales se distribuyen de la siguiente manera en: - 2 horas de clases prácticas: para afianzar el dominio de los tópicos discutidos, donde se presentan actividades de fijación, revisión e implementación de los conceptos vistos en las clases teóricas. Las prácticas serán orientativas para permitir el aprendizaje activo del alumno, se promoverá la discusión de soluciones y análisis de casos propuestos por los estudiantes.
|
Programa AnalÃtico
UNIDAD 1 – INTRODUCCION. |
Qué es la minería de datos. Qué es la Bioinformática. Antecedentes y |
UNIDAD 2 - DATOS BIOLOGICOS. |
Tipos y características particulares.. Bases de datos biológicas. |
UNIDAD 3 - MINERIA DE DATOS. |
Clustering. Técnicas y modelos de clustering. Agrupamiento Jerárquico. K-medias y Partición en torno a Medoides (PAM). Mapas auto-organizativos (SOM). Ensamble de clusters. Clasificación. Redes neuronales. Máquinas de vector soporte (SVM). |
UNIDAD 4 – VALIDACION DE RESULTADOS. |
Análisis estadístico de los resultados. Análisis de la varianza. Medidas de calidad en clustering. Medidas de validación externas e internas. Medidas de estabilidad en clustering. |
UNIDAD 5 – GENERACION DE NUEVO CONOCIMIENTO. |
Algoritmos de búsqueda de redes de relaciones. Búsqueda en profundidad y en amplitud, algoritmos evolutivos. Inferencia de redes metabólicas. Reconstrucción de redes de regulación entre genes a partir de mediciones temporales. |
BibliografÃa
BibliografÃa básica |
Russell, S., Norvig, P. |
R. Xu and D. C. Wunsch. |
G. Fogel and D. Corne, |
I. Witten & E. Franck |
Stegmayer, G., Gerard, M., Milone, D. |
E. Keedwell and A. Narayanan, |
Apuntes
Unidad | TÃtulo Apunte | Descripción | Descargar |
---|---|---|---|
UNIDAD 1 – INTRODUCCION. | Presentacion materia | Descargar | |
UNIDAD 2 - DATOS BIOLOGICOS. | Distancia entre genes | Descargar | |
UNIDAD 3 - MINERIA DE DATOS. | Clasificacion | Descargar | |
UNIDAD 3 - MINERIA DE DATOS. | Clustering | Descargar | |
UNIDAD 4 – VALIDACION DE RESULTADOS. | Validacion | Descargar | |
UNIDAD 5 – GENERACION DE NUEVO CONOCIMIENTO. | Algoritmos evolutivos | Descargar | |
UNIDAD 5 – GENERACION DE NUEVO CONOCIMIENTO. | Busqueda | Descargar |
Cronograma de actividades
Unidad 1. Introducción. Modalidad de cursado. Condiciones de regularidad. | Semana 1 | Tipo: T | Duración: 4 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 2. Explicación de los distintos tipos de datos biológicos. KEGG. Practica con genes y metabolitos su pre-procesamiento (normalización). | Semana 2 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 2. Explicación de los distintos tipos de datos biológicos. KEGG. Practica con genes y metabolitos su pre-procesamiento (normalización). | Semana 2 | Tipo: EP | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 2. Genes y GO. Anotaciones semánticas. Distancias. Práctica de cálculo de distinto tipo de matrices de distancias entre datos biológicos. | Semana 3 | Tipo: EP | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 2. Genes y GO. Anotaciones semánticas. Distancias. Práctica de cálculo de distinto tipo de matrices de distancias entre datos biológicos. | Semana 3 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 3. Clustering. Ensamble de clustering. Implementación y comparación de resultados en diferentes tipos de datos artificiales. | Semana 4 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 3. Clustering. Ensamble de clustering. Implementación y comparación de resultados en diferentes tipos de datos artificiales. | Semana 4 | Tipo: EP | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 3. Clasificación. Perceptrón multicapa y máquinas de vector soporte. A partir de secuencias: plegado, extracción de caracterÃsticas y clasificación de miRNAs. | Semana 5 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 3. Clasificación. Perceptrón multicapa y máquinas de vector soporte. A partir de secuencias: plegado, extracción de caracterÃsticas y clasificación de miRNAs. | Semana 5 | Tipo: EP | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Defensa Proyecto Integrador 1 | Semana 6 | Tipo: P/D | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Defensa PI 1 | Semana 6 | Tipo: PI | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Parcial 1: Unidades 1, 2 y 3 | Semana 7 | Tipo: E | Duración: 4 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Consultas | Semana 7 | Tipo: C | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 4. Validación de resultados. Estabilidad. Medidas. Implementación y práctica de las medidas sobre bases de datos artificias y reales disponibles. | Semana 8 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 4. Validación de resultados. Estabilidad. Medidas. Implementación y práctica de las medidas sobre bases de datos artificias y reales disponibles. | Semana 8 | Tipo: PL | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 4. Análisis estadÃstico de resultados. Implementación y práctica sobre bases de datos artificias y reales disponibles. | Semana 9 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 4. Análisis estadÃstico de resultados. Implementación y práctica sobre bases de datos artificias y reales disponibles. | Semana 9 | Tipo: PL | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 5. Reconstrucción de redes de regulación entre genes. Búsqueda de redes metabólicas con algoritmos evolutivos. | Semana 10 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 5. Reconstrucción de redes de regulación entre genes. Búsqueda de redes metabólicas con algoritmos evolutivos. | Semana 10 | Tipo: PL | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 5. Algoritmos clásicos de búsqueda. Búsqueda en profundidad, en amplitud. Búsqueda óptima y completa. Práctica de búsqueda de relaciones entre un conjunto de metabolitos y genes. | Semana 11 | Tipo: T | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Unidad 5. Algoritmos clásicos de búsqueda. Búsqueda en profundidad, en amplitud. Búsqueda óptima y completa. Práctica de búsqueda de relaciones entre un conjunto de metabolitos y genes. | Semana 11 | Tipo: P/D | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Defensa Proyecto Integrador 2 | Semana 12 | Tipo: PI | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Consulta | Semana 12 | Tipo: C | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Defensa Proyecto Integrador 2 | Semana 12 | Tipo: P/D | Duración: 2 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Parcial 1: unidades 4 y 5. | Semana 13 | Tipo: E | Duración: 4 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
Coloquio Final Integrador | Semana 15 | Tipo: PI | Duración: 4 hs |
Docente/s responsable/s: Georgina Silvia Stegmayer, Georgina Silvia Stegmayer | |||
Descripción: | |||
Observaciones: |
GuÃas de actividades
Actividad | TÃtulo | Descripción | Descargar |
---|---|---|---|
Unidad 2. Genes y GO. Anotaciones semánticas. Distancias. Práctica de cálculo de distinto tipo de matrices de distancias entre datos biológicos. | Distancia genes. | Descargar | |
Unidad 3. Clustering. Ensamble de clustering. Implementación y comparación de resultados en diferentes tipos de datos artificiales. | Clustering practica | Descargar |
Requerimientos para regularizar
Alumno regular: El alumno queda regular cuando cumple con: |
Requerimientos para promover
Promoción directa sin examen final: Para alcanzar la promoción de la asignatura los alumnos deberán cumplir las siguientes condiciones y actividades: |
Examen final
Alumnos regulares |
Escrito individual |
Alumnos libres |
Dos TP practicos, una actividad practica integradora y un examen integrador escrito individual. |
Evaluaciones
Fecha | Tipo | Modalidad | Descripción |
---|---|---|---|
29-04-2020 | Trabajo Práctico | Oral | Defensa Proyecto Integrador parte I. |
06-05-2020 | Parcial | Escrita | Parcial 1: unidades 1, 2 y 3. |
03-06-2020 | Trabajo Práctico | Oral | Defensa Proyecto Integrador parte 2. |
10-06-2020 | Parcial | Escrita | Parcial 2: unidades 4 y 5. |
17-06-2020 | Coloquio | Oral | Coloquio final integrador. |
17-06-2020 | Recuperatorio | Escrita | Recuperatorios. |