Diplomado en Análisis de Datos Ómicos con Python

Duración: 5 meses (150 horas)

Folio de validez oficial de la red SEP-CONOCER EC0301 y EC366

Inicio: 15 de diciembre del 2025

Modalidad: Online: Sincrónico (plataforma: ZOOM, lunes, martes y jueves de 6:00 pm a 80 pm, hora centro de México)

Idioma: Español

Profesor: Dr Eliel Ruiz May
Formación: Ing Bioquímico, D en C en Biotecnología en plantas
Trayectoria: SNII-2, 71+ artículos científicos, 8+ capítulos de libros
acerca del DIPLOMADO
El Diplomado tiene como objetivo capacitar a los participantes en el uso de herramientas computacionales básicas y avanzadas para procesar, analizar, visualizar y modelar datos ómicos —como datos genómicos, transcriptómicos, proteómicos y metabolómicos— utilizando el lenguaje de programación Python. Está diseñado principalmente para estudiantes de posgrado, técnicos, postdoctorantes e investigadores que desean incorporar Python en su flujo de trabajo cotidiano para el análisis de datos globales y de alta dimensión. El diplomado tiene una orientación práctica en un 70%, complementado con un 30% teórico que brinda los fundamentos necesarios para la correcta interpretación de los resultados. Los casos de aplicación están enfocados en biología, medicina, biotecnología y bioinformática. Se utilizará la distribución Anaconda. No se requieren conocimientos previos en programación, ya que el curso comienza desde lo esencial. Este diplomado busca que los participantes se familiaricen y dominen herramientas modernas de análisis reproducible, escalable y automatizable para abordar con confianza datos de alta complejidad en investigación biomédica y ciencias de la vida.
TEMARIO
Bloque 1.
1. Instalación y manejo de anaconda
a. Generación de diferentes ambientes
b. Instalación de paqueterías básicas, Pandas, Matplobit, Numpy etc, vía interfase anacondada o via Pip
2. Visualización de herramientas de trabajo, Sypder y VS code.
3. Instalación de Spyder (entorno de desarrollo integral, IDE, para programar en Python diseñado para científicos) y Visual Studio (VS) Code
4. Familiarización con la interfase de Spyder
5. Familiarización con la interfase de VS code
6. Introducción a padas para cargar, visualizar, editar y guardar bases de datos (marcos de datos). Puntos básicos para empezar a trabajar con datos ómicos
7. Introducción a matplobit para la visualización de gráficos en alta resolución. Se pretende generar gráficos básicos como gráficos de barra y de dispersión
8. Introducción a seaborn para la visualización de gráficos en alta resolución. Se pretende generar gráficos básicos como gráficos de barra y de dispersión
Bloque 2.
1. Imputación de datos omico mediante la implementación de diferentes estrategias incluyendo la eliminación de datos perdidos (dropna), Imputación de promedio (mean), imputación por regresión (Iterative Impute LR) y vecinos más cercanos (KNN)
2. Normalización de datos omicos mediante la implementación de diferentes estrategias incluyendo estandarización, normalización mínima-máxima, normalización por cuantiles, normalización robusta
3. Visualización de datos imputados y normalizados mediante graficas de violín, diagrama de cajas (box plots)
4. Implementación de script para la visualización de PCA-2D, PCA-3D, Biplots-2D y Biplots-3D
5. Toma de dedición para la selección de datos para estudios comparativos 6. Prácticas y tareas con datos propio de los participantes
Bloque 3.
1. Fundamentos de análisis estadísticos prueba de t de Student (T.TEST) y análisis de varianza (one-way ANOVA)
2. Implementación de protocolos para T.TEST y one-way ANOVA para análisis comparativos de datos omicos
3. Visualización de datos comparativos mediante graficas de volcano, mapas de calor (heatmaps), dot plots, 4. Fundamentos básicos de correlación cruzada (cross correlation)
5. Implementación de protocolos para la generación de datos asociados con la correlación cruzada y visualización de gráficos
6. Prácticas y tareas con datos propio de los participantes
Bloque 4.
1. Fundamentos de la reducción de la dimensionalidad mediante aproximaciones supervisadas y no supervisadas
2. Implementación de protocolos para la reducción de la dimensionalidad incluyendo el Análisis de Componente Principal (PCA), Aproximación y Proyección de Variedad Uniforme (UMAP), y t-SNE (t-distributed Stochastic Neighbor Embedding).
3. Fundamentos de estrategias de agrupamiento (clustering)
4. Aplicación de estrategias de agrupamiento incluyendo k-means, agrupamiento aglomerativo, agrupamiento jerarquice, y agrupamiento DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
5. Visualización de agrupamientos mediante gráficos 2D y 3D
6. Toma de decisiones para la selección de agrupamiento de interés
7. Prácticas y tareas con datos propio de los participantes
Bloque 5.
1. Fundamentos básicos de la interacción proteína-proteína
2. Familiarización con la base de datos STRING
3. Establecimientos de scripts para determinación de interacción de proteínas deseadas en organismos modelos y no modelos
4. Construcción de interactomics mediante la paquetería networkx considerando la generación de valores de centralidad y comunidades
5. Implementación de la visualización de interactomics con la paquetería networkx y gravis
6. Prácticas y tareas con datos propio de los participantes
Bloque 6.
1. Fundamente de enriquecimiento de términos ontológicos y agrupamientos de términos ontológicos
2. Establecimiento de scripts para el enriquecimiento de términos ontológicos
3. Herramientas de acceso libre para el enriquecimiento de términos ontológicos, DAVID, Shyny GO, gprofiler y PlantGSAD
4. Análisis funcionales mediante Metaboanalyst
5. Visualización de enriquecimientos
GO mediante gráficos de dotplots, y tree-maps
6. Prácticas y tareas con datos propio de los participantes
En este link puedes descargar el programa en PDF