Diplomado en Análisis de Datos Ómicos con Python

Duración: 5 meses (150 horas)

Folio de validez oficial de la red SEP-CONOCER EC0301 y EC366

Inicio: 18 de agosto del 2025

Modalidad: Online: asincrónico (plataforma: https://pharbiois.milaulas.com/

Idioma: Español

Profesor: Dr Eliel Ruiz May
Formación: Ing Bioquímico, D en C en Biotecnología en plantas
Trayectoria: SNII-2, 71+ artículos científicos, 8+ capítulos de libros
acerca del DIPLOMADO
El Diplomado tiene como objetivo capacitar a los participantes en el uso de herramientas computacionales básicas y avanzadas para procesar, analizar, visualizar y modelar datos ómicos —como datos genómicos, transcriptómicos, proteómicos y metabolómicos— utilizando el lenguaje de programación Python. Está diseñado principalmente para estudiantes de posgrado, técnicos, postdoctorantes e investigadores que desean incorporar Python en su flujo de trabajo cotidiano para el análisis de datos globales y de alta dimensión. El diplomado tiene una orientación práctica en un 70%, complementado con un 30% teórico que brinda los fundamentos necesarios para la correcta interpretación de los resultados. Los casos de aplicación están enfocados en biología, medicina, biotecnología y bioinformática. Se utilizará la distribución Anaconda. No se requieren conocimientos previos en programación, ya que el curso comienza desde lo esencial. Este diplomado busca que los participantes se familiaricen y dominen herramientas modernas de análisis reproducible, escalable y automatizable para abordar con confianza datos de alta complejidad en investigación biomédica y ciencias de la vida.
TEMARIO
-Presentación del diplomado y examen diagnóstico
MÓDULO 1: EL PROGRAMA RSTUDIO HERRAMIENTA EFICAZ PARA EL APRENDIZAJE ESTADÍSTICO
Semana 1: Manipulación de datos en R (10 horas)
o Breve introducción de R
o Descarga e instalación de R
o El medioambiente R (interface de comandos en R y Rstudio)
- Instalación y descarga de paquetes
- Aspectos básicos de R
- Vectores
- Matrices
- Arreglos
- data.frames
o Lectura de datos
- Datos de archivos csv, txt
- Datos disponibles en R
- Datos disponibles en paquetes e internet
o Manejo de base de datos
- Generación y modificación de variables
- Aplicación de filtros
- Unión de base de datos
Semana 2: Programación con R y estadística descriptiva (10 horas)
o Uso de sentencias if, else
o Uso de bucles for, while
o Estructura de programación en R
o Interactuando con R
o Conceptos básico de estadística
Población, muestra
Tipos de variables
Estadístico, parámetro
o Medidas de tendencia central
o Medidas de variabilidad
o Medidas de asimetría
o Interpretación de un caso de estudio
Semana 3: Probabilidad y simulación (10 horas)
o Nociones de probabilidad
o Simulación de eventos
o Variables aleatoria
o Principales variables aleatorias discretas
o Principales variables aleatorias continuas
Semana 4: Gráficos en R y muestreo estadístico (10 horas)
o Gráficos básicos
- Histogramas
- Boxplots
o Gráficos con ggplot2
o Muestreo estadístico
- Muestreo aleatorio simple
- Muestreo estratificado
- Muestreo por conglomerados
MÓDULO 2: ANÁLISIS INFERENCIAL PARA LA TOMA DE DECISIONES
Semana 5: Estadística inferencial (10 horas)
o Pruebas de hipótesis para un parámetro
o Prueba de hipótesis para dos parámetros
o Prueba de hipótesis para u vector de parámetros
o Correlación y regresión lineal simple
Semana 6: Estadística no paramétrica (10 horas)
o Pruebas de hipótesis para un parámetro
o Prueba de hipótesis para dos parámetros
o Correlación y regresión lineal simple
Semana 7: Diseños Experimentales (10 horas)
o Diseños completamente al azar
o Diseño de bloques
o Diseño factorial
o Otros diseños experimentales
MÓDULO 3: MÉTODOS MULTIVARIADOS PARA DESCUBRIR PATRONES Y
RELACIONES EN LOS DATOS
Semana 8: Modelo de regresión más utilizados (10 horas)
o Regresión lineal múltiple
o Regresión logística binaria
o Regresión logística multinomial
o Regresión logística ordinal
Semana 9: Métodos multivariados no supervisados (10 horas)
o Análisis factorial
o Análisis clúster
o Reducción de variables y observaciones bajo presencia de
variables cualitativas
Semana 10: Análisis de series de tiempo (10 horas)
o Preparación de datos en R
o Métodos clásicos
o Método Holt Winters
o Método Box Jenkins (ARIMA y SARIMA)
Modalidad de estudio
El curso se desarrolla de manera asincrónica en donde se explica a través de videos y materiales como word, ppt, pdf y scripts, acerca de los temas presentados. Durante cada semana de clase el estudiante deberá dedicar 10 horas para su aprendizaje. Para aprobar el curso el estudiante deberá desarrollar las taras de conocimiento semanales de los métodos aprendidos y un trabajo encargado en cada módulo.
Nota: Se califica con actividades en google classroom (70%) y ejercicio final y/o exámen (30%), la constancia se entrega con calificación numérica de 1-10.
En este link puedes descargar el programa en PDF