Uploaded by Jessie Joe Chavez Silva

mit-programa-ciencia-de-datos-aprendizaje-automatico

advertisement
CIENCIA DE DATOS Y
APRENDIZAJE AUTOMATICO:
TOMA DE DECISIONES
BASADA EN DATOS
Comienza a tomar decisiones basadas en datos con el
programa de 12 semanas impartido por profesores del MIT.
SOBRE EL
MIT IDSS
La educación y la investigación en el MIT Institute for Data, Systems, and Society – o Instituto de Datos, Sistemas y
Sociedad (IDSS) - son llevadas a cabo con el objetivo de proporcionar soluciones a desafíos sociales complejos mediante
la comprensión y el análisis de datos. Así, el Instituto apuesta por el desarrollo de métodos analíticos que puedan ser
aplicados a diversas áreas como las finanzas, sistemas de energía, la urbanización, las redes sociales y la salud.
MIT IDSS abarca la colisión y síntesis de tanto ideas como métodos de disciplinas analíticas incluyendo la estadística,
ciencia de datos, teoría e inferencia de la información, teoría de sistemas y control, optimización, economía,
comportamiento humano y redes. Todas estas disciplinas son relevantes tanto para comprender sistemas complejos
como crear arquitecturas y diseños que permitan la cuantificación y administración.
MISION
La misión del MIT IDSS es promover la educación y la investigación de métodos analíticos en sistemas de información
y decisión, estadística y ciencia de datos, ciencias sociales y aplicar estos métodos para abordar desafíos sociales
complejos en un conjunto diverso de áreas como finanzas, sistemas de energía, urbanización, redes sociales y salud.
Los avances tecnológicos en áreas como sensores inteligentes, big data, comunicaciones, computación y redes sociales
están escalando rápidamente el tamaño y la complejidad de los sistemas y redes interconectados y, al mismo tiempo, están
generando grandes cantidades de datos que pueden conducir a nuevos conocimientos y comprensión.
02
SOBRE
EL PROGRAMA
La demanda de profesionales expertos en datos, análisis y aprendizaje automático está aumentando. Según
un informe de la Oficina de Estadísticas Laborales de EE. UU., la demanda de ciencia de datos aumentará y
creará 11,5 millones de nuevos puestos de trabajo para 2026. Los científicos de datos aportan valor a
organizaciones de todas las industrias porque pueden resolver desafíos complejos e impulsar
importantes procesos de toma de decisiones.
El MIT Instituto de Datos, Sistemas y Sociedad (IDSS) entiende el poder de descubrir el valor de los datos,
por lo que ha creado una gran variedad de cursos y programas en línea para llevar tus habilidades de análisis
de datos al siguiente nivel. Ya sea que estés buscando comenzar en el área, buscando oportunidades de
desarrollo profesional o simplemente quieras brindar información de valor a tu empresa, los programas del
MIT IDSS te enseñarán a aprovechar los datos de nuevas e innovadoras formas.
03
BENEFICIOS DEL
PROGRAMA
Trabaja en un sólido entorno
de colaboración para crear redes con
tus compañeros de programa.
Aprende en línea de 11 renombrados
profesores del MIT.
Obtén un certificado de finalización del programa
por parte de MIT IDSS.
Impulsa tu carrera con sesiones de revisión
de CV y LinkedIn. Demuestra tu experiencia
Obtén tutoría por parte de expertos de la industria
y dominio en ciencia de datos con un portafolio
sobre las aplicaciones de la ciencia de datos
de 3 proyectos y más de 15 casos de estudio.
en el mundo real.
ESTRUCTURA
DEL PROGRAMA
SEMANA 1 y 2
SEMANA 3
Obtén más de 30 horas de conferencias grabadas por
parte de los profesores del MIT IDSS, sesiones guiadas
con expertos de la industria, junto con proyectos
prácticos y sesiones conceptuales, estructurados de la
siguiente manera:
Cursos básicos: Python y estadísticas para ciencia de datos
Agrupamiento, agrupamiento espectral, componentes e incrustaciones:
Sesiones, casos de estudio prácticos y cuestionarios
SEMANA 4
Descanso de aprendizaje
Sesión conceptual: dar sentido a los datos no estructurados, así como regresión y predicción
SEMANA 5 y 6
SEMANA 7
Aprendizaje supervisado y no supervisado: regresión, prueba de hipótesis
y clasificación
Descanso de aprendizaje
Sesión conceptual: clasificación y prueba de hipótesis
SEMANA 8 y 9
SEMANA 10
Aprendizaje profundo y sistemas de recomendaci6n: redes neuronales, filtrado
colaborativo y técnicas de recomendación personalizadas a través de sesiones, estudio de
casos prácticos y cuestionarios
Descanso de aprendizaje
Sesión conceptual: aprendizaje profundo y sistemas de recomendación
SEMANA 11 y 12
Redes y análisis predictivo: modelos gráficos, modelado predictivo y
técnicas de ingeniería de características a través de sesiones, estudios de casos prácticos y cuestionarios
Nota: Las sesiones conceptuales ayudan a los alumnos a solidificar los conceptos aprendidos en el contenido de video de
la semana o como una sesión preparatoria para las próximas sesiones. Esto también ayuda a los alumnos a preparar sus
preguntas para la sesión en vivo de fin de semana con el experto en la industria.
04
¿PARA QUIÉN ES EL PROGRAMA?
Científicos de datos, analistas de datos y profesionales en activo que deseen extraer conocimientos prácticos
a partir de grandes volúmenes de datos.
Debido a la naturaleza del programa, se adecúa tanto para profesionales con poca experiencia como para
altos directivos, incluyendo directores de tecnología, analistas de inteligencia de negocio, gerentes de ciencia
de datos, entusiastas de la ciencia de datos, profesionales de Tl, consultores y gerentes de empresas.
Para aquellos que cuentan con alguna formación académica o profesional en matemáticas aplicadas y
estadística, les resultará más fácil el aprendizaje. Sin embargo, todos los participantes pueden aprovechar al
máximo el programa aprendiendo sobre estos temas con el apoyo de Great Learning.
DESPUÉS DE ESTE CURSO
SERAS CAPAZ DE:
Comprender las complejidades de
Seleccionar la mejor forma para representar
técnicas de ciencia de datos y sus
datos al hacer predicciones.
aplicaciones a problemas del mundo real.
Comprender la teoría detrás de los sistemas
lmplementar varias técnicas de aprendizaje
de recomendación y explorar sus aplicaciones
automático para resolver problemas complejos y
en múltiples industrias y contextos empresariales.
tomar decisiones de negocio basadas en datos.
Crear un portafolio listo con proyectos para
Explorar dos áreas del aprendizaje automático:
demostrar tu capacidad de extraer insights e
aprendizaje profundo y redes neurales. Además
información empresarial de datos.
de cómo pueden ser aplicadas a áreas como
la visión computarizada.
05
PLAN DE ESTUDIOS DEL
PROGRAMA
El programa tiene una duración de 12 semanas:
SEMANA 1 - 2
Cursos básicos: Python y estadísticas para la ciencia de datos
Python para ciencia de datos
Estadística para la ciencia de datos
Numpy
Estadística descriptivas
Pandas
Estadística inferencial
Visualización de datos
Caso de estudio 1: análisis de la Copa Mundial de la FIFA
Caso de estudio 2: análisis de pasos de usuarios de
Evaluación: proyecto Movielens
productos de fitness
Evaluación: proyecto Movielens
SEMANA 3
Dar sentido a los datos no estructurados
Introducción
¿Qué es el aprendizaje no supervisado y por qué es un desafío?
Ejemplos de aprendizaje no supervisado
Agrupación
¿Qué es la agrupación?
Cuando usar la agrupación en clústeres
Preliminares de K-means
El algoritmo K-means
¿Cómo evaluar a agrupación?
K-means: ¿Qué es lo que realmente hace un clúster?
Mas allá de K-means: otras nociones de distancia
Mas allá de K-means: datos y preprocesamiento
Mas allá de K-means: big data y Bayes no paramétrico
Mas allá de la agrupación
Caso de estudio 1: códigos genéticos
Caso de estudio 2: encontrar temas en la descripción del proyecto
06
Agrupación espectral, componentes e incrustaciones
¿Qué pasa si no tenemos características para describir los datos o no todos son
significativos?
Encontrar los componentes principales en datos y aplicaciones
La magia de los vectores propios I
Agrupamiento en gráficos y redes
Características de los gráficos: la magia de los vectores propios II
Agrupación espectral
Agrupación de modularidad
Incrustaciones: nuevas características y su significado
Caso de estudio 3: PCA - identificación de rostros
Caso de estudio 4: agrupación espectral - agrupación de noticias
SEMANA 4
DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre dar sentido a los datos no estructurados
07
SEMANA 5
Regresión y predicción
Regresión y extensiones clásicas lineales y no lineales
Regresión lineal con una y varias variables
Regresión lineal para predicción
Regresión lineal para inferencia causal
Logística y otros tipos de regresión no lineal
Caso de estudio 1: predicción de salarios 1
Caso de estudio 2: brecha salarial de género
Regresión moderna con datos de alta dimensión
Hacer buenas predicciones con datos de alta dimensión
Sobreajuste por validación y validación cruzada
Regularización por Lasso, Ridge y sus modificaciones
Árboles de regresión, bosque aleatorio y árboles potenciados
Caso de estudio 3: ¿Los países pobres crecen más rápido que los países ricos?
El uso de la regresión moderna para la inferencia causal
Ensayos de control aleatorizados
Estudios observacionales con confusión
Caso de estudio 4: predicción de salarios 2
Caso de estudio 5: el efecto de la posesión de armas en las tasas de homicidio
08
SEMANA 6
Clasificación y prueba de hipótesis
·
·
·
·
·
·
·
Clasificación y prueba de hipótesis
¿Qué son las anomalías? ¿Qué es el fraude? ¿Spam?
Clasificación binaria: falso positivo/negativo, precisión/recuperación y puntuación F1
Regresión logística y probit: clasificación binaria estadística
Prueba de hipótesis: prueba de razón y valores p de Neyman-Pearson; confianza
Maquina de vectores de soporte: clasificador no estadístico
Perceptrón: clasificador simple con interpretación elegante
Caso de estudio 1: regresión logística - el desastre del Challenger
SEMANA 7
DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre clasificación y prueba de hipótesis
SEMANA 8
Aprendizaje profundo
·
·
·
·
·
·
·
·
·
·
¿Qué es la clasificación de imágenes? Presentación ImageNet y ejemplos
Clasificación utilizando un único umbral lineal (perceptrón)
Representaciones jerárquicas
Ajuste de parámetros usando retro propagación
Funciones no convexas
¿Qué tan interpretables son sus características?
Manipulación de redes profundas (ejemplo del avestruz)
Transferencia de aprendizaje
Otras aplicaciones I: reconocimiento de voz
Otras aplicaciones II: procesamiento del lenguaje natural
Caso de estudio 1: límite de decisión de una red neuronal profunda
09
SEMANA 9
Sistemas de recomendación
Recomendaciones y clasificación
¿Qué hace un sistema de recomendación?
¿Cuál es el problema de la predicción de recomendaciones?
¿Y, que datos tenemos?
Uso de promedios de población
Uso de comparaciones de población y clasificación
Caso de estudio 1: recomendación de películas
Filtración colaborativa
Personalización mediante filtrado colaborativo utilizando usuarios similares
Personalización mediante filtrado colaborativo utilizando elementos similares
Personalización mediante filtrado colaborativo utilizando usuarios y elementos similares
Caso de estudio 2: recomiende nuevas canciones a los usuarios en función de sus hábitos de escucha
Recomendaciones personalizadas
Personalización mediante comparaciones, clasificaciones y elementos de usuarios
Modelo oculto de Markov / redes neuronales, gráfico bipartito y modelo gráfico
Uso de información secundaria
20 preguntas y aprendizaje activo
Construyendo un sistema: desafíos algorítmicos y del sistema
Caso de estudio 3: hacer recomendaciones de nuevos productos
10
SEMANA 10
DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre aprendizaje profundo y sistemas de recomendación
SEMANA 11
Redes y modelos gráficos
Introducción
Introducción a las redes
Ejemplos de redes
Representación de redes
Caso de estudio 1: navegación / GPS
1.1 : Filtrado de Kalman: seguimiento de la posición 2D de un objeto cuando se mueve con velocidad constante
1.2 : Filtrado de Kalman: seguimiento de la posición 3D de un objeto que cae debido a la gravedad
Redes
Medidas de centralidad: grado, vector propio y rango de página
Centralidad de cercanía e intermediación
Distribución de grados, agrupamiento y mundo pequeño
Modelos de red: Erdos-Renyi, modelo de configuración y conexión preferencial
Modelos estocásticos en redes para la propagación de virus o ideas
Maximización de la influencia
Caso de estudio 2: identificación de nuevos genes que causan autismo
Modelos gráficos
Modelos gráficos no dirigidos
Modelos de Ising y Gaussianos
Aprendizaje de modelos gráficos a partir de datos
Modelos gráficos dirigidos
Estructuras en V, "explicaciones" y aprendizaje de modelos gráficos dirigidos
Inferencia en modelos gráficos: marginales y paso de mensajes
Modelo oculto de Márkov (HMM)
Filtro Kalman
11
SEMANA 12
Análisis predictivo
Modelado predictivo para datos temporales
Ingeniería de predicción
Caso de estudio 1: taxis de la ciudad de Nueva York
Ingeniería de funciones
Introducción
Tipos de funciones
Síntesis profunda de funciones: primitivas y algoritmos
Síntesis profunda de funciones: apilamiento
Caso de estudio 2: conjunto de datos minoristas del Reino Unido
Evaluación: caso de estudio calificado - viajes en taxi en la ciudad de Nueva York
12
PROFESORES
Devavrat Shah
Profesor, EECS e IDSS, MIT
Felipe Rigollet
Profesor, matemáticas e IDSS, MIT
Carolina Uhler
Profesora asociada de Henry L. y Grace Doherty,
EECS e IDSS, MIT
Victor Chernozhukov
Profesor, economía e IDSS, MIT
Stefanie Jegelka
Profesora asociada de desarrollo profesional de X- Consortium,
EECS e IDSS, MIT
13
Ankur Moitra
Profesor asociado de desarrollo profesional de Rockwell International,
matemáticas e IDSS, MIT
Tamara Broderick
Profesora Asociada, EECS e IDSS, MIT
David D. Gamarnik
Profesor de operaciones de la Universidad Tecnológica de Nanyang
investigación, Sloan School of Management e IDSS, MIT
Jonathan Kelner
Profesor, matemáticas, MIT
Kalyan Veeramachaneni
Científico investigador principal en el Laboratorio de Información
y Sistemas de Decisión, MIT
Guy Bresler
Profesor asociado, EECS e IDSS, MIT
14
MENTORES DE
PROGRAMA
El programa te capacita para trabajar en proyectos relevantes para la industria por parte de expertos en ciencia
de datos y aprendizaje automático a través de sesiones de aprendizaje guiado en vivo para brindarte una comprensión
práctica de los conceptos básicos. Algunos de los expertos de la industria que colaboran como mentores son:
Mateo Nickens
Udit Mehrotra
Gerente, Partnership Science
Meta
Científico de datos
Dell
Bhaskarjit Sarmah
Shirish Gupta
Científico de datos
BlackRock
Científico de datos senior
Bradford Tuckfield
Vaibhav Verdhan
Gerente senior de ciencia de datos
Charles Schwab
Líder de análisis
Analítica avanzada global
AstraZeneca
Novartis
Odaiyappan Pichappan
Científico de datos senior
Verizon 4G inalámbrico
COORDINADOR DE PROGRAMA:
TU GUÍA PERSONAL
DE GREAT LEARNING
Tu coordinador de programa, parte del equipo de
Great Learning, será tu único punto de contacto para todas
las consultas académicas y no académicas del programa.
Tu coordinador realizara un seguimiento de tu aprendizaje, te
brindara apoyo personalizado, así como ánimos para
garantizar tu éxito en el programa.
15
CERTIFICADO
La imagen es solo para fines ilustrativos. El certificado real puede estar sujeto a cambios a discreci6n de la universidad.
PROCESO DE SOLICITUD
Paso 1
Paso 2
Paso 3
Formulario de solicitud
Evaluación de la solicitud. Tu
Únete el programa. Si
Regístrate completando el
solicitud será revisada para
eres seleccionado, recibirás
formulario de solicitud en línea.
determinar si éste es el
una oferta de admisión.
programa indicado para ti.
Asegura tu lugar en el grupo
pagando la cuota de admisión.
DETALLES DE SOLICITUD Y CUOTAS
Duraci6n del programa: 12 semanas
Cuota: 2,100 USD
Fecha de inicio: 22 de octubre de 2022
16
El programa de aprendizaje automático y ciencia de datos del MIT IDSS, con un plan de
estudios desarrollado e impartido por profesores del MIT, se imparte en colaboración con:
Great Learning es una plataforma de tecnología educativa con la misión de hacer que los
profesionales sean competentes y se mantengan preparados para el futuro. Sus programas se
enfocan en la próxima frontera de crecimiento en la industria y actualmente abarcan análisis,
ciencia de datos, big data, aprendizaje automático, inteligencia artificial, aprendizaje profundo,
computación en la nube y más. Great Learning utiliza tecnología, contenido de alta calidad y
colaboraciones con expertos de la industria para brindar una experiencia de aprendizaje integral
que ayuda a los candidatos a aprender, aplicar y demostrar sus competencias. Todos los
programas se ofrecen en colaboración con universidades líderes a nivel mundial y los toman miles
de profesionales cada año de más de 170 países.
17
COMIENZA AHORA A
TOMAR DECISIONES
BASADAS EN DATOS
APLICA YA
HABLA CON UN ASESOR DEL PROGRAMA
+52 800 283 2768
¿TIENES PREGUNTAS SOBRE EL PROGRAMA O
SOBRE CÓMO ENCAJA CON TUS METAS PROFESIONALES?
dsml-es.mit@mygreatlearning.com
VISITA NUESTRO SITIO WEB
https://www.mygreatlearning.com/mit-idss-es-programa-ciencia-dedatos-aprendizaje-automatico
Download