+ Ciencia de Datos Unidad 1. Introducción a la ciencia de datos. Mtro. Josue Miguel Flores Parra Etapa Terminal Facultad de Contaduría y Administración. Universidad Autónoma de Baja California 1 + Contenido Presentación. 2 Unidad I. Introducción a la ciencia de datos. 1. Qué es la ciencia de datos. 2. Fundamentos de la ciencia de datos. 3. Los múltiples caminos hacia la ciencia de datos. 4. Roles en la ciencia de datos. 1. Científico de datos. 2. Ingeniero de datos. 3. Analista de datos. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 1. Qué es la ciencia de datos. 3 ➔ Vivimos en la era de los datos. ➔ Los datos han cobrado una enorme importancia. ➔ La explotación de estos es aun más importante. ➔ Nuevos patrones. ➔ Comprobar/validar teorías científicas. ➔ Construir modelos para predecir comportamiento. ➔ Categorizar objetos. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 1. Qué es la ciencia de datos. 4 ➔ “La ciencia de datos es la disciplina que convierte los datos en conocimiento útil.” Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 1. Qué es la ciencia de datos. 5 ➔ Peter Naur puso énfasis en los datos y acuñó el término “Ciencia de Datos” en 1974. A partir de 1977 el término fue integrado en varias asociaciones y conferencias de ámbito estadístico y computacional. ➔ William S. Cleveland fue el primero en tratar la Ciencia de Datos como una disciplina independiente en 2001. ➔ Jim Gray, imaginó la Ciencia de Datos como un «cuarto paradigma» de la ciencia (empírico, teórico, computacional, y ahora basado en datos). ➔ Más detalles.Forbes: A Very Short History Of Data Science . Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 1. Qué es la ciencia de datos. 6 ➔ La Ciencia de Datos surge como un campo interdisciplinario que incluye: Programación; Matemáticas y la Estadística; y Experiencia en el campo de estudio. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 2. Fundamentos de la ciencia de datos. 7 ➔ La práctica de la Ciencia de Datos, requiere: ‣ Conocimientos de programación. ‣ Conocimientos de Estadística/Matemáticas. ‣ Conocimiento Especializado (o de dominio). ‣ Comunicación. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 2. Fundamentos de la ciencia de datos. 8 ➔ Inteligencia Artificial es el ámbito que se centra en la creación de máquinas inteligentes que funcionan y reaccionan como los humanos. El estudio de la IA se remonta a 1936, cuando Alan Turing construyó las primeras máquinas que funcionaban por IA. ➔ Aprendizaje Automático es una herramienta de creación para extraer conocimientos de los datos. En el aprendizaje automático los modelos pueden basarse en datos de manera independiente o en etapas. ➔ Aprendizaje Profundo es la creación de redes neuronales multicapa en áreas en las que se necesita un análisis más avanzado o rápido y en las que el aprendizaje automático tradicional no puede hacer frente. La «profundidad» proporciona más de una capa oculta de redes de neuronas que realizan cálculos matemáticos. ➔ Big Data trabaja con grandes cantidades de datos, a menudo no estructurados. Las características específicas de la esfera son herramientas y sistemas capaces de soportar grandes cargas. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 2. Fundamentos de la ciencia de datos. 9 ➔ Cómo se lleva a cabo la ciencia de datos. ‣ Identificar una hipótesis relacionada con el negocio para probar. ‣ Obtención de los datos. ‣ Preparar los para su análisis. ‣ Experimentar con diferentes modelos analíticos. ‣ Elegir el mejor modelo y ejecutarlo con los datos. ‣ Explicar los modelos. ‣ Implementar un modelo. ‣ Monitorear los modelos. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 2. Fundamentos de la ciencia de datos. 10 ➔ Aplicaciones de la Ciencia de Datos. ‣ Sistemas de recomendación de productos. ‣ Sectores de innovación tecnológica. ‣ Industria: Mantenimiento productivo o cuidado de las máquinas. ‣ Marketing. ‣ Ciberseguridad. ‣ Coches que conducen solos. ‣ Fraudes en el sector de finanzas. ‣ Detección de enfermedades y búsqueda de tratamientos médicos. ‣ Mundo científico, ejemplo: previsión meteorología, agricultura. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 3. Los múltiples caminos hacia la ciencia de datos. 11 ➔ Ruta de aprendizaje: Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 3. Los múltiples caminos hacia la ciencia de datos. 12 ➔ Conocimientos: ‣ Cálculo y algebra lineal. ‣ Estadística descriptiva e inferencial. ‣ Procesos de optimización y dominio de algoritmos. ‣ Manejo de bases de datos. ‣ Programación. ‣ Limpieza de datos e ingeniería de variables. ‣ Machine Learning y Deep Learning. ‣ Visión por computadora. ‣ Procesamiento del lenguaje natural. ‣ Manejo de datos masivos (Big Data). ‣ Visualización de datos y Storytelling. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 4. Roles en la ciencia de datos. 13 ➔ Científico de datos. Realiza análisis estadísticos avanzados y estudia grandes conjuntos de datos.Necesitan un conocimiento profundo de machine learning y el acondicionamiento de datos. ➔ Responsable de tareas tales como la transformación y limpieza de datos. ➔ Trabajan para identificar y clasificar varios patrones en los datos, así como para desarrollar algoritmos de aprendizaje automático para que sean más precisos y eficientes. ➔ Necesitan comprender las necesidades de la empresa o del equipo con el que están trabajando para transformar y ordenar grandes conjuntos de datos según sea necesario. ➔ Tiene habilidades matemáticas sólidas y conocimientos detallados de R, SAS y Python. También necesitan estudiar y comprender los algoritmos de aprendizaje automático y familiarizarse con las herramientas de big data. Las habilidades técnicas cómo la optimización de datos y la minería de datos son importantes para este papel. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 4. Roles en la ciencia de datos. 14 ➔ Ingeniero de datos. Desarrolla y mantiene la arquitectura de datos. Son especialistas en la preparación de grandes conjuntos de datos para que los analistas puedan utilizarlos. Cuando un analista necesita interpretar la información, un ingeniero crea programas que puedan generar datos con una disposición adecuada. ➔ Trabajar con datos estructurados y no estructurados es una tarea clave para alguien en esta función. Por lo tanto, la experiencia en SQL es una habilidad clave que se requiere. ➔ La duplicación de datos, la gestión de datos y la limpieza de datos también son tareas importantes para un ingeniero de datos. ➔ Cualquier persona en esta función necesita habilidades de programación sólidas y conocimientos de algoritmos. Crear una API puede estar entre sus responsabilidades, por ejemplo, o desarrollar una infraestructura en la nube. Es una función muy técnica y también se requiere un buen conocimiento de ingeniería y de herramientas de pruebas. ➔ Desarrolla procesos en torno al modelado de datos y la generación de datos. Esto requiere un pensamiento creativo y una fuerte capacidad de resolver problemas. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 4. Roles en la ciencia de datos. 15 ➔ Analista de datos. Estudia los datos y los desglosa para que las empresas y los equipos puedan utilizarlos para tomar decisiones. Saber qué landing page de un sitio web funciona mejor en términos de SEO, por ejemplo, o saber cuántos usuarios abandonan una página web inmediatamente después de visitarla puede ser muy útil para decidir los próximos pasos de una estrategia de contenido. ➔ Estudia los números y los presenta de forma que los equipos puedan utilizar la información. Es posible que necesiten comprender el rendimiento actual o planificar para el futuro y encontrar formas de optimizar las ventas o las visitas al sitio web o identificar tendencias según los diferentes grupos de usuarios. ➔ Las habilidades necesarias para este papel incluyen: buenos conocimientos estadísticos, aptitudes técnicas sólidas, la capacidad de estudiar información numérica y convertirla en una narrativa o un punto de información, generación de informes y visualización de datos. ➔ Responsable de recopilar datos y compilarlos en un informe. Esto puede basarse en factores tales como el calendario y la actividad. También son responsables de interpretar esta información. ➔ Este papel es un excelente punto de partida para cualquiera que esté interesado en alguna carrera relacionada con los datos. La adquisición de experiencia en esta área proporcionará una base sólida para cualquier trayectoria profesional relacionada con los datos. Curso de Ciencia de Datos- Universidad Autónoma de Baja California Introducción a la ciencia de datos. + 4. Roles en la ciencia de datos. Curso de Ciencia de Datos- Universidad Autónoma de Baja California 16 Introducción a la ciencia de datos.