Uploaded by Josue Miguel Flores Parra

Unidad 1. Ciencia de Datos.

advertisement
+
Ciencia de Datos
Unidad 1. Introducción a la ciencia de datos.
Mtro. Josue Miguel Flores Parra
Etapa Terminal
Facultad de Contaduría y Administración.
Universidad Autónoma de Baja California
1
+
Contenido Presentación.
2
Unidad I. Introducción a la ciencia de datos.
1. Qué es la ciencia de datos.
2. Fundamentos de la ciencia de datos.
3. Los múltiples caminos hacia la ciencia de datos.
4. Roles en la ciencia de datos.
1. Científico de datos.
2. Ingeniero de datos.
3. Analista de datos.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
1. Qué es la ciencia de datos.
3
➔ Vivimos en la era de los datos.
➔ Los datos han cobrado una enorme importancia.
➔ La explotación de estos es aun más importante.
➔ Nuevos patrones.
➔ Comprobar/validar teorías científicas.
➔ Construir modelos para predecir comportamiento.
➔ Categorizar objetos.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
1. Qué es la ciencia de datos.
4
➔ “La ciencia de datos es la disciplina que
convierte los datos en conocimiento útil.”
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
1. Qué es la ciencia de datos.
5
➔ Peter Naur puso énfasis en los datos y acuñó el
término “Ciencia de Datos” en 1974. A partir de 1977 el
término fue integrado en varias asociaciones y conferencias
de ámbito estadístico y computacional.
➔ William S. Cleveland fue el primero en tratar la Ciencia de
Datos como una disciplina independiente en 2001.
➔ Jim Gray, imaginó la Ciencia de Datos como un «cuarto
paradigma» de la ciencia (empírico, teórico,
computacional, y ahora basado en datos).
➔ Más detalles.Forbes: A Very Short History Of Data Science .
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
1. Qué es la ciencia de datos.
6
➔ La Ciencia de Datos surge como un campo
interdisciplinario que incluye: Programación;
Matemáticas y la Estadística; y Experiencia en el campo
de estudio.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
2. Fundamentos de la ciencia de
datos.
7
➔ La práctica de la Ciencia de Datos, requiere:
‣
Conocimientos de programación.
‣
Conocimientos de Estadística/Matemáticas.
‣
Conocimiento Especializado (o de dominio).
‣
Comunicación.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
2. Fundamentos de la ciencia de
datos.
8
➔ Inteligencia Artificial es el ámbito que se centra en la creación de
máquinas inteligentes que funcionan y reaccionan como los
humanos. El estudio de la IA se remonta a 1936, cuando Alan Turing
construyó las primeras máquinas que funcionaban por IA.
➔ Aprendizaje Automático es una herramienta de creación para
extraer conocimientos de los datos. En el aprendizaje automático
los modelos pueden basarse en datos de manera independiente o
en etapas.
➔ Aprendizaje Profundo es la creación de redes neuronales
multicapa en áreas en las que se necesita un análisis más avanzado
o rápido y en las que el aprendizaje automático tradicional no
puede hacer frente. La «profundidad» proporciona más de una capa
oculta de redes de neuronas que realizan cálculos matemáticos.
➔ Big Data trabaja con grandes cantidades de datos, a menudo no
estructurados. Las características específicas de la esfera son
herramientas y sistemas capaces de soportar grandes cargas.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
2. Fundamentos de la ciencia de
datos.
9
➔ Cómo se lleva a cabo la ciencia de datos.
‣
Identificar una hipótesis relacionada con el negocio
para probar.
‣
Obtención de los datos.
‣
Preparar los para su análisis.
‣
Experimentar con diferentes modelos analíticos.
‣
Elegir el mejor modelo y ejecutarlo con los datos.
‣
Explicar los modelos.
‣
Implementar un modelo.
‣
Monitorear los modelos.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
2. Fundamentos de la ciencia de
datos.
10
➔ Aplicaciones de la Ciencia de Datos.
‣
Sistemas de recomendación de productos.
‣
Sectores de innovación tecnológica.
‣
Industria: Mantenimiento productivo o cuidado de las
máquinas.
‣
Marketing.
‣
Ciberseguridad.
‣
Coches que conducen solos.
‣
Fraudes en el sector de finanzas.
‣
Detección de enfermedades y búsqueda de tratamientos
médicos.
‣
Mundo científico, ejemplo: previsión meteorología,
agricultura.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
3. Los múltiples caminos hacia la
ciencia de datos.
11
➔ Ruta de aprendizaje:
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
3. Los múltiples caminos hacia la
ciencia de datos.
12
➔ Conocimientos:
‣ Cálculo y algebra lineal.
‣
Estadística descriptiva e inferencial.
‣
Procesos de optimización y dominio de algoritmos.
‣
Manejo de bases de datos.
‣
Programación.
‣
Limpieza de datos e ingeniería de variables.
‣
Machine Learning y Deep Learning.
‣
Visión por computadora.
‣
Procesamiento del lenguaje natural.
‣
Manejo de datos masivos (Big Data).
‣
Visualización de datos y Storytelling.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
4. Roles en la ciencia de datos.
13
➔ Científico de datos. Realiza análisis estadísticos avanzados y estudia
grandes conjuntos de datos.Necesitan un conocimiento profundo
de machine learning y el acondicionamiento de datos.
➔ Responsable de tareas tales como la transformación y limpieza de
datos.
➔ Trabajan para identificar y clasificar varios patrones en los datos, así
como para desarrollar algoritmos de aprendizaje automático para que
sean más precisos y eficientes.
➔ Necesitan comprender las necesidades de la empresa o del equipo con
el que están trabajando para transformar y ordenar grandes conjuntos
de datos según sea necesario.
➔ Tiene habilidades matemáticas sólidas y conocimientos detallados de R,
SAS y Python. También necesitan estudiar y comprender los algoritmos
de aprendizaje automático y familiarizarse con las herramientas de big
data. Las habilidades técnicas cómo la optimización de datos y la
minería de datos son importantes para este papel.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
4. Roles en la ciencia de datos.
14
➔ Ingeniero de datos. Desarrolla y mantiene la arquitectura de datos. Son
especialistas en la preparación de grandes conjuntos de datos para que los
analistas puedan utilizarlos. Cuando un analista necesita interpretar la
información, un ingeniero crea programas que puedan generar datos con una
disposición adecuada.
➔ Trabajar con datos estructurados y no estructurados es una tarea clave para
alguien en esta función. Por lo tanto, la experiencia en SQL es una habilidad
clave que se requiere.
➔ La duplicación de datos, la gestión de datos y la limpieza de datos también son
tareas importantes para un ingeniero de datos.
➔ Cualquier persona en esta función necesita habilidades de programación
sólidas y conocimientos de algoritmos. Crear una API puede estar entre sus
responsabilidades, por ejemplo, o desarrollar una infraestructura en la nube. Es
una función muy técnica y también se requiere un buen conocimiento de
ingeniería y de herramientas de pruebas.
➔ Desarrolla procesos en torno al modelado de datos y la generación de datos.
Esto requiere un pensamiento creativo y una fuerte capacidad de resolver
problemas.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
4. Roles en la ciencia de datos.
15
➔ Analista de datos. Estudia los datos y los desglosa para que las empresas y los equipos
puedan utilizarlos para tomar decisiones. Saber qué landing page de un sitio web
funciona mejor en términos de SEO, por ejemplo, o saber cuántos usuarios abandonan
una página web inmediatamente después de visitarla puede ser muy útil para decidir los
próximos pasos de una estrategia de contenido.
➔ Estudia los números y los presenta de forma que los equipos puedan utilizar la
información. Es posible que necesiten comprender el rendimiento actual o planificar para
el futuro y encontrar formas de optimizar las ventas o las visitas al sitio web o identificar
tendencias según los diferentes grupos de usuarios.
➔ Las habilidades necesarias para este papel incluyen: buenos conocimientos estadísticos,
aptitudes técnicas sólidas, la capacidad de estudiar información numérica y convertirla
en una narrativa o un punto de información, generación de informes y visualización de
datos.
➔ Responsable de recopilar datos y compilarlos en un informe. Esto puede basarse en
factores tales como el calendario y la actividad. También son responsables de interpretar
esta información.
➔ Este papel es un excelente punto de partida para cualquiera que esté interesado en alguna
carrera relacionada con los datos. La adquisición de experiencia en esta área proporcionará
una base sólida para cualquier trayectoria profesional relacionada con los datos.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
Introducción a la ciencia de datos.
+
4. Roles en la ciencia de datos.
Curso de Ciencia de Datos- Universidad Autónoma de Baja California
16
Introducción a la ciencia de datos.
Download