Uploaded by vivandrea1

Fase 1 Viviana Andrea García Meza

advertisement
Fase 1 - Evaluación Inicial
Machine Learning
Viviana A. Garcı́a M.
vagarciamez@unadvirtual.edu.co
Universidad Nacional Abierta y a Distancia
Resumen
El aprendizaje automático, según [Ge] “es una disciplina que combina ciencia y creatividad para enseñar a las computadoras a aprender
de los datos existentes mediante algoritmos, sin requerir programación
explı́cita.” Este proceso imita el aprendizaje humano, permitiendo a
las máquinas generar modelos que pueden producir resultados en situaciones inéditas. Se distinguen dos tipos de aprendizaje: supervisado, que aprende de datos etiquetados para hacer predicciones sobre
datos desconocidos, y no supervisado, que explora la estructura de los
datos para obtener información relevante sin una variable de resultado
conocida.
En la actualidad, donde las volumetrı́as de los datos aumentan,
el aprendizaje automático es una aplicación vital, ya que proporciona
una forma eficaz de capturar el conocimiento y análisis, mejorando
progresivamente el rendimiento de los modelos predictivos y facilitando la toma de decisiones basadas en datos. Algunas aplicaciones
prácticas incluyen filtros de spam, reconocimiento de voz y texto, y
motores de búsqueda web.
Palabras clave: Maching Learning, aprendizaje automático, aprendizaje
supervisado, aprendizaje no supervisado.
1
Resumen
Machine learning, according to [Ge], “is a discipline that combines
science and creativity to teach computers to learn from existing data through algorithms, without requiring explicit programming.” This
process mimics human learning, allowing machines to generate models
that can produce results in unprecedented situations. There are two
types of learning: supervised, which learns from labeled data to make
predictions about unknown data, and unsupervised, which explores
the structure of the data to obtain relevant information without a
known outcome variable.
At present, where data volumes are increasing, machine learning is
a vital application, as it provides an effective way to capture knowledge
and analysis, progressively improving the performance of predictive
models and facilitating data-based decision making. Some practical
applications include spam filters, voice and text recognition, and web
search engines.
Keywords: Machine Learning, automatic learning, supervised learning,
unsupervised learning.
1.
¿Qué es el aprendizaje automático?
El aprendizaje automático en inglés (machine learning), hace parte de
una subdisciplina de la inteligencia artificial, la cual en sus incios fue definida por Arthur Samuel en 1959, su definición comprende que el aprendizaje
automatico tiene como objetivo equipar a las máquinas con la habilidad de
aprender de los datos a través de algoritmos, sin necesidad de programación
explı́cita. Y, este aprendizaje se asemeja a cómo los humanos aprendemos de
ejemplos sin depender de fórmulas o reglas especı́ficas. [Ve, pag 1]
De tal modo, permite a las máquinas generar modelos que pueden producir resultados en situaciones nuevas que no se conocı́an durante el aprendizaje. Esto es especialmente útil en situaciones donde no existe o es difı́cil
encontrar una fórmula que facilite una respuesta exacta basada en ciertas
variables. [Ve, pag 1]
2
Tom Mitchell en 1997, propuso la siguiente definición: “El aprendizaje
automático comprende el estudio y diseño de programas que mejoran el desempeño P al realizar una tarea T, a partir de la experiencia E.”[Mi]
2.
¿Qué son los aprendizaje supervisados y
no supervisados?
”El objetivo principal en el aprendizaje supervisado es aprender un modelo a partir de datos de entrenamiento etiquetados que permita hacer predicciones sobre datos no vistos o futuros.”[RaMi, pag 2].
[JaZsHe] anota que en este tipo de aprendizaje, la entrada representa un
conjunto de datos de entrenamiento que contenga ejemplos junto con sus correspondientes respuestas etiquetadas. Su propósito radica en predecir una
variable objetivo basada en las caracterı́sticas proporcionadas. Los problemas
asociados con el aprendizaje supervisado pueden dividirse en dos categorı́as
principales: regresión, donde se busca predecir un valor numérico, y clasificación, donde el objetivo es predecir una clase categórica.
En segunda parte, en el aprendizaje no supervisado se puede identificar
la respuesta correcta de antemano cuando se realiza entrenamiento de un
modelo, de tal modo, se manipulan datos no etiquetados o datos de estructura no identificada. Ası́ como [RaMi, pag 7] menciona:“Utilizando técnicas
de aprendizaje no supervisado, somos capaces de explorar la estructura de
los datos para extraer información significativa sin la guı́a de una variable de
resultado conocida o función de recompensa”
Por lo tanto, este tiene como objetivo detectar patrones innatos en los
datos sin disponer de etiquetas previas. Los conjuntos de datos de entrenamiento únicamente contienen variables de entrada, sin información de salida
asociada, con el fin de identificar estructuras subyacentes, como agrupaciones
o reducciones de dimensionalidad [JaZsHe]
3
3.
¿Por qué es importante el aprendizaje automático?
“Estamos en la era de la tecnologı́a avanzada, donde los datos, tanto estructurados como no estructurados, son abundantes.” [RaMi, pag 2]
En lugar de necesitar que los humanos creen reglas y modelos a mano a
partir de grandes volúmenes de datos, el aprendizaje automático ofrece una
forma más eficaz de capturar el conocimiento en los datos. Esto permite mejorar de manera gradual el rendimiento de los modelos predictivos y tomar
decisiones basadas en datos [RaMi, pag 2]
El aprendizaje automático no solo es cada vez más relevante en la investigación de ciencias de la computación, sino que también está teniendo un
impacto creciente en nuestra vida diaria. Gracias al aprendizaje automático, tenemos filtros de spam de correo electrónico muy eficaces, software de
reconocimiento de texto y voz fácil de usar, motores de búsqueda web fiables y desafiantes programas de ajedrez. Y con suerte, en un futuro cercano,
también tendremos coches autónomos seguros y eficientes. [RaMi, pag 2]
4.
¿Qué aplicaciones tiene el aprendizaje automático?
Un ejemplo de aplicación de machine learning, se presenta en actividades
diarias como ingresar a la bandeja de entrada del correo, cuando el usario
quiere filtrar los correos no deseados o también conocidos como ”spam”. Es
posible utilizar un filtro de spam, que es una herramienta de aprendizaje automático, la cual se entrena con ejemplos de correos “spam “ham”(correos
deseados), que forman el conjunto de entrenamiento. Cada correo en este
conjunto es una instancia de entrenamiento donde el modelo aprende de los
datos de entrenamiento y realiza predicciones sobre nuevos correos electrónicos. Su tarea (T) es marcar los nuevos correos electrónicos como ”spam” o
”ham”. [Ge]
2
Desde mi área de desempeño profesional que implica el sector de servicios
BPO (Business process outsourcing) y cobranzas, el aprendizaje automático
4
es una herramienta invaluable para optimizar todos los procesos de la operacion. Mediante algoritmos avanzados, es posible predecir el comportamiento
de los deudores (identificar perfil de clientes, hábitos de pago), optimizar las
rutas de contacto y determinar el momento óptimo para las interacciones.
Además, a través del insumo de los audios de las llamadas se podrı́a aplicar
análisis de sentimiento y voz, realizar detección de fraudes.
Referencias
[Ge] Géron, A. (2020). Aprende machine learning con scikit-learn, keras y
tensorflow. España: Anaya.
[Ve] Véliz, C. (2020). Aprendizaje automático. Introducción al aprendizaje
profundo. El Fondo Editorial de la Pontificia Universidad Católica del
Perú.
[Mi] Mitchell, T. (1997). Machine Learning. McGraw Hill.
[JaZsHe] Janiesch, C., and Zschech, P., and Heinrich, K. (2021). Aprendizaje
automático y aprendizaje profundo.
[RaMi] Raschka, S., and Mirjalili, V. (2017). Python Machine Learning Second Edition: Unlock Modern Machine Learning and Deep Learning
Techniques with Python by Using the Latest Cutting-edge Open Source
Python Libraries.
5
Download