Fase 1 - Evaluación Inicial Machine Learning Viviana A. Garcı́a M. vagarciamez@unadvirtual.edu.co Universidad Nacional Abierta y a Distancia Resumen El aprendizaje automático, según [Ge] “es una disciplina que combina ciencia y creatividad para enseñar a las computadoras a aprender de los datos existentes mediante algoritmos, sin requerir programación explı́cita.” Este proceso imita el aprendizaje humano, permitiendo a las máquinas generar modelos que pueden producir resultados en situaciones inéditas. Se distinguen dos tipos de aprendizaje: supervisado, que aprende de datos etiquetados para hacer predicciones sobre datos desconocidos, y no supervisado, que explora la estructura de los datos para obtener información relevante sin una variable de resultado conocida. En la actualidad, donde las volumetrı́as de los datos aumentan, el aprendizaje automático es una aplicación vital, ya que proporciona una forma eficaz de capturar el conocimiento y análisis, mejorando progresivamente el rendimiento de los modelos predictivos y facilitando la toma de decisiones basadas en datos. Algunas aplicaciones prácticas incluyen filtros de spam, reconocimiento de voz y texto, y motores de búsqueda web. Palabras clave: Maching Learning, aprendizaje automático, aprendizaje supervisado, aprendizaje no supervisado. 1 Resumen Machine learning, according to [Ge], “is a discipline that combines science and creativity to teach computers to learn from existing data through algorithms, without requiring explicit programming.” This process mimics human learning, allowing machines to generate models that can produce results in unprecedented situations. There are two types of learning: supervised, which learns from labeled data to make predictions about unknown data, and unsupervised, which explores the structure of the data to obtain relevant information without a known outcome variable. At present, where data volumes are increasing, machine learning is a vital application, as it provides an effective way to capture knowledge and analysis, progressively improving the performance of predictive models and facilitating data-based decision making. Some practical applications include spam filters, voice and text recognition, and web search engines. Keywords: Machine Learning, automatic learning, supervised learning, unsupervised learning. 1. ¿Qué es el aprendizaje automático? El aprendizaje automático en inglés (machine learning), hace parte de una subdisciplina de la inteligencia artificial, la cual en sus incios fue definida por Arthur Samuel en 1959, su definición comprende que el aprendizaje automatico tiene como objetivo equipar a las máquinas con la habilidad de aprender de los datos a través de algoritmos, sin necesidad de programación explı́cita. Y, este aprendizaje se asemeja a cómo los humanos aprendemos de ejemplos sin depender de fórmulas o reglas especı́ficas. [Ve, pag 1] De tal modo, permite a las máquinas generar modelos que pueden producir resultados en situaciones nuevas que no se conocı́an durante el aprendizaje. Esto es especialmente útil en situaciones donde no existe o es difı́cil encontrar una fórmula que facilite una respuesta exacta basada en ciertas variables. [Ve, pag 1] 2 Tom Mitchell en 1997, propuso la siguiente definición: “El aprendizaje automático comprende el estudio y diseño de programas que mejoran el desempeño P al realizar una tarea T, a partir de la experiencia E.”[Mi] 2. ¿Qué son los aprendizaje supervisados y no supervisados? ”El objetivo principal en el aprendizaje supervisado es aprender un modelo a partir de datos de entrenamiento etiquetados que permita hacer predicciones sobre datos no vistos o futuros.”[RaMi, pag 2]. [JaZsHe] anota que en este tipo de aprendizaje, la entrada representa un conjunto de datos de entrenamiento que contenga ejemplos junto con sus correspondientes respuestas etiquetadas. Su propósito radica en predecir una variable objetivo basada en las caracterı́sticas proporcionadas. Los problemas asociados con el aprendizaje supervisado pueden dividirse en dos categorı́as principales: regresión, donde se busca predecir un valor numérico, y clasificación, donde el objetivo es predecir una clase categórica. En segunda parte, en el aprendizaje no supervisado se puede identificar la respuesta correcta de antemano cuando se realiza entrenamiento de un modelo, de tal modo, se manipulan datos no etiquetados o datos de estructura no identificada. Ası́ como [RaMi, pag 7] menciona:“Utilizando técnicas de aprendizaje no supervisado, somos capaces de explorar la estructura de los datos para extraer información significativa sin la guı́a de una variable de resultado conocida o función de recompensa” Por lo tanto, este tiene como objetivo detectar patrones innatos en los datos sin disponer de etiquetas previas. Los conjuntos de datos de entrenamiento únicamente contienen variables de entrada, sin información de salida asociada, con el fin de identificar estructuras subyacentes, como agrupaciones o reducciones de dimensionalidad [JaZsHe] 3 3. ¿Por qué es importante el aprendizaje automático? “Estamos en la era de la tecnologı́a avanzada, donde los datos, tanto estructurados como no estructurados, son abundantes.” [RaMi, pag 2] En lugar de necesitar que los humanos creen reglas y modelos a mano a partir de grandes volúmenes de datos, el aprendizaje automático ofrece una forma más eficaz de capturar el conocimiento en los datos. Esto permite mejorar de manera gradual el rendimiento de los modelos predictivos y tomar decisiones basadas en datos [RaMi, pag 2] El aprendizaje automático no solo es cada vez más relevante en la investigación de ciencias de la computación, sino que también está teniendo un impacto creciente en nuestra vida diaria. Gracias al aprendizaje automático, tenemos filtros de spam de correo electrónico muy eficaces, software de reconocimiento de texto y voz fácil de usar, motores de búsqueda web fiables y desafiantes programas de ajedrez. Y con suerte, en un futuro cercano, también tendremos coches autónomos seguros y eficientes. [RaMi, pag 2] 4. ¿Qué aplicaciones tiene el aprendizaje automático? Un ejemplo de aplicación de machine learning, se presenta en actividades diarias como ingresar a la bandeja de entrada del correo, cuando el usario quiere filtrar los correos no deseados o también conocidos como ”spam”. Es posible utilizar un filtro de spam, que es una herramienta de aprendizaje automático, la cual se entrena con ejemplos de correos “spam “ham”(correos deseados), que forman el conjunto de entrenamiento. Cada correo en este conjunto es una instancia de entrenamiento donde el modelo aprende de los datos de entrenamiento y realiza predicciones sobre nuevos correos electrónicos. Su tarea (T) es marcar los nuevos correos electrónicos como ”spam” o ”ham”. [Ge] 2 Desde mi área de desempeño profesional que implica el sector de servicios BPO (Business process outsourcing) y cobranzas, el aprendizaje automático 4 es una herramienta invaluable para optimizar todos los procesos de la operacion. Mediante algoritmos avanzados, es posible predecir el comportamiento de los deudores (identificar perfil de clientes, hábitos de pago), optimizar las rutas de contacto y determinar el momento óptimo para las interacciones. Además, a través del insumo de los audios de las llamadas se podrı́a aplicar análisis de sentimiento y voz, realizar detección de fraudes. Referencias [Ge] Géron, A. (2020). Aprende machine learning con scikit-learn, keras y tensorflow. España: Anaya. [Ve] Véliz, C. (2020). Aprendizaje automático. Introducción al aprendizaje profundo. El Fondo Editorial de la Pontificia Universidad Católica del Perú. [Mi] Mitchell, T. (1997). Machine Learning. McGraw Hill. [JaZsHe] Janiesch, C., and Zschech, P., and Heinrich, K. (2021). Aprendizaje automático y aprendizaje profundo. [RaMi] Raschka, S., and Mirjalili, V. (2017). Python Machine Learning Second Edition: Unlock Modern Machine Learning and Deep Learning Techniques with Python by Using the Latest Cutting-edge Open Source Python Libraries. 5