1 UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA INDUSTRIAL Y DE SISTEMAS “SELECCIÓN DE PERSONAL EN PROYECTOS DE RECOLECCIÓN DE RESIDUOS MARÍTIMOS UTILIZANDO INTELIGENCIA ARTIFICIAL” TESIS PARA OPTAR POR EL TITULO PROFESIONAL DE INGENIERO DE SISTEMAS ELABORADO POR VICTOR MANUEL RAMIREZ TARAZONA ASESOR JOSE ALBERTO CABALLERO ORTIZ LIMA-PERÚ 2024 Índice general 1. Problemática 4 1.1. Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.1. Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3.1. Justificación Practica . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3.2. Justificación Académica . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.1. Hipótesis General . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.2. Hipótesis Especificas . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.5. Alcances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2. Marco Teórico 7 2.1. Tecnología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.1.1. Inteligencia Artificial . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.1.2. Redes Neuronales Artificiales . . . . . . . . . . . . . . . . . . . . . 8 2.1.3. Modelo de redes Petri . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1.4. Modelo Tradicional de repartición de Recursos Humanos . . . . . . 12 2.1.5. Marco AMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.1.6. Adam y Nadam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.1.7. HRM 5P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2 ÍNDICE GENERAL 3 2.2. Normativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.1. ISO 30405 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.3. Institucional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3.1. SUNAFIL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3.2. LAMOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3. Estado del Arte 19 3.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2. Relación del Problema con ML/AI . . . . . . . . . . . . . . . . . . . . . . 19 3.3. Enfoques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.3.1. Modelos con Petri con metodologías auxiliares . . . . . . . . . . . . 20 3.3.2. Redes Neuronales con mejoras en su modelo . . . . . . . . . . . . . 22 3.3.3. Aprendizaje Profundo . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.4. Benchmarking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.4.1. Análisis de las alternativas con AHP . . . . . . . . . . . . . . . . . 28 3.4.2. Justificación de cada factor . . . . . . . . . . . . . . . . . . . . . . 29 3.4.3. Selección de alternativa . . . . . . . . . . . . . . . . . . . . . . . . 32 4. Aporte de tesis 33 4.1. Caja Negra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5. Anexos 36 Capítulo 1 Problemática 1.1. Problema El problema principal que tiene el área es en el proceso de selección y repartición de trabajadores a un proyecto, este tipo de procesos llegan a ser más complejos a más grande y dificultoso el proyecto se vuelve, tratar de manejar ese proceso manualmente se vuelve más insostenible a más gente y tareas se han de repartir (esto ya que cada trabajador tendrá que hacer una tarea en especifico), ya que el proceso repartición depende de varios factores como la dificultad de las tareas, la disponibilidad y habilidad de los trabajadores con los que se está trabajando en el proyecto, etc. 1.2. Objetivo Mejorar el proceso de repartición de trabajadores a los proyectos que lo requieran 1.2.1. Objetivos Específicos 1. Agilizar el proceso de selección y asignación de tareas de proyecto 2. Mejorar la cantidad de requerimientos cumplidos en los proyectos 4 1.3. JUSTIFICACIÓN 1.3. 1.3.1. 5 Justificación Justificación Practica Esta investigación se realiza porque se tiene la necesidad de mejorar el rendimiento del área operativa de la empresa, en especial en el proceso de selección , resolviendo esta problemática se busca lograr un mejor rendimiento en las operaciones de la empresa, reduciendo tiempos y problemas en los proyectos de esta. Además de que hizo estudios donde se mostraron que la aplicación de un modelo de IA en el problema de locación de recursos humanos (human resource allocation) mostró mejoras significativas en los indicadores de rendimiento de proyecto de una compañía (Ma and Wang, 2021) 1.3.2. Justificación Académica Esta investigación se realiza con el propósito de investigar información sobre la inteligencia artificial en casos de mejora u optimización de la selección de los recursos humanos en proyectos de las empresas en base a los factores de trabajo que tiene un proyecto en el área de selección y repartición de tareas. En este caso se agregaría mas ejemplos de uso de Inteligencia Artificial y Aprendizaje de Maquina en las áreas de producción y control ya que la repartición de trabajadores en tareas esta dentro de esa área (Elbasheer et al., 2022) 1.4. 1.4.1. Hipótesis Hipótesis General La aplicación del modelo de doble ciclo con RNN y metodología tradicional hará que la repartición de trabajadores a los proyectos sea mas rápida y con mejores resultados. 6 CAPÍTULO 1. PROBLEMÁTICA 1.4.2. Hipótesis Especificas 1. El algoritmo de selección de recursos humanos demorara menos que el proceso tradicional 2. El algoritmo lograra que los requerimientos cumplidos del proyecto sea mayor o igual que la manera manual 1.5. Alcances Lo que en la investigación se va hacer es una aplicación en base a un modelo de redes neuronales recurrentes y metodología tradicional de repartición de recursos humanos con la base de datos de los proyectos y los candidatos. Se va construir el modelo hasta la etapa de entrenamiento de modelo y su análisis de precisión de entrenamiento y tasa de error. Se buscara trabajar en base a la data de los documentos de proyectos pasados y los contratantes que se tienen para al menos tener una mejora en los resultados de selección. Capítulo 2 Marco Teórico 2.1. Tecnología 2.1.1. Inteligencia Artificial La inteligencia artificial (IA) dentro del ámbito de la informática es una disciplina que engloba capacidades cognitivas e intelectuales manifestadas por sistemas informáticos o combinaciones de algoritmos. Su objetivo principal es crear máquinas capaces de imitar la inteligencia humana para llevar a cabo diversas tareas, mejorando a medida que adquieren información. La inteligencia artificial no busca reemplazar a los seres humanos, sino potenciar de manera significativa sus capacidades y contribuciones (Rouhiainen, 2018). La arquitectura y los procesos de las inteligencias artificiales para aprender, mejorar e implementarse en diversos campos varían según el propósito deseado. En términos generales, abarcan desde la ejecución de algoritmos simples hasta la interconexión de redes neuronales artificiales complejas que intentan imitar los circuitos neuronales del cerebro humano. Estas inteligencias aprenden a través de distintos modelos de aprendizaje (Russell and Norvig, 2016): 1. Aprendizaje automático: Se observa los datos, se construye un modelo basado en esos datos y se utiliza ese modelo a la vez como una hipótesis acerca de los datos y su comportamiento. 7 8 CAPÍTULO 2. MARCO TEÓRICO 2. Aprendizaje por refuerzo: Se determina qué acciones debe escoger un agente de software en un entorno dado con el fin de maximizar alguna noción de recompensa.o premio acumulado 3. Aprendizaje profundo: Se intenta modelar abstracciones de alto nivel en datos usando arquitecturas computacionales que admiten transformaciones no lineales múltiples e iterativas de datos expresados en forma matricial o tensorial 4. Aprendizaje supervisado: El programa aprende iterativamente de los datos para permitir que los ordenadores encuentren información escondida sin tener que programar de manera explícita dónde buscar. 2.1.2. Redes Neuronales Artificiales Las redes neuronales artificiales se componen de neuronas artificiales interconectadas que transmiten señales entre sí. Estas redes reciben información de entrada que atraviesa la red neuronal y se somete a varias operaciones, lo que da como resultado valores de salida. Cada neurona en una red neuronal está conectada con otras mediante enlaces que multiplican el valor de salida de la neurona anterior por un peso específico. Estos pesos en los enlaces pueden aumentar o inhibir el estado de activación de las neuronas adyacentes. Asimismo, en la salida de cada neurona puede haber una función de activación, también conocida como función limitadora o umbral, que modifica el valor resultante o impone un límite antes de propagarse hacia otra neurona (Russell and Norvig, 2016). Estos sistemas aprenden y se forman a sí mismos, en lugar de ser programados de forma explícita, y sobresalen en áreas donde la detección de soluciones o características es difícil de expresar con la programación convencional. Para realizar este aprendizaje automático, normalmente, se intenta minimizar una función de pérdida que evalúa la red en su total Figura 1 Imagen de una red neuronal 2.1. TECNOLOGÍA 2.1.2.1. 9 Retropropagación La retropropagación se basa principalmente en el aprendizaje de retro-propagación de errores, y los pesos y umbrales de la red se ajustan y corrigen continuamente a través del proceso de retro-propagación. La esencia de la retropropagación es realizar la función de mapeo desde la entrada hasta la salida, haciéndola adecuada para resolver varios problemas internos complejos y realizar cualquier mapeo no lineal complejo. La red consta de una capa de entrada, una capa oculta y una capa de salida. Entre ellos, la capa oculta contiene muchas capas. Dentro de la retropropagación, las neuronas de cada capa existen de forma independiente. Solo hay conexiones unidireccionales entre neuronas adyacentes en dos capas. La señal de entrada pasa a la capa oculta a través de la capa de entrada, procesada por la función de la capa oculta y luego los datos pasan a la capa de salida. La función transforma los datos de la capa de salida para obtener el resultado de salida final. (Jiaping et al., 2022) Figura 2 Gráfica de como funciona la Retropropagación 10 2.1.2.2. CAPÍTULO 2. MARCO TEÓRICO Redes Neuronales Recurrentes Las redes neuronales recurrentes (RNN) son una categoría de técnicas de aprendizaje profundo ,estas redes son reconocidas por su capacidad de procesar y extraer información de datos secuenciales. Como resultado, tareas como análisis de video, subtitulado de imágenes, procesamiento del lenguaje natural y análisis musical se benefician de las capacidades de las redes neuronales recurrentes. A diferencia de las redes neuronales artificiales tradicionales, que suponen la independencia entre los datos de entrada, las RNN capturan de manera activa las dependencias secuenciales y temporales presentes en los datos. Uno de los aspectos más distintivos de las redes neuronales recurrentes (RNN) es la compartición de parámetros. Si no se compartieran los parámetros, el modelo asignaría parámetros individuales para representar cada dato en una secuencia, lo que limitaría su capacidad para realizar inferencias en secuencias de longitud variable. Las redes neuronales recurrentes (RNN) suelen extender la arquitectura de las redes multicapa convencionales mediante la inclusión de ciclos que conectan nodos adyacentes o pasos de tiempo. Estos ciclos forman la memoria interna de la red, que se utiliza para evaluar las características del dato actual en relación con los datos del pasado inmediato. Figura 3 Gráfica de como funciona las Redes Neuronales Recurrentes 2.1. TECNOLOGÍA 2.1.3. 11 Modelo de redes Petri Una Red de Petri es una representación matemática o gráfica de un sistema de eventos discretos en el cual se puede describir la topología de un sistema distribuido, paralelo o concurrente. Esta red, definida en la década de los años 1960 por Carl Adam Petri, es una generalización de la teoría de autómatas que permite expresar sistemas con eventos concurrentes. Una red de Petri está compuesta por lugares, transiciones, arcos dirigidos y marcas o fichas que ocupan posiciones dentro de los lugares. Las reglas básicas son las siguientes: los arcos conectan lugares con transiciones, así como transiciones con lugares. No puede haber arcos directos entre lugares ni entre transiciones. Los lugares pueden contener un número finito o infinito contable de marcas. Las transiciones se disparan, lo que significa que consumen marcas de una posición de origen y producen marcas en una posición de destino. Una transición está habilitada para dispararse si tiene marcas en todas sus posiciones de entrada. Figura 4 Gráfica de como funciona la Red Petri 12 CAPÍTULO 2. MARCO TEÓRICO 2.1.4. Modelo Tradicional de repartición de Recursos Humanos La teoría tradicional de la repartición de los recursos humanos dice que para el planeamiento de esta repartición implica principalmente el análisis de la estructura del personal y ordenar la correlación entre los requerimientos de los trabajos y las competencias de los trabajadores en detalle. Las competencias del personal incluyen varios elementos, los cuales son ponderados para determinar el puntaje de calidad del personal en una tarea determinada (Feng et al., 2021). El proceso puede llegar a ser iterativo y contiene los siguientes pasos. 1. Se procesa y se agrupa la data en 2 grupos, la matriz de evaluación del personal y la matriz de capacidad del personal (aunque se use mas esta segunda matriz). 2. Se hallan los indicadores clave de trabajo en base a los requerimientos del trabajo, la matriz de capacidad del personal y la matriz de evaluación del personal (en base a un análisis estadístico) 3. Ahora en base a los puntajes que tiene cada trabajador, se busca optimizar cuales son los trabajos los cuales las personas pueden trabajar mejor pero buscando maxi- 2.1. TECNOLOGÍA 13 mizar la eficiencia total entre todos estos trabajos (no solo de uno individualmente). Esta data puede llegar a reutilizarse en el agrupamiento de la data en matrices para obtener mejores valores en el análisis estadístico 4. Al final toda los trabajadores quedan repartidos según el trabajo correspondiente y se muestra los resultados 2.1.5. Marco AMO El modelo AMO es un enfoque en el campo de los recursos humanos que busca explicar la relación entre las prácticas de RR.HH. y el rendimiento organizacional al analizar los aspectos relacionados con la habilidad, la motivación y las oportunidades. Este modelo destaca la importancia de estos tres elementos dentro del sistema de trabajo, los cuales influyen en las características de los empleados y en el progreso de la organización. Los profesionales de RR.HH. pueden evaluar el rendimiento de un individuo utilizando como referencia su habilidad, motivación y las oportunidades que se le brindan. Una organización que considere la capacidad, motivación y oportunidad de sus empleados puede lograr de manera más efectiva sus objetivos al mejorar el desempeño de su personal. Los líderes de la organización pueden utilizar este modelo para influir en el rendimiento de los empleados. Una empresa que priorice los tres elementos mencionados tiene más probabilidades de obtener éxito en comparación con aquellas que solo se centren en uno o dos de ellos. Cuando los empleados alcanzan su máximo potencial, la organización tiene mayores posibilidades de alcanzar sus metas. Las instituciones pueden optimizar estos tres elementos para mejorar el desempeño de los empleados y lograr sus objetivos. Los profesionales de recursos humanos pueden evaluar el rendimiento de una persona utilizando su habilidad (A), motivación (M) y oportunidad (O). (Bos-Nehles et al., 2023) 2.1.6. Adam y Nadam Adam (Algoritmo de optimización de gradiente) es un algoritmo el cual busca acelerar la velocidad de reducción de perdida en cada iteración mejorando las actualizaciones de 14 CAPÍTULO 2. MARCO TEÓRICO los pesos de los enlaces que hay entre neuronas (Kingma, 2014). Esto se halla con los siguientes pasos 1. Se halla primero o se inicializa los valores iniciales: p0 siendo la media de los valores, v0 siendo la varianza no centrada, gt la grandiente de los parámetros, α como 0, m1 como 0.9, m2 como 0.999 y ϵ como 10−8 y t=o siendo t el tiempo o la cantidad de iteraciones que se esta haciendo 2. Se calcula pt = m1 ∗ pt−1 + (1 − m1 ) ∗ gt y vt = m2 ∗ vt−1 + (1 − m2 ) ∗ gt2 3. Ahora se halla las desviaciones de los valores anteriormente calculados. pbt = pt /(1− mt1 ) y vbt = vt /(1 − mt2 ) 4. Usando estos valores, el peso variara de la siguiente manera: wt = wt−1 − α ∗ p b + ϵ) pbt /( qt Ahora, para el caso de Nadam, se cambia lo que varia en el cambio del peso, esto usando el Gradiente acelerado de Nesterov (Dozat, 2016). Ahora su variación sera la siguiente formula: wt = wt−1 − √ 2.1.7. α (1 − mt1 ) ∗ gt (m1 pbt + ) 1 − mt1 vbt + ϵ HRM 5P El modelo HRM 5P incluye cinco tareas básicas: Percepción, Selección, Colocación, Profesional y Conservación. (Perception, Pick, Placement, Professional and Preservation) (Jiaping et al., 2022) 1. La percepción significa que la empresa divide las partes según las necesidades y funciones del negocio,basándose en la compilación de una descripción del puesto, según los requisitos de la descripción del puesto se encuentra a los empleados más adecuados para el puesto. 2. La selección significa que las empresas necesitan reclutar y seleccionar talentos y utilizar métodos científicos de evaluación de talentos para seleccionar a los más adecuados 2.2. NORMATIVO 15 3. Colocación se refiere a conocer a las personas y hacer bien su trabajo y proporcionar canales de promoción a los empleados. 4. Lo profesional significa mejorar la calidad de los empleados cultivando talentos, lo que se concreta en formar a los empleados para que dominen nuevos conocimientos y nuevas tecnologías. 5. La preservación es establecer un mecanismo científico y razonable de incentivos salariales y de evaluación del rendimiento para evitar la fuga de cerebros. 2.2. Normativo 2.2.1. ISO 30405 Esta ISO muestra una guía de como reclutar la gente necesaria para determinado trabajo. Esta muestra los procesos y practicas importantes como el desarrollo de la política de contratación, el flujo desde la búsqueda de aplicantes potenciales a la contratación de nuevos trabajadores y la evaluación de estos. El proceso general de la ISO 30405 se podría resumir en lo siguiente 1. Pautas de reclutamiento a) Potencial grupo de talento b) Grupo de talento c) Grupo de aplicantes d ) Candidatos para evaluación adicional e) Manejo de candidatos f ) Pre-contratación g) Contratación 2. Medidas, análisis y mejora a) Proceso de medida 16 CAPÍTULO 2. MARCO TEÓRICO b) Análisis de resultados c) Mejora 2.3. 2.3.1. Institucional SUNAFIL Supervisan el cumplimiento de la normativa socio-laboral y de seguridad y salud en el trabajo, ejecutando las funciones de fiscalización y sanción en materia de inspección del trabajo dentro del ámbito de su competencia. Asimismo, aprueban las políticas institucionales en materia de inspección del trabajo, en concordancia con las políticas nacionales y sectoriales. Tienen el compromiso de ejecutar los servicios de promoción, prevención, fiscalización y supervisión del cumplimiento de las normas socio-laborales y las de seguridad y salud en el trabajo, hacia el logro del trabajo digno para los trabajadores, en el marco de la política nacional de modernización de la gestión pública e imponemos las sanciones legalmente establecidas por el incumplimiento de las normas socio-laborales, en el ámbito de su competencia. (SUNAFIL, 2023) 2.3.2. 2.3.2.1. LAMOR Que es LAMOR y que hacen Lamor es una empresa familiar finlandesa que centra en servicios y productos medioambientales. En el año 2020, en Lamor se distinguían tres áreas principales de negocio: respuesta a derrames de petróleo, administración de residuos y tratamiento de agua. Los productos Lamor se utilizan en más de cien países. Además, la compañía cuenta con filiales en Arabia Saudí, Bolivia, China, Colombia, los Estados Unidos, Gran Bretaña, Guyana, India, Kazajistán, Omán, Perú, Rusia, Turquía y Ucrania. El propietario principal de Lamor Corporation Ab es el Larsen familia. La denominación de la empresa, Lamor, es un acrónimo formado por las palabras: Larsen Marine Oil Recovery. 2.3. INSTITUCIONAL 17 En 2020, las áreas principales de negocio de Lamor eran tres: respuesta a derrames de petróleo, gestión de residuos y tratamiento de agua. Para 2016, más de 800 productos diferentes componían la cartera de Lamor, muchos de los cuales estaban patentados. Lamor diseña los productos que luego son manufacturados por una extensa red de subcontratistas. Lamor ha inventado soluciones técnicas sencillas para la recuperación del petróleo derramado en el mar como le skimmer de cepillos. En 2018, Lamor estuvo al frente de aproximadamente el 40 % de todas las necesidades del mercado mundial de respuesta a derrames de petróleo y operó en 94 países. (LAMOR, 2023) 2.3.2.2. Proceso de selección El proceso de selección de personal para los proyectos es un tanto peculiar, ya que no es que tengan un personal definido para que trabajen en los proyectos, sino que mas bien contratan personal que solo estará trabajando en la duración del proyecto. Para este proceso de selección hay ciertos pasos que se siguen. 1. Analizar los requerimientos necesarios para el proyecto 2. Búsqueda de candidatos 3. Selección de los candidatos según requerimientos 4. Contratación El proceso en el cual el trabajo se va a centrar mas es en la selección de los candidatos según los requerimientos. En este no se tiene un algoritmo ni tampoco es automatizado, todo el proceso es elegido a mano con los encargados de recursos humanos para la elección de candidatos que cumplan los requisitos para el proyecto (o al menos la mayor cantidad de requerimientos en la medida de lo posible). Esto priorizando los requerimientos mas importantes (como por ejemplo experiencia dentro de un campo o manejo de algún tipo de maquinaria marina), para este contexto solo se tomara el proceso para elegir personal aunque se debe tomar en cuenta que este proceso ocurre también a la par con búsqueda de recursos como maquinaria. El proceso se mostrara en mejor detalle con un diagrama 18 CAPÍTULO 2. MARCO TEÓRICO BPMN. Figura 5 BPMN de la repartición de los trabajadores a un proyecto Capítulo 3 Estado del Arte 3.1. Antecedentes 3.2. Relación del Problema con ML/AI El problema que se esta trabajando puede caer entre varias categorías como repartición de tareas o de recursos humanos, estos caen en la categoría general de Programación Dinámica de Producción, en la aplicación general de esta categoría se utiliza generalmente el "Smart Programming", siendo esta una de las aplicaciones mas significativas de AI/ML (Elbasheer et al., 2022). Entonces como ambos trabajan con AI y están relacionados en la misma categoría se podría derivar entre repartición de tareas o de recursos humanos dependiendo de como estos se desenvuelven en el problema a solucionar. 3.3. Enfoques Durante la investigación de metodologías y enfoques que se encontró sobre este problema de repartición de tareas y recursos humanos a proyectos, se encontraron artículos relevantes sobre este problema. Los artículos se agruparan según los métodos y marcos de trabajo con los cuales estos solucionan el problema. 19 20 3.3.1. CAPÍTULO 3. ESTADO DEL ARTE Modelos con Petri con metodologías auxiliares Entre ambos modelos se pueden observar que el uso del Petri con alguna metodología extra para tener mejores resultados. Estas metodologías varían en como estas son implementadas, primero veamos el caso en donde se aplica la metodología FCM. En este caso la metodología FCM se usa como método para mejorar los resultados que se hacen en cada iteración, parecido a lo que ocurre con Adam/Nadam y parecidos (Zhang and Pan, 2022). En este caso, tanto el FCM como el método Petri interactúan con los pesos de los arcos de las redes en base a los parámetros de las habilidades que tiene cada persona. En este caso de la aplicación de Petri con FCM, también se plantea una arquitectura que soportara la metodología y así poder tener una data mejor organizada y procesada. En este caso se muestra que la data se puede separar en 3 tipos, la data real (de los trabajadores, las tareas y sus requerimientos, etc), data de procesos (entrenamiento y habilidades de los trabajadores) y data simulada (esto para el entrenamiento, basada en la data obtenida de los otros 2 tipos de datos). La data es enviada a una base de datos local donde se aplicara el modelo Petri. Figura 6 Gráfica de la arquitectura del articulo de Petri con FCM En este caso las redes Petri Sacado del articulo An intelligent scheduling model of computer human resources in complex scenarios based on artificial intelligence 3.3. ENFOQUES 21 trabajan en base a transiciones de tiempo y lugar de los recursos humanos, cuando la data se procesa, los pesos que indican las transacciones cambian en base a una función. Este método es uno de los mas precisos entre todos los artículos a analizar, teniendo una precisión de 99.12 % en comparación a que si solo se aplicara la red Petri con el método Adam el cual da en comparación solo 91.34 % de precisión. Ahora, para el segundo caso donde se usa el marco AMO no se tiene una arquitectura presentada en si, pero si se tiene una estructura general de código sobre como este extrae y procesa la data. El marco AMO es mas que todo utilizado como parte del proceso de ajuste de pesos de los arcos, esto para que cuando se busque las mejores tareas para los trabajadores no solo se base en el sistema de premio/castigo el cual esta basado la red Petri sino que también se tome en cuenta las motivaciones y las posibles mejoras que un trabajador tenga al estar en determinada tarea. (Dai et al., 2021) También, se muestra que hay un proceso el cual el codigo se convierte en redes Petri, primero que todo se tiene que el código esta escrito en una estructura secuencial, despues entre los fragmentos de codigo ya transformados se busca que este en una estructura en paralelo para que al final esta se convierta en una estructura de concurrencia. Figura 7 De fragmentos de codigo a red Petri Ahora, el lenguaje de programación que usa el autor para crear el programa es Python, Sacado del articulo Human Resource Petri Net Allocation Model Based on Artificial Intelligence and Neural Network 22 CAPÍTULO 3. ESTADO DEL ARTE se usa programas de parseo de código para saber cuales son las entradas, salidas, operaciones y parámetros, para ello utiliza el ASTParser (por lo ligero que es) para poder tener el código en un modelo de documento de objetos, esto sera guardado para su posterior uso. Se busca relacionar las operaciones en el código con la red Petri que se esta construyendo. Para construir y guardar la red Petri se usa el programa Neo4j ya que crea una estructura muy parecida a la que se quiere crear (con nodos y aristas). Al final, este programa lo que busca es transformada en elementos de la red de Petri, esta lo que busca es transformar las declaraciones de acción de los programas en objetos de entrada, objetos de salida y el conjunto de operaciones que esta conforma. Este método tiene una precisión de 78.85 3.3.2. Redes Neuronales con mejoras en su modelo En este caso, también hay artículos que tratan de atacar el problema usando las redes neuronales, se encontraron varios artículos que usan este modelo pero en diferentes enfoques, lo que tienen en común es la aplicación de redes neuronales, tanto Retropropagacion como Redes Neuronales Recurrentes. Primero que todo, en este articulo usa otra metodología extra para su modelado de dato antes de procesarlo con BPNN, este usa el modelo de 5P de HRM, estas siendo Percepción que es los requerimientos que determinado trabajo pide, Elección (Pick) Que son las personas que pueden ser elegidas para determinada tarea, Ubicación (Placement) que seria en donde las personas estarían trabajando. Profesionalismo que indica las capacidades y cualidades de los trabajadores y Preservación que seria los incentivos que se hacen para tener. Esto se puede hallar con el modelo de predicción de salario, el cual halla cual es el sueldo que el trabajador esta dispuesto a aceptar, este toma varios factores como su posición profesional, ubicación, edad, genero, etc. Para el procesamiento de la data se usa 30 neuronas, 14 de entrada, 15 ocultas y 15 en la capa oculta, para la función de activación se usa la función sigmoidea ya que permite una 23 3.3. ENFOQUES selección no lineal (esto conviene ya que la problemática no sigue convenciones lineales). f (x) = 1 1 + e−x Para lograr mas rapidez en alcanzar mas precisión los parámetros de peso de los arcos se toman en valores pequeños al azar y diferentes de 0, esto porque si son 0 se demora mucho en reducir el error y si todos tienen el mismo peso las actualizaciones de pesos tendrán menos impacto (Jiaping et al., 2022). Para la función de error se toma la media del cuadrado de la resta entre los valores del vector resultado y vector objetivo 1 E = (y − z)2 2 Al final, se utilizan las metodologías Adam/Nadam (en el caso del articulo no tiene una diferencia relevante en la precisión) para lograr alcanzar mas rápido una mejor precisión. Para el análisis de la data la repartición es 91 % de la data como entrenamiento y 9 % de prueba. Además de esto, la data antes de procesarse se normaliza ya que puede haber data incompleta o con rangos muy grandes entre estas. Después de que se haya pasado por el proceso del BPNN se desnormaliza la data resultante para que tenga la misma distribución que la data de entrada. La formula de normalización es la siguiente x′ = x − xmin xmax − xmin Se podría resumir el proceso en lo siguiente 1. Construcción del modelo 2. Inicializar parámetros 3. Calcular los resultados de las capas ocultas y de salida 4. Ajustar el parámetro de la capa de salida 5. Ajustar el parámetro de las capas ocultas 6. Si no se logra la precisión buscada se regresa al paso 3 24 CAPÍTULO 3. ESTADO DEL ARTE 7. Se muestra el resultado En este caso, la precisión es de 79.4 %. Para el otro modelo es una combinación del modelo de repartición de recursos humanos tradicional y RNN. El modelo tradicional trabaja en base a una matriz de competencias y de evaluaciones, esto sirve en el modelo como una manera de organizar la data antes de la aplicación de RNN. Lo mas relevante es el uso de la convolución de la data para obtener las características mas importantes. (Feng et al., 2021) x1 → w1 → x2 → ... → xL−1 → wL−1 → xL → wL → z z = f (xL , y) L=− X (y ∗ log(p) + (1 − y) ∗ log(1 − p)) n En esta xL es la data de entrada de la capa L, w es el parámetro de peso de la capa L, y es el valor de calibración del modelo y la función f es la que determina el calculo de la desviación del modelo. Ahora, para el calculo de la desviación se utiliza el calculo de la entropía cruzada el cual es mostrada arriba como L. También es usado el Adam para alcanzar una mejor optimización de cambio de parámetros. Lo mas relevante del modelo es que tiene no solo el modelo base, sino que trabaja con un modelo híbrido, el modelo global es combinado con el modelo local usando las características de la data de un modelo jerárquico como la salida de la red para lograr el trabajo de repartición de tareas. Al final, todo quedaría en un proceso como el que se va a mostrar a continuación. 1. Recolección de los datos: Estos datos es obtenida de la información de las capacidades y características de la organización, como cada empresa varia en su formato así que debe uniformizarse, tanto en el redondeo como las unidades 2. Pre-procesamiento de los datos: La data es agrupada para tener un mejor entendimiento de las características que se puede extraer del modelo de HR. También se guarda la data preprocesada en un almacén de datos para poder entrenar el RNN. 3.3. ENFOQUES 25 3. Realizar las mejoras del modelo: Se agrupa los datos relacionados para tener una base en donde trabajara el modelo, una vez la data es agrupada y procesada esta es usada como entrada para el modelo RNN. 4. Salida de resultado de recomendaciones: Después del procesamiento del RNN, se usa tanto la data estadística obtenida anteriormente en el pre-procesamiento como la matriz de puntuación para que cada tarea tenga clasificado que trabajador tiene las mejores capacidades para el trabajo. Figura 8 Modelo de red de doble ciclo Este modelo tiene una precisión de 81.22 % Sacado del articulo Design and simulation of human resource allocation model based on double-cycle neural network También se encuentra otro modelo que usa en este caso Retropropagacion, el contexto de 26 CAPÍTULO 3. ESTADO DEL ARTE este caso es sobre la repartición de recursos humanos en el área de turismo. primero que todo para hallar los valores se pone todos los factores en una matriz de m indicadores y n objetos, esto sacándose de los datos obtenidos de base de datos sobre turismo. Cuando se actualiza esta nueva data o entra una nueva se elimina y la diferencia es usada para conocer el cambio que hay entre los tiempos de un dato a otro. Este modelo considera tanto los factores positivos como los negativos que pueden impactar en la repartición del personal. En el caso de los factores positivos considera los recursos de turismo del área, el nivel del control del personal y el ambiente donde opera la zona de turismo, como los factores negativos toma el grado de profesión del personal, el efecto del turismo en el área y la competitividad del mercado (aunque es mas que todo factores que restringen las elecciones, podría tomarse como los factores que aumentan o disminuyen las opciones de elección) Figura 9 Modelo de Retropropagacion usando factores positivos y negativos Sacado del articulo Analysis of human resource allocation model for tourism industry based on improved BP neural network En el modelo del articulo, se toma los datos y se normalizan para que queden en un rango de entre -1 y 1, esto dependiendo del tipo de dato al cual se este normalizando (por 27 3.3. ENFOQUES ejemplo que se normalizara entre los factores de recursos y el de grado de profesión de los trabajadores, pero no todo junto). Se halla también la cantidad de nodos ocultos óptima dependiendo de la cantidad de nodos de entrada y de salida. Esta formula empírica es ln(N ) + p N2 + M2 Siendo N la cantidad de nodos de entrada, M la cantidad de nodos de salida y m la cantidad de nodos ocultos. También que se usa como función de activación la función sigmoidea Al final de todo ello para que el modelo converja mas rápido, se aplica una variación al azar en el proceso de descenso de gradiente estocástico, y este cambio se agrega en el peso de las aristas.(Zhu and Liu, 2022) Este modelo tiene una precisión de 92.71 % 3.3.3. Aprendizaje Profundo En este caso de trata del uso de tanto Aprendizaje Profundo como Redes Bayesianas para la repartición de recursos humanos en las tareas de una empresa. Primero que todo va a construir un modelo de redes bayesianas dinámicas, esto para hallar relaciones entre variables al azar sin que haya tantas complicaciones, además de que puede aceptar conjuntos de datos incompletos sin muchas complicaciones. Cuando se esta construyendo el modelo se buscan los indicadores principales o mas relevantes para después la construcción del modelo en si. Para ello usan la metodología del cuadro de mando integral, esto entre las áreas de Aspecto financiero (teniendo de indicadores la ganancia empresarial, valor de producción empresarial y deuda corporativa), Servicio al cliente (teniendo de indicadores habilidades de comunicación, satisfacción al cliente y la participación del cliente), Trabajo Personal (teniendo de indicadores la dedicación, habilidades de trabajo y responsabilidad laboral) y de Manejo corporativo (teniendo de indicadores la asistencia al trabajo y las violaciones de disciplina), donde al final se hallara los pesos y el puntaje que puede obtener un trabajador. Pero también se halla el modelo bayesiano de los nodos en base a factores independientes que pueden afectar el rendimiento de un trabajador en un puesto. Este modelo después se simplifica retirando las conexiones redundantes entre 28 CAPÍTULO 3. ESTADO DEL ARTE estos factores.(Yang and Tang, 2023) Se mostrara después como estos factores se han simplificado. Figura 10 Modelo de Deep Learning usando Redes Bayesianas con factores de colocacion de personal Sacado del articulo Big Data-based Human Resource Performance Evaluation Model Using Bayesian Network of Deep Learning 3.4. Benchmarking 3.4.1. Análisis de las alternativas con AHP En este caso de hallar el modelo de algoritmo que se ajuste mejor a las necesidades de la empresa, se tomara 4 factores relevantes para hallar cual de estos algoritmos es mejor adecuado para el proceso. 1. N° Personas: Cantidad de personas que el algoritmo puede procesar efectivamente 2. Precisión: Que tan preciso es el algoritmo en terminar el proceso 3. Complejidad: La cantidad de metodologías y la dificultad de aplicarlas (en base a ello también se puede derivar el costo que supondría aplicarlo) 4. Cercanía: Que tanto se acerca los problemas resueltos por los artículos al problema que se quiere resolver 29 3.4. BENCHMARKING 3.4.2. Justificación de cada factor 1. N° Personas: Es relevante para el proyecto ya que se requiere que el algoritmo logre trabajar con una cantidad decente de personal, la empresa trabaja con una cantidad mínimo de 160-200 personas de alta rotación ya que son contratados en base a cada proyecto. 2. Precisión: Es relevante ya que se busca que los trabajadores sean lo mas aptos para el proyecto en el cual se estará asignando. 3. Complejidad: Se busca que el algoritmo sea lo menos complicado posible para que sea fácil de aplicar y de modificar en caso se requiera hacer cambios al algoritmo 4. Cercanía: Se busca que el algoritmo buscado sea lo mas cercano al problema que se busca resolver para que la adaptación a la resolución del problema sea lo mas fácil posible y así evitar complicaciones. Con estos factores mencionados, se preguntara al stakeholder del problema sobre cual de estos factores es mas relevante para resolverlo, así poder seleccionar la mejor solución para el problema. Para ello se combinaron ambos puntos de vista para lograr entre ambos una matriz de pesos mas adecuada. Tabla 1 Matriz de criterios N° Personas Precisión Complejidad Cercanía N° Personas 1 1 0.5 0.2 Precisión 1 1 0.33 0.2 Complejidad 2 3 1 0.25 Cercania 5 5 4 1 Después de hallar los pesos respectivos, se hará una prueba de consistencia lógica para determinar si la matriz es consistente Se encuentra que el valor propio de la matriz es 30 CAPÍTULO 3. ESTADO DEL ARTE 4.071, con ese valor se pasara a hallar la proporción de consistencia CI = 4.071 − 4 = 0.027 = 2.7 % 4−1 Como esta proporción es menor a 10 % entonces significa que la matriz de pesos es consistente Ahora se mostrara la tabla de pesos ponderada en base a la matriz de pesos Tabla 2 Matriz de pesos Factor Peso N° Personas 0.103 Precisión 0.095 Complejidad 0.208 Cercanía 0.594 Una ves obtenido los pesos de las variables, ahora se pasara a poner el valor que cada articulo tiene en cada factor, para ello pondremos unos rangos que cada articulo podrá encajar en estas categorías N° de personas Valor <1000 1 1000-1500 2 1500-2000 3 >2000 4 Precisión Valor <80 1 80-90 2 90-95 3 >95 4 31 3.4. BENCHMARKING Complejidad Valor Solo un modelo 4 Un modelo con metodologías auxiliares Mas de un modelo 3 2 Mas de un modelo con otras metodologías 1 auxiliares Cercanía Valor Modelo que usa HRM y/o asignación de tareas pero no muestra resultado 1 de repartición Modelo que usa repartición de tareas 2 Modelo que usa HRM 3 Modelo de asignación de tareas y HRM 4 Ahora, para la creación de la matriz multi-criterio se eligieron los 4 artículos que tienen mas cercanía con el problema a tratar, además se van a referenciar los artículos con letras. Esto por comodidad de creación de la tabla. Para ello en la siguiente tabla se mostrara los artículos y la letra que los representa Tabla 3 Relación entre el articulo y la letra de representación 32 CAPÍTULO 3. ESTADO DEL ARTE Articulo Letra Human Resource Petri Net Allocation Model A Based on Artificial Intelligence and Neural Network Design and Simulation of Human Resource Allocation Model Based on Double-Cycle Neural Network Enterprise Human Resource Management Model B C by Artificial Intelligence Digital Technology An Intelligent Scheduling Model of Computer Human Resources in Complex Scenarios Based on Artificial Intelligence D En base a ello, haré la matriz multi-criterio para hallar el método que sera el elegido. Tabla 4 Matriz multi-criterio Factor Peso N° Personas A B C D 0.103 2 4 3 2 Precisión 0.095 1 2 1 4 Complejidad 0.208 3 2 3 2 Cercanía 0.594 3 3 1 3 2.707 2.800 1.162 2.784 Resultado 3.4.3. Artículos Selección de alternativa Con los resultados se muestra que la mejor alternativa a elegir seria el articulo 2 de Doble Ciclo con el modelo RNN y tradicional, con la aplicación del método Nadam, esto no podría ser compatible con D que el es segundo mas cercano ya que este tiene un modelo totalmente diferente, siendo la de Petri con el FCM. Capítulo 4 Aporte de tesis 4.1. Caja Negra Una caja negra se examina centrándose en las entradas que recibe y las salidas o respuestas que produce, sin considerar su funcionamiento interno. En otras palabras, nos interesa cómo se relaciona con su entorno (a veces, incluso con otros elementos que también podrían ser cajas negras)(Arahal et al., 2006), comprendiendo qué hace, pero sin preocuparnos por cómo lo hace. Por lo tanto, es fundamental que una caja negra tenga una interfaz bien definida para sus entradas y salidas, es decir, sus características de entrada y salida, mientras que no es necesario definir ni conocer los detalles internos de su funcionamiento. Donde las entradas son: 1. Datos de la lista de candidatos para los proyectos: Todos los datos relevantes para que pueda ayudar en la resolución del proyecto, estos pueden ser por ejemplo (Capacidades y experiencia del trabajador, cualidades, genero, edad, etc) 2. Datos de los requerimientos humanos del proyecto: Toda la data que se pueda obtener sobre los requerimientos humanos o que una persona puede proveer al proyecto, estos pueden ser por ejemplo (Cualidades o experiencia de los trabajadores como saber Excel experto, saber manejo de maquinaria pesada, X cantidad de tiempo de 33 34 CAPÍTULO 4. APORTE DE TESIS experiencia mínima, etc) Los habilitadores son: 1. Capacidad de transferencia y procesamiento de datos: Esto se considera como la capacidad que tienen los servidores u ordenadores de la empresa para tanto transferir la data desde la base de datos de la empresa al algoritmo y también cuanta potencia de procesamiento tiene para que logre funcionar el algoritmo en un tiempo corto (deseablemente pocas horas) 2. Data organizada: Que todas los datos de los organizadores y de los proyectos tengan la misma estructura y que se pueda obtener información de esta con relativa facilidad. Las restricciones son: 1. Documentos no organizados: Que los documentos entre trabajadores y entre proyectos difieran en estructura, haciendo que la extracción de datos sea mas difícil de lograr porque no se podría hacer de una manera automatizada. 2. Proyectos no registrados por ser recientes: Por normativa de la empresa, los documentos mas recientes de la empresa no pueden salir del mismo grupo de proyecto hasta que se haya completado el proyecto en su totalidad, limitando la cantidad de datos e información a proyectos de hace 2 meses mínimo. La salida es: 1. Repartición de los trabajadores con sus respectivos proyectos: Un documento o tabla donde se muestre que trabajador trabaje para X parte del proyecto según sus capacidades obtenidas al inicio del algoritmo. 4.1. CAJA NEGRA Figura 11 Modelo de caja negra 35 Capítulo 5 Anexos 36 Tabla 5 Tabla de la matriz de consistencia Problema El proceso de selección de trabajadores en un proyecto es mas difícil de hacerlo efectivamente a mas cantidad haya de proyectos Objetivos Hipótesis Variables Mejora el proceso de La aplicación del modelo de doble ciclo repartición de trabajadores con RNN y metodología tradicional hará VI: Aplicación de algoritmo de repartición a los proyectos que lo que la repartición de trabajadores a los VD: Calidad del proceso de repartición de los requieran usando algoritmos proyectos sea mas rápida y con mejores trabajadores a los proyectos de IA resultados. Agilizar el proceso de El algoritmo de selección de recursos selección y repartición humanos demorara menos que el proceso de tareas de proyecto tradicional Mejorar la cantidad de El algoritmo lograra que los requerimientos requerimientos humanos cumplidos del proyecto sea mayor o igual cumplidos en los proyectos que la manera manual VI: Algoritmo VD: Tiempo del proceso de selección Indicadores VI: ¿El algoritmo esta? VD: Tiempo desde el inicio hasta el final del proceso de selección VI: Algoritmo VI: ¿El algoritmo esta? VD: Diferencia entre la cantidad de VD: Diferencia de los requerimientos planteados requerimientos cumplidos y los que pre operación y los que se lograron obtener en el se planeaban cubrir momento de los proyectos Medición VI: ¿Hay? VD: Documentos del proceso VI: ¿Hay? VD: Documentos del proyecto (pre y post operación) Basado en la estructura de matriz de consistencia del libro “Cómo hacer un proyecto de investigación"(Tafur and Izaguirre, 2022) 37 Bibliografía Arahal, M., Soria, M., and Díaz, F. (2006). Técnicas de predicción con aplicaciones en Ingeniería. Ingeniería (Universidad de Sevilla). Secretariado de Publicaciones de la Universidad de Sevilla. Bos-Nehles, A., Townsend, K., Cafferkey, K., and Trullen, J. (2023). Examining the ability, motivation and opportunity (amo) framework in hrm research: Conceptualization, measurement and interactions. International Journal of Management Reviews, page 15. Dai, W., Hu, Y., Zhu, Z., and Liao, X. (2021). Human resource petri net allocation model based on artificial intelligence and neural network. Mobile Information Systems, 2021:1–13. Dozat, T. (2016). Incorporating nesterov momentum into adam. OpenReview. Elbasheer, M., Longo, F., Nicoletti, L., Padovano, A., Solina, V., and Vetrano, M. (2022). Applications of ml/ai for decision-intensive tasks in production planning and control. Procedia Computer Science, 200:1903–1912. Feng, Q., Feng, Z., and Su, X. (2021). Design and simulation of human resource allocation model based on double-cycle neural network. Computational Intelligence and Neuroscience, 2021:1–10. Jiaping, Y. et al. (2022). Enterprise human resource management model by artificial intelligence digital technology. Computational Intelligence and Neuroscience, 2022. 38 BIBLIOGRAFÍA 39 Kingma, D. P. . B. J. (2014). Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980. LAMOR (2023). About lamor. Recuperado el 02 de Septiembre del 2023 de la pagina de LAMOR. https://www.lamor.com/about-lamor. Ma, H. and Wang, J. (2021). Application of artificial intelligence in intelligent decisionmaking of human resource allocation. In The 2020 International Conference on Machine Learning and Big Data Analytics for IoT Security and Privacy: SPIoT-2020, Volume 1, pages 201–207. Springer. Rouhiainen, L. (2018). Inteligencia artificial: 101 cosas que debes saber hoy sobre nuestro futuro. Alienta. Alienta Editorial. Russell, S. and Norvig, P. (2016). Artificial Intelligence: A Modern Approach. Always learning. Pearson. SUNAFIL (2023). Informacion institucional. Recuperado el 02 de Septiembre del 2023 de la pagina de SUNAFIL. https://www.gob.pe/institucion/sunafil/institucional. Tafur, R. and Izaguirre, M. (2022). Cómo hacer un proyecto de investigación. Alpha Editorial. Yang, Q. and Tang, Y. (2023). Big data-based human resource performance evaluation model using bayesian network of deep learning. Applied Artificial Intelligence, 37(1):2198897. Zhang, D. and Pan, J. (2022). An intelligent scheduling model of computer human resources in complex scenarios based on artificial intelligence. Wireless Communications and Mobile Computing, 2022:1–10. Zhu, S. and Liu, Y. (2022). Analysis of human resource allocation model for tourism industry based on improved bp neural network. Journal of Mathematics, 2022:1–10.