Data Science Curso (MII707) CASO DE USO APLICADO A LA CIENCIA DE DATOS, TERCERA FASE Semana: 4 Sumativa: 3 2 Aprendizaje esperado: Seleccionar set de datos y muestreo utilizando herramientas de exploración de data y reducción de dimensiones, considerando por ello las limitaciones en términos de cantidad de registros y variables. Indicador/es de logro: 3.1 Describen los conceptos fundamentales de similaridad, clustering y vecindad. 3.2 Identifican conceptos de visualización de rendimiento bajo incertidumbre. 3.3 Identifican elementos de diseño experimental y pensamiento analítico para la toma de decisiones. 3.4 Utilizan razonamiento bayesiano para evidencia y razonamiento probabilístico. Instrucciones generales Lea con atención la experiencia de aprendizaje situado y la rúbrica correspondiente. 1. Revise los recursos de la semana y guíese en ellos para desarrollar el estudio de caso. Lea el documento con el caso de uso aplicado a la ciencia de datos. 2. De manera grupal deben aplicar clustering, similarities, y/o best-prospect target, como herramientas y exploración de Data en un caso de uso. Le recordamos que contará con la posibilidad de plantear sus consultas respecto de los contenidos tratados, en el foro “Consultas al docente”, que estará abierto durante toda la semana. Esta es una instancia de evaluación sumativa, con calificación, que pondera un 40% de la nota final. 3 Instrucciones específicas Lea el documento con el caso de uso aplicado a la ciencia de datos. El estudio de caso debe presentar en su primera etapa un informe de avance escrito conteniendo lo siguiente: 1. Introducción: se mantiene la descripción del problema exigido en la evaluación sumativa 1, mejorando eventuales observaciones. Se debe expresar en forma escrita su entendimiento mediante el análisis del problema, determinación de variables que se trabajaron con la data y las medidas de rendimiento, y finalmente qué se obtuvo. (hasta 1 página) 2. Análisis preliminar de la data: descripción de la data (entendimiento), procesamiento y preparación referido a la proveniencia de la data (básica, sin procesar, desordenada). Se exige para esta etapa argumentar el análisis preliminar en forma definitiva, profundizando en las fortalezas y debilidades de la data (por ejemplo, si la data está orientada a la solución del problema; data histórica no siempre es así). 3. Modelo definitivo: deberá contener la descripción del modelo implementado, considerando una diagramación de los conceptos fundamentales de ciencia de datos, técnicas o algoritmos que pueda utilizar. 4. Evaluación del modelo: deberá consignar los resultados de la minería de datos y realizar una evaluación tanto cualitativa como cuantitativa, considerando que esta evaluación es de carácter preliminar “de laboratorio”. Nos referimos al carácter “de laboratorio” en términos de que su evaluación es bajo este ambiente, por lo que se deberá posteriormente y en una evaluación final (3 fase), asegurarse que el modelo satisface el objetivo general del proyecto de inteligencia de negocios. No olvidar que el desarrollo de nuestro modelo está orientado a la toma de decisiones de los stakeholders. 5. Desarrollo: deberá concluir su modelo mediante el desarrollo o puesta en marcha del modelo, utilizando para ello la data de su proyecto, demostrando la utilidad del proceso. Deberá considerar discusión y conclusiones basadas en evidencia. Posteriormente deberá responder de acuerdo a los contenidos vistos en clases, lo siguiente: 6. Defina los conceptos de similaridad, clustering y vecindad. 7. Describa las características de una curva ROC. 8. Cuide su ortografía y redacción. 9. Respete los aspectos formales solicitados. 4 Aspectos formales ● Debe entregar el archivo en formato Word usando el entregable, este no debe superar las 20 páginas tamaño carta, incluida la portada y la bibliografía en formato APA (en caso de tener dudas, consultar el apartado bibliografía en el menú del curso). ● Para textos utilice letra Arial o Calibri, tamaño 11, interlineado 1,15 y márgenes justificados por defecto en ambos lados. ● El nombre del archivo se debe ajustar al siguiente ejemplo: mii707_s3grupo1, y no debe incluir tildes, símbolos, letra “ñ”, un solo guion medio o bajo, y no superar los 20 caracteres. ● Si se detecta plagio en su trabajo será calificado, automáticamente, con nota mínima. ● Esta evaluación es grupal/individual, complete el entregable que se adjunta y luego envíelo en Word a través del buzón de entrega correspondiente. Para esto: a) Diríjanse a la sección entrega de actividad. b) Un integrante del grupo deberá enviar el archivo final. c) Haga clic en “Examinar mi equipo”. d) Adjunte el archivo con la tarea (del grupo). ● El documento deberá ser entregado durante la semana en curso. 5 A continuación, revisen la lista de cotejo asociada a la evaluación: Rúbrica de evaluación NIVELES DE LOGRO CRITERIOS EXCELENTE 100 BUENO 75 ACEPTABLE 50 INSUFICIENTE 25 NO CUMPLE 0 Introducción. Entendimiento del problema (15 %) Describe el problema, mediante la determinación de variables que se trabajaron con la data con las medidas de rendimiento y lo qué se obtuvo, aplicando todas las correcciones a partir de la retroalimentación de la evaluación 2. Describe el problema, mediante la determinación de variables que se trabajaron con la data con las medidas de rendimiento, omitiendo lo qué se obtuvo o sin aplicar una de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe el problema, omitiendo la determinación de variables que se trabajaron con la data o las medidas de rendimiento, o lo qué se obtuvo, o sin aplicar dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe el problema, omitiendo la determinación de variables que se trabajaron con la data y las medidas de rendimiento, y lo qué se obtuvo, o sin aplicar más de dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. No cumple, no entrega introducción. Entendimiento de la data, procesamiento, preparación (10 %) Describe la data, procesamiento y preparación referido a su proveniencia, argumentando sobre las fortalezas y debilidades de ella, aplicando todas las correcciones a partir de la retroalimentación de la evaluación 2. Describe la data, procesamiento y preparación referido a su proveniencia, mencionando fortalezas y debilidades, sin argumentarlas, o sin aplicar una de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe la data, omitiendo su procesamiento o preparación referido a su proveniencia, o sus fortalezas y debilidades, o sin aplicar dos de las correcciones solicitadas en la retroalimentación de la evaluación 1. Describe la data, omitiendo su procesamiento y preparación referido a su proveniencia, y sus fortalezas y debilidades, o sin aplicar más de dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. No cumple, no describe la data. Modelo definitivo (10 %) Describe el modelo implementado, diagramando los conceptos fundamentales de ciencia de datos, técnicas o algoritmos a utilizar, aplicando todas las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe el modelo a implementar, considerando una idea a través de una diagramación de los conceptos fundamentales de ciencia de datos, omitiendo las técnicas o los algoritmos a utilizar, o sin aplicar una de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe el modelo a implementar, omitiendo la diagramación de los conceptos fundamentales de ciencia de datos, o las técnicas o los algoritmos, o sin aplicar dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe el modelo a implementar, omitiendo la diagramación de los conceptos fundamentales de ciencia de datos, y las técnicas y los algoritmos, o sin aplicar más de dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. No cumple, no describe el modelo a implementar. 6 Evaluación de un modelo (10 %) Describe los resultados de la minería de datos y realiza una evaluación final de laboratorio, cualitativa y cuantitativa, considerando si el modelo satisface el objetivo general del proyecto, y si está orientado a la toma de decisiones de los stakeholders, aplicando todas las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe los resultados de la minería de datos y realiza una evaluación de laboratorio, cualitativa y cuantitativa, sin considerar si el modelo satisface el objetivo general del proyecto, o si está orientado a la toma de decisiones de los stakeholders, o sin aplicar una de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe los resultados de la minería de datos, sin realizar una evaluación de laboratorio, cualitativa y cuantitativa, o sin considerar si el modelo satisface el objetivo general del proyecto, o si está orientado a la toma de decisiones de los stakeholders, o sin aplicar dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. Describe los resultados de la minería de datos, sin realizar una evaluación de laboratorio, cualitativa y cuantitativa, y sin considerar si el modelo satisface el objetivo general del proyecto, o si está orientado a la toma de decisiones de los stakeholders, o sin aplicar más de dos de las correcciones solicitadas en la retroalimentación de la evaluación 2. No cumple, no describe los resultados de la minería de datos. Conclusión sobre el modelo de proyecto (25 %) Concluye su modelo mediante el desarrollo o puesta en marcha, utilizando para ello la data de su proyecto, demostrando la utilidad del proceso y basado en la evidencia. Concluye su modelo mediante el desarrollo o puesta en marcha, utilizando para ello la data de su proyecto, omitiendo la demostración de la utilidad del proceso y basado en la evidencia. Concluye su modelo mediante el desarrollo o puesta en marcha, sin utilizar para ello la data de su proyecto, u omitiendo la demostración de la utilidad del proceso, o sin basarse en la evidencia. Concluye su modelo mediante el desarrollo o puesta en marcha, sin utilizar para ello la data de su proyecto, y omitiendo la demostración de la utilidad del proceso, y sin basarse en la evidencia. No cumple, no concluye sobre el modelo del proyecto. Definición de los conceptos de similaridad, clustering y vecindad (10 %) Define los conceptos de similaridad, clustering y vecindad. Define los conceptos de similaridad, clustering y vecindad, con hasta un error en las definiciones. Define los conceptos de similaridad, clustering y vecindad, con hasta dos errores en las definiciones. Define los conceptos de similaridad, clustering y vecindad, con más de dos errores en las definiciones. No cumple, no define los conceptos de similaridad, clustering y vecindad. Descripción de curva ROC (10 %) Describe 4 características de una curva ROC. Describe 3 características de una curva ROC. Describe 2 características de una curva ROC. Describe 1 característica de una curva ROC. No cumple, no describe curva ROC. Redacción y ortografía (5 %) El producto entregado no posee errores ortográficos ni gramaticales. El producto entregado posee hasta cinco errores ortográficos y/o gramaticales. El producto entregado posee entre seis y diez errores ortográficos y/o gramaticales. El producto entregado posee entre once y quince errores ortográficos y/o gramaticales. El producto entregado posee más de quince errores ortográficos y/o gramaticales. Cumplimiento de aspectos formales. (5 %) El producto es entregado a tiempo y cumple con todos los aspectos formales indicados. Se distinguen citas y referencias en norma APA, correctamente aplicada, según corresponda. El producto es entregado a tiempo, pero solo cumple con 3 de los aspectos formales indicados. Se distinguen citas y referencias en norma APA, según corresponda, sin embargo, existen algunos errores en su aplicación. El producto es entregado con un máximo de 24 horas de retraso o solo cumple con 2 de los aspectos formales indicados. No utiliza norma APA en citas y referencias. El producto es entregado con un máximo de 48 horas de retraso o solo cumple con un aspecto formal de los indicados. No utiliza norma APA en citas y referencias. No cumple los aspectos formales indicados y no utiliza norma APA en citas y referencias.
0
You can add this document to your study collection(s)
Sign in Available only to authorized usersYou can add this document to your saved list
Sign in Available only to authorized users(For complaints, use another form )