Metodología de la Investigación PhD. Jorge L. Santamaría C. https://orcid.org/0000-0002-3982-2488 Semestre 2023 – 2023 Modalidad Presencial Normas Generales: • Todas las clases -1 punto Claves para el éxito del Curso: • Compromiso para la asignatura: • Dedicar el tiempo que necesite para estudiar y • Dedicar el tiempo que necesite para realizar trabajos. • Presentar todos los trabajos o tareas: • Trabajos Individuales • Trabajos grupales • *** Antes de la hora señalada No entregar fuera de tiempo!! Claves para el éxito del Curso: • Asistir a Clases en el horario establecido. • Estudiar a distancia (en línea) o presencial requiere de un esfuerzo por parte del estudiante. • Familiarizarse con el uso del Aula Virtual: • Entrega de trabajos, pruebas, exámenes, etc. • ****No es escusa el desconocimiento • Solventar todas sus dudas en su debido momento. • Realizar preguntas en clase • Utilizar todo el material disponible. • Leerlo • Estudiarlo Socialización del Sílabo • Grupos para las prácticas • Formar grupos de aproximadamente 5 estudiantes • Designar un coordinador de cada grupo para que suba el trabajo al Aula Virtual • Estudiantes: • Seguimiento al Sílabo • Uno por cada paralelo – Enviar nombre, número de teléfono e email • Nombre de los archivos: • Para Trabajo Grupal (Informes de Laboratorio): Grupo#_Informe#_Semestre-Paralelo.docx • Ejemplo: Grupo3_Informe4_S3-P1.docx • Para Trabajo Individual: Apellido_Nombre_Trabajo#_Semestre-Paralelo.docx / pdf • Ejemplo: Santamaría_Jorge_Trabajo2_S3-P1.pdf • Para Evaluaciones: Apellido_Nombre_Evaluacion#_Semestre-Paralelo. docx / pdf • Ejemplo: Santamaría_Jorge_Evaluacion2_S3-P2.pdf • No subir el archivo compartido! • Indicaciones finales: • Todas las Clases son presenciales y se creará una clase en MS Teams. • La clase de TEAMS se utilizará para comunicar y compartir información. • La justificación para no rendir pruebas es calamidad doméstica comprobada. • Toda entrega de trabajos/pruebas/exámenes fuera de tiempo se penalizará con el 50% por cada día de retraso. En físico y a través del Aula Virtual (Se indicará) • Al inicio de cada clase se tomará lista generalmente. • NO interrumpir la clase por llegar tarde (No llegar atrasado). • Respetar el formato de las tareas encomendadas! Metodología de la Investigación PhD. Jorge L. Santamaría C. https://orcid.org/0000-0002-3982-2488 Semestre 2023 – 2023 Modalidad Presencial • Para resolver un problema: • Para qué hacer Investigación?: Pensar: Unidad 1: METODOLOGÍA DE LA INVESTIGACIÓN PARA INGENIEROS 1.1 Introducción y Conceptos preliminares 1.2 Ética en la Investigación 1.3 Inducción y deducción en investigación 1.4 Métodos de investigación científica 1.1 Introducción y Conceptos preliminares • Presentar los requerimientos para llevar a cabo excelente y publicable investigación en beneficio de la humanidad. 1.1 Introducción y Conceptos preliminares • Qué diferencia a la investigación de ingeniería con otras investigaciones? • Los ingenieros se dedican a mejorar el lugar donde vivimos. • Existe un Código de Ética que regula las actividades de los ingenieros. • El uso de normas o estándares para asegurar la calidad • Resultados de investigaciones ingenieriles aseguran el Desarrollo Sustentable. 1.1 Introducción y Conceptos preliminares • Ejemplo: El cemento es el principal componente del hormigón y su proceso de fabricación es altamente contaminante → Buscar alternativas para reducer su consume. • El cemento es causante del 8% de las emisiones a nivel global! https://psci.princeton.edu/tips/2020/11/3/cement-and-concrete-the-environmental-impact NOVEMBER 3, 2020 1.1 Introducción y Conceptos preliminares • Conocimientos básicos para la clase: • Entendimiento básico de conceptos fundamentales y lenguaje relevante a la ingeniería civil. • Algo de experiencia en realización de ensayos de laboratorio • Interpretar resultados • Dibujar resultados 1.1 Introducción y Conceptos preliminares • Conocimientos básicos para la clase: • Conocimientos básicos de estadística • Recuerde que Estadística es la ciencia que estudia la variabilidad. 1.1 Introducción y Conceptos preliminares • Conocimientos básicos para la clase: • Uso de software para analizar y dibujar datos? • Excel? • Matlab? • Minitab? • SPSS? 1.1 Introducción y Conceptos preliminares • Ejercicio: Contestar estas preguntas: • Se dibujar (visualizar) un conjunto de datos experimentales? • Regresiones? • Lineal? • Calcular la ecuación? • Coeficiente de correlación? 1.1 Introducción y Conceptos preliminares • Ejercicio: Contestar estas preguntas: • Se buscar artículos científicos en bases de datos para hacer una revisión de la literatura? • Qué bases de datos conoce? • Uso una palabra clave? 1.1 Introducción y Conceptos preliminares • Si no puede hacer esto no puede hacer una buena investigación. • El objetivo de esta clase es darle herramientas para que pueda “investigar” 1.1 Introducción y Conceptos preliminares • Tarea 1: • • • • • • Plantear general un tema de Investigación Buscar en las bases de datos y conseguir 20 artículos relacionados al tema Copiar los títulos de los 20 artículos. Leer el Resumen (Abstract) y conclusiones para ver si le sirve Escoger 10 artículos Realizar una “tabla” para los 10 artículos seleccionados. Un artículo por hoja! Titulo: Autor/es: Año de Publicación: Revista / Journal: DOI (Digital Object Identifier): Base de Indexación (Scopus, SciELO, latindex, etc.): Base de Datos donde encontró el Artículo: EBSCO, Taylor & Francis, ProQuest, etc. Cita en APA: Cita en Chicago: Cita en MLA: 1.1 Introducción y Conceptos preliminares • Tarea: • Fecha de Entrega: • A través del Aula Virtual en la fecha indicada • Subir el link del archivo en formato de documento de Word al Aula Virtual antes de la fecha y hora señalada • Entrega fuera de tiempo: • -50% • Nota Individual (Realizarla en Grupo) • Incluir una Carátula: Facultad…., Asignatura…, Nombres de los integrantes, Semestre…. • Utilizar letra Arial 12, interlineado SENCILLO (Simple), márgenes de 25 mm a todos los lados • Formato del nombre del archivo del Trabajo Individual 1: Grupo 1_Trabajo1_S8-P1.docx 1.1 Introducción y Conceptos preliminares • Revisión de la Tarea: • Ejemplo de búsqueda de información del tema planteado: • Papercrete 1.1 Introducción y Conceptos preliminares • Espectativa! https://bvirtual.uce.edu. ec/login 1.1 Introducción y Conceptos preliminares https://bvirtual.uce.edu.ec/login 1.1 Introducción y Conceptos preliminares https://bvirtual.uce.edu.ec/login 1.1 Introducción y Conceptos preliminares https://bvirtual.uce.edu.ec/login 1.1 Introducción y Conceptos preliminares https://bvirtual.uce.edu.ec/login 1.1 Introducción y Conceptos preliminares • Bases de Datos Alternativas: 1.1 Introducción y Conceptos preliminares • Cómo citar la información que se ha obtenido? 1.1 Introducción y Conceptos preliminares • Cómo citar la información que se ha obtenido? 1.1 Introducción y Conceptos preliminares • Software para citar: 1.1 Introducción y Conceptos preliminares • Software para citar: 1.1 Introducción y Conceptos preliminares • Mitos de Investigación: 1. La investigación es sumamente complicada y difícil • Durante años, algunas personas han dicho que la investigación es muy complicada, difícil, exclusiva. • La investigación es para personas de edad avanzada, lentes, barba y pelo canoso, con “mentes privilegiadas” (nerds) 1.1 Introducción y Conceptos preliminares • Mitos de Investigación: 1. La investigación es sumamente complicada y difícil • Verdad: Cualquier ser humano puede hacer investigación y realizarla correctamente, si aplica rigurosamente el proceso correspondiente. 1.1 Introducción y Conceptos preliminares • Mitos de Investigación: 2. Estudiantes piensan que la investigación científica es algo que no tiene relación con la realidad cotidiana, o centros de investigación, o para graduarse. • Verdad: la investigación soluciona problemas cotidianos: • Electricidad, computadoras, vacunas, ropa. • Procesos industriales, temas de amistad, violencia, deportes, etc. 1.1 Introducción y Conceptos preliminares • Importancia de la Investigación en Ingeniería: • Debe producir prácticos resultados • Debe producir resultados que beneficien a la humanidad • Debe ser basada en ética. • Debe considerar resultados ambientales • Debe ser basada en pruebas realizadas en la industria estándar. • Ejemplo: Descubrimiento de un nuevo material que reemplace el asfalto y el hormigón para construcción de vías que se auto repara. 1.1 Introducción y Conceptos preliminares • Definición de Investigación: Conjunto de procesos sistemáticos y empíricos que se aplican al estudio de un fenómeno. • Se distinguen TRES formas: • cuantitativa, cualitativa y mixta 1.1 Introducción y Conceptos preliminares • La Investigación se la desarrolla en equipo • Mayor alcance • Divertida? • Lazos de amistad? 1.1 Introducción y Conceptos preliminares • Tipos de Investigación: Se la clasifica según el propósito 1. Investigación básica: Producir conocimiento y teorías 1.1 Introducción y Conceptos preliminares • Propósitos de la Investigación científica (Tipos de Investigación): 2. Investigación aplicada: Resolver problemas 1.1 Introducción y Conceptos preliminares • Una Investigación está completa cuando los resultados son publicados en una revista científica • Solo cuando existe Revisión de pares se puede decir que un Nuevo Conocimiento fue Creado 1.1 Introducción y Conceptos preliminares • Cuando una investigación se la lleva a cabo en SECRETO, la investigación NO contribuye al conocimiento mundial ➔ No puede ser descrita como una investigación. 1.1 Introducción y Conceptos preliminares • Investigaciones de publicaciones anteriores o patentes NO constituye investigación. • Ejemplo: Recopilar información de un tema utilizando un buscador de internet. • Resultados de investigaciones que son nuevas para el investigador pero son bien conocidas para otros NO constituye una original investigación publicable. • Toda investigación original debe identificar claramente todos los trabajos previos relevantes antes de reclamar haber desarrollado NUEVO CONOCIMIENTO. 1.2 Ética en la Investigación 1.2 Ética en la Investigación • Siempre que exista alguna falla en proyectos de ingeniería, inevitablemente se buscará culpar a los ingenieros que: • Diseñaron • Construyeron • Realizan el mantenimiento ➔ Se crearon las organizaciones o sociedades profesionales para minimizar las fallas. • Estas organizaciones promueven: • Intercambio de información • Seguir los Códigos de Ética • Promueven procesos de acreditación de profesionales y universidades • Publicación de INVESTIGACION • Normas • Análisis de fallas 1.2 Ética en la Investigación • En muchos países se exige que los ingenieros analicen sus proyectos de una manera Holística (integral) • Se exige que los ingenieros estén registrados; es decir, que su competencia profesional sea comprobada. • Estudiar en una Universidad avalada • Seguir Código de Ética • Se requiere actuar en los mejores intereses de la humanidad y comunidad. • Esto NO significa actuar en favor de familiares. • Seguir un Código de Ética mantiene la reputación de los profesionales. 1.2 Ética en la Investigación • Código de Ética de Ecuador: • TITULO II: DEL EJERCICIO DE LA PROFESION Art.6. Son actos contrarios a la Ética Profesional, los siguientes: a) Actuar contra el decoro y el prestigio de la profesión, contra la disciplina de la Institución o contra el respeto y la solidaridad que deben guardar los miembros entre sí. b) Promover o colaborar en la promulgación de leyes u otras normas, resoluciones, dictámenes o medidas, que vulneren los derechos de la profesión del Ingeniero Civil, del Colegio de Ingenieros, o de uno o más colegiados. c), d) …. • TITULO IV: RELACIONES CON MANDANTES Y CLIENTES Art. 8. Son actos contrarios a la ética profesional, entre Ingenieros Civiles, mandantes o empleadores, los siguientes: a) Siendo empleado, funcionario o ejecutivo de una empresa u organismo, aceptar en provecho propio comisiones, descuentos, bonificaciones u otros beneficios de proveedores, de contratistas o de personas interesadas en la venta de materiales, equipo o servicios o en la ejecución de los trabajos que le hayan sido encomendados. https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwjnpZnA_q37AhU_VTABHS4ABGEQFn oECA4QAw&url=https%3A%2F%2Fcicpec.com%2Fdocumentos%2Floc_2016%2FCODIGO_ETICA_PROFESIONAL.pdf&usg=AOvVaw1JiY4jh5M_NyL9PcO4uAMj 1.2 Ética en la Investigación • La American Society o f Civil Engineers (ASCE): “Engineers shall hold paramount the safety, health and welfare of the public and shall strive to comply with the principles of sustainable development in the performance of their professional duties” • Código de Ética de Australia: “As engineering practitioners, we use our knowledge and skills for the benefit o f the community to create engineering solutions for a sustainable future. In doing so, we strive to serve the community ahead o f other personal or sectional interests” 1.2 Ética en la Investigación ➔ Cuando se lleve a cabo INVESTIGACION en INGENIERIA, el equipo de investigación debe entender las implicaciones y restricciones que aplican a sus proyectos de investigación basados en sus códigos de ética respectivos! • Cuando la Investigación involucra a SERES HUMANOS o a ANIMALES se requiere que el proyecto sea evaluado por el impacto en humanos y animales antes de empezar el proyecto. • Este tipo de proyectos incluye: • Encuestas • Actividad física • Actividad mental Y esto puede afectar o desviar los resultados de la investigación! Se debe informar a los participantes. Ej: Voluntaria, se puede no participar, respuestas anónimas, resultados para fines académicps, etc. 1.2 Ética en la Investigación • En la Universidad Central de Ecuador se requiere que el proyecto sea evaluado por el impacto en humanos y animales antes de empezar el proyecto por el Comité de Etica. • Revisar: https://sites.google.com/site/investigacioneticauce/home?authuser=0 1.2 Ética en la Investigación • Investigación con seres humanos • Revisar: https://drive.google.com/file/d/1LHBaGt_UTWQW_cLl00vkqeY8_oM0kZuV/view 1.2 Ética en la Investigación 1.2 Ética en la Investigación • Ética en la práctica de Investigación de Ingeniería: • La razón por la que importa la ética en investigaciones de ingeniería es que tiene impacto en personas. • La investigación de ingeniería No es un trabajo aislado del desarrollo tecnológico. • Los resultados de investigaciones a menudo tienen efectos: • No deseados • No intencionados • Es imperativo / vital que la responsabilidad ética de los investigadores asegure que los riesgos / amenazas asociadas a sus tecnologías desarrolladas sean minimizados y que sean considerados mecanismos de seguridad alternativos. 1.2 Ética en la Investigación • Tipos de Mala Conducta en Investigación: • Fabricación o invención de datos • Falsificación de datos – alteración • Plagio 1.3 Inducción y deducción en investigación 1.3 Inducción y deducción en investigación • Uno de los principales objetivos de la Investigación científica es: • Encontrar hechos ➔ para establecer teorías y leyes ➔ para explicar o predecir fenómenos 1.3 Inducción y deducción en investigación • Para arribar a conclusiones CORRECTAS se necesita enfoque sistemático ( ideas o principios coherentes). • Enfoque sistemático para llegar a un argumento o razonamiento es esencial. ➔ Los investigadores deben usar LOGICA para probar sus aseveraciones. 1.3 Inducción y deducción en investigación • Antes de que la idea moderna de “investigación” surgiera, los antiguos filósofos llamaban a la investigación “razonamiento lógico”. ➔ Es natural que algunas características de la lógica se estén presentes en la Investigación de hoy en día. Razonamiento lógico Investigación 1.3 Inducción y deducción en investigación ➔ Los métodos INDUCTIVO y DEDUCTIVO de razonamiento son parte de la Investigación. 1.3 Inducción y deducción en investigación • Método Deductivo: El razonamiento deductivo es el proceso de razonar de una suposición general a una aplicación especifica. • En este caso la premisa mayor está basada: • Teoría Algo que se • Regla • Principio conoce! • Ley • Entendimiento general • Se usa ese conocimiento para llegar a una conclusión General Particular 1.3 Inducción y deducción en investigación • Método Deductivo: • Ejemplo: • Cuál es la relación entre las clases A y C si se conoce la relación entre las clases A y C con B? • Premisa General: Todas las A’s son B’s • Premisa Específica: Todas las B’s son C’s • Conclusión: Todas las A’s son C’s • Premisa general: Todos los cuervos son negros (ya se conoce) • Premisa específica: Este pájaro es un cuervo. • Conclusión: El pájaro es de color negro • Premisa general: Todos los pesticidas son tóxicos (ya se conoce) • Premisa específica: Este es un pesticida. • Conclusión: Este pesticida es tóxico. 1.3 Inducción y deducción en investigación • Método Deductivo: • Este método contribuyó mucho al desarrollo de las ciencias primarias. • Matemáticas • No fue exitoso en explorar el universo → Usar Método Inductivo • No fue exitoso para arribar a nuevos hechos → Usar Método Inductivo • La conclusión se deriva inevitablemente de las premisas (suposiciones). • La conclusión puede ser falsa pero LOGICAMENTE VALIDA. • Recuerde: 1.3 Inducción y deducción en investigación • Método Inductivo: El razonamiento inductivo es el proceso de razonar de argumento específico que es basado en la OBSERVACION O EXPERIENCIA para llegar a una conclusión general. • Un investigador puede llegar a establecer LEYES GENERALES con la ayuda de proposiciones especificas (algo probado) a través de argumentos inductivos. Específico General 1.3 Inducción y deducción en investigación • Método Inductivo: • El método inductivo fue ampliamente aceptado como método para generar avances en las ciencias desde apenas 450 años atrás. • Inducción → generalización de un comportamiento de unas pocas muestras al de toda la población • Si una SITUACION O CONDICION es verdad en todos los casos observados, entonces la SITUACION O CONDICION debe ser verdad en todos los casos. • Cuando el tamaño de la muestra es pequeño, la afirmación general puede ser NO confiable. • Las observaciones hechas con inducción son verificadas mas adelante a través del método deductivo para nuevas situaciones. 1.3 Inducción y deducción en investigación • Método Inductivo: • Proceso de Inducción: Observaciones Específicas Detecta Patrones y Regularidades Formula una Hipótesis Conclusiones Generales Probablemente: Teoría y Ley!!! Si se tiene evidencias fuertes! 1.3 Inducción y deducción en investigación • Método Inductivo: • Ejemplos: Qué puede concluir de las siguientes observaciones? Regla en alguno? • 2,4,6,8,10, … • 1,3,9,27,… • 2,3,5,7,11,13,17,19,23,29, … *** se debe tener algo de conocimiento de lo que se desea investigar *** 1.3 Inducción y deducción en investigación • Método Inductivo: • Ejemplos: Qué puede concluir de las siguientes observaciones? 1.4 Métodos de investigación científica • Siempre que vamos a hacer investigación hay que seleccionar el método apropiado para alcanzar los objetivos. 1.4 Métodos de investigación científica • Cada disciplina tiene sus propias maneras para hacer investigación. • Ciencias sociales: • Métodos cualitativos - No experimentales • Sin embargo, a veces se utilizan métodos experimentales • Ciencias exactas: • Métodos cuantitativos - Métodos experimentales 1.4 Métodos de investigación científica • Investigación No Experimental: • No tiene variables Independientes • El investigador no puede: • Controlar las variables • Manipular las variables • Alterar los sujetos de estudio • El investigador OBSERVA el contexto en el cual el fenómeno ocurre • El investigador ANALIZA el contexto en el cual el fenómeno ocurre • Este método depende de: • Correlaciones • Encuestas • Estudios de Caso • Este método No puede demostrar una relación Causa - Efecto 1.4 Métodos de investigación científica • Métodos No experimentales: (Ciencias Sociales) • Observación natural • Investigación histórica • Investigación etnográfica • Estudio transversal / longitudinal • Estudio de Cohorte • Caso de estudio • Investigación correlacional • Construir un modelo 1.4 Métodos de investigación científica • Método de Observación natural (Observacional): • Fundamental para el estudio de las ciencias • Utilizado cuando la experimentación es difícil o imposible • El investigador toma nota de: • Comportamientos • Procesos • Fenómenos alrededor • Usado comúnmente en: • Ciencias Sociales • Salud • Ecología 1.4 Métodos de investigación científica • Método de Observación natural (Observacional): • Ejemplo: Charles Darwin pudo reconocer patrones en la naturaleza a través de observación. 1.4 Métodos de investigación científica • Método de Observación natural (Observacional): • Exitoso en ciencias físicas (difícil hacer experimentos): • Astronomía • Cómo hacer experimentos con cuerpos celestes? → No es práctico. • Geología • Oceanografía • Meteorología 1.4 Métodos de investigación científica • Método de Observación natural (Observacional): • Mayor fortaleza: • Observar los fenómenos en su ambiente natural • Desventaja: • No existen situaciones controladas de un laboratorio. • Realizar la observación pacientemente • Observar sin alterar o interrumpir procesos o fenómenos 1.4 Métodos de investigación científica • Método de Investigación Histórica: • Estudia eventos pasados para entender los mismos. • El propósito de la investigación histórica es predecir eventos basado en eventos pasados. • No es posible hacer ningún experimento. • Los eventos pasados pueden estar afectados por situaciones particulares que pueden haber afectado sus resultados. • Los historiadores no pueden controlar, manipular o controlar variables. • Dependen de observaciones reportadas por testigos • Vivos • Muertos • Reales? • Exageradas? 1.4 Métodos de investigación científica • Investigación Histórica: • Fuentes de la Investigación histórica: • Primaria: • Relatos de testigos visuales (pueden tergiversar lo que vieron o ponerlos en otro contexto) • Restos: • Fósiles • Reliquias: • Armas • Ropa • U tencillos • Testimonios orales • Secundaria: • Libros , enciclopedias 1.4 Métodos de investigación científica • Investigación Etnográfica: • Estudia eventos actuales en los que intervienen personas y no los pasados. • Etnografía = estudio descriptivo de las costumbres y tradiciones de los pueblos • El principal método utilizado es Observación Participante • El investigador vive con los sujetos que son observados. • El investigador toma parte de las actividades de las personas • Para tener éxito: • El investigador debe conocer el roll juega • Debe conocer que datos recolectar y como los va a analizar e interpretar. • Se puede usar el método de observación directa. • Uso de tecnología para recolectar datos. 1.4 Métodos de investigación científica • Estudio Transversal: • Común en ciencias sociales, salud y ecología. • Se lo conoce como Estudio de Prevalencia. • Un estudio transversal puede ser una encuesta de prevalencia de un: • Fenómeno • Situación • Problema • Factores de riesgo • Alguna otra característica • Permite → Fotografía de la población En un cierto momento. 1.4 Métodos de investigación científica • Estudio Transversal: • Herramientas: • Cuestionarios • Entrevistas • Muestra debe ser representativa de: • Edad • Genero • Clase social • Transversal → Población y Tiempo • No es apropiado para estudiar eventos o condiciones “raras” ya que no se puede asegurar que una muestra contenga esas condiciones raras. 1.4 Métodos de investigación científica • Estudio Longitudinal: • Cuando se realiza un estudio observacional por un cierto periodo de tiempo para determinar patrones de cambio de un: • Fenómeno • Situación • Problema • Actitud • Otros atributos en relación al tiempo • Estudio Transversal → las medidas se las toma UNA VEZ • Estudio Longitudinal → Las medidas se las toma en el transcurso del tiempo. • Estudio Longitudinal → Serie de estudios transversales repetitivos. • Estudio Longitudinal puede ser: • Retrospectivo • Prospectivo 1.4 Métodos de investigación científica • Estudio Longitudinal: • Permite realizar estudios sociales o médicos de efectos a largo plazo de: • Procesos • Medicación • Programación • En ecología o agricultura: • Análisis de crecimiento de plantas • Erosión de suelos • Curso de un río • La mayor desventaja es el efecto de la condición de la persona. • Es contactado repetidamente y pueden responder a preguntas de una manera condicionada. 1.4 Métodos de investigación científica • Estudio de Cohorte: • Un grupo que tiene trato común dentro de una población (cohorte) es observado durante un periodo de tiempo. • El trato común puede ser: • Edad • Estado civil • Enfermedad • Altura • Peso Educación • Etc. • Personas, plantas y animales que viven cerca de una fuente de contaminación son ejemplos de cohortes. • Estudio de cohorte puede ser: • Retrospectivo • Prospectivo 1.4 Métodos de investigación científica • Estudio de Cohorte: • Cuando se tiene dos cohortes: • Un grupo es Expuesto • Un grupo es NO expuesto 1.4 Métodos de investigación científica • Caso de Estudio: • Muy útil en Ciencias Sociales y Naturales • Se usan cuando se quiere obtener una visión detallada de un caso en particular o fenómeno. • Características de un Caso de Estudio: • Se lo enfoca en un caso seleccionado • El investigador requiere un entendimiento detallado de un problema. • La recolección de datos se la puede hacer de diferente manera: • Observaciones • Entrevistas • Revisión de datos 1.4 Métodos de investigación científica • Caso de Estudio: • Se asume que el caso bajo estudio es típico de los casos de una clase similar para poder hacer generalizaciones. • Estudios de caso usualmente involucran métodos cualitativos y cuantitativos. • Son utilices cuando los investigadores No pueden llevar a cabo estudios experimentales. • Limitaciones: • Es un método descriptivo, no es analítico ni exploratorio. • Se estudia usualmente UN o pocos casos → no representativo de la población. • La información recolectada es retrospectiva. 1.4 Métodos de investigación científica • Investigación Correlacional: • Es un método transversal • Se lo usa para determinar si cambios en una o mas variables están relacionados a cambios en otras variables. • Investiga la Naturaleza, Grado, Magnitud y Fuerza de correlación entre dos o mas variables cuantitativas. • Una relación entre variables No significa que la una causa la otra. • No se prueba ni desaprueba Si la relación causa – efecto. 1.4 Métodos de investigación científica • Construcción de un Modelo: • Se construye un “modelo para estimar el efecto de un proceso. • La confiabilidad de los modelos depende de la base de datos creada en base a la experiencia. 1.4 Métodos de investigación científica • Investigación No Experimental: • Resumen: • Es descriptiva o correlacional, sin cambios hechos por el investigador. • Se describe una situación como es. • Se describe una relación entre variables. • No se controla las variables. • Difícil de determinar efectos de causa y efecto. • Validar el estudio es siempre una preocupación. • Se preocupa en las mediciones más que en los efectos. • Tomarse su tiempo para ver si este tipo de investigación me es útil. 1.4 Métodos de investigación científica • Métodos No Experimentales → Se limitan a Observar y Describir lo que existe 1.4 Métodos de investigación científica • Métodos No Experimentales : • Método común de análisis: RESULTADOS CUALITATIVOS NUMEROS ESTADISTICA CONFIABILIDAD Y CONCLUSIONES 1.4 Métodos de investigación científica • Métodos experimentales: (Ciencias Exactas) • La palabra “experimento” → Probar 1.4 Métodos de investigación científica • Métodos experimentales: • El conocimiento dado por los experimentos se basa siempre: • Observación • Experiencia → Experimentos generan Conocimiento Empírico → Los métodos experimentales son métodos empíricos 1.4 Métodos de investigación científica • Métodos experimentales: • Ejemplo: Las Clases de Ensayo de Materiales, Mecánica de Suelos 1.4 Métodos de investigación científica • Métodos experimentales: • Bajo situaciones controladas • Siempre se pueden replicar resultados. • Se pueden realizar experimentos: • En un laboratorio • En el campo 1.4 Métodos de investigación científica • Métodos Experimentales: • Pre Experimental • Experimentos Puros (Experimental) • Cuasiexperimentos • Pre Experimental: • Su grado de control es mínimo • No cumple con los requisitos de un experimento “puro”. • Generalmente es útil como un primer acercamiento al problema de investigación en la realidad. • Los dos diseños preexperimentales no son adecuados para el establecimiento de relaciones causales. • En ciertas ocasiones los diseños preexperimentales sirven como estudios exploratorios, pero sus resultados deben observarse con precaución. 1.4 Métodos de investigación científica • Métodos Experimentales: • Pre Experimental: • Estudio de Caso: • Administrar un estímulo o tratamiento a un grupo y después aplicar una medición de una o más variables para observar cuál es el nivel del grupo en éstas. • No hay manipulación de la variable independiente. 1.4 Métodos de investigación científica • Métodos Experimentales: • Pre Experimental: • Diseño de preprueba/posprueba con un solo grupo: • A un grupo se le aplica una prueba previa al estímulo o tratamiento experimental, después se le administra el tratamiento y finalmente se le aplica una prueba posterior al estímulo. • Ofrece una ventaja sobre el anterior: existe un punto de referencia inicial para ver qué nivel tenía el grupo en las variables dependientes antes del estímulo. • No resulta conveniente para fines de establecer causalidad: podrían ocurrir otros acontecimientos capaces de generar cambios entre una medida y otra. • Se corre el riesgo de elegir a un grupo atípico o que en el momento del experimento no se encuentre en su estado normal. 1.4 Métodos de investigación científica • Métodos Experimentales: • Experimentos Puros (Experimental): • Reúnen los dos requisitos para lograr el control y la validez • Incluyen una o más variables independientes y una o más dependientes. • Se observa a un grupo o varios luego de aplicar factores de causa y efecto. • El investigador controla una o mas variables. • Aleatorios – Requiere Análisis Estadístico 1.4 Métodos de investigación científica • Métodos Experimentales: • Experimentos Puros (Experimental): • Diseños Factoriales • Intervienen dos o mas factores donde se estudia el efecto de dichos factores en la respuesta. • Ejemplo: • Factores que intervienen en la resistencia a la compresión del hormigón Relación agua – cemento Tipo de Cemento Resistencia: Curado Compresión Tiempo de mezclado Flexión Uso de vibrador K 2 Se usa software Mezclas: 1.4 Métodos de investigación científica • Métodos Experimentales: • Cuasiexperimentos: • La palabra “cuasi” significa similar. Pero no son iguales. • Los diseños cuasiexperimentales también manipulan deliberadamente, al menos, una variable independiente para observar su efecto sobre una o más variables dependientes. • Difieren de los experimentos “puros” en el grado de seguridad que pueda tenerse en el resultado. • En los diseños cuasiexperimentales, los sujetos no se asignan al azar sino que dichos grupos ya están conformados antes del experimento. • Comunes en ciencias sociales, de la salud, veterinarias. • Se manipula una variable independiente pero los participantes no son seleccionados al azar. 1.4 Métodos de investigación científica • Métodos Experimentales: • Cuasiexperimentos: • Ejemplos: • • • • Grupos terapéuticos ya integrados Equipos deportivos constituidos Trabajadores de turnos establecidos Grupos de habitantes de distintas regiones geográficas (que ya estén agrupados por zona). 1.4 Métodos de investigación científica • Métodos Experimentales: • Resumen: • Métodos Experimentales → Se manipula variables intencionalmente para asegurarse Cómo y Por Qué un evento en particular ocurre. Unidad 2: ORIGEN DEL PROYECTO DE INVESTIGACION 2.1 Enfoque cuantitativo, cualitativo y mixto 2.2 Planteamiento del problema de investigación 2.3 Marco teórico 2.4 Formulación de hipótesis y definición de variables 2,1 Enfoque cuantitativo, cualitativo y mixto • Recuerde: • “Conjunto de procesos sistemáticos, críticos y empíricos que se aplican al estudio de un fenómeno o problema con el objetivo de ampliar su conocimiento. • Los fenómenos a estudiar pueden ser variados: • Comportamientos • Sentimientos y emociones • Enfermedades • Procesos psicológicos • En ingeniería: • Materiales construcción • Métodos de diseño • Métodos constructivos 2,1 Enfoque cuantitativo, cualitativo y mixto • Algunos autores les llaman las rutas posibles para resolver un problema de investigación. • Existen varios enfoques: • Todas son válidas para generar conocimiento. 2,1 Enfoque cuantitativo, cualitativo y mixto • Preguntas frecuentes: • Cual ruta escojo? • Cuál es la mejor? • Cuál es la más rápida? • Cuá es la menos costosa? • Cuál es la ideal? • Cuál es la más fácil? • Cuál es la apropiada? • Etc. 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cuantitativo: El proceso es secuencial y probatorio 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cuantitativo • Características: • Refleja la necesidad de medir y estimar magnitudes de los fenómenos o problemas de investigación • El investigador o investigadora plantea un problema de estudio delimitado y concreto sobre el fenómeno. • Una vez planteado el problema de estudio, el investigador considera lo que se ha investigado anteriormente (la revisión de la literatura) y construye un marco teórico (la teoría que habrá de guiar su estudio), del cual deriva una o varias hipótesis y las somete a prueba mediante el empleo de los diseños de investigación apropiados. • Las hipótesis ( “creencias”) se generan antes de recolectar y analizar los datos. • La recolección de los datos se fundamenta en la medición (se miden las variables contenidos en las hipótesis). • Se lleva a cabo al utilizar procedimientos estandarizados y aceptados por una comunidad científica. • Para que una investigación sea creíble y aceptada por otros investigadores, debe demostrarse que se siguieron tales procedimientos. • Como en este enfoque se pretende medir, los fenómenos estudiados deben poder observarse o referirse al “mundo real”. 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cuantitativo • Características: • Debido a que los datos son producto de mediciones, se representan mediante números (cantidades) y se deben analizar con métodos estadísticos. • En el proceso se trata de tener el mayor control para lograr que otras posibles explicaciones, distintas o “rivales” a la propuesta del estudio (hipótesis), se desechen y se excluya la incertidumbre y minimice el error. Es por esto que se confía en la experimentación o en las pruebas de causalidad. • Los análisis cuantitativos se interpretan a la luz de las predicciones iniciales (hipótesis) y de estudios previos (teoría). • La interpretación constituye una explicación de cómo los resultados encajan en el conocimiento existente. • La investigación cuantitativa debe ser lo más “objetiva” posible. • Los fenómenos que se observan o miden no deben ser afectados por el investigador, quien debe evitar en lo posible que sus temores, creencias, deseos y tendencias influyan en los resultados del estudio o interfieran en los procesos y que tampoco sean alterados por las tendencias de otros. • Los estudios cuantitativos siguen un patrón predecible y estructurado (el proceso) y se debe tener presente que las decisiones críticas sobre el método se toman antes de recolectar los datos. 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cuantitativo • Características: • En una investigación cuantitativa se intenta generalizar los resultados encontrados en un grupo o segmento (muestra) a una colectividad mayor (universo o población). • También se busca que los estudios efectuados puedan replicarse. • Al final, con los estudios cuantitativos se pretende confirmar y predecir los fenómenos investigados, buscando regularidades y relaciones causales entre elementos. • La meta principal es la formulación y demostración de teorías. • Para este enfoque, los datos generados poseen los estándares de validez y confiabilidad, las conclusiones derivadas contribuirán a la generación de conocimiento. • Esta aproximación se vale de la lógica o razonamiento deductivo, que comienza con la teoría, y de ésta se derivan expresiones lógicas denominadas “hipótesis” que el investigador somete a prueba. • La investigación cuantitativa pretende identificar leyes “universales” y causales. • La búsqueda cuantitativa ocurre en la “realidad externa” al individuo. 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cualitativo: 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cualitativo • Características: • El investigador o investigadora plantea un problema, pero no sigue un proceso definido claramente. • Sus planteamientos iniciales no son tan específicos como en el enfoque cuantitativo y las preguntas de investigación no siempre se han conceptualizado ni definido por completo. • En lugar de iniciar con una teoría y luego “voltear” al mundo empírico para confirmar si ésta es apoyada por los datos y resultados, el investigador comienza examinando los hechos en sí y en el proceso desarrolla una teoría coherente para representar lo que observa. • Las investigaciones cualitativas se basan más en una lógica y proceso inductivo (explorar y describir, y luego generar perspectivas teóricas). Van de lo particular a lo general. • En la mayoría de los estudios cualitativos no se prueban hipótesis, sino que se generan durante el proceso y se perfeccionan conforme se recaban más datos; son un resultado del estudio. 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cualitativo • Características: • El enfoque se basa en métodos de recolección de datos no estandarizados ni predeterminados completamente. • Obtener las perspectivas y puntos de vista de los participantes (sus emociones, prioridades, experiencias, significados y otros aspectos más bien subjetivos). • El investigador hace preguntas más abiertas, recaba datos expresados a través del lenguaje escrito, verbal y no verbal, así como visual, los cuales describe, analiza y convierte en temas que vincula, y reconoce sus tendencias personales. • El investigador cualitativo utiliza técnicas para recolectar datos, como la observación no estructurada, entrevistas abiertas, revisión de documentos, discusión en grupo, evaluación de experiencias personales, registro de historias de vida, e interacción e introspección con grupos o comunidades. • El proceso de indagación es más flexible y se mueve entre las respuestas y el desarrollo de la teoría. • Su propósito consiste en “reconstruir” la realidad, tal como la observan los actores de un sistema social definido previamente. • La aproximación cualitativa evalúa el desarrollo natural de los sucesos, es decir, no hay manipulación ni estimulación de la realidad. 2,1 Enfoque cuantitativo, cualitativo y mixto • Enfoque cualitativo • Características: • Se fundamenta en una perspectiva interpretativa centrada en el entendimiento del significado de las acciones de seres vivos, sobre todo de los humanos y sus instituciones (busca interpretar lo que va captando activamente). • Postula que la “realidad” se define a través de las interpretaciones de los participantes en la investigación respecto de sus propias realidades. • El investigador se introduce en las experiencias de los participantes y construye el conocimiento, siempre consciente de que es parte del fenómeno estudiado. • No pretenden generalizar de manera probabilística los resultados a poblaciones más amplias ni obtener necesariamente muestras representativas; incluso, regularmente no pretenden que sus estudios lleguen a repetirse. • El enfoque cualitativo puede concebirse como un conjunto de prácticas interpretativas que hacen al mundo “visible”, lo transforman y convierten en una serie de representaciones en forma de observaciones, anotaciones, grabaciones y documentos. • Es naturalista (porque estudia los fenómenos y seres vivos en sus contextos o ambientes naturales y en su cotidianidad) e interpretativo (pues intenta encontrar sentido a los fenómenos en función de los significados que las personas les otorguen). 2,1 Enfoque cuantitativo, cualitativo y mixto • Diferencias entre Enfoque cuantitativo y cualitativo • El enfoque cualitativo busca principalmente la “dispersión o expansión” de los datos e información, mientras que el enfoque cuantitativo pretende “acotar” intencionalmente la información. • Medir con precisión las variables del estudio • Un estudio cuantitativo se basa en investigaciones previas, el estudio cualitativo se fundamenta primordialmente en sí mismo. • El cuantitativo se utiliza para consolidar las creencias (formuladas de manera lógica en una teoría o un esquema teórico) y establecer con exactitud patrones de comportamiento de una población; y el cualitativo, para que el investigador se forme creencias propias sobre el fenómeno estudiado, como lo sería un grupo de personas únicas o un proceso particular. Revisar!!! 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: PASO 1 (Idea) 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Fuentes • Experiencias individuales • Materiales escritos (libros, artículos de revistas o periódicos, notas y • tesis) • Piezas audiovisuales y programas de radio o televisión • Información disponible en internet (dentro de su amplia gama de posibilidades, como páginas web, foros de discusión, redes sociales y otras) • Teorías • Descubrimientos producto de investigaciones • Conversaciones personales • Observaciones de hechos • Creencias e incluso intuiciones y presentimientos 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Fuentes: • Sin embargo, las fuentes que originan las ideas no forzosamente se relacionan con la calidad de éstas. • Ejemplo: Idea de un artículo científico no necesariamente mejor que una idea cuando veía un partido de fútbol del mundial. • Después se puede conversar la idea con algunos amigos y precisarla un poco más o modificarla. • Más tarde se busca información al respecto en revistas y periódicos, hasta consultar artículos científicos y libros. Lo mismo podría suceder en el caso de otros temas. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Fuentes: • A veces las ideas nos las proporcionan otras personas y responden a determinadas necesidades. • Otras personas pueden ver o analizar un fenómeno desde otro punto de vista. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Motores de Ideas para Investigar: • Inspiración: Basada en los intereses personales del investigador y hay que trabajar en el tópico o idea para mejorarla. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Motores de Ideas para Investigar: • Oportunidad: Cuando por facilidad podemos indagar sobre algún tema (becas para investigar nuevos métodos constructivos). 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Motores de Ideas para Investigar: • Conceptualización: Detectar un fenómeno o problema de investigación que requiere indagarse en profundidad o aportarse mayor conocimiento o evidencia para conocerlo, definirlo, describirlo y/o comprenderlo. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Motores de Ideas para Investigar: • Necesidad de resolver una problemática: Cuando requiere solucionarse “algo” (Ej: el calentamiento global, contaminación de ríos). 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Motores de Ideas para Investigar: • Necesidad de cubrir “huecos de conocimiento”: Es frecuente que el investigador que se vaya compenetrando con algún campo de conocimiento, detecte temas poco estudiados o no investigados en su contexto y decida adentrarse en éstos. • Encontrar la frontera del conocimiento (nichos). 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Vaguedad de Ideas Iniciales: • La mayoría de las ideas iniciales son vagas y requieren analizarse con cuidado para que se transformen en planteamientos más precisos y estructurados, en particular en el proceso cuantitativo. • Cuando una persona concibe una idea de investigación, debe familiarizarse con el campo de conocimiento en el que se ubica la idea. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: • Vaguedad de Ideas Iniciales: • Cuando una persona concibe una idea de investigación, debe familiarizarse con el campo de conocimiento en el que se ubica la idea --> Indispensable conocer los Antecedentes • Ayuda a No investigar sobre algún tema que ya se haya estudiado a fondo. • Una buena investigación debe ser novedosa: • Tratar un tema no estudiado • Profundizar poco en uno medianamente conocido • Darle una visión diferente o innovadora a un problema aunque ya se haya examinado repetidamente (por ejemplo, mejorar un material existente) 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Ideas para una Investigación: --> Indispensable conocer los Antecedentes • Ayuda a Estructurar más formalmente la idea de investigación: • Su idea será precisa en mayor medida. • Ayuda a Seleccionar la perspectiva principal desde la cual se abordará la idea de investigación. • Aunque los fenómenos o problemas sean “los mismos”, pueden analizarse de diversas formas, según la disciplina dentro de la cual se enmarque la investigación. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Investigación previa de los temas: • Cuanto mejor se conozca un tema, el proceso de afinar la idea será más eficiente y rápido. • Desde luego, hay temas que han sido más investigados que otros y, en consecuencia, su campo de conocimiento se encuentra mejor estructurado. Estos casos requieren planteamientos más específicos. • Podríamos decir que hay: • Temas ya investigados, estructurados y formalizados: Se puede encontrar documentos escritos y otros materiales que reportan los resultados de investigaciones anteriores. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Podríamos decir que hay: • Temas ya investigados pero menos estructurados y formalizados: Se ha investigado aunque existen sólo algunos documentos escritos y otros materiales que reporten esta investigación; el conocimiento puede estar disperso o no ser accesible. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Podríamos decir que hay: • Temas poco investigados y no estructurados, los cuales requieren un esfuerzo para encontrar lo que escasamente se ha investigado. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Podríamos decir que hay: • Temas no investigados. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Criterios para generar ideas: • Las buenas ideas intrigan, alientan y estimulan al investigador de manera personal. • Es importante que nos resulte atractiva, interesante o necesaria. • Es muy tedioso tener que trabajar en algo que no sea de nuestro interés. • El estudio y tendrá una mayor predisposición para salvar los obstáculos que se le presenten. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Criterios para generar ideas: • Las buenas ideas de investigación “no son necesariamente nuevas, pero sí novedosas”. • En muchas ocasiones es necesario actualizar estudios previos. • Adaptar los planteamientos derivados de investigaciones efectuadas en contextos diferentes. • Conducir ciertos planteamientos a través de nuevos caminos. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Criterios para generar ideas: • Las buenas ideas de investigación pueden servir para elaborar teorías y solucionar problemáticas. • Conducir a formular, integrar o probar una teoría. • A iniciar otros estudios que logren constituir una teoría o bien • A generar nuevos métodos de recolectar y analizar datos. • Dan origen a investigaciones que contribuyen a resolver problemas concretos. 2,1 Enfoque cuantitativo, cualitativo y mixto • Origen de un proyecto de Investigación: • Criterios para generar ideas: • Las buenas ideas pueden fomentar nuevas interrogantes y cuestionamientos: • Hay que encontrar respuestas, pero también es preciso hacer más preguntas. • A veces un estudio llega a generar más preguntas que respuestas. 2.1 Enfoque cuantitativo, cualitativo y mixto • Recomendaciones para desarrollar ideas y comenzar una investigación: • Examinar temas acotados, que no sean muy generales. • Compartir la idea con amigos y otras personas informadas (en persona y en las redes sociales en internet) para conocer opiniones, datos y referencias. • Meditar y escribir sobre las implicaciones de estudiar la idea, no solamente enunciarla. • Reflexionar sobre la idea para enfocarse en algún aspecto. • Relacionar nuestras ideas personales y experiencias con la idea de investigación. 2.1 Enfoque cuantitativo, cualitativo y mixto • Resumen: 2.1 Enfoque cuantitativo, cualitativo y mixto • Resumen: 2.1 Enfoque cuantitativo, cualitativo y mixto • Resumen: 2.2 Planteamiento del problema de investigación (PASO 2) En la Ruta Cuantitativa: 2.2 Planteamiento del problema de investigación (PASO 2) En la Ruta Cuantitativa: 2.2 Planteamiento del problema de investigación (PASO 2) En la Ruta Cuantitativa: • ***El planteamiento del problema es el centro, el corazón de la investigación: dicta o define los métodos y la ruta a seguir.*** 2.2 Planteamiento del problema de investigación: • Criterios: • El problema debe estar formulado como pregunta, claramente y sin ambigüedad. • Ejemplo: ¿qué efecto?, ¿en qué condiciones...?, ¿cuál es la influencia de...?, ¿cómo se relaciona... con...? • El planteamiento debe implicar la posibilidad de ser investigado empíricamente. • Que se pueda realizar experimentos • El planteamiento debe ser ético. • No dañar a seres humanos o implique racismo. • Cuando el problema asocia variables, fenómenos, eventos, hechos, etc., la o las relaciones deben expresarse con claridad. 2.2 Planteamiento del problema de investigación: • Sus principales propósitos respecto a fenómenos, eventos, variables y hechos son: • Explorarlos cuantificando • Describirlos • Establecer sus precedentes • Comparar grupos, categorías o clases • Relacionarlos • Determinar sus causas y efectos • Evaluarlos • Desarrollar tecnología e innovaciones • Resolver problemáticas a través de conocerlos 2.2 Planteamiento del problema de investigación: • El Problema de Investigación incluye los siguientes componentes: • Los objetivos que persigue la investigación • Las preguntas de investigación • La justificación • Viabilidad del estudio • La evaluación de las deficiencias en el conocimiento del problema. 2.2 Planteamiento del problema de investigación: • Los objetivos que persigue la investigación: • Características: • • • • • • Deben expresarse con claridad y ser concretos Tienen un número limitado Medibles Realistas —> puedan alcanzarse Limitado en el tiempo Utilizar verbos en infinitivo • Ej: describir, determinar, demostrar, examinar, especificar, indicar, analizar, estimar, comparar, valorar, probar y relacionar • Deben ser congruentes entre sí. 2.2 Planteamiento del problema de investigación: • Los objetivos que persigue la investigación: • Redacción de los Objetivos: • Determinar el objetivo principal de la investigación • Definir de forma concreta lo que buscas lograr con tu investigación. • Leyendo la literatura de tu disciplina y encontrando lagunas en la investigación existente. • Desglosar el enfoque de tu investigación en objetivos de investigación • Desglosar en pasos más pequeños y objetivos separados → Objetivo general y otros objetivos específicos y limitados. • En el objetivo general exponer en sentido amplio lo que se pretende conseguir con tu investigación. • Utilizar los objetivos específicos para describir cómo puedes alcanzar tu objetivo general puntualmente. • Pedir retroalimentación • Solicitar la revisión de un colega, amigo o un mentor • Detectar errores • Objetivos sean más comprensibles para otras personas. 2.2 Planteamiento del problema de investigación: • Preguntas de investigación cuantitativa: • Se presenta el problema de manera directa y minimiza distorsión. • Son los propios objetivos, pero ahora presentados en forma de interrogantes. 2.2 Planteamiento del problema de investigación: • Preguntas de investigación cuantitativa: • Características: • Ser específicas, enfocadas o concretas. • Establecer los límites temporales y espaciales del estudio • Poder responderse recolectando y analizando datos empíricos (observables o medibles). • Desconocerse sus respuestas (si se conocen, no valdría la pena realizar el estudio). • Contestarse utilizando medios éticos. • Aportar conocimiento sustancial en un área de estudio o profesional. • Ser claras, comprensibles por otras personas, además del propio investigador. • Contener conceptos (variables) que puedan ser identificables y medibles. 2.2 Planteamiento del problema de investigación: • Justificación de la investigación: • Justificar el estudio que pretendemos realizar, basándonos en los objetivos y las preguntas de investigación. • Exponer las razones por las cuales es importante o necesario llevarlo a cabo (para qué del estudio) y los beneficios que se derivarán de él. 2.2 Planteamiento del problema de investigación: • Justificación de la investigación: • Criterios: • Valor teórico o de conocimiento. • ¿se llenará algún vacío de conocimiento? • Conveniencia. • ¿Qué tan útil es la investigación?, ¿para qué sirve? • Relevancia social. • ¿Cuál es su trascendencia para la sociedad? ¿de qué modo? En resumen, • Implicaciones prácticas y de desarrollo. • ¿Ayudará a resolver alguno o varios problemas reales? • Utilidad metodológica. • ¿El estudio puede contribuir a crear nuevos métodos y/o técnicas? ¿contribuye a la definición de un concepto, variable o relación entre variables? • ¿Pueden lograrse con él mejoras en la forma de experimentar? 2.2 Planteamiento del problema de investigación: • Justificación de la investigación: *** Desde luego, es muy difícil que una investigación pueda responder positivamente a todas estas preguntas. Algunas veces solo cumple un criterio!!*** 2.2 Planteamiento del problema de investigación: • Viabilidad o factibilidad de la investigación: • Tomar en cuenta: • Tener conocimientos y competencias necesarias • Disponibilidad de tiempo • Recursos financieros • Recursos humanos • Recursos materiales 2.2 Planteamiento del problema de investigación: • Viabilidad o factibilidad de la investigación: • Cómo puedo hacer investigación si no tengo: • Acceso a bases de datos? • Laboratorios? • Software? • Computadoras? 2.2 Planteamiento del problema de investigación: • Evaluación de las deficiencias en el conocimiento del problema: • Es importante considerar las siguientes preguntas para saber dónde se encuentra ubicada nuestra investigación. • ¿Qué más necesitamos saber del problema? • ¿Qué falta examinar o abordar? • ¿Qué no se ha considerado? • ¿Qué se ha olvidado? • ¿Qué otras preguntas pueden hacerse que se vinculen a las de la propia indagación? 2.2 Planteamiento del problema de investigación: • Resumen: 2.2 Planteamiento del problema de investigación: • Tarea Individual 2: Planteamiento del problema de investigación • Carátula (incluir el número de grupo) • Tema de Investigación: • Refinar el tema de Investigación según lo indicado en la Clase • Lluvia de ideas (Brainstorming) – 1 carilla • Planteamiento del Problema para su tema específico planteado: • 1 objetivo General • 4 objetivos específicos (mínimo) • Preguntas de Investigación – Una por cada objetivo • Justificación: 2 párrafos mínimo (1 carilla a espacio sencillo) • Viabilidad: 2 párrafos mínimo(1 carilla a espacio sencillo) • Evaluación de las Deficiencias: 1 párrafo minimo (0.5 carillas a espacio sencillo) 2.2 Planteamiento del problema de investigación: • Tarea: • Fecha de Entrega: • A través del Aula Virtual en la fecha indicada • Subir el link del archivo en formato de documento de Word al Aula Virtual antes de la fecha y hora señalada • Entrega fuera de tiempo: • -50% • Nota Individual (Realizarla en Grupo) • Incluir una Carátula: Facultad…., Asignatura…, Nombres de los integrantes, Semestre…. • Utilizar letra Arial 12, interlineado SENCILLO (Simple), márgenes de 25 mm a todos los lados • Formato del nombre del archivo del Trabajo Individual 2: Grupo 1_Trabajo2_S8-P1.docx 2.3 Marco Teórico: 2.3 Marco Teórico: Es un proceso de inmersión en el conocimiento existente y disponible que debe estar relacionado con el planteamiento del problema (objetivos, preguntas, justificación, viabilidad y evaluación de las deficiencias de lo que se sabe del problema) 2.3 Marco Teórico: • Además: • Es parte del reporte o informe de investigación. • Es sustentar teóricamente el estudio. • Es analizar y exponer de una manera organizada las teorías, investigaciones previas y los antecedentes en general que se consideren válidos y adecuados para contextualizar y orientar tu estudio. • “Marco teórico” no es lo mismo que “teoría”. 2.3 Marco Teórico: • Utilidad: • Ayuda a afinar el planteamiento del problema (todos sus componentes). • Guía e “ilumina” sobre cuál es la forma más adecuada y pertinente de realizar nuestra investigación. • Al revisar analíticamente los antecedentes podemos percatarnos de cómo ha sido abordado y tratado el problema o fenómeno bajo estudio. • Qué tipos de investigaciones se han realizado. • En qué clases de muestras y casos • ¿cómo se han recabado estos? • En qué contextos se han llevado a cabo (lugares, tiempos, situaciones). • Qué rutas han seguido (cuantitativa, cualitativa, mixta o las tres) y bajo qué abordajes o diseños (experimentos, encuestas, etcétera). 2.3 Marco Teórico: • Utilidad: • Orienta sobre lo que queremos y lo que no queremos para nuestra investigación. • Evita errores que se han cometido en estudios previos (función preventiva). • Amplia el horizonte del estudio. • Encamina para que nos centremos en el planteamiento problema y evitar desviaciones de este. • Documenta la necesidad de implementar el estudio (justificación). • Conduce al establecimiento de hipótesis o afirmaciones que habrán de someterse a prueba en la realidad, o ayuda a no establecerlas por razones bien fundamentadas. • Inspira nuevas líneas y áreas de investigación. • Provee de un marco de referencia para interpretar los resultados del estudio. • Se lo utiliza para explicar nuestros resultados. 2.3 Marco Teórico: • Utilidad: • En “definitiva” muestra el panorama mayor o “big picture” → donde nos podemos mover! 2.3 Marco Teórico: • Etapas: 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas) • Detectar • Examinar • Obtener → Referencias bibliográficas adecuadas para el planteamiento del problema 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas) • “Literatura” se refiere a: • Libros • Artículos y ensayos en revistas científicas • Tesis • Foros y páginas de internet • Materiales audiovisuales • Testimonios de expertos • Todas aquellas fuentes pero siempre apoyadas por una organización profesional, científica o académica. 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas) • Una buena búsqueda de literatura relevante es un proceso de 2 pasos: • Identificar los temas principales y secundarios o conceptos relevantes • Colocar la Cita de la fuente (articulo, sitio web, etc. ) 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas) • Recuerde que: • Una revisión de la literatura integral debe: • Analizar y sintetizar sistemáticamente los trabajos de “calidad” disponibles. • Dotar de cimientos firmes sobre el tema de interés. • Dotar de opciones de metodologías de investigación. • Demostrar que el trabajo de investigación contribuirá al campo de conocimiento. 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas). • Motores de búsqueda: A fin de comenzar “con el pie derecho” y no “perder la ruta cuantitativa” → elegir los términos de búsqueda, palabras clave o descriptores. • Google académico (Google Scholar) → Ok Para empezar! • EBSCO (Academic Search) 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas). 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas). 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas). 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas). 2.3 Marco Teórico: • Etapas: • Detección y obtención de la literatura pertinente de acuerdo al planteamiento del problema de investigación (fuentes bibliográficas). 2.3 Marco Teórico: • Etapas: • Revisión analítica y selectiva de la literatura (cada fuente y su conexión con otras) • Una vez que se obtuvo las referencias (la literatura) de interés procedes se procede a consultarlas o revisarlas analíticamente. 2.3 Marco Teórico: • Etapas: • Revisión analítica y selectiva de la literatura (cada fuente y su conexión con otras) • Se recomienda hacer una matriz para tabular información. 2.3 Marco Teórico: • Etapas: • Evaluar el panorama que nos revele la revisión de la literatura (síntesis de la literatura encontrada) • Panoramas: • Existencia de una teoría completamente desarrollada y fundamentada • Ya existe una teoría capaz de describir, explicar y predecir el planteamiento o fenómeno de estudio • Tener cuidado de no investigar algo ya estudiado muy a fondo. 2.3 Marco Teórico: • Etapas: • Evaluar el panorama que nos revele la revisión de la literatura (síntesis de la literatura encontrada) • Panoramas: • Existencia de varias teorías aplicables a nuestro problema de investigación • Cuando al revisar la literatura se descubren varias teorías o modelos aplicables al problema de investigación. • Podemos elegir una o uno para edificar el marco teórico (desglosando la teoría) • O tomar partes de algunas o todas las teorías. 2.3 Marco Teórico: • Etapas: • Evaluar el panorama que nos revele la revisión de la literatura (síntesis de la literatura encontrada) • Panoramas: • Existencia de “piezas y trozos” de teorías (generalizaciones empíricas) • Todavía no se dispone de diversas teorías que expliquen los fenómenos de determinadas áreas del conocimiento y profesionales. • Solo se tienen hipótesis o generalizaciones empíricas. 2.3 Marco Teórico: • Etapas: • Evaluar el panorama que nos revele la revisión de la literatura (síntesis de la literatura encontrada) • Panoramas: • Descubrimientos interesantes pero parciales que no se ajustan a una teoría. • No hay teorías ni generalizaciones empíricas, sino solo algunos estudios previos asociados para la investigación. 2.3 Marco Teórico: • Etapas: • Evaluar el panorama que nos revele la revisión de la literatura (síntesis de la literatura encontrada) • Panoramas: • Existencia de antecedentes mínimos, guías aún no investigadas e ideas vagamente relacionadas con el problema de investigación. • A veces la literatura nos revela que se han realizado muy pocas investigaciones en relación al planteamiento del problema. 2.3 Marco Teórico: • Etapas: • Construir el marco teórico. • Hay que tener claro el panorama revelado por la literatura. 2.3 Marco Teórico: • Etapas: • Construir el marco teórico. • Cuente una historia y utilizar la literatura relevante para sustentar sus aseveraciones. 2.3 Marco Teórico: • Tarea Individual 3: Marco Teórico (Revisión de la Literatura) • Carátula (incluir el número de grupo) • Marco Teórico: 4 carillas mínimo (Espaciamiento sencillo) • Utilizar mínimo 10 artículos o fuentes bibliográficas • Los que seleccionó anteriormente en la Tarea 1 • Referencias Bibliográficas • Citar en APA y Chicago • Utilizar algún software de manejo de fuentes bibliográficas • Ej: Zotero • Elaborar párrafos completos para expresar sus ideas • Oración Tema y oraciones de soporte. • Recuerde que una oración larga NO es un párrafo. • Un párrafo está conformado por varias oraciones. 2.3 Marco Teórico: • Tarea: • Fecha de Entrega: • A través del Aula Virtual en la fecha indicada • Subir el link del archivo en formato de documento de Word al Aula Virtual antes de la fecha y hora señalada • Entrega fuera de tiempo: • -50% • Nota Individual (Realizarla en Grupo) • Incluir una Carátula: Facultad…., Asignatura…, Nombres de los integrantes, Semestre…. • Utilizar letra Arial 12, interlineado SENCILLO (Simple), márgenes de 25 mm a todos los lados • Formato del nombre del archivo del Trabajo Individual 2: Grupo 1_Trabajo2_S8-P1.docx 2.4 Formulación de hipótesis y definición de variables: 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Los alcances son: 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Estudios Exploratorios • Investigan fenómenos o problemas poco estudiados, de los cuales se tienen dudas o no se han abordado en el contexto. • La literatura reveló que tan solo hay guías no investigadas • e ideas vagamente relacionadas con el problema de estudio • Identifican conceptos o variables e hipótesis promisorias para indagar. • Sirven para obtener información sobre la posibilidad de llevar a cabo una investigación más completa y profunda • Preparan el terreno para estudios más amplios, elaborados y profundos • Investigan desde una perspectiva innovadora. • Se llevan a cabo cuando el propósito es estudiar fenómenos y problemas nuevos, desconocidos o poco estudiados. → Estudios Exploratorios para “Descubrir” 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Estudios Exploratorios • Analizar fenómenos desconocidos, poco tratados o novedosos: un virus de reciente aparición. 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Estudios Descriptivos • Tienen como finalidad especificar propiedades y características de conceptos, fenómenos, variables o hechos en un contexto determinado. • Miden o recolectan datos y reportan información sobre diversos conceptos, variables, aspectos, dimensiones o componentes del fenómeno o problema a investigar. • Definen y miden variables y las caracterizan, así como al fenómeno o planteamiento referido. • Cuantifican y muestran con precisión los ángulos o dimensiones de un fenómeno, problema, suceso, comunidad, contexto o situación. • El investigador debe ser capaz de definir, o al menos visualizar, qué se medirá. → Estudios Descriptivos muestran las dimensiones de un fenómeno. 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Estudios Correlacionales: • Tienen como propósito conocer la relación o grado de asociación que existe entre dos o más conceptos, variables, categorías o fenómenos en un contexto en particular. • Permiten cierto grado de predicción. • Miden las variables y su relación en términos estadísticos. • Las correlaciones pueden ser positivas (directamente proporcionales) o negativas (inversamente proporcionales). 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Estudios Correlacionales: • Riesgo: Las relaciones espurias o falsas → No tienen un sentido práctico 2.4 Formulación de hipótesis y definición de variables: • Alcance de la Investigación: • Estudios Explicativos: • Pretenden determinar las causas de los eventos y fenómenos de cualquier índole. • Establecen relaciones de causalidad entre conceptos, variables, hechos o fenómenos en un contexto concreto. • Generan un sentido de entendimiento de los fenómenos y problemas que examinan. → Estudios Explicativos “explican“ el fenómeno. 2.4 Formulación de hipótesis y definición de variables: • Diferencias entre los Alcances de la Investigación: • Las investigaciones explicativas son más estructuradas que los estudios con los demás alcances y proporcionan un sentido de entendimiento del fenómeno al que hacen referencia. • Se guían por preguntas como: ¿qué efectos tiene “una variable” sobre “otra variable”? • ¿qué variables mediatizan los efectos y de qué modo? • Los estudios descriptivos responderían a preguntas del tipo: • ¿qué mecanismos utilizan los agentes de erosión del hormigón? • ¿ En qué lugares ocurre? • ¿ Cuántas estructuras han fallado en la última década? • ¿ En qué ciudades ocurren? • Las investigaciones correlacionales se abocan a preguntas como: • ¿existe una relación entre “variable 1” y “Variable 2”? • ¿ La prevalencia de “Variable” es más profunda en “………”? • Los estudios exploratorios, en cambio, responden a cuestionamientos como: • ¿cuáles son las causas que originan ……….? • ¿un nuevo tipo de aditivo o producto puede contrarrestar los efectos de ……? 2.4 Formulación de hipótesis y definición de variables: • Factores que determinan el tipo de alcance: • El conocimiento actual del problema de investigación • El propósito definido por el investigador 2.4 Formulación de hipótesis y definición de variables: • Cuál alcance es el mejor? • → Respuesta: Ninguno. Depende…. 2.4 Formulación de hipótesis y definición de variables: • Formulación de hipótesis: • Ejemplos?????? 2.4 Formulación de hipótesis y definición de variables: • Formulación de hipótesis: 2.4 Formulación de hipótesis y definición de variables: • Hipótesis: • Características: • Referirse a una situación “real” • Las hipótesis únicamente se pueden someter a prueba en un contexto específico y definido (tiempo y lugar, así como con casos concretos). • Las variables o términos de las hipótesis deben ser lo más concretos, entendibles y precisos que sea posible. • Los términos o variables de una hipótesis deben ser observables o medibles, así como la relación planteada entre ellas, es decir, tener referentes empíricos. • Las hipótesis científicas, al igual que los objetivos y las preguntas de investigación, no incluyen juicios morales ni cuestiones que no podamos medir. • La relación propuesta entre las variables debe ser clara, lógica y creíble o posible. • Es indispensable que se comprenda la forma en que se vinculan las variables y esta relación no puede ser ilógica. 2.4 Formulación de hipótesis y definición de variables: • Hipótesis: • Tipos: 2.4 Formulación de hipótesis y definición de variables: • Hipótesis de Investigación: • Proposiciones tentativas acerca de la o las posibles relaciones entre dos o más variables • Pueden ser: 2.4 Formulación de hipótesis y definición de variables: • Hipótesis de Investigación: • Hipótesis Predictivas de un Valor o dato: • Se utilizan para intentar predecir un dato o valor en una o más variables que se observarán o medirán. • Ejemplo: • La tasa de desocupación (TD) de la población económicamente activa para el año próximo en Ecuador será de 5.2%. 2.4 Formulación de hipótesis y definición de variables: • Hipótesis de Investigación: • Hipótesis Correlacionales: • Establecen vínculos entre dos o más variables y corresponden a los estudios correlacionales. • Ejemplo: • A mayor resistencia a la compresión del hormigón, mayor durabilidad. 2.4 Formulación de hipótesis y definición de variables: • Hipótesis de Investigación: • Hipótesis de comparación de grupos o categorías: • Contrastan dos o más grupos, categorías, procesos o hechos en términos cuantitativos (hombres-mujeres, turnos de una planta, grupos de un experimento, etc.). • Ejemplo: • Las mujeres son mas inteligentes que los hombres. 2.4 Formulación de hipótesis y definición de variables: • Hipótesis de Investigación: • Hipótesis causales: • • • • Plantean relaciones de causalidad entre las variables incluidas. Son explicativas. Establecen relaciones de causa-efecto Ejemplo: • El uso de aditivos mejora las propiedades del hormigón. 2.4 Formulación de hipótesis y definición de variables: • Hipótesis de Investigación: • Hipótesis causales: • Con varias variables 2.4 Formulación de hipótesis y definición de variables: • Hipótesis Nulas: • Refutan o niegan lo que afirman las hipótesis de investigación. • Representan el reverso o contradicción de estas. • La clasificación de hipótesis nulas es similar a la de las hipótesis de investigación. • Las hipótesis nulas se simbolizan así: Ho • Ejemplos: • Ho: “Los fumadores no tienen un riesgo mayor de presentar un infarto que los no fumadores” 2.4 Formulación de hipótesis y definición de variables: • Hipótesis Alternativas: • Son posibilidades opcionales ante las hipótesis de investigación y nula. • Proporcionan otra explicación o descripción diferente de las que ofrecen estos dos tipos de hipótesis. • Ejemplo: • Hipótesis de investigación: “Este automóvil es negro” • La nula (Ho): “Este automóvil no es negro” • Hipótesis alternativas: “Este automóvil es azul”, o “Este automóvil es verde”, o “Este automóvil es blanco”, etc. • Las hipótesis alternativas se simbolizan como Ha 2.4 Formulación de hipótesis y definición de variables: • Hipótesis Estadísticas: • Las hipótesis estadísticas representan en términos estadísticos y matemáticos lo que son las hipótesis de investigación, nulas y alternativas. • O en otras palabras: Son las hipótesis de investigación traducidas a términos estadísticos 2.4 Formulación de hipótesis y definición de variables: • ¿Qué ocurre cuando no se aporta evidencia en favor de las hipótesis de nuestra investigación? No te preocupes, generaste conocimiento, que es la meta de la investigación!!! 2.4 Formulación de hipótesis y definición de variables: • Variables: Las hipótesis relacionan variables → al formular una hipótesis, es indispensable definir variables incluidos en ella. • Para que el investigador o cualquier persona que examine la investigación le de el mismo significado a las variables incluidas en las hipótesis. • Se asegura que las variables pueden ser medidas, observadas, evaluadas o inferidas. • Ayudan a evaluar más adecuadamente los resultados de la investigación. 2.4 Formulación de hipótesis y definición de variables: • Variables: Se las debe definir: • Conceptualmente: (Concepto) • La definición conceptual es aquella que precisa o indica con otros términos cómo vamos a entender una variable en el contexto de nuestra investigación. • Ejemplo: • Durabilidad del hormigón: La durabilidad del hormigón es la capacidad que tiene de resistir a la acción del ambiente, ataques físicos, químicos, físicos y/o biológicos o cualquier otro proceso que tienda a deteriorarlo. 2.4 Formulación de hipótesis y definición de variables: • Variables: Se las debe definir: • Operacionalmente: • Definir las variables que se incluyen en sus hipótesis, en forma tal que puedan ser medidas u observadas, • comprobadas y contextualizadas. • Ejemplo: • Se puede operacionalizar la variable “durabilidad” al seleccionar al Esfuerzo de compresión como la variable operacional. • Es el resultante de dividir una carga para el área resistente medida en MPa. • Esfuerzo= P/A 2.4 Formulación de hipótesis y definición de variables: • Tarea: • Indicar el Tipo de Alcance que tiene su investigación e indicar por qué? (Exploratorio, correlacional, descriptivo, explicativo) • Escribir UN párrafo de al menos ½ carilla a espacio simple. • Hipótesis: • Escribir su Hipótesis de investigación (una). • Escribir la Hipótesis nula (una) • Escribir una hipótesis alternativa. • Variables: • Definir su variables. • La conceptual y la operacional correspondiente. • Indicar cuáles son variables Independientes y las Dependientes. • Entregar la tarea a traes del aula virtual. Unidad 3: PROYECTO DE INVESTIGACION 3.1 Diseño de Investigación 3.2 Tipos de muestras 3.3 Selección de muestras 3.4 Recolección de datos 3.1 Diseño de Investigación: 3.1 Diseño de Investigación: • Se refiere al plan o estrategia concebida para obtener la información que se necesita para responder al planteamiento del problema. 3.1 Diseño de Investigación: • Es decir: • Qué debo hacer para obtener datos y responder las preguntas de investigación? • Cuál es la estrategia? 3.1 Diseño de Investigación: • Si estás iniciándote en la investigación, es decir Ustedes → se sugiere comenzar con estudios que se basen en un solo diseño. • Luego desarrollar indagaciones para el uso de varios diseños. • Si el diseño está concebido cuidadosamente, el producto final de un estudio (sus resultados) tendrá mayores posibilidades de generar conocimiento. 3.1 Diseño de Investigación: • Tipos de Diseños de Investigación: 3.1 Diseño de Investigación: • Diseños Experimentales: • Experimentar → realizar una acción y después observar las consecuencias. • En investigación → manipular deliberadamente una o más variables independientes para analizar las consecuencias que tal manipulación tiene sobre una o más variables dependientes. 3.1 Diseño de Investigación: • Diseños Experimentales: 3.1 Diseño de Investigación: • Diseños Experimentales: • Se los denomina también → Estudios de Intervención. • Se pueden realizar estudios con: • Humanos • Otros seres vivos • Objetos → siempre observando rigurosamente los principios éticos • Los diseños experimentales se utilizan cuando el investigador pretende establecer el posible efecto de una causa que se manipula. 3.1 Diseño de Investigación: • Diseños Experimentales: • Características: 1. Manipulación intencional de una o más variables independientes. 2. Medición de las variables dependientes. 3. Control sobre la situación experimental. ➔ Podemos decir que un experimento se lleva a cabo para analizar si una o más variables independientes afectan a una o más variables dependientes y por qué lo hacen ➔ Su alcance es explicativo. 3.1 Diseño de Investigación: • Diseños Experimentales: • Clasificación: 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños preexperimentales (preexperimentos): • Su grado de control es mínimo. • Son diseños con un grupo único. • Se analiza una sola variable. • No existe manipulación de variable independiente. • Un solo caso de estudio. • Grupo estático – el mismo. • Un grupo para una pre prueba y pos prueba. 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños preexperimentales (preexperimentos): • Simbología comúnmente utilizada 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños preexperimentales (preexperimentos): • Clasificación: 1. Estudio de caso con una sola medición. 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños preexperimentales (preexperimentos): • Clasificación: 2. Diseño de preprueba/posprueba con un solo grupo. 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Requisitos: 1. Grupos de comparación (manipulación de la variable independiente). 2. Equivalencia de los grupos. • Clasificación: 1. Diseño con posprueba únicamente y grupo de control 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Clasificación: 2. Diseño con preprueba-posprueba y grupo de control 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Clasificación: 3. Diseño de cuatro grupos de Solomon (mezcla 2 anteriores) 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Clasificación: 3. Diseño de cuatro grupos de Solomon (mezcla 2 anteriores) 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Clasificación: 3. Diseños experimentales de series cronológicas múltiples • En ocasiones, el experimentador está interesado en analizar efectos en el mediano o largo plazo porque tiene bases para suponer que la influencia de la variable independiente sobre la dependiente tarda en manifestarse. • Efecto de la edad en la resistencia a la compresión del hormigón. 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Diseños Factoriales: • Se utilizan muy a menudo en la investigación experimental. • Manipulan dos o más variables independientes e incluyen dos o más niveles o modalidades de presencia en cada una de las variables independientes. • Consiste en que todos los niveles o modalidades de cada variable independiente son tomados en combinación con todos los niveles o modalidades de las otras variables independientes. • No se hace varias una variable a la vez! • Herramienta estadística. 3.1 Diseño de Investigación: • Diseños Experimentales: • Diseños Experimentales (control): • Los experimentos de los puede realizar en un Laboratorio o en Campo. • Los experimentos de laboratorio se realizan en condiciones controladas. • Los experimentos de campo son estudios efectuados en una situación realista en la que el investigador manipula una o más variables independientes en condiciones tan cuidadosamente controladas como lo permite la situación. 3.1 Diseño de Investigación: • Diseños Experimentales: • Recuerde: • Los experimentos analizan las relaciones entre una o más variables independientes y una o más dependientes. • Analizan efectos causales de las variables independientes sobre las dependientes. • Son estudios explicativos (que obviamente determinan correlaciones). • Se trata de diseños cuantitativos completamente deductivos aunque pueden ser parte de una investigación mixta. • Se basan en hipótesis preestablecidas, miden variables y su aplicación debe sujetarse al diseño concebido con antelación. • El investigador está centrado en la validez, el rigor y el control de la situación de investigación. • El análisis estadístico resulta fundamental para lograr los objetivos. 3.1 Diseño de Investigación: • Diseños Cuasieperimentales: • Los diseños cuasiexperimentales también manipulan deliberadamente, al menos, una variable independiente para observar su efecto sobre una o más variables dependientes. • Difieren de los experimentos puros en el grado de seguridad que pueda tenerse sobre la equivalencia inicial de los grupos. • En los diseños cuasiexperimentales, los sujetos no se asignan al azar a los grupos ni se emparejan, sino que dichos grupos ya están formados antes del experimento. 3.1 Diseño de Investigación: • También existes los Diseños NO experimentales. 3.1 Diseño de Investigación: • Resumen: 3.2 Tipos de Muestras: • Muestra: • Es un subgrupo de la población o universo que te interesa, sobre la cual se recolectarán los datos. • Deberá ser representativa de dicha población. • De manera probabilística para poder generalizar los resultados encontrados en la muestra a la población • Casi siempre las investigaciones se realizan en muestras por cuestiones de ahorro de tiempo y recursos. 3.2 Tipos de Muestras: • Muestra: • Tipos: 3.2 Tipos de Muestras: • Muestra: • Tipos: 3.2 Tipos de Muestras: • Muestreo Probabilístico: • Utiliza la estadística para seleccionar al azar un pequeño grupo de individuos (muestra) de una gran población existente y luego predecir que todas las respuestas juntas coincidirán con la población en general. 3.2 Tipos de Muestras: • Muestreo Probabilístico: • Ventajas: • Puede medirse la magnitud del error en nuestras predicciones. • Son esenciales en los diseños de investigación donde se pretende hacer estimaciones de variables en la población. • Se refiere a ESTIMAR una variable aleatoria. • Ejemplo: • Resistencia a la compresión del hormigón. • Edad de los estudiantes de 8vo semestre . • Estas variables se miden y se analizan con pruebas estadísticas en una muestra. 3.2 Tipos de Muestras: • Muestreo NO Probabilístico: • También se lo denomina dirigido → procedimiento de selección orientado por las características y contexto de la investigación. • No orientadas por un criterio estadístico. • Desventajas: • No es posible calcular con precisión el error estándar. • No se puede determinar con qué nivel de confianza hacemos una estimación. • No se puede generalizar los resultados. 3.3 Selección de Muestras: • Proceso general para seleccionar una muestra 3.3 Selección de Muestras: • Proceso general para seleccionar una muestra: • Determinar la unidad de muestreo o análisis → Sobre “qué” o “quiénes” se recolectarán los datos • Ejemplo: Probetas cilíndricas de hormigón elaborado con fibras. • Delimitar la población o universo → Conjunto de todos los casos que concuerdan con determinadas especificaciones. 1) No elegir casos que deberían ser parte de la muestra (participantes que tendrían que estar y no fueron seleccionados) 2) Incluir casos que no deberían estar porque no forman parte de la población y 3) Seleccionar casos que son verdaderamente inelegibles 3.3 Selección de Muestras: • Proceso general para seleccionar una muestra: • Elegir la estrategia de muestreo adecuada para seleccionar las unidades de muestreo o análisis y mantener su representatividad: probabilística o no probabilística 3.3 Selección de Muestras: • Proceso general para seleccionar una muestra: • Cálculo del tamaño de muestra apropiado y Selección al azar de las unidades o casos: • Existen diversos métodos, algunos de ellos requieren el uso de fórmulas. • O utilizando software estadístico: • Ejemplo: El programa STATS® (gratis), Minitab, SPSS • O en páginas web Leer el Capitulo 8 del Libro! 3.3 Selección de Muestras: • Tamaño óptimo de la muestra: 3.3 Selección de Muestras: • Tamaño óptimo de la muestra: 3.3 Selección de Muestras: • Tamaño óptimo de la muestra: 3.3 Selección de Muestras: • Tamaño óptimo de la muestra: • Ten en mente que lo óptimo de una muestra depende de cuánto se aproxima su distribución a la distribución de las características de la población. 3.4 Recolección de Datos: 3.4 Recolección de Datos: • Significa aplicar instrumentos para recabar la información pertinente de las variables del estudio en la muestra. • Los datos obtenidos son la base del análisis. • Sin datos no hay investigación. • Recordar que: • Para haber llegado a esta etapa se debe haber establecido y definido con precisión y claridad las hipótesis del estudio y las variables, tanto conceptual como operacionalmente. • Al haber realizado la revisión de la bibliografía, se debe haber detectado instrumentos o formas para medir las variables planteadas. 3.4 Recolección de Datos: • Implica elaborar un plan detallado de procedimientos que conduzcan a reunir datos con un propósito específico. • Se debe tener en cuenta: • Las variables a medir (contenidos en el planteamiento e hipótesis). • Las definiciones operacionales → Para ver como las mido. • La muestra. • Los recursos disponibles (de tiempo, apoyo institucional, económicos, etc). 3.4 Recolección de Datos: • Hace falta aclarar lo que significa medir. 3.4 Recolección de Datos: • Para medir se necesitan instrumentos de medición: “Es el recurso que utiliza el investigador para registrar información o datos sobre las variables que tiene en mente.” 3.4 Recolección de Datos: • Requisitos de los Instrumentos de Medición: • Confiabilidad: Grado en que su aplicación repetida al mismo individuo, caso o muestra produce resultados iguales. 3.4 Recolección de Datos: • Requisitos de los Instrumentos de Medición: • Validez: Grado en que un instrumento mide con exactitud la variable que verdaderamente pretende medir. • La validez es un estándar. 3.4 Recolección de Datos: • Requisitos de los Instrumentos de Medición: • La validez → se tienen diferentes tipos de evidencia: 1) Evidencia relacionada con el contenido: La amplitud en que la medición representa al concepto o variable. 2) Evidencia relacionada con el criterio: Comparar sus resultados con los de algún criterio externo 3) Evidencia relacionada con el constructo: Qué tan bien un instrumento representa y mide un concepto teórico 4) Evidencia asociada con la opinión de expertos y Evidencia vinculada a la comprensión del instrumento: Grado en que un instrumento realmente mide la variable de interés, de acuerdo con expertos en el tema. 3.4 Recolección de Datos: • Requisitos de los Instrumentos de Medición: • Precisión, Exactitud??? Error? Desviación Estándar? 3.4 Recolección de Datos: • Objetividad de los Instrumentos de Medición: 3.4 Recolección de Datos: • Instrumentos de Medición: • Pregunta: • Mi instrumento de medición es 100% preciso? • Respuesta: • En la práctica es casi imposible que una medición sea perfecta y generalmente se tiene un grado de error. 3.4 Recolección de Datos: • Instrumentos de Medición: • Cuando se vaya a medir una variable se debe tomar en cuenta lo siguiente: • La operacionalización: Paso de una variable teórica a indicadores empíricos verificables y medibles. • Esfuerzo de compresión → Resistencia a la compresión en MPa. • La codificación: Asignarles un valor numérico o símbolo que los represente. • Variable : Tipo de Cemento: • Uso General (GU) → 1 y Alta Resistencia Inicial (HE) → 2 3.4 Recolección de Datos: • Instrumentos de Medición: • Cuando se vaya a medir una variable se debe tomar en cuenta lo siguiente: • Los Niveles de medición: • Nominal: La variable tiene Dos o más categorías 3.4 Recolección de Datos: • Instrumentos de Medición: • Cuando se vaya a medir una variable se debe tomar en cuenta lo siguiente: • Los Niveles de medición: • Ordinal: Varia categorías con un orden de mayor a menor 3.4 Recolección de Datos: • Instrumentos de Medición: • Cuando se vaya a medir una variable se debe tomar en cuenta lo siguiente: • Los Niveles de medición: • Por Intervalos: Se establecen intervalos iguales 3.4 Recolección de Datos: • Métodos para recolección de Datos: • Cuestionarios: • En ciencias sociales, tal vez el instrumento más utilizado para recolectar los datos. • Consiste en un conjunto de preguntas respecto de una o mas variables a medir. • Se utilizan en encuestas de TODO tipo. 3.4 Recolección de Datos: • Cuestionarios: • Tipos de Preguntas: • Cerradas: 3.4 Recolección de Datos: • Cuestionarios: • Tipos de Preguntas: • Abiertas: 3.4 Recolección de Datos: • Cuestionarios: • Preguntas Abiertas o Cerradas? • Las preguntas cerradas son más fáciles de codificar y preparar para su análisis. • Las preguntas cerradas requieren un menor esfuerzo por parte de los encuestados. • No tienen que escribir • Toma menos tiempo que contestar • El uso de preguntas cerradas reduce la ambigüedad de las respuestas y se favorecen las comparaciones entre las respuestas. • La principal desventaja de las preguntas cerradas reside en que limitan las respuestas. • Es necesario que anticipes las posibles opciones de respuesta 3.4 Recolección de Datos: • Cuestionarios: • Preguntas Abiertas o Cerradas? • Las preguntas abiertas proporcionan una información más amplia. • Son particularmente útiles cuando no tienes información sobre las posibles respuestas. • Sirven en situaciones donde deseas profundizar en una opinión o en los motivos de un comportamiento. • Su mayor desventaja es que son más difíciles de codificar, clasificar y preparar para el análisis. • Presentan sesgos derivados de distintas fuentes; por ejemplo, quienes tienen dificultad para expresarse en forma oral y escrita. ***Siempre que se pretenda efectuar análisis estadístico se requiere codificar las respuestas de los participantes en las preguntas del cuestionario *** 3.4 Recolección de Datos: • Métodos para recolección de Datos: • Análisis del contenido cuantitativo: Técnica para estudiar cualquier tipo de comunicación de una manera objetiva y sistemática que cuantifica los mensajes o contenidos en categorías y subcategorías, y los somete a análisis estadístico. • Observación: Este método de recolección de datos consiste en el registro sistemático, válido y confiable de comportamientos y situaciones observables, a través de un conjunto de categorías y subcategorías. • Pruebas estandarizadas e inventarios: Miden variables específicas de un tipo específico a través de pruebas que siguen procesos rigurosos. • Datos secundarios (recolectados por otros investigadores): Implica la revisión de documentos, registros públicos y archivos físicos o electrónicos. 3.4 Recolección de Datos: • Métodos para recolección de Datos: • Análisis de indicadores, fórmulas y ecuaciones: Un fenómeno o variable multidimensional puede medirse a través de uno o más indicadores, y determinarse el valor de los casos o unidades mediante una ecuación, fórmula o ponderación. • Instrumentos mecánicos o electrónicos: Sistemas de medición por aparatos. • Instrumentos y procedimientos específicos propios de cada disciplina: En todas las áreas de estudio se han generado valiosos métodos para recolectar datos sobre variables específicas. Ensayos de laboratorio → Normas INEN, ASTM 3.4 Recolección de Datos: • Métodos para recolección de Datos: Una vez que se han recolectado los datos se los debe tabular usando un software estadístico! Unidad 4: ANALISIS DE DATOS CUANTITATIVOS 4.1 Herramientas disponibles 4.2 Estadística descriptiva 4.3 Estadística inferencial 4.4 Reporte de resultados de la investigación Unidad 4: ANALISIS DE DATOS CUANTITATIVOS 4.1 Herramientas disponibles Primer Paso: 4.1 Herramientas disponibles • Generar una Matriz de Datos luego de la Fase de Recolección de Datos en el software de tu preferencia. 4.1 Herramientas disponibles • Generar una Matriz de Datos luego de la Fase de Recolección de Datos en el software de tu preferencia. 4.1 Herramientas disponibles • Generar una Matriz de Datos luego de la Fase de Recolección de Datos en el software de tu preferencia. 4.1 Herramientas disponibles • Generar una Matriz de Datos luego de la Fase de Recolección de Datos en el software de tu preferencia. Income Education Age Residence Employ Savings Debt • Ejemplo: 50000 72000 61000 88000 91100 45100 36200 41000 40000 32000 29000 21240 58700 41000 38720 88240 40000 34600 29800 56400 39800 54200 42650 62200 72200 26530 36500 40000 41200 50000 Credit cards 16 18 18 20 18 14 14 12 16 16 16 12 12 14 16 16 18 16 12 16 14 16 16 14 16 12 16 16 12 16 28 35 36 35 38 41 29 34 32 30 28 26 38 29 36 38 39 40 27 30 29 31 27 40 34 30 26 29 34 35 2 10 6 4 8 15 6 9 8 2 1 2 9 5 11 13 7 14 1 2 3 5 3 8 5 1 2 3 5 8 2 8 5 4 9 14 5 8 7 2 4 2 9 4 11 12 6 12 3 1 2 3 2 10 4 2 2 2 4 6 5000 12000 15000 980 20000 3900 100 5000 19000 16000 2100 100 4500 300 24500 13600 16000 34000 100 3000 2500 14200 5200 10000 12000 0 3100 1900 1000 4500 1200 5400 1000 1100 0 22000 7000 200 1760 550 4600 10010 7800 10000 540 8100 1300 100 10000 1200 900 800 1000 700 400 12000 800 1300 1200 1400 2 4 2 4 1 4 5 3 2 1 2 3 5 6 2 2 2 3 5 2 3 2 3 2 4 2 3 3 2 2 4.2 Estadística Descriptiva Introducción • Existen varias definiciones de Estadística. • Ciencia que nos permite resolver problemas en presencia de variabilidad (Mason et al., 2003). • Ciencia que nos permite tomar decisiones y deducir conclusiones cuando existe variabilidad (Montgomery y Runger, 2014). • Tiene que ver con métodos científicos para recolectar, organizar, resumir, presentar y analizar datos; así como también, con obtener conclusiones válidas y tomar decisi ones razonables basadas en los referidos análisis (Spiegel y Stephens, 2018). • Es la ciencia de los datos. Es el arte de aprender de los datos. (Selvamuthu y Das, 2018) Introducción ➔ Ciencia que nos permite resolver problemas, obtener conclusiones y tomar decisiones cuando existe variabilidad de datos utilizando métodos científicos. ➔ Ciencia que nos ayuda a entender la variabilidad de datos. ➔Estadística ➔ Ciencia de los datos ➔ Importante para Ingeniero/as-arquitecto/as Problema Recolección y Análisis de Datos Conclusiones Proceso de Inferencia Estadística Toma de Decisiones Introducción • La estadística ayuda en la toma de decisiones y a inferir conclusiones cuando existe variabilidad. • Los conceptos de probabilidades y estadística contribuyen en la solución de muchos problemas de ingeniería. • Un ingeniero es aquel que resuelve problemas de interés para la sociedad aplicando principios científicos. • Perfeccionando productos existentes • Diseñando productos nuevos • El Método Ingenieril o Científico es la técnica que formula y resuelve estos problemas. • La estadística trata con: • • • • Recolectar Presentar Analizar Usar Datos ➔ tomar decisiones, resolver problemas y diseñar productos y procesos. • Métodos estadísticos permiten describir y entender “Variabilidad” • Variabilidad: Sucesivas observaciones de un sistema o fenómeno NO produce exactamente el mismo resultado • Ejemplo: Tiempo de viaje a casa o rendimiento de combustible no es el mismo debido a varios factores • Factores son la fuente potencial de variabilidad del sistema • La estadística provee un procedimiento para describir esta variabilidad y aprender sobre cuales son las fuentes de dicha variabilidad mas importantes o cuales tienen el mayor impacto en la salida. • En ingeniería civil por ejemplo: • Resultados de esfuerzos de compresión medidos en MPa en cilindros de hormigón: 22.6, 22.9, 23.4, 22.7, 22.8, 23.5, 23.1, 23.0, 23.2, 23.3 • En este caso: El esfuerzo de Compresión: • Muestra variabilidad • ➔ Esfuerzo de Compresión es una Variable Randómica (Al azar) (X= µ (constante) + Є (disturbio)) • La constant µ es la misma en cada observación, pero cambios en el ambiente ( variación en el equipo, otros factores) cambian Є. • Si obtuviéramos siempre la misma respuesta (Ej: esfuerzo de compresión igual a 22.8) ➔ X= µ y Є=0 • Esto nunca sucede en la vida real. • Siempre existe dispersión o variabilidad. • ➔ Necesitamos siempre describir, cuantificar y eventualmente reducir variabilidad. Tipos de Datos: • Los datos son la representación de variables estadísticas a través de la asignación de un valor, letras o símbolos. • Categóricos o Cualitativos : Este tipo de datos no son cuantificables y se pueden expresar tanto con palabras como con números. • Nominales: Expresan con un nombre una cualidad que no tiene por qué ser ordenable. • Se analiza agrupando en categorías. • Letras, símbolos, palabras, genero. • Ordinales: Expresan una cualidad a través de un dato que es posible ordenar a través de una escala previamente definida. • Encuestas, cuestionarios. • Numéricos o Cuantitativos: Estos datos son expresados en números y sí que pueden medir. Pueden ser a su vez: • Discretos: Los valores vienen dados entre intervalos finitos de datos. • No se los puede dividir → No tienen un significado • Se las cuenta en valores enteros. • # de estudiantes en clase • Continuos: Estos datos se extraen de un intervalo infinito. • Temperatura Resumen Tipos de Datos: Tipos de Datos: Ejemplo: M.S. Marital Status E.L. Education level Representación de Datos: • Luego de un experimento o medición obtenemos datos. • El objetivo es: • Entender las características de los datos • Obtener la mayor cantidad de información útil de esos datos Estadística Descriptiva • Métodos Gráficos: Diagrama de Caja y Bigotes de Edad H istograma (de frecuencia) de Nivel de Educacion 28 Nivel de Educacion 15 Frecuencia 10 26 Diagrama de Dispersión de Nivel de Educacion vs Edad 10 24 5 2 5 1 2 3 4 20 Nivel de Educac ion 2 3 Nivel de Educacion 1 1 Category 1 2 3 4 3 22 0 Diagrama de Puntos de Nivel de Educacion Grafico de Pastel Estado Civil 1 2 4 20 30 Edad Frecuencia 15 Diagrama de Barras 32 N i vel de Educac i on (Cl ases) 1 2 3 4 20 0 1 2 3 Nivel de Educacion 4 20 22 24 26 28 30 32 Edad • Métodos numéricos: • Las herramientas gráficas siempre son importantes • Visualizar datos • ** No abusar • Un buen análisis estadístico debe comenzar con graficar los datos. 4 • Métodos gráficos • Diagrama de tallo y hojas: Buena manera de mostrar datos de muestras grandes (más de 20 observaciones) Modo Media Métodos gráficos • Diagramas de Dispersión: La mayoría de veces se trabaja con datos multivariable (cada observación tiene varias variable). • Ejemplo: Métodos gráficos • Diagramas de Dispersión: Muy utilizado para mostrar la relación entre dos variables (X, Y). • Excelente herramienta exploratoria para identificar potenciales relaciones entre variables. ** Podría decirse que los vinos de mayor color tienen mayor calidad ** Potencial relación lineal entre estas dos variables. Métodos gráficos • Diagramas de Dispersión: • Cuando existen dos o más variables se puede elaborar un Matriz de Diagramas de Dispersión para visualizar todas las posible relaciones a la vez. Conclusiones? Métodos gráficos Histogramas: • Distribución de Frecuencias: Es una Tabla que tiene mejor resumen de datos que el diagrama de tallos y hojas. • Se debe dividir el rango de datos en intervalos, clases, celdas o cajas de la misma amplitud. • No se obtiene buena información cuando se escoge un número de clases demasiado pequeño o demasiado grande. • 5 – 20 clases es generalmente OK. • En la práctica usar la Regla: # intervalos = #𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 • Es muy importante escoger el número de intervalos. • Se las puede utilizar con datos cualitativos o categóricos. Métodos gráficos Histogramas: Distribución de Frecuencias: Ejemplo: Dada los siguientes datos de esfuerzo de compresión de una aleación de aluminio y litio, elaborar una tabla de distribución de frecuencias. Número de Intervalos: # intervalos = 80 = 8.94 → 9 (Puede ser entre 8 y 9 intervalos) Valor max =245 y Valor min=76 → Rango=24576=169 es lo que se debe cubrir con intervalos. Si: Asumimos que el limite inferior es un poco menor del valor min → 70 Asumimos que el limite superior es un poco mayor del valor max → 250 → Rango=180 y el ancho de cada intervalo sería de 20 para tener 9 intervalos. Métodos gráficos Distribución de Frecuencias: Ejemplo: Dada los siguientes datos de esfuerzo de compresión de una aleación de aluminio y litio, elaborar una tabla de distribución de frecuencias Nota: La Frecuencia Relativa = Frecuencia en cada intervalo/ total de observaciones Métodos gráficos • Histogramas: Representación gráfica de la forma de distribución de los datos utilizando barras que contienen rangos (Intervalos de clase). • Brinda la siguiente información: • • • • • • Muestra la forma que siguen los datos y su dispersión. Forma de distribución de datos. Detecta valores inusuales (outliers) Detecta las clases más frecuentes Si existe o no “grietas” en los datos. Tendencia central. • Muchos histogramas de bases de datos comúnmente tienen la forma de una campana simétrica donde el punto mas alto es el promedio (histogramas normales). • Histogramas son apropiados para muestras relativamente grandes (>75). Métodos gráficos • Histogramas: • Para construir un histograma: • Elaborar una Tabla de Distribución de Frecuencias • Colocar los límites de los intervalos en la escala horizontal • Colocar en la escala vertical las frecuencias o frecuencias relativas • Dibujar un rectángulo sobre cada intervalo con una altura igual a la frecuencia o frecuencia relativa. Métodos gráficos • Histogramas: • Notar: • Simetría de la distribución de esfuerzos en forma de campana. • El histograma no indica posibles tipos de Curvas de Distribución de Probabilidad (Probability Distribution) para usar como modelo para la población. Métodos gráficos • Histogramas: • Visualizar lo que sucede cuando se aumenta el número de intervalos • Recordar que los histogramas son SENSIBLES al número de intervalos y su amplitud de intervalo. Similares No Métodos gráficos • Gráfico de Series de Tiempo: Este gráfico a diferencia de histogramas, tallo y hojas, de caja y bigotes toma en cuenta en tiempo para mostrar la variabilidad de los datos. • Los datos de Series de Tiempo son aquellos que se los registra según cuando ocurrieron. • Ordenadas va la Variable y Abscisas el Tiempo • Permite visualizar: • Tendencias • Ciclos Ejemplo: Muestra las ventas de una compañía por 10 años. Se puede inferir que existe una tendencia al incremento de ventas. Métodos gráficos • Gráfico de Series de Tiempo: • Ejemplo: Considerando el mismo ejemplo de los esfuerzos asumiendo que los datos fueron tomas en el orden que ocurrieron. Métodos gráficos • Gráfico de Series de Tiempo: • Es muy útil combinar el Diagrama de Tallo y Hojas con Gráfico de Series de Tiempo (Digidot Plot) Métodos gráficos • Gráfico de Probabilidad: Técnica gráfica para ver si los datos siguen una curva de probabilidad determinada basados en una examinación visual subjetiva. • Es importante porque para algunas pruebas estadísticas se asume que la población sigue un tipo determinado de distribución. • Se debe verificar lo que se asume! • En otros casos puede darnos la idea de cómo se origina los datos. • Histogramas pueden darnos una idea más profunda de la forma en que están distribuidos los datos pero es confiable cuando la muestra es grande. • Fácil de construir y más confiable que un histograma para muestras pequeñas. • El uso de Software es recomendado. • Nos enfocaremos en Gráficos de Probabilidad Normales ya que muchas técnicas estadísticas son apropiadas cuando la población es “al menos” normal. • Técnica gráfica para identificar desvíos de normalidad. Métodos gráficos • Gráfico de Probabilidad: • Procedimiento para construirlo: • Ranquear los datos de menor a mayor • Dibujar los datos ranqueados en función de su frecuencia acumulada (eje vertical) ( j - 0.5) / n ó 100 ( j - 0.5) / n ó 100 [1- ( j - 0.5) / n] Donde: j es el número de ranquing del dato • Si los datos dibujados encajan dentro de una línea recta, los datos están “normalmente distribuidos” • Si los datos ploteados se desvían significativamente de la línea recta, no se cumple la hipótesis. • La determinación de si el gráfico es una línea recta o no, es subjetiva. Métodos gráficos • Gráfico de Probabilidad: • Ejemplo: Se tiene 10 observaciones de la duración de baterías en minutos en laptops: 76, 191, 214, 220, 205, 192, 201, 190, 183, 185 y se cree que siguen una distribución normal. Realizar el Grafico de Probabilidad Normal para verificar la hipótesis. • Ranquear y calcular la frecuencia acumulada. Métodos gráficos • Gráfico de Probabilidad: • Ejemplo: Se tiene 10 observaciones de la duración de baterías en minutos en laptops: 76, 191, 214, 220, 205, 192, 201, 190, 183, 185 y se cree que siguen una distribución normal. Realizar el Grafico de Probabilidad Normal para verificar la hipótesis. Métodos gráficos • Gráfico de Probabilidad: • Gráficos indicando que los datos NO están normalmente distribuidos. • Gráficos de muestras pequeñas puedes NO ser confiables. • Aún cuando la población está normalmente distribuida, el gráfico NO es una línea recta exacta. • Métodos gráficos • Diagrama de Spaghetti: Método para visualizar posibles flujos en un sistema. Contiene muchas líneas lo que hace, muchas veces que sea difícil de entenderlo. • Métodos gráficos • Diagrama de Caja y Bigotes: Representación gráfica de datos que permite visualizar: • • • • • Centro Dispersión Valores atípicos (outliers). Desviación de la simetría. Datos distribuidos a través de cuartiles. • Valor del 1er cuartil • 2do cuartil (la media) • 3er cuartil • También tiene líneas que se extienden hacia afuera de la caja indicando el mínimo y máximo valor. • Métodos gráficos • Diagrama de Caja y Bigotes: • Descripción del diagrama • Métodos gráficos • Diagrama de Caja y Bigotes: • Ejemplo: • Métodos gráficos • Gráfico de Pastel: Gráfico circular, dividido en fracciones o “pedazos de pastel”, utilizado para representar proporciones numéricas o categorías de una población. Se aplica solo para datos categóricos o agrupados. Grafico de Pastel Category 1 2 3 4 • Métodos gráficos • Gráficos de Barras: Representa variables categóricas a través de barras cuya longitud es proporcional a los valores que representan. Método muy utilizado para presentar datos. La altura de cada barra representa la frecuencia de sus categorías. • Métodos gráficos • Diagrama de Pareto: Diagrama de barras usado para ranquear las causas de un problema (80/20). Usado en Mejoramiento de la Calidad con datos categóricos. • Métodos gráficos • Gráfico de frecuencia Acumulada: Es una variación del histograma. • Se puede decir que el comportamiento del gráfico está bien distribuido cuando no hay cambios brusco en la pendiente del gráfico. • El alto de cada barra representa el # de observaciones ≤ limite superior del intervalo. Ejemplo: Del gráfico se puede decir directamente que hay 70 observaciones menores que 200 psi. Métodos gráficos • Diagrama de Puntos: Manera útil de representar datos (hasta 20) • Ver fácilmente: • la ubicación o el medio de los datos • La dispersión o variabilidad • Cuando se dispone de pocos datos es difícil ver patrones de variabilidad. 22.6 22.8 23.0 23.2 fc Diagrama de Puntos de f'c (Dotplot of f'c) 23.4 Estadística Descriptiva • Métodos Numéricos: Para resumir los datos • Recordar que: Estadística es la Ciencia de los Datos! • Se refiere a organizar y resumir datos ➔ faciliten interpretación y análisis. • Consideremos que se realizaron ensayos (pruebas) en cilindros de hormigón y se obtuvieron los siguientes datos en MPa: 23.2, 23.0, 23.5, 23.8, 23.6, 23.3, 22.9, 23.4, 23.9, y 23.7 Cómo resumir la información de estos datos con números? Esta es la pregunta general que nos hacemos! Los resultados sirven para TOMA DE DECISIONES (Decision – making ) Estadística Descriptiva • Métodos Numéricos: Para resumir los datos • Se necesita calculadoras o programas especializados. • No nos centraremos en el uso de un software específico. • Se presentarán ejemplos con uso de software. • Es bastante útil describir las características de los datos con NÚMEROS. • Medidas de la Tendencia Central: Describe la posición central del grupo de datos. Se refiere a lo que es esperado en una muestra, valor recurrente o comportamiento promedio de una muestra. • Promedio: Sumatoria de todos los datos dividido para el numero de datos. En muchos casos es la medida apropiada de la tendencia central de una muestra. Outliers pueden afectar su valor. Promedio aritmético = Promedio de la Muestra Ejemplo: Calcular el valor promedio de x1 = 12.6, x2 = 12.9, x3 = 13.4, x4 = 12.3, x5 = 13.6, x6 = 13.5, x7 = 12.6, y x8 = 13.1 Qué representa el número 13.0? Puede ser considerado como un punto de balance (punto de equilibrio) y se lo puede visualizar con un Diagrama de puntos. Estadística Descriptiva • Promedio: • Usualmente el promedio se lo obtiene para un número de datos que se obtienen de la población. • Por esta razón: Promedio aritmético = Promedio de la Muestra • Tipos de población: • Hipotética o Conceptual: • Bloques de hormigón que se fabricarán. • Física: • Bloques de hormigón que existen. ത es un estimado razonable del promedio de la • El promedio de la muestra (𝑋) población (𝜇) • Media: Medida simple de la tendencia central. Se ordenan los datos de menor a mayor y la media es el valor central para un número impar de datos o el promedio de los dos valores centrales para un número par de datos. El valor para el cual la mitad de las observaciones es menor y la otra mitad es mayor. • Modo: Es el valor que aparece la mayor cantidad de veces en un grupo de datos. Es el valor mas frecuente. Cuando se tiene datos categóricos, es preferible trabajar con el modo o con la media. • Media Geométrica: Es la raíz n del producto de n observaciones. No se la usa cuando se tiene un valor igual a cero o cuando se tiene datos categóricos ya que usualmente se tiene valores de ceros. Métodos Numéricos: • El promedio NO entrega toda la información de una muestra de datos. • Medidas de la Dispersión: Describe la dispersión del grupo de datos. • Variabilidad: Hace referencia a la dispersión, rango o distribución de los datos. Una medida de variabilidad nos indica cuan dispersos los datos están alrededor de un valor. Métodos Numéricos: • Medidas de la Dispersión: • Desviación Estándar: De la Muestra • • • • Medida de la dispersión de los datos. Es la raíz cuadrada de la varianza y es siempre positiva. Se comporta en forma similar que la varianza. Es muy útil porque nos da la idea de la variabilidad de una muestra en las mismas unidades de la muestra. Métodos Numéricos: • Medidas de la Dispersión: • Varianza: De la Muestra • • • • • Medida de cuan lejos están los datos están dispersos del valor promedio. Es igual al cuadrado de la desviación estándar. Es el promedio aritmético del cuadrado de las distancias entre cada observación y el promedio. A mayor dispersión de los datos, mayor es la varianza. La varianza es sensible a los valores inusuales (outliers) ya que la pueden incrementar drásticamente y se puede inferir su presencia. • A menor varianza, mas estable la muestra es. • La varianza disminuye mientras mas grande sea la muestra. Métodos Numéricos: • Medidas de la Dispersión: • Ejemplo: Calcular la varianza y la desviación estándar. Métodos Numéricos: • Medidas de la Dispersión: • A mayor variabilidad, mayores serán los valores absolutos de las diferencias con el promedio ➔ Mayor Variabilidad. Métodos Numéricos: • Otros valores estadísticos: • Rango: De la Muestra • Diferencia entre el mayor y el menor valor • A mayor variabilidad, mayor rango. • Fácil de calcular pero ignora todo lo que pasa entre el mayor y menor valor • Ejemplo: Calcular el rango de x1 = 12.6, x2 = 12.9, x3 = 13.4, x4 = 12.3, x5 = 13.6, x6 = 13.5, x7 = 12.6, y x8 = 13.1 ➔ r = 13.6 - 12.3 = 1.3 Métodos Numéricos: • Otros valores estadísticos: • Cuartiles: De la Muestra • Cuando los datos ordenados se los divide en 4 partes iguales, eso límites se llaman cuartiles. • Primer Cuartil (q1): 25% de observaciones abajo y 75% arriba aproximadamente. (n +1) / 4 • Segundo Cuartil (q2): 50% de observaciones abajo y 50% arriba aproximadamente. **Es igual a la MEDIA • Tercer Cuartil (q3): 75% de observaciones abajo y 25% arriba aproximadamente. (n +1) 3/ 4 Métodos Numéricos: • Otros valores estadísticos: • Cuartiles: De la Muestra • Ejemplo: Calcular el q1, q2 y q3 a partir del Diagrama de tallo y hojas que se muestra a continuación. • Primer Cuartil (q1): 25% de observaciones abajo y 75% arriba aproximadamente. (n +1) / 4=(80+1)/4=20.25 ==> 20va observación → 143 20.25 observación → ??? 21va observación → 145 Interpolando: q1=143.50 • Segundo Cuartil (q2): 40va observación → 160 41va observación → 163 (160+163)/2=161.50 = q2 • Tercer Cuartil (q3): 75% de observaciones abajo y 25% arriba aproximadamente. (n +1) 3/ 4 = (80+1)*3/4=60.75 60va observación → 181 60.75 observación → ??? 61va observación → 181 Interpolando: q3=181.00 Métodos Numéricos: • Otros valores estadísticos: • Percentil: De la Muestra • Indica el valor bajo el cual se tiene el porcentaje de observaciones deseado. • Ejemplo: Calcular el percentil 20 de los datos. Datos: Ordenados 43 78 54 79 56 85 61 87 62 88 66 89 68 93 69 95 69 96 70 98 71 99 72 99 77 Números de datos N = 25 25*0.2=5 Encontrar el valor número 5 y promediar con el inmediato superior ➔ (62+66)/2=64 **Hay otros métodos pero debe dar valores parecidos. Métodos Numéricos: • Otros valores estadísticos: • Rango Intercuartil (IQR): De la Muestra • Diferencia entre q1 y q3. IQR = q3 − q1 • Es menos sensible a los valores extremos que el rango. • Puede usarse como una medida de la variabilidad. • Error estándar de la media (SE Mean): • Es la desviación estándar de todas las posibles muestras (de un tamaño dado) escogidos de esa población. 𝑆𝐸 𝑀𝑒𝑎𝑛 = 𝜎 𝑁 • Donde: 𝜎= Desviación estándar y N es el tamaño de la muestra. Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Variación: Es la relación entre la desviación estándar y la media de la muestra (promedio). • Cuando se quiere comparar grupos de datos (muestras) que tienen diferentes unidades, se puede saber cual muestra es menos variable que otra. • A mayor coeficiente de variación, más variable es la muestra. • Estandariza la medida de variabilidad al no tener unidades. Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra: Es una medida cuantitativa de la intensidad (que tan fuerte) de la relación lineal entre dos variables x y y. • • • • • Si dos variables están perfectamente relacionadas linealmente con pendiente (+) → 𝑟𝑥𝑦 = 1.0 Si dos variables están perfectamente relacionadas linealmente con pendiente (-) → 𝑟𝑥𝑦 = −1.0 Si dos variables NO están relacionadas linealmente → 𝑟𝑥𝑦 = 0.0 Este coeficiente se lo conoce como Coeficiente de Correlación de Pearson. Comúnmente se lo simboliza también con 𝝆 Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra: • Ejemplo: Utilizando los datos del ejemplo del vino. Para Calidad y Color, por ejemplo: 𝑟𝑥𝑦 = 0.712 **Indica moderada correlación. Puede existir relación lineal entre estas dos variable. ** Correlaciones menos │0.5│ se las considera débiles y arriba de │0.8│ Fuertes! Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra: • Potenciales relaciones entre variables para ser interpretados. Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra: • Ejercicio: Visualizar los resultados del Diagrama de Dispersión y los Coeficientes de Correlación de Pearson para el ejemplo del vino Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra (Spearman): • Un coeficiente de correlación mide el grado en que dos variables tienden a cambiar al mismo tiempo! • El coeficiente describe tanto la fuerza como la dirección de la relación. • La correlación de Pearson evalúa la relación lineal entre dos variables continuas. • La correlación de Spearman se emplea cuando los datos son ordinales, de intervalo, o no se satisface la condición de normalidad. • Siendo di la distancia entre los rangos de cada observación (xi−yi) y n el número de observaciones. Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra (Spearman): • La correlación de Spearman evalúa la relación monótona entre dos variables continuas u ordinales. • En una relación monótona, las variables tienden a cambiar al mismo tiempo, pero no necesariamente a un ritmo constante. • La Gráfica revela que ambas variables aumentan al mismo tiempo, pero no al mismo ritmo. Esta relación es monótona, pero no lineal. Métodos Numéricos: • Otros valores estadísticos: • Coeficiente de Correlación de la Muestra (Spearman): • Ejercicio: Visualizar los resultados del Diagrama de Dispersión y los Coeficientes de Correlación de Pearson para el ejemplo del vino Métodos Numéricos: • Otros valores estadísticos: • Comparación de los coeficientes de Pearson y Spearman: • El valor de los coeficientes de correlación de Pearson y Spearman puede variar de −1 a +1. Pearson = +1, Spearman = +1 Pearson = +0.851, Spearman = +1 Pearson = −0.799, Spearman = −1 Pearson = −0.093, Spearman = −0.093 Coeficiente de 0 Pearson = −1, Spearman = −1 Los coeficientes de correlación de Pearson solo miden relaciones lineales. Los coeficientes de correlación de Spearman solo miden relaciones monótonas. Por lo tanto, puede existir una relación significativa aunque los coeficientes de correlación sean 0. Métodos Numéricos: • Otros valores estadísticos: • Comparación de los coeficientes de Pearson y Spearman: • Siempre es una buena idea examinar la relación entre las variables con una gráfica de dispersión. • Los coeficientes de correlación solo miden relaciones lineales (Pearson) o monótonas (Spearman). Son posibles otras relaciones. Métodos Numéricos: • Otros valores estadísticos: • Asimetría (Skewness) : Medida de la desviación de los datos respecto a la distribución normal. • Es la medida de la falta de simetría de una muestra. • Si la muestra es simétrica respecto de la media, la asimetría es cero. • Se la usa respecto a un HISTOGRAMA o a una DISTRIBUCIÓN DE PROBABILIDAD Métodos Numéricos: • Otros valores estadísticos: • Curtosis (Kurtosis): Se refiere a que tan “puntiaguda” es la muestra comparada con una muestra normalmente distribuida. • Un valor alto de curtosis significa que la muestra tiene un pico alto. Tarea Los esfuerzos cortantes medidos en MPa de 100 puntos de suelda en una aleación de titanio son los que se encuentran en el archivo adjunto de Excel (Aula Virtual): a) Elaborar un Diagrama de tallo y hojas y Caja y Vigotes para el esfuerzo de corte. b) Cuál es el percentil 35 y 95? c) Calcular los siguientes estadísticos: Promedio, Media, Modo, varianza, desviación estándar, error estándar de la media, coeficiente de variación, cuartiles q1, q2, q3, rango intercuartil d) Construir un histograma y comparar con el gráfico de tallo y hojas. e) Construir un Gráfico de Puntos y comparar con el histograma. f) Construir el Gráfico de Probabilidad Normal e indicar si los datos están normalmente distribuidos (Solo con Software) a) Nota: Comentar los resultados obtenidos 1) Mostrar todo el proceso. 2) Realizar los cálculos a mano (10 puntos) y con software (10 puntos). 4.3 Estadística Inferencial • Se la puede dividir en: • Estimación de Parámetros • Estimación Puntual: Se calcula un valor simple a partir de una muestra • Estimación por Intervalos de Confianza: Se calculan dos números para establecer un rango de valores que se espera contenga al parámetro con cierta confianza. • Pruebas de Hipótesis • Prueba dos hipótesis: • Ho: Hipótesis Nula vs. H1: Hipótesis Alternativa Estadística Inferencial • Estimación de Parámetros • Estimación Puntual: Se calcula un valor simple “razonable” a partir de una muestra. • Las observaciones (valores obtenidos) se los considera variables aleatorias. • Al valor obtenido se lo denomina “estadístico” • Ejemplo: 𝑋ത 𝑦 𝑆 2 (promedio y desviación estándar) son variables aleatorias y estadísticos • Como un estadístico es una variable aleatoria, tiene una distribución de probabilidad. • El objetivo de la estimación puntual es seleccionar un valor único basado en los datos de la muestra para θ (𝑋ത , 𝑆 2 𝑜 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑙 𝑜𝑡𝑟𝑜 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜). = 𝒉(𝑿𝟏, 𝑿𝟐, … , 𝑿𝒏) diremos que es la Estimación Puntual de θ. • Q Estadística Inferencial • Estimación de Parámetros • Estimación Puntual: • Ejemplo: Supongamos que una variable X está normalmente distribuida con promedio desconocido (m). El promedio de la muestra ( 𝑋ത ) es una estimación puntual de un valor desconocido del promedio de la población (m). ➔ 𝜇ො = 𝑋ത • Si tengo que: x1=25, x2=30, x3=29 y x4=31, la estimación puntual de m es 𝑋ത = 28.75 • Si tengo que: x1=25, x2=30, x3=29 y x4=31, la estimación puntual de s2 es S2=6.9 • Ejemplo: Se toma una muestra de 80 estudiantes de estudiantes de la Universidad Central y se obtiene un promedio de 𝑋ത =1.69m, el valor de 𝑋ത (promedio de la muestra) es un punto estimado del valor 𝜇 (promedio de la población). • Problemas de estimación son frecuentes!!!! • Estimación de Parámetros • Estimación de Intervalos: • Ejemplo: • Si se tiene un 95% de intervalo de confianza basado en 10 ensayos de compresión (probetas) y se tiene que el límite inferior es 21 MPa y el superior es 25 MPa ➔ se puede decir que se tiene un 95% de Nivel de Confianza de que el valor Promedio 𝑋ത está en ese intervalo. • En otras palabras, si ensayamos 20 muestras (10 probetas c/u), un intervalo de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza que contendrán el parámetro de población. El 5% de las veces el intervalo estará en ERROR. Pruebas de Hipótesis • En lugar de encontrar un valor estimado de un parámetro, se asigna un valor hipotético y se utiliza la información de la muestra para confirmarlo o rechazarlo. • A veces es necesario responder a una pregunta sobre un parámetro. • Por ejemplo: Es el valor promedio que obtengo igual, mayor o menor a 40? • Este tipo de preguntas se las puede responder con esta técnica. • El proceso de toma de decisiones se conoce como prueba de hipótesis. • Este es uno de los aspectos mas importantes en estadística inferencial. • Experimentos comparativos se los encuentra frecuentemente en la práctica. • Por ejemplo: Comparar la media de una población con un valor determinado • Hipótesis estadística paramétrica: Es probar una declaración de un parámetro desconocido con la ayuda de las observaciones (datos) de la una muestra aleatoria. • Hipótesis estadística es una declaración sobre los parámetros de una o mas poblaciones. • En estadística se utiliza Distribuciones de Probabilidad para describir a una población • ➔ Hipótesis estadística es una declaración sobre una distribución de probabilidad de una variable aleatoria (randómica). • Una hipótesis envuelve uno o mas parámetros de esta distribución. Hipótesis Nula (𝐻𝑜 ): • Es una declaración (aseveración) sobre un parámetro desconocido. • Siempre tiene el signo igual que. Hipótesis Alternativa (𝐻1 ): • Es una declaración (aseveración) complementaria sobre un parámetro desconocido. • Contradice 𝐻𝑜 • Cómo decidir si se acepta la hipótesis nula o se la rechaza? • La respuesta es: • A través de una Prueba Estadística: Valor estadístico calculado en base a los datos de una muestra. • Verificando si está en una Región Crítica (Región de Rechazo): Grupo de valores estadísticos para los cuales la hipótesis nula es rechazada. • Ejemplo: Estamos interesados en la velocidad de un automóvil. La velocidad es una variable aleatoria (randómica) que puede ser descrita por una distribución de probabilidad. Queremos averiguar si la velocidad del automóvil es 50 km/h. • 𝐻𝑜 : µ = 50 𝑘𝑚/ℎ • 𝐻1 : µ ≠ 50 𝑘𝑚/ℎ (Hipótesis nula) (Hipótesis Alternativa) ➔ De dos colas (µ > 𝑜 <) • Si quisiéramos saber si µ>50: • 𝐻𝑜 : µ = 50 𝑘𝑚/ℎ • 𝐻1 : µ>50 𝑘𝑚/ℎ (Hipótesis nula) (Hipótesis Alternativa) ➔ De una cola • O si quisiéramos saber si µ<50: • 𝐻𝑜 : µ = 50 𝑘𝑚/ℎ • 𝐻1 : µ<50 𝑘𝑚/ℎ (Hipótesis nula) (Hipótesis Alternativa) ➔ De una cola • Nota: • Siempre declararemos a 𝐻𝑜 como una igualdad!!! • Esta implícito que si 𝐻1 tiene el signo “<” ➔ 𝐻𝑜 es “≥” y viceversa • Las hipótesis son declaraciones o afirmaciones sobre toda la población • El procedimiento que nos lleva a tomar una decisión sobre la hipótesis nula es la prueba de hipótesis: • Rechazo la Hipótesis Nula y Acepto la Hipótesis Alternativa, o • No rechazo la Hipótesis Nula • Errores que pueden pasar cuando se prueban hipótesis: • Ejemplo: • El escenario de Rechazar 𝑯𝒐 cuando es verdadera se conoce como Error Tipo I. ത difieren del • Ejemplo: µ=50km/h y el promedio de las muestras seleccionadas al azar (𝑋) valor de la media de la población (µ) • Falla de Rechazar 𝑯𝒐 cuando es falsa se conoce como Error Tipo II. ത tienen un • Ejemplo: µ ≠ 50 km/h y el promedio de las muestras seleccionadas al azar (𝑋) valor de 50 km/h. • Probabilidades pueden ser asociadas a errores Tipo I y II ya que nuestra decisión se basa en variables aleatorias (randómicas). • Probabilidad de cometer Error Tipo I también se las conoce como: • Nivel de significancia o • error 𝜶 𝜶 = 𝑷 𝑬𝒓𝒓𝒐𝒓 𝑻𝒊𝒑𝒐 𝑰 = 𝑷(𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝒐 𝒄𝒖𝒂𝒏𝒅𝒐 𝑯𝒐 𝐞𝐬 𝐕𝐞𝐫𝐝𝐚𝐝𝐞𝐫𝐚) • Se puede reducir 𝛼: • Ampliando los intervalos de aceptación • Incrementando el tamaño de la muestra • Probabilidad de cometer Error Tipo II también se las conoce como: • error 𝜷 𝜷 = 𝑷 𝑬𝒓𝒓𝒐𝒓 𝑻𝒊𝒑𝒐 𝑰𝑰 = 𝑷(𝑨𝒄𝒆𝒑𝒕𝒂𝒓 𝑯𝒐 𝒄𝒖𝒂𝒏𝒅𝒐 𝑯𝒐 𝐞𝐬 𝐅𝐚𝐥𝐬𝐚) ***La prueba estadística ideal sería la que minimice los errores tipo I y II. • Ninguna pruebas estadística es 100% confiable. • Siempre existe una posibilidad de hacer una conclusión incorrecta ya que las pruebas estadísticas se basan en probabilidades. • Los errores tipo I y II están determinados por: • Nivel de Significancia (𝛼) • Poder Estadístico ➔ Se debe determinar cual error tiene más severas consecuencias! • Cuando la 𝑯𝒐 es verdadera y la rechazamos cometemos Error Tipo I. • Cuando se fija un valor 𝛼 = 0.05 para una prueba estadística quiere decir que uno acepta el 5% de probabilidad de cometer un error cuando rechaza la 𝐻𝑜 . • Para minimizar el Error Tipo I, seleccione un valor de 𝛼 más bajo. • Cuando la 𝑯𝒐 es falsa y no se la rechaza cometemos el Error Tipo II. • Para minimizar el Error Tipo II, se debe asegurar que tenemos suficiente Poder Estadístico 1 − 𝛽 ; es decir con una muestra lo suficientemente grande. • Las probabilidades de hacer las decisiones correctas tienen que ser altas!!! 1−𝛼 𝑦 1− 𝛽 • Generalmente: • El analista controla 𝛼 cuando selecciona los límites ➔ el analista fija α a un valor deseado • Rechazar 𝑯𝒐 es una CONCLUSIÓN IMPORTANTE • Usualmente se asume α = 0.05 (No siempre es apropiado!) • Resumen de Error Tipo I y II: Poder o potencia estadística: • Es la probabilidad de correctamente rechazar un 𝐻𝑜 falsa. • Se lo calcula: 1-β • Está afectado por: • Tamaño de la muestra • Variabilidad de los datos • Nivel de Significancia • Ninguna prueba estadística es perfecta! Siempre hay la posibilidad de cometer el Error Tipo I o Tipo II. • Para estimar el promedio de una población se utilizan muestras “aleatorias” y las muestras aleatorias son solo eso “aleatorias”. Poder estadístico: • Por ejemplo: Estamos probando : 𝐻𝑜 : µ = 50 𝑘𝑚/ℎ y 𝐻1 : µ ≠ 50 𝑘𝑚/ℎ, pero el verdadero valor de µ 𝑒𝑠 52 𝑘𝑚/ℎ. Se tiene que 𝛽 = 0.2643 ➔ el poder estadístico es: 1 − 𝛽 = 1 − 0.2643 = 0.7357 cuando µ = 52𝑘𝑚/ℎ. ➔ Significa que la prueba rechazara correctamente 𝐻𝑜 y detectará esta diferencia el 73.57% de las veces. • Un valor de potencia de 0.9039 significa que si usted decide repetir el experimento muchas veces, (con una nueva muestra aleatoria cada vez), alrededor de 90.39% de las veces, usted terminará rechazando correctamente la hipótesis nula. • Existen varios sitios web para calcular Error Tipo 2: https://www.statology.org/type-ii-error-calculator/ Hipótesis de Una y Dos Colas: • Siempre declarar a la 𝐻𝑜 como una igualdad para controlar 𝛼 a un valor especifico. • 𝐻1 puede ser de una cola o dos colas: • De una cola: “mayor que, menor que, superior que, al menos, exceda, etc.” • De dos colas: Si no se especifica una dirección (“no igual, diferente”) • Cuando formulamos hipótesis de Una Cola, recordar que rechazar 𝐻𝑜 es una conclusión “fuerte o de peso”. • Depende de nuestra experiencia o necesidad. Valor 𝒑 en Pruebas de Hipótesis: • Una manera de reportar pruebas de hipótesis es indicar si se rechazó o no 𝐻𝑜 a un determinado valor 𝛼 o nivel de significancia (nivel fijado de significancia). • En este caso no se sabe si el valor estadístico estaba en o en las afueras de la región de rechazo. • El valor 𝑝 ha sido aceptado ampliamente en la práctica ya que solventa este problema. • El valor 𝑝 contiene mucha información sobre evidencia en contra de 𝐻𝑜 . • El valor 𝑝 es el menor nivel de significancia que podría llevar a rechazar 𝐻𝑜 con los datos que se tiene. • En otras palabras, el valor p es el observado nivel de significancia. • Se rechaza 𝐻𝑜 si el valor de 𝑝 es menor que el nivel de significancia (𝛼). • Una vez que se conoce el valor de 𝑝 se puede decidir. • Ejemplo: Si 𝛼 = 0.05 y 𝑝 = 0.038 ➔ RECHAZAR 𝐻𝑜 • El valor de 𝑝 nos dice si 𝐻𝑜 es verdadera. • El valor de 𝑝 es la probabilidad de rechazar 𝐻𝑜 incorrectamente. • El valor de 𝑝 es usado ampliamente. • Mientras más alejado este del valor especificado en 𝐻𝑜 , más alto es el chance de que se rechace 𝐻𝑜 correctamente. Procedimiento general para Pruebas de Hipótesis: • Identificar el parámetro de interés • Declare 𝐻𝑜 • Declare 𝐻1 • Determine una Prueba Estadística apropiada • Rechace 𝐻𝑜 si cumple las condiciones para hacerlo • Calcule el valor estadístico • Infiera conclusiones Nota: Tenga cuidado cuando interprete resultados de pruebas de hipótesis cuando el tamaño de la muestra es grande ya que cualquier desviación pequeña del valor del m asumido (𝐻𝑜 ) puede ser detectado, aún cuando la diferencia sea pequeña y no tenga significado práctico. Pruebas en el Promedio de una Distribución Normal (UNA MUESTRA) Varianza CONOCIDA • Consideraremos pruebas de hipótesis sobre el promedio (𝜇) de una población normal con varianza (𝜎 2 ) conocida. • Queremos probar: • • • 𝐻𝑜 : 𝜇 = 𝜇𝑜 ; 𝐻1 : 𝜇 ≠ 𝜇𝑜 𝜇𝑜 es una constante. 𝑋ത tiene una distribución normal con una media 𝜇𝑜 y una desviación estándar 𝜎/ 𝑛 • La prueba estadística es llamada Prueba Z estadística 𝑍𝑜 = ത 𝑜 𝑋−𝜇 𝜎 𝑛 ; donde 𝑋ത = σ𝑛 𝑖=1 𝑥𝑖 𝑛 Resumen de Pruebas en el Promedio de una muestra con Varianza Conocida Pruebas en el Promedio de una muestra con Varianza Conocida (Prueba Z una muestra) Ejemplo: Asuma que las calificaciones de los estudiantes siguen una distribución normal, con un promedio (𝜇) desconocido y una varianza (𝜎 2 ) conocida igual 1.44. Probar las siguiente hipótesis: 𝐻𝑜 : 𝜇 = 14.0 𝐻1 : 𝜇 ≠ 14.0 con un nivel de significancia (𝛼) igual 0.10. El promedio 𝑋ത es igual 14.5 de una muestra de 50 estudiantes. • La prueba estadística es llamada Prueba Z estadística 𝑍𝑜 = ത 𝑜 𝑋−𝜇 𝜎 𝑛 = 14.5−14.0 1.2 50 = 0.50 0.1697 = 2.95 Pruebas en el Promedio de una Distribución Normal • Región Crítica: 𝑍𝑜 > 𝑍𝛼/2 ó 𝑍𝑜 < −𝑍𝛼/2 • Si el Valor Estadístico 𝑍𝑜 calculado se encuentra en la Región Crítica se debe RECHAZAR la hipótesis nula 𝐻𝑜 . 𝑍𝑜 > 𝑍𝛼/2 2.95 > 1.645 Curva de Distribución Normal Normal, Mean=0, StDev=1 0.4 0.3 Density 𝐻𝑜 : 𝜇 = 14.0 𝐻1 : 𝜇 ≠ 14.0 0.2 0.1 0.05 0.0 0.05 -1.645 0 X 1.645 𝑍𝑜 Pruebas en el Promedio de una Distribución Normal • Valor 𝑝: Es la probabilidad que le corresponde arriba del Valor Estadístico 𝑍𝑜 y abajo del Valor Estadístico −𝑍𝑜 calculado. • Si el Valor 𝑝 es menor que el nivel de significancia 𝛼 se debe RECHAZAR la hipótesis nula 𝐻𝑜 . Distribution Plot Normal, Mean=0, StDev=1 𝐻𝑜 : 𝜇 = 14.0 𝐻1 : 𝜇 ≠ 14.0 0.4 Density 0.3 0.2 0.1 0.001589 0.001589 0.0 -2.95 El valor 𝑝 = 0.001589 ∗ 2 = 0.003 < 𝛼 = 0.10 ➔ RECHAZAR 𝐻𝑜 al 0.10 nivel de significancia! 0 X 𝑍𝑜 2.95 Pruebas en el Promedio de una Distribución Normal • Resultado con Minitab: • La prueba estadística es llamada Prueba Z estadística Distribution Plot Normal, Mean=14.5, StDev=0.1697 2.5 Density 2.0 1.5 1.0 0.5 0.05 0.0 0.05 14.22 14.5 X 14.78 Distribution Plot Normal, Mean=0, StDev=1 0.4 El valor 𝑝 = 0.001589 ∗ 2 = 0.003 < 𝛼 = 0.10 ➔ RECHAZAR 𝐻𝑜 al 0.10 nivel de significancia! Density 0.3 0.2 0.1 0.001589 0.0 -2.95 0.001589 0 X 2.95 Escogiendo el Tamaño de la Muestra (𝒏) o Calcular Error Tipo II (𝛽) Prueba Z de una muestra Utilizando La curva característica de operación (CO) • Se dibuja error Tipo II 𝛽 en función de d para varios tamaños de muestras n, donde 𝛽 y d: • Φ es la probabilidad a la izquierda de Z en la Curva de Distribución Normal. • Se necesita saber la diferencia entre 𝜇 − 𝜇𝑜 y conocer la desviación estándar 𝜎. Escogiendo el Tamaño de la Muestra 𝒏 o Calcular Error Tipo II Utilizando La curva de operación característica (OC) • OC curves: (Ejemplo) Prueba t para una Muestra Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Ahora consideramos pruebas de hipótesis en el promedio de una población con varianza desconocida. • La variable aleatoria (randómica o al azar) sigue ahora una distribución t. • Utilizamos la prueba estadística t: 𝑋ത − 𝜇𝑜 𝑇𝑜 = 𝑠 𝑛 • Si 𝐻𝑜 es verdadera ➔ 𝑇𝑜 tiene una distribución 𝑡 con 𝑛 − 1 grados de libertad. • Rechazamos 𝐻𝑜 si 𝑇𝑜 se encuentra dentro de la Región Crítica. Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Se prueban las siguientes hipótesis: • Hipótesis Nula: 𝐻𝑜 : 𝜇 = 𝜇𝑜 ➔ La media de la población (𝜇) es igual a la media hipotética (𝜇𝑜 ). • Hipótesis Alternativa: 𝐻1 : 𝜇 ≠ 𝜇𝑜 ➔ La media de la población (𝜇) es diferente de la media hipotética (𝜇𝑜 ). 𝐻1 : 𝜇 > 𝜇𝑜 ➔ La media de la población (𝜇) es mayor que la media hipotética (𝜇𝑜 ). 𝐻1 : 𝜇 < 𝜇𝑜 ➔ La media de la población (𝜇) es menor que la media hipotética (𝜇𝑜 ). Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Utilice la Prueba t de UNA muestra para estimar la media (promedio) de una población y compararla con un valor objetivo o un valor de referencia cuando no se conoce la desviación estándar de la población. • Se puede determinar lo siguiente: • Determine si la media de población difiere de la media hipotética que usted especifica. • Calcule un rango de valores que probablemente incluya la media de la población. • Una prueba bilateral (≠) puede detectar diferencias que son menores o mayores que el valor hipotético, pero tiene menos potencia que una prueba unilateral. • Esta prueba unilateral (< ó >) tiene mayor potencia que una prueba bilateral, pero no puede detectar si la media de la población es mayor o menor que la media hipotética. Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Consideraciones acerca de los datos para una Prueba 𝑡 de 1 muestra: • La desviación estándar de la población no se conoce • Si conoce la desviación estándar de la población, utilice la Prueba 𝒁 de 1 muestra porque la prueba 𝑍 tiene más potencia que la prueba 𝑡. • Los datos deben ser continuos. • Ejemplo: Esfuerzos de compresión de muestras cilíndricas. • Los datos de la muestra no deben ser marcadamente asimétricos y el tamaño de la muestra debe ser mayor que 20. • Si el tamaño de su muestra es menor que 20, se debe graficar los datos para verificar si hay asimetría y observaciones poco comunes o inusuales (outliers). Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Consideraciones acerca de los datos para una Prueba 𝑡 de 1 muestra: • Los datos de la muestra se deben seleccionar aleatoriamente. • Si sus datos no se recopilan aleatoriamente, los resultados podrían no representar la población. • Cada observación debe ser independiente de todas las demás observaciones. • Si se tiene datos pareados o dependientes; como por ejemplo, mediciones de un espesor tomadas con dos calibradores diferentes, utilice la Prueba 𝑡 𝑝𝑎𝑟𝑒𝑎𝑑𝑎. • Determinar un tamaño de muestra adecuado. • La muestra debe ser lo suficientemente grande para que: • Los valores estimados tengan suficiente precisión. • Los intervalos de confianza sean suficientemente estrechos como para ser útiles. • Se tiene protección adecuada contra errores tipo I y tipo II. • Utilice el Poder o Potencia estadística para determinar el tamaño adecuado de la muestra. Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Consideraciones del Analista para una Prueba 𝑡 de 1 muestra: • Nivel de confianza: • Por lo general, un nivel de confianza de 95% funciona adecuadamente. • Un nivel de confianza de 95% indica que si usted toma 100 muestras aleatorias de la población, los intervalos de confianza para aproximadamente 95 de las muestras incluirán el parámetro de población. • Para un conjunto determinado de datos, un nivel de confianza más bajo produce un Intervalo de Confianza más estrecho y un nivel de confianza más alto produce un Intervalo de Confianza más amplio. • La amplitud del Intervalo también tiende a disminuir con tamaños de muestra más grandes. • Por lo tanto, convendría usar un nivel de confianza que no sea 95%, dependiendo del tamaño de la muestra. Pruebas de Hipótesis en la Media (Promedio) de una Distribución Normal cuando la Varianza NO es Conocida (UNA MUESTRA): • Consideraciones del Analista para una Prueba 𝑡 de 1 muestra: • Nivel de confianza: • Si el tamaño de la muestra es pequeño, un intervalo de confianza de 95% pudiera ser demasiado amplio para ser útil. Con un nivel de confianza más bajo, como 90%, se obtiene un intervalo más estrecho. Sin embargo, la probabilidad de que el intervalo incluya la media de la población disminuye. • Si el tamaño de la muestra es grande, considere usar un nivel de confianza más alto, como 99%. • Con una muestra grande, un nivel de confianza de 99% aún podría producir un intervalo razonablemente estrecho, aumentando al mismo tiempo la probabilidad de que el intervalo incluya la media de la población. • Cuando la muestra es pequeña, se asume que la distribución que subyacente es normal. • En la práctica muchas poblaciones son aproximadamente normales. • Desviaciones pequeñas de la normalidad de la población tendrán un efecto pequeño en la validez de resultados. • Si el Tamaño de la Muestra (𝑛) es grande (≥ 40) se podría calcular los Intervalos de Confianza igual que la Prueba 𝑍 utilizando la Curva de Distribución Normal. • Usualmente el Tamaño de la Muestra (𝑛) es pequeña en problemas de ingeniería y se recomienda usar la distribución 𝑡. • Cuando se incrementan los grados de libertad, la Distribución 𝑡 tiene a ser una Distribución Normal Estándar. Parámetros para leer las Tablas que se encuentran en los libros. Ejemplo: • El Valor de 𝑍𝛼 aparece en la ultima fila de Tabla ya que cuando los grados de libertad son ∞ la Curva de Distribución t llega a ser la Curva de Distribución Normal Estándar. 𝑇0.05,∞ = 𝑍0.05 = 1.645 Resumen para la Prueba t de una muestra: Escogiendo el Tamaño de la Muestra (𝒏) o Calcular Error Tipo II (𝛽) Prueba t de una muestra Utilizando La curva de operación característica (OC) • Igual que en la Prueba Z, se necesita saber la diferencia entre 𝜇 − 𝜇𝑜 utilizando la siguiente ecuación: • También se necesita utilizar Tablas especiales para determinar el error Tipo II 𝛽 Escogiendo el Tamaño de la Muestra (𝒏) o Calcular Error Tipo II (𝛽) Prueba t de una muestra Utilizando La curva de operación característica (OC) • Curvas OC: Prueba en la Varianza de UNA MUESTRA • Asume que la población de donde fue sacada la muestra sigue una distribución normal. • Prueba de hipótesis en una muestra con parámetros desconocidos: Promedio 𝜇 y varianza 𝜎 2 . • A veces se requiere probar la hipótesis de que la varianza 𝜎 2 es igual a un valor específico. 𝐻𝑜 : 𝜎 2 = 𝜎𝑜2 Y 𝐻1 puede ser: 𝐻1 : 𝜎 2 ≠ 𝜎𝑜2 𝐻1 : 𝜎 2 < 𝜎𝑜2 𝐻1 : 𝜎 2 > 𝜎𝑜2 Prueba en la Varianza de UNA MUESTRA • Si 𝐻𝑜 es verdadera, 𝑋𝑜 sigue una distribución Chi Cuadrado con n-1 grados de libertad 2 (𝑛 − 1)𝑠 𝑋𝑜2 = 𝜎𝑜2 • La prueba t es robusta para desviaciones de normalidad, mientras que la prueba Chi Cuadrado NO lo es. • Pequeñas desviaciones de normalidad pueden afectar los resultados dramáticamente. Prueba en la Varianza de UNA MUESTRA • Criterio de rechazo: Pruebas de Normalidad • La normalidad se asume para varias pruebas estadísticas. • Para la prueba estadística de una varianza se utiliza el Método Chi Cuadrado solamente cuando los datos están Normalmente Distribuidos. Cualquier pequeña desviación tergiversa los resultados. • Se hace una prueba de Normalidad cuando se desea saber si los datos que se tiene siguen una Distribución Normal (ver Figura). Distribution Plot Normal, Mean=20, StDev=2 0.20 Density 0.15 0.10 0.05 0.0005 0.00 13.42 0.0005 20 X 26.58 Pruebas de Normalidad • Las hipótesis que se prueban: 𝐻𝑜 : Los datos siguen una distribución normal. 𝐻1 :Los datos "NO"siguen una distribución normal. • Para asegurar que los resultados sean válidos: • Los datos deben ser numéricos • Los datos de la muestra se deben seleccionar aleatoriamente • El tamaño de la muestra debería ser mayor que 20 • Si es menor que 20 puede no proporcionar suficiente Potencia Estadística para detectar diferencias significativas entre los datos de su muestra y la distribución normal. • Muestras muy grandes; sin embargo, proporcionan demasiada potencia y hace parecer que pequeñas diferencias parezcan significativas. • Existen varios métodos para realizar Pruebas de Normalidad • Entre las principales pruebas de normalidad tenemos: • • • • • • • • • • • Métodos gráficos: Histograma y Gráfico de Probabilidad Kolmogorov-Smirnov (K-S) Lilliefors corrected K-S Shapiro-Wilk Anderson-Darling Cramer-von Mises D’Agostino skewness Anscombe-Glynn kurtosis D’Agostino-Pearson omnibus Jarque-Bera Ryan- Joiner • El software especializado usualmente NO realiza todas estas pruebas. Pruebas de Normalidad • Método Gráfico: • Utilizando el Gráfico de Probabilidad No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Notas Prueba 14.4 17.5 16.0 15.3 15.6 12.3 15.0 14.2 13.9 17.2 13.9 14.3 16.2 14.3 11.4 15.3 14.6 15.4 16.2 15.4 15.7 16.6 17.0 14.7 14.3 • Recuerde…. Si los puntos se encuentran distribuidos relativamente cerca (apegados) a la línea de un Gráfico de Distribución, entonces los datos se encuentran Normalmente Distribuidos. Pruebas de Normalidad • Método Gráfico: • Utilizando la Prueba del Lápiz Grueso • Otra manera es utilizando la prueba del “lápiz grueso”; es decir, si al colocar un lápiz encima de los puntos, estos son cubiertos, entonces los datos se encuentran Normalmente Distribuidos. • La "prueba del lápiz grueso“ es una aproximación informal de una prueba de normalidad es y se aplica con frecuencia a una gráfica de probabilidad. • Imagine un "lápiz grueso" colocado sobre la línea ajustada: Si este cubre todos los puntos de los datos en la gráfica, probablemente los datos son normales. • Si los puntos están lo suficientemente distantes de la línea ajustada como para verse más allá de los bordes del lápiz grueso, es probable que se trate de datos no normales. • Este enfoque informal no es un sustituto de la inferencia estadística de la prueba de normalidad, pero es útil como una rápida herramienta de evaluación visual. Pruebas de Normalidad • Método Gráfico: • Utilizando la Prueba del Lápiz Grueso Pruebas de Normalidad • Método Gráfico: • Utilizando un Histograma • Se grafica un histograma y se lo compara con una curva de distribución normal Histogram of Notas Prueba Normal Mean 15.07 StDev 1.416 N 25 7 6 Frequency 5 4 3 2 1 0 11 12 13 14 15 Notas Prueba 16 17 18 Pruebas de Normalidad • Anderson-Darling (A): • Es la opción más adecuada en la mayoría de las situaciones. • Esta prueba es generalmente más efectiva para la detección de no normalidad en las colas de la distribución. • Este valor estadístico es una distancia elevada al cuadrado que tiene mayor ponderación en las colas de la distribución. • Un valor pequeño de Anderson-Darling indica que la distribución se ajusta mejor a los datos. Pruebas de Normalidad • Anderson-Darling: • Ejemplo: No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Notas Prueba 14.4 17.5 16.0 15.3 15.6 12.3 15.0 14.2 13.9 17.2 13.9 14.3 16.2 14.3 11.4 15.3 14.6 15.4 16.2 15.4 15.7 16.6 17.0 14.7 14.3 Pruebas de Normalidad • Ryan-Joiner: • Esta prueba evalúa la normalidad calculando la correlación entre los datos y las puntuaciones normales de los datos. • Si el coeficiente de correlación se encuentra cerca de 1, es probable que la población sea normal. • El estadístico de Ryan-Joiner evalúa la fuerza de esta correlación; si se encuentra por debajo del valor crítico apropiado, usted rechazará la hipótesis nula de normalidad de la población. • Esta prueba es similar a la prueba de normalidad de Shapiro-Wilk. Pruebas de Normalidad • Ryan-Joiner: • Ejemplo: Pruebas de Normalidad • Kolmogorov-Smirnov: • Esta prueba compara la función de distribución acumulada empírica de los datos de la muestra con la distribución esperada si los datos fueran normales. • Si esta diferencia observada es adecuadamente grande, la prueba rechazará la hipótesis nula de normalidad de la población. • Si el valor 𝑝 de esta prueba es menor que el nivel de significancia (α) elegido, usted puede rechazar la hipótesis nula y concluir que se trata de una población no normal. Pruebas de Normalidad • Kolmogorov-Smirnov: • Ejemplo: Estadística Inferencial para DOS muestras Estadística Inferencial para DOS muestras Inferencia en la Diferencia de las Medias (Promedios) de dos Distribuciones Normales (Varianza Conocida – Prueba Z para medias de dos muestras) • Ahora consideramos dos diferentes poblaciones independientes • El Objetivo es estudiar la diferencia en los parámetros de dos poblaciones. • Los investigadores están usualmente interesados en comparar dos diferentes condiciones para determinar cual condición afecta la respuesta (observación). • En este caso consideramos estadística inferencial en la diferencia de las medias 𝜇1 − 𝜇2 de dos poblaciones normalmente distribuidas con varianzas 𝜎12 y 𝜎22 conocidas. • Lo que se asume: • • • • La muestra 1 es una aleatoria de la población 1. La muestra 2 es una aleatoria de la población 2. Las dos poblaciones son independientes. Las dos poblaciones son Normalmente Distribuidas. • Basado en lo que se asumió se puede afirmar que: 𝑍𝑂 = 𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 ) 𝜎12 𝜎22 + 𝑛1 𝑛2 • 𝑍𝑜 tiene una distribución normal con media = 0 y varianza = 1 • El procedimiento es similar a la prueba 𝑍 de una muestra. • La hipótesis nula 𝐻𝑂 es Rechazada si 𝑍𝑂 se encuentra en la Región Crítica. • Resumen: Pruebas en la diferencia de medias con Varianza Conocida (Prueba 𝑍 de dos muestras) • Ejemplo: Resolución con Software • Minitab??? → macro • Excel??? → Poblacion 1 Poblacion 2 121 112 122 114 123 113 121 114 124 115 121 116 123 114 124 115 125 116 125 118 z-Test: Two Sample for Means Mean Known Variance Observations Hypothesized Mean Difference z P(Z<=z) one-tail z Critical one-tail P(Z<=z) two-tail z Critical two-tail Poblacion 1 Poblacion 2 122.9 114.7 64 64 10 10 0 2.291969677 0.010953697 1.644853627 0.021907393 1.959963985 • Ejemplo: Resolución con Software • Minitab??? → macro • Excel??? → Prueba 𝑍 de dos muestras Escogiendo el Tamaño de la Muestra (𝒏) o Calcular Error Tipo II (𝛽) • Utilizando La curva de operación característica (OC) • Se utiliza la siguiente expresión para usar las Curvas OC: • O puede usarse esta ecuación cuando se sabe 𝛽, H1 es de una cola y n1=n2=n. Inferencia en la Diferencia de las Medias (Promedios) de DOS Distribuciones Normales (Varianzas Desconocidas) • Dos diferentes casos deben ser considerados • CASO 1: Las varianzas son desconocidas pero iguales 𝜎12 = 𝜎22 = 𝜎 2 • CASO 2: Las varianzas son desconocidas pero diferentes (no iguales) 𝜎12 ≠ 𝜎22 • El valor 𝑡 estadístico se usa para probar las hipótesis. Caso 1: Las varianzas son desconocidas pero iguales 𝝈𝟐𝟏 = 𝝈𝟐𝟏 = 𝝈𝟐 𝑇0 = 𝑋ത1 − 𝑋ത2 − ∆0 1 1 𝑆𝑝 + 𝑛1 𝑛2 • T tiene una distribución t con 𝑛1 − 𝑛2 − 2 grados de libertad. • Donde 𝑆𝑝 la desviación estándar acumulada de las dos poblaciones. 2 2 𝑛 − 1 𝑠 + 𝑛 − 1 𝑠 1 2 1 2 2 𝑆𝑝 = 𝑛1 + 𝑛2 − 2 • La hipótesis 𝐻𝑜 es Rechazada si 𝑇 se encuentra en la Región Crítica. Caso 1: Las varianzas son desconocidas pero iguales • Criterios de Rechazo de Ho. • Caso 2: Las varianzas son desconocidas pero diferentes (no iguales) 𝜎12 ≠ 𝜎22 • En muchos casos no se pueden asumir que las varianzas 𝜎12 𝑦 𝜎22 son iguales 𝑇𝑜∗ = 𝑋ത1 − 𝑋ത2 − ∆0 𝑠12 𝑠22 + 𝑛1 𝑛2 • Este método, Prueba 𝑡 para la diferencia en las medias (promedios), con varianzas desconocidas y asumidas NO iguales, es un procedimiento más seguro a menos de que estemos seguros de que las varianzas son iguales. • Caso 2: Las varianzas son desconocidas pero diferentes (no iguales) • Ejemplo: Usando Minitab Probability Plot of Dark, Milk Normal 99 Variable Dark Milk 95 90 Mean StDev N AD P 116.1 3.533 12 0.638 0.072 100.2 2.890 12 0.266 0.624 Percent 80 70 60 50 40 30 20 10 5 1 90 95 100 105 110 Data 115 120 125 Prueba t de dos muestras emparejadas • Un caso especial de pruebas t. • Ocurre cuando los datos son recolectados en pares • Ejemplo: Tomar dos medidas en una misma probeta o espécimen. Prueba F • Prueba de hipótesis para igualdad de DOS Varianzas. • Modelos Estadísticos: • Regresión Lineal Simple • Modelos Empíricos: • Muchos problemas en ciencias exactas analizan la relación entre dos o más variables. • Existen Modelos Determinísticos: • Ejemplo: 𝐷𝑒𝑠𝑝𝑙𝑎𝑧𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = 𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 ∗ 𝑡𝑖𝑒𝑚𝑝𝑜 • Predice desplazamientos de manera exacta • No considera errores (incertidumbre) • Para las mismas entradas → mismas salidas • Y Modelos No determinísticos: • Relación entre variables no es determinística • Ejemplo: Consumo de gasolina = f (peso del vehículo) • Predice la salida de manera no exacta. • Dos vehículos con igual peso pueden tener diferente consumo de gasolina • Modelos Estadísticos: • Regresión Lineal Simple • Modelos Empíricos: • Se usa herramientas estadísticas para modelar y explorar relaciones NO determinísticas entre variables → Esto es lo que se denomina Análisis de Regresión • Análisis de Regresión es una herramienta muy utilizada ya que la relación no determinística entre variables es común. • El Análisis de Regresión más simple es la Regresión Lineal • Una variable independiente (predictor) x • La relación con la respuesta se asume lineal • Se puede utilizar este modelo para optimización de procesos. • Ejemplo: Temperatura que maximice un resultado • Modelos Estadísticos: • Regresión Lineal Simple • Modelos Empíricos: La manera correcta de generalizar esto a un Modelo Probabilístico Lineal es asumir que el valor esperado de y es una función lineal de x + error 𝒀 = 𝜷𝟎 + 𝜷𝟏 𝒙 + ∈ • Este modelo se lo conoce como Regresión Lineal Simple • Tiene solo un Regresor (variable independiente x)! • • • • La Regresión Lineal Simple es un Modelo Empírico Donde: 𝛽0 y 𝛽1 → Coeficientes de Regresión ∈ es el término de Error aleatorio (𝜎 2 ) • Modelos Estadísticos: • Regresión Lineal Simple • Modelos Empíricos: • En problemas de la vida real se estiman los valores de 𝛽0 , 𝛽1 y 𝜎 2 de los datos que se tiene. • La Regresión Lineal Simple se utiliza para predecir el promedio de una observación (Y) para una particular x. • Y es una variable aleatoria Normalmente Distribuida: 𝜷𝟎 + 𝜷𝟏 𝒙 → 𝝁 → Promedio ∈ = 𝝈𝟐 → Varianza • Modelos Estadísticos: • Regresión Lineal Simple • Modelos Empíricos: • Precauciones: • Hay que tener cuidado en relacionar variables que NO tengan relación. • Ejemplo: • Esfuerzo de compresión del hormigón y el número de parqueaderos. • Se puede tener una relación lineal perfecta pero CASUAL • Esta relación de variables No es razonable y no se puede confiar. • Puede pasar bastante seguido. • Solamente la teoría de Diseño de Experimentos permite determinar relaciones de Causa – Efecto . • Los modelos de Regresión son validos solamente en el rango de los datos originales. • No son válidos necesariamente cuando se extrapola valores. • Si se extrapola hay que tener cuidado! • Extrapolar “moderadamente” la mayoría de veces es OK. • Modelos Estadísticos: • Regresión Lineal Simple • Karl Gauss propuso estimar los coeficientes de regresión 𝜷𝟎 𝑦 𝜷𝟏 del modelo minimizando la suma de los cuadrados de las desviaciones verticales. • A este criterio se lo conoce como el Método de los Mínimos Cuadrados 𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏 𝒙𝒊 +∈𝒊 , 𝑖 = 1, 2, … , 𝑛 • Modelos Estadísticos: • Regresión Lineal Simple Idoneidad del Modelo de Regresión • Para desarrollar el modelo de regresión se hicieron algunas suposiciones. • Los errores no están correlacionados. • Los errores están normalmente distribuidos con varianza constante. • Asumimos que el fenómeno se comporta linealmente. • El analista “siempre” debe validar las suposiciones. • Análisis de Residuales 𝑒𝑖 = 𝑦𝑖 − 𝑦ො𝑖 Donde: 𝑦𝑖 = Es la observación 𝑦ො𝑖 = Es el valor que se obtiene del modelo de regresión • Modelos Estadísticos: • Regresión Lineal Simple Idoneidad del Modelo de Regresión • Análisis de Residuales • Se lo realiza para verificar la suposición de que los errores están: • Normalmente distribuidos: Para esto se construye un histograma o un gráfico de probabilidad normal de los residuales. • También se puede estandarizar los residuales. • Es usual graficar los residuales: • En secuencia de tiempo • En función de 𝑦ො𝑖 • En función de la variable dependiente x • Modelos Estadísticos: • Regresión Lineal Simple Idoneidad del Modelo de Regresión • Análisis de Residuales a) Ideal • El resto representa anomalías b) La varianza se incrementa con el tiempo, 𝑦ො𝑖 o x. (Se corrige con Transformación de datos √y o 1/y) c) Indica desigualdad de varianzas d) Indica que el Modelo NO es Adecuado! → Modelo de un grado Mayor. • Modelos Estadísticos: • Regresión Lineal Simple Idoneidad del Modelo de Regresión • Coeficiente de Determinación R2 • Usado ampliamente para un Modelo de Regresión • Se lo usa comúnmente para juzgar la IDONEIDAD del modelo. Qué tan bien el modelo puede estimar NUEVOS datos. • El valor de R2 varía entre 0 y 1 0 ≤ R2 ≤ 1 • R2 es la VARIABILIDAD DE LOS DATOS EXPLICADOS POR EL MODELO DE REGRESION. • Modelos Estadísticos: • Regresión Lineal Simple Idoneidad del Modelo de Regresión • Coeficiente de Determinación R2 • Precauciones: • No es una medida de la pendiente de la recta. • A mayor R cuadrado no significa mayor pendiente. • R cuadrado NO mide la idoneidad del modelo porque puede ser “camuflado” adicionando términos al modelo. • A pesar de que las variables no tengan una relación lineal, R cuadrado puede ser alto. • Se debe tener cuidado !!! → Analizar Residuales. • RESUMEN: