1.1 STATISTICAL AND CRITICAL THINKING Este texto introduce el concepto de estadística como la ciencia que abarca desde la planificación de estudios y experimentos hasta la obtención, organización, resumen, presentación, análisis e interpretación de datos para finalmente extraer conclusiones. Se definen términos clave como: ● Datos: Colecciones de observaciones (medidas, edad, sexo, respuestas de encuestas). ● Población: Conjunto completo de todas las mediciones o datos que se están considerando. ● Censo: Recopilación de datos de todos los miembros de la población. ● Muestra: Subconjunto de miembros seleccionados de una población. Se destaca la importancia de utilizar muestras representativas para inferir conclusiones sobre la población completa. El texto describe el proceso de un estudio estadístico, enfatizando en el pensamiento crítico y la interpretación de resultados, más que en los cálculos matemáticos. Se mencionan diferentes tipos de muestras, como las muestras de respuesta voluntaria, que suelen estar sesgadas y no son representativas de la población. Se abordan conceptos clave como: ● Significancia estadística: Se alcanza cuando un resultado es muy improbable que ocurra por casualidad. ● Significancia práctica: Importancia real y útil de un resultado, aunque estadísticamente significativo. Finalmente, se advierten sobre posibles dificultades en el análisis de datos, como: ● Conclusiones engañosas: Hacer afirmaciones no justificadas por el análisis estadístico. ● Correlación no implica causalidad: No se puede asumir que una relación entre dos variables implica que una causa la otra. ● Datos reportados en lugar de medidos: Es preferible tomar medidas directamente en lugar de confiar en los reportes de los sujetos. ● Preguntas sesgadas: Preguntas formuladas de manera que inducen a una respuesta determinada. ● Orden de las preguntas: El orden en que se presentan las preguntas puede influir en las respuestas. ● No respuesta: Las personas que se niegan a responder a una encuesta pueden 1. Tasas de respuesta bajas: ● Problema: Cuando una encuesta tiene una tasa de respuesta baja, la confiabilidad de los resultados disminuye. Esto se debe a que se tiene un tamaño de muestra más pequeño y aumenta la probabilidad de que exista un sesgo entre quienes sí responden. ● Soluciones: ○ Presentar un argumento convincente sobre la importancia de la encuesta. ○ Hacer la encuesta breve y concisa. ○ Ofrecer incentivos por completar la encuesta (dinero, sorteos). ● Niveles aceptables: No hay pautas definitivas, pero una tasa de respuesta del 80% o más se considera muy buena. Algunas fuentes sugieren que tasas de respuesta de al menos 40% son aceptables. 2. "Straightlining": ● Problema: Ocurre cuando los encuestados dan la misma respuesta (por ejemplo, la opción "b") a todas o casi todas las preguntas. ● Consecuencias: Las respuestas obtenidas por "straightlining" deben eliminarse, ya que no reflejan realmente las opiniones de los encuestados. Porcentajes Engañosos ● Problema: Algunos estudios citan porcentajes engañosos o poco claros. ● Principio fundamental: 100% de una cantidad representa la totalidad de esa cantidad. Por lo tanto, no se pueden justificar porcentajes superiores al 100%. Por ejemplo, si un investigador médico afirma haber desarrollado un tratamiento para las migrañas que reduce los dolores de cabeza en un 150%, esta afirmación no es correcta. Eliminar todas las migrañas representaría una reducción del 100%. ● Interpretación de porcentajes: El símbolo "%" o "por ciento" significa "dividido por 100". ○ Para encontrar el porcentaje de una cantidad, se reemplaza el símbolo "%" por la división entre 100 y se interpreta "de" como multiplicación. ○ Ejemplo: 6% de 1200 respuestas = (6/100) * 1200 = 72 En esencia, este segmento advierte sobre el uso incorrecto de porcentajes, especialmente aquellos que superan el 100%, ya que son matemáticamente imposibles. Además, proporciona una guía clara sobre cómo calcular el porcentaje de una cantidad. 1.2 TYPES OF DATA 1. Parámetro y Estadística: ● Parámetro: Medida numérica que describe alguna característica de una población. ● Estadístico: Medida numérica que describe alguna característica de una muestra. 2. Datos Cuantitativos y Categóricos: ● Cuantitativos (o numéricos): Representan conteos o mediciones (ej.: altura, peso). ● Categóricos (o cualitativos): Representan nombres o etiquetas (ej.: color de ojos, género). 3. Unidades de Medida: ● Es crucial utilizar las unidades de medida adecuadas al trabajar con datos cuantitativos (dólares, horas, metros, etc.). ● Ignorar las unidades puede tener consecuencias graves (ejemplo: la pérdida de la sonda espacial Mars Climate Orbiter por un error en las unidades). 4. Datos Discretos y Continuos: ● Discretos: Resultan de un número finito o "contable" de valores (ej.: número de pacientes, número de intentos). ● Continuos: Resultan de un número infinito de posibles valores (ej.: longitud, peso). 1. Niveles de Medición: ● Existen cuatro niveles de medición para clasificar los datos: nominal, ordinal, intervalo y razón. ● El nivel de medición determina los procedimientos estadísticos adecuados que se pueden aplicar a los datos. 2. Nivel Nominal: ● ● ● ● Los datos consisten en nombres, etiquetas o categorías. No se pueden ordenar (de menor a mayor). Ejemplos: Sí/No/Indeciso, respuestas codificadas en encuestas. No se deben utilizar para cálculos, como la media, ya que los números asignados a las categorías no tienen significado numérico real. 3. Nivel Ordinal: ● Los datos se pueden ordenar, pero las diferencias entre los valores no se pueden determinar o no tienen sentido. ● Ejemplos: Calificaciones escolares (A, B, C, D, F), escalas de opinión (muy de acuerdo, de acuerdo, etc.). ● No se recomienda utilizar para cálculos, aunque en algunas ocasiones se utilizan cálculos (como la media) con datos ordinales, especialmente aquellos obtenidos de escalas de calificación. 4. Nivel Intervalo: ● Los datos se pueden ordenar y las diferencias entre los valores son significativas. ● No tienen un punto de inicio natural (cero). ● Ejemplos: Temperaturas en grados Fahrenheit, años en el calendario. 5. Nivel Razón: ● Los datos se pueden ordenar, las diferencias son significativas y hay un punto de inicio natural (cero). ● Las diferencias y las razones son significativas. ● Ejemplos: Altura, peso, tiempo. En resumen, el nivel de medición de los datos es fundamental para seleccionar y aplicar correctamente los métodos estadísticos adecuados. 1. Big Data: ● Definición: Conjuntos de datos tan grandes y complejos que su análisis supera las capacidades de las herramientas de software tradicionales. Requiere el uso de software que se ejecute en paralelo en múltiples computadoras. ● Ciencia de Datos: Aplicación de la estadística, la informática y la ingeniería de software, junto con otras áreas relevantes (genética). ● Estadística en la Ciencia de Datos: Los científicos de datos modernos requieren conocimientos sólidos en estadística, informática y otras áreas como psicología, biología, medicina, etc. 2. Datos Faltantes: ● Definición: Valores que no se han registrado o están ausentes en un conjunto de datos. ● Tipos: ○ Faltantes completamente al azar (MCAR): La probabilidad de que falte un valor es independiente de su valor o de otros valores en el conjunto de datos. ○ Faltantes no al azar (MNAR): La probabilidad de que falte un valor está relacionada con la razón por la que falta. ● Consecuencias: ○ Ignorar datos MCAR puede no tener un impacto significativo. ○ Ignorar datos MNAR puede introducir sesgos en los resultados. ● Métodos para tratar datos faltantes: ○ Eliminar casos: Eliminar todos los sujetos que tengan valores faltantes. Puede introducir sesgos si los datos son MNAR. ○ Imputación: Sustituir los valores faltantes por valores estimados. En resumen: El texto introduce el concepto de Big Data y su relación con la ciencia de datos. Además, se discuten los problemas asociados con los datos faltantes, diferenciando entre datos faltantes al azar y no al azar, y se presentan algunas estrategias para tratarlos. Nota: La información sobre el impacto de la demencia en la probabilidad de contraer coronavirus se proporciona como un ejemplo de aplicación de Big Data. 1.3 COLLECTING SAMPLE DATA 1. Placebo: ● Sustancia o procedimiento inofensivo y sin efecto terapéutico utilizado para efectos psicológicos o como control en investigaciones. ● Ejemplo: Experimento de la vacuna Salk contra la polio. Se compararon dos grupos: uno con la vacuna y otro con placebo. 2. Experimento vs. Estudio Observacional: ● Experimento: Se aplica un tratamiento y se observan sus efectos en los individuos. ● Estudio Observacional: Se observan y miden características específicas sin intentar modificar a los individuos. ● Ejemplo: Relación entre consumo de helado y ahogamientos. El estudio observacional puede llevar a conclusiones erróneas debido a variables ocultas (temperatura). Un experimento sería más adecuado para determinar la relación causal. 3. Diseño de Experimentos: ● Replicación: Repetición del experimento en múltiples individuos para obtener resultados más confiables. ● Ceguera: Ocultar a los sujetos (y a veces a los investigadores) si están recibiendo el tratamiento o el placebo. Esto ayuda a minimizar el efecto placebo. ● Aleatorización: Asignación aleatoria de los individuos a los grupos para garantizar grupos comparables. En resumen: El texto describe los conceptos de placebo, experimentos, estudios observacionales y los principios clave del diseño experimental, como la replicación, la ceguera y la aleatorización. Se enfatiza la importancia de utilizar la metodología adecuada para obtener resultados válidos y confiables. 1. Muestreo Aleatorio Simple: ● Se selecciona una muestra de n sujetos de manera que todas las posibles muestras del mismo tamaño tengan la misma probabilidad de ser elegidas. 2. Otros Métodos de Muestreo: ● Muestreo Sistemático: Se selecciona un punto de partida y luego se selecciona cada k-ésimo elemento de la población. ● Muestreo por Conveniencia: Se utilizan datos que son fáciles de obtener. ● Muestreo Estratificado: Se divide la población en subgrupos (estratos) y se selecciona una muestra de cada subgrupo. ● Muestreo por Conglomerados: Se divide la población en secciones (conglomerados) y se selecciona una muestra de conglomerados completos. 3. Muestreo Multietapa: ● Se utiliza una combinación de diferentes métodos de muestreo en varias etapas. En resumen: El texto describe diferentes métodos de muestreo utilizados para seleccionar una muestra de una población. Se destaca la importancia del muestreo aleatorio simple y se presentan otros métodos como el sistemático, el estratificado, el por conglomerados y el multietapa. Certainly, here's a summary of the provided text in Spanish: 1. Tipos de Estudios Observacionales: ● Transversal: Se recolectan datos en un único momento. ● Retrospectivo (o de casos y controles): Se recolectan datos de un período pasado a través de registros, entrevistas, etc. ● Prospectivo (o longitudinal o de cohortes): Se recolectan datos en el futuro de grupos que comparten características comunes. 2. Experimentos: ● Confusión: Cuando no se puede identificar con certeza el factor específico que causó un efecto observado. ● Diseño Experimental Completamente Aleatorizado: Se asignan los sujetos a los grupos de tratamiento de manera aleatoria. ● Diseño de Bloques Aleatorizados: Se forman bloques de sujetos con características similares y se asignan aleatoriamente los tratamientos dentro de cada bloque. ● Diseño de Pares Emparejados: Se comparan dos grupos de tratamiento utilizando pares de sujetos emparejados (por ejemplo, mediciones antes y después de un tratamiento, o gemelos). En resumen: El texto describe diferentes tipos de estudios observacionales y métodos para diseñar experimentos, incluyendo el control de factores de confusión a través de la aleatorización y el uso de bloques aleatorizados. 1. Diseño Rigorosamente Controlado: ● Se asignan cuidadosamente los sujetos a diferentes grupos de tratamiento para garantizar que los grupos sean similares en aspectos relevantes para el experimento. ● Implementarlo puede ser extremadamente difícil. 2. Errores de Muestreo: ● Error de muestreo (o error de muestreo aleatorio): Discrepancia entre un resultado de la muestra y el resultado real de la población debido a la variabilidad aleatoria del muestreo. ● Error no muestral: Resultado de errores humanos, como errores de entrada de datos, errores de cálculo, preguntas con sesgo, datos falsos proporcionados por los encuestados, conclusiones sesgadas o aplicación incorrecta de métodos estadísticos. ● Error de muestreo no aleatorio: Resultado del uso de un método de muestreo no aleatorio, como el muestreo por conveniencia o el muestreo de respuesta voluntaria. En resumen: El texto describe el concepto de diseño experimental rigurosamente controlado y explica los diferentes tipos de errores que pueden afectar los resultados de un estudio estadístico, incluyendo los errores de muestreo y los errores no muestrales. Ensayos Clínicos ● Definición: Experimentos prospectivos diseñados para evaluar la seguridad y eficacia de un nuevo medicamento, dispositivo, técnica quirúrgica, método de asesoramiento, etc. ● Etapas: ○ Fase 1: Evaluación de la seguridad y determinación de la dosis correcta. Pequeño número de sujetos (20-100). Duración: varios meses. Costo: alrededor de $4 millones. Tasa de éxito: 70%. ○ Fase 2: Evaluación de la eficacia. Grupo más grande (100-300 sujetos). Duración: varios meses a dos años. Costo: alrededor de $13 millones. Tasa de éxito: 50%. ○ Fase 3: Evaluación de la seguridad y eficacia en un grupo más grande y diverso (varios cientos a 3000 sujetos). Duración: varios años. Costo: alrededor de $20 millones. Tasa de éxito: 60%. ○ Fase 4: Monitoreo de la eficacia y seguridad tras su uso generalizado. ● Proceso de aprobación: ○ Investigación previa en animales y/o células humanas. ○ Revisión y aprobación por parte de la FDA (Food and Drug Administration). ○ Revisión ética por parte de un Comité de Revisión Institucional. ● Duración y Costo: ○ Aproximadamente seis años. ○ Costo de millones de dólares. ● Excepción: ○ Desarrollo de la vacuna contra COVID-19 de Pfizer y BioNTech, que se desarrolló y obtuvo aprobación de emergencia en ocho meses. En resumen: El texto describe las etapas de un ensayo clínico, destacando su importancia en el desarrollo de nuevos medicamentos y la rigurosidad del proceso de aprobación. También menciona la excepción notable del desarrollo acelerado de la vacuna contra COVID-19. 1.4 ETHICS IN STATISTICS (ejercicios didacticos)