Uploaded by Camila Montaña

Estadística y Pensamiento Crítico: Conceptos Clave

advertisement
1.1 STATISTICAL AND CRITICAL THINKING
Este texto introduce el concepto de estadística como la ciencia que abarca desde la
planificación de estudios y experimentos hasta la obtención, organización, resumen,
presentación, análisis e interpretación de datos para finalmente extraer conclusiones.
Se definen términos clave como:
●​ Datos: Colecciones de observaciones (medidas, edad, sexo, respuestas de
encuestas).
●​ Población: Conjunto completo de todas las mediciones o datos que se están
considerando.
●​ Censo: Recopilación de datos de todos los miembros de la población.
●​ Muestra: Subconjunto de miembros seleccionados de una población.
Se destaca la importancia de utilizar muestras representativas para inferir conclusiones
sobre la población completa.
El texto describe el proceso de un estudio estadístico, enfatizando en el pensamiento
crítico y la interpretación de resultados, más que en los cálculos matemáticos.
Se mencionan diferentes tipos de muestras, como las muestras de respuesta voluntaria,
que suelen estar sesgadas y no son representativas de la población.
Se abordan conceptos clave como:
●​ Significancia estadística: Se alcanza cuando un resultado es muy improbable que
ocurra por casualidad.
●​ Significancia práctica: Importancia real y útil de un resultado, aunque
estadísticamente significativo.
Finalmente, se advierten sobre posibles dificultades en el análisis de datos, como:
●​ Conclusiones engañosas: Hacer afirmaciones no justificadas por el análisis
estadístico.
●​ Correlación no implica causalidad: No se puede asumir que una relación entre
dos variables implica que una causa la otra.
●​ Datos reportados en lugar de medidos: Es preferible tomar medidas directamente
en lugar de confiar en los reportes de los sujetos.
●​ Preguntas sesgadas: Preguntas formuladas de manera que inducen a una
respuesta determinada.
●​ Orden de las preguntas: El orden en que se presentan las preguntas puede influir
en las respuestas.
●​ No respuesta: Las personas que se niegan a responder a una encuesta pueden
1. Tasas de respuesta bajas:
●​ Problema: Cuando una encuesta tiene una tasa de respuesta baja, la confiabilidad
de los resultados disminuye. Esto se debe a que se tiene un tamaño de muestra más
pequeño y aumenta la probabilidad de que exista un sesgo entre quienes sí
responden.
●​ Soluciones:
○​ Presentar un argumento convincente sobre la importancia de la encuesta.
○​ Hacer la encuesta breve y concisa.
○​ Ofrecer incentivos por completar la encuesta (dinero, sorteos).
●​ Niveles aceptables: No hay pautas definitivas, pero una tasa de respuesta del 80%
o más se considera muy buena. Algunas fuentes sugieren que tasas de respuesta
de al menos 40% son aceptables.
2. "Straightlining":
●​ Problema: Ocurre cuando los encuestados dan la misma respuesta (por ejemplo, la
opción "b") a todas o casi todas las preguntas.
●​ Consecuencias: Las respuestas obtenidas por "straightlining" deben eliminarse, ya
que no reflejan realmente las opiniones de los encuestados.
Porcentajes Engañosos
●​ Problema: Algunos estudios citan porcentajes engañosos o poco claros.
●​ Principio fundamental: 100% de una cantidad representa la totalidad de esa
cantidad. Por lo tanto, no se pueden justificar porcentajes superiores al 100%. Por
ejemplo, si un investigador médico afirma haber desarrollado un tratamiento para las
migrañas que reduce los dolores de cabeza en un 150%, esta afirmación no es
correcta. Eliminar todas las migrañas representaría una reducción del 100%.
●​ Interpretación de porcentajes: El símbolo "%" o "por ciento" significa "dividido por
100".
○​ Para encontrar el porcentaje de una cantidad, se reemplaza el símbolo "%"
por la división entre 100 y se interpreta "de" como multiplicación.
○​ Ejemplo: 6% de 1200 respuestas = (6/100) * 1200 = 72
En esencia, este segmento advierte sobre el uso incorrecto de porcentajes, especialmente
aquellos que superan el 100%, ya que son matemáticamente imposibles. Además,
proporciona una guía clara sobre cómo calcular el porcentaje de una cantidad.
1.2 TYPES OF DATA
1. Parámetro y Estadística:
●​ Parámetro: Medida numérica que describe alguna característica de una población.
●​ Estadístico: Medida numérica que describe alguna característica de una muestra.
2. Datos Cuantitativos y Categóricos:
●​ Cuantitativos (o numéricos): Representan conteos o mediciones (ej.: altura, peso).
●​ Categóricos (o cualitativos): Representan nombres o etiquetas (ej.: color de ojos,
género).
3. Unidades de Medida:
●​ Es crucial utilizar las unidades de medida adecuadas al trabajar con datos
cuantitativos (dólares, horas, metros, etc.).
●​ Ignorar las unidades puede tener consecuencias graves (ejemplo: la pérdida de la
sonda espacial Mars Climate Orbiter por un error en las unidades).
4. Datos Discretos y Continuos:
●​ Discretos: Resultan de un número finito o "contable" de valores (ej.: número de
pacientes, número de intentos).
●​ Continuos: Resultan de un número infinito de posibles valores (ej.: longitud, peso).
1. Niveles de Medición:
●​ Existen cuatro niveles de medición para clasificar los datos: nominal, ordinal,
intervalo y razón.
●​ El nivel de medición determina los procedimientos estadísticos adecuados que se
pueden aplicar a los datos.
2. Nivel Nominal:
●​
●​
●​
●​
Los datos consisten en nombres, etiquetas o categorías.
No se pueden ordenar (de menor a mayor).
Ejemplos: Sí/No/Indeciso, respuestas codificadas en encuestas.
No se deben utilizar para cálculos, como la media, ya que los números asignados
a las categorías no tienen significado numérico real.
3. Nivel Ordinal:
●​ Los datos se pueden ordenar, pero las diferencias entre los valores no se pueden
determinar o no tienen sentido.
●​ Ejemplos: Calificaciones escolares (A, B, C, D, F), escalas de opinión (muy de
acuerdo, de acuerdo, etc.).
●​ No se recomienda utilizar para cálculos, aunque en algunas ocasiones se utilizan
cálculos (como la media) con datos ordinales, especialmente aquellos obtenidos de
escalas de calificación.
4. Nivel Intervalo:
●​ Los datos se pueden ordenar y las diferencias entre los valores son significativas.
●​ No tienen un punto de inicio natural (cero).
●​ Ejemplos: Temperaturas en grados Fahrenheit, años en el calendario.
5. Nivel Razón:
●​ Los datos se pueden ordenar, las diferencias son significativas y hay un punto de
inicio natural (cero).
●​ Las diferencias y las razones son significativas.
●​ Ejemplos: Altura, peso, tiempo.
En resumen, el nivel de medición de los datos es fundamental para seleccionar y aplicar
correctamente los métodos estadísticos adecuados.
1. Big Data:
●​ Definición: Conjuntos de datos tan grandes y complejos que su análisis supera las
capacidades de las herramientas de software tradicionales. Requiere el uso de
software que se ejecute en paralelo en múltiples computadoras.
●​ Ciencia de Datos: Aplicación de la estadística, la informática y la ingeniería de
software, junto con otras áreas relevantes (genética).
●​ Estadística en la Ciencia de Datos: Los científicos de datos modernos requieren
conocimientos sólidos en estadística, informática y otras áreas como psicología,
biología, medicina, etc.
2. Datos Faltantes:
●​ Definición: Valores que no se han registrado o están ausentes en un conjunto de
datos.
●​ Tipos:
○​ Faltantes completamente al azar (MCAR): La probabilidad de que falte un
valor es independiente de su valor o de otros valores en el conjunto de datos.
○​ Faltantes no al azar (MNAR): La probabilidad de que falte un valor está
relacionada con la razón por la que falta.
●​ Consecuencias:
○​ Ignorar datos MCAR puede no tener un impacto significativo.
○​ Ignorar datos MNAR puede introducir sesgos en los resultados.
●​ Métodos para tratar datos faltantes:
○​ Eliminar casos: Eliminar todos los sujetos que tengan valores faltantes.
Puede introducir sesgos si los datos son MNAR.
○​ Imputación: Sustituir los valores faltantes por valores estimados.
En resumen: El texto introduce el concepto de Big Data y su relación con la ciencia de
datos. Además, se discuten los problemas asociados con los datos faltantes, diferenciando
entre datos faltantes al azar y no al azar, y se presentan algunas estrategias para tratarlos.
Nota: La información sobre el impacto de la demencia en la probabilidad de contraer
coronavirus se proporciona como un ejemplo de aplicación de Big Data.
1.3 COLLECTING SAMPLE DATA
1. Placebo:
●​ Sustancia o procedimiento inofensivo y sin efecto terapéutico utilizado para efectos
psicológicos o como control en investigaciones.
●​ Ejemplo: Experimento de la vacuna Salk contra la polio. Se compararon dos grupos:
uno con la vacuna y otro con placebo.
2. Experimento vs. Estudio Observacional:
●​ Experimento: Se aplica un tratamiento y se observan sus efectos en los individuos.
●​ Estudio Observacional: Se observan y miden características específicas sin
intentar modificar a los individuos.
●​ Ejemplo: Relación entre consumo de helado y ahogamientos. El estudio
observacional puede llevar a conclusiones erróneas debido a variables ocultas
(temperatura). Un experimento sería más adecuado para determinar la relación
causal.
3. Diseño de Experimentos:
●​ Replicación: Repetición del experimento en múltiples individuos para obtener
resultados más confiables.
●​ Ceguera: Ocultar a los sujetos (y a veces a los investigadores) si están recibiendo el
tratamiento o el placebo. Esto ayuda a minimizar el efecto placebo.
●​ Aleatorización: Asignación aleatoria de los individuos a los grupos para garantizar
grupos comparables.
En resumen: El texto describe los conceptos de placebo, experimentos, estudios
observacionales y los principios clave del diseño experimental, como la replicación, la
ceguera y la aleatorización. Se enfatiza la importancia de utilizar la metodología adecuada
para obtener resultados válidos y confiables.
1. Muestreo Aleatorio Simple:
●​ Se selecciona una muestra de n sujetos de manera que todas las posibles muestras
del mismo tamaño tengan la misma probabilidad de ser elegidas.
2. Otros Métodos de Muestreo:
●​ Muestreo Sistemático: Se selecciona un punto de partida y luego se selecciona
cada k-ésimo elemento de la población.
●​ Muestreo por Conveniencia: Se utilizan datos que son fáciles de obtener.
●​ Muestreo Estratificado: Se divide la población en subgrupos (estratos) y se
selecciona una muestra de cada subgrupo.
●​ Muestreo por Conglomerados: Se divide la población en secciones
(conglomerados) y se selecciona una muestra de conglomerados completos.
3. Muestreo Multietapa:
●​ Se utiliza una combinación de diferentes métodos de muestreo en varias etapas.
En resumen: El texto describe diferentes métodos de muestreo utilizados para seleccionar
una muestra de una población. Se destaca la importancia del muestreo aleatorio simple y se
presentan otros métodos como el sistemático, el estratificado, el por conglomerados y el
multietapa.
Certainly, here's a summary of the provided text in Spanish:
1. Tipos de Estudios Observacionales:
●​ Transversal: Se recolectan datos en un único momento.
●​ Retrospectivo (o de casos y controles): Se recolectan datos de un período
pasado a través de registros, entrevistas, etc.
●​ Prospectivo (o longitudinal o de cohortes): Se recolectan datos en el futuro de
grupos que comparten características comunes.
2. Experimentos:
●​ Confusión: Cuando no se puede identificar con certeza el factor específico que
causó un efecto observado.
●​ Diseño Experimental Completamente Aleatorizado: Se asignan los sujetos a los
grupos de tratamiento de manera aleatoria.
●​ Diseño de Bloques Aleatorizados: Se forman bloques de sujetos con
características similares y se asignan aleatoriamente los tratamientos dentro de cada
bloque.
●​ Diseño de Pares Emparejados: Se comparan dos grupos de tratamiento utilizando
pares de sujetos emparejados (por ejemplo, mediciones antes y después de un
tratamiento, o gemelos).
En resumen: El texto describe diferentes tipos de estudios observacionales y métodos para
diseñar experimentos, incluyendo el control de factores de confusión a través de la
aleatorización y el uso de bloques aleatorizados.
1. Diseño Rigorosamente Controlado:
●​ Se asignan cuidadosamente los sujetos a diferentes grupos de tratamiento para
garantizar que los grupos sean similares en aspectos relevantes para el
experimento.
●​ Implementarlo puede ser extremadamente difícil.
2. Errores de Muestreo:
●​ Error de muestreo (o error de muestreo aleatorio): Discrepancia entre un
resultado de la muestra y el resultado real de la población debido a la variabilidad
aleatoria del muestreo.
●​ Error no muestral: Resultado de errores humanos, como errores de entrada de
datos, errores de cálculo, preguntas con sesgo, datos falsos proporcionados por los
encuestados, conclusiones sesgadas o aplicación incorrecta de métodos
estadísticos.
●​ Error de muestreo no aleatorio: Resultado del uso de un método de muestreo no
aleatorio, como el muestreo por conveniencia o el muestreo de respuesta voluntaria.
En resumen: El texto describe el concepto de diseño experimental rigurosamente
controlado y explica los diferentes tipos de errores que pueden afectar los resultados de un
estudio estadístico, incluyendo los errores de muestreo y los errores no muestrales.
Ensayos Clínicos
●​ Definición: Experimentos prospectivos diseñados para evaluar la seguridad y
eficacia de un nuevo medicamento, dispositivo, técnica quirúrgica, método de
asesoramiento, etc.​
●​ Etapas:​
○​ Fase 1: Evaluación de la seguridad y determinación de la dosis correcta.
Pequeño número de sujetos (20-100). Duración: varios meses. Costo:
alrededor de $4 millones. Tasa de éxito: 70%.
○​ Fase 2: Evaluación de la eficacia. Grupo más grande (100-300 sujetos).
Duración: varios meses a dos años. Costo: alrededor de $13 millones. Tasa
de éxito: 50%.
○​ Fase 3: Evaluación de la seguridad y eficacia en un grupo más grande y
diverso (varios cientos a 3000 sujetos). Duración: varios años. Costo:
alrededor de $20 millones. Tasa de éxito: 60%.
○​ Fase 4: Monitoreo de la eficacia y seguridad tras su uso generalizado.
●​ Proceso de aprobación:​
○​ Investigación previa en animales y/o células humanas.
○​ Revisión y aprobación por parte de la FDA (Food and Drug Administration).
○​ Revisión ética por parte de un Comité de Revisión Institucional.
●​ Duración y Costo:​
○​ Aproximadamente seis años.
○​ Costo de millones de dólares.
●​ Excepción:​
○​ Desarrollo de la vacuna contra COVID-19 de Pfizer y BioNTech, que se
desarrolló y obtuvo aprobación de emergencia en ocho meses.
En resumen: El texto describe las etapas de un ensayo clínico, destacando su importancia
en el desarrollo de nuevos medicamentos y la rigurosidad del proceso de aprobación.
También menciona la excepción notable del desarrollo acelerado de la vacuna contra
COVID-19.
1.4 ETHICS IN STATISTICS
(ejercicios didacticos)
Download