¿A qué distancia del verdadero valor del parámetro estará esta estimación? ¿Qué tan cercana está la diana o blanco de la bala del tirador? La distancia entre la estimación y el verdadero valor del parámetro se denomina error de estimación. La distancia entre una estimación y el parámetro estimado recibe el nombre de error de estimación. Definición En este capítulo, usted puede suponer que los tamaños muestrales son siempre grandes y, por tanto, que los estimadores insesgados que estudiará tienen distribuciones muestrales que pueden ser aproximadas por una distribución normal (por el teorema del límite central). Recuerde que, para cualquier estimador puntual con una distribución normal, la regla empírica dice que aproximadamente 95% de todas las estimaciones puntuales estarán a no más de dos (o más exactamente, 1.96) desviaciones estándar de la media de esa distribución. Para estimadores insesgados, esto implica que la diferencia entre el estimador puntual y el verdadero valor del parámetro será menor a 1.96 desviaciones estándar o 1.96 errores estándar (SE). Esta cantidad, llamada el 95% de margen de error (o simplemente “margen de error”), da un límite superior práctico para el error de estimación (véase la figura 8.4). Es posible que el error de estimación exceda este margen de error, pero eso es muy poco probable. Intervalo de confianza para la media y la proporción poblacional 95% 1.96SE 1.96SE Verdadero valor Margen de error Margen de error Una estimación particular Estimador muestral Daniel Griffith Bioestadística Esquema del tema I. Estimación puntual II. Estimación de intervalo III. Estimación de la diferencia entre dos medias poblacionales IV. Estimación de la diferencia entre dos proporciones binomiales V. Límites de confianza a una cola VI. Determinación del tamaño muestral ciones estándar o 1.96 errores estándar (SE). Esta cantidad, llamada el 95% de I. Estimación de error (o simplemente “margen de error”), da un límite superior práctico Estimación puntual de un parámetro puntual error de estimación (véase la figura 8.4). Es posible que el error de estimación margen de error, (n pero esopodemos es muy poco probable. • Usando tamañoseste muestrales grandes > 30) asumir que los estimadores tienen distribuciones muestrales que pueden ser aproximadas por una distribución normal. URA 8.4 ● estimador puntual con una distribución normal, la regla empírica dice que • Para cualquier bución muestral de el 95% de todas las estimaciones puntuales estarán a exactamente 1.96 desviaciones imador insesgado estándar de la media de esa distribución. 95% 1.96SE 1.96SE Verdadero valor Margen de error Margen de error Una estimación particular Estimador muestral I. Estimación puntual Estimación puntual de un parámetro MI ENTRENADOR PERSONAL ¿Cómo estimo una media o proporción poblacional? • • Estimador puntual: estadístico calculado usando mediciones muestrales Para estimar la media poblacional m para una población cuantitativa, el esti_ mador puntual x es insesgado con el error estándar estimado como s__ † SE " ___ !n El 95% de margen de error cuando n # 30 se estima como s__ $1.96 ___ !n " # • 95% de margen de error: 1.96 * error estándar del estimador • Para estimar la proporción poblacional p para una población binomial, el estimador puntual p̂ " x/n es insesgado, con un error estándar estimado como ___ $n p̂q̂ SE " ___ El 95% de margen de error se estima como ___ $n p̂q̂ $1.96 ___ Suposiciones: np̂ % 5 y nq̂ % 5. I. Estimación puntual Estimación de una media poblacional Ejemplo 1: Un ecólogo está realizando un estudio del oso polar, especie que se encuentra en el océano Ártico y sus alrededores. Una muestra aleatoria de n = 50 osos polares produjo un peso promedio de 980 libras con una desviación estándar de 105 libras. Use esta información para estimar el peso promedio de todos los osos polares del Ártico. Solución: La variable aleatoria medida es el peso, una variable aleatoria cuantitativa mejor descrita por su media µ. La estimación puntual de µ, el peso promedio de todos los osos polares del Ártico, es xx = 980 libras. El margen de error se estima como: s 1.96 SE = 1.96 * √n = 1.96 * (105/√50) = 29.1 980 ± 29.1 libras I. Estimación puntual Estimación de una proporción poblacional Ejemplo 2: En una muestra aleatoria de n = 200 intentos de cazar una foca, se encontró que el oso polar capta su presa en solo el 7.3%. Estime la verdadera proporción de intentos de caza exitosa y encuentre el margen de error para la estimación. Solución: El parámetro de interés es ahora p, la proporción de intentos de caza exitosa. El mejor estimador de p es la proporción muestral pp̂ , que para esta muestra es p = 0.073. Para hallar el margen de error, usted puede aproximar el valor de p con su estimación p̂ : 1.96 SE = 1.96 * p̂q̂ n = 1.96 * √ (0.073)(0.927) = 0.036 200 7.3 ± 3.6% https://www.youtube.com/watch?v=zNO0kxTClYo II. Estimación de intervalo Coeficiente de confianza Coeficiente de confianza (1 - α): la probabilidad de que un intervalo de confianza contenga el parámetro estimado Normalmente usamos intervalos de confianza de 95%. • Parámetro que queremos estimar • Intervalo de confianza • Lance del lazo vaca lazo saque de muestra • Proporción de intervalos que “lazan la vaca” en muestreo repetido coeficiente de confianza https://www.youtube.com/watch?v=DgW7sKUTJHo II. Estimación de intervalo Intervalo de confianza (1 – α) * 100% para una media poblacional µ Ejemplos: • El promedio de calificaciones de estudiantes universitarios en la UTPL • El promedio de resistencia de un nuevo tipo de acero • El número promedio de fallecimientos por categoría de edad • El promedio de demanda para café orgánico Cuando el tamaño muestral n sea grande, la media muestral x es el mejor estimador puntual para la media poblacional µ. II. Estimación de intervalo se dan en la tabla 8.2. Intervalo de confianza de muestra grande (1 –α) * 100% (Estimador puntual) ± zα/2 * (error estándar del estimador) ● f(z) Límite inferior (LI) de confianza Límite superior (LS) de confianza (1 – α) α/2 α/2 –z α/2 0 z α/2 z zα/2 = el valor z con un área α/2 en la cola derecha de una distribución normal estándar II. Estimación de intervalo Un intervalo de confianza (1 –α) * 100% para una media poblacional µ (Estimador puntual) ± zα/2 * (error estándar del estimador) x ± zα /2 σ n n = tamaño muestral σ = desviación estándar de la población muestreada Si σ es desconocida, puede ser aproximada por la desviación estándar muestral s cuando n > 30 y el intervalo aproximado de confianza es: x ± zα /2 s n II. Estimación de intervalo Estimación de una media poblacional Ejemplo 3: Un científico interesado en vigilar contaminantes químicos en alimentos y la acumulación de contaminantes en la dieta humana, seleccionó una muestra aleatoria de n = 50 hombres. Se encontró que el promedio de ingesta diaria de productos lácteos fue de xx = 756 g/día, con una desviación estándar de s = 35 g/día. ¿Cuál es el intervalo de confianza (IC) de 95% para la ingesta diaria media de productos lácteos para hombres? Solución: Como el tamaño muestral es grande, la distribución de la media muestral xx está distribuida normalmente en forma aproximada, con media µ y error estándar estimado por s/√n. IC 95%: x ± zα /2 s = 756 ± 1.96 (35 / √50) = 756 ± 9.70 n 746.30 < µ < 765.70 inferior. II. Estimación de intervalo ● Interpretación del intervalo de confianza 20 • ¿Qué significa decir que estamos “95% ciertos” que el valor real de la media poblacional µ está dentro de un intervalo determinado? Número de intervalo 16 12 • De los 20 intervalos, podría esperarse que 95% de ellos, o sea 19 de cada 20, funcionaran como se planea y contienen µ dentro de sus límites superior e inferior. 8 4 µ II. Estimación de intervalo ! # Interpretación del intervalo de confianza _ s__ x % 1.96 ___ "n 35 ___ 756 % 1.96 ____ "50 756 al % 9.70 que, estimar ! # Suponga la media poblacional µ, se obtiene un intervalo dado por [1.10; 2.25] al 95% de confianza. Esto nos dice Por tanto, el intervalo de confi anzaque: de 95% para m es de 746.30 a 765.70 gramos por a. Eldía. intervalo es 100% que contenga la media buscada. MI CONSEJO b. El 95% de las observaciones de la población estén contenidas entre los valores de 1.10 n intervalo de confianza Interpretación del intervalo de confianza e 95% nos dice que, si a 2.25. ¿Qué significa decir que estamos “95% ciertos” que el valor real de la media poblacional uéramos a construir muchos e estos intervalos (todos estárealiza dentro de un determinado?100 Si fuéramos a construir 20 de esos intervalos, c. Simse elintervalo experimento veces, la media poblaciónal verdadera µ estará s cuales tendrían puntos cada uno usando diferente información muestral, nuestros intervalos podrían verse como xtremos ligeramente contenida en8.9.elDeintervalo 95 veces. los de la figura los 20 intervalos, podría esperarse que 95% de ellos, o sea 19 ferentes), 95% de de cada 20, funcionaran como se planea y contienen m dentro de sus límites superior e los encierran la mediad. La probabilidad de que µ está contenida en el intervalo es el 95%. inferior. oblacional. e. El 5% de los intervalos muestreados no contienen µ. einte intervalos de onfianza para la media el ejemplo 8.6 ● 20 Respuestas correctas: c d e 16 Número de intervalo IGURA 8.9 12 Un nivel de confianza (por ejemplo, el k %) indica que, de 100 muestras aleatorias, se espera que k arrojen un valor estimado del parámetro, dentro de dicho intervalo. 8 4 µ II. Estimación de intervalo Intervalo de confianza (1 – α) * 100% para una proporción poblacional p Ejemplos: • La proporción de ventas que se puede esperar en un gran número de contactos de clientes • La proporción de pacientes con dengue • La proporción de votantes “probables” que planean votar para Donald Trump en 2024! Cada uno es un ejemplo del experimento binomial y el parámetro a estimarse es la proporción binomial p. Cuando el tamaño muestral es grande, la proporción muestral, pˆ p̂ = x = Número total de éxitos n Número total de intentos Es el mejor estimador puntual para la proporción poblacional p. Ejemplo 8.8 en Mendenhall 2015 p315 III. Diferencia entre 2 medias Estimación de la diferencia entre dos medias poblacionales Ejemplos: • Las calificaciones promedio del examen de admisión para el colegio médico (MCAT) de los EEUU para estudiantes cuya especialización fuera bioquímica, y para aquellos cuya especialización fuera biología • Las producciones promedio en una planta de cerveza que usa materias primas (cebada, lúpulo, etc) suministradas por dos proveedores diferentes • El promedio de diámetros de tallos de Podocarpus crecidos a 2400 m y a 2800 m III. Diferencia entre 2 medias Propiedades de la distribución muestral de ( x1–− xx2 ) la diferencia entre dos medias muestrales Población 1 Población 2 Muestra 1 Muestra 2 Media µ1 µ2 Varianza s12 s22 Tamaño muestral 1 s12 n1 x2 s22 n2 Propiedades de la distribución muestral de ( x1 −– xx2 ) la diferencia entre dos medias muestrales III. Diferencia entre 2 medias • Estimación puntual de (µ1 - µ2) § Estimador puntual: ( x1 − x2 ) § 95% margen de error: ± 1.96 * SE = ± 1.96 s12 s22 + n1 n2 • Un intervalo de confianza de (1 - α) * 100% para (µ1 - µ2) § ( x1 − x2 ) ± z α/2 s12 s22 + n1 n2 Esto es el caso si las poblaciones muestreadas están distribuidas normalmente o, si no están distribuidas normalmente, cuando n1 y n2 son ambas > 30. III. Diferencia entre 2 medias Distribución muestral de ( x1–− xx2 ), la diferencia entre dos medias muestrales Ejemplo 4: El científico del ejemplo 3 se preguntaba si había diferencia en el promedio de ingesta diaria de productos lácteos entre hombres y mujeres. Tomó una muestra de 50 mujeres y 50 hombres y registró sus ingestas diarias de productos lácteos en g/día. Sus resultados muestrales: Hombres Mujeres x 756 762 s 35 30 n 50 50 1. Construya un intervalo de confianza de 95% para la diferencia en el promedio de ingestas diarias de lácteos para hombres y mujeres. Solución: α / 2 = 0.05/2 = 0.025 IC 95%: ( x1 − x2 2 2 s s ) ± 1.96 1 + 2 n1 n2 z α/2 = 1.96 2 2 35 30 = (756 – 762) ± 1.96 = -6 ± 12.78 + 50 50 -18.78 < (µ1 - µ2) < 6.78 III. Diferencia entre 2 medias Distribución muestral de ( x1–− xx2 ), la diferencia entre dos medias muestrales Ejemplo 4: 2. ¿Se puede concluir que hay una diferencia en el promedio de ingestas diarias para hombres y mujeres? Solución: -18.78 < (µ1 - µ2) < 6.78 Si no hubiera diferencia en las dos medias poblacionales, µ1 y µ2 serían iguales a (µ1 - µ2) = 0. Si observamos el intervalo de confianza construido, se verá que 0 es uno de los posibles valores para (µ1 - µ2). Por tanto, es probable que las medias sean iguales y no estaríamos dispuestos a concluir que hay una diferencia en el promedio de ingestas diarias de productos lácteos para hombres y mujeres. Distribución muestral de ( x1–− xx2 ), la diferencia entre dos medias muestrales III. Diferencia entre 2 medias Ejemplo 5: Había una vez una pareja, ella se llamaba Jennifer y el John. Ambos se graduaron de sus estudios y querían desarrollarse como investigadores en la universidad. Cada uno preparó su hoja de vida y lo enviaron a diferentes universidades. Pero esto no es una historia de amor... En este estudio, un número de profesores/as de departamentos de ciencia de universidades estadounidenses calificaron la misma hoja de vida de un estudiante, que fue asignado aleatoriamente un nombre masculino (p.e. John) o femenino (p.e. Jennifer), para contratar a un gerente de laboratorio. El objetivo del estudio fue de investigar si los/as profesores científicos/as muestran un prejuicio contra las estudiantes mujeres que podría contribuir a la desigualdad de género que existe en la ciencia. Por lo tanto, se esperaba que las hojas de vida con el nombre de Jennifer obtuvieran una puntuación menorde John. Los resultados obtenidos en el estudio fueron los siguientes: John Jennifer x 4.0 3.3 s 0.94 1.05 n 63 65 IC 95%: (4.0-3.3) ± 1.96 √((0.942/63) +(1.052/65)) = 0.7 ± 0.345 0.355 < (µ1 - µ2) < 1.045 Distribución muestral de ( x1–− xx2 ), la diferencia entre dos medias muestrales III. Diferencia entre 2 medias Ejemplo 5: Había una vez una pareja, ella se llamaba Jennifer y el John. Ambos se graduaron de sus estudios y querían desarrollarse como investigadores en la universidad. Cada uno preparó su hoja de vida y lo enviaron a diferentes universidades. Pero esto no es una historia de amor... En este estudio, un número de profesores/as de departamentos de ciencia de universidades estadounidenses calificaron la misma hoja de vida de un estudiante, que fue asignado aleatoriamente un nombre masculino (p.e. John) o femenino (p.e. Jennifer), para contratar a un gerente de laboratorio. El objetivo del estudio fue de investigar si los/as profesores científicos/as muestran un prejuicio contra las estudiantes mujeres que podría contribuir a la desigualdad de género que existe en la ciencia. Por lo tanto, se esperaba que las hojas de vida con el nombre de Jennifer obtuvieran una puntuación menorde John. Los resultados obtenidos en el estudio fueron los siguientes: John Jennifer x 4.0 3.6 s 0.94 1.05 n 63 64 IC 95%: (4.0-3.6) ± 1.96 √((0.942/63) +(1.052/64)) = 0.4 ± 0.346 0.054 < (µ1 - µ2) < 0.746 IV. Diferencia entre 2 proporciones Estimación de la diferencia entre dos proporciones binomiales (p1 - p2) Ejemplos: • La proporción de fármacos defectuosos manufacturados en dos líneas de producción • La proporción de gringos y la proporción de ecuatorianos que les gusta la música del grupo TOOL • Los porcentajes de germinación de semillas no tratadas y semillas que han sido encontradas en las fecas de venado Propiedades de la distribución muestral de (( p̂1 − p̂2 )) la diferencia entre dos proporciones muestrales IV. Diferencia entre 2 proporciones Estimación puntual de (p1 - p2) § Estimador puntual: ( p̂1 − p̂)2 ) § 95% margen de error: ± 1.96 SE = ± 1.96 p̂1q̂1 p̂2 q̂2 + n1 n2 Un intervalo de confianza de (1 - α) * 100% para (p1 - p2) § (( p̂1 − p̂2 ) ± z α/2 p̂1q̂1 p̂2 q̂2 + n1 n2 Suposición: n1 y n2 deben ser suficientemente grandes para que la distribución muestral de ( p̂(1 − p̂2 )) puede ser aproximado por una q̂1 n2pˆ q̂2 son todas > 5. p̂1 n1qˆ, p̂2 y n2qˆ distribución normal, es decir, si n1pˆ, IV. Diferencia entre 2 proporciones Propiedades de la distribución muestral de (( p̂1 − p̂2 )) la diferencia entre dos proporciones muestrales Ejemplo 5: La propuesta de un bono para la construcción de una escuela será enviada a los votantes en la siguiente elección municipal. Una parte importante del dinero derivado de esta emisión de bonos se empleará en construir escuelas en una zona de rápido desarrollo de Loja (El Valle) y lo demás se usará para renovar los edificios escolares del resto de Loja. Para evaluar la viabilidad de la propuesta, a una muestra aleatoria de n1 = 50 residentes de El Valle y n2 = 100 de las otras partes de la ciudad, se les preguntó si piensan votar por la propuesta. El Valle Resto de Loja n 50 100 No. a favor 38 65 p̂ 0.76 0.65 Estime la diferencia en las proporciones verdaderas a favor de la propuesta de bono con un 99% de intervalo de confianza. Solución: IC 99%: α /2 = 0.01/2 = 0.005 ( p̂1 − p̂2 ) ± 2.58 z α/2 = 2.58 p̂1q̂1 p̂2 q̂2 + = 0.11 ± 0.199 n1 n2 Mendenhall et al. 2015 p325 8.9 SELECCIÓN DEL TAMAÑO MUESTRAL V. Confianza de una cola Límites de confianza de una cola El valor z para un límite de confianza de una cola (1 ! a)100%, za, localiza un área unaUn sola cola superior de la distribución normal, como en la figura 8.13. límite (LS) de confianza (1 -seα)muestra * 100%: (Estimador puntual) + zα * (Error estándar del estimador) A 8.13 ra un límite nza de una cola M P L O ❍ ● f(z) α 0 8.12 zα Un límite inferior (LI) de confianza (1 - α) * 100%: z Una corporación planea emitir algunos documentos a corto plazo y espera que el i (Estimador puntual) – zα * (Error estándar del estimador) que tendrá para pagar no rebasará el 11.5%. Para obtener alguna información ace VI. Determinar tamaño muestral Determinación del tamaño muestral Diseñar un experimento “Comprar” cierta cantidad de información • Al igual que cuando se compra cualquier producto, se debe comprar tanta información estadística como sea posible por el mínimo costo posible. • ¿Por que? La cantidad total de información de la muestra afectará la confiabilidad de las inferencias hechas por el investigador. Es esta confiabilidad la que debemos especificar. • La precisión de la estimación es medida por el margen de error o el ancho del intervalo de confianza. • Como estas dos mediciones son una función del tamaño muestral, especificar la precisión determina el tamaño muestral necesario. VI. Determinar tamaño muestral nombre de error de estimación. Determinación del tamaño muestral En este capítulo, usted puede suponer que los tamañ des y, por tanto, que los estimadores insesgados que muestrales que pueden ser aproximadas por una distr límite central). Recuerde que, para cualquier estima ¿Cómo escoger el tamaño muestral n necesario paradel comprar una cantidad determinada normal, la regla empírica dice que aproximadamente de información? puntuales estarán a no más de dos (o más exactamente la media de esa distribución. Para estimadores insesgad 1. Escoja B, el límite en el error de su estimación y unentre coeficiente confianza (1 - α). el estimadorde puntual y el verdadero valor del pará ciones estándar o 1.96 errores estándar (SE). Esta cant 2. Para un problema de una muestra, de esta ecuación despeje el tamaño“margen muestral n: de error (o simplemente de error”), da un error de estimación (véase la figura 8.4). Es posible q s zα /2 este margen de error, pero eso es muy poco probable. < B n FIGURA 8.4 ● Distribución muestral de 3. Si se desconoce s pero se conoce el rango, se puede estimar s con s ≈ rango/4 dado un estimador insesgado que casi todos los datos (95%) se encuentran dentro de 2 desviaciones estándar de la media (tanto arriba como por debajo). 95% 4. Para un problema de dos muestras, haga n1= n2 = n y resuelva la ecuación del paso 2. 1.96SE 1.96SE VI. Determinar tamaño muestral Determinación del tamaño muestral Ejemplo 6: Para probar la hipotesis de que la gente está alterando sus dietas cada vez más para incluir menos carne roja y más frutas y verduras, una investigadora escoge registros de nutrición en hospitales, para personas encuestadas hace 10 años. Ella compara el promedio de cantidad de carne consumida por año contra las cantidades consumidas por un número igual de personas a quienes ella entrevistará este año. Se sabe que la cantidad de carne consumida anualmente por los individuos de su población objetivo varía de 0 a 104 libras y que este consumo se ha mantenido durante los últimos 10 años. ¿Cuántas personas se deben seleccionar de cada grupo si se desea estimar la diferencia en el promedio anual de consumo de carne per cápita, correcto a no más de 5 libras con 99% de confianza? Solución: B = 5 IC 99%: α/2 = .01/2 = .005 z α/2 = 2.58 n 1= n 2 = n s1= s2 = Rango/4 = 104/4 = 26 z α/2 s12 s22 < B + n1 n2 n1= n2 = 360