Uploaded by Anderson Arevalo

Bioest 2.1 Intervalo de confianza

advertisement
¿A qué distancia del verdadero valor del parámetro estará esta estimación? ¿Qué tan
cercana está la diana o blanco de la bala del tirador? La distancia entre la estimación y el
verdadero valor del parámetro se denomina error de estimación.
La distancia entre una estimación y el parámetro estimado recibe el
nombre de error de estimación.
Definición
En este capítulo, usted puede suponer que los tamaños muestrales son siempre grandes y, por tanto, que los estimadores insesgados que estudiará tienen distribuciones
muestrales que pueden ser aproximadas por una distribución normal (por el teorema
del límite central). Recuerde que, para cualquier estimador puntual con una distribución
normal, la regla empírica dice que aproximadamente 95% de todas las estimaciones
puntuales estarán a no más de dos (o más exactamente, 1.96) desviaciones estándar de
la media de esa distribución. Para estimadores insesgados, esto implica que la diferencia
entre el estimador puntual y el verdadero valor del parámetro será menor a 1.96 desviaciones estándar o 1.96 errores estándar (SE). Esta cantidad, llamada el 95% de margen
de error (o simplemente “margen de error”), da un límite superior práctico para el
error de estimación (véase la figura 8.4). Es posible que el error de estimación exceda
este margen de error, pero eso es muy poco probable.
Intervalo de confianza para
la media y la proporción
poblacional
95%
1.96SE
1.96SE
Verdadero valor
Margen
de error
Margen
de error
Una estimación particular
Estimador
muestral
Daniel Griffith
Bioestadística
Esquema del tema
I. Estimación puntual
II. Estimación de intervalo
III. Estimación de la diferencia entre dos medias poblacionales
IV. Estimación de la diferencia entre dos proporciones binomiales
V. Límites de confianza a una cola
VI. Determinación del tamaño muestral
ciones estándar o 1.96 errores estándar (SE). Esta cantidad, llamada el 95% de
I. Estimación
de error (o simplemente
“margen
de error”), da un límite superior práctico
Estimación
puntual de
un parámetro
puntual
error de estimación (véase la figura 8.4). Es posible que el error de estimación
margen de
error, (n
pero
esopodemos
es muy poco
probable.
• Usando tamañoseste
muestrales
grandes
> 30)
asumir
que los estimadores tienen
distribuciones muestrales que pueden ser aproximadas por una distribución normal.
URA 8.4
● estimador puntual con una distribución normal, la regla empírica dice que
• Para cualquier
bución muestral de
el 95% de todas las estimaciones puntuales estarán a exactamente 1.96 desviaciones
imador insesgado
estándar de la media de esa distribución.
95%
1.96SE
1.96SE
Verdadero valor
Margen
de error
Margen
de error
Una estimación particular
Estimador
muestral
I. Estimación
puntual
Estimación puntual de un parámetro
MI ENTRENADOR PERSONAL
¿Cómo estimo una media o proporción poblacional?
•
• Estimador puntual:
estadístico calculado usando
mediciones muestrales
Para estimar la media poblacional m para una población cuantitativa, el esti_
mador puntual x es insesgado con el error estándar estimado como
s__ †
SE " ___
!n
El 95% de margen de error cuando n # 30 se estima como
s__
$1.96 ___
!n
" #
• 95% de margen de error:
1.96 * error estándar del
estimador
•
Para estimar la proporción poblacional p para una población binomial, el estimador puntual p̂ " x/n es insesgado, con un error estándar estimado como
___
$n
p̂q̂
SE " ___
El 95% de margen de error se estima como
___
$n
p̂q̂
$1.96 ___
Suposiciones: np̂ % 5 y nq̂ % 5.
I. Estimación
puntual
Estimación de una media poblacional
Ejemplo 1: Un ecólogo está realizando un estudio del oso polar, especie que se
encuentra en el océano Ártico y sus alrededores. Una muestra aleatoria de n = 50 osos
polares produjo un peso promedio de 980 libras con una desviación estándar de 105
libras. Use esta información para estimar el peso promedio de todos los osos polares
del Ártico.
Solución: La variable aleatoria medida es el peso, una variable aleatoria cuantitativa
mejor descrita por su media µ. La estimación puntual de µ, el peso promedio de todos
los osos polares del Ártico, es xx = 980 libras. El margen de error se estima como:
s
1.96 SE = 1.96 * √n
= 1.96 * (105/√50) = 29.1
980 ± 29.1 libras
I. Estimación
puntual
Estimación de una proporción poblacional
Ejemplo 2: En una muestra aleatoria de n = 200 intentos de cazar una foca, se encontró
que el oso polar capta su presa en solo el 7.3%. Estime la verdadera proporción de
intentos de caza exitosa y encuentre el margen de error para la estimación.
Solución: El parámetro de interés es ahora p, la proporción de intentos de caza exitosa.
El mejor estimador de p es la proporción muestral pp̂ , que para esta muestra es
p = 0.073. Para hallar el margen de error, usted puede aproximar el valor de p con su
estimación p̂ :
1.96 SE = 1.96 *
p̂q̂
n
= 1.96 * √ (0.073)(0.927) = 0.036
200
7.3 ± 3.6%
https://www.youtube.com/watch?v=zNO0kxTClYo
II. Estimación
de intervalo
Coeficiente de confianza
Coeficiente de confianza (1 - α): la probabilidad de que un intervalo de confianza
contenga el parámetro estimado
Normalmente usamos intervalos de confianza de 95%.
• Parámetro que queremos estimar
• Intervalo de confianza
• Lance del lazo
vaca
lazo
saque de muestra
• Proporción de intervalos que “lazan la
vaca” en muestreo repetido coeficiente
de confianza
https://www.youtube.com/watch?v=DgW7sKUTJHo
II. Estimación
de intervalo
Intervalo de confianza (1 – α) * 100% para
una media poblacional µ
Ejemplos:
• El promedio de calificaciones de
estudiantes universitarios en la UTPL
• El promedio de resistencia de un nuevo
tipo de acero
• El número promedio de fallecimientos
por categoría de edad
• El promedio de demanda para café
orgánico
Cuando el tamaño muestral n sea grande, la media muestral x es el mejor
estimador puntual para la media poblacional µ.
II. Estimación
de intervalo
se dan en la tabla 8.2.
Intervalo de confianza de muestra grande (1 –α) * 100%
(Estimador puntual) ± zα/2 * (error estándar del estimador)
●
f(z)
Límite inferior
(LI) de confianza
Límite superior
(LS) de confianza
(1 – α)
α/2
α/2
–z
α/2
0
z
α/2
z
zα/2 = el valor z con un área α/2 en la cola derecha de una distribución normal estándar
II. Estimación
de intervalo
Un intervalo de confianza (1 –α) * 100% para una
media poblacional µ
(Estimador puntual) ± zα/2 * (error estándar del estimador)
x
± zα /2
σ
n
n = tamaño muestral
σ = desviación estándar de la población muestreada
Si σ es desconocida, puede ser aproximada por la desviación estándar
muestral s cuando n > 30 y el intervalo aproximado de confianza es:
x
± zα /2
s
n
II. Estimación
de intervalo
Estimación de una media poblacional
Ejemplo 3: Un científico interesado en vigilar contaminantes químicos en alimentos y la
acumulación de contaminantes en la dieta humana, seleccionó una muestra aleatoria
de n = 50 hombres. Se encontró que el promedio de ingesta diaria de productos lácteos
fue de xx = 756 g/día, con una desviación estándar de s = 35 g/día.
¿Cuál es el intervalo de confianza (IC) de 95% para la ingesta diaria media de productos
lácteos para hombres?
Solución: Como el tamaño muestral es grande, la distribución de la media muestral xx
está distribuida normalmente en forma aproximada, con media µ y error estándar
estimado por s/√n.
IC 95%:
x ± zα /2
s
= 756 ± 1.96 (35 / √50) = 756 ± 9.70
n
746.30 < µ < 765.70
inferior.
II. Estimación
de intervalo
●
Interpretación del intervalo de confianza
20
• ¿Qué significa decir que estamos “95%
ciertos” que el valor real de la media
poblacional µ está dentro de un
intervalo determinado?
Número de intervalo
16
12
• De los 20 intervalos, podría esperarse
que 95% de ellos, o sea 19 de cada 20,
funcionaran como se planea y
contienen µ dentro de sus límites
superior e inferior.
8
4
µ
II. Estimación
de intervalo
! #
Interpretación
del intervalo de confianza
_
s__
x % 1.96 ___
"n
35
___
756 % 1.96 ____
"50
756 al
% 9.70
que,
estimar
! #
Suponga
la media poblacional µ, se obtiene un intervalo dado por [1.10; 2.25] al
95% de confianza.
Esto nos
dice
Por tanto, el intervalo
de confi
anzaque:
de 95% para m es de 746.30 a 765.70 gramos por
a. Eldía.
intervalo es 100% que contenga la media buscada.
MI CONSEJO
b. El 95% de las observaciones de la población estén contenidas entre los valores de 1.10
n intervalo de confianza
Interpretación del intervalo de confianza
e 95% nos dice que, si
a
2.25.
¿Qué significa decir que estamos “95% ciertos” que el valor real de la media poblacional
uéramos a construir muchos
e estos intervalos (todos
estárealiza
dentro de un
determinado?100
Si fuéramos
a construir
20 de esos
intervalos,
c. Simse
elintervalo
experimento
veces,
la media
poblaciónal
verdadera µ estará
s cuales tendrían puntos
cada uno usando diferente información muestral, nuestros intervalos podrían verse como
xtremos ligeramente
contenida
en8.9.elDeintervalo
95 veces.
los de la figura
los 20 intervalos,
podría esperarse que 95% de ellos, o sea 19
ferentes), 95% de
de cada 20, funcionaran como se planea y contienen m dentro de sus límites superior e
los encierran la mediad.
La
probabilidad de que µ está contenida en el intervalo es el 95%.
inferior.
oblacional.
e. El 5% de los intervalos muestreados no contienen µ.
einte intervalos de
onfianza para la media
el ejemplo 8.6
●
20
Respuestas correctas: c d e
16
Número de intervalo
IGURA 8.9
12
Un nivel de confianza (por ejemplo, el k %) indica
que, de 100 muestras aleatorias, se espera que k
arrojen un valor estimado del parámetro, dentro
de dicho intervalo.
8
4
µ
II. Estimación
de intervalo
Intervalo de confianza (1 – α) * 100% para una
proporción poblacional p
Ejemplos:
• La proporción de ventas que se puede esperar
en un gran número de contactos de clientes
• La proporción de pacientes con dengue
• La proporción de votantes “probables” que
planean votar para Donald Trump en 2024!
Cada uno es un ejemplo del experimento binomial y el parámetro a estimarse es la
proporción binomial p.
Cuando el tamaño muestral es grande, la proporción muestral,
pˆ
p̂ = x = Número total de éxitos
n
Número total de intentos
Es el mejor estimador puntual para la proporción poblacional p.
Ejemplo 8.8 en Mendenhall 2015 p315
III. Diferencia
entre 2 medias
Estimación de la diferencia entre dos medias poblacionales
Ejemplos:
• Las calificaciones promedio del examen
de admisión para el colegio médico
(MCAT) de los EEUU para estudiantes cuya
especialización fuera bioquímica, y para
aquellos cuya especialización fuera
biología
• Las producciones promedio en una planta
de cerveza que usa materias primas
(cebada, lúpulo, etc) suministradas por
dos proveedores diferentes
• El promedio de diámetros de tallos de
Podocarpus crecidos a 2400 m y a 2800 m
III. Diferencia
entre 2 medias
Propiedades de la distribución muestral de ( x1–− xx2 ) la
diferencia entre dos medias muestrales
Población 1 Población 2 Muestra 1 Muestra 2
Media
µ1
µ2
Varianza
s12
s22
Tamaño
muestral
1
s12
n1
x2
s22
n2
Propiedades de la distribución muestral de ( x1 −– xx2 ) la
diferencia entre dos medias muestrales
III. Diferencia
entre 2 medias
• Estimación puntual de (µ1 - µ2)
§ Estimador puntual:
( x1 − x2 )
§ 95% margen de error: ± 1.96 * SE = ± 1.96
s12 s22
+
n1 n2
• Un intervalo de confianza de (1 - α) * 100% para (µ1 - µ2)
§
(
x1 − x2 ) ± z α/2
s12 s22
+
n1 n2
Esto es el caso si las poblaciones muestreadas están distribuidas normalmente o,
si no están distribuidas normalmente, cuando n1 y n2 son ambas > 30.
III. Diferencia
entre 2 medias
Distribución muestral de ( x1–− xx2 ), la diferencia entre
dos medias muestrales
Ejemplo 4: El científico del ejemplo 3 se preguntaba si había diferencia en el promedio de
ingesta diaria de productos lácteos entre hombres y mujeres. Tomó una muestra de 50
mujeres y 50 hombres y registró sus ingestas diarias de productos lácteos en g/día. Sus
resultados muestrales:
Hombres
Mujeres
x
756
762
s
35
30
n
50
50
1. Construya un intervalo de confianza de 95% para la diferencia en el promedio de ingestas
diarias de lácteos para hombres y mujeres.
Solución:
α / 2 = 0.05/2 = 0.025
IC 95%: ( x1 − x2
2
2
s
s
) ± 1.96 1 + 2
n1 n2
z α/2 = 1.96
2
2
35
30
= (756 – 762) ± 1.96
= -6 ± 12.78
+
50 50
-18.78 < (µ1 - µ2) < 6.78
III. Diferencia
entre 2 medias
Distribución muestral de ( x1–− xx2 ), la diferencia entre
dos medias muestrales
Ejemplo 4:
2.
¿Se puede concluir que hay una diferencia en el promedio de ingestas diarias para
hombres y mujeres?
Solución:
-18.78 < (µ1 - µ2) < 6.78
Si no hubiera diferencia en las dos medias poblacionales, µ1 y µ2 serían iguales a (µ1 - µ2) = 0.
Si observamos el intervalo de confianza construido, se verá que 0 es uno de los posibles
valores para (µ1 - µ2).
Por tanto, es probable que las medias sean iguales y no estaríamos dispuestos a concluir que
hay una diferencia en el promedio de ingestas diarias de productos lácteos para hombres y
mujeres.
Distribución muestral de ( x1–− xx2 ), la diferencia entre
dos medias muestrales
III. Diferencia
entre 2 medias
Ejemplo 5: Había una vez una pareja, ella se llamaba Jennifer y el John. Ambos se
graduaron de sus estudios y querían desarrollarse como investigadores en la
universidad. Cada uno preparó su hoja de vida y lo enviaron a diferentes universidades.
Pero esto no es una historia de amor...
En este estudio, un número de profesores/as de departamentos de ciencia de universidades estadounidenses calificaron
la misma hoja de vida de un estudiante, que fue asignado aleatoriamente un nombre masculino (p.e. John) o femenino
(p.e. Jennifer), para contratar a un gerente de laboratorio.
El objetivo del estudio fue de investigar si los/as profesores científicos/as muestran un prejuicio contra las estudiantes
mujeres que podría contribuir a la desigualdad de género que existe en la ciencia. Por lo tanto, se esperaba que las hojas
de vida con el nombre de Jennifer obtuvieran una puntuación menorde John.
Los resultados obtenidos en el estudio fueron los siguientes:
John
Jennifer
x
4.0
3.3
s
0.94
1.05
n
63
65
IC 95%: (4.0-3.3) ± 1.96 √((0.942/63) +(1.052/65))
= 0.7 ± 0.345
0.355 < (µ1 - µ2) < 1.045
Distribución muestral de ( x1–− xx2 ), la diferencia entre
dos medias muestrales
III. Diferencia
entre 2 medias
Ejemplo 5: Había una vez una pareja, ella se llamaba Jennifer y el John. Ambos se
graduaron de sus estudios y querían desarrollarse como investigadores en la
universidad. Cada uno preparó su hoja de vida y lo enviaron a diferentes universidades.
Pero esto no es una historia de amor...
En este estudio, un número de profesores/as de departamentos de ciencia de universidades estadounidenses calificaron
la misma hoja de vida de un estudiante, que fue asignado aleatoriamente un nombre masculino (p.e. John) o femenino
(p.e. Jennifer), para contratar a un gerente de laboratorio.
El objetivo del estudio fue de investigar si los/as profesores científicos/as muestran un prejuicio contra las estudiantes
mujeres que podría contribuir a la desigualdad de género que existe en la ciencia. Por lo tanto, se esperaba que las hojas
de vida con el nombre de Jennifer obtuvieran una puntuación menorde John.
Los resultados obtenidos en el estudio fueron los siguientes:
John
Jennifer
x
4.0
3.6
s
0.94
1.05
n
63
64
IC 95%: (4.0-3.6) ± 1.96 √((0.942/63) +(1.052/64))
= 0.4 ± 0.346
0.054 < (µ1 - µ2) < 0.746
IV. Diferencia
entre 2
proporciones
Estimación de la diferencia entre
dos proporciones binomiales (p1 - p2)
Ejemplos:
• La proporción de fármacos defectuosos
manufacturados en dos líneas de
producción
• La proporción de gringos y la proporción
de ecuatorianos que les gusta la música
del grupo TOOL
• Los porcentajes de germinación de
semillas no tratadas y semillas que han
sido encontradas en las fecas de venado
Propiedades de la distribución muestral de (( p̂1 − p̂2 )) la diferencia
entre dos proporciones muestrales
IV. Diferencia
entre 2
proporciones
Estimación puntual de (p1 - p2)
§ Estimador puntual: ( p̂1 − p̂)2 )
§ 95% margen de error: ± 1.96 SE = ± 1.96
p̂1q̂1 p̂2 q̂2
+
n1
n2
Un intervalo de confianza de (1 - α) * 100% para (p1 - p2)
§
(( p̂1 − p̂2 ) ± z α/2
p̂1q̂1 p̂2 q̂2
+
n1
n2
Suposición: n1 y n2 deben ser suficientemente grandes para que la
distribución muestral de ( p̂(1 − p̂2 )) puede ser aproximado por una
q̂1 n2pˆ
q̂2 son todas > 5.
p̂1 n1qˆ,
p̂2 y n2qˆ
distribución normal, es decir, si n1pˆ,
IV. Diferencia
entre 2
proporciones
Propiedades de la distribución muestral de (( p̂1 − p̂2 )) la diferencia
entre dos proporciones muestrales
Ejemplo 5: La propuesta de un bono para la construcción de una escuela será enviada a los votantes en
la siguiente elección municipal. Una parte importante del dinero derivado de esta emisión de bonos se
empleará en construir escuelas en una zona de rápido desarrollo de Loja (El Valle) y lo demás se usará
para renovar los edificios escolares del resto de Loja. Para evaluar la viabilidad de la propuesta, a una
muestra aleatoria de n1 = 50 residentes de El Valle y n2 = 100 de las otras partes de la ciudad, se les
preguntó si piensan votar por la propuesta.
El Valle
Resto de Loja
n
50
100
No. a favor
38
65
p̂
0.76
0.65
Estime la diferencia en las proporciones verdaderas a favor de la propuesta de bono con un 99% de
intervalo de confianza.
Solución:
IC 99%:
α /2 = 0.01/2 = 0.005
( p̂1 − p̂2 ) ± 2.58
z α/2 = 2.58
p̂1q̂1 p̂2 q̂2
+
= 0.11 ± 0.199
n1
n2
Mendenhall et al. 2015 p325
8.9 SELECCIÓN DEL TAMAÑO MUESTRAL
V. Confianza
de una cola
Límites de confianza de una cola
El valor z para un límite de confianza de una cola (1 ! a)100%, za, localiza un área
unaUn
sola
cola superior
de la distribución
normal, como
en la figura 8.13.
límite
(LS) de confianza
(1 -seα)muestra
* 100%:
(Estimador puntual) + zα * (Error estándar del estimador)
A 8.13
ra un límite
nza de una cola
M P L O
❍
●
f(z)
α
0
8.12
zα
Un límite inferior (LI) de confianza (1 - α) * 100%:
z
Una corporación planea emitir algunos documentos a corto plazo y espera que el i
(Estimador puntual) – zα * (Error estándar del estimador)
que tendrá para pagar no rebasará
el 11.5%. Para obtener alguna información ace
VI. Determinar
tamaño
muestral
Determinación del tamaño muestral
Diseñar un experimento
“Comprar” cierta cantidad
de información
• Al igual que cuando se compra cualquier producto, se debe
comprar tanta información estadística como sea posible por el
mínimo costo posible.
• ¿Por que? La cantidad total de información de la muestra
afectará la confiabilidad de las inferencias hechas por el
investigador. Es esta confiabilidad la que debemos especificar.
• La precisión de la estimación es medida por el margen de
error o el ancho del intervalo de confianza.
• Como estas dos mediciones son una función del tamaño
muestral, especificar la precisión determina el tamaño
muestral necesario.
VI. Determinar
tamaño
muestral
nombre de error de estimación.
Determinación del tamaño muestral
En este capítulo, usted puede suponer que los tamañ
des y, por tanto, que los estimadores insesgados que
muestrales que pueden ser aproximadas por una distr
límite central).
Recuerde que,
para cualquier estima
¿Cómo escoger el tamaño muestral n necesario paradel
comprar
una cantidad
determinada
normal, la regla empírica dice que aproximadamente
de información?
puntuales estarán a no más de dos (o más exactamente
la media de esa distribución. Para estimadores insesgad
1. Escoja B, el límite en el error de su estimación y unentre
coeficiente
confianza
(1 - α).
el estimadorde
puntual
y el verdadero
valor del pará
ciones estándar o 1.96 errores estándar (SE). Esta cant
2. Para un problema de una muestra, de esta ecuación
despeje
el tamaño“margen
muestral
n:
de error
(o simplemente
de error”),
da un
error de estimación (véase la figura 8.4). Es posible q
s
zα /2
este margen de error, pero eso es muy poco probable.
< B
n
FIGURA 8.4
●
Distribución muestral de
3. Si se desconoce s pero se conoce
el rango, se puede estimar s con s ≈ rango/4 dado
un estimador insesgado
que casi todos los datos (95%) se encuentran dentro de 2 desviaciones estándar de la
media (tanto arriba como por debajo).
95%
4. Para un problema de dos muestras,
haga n1= n2 = n y resuelva la ecuación del paso 2.
1.96SE
1.96SE
VI. Determinar
tamaño
muestral
Determinación del tamaño muestral
Ejemplo 6: Para probar la hipotesis de que la gente está alterando sus dietas cada vez más para
incluir menos carne roja y más frutas y verduras, una investigadora escoge registros de nutrición
en hospitales, para personas encuestadas hace 10 años. Ella compara el promedio de cantidad de
carne consumida por año contra las cantidades consumidas por un número igual de personas a
quienes ella entrevistará este año. Se sabe que la cantidad de carne consumida anualmente por
los individuos de su población objetivo varía de 0 a 104 libras y que este consumo se ha
mantenido durante los últimos 10 años.
¿Cuántas personas se deben seleccionar de cada grupo si se desea estimar la diferencia en el
promedio anual de consumo de carne per cápita, correcto a no más de 5 libras con 99% de
confianza?
Solución: B = 5
IC 99%: α/2 = .01/2 = .005
z α/2 = 2.58
n 1= n 2 = n
s1= s2 = Rango/4 = 104/4 = 26
z α/2
s12 s22 < B
+
n1 n2
n1= n2 = 360
Download