Uploaded by Daniel Galarza

intervalosdeconfianza1 (1)

advertisement
INFERENCIA ESTADÍSTICA
La Inferencia Estadística comprende los
métodos que son usados para obtener
conclusiones acerca de la población en base a
una muestra tomada de ella.
Incluye los métodos de estimación de
parámetros y las pruebas de hipótesis.
P
M
obtención de
la muestra
conclusiones
Problema de estimación:
¿Por qué una encuesta de 1500 personas permite
predecir bastante bien el resultado de una elección
con 10 millones de votantes? ¿Cómo se consigue?
¿Cómo se mide la precisión del resultado?
Problema de test de hipótesis:
Las normas de calidad exigen que, en un lote de
5000 bombillas, a lo sumo el 3% pueden durar
menos de 1000 horas. En un estudio de control de
calidad de una fabrica de bombillas sería muy
costoso examinar cada una. Se decide usar una
muestra de 500 bombillas. Si obtenemos el 3,2% de
bombillas defectuosas, ¿deberíamos declarar el lote
completo defectuoso?
Problema de estimación
Se busca precisar una característica
totalmente desconocida de la población a
partir de los datos obtenidos sobre una
muestra.
Estimar el porcentaje de la población (10 millones)
que votó a JP a partir de una muestra de 1500
votantes.
Estimar la duración promedio de las bombillas del lote
de 5000, a partir de una muestra de 500.
Problema de test de hipótesis
Se busca comprobar alguna información
sobre la población a partir de los datos
obtenidos de una muestra.
JP obtiene más del 65% de los votos.
Menos del 3% de las bombillas del lote de 5000
duran menos de 1000 horas.
Las bombillas duran más de 1000 horas en promedio.
Problema de estimación
Sea  una característica, un parámetro
poblacional cuyo valor se desea conocer a
partir de una muestra.
Sea ˆ un estadístico (función de la muestra)
que utilizamos para estimar el valor de .

El estadístico: ˆ  T ( X

1
, X 2 ,..., X n )
es una función que depende de la muestra y
lo llamaremos estimador. El valor concreto
de ˆ es la estimación.
Estimación de parámetros
Estimación
puntual
por intervalos
Estimación Puntual: Se estudian los
diversos
métodos
de
encontrar
estimadores y las propiedades óptimas
que deben tener éstos.
Estimación por Intervalos de Confianza:
se estima un parámetro usando un
intervalo centrado en un estimado del
parámetro.
Estimación puntual
Provee un solo valor, un valor concreto para
la estimación.
Un estimador puntual es simplemente un
estadístico (media aritmética, varianza, etc.)
que se emplea para estimar parámetros
(media poblacional, varianza poblacional,
etc.).
Por ejemplo, cuando obtenemos una media
aritmética a partir de una muestra, tal valor
puede ser empleado como una estimación
para el valor de la media poblacional.
Parámetro Estimación Estadístico

E x   
~

ˆ
~x
x
X~
X
p
x
pˆ 
n
ˆP  X
n
2
s2
S2
Métodos de estimación puntual
Hemos visto que un estimador de la media poblacional
es la media muestral y de la varianza poblacional es la
varianza muestral.
¿cómo determinar un estimador cuando no se trata de
la media o la varianza?
Por ejemplo, supongamos una población con función
densidad:

f ( x) 
1
(1  x)
x  0,   0
Método de los momentos
Método de máxima verosimilitud
Método de mínimos cuadrados
¿Cómo estimar
el parámetro θ?
Propiedades de los estimadores
~
que  estime

No se espera
exactamente a
sino que en realidad se espera que no esté
muy alejado.
Entre 2
o más estimadores del mismo
parámetro ¿cuál es el mejor estimador?
1. Ausencia de sesgo
(Insesgadez)
2. Consistencia
3. Eficiencia
Estimador insesgado
Diremos que  es un estimador insesgado de  si:

E ˆ  E T  X 1 ,..., X n   
La media muestral es un estimador insesgado de la
media poblacional.
La varianza muestral (dividida por n) no es un estimador
insesgado de la varianza poblacional, es sesgado.
b ( )  E ˆ    se llama sesgo de ˆ
Sea una población N(, ) y sean los estimadores de
varianza: varianza muestral y la varianza muestral
(partida por n).
1
2
ˆ1  s 
n
n
 (x
j
 x)
2
j 1
1
2
ˆ
2  S 
n 1
n
 (x
j
 x)
2
j 1
Si la población es normal, entonces el estimador:
(n  1) S 2
2
se distribuye como  n21
E[ˆ2 ]  E[ s ] 
2
*
2
n 1
E[  n21 ]   2
E (S )  
2
n 1 ˆ
n 1 2
2 
ˆ
E[1 ] 
E[ 2 ] 
  
n
n
n


2
sesgo
2
Estimación por intervalo
Este método determina dos valores (límites de
confianza) entre los que se acepta que puede estar el
valor del estimador.
ˆL    ˆU
ˆ L   
ˆ U  1
P
̂
Muestra
0  1
Tenemos entonces una probabilidad de 1-α de
seleccionar una variable aleatoria que produzca un
intervalo que contenga al parámetro.
El intervalo que se calcula a partir de la
muestra seleccionada; ˆ    ˆ
L
U
se llama intervalo de confianza de (1–) 100%
Estimación por intervalo
1

nivel o grado de confianza
probabilidad de error (riesgo)
Tenemos entonces una probabilidad α de seleccionar
una variable aleatoria que produzca un intervalo que no
contenga al parámetro.
En general el tamaño del intervalo disminuye con el
tamaño muestral y aumenta con 1-α.
En todo intervalo de confianza hay una noticia buena y
otra mala:
La buena: hemos usado una técnica que en % alto de
casos acierta.
La mala: no sabemos si ha acertado en nuestro caso.
Intervalo de confianza para la Media
Poblacional (varianza conocida).
De una población normal con
media desconocida  y varianza
conocida 2 se extrae una
muestra de tamaño n, entonces
de la distribución de la media
muestral se obtiene que:
Z
X 

n
se distribuye como
una normal estándar.
Luego
P(  z a / 2  Z  z a / 2 )  1  
Donde Z/2 es el valor de la normal estándar tal que el
área a la derecha de dicho valor es /2.
Intervalo de confianza para la Media
Poblacional (varianza conocida).
Sustituyendo la fórmula de Z, se obtiene:
P( X - z/2 / n <  < X + z/2 / n ) = 1 - 
Los dos extremos del intervalo son aleatorios.
De lo anterior se puede concluir que un Intervalo
de Confianza del 100 (1-) % para la media
poblacional , es de la forma:
( x – z/2 / n , x + z/2 / n )
Inferencias acerca de la Media
Poblacional (varianza conocida).
La siguiente tabla muestra los Z/2 más usados.
Nivel de
Confianza
90
95
99
Z/2
1.645
1.96
2.58
Los parámetros poblacionales son fijos, no
aleatorios.
Los estadísticos o los estimadores son
variables aleatorias (su valor depende de
la muestra seleccionada: los estadísticos
calculados para distintas muestras darán,
en general, resultados distintos).
Intervalo de confianza para la Media
Poblacional (varianza desconocida).
En la práctica si la media poblacional es
desconocida entonces, es bien probable que la
varianza también lo sea puesto que en el
cálculo de 2
interviene . Si ésta es la
situación, y si el tamaño de muestra es grande
(n > 30), entonces 2 es estimada por la
varianza muestral s2 y se puede usar la
siguiente fórmula para el intervalo de confianza
de la media poblacional:
( x  z / 2 s /
n , x  z / 2 s / n )
Intervalo de confianza para la Media
Poblacional (varianza desconocida).
Supongamos que la población es normal con
media y varianza desconocida y que se desea
hacer inferencias acerca de , basada en una
muestra pequeña (n < 30) tomada de la
población. En este caso la distribución de la
media muestral X ya no es normal, sino que
sigue la distribución t de Student.
Si de una población Normal con media  y
desviación estándar  desconocida se extrae
una muestra de tamaño n, entonces el
estadístico:
X   se distribuye como una t de
t 
S
Student con n-1 grados de
libertad.
n
Un intervalo de confianza del 100 (1-) % para 
es de la forma:
( x  t / 2 s / n , x  t / 2 s / n )
donde s es la desviación estándar muestral.
t(n-1,/2) es un valor de t con n–1 grados de
libertad y tal que el área a la derecha de dicho
valor es /2.
Download