Uploaded by xnyarlathotep

Clase 2 Inferencia Estadísitca

advertisement
ECONOMETRÍA PARA LOS
NEGOCIOS
DOCTORADO EN ADMINISTRACIÓN
Notas de Clases Nº2
CARLOS MAQUIEIRA
1
AGENDA
• Inferencia Estadística
– Muestras y estimadores
• Contraste de hipótesis
– Muestreo estadístico
– Teorema del Límite Central
– Testeo de media (sigma conocido y desconocido)
– Testeo de proporción poblacional
2
Muestreo Estadístico
•
A las características numéricas de una población, como la media y la
desviación estándar, se les llama parámetros. En el ejemplo de EAI (cap.3),
que tiene 2,500 ejecutivos, se estima la media poblacional y la desviación
estándar poblacional de os sueldos anuales (media poblacional =$51,500;
desv estándar=$4,000). Además se sabe que 1500 gerentes han completado
el programa de capacitación. Esto implica p la proporción de la población
que ha completado el programa de capacitación es 0.60 (1500/2500). Por lo
tanto, contamos con tres parámetros de la población: media, desv estándar
y proporción de capacitación.
•
Supongamos que para el director del personal es muy costoso obtener la
información de sueldos y capacitación para los 2,500 ejecutivos. Su
problema es tener una muestra representativa de la población de tal forma
de poder contar con buenas estimaciones de los parámetros de la población.
•
Supongamos que decide tomar una muestra de 30 gerentes representativos
de la población.
3
Muestreo Estadístico
• Selección de una muestra:
– En general se prefiere hacer muestreos de poblaciones
finitas. Esto permite hacer inferencias estadísticas válidas
acerca de la población. Cada muestra de tamaño n tiene la
misma probabilidad de ser seleccionada. Esto se denomina
muestreo aleatorio simple.
• Definición Muestro Simple (Población Finita)
– Una muestra aleatoria simple de tamaño n de una población
de tamaño N es una muestra seleccionada de manera que
cada posible muestra de tamaño n tenga probabilidad de ser
seleccionada.
• La forma de hacerlo es elegir elementos para la muestra
de uno en uno.
4
Muestreo Estadístico
•
En el ejemplo se le asigna a cada uno de los gerentes un número que va del
1 a 2,500 en el orden en que aparen sus sus nombres en el archivo de
personal. A continuación se revisa la tabla de dígitos aleatorios de la figura
7.1.
– Para la selección se escogen los primeros cuatro números de la primera fila
hasta completar siete números de 4 dígitos (máx 2,500).
– 6327 1599 8617 7445 1102 1514 1807.
– Todos los números superiores a 2500 se eliminan porque sólo hay 2500
gerentes. Más arriba entonces quedan seleccionados 1599 1102 1514 1807.
Este procedimiento continua hasta encontrar un total de 30 gerentes. El muestro
realizado se llama muestreo sin reemplazo.
– El número de muestras aleatorias simples de tamaño n que se puede seleccionar
un población finito de tamaño N es N!/n!(N-n)!.
5
Muestreo Estadístico
• Muestreo de una población infinita
– Muestra aleatoria (población infinita)
• Una muestra aleatoria de tamaño n de una población
infinita es seleccionada de manera tal que se satisfagan
las condiciones siguientes:
– 1. Cada elemento elegido proviene de la misma población.
– 2. Cada elemento es seleccionado en forma independiente.
6
Muestreo Estadístico
• Distribuciones muestrales
– En el ejemplo de EIA la media muestral 𝑋 es el estimador
puntual de la media poblacional, y 𝑝 es la proporción de
gerentes capacitados. Supongamos que ambas estimaciones
puntuales son $51.814 y 0.63 respectivamente. Se escoge
una segunda muestra de 30 gerentes y ahora los
estimadores son $52.670 y 0.70. Finalmente, suponga que
se realizan 500 muestras aleatorias con 30 gerentes en cada
una de ellas.
– En la práctica sólo se selecciona una muestra aleatoria de la
población.
– Cuando el valor esperado de un estimador puntual es igual
al parámetro poblacional, se dice que es un estimador
puntual insesgado de la media poblacional.
7
Muestreo Estadístico
• Ejemplo: Supongamos que tenemos una variable
aleatoria que puede tomar sólo 3 valores: 2, 4 y 6.
¿Cómo se ve esta distribución? La media es 4 y la
varianza es 2,66.
• Ahora decidimos tomar dos muestras, por lo tanto los
posible valores son:
• 2,2; 2,4; 2,6; 4,2; 4,4; 4,6; 6,2; 6,4 y 6,6.
• Se solicita analizar la distribución de probabilidades de
la media al considerar los resultados de estas dos
muestras y además determine la desviación estándar.
Analice estos estimadores en relación a los parámetros
de la población.
8
Muestreo Estadístico
• Distribuciones muestrales
– Teorema del Límite Central: Cuando se seleccionan muestras
aleatorias simples de tamaño n de una población, la distribución de
" puede aproximarse mediante una
muestreo de la media muestral 𝒙
distribución normal a medida que el tamaño de la muestra se hace
grande.
– ¿Cuánto debe ser el tamaño muestral? En general 30. En todo caso si
la la población es muy sesgada o existen observaciones atípicas,
pueden necesitarse muestras de tamaño 50. Es más, en el caso de
distribuciones que tienden a ser simétricas podría bastar con n=10.
π‘₯Μ… − πœ‡(
𝑧= 𝜎
~ N(0,1)
𝑛
9
Contraste de Hipótesis
• Definición: Es el procedimiento basado en la evidencia muestral y
en la teoría de probabilidades que se emplea para determinar si la
hipótesis es un enunciado racional y no debe rechazarse o si es
irracional y debe ser rechazado.
• En un trabajo de investigación se plantean dos hipótesis mutuamente
excluyentes; la hipótesis nula y la hipótesis alternativa o de
investigación.
• El análisis estadístico de los datos servirá para determinar si se
puede rechazar o no rechazar la hipótesis nula (H0).
• Cuando se rechaza la H0 significa que el factor estudiado ha influido
significativamente en los resultados.
10
Contraste de Hipótesis
Valor de verdad real de H0
Decisión que se
toma en la
prueba de
hipótesis
Rechazo
Es verdad
𝛼
Error Tipo I
Es falso
1−𝛽
Decisión Correcta
No rechazo
1−𝛼
Decisión Correcta
𝛽
Error Tipo 2
Nos interesa tener el menor nivel de error Tipo I. En la medida
que disminuya la probabilidad de rechazar la hipótesis nula
considerando que es verdadera entonces nos permite confiar en
mayor medida en la decisión que se adopta.
11
Contraste de Hipótesis
Aspectos Importantes en el Contraste de Hipótesis Nula
v La hipótesis nula puede ser para valores mayores o menores
iguales a 0, pero la hipótesis alternativa debe ser el
complemento.
v Las hipótesis alternativas pueden llevar a pruebas de una o dos
colas: Ejemplo:
• Supongamos 𝐻! πœ‡= Valor
• Contraste de una cola puede ser 𝐻! πœ‡ > Valor o
𝐻! πœ‡<Valor
• Contraste de dos colas es 𝐻! πœ‡ ≠ 0
12
Media Poblacional con Desviación
Estándar Conocida de la Población
13
Contraste de Hipótesis
14
Contraste de Hipótesis
• Ejemplo: Una panadería vende galletas sólo en paquetes. El
peso nominal impreso en el paquete es 500 grs. En la práctica
el peso de cada paquete no es exacto, por cual es una variable
aleatoria. El dueño del negocio, basado en información
histórica, afirma que la media del peso del paquete es 500 grs.
con una desviación estándar de 5 grs. Se desea analizar la
afirmación del dueño. Para ello alguien externo toma una
muestra de 100 paquetes y obtiene una media muestral de
497,5 grs. Realizar una prueba de hipótesis con un nivel de
significancia de 5%.
• Se pone en cuestión si u=500 y se cree que podría tener un
peso menor a 500 H0
𝐻! : πœ‡ = 500 𝑑𝑒𝑒ñπ‘œ 𝑑𝑒𝑙 π‘›π‘’π‘”π‘œπ‘π‘–π‘œ , hipótesis nula
𝐻" : πœ‡ < 500, hipótesis alternativa
15
Contraste de Hipótesis
• Suponiendo un nivel de significancia del 5%,
el valor crítico es -1,64 (mirando hacia valores
inferiores a la media poblacional)
• z= -5,40 lo cual implica que cae en la región
de rechazo de la hipótesis nula.
𝐻! : πœ‡ = 500 𝑑𝑒𝑒ñπ‘œ 𝑑𝑒𝑙 π‘›π‘’π‘”π‘œπ‘π‘–π‘œ , hipótesis nula
𝐻" : πœ‡ < 500, hipótesis alternativa
16
Contraste de Hipótesis
• Ejemplo: Una empresa estudia introducir un nuevo sistema de
producción para mejorar su productividad media establecida
actualmente en 42 unidades por persona al día. Se estima que
el cambio no será rentable si no consigue elevar dicho número
por encima de 45 u. Se realizó una prueba de la nueva
tecnología con 35 personas, se obtuvo una producción media
de 46,5 u y no se observó ningún cambio apreciable en sigma
(3u por día). Considerando esta información, usted
recomendaría efectuar el cambio tecnológico, a un nivel de
significancia de 1%.
𝐻! : πœ‡ = 45, hipótesis nula
𝐻" : πœ‡ > 45, hipótesis alternativa
17
Contraste de Hipótesis
Ejemplo: Lloyd’s Department Store selecciona una muestra aleatoria simple de 100
clientes con objeto de conocer información acerca de la cantidad que gastan en cada visita a la
tienda. Si x representa la cantidad gastada en cada visita a la tienda, la media muestral π‘₯Μ… es una
estimación puntual de μ, la cantidad media gastada en cada visita a la tienda por la población
compuesta por los clientes de Lloyd’s Department Store. La tienda ha realizado estos estudios
semanales durante varios años. Con base en sus datos anteriores, supone que el valor conocido de
la desviación estándar poblacional es σ = $20. Los datos anteriores (históricos) indican
también que la población tiene una distribución normal.
En la semana más reciente, en su estudio de 100 clientes (n = 100), Lloyd’s obtuvo como media
muestral π‘₯Μ… = $82.
Determine: El margen de error para la estimación y desarrolle una estimación por intervalo para la
media poblacional. Suponga un probabilidad de rechazo de 5% con dos colas.
Respuesta: Al estandarizar la variable, tenemos un σ = $2 (20/raíz(100)), Normal(0,2). En la
distribución N(0,1) al 95% de nivel de confianza (0,95 es coeficiente de confianza) los valores
críticos son +- 1,96 . Entonces con 2 desv. Estándar los valores críticos son +-3,92. Por lo cual, el
intervalo de confianza es 78,08-85,92.
El margen de error es 𝑧!/#
$
,
%
en suma la media poblacional es
18
Media Poblacional con Desviación
Estándar Desconocida de la Población
19
Contraste de Hipótesis
Cuando se utiliza s para estimar σ , el margen de error y la estimación por intervalo de la media
poblacional se basan en una distribución de probabilidad conocida como distribución t . Esta
distribución es una familia de distribuciones de probabilidad similar , y cada una depende de un
parámetro conocido como grados de libertad. En la medida que aumente el grado de libertad la
distribución t. (ver forma de la distribución t)
20
Contraste de Hipótesis
21
Contraste de Hipótesis
22
Testeo de proporción poblacional
23
Resumen
de las pruebas de hipótesis para la proporción poblacional
24
Distribución de la media de proporción poblacional
25
Proporción poblacional
• Ejemplo: Se encuestó a 900 mujeres para
conocer su opinión acerca de los horarios
disponibles para practicar golf. En el estudio se
encontró que 396 estaban satisfechas con los
horarios disponibles. Se solicita que estime el
intervalo de confianza de 95%.
• R: 0,4076 - 0,4724 (entre 40,76% y 47,24%
están satisfechas con la disponibilidad de
horarios).
26
Proporción poblacional
• Determinar tamaño de la muestra para un nivel
de precisión definido:
P* es un valor planeado del promedio de p
27
Proporción poblacional
• Ejemplo: En el caso de las mujeres golfistas, determinar
cuál debiera ser el tamaño de la muestra si se desea que en
la estimación de la proporción poblacional el margen de
error sea de 0,025 a 95% de confianza. Tomemos el 0,44
anteriormente obtenido como proxy de p*.
1,96# 0,44 ∗ (1 − 0,44)
𝑛=
= 1514,5 ≈ 1515
0,025#
Si se considera un p*=0,5 entonces n=1536,6, es decir, 1537
28
Comparación de dos medias
poblacionales
29
30
Download