ECONOMETRÍA PARA LOS NEGOCIOS DOCTORADO EN ADMINISTRACIÓN Notas de Clases Nº2 CARLOS MAQUIEIRA 1 AGENDA • Inferencia Estadística – Muestras y estimadores • Contraste de hipótesis – Muestreo estadístico – Teorema del Límite Central – Testeo de media (sigma conocido y desconocido) – Testeo de proporción poblacional 2 Muestreo Estadístico • A las características numéricas de una población, como la media y la desviación estándar, se les llama parámetros. En el ejemplo de EAI (cap.3), que tiene 2,500 ejecutivos, se estima la media poblacional y la desviación estándar poblacional de os sueldos anuales (media poblacional =$51,500; desv estándar=$4,000). Además se sabe que 1500 gerentes han completado el programa de capacitación. Esto implica p la proporción de la población que ha completado el programa de capacitación es 0.60 (1500/2500). Por lo tanto, contamos con tres parámetros de la población: media, desv estándar y proporción de capacitación. • Supongamos que para el director del personal es muy costoso obtener la información de sueldos y capacitación para los 2,500 ejecutivos. Su problema es tener una muestra representativa de la población de tal forma de poder contar con buenas estimaciones de los parámetros de la población. • Supongamos que decide tomar una muestra de 30 gerentes representativos de la población. 3 Muestreo Estadístico • Selección de una muestra: – En general se prefiere hacer muestreos de poblaciones finitas. Esto permite hacer inferencias estadísticas válidas acerca de la población. Cada muestra de tamaño n tiene la misma probabilidad de ser seleccionada. Esto se denomina muestreo aleatorio simple. • Definición Muestro Simple (Población Finita) – Una muestra aleatoria simple de tamaño n de una población de tamaño N es una muestra seleccionada de manera que cada posible muestra de tamaño n tenga probabilidad de ser seleccionada. • La forma de hacerlo es elegir elementos para la muestra de uno en uno. 4 Muestreo Estadístico • En el ejemplo se le asigna a cada uno de los gerentes un número que va del 1 a 2,500 en el orden en que aparen sus sus nombres en el archivo de personal. A continuación se revisa la tabla de dígitos aleatorios de la figura 7.1. – Para la selección se escogen los primeros cuatro números de la primera fila hasta completar siete números de 4 dígitos (máx 2,500). – 6327 1599 8617 7445 1102 1514 1807. – Todos los números superiores a 2500 se eliminan porque sólo hay 2500 gerentes. Más arriba entonces quedan seleccionados 1599 1102 1514 1807. Este procedimiento continua hasta encontrar un total de 30 gerentes. El muestro realizado se llama muestreo sin reemplazo. – El número de muestras aleatorias simples de tamaño n que se puede seleccionar un población finito de tamaño N es N!/n!(N-n)!. 5 Muestreo Estadístico • Muestreo de una población infinita – Muestra aleatoria (población infinita) • Una muestra aleatoria de tamaño n de una población infinita es seleccionada de manera tal que se satisfagan las condiciones siguientes: – 1. Cada elemento elegido proviene de la misma población. – 2. Cada elemento es seleccionado en forma independiente. 6 Muestreo Estadístico • Distribuciones muestrales – En el ejemplo de EIA la media muestral π es el estimador puntual de la media poblacional, y π es la proporción de gerentes capacitados. Supongamos que ambas estimaciones puntuales son $51.814 y 0.63 respectivamente. Se escoge una segunda muestra de 30 gerentes y ahora los estimadores son $52.670 y 0.70. Finalmente, suponga que se realizan 500 muestras aleatorias con 30 gerentes en cada una de ellas. – En la práctica sólo se selecciona una muestra aleatoria de la población. – Cuando el valor esperado de un estimador puntual es igual al parámetro poblacional, se dice que es un estimador puntual insesgado de la media poblacional. 7 Muestreo Estadístico • Ejemplo: Supongamos que tenemos una variable aleatoria que puede tomar sólo 3 valores: 2, 4 y 6. ¿Cómo se ve esta distribución? La media es 4 y la varianza es 2,66. • Ahora decidimos tomar dos muestras, por lo tanto los posible valores son: • 2,2; 2,4; 2,6; 4,2; 4,4; 4,6; 6,2; 6,4 y 6,6. • Se solicita analizar la distribución de probabilidades de la media al considerar los resultados de estas dos muestras y además determine la desviación estándar. Analice estos estimadores en relación a los parámetros de la población. 8 Muestreo Estadístico • Distribuciones muestrales – Teorema del Límite Central: Cuando se seleccionan muestras aleatorias simples de tamaño n de una población, la distribución de " puede aproximarse mediante una muestreo de la media muestral π distribución normal a medida que el tamaño de la muestra se hace grande. – ¿Cuánto debe ser el tamaño muestral? En general 30. En todo caso si la la población es muy sesgada o existen observaciones atípicas, pueden necesitarse muestras de tamaño 50. Es más, en el caso de distribuciones que tienden a ser simétricas podría bastar con n=10. π₯Μ − π( π§= π ~ N(0,1) π 9 Contraste de Hipótesis • Definición: Es el procedimiento basado en la evidencia muestral y en la teoría de probabilidades que se emplea para determinar si la hipótesis es un enunciado racional y no debe rechazarse o si es irracional y debe ser rechazado. • En un trabajo de investigación se plantean dos hipótesis mutuamente excluyentes; la hipótesis nula y la hipótesis alternativa o de investigación. • El análisis estadístico de los datos servirá para determinar si se puede rechazar o no rechazar la hipótesis nula (H0). • Cuando se rechaza la H0 significa que el factor estudiado ha influido significativamente en los resultados. 10 Contraste de Hipótesis Valor de verdad real de H0 Decisión que se toma en la prueba de hipótesis Rechazo Es verdad πΌ Error Tipo I Es falso 1−π½ Decisión Correcta No rechazo 1−πΌ Decisión Correcta π½ Error Tipo 2 Nos interesa tener el menor nivel de error Tipo I. En la medida que disminuya la probabilidad de rechazar la hipótesis nula considerando que es verdadera entonces nos permite confiar en mayor medida en la decisión que se adopta. 11 Contraste de Hipótesis Aspectos Importantes en el Contraste de Hipótesis Nula v La hipótesis nula puede ser para valores mayores o menores iguales a 0, pero la hipótesis alternativa debe ser el complemento. v Las hipótesis alternativas pueden llevar a pruebas de una o dos colas: Ejemplo: • Supongamos π»! π= Valor • Contraste de una cola puede ser π»! π > Valor o π»! π<Valor • Contraste de dos colas es π»! π ≠ 0 12 Media Poblacional con Desviación Estándar Conocida de la Población 13 Contraste de Hipótesis 14 Contraste de Hipótesis • Ejemplo: Una panadería vende galletas sólo en paquetes. El peso nominal impreso en el paquete es 500 grs. En la práctica el peso de cada paquete no es exacto, por cual es una variable aleatoria. El dueño del negocio, basado en información histórica, afirma que la media del peso del paquete es 500 grs. con una desviación estándar de 5 grs. Se desea analizar la afirmación del dueño. Para ello alguien externo toma una muestra de 100 paquetes y obtiene una media muestral de 497,5 grs. Realizar una prueba de hipótesis con un nivel de significancia de 5%. • Se pone en cuestión si u=500 y se cree que podría tener un peso menor a 500 H0 π»! : π = 500 ππ’πñπ πππ πππππππ , hipótesis nula π»" : π < 500, hipótesis alternativa 15 Contraste de Hipótesis • Suponiendo un nivel de significancia del 5%, el valor crítico es -1,64 (mirando hacia valores inferiores a la media poblacional) • z= -5,40 lo cual implica que cae en la región de rechazo de la hipótesis nula. π»! : π = 500 ππ’πñπ πππ πππππππ , hipótesis nula π»" : π < 500, hipótesis alternativa 16 Contraste de Hipótesis • Ejemplo: Una empresa estudia introducir un nuevo sistema de producción para mejorar su productividad media establecida actualmente en 42 unidades por persona al día. Se estima que el cambio no será rentable si no consigue elevar dicho número por encima de 45 u. Se realizó una prueba de la nueva tecnología con 35 personas, se obtuvo una producción media de 46,5 u y no se observó ningún cambio apreciable en sigma (3u por día). Considerando esta información, usted recomendaría efectuar el cambio tecnológico, a un nivel de significancia de 1%. π»! : π = 45, hipótesis nula π»" : π > 45, hipótesis alternativa 17 Contraste de Hipótesis Ejemplo: Lloyd’s Department Store selecciona una muestra aleatoria simple de 100 clientes con objeto de conocer información acerca de la cantidad que gastan en cada visita a la tienda. Si x representa la cantidad gastada en cada visita a la tienda, la media muestral π₯Μ es una estimación puntual de μ, la cantidad media gastada en cada visita a la tienda por la población compuesta por los clientes de Lloyd’s Department Store. La tienda ha realizado estos estudios semanales durante varios años. Con base en sus datos anteriores, supone que el valor conocido de la desviación estándar poblacional es σ = $20. Los datos anteriores (históricos) indican también que la población tiene una distribución normal. En la semana más reciente, en su estudio de 100 clientes (n = 100), Lloyd’s obtuvo como media muestral π₯Μ = $82. Determine: El margen de error para la estimación y desarrolle una estimación por intervalo para la media poblacional. Suponga un probabilidad de rechazo de 5% con dos colas. Respuesta: Al estandarizar la variable, tenemos un σ = $2 (20/raíz(100)), Normal(0,2). En la distribución N(0,1) al 95% de nivel de confianza (0,95 es coeficiente de confianza) los valores críticos son +- 1,96 . Entonces con 2 desv. Estándar los valores críticos son +-3,92. Por lo cual, el intervalo de confianza es 78,08-85,92. El margen de error es π§!/# $ , % en suma la media poblacional es 18 Media Poblacional con Desviación Estándar Desconocida de la Población 19 Contraste de Hipótesis Cuando se utiliza s para estimar σ , el margen de error y la estimación por intervalo de la media poblacional se basan en una distribución de probabilidad conocida como distribución t . Esta distribución es una familia de distribuciones de probabilidad similar , y cada una depende de un parámetro conocido como grados de libertad. En la medida que aumente el grado de libertad la distribución t. (ver forma de la distribución t) 20 Contraste de Hipótesis 21 Contraste de Hipótesis 22 Testeo de proporción poblacional 23 Resumen de las pruebas de hipótesis para la proporción poblacional 24 Distribución de la media de proporción poblacional 25 Proporción poblacional • Ejemplo: Se encuestó a 900 mujeres para conocer su opinión acerca de los horarios disponibles para practicar golf. En el estudio se encontró que 396 estaban satisfechas con los horarios disponibles. Se solicita que estime el intervalo de confianza de 95%. • R: 0,4076 - 0,4724 (entre 40,76% y 47,24% están satisfechas con la disponibilidad de horarios). 26 Proporción poblacional • Determinar tamaño de la muestra para un nivel de precisión definido: P* es un valor planeado del promedio de p 27 Proporción poblacional • Ejemplo: En el caso de las mujeres golfistas, determinar cuál debiera ser el tamaño de la muestra si se desea que en la estimación de la proporción poblacional el margen de error sea de 0,025 a 95% de confianza. Tomemos el 0,44 anteriormente obtenido como proxy de p*. 1,96# 0,44 ∗ (1 − 0,44) π= = 1514,5 ≈ 1515 0,025# Si se considera un p*=0,5 entonces n=1536,6, es decir, 1537 28 Comparación de dos medias poblacionales 29 30