UNIDAD 6 ESTIMACIONES OBJETIVOS DE LA UNIDAD SE ESPERA QUE EL ALUMNO SEA CAPAZ DE: • DEFINIR UN ESTIMADOR PUNTUAL.• DEFINIR NIVEL DE CONFIANZA.• CONSTRUIR UN INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL CUANDO SE CONOCE LA DESVIACIÓN ESTÁNDAR DE LA POBLACION.• CONSTRUIR UN INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL CUANDO NO SE CONOCE LA DESVIACION ESTANDAR DE LA POBLACIONAL.• CONSTRUIR UN INTERVALO DE CONFIANZA PARA UNA PROPORCION DE LA POBLACION.• DETERMINAR EL TAMAÑO DE LA MUESTRA PARA UN MUESTREO DE ATRIBUTOS Y VARIBALES.- En todas las Unidades que hemos visto se encuentran las bases que necesita para entender la inferencia estadística y saber como aplicarla en situaciones prácticas.- En la primera Unidad centramos su atención en la Estadística Descriptiva, tanto gráficas como numéricas, para describir e interpretar conjuntos de mediciones.- En la Unidad siguiente, aprendió acerca de las probabilidades y sus distribuciones las herramientas básicas empleadas para describir poblaciones de mediciones.- Se enfatizó la importancia de las distribuciones binomial y normal en aplicaciones prácticas.- En la Unidad anterior, se proporcionó el eslabón entre la probabilidad y la inferencia estadística.El teorema central del límite establece que, aun cuando las poblaciones muestreadas no sea normales, las distribuciones muestrales de estos estadísticos, serán aproximadamente normales cuando el tamaño de la muestra n es grande.Estos estadísticos son las herramientas que usted usa para la estadística inferencial; hacer inferencia acerca de una población usando la información contenida en la muestra.- Hay muchas maneras de tomar decisiones o hacer predicciones, algunas de naturaleza subjetivas y otras más objetivas.- ¿Cuán buenas será su toma de decisiones o predicciones?.- Aunque podría sentir que su propia habilidad para tomar decisiones es bastante buena, la experiencia hace pensar que este podría no ser el caso.- El trabajo del Estadístico es proporcionar los métodos de inferencia estadística que sean mejores y más confiable que las suposiciones subjetivas.La inferencia estadística tiene que ver con la toma de decisiones o la elaboración de predicciones acerca de los parámetros, las medidas numéricas descriptivas que caracterizan a una población.- Tres parámetros encontrados en Unidades anteriores, son la media poblacional μ, la desviación estándar de la población σ y la proporción binomial p.En la inferencia estadística un problema práctico es repetido en el marco de una población con un parámetro específico.- Por ejemplo, un metalúrgico podría medir los coeficientes de dilatación promedio para ambos tipos de acero y después comparar sus valores.- Los métodos para hacer inferencia de los parámetros de la población caen en una de dos categorías: a) ESTIMACION : para estimar o predecir el valor del parámetro.- b) PRUEBA DE HIPOTESIS : para tomar una decisión respecto al valor de un parámetro con base en alguna idea preconcebida acerca de cual podría ser su valor.- Veamos un ejemplo: 1.- Los circuitos de las computadoras y otros equipos electrónicos constan de una o más tarjetas de circuitos impresos (TCI) y las computadoras se reparan reemplazando una o más tarjetas defectuosas.- En un intento por encontrar la aplicación apropiada de un proceso de enchapado en un lado de la tarjeta, un supervisor de producción podría estimar el espesor promedio de la electrodeposición de cobre en la tarjeta al usar muestras durante varios días de operación.- Puesto que el no tiene conocimiento del espesor promedio μ, antes de observar el proceso de producción, el problema que tiene es de estimación.- 2.- El dueño de la planta le dice al supervisor, del ejemplo anterior, que el espesor de la electrodeposición de cobre no debe ser menor que 0,001 pulgadas para que el proceso esté bajo control.Para decidir si el proceso esta bajo control o no, el supervisor podría formular una prueba.- El podría hipotetizar que el proceso esta bajo control: asume que el espesor medio de la electrodeposición es 0,001 o mayor, y usa una muestra de varios días de operación para decidir si la hipótesis es correcta o no.- El método de toma de decisiones del supervisor se llama Prueba de Hipótesis.- ¿Qué método de inferencia usaría?.- Es decir, ¿debe estimar el parámetro o debe probar una hipótesis con respecto a su valor?.- La respuesta es dada por la pregunta práctica planteada, y a menudo se determina por preferencia personal.Puesto que tanto la estimación como las pruebas de hipótesis se usan con frecuencia en las publicaciones de temas científicos, nosotros veremos ambos temas.- Estimaciones en esta Unidad y Pruebas de Hipótesis en la Unidad siguiente.- Un problema estadístico que requiere planificación, análisis y la realización de inferencias está incompleto sin una medida de la bondad de la inferencia .- Es decir, ¿Qué tan exacta o confiable es el método que utilizó?.- Si un corredor de bolsa predice que el precio de una acción será de 80 dólares el lunes, ¿estará dispuesto a comprar o vender su acción sin saber que tan confiable es su predicción?.- Los procedimientos estadísticos son importantes porque proporcionan dos tipos de información: • Métodos para hacer inferencia.• Una medida numérica de la bondad o confiabilidad de la inferencia.- METODOS DE ESTIMACION Todo el mundo hace estimaciones.- Por ejemplo, cuando usted decide cruzar una calle hace una estimación de la velocidad del auto que viene, que tan cerca está, etc, luego decide si cruza o no.Los Administradores, Contadores, Economistas, etc, deben hacer estimaciones rápidas.El resultado de estas estimaciones pueden afectar sus organizaciones de manera tan seria como el resultado de su decisión de cruzar la calle.Todos estos profesionales hacen estimaciones sin preocuparse si son científicas o no, pero con las esperanza de que las estimaciones tengan una semejanza razonable con el resultado.- Con lo que veremos con este tema, observaremos que podemos hacer estimaciones lo más acertadas posibles, es decir sin correr grandes riesgos.Además con este tema empezamos a explicar las posibilidades de hacer inferencias sobre una población, basándonos en la información contenida en una muestra aleatoria.- Vamos a centrar nuestra atención en características específicas o parámetros de la población.- Algunos parámetros de interés podrían ser la media, la variancia o la proporción de la población que poseen determinados atributos.Por ejemplo, podríamos hacer inferencia sobre: •El ingreso medio de las familias de un barrio.• Todas las acciones que cotizan en una bolsa de valores.•La variación en el nivel de impureza en diferentes lotes de un producto químico.•La proporción de empleados de una empresa que están a favor de modificar un plan de incentivos.• Ver la aceptación del público de un nuevo producto.• Las ventas de un comercio en el futuro.• Todas las cuentas pendientes de cobro de un proveedor.•Etc, Etc.- Cualquier inferencia que se haga sobre la población tendrá que basarse necesariamente en estadísticos muestrales, es decir en función de la información muestral.- La elección apropiada de estos estadísticos dependerá de cual sea el parámetro de interés de la población.- El verdadero parámetro será desconocido y un objetivo será estimar su valor.- Cualquier Cualquier estadístico estadístico de de la la muestra muestra que que se se utilice utilice para para estimar estimar un un parámetro parámetro poblacional poblacional desconocido desconocido se se conoce conoce como como estimador estimador ES DECIR Un estimador de un parámetro poblacional es una variable aleatoria que depende de la información de la muestra y cuyas realizaciones proporcionan aproximaciones al valor desconocido del parámetro.- La media de la muestra X puede ser un estimador de la media de la población μ, la proporción de la muestra p puede ser un estimador de la proporción poblacional P.- Cuando Cuando hemos hemos observado observado un un valor valor numérico numérico específico específico de de nuestro nuestro estimador estimador nos nos referimos referimos aa ese ese valor valor como como una una estimación.estimación.- En otras palabras, una estimación es un valor específico observado de un estadístico.Hacemos una estimación si tomamos una muestra y calculamos el valor que toma nuestro estimador en esa muestra.- Supongamos que deseamos estimar el ingreso medio de las familias de un barrio.Parece razonable basar nuestra conclusiones en el ingreso medio muestral, por lo tanto, diremos que el estimador de la media poblacional es la media muestral.- Supongamos que habiendo tomado la muestra hallamos que el ingreso promedio de las familias de la muestra es 1650$.- Entonces la estimación de la media de la población es 1650$.Para estudiar la estimación de un parámetro desconocido, debe considerarse dos posibilidades.- Primero, podríamos calcular en base a los datos de la muestra, un valor representativo o tal vez el más representativo y es lo que vimos con la estimación de los 1650$ para las familias del barrio que estudiamos.Alternativamente, podríamos estar interesado en encontrar un intervalo o rango, en el cual estemos casi seguro de que esté el verdadero parámetro, y es lo que llamamos Estimación por Intervalos de Confianza.- Entonces, si bien hay otros métodos, los estimación que veremos son dos: métodos a) ESTIMACIÓN PUNTUAL b) ESTIMACION POR INTERVALOS DE CONFIANZA.- de a) ESTIMACION PUNTUAL Un estimador puntual de un parámetro poblacional es una función de la muestra que da como resultado un único valor.La correspondiente realización se llama estimación puntual .En el ejemplo, que vimos antes, el ingreso medio de las familias, el parámetro que se quiere estimar es la media poblacional.- El estimador puntual que se utiliza es la media muestral y la estimación resultante fue de 1650$.Entonces tenemos la siguiente tabla, para estimadores puntuales: Parámetro poblacional Media Variancia x X ²x Desviación estándar Proporción Estimador P S²x x sx p Veamos un ejemplo.Las ganancias por acciones de una muestra de 10 valores de la Bolsa de Buenos Aires en un día particular fueron: 10 16 5 10 12 8 4 6 5 4 Hallar estimaciones puntuales para los siguientes parámetros poblacionales; media, variancia, desvío estándar y la proporción para los que la ganancia por acción fue mayor que 8,5.Entonces: Nº 1 Xi 10 X² 100 2 3 16 5 256 25 4 5 10 12 100 144 6 7 8 4 64 16 8 9 6 5 36 25 10 Total 4 80 16 782 Tenemos que: n = 10 Xi = 80 Por lo tanto la media muestral es xi X = ------------ = n X² = 782 80 ------------ = 8.0 10 Que es nuestra estimación de la media poblacional.Una estimación de la variancia poblacional será: x² - n X² 782 - 10 * 64 S² = ---------------------------- = --------------------------- = 15.7 n - 1 9 Para la desviación estándar la estimación puntual será Sx = S² = 15,78 = 3.97 Finalmente, en la muestra, el número de valores para los cuales la ganancia por acción es mayor que 8,5 son cuatro.- Por lo tanto nuestra estimación puntual de la proporción poblacional es: p = x 4 = n = 0.40 10 En un situación practica podría haber varios estadísticos disponibles como estimadores puntuales para un parámetro poblacional.- Para decidir cual es la mejor opción, necesita saber como se comporta el estimador en el muestreo repetido, descrito por su distribución muestral.A manera de analogía, piense en disparar un revolver a un blanco.- El parámetro de interés es el centro del blanco en el que dispara las balas.- Cada bala representa una sola estimación de la muestra, disparada por el revolver, la cual representa al estimador.- Suponga que su amigo dispara un solo tiro y da en el centro del blanco.- ¿su conclusión es que el es un tirador excelente?.- ¿se pondría de pie al lado del blanco mientras el hace un segundo disparo? Probablemente no, porque no tiene ninguna medida del desempeño en ensayos repetidos.- ¿El siempre da en el blanco, o es constante para dar muy alto o muy bajo?.- ¿sus tiros se agrupan muy cercanos al blanco o por lo general salen desviados del blanco por un amplio margen?.- En la figura siguiente aparecen varias configuraciones del blanco.●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Consistente ● ● ● ● ● arriba del blanco ● ● ● Fuera del blanco Consistente abajo del blanco ●●●●● por un amplio margen Mejor puntería Las distribuciones muestrales proporcionan información útil para seleccionar el mejor estimador.- ¿Qué características serían valiosas?.Primero, la distribución muestral del estimador puntual debe estar centrada en el valor verdadero del parámetro por estimar.- Es decir, el estimador no debe subestimar o sobreestimar regularmente el parámetro de interés.- Se dice que tal estimador es no sesgado.Definición: Se dice que un estimador de un parámetro es no sesgado si la media de su distribución es igual al verdadero valor del parámetro.- De otra manera, se dice que el estimador es sesgado.- Gráfica de distribución Normal; Desv.Est.=5 0,09 Estimador Estimador 0,07 0,06 Densidad no sesgado 0,08 sesgado 0,05 0,04 0,03 0,02 0,01 0,00 0 10 20 30 40 X Valor verdadero del parámetro En la figura anterior aparecen las distribuciones muestrales para un estimador no sesgado y un estimador sesgado.- La distribución para el estimador sesgado se desplaza a la derecha del valor verdadero del parámetro.-Este estimador sesgado tiene más probabilidad de sobreestimar el valor verdadero del parámetro que uno no sesgado.- La segunda característica deseable de un estimador es que la dispersión (medida por la variancia) de la distribución muestral debe ser tan pequeña como sea posible.Gráfica de distribución 0,04 0,03 Densidad Estimador con variancia mayor Estimador con variancia menor 0,02 0,01 0,00 -50 -25 0 25 X 50 75 Valor verdadero del parámetro 100 Esto asegura que, con una probabilidad alta, una estimación individual caerá cerca del verdadero valor del parámetro.Las distribuciones muestrales para dos estimadores no sesgados, uno con una variancia pequeña y la otra con una variancia mayor se muestran en la placa anterior.Claro, preferirá al estimador con la menor variancia, porque las estimaciones tienden a quedar más cerca del verdadero valor del parámetro que en la distribución con la variancia más grande.- En situaciones de muestreo de la vida real, quizás usted sabe que la distribución muestral de un estimador se centra respecto al parámetro que intenta estimar, pero todo lo que tiene es la estimación calculada de las n mediciones contenidas en la muestra.- ¿cuán lejos estará su estimación del valor del verdadero parámetro?.- La distancia entre la estimación y el verdadero valor del parámetro se llama error de estimación .En esta Unidad debe suponer que los tamaños de la muestra siempre son grandes y por consiguiente, que los estimadores no sesgados que estudiara tienen distribución muestral que se pueden aproximar mediante una distribución normal (debido al teorema central del límite).- Recuerde que, para cualquier estimador puntual con una distribución normal; la regla empírica establece que aproximadamente el 95% de las estimaciones puntuales, estarán a dos (o con más exactitud 1,96) desviaciones estándar de la media de esa distribución.Para estimadores no sesgados, esto significa que la diferencia entre el estimador puntual y el valor verdadero del parámetro será menor que 1,96 desviaciones estándar o 1,96 errores estándar (SE).Esta cantidad conocida como margen de error del 95% (o simplemente margen de error), proporciona un límite superior práctico para el error de estimación.(ver figura siguiente) Es posible que el error de estimación exceda este margen de error, pero esto es muy improbable.- 95% 1.96 SE 1.96 SE Margen Margen de de error error Distribución muestral de un estimador no sesgado Estimador muestral ¿COMO ESTIMO UNA MEDIA O PROPORCION POBLACIONAL? • Para estimar la media poblacional μ de una población cuantitativa, el estimador puntual x es no sesgado, con un error estándar estimado como: SE = S n El margen de error de 95% cuando n ≥ 30 es estimado como: ± 1,96 S n Para estimar la proporción poblacional P de una población binomial, el estimador puntual p = x/n es no sesgado con error estándar estimado como: SE = pq n El margen de error del 95% es estimado como: ± 1,96 pq n Suposiciones: n p > 5 y nq >5 Ejemplo 1: Un investigador está interesado en la posibilidad de fusionar las capacidades de la televisión y la Internet.Una muestra aleatoria de n = 50 usuarios de Internet que fueron encuestados acerca del tiempo que pasan viendo la televisión produjo un promedio de 11,5 horas por semana con una desviación estándar de 3,5 horas.- Use esta información para estimar el tiempo medio poblacional que los usuarios de Internet pasan viendo televisión.Solución La variable aleatoria medida es el tiempo que pasaron viendo televisión por semana.- Esta es una variable aleatoria cuantitativa mejor descripta por su media μ.- La estimación puntual de μ, el tiempo promedio que los usuarios de Internet pasan viendo televisión es x = 11,5 horas.- El margen de error se estima como: 1,96 SE = 1,96 S n = 1,96 3.5 = 0.97 50 Puede sentirse bastante seguro de que la estimación muestral de 11,5 horas de ver televisión para los usuarios de Internet esta a ± 1 horas de la media poblacional.- Ejemplo 2: Además del tiempo promedio que los usuarios de Internet pasan viendo televisión del ejemplo anterior, está interesado en estimar la proporción de individuos en la población que quieren comprar una televisión que también funcione como computadora.- En una muestra aleatoria de n = 100 adultos, 45% en la muestra indicaron que podían comprar una.- Estime la proporción poblacional verdadera de adultos interesados en comprar una televisión que también funcione como computadora, y encuentre el margen de error para la estimación.Solución El parámetro de interés ahora es P, la proporción de individuos en la población que quieren comprar una televisión que también funcione como computadora.El mejor estimador de P es la proporción muestral p, que para esta muestra es p = 0,45.A fin de encontrar el margen de error, aproxime el valor de P con su estimación p = 0,45, entonces: 1,96 SE = 1,96 Pq n = 1,96 0,45 * 0,55 100 = 0.10 Con este margen de error, usted puede estar muy seguro de que la estimación de 0,45 está a ± 0,10 del verdadero valor de P.- Por tanto, es posible concluir que el verdadero valor de P podría ser tan pequeño como 0,35 o tan grande como 0,55.- Este margen de error es bastante grande cuando se compara con la estimación y refleja el hecho de que se requieren muestras grandes para lograr un margen de error pequeño al estimar P.Cuando el valor de p esta entre 0,3 y 0,7 hay poco cambios en el valor de que es el numerador Pq del SE , que alcanza su máximo valor para p = 0,50, por tal motivo muchas encuestadoras como Gallup usan tamaños de muestras de alrededor de 1000 así que su margen de error es: 1,96 0.5 * 0.5 1000 = 0,031 3% Se dice en este caso que la estimación esta ± 3 % de la proporcion poblabacional verdadera.- EJERCICIOS 1.- ¿Explique lo que significa “ margen de error” en la estimación puntual?.2.- ¿Cuáles son las dos características del mejor estimador puntual para un parámetro poblacional?.3.- Calcule el margen de error al estimar una media poblacional μ para estos valores: a) n = 50 S² = 4 b) n = 500 S² = 4 c) n = 5000 S² = 4 ¿Que efecto tiene un tamaño mayor de la muestra en el margen de error?.- 3.- Calcule el margen de error al estimar una proporción binomial P por medio de muestras de tamaño n = 100 y los siguientes valores estimados de para P: a) P = 0.10 b) P = 0.30 d) P = 0.70 e) P = 0.90 c) P = 0.50 ¿Cuál de los valores de P produce el margen de error más grande?.4.- Suponga que usted está escribiendo un cuestionario para una encuesta de n = 100 individuos.- El cuestionario generará las estimaciones para varias proporciones binomiales diferentes.- Se quiere informar un solo margen de error para la encuesta, ¿Qué margen de error del ejercicio anterior está bien usar?.- 5.- Con frecuencia un aumento en la proporción de ahorro de los consumidores se relacionan con una falta de confianza en la economía y se dice que es un indicador de una tendencia recesiva.- Un muestreo aleatorio de n= 200 cuentas de ahorra en una comunidad mostró un incremento medio en los valores de las cuentas de ahorro de 7,2% durante los últimos 12 meses, con una desviación estándar de 5,6%.- Estime el incremento porcentual medio de los valores de las cuentas de ahorro durante los últimos 12 meses de los depositantes en la comunidad.- Encuentre el margen de error para su estimación.Repta: x = 7.2 % SE = 0,776 6.- A la mayoría de los argentinos les encanta participar o por lo menos ver, en una multitud de eventos deportivos; muchos sienten que los deportes tienen más que solo el valor de entretenimiento.- En una encuesta a 1000 adultos , el 78% sienten que los deportes espectáculo tienen un efecto positivo en la sociedad.a) Encuentre una estimación puntual para la proporción de argentinos adultos que sienten que los deportes espectáculo tienen un efecto positivo en la sociedad.Calcule el margen de error.b) La encuesta produce un margen de error de más o menos 3,1%.- ¿esto concuerda con los resultados del inciso a)? Si no, ¿Qué valor de p produce el margen de error dado en la encuesta?.Repta: a) p = 0,78 ME= 0,026 b) no, p = 0.50 7.Uno de los costos principales al planear las vacaciones de verano es el costo del hospedaje.- Incluso dentro de una cadena particular de hoteles, los costos varían sustancialmente dependiendo del tipo de habitación y los servicios ofrecidos.- Suponga que elige al azar 50 estados de cuentas de cada una de las bases de datos de las cadenas de hoteles, Marriott, Sheraton, y Hilton, y se registra las tarifas de alojamientos nocturnos: Marriott Sheraton Hilton Promedio muestral 170 145 150 Desvió estándar muestral 17,5 10,0 16,5 a) Describa la población o poblaciones muestreadas.- b) Encuentre la estimación puntual para la tarifa de alojamiento promedio de los hoteles Marriott.Calcule el margen de error.c) Encuentre la estimación puntual para la tarifa de alojamiento promedio de los hoteles Sheraton.- Calcule el margen de error.d) Encuentre la estimación puntual para la tarifa de alojamiento promedio de los hoteles Hilton.Calcule el margen de error.- 8.- Las estaciones de radio y televisión con frecuencia sacan al aire temas polémicos durante sus transmisiones y piden a los espectadores que indiquen si están de acuerdo o no con una posición dada acerca de un problema.- Se realiza una encuesta u se pide a los telespectadores que si están de acuerdo que llamen a un cierto número 900 y si no que llamen a un segundo número 900.- Todos los participantes pagan una cuota por sus llamadas.a) ¿Esta técnica de muestreo produce una muestra aleatoria?.b) ¿Qué es posible decir acerca de la validez de los resultados de tal encuesta?.- ¿Debe preocuparse por un margen de error en este caso?.- PARA MOSTRAR EL USO DE MINITAB EN LA ESTIMACION PUNTUAL Supongamos que un día seleccionamos una muestra aleatoria de acciones que cotizan en la bolsa y observamos que las relaciones preciobeneficio de estas acciones son: 10 16 13 11 12 14 12 15 14 14 13 13 13 ---- a) Muestre si los normalmente.- datos se distribuyen b) Halle estimaciones puntuales de la media y de la variancia.- Gráfica de probabilidad de C1 Normal 99 Media Desv.Est. N AD Valor P 95 90 13,08 1,605 13 0,281 0,581 Porcentaje 80 70 60 50 40 30 20 10 5 1 9 10 11 12 13 C1 14 15 16 17 En el gráfico de probabilidad normal no se observa nada que indique ausencia de normalidad.- Suponiendo que la distribución es normal, una estimación puntual de la media poblacional precio beneficio es la media muestra de 13,1 y una estimación de la variancia poblacional es la variancia muestral S²= 2.58.- Tanto la media muestral como la variancia son estimadores puntuales insesgados, consistentes y eficientes de la media y variancia poblacional, respectivamente.- 1.- Una muestra aleatoria de ocho viviendas de un barrio tenían los siguientes precios de ventas (en miles de dólares): 92 83 112 127 109 96 102 90 a) Busque pruebas de la ausencia de normalidad.b) Halle una estimación puntual de la media poblacional que sea insesgada y eficiente.c) Utilice un método de estimación insesgado para hallar una estimación puntual de la variancia de la media muestral.d) Utilice un estimador insesgado para estimar la proporción de viviendas de este barrio que se venden por menos de 92500 dólares.- 2.- Una muestra aleatoria de 12 obreros de una gran fábrica encontró las siguientes cifras sobre número de horas extras realizadas el mes anterior: 22 16 28 12 18 36 23 11 41 29 26 31 Utilice métodos de estimación insesgados para hallar la estimaciones puntuales de: a) La media poblacional.b) La variancia poblacional.c) La variancia de la media muestral. d) La proporción poblacional de obreros que trabajaron más de 30 horas extras en esta fábrica el mes anterior.e) La variancia de la proporción muestral de obreros que trabajaron más de 30 horas extras en esta fábrica el mes anterior.- 3.- Una muestra aleatoria de 10 economistas han realizado las siguientes predicciones del crecimiento porcentual del producto bruto interno real del próximo año: 2.2 2.8 3.0 2.5 2.4 2.6 2.5 2.4 2.7 2.6 Utilice métodos de estimación insesgados para hallar las estimaciones puntuales de: a) La media poblacional.- b) La variancia poblacional.- c) La variancia de la media muestral.d) La proporción poblacional de economistas que han predicho un crecimiento del PBI real de al menos 2,5 por ciento.e) La variancia de la proporción muestral de economistas que han predicho un crecimiento del PBI real de al menos un 2,5 %.- b) b) ESTIMACION ESTIMACION POR POR INTERVALOS INTERVALOS DE DE CONFIANZA CONFIANZA EL MAPA CONCEPTUAL DE LO QUE VEREMOS SOBRE ESTE TEMA SERÁ: INTERVALOS DE CONFIANZA Principio e Interpretación de los I de C El valor α la probabilidad del error Para Para medias Proporciones poblacionales poblacionales Muestras grandes Muestras pequeñas Controlando Determinación el ancho de los de un tamaños intervalo muestrales Cambio del nivel de confianza Cambio del tamaño muestral Para Estimar μ Para estimar proporción El Gerente Comercial puede seleccionar una muestra aleatoria de 100 clientes y decidir que la media poblacional, gasto promedio por cliente está en algún sitio entre 200 y 500 $.Una Estimación por Intervalos especifica el rango dentro del cual está el parámetro desconocido.Tal intervalo con frecuencia va acompañado de una afirmación sobre el nivel de confianza que se da en su exactitud.Por eso se llama INTERVALOS DE CONFIANZA En realidad hay tres niveles de confianza relacionados con los Intervalos de Confianza 90, 95 y del 99 % No hay nada mágico sobre estos tres valores mág Se podría calcular un Intervalo de Confianza para cualquier nivel que se deseara Estos niveles de confianza se denominan COEFICIENTES DE CONFIANZA Las estimaciones por intervalo gozan de ciertas ventajas sobre las estimaciones puntuales.Debido al error de muestreo probablemente X no será igual a μ.- Sin embargo, no hay manera de saber que tan grande es el error de muestreo.- Por lo tanto, los INTERVALOS DE CONFIANZA , se utilizan para explicar esta discrepancia desconocida EL EL FUNDAMENTO FUNDAMENTO DE DE UN UN INTERVALO INTERVALO DE DE CONFIANZA CONFIANZA Un UnIIde deCCtiene tieneun unlímite límite inferior inferior de de confianza confianza(LIC) (LIC) yyun un límite límitesuperior superior de de confianza confianza(LSC) (LSC) Estos límites se hallan calculando primero la media muestral X Luego Luegose sesuma sumauna unacierta cierta cantidad cantidadaala lamedia mediamuestral muestral para paraobtener obtenerel elLSC LSCyyla la misma mismacantidad cantidadse seresta restapara para obtener obtenerLIC.LIC.- La determinación de esa cantidad es nuestro objetivo ¿Cómo se puede construir un intervalo y luego argumentar que se puede tener un 95% de confianza en que contiene μ, si incluso no se sabe cuál es la media poblacional?.Vale la pena recordar de la definición anterior sobre la REGLA EMPIRICA que por ejemplo, el 95 % de todas las medias muestrales caen dentro de dos errores estándar de la media poblacional.- Entonces la media poblacional está máximo a dos errores estándar del 95% de todas las medias muestrales.- Por lo tanto, al comenzar con cualquier media muestral, si se pasa de dos errores estándar por encima de dicha media y dos errores estándar por debajo de ella, se puede tener un 95% de confianza en que el Intervalo resultante contenga la media poblacional desconocida.- La discusión sobre distribuciones de muestreo mostró que de toda población se pueden obtener muchas muestras diferentes de un tamaño dado, cada una con su propia media.- ± 2 σx μ=? LSC1 X1 LIC1 LIC2 LIC3 X3 LIC4 X2 LSC2 LSC3 X4 LSC4 LIC5 X5 LSC5 La figura anterior, muestra cinco de estas medias muestrales posibles.- Si la muestra da X1, un intervalo que se extiende dos errores estándar por encima y por debajo de X1 todavía incluye el valor desconocido de la media poblacional.- De igual forma si la muestra hubiese dado una media X2, el intervalo resultante también incluiría la media poblacional.- Vale la pena destacar que solo X3 y X5, quedan tan lejos de la media poblacional que un intervalo de ± 2 errores estándar no incluye la media poblacional.- Todas las otras muestras consideradas producirán un intervalo que contiene la media poblacional Entonces la clave para recordar, es esta: Como la media poblacional está a lo más a dos errores estándar para el 95% de todas las medias muestrales.- Entonces, dada una media muestral cualquiera, se puede estar 95 % seguro de que el intervalo de dos errores estándar alrededor de dicha media muestral contiene la media poblacional desconocida.- 1.- Intervalo de Confianza para la media de una distribución normal; variancia poblacional conocida.n ≥ 30 Uno de los usos más comunes de los intervalos de confianza es estimar la media poblacional.Por ejemplo: • Un fabricante puede querer estimar la producción mensual promedio de su planta.•Un representante de mercadeo puede interesarse en la reducción en las ventas semanales promedios.•El jefe financiero de una firma que aparece entre las 500 mejores firmas puede querer estimar los rendimiento trimestrales promedios que se tuvieron en operaciones corporativas.•Etc.- El número de situaciones que se encuentran comúnmente en el mundo de los Negocios, la Economía, y la Administración que requiere de una estimación de la media poblacional es casi ilimitado.- Recordemos que el Intervalo de Confianza se forma utilizando la media muestral como una estimación puntual para el cual se adiciona y se resta un cierto valor para obtener los límites superior e inferior del intervalo de confianza respectivamente.Por lo tanto el I de C es: XX ±± ZZαα/2/2 σ σ xx Veamos ahora de donde surge este Intervalo de Confianza Supongamos que hablamos del 95 % de confianza; 1-α - zα/2 P ( - Zα/2 < 0 zα/2 Z < Z α/2 ) ; pero Z = Z X - μ σ/√n En lo anterior reemplazamos Z por su igual y despejamos el parámetro μ, entonces P ( X - Zα/2 σ / √ n < μ < X + Z α/2 * σ / √n )= 1- α Cuanto debe sumarse y restarse depende en parte del Nivel de confianza deseado, estipulado por el valor Z, en la formula antes mencionada.Un nivel de confianza del 1 - α = 90 % Z = 1,645 1 - α = 95 % Z = 1,96 1 - α = 99 % Z = 2,58 Veamos un ejemplo y expliquemos.- Suponga que un empresario muy importante intenta construir un gran Supermercado.- Puede estimar en el área el ingreso promedio por familia como indicador de las ventas esperadas.- Una muestra aleatoria simple de n= 100 familias da una media de X = 1800$.- Se asume que la desviación estándar poblacional es de σ = 650$, que se la conoce de una serie de trabajos anteriores en esa zona.- ¿ Determine un intervalo de confianza para la media poblacional μ con un nivel de confianza del 95%?.Solución Nuestro Intervalo de Confianza X ± Zα/2 σx = σ n = 650 σx = 65 100 Entonces, será: 1672,60 1800 ± 1,96 (65) = 1927,40 1672,60 ≤ μ ≤ 1927,40 INTERPRETACION INTERPRETACION DE DE UN UN INTERVALO INTERVALO DE DE CONFIANZA CONFIANZA El empresario puede interpretar los resultados de su Intervalo de Confianza de dos formas.- 1.- Es la más común, establece que el empresario tiene un 95% de confianza de que la media poblacional real desconocida este entre esos valores determinados.2.- Reconoce que se pueden desarrollar muchos Intervalos de confianza diferentes.- Otra muestra probablemente produciría una media muestral diferente debido al error de muestreo.- Con una X diferente el intervalo tendrá límites diferentes.- Por tanto, esta segunda interpretación establece, que si se construyen todos los intervalos posibles, el 95 % de ellos contendrían la media poblacional desconocida.- Lo Lo expresado expresado en en 2) 2) significa significa que que el el 55 % % de de todos todos los los intervalos intervalos estaría estaría errado errado (no (no contendrían contendrían la la media media poblacional).poblacional).Este Este55%, %, que quelo localculamos calculamoscomo: como: 11 -- Coeficiente Coeficientede deConfianza Confianza SE LLAMA VALOR α REPRESENTA LA PROBABILIDAD DE ERROR Valor Alfa : es la probabilidad de error o la probabilidad de que un intervalo dado no contenga la media poblacional desconocida.- EJERCICIO PARA HACER EN CLASE 1.- Supongamos que el tiempo que permanecen los clientes en un negocio de ropa sigue una distribución normal.- Una muestra aleatoria de 16 clientes tenia un tiempo medio de 25 minutos.Supongamos que σ = 6 minutos.- Halle el error estándar, el margen de error y la amplitud del intervalo de confianza de la media poblacional μ, al 95 por ciento.- 2.- Un proceso produce bolsas de azúcar refinado.- El peso del contenido de estas bolsas sigue una distribución normal que tiene una desviación estándar de 12 gramos.- El contenido de una muestra aleatoria de 25 bolsas tiene un peso promedio de 198 gramos.- Halle un intervalo de confianza del 99 por ciento y del 95 por ciento, para el verdadero peso medio de todas las bolsas de azúcar producidas por el proceso.- Explique cual estimación es más conveniente y porque.- 2.- Intervalo de Confianza para la media de una distribución normal; variancia poblacional desconocida.n ≥ 30 Como la σ es desconocida podemos sustituirla por la variancia de la muestra, entonces nuestro Intervalo de Confianza será: XX ±± ZZαα/2/2 ss xx Donde S x = S n Veamos un ejemplo: El Contador Mario Sosa, acaba de registrar las declaraciones de impuestos de sus clientes.Desea estimar la cantidad que deben a la AFIP.- De los 50 cliente que seleccionó en su muestra aleatoria simple, la cantidad promedio que se adeudaba era de $ 16320.- Ya que la desviación estándar de la población es desconocida el Contador debe estimar a σ con la desviación estándar de la muestra s = 220,30.- Se desea un nivel de confianza del 99%.Solución En este caso el IC será: X ± Zα/2 sx 220,30 16320 ± 2,58 * = 50 16239,62 16320 ± 80,38 = 16400,38 El Contado Mario Sosa puede tener un 99 % de confianza en que la cantidad promedio que deben todos sus clientes a la AFIP esta entre esos valores.- Amplitud del Intervalo : 16400,38 - 16239,62 = 160,76 Nos podríamos preguntar ¿ que pasaría a este intervalo si el Contador estuviera dispuesto a aceptar un nivel de confianza del 95%? Sería: 16258,94 16320 ± 61,06 = 16381,06 Amplitud del Intervalo sería: 16381,06 – 16258,94 = 122,12 Los resultados son tan buenos como malos.Las buenas noticias son que el intervalo del 95% es más estrecho y ofrece mayor precisión.Un intervalo amplio no es especialmente útil.Entre más estrecho es el intervalo, más significativo es.Las malas noticias son que el Contador Mario Sosa ahora está el 95% seguro que el intervalo contiene en realidad a μ.Aunque el intervalo es más preciso, más estrecho, la probabilidad de que contenga μ se ha reducido del 99% al 95%.- El Contador tuvo que perder algo de confianza y ganar más precisión.- EJERICICIO PARA HACER EN CLASE: Un científico interesado en vigilar los contaminantes químicos en los alimentos y por tanto, la acumulación de contaminantes en las dietas humanas, eligió una muestra aleatoria de n = 50 adultos varones.Encontró que la ingestión promedio diaria de productos lácteos era x = 756 gramos por día con una desviación estándar s = 35 gramos por día.a) Use esta información para construir un intervalo de confianza de 95% para la ingestión media diaria de productos lácteos para los varones.b) Use esta información para construir un intervalo de confianza de 90% para la ingestión media diaria de productos lácteos para los varones.- 3.- Intervalo de Confianza para la media de una distribución normal; variancia poblacional conocida.n ≤ 30 En este caso el Intervalo de Confianza, será usando también Zα/2.- El Gerente de cierto banco lo contrato como consultor para diversa tareas,. Hoy le pide analizar las operaciones de sus cajeros automáticos.- Una muestra aleatoria de 9 de ellos mostró las transacciones promedio de 1600$.- Por un estudio anterior que se había realizado se conoce el desvío estándar poblacional σ = 350$ por día.- El gerente le pide que estime el volumen diario promedio con un 95 % de confianza.Solución El Intervalo de Confianza será: X ± Zα/2 σ x 350,0 1600 ± 1,96 * = 9 1371,33 1600 ± 228,67 = 1828,67 Podrá decir con un 95 % de confianza que el promedio poblacional de las operaciones diarias de los cajeros esta entre 1371 $ y 1829 $.- EJERCICIO PARA HACER EN CLASE Un director de personal ha observado que históricamente las puntuaciones de los test de aptitud realizados a los solicitantes de empleo en los niveles de entrada siguen una distribución normal con una desviación estándar de 32,4 puntos.Una muestra aleatoria de nueve puntuaciones del grupo actual de solicitantes tenía una puntuación media de 187,9 puntos.a) Halle el intervalo de confianza al 80 por ciento de la media poblacional de las puntuaciones del grupo actual de solicitantes.b) Halle el intervalo de confianza al 90 por ciento de la media poblacional de las puntuaciones del grupo actual de solicitantes.c) Comente cual le conviene y porque.- 1.- Se sabe que la desviación estándar de los volúmenes de las botellas de 710 ml de agua mineral embotellada por una empresa es de 6 ml.- Se ha tomado una muestra de aleatoria de 90 botellas y se han medido: a) Halle el factor de fiabilidad de un intervalo de confianza al 92 por ciento de la media poblacional de los volúmenes.b) Calcule el error estándar de la media.c) Calcule la amplitud de un intervalo de confianza al 92 por ciento de la media poblacional de los volúmenes.- 2.- Se sabe que el peso de los ladrillos que produce una fábrica sigue una distribución normal con una desviación estándar de 0,12 kilos.- Una muestra aleatoria de 16 ladrillos de la producción de hoy tenía un peso medio de 4,07 kilos.a)Halle el intervalo de confianza al 99 por ciento del peso promedio de todos los ladrillo producidos hoy.b)Explique sin realizar los calculo si el intervalo de confianza al 95 por ciento de la media poblacional tendría más amplitud, menos o igual que la obtenida en el inciso a).- c) Si decide que mañana se tomara una muestra aleatoria de 20 ladrillos.- Explique sin realizar los cálculos si el intervalo de confianza 99 por ciento del peso medio de la producción de mañana calculado correctamente tendría más amplitud, menos o igual que la obtenida en el inciso a).d) Suponga que la desviación estándar poblacional de la producción de hoy es de 0,15 kilos (no 0,12 kilos).- Explique sin realizar los cálculos si el intervalo de confianza al 99% del peso medio de la producción de hoy calculado correctamente tendría más amplitud, menos o igual que la obtenida en el inciso a).- 3.- La secretaria de admisiones en un programa de master en administración de empresas ha observado que históricamente los solicitantes tienen una calificación media en los estudios de licenciatura que sigue una distribución normal con desviación estándar de 0,45.- Se ha extraído una muestra aleatoria de 25 solicitudes cuya calificación media ha resultado ser 2,90.• Halle el intervalo de confianza de la media poblacional al 95 %.- Explique.b) Basándose en estos resultados muestrales, un estadístico calcula para la media poblacional el intervalo de confianza que va de 2,81 a 2,99.- Halle el nivel de confianza correspondiente a este intervalo.- 4.- Intervalo de Confianza para la media de una distribución normal; variancia poblacional desconocida.n ≤ 30 En situaciones anteriores el tamaño de la muestra era mayor, igual a 30.- Sin embargo, no siempre puede ser posible obtener por lo menos 30 observaciones.- Para una compañía de seguro que prueba la resistencia al impacto de los autos, destruir 30 autos puede volverse bastante costoso.- Una empresa farmacéutica puede no encontrar 30 personas disponibles para actuar como conejitos de indias, etc.- Es decir, que en muchos casos una muestra grande es imposible obtener.- Cuando debe tomarse una muestra pequeña, la distribución normal puede no aplicarse.- El teorema central del límite asegura normalidad en el proceso de muestreo solo si la muestra es grande.- Cuando se utiliza una muestra pequeña y además se desconoce la desviación estándar poblacional σ puede ser necesaria una distribución alternativa, que se conoce como la distribución t de Student o distribución t simplemente.- Específicamente la distribución t se utiliza cuando se cumplen las tres condiciones siguientes: 1.- La muestra es pequeña, menor de 30 2.- σ es desconocida 3.- La población es normal o casi normal.Además, si no puede asumirse una población normal, se aumenta el tamaño de la muestra para utilizar la distribución Z y de no ser posible se debe recurrir a las pruebas no paramétricas.- La distribución t de Student, fue desarrollada en 1908 por William S. Gosset (1876-1937) quién se graduó en matemáticas en Oxford, trabajo como un experto cervecero en Cervecería Guinness de Dublin, Irlanda.Guinnes no permitía que sus empleados publicaran sus investigaciones, de manera que Gosset que le gustaba mucho jugar con los números, publico sus primeros trabajos sobre la distribución t con el seudónimo de Student y de esta manera proteger su trabajo.- Si la variable aleatoria X tiene una distribución normal, entonces el estadístico, X - μ S/ √n tiene una distribución t con n – 1 grados de libertad.Como desconocemos σ utilizamos S para estimarla.A igual que la distribución Z, la distribución t tiene una media igual a cero, es simétrica con respecto a la media y oscila entre - ∞ y + ∞ .- Sin embargo, mientras la distribución Z tiene una variancia igual a 1, la distribución t tiene una variancia mayor que 1, por lo tanto es más plana, más dispersa que la distribución Z.Esto se debe a que desconocemos σ y lo estimamos con el desvío estándar de la muestra.- Distribución Z Distribución t Cuando aumentan el número de grados de libertad, la distribución t se acerca poco a poco a la distribución normal hasta que las dos son casi idénticas.- Esto sucede porque S se convierte en un mejor estimador de σ cuando la muestra crece.- Con una muestra de tamaño 120 o más, S estima a σ con precisión suficiente que hay muy poca diferencia entre ambas distribuciones.- En realidad la distribución t es una familia de distribuciones, cada una con su propia variancia.- La variancia depende de los grados de libertad, definidos como el número de observaciones que se pueden elegir libremente.- Es el número de observaciones menos el número de restricciones impuestas sobre tales observaciones.Los valores de probabilidad t se buscan en la tabla de la Distribución t de Student, del Compendio de Tasas Estadísticas.- Veremos como se usa en Clase Práctica.- Pasemos Pasemos ahora ahora al al tema tema que que nos nos compete compete que que es es la la determinación determinación del del Intervalo Intervalo de de Confianza Confianza para para la la media media de de una una población población normal normal con con variancia variancia poblacional poblacional desconocida desconocida cuando cuando el el tamaño tamaño de de la la muestra muestra es es menor menor de de 30.30.- Veamos como surge el Intervalo de confianza P ( - t n-1; α/2 < t n-1 < + t n – 1; α/2) X– μ P ( - t n-1; α/2 < S/√n = 1- α < + t n – 1; α/2) = 1- α Despejamos el parámetro desconocido μ, nos queda: X - t n-1; α/2 S √n < μ < X + t n – 1; α/2 S √n Al ensayar un nuevo método de producción, se seleccionaron 18 empleados al azar y se les pidió lo probaran.- La tasa de producción promedio muestral para los 18 empleados fue de 80 partes por hora y la desviación estándar muestral fue de 10 partes por hora.Determine intervalos de confianza del 90 y 95% de la tasa de producción promedio poblacional con el nuevo método, suponiendo que la población tiene una distribución normal de probabilidades.SOLUCION Al 90 % t n - 1: α/2 = t17; 0,05 = 1,740 Al 95 % t n – 1 : α/2 = t17 ; 0,025 = 2,110 I de C del 90% X - t n - 1: α/2 10/4,24 < μ < X 80 - 1,740 * 2,358 < μ + t n - 1: α/2 < 80 + 1,740 * 2,358 75,90 80 ± 4,10 = 84,10 Amplitud intervalo: 10/4,24 84,10 - 75,90 = 8,2 I de C del 95% X - t n - 1: α/2 10/4,24 < μ < X 80 - 2,110 * 2,358 < μ + t n - 1: α/2 < 80 + 2,110 * 2,358 75,03 80 ± 4,97 = 84,97 Amplitud intervalo: 10/4,24 84,97 - 75,03 = 8,2 EJERCICIO PARA HACER EN CLASE Una muestra aleatoria de seis coches americanos de un determinado modelo consumen las siguientes cantidades en kilómetros por litro: 18.6 18.4 19.2 20.8 19.4 20.5 Determine un intervalo de confianza del 90 por ciento para el consumo de nafta medio poblacional de los automóviles de este modelo, suponiendo que la distribución es normalSolución Resp: x = 19.4833 (18,67 a 20,29) S² = 0.96 s = 0.98 EJERICICIO PARA MOSTRAR USO DEL PROGRAMA MINITAB Los precios del gasoil experimentaron una vertiginosa subida en los primeros años de este siglo.Supongamos que se realizado recientemente un estudio con camioneros que tenían mas o menos el mismo numero de años de experiencia para comprobar el comportamiento de 24 camiones de un determinado modelo en la misma autopista.- Estime la media poblacional del consumo de combustible de este modelo de camión con una confianza del 90 por ciento suponiendo que el consumo de combustible, en kilómetros recorrido por litro de estos 24 camiones es: 15.5 21.0 18.5 19.3 19.7 16.9 20.2 14.5 16.5 19.2 18.7 18.2 18.0 17.5 18.5 20.5 18.6 19.1 19.8 18.0 19.8 18.2 20.3 21.8 Solución Lo primero que debemos probar si los datos siguen aproximadamente una distribución normal.Gráfica de probabilidad de MPG Normal 99 Media Desv.Est. N AD Valor P 95 90 Porcentaje 80 70 60 50 40 30 20 10 5 1 14 15 16 17 18 19 MPG 20 21 22 23 18,68 1,695 24 0,286 0,594 En la grafica de probabilidad no se observa nada que indique la ausencia de normalidad.Estadísticas descriptivas: MPG Var MPG N 24 Media del Error Media estándar Desv.Est. Varianza Mínimo Mediana 18,679 0,346 1,695 2,874 14,500 18,650 Variable Máximo Sesgo Kurtosis MPG 21,800 -0,61 0,62 La media y mediana son casi iguales lo que indica que la distribución es simétrica.- T de una muestra N 24 Media 18,679 Desv.Est. 1,695 Media del Error estándar 0,346 IC de 90% (18,086; 19,272) Surge de tn-1; α/2 = t23;0.05 = 1.714 El intervalo de confianza al 90%, será: x ± t23; 0.05 s/√n = 18.68 ± 1.714 * 0.3460 = = 18.68 ± 0.5930 = (18.68 a 19.3) Podemos estar seguro que el promedio de consumo de gasoil por kilómetros de estos camiones esta entre 18,68 y 19,3 con un 90% de confianza.- 1.- El tiempo que demora una muestra de cinco empleados en desplazarse desde su casa al trabajo son: 30 42 35 40 45 a) Calcule el error estándar de la medias.b) Halle t n; α/2 correspondiente a el intervalo de confianza de la verdadera media poblacional al 95%.c) Calcule la amplitud de un intervalo de confianza al 95% de la media poblacional del tiempo que se tarda en desplazarse al trabajo.- 2.- Una empresa de alquiler de automóviles tienen interés en saber cuanto tiempo permanecen sus vehículos en el taller de reparaciones.- Formule todos los supuestos y halle el intervalo de confianza al 90% del numero anual medio de días que todos los vehículos de la flota de la empresa pasan en el taller de reparaciones si una muestra aleatoria de nueve automóviles mostró el siguiente numero de días que habia permanecido cada uno en el taller de reparaciones: 16 10 21 22 8 17 19 14 19 3.- Una tienda de ropa tiene interés en saber cuanto gastan los estudiantes universitarios en ropa durante el primer mes del año escolar.- El gasto medio de una muestra aleatoria de nueve estudiantes es de 157,82$ y la desviación estándar muestral es de 38,89$.Suponiendo que la población sigue una distribucion normal, halle el margen de error del intervalo de confianza al 95 por ciento de la media poblacional.- 4.- Preocupa la velocidad a la que se conduce en un determinado tramo de una autopista.- El radar indica la siguiente velocidad de una muestra aleatoria de siete automóviles en kilómetros por hora: 79 73 68 77 86 71 69 Suponiendo que la población sigue una distribución normal, halle el margen de error del intervalo de confianza al 95 por ciento de la velocidad media de todos automóviles que circulan por este tramo de la autopista.- 5.- El director de la oficina de colocación de una escuela de administración de empresas quiere estimar los sueldos anual medio que perciben los licenciados cinco año después.- Una muestra aleatoria de 25 licenciados tenia una media muestral de 42740$ y una desviación estándar muestral de 4780$.a)Halle un intervalo de confianza de la media poblacional al 90 por ciento, suponiendo que la población sigue una distribución normal.b) Halle un intervalo del 95%.c) Compare y explique cual es mejor estimación.- 6.- Una clínica ofrece un programa de adelgazamiento.- Según sus historiales, una muestra aleatoria de 10 pacientes habia experimentado las siguientes perdidas de peso en kilos al termino del programa: 18 25 6 11 15 20 16 19 12 7 a)Halle un intervalo de confianza de la media poblacional al 99 por ciento.b) Explique sin realizar los cálculos si el intervalo de confianza de la media poblacional al 90 por ciento seria mayor, menor o igual que el obtenido en el inciso a).- RESUMEN RESUMEN DE DE PROCEDIMIENTOS PROCEDIMIENTOS DE DE ESTIMACION ESTIMACION DE DE INTERVALO INTERVALO PARA PARA UNA UNA MEDIA MEDIA DE DE POBLACION POBLACION si si Se conoce no σ Usar S en lugar de σ no Es n ≥ 30 si si Se conoce σ La población es no normal no Usar S en lugar de σ Use Z Use Z Use Z Use t Utilizo Estadística No Paramétrica INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL POBLACIONA (Muestras grandes) Supongamos que estamos interesados en la proporción de miembros de la población que poseen un determinado atributo.- Por ejemplo, una empresa puede estar interesados en cuantos de sus clientes pagan con tarjeta en relación a los que pagan en efectivo; un empresario puede estar interesado en que proporción sus productos son no defectuosos en relación a los defectuosos, etc.En cada uno de estos casos, existen solo dos posibles resultados.- Por tanto, la preocupación se concentra en la proporción de respuestas que quedan dentro de uno de estos dos resultado.Situándonos en el marco de la distribución binomial, p representa la proporción de éxitos en n intentos independientes, cada uno con probabilidad de éxito p En secciones anteriores vimos que si n es grande en general, n * p mayor que 0,05 y n * p * (1 – p) mayor que 0,05, la distribución de las proporciones muestrales será normal, por lo tanto podemos usar Z para el Intervalo de Confianza.Sabemos que el error estándar de la distribución muestral de las proporciones muestrales es: σp = P ( 1 – P) n Podemos usar la proporción muestral para estima P, entonces: p(1–p) Sp = n Nuestro Intervalo de Confianza será: p ± Z α/2 * S p Veamos un ejemplo: A una muestra aleatoria de 142 directores de Recursos Humanos que ofertan trabajo a profesionales universitarios, se les pregunto Cual era el papel que jugaba el expediente académico en la evaluación de los candidatos.- Ochenta y siete de estos directores contestaron “definitivo”, “importante” o “muy importante”.Calcular un Intervalo de Confianza del 95% para la proporción poblacional de directores de recursos humanos que comparten esta opinión.Solución Entonces tenemos: n = 142 Sp = p = 87 / 142 = 0,613 p(1–p) n = Z α/2 = ± 1,96 y 0,613 * 0,387 142 = 0,040 0,613 ± 1,96 * 0,040 0,5346 0,613 ± 0,0784 = 0,6914 La proporción poblacional estará entre el 53 y 69%.Se puede conseguir I de C con menor amplitud si se toman muestras más grandes.- EJERICICIO PARA HACER EN CLASE La dirección quiere una estimación de la proporción de los empleados de la empresa que es partidaria de un plan de pluses modificado.Se ha observado que en una muestra aleatoria de 344 empleados, 261 están a favor de este plan.Halle una estimación por intervalo de confianza al 90 por ciento de la verdadera proporción de la población que es partidaria de este plan modificado.Solución Resp; (0,721 a 0,797) 1.- Una muestra aleatoria de 985 votantes probables – aquellos que votaría en las próxima elecciones- fue encontrada durante una encuesta telefónica dirigida por el Partido Justicialista.- De los encuestados 592 indicaron que votaría el candidato Justicialista en las próxima elecciones.- Construya un intervalo de confianza de 90% para P, la proporción de votantes en la población que piensa votar por el candidato justicialista.¿concluiría con base a esta información, que el candidato ganará la elección?.Rpta: 0,575 < P < 0,627 2.- Es importante que las compañías aéreas respeten las horas programadas de salida de los vuelos.- Suponga que una compañía ha examinado recientemente las horas de salida de una muestra aleatoria de 246 vuelos y ha observado que 10 vuelos se retrasaron debido al mal tiempo, 4 por razones de mantenimiento y el resto salio a su hora.a)Estime el porcentaje de vuelos que salieron a su hora utilizando un nivel de confianza del 98 por ciento.b) Estime el porcentaje de vuelos que se retrasaron debido al mal tiempo utilizando un nivel de confianza del 98 por ciento.- 3.- Suponga que las autoridades sanitarias creen que este año la epidemia de gripe será menor que durante el mismo periodo del año pasado.Se ha preguntado a los residentes de una zona metropolitana si esta noticia los disuadiría de vacunarse contra la gripe.- Si solo 40 personas de una muestra aleatoria de 246 declaran que ahora no se vacunarían, estime con una confianza del 98 por ciento la proporción de todos los residentes de la zona metropolitana que ahora consideran innecesario vacunarse contra la gripo.- 4.- En un año de elecciones presidenciales, los candidatos quieren saber que votarán los votantes de diferentes partes del país.- Suponga que se pregunta a 420 posibles votantes del noreste si votarían a un determinado candidato si las elecciones fueran hoy.- En esta muestra aleatoria 223 indicaron que votarían a favor de este candidato.- ¿Cuál es el margen de error?.Halle la estimación del intervalo de confianza al 95 por ciento del apoyo con que cuenta este candidato en el noreste.- 5.- En una muestra aleatoria de 198 estudiantes de marketing, 98 consideraron que no era ético inflar las calificaciones.Basándose en esta información, un estadístico calculo un intervalo de confianza de la proporción poblacional que iba de 0,445 a 0,545.¿Cuál es el nivel de confianza de este intervalo?.6.-Suponga que se pregunto a una muestra aleatoria de 142 responsables de las admisiones en programas de postgrado que papel desempeñan las calificaciones obtenidas en exámenes normalizados en la consideración de un candidato.- En esta muestra de 87 miembros respondieron un papel muy importante.- Halle el intervalo de confianza al 95 por ciento de la proporción poblacional de responsables que tienen esta opinión.- 7.- En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido la certificación ISO en los dos últimos años.Halle un intervalo de confianza al 99 por ciento de la proporción poblacional de empresas que han recibido la certificación en los últimos dos años.8.- En una muestra aleatoria de 400 posibles votantes de una ciudad, 320 indicaron que en las siguientes elecciones votarían a favor de una política propuesta.a) Calcule un intervalo de confianza del 98 por ciento de la proporción de la población que esta a favor de esta política.b) Calcule la amplitud de la estimación del intervalo de confianza al 90 por ciento de la proporción de la población que está a favor de esta política.- CONTROL DEL ANCHO DE UN INTERVALO Como hemos dicho anteriormente, es preferible un intervalo más estrecho debido a la precisión adicional que proporciona.- Hay Hay dos dos métodos métodos principales principales para para lograr lograr un un intervalo intervalo más más preciso.preciso.- Estos Estos son: son: a) REDUCCIÓN DEL NIVEL DE CONFIANZA b) INCREMENTO DEL TAMAÑO MUESTRA a) A veces perder un poco de confianza hace que se logren intervalos de confianza más estrecho, es decir que se logra mayor precisión en la estimación.- Incrementar el tamaño de la muestra es la única forma de reducir el tamaño del intervalo sin sufrir una pérdida de confianza.b) Incrementando el tamaño de la muestra se puede reducir el error estándar de las media muestrales, σ/√ n .- Para niveles de confianza como el 95 y 99% nos van a dar intervalos muy similares.- Es decir que mantenemos el nivel de confianza, pero esta ventaja no se gana sin un precio.- El tamaño más grande de la muestra significa más tiempo y dinero que deben gastarse al recolectar y manejar los datos.- De nuevo debe tomarse una decisión.- Respecto a que método tomar es una decisión gerencial.- DETERMINACIO N DEL TAMAÑO APROPIADO DE LA MUESTRA El tamaño de la muestra juega un papel importante al determinar la probabilidad de error así como en la precisión de la estimación.- Una vez que se ha seleccionado el nivel de confianza, dos factores importantes influyen en el tamaño muestral.- 1.- La variancia de la población σ² 2.- El tamaño del error tolerable que el investigador está dispuesto a aceptar.- Mientras que el 1) esta fuera del alcance del Mi investigador y nada se puede hacer, en el 2) si es posible limitar el tamaño del error.- El tamaño del error que un investigador puede tolerar depende de que tan crítico es el trabajo que está realizando.Algunas tareas extremadamente delicadas requieren de resultados exactos ; por ejemplo, los procedimientos médicos de los cuales dependen la vida humana; la producción de piezas de una máquina que debe cumplir especificaciones precisas, pueden tolerar un muy pequeño error, etc, en otros casos los errores más grandes pueden tener consecuencias menos graves.- En los ejemplos que vimos sobre Intervalos de Confianza, el tamaño de la muestra se determino de manera arbitraria sin tomar en cuenta el tamaño del intervalo de confianza.En el mundo de los negocios, la determinación de un tamaño de muestra adecuado es un procedimiento complicado sujeto a restricciones de presupuesto, tiempo y facilidad de selección.- Para entender esto, suponga que usted como Auditor de la Empresa Garbarino, quisiera estimar el promedio o la proporción de facturas que contienen errores, intentaría determinar de antemano la calidad requerida de la estimación.Esto significa que debe decidir la cantidad de error que esta dispuesto a permitir al estimar estas variables.- También debe determinar de antemano la confianza que desea tener de obtener una estimación correcta del parámetro de población verdadero.- VEREMOS AHORA COMO DETERMINAR EL TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA POBLACIONA L LA PROPORCION POBLACIONAL DETERMINACION DEL TAMAÑO DE LA MUESTRA PARA LA MEDIA.Para determinar el tamaño de la muestra necesario para estimar la media, debe tenerse en cuenta la cantidad de error de muestreo que se aceptará y el nivel de confianza deseado.- Por otro lado, debe tener alguna información de la desviación estándar.- Recordemos que: Z = X - μ σ √n Donde Z es el valor crítico correspondiente a un área de ( 1 - α) / 2 desde el centro de una distribución normal estándar.- Si se multiplica ambos lados de la ecuación por σ /√ n tiene: σ Z = X - μ √n se Entonces el valor de Z es negativo o positivo, según si X es mayor o menor que μ.La diferencia entre la media muestral y la media poblacional que simbolizamos con E, se conoce como error de muestreo .- Entonces: E = Z σ √n n= Z² σ² E² De acuerdo con la fórmula de n, para determinar el tamaño de la muestra, deben conocerse los tres factores siguientes: a) El intervalo de confianza deseado, que determina el valor de Z o valor crítico en la distribución normal estándar.b) El error de muestreo E aceptable.c) La desviación estándar σ.En la práctica profesional casi nunca es fácil determinar estas tres cantidades.- En esos casos se debe recurrir a personas expertas en estos temas.- Veamos un ejemplo: Un grupo de consumidores desea estimar el monto de las facturas de energía eléctrica para el mes de julio para las viviendas unifamiliares en una gran ciudad.Con base a estudios realizados en otras entidades, se supone que la desviación estándar es de 25 $.- El grupo desea estimar el monto promedio para julio dentro de ± 5 pesos del promedio verdadero con 99% de confianza.a) ¿Qué tamaño de muestra necesita?.b) Si desea 95 % de confianza.- ¿Qué tamaño de muestra necesitaría?.Solución a) n = 2,58² 25² = 5,0² n = 166,41 a) n = 1,96² 25 167 facturas 25² 5,0² n = 96,04 6,6564 * 625 = 3,8416 * 625 25 97 facturas Veamos un ejemplo.- El propietario de un gran centro de esquí de los Estados Unidos esta considerando comprar una máquina para hacer nieve y ayudar a la madre naturaleza a proporcionarle una base apropiada para los fanáticos esquiadores.- Si el promedio de nevadas parece insuficientes, piensa que la máquina debería pagarse sola muy pronto.- Planea estimar las pulgadas promedio de nieve que caen el área, pero no tiene idea que tan grande tiene que ser la muestra.- Solo sabe que desea un 99% de confianza en sus hallazgos y que el error no debe exceder de 1 pulgada.- El propietario le promete abonos gratuitos.- ¿Usted puede ayudarlo?.Solución Usted comienza con una muestra piloto grande n ≥ 30, que en el estudio produce una desviación estándar de 3,5 pulgadas.- Entonces: n = Z² σ² E² = 2,58² 3,5² = 81,5 82 1,0² Ahora puede recolectar los datos sobre las últimas 82 nevadas que se utilizaran para estimar las nevadas promedio.- Con esta información el propietario puede determinar si la madre naturaleza necesita ayuda.Lo más importante es que usted puede pasar el resto del invierno esquiando gratuitamente.- DETERMINACION DEL TAMAÑO DE LA MUESTRA PARA LA PROPORCION Los métodos de determinación del tamaño de la muestra para la proporción son similares a lo visto para estimar la media.Recordemos que: Z= p - P P * (1 -P) n Donde Z es el valor crítico que corresponde a un área de (1 – α)/ 2 desde el centro de una distribución normal estándar.- Al multiplicar queda: ambos lados por el denominador, nos P * (1 -P) Z = ( p - P) n El error de muestreo E es igual ( P - P), la diferencia entre la proporción muestral y el parámetro estimado P.Este error de muestreo se define como: P * (1 -P) E = Z * n Al despejar n de nuestra fórmula anterior nos queda: n = Z² * P (1 – P) E² Para determinar el tamaño de la muestra que permita estimar una proporción, se debe definir tres incógnitas: a) El nivel de confianza deseado.b) El error de muestreo E.c) La proporción verdadera de éxito P.- En la practica profesional la determinación de estas tres cantidades requiere toda una planificación.El nivel de confianza deseado me dará el valor de Z.- El error de muestreo será la cantidad de error que se está dispuesto a tolerar al estima la proporción P de la población.- La tercera cantidad es la proporción de éxito P, en realidad “es el parámetro de la población que se quiere encontrar”, entonces ¿como se establece un valor que es justo para lo que se debe tomar una muestra que permita determinarlo?.Primero se debe recurrir a información histórica o experiencias previas que ayuden a estimar una predicción de P.- Cuando no encontramos nada que nos ayude, suponemos P = 0,50 como la manera más conservadora de determinar el tamaño de la muestra.- Es posible que el uso de P = 0,50 sobreestime el tamaño de la muestra porque la proporción muestral real se usa para desarrollar el intervalo de confianza.Si la proporción muestral es muy diferente de 0,50, el ancho del intervalo de confianza será más angosto que el requerido en un principio.- La mayor precisión la obtenemos a costa de gastar más tiempo y dinero en un tamaño de muestra más grande.Veamos un ejemplo.- Supongamos que el Poder Legislativo de nuestra ciudad está planeando una Ley que prohíbe fumar en todos los edificios públicos incluyendo restaurantes, confiterías, cines etc.- Solo estará exentas las viviendas particulares.- Sin embargo, la legislatura antes de sacarla definitivamente, desea saber que proporción de la población acompaña tal medida.- La carencia de toda habilidad estadística por parte de los legisladores obliga a citarlo a usted como consultor.- Su primer paso será determinar el tamaño muestral necesario.- Se le dice que su error no debe exceder del 2 % y usted debe estar 95 % seguro de sus resultados.Solución Debido a que no se tomo previamente una muestra piloto, usted debe determinar temporalmente un P = 0,50 para determinar el tamaño muestral.Al despejar n de nuestra fórmula anterior nos queda: n = Z² * P (1 – P) E² n = 1,96² * 0,50 * 0,50 = 2401 ciudadanos 0,02² Con los datos suministrados por los 2401 ciudadanos usted puede proceder con su estimación de la proporción de todos los ciudadanos que están a favor de la ley.- Recién el legislativo tomará una decisión.- EJERICICIO PARA HACER EN CLASE Unos fabricantes de tubo de polivinilo quieren tener un suministro suficiente para satisfacer las necesidades del mercado.- Desean hacer una investigación entre los comerciantes al mayoreo que compran el tubo de polivinilo a fin de estimar la proporción en que planean aumentar sus compras el próximo año.- ¿Qué tamaño de muestra se requiere si desean que su estimación quede dentro de 0,04 de la proporción real con probabilidad igual a 0,90?.Rpta: n = 422,7 LIMITES DE CONFIANZA UNILATERALES Los intervalos de confianza que hemos visto hasta ahora, se denomina intervalos de confianza bilaterales, porque producen un límite inferior y un límite superior para el parámetro de interés.No obstante, algunas veces el experimentador solo está interesado en uno de esos límites, es decir, necesita un límite superior (o quizás el límite inferior) para el parámetro de interés.Cuando la distribución muestral de un estimador puntual es aproximadamente normal, es posible usar el mismo argumento que hemos visto al principio de intervalos de confianza, solo que usaremos cuando la muestra es suficientemente grande, Zα.- Entonces: Limite inferior del Intervalo: Estimador puntual - Zα * error estándar del estimador Limite superior del Intervalo: Estimador puntual + Zα * error estándar del estimador fx α 0 Zα EJERCICIO PARA HACER EN CLASE Una corporación planea emitir algunas acciones a corto plazo y tiene la esperanza de que el interés a pagar no exceda 11,5 %.- Para obtener alguna información con respecto a este problema, la corporación comercializó 40 acciones, cada una a través de 40 agencias de correduría.- La media y la desviación estándar para las 40 tasas de interés fueron 10,3 y 0,31 % respectivamente.Puesto que la corporación está interesada solo en un límte superior en las tasas de interés, encuentre un límite superior de 95% para la tasa de interés media que la corporación tendrá que pagar por las notas.Repta: 10,3806 EJERCICIOS GENERALES 1.- Se extrajo una muestra aleatoria de 172 estudiantes de Contabilidad y se les pidió que evaluaran una determinada condición de trabajo en una escala de 1 (no importante) a 5 (extremadamente importante).- La “seguridad en el trabajo” recibió una calificación media de 4,38 con una desviación estándar muestral de 0,70.Calcular y explicar un intervalo de confianza del 99 por ciento para la media poblacional.Resp: (4,24 a 4,52) 2.- En un estudio de los efectos de las fusiones en la industria del transporte por carreteras, se examinó una muestra aleatoria de 17 empresas resultantes de una fusión y midió el incremento en la tasa de crecimiento de la carga en toneladas transportada en el período posterior a la fusión, comparándolo con el anterior a dicha fusión.Para cada una de estas empresas, se examinó otra empresa con una localización y tamaño similares pero que no habían participado en una fusión.- Se calculó la diferencia en las tasas de crecimiento de ambas clases de empresas.- Los valores muestrales que surgieron como resultado de dicho cálculo tenían media 0,105 y una desviación estándar de 0,440.- Calcule un intervalo de confianza del 90 por ciento para la media poblacional, asumiendo que la distribución de la población es normal.Resp: (- 0,121 a 0,331).- (con t).- 3.- Para tratar de estimar la media de consumo por cliente, en un gran restaurante, se reunieron datos de una muestra de 49 clientes, durante un período de 3 semanas: Suponga que la desviación estándar de población es de 2,50 dólares.¿Cuál es el error estándar de la media?.Con un nivel del 95%, ¿Cuál es el margen de error?.Si la media de la muestra es de $22,60 dólares, ¿Cuál es el intervalo de confianza del 95% para la media de la población?.4.- Los Ingresos semanales de las personas que trabajan en varias industrias aparecieron en el cierta revista económica.- Esos ingresos para quienes trabajan en los servicios fueron de 369$.Suponga que los resultados se basaron en una muestra aleatorias simple de 250 personas dedicados a los servicios y que la desviación estándar de la muestra fue 50$.- Calcule un intervalo de confianza del 95% para la población de ingresos semanales de personas que trabajan en servicios.- 5.- Se determinó la rentabilidad de vender automóviles usados, en un estudio de la Asociación Nacional de Comerciantes de Automóviles.- Suponga que con una muestra de 200 vendedores de autos usados se obtuvo una ganancia promedio de $300 y una desviación estándar de 150$.- Con esta información defina un estimado de intervalo de confianza del 95% para la utilidad promedio de la población de ventas de autos usados.6.- Una muestra de 532 suscriptores a la revista Mercado, mostró que el tiempo promedio que pasa un suscriptor en Internet y en servicios en línea es de 6,7 horas semanales.Si la desviación estándar de la muestra es de 5,8 horas.¿Cuál es el intervalo de confianza de 95% de la población de tiempos promedio que pasan los suscriptores a Mercado en Internet y en servicios en línea?.- 7.- La Asociación Internacional de Transporte hace encuestas entre agentes viajeros para determinar calificaciones de calidad de los aeropuertos transatlánticos principales.- La calificación máxima es 10.- El aeropuerto con mayor calificación fue Ámsterdam con una calificación promedio de 7,93, seguido por Toronto con 7,17.Suponga que se toma una muestra aleatoria de 50 agentes viajeros y que a cada uno se le pidió calificar el aeropuerto de Buenos Aires.- A continuación vemos las calificaciones obtenidas con la muestra de 50: 6 4 6 8 7 7 6 3 3 8 7 8 7 5 9 5 8 4 3 8 4 4 8 4 5 6 2 5 9 9 9 9 5 9 7 8 3 10 8 9 10 5 8 6 4 5 4 8 4 8 a) Determine un estimado por intervalo de confianza del 95%.b) Determine un estimado por intervalo de confianza del 98%.c) Determine un estimado por intervalo de confianza del 92 %.d) Explique cada uno de ellos y fundamente la mejor estimación de la calificación promedio poblacional.- 8.- La encuesta anual de calidad de automóviles efectuada por cierta Consultora, determinó que la cantidad promedio de defectos en todas las marcas, por cada vehículo nuevo es de 1,07.- Suponga que se toma una muestra de 30 automóviles nuevos de determinada marca y se obtuvieron las siguientes cantidades de defectos por vehículo: 0 1 1 2 1 0 2 3 2 1 2 0 0 2 0 1 1 3 4 0 3 0 2 0 2 0 3 1 0 2 a) Con estos datos ¿Cuál es el promedio muestral de la cantidad de defectos por vehículo?.b) ¿Cuál es la desviación estándar de la muestra?.c) Determine un estimado por intervalo de confianza del 95% para la cantidad promedio de defectos por vehículo para la población de automóviles de esta marca.d) Después de revisar el estimado de confianza de la parte c), un analista estadístico sugirió que el fabricante revisara una mayor cantidad de automóviles nuevos antes de llegar a una conclusión al comparar la calidad de sus vehículos con el promedio general de 1,07 defectos por vehículos.- ¿Respalda usted esta idea?, ¿Por qué?.- 9.- Una operación de llenado de envases tiene desviación estándar histórica de 5,5 onzas.- Un inspector de control de calidad selecciona periódicamente 36 recipientes al azar, y emplea el peso de llenado promedio de la muestra para estimar el correspondiente a la población.a) ¿Cuál es el error estándar del promedio?.b) Con 0,95, 0,90 y 0,99 de probabilidad, ¿Qué se puede afirmar acerca del error de muestreo?.-¿Qué sucede a la declaración del error de muestreo cuando aumenta la probabilidad?.- ¿Por que sucede así?.c) ¿Cuál es el intervalo de confianza del 99% para el peso promedio de llenado de la población en el proceso, si el promedio muestral es de 48,6 onzas?.- 10.- La Asociación Argentina de Agencias de Publicidad tiene registros de datos sobre minutos de anuncios por cada media hora de programas principales de Televisión.En la tabla siguiente vemos una lista de datos representativos de una muestra de programas preferentes en cadena principales a las 8,30 PM..6,0 5,8 6,3 6,4 6,0 7,2 6,5 7,2 7,6 6,0 6,6 7,0 6,2 5,7 7,0 6,2 6,5 7,3 6,8 6,2 Determine un estimado puntual y calcule un Intervalo de confianza del 95% para la cantidad promedio de minutos de anuncios en los principales espectáculos televisivos a las 8,30 PM.- (con t) 11.- La cantidad de horas que duermen los argentinos cada noche varia mucho desde el 12 % de la población que duerme menos de 6 horas hasta el 3% que duerme más de 8 horas.- A continuación vemos la muestra de las horas que duermen por la noche 25 personas: 5.3 6.7 7.2 6.0 6.5 8.6 7.7 6.9 7.8 7.3 6.8 7.6 6.2 7.6 6.9 5.8 5.5 7.1 7.2 6.0 7.6 7.0 6.6 6.5 7.1 a) ¿Cuál es el estimado puntual de la media de población de la cantidad de horas que se duerme cada noche?.b) Suponiendo que la población tiene una distribución normal, determine un Intervalo de confianza del 95% para la cantidad de la media de población de horas de sueño cada noche.c) Suponiendo que la población tiene una distribución normal, determine un Intervalo de confianza del 92% para la cantidad de la media de población de horas de sueño cada noche.d) Suponiendo que la población tiene una distribución normal, determine un Intervalo de confianza del 90% para la cantidad de la media de población de horas de sueño cada noche.e) ¿Cuál de las estimaciones aconsejaría usted? ¿Por qué?.- (con t) 12.- Se cree que los sueldos anuales iniciales de egresados de Licenciatura en Administración de Empresas pueden tener una desviación estándar aproximada de 2000$.- Suponga que se desea un estimado de intervalo del 95% de nivel de confianza para la media del sueldo anual inicial.- ¿De que tamaño debe tomarse la muestra si el margen de error es: a) 500$? b) 200$? c) 100$? 13.- La Cámara Argentina de Viviendas, publica datos del alquiler mensual de viviendas con un dormitorio en cierta área metropolitana.- La desviación estándar de la renta mensual es aproximadamente de $80,0.- Suponga que se debe seleccionar una muestra de área metropolitana para estimar la media de la población de renta mensual de viviendas con un solo dormitorio.Emplee el nivel de confianza del 95%.a) ¿De que tamaño debe ser la muestra para que el margen de error deseado sea de 25,0$?.b) ¿De que tamaño debe ser la muestra para que el margen de error deseado sea de $15,0?.- 14.- El tiempo de traslado al trabajo para residentes de las 15 ciudades mayores de la provincia de Buenos Aires aparece en una revista técnica.- Suponga que se emplea una muestra aleatoria simple preliminar de residentes de Morón y se determina que 6,25 minutos es el valor de planeación de la desviación estándar poblacional.Si se desea estimar la media de la población del tiempo de traslado para los residentes de Morón, con 2 minutos de margen de error, ¿Qué tamaño de la muestra se debe usar?.- Suponga una confianza del 95%.Si se desea que el margen de error sea de 1 minuto, ¿Qué tamaño de la muestra se debe usar?.- Suponga una confianza del 95%?.- 15.- En una encuesta realizada por cierta consultora, se pidió a 814 adultos que contestaran un cuestionario acerca de sus ideas sobre el estado general interno de Argentina.- A la pregunta ¿“Cree usted que todo va bien en Argentina en la actualidad “?,562 adultos contestaron que SI.a) ¿Cuál es el estimado puntual de la proporción poblacional de adultos que creen que las cosas van bien en Argentina?.b) ¿Cuál es el margen de error con el 90% de confianza?.c) ¿Cuál es el intervalo de confianza del 90% para la proporción de adultos que creen que todo va bien en Argentina?.- 16.- Esteban Rossi, reunió datos sobre las actitudes acerca de la calidad del servicio a clientes en tiendas de ventas al menudeo.- La encuesta determinó que el 28% de los argentinos creen que el servicio al cliente es mejor en la actualidad que hace dos años atrás.Si en una muestra participaron 650 adultos, determine un intervalo de confianza del 90% de la proporción poblacional de adultos que creen que el servicio al cliente es mejor actualmente que hace dos años.- 17.- Una consultora llevó a cabo una encuesta nacional de 902 golfistas mujeres para estudiar como se consideran tratadas en los campos de golf.- En la encuesta se encontró que 397 mujeres están satisfechas con los tiempos disponible de caddie, 307 estaban satisfechas con los reglamentos de membresías el, y 234 estaban satisfechas con las instalaciones de los vestidores.a) Determine el estimado puntual de la proporción poblacional y el intervalo de confianza del 95% para cada una de las tres preguntas de la encuesta.b) Determine intervalo de confianza del 90 % para cada una de las tres preguntas de la encuesta.c) De conclusiones.- 18.- La conserjería de hacienda también quiere información sobre las tarjetas de estacionamiento de minusválidos.- Suponga que en una muestra de 350 transacciones relacionadas con estas tarjetas se observó que 250 se pagaron electrónicamente.a) ¿Cuál es el margen de error de una estimación de la proporción poblacional de tarjetas pagadas electrónicamente considerando un intervalo de confianza de 99%?.b) Indique sin realizar los cálculos si es el margen de error de una estimación similar a la anterior pero con un nivel de confianza al 95% es mayor, menor o igual que el obtenido en el inciso a) en el que el nivel de confianza era del 99%.Resp: a) 0.9623 b) menor 19.- ¿Cuál es el método más frecuente para renovar el permiso de circulación de los vehículos?.Examinando una muestra aleatoria de 500 renovaciones en una provincia, la conserjería de hacienda observó que 200 se realizaron por correo, 160 se pagaron en persona y el resto se pago por Internet.- Esta operación no podía realizarse por teléfono.a) Estime la proporción poblacional que paga la renovación en persona en las oficinas de la consejería de hacienda.- Utilice un nivel de confianza del 90 por ciento.b) Estime la proporción poblacional de renovación por Internet.- Utilice un nivel de confianza del 95 por ciento.- c) Suponga que calculáramos para la proporción poblacional que paga renovación por correo un intervalo de confianza que fuera de 0,34 a 0,46.¿Cuál es el nivel de confianza de este intervalo?.d) Se ha dicho en un período local que menos de un tercio (entre el 23,7 y el 32,3 por ciento) de la población prefiere pagar por Internet.¿Cuál es el nivel de confianza de ese intervalo?.Resp. a) b) d) c) 99,38 % 20.- Existen varios medicamentos para tratar la diabetes.Un experto en ventas de una importante compañía farmacéutica necesita una estimación del numero de nuevas prescripciones de su nuevo medicamento contra la diabetes que se hicieron durante un determinado mes.-El numero de nuevas prescripciones en una muestra aleatoria de 10 distritos de ventas es: 210 240 190 275 290 265 312 284 261 243 a) Halle un intervalo de confianza al 90% del numero medio de prescripciones de este nuevo medicamento en todos los distritos de ventas,. Indique los supuestos.b) Calcule la amplitud de los intervalos de confianza al 95 y 98 %.Resp: a) 235,4318 a 278,5628 b) normalidad c) 230.39 a 283.61 al 95% 223.815 a 290.815 al 98% 21.- Todo el mundo sabe que el ejercicio físico es importante.- Recientemente, se ha encuestado y se ha preguntado a los residentes de una comunidad cuantos minutos dedicaban diariamente a hacer algún tipo de ejercicio riguroso.- En una muestra aleatoria de 50 residentes, el tiempo medio dedicado diariamente a hacer algún ejercicio riguroso era de media hora.- Se observó que la desviación estándar era de 4,2 minutos.- Halle una estimación del intervalo de confianza al 90% del tiempo que dedican diariamente estos residentes a hacer algún tipo de ejercicio riguroso.Resp: 29.0209 a 30.9771 22.- Un ayudante de estudios de mercado de un hospital veterinario encuestó a una muestra aleatoria de 457 propietario de animales domésticos.- Les pidió que indicaran el número de veces que van al veterinario al año.- La media muestral de las respuesta fue de 3,59 y la desviación estándar fue de 1,045.Basándose en estos resultados se calculo el intervalo de confianza de la media poblacional de 3,49 a 3,69.a) Halle la probabilidad que corresponde a este intervalo.b) Estime un intervalo de confianza para la media poblacional al 99 por ciento.Resp: a) 95.96% b) INTERVALOS DE CONFIANZA PARA DOS MEDIAS POBLACIONALES Veremos en este caso métodos basados en intervalos de confianza para estimar algunos parámetros de dos poblaciones.- Un importante problema en la inferencia estadística es la comparación de dos medias de poblaciones que siguen una distribución normal o la comparación de dos proporciones de grandes poblaciones.Por ejemplo: a) Los ejecutivos de las cadenas minoristas pueden querer estimar la diferencia entre las ventas diarias de dos de sus establecimientos.b) Los fabricantes pueden querer comparar la productividad media, en unidades por hora de los trabajadores del turno de día y del turno de noche de una planta.c) Una compañía química recibe envios de dos proveedores.- Se selecciona muestras aleatorias independientes de lotes procedentes de los dos proveedores y se comparan los niveles de impurezas de los dos lotes.- INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES Hay situaciones donde se necesita estimar la diferencia entre la media de dos poblaciones.- A partir de cada población se extrae una muestra aleatoria independiente y de cada una de ella se calcula las medias muestrales x1 y x2, respectivamente.En la Unidad de Distribuciones Muestrales, se dijo que el estimador x1 - x2 ofrece una estimación insesgada de la diferencia entre las medias poblacionales µ1 - µ2.- La variancia del estimador es σ²1/n1 + σ²2/n2 .También hemos mencionado que según las condiciones, la distribución muestral de x1 - x2, puede presentar una distribución al menos aproximadamente normal, de modo que en muchos casos se utiliza la distribución normal para estimar un intervalo de confianza para µ1 - µ2 .- Cuando se conoce la variancia de la población el intervalo de confianza para µ1 - µ2 esta dado por: ( x1 - x2) ± Z1- α/2 σ²1/n1 + σ²2/n2 El análisis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece información util para decidir si es no probable que las medias de las dos poblaciones sean iguales.- Cuando el intervalo no incluye al cero, se dice que el intervalo ofrece evidencia de que las dos medias poblacionales tienen medias diferentes.Cuando el intervalo incluye al cero, se dice que las poblaciones pueden tener medias iguales.- VEAMOS UN EJEMPLO Las calidades de desgaste de dos tipos de neumáticos para automóviles se compararon mediante muestras probadas en carreteras de n1 = n2 = 100 automóviles de cada tipo.- El número de kilómetros hasta el desgaste final se definió como una cantidad específica de uso del neumático.- Los resultados de la prueba aparecen en la tabla siguientes.- Estime (µ1 - µ2 ) , la diferencia en kilómetros promedio hasta el desgaste final, con un intervalo de confianza de 99%.- ¿Hay una diferencia en la calidad de desgaste promedio para los dos tipos de neumáticos?.Neumático 1 Neumático 2 Media Media 25100 kilómetros 26400 kilómetros Variancia1440000 kilómetros² Variancia 1960000 kilómetros² Solución: La estimación puntual de µ1 - µ2 es x1 - x2 = 26400 – 25100 = 1300 kilómetros.- El coeficiente de confiabilidad que corresponde a 0,99, localizado en la Tabla de la Normal Estandarizada es 2,58.- El error estándar es: σ x 1 - x2 = σ ²1 n1 + σ²2 n2 = 1440000 100 + 1960000 100 = 184,8 Por lo tanto, el intervalo de confianza del 99% será: 1300 ± 2,58 (184,8) 1300 ± 475,8 ( 824,2 a 1775,8) Se dice que se tiene una confianza del 99% de que la diferencia real entre las medias poblacionales este entre 824,2 y 1775,8 kilómetros, porque en muestreos repetidos 99% de los intervalos construidos de esa manera incluiría la diferencias entre las medias reales.Como dentro del intervalo no incluye el cero, se concluye que las dos poblaciones tienen diferentes medias.Muestreo a partir de poblaciones que no siguen una distribución normal.La elaboración de un intervalo de confianza para la diferencia entre las medias de dos poblaciones que no siguen una distribución normal es igual al caso anterior siempre que n1 y n2 sean grandes.- Es evidente que esto es el resultado de aplicar el teorema central del límite.- Si se desconocen las variancias de la población se utilizan las variancias de la muestra para estimarlas.- VEAMOS UN EJEMPLO En un esfuerzo por comparar los salarios iniciales anuales para graduados de la universidad especializados en educación y ciencias sociales, se seleccionaron muestras aleatorias de 50 estudiantes recién graduados en cada especialidad y se obtuvo la siguiente información: Especialidad Media Desvió estándar Educación 40554 2225 Ciencias Sociales 38348 2375 a) Encuentre una estimación puntual para la diferencia en la medida de los sueldos iniciales anuales de estudiantes universitarios recién graduados que se especializaron en educación y ciencias sociales.- ¿Cuál es el margen de error en estimación?.- b) Con base a los resultados del inciso a) diferencia importante en las medias de los dos la población general?.- ¿hay una grupos en c) Calcule un Intervalo de confianza de 95%.Solución La estimación puntal para la diferencia entre las medias de las poblaciones es la diferencia entre las medias de las muestras, 40554 - 38348 = 2206.- Sabemos que para una confiabilidad del 95% le corresponde 1,96.- La estimación del error estándar es: 5640625 4950625 S x1 - x2 = 50 + 50 = 902,08 El intervalo de confianza será: 2206 ± 1,96 (460,2445) 2206 ± 902,08 (1303,92 a 3108,08) El intervalo no contiene al cero, lo que podemos decir con un 95% de confianza que hay diferencia entre los promedios anuales de los graduados en las distntas especialidades.- EJERCICIO PARA HACER EN CLASE Uno de los costos principales al planear las vacaciones de verano es el costo del hospedaje.- Incluso dentro de una cadena particular de hoteles, los costos varían sustancialmente dependiendo del tipo de habitación y los servicios ofrecidos.- Suponga que elige al azar 50 estados de cuentas de cada una de las bases de datos de las cadenas de hoteles, Marriott, Sheraton, y Hilton, y se registra las tarifas de alojamientos nocturnos: Marriott Sheraton Hilton Promedio muestral 170 145 150 Desvió estándar muestral 17,5 10,0 16,5 a) Encuentre un intervalo de confianza de 95% para la diferencia en las tarifas promedio de alojamiento para las cadenas de hoteles Marriott y Hilton.b) Encuentre un intervalo de confianza de 99% para la diferencia en las tarifas promedio de alojamiento para las cadenas hoteleras Sheraton y Hilton.c) ¿Los intervalos de los incisos a) y b) contienen el valor (μ - μ )? ¿Por qué es de interés para el investigador?.d) ¿Los datos indican una diferencia en las tarifas promedio de alojamiento entre las cadenas Marriott y Hilton?, ¿entre las cadenas Sheraton y Hilton?.Solución DISTRIBUCION t Y LA DIFERENCIA ENTRE LAS MEDIAS.Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblaciones con un intervalo de confianza, es posible utilizar la distribución t para suministrar el factor de confiabilidad si se conocen ciertas suposiciones: se debe saber o suponer de buena fe, que las dos poblaciones muestreadas siguen una distribución normal.- Respecto a las variancias se debe distinguir entre dos situaciones: LAS VARIANCIAS SON IGUALES LAS VARIANCIAS SON DISTINTAS Variancias poblacionales iguales. Si la suposición sobre igualdad de las variancias poblacionales esta justificada, las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estimación de lo mismo, es decir, la variancia común.- Parece lógico entonces, aprovechar este hecho en el análisis en cuestión.- Esto es precisamente lo que se hace para establecer una variancia conjunta para la variancia común.Esta variancia se obtiene mediante el calculo promedio ponderado de las dos variancias de las muestras.- Cada variancia de la muestra es ponderada por los grados de libertad.- Si los tamaños de muestras son iguales, este promedio ponderado es la media aritmética de las variancias de las dos muestras .- Si el tamaño de las dos muestras es distinto, el promedio ponderado aprovecha la información adicional proporcionada por la muestra mayor.- La estimación conjunta se obtiene con la formula: S²p = (n1- 1) S²1 + (n2- 1) S²2 (n1 + n2 – 2) Así, la estimación del error estándar esta dada por: S x 1 - x2 = S²p n1 + S²p n2 El intervalo de confianza de 100 (1 – α) por ciento para la diferencia µ1 - µ2 esta dada por ( x1 - x2) ± t1 - α/2 S x 1 - x2 El número de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n1 - n2 - 2 que es el denominador de la ecuación de S²p .Este intervalo se interpreta de la forma habitual.- Veamos un ejemplo: Un estudio tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una empresa inscriptos en un programa supervisado de acondicionamiento físico.- Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron al programa y que permanecieron activos por 13 años en promedio, y de 17 individuos (el segundo grupo, el sedentario) que decidieron no inscribirse.- Entre los datos que se registraron acerca de los individuos está el número máximo de sentadillas realizadas en 30 segundos.El grupo deportista obtuvo una media y una desviación estándar de 21,0 y 4,9 respectivamente.- La media y la desviación estándar para el grupo sedentario fue de 12,1 y 5,6 respectivamente.- Se considera que las dos poblaciones de mediciones de acondicionamiento físico muscular sigue una distribución normal y que las variancias para ambas poblaciones son iguales.- Se pretende elaborar un intervalo de confianza del 95% para la diferencias entre las medias de las poblaciones representadas por las dos muestras.Solución Primero calculamos la estimación conjunta de la variancia común de las poblaciones: S ²p = (13 – 1) 4,9² + (17 – 1) 5,6² 13 + 17 - 2 = 28,21 Entramos a la tabla de la t con 28 grados de libertad y obtenemos un factor de confiabilidad de 2,0484.- Podemos ahora calcular el intervalo de confianza del 95% para la diferencia entre las medias de las dos poblaciones: (21,0 - 12,1) ± 2,0484 28,21 13 + 28,21 17 8,9 ± 4,0085 4,9 a 12,9 Se tiene una confianza del 95% de que la diferencia entre las medias de las poblaciones están entre 4,9 y 12,9.Debido a que el intervalo no incluye al cero, se puede concluir que las medias de las poblaciones son diferentes.- EJERICICIO PARA HACER EN CLASE Los residentes de la ciudad de Córdoba se quejan de que las multas de tráfico por exceso de velocidad son más altas en su ciudad que las que se imponen en la vecina ciudad de Rió Cuarto.- Las autoridades acordaron estudiar el problema para ver si las quejas son razonables.- Se obtuvieron muestras aleatorias independientes de las multas pagadas por los residentes de cada una de las ciudades durante tres meses.- Las cuantías de estas multas eran: Córdoba 100 125 135 128 140 142 128 137 156 142 Rió Cuarto 95 87 100 75 110 105 85 95 Suponiendo que la variancia poblacional es igual, halle el intervalo de confianza de 95% de la diferencia entre los costos medios de las multas de estas dos ciudades.- RESPUESTA DEL EJERCICIO USANDO MINITAB.a) Cargamos los datos de las dos muestras, una en C1 y otra en C2.b) Nos posicionamos en la columna C3.c) Nos dirigimos con el cursor a Estadística Básica y damos enter a “t de 2 muestras”.d) En la ventana siguiente tipiamos Muestras en diferentes columnas.- Seleccione C1 en la primera y C2 en la segunda.e) Tecleamos asumir variancias iguales.f) Nos vamos a Opciones y registramos el nivel de confianza que nos interesa y Aceptamos.g) Luego Aceptamos y nos queda lo siguiente: IC de dos muestras: C1. C2 t de dos muestras para C1 vs. C2 N C1 10 C2 8 Media Desv. Est. 133,3 14,8 94,0 11,4 Media del Error estándar 4,7 4,0 Diferencia = mu (C1) - mu (C2) Estimado de la diferencia: 39,30 IC de 95% para la diferencia: (25,84. 52,76) A largo plazo hay una diferencia entre el costo de las multas de Córdoba y Río Cuarto.- El costo medio de una multa impuesta en Córdoba es entre 25,84 y 52,76 más alto que el costo medio de una multa similar impuesta en Río Cuarto.- Variancias poblacionales distintas.Cuando no se puede concluir que las variancias de dos poblaciones de interés son iguales, aún cuando pueda suponerse que las dos poblaciones presentan distribución normal, no es adecuado utilizar la distribución t como acabamos de ver para construir los intervalos de confianza.Una solución al problema de variancias distintas fue propuesta por Fisher, y Cochran lo analiza en detalle.El problema gira en torno al hecho de que la cantidad ( x1 - x2) – (µ1 - µ2) S²1 n1 + S²2 n2 No sigue una distribución t con n1 + n2 - 2 grados de libertad cuando las variancias de las poblaciones son distintas.- Por lo tanto, la distribución t no se puede utilizar en la forma habitual para obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes.- La solución propuesta por Cochran consiste en el cálculo del factor de confiabilidad mediante la siguiente fórmula: W 1 t1 + w 2 t 2 t’ 1 – α/2 = W1 + w 2 Donde w1 = S²1 / n1 w2 = S²2 / n2 t1 = t1 – α/2 para n1 – 1 grados de libertad y t2 = t1 – α/2 para n2 – 1 grados de libertad.- Un intervalo de confianza aproximado del 100(1- α) por ciento para µ1 - µ2 esta dado por: ( x1 - x2) ± t’1 – α/2 S²1 n1 S ²2 + n2 Veamos un ejemplo: Retomemos el ejemplo visto oportunamente para variancias iguales.Los investigadores también informaron los siguientes datos de las mediciones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos: Muestra n Media Desviación estándar Grupo deportistas Grupo sedentarios 13 17 4,5 3,7 0,3 1,0 Se considera que las dos poblaciones de todas las calificaciones de acondicionamiento muscular sigue una distribución aproximadamente normal.- Sin embargo, no debe suponerse que las dos variancias poblacionales son iguales.Se pretende elaborar un intervalo de confianza del 95% de confianza para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poblaciones representadas por las muestras.Solución Se utiliza el t’ que vimos para calcular el factor de confiabilidad.- En la Tabla de la distribución t de Student, se muestra que con 12 grados de libertad y 1 - 0,05/2 = 0,975, t1 = 2,1788.- Análogamente con 16 grados de libertad y 1 - 0,05/2 = 0,975, t2 = 2,1199.- Ahora podemos calcular: t’ = = 0,3²/13 * 2,1788 + 1,0²/ 17 * 2,1199 0,3²/13 + 1,0²/ 17 0,139784 0,065747 = = 2,1261 Ahora estamos en condición de elaborar el intervalo de confianza pedido: S²1 ( x1 - x2) ± t’1 – α/2 ( 4,5 - 4,7) ± 2,1261 S ²2 + n1 0,3² 13 n2 + 1,0² 17 0,8 ± 2,1261 * 0,25641101 0,25 a 1,34 Como el intervalo no incluye al cero se concluye que las medias de las dos poblaciones son diferentes.- EJERCICIO PARA HACER EN CLASE La empresa de auditorias Sosa Roberto SRl, tomó muestra aleatoria de facturas pendientes de pagos de la oficina este y oeste de Rosental Mayoristas SA.- Quería estimar con estas dos muestras independientes la diferencia entre los valores medios de las facturas pendientes de pago.- Los estadísticos muestrales obtenidos fueron los siguientes: Oficina este Población X Oficina oeste Población Y Media muestral 290 250 Tamaño de la muestra 16 11 Desviación estándar muestral 15 50 No suponemos que las variancias poblacionales desconocidas son iguales.- Estime la diferencia entre los valores medios de las facturas pendientes de pago de las dos oficinas.- Utilice un nivel de confianza del 95%.Solución IC de dos muestras independientes.- Variancias distintas Muestra N 1 16 2 11 Media 290,0 250,0 Media del Error Desv.Est. estándar 15,0 3,8 50,0 15 Diferencia = mu (1) - mu (2) Estimado de la diferencia: 40,0 IC de 95% para la diferencia: (5,8. a 74,2) A largo plazo, el valor medio de las facturas pendientes de pago de la Oficina Este son entre 5,8 $ y 74,2$ mayores que el valor de las facturas de pago de la Oficina Oeste.- EJERCICIOS 1.- Se observa que en una muestra aleatoria de seis estudiantes de un curso de introducción a la economía financiera que utiliza técnicas de aprendizaje de grupo la calificación media es de 76,12 y la desviación muestral es de 2,53.- En una muestra aleatoria de nueve estudiantes de otro curso de introducción a la economía financiera que no utiliza técnicas de aprendizaje de grupo, la media y la desviación estándar muestral de las calificaciones de los exámenes son 74,61 y 8,61 respectivamente.Estime un intervalo de confianza del 95% para la diferencia entre las dos calificaciones medias poblacionales.Suponga que las variancias poblacionales no son iguales.- 2.- Tolosa Hnos, es un fabricante pequeño pero en expansión de cereales de desayuno que solo debe calentarse para comerlos.- José Heredia, agricultor que cultiva cereales, creó la empresa en 1910.- Se utilizan dos máquinas para empaquetar cajas de cereales de trigo azucarado de (510 gramos).- Estime la diferencia entre los pesos medios de las cajas de cereales azucarado empaquetados por las dos máquinas.- Utilice un nivel de confianza del 95% y el fichero que esta en Minitab.3.Se encuesta a persona recién licenciadas en administración de empresas que trabajan a tiempo completo y que declaran que su origen socioeconómico es relativamente alto o bajo.- La remuneración total media de una muestra aleatoria de 16 personas de origen socioeconómico alto es de 34500 y la desviación estándar muestral es de 8520$.- La remuneración media de una muestra aleatoria independiente de 9 personas de origen socioeconómico bajo es de 31499$ y la desviación estándar muestral es de 7521$.- Halle el intervalo de confianza al 90% de la diferencia entre las dos media poblacionales.3.- Suponga que en una muestra aleatoria de 200 empresas que revaluaron sus activos fijos, el cociente medio entre la deuda y los activos tangibles era de 0,517 y la desviación estándar muestral era de 0,148.- En una muestra aleatoria independiente de 400 empresas que no revaluaron sus activos fijos, el cociente medio entre la deuda y los activos tangibles era de 0,489 y la desviación estándar muestral de 0,159.- Halle el intervalo de confianza al 99% de la diferencia entre las dos media poblacionales.- 4.- Un investigador planea estimar el efecto que produce un medicamento en las puntuaciones que obtienen los sujetos humanos que realizan una tarea de coordinación psicomotriz.Administra el medicamento antes de la prueba a los miembros de una muestra aleatoria de 9 sujetos.- Sus puntuaciones media es de 9,78 y la variancia muestral es de 17,64.Utilice una muestra aleatoria independiente de 10 sujetos como grupo de control y le administra un placebo antes de la prueba.-Las puntuaciones media de este grupo de control es de 15,10 y la variancia muestral es de 27,01.Suponiendo que las distribuciones poblacionales son normales y tienen variancias iguales, halle el intervalo de confianza al 90% de la diferencia entre medias poblacionales de las puntuaciones.- INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS POBLACIONES En muchas situaciones, se tienen interés en conocer la magnitud de la diferencia entre las proporciones de dos poblaciones.- Es posible que se quiera comparar por ejemplo, entre hombres y mujeres dos grupos de edades, dos grupos socioeconómicos o dos grupos de diagnóstico con respecto a la proporción que posee alguna característica de interés.Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblaciones se obtiene al calcular la diferencia de las proporciones de las muestras, p1 - p2.Tal como hemos visto, cuando n1 y n2 son de gran tamaño y las proporciones de la población no están muy cerca de 0 o de 1, es posible aplicar el teorema central del límite y utilizar la teoría de la distribución normal para obtener los intervalos de confianza.- El error estándar de la estimación se calcula mediante la siguiente formula: Sp1 - p2 = p1 (1 - p1) n1 + p2 (1 - p2) n2 dado que como regla, se desconoce las proporciones de la población.- Un intervalo de confianza de 100( 1 – α) por ciento para p1 - p2 se obtiene como: ( p1 - p2) ± Z α/2 p1 (1 - p1) n1 + p2 (1 - p2) n2 VEAMOS UN EJEMPLO Unos investigadores de EEUU, investigaron la relación de desarrollo del ego, edad, sexo y diagnóstico de suicidio entre los internos adolescentes de la unidad de psiquiatría de cierta institución.La muestra consistía en 96 varones y 125 niñas con edades entre 12 y 16 años, seleccionados de entre los internados en la unidad de adolescentes y niños de un hospital psiquiátrico privado.- Se reportaron 18 niños y 60 niñas con intentos de suicidio.- Considérese el comportamiento de las niñas como el de una muestra aleatoria simple a partir de una población similar de niñas y que los jóvenes, igualmente, pueden considerarse como una muestra aleatoria simple extraída de una población similar de niños.- Para estas dos poblaciones, se pretende construir un intervalo de confianza del 99%, para la diferencia entre las proporciones de los individuos con intento de suicidio.Solución Las proporciones para las niñas y niños respectivamente son: p1 = 60/125 = 0,4878 y p2 = 18/96 = 0,1873.La diferencia entre las proporciones de la muestra es p1 p2 = 0,4878 – 0,1873 = 0,3003.El error estándar estimado de la diferencia entre las proporciones de las muestras es: S p1 - p2 = 0,4878 * 0,5122 125 + 0,1875 * 0,8125 96 El factor de confiabilidad de la tabla de la distribución normal para 99% de confianza es 2,58, de modo que el intervalo de confianza será: 0,3003 ± 2,58 * 0,0602 0,1450 a 0,4556 Se tiene la confianza del 99% de que para las poblaciones muestreadas, la proporción de intentos de suicidios entre las niñas excede a la proporción de intentos de suicidios entre los varones por 0,1450 a 0,4556.Como el intervalo de concluye que las dos diferentes.- confianza no proporciones incluye el cero, se de poblaciones son EJERCICIO PARA HACER EN CLASE 1.-Para la construcción de escuelas será sometida a votación una propuesta de bonos en la próxima elección municipal.- Una parte importante del dinero obtenido por esta emisión de bonos se usará para construir escuelas en la sección de la ciudad de rápido crecimiento, y el resto para renovar y remodelar los edificios escolares en el resto de la ciudad.- Para evaluar la viabilidad de la propuesta, se preguntó a una muestra aleatoria de 50 residentes de la sección en crecimiento y una muestra aleatoria de 100 residentes de las otras partes de la ciudad, si planeaban votar por la propuesta.- Los resultados se muestran en la tabla siguiente: Sección en crecimiento Resto de la ciudad Tamaño de la muestra 90 100 N° a favor de la propuesta 38 65 Proporción que favorece la propuesta 0.76 0.85 a) Estime la diferencia en las proporciones verdaderas que favorecen la propuesta de bonos con un intervalo de confianza de 99%.b) Si con ambas muestra formara una de tamaño 150 con 103 a favor de la propuesta, esto da una estimación puntual de la proporción de residentes de la ciudad que votarán a favor.- ¿Cuál es el margen de error?.- 2.- En un estudio sobre la relación entre el orden del nacimiento y el éxito en la universidad, un investigador encontró que 126, de una muestra de 180, graduados de la universidad eran primogénitos o hijos únicos.- En una muestra de 100 no graduados de edad y bases socioeconómicas comparables, el número de primogénitos o hijos únicos fue 54.- Estime la diferencia entre las proporciones de primogénitos o hijos únicos en las dos poblaciones de que tomaron estas muestras.- Use un intervalo de confianza de 90% e interprete sus resultados.3.- Durante un año de elecciones generales, se realizan muchos pronósticos para averiguar como perciben los votantes a un determinado candidato.- En una muestra aleatoria 120 posibles votantes del distrito A, 107 declararon que apoyaban al candidato en cuestión.- En una muestra aleatoria independiente de 141 posibles votantes del distrito B, solo 73 declaran que apoyaran a ese candidato.- Si las proporciones poblacionales respectivas se representan por medio de PA y PB, halle el intervalo de confianza al 95% de la diferencia proporcional.Si este ejercicio lo resolvemos con Minitab, tendremos: IC para dos proporciones Muestra X 1 107 2 78 N 120 141 Muestra p 0,891667 0,553191 Diferencia = p (1) - p (2) Estimado de la diferencia: 0,338475 IC de 95% para la diferencia: (0,239347. 0,437603) 4.- En una muestra aleatoria de 120 grandes minoristas, 83 utilizan la regresión como método de predicción.- En una muestra aleatoria independiente de 163 pequeños minoristas, 78 utilizan la regresión como método de predicciones.- Halle el intervalo de confianza al 98% por ciento de la diferencia entre las dos proporciones poblacionales.5.- ¿Iría más a la biblioteca si se ampliara su horario de apertura?.- En una muestra aleatoria de 138 estudiantes de primer año, 80 declararon que irían a la biblioteca de la universidad si se ampliara su horario.- En una muestra aleatoria independiente de 96 estudiante de segundo años, 73 respondieron que irían más si se ampliara su horario.- Estime la diferencia entre las proporciones de estudiantes de primer año y de segundo año que respondieron afirmativamente a esta pregunta.- Utilice un nivel de confianza del 95%.- 6.- Una muestra aleatoria de 100 hombres contenía 61 a favor de la introducción de una enmienda constitucional para reducir la tasa de crecimiento de los impuestos sobre bienes inmuebles.- Una muestra aleatoria independiente de 100 mujeres contenía 54 a favor de esta enmienda.- Se calculo el intervalo de confianza 0,04 < Px - Py < 0,10 De la diferencia entre las proporciones poblacionales.¿Cuál es el nivel de confianza de este intervalo?.7.- Se observo a los clientes de un supermercado y se les encuestó inmediatamente después deque colocaran un artículo en el carro.- En una muestra aleatoria de 510 clientes que eligieron un producto al precio ordinario, 320 afirmaron que comprobaban el precio en el momento que lo elegían.- En una muestra aleatoria independiente de 332 que eligieron un producto a un precio especial, 200 hicieron esa afirmación.- Halle un intervalo de confianza al 90% de la diferencia entre las dos proporciones poblacionales.8.- Según un artículo de prensa, el 75 por ciento de 400 personas encuestadas en una ciudad se oponen a una decisión judicial reciente.- Según ese mismo artículo, solo el 45 por ciento de 500 personas encuestadas en otra se oponen a esa decisión.Construya un intervalo de confianza al 95% de la diferencia entre las proporciones poblacionales basándose en los datos.- INTERVALOS DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES CON DISTRIBUCION NORMAL ESTIMACION PUNTUAL DE LA VARIANCIA DE LA POBLACION.Hemos dicho en secciones anteriormente que cuando se desconoce la variancia de la población es posible utilizar la variancia de la muestra como una estimador.- Como cuando vimos las propiedades de un estimador se hizo referencia solo al criterio de insesgado, así que es necesario revisar si la variancia de la muestra es un estimador insesgado de la variancia de la población.Para ser insesgado, el valor promedio de la variancia de la muestra sobre todas las muestras posible deber ser igual a la variancia de la población.- Esto es que se debe cumplir que E (S²) = σ².- Para ver si esto se cumple en una situación particular se considera el ejemplo que vimos de las edades de cinco niños en la Unidad anterior.- En la tabla que hacemos mención veíamos todas las muestras posibles de tamaño 2 a partir de la población formada con valores 6 8 10 12 14.Recuerde que dos medidas de dispersión para esta población se calcularon como: σ² = Ʃ (xi µ)² N =8 y S² = Ʃ (xi µ)² N-1 = 10 Si se calcula la variancia de la muestra con la formula que vimos, para cada una de las muestras posibles que aparecen en la tabla, se obtienen las variancias muestrales de la tabla: TABLA A SEGUNDA SELECCION 1º S E L E C C I O N 6 8 10 12 14 6 6;6 (0) 6,8 (2) 6;10 (8) 6;12 (18) 6;14 (32) 8 8;6 (2) 8,8 (0) 8;10 (2) 8;12 (8) 8;14 (18) 10 10;6 (8) 10,8 (2) 10;10 (0) 10;12 (2) 10;14 (8) 12 12;6 (18) 12;8 (8) 12;10 (2) 12;12 (0) 12;14 (2) 14 14;6 (32) 14;8 (18) 14;10 (8) 14;12 (2) 14;14 (0) Las variancias de cada muestra están entre paréntesis.- Muestreo con reemplazos.- Si el muestreo es con reemplazo el valor esperado de S² se obtiene tomando la media de todas las variancias posibles de las muestras en la Tabla A.- Cuando se hace esto, se obtiene: E(S²) = Ʃ S² 25 = 0 + 2 + ……… +2 + 0 25 = 200 25 =8 Se aprecia que cuando el muestreo es con reemplazo la E (S²) = σ² Muestreo sin reemplazos.Si el muestreo es sin reemplazo el valor esperado de S ² se obtiene tomando la media de todas las variancias posibles de las muestras que estan por encima (o por debajo) de la diagonal princiapal en la Tabla A.- Cuando se hace esto, se obtiene: E(S²) = Ʃ S² 10 = 2 + 8 +…………… +2 10 = 100 10 = 10 Se aprecia que cuando el muestreo es con reemplazo la E (S²) ≠ σ² , sino que es igual a S².- Estos resultados son ejemplos de principios generales, ya que es posible mostrar en términos generales que: E(S²) = σ², cuando el muestreo es con reemplazo.E(S²) = S², cuando el muestreo es sin reemplazo.Cuando N es muy grande , N – 1 y N son aproximadamente iguales y entonces, S² y σ² serán aproximadamente iguales.Estos resultados justifican que usemos la formula con el n -1 para calcular la variancia de la muestra.- Asi mismo debe recordarse que a pesar de que S² es un estimador insesgado de σ². s no es un estimador insesgado de σ.Sin embargo el sesgo disminuye a medida que se incrementa el tamaño de la muestra n.- Ya teniendo una estimación puntual de la variancia, resulta lógico preguntase sobre la elaboración de un intervalo de confianza para la variancia poblacional.- Para elaborar un intervalo de confianza para la variancia poblacional σ², es necesario encontrar una distribución muestral adecuada, y esta es la Distribución Chi cuadada que la simbolizamos con Ҳ².En general los intervalos de confianza para σ² se basa en la distribución muestral de (n – 1) S²/ σ².- Si se extraen muestras de tamaño n de una población con distribución normal, esta cantidad tiene una distribución conocida como Chi cuadrada con n -1 grados de libertad.Cuando veamos pruebas de hipótesis volveremos hablar de esta distribución, aquí solamente diremos que esta es la distribución que se utiliza para los intervalos de confianza de la variancia, cuando se cumple el supuesto de que la población sigue una distrución normal.- k=2 k=6 k=4 Para obtener un intervalo de confianza de 100(1- α) por ciento para σ², se obtiene primero el intervalo de confianza de 100(1 – α) por ciento para (n – 1) S²/ σ².Para efectuar este procedimiento se seleccionan los valores de la tabla Chi cuadrada de las Tablas Estadisticas.- De tal modo que α/2 quede a la izquierda del valor menor y α/2 quede a la derecha del valor mayor.- En otras palabras, los dos valores chi cuadrada se seleccionan de modo que α se divide en partes iguales entre las dos colas de la distribución.- Estos dos valores de Chi se designan como Ҳ²α/2 y Ҳ²1 – α/2, respectivamente.- Por lo tanto, el intervalo de confianza de 100(1 – α) por ciento para (n – 1) S²/ σ² esta dado por, Ҳ²α/2 < S² (n – 1) σ² < Ҳ² 1 - α/2 Ahora se utiliza esta ecuación para obtener una formula con σ² como único término central.- Primero se divide cada término por (n – 1) S² para obtener: Ҳ²α/2 < (n – 1)S² 1 < σ² Ҳ²1 - α/2 (n – 1)S² Si se aplica el elemento recíproco en esta ecuación, se obtiene: (n – 1)S² Ҳ²α/2 (n – 1)S² > σ² > Ҳ²1 - α/2 Notesé que cambia la dirección de las desigualdades cuando se aplica el elemento recíproco.- Pero si se invierte el orden de los términos se tiene: Notesé que cambia la dirección de las desigualdades cuando se aplica el elemento recíproco.- Pero si se invierte el orden de los términos se tiene: (n – 1)S² (n – 1)S² < Ҳ²α/2 σ² < Ҳ²1 - α/2 Que es un intervalo de confianza de 100(1 – α) por ciento para σ².- Si se toma la raíz cuadrada de cada término de la ecuacón anterior se tiene el siguiente intervalo de confianza 100(1 - α) por ciento la desviación estándar de la población.Veamos un ejemplo: Una muestra aleatoria de pastillas para el dolor de cabeza tienen una desviación estándar de 0,8% en la concentración de ingredientes activos.- Hallar un intervalo de confianza del 90% para la variancia poblacional.Solución Mos que n = 15 S² = 0,8² = 0,64 Dado que el intervalo requerido es del 90%, entonces α = 0,10, tenemos que: Ҳ²n – 1: α/2 = Ҳ²14; 0,05 = 23,685 Ҳ²n – 1;1 - α/2 = Ҳ²14; 0,95 = 6,571 El intervalo de confianza será: 14 (0,64) 23,685 < σ² < 14 (0,64) 6,571 Por lo que, 0,378 < σ² < 1,364 Nuestro intervalo de confianza del 90% para la variancia poblacional en la concentración del ingrediente activo esta entre 0,378 y 1,364.Dado que la desviación estándar es la raíz cuadrada de la variancia podemos calcular el intervalo de confianza para la desviación estándar , que será; 0,61 < σ < 1,17 Por lo tanto, nuestro intervalo de confianza del 90% para la desviación estándar poblacional de la concentración porcentual del ingrediente activo de estas pastillas va de 0,61% a 1,17%.- Veamos otro ejemplo para Intervalos de confianza para la variancia.En una investigación de los efectos de dietas con densidad baja en colesterol lipoproteico, cierto médico estudio a 12 individuos, hombres y mujeres, medianamente hipercolesterolémicos.- Los niveles de colesterol (mmol/l) para estos individuos fueron;6,0 6,4 7,0 5,8 6,0 5,8 5,9 6,7 6,1 6,5 6,3 5,8.Se supone que los 12 individuos forman una muestra aleatoria simple extraida de una población de individuos similares que sigue una distribución normal.- Se pretende estimar a partir de los datos de la muestra, la variancia poblacional de los niveles del colesterol del plasma en la población con un intervalo de confianza del 95%.Solución La muestra produce un valor para S² = 0,391868.- Los grados de libertad son n – 1 = 11.- Los valores Chi cuadrada son: Ҳ²n - 1: α/2 = Ҳ² 11; 0,025 = 21,920 Ҳ² n - 1;1 - α/2 = Ҳ² 11; 0,975 = 3,816 El intervalo de confianza será: 11 (0,391868) < 21,920 σ² 0,196649087 < σ² < < 11 (0,391868) 3,816 1,35483656 Tenemos un 95% de confianza de que el parámetro poblacional esta entre esos valores.- Advertencia: No usar este procedimiento cuando la distribución de la población no es normal.La validez del estimador por intervalo de la variancia depende en mayor medida de la hipótesis de normalidad que el correspondiente a la media poblacional.- Otra dificultad con estos intervalos de confianza resulta del hecho de que el estimador no está en el centro del intervalo de confianza como en el caso de la media.- Esto se debe a que la distribución Chi cuadrada, a diferencia de la normal, no es simétrica.- La consecuencia práctica de ello es que el método desarrollado para la obtención del intervalo de confianza para la σ² no produce los intervalos más cortos posibles.-