Uploaded by fowes99034

estimaciones compress

advertisement
UNIDAD 6
ESTIMACIONES
OBJETIVOS DE LA
UNIDAD
SE ESPERA QUE EL
ALUMNO
SEA CAPAZ DE:
• DEFINIR UN ESTIMADOR PUNTUAL.• DEFINIR NIVEL DE CONFIANZA.• CONSTRUIR UN INTERVALO DE CONFIANZA PARA
LA MEDIA POBLACIONAL CUANDO SE CONOCE LA
DESVIACIÓN ESTÁNDAR DE LA POBLACION.• CONSTRUIR UN INTERVALO DE CONFIANZA PARA
LA MEDIA POBLACIONAL CUANDO NO SE CONOCE
LA DESVIACION ESTANDAR DE LA POBLACIONAL.• CONSTRUIR UN INTERVALO DE CONFIANZA PARA
UNA PROPORCION DE LA POBLACION.• DETERMINAR EL TAMAÑO DE LA MUESTRA PARA
UN MUESTREO DE ATRIBUTOS Y VARIBALES.-
En todas las Unidades que hemos visto se
encuentran las bases que necesita para entender
la inferencia estadística y saber como aplicarla
en situaciones prácticas.- En la primera Unidad
centramos su atención en la Estadística
Descriptiva, tanto gráficas como numéricas,
para describir e interpretar conjuntos de
mediciones.- En la Unidad siguiente, aprendió
acerca
de
las
probabilidades
y
sus
distribuciones las herramientas básicas
empleadas para describir poblaciones de
mediciones.- Se enfatizó la importancia de las
distribuciones binomial y normal en aplicaciones
prácticas.-
En la Unidad anterior, se proporcionó el eslabón
entre la probabilidad y la inferencia estadística.El teorema central del límite establece que, aun
cuando las poblaciones muestreadas no sea
normales, las distribuciones muestrales de estos
estadísticos, serán aproximadamente normales
cuando el tamaño de la muestra n es grande.Estos estadísticos son las herramientas que
usted usa para la estadística inferencial; hacer
inferencia acerca de una población usando la
información contenida en la muestra.-
Hay muchas maneras de tomar decisiones o hacer
predicciones, algunas de naturaleza subjetivas y
otras más objetivas.- ¿Cuán buenas será su toma
de decisiones o predicciones?.- Aunque podría
sentir que su propia habilidad para tomar
decisiones es bastante buena, la experiencia hace
pensar que este podría no ser el caso.- El
trabajo del Estadístico es proporcionar
los métodos de inferencia estadística
que sean mejores y más confiable que
las suposiciones subjetivas.La inferencia estadística tiene que ver con la toma
de decisiones o la elaboración de predicciones
acerca de los parámetros, las
medidas
numéricas
descriptivas
que
caracterizan a una población.- Tres parámetros
encontrados en Unidades anteriores, son la
media poblacional μ, la desviación estándar de
la población σ y la proporción binomial p.En la inferencia estadística un problema
práctico es repetido en el marco de una
población con un parámetro específico.- Por
ejemplo, un metalúrgico podría medir los
coeficientes de dilatación promedio para ambos
tipos de acero y después comparar sus
valores.-
Los métodos para hacer inferencia de los
parámetros de la población caen en una de dos
categorías:
a) ESTIMACION :
para
estimar
o
predecir el valor
del parámetro.-
b)
PRUEBA
DE
HIPOTESIS : para tomar
una decisión respecto al
valor de un parámetro con
base en alguna idea
preconcebida acerca de
cual podría ser su valor.-
Veamos un ejemplo:
1.- Los circuitos de las computadoras y otros
equipos electrónicos constan de una o más
tarjetas de circuitos impresos (TCI) y las
computadoras se reparan reemplazando una o
más tarjetas defectuosas.- En un intento por
encontrar la aplicación apropiada de un proceso
de enchapado en un lado de la tarjeta, un
supervisor de producción podría estimar el
espesor promedio de la electrodeposición de
cobre en la tarjeta al usar muestras durante
varios días de operación.- Puesto que el no tiene
conocimiento del espesor promedio μ, antes de
observar el proceso de producción, el problema
que tiene es de estimación.-
2.- El dueño de la planta le dice al supervisor, del
ejemplo anterior, que el espesor de la
electrodeposición de cobre no debe ser menor
que 0,001 pulgadas para que el proceso esté bajo
control.Para decidir si el proceso esta bajo
control o no, el supervisor podría formular una
prueba.- El podría hipotetizar que el proceso
esta bajo control: asume que el espesor medio
de la electrodeposición es 0,001 o mayor, y usa
una muestra de varios días de operación para
decidir si la hipótesis es correcta o no.- El
método de toma de decisiones del supervisor se
llama Prueba de Hipótesis.-
¿Qué método de inferencia usaría?.- Es decir,
¿debe estimar el parámetro o debe probar una
hipótesis con respecto a su valor?.- La respuesta
es dada por la pregunta práctica planteada, y a
menudo se determina por preferencia personal.Puesto que tanto la estimación como las pruebas
de hipótesis se usan con frecuencia en las
publicaciones de temas científicos, nosotros
veremos ambos temas.- Estimaciones
en esta
Unidad y Pruebas de
Hipótesis en la Unidad siguiente.-
Un
problema
estadístico
que
requiere
planificación, análisis y la
realización de
inferencias está incompleto sin una medida de la
bondad de la inferencia .- Es decir, ¿Qué tan
exacta o confiable es el método que utilizó?.- Si
un corredor de bolsa predice que el precio de
una acción será de 80 dólares el lunes, ¿estará
dispuesto a comprar o vender su acción sin
saber que tan confiable es su predicción?.- Los
procedimientos estadísticos son importantes
porque proporcionan dos tipos de información:
• Métodos para hacer inferencia.• Una medida numérica de la bondad o
confiabilidad de la inferencia.-
METODOS
DE
ESTIMACION
Todo el mundo hace estimaciones.- Por ejemplo,
cuando usted decide cruzar una calle hace una
estimación de la velocidad del auto que viene,
que tan cerca está, etc, luego decide si cruza o
no.Los Administradores, Contadores, Economistas,
etc, deben hacer estimaciones rápidas.El
resultado de estas estimaciones pueden afectar
sus organizaciones de manera tan seria como el
resultado de su decisión de cruzar la calle.Todos estos profesionales hacen estimaciones
sin preocuparse si son científicas o no, pero con
las esperanza de que las estimaciones tengan
una semejanza razonable con el resultado.-
Con lo que veremos con este tema,
observaremos que podemos hacer
estimaciones lo más acertadas posibles,
es decir sin correr grandes riesgos.Además con este tema empezamos a
explicar las posibilidades de hacer
inferencias
sobre
una
población,
basándonos en la información contenida
en una muestra aleatoria.- Vamos a
centrar
nuestra
atención
en
características específicas o parámetros
de la población.-
Algunos parámetros de interés podrían ser la media,
la variancia o la proporción de la población
que poseen determinados atributos.Por ejemplo, podríamos hacer inferencia sobre:
•El ingreso medio de las familias de un barrio.• Todas las acciones que cotizan en una bolsa de
valores.•La variación en el nivel de impureza en diferentes lotes
de un producto químico.•La proporción de empleados de una empresa que están
a favor de modificar un plan de incentivos.• Ver la aceptación del público de un nuevo producto.• Las ventas de un comercio en el futuro.• Todas las cuentas pendientes de cobro de un
proveedor.•Etc, Etc.-
Cualquier inferencia que se haga sobre
la población tendrá que basarse
necesariamente
en
estadísticos
muestrales, es decir en función de la
información muestral.- La elección
apropiada de estos estadísticos
dependerá de cual sea el parámetro
de interés de la población.- El
verdadero
parámetro
será
desconocido y un objetivo será
estimar su valor.-
Cualquier
Cualquier estadístico
estadístico de
de la
la muestra
muestra que
que se
se
utilice
utilice para
para estimar
estimar un
un parámetro
parámetro poblacional
poblacional
desconocido
desconocido se
se conoce
conoce como
como estimador
estimador
ES DECIR
Un estimador de un parámetro
poblacional es una variable aleatoria
que depende de la información de la
muestra
y
cuyas
realizaciones
proporcionan aproximaciones al valor
desconocido del parámetro.-
La media de la muestra  X puede ser un
estimador de la media de la población μ, la
proporción de la muestra  p puede ser un
estimador de la proporción poblacional P.-
Cuando
Cuando hemos
hemos observado
observado un
un
valor
valor numérico
numérico específico
específico de
de
nuestro
nuestro estimador
estimador nos
nos
referimos
referimos aa ese
ese valor
valor como
como una
una
estimación.estimación.-
En otras palabras, una estimación es un valor
específico observado de un estadístico.Hacemos una estimación si tomamos una muestra y
calculamos el valor que toma nuestro estimador en esa
muestra.- Supongamos que deseamos estimar el ingreso
medio de las familias de un barrio.Parece razonable basar nuestra conclusiones en el
ingreso medio muestral, por lo tanto, diremos que el
estimador de la media poblacional es la media
muestral.- Supongamos que habiendo tomado la muestra
hallamos que el ingreso promedio de las familias de la
muestra es 1650$.- Entonces la estimación de la
media de la población es 1650$.Para estudiar la estimación de un parámetro
desconocido, debe considerarse dos posibilidades.-
Primero, podríamos calcular en base a los datos de la
muestra, un valor representativo o tal vez el más
representativo y es lo que vimos con la estimación de los
1650$ para las familias del barrio que estudiamos.Alternativamente, podríamos estar interesado en encontrar
un intervalo o rango, en el cual estemos casi seguro de
que esté el verdadero parámetro, y es lo que llamamos
Estimación por Intervalos de Confianza.- Entonces, si
bien hay otros métodos, los
estimación que veremos son dos:
métodos
a) ESTIMACIÓN PUNTUAL
b) ESTIMACION POR
INTERVALOS
DE CONFIANZA.-
de
a)
ESTIMACION
PUNTUAL
Un estimador puntual de un parámetro
poblacional es una función de la muestra que da
como resultado un único valor.La
correspondiente
realización
se
llama
estimación puntual .En el ejemplo, que vimos antes, el ingreso medio
de las familias, el parámetro que se quiere
estimar es la media poblacional.- El estimador
puntual que se utiliza es la media muestral y la
estimación resultante fue de 1650$.Entonces tenemos la siguiente tabla, para
estimadores puntuales:
Parámetro poblacional
Media
Variancia
x
 X
 ²x
Desviación estándar
Proporción
Estimador
P
S²x
x
sx
 p
Veamos un ejemplo.Las ganancias por acciones de una muestra de
10 valores de la Bolsa de Buenos Aires en un día
particular fueron:
10
16
5
10
12
8
4
6
5
4
Hallar estimaciones puntuales para los siguientes
parámetros poblacionales; media, variancia,
desvío estándar y la proporción para los que la
ganancia por acción fue mayor que 8,5.Entonces:
Nº
1
Xi
10
X²
100
2
3
16
5
256
25
4
5
10
12
100
144
6
7
8
4
64
16
8
9
6
5
36
25
10
Total
4
80
16
782
Tenemos que:
n = 10
 Xi = 80
Por lo tanto la media muestral es
 xi
 X = ------------ =
n
 X² = 782
80
------------ = 8.0
10
Que es nuestra estimación de la media poblacional.Una estimación de la variancia poblacional será:
 x² - n  X²
782 - 10 * 64
S² = ---------------------------- = --------------------------- = 15.7
n - 1
9
Para la desviación estándar la estimación puntual será
Sx =
 S²
=
 15,78 = 3.97
Finalmente, en la muestra, el número de
valores para los cuales la ganancia por
acción es mayor que 8,5 son cuatro.- Por
lo tanto nuestra estimación puntual de la
proporción poblacional es:
 p =
x
4
=
n
= 0.40
10
En un situación practica podría haber varios estadísticos
disponibles como estimadores puntuales para un
parámetro poblacional.- Para decidir cual es la mejor
opción, necesita saber como se comporta el estimador
en el muestreo repetido, descrito por su distribución
muestral.A manera de analogía, piense en disparar un revolver a
un blanco.- El parámetro de interés es el centro del
blanco en el que dispara las balas.- Cada bala representa
una sola estimación de la muestra, disparada por el
revolver, la cual representa al estimador.- Suponga que
su amigo dispara un solo tiro y da en el centro del
blanco.- ¿su conclusión es que el es un
tirador
excelente?.- ¿se pondría de pie al lado del blanco
mientras el hace un segundo disparo? Probablemente
no, porque no tiene ninguna medida del desempeño en
ensayos repetidos.-
¿El siempre da en el blanco, o es constante para dar muy
alto o muy bajo?.- ¿sus tiros se agrupan muy cercanos al
blanco o por lo general salen desviados del blanco por un
amplio margen?.- En la figura siguiente aparecen varias
configuraciones del blanco.●●
● ● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Consistente
●
●
●
●
●
arriba del blanco
● ●
●
Fuera del blanco
Consistente
abajo del blanco
●●●●●
por un amplio
margen
Mejor puntería
Las distribuciones muestrales proporcionan información
útil para seleccionar el mejor estimador.- ¿Qué
características
serían
valiosas?.Primero,
la
distribución muestral del estimador puntual
debe estar centrada en el valor verdadero del
parámetro por estimar.- Es decir, el estimador no
debe subestimar o sobreestimar regularmente el
parámetro de interés.- Se dice que tal estimador es no
sesgado.Definición: Se dice que un estimador de un
parámetro es no sesgado si la media de su
distribución es igual al verdadero valor del
parámetro.- De otra manera, se dice que el estimador
es sesgado.-
Gráfica de distribución
Normal; Desv.Est.=5
0,09
Estimador
Estimador
0,07
0,06
Densidad
no
sesgado
0,08
sesgado
0,05
0,04
0,03
0,02
0,01
0,00
0
10
20
30
40
X
Valor verdadero del parámetro
En la figura anterior aparecen las distribuciones muestrales para un
estimador no sesgado y un estimador sesgado.- La distribución
para el estimador sesgado se desplaza a la derecha del valor
verdadero del parámetro.-Este estimador sesgado tiene más
probabilidad de sobreestimar el valor verdadero del parámetro que
uno no sesgado.-
La segunda característica deseable de un estimador es
que la dispersión (medida por la variancia) de
la distribución muestral debe ser tan pequeña
como sea posible.Gráfica de distribución
0,04
0,03
Densidad
Estimador
con
variancia
mayor
Estimador
con
variancia
menor
0,02
0,01
0,00
-50
-25
0
25
X
50
75
Valor verdadero del parámetro
100
Esto asegura que, con una probabilidad alta, una
estimación individual caerá cerca del verdadero
valor del parámetro.Las distribuciones muestrales para dos
estimadores no sesgados, uno con una variancia
pequeña y la otra con una variancia mayor se
muestran en la placa anterior.Claro, preferirá al estimador con la menor
variancia, porque las estimaciones tienden a
quedar más cerca del verdadero valor del
parámetro que en la distribución con la variancia
más grande.-
En situaciones de muestreo de la vida real, quizás usted
sabe que la distribución muestral de un estimador se
centra respecto al parámetro que intenta estimar, pero
todo lo que tiene es la estimación calculada de las n
mediciones contenidas en la muestra.- ¿cuán lejos estará
su estimación del valor del verdadero parámetro?.- La
distancia entre la estimación y el verdadero valor del
parámetro se llama error de estimación .En esta Unidad debe suponer que los tamaños de la
muestra siempre son grandes y por consiguiente, que los
estimadores no sesgados que estudiara tienen
distribución muestral que se pueden aproximar mediante
una distribución normal (debido al teorema central del
límite).- Recuerde que, para cualquier estimador puntual
con una distribución normal; la regla empírica establece
que aproximadamente el 95% de las estimaciones
puntuales, estarán a dos (o con más exactitud 1,96)
desviaciones estándar de la media de esa
distribución.Para estimadores no sesgados, esto significa que la
diferencia entre el estimador puntual y el valor
verdadero del parámetro será menor que 1,96
desviaciones estándar o 1,96 errores estándar (SE).Esta cantidad conocida como margen de error del 95%
(o simplemente margen de error), proporciona un
límite superior práctico para el error de estimación.(ver figura siguiente)
Es posible que el error de estimación exceda este
margen de error, pero esto es muy improbable.-
95%
1.96 SE
1.96 SE
Margen
Margen
de
de
error
error
Distribución muestral de un estimador no sesgado
Estimador
muestral
¿COMO ESTIMO UNA MEDIA O PROPORCION
POBLACIONAL?
• Para estimar la media poblacional μ de una población
cuantitativa, el estimador puntual  x es no sesgado,
con un error estándar estimado como:
SE =
S
n
El margen de error de 95% cuando n ≥ 30 es estimado
como:
± 1,96
S
n
Para estimar la proporción poblacional P de una
población binomial, el estimador puntual  p = x/n es
no sesgado con error estándar estimado como:
SE =
pq
n
El margen de error del 95% es estimado como:
± 1,96
pq
n
Suposiciones: n p > 5
y
nq >5
Ejemplo 1:
Un investigador está interesado en la posibilidad de
fusionar las capacidades de la televisión y la Internet.Una muestra aleatoria de n = 50 usuarios de Internet
que fueron encuestados acerca del tiempo que pasan
viendo la televisión produjo un promedio de 11,5 horas
por semana con una desviación estándar de 3,5
horas.- Use esta información para estimar el tiempo
medio poblacional que los usuarios de Internet pasan
viendo televisión.Solución
La variable aleatoria medida es el tiempo que pasaron
viendo televisión por semana.- Esta es una variable
aleatoria cuantitativa mejor descripta por su media μ.-
La estimación puntual de μ, el tiempo promedio que
los usuarios de Internet pasan viendo televisión es  x
= 11,5 horas.- El margen de error se estima como:
1,96 SE = 1,96
S
n
= 1,96
3.5
= 0.97
50
Puede sentirse bastante seguro de que la estimación
muestral de 11,5 horas de ver televisión para los
usuarios de Internet esta a ± 1 horas de la media
poblacional.-
Ejemplo 2:
Además del tiempo promedio que los usuarios de
Internet pasan viendo televisión del ejemplo anterior,
está interesado en estimar la proporción de individuos
en la población que quieren comprar una televisión
que también funcione como computadora.- En una
muestra aleatoria de n = 100 adultos, 45% en la
muestra indicaron que podían comprar una.- Estime la
proporción
poblacional
verdadera
de adultos
interesados en comprar una televisión que también
funcione como computadora, y encuentre el margen de
error para la estimación.Solución
El parámetro de interés ahora es P, la proporción de
individuos en la población que quieren comprar una
televisión que también funcione como computadora.El mejor estimador de P es la proporción muestral  p,
que para esta muestra es  p = 0,45.A fin de encontrar el margen de error, aproxime el valor
de P con su estimación  p = 0,45, entonces:
1,96 SE = 1,96
Pq
n
= 1,96
0,45 * 0,55
100
= 0.10
Con este margen de error, usted puede estar muy
seguro de que la estimación de 0,45 está a ± 0,10 del
verdadero valor de P.-
Por tanto, es posible concluir que el verdadero valor de P
podría ser tan pequeño como 0,35 o tan grande como
0,55.- Este margen de error es bastante grande cuando se
compara con la estimación y refleja el hecho de que se
requieren muestras grandes para lograr un margen de
error pequeño al estimar P.Cuando el valor de p esta entre 0,3 y 0,7 hay poco
cambios en el valor de
que es el numerador
Pq
del SE , que alcanza su máximo valor para p = 0,50, por
tal motivo muchas encuestadoras como Gallup usan
tamaños de muestras de alrededor de 1000 así que su
margen de error es:
1,96
0.5 * 0.5
1000
=
0,031
3%
Se dice en este caso que la estimación esta ± 3 % de la
proporcion poblabacional verdadera.-
EJERCICIOS
1.- ¿Explique lo que significa “ margen de error” en la
estimación puntual?.2.- ¿Cuáles son las dos características del mejor
estimador puntual para un parámetro poblacional?.3.- Calcule el margen de error al estimar una media
poblacional μ para estos valores:
a) n = 50
S² = 4
b) n = 500
S² = 4
c) n = 5000
S² = 4
¿Que efecto tiene un tamaño mayor de la muestra en
el margen de error?.-
3.- Calcule el margen de error al estimar una proporción
binomial P por medio de muestras de tamaño n = 100
y los siguientes valores estimados de para P:
a) P = 0.10
b) P = 0.30
d) P = 0.70
e) P = 0.90
c) P = 0.50
¿Cuál de los valores de P produce el margen de error
más grande?.4.- Suponga que usted está escribiendo un cuestionario
para una encuesta de n = 100 individuos.- El cuestionario
generará las estimaciones para varias proporciones
binomiales diferentes.- Se quiere informar un solo margen
de error para la encuesta, ¿Qué margen de error del
ejercicio anterior está bien usar?.-
5.- Con frecuencia un aumento en la proporción de ahorro
de los consumidores se relacionan con una falta de
confianza en la economía y se dice que es un indicador
de una tendencia recesiva.- Un muestreo aleatorio de n=
200 cuentas de ahorra en una comunidad mostró un
incremento medio en los valores de las cuentas de ahorro
de 7,2% durante los últimos 12 meses, con una
desviación estándar de 5,6%.- Estime el incremento
porcentual medio de los valores de las cuentas de ahorro
durante los últimos 12 meses de los depositantes en la
comunidad.- Encuentre el margen de error para su
estimación.Repta:
 x = 7.2 %
SE = 0,776
6.- A la mayoría de los argentinos les encanta participar o
por lo menos ver, en una multitud de eventos
deportivos; muchos sienten que los deportes tienen
más que solo el valor de entretenimiento.- En una
encuesta a 1000 adultos , el 78% sienten que los
deportes espectáculo tienen un efecto positivo en la
sociedad.a) Encuentre una estimación puntual para la proporción
de argentinos adultos que sienten que los deportes
espectáculo tienen un efecto positivo en la sociedad.Calcule el margen de error.b) La encuesta produce un margen de error de más o
menos 3,1%.- ¿esto concuerda con los resultados del
inciso a)? Si no, ¿Qué valor de p produce el margen de
error dado en la encuesta?.Repta: a)  p = 0,78
ME= 0,026 b) no,
p = 0.50
7.Uno de los costos principales al planear las
vacaciones de verano es el costo del hospedaje.- Incluso
dentro de una cadena particular de hoteles, los costos
varían sustancialmente dependiendo del tipo de
habitación y los servicios ofrecidos.- Suponga que elige
al azar 50 estados de cuentas de cada una de las bases
de datos de las cadenas de hoteles, Marriott, Sheraton, y
Hilton, y se registra las tarifas de alojamientos nocturnos:
Marriott
Sheraton
Hilton
Promedio muestral
170
145
150
Desvió estándar muestral
17,5
10,0
16,5
a) Describa la población o poblaciones muestreadas.-
b) Encuentre la estimación puntual para la tarifa
de alojamiento promedio de los hoteles Marriott.Calcule el margen de error.c) Encuentre la estimación puntual para la tarifa
de alojamiento promedio de los hoteles
Sheraton.- Calcule el margen de error.d) Encuentre la estimación puntual para la tarifa
de alojamiento promedio de los hoteles Hilton.Calcule el margen de error.-
8.- Las estaciones de radio y televisión con frecuencia
sacan al aire temas polémicos durante sus
transmisiones y piden a los espectadores que indiquen
si están de acuerdo o no con una posición dada acerca
de un problema.- Se realiza una encuesta u se pide a
los telespectadores que si están de acuerdo que
llamen a un cierto número 900 y si no que llamen a un
segundo número 900.- Todos los participantes pagan
una cuota por sus llamadas.a) ¿Esta técnica de muestreo produce una muestra
aleatoria?.b) ¿Qué es posible decir acerca de la validez de los
resultados de tal encuesta?.- ¿Debe preocuparse por
un margen de error en este caso?.-
PARA MOSTRAR
EL USO DE
MINITAB
EN LA
ESTIMACION
PUNTUAL
Supongamos que un día seleccionamos una
muestra aleatoria de acciones que cotizan en la
bolsa y observamos que las relaciones preciobeneficio de estas acciones son:
10
16
13
11
12
14
12
15
14
14
13
13
13
----
a) Muestre
si
los
normalmente.-
datos
se
distribuyen
b) Halle estimaciones puntuales de la media y de
la variancia.-
Gráfica de probabilidad de C1
Normal
99
Media
Desv.Est.
N
AD
Valor P
95
90
13,08
1,605
13
0,281
0,581
Porcentaje
80
70
60
50
40
30
20
10
5
1
9
10
11
12
13
C1
14
15
16
17
En el gráfico de probabilidad normal no se observa nada que indique
ausencia de normalidad.- Suponiendo que la distribución es normal,
una estimación puntual de la media poblacional precio beneficio es la
media muestra de 13,1 y una estimación de la variancia poblacional
es la variancia muestral S²= 2.58.- Tanto la media muestral como la
variancia son estimadores puntuales insesgados, consistentes y
eficientes de la media y variancia poblacional, respectivamente.-
1.- Una muestra aleatoria de ocho viviendas de un barrio
tenían los siguientes precios de ventas (en miles de
dólares):
92
83
112
127
109
96
102
90
a) Busque pruebas de la ausencia de normalidad.b) Halle una estimación puntual de la media poblacional
que sea insesgada y eficiente.c) Utilice un método de estimación insesgado para hallar
una estimación puntual de la variancia de la media
muestral.d)
Utilice un estimador insesgado para estimar la
proporción de viviendas de este barrio que se venden
por menos de 92500 dólares.-
2.- Una muestra aleatoria de 12 obreros de una gran
fábrica encontró las siguientes cifras sobre número de
horas extras realizadas el mes anterior:
22
16
28
12
18
36
23
11
41
29
26
31
Utilice métodos de estimación insesgados para hallar la
estimaciones puntuales de:
a) La media poblacional.b) La variancia poblacional.c) La variancia de la media muestral.
d) La proporción poblacional de obreros que trabajaron
más de 30 horas extras en esta fábrica el mes anterior.e) La variancia de la proporción muestral de obreros que
trabajaron más de 30 horas extras en esta fábrica el
mes anterior.-
3.- Una muestra aleatoria de 10 economistas han
realizado las siguientes predicciones del crecimiento
porcentual del producto bruto interno real del próximo
año:
2.2
2.8
3.0
2.5
2.4
2.6
2.5
2.4 2.7
2.6
Utilice métodos de estimación insesgados para hallar las
estimaciones puntuales de:
a) La media poblacional.-
b) La variancia poblacional.-
c) La variancia de la media muestral.d) La proporción poblacional de economistas que han
predicho un crecimiento del PBI real de al menos 2,5
por ciento.e) La variancia de la proporción muestral de economistas
que han predicho un crecimiento del PBI real de al
menos un 2,5 %.-
b)
b)
ESTIMACION
ESTIMACION
POR
POR
INTERVALOS
INTERVALOS
DE
DE
CONFIANZA
CONFIANZA
EL MAPA CONCEPTUAL
DE LO QUE VEREMOS
SOBRE ESTE TEMA
SERÁ:
INTERVALOS DE CONFIANZA
Principio e
Interpretación
de
los I de C
El valor α
la probabilidad
del error
Para
Para medias
Proporciones
poblacionales
poblacionales
Muestras
grandes
Muestras
pequeñas
Controlando Determinación
el ancho
de los
de un
tamaños
intervalo
muestrales
Cambio del
nivel de
confianza
Cambio del
tamaño
muestral
Para
Estimar
μ
Para
estimar
proporción
El Gerente Comercial puede seleccionar una muestra
aleatoria de 100 clientes y decidir que la media
poblacional, gasto promedio por cliente está en algún
sitio entre 200 y 500 $.Una Estimación por Intervalos especifica el rango
dentro del cual está el parámetro desconocido.Tal intervalo con frecuencia va acompañado
de una afirmación sobre el nivel de confianza
que se da en su exactitud.Por eso se llama
INTERVALOS DE CONFIANZA
En realidad hay tres niveles de confianza
relacionados con
los Intervalos de Confianza
90, 95 y del 99 %
No hay nada mágico
sobre estos tres valores
mág
Se podría calcular un
Intervalo de Confianza
para cualquier nivel
que se deseara
Estos niveles de
confianza se
denominan
COEFICIENTES
DE CONFIANZA
Las estimaciones
por intervalo
gozan de ciertas
ventajas sobre
las estimaciones
puntuales.Debido al error
de muestreo
probablemente
 X no será igual
a μ.-
Sin embargo, no hay
manera de saber que
tan grande es el error
de muestreo.-
Por lo tanto, los INTERVALOS
DE CONFIANZA , se utilizan para
explicar esta discrepancia
desconocida
EL
EL FUNDAMENTO
FUNDAMENTO DE
DE
UN
UN
INTERVALO
INTERVALO DE
DE
CONFIANZA
CONFIANZA
Un
UnIIde
deCCtiene
tieneun
unlímite
límite inferior
inferior de
de
confianza
confianza(LIC)
(LIC) yyun
un límite
límitesuperior
superior de
de
confianza
confianza(LSC)
(LSC)
Estos límites se hallan calculando primero la media
muestral X
Luego
Luegose
sesuma
sumauna
unacierta
cierta
cantidad
cantidadaala
lamedia
mediamuestral
muestral
para
paraobtener
obtenerel
elLSC
LSCyyla
la
misma
mismacantidad
cantidadse
seresta
restapara
para
obtener
obtenerLIC.LIC.-
La determinación de esa cantidad es nuestro objetivo
¿Cómo se puede construir un intervalo y luego
argumentar que se puede tener un 95% de confianza en
que contiene μ, si incluso no se sabe cuál es la media
poblacional?.Vale la pena recordar de la definición anterior sobre la REGLA
EMPIRICA que por ejemplo, el 95 % de todas las medias
muestrales caen dentro de dos errores estándar de la media
poblacional.- Entonces la media poblacional está máximo a dos
errores estándar del 95% de todas las medias muestrales.-
Por lo tanto, al comenzar con cualquier
media muestral, si se pasa de dos errores
estándar por encima de dicha media y dos
errores estándar por debajo de ella, se
puede tener un 95% de confianza en que
el Intervalo resultante contenga la media
poblacional desconocida.-
La discusión sobre distribuciones de muestreo mostró que de toda
población se pueden obtener muchas muestras diferentes de un
tamaño dado, cada una con su propia media.-
± 2 σx
μ=?
LSC1
 X1
LIC1
LIC2
LIC3
 X3
LIC4
 X2
LSC2
LSC3
 X4
LSC4
LIC5
 X5
LSC5
La figura anterior, muestra cinco de estas medias
muestrales posibles.- Si la muestra da  X1, un intervalo
que se extiende dos errores estándar por encima y por
debajo de  X1 todavía incluye el valor desconocido de la
media poblacional.- De igual forma si la muestra hubiese
dado una media  X2, el intervalo resultante también
incluiría la media poblacional.- Vale la pena destacar que
solo  X3 y  X5, quedan tan lejos de la media poblacional
que un intervalo de ± 2 errores estándar no incluye la
media poblacional.-
Todas las otras muestras consideradas producirán
un intervalo que contiene la media poblacional
Entonces la clave para recordar, es esta:
Como la media poblacional está a lo más
a dos errores estándar para el 95% de
todas las medias muestrales.-
Entonces, dada una media muestral cualquiera,
se puede estar 95 % seguro de que el intervalo
de dos errores estándar alrededor de dicha
media muestral contiene la media poblacional
desconocida.-
1.- Intervalo de
Confianza para la
media de una
distribución normal;
variancia
poblacional
conocida.n ≥ 30
Uno de los usos más comunes de los intervalos
de confianza es estimar la media poblacional.Por ejemplo:
• Un fabricante puede querer estimar la
producción mensual promedio de su planta.•Un representante de mercadeo puede
interesarse en la reducción en las ventas
semanales promedios.•El jefe financiero de una firma que aparece
entre las 500 mejores firmas puede querer
estimar los rendimiento trimestrales promedios
que se tuvieron en operaciones corporativas.•Etc.-
El número de situaciones que
se encuentran comúnmente en el
mundo de los Negocios, la Economía,
y la Administración que
requiere de una estimación de la media
poblacional es casi ilimitado.-
Recordemos que el Intervalo de Confianza se forma
utilizando la media muestral como una estimación
puntual para el cual se adiciona y se resta un cierto valor
para obtener los límites superior e inferior del intervalo
de confianza respectivamente.Por lo tanto el I de C es:
XX ±± ZZαα/2/2 σ
σ xx
Veamos ahora de donde surge este Intervalo de Confianza
Supongamos que hablamos del 95 % de confianza;
1-α
- zα/2
P ( - Zα/2 <
0
zα/2
Z < Z α/2 ) ; pero Z =
Z
X - μ
σ/√n
En lo anterior reemplazamos Z por su igual y despejamos el
parámetro μ, entonces
P ( X - Zα/2 σ / √ n < μ < X + Z α/2 * σ / √n )= 1- α
Cuanto debe sumarse y restarse depende
en parte del Nivel de confianza deseado,
estipulado por el valor Z,
en la formula antes mencionada.Un nivel de confianza del
1 - α = 90 %

Z = 1,645
1 - α = 95 %

Z = 1,96
1 - α = 99 %

Z = 2,58
Veamos un ejemplo y expliquemos.-
Suponga que un empresario muy importante
intenta construir un gran Supermercado.- Puede
estimar en el área el ingreso promedio por familia
como indicador de las ventas esperadas.- Una
muestra aleatoria simple de n= 100 familias da
una media de  X = 1800$.- Se asume que la
desviación estándar poblacional es de σ = 650$,
que se la conoce de una serie de trabajos
anteriores en esa zona.- ¿ Determine un intervalo
de confianza para la media poblacional μ con un
nivel de confianza del 95%?.Solución
Nuestro
Intervalo de Confianza
X ± Zα/2
σx
=
σ
n
=
650
σx
= 65
100
Entonces,
será:
1672,60
1800 ± 1,96 (65) =
1927,40
1672,60 ≤
μ ≤
1927,40
INTERPRETACION
INTERPRETACION
DE
DE UN
UN
INTERVALO
INTERVALO DE
DE
CONFIANZA
CONFIANZA
El empresario puede interpretar los resultados de su
Intervalo de Confianza de dos formas.-
1.- Es la más común, establece que el empresario
tiene un 95% de confianza de que la media
poblacional real desconocida este entre esos
valores determinados.2.- Reconoce que se pueden desarrollar muchos
Intervalos de confianza diferentes.- Otra muestra
probablemente produciría una media muestral diferente
debido al error de muestreo.- Con una X diferente el
intervalo tendrá límites diferentes.- Por tanto, esta
segunda interpretación establece, que si se construyen
todos los intervalos posibles, el 95 % de ellos
contendrían la media poblacional desconocida.-
Lo
Lo expresado
expresado en
en 2)
2) significa
significa que
que el
el 55 %
% de
de todos
todos los
los
intervalos
intervalos estaría
estaría errado
errado (no
(no contendrían
contendrían la
la media
media
poblacional).poblacional).Este
Este55%,
%, que
quelo
localculamos
calculamoscomo:
como:
11 -- Coeficiente
Coeficientede
deConfianza
Confianza
SE LLAMA VALOR
α
REPRESENTA LA PROBABILIDAD DE ERROR
Valor Alfa : es la probabilidad de error o la
probabilidad de que un intervalo dado no
contenga la media poblacional desconocida.-
EJERCICIO PARA HACER EN CLASE
1.- Supongamos que el tiempo que
permanecen los clientes en un negocio de
ropa sigue una distribución normal.- Una
muestra aleatoria de 16 clientes tenia un
tiempo
medio
de
25
minutos.Supongamos que σ = 6 minutos.- Halle el
error estándar, el margen de error y la
amplitud del intervalo de confianza de la
media poblacional μ, al 95 por ciento.-
2.- Un proceso produce bolsas de azúcar
refinado.- El peso del contenido de estas
bolsas sigue una distribución normal que
tiene una desviación estándar de 12
gramos.- El contenido de una muestra
aleatoria de 25 bolsas tiene un peso
promedio de 198 gramos.- Halle un
intervalo de confianza del 99 por ciento y
del 95 por ciento, para el verdadero peso
medio de todas las bolsas de azúcar
producidas por el proceso.- Explique cual
estimación es más conveniente y
porque.-
2.- Intervalo de
Confianza para la
media de una
distribución normal;
variancia poblacional
desconocida.n ≥ 30
Como la σ es desconocida podemos sustituirla por la
variancia de la muestra, entonces nuestro Intervalo de
Confianza será:
XX ±± ZZαα/2/2 ss xx
Donde S x =
S
n
Veamos un ejemplo:
El Contador Mario Sosa, acaba de registrar las
declaraciones de impuestos de sus clientes.Desea estimar la cantidad que deben a la AFIP.- De
los 50 cliente que seleccionó en su muestra
aleatoria simple, la cantidad promedio que se
adeudaba era de $ 16320.- Ya que la desviación
estándar de la población es desconocida el
Contador debe estimar a σ con la desviación
estándar de la muestra s = 220,30.- Se desea un
nivel de confianza del 99%.Solución
En este caso el IC será:
X ± Zα/2
sx
220,30
16320 ± 2,58 *
=
50
16239,62
16320 ± 80,38 =
16400,38
El Contado Mario Sosa puede tener un 99 % de
confianza en que la cantidad promedio que deben todos
sus clientes a la AFIP esta entre esos valores.-
Amplitud del Intervalo : 16400,38 - 16239,62 = 160,76
Nos podríamos preguntar ¿ que pasaría a este
intervalo si el Contador estuviera dispuesto a
aceptar un nivel de confianza del 95%? Sería:
16258,94
16320 ± 61,06 =
16381,06
Amplitud del Intervalo sería:
16381,06
– 16258,94 =
122,12
Los resultados son tan buenos como malos.Las buenas noticias son que el intervalo del 95%
es más estrecho y ofrece mayor precisión.Un intervalo amplio no es especialmente útil.Entre más estrecho es el intervalo, más
significativo es.Las malas noticias son que el Contador Mario
Sosa ahora está el 95% seguro que el intervalo
contiene en realidad a μ.Aunque el intervalo es más preciso, más estrecho,
la probabilidad de que contenga μ se ha reducido
del 99% al 95%.- El Contador tuvo que perder algo
de confianza y ganar más precisión.-
EJERICICIO PARA HACER EN CLASE:
Un científico interesado en vigilar los contaminantes
químicos en los alimentos y por tanto, la acumulación
de contaminantes en las dietas humanas, eligió una
muestra aleatoria de n = 50 adultos varones.Encontró que la ingestión promedio diaria de productos
lácteos era  x = 756 gramos por día con una desviación
estándar s = 35 gramos por día.a) Use esta información para construir un intervalo de
confianza de 95% para la ingestión media diaria de
productos lácteos para los varones.b) Use esta información para construir un intervalo de
confianza de 90% para la ingestión media diaria de
productos lácteos para los varones.-
3.- Intervalo de
Confianza para la
media de una
distribución normal;
variancia poblacional
conocida.n ≤ 30
En este caso el Intervalo de Confianza, será usando
también Zα/2.-
El Gerente de cierto banco lo contrato como
consultor para diversa tareas,. Hoy le pide
analizar las operaciones de sus cajeros
automáticos.- Una muestra aleatoria de 9 de
ellos mostró las transacciones promedio de
1600$.- Por un estudio anterior que se había
realizado se conoce el desvío estándar
poblacional σ = 350$ por día.- El gerente le
pide que estime el volumen diario promedio con
un 95 % de confianza.Solución
El Intervalo de Confianza será:
X ± Zα/2 σ x
350,0
1600 ± 1,96 *
=
9
1371,33
1600 ± 228,67 =
1828,67
Podrá decir con un 95 % de confianza que el promedio
poblacional de las operaciones diarias de los cajeros
esta entre 1371 $ y 1829 $.-
EJERCICIO PARA HACER EN CLASE
Un director de personal ha observado que históricamente
las puntuaciones de los test de aptitud realizados a los
solicitantes de empleo en los niveles de entrada siguen
una distribución normal con una desviación estándar de
32,4 puntos.Una muestra aleatoria de nueve
puntuaciones del grupo actual de solicitantes tenía una
puntuación media de 187,9 puntos.a) Halle el intervalo de confianza al 80 por ciento de la
media poblacional de las puntuaciones del grupo actual
de solicitantes.b) Halle el intervalo de confianza al 90 por ciento de la
media poblacional de las puntuaciones del grupo actual
de solicitantes.c) Comente cual le conviene y porque.-
1.- Se sabe que la desviación
estándar de los
volúmenes de las botellas de 710 ml de agua mineral
embotellada por una empresa es de 6 ml.- Se ha
tomado una muestra de aleatoria de 90 botellas y se
han medido:
a) Halle el factor de fiabilidad de un intervalo de
confianza al 92 por ciento de la media poblacional
de los volúmenes.b) Calcule el error estándar de la media.c) Calcule la amplitud de un intervalo de confianza al
92 por ciento de la media poblacional de los
volúmenes.-
2.- Se sabe que el peso de los ladrillos que
produce una fábrica sigue una distribución
normal con una desviación estándar de 0,12
kilos.- Una muestra aleatoria de 16 ladrillos
de la producción de hoy tenía un peso medio
de 4,07 kilos.a)Halle el intervalo de confianza al 99 por
ciento del peso promedio de todos los
ladrillo producidos hoy.b)Explique sin realizar los calculo si el intervalo
de confianza al 95 por ciento de la media
poblacional tendría más amplitud, menos o
igual que la obtenida en el inciso a).-
c) Si decide que mañana se tomara una muestra
aleatoria de 20 ladrillos.- Explique sin realizar
los cálculos si el intervalo de confianza 99 por
ciento del peso medio de la producción de
mañana calculado correctamente tendría más
amplitud, menos o igual que la obtenida en el
inciso a).d)
Suponga que la desviación estándar
poblacional de la producción de hoy es de 0,15
kilos (no 0,12 kilos).- Explique sin realizar los
cálculos si el intervalo de confianza al 99% del
peso medio de la producción de hoy calculado
correctamente tendría más amplitud, menos o
igual que la obtenida en el inciso a).-
3.- La secretaria de admisiones en un programa de
master en administración de empresas ha observado
que históricamente los solicitantes tienen una
calificación media en los estudios de licenciatura que
sigue una distribución normal con desviación estándar
de 0,45.- Se ha extraído una muestra aleatoria de 25
solicitudes cuya calificación media ha resultado ser
2,90.• Halle el intervalo de confianza de la media poblacional
al 95 %.- Explique.b) Basándose en estos resultados muestrales, un
estadístico calcula para la media poblacional el
intervalo de confianza que va de 2,81 a 2,99.- Halle el
nivel de confianza correspondiente a este intervalo.-
4.- Intervalo de
Confianza para la
media de una
distribución normal;
variancia poblacional
desconocida.n ≤ 30
En situaciones anteriores el tamaño
de la
muestra era mayor, igual a 30.- Sin embargo, no
siempre puede ser posible obtener por lo menos
30 observaciones.- Para una compañía de seguro
que prueba la resistencia al impacto de los autos,
destruir 30 autos puede volverse bastante
costoso.- Una empresa farmacéutica puede no
encontrar 30 personas disponibles para actuar
como conejitos de indias, etc.- Es decir, que en
muchos casos una muestra grande es imposible
obtener.- Cuando debe tomarse una muestra
pequeña, la distribución normal puede no
aplicarse.- El teorema central del límite asegura
normalidad en el proceso de muestreo solo si la
muestra es grande.-
Cuando se utiliza una muestra
pequeña
y
además
se
desconoce
la
desviación
estándar poblacional σ puede
ser necesaria una distribución
alternativa, que se conoce
como la distribución t de
Student o distribución t
simplemente.-
Específicamente la distribución t se utiliza cuando se
cumplen las tres condiciones siguientes:
1.- La muestra es pequeña,
menor de 30
2.- σ es desconocida
3.- La población es normal o
casi normal.Además, si no puede asumirse una
población normal, se aumenta el
tamaño de la muestra para utilizar la
distribución Z y de no ser posible se
debe recurrir a las pruebas no
paramétricas.-
La distribución t de Student, fue desarrollada en 1908 por
William S. Gosset (1876-1937) quién se graduó en
matemáticas en Oxford, trabajo como un experto
cervecero en Cervecería Guinness de Dublin, Irlanda.Guinnes no permitía que sus empleados publicaran sus
investigaciones, de manera que Gosset que le gustaba
mucho jugar con los números, publico sus primeros
trabajos sobre la distribución t con el seudónimo de
Student y de esta manera proteger su trabajo.-
Si la variable aleatoria X tiene una distribución normal,
entonces el estadístico,
X - μ
S/ √n
tiene una distribución t con n – 1 grados de libertad.Como desconocemos σ utilizamos S para estimarla.A igual que la distribución Z, la distribución t tiene una
media igual a cero, es simétrica con respecto a la media
y oscila entre - ∞ y + ∞ .- Sin embargo, mientras la
distribución Z tiene una variancia
igual a 1, la
distribución t tiene una variancia mayor que 1, por lo
tanto es más plana, más dispersa que la distribución Z.Esto se debe a que desconocemos σ y lo estimamos
con el desvío estándar de la muestra.-
Distribución Z
Distribución t
Cuando aumentan el número de grados de
libertad, la distribución t se acerca poco a poco a
la distribución normal hasta que las dos son casi
idénticas.- Esto sucede porque S se convierte en
un mejor estimador de σ cuando la muestra
crece.- Con una muestra de tamaño 120 o más, S
estima a σ con precisión suficiente que hay muy
poca diferencia entre ambas distribuciones.-
En realidad la distribución t es una familia de
distribuciones, cada una con su propia variancia.- La
variancia depende de los grados de libertad, definidos
como el número de observaciones que se pueden elegir
libremente.- Es el número de observaciones menos el
número de restricciones impuestas sobre tales
observaciones.Los valores de probabilidad t se buscan en la tabla de la
Distribución t de Student, del Compendio de Tasas
Estadísticas.- Veremos como se usa en Clase Práctica.-
Pasemos
Pasemos ahora
ahora al
al tema
tema que
que nos
nos
compete
compete que
que es
es la
la determinación
determinación del
del
Intervalo
Intervalo de
de Confianza
Confianza para
para la
la
media
media de
de una
una población
población normal
normal con
con
variancia
variancia poblacional
poblacional desconocida
desconocida
cuando
cuando el
el tamaño
tamaño de
de la
la muestra
muestra es
es
menor
menor de
de 30.30.-
Veamos como surge el Intervalo de confianza
P ( - t n-1; α/2 < t n-1 < + t n – 1; α/2)
X– μ
P ( - t n-1; α/2 <
S/√n
= 1- α
< + t n – 1; α/2) = 1- α
Despejamos el parámetro desconocido μ, nos
queda:
X - t n-1; α/2
S
√n
< μ < X
+ t n – 1; α/2
S
√n
Al ensayar un nuevo método de producción, se
seleccionaron 18 empleados al azar y se les pidió lo
probaran.- La tasa de producción promedio muestral
para los 18 empleados fue de 80 partes por hora y la
desviación estándar muestral fue de 10 partes por hora.Determine intervalos de confianza del 90 y 95% de la tasa
de producción promedio poblacional con el nuevo
método, suponiendo que la población tiene una
distribución normal de probabilidades.SOLUCION
Al 90 %
t n - 1: α/2
= t17; 0,05
= 1,740
Al 95 % t n – 1 : α/2 = t17 ; 0,025 = 2,110
I de C del 90%
X
- t n - 1: α/2 10/4,24 < μ < X
80 - 1,740 * 2,358
< μ
+ t
n - 1: α/2
< 80 + 1,740 * 2,358
75,90
80
± 4,10 =
84,10
Amplitud intervalo:
10/4,24
84,10 - 75,90 = 8,2
I de C del 95%
X
- t n - 1: α/2 10/4,24 < μ < X
80 - 2,110 * 2,358
< μ
+ t
n - 1: α/2
< 80 + 2,110 * 2,358
75,03
80
± 4,97 =
84,97
Amplitud intervalo:
10/4,24
84,97 - 75,03 = 8,2
EJERCICIO PARA HACER EN CLASE
Una muestra aleatoria de seis coches americanos de un
determinado modelo consumen las siguientes cantidades
en kilómetros por litro:
18.6
18.4
19.2
20.8
19.4
20.5
Determine un intervalo de confianza del 90 por ciento
para el consumo de nafta medio poblacional de los
automóviles de este modelo, suponiendo que la
distribución es normalSolución
Resp:  x = 19.4833
(18,67 a 20,29)
S² = 0.96
s = 0.98
EJERICICIO PARA
MOSTRAR
USO DEL
PROGRAMA
MINITAB
Los precios del gasoil experimentaron una vertiginosa
subida en los primeros años de este siglo.Supongamos que se realizado recientemente un
estudio con camioneros que tenían mas o menos el
mismo numero de años de experiencia para comprobar
el comportamiento de 24 camiones de un determinado
modelo en la misma autopista.- Estime la media
poblacional del consumo de combustible de este
modelo de camión con una confianza del 90 por ciento
suponiendo que el consumo de combustible, en
kilómetros recorrido por litro de estos 24 camiones es:
15.5
21.0
18.5
19.3
19.7
16.9 20.2 14.5
16.5
19.2
18.7
18.2
18.0
17.5 18.5 20.5
18.6
19.1
19.8
18.0 19.8
18.2 20.3 21.8
Solución
Lo primero que debemos probar si los datos
siguen aproximadamente una distribución
normal.Gráfica de probabilidad de MPG
Normal
99
Media
Desv.Est.
N
AD
Valor P
95
90
Porcentaje
80
70
60
50
40
30
20
10
5
1
14
15
16
17
18
19
MPG
20
21
22
23
18,68
1,695
24
0,286
0,594
En la grafica de probabilidad no se observa nada
que indique la ausencia de normalidad.Estadísticas descriptivas: MPG
Var
MPG
N
24
Media del
Error
Media estándar Desv.Est. Varianza Mínimo Mediana
18,679
0,346
1,695
2,874
14,500
18,650
Variable Máximo Sesgo Kurtosis
MPG
21,800
-0,61
0,62
La media y mediana son casi iguales lo que
indica que la distribución es simétrica.-
T de una muestra
N
24
Media
18,679
Desv.Est.
1,695
Media del
Error
estándar
0,346
IC de 90%
(18,086; 19,272)
Surge de tn-1; α/2 = t23;0.05 = 1.714
El intervalo de confianza al 90%, será:
 x ± t23; 0.05 s/√n = 18.68 ± 1.714 * 0.3460 =
= 18.68 ± 0.5930 = (18.68 a 19.3)
Podemos estar seguro que el promedio de consumo de
gasoil por kilómetros de estos camiones esta entre
18,68 y 19,3 con un 90% de confianza.-
1.- El tiempo que demora una muestra de cinco
empleados en desplazarse desde su casa al
trabajo son:
30
42
35
40
45
a) Calcule el error estándar de la medias.b) Halle t n; α/2 correspondiente a el intervalo de
confianza de la verdadera media poblacional al
95%.c) Calcule la amplitud de un intervalo de
confianza al 95% de la media poblacional del
tiempo que se tarda en desplazarse al trabajo.-
2.- Una empresa de alquiler de automóviles
tienen interés en saber cuanto tiempo
permanecen sus vehículos en el taller de
reparaciones.- Formule todos los supuestos y
halle el intervalo de confianza al 90% del
numero anual medio de días que todos los
vehículos de la flota de la empresa pasan en el
taller de reparaciones si una muestra aleatoria
de nueve automóviles mostró el siguiente
numero de días que habia permanecido cada
uno en el taller de reparaciones:
16
10
21
22
8
17
19
14
19
3.- Una tienda de ropa tiene interés en saber
cuanto gastan los estudiantes universitarios en
ropa durante el primer mes del año escolar.- El
gasto medio de una muestra aleatoria de nueve
estudiantes es de 157,82$ y la desviación
estándar muestral es de 38,89$.Suponiendo que la población sigue una
distribucion normal, halle el margen de error
del intervalo de confianza al 95 por ciento de la
media poblacional.-
4.- Preocupa la velocidad a la que se conduce en
un determinado tramo de una autopista.- El
radar indica la siguiente velocidad de una
muestra aleatoria de siete automóviles en
kilómetros por hora:
79
73
68
77
86
71
69
Suponiendo que la población sigue una
distribución normal, halle el margen de error
del intervalo de confianza al 95 por ciento de
la velocidad media de todos automóviles que
circulan por este tramo de la autopista.-
5.- El director de la oficina de colocación de una
escuela de administración de empresas quiere
estimar los sueldos anual medio que perciben
los licenciados cinco año después.- Una
muestra aleatoria de 25 licenciados tenia una
media muestral de 42740$ y una desviación
estándar muestral de 4780$.a)Halle un intervalo de confianza de la media
poblacional al 90 por ciento, suponiendo que la
población sigue una distribución normal.b) Halle un intervalo del 95%.c) Compare y explique cual es mejor estimación.-
6.- Una clínica ofrece un programa de
adelgazamiento.- Según sus historiales, una
muestra aleatoria de 10 pacientes habia
experimentado las siguientes perdidas de peso
en kilos al termino del programa:
18
25
6
11
15
20
16
19
12
7
a)Halle un intervalo de confianza de la media
poblacional al 99 por ciento.b) Explique sin realizar los cálculos si el intervalo
de confianza de la media poblacional al 90 por
ciento seria mayor, menor o igual que el
obtenido en el inciso a).-
RESUMEN
RESUMEN DE
DE
PROCEDIMIENTOS
PROCEDIMIENTOS DE
DE
ESTIMACION
ESTIMACION DE
DE
INTERVALO
INTERVALO
PARA
PARA UNA
UNA MEDIA
MEDIA DE
DE
POBLACION
POBLACION
si
si
Se conoce no
σ
Usar S
en lugar
de σ
no
Es n ≥ 30
si
si
Se
conoce
σ
La población es no
normal
no
Usar S
en lugar
de σ
Use Z
Use Z
Use Z
Use t
Utilizo
Estadística
No
Paramétrica
INTERVALO DE
CONFIANZA
PARA LA
PROPORCION
POBLACIONAL
POBLACIONA
(Muestras grandes)
Supongamos que estamos interesados en la proporción
de miembros de la población que poseen un
determinado atributo.- Por ejemplo, una empresa puede
estar interesados en cuantos de sus clientes pagan con
tarjeta en relación a los que pagan en efectivo; un
empresario puede estar interesado en que proporción
sus productos son no defectuosos en relación a los
defectuosos, etc.En cada uno de estos casos, existen solo dos posibles
resultados.- Por tanto, la preocupación se concentra en
la proporción de respuestas que quedan dentro de uno
de estos dos resultado.Situándonos en el marco de la distribución binomial, p
representa la proporción de éxitos en n intentos
independientes, cada uno con probabilidad de éxito p
En secciones anteriores vimos que si n es grande en
general, n * p mayor que 0,05 y n * p * (1 – p) mayor que
0,05, la distribución de las proporciones muestrales será
normal, por lo tanto podemos usar Z para el Intervalo de
Confianza.Sabemos que el error estándar de la
distribución muestral de las proporciones muestrales
es:
σp =
P ( 1 – P)
n
Podemos usar la proporción muestral para estima P,
entonces:
p(1–p)
Sp =
n
Nuestro Intervalo de Confianza será:
p
±
Z α/2 * S p
Veamos un ejemplo: A una muestra aleatoria de 142
directores de Recursos Humanos que ofertan trabajo a
profesionales universitarios, se les pregunto Cual era el
papel que jugaba el expediente académico en la
evaluación de los candidatos.- Ochenta y siete de estos
directores contestaron “definitivo”, “importante” o “muy
importante”.Calcular un Intervalo de Confianza del 95% para la
proporción poblacional de directores de recursos
humanos que comparten esta opinión.Solución
Entonces tenemos:
n = 142
Sp =
p = 87 / 142 = 0,613
p(1–p)
n
=
Z α/2 = ± 1,96 y
0,613 * 0,387
142
= 0,040
0,613 ± 1,96 * 0,040
0,5346
0,613 ± 0,0784 =
0,6914
La proporción poblacional estará entre el 53 y 69%.Se puede conseguir I de C con menor amplitud si se
toman muestras más grandes.-
EJERICICIO PARA HACER EN CLASE
La dirección quiere una estimación de la
proporción de los empleados de la empresa que
es partidaria de un plan de pluses modificado.Se ha observado que en una muestra aleatoria de
344 empleados, 261 están a favor de este plan.Halle una estimación por intervalo de confianza
al 90 por ciento de la verdadera proporción de la
población que es partidaria de este plan
modificado.Solución
Resp; (0,721 a 0,797)
1.- Una muestra aleatoria de 985 votantes
probables – aquellos que votaría en las próxima
elecciones- fue encontrada durante una encuesta
telefónica dirigida por el Partido Justicialista.- De
los encuestados 592 indicaron que votaría el
candidato
Justicialista
en
las
próxima
elecciones.- Construya un intervalo de confianza
de 90% para P, la proporción de votantes en la
población que piensa votar por el candidato
justicialista.¿concluiría con base a esta información, que el
candidato ganará la elección?.Rpta: 0,575 < P < 0,627
2.- Es importante que las compañías aéreas
respeten las horas programadas de salida de
los vuelos.- Suponga que una compañía ha
examinado recientemente las horas de salida
de una muestra aleatoria de 246 vuelos y ha
observado que 10 vuelos se retrasaron debido
al mal tiempo, 4 por razones de mantenimiento
y el resto salio a su hora.a)Estime el porcentaje de vuelos que salieron a
su hora utilizando un nivel de confianza del 98
por ciento.b) Estime el porcentaje de vuelos que se
retrasaron debido al mal tiempo utilizando un
nivel de confianza del 98 por ciento.-
3.- Suponga que las autoridades sanitarias creen
que este año la epidemia de gripe será menor
que durante el mismo periodo del año pasado.Se ha preguntado a los residentes de una zona
metropolitana si esta noticia los disuadiría de
vacunarse contra la gripe.- Si solo 40 personas
de una muestra aleatoria de 246 declaran que
ahora no se vacunarían, estime con una
confianza del 98 por ciento la proporción de
todos los residentes de la zona metropolitana
que ahora consideran innecesario vacunarse
contra la gripo.-
4.- En un año de elecciones presidenciales, los
candidatos quieren saber que votarán los
votantes de diferentes partes del país.- Suponga
que se pregunta a 420 posibles votantes del
noreste si votarían a un determinado candidato
si las elecciones fueran hoy.- En esta muestra
aleatoria 223 indicaron que votarían a favor de
este candidato.- ¿Cuál es el margen de error?.Halle la estimación del intervalo de confianza al
95 por ciento del apoyo con que cuenta este
candidato en el noreste.-
5.- En una muestra aleatoria de 198 estudiantes de
marketing, 98 consideraron que no era ético inflar las
calificaciones.Basándose en esta información, un estadístico calculo
un intervalo de confianza de la proporción poblacional
que iba de 0,445 a 0,545.¿Cuál es el nivel de confianza de este intervalo?.6.-Suponga que se pregunto a una muestra aleatoria de
142 responsables de las admisiones en programas de
postgrado que papel desempeñan las calificaciones
obtenidas
en
exámenes
normalizados
en
la
consideración de un candidato.- En esta muestra de 87
miembros respondieron un papel muy importante.- Halle
el intervalo de confianza al 95 por ciento de la proporción
poblacional de responsables que tienen esta opinión.-
7.- En una muestra aleatoria de 95 empresas
manufactureras, 67 han indicado que su empresa ha
obtenido la certificación ISO en los dos últimos años.Halle un intervalo de confianza al 99 por ciento de la
proporción poblacional de empresas que han recibido la
certificación en los últimos dos años.8.- En una muestra aleatoria de 400 posibles votantes de
una ciudad, 320 indicaron que en las siguientes
elecciones votarían a favor de una política propuesta.a) Calcule un intervalo de confianza del 98 por ciento de
la proporción de la población que esta a favor de esta
política.b) Calcule la amplitud de la estimación del intervalo de
confianza al 90 por ciento de la proporción de la
población que está a favor de esta política.-
CONTROL DEL ANCHO
DE UN INTERVALO
Como hemos dicho anteriormente, es preferible un
intervalo más estrecho debido a la precisión adicional
que proporciona.-
Hay
Hay dos
dos métodos
métodos
principales
principales para
para lograr
lograr
un
un intervalo
intervalo más
más
preciso.preciso.- Estos
Estos son:
son:
a) REDUCCIÓN DEL NIVEL DE CONFIANZA
b) INCREMENTO DEL TAMAÑO MUESTRA
a) A veces perder un poco de confianza hace que se logren
intervalos de confianza más estrecho, es decir que se
logra mayor precisión en la estimación.- Incrementar el
tamaño de la muestra es la única forma de reducir el
tamaño del intervalo sin sufrir una pérdida de confianza.b) Incrementando el tamaño de la muestra se puede
reducir el error estándar de las media muestrales,
σ/√ n .- Para niveles de confianza como el 95 y 99%
nos van a dar intervalos muy similares.- Es decir que
mantenemos el nivel de confianza, pero esta ventaja
no se gana sin un precio.- El tamaño más grande de
la muestra significa más tiempo y dinero que deben
gastarse al recolectar y manejar los datos.- De nuevo
debe tomarse una decisión.- Respecto a que método
tomar es una decisión gerencial.-
DETERMINACIO
N DEL TAMAÑO
APROPIADO DE
LA MUESTRA
El tamaño de la
muestra juega
un papel
importante al
determinar la
probabilidad
de error así
como en la
precisión de la
estimación.-
Una vez que se ha seleccionado el
nivel de confianza, dos factores
importantes influyen en el tamaño
muestral.-
1.- La variancia de
la población σ²
2.- El tamaño del error tolerable que el
investigador está dispuesto a aceptar.-
Mientras
que el 1) esta fuera del alcance del
Mi
investigador y nada se puede hacer, en el 2) si es
posible limitar el tamaño del error.-
El tamaño del error que un investigador
puede tolerar depende de que tan crítico es
el trabajo que está realizando.Algunas tareas extremadamente delicadas
requieren de resultados exactos ; por
ejemplo, los procedimientos médicos de los
cuales dependen la vida humana; la
producción de piezas de una máquina que
debe cumplir especificaciones precisas,
pueden tolerar un muy pequeño error, etc,
en otros casos los errores más grandes
pueden
tener
consecuencias
menos
graves.-
En los ejemplos que vimos sobre
Intervalos de Confianza, el tamaño de la
muestra se determino de manera arbitraria
sin tomar en cuenta el tamaño del intervalo
de confianza.En el mundo de los
negocios, la determinación de un tamaño
de muestra adecuado es un procedimiento
complicado sujeto a restricciones de
presupuesto, tiempo y facilidad de
selección.-
Para entender esto, suponga que usted
como Auditor de la Empresa Garbarino,
quisiera estimar el promedio o la
proporción de facturas que contienen
errores, intentaría determinar de antemano
la calidad requerida de la estimación.Esto significa que debe decidir la cantidad
de error que esta dispuesto a permitir al
estimar estas variables.- También debe
determinar de antemano la confianza que
desea tener de obtener una estimación
correcta del parámetro de población
verdadero.-
VEREMOS AHORA
COMO
DETERMINAR EL
TAMAÑO
DE MUESTRA PARA
ESTIMAR
LA MEDIA
POBLACIONA
L
LA
PROPORCION
POBLACIONAL
DETERMINACION DEL TAMAÑO DE LA MUESTRA
PARA LA MEDIA.Para determinar el tamaño de la muestra necesario para
estimar la media, debe tenerse en cuenta la cantidad de
error de muestreo que se aceptará y el nivel de confianza
deseado.- Por otro lado, debe tener alguna información de
la desviación estándar.- Recordemos que:
Z =
X -
μ
σ
√n
Donde Z es el valor crítico correspondiente a un área de
( 1 - α) / 2 desde el centro de una distribución normal
estándar.-
Si se multiplica ambos lados de la ecuación por σ /√ n
tiene:
σ
Z
= X - μ
√n
se
Entonces el valor de Z es negativo o positivo, según si X
es mayor o menor que μ.La diferencia entre la media muestral y la media
poblacional que simbolizamos con E, se conoce como
error de muestreo .- Entonces:
E = Z
σ
√n
n=
Z² σ²
E²
De acuerdo con la fórmula de n, para determinar el
tamaño de la muestra, deben conocerse los tres
factores siguientes:
a) El intervalo de confianza deseado, que determina el
valor de Z o valor crítico en la distribución normal
estándar.b) El error de muestreo E aceptable.c) La desviación estándar σ.En la práctica profesional casi nunca
es
fácil
determinar
estas
tres
cantidades.- En esos casos se debe
recurrir a personas expertas en estos
temas.-
Veamos un ejemplo: Un grupo de consumidores
desea estimar el monto de las facturas de energía
eléctrica para el mes de julio para las viviendas
unifamiliares en una gran ciudad.Con base a estudios realizados en otras
entidades, se supone que la desviación estándar
es de 25 $.- El grupo desea estimar el monto
promedio para julio dentro de ± 5 pesos del
promedio verdadero con 99% de confianza.a) ¿Qué tamaño de muestra necesita?.b) Si desea 95 % de confianza.- ¿Qué
tamaño de muestra necesitaría?.Solución
a)
n =
2,58²
25²
=
5,0²
n = 166,41
a)
n =
1,96²
25
167 facturas
25²
5,0²
n = 96,04
6,6564 * 625
=
3,8416 * 625
25
97 facturas
Veamos un ejemplo.- El propietario de un gran centro
de esquí de los Estados Unidos esta considerando
comprar una máquina para hacer nieve y ayudar a la
madre naturaleza a proporcionarle una base apropiada
para los fanáticos esquiadores.- Si el promedio de
nevadas parece insuficientes, piensa que la máquina
debería pagarse sola muy pronto.- Planea estimar las
pulgadas promedio de nieve que caen el área, pero no
tiene idea que tan grande tiene que ser la muestra.- Solo
sabe que desea un 99% de confianza en sus hallazgos y
que el error no debe exceder de 1 pulgada.- El propietario
le promete abonos gratuitos.- ¿Usted puede ayudarlo?.Solución
Usted comienza con una muestra piloto grande n ≥ 30,
que en el estudio produce una desviación estándar de
3,5 pulgadas.- Entonces:
n =
Z²
σ²
E²
=
2,58²
3,5²
= 81,5
82
1,0²
Ahora puede recolectar los datos sobre las
últimas 82 nevadas que se utilizaran para estimar
las nevadas promedio.- Con esta información el
propietario puede determinar si la madre
naturaleza necesita ayuda.Lo más importante es que usted puede pasar el
resto del invierno esquiando gratuitamente.-
DETERMINACION DEL TAMAÑO DE LA MUESTRA
PARA LA PROPORCION
Los métodos de determinación del tamaño de la muestra
para la proporción son similares a lo visto para estimar la
media.Recordemos que:
Z=
p - P
P * (1 -P)
n
Donde Z es el valor crítico que corresponde a un área de
(1 – α)/ 2 desde el centro de una distribución normal
estándar.-
Al multiplicar
queda:
ambos lados por el denominador, nos
P * (1 -P)
Z
= ( p - P)
n
El error de muestreo E es igual (  P - P), la diferencia
entre la proporción muestral y el parámetro estimado P.Este error de muestreo se define como:
P * (1 -P)
E
=
Z *
n
Al despejar n de nuestra fórmula anterior nos queda:
n =
Z² * P (1 – P)
E²
Para determinar el tamaño de la muestra que
permita estimar una proporción, se debe definir
tres incógnitas:
a) El nivel de confianza deseado.b) El error de muestreo E.c) La proporción verdadera de éxito P.-
En la practica profesional la determinación de estas tres
cantidades requiere toda una planificación.El nivel de confianza deseado me dará el valor de Z.- El
error de muestreo será la cantidad de error que se está
dispuesto a tolerar al estima la proporción P de la
población.- La tercera cantidad es la proporción de
éxito P, en realidad “es el parámetro de la población que
se quiere encontrar”, entonces ¿como se establece un
valor que es justo para lo que se debe tomar una
muestra que permita determinarlo?.Primero se debe recurrir a información histórica o
experiencias previas que ayuden a estimar una
predicción de P.- Cuando no encontramos nada que nos
ayude, suponemos P = 0,50 como la manera más
conservadora de determinar el tamaño de la muestra.-
Es posible que el uso de
P = 0,50
sobreestime el tamaño de la muestra
porque la proporción muestral real se usa
para desarrollar el intervalo de confianza.Si la proporción muestral es muy diferente
de 0,50, el ancho del intervalo
de
confianza será más angosto que el
requerido en un principio.- La mayor
precisión la obtenemos a costa de gastar
más tiempo y dinero en un tamaño de
muestra más grande.Veamos un ejemplo.-
Supongamos que el Poder Legislativo de nuestra
ciudad está planeando una Ley que prohíbe fumar
en todos los edificios públicos incluyendo
restaurantes, confiterías, cines etc.- Solo estará
exentas las viviendas particulares.- Sin embargo,
la legislatura antes de sacarla definitivamente,
desea saber que proporción de la población
acompaña tal medida.- La carencia de toda
habilidad estadística por parte de los legisladores
obliga a citarlo a usted como consultor.- Su primer
paso será determinar el tamaño muestral
necesario.- Se le dice que su error no debe
exceder del 2 % y usted debe estar 95 % seguro de
sus resultados.Solución
Debido a que no se tomo previamente una muestra piloto,
usted debe determinar temporalmente un P = 0,50 para
determinar el tamaño muestral.Al despejar n de nuestra fórmula anterior nos queda:
n = Z² * P (1 – P)
E²
n = 1,96² * 0,50 * 0,50 = 2401 ciudadanos
0,02²
Con los datos suministrados por los 2401 ciudadanos
usted puede proceder con su estimación de la
proporción de todos los ciudadanos que están a favor de
la ley.- Recién el legislativo tomará una decisión.-
EJERICICIO PARA HACER EN CLASE
Unos fabricantes de tubo de polivinilo quieren tener un
suministro suficiente para satisfacer las necesidades del
mercado.- Desean hacer una investigación entre los
comerciantes al mayoreo que compran el tubo de
polivinilo a fin de estimar la proporción en que planean
aumentar sus compras el próximo año.- ¿Qué tamaño de
muestra se requiere si desean que su estimación quede
dentro de 0,04 de la proporción real con probabilidad
igual a 0,90?.Rpta: n = 422,7
LIMITES DE
CONFIANZA
UNILATERALES
Los intervalos de confianza que hemos visto hasta ahora,
se denomina intervalos de confianza bilaterales, porque
producen un límite inferior y un límite superior para el
parámetro de interés.No obstante, algunas veces el experimentador solo está
interesado en uno de esos límites, es decir, necesita un
límite superior (o quizás el límite inferior) para el
parámetro de interés.Cuando la distribución muestral de un estimador puntual
es aproximadamente normal, es posible usar el mismo
argumento que hemos visto al principio de intervalos de
confianza, solo que usaremos cuando la muestra es
suficientemente grande, Zα.- Entonces:
Limite inferior del Intervalo:
Estimador puntual - Zα * error estándar del estimador
Limite superior del Intervalo:
Estimador puntual + Zα * error estándar del estimador
fx
α
0
Zα
EJERCICIO PARA HACER EN CLASE
Una corporación planea emitir algunas acciones a corto
plazo y tiene la esperanza de que el interés a pagar no
exceda 11,5 %.- Para obtener alguna información con
respecto a este problema, la corporación comercializó 40
acciones, cada una a través de 40 agencias de
correduría.- La media y la desviación estándar para las 40
tasas de interés fueron 10,3 y 0,31 % respectivamente.Puesto que la corporación está interesada solo en un
límte superior en las tasas de interés, encuentre un límite
superior de 95% para la tasa de interés media que la
corporación tendrá que pagar por las notas.Repta:
10,3806
EJERCICIOS
GENERALES
1.- Se extrajo una muestra aleatoria de 172
estudiantes de Contabilidad y se les pidió que
evaluaran una determinada condición de trabajo
en
una escala de 1 (no importante) a 5
(extremadamente importante).- La “seguridad en
el trabajo” recibió una calificación media de 4,38
con una desviación estándar muestral de 0,70.Calcular y explicar un intervalo de confianza del
99 por ciento para la media poblacional.Resp:
(4,24 a 4,52)
2.- En un estudio de los efectos de las fusiones en la
industria del transporte por carreteras, se examinó una
muestra aleatoria de 17 empresas resultantes de una
fusión y midió el incremento en la tasa de crecimiento de
la carga en toneladas transportada en el período posterior
a la fusión, comparándolo con el anterior a dicha fusión.Para cada una de estas empresas, se examinó otra
empresa con una localización y tamaño similares pero que
no habían participado en una fusión.- Se calculó la
diferencia en las tasas de crecimiento de ambas clases de
empresas.- Los valores muestrales que surgieron como
resultado de dicho cálculo tenían media 0,105 y una
desviación estándar de 0,440.- Calcule un intervalo de
confianza del 90 por ciento para la media poblacional,
asumiendo que la distribución de la población es normal.Resp: (- 0,121 a 0,331).- (con t).-
3.- Para tratar de estimar la media de consumo por cliente, en un gran
restaurante, se reunieron datos de una muestra de 49 clientes,
durante un período de 3 semanas:
Suponga que la desviación estándar de población es de 2,50 dólares.¿Cuál es el error estándar de la media?.Con un nivel del 95%, ¿Cuál es el margen de error?.Si la media de la muestra es de $22,60 dólares, ¿Cuál es el intervalo de
confianza del 95% para la media de la población?.4.- Los Ingresos semanales de las personas que trabajan en varias
industrias aparecieron en el cierta revista económica.- Esos
ingresos para quienes trabajan en los servicios fueron de 369$.Suponga que los resultados se basaron en una muestra aleatorias
simple de 250 personas dedicados a los servicios y que la
desviación estándar de la muestra fue 50$.- Calcule un intervalo de
confianza del 95% para la población de ingresos semanales de
personas que trabajan en servicios.-
5.- Se determinó la rentabilidad de vender automóviles
usados, en un estudio de la Asociación Nacional de
Comerciantes de Automóviles.- Suponga que con una
muestra de 200 vendedores de autos usados se obtuvo
una ganancia promedio de $300 y una desviación estándar
de 150$.- Con esta información defina un estimado de
intervalo de confianza del 95% para la utilidad promedio de
la población de ventas de autos usados.6.- Una muestra de 532 suscriptores a la revista Mercado,
mostró que el tiempo promedio que pasa un suscriptor en
Internet y en servicios en línea es de 6,7 horas semanales.Si la desviación estándar de la muestra es de 5,8 horas.¿Cuál es el intervalo de confianza de 95% de la población
de tiempos promedio que pasan los
suscriptores a
Mercado en Internet y en servicios en línea?.-
7.- La Asociación Internacional de Transporte hace encuestas entre
agentes viajeros para determinar calificaciones de calidad de los
aeropuertos transatlánticos principales.- La calificación máxima es
10.- El aeropuerto con mayor calificación fue Ámsterdam con una
calificación promedio de 7,93, seguido por Toronto con 7,17.Suponga que se toma una muestra aleatoria de 50 agentes viajeros y
que a cada uno se le pidió calificar el aeropuerto de Buenos Aires.- A
continuación vemos las calificaciones obtenidas con la muestra de 50:
6
4
6
8
7
7
6
3
3
8
7
8
7
5
9
5
8
4
3
8
4
4
8
4
5
6
2
5
9
9
9
9
5
9
7
8
3
10
8
9
10
5
8
6
4
5
4
8
4
8
a) Determine un estimado por intervalo de confianza del 95%.b) Determine un estimado por intervalo de confianza del 98%.c) Determine un estimado por intervalo de confianza del 92 %.d) Explique cada uno de ellos y fundamente la mejor estimación de la
calificación promedio poblacional.-
8.- La encuesta anual de calidad de automóviles efectuada por cierta
Consultora, determinó que la cantidad promedio de defectos en todas
las marcas, por cada vehículo nuevo es de 1,07.- Suponga que se toma
una muestra de 30 automóviles nuevos de determinada marca y se
obtuvieron las siguientes cantidades de defectos por vehículo:
0
1
1
2
1
0
2
3
2
1
2
0
0
2
0
1
1
3
4
0
3
0
2
0
2
0
3
1
0
2
a) Con estos datos ¿Cuál es el promedio muestral de la cantidad de
defectos por vehículo?.b) ¿Cuál es la desviación estándar de la muestra?.c) Determine un estimado por intervalo de confianza del 95% para la
cantidad promedio de defectos por vehículo para la población de
automóviles de esta marca.d) Después de revisar el estimado de confianza de la parte c), un
analista estadístico sugirió que el fabricante revisara una mayor
cantidad de automóviles nuevos antes de llegar a una conclusión al
comparar la calidad de sus vehículos con el promedio general de
1,07 defectos por vehículos.- ¿Respalda usted esta idea?, ¿Por
qué?.-
9.- Una operación de llenado de envases tiene desviación
estándar histórica de 5,5 onzas.- Un inspector de
control de calidad selecciona periódicamente 36
recipientes al azar, y emplea el peso de llenado
promedio de la muestra para estimar el correspondiente
a la población.a) ¿Cuál es el error estándar del promedio?.b) Con 0,95, 0,90 y 0,99 de probabilidad, ¿Qué se puede
afirmar acerca del error de muestreo?.-¿Qué sucede a la
declaración del error de muestreo cuando aumenta la
probabilidad?.- ¿Por que sucede así?.c) ¿Cuál es el intervalo de confianza del 99% para el peso
promedio de llenado de la población en el proceso, si el
promedio muestral es de 48,6 onzas?.-
10.- La Asociación Argentina de Agencias de Publicidad
tiene registros de datos sobre minutos de anuncios por
cada media hora de programas principales de Televisión.En la tabla siguiente vemos una lista de datos
representativos de una muestra de programas preferentes
en cadena principales a las 8,30 PM..6,0
5,8
6,3 6,4 6,0
7,2 6,5 7,2
7,6
6,0
6,6
7,0
6,2
5,7
7,0
6,2
6,5
7,3
6,8
6,2
Determine un estimado puntual y calcule un Intervalo de
confianza del 95% para la cantidad promedio de minutos
de anuncios en los principales espectáculos televisivos a
las 8,30 PM.- (con t)
11.- La cantidad de horas que duermen los argentinos cada noche
varia mucho desde el 12 % de la población que duerme menos de 6
horas hasta el 3% que duerme más de 8 horas.- A continuación
vemos la muestra de las horas que duermen por la noche 25
personas:
5.3
6.7
7.2
6.0
6.5
8.6 7.7 6.9 7.8 7.3 6.8 7.6 6.2 7.6 6.9 5.8
5.5
7.1
7.2
6.0 7.6
7.0 6.6 6.5
7.1
a) ¿Cuál es el estimado puntual de la media de población de la
cantidad de horas que se duerme cada noche?.b) Suponiendo que la población tiene una distribución normal,
determine un Intervalo de confianza del 95% para la cantidad de la
media de población de horas de sueño cada noche.c) Suponiendo que la población tiene una distribución normal,
determine un Intervalo de confianza del 92% para la cantidad de la
media de población de horas de sueño cada noche.d) Suponiendo que la población tiene una distribución normal,
determine un Intervalo de confianza del 90% para la cantidad de la
media de población de horas de sueño cada noche.e) ¿Cuál de las estimaciones aconsejaría usted? ¿Por qué?.- (con t)
12.- Se cree que los sueldos anuales iniciales de egresados de
Licenciatura en Administración de Empresas pueden tener una
desviación estándar aproximada de 2000$.- Suponga que se desea un
estimado de intervalo del 95% de nivel de confianza para la media del
sueldo anual inicial.- ¿De que tamaño debe tomarse la muestra si el
margen de error es:
a) 500$?
b) 200$?
c) 100$?
13.- La Cámara Argentina de Viviendas, publica datos del alquiler
mensual de viviendas con un dormitorio en cierta área
metropolitana.- La desviación estándar de la renta mensual es
aproximadamente de $80,0.- Suponga que se debe seleccionar una
muestra de área metropolitana para estimar la media de la
población de renta mensual de viviendas con un solo dormitorio.Emplee el nivel de confianza del 95%.a) ¿De que tamaño debe ser la muestra para que el margen de error
deseado sea de 25,0$?.b) ¿De que tamaño debe ser la muestra para que el margen de error
deseado sea de $15,0?.-
14.- El tiempo de traslado al trabajo para residentes de las
15 ciudades mayores de la provincia de Buenos Aires
aparece en una revista técnica.- Suponga que se emplea
una muestra aleatoria simple preliminar de residentes de
Morón y se determina que 6,25 minutos es el valor de
planeación de la desviación estándar poblacional.Si se desea estimar la media de la población del tiempo de
traslado para los residentes de Morón, con 2 minutos de
margen de error, ¿Qué tamaño de la muestra se debe
usar?.- Suponga una confianza del 95%.Si se desea que el margen de error sea de 1 minuto, ¿Qué
tamaño de la muestra se debe usar?.- Suponga una
confianza del 95%?.-
15.- En una encuesta realizada por cierta consultora, se
pidió a 814 adultos que contestaran un cuestionario
acerca de sus ideas sobre el estado general interno de
Argentina.- A la pregunta ¿“Cree usted que todo va bien
en Argentina en la actualidad “?,562 adultos contestaron
que SI.a) ¿Cuál es el estimado puntual de la proporción
poblacional de adultos que creen que las cosas van bien
en Argentina?.b) ¿Cuál es el margen de error con el 90% de confianza?.c) ¿Cuál es el intervalo de confianza del 90% para la
proporción de adultos que creen que todo va bien en
Argentina?.-
16.- Esteban Rossi, reunió datos sobre las
actitudes acerca de la calidad del servicio a
clientes en tiendas de ventas al menudeo.- La
encuesta determinó
que el 28% de los
argentinos creen que el servicio al cliente es
mejor en la actualidad que hace dos años atrás.Si en una muestra participaron 650 adultos,
determine un intervalo de confianza del 90% de
la proporción poblacional de adultos que creen
que el servicio al cliente es mejor actualmente
que hace dos años.-
17.- Una consultora llevó a cabo una encuesta nacional
de 902 golfistas mujeres para estudiar como se
consideran tratadas en los campos de golf.- En la
encuesta se encontró que 397 mujeres están
satisfechas con los tiempos disponible de caddie,
307 estaban satisfechas con los reglamentos de
membresías el, y 234 estaban satisfechas con las
instalaciones de los vestidores.a) Determine el estimado puntual de la proporción
poblacional y el intervalo de confianza del 95% para
cada una de las tres preguntas de la encuesta.b) Determine intervalo de confianza del 90 % para
cada una de las tres preguntas de la encuesta.c) De conclusiones.-
18.- La conserjería de hacienda también quiere
información sobre las tarjetas de estacionamiento
de minusválidos.- Suponga que en una muestra de
350 transacciones relacionadas con estas tarjetas se
observó que 250 se pagaron electrónicamente.a) ¿Cuál es el margen de error de una estimación de la
proporción poblacional de tarjetas pagadas
electrónicamente considerando un intervalo de
confianza de 99%?.b) Indique sin realizar los cálculos si es el margen de
error de una estimación similar a la anterior pero
con un nivel de confianza al 95% es mayor, menor o
igual que el obtenido en el inciso a) en el que el nivel
de confianza era del 99%.Resp: a) 0.9623
b) menor
19.- ¿Cuál es el método más frecuente para renovar el
permiso de circulación de los vehículos?.Examinando una
muestra aleatoria de 500
renovaciones en una provincia, la conserjería de
hacienda observó que 200 se realizaron por correo,
160 se pagaron en persona y el resto se pago por
Internet.- Esta operación no podía realizarse por
teléfono.a) Estime la proporción poblacional que paga la
renovación en persona en las oficinas de la
consejería de hacienda.- Utilice un nivel de
confianza del 90 por ciento.b) Estime la proporción poblacional de renovación por
Internet.- Utilice un nivel de confianza del 95 por
ciento.-
c) Suponga que calculáramos para la proporción
poblacional que paga renovación por correo un
intervalo de confianza que fuera de 0,34 a 0,46.¿Cuál es el nivel de confianza de este intervalo?.d) Se ha dicho en un período local que menos de un
tercio (entre el 23,7 y el 32,3 por ciento) de la
población prefiere pagar por Internet.¿Cuál es el nivel de confianza de ese intervalo?.Resp. a)
b)
d)
c) 99,38 %
20.- Existen varios medicamentos para tratar la diabetes.Un experto en ventas de una importante compañía
farmacéutica necesita una estimación del numero de
nuevas prescripciones de su nuevo medicamento
contra la diabetes que se hicieron durante un
determinado mes.-El numero de nuevas prescripciones
en una muestra aleatoria de 10 distritos de ventas es:
210 240 190 275 290 265 312 284 261 243
a) Halle un intervalo de confianza al 90% del numero
medio de prescripciones de este nuevo medicamento
en todos los distritos de ventas,. Indique los
supuestos.b) Calcule la amplitud de los intervalos de confianza al 95
y 98 %.Resp:
a) 235,4318 a 278,5628 b) normalidad
c) 230.39 a 283.61 al 95%
223.815 a 290.815 al 98%
21.- Todo el mundo sabe que el ejercicio físico es
importante.- Recientemente, se ha encuestado y se
ha preguntado a los residentes de una comunidad
cuantos minutos dedicaban diariamente a hacer
algún tipo de ejercicio riguroso.- En una muestra
aleatoria de 50 residentes, el tiempo medio
dedicado diariamente a hacer algún
ejercicio
riguroso era de media hora.- Se observó que la
desviación estándar era de 4,2 minutos.- Halle una
estimación del intervalo de confianza al 90% del
tiempo que dedican diariamente estos residentes a
hacer algún tipo de ejercicio riguroso.Resp: 29.0209 a 30.9771
22.- Un ayudante de estudios de mercado de un
hospital veterinario encuestó a una muestra
aleatoria
de
457
propietario
de
animales
domésticos.- Les pidió que indicaran el número de
veces que van al veterinario al año.- La media
muestral de las respuesta fue de 3,59 y la desviación
estándar fue de 1,045.Basándose en estos resultados se calculo el intervalo
de confianza de la media poblacional de 3,49 a 3,69.a) Halle la probabilidad que corresponde a este
intervalo.b) Estime un intervalo de confianza para la media
poblacional al 99 por ciento.Resp: a) 95.96%
b)
INTERVALOS DE
CONFIANZA
PARA
DOS MEDIAS
POBLACIONALES
Veremos en este caso métodos basados en intervalos de confianza
para estimar
algunos parámetros de dos poblaciones.- Un
importante problema en la inferencia estadística es la comparación
de dos medias de poblaciones que siguen una distribución normal
o la comparación de dos proporciones de grandes poblaciones.Por ejemplo:
a) Los ejecutivos de las cadenas minoristas pueden
querer estimar la diferencia entre las ventas diarias de
dos de sus establecimientos.b) Los fabricantes pueden querer comparar la
productividad media, en unidades por hora de los
trabajadores del turno de día y del turno de noche de
una planta.c) Una compañía química recibe envios de dos
proveedores.- Se selecciona muestras aleatorias
independientes
de lotes procedentes de los dos
proveedores y se comparan los niveles de impurezas de
los dos lotes.-
INTERVALOS DE
CONFIANZA
PARA LA
DIFERENCIA ENTRE
DOS MEDIAS
POBLACIONALES
Hay situaciones donde se necesita estimar la diferencia
entre la media de dos poblaciones.- A partir de cada
población se extrae una muestra aleatoria independiente y
de cada una de ella se calcula las medias muestrales  x1 y
 x2, respectivamente.En la Unidad de Distribuciones Muestrales, se dijo que el
estimador  x1 -  x2 ofrece una estimación insesgada de la
diferencia entre las medias poblacionales µ1 - µ2.- La
variancia del estimador es σ²1/n1 + σ²2/n2 .También hemos mencionado que según las condiciones, la
distribución muestral de  x1 -  x2, puede presentar una
distribución al menos aproximadamente normal, de modo
que en muchos casos se utiliza la distribución normal para
estimar un intervalo de confianza para µ1 - µ2 .-
Cuando se conoce la variancia de la población el intervalo
de confianza para µ1 - µ2 esta dado por:
( x1 -  x2) ± Z1- α/2
σ²1/n1 + σ²2/n2
El análisis del intervalo de confianza para la diferencia
entre las medias poblacionales ofrece información util
para decidir si es no probable que las medias de las dos
poblaciones sean iguales.- Cuando el intervalo no incluye
al cero, se dice que el intervalo ofrece evidencia de que
las dos medias poblacionales tienen medias diferentes.Cuando el intervalo incluye al cero, se dice que las
poblaciones pueden tener medias iguales.-
VEAMOS UN EJEMPLO
Las calidades de desgaste de dos tipos de neumáticos
para automóviles se compararon
mediante muestras
probadas en carreteras de n1 = n2 = 100 automóviles de
cada tipo.- El número de kilómetros hasta el desgaste final
se definió como una cantidad específica de uso del
neumático.- Los resultados de la prueba aparecen en la
tabla siguientes.- Estime
(µ1 - µ2 ) , la diferencia en
kilómetros promedio hasta el desgaste final, con un
intervalo de confianza de 99%.- ¿Hay una diferencia en la
calidad de desgaste promedio para los dos tipos de
neumáticos?.Neumático 1
Neumático 2
Media
Media 25100 kilómetros
26400 kilómetros
Variancia1440000 kilómetros²
Variancia 1960000 kilómetros²
Solución: La estimación puntual de µ1 - µ2 es  x1 -  x2 =
26400 – 25100 = 1300 kilómetros.- El coeficiente de
confiabilidad que corresponde a 0,99, localizado en la
Tabla de la Normal Estandarizada es 2,58.- El error
estándar es:
σ x
1
-  x2
=
σ ²1
n1
+
σ²2
n2
=
1440000
100
+
1960000
100
= 184,8
Por lo tanto, el intervalo de confianza del 99% será:
1300 ± 2,58 (184,8)
1300 ± 475,8
( 824,2 a 1775,8)
Se dice que se tiene una confianza del 99% de que la
diferencia real entre las medias poblacionales este entre
824,2 y 1775,8 kilómetros, porque en muestreos repetidos
99% de los intervalos construidos de esa manera incluiría
la diferencias entre las medias reales.Como dentro del intervalo no incluye el cero, se concluye
que las dos poblaciones tienen diferentes medias.Muestreo a partir de poblaciones que no siguen
una distribución normal.La elaboración de un intervalo de confianza para la
diferencia entre las medias de dos poblaciones que no
siguen una distribución normal es igual al caso anterior
siempre que n1 y n2 sean grandes.- Es evidente que esto es
el resultado de aplicar el teorema central del límite.- Si se
desconocen las variancias de la población se utilizan las
variancias de la muestra para estimarlas.-
VEAMOS UN EJEMPLO
En un esfuerzo por comparar los salarios iniciales anuales
para graduados de la universidad especializados en
educación y ciencias sociales, se seleccionaron muestras
aleatorias de 50 estudiantes recién graduados en cada
especialidad y se obtuvo la siguiente información:
Especialidad
Media
Desvió estándar
Educación
40554
2225
Ciencias Sociales
38348
2375
a) Encuentre una estimación puntual para la diferencia en
la medida de los sueldos iniciales anuales de estudiantes
universitarios recién graduados que se especializaron en
educación y ciencias sociales.- ¿Cuál es el margen de
error en estimación?.-
b) Con base a los resultados del inciso a)
diferencia importante en las medias de los dos
la población general?.-
¿hay una
grupos en
c) Calcule un Intervalo de confianza de 95%.Solución
La estimación puntal para la diferencia entre las medias de
las poblaciones es la diferencia entre las medias de las
muestras, 40554 - 38348 = 2206.- Sabemos que para una
confiabilidad del 95% le corresponde 1,96.- La estimación
del error estándar es:
5640625
4950625
S x1 -  x2 =
50
+
50
= 902,08
El intervalo de confianza será:
2206 ± 1,96 (460,2445)
2206 ±
902,08
(1303,92 a 3108,08)
El intervalo no contiene al cero, lo que podemos decir con
un 95% de confianza que hay diferencia entre los
promedios anuales de los graduados en las distntas
especialidades.-
EJERCICIO PARA HACER EN CLASE
Uno de los costos principales al planear las vacaciones
de verano es el costo del hospedaje.- Incluso dentro de
una cadena particular de hoteles, los costos varían
sustancialmente dependiendo del tipo de habitación y los
servicios ofrecidos.- Suponga que elige al azar 50 estados
de cuentas de cada una de las bases de datos de las
cadenas de hoteles, Marriott, Sheraton, y Hilton, y se
registra las tarifas de alojamientos nocturnos:
Marriott
Sheraton
Hilton
Promedio muestral
170
145
150
Desvió estándar muestral
17,5
10,0
16,5
a) Encuentre un intervalo de confianza de 95% para la
diferencia en las tarifas promedio de alojamiento para las
cadenas de hoteles Marriott y Hilton.b) Encuentre un intervalo de confianza de 99% para la
diferencia en las tarifas promedio de alojamiento para las
cadenas hoteleras Sheraton y Hilton.c) ¿Los intervalos de los incisos a) y b) contienen el valor
(μ - μ )? ¿Por qué es de interés para el investigador?.d) ¿Los datos indican una diferencia en las tarifas
promedio de alojamiento entre las cadenas Marriott y
Hilton?, ¿entre las cadenas Sheraton y Hilton?.Solución
DISTRIBUCION t Y LA DIFERENCIA ENTRE LAS
MEDIAS.Cuando no se conocen las variancias y se pretende
estimar la diferencia entre las medias de dos poblaciones
con un intervalo de confianza, es posible utilizar la
distribución t para suministrar el factor de confiabilidad si
se conocen ciertas suposiciones: se debe saber o suponer
de buena fe, que las dos poblaciones muestreadas siguen
una distribución normal.- Respecto a las variancias se
debe distinguir entre dos situaciones:
LAS VARIANCIAS SON
IGUALES
LAS VARIANCIAS SON
DISTINTAS
Variancias poblacionales iguales.
Si la suposición sobre igualdad de las variancias
poblacionales esta justificada, las dos variancias de las
muestras calculadas a partir de las muestras
independientes pueden considerarse como estimación de
lo mismo, es decir, la variancia común.- Parece lógico
entonces, aprovechar este hecho en el análisis en
cuestión.- Esto es precisamente lo que se hace para
establecer una variancia conjunta para la variancia
común.Esta variancia se obtiene mediante el calculo promedio
ponderado de las dos variancias de las muestras.- Cada
variancia de la muestra es ponderada por los grados de
libertad.- Si los tamaños de muestras son iguales, este
promedio ponderado es la media aritmética de las
variancias de las dos muestras .-
Si el tamaño de las dos muestras es distinto, el promedio
ponderado
aprovecha
la
información
adicional
proporcionada por la muestra mayor.- La estimación
conjunta se obtiene con la formula:
S²p =
(n1- 1)
S²1 + (n2- 1) S²2
(n1
+ n2 – 2)
Así, la estimación del error estándar esta dada por:
S x
1
-  x2
=
S²p
n1
+
S²p
n2
El intervalo de confianza de 100 (1 – α) por ciento para la
diferencia µ1 - µ2 esta dada por
( x1 -  x2) ± t1 - α/2
S x
1
-  x2
El número de grados de libertad utilizado para determinar
el valor de t que se usa para construir el intervalo es
n1 - n2 - 2 que es el denominador de la ecuación de S²p .Este intervalo se interpreta de la forma habitual.-
Veamos un ejemplo:
Un estudio tuvo como objetivo determinar los efectos del
ejercicio por un tiempo prolongado en los ejecutivos de
una empresa inscriptos en un programa supervisado de
acondicionamiento físico.- Se registraron datos de 13
individuos (el grupo deportista) que voluntariamente se
inscribieron al programa y que permanecieron activos por
13 años en promedio, y de 17 individuos (el segundo
grupo, el sedentario) que decidieron no inscribirse.- Entre
los datos que se registraron acerca de los individuos está
el número máximo de sentadillas
realizadas en 30
segundos.El grupo deportista obtuvo una media y una desviación
estándar de 21,0 y 4,9 respectivamente.- La media y la
desviación estándar para el grupo sedentario fue de 12,1 y
5,6 respectivamente.-
Se considera que las dos poblaciones de mediciones de
acondicionamiento físico muscular sigue una distribución
normal y que las variancias para ambas poblaciones son
iguales.- Se pretende elaborar un intervalo de confianza
del 95% para la diferencias entre las medias de las
poblaciones representadas por las dos muestras.Solución
Primero calculamos la estimación conjunta de la variancia
común de las poblaciones:
S ²p =
(13 – 1) 4,9²
+ (17 – 1) 5,6²
13 + 17 - 2
= 28,21
Entramos a la tabla de la t con 28 grados de libertad y
obtenemos un factor de confiabilidad de 2,0484.-
Podemos ahora calcular el intervalo de confianza del 95%
para la diferencia entre las medias de las dos poblaciones:
(21,0 - 12,1) ± 2,0484
28,21
13
+
28,21
17
8,9 ± 4,0085
4,9
a 12,9
Se tiene una confianza del 95% de que la diferencia entre
las medias de las poblaciones están entre 4,9 y 12,9.Debido a que el intervalo no incluye al cero, se puede
concluir que las medias de las poblaciones son
diferentes.-
EJERICICIO PARA HACER EN CLASE
Los residentes de la ciudad de Córdoba se quejan de que
las multas de tráfico por exceso de velocidad son más
altas en su ciudad que las que se imponen en la vecina
ciudad de Rió Cuarto.- Las autoridades acordaron estudiar
el problema para ver si las quejas son razonables.- Se
obtuvieron muestras aleatorias independientes de las
multas pagadas por los residentes de cada una de las
ciudades durante tres meses.- Las cuantías de estas
multas eran:
Córdoba 100 125 135 128 140 142 128 137 156 142
Rió Cuarto 95
87 100 75
110
105
85 95
Suponiendo que la variancia poblacional es igual, halle el
intervalo de confianza de 95% de la diferencia entre los
costos medios de las multas de estas dos ciudades.-
RESPUESTA DEL EJERCICIO USANDO MINITAB.a) Cargamos los datos de las dos muestras, una en C1 y
otra en C2.b) Nos posicionamos en la columna C3.c) Nos dirigimos con el cursor a Estadística Básica y
damos enter a “t de 2 muestras”.d) En la ventana siguiente tipiamos Muestras en
diferentes columnas.- Seleccione C1 en la primera y C2
en la segunda.e) Tecleamos asumir variancias iguales.f) Nos vamos a Opciones y registramos el nivel de
confianza que nos interesa y Aceptamos.g) Luego Aceptamos y nos queda lo siguiente:
IC de dos muestras: C1. C2
t de dos muestras para C1 vs. C2
N
C1 10
C2 8
Media Desv. Est.
133,3
14,8
94,0
11,4
Media del
Error
estándar
4,7
4,0
Diferencia = mu (C1) - mu (C2)
Estimado de la diferencia: 39,30
IC de 95% para la diferencia: (25,84. 52,76)
A largo plazo hay una diferencia entre el costo de las multas de
Córdoba y Río Cuarto.- El costo medio de una multa impuesta en
Córdoba es entre 25,84 y 52,76 más alto que el costo medio de una
multa similar impuesta en Río Cuarto.-
Variancias poblacionales distintas.Cuando no se puede concluir que las variancias de dos
poblaciones de interés son iguales, aún cuando pueda
suponerse que las dos poblaciones presentan distribución
normal, no es adecuado utilizar la distribución t como
acabamos de ver para construir los intervalos de
confianza.Una solución al problema de variancias distintas fue
propuesta por Fisher, y Cochran lo analiza en detalle.El problema gira en torno al hecho de que la cantidad
( x1 -  x2) – (µ1 - µ2)
S²1
n1
+
S²2
n2
No sigue una distribución t con n1 + n2 - 2 grados de
libertad cuando las variancias de las poblaciones son
distintas.- Por lo tanto, la distribución t no se puede
utilizar en la forma habitual para obtener el factor de
confiabilidad del intervalo de confianza para la diferencia
entre las medias de dos poblaciones que tienen variancias
diferentes.- La solución propuesta por Cochran consiste
en el cálculo del factor de confiabilidad mediante la
siguiente fórmula:
W 1 t1 + w 2 t 2
t’ 1 – α/2 =
W1 + w 2
Donde w1 = S²1 / n1
w2 = S²2 / n2 t1 = t1 – α/2 para n1 – 1
grados de libertad y t2 = t1 – α/2 para n2 – 1 grados de
libertad.-
Un intervalo de confianza aproximado del 100(1- α) por
ciento para µ1 - µ2 esta dado por:
( x1 -  x2) ± t’1 – α/2
S²1
n1
S ²2
+
n2
Veamos un ejemplo:
Retomemos el ejemplo visto oportunamente para
variancias
iguales.Los
investigadores
también
informaron los siguientes datos de las mediciones
referentes
a
todas
las
calificaciones
del
acondicionamiento muscular logradas por
los
individuos:
Muestra
n
Media
Desviación
estándar
Grupo deportistas
Grupo sedentarios
13
17
4,5
3,7
0,3
1,0
Se considera que las dos poblaciones de todas las
calificaciones de acondicionamiento muscular sigue una
distribución aproximadamente normal.- Sin embargo, no
debe suponerse que las dos variancias poblacionales
son iguales.Se pretende elaborar un intervalo de confianza del 95%
de confianza para la diferencia entre las medias de todas
las calificaciones de acondicionamiento muscular para
las dos poblaciones representadas por las muestras.Solución
Se utiliza el t’ que vimos para calcular el factor de
confiabilidad.- En la Tabla de la distribución t de Student,
se muestra que con 12 grados de libertad y 1 - 0,05/2 =
0,975,
t1 = 2,1788.- Análogamente con 16 grados de
libertad y 1 - 0,05/2 = 0,975, t2 = 2,1199.- Ahora podemos
calcular:
t’ =
=
0,3²/13 * 2,1788 + 1,0²/ 17 * 2,1199
0,3²/13 + 1,0²/ 17
0,139784
0,065747
=
= 2,1261
Ahora estamos en condición de elaborar el intervalo de
confianza pedido:
S²1
( x1 -  x2) ± t’1 – α/2
( 4,5 - 4,7) ± 2,1261
S ²2
+
n1
0,3²
13
n2
+
1,0²
17
0,8 ± 2,1261 * 0,25641101
0,25 a
1,34
Como el intervalo no incluye al cero se concluye que las
medias de las dos poblaciones son diferentes.-
EJERCICIO PARA HACER EN CLASE
La empresa de auditorias Sosa Roberto SRl, tomó
muestra aleatoria de facturas pendientes de pagos de la
oficina este y oeste de Rosental Mayoristas SA.- Quería
estimar con estas dos muestras independientes la
diferencia entre los valores medios de las facturas
pendientes de pago.- Los estadísticos muestrales
obtenidos fueron los siguientes:
Oficina este
Población X
Oficina oeste
Población Y
Media muestral
290
250
Tamaño de la
muestra
16
11
Desviación estándar
muestral
15
50
No suponemos que las variancias poblacionales
desconocidas son iguales.- Estime la diferencia entre
los valores medios de las facturas pendientes de pago
de las dos oficinas.- Utilice un nivel de confianza del
95%.Solución
IC de dos muestras independientes.- Variancias distintas
Muestra N
1
16
2
11
Media
290,0
250,0
Media del
Error
Desv.Est.
estándar
15,0
3,8
50,0
15
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: 40,0
IC de 95% para la diferencia: (5,8. a 74,2)
A largo plazo, el valor medio de las facturas pendientes de pago de la
Oficina Este son entre 5,8 $ y 74,2$ mayores que el valor de las facturas de
pago de la Oficina Oeste.-
EJERCICIOS
1.- Se observa que en una muestra aleatoria de seis
estudiantes de un curso de introducción a la economía
financiera que utiliza técnicas de aprendizaje de grupo la
calificación media es de 76,12 y la desviación muestral es
de 2,53.- En una muestra aleatoria de nueve estudiantes
de otro curso de introducción a la economía financiera
que no utiliza técnicas de aprendizaje de grupo, la media
y la desviación estándar muestral de las calificaciones de
los exámenes son 74,61 y 8,61 respectivamente.Estime un intervalo de confianza del 95% para la
diferencia entre las dos calificaciones medias
poblacionales.Suponga
que
las
variancias
poblacionales no son iguales.-
2.- Tolosa Hnos, es un fabricante pequeño pero en
expansión de cereales de desayuno que solo debe
calentarse para comerlos.- José Heredia, agricultor que
cultiva cereales, creó la empresa en 1910.- Se utilizan dos
máquinas para empaquetar cajas de cereales de trigo
azucarado de (510 gramos).- Estime la diferencia entre
los pesos medios de las cajas de cereales azucarado
empaquetados por las dos máquinas.- Utilice un nivel de
confianza del 95% y el fichero que esta en Minitab.3.Se encuesta
a persona recién licenciadas en
administración de empresas que trabajan a tiempo
completo y que declaran que su origen socioeconómico
es relativamente alto o bajo.- La remuneración total
media de una muestra aleatoria de 16 personas de origen
socioeconómico alto es de 34500 y la desviación
estándar muestral es de 8520$.-
La remuneración media de una muestra aleatoria
independiente de 9 personas de origen socioeconómico
bajo es de 31499$ y la desviación estándar muestral es
de 7521$.- Halle el intervalo de confianza al 90% de la
diferencia entre las dos media poblacionales.3.- Suponga que en una muestra aleatoria de 200
empresas que revaluaron sus activos fijos, el cociente
medio entre la deuda y los activos tangibles era de 0,517
y la desviación estándar muestral era de 0,148.- En una
muestra aleatoria independiente de 400 empresas que no
revaluaron sus activos fijos, el cociente medio entre la
deuda y los activos tangibles era de 0,489 y la desviación
estándar muestral de 0,159.- Halle el intervalo de
confianza al 99% de la diferencia entre las dos media
poblacionales.-
4.- Un investigador planea estimar el efecto que produce
un medicamento en las puntuaciones que obtienen los
sujetos humanos que realizan una tarea de coordinación
psicomotriz.Administra el medicamento antes de la prueba a los
miembros de una muestra aleatoria de 9 sujetos.- Sus
puntuaciones media es de 9,78 y la variancia muestral es
de 17,64.Utilice una muestra aleatoria independiente de 10 sujetos
como grupo de control y le administra un placebo antes
de la prueba.-Las puntuaciones media de este grupo de
control es de 15,10 y la variancia muestral es de 27,01.Suponiendo que las distribuciones poblacionales son
normales y tienen variancias iguales, halle el intervalo de
confianza al 90% de la diferencia entre medias
poblacionales de las puntuaciones.-
INTERVALOS DE
CONFIANZA
PARA LA DIFERENCIA
ENTRE LAS
PROPORCIONES DE
DOS POBLACIONES
En muchas situaciones, se tienen interés en conocer la
magnitud de la diferencia entre las proporciones de dos
poblaciones.- Es posible que se quiera comparar por
ejemplo,
entre hombres y mujeres dos grupos de
edades, dos grupos socioeconómicos o dos grupos de
diagnóstico con respecto a la proporción que posee
alguna característica de interés.Un estimador puntual insesgado de la diferencia entre
dos proporciones de las poblaciones se obtiene al
calcular la diferencia de las proporciones
de las
muestras,  p1 -  p2.Tal como hemos visto, cuando n1 y n2 son de gran
tamaño y las proporciones de la población no están muy
cerca de 0 o de 1, es posible aplicar el teorema central
del límite y utilizar la teoría de la distribución normal para
obtener los intervalos de confianza.-
El error estándar de la estimación se calcula mediante la
siguiente formula:
Sp1 - p2 =
 p1 (1 -  p1)
n1
+
 p2 (1 -  p2)
n2
dado que como regla, se desconoce las proporciones de
la población.- Un intervalo de confianza de 100( 1 – α)
por ciento para p1 - p2 se obtiene como:
( p1 -  p2) ± Z α/2
 p1 (1 -  p1)
n1
+
 p2 (1 -  p2)
n2
VEAMOS UN EJEMPLO
Unos investigadores de EEUU, investigaron la relación de
desarrollo del ego, edad, sexo y diagnóstico de suicidio
entre los internos adolescentes de la unidad de psiquiatría
de cierta institución.La muestra consistía en 96 varones y 125 niñas con
edades entre 12 y 16 años, seleccionados de entre los
internados en la unidad de adolescentes y niños de un
hospital psiquiátrico privado.- Se reportaron 18 niños y 60
niñas con intentos de suicidio.- Considérese el
comportamiento de las niñas como el de una muestra
aleatoria simple a partir de una población similar de niñas
y que los jóvenes, igualmente, pueden considerarse como
una muestra aleatoria simple extraída de una población
similar de niños.-
Para estas dos poblaciones, se pretende construir un
intervalo de confianza del 99%, para la diferencia entre las
proporciones de los individuos con intento de suicidio.Solución
Las proporciones para las niñas y niños respectivamente
son:  p1 = 60/125 = 0,4878 y  p2 = 18/96 = 0,1873.La diferencia entre las proporciones de la muestra es  p1  p2 = 0,4878 – 0,1873 = 0,3003.El error estándar estimado de la diferencia entre las
proporciones de las muestras es:
S p1 -  p2 =
0,4878 * 0,5122
125
+
0,1875 * 0,8125
96
El factor de confiabilidad de la tabla de la distribución
normal para 99% de confianza es 2,58, de modo que el
intervalo de confianza será:
0,3003
± 2,58 * 0,0602
0,1450 a 0,4556
Se tiene la confianza del 99% de que para las poblaciones
muestreadas, la proporción de intentos de suicidios entre
las niñas excede a la proporción de intentos de suicidios
entre los varones por 0,1450 a 0,4556.Como el intervalo de
concluye que las dos
diferentes.-
confianza no
proporciones
incluye el cero, se
de poblaciones son
EJERCICIO PARA HACER EN CLASE
1.-Para la construcción de escuelas será sometida a
votación una propuesta de bonos en la próxima
elección municipal.- Una parte importante del dinero
obtenido por esta emisión de bonos se usará para
construir escuelas en la sección de la ciudad de rápido
crecimiento, y el resto para renovar y remodelar los
edificios escolares en el resto de la ciudad.- Para
evaluar la viabilidad de la propuesta, se preguntó a
una muestra aleatoria de 50 residentes de la sección
en crecimiento y una muestra aleatoria
de 100
residentes de las otras partes de la ciudad, si
planeaban votar por la propuesta.- Los resultados se
muestran en la tabla siguiente:
Sección en crecimiento Resto de la ciudad
Tamaño de la muestra
90
100
N° a favor de la
propuesta
38
65
Proporción que
favorece la propuesta
0.76
0.85
a) Estime la diferencia en las proporciones verdaderas
que favorecen la propuesta de bonos con un intervalo
de confianza de 99%.b) Si con ambas muestra formara una de tamaño 150
con 103 a favor de la propuesta, esto da una
estimación puntual de la proporción de residentes de
la ciudad que votarán a favor.- ¿Cuál es el margen de
error?.-
2.- En un estudio sobre la relación entre el orden del
nacimiento y el éxito en la universidad, un investigador
encontró que 126, de una muestra de 180, graduados
de la universidad eran primogénitos o hijos únicos.- En
una muestra de 100 no graduados de edad y bases
socioeconómicas comparables, el número de
primogénitos o hijos únicos fue 54.- Estime la
diferencia entre las proporciones de primogénitos o
hijos únicos en las dos poblaciones de que tomaron
estas muestras.- Use un intervalo de confianza de 90%
e interprete sus resultados.3.- Durante un año de elecciones generales, se realizan
muchos pronósticos para averiguar como perciben los
votantes a un determinado candidato.- En una muestra
aleatoria 120 posibles votantes del distrito A, 107
declararon que apoyaban al candidato en cuestión.-
En una muestra aleatoria independiente de 141 posibles
votantes del distrito B, solo 73 declaran que apoyaran a
ese
candidato.- Si las proporciones poblacionales
respectivas se representan por medio de PA y PB, halle
el intervalo de confianza al 95% de la diferencia
proporcional.Si este ejercicio lo resolvemos con Minitab, tendremos:
IC para dos proporciones
Muestra X
1
107
2
78
N
120
141
Muestra p
0,891667
0,553191
Diferencia = p (1) - p (2)
Estimado de la diferencia: 0,338475
IC de 95% para la diferencia: (0,239347. 0,437603)
4.- En una muestra aleatoria de 120 grandes minoristas,
83 utilizan la regresión como método de predicción.- En
una muestra aleatoria independiente de 163 pequeños
minoristas, 78 utilizan la regresión como método de
predicciones.- Halle el intervalo de confianza al 98% por
ciento de la diferencia entre las dos proporciones
poblacionales.5.- ¿Iría más a la biblioteca si se ampliara su horario de
apertura?.- En una muestra aleatoria de 138 estudiantes
de primer año, 80 declararon que irían a la biblioteca de la
universidad si se ampliara su horario.- En una muestra
aleatoria independiente de 96 estudiante de segundo
años, 73 respondieron que irían más si se ampliara su
horario.- Estime la diferencia entre las proporciones de
estudiantes de primer año y de segundo año que
respondieron afirmativamente a esta pregunta.- Utilice un
nivel de confianza del 95%.-
6.- Una muestra aleatoria de 100 hombres contenía 61 a
favor de la introducción de una enmienda constitucional
para reducir la tasa de crecimiento de los impuestos
sobre bienes inmuebles.- Una muestra aleatoria
independiente de 100 mujeres contenía 54 a favor de esta
enmienda.- Se calculo el intervalo de confianza
0,04 < Px -
Py < 0,10
De la diferencia entre las proporciones poblacionales.¿Cuál es el nivel de confianza de este intervalo?.7.- Se observo a los clientes de un supermercado y se les
encuestó inmediatamente después deque colocaran un
artículo en el carro.- En una muestra aleatoria de 510
clientes que eligieron un producto al precio ordinario,
320 afirmaron que comprobaban el precio en el momento
que lo elegían.-
En una muestra aleatoria independiente de 332 que
eligieron un producto a un precio especial, 200 hicieron
esa afirmación.- Halle un intervalo de confianza al 90% de
la diferencia entre las dos proporciones poblacionales.8.- Según un artículo de prensa, el 75 por ciento de 400
personas encuestadas en una ciudad se oponen a una
decisión judicial reciente.- Según ese mismo artículo,
solo el 45 por ciento de 500 personas encuestadas en
otra se oponen a esa decisión.Construya un intervalo de confianza al 95% de la
diferencia entre las proporciones poblacionales
basándose en los datos.-
INTERVALOS DE
CONFIANZA
PARA LA VARIANCIA
DE POBLACIONES CON
DISTRIBUCION
NORMAL
ESTIMACION PUNTUAL DE LA VARIANCIA DE
LA POBLACION.Hemos dicho en secciones anteriormente que cuando se
desconoce la variancia de la población es posible utilizar
la variancia de la muestra como una estimador.- Como
cuando vimos las propiedades de un estimador se hizo
referencia solo al criterio de insesgado, así que es
necesario revisar si la variancia de la muestra es un
estimador insesgado de la variancia de la población.Para ser insesgado, el valor promedio de la variancia de la
muestra sobre todas las muestras posible deber ser igual
a la variancia de la población.- Esto es que se debe
cumplir que E (S²) = σ².- Para ver si esto se cumple en una
situación particular se considera el ejemplo que vimos de
las edades de cinco niños en la Unidad anterior.-
En la tabla que hacemos mención veíamos todas las
muestras posibles de tamaño 2 a partir de la población
formada con valores 6 8 10 12 14.Recuerde que dos medidas de dispersión para esta
población se calcularon como:
σ² =
Ʃ (xi µ)²
N
=8
y S² =
Ʃ (xi µ)²
N-1
= 10
Si se calcula la variancia de la muestra con la formula
que vimos, para cada una de las muestras posibles que
aparecen en la tabla, se obtienen las variancias
muestrales de la tabla:
TABLA
A
SEGUNDA SELECCION
1º
S
E
L
E
C
C
I
O
N
6
8
10
12
14
6
6;6
(0)
6,8
(2)
6;10
(8)
6;12
(18)
6;14
(32)
8
8;6
(2)
8,8
(0)
8;10
(2)
8;12
(8)
8;14
(18)
10
10;6
(8)
10,8
(2)
10;10
(0)
10;12
(2)
10;14
(8)
12
12;6
(18)
12;8
(8)
12;10
(2)
12;12
(0)
12;14
(2)
14
14;6
(32)
14;8
(18)
14;10
(8)
14;12
(2)
14;14
(0)
Las variancias de cada muestra están entre paréntesis.-
Muestreo con reemplazos.-
Si el muestreo es con reemplazo el valor
esperado de S² se obtiene tomando la media de
todas las variancias posibles de las muestras en
la Tabla A.- Cuando se hace esto, se obtiene:
E(S²) =
Ʃ S²
25
=
0 + 2 + ……… +2 + 0
25
=
200
25
=8
Se aprecia que cuando el muestreo es con
reemplazo la E (S²) = σ²
Muestreo sin reemplazos.Si el muestreo es sin reemplazo el valor esperado de S ²
se obtiene tomando la media de todas las variancias
posibles de las muestras que estan por encima (o por
debajo) de la diagonal princiapal en la Tabla A.- Cuando
se hace esto, se obtiene:
E(S²) =
Ʃ S²
10
=
2 + 8 +…………… +2
10
=
100
10
= 10
Se aprecia que cuando el muestreo es con reemplazo la E
(S²) ≠ σ² , sino que es igual a S².-
Estos resultados son ejemplos de principios generales,
ya que es posible mostrar en términos generales que:
E(S²) = σ², cuando el muestreo es con reemplazo.E(S²) = S², cuando el muestreo es sin reemplazo.Cuando N es muy grande , N – 1 y N son
aproximadamente iguales y entonces, S² y σ² serán
aproximadamente iguales.Estos resultados justifican que usemos la formula con el
n -1 para calcular la variancia de la muestra.- Asi mismo
debe recordarse que a pesar de que S² es un estimador
insesgado de σ². s no es un estimador insesgado de σ.Sin embargo el sesgo disminuye a medida que se
incrementa el tamaño de la muestra n.-
Ya teniendo una estimación puntual de la variancia, resulta
lógico preguntase sobre la elaboración de un intervalo de
confianza para la variancia poblacional.- Para elaborar un
intervalo de confianza para la variancia poblacional σ², es
necesario encontrar una distribución muestral adecuada,
y esta es la Distribución Chi cuadada que la simbolizamos
con Ҳ².En general los intervalos de confianza para σ² se basa en
la distribución muestral de (n – 1) S²/ σ².- Si se extraen
muestras de tamaño n de una población con distribución
normal, esta cantidad tiene una distribución conocida
como Chi cuadrada con n -1 grados de libertad.Cuando veamos pruebas de hipótesis volveremos hablar
de esta distribución, aquí solamente diremos que esta es
la distribución que se utiliza para los intervalos de
confianza de la variancia, cuando se cumple el supuesto
de que la población sigue una distrución normal.-
k=2
k=6
k=4
Para obtener un intervalo de confianza de 100(1- α) por
ciento para σ², se obtiene primero el intervalo de confianza
de 100(1 – α) por ciento para (n – 1) S²/ σ².Para efectuar este procedimiento se seleccionan los
valores de la tabla Chi cuadrada de las Tablas
Estadisticas.-
De tal modo que α/2 quede a la izquierda del valor menor y
α/2 quede a la derecha del valor mayor.- En otras
palabras, los dos valores chi cuadrada se seleccionan de
modo que α se divide en partes iguales entre las dos
colas de la distribución.- Estos dos valores de Chi se
designan como Ҳ²α/2 y Ҳ²1 – α/2, respectivamente.- Por lo
tanto, el intervalo de confianza de 100(1 – α) por ciento
para (n – 1) S²/ σ² esta dado por,
Ҳ²α/2 <
S² (n – 1)
σ²
< Ҳ² 1 - α/2
Ahora se utiliza esta ecuación para obtener una formula
con σ² como único término central.- Primero se divide
cada término por (n – 1) S² para obtener:
Ҳ²α/2
<
(n – 1)S²
1
<
σ²
Ҳ²1 - α/2
(n – 1)S²
Si se aplica el elemento recíproco en esta ecuación, se
obtiene:
(n – 1)S²
Ҳ²α/2
(n – 1)S²
>
σ²
>
Ҳ²1 - α/2
Notesé que cambia la dirección de las desigualdades
cuando se aplica el elemento recíproco.- Pero si se invierte
el orden de los términos se tiene:
Notesé que cambia la dirección de las desigualdades
cuando se aplica el elemento recíproco.- Pero si se invierte
el orden de los términos se tiene:
(n – 1)S²
(n – 1)S²
<
Ҳ²α/2
σ²
<
Ҳ²1 - α/2
Que es un intervalo de confianza de 100(1 – α) por ciento
para σ².- Si se toma la raíz cuadrada de cada término de
la ecuacón anterior se tiene el siguiente intervalo de
confianza 100(1 - α) por ciento la desviación estándar de
la población.Veamos un ejemplo:
Una muestra aleatoria de pastillas para el dolor de cabeza
tienen una
desviación
estándar de 0,8% en la
concentración de ingredientes activos.- Hallar un intervalo
de confianza del 90% para la variancia poblacional.Solución
Mos que n = 15
S² = 0,8² = 0,64
Dado que el intervalo requerido es del 90%, entonces α =
0,10, tenemos que:
Ҳ²n – 1: α/2 = Ҳ²14; 0,05 = 23,685
Ҳ²n – 1;1 - α/2 = Ҳ²14; 0,95 = 6,571
El intervalo de confianza será:
14 (0,64)
23,685
< σ² <
14 (0,64)
6,571
Por lo que,
0,378
<
σ²
< 1,364
Nuestro intervalo de confianza del 90% para la variancia
poblacional en la concentración del ingrediente activo esta
entre 0,378 y 1,364.Dado que la desviación estándar es la raíz cuadrada de la
variancia podemos calcular el intervalo de confianza para
la desviación estándar , que será;
0,61 <
σ < 1,17
Por lo tanto, nuestro intervalo de confianza del 90% para
la desviación estándar poblacional de la concentración
porcentual del ingrediente activo de estas pastillas va de
0,61% a 1,17%.-
Veamos otro ejemplo para Intervalos de confianza para la
variancia.En una investigación de los efectos de dietas con
densidad baja en colesterol lipoproteico, cierto médico
estudio
a 12 individuos, hombres y mujeres,
medianamente hipercolesterolémicos.- Los niveles de
colesterol (mmol/l) para estos individuos fueron;6,0 6,4
7,0 5,8 6,0 5,8 5,9 6,7 6,1 6,5 6,3 5,8.Se supone que los 12 individuos forman una muestra
aleatoria simple extraida de una población de individuos
similares que sigue una distribución normal.- Se pretende
estimar a partir de los datos de la muestra, la variancia
poblacional de los niveles del colesterol del plasma en la
población con un intervalo de confianza del 95%.Solución
La muestra produce un valor para S² = 0,391868.- Los
grados de libertad son n – 1 = 11.- Los valores Chi
cuadrada son:
Ҳ²n - 1: α/2 = Ҳ² 11; 0,025 = 21,920
Ҳ² n - 1;1 - α/2 = Ҳ² 11; 0,975 = 3,816
El intervalo de confianza será:
11 (0,391868)
<
21,920
σ²
0,196649087 <
σ² <
<
11 (0,391868)
3,816
1,35483656
Tenemos un 95% de confianza de que el parámetro
poblacional esta entre esos valores.-
Advertencia:
No usar este procedimiento cuando la
distribución de la población no es
normal.La validez del estimador por intervalo
de la variancia depende en mayor
medida de la hipótesis de normalidad
que el correspondiente a la media
poblacional.-
Otra dificultad con estos intervalos de
confianza resulta del hecho de que el
estimador no está en el centro del
intervalo de confianza como en el caso
de la media.- Esto se debe a que la
distribución Chi cuadrada, a diferencia
de la normal, no es simétrica.- La
consecuencia práctica de ello es que el
método desarrollado para la obtención
del intervalo de confianza para la σ² no
produce los intervalos
más cortos
posibles.-
Download