Uploaded by rgarciaseija

Medidas de posición

advertisement
Estadística
Tema 3: Medidas de Posición
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
1
Estadísticos de posición
Se define el cuantil de orden k como un valor de la variable por debajo del cual se
encuentra una frecuencia acumulada k.
 kn

− Fi −1 

 Ic
Cuantil = L i +  c
fi






Donde:
Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el cuantil k.
n = número total de valores de x involucrados.
c = número total de partes iguales en que dividimos el grupo de datos.
fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el cuantil k.
Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia
acumulada de todas las clases previas a la clase donde se encuentra el cuantil k.
Ic = intervalo de clase. (longitud del intervalo que abarca la clase)
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
2
Estadísticos de posición
Casos particulares son los cuartiles, quintiles, deciles, percentiles, etc.
„
Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.
„
Quintiles: Dividen a la muestra en 5 grupos con frecuencias similares.
„
Deciles: Dividen a la muestra en 10 grupos con frecuencias similares.
„
Percentiles: Dividen a la muestra en 100 grupos con frecuencias similares.
Mediana
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
3
Estadísticos de posición
„
Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes
iguales: primero, segundo y tercer cuartil.
Primer cuartil = Percentil 25
Segundo cuartil = Percentil 50 = mediana
Tercer cuartil = Percentil 75
„
Para datos no agrupados los cuartiles se ubican, aproximadamente,
ordenando y dividiendo el total de datos en 4 grupos con igual número de
datos. Para ello se multiplica el total de datos por la fracción
correspondiente a cada cuartil. Si el resultado no es un entero se
redondea al entero inmediato superior y se ubica ese dato, si el resultado
es entero se ubica ese dato y se promedia con el dato siguiente a el.
„
Para datos agrupados los cuartiles se ubican de la siguiente manera:
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
4
Estadísticos de posición

 kn
− Fi −1 

 Ic
Cuartil = Q k = L i +  4
fi




Donde:
Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el cuartil k.
n = número total de valores involucrados.
fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el cuartil k.
Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia
acumulada de todas las clases previas a la clase donde se encuentra el cuartil k.
Ic = intervalo de clase. (longitud del intervalo que abarca la clase)
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
5
Estadísticos de posición
„
Quintiles: Hay 4 quintiles que dividen a una distribución en 5 partes
iguales: primero, segundo, tercero y cuarto quintil.
Primer quintil = Percentil 20
Segundo quintil = Percentil 40
Tercer quintil = Percentil 60
Cuarto quintil = Percentil 80
„
Para datos no agrupados los quintiles se ubican, aproximadamente,
ordenando y dividiendo el total de datos en 5 grupos con igual número de
datos. Para ello se multiplica el total de datos por la fracción
correspondiente a cada quintil. Si el resultado no es un entero se
redondea al entero inmediato superior y se ubica ese dato, si el resultado
es entero se ubica ese dato y se promedia con el dato siguiente a el.
„
Para datos agrupados los quintiles se ubican de la siguiente manera:
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
6
Estadísticos de posición

 kn
− Fi −1 

 Ic
Qu int il = q k = L i +  5
fi






Donde:
Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el quintil k.
n = número total de valores involucrados.
fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el quintil k.
Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia
acumulada de todas las clases previas a la clase donde se encuentra el quintil k.
Ic = intervalo de clase. (longitud del intervalo que abarca la clase)
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
7
Estadísticos de posición
„
Deciles: Hay 9 deciles que dividen a una distribución en 9 partes iguales:
Primer decil = Percentil 10
Segundo decil = Percentil 20
Tercer decil = Percentil 30
Cuarto decil = Percentil 40
Quinto decil = Percentil 50 = mediana
Sexto decil = Percentil 60
Séptimo decil = Percentil 70
Octavo decil = Percentil 80
Noveno decil = Percentil 90
„
Para datos no agrupados los deciles se ubican, aproximadamente,
ordenando y dividiendo el total de datos en 10 grupos con igual número
de datos. Para ello se multiplica el total de datos por la fracción
correspondiente a cada decil. Si el resultado no es un entero se redondea
al entero inmediato superior y se ubica ese dato, si el resultado es entero
se ubica ese dato y se promedia con el dato siguiente a el.
„
Para datos agrupados los deciles se ubican de la siguiente manera:
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
8
Estadísticos de posición

 kn
− Fi −1 

 Ic
Decil = D k = L i +  10
fi






Donde:
Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el decil k.
n = número total de valores involucrados.
fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el decil k.
Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia
acumulada de todas las clases previas a la clase donde se encuentra el decil k.
Ic = intervalo de clase. (longitud del intervalo que abarca la clase)
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
9
Estadísticos de posición
„
Percentiles: Hay 99 percentiles que dividen a una distribución en 100
partes iguales. Se interpretan como el porcentaje de datos que se
encuentran agrupados por debajo del percentil considerado.
„
Para datos no agrupados los percentiles se ubican, aproximadamente,
ordenando y dividiendo el total de datos en 100 grupos con igual número
de datos. Para ello se multiplica el total de datos por la fracción
correspondiente a cada percentil. Si el resultado no es un entero se
redondea al entero inmediato superior y se ubica ese dato, si el resultado
es entero se ubica ese dato y se promedia con el dato siguiente a el.
„
Para datos agrupados los percentiles se ubican de la siguiente manera:
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
10
Estadísticos de posición

 kn
− Fi −1 

 Ic
Percentil = Pk = L i +  100
fi






Donde:
Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el percentil k.
n = número total de valores involucrados.
fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el percentil k.
Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia
acumulada de todas las clases previas a la clase donde se encuentra el percentil k.
Ic = intervalo de clase. (longitud del intervalo que abarca la clase)
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
11
„
Ejemplos
El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué
peso se considera “demasiado bajo”?
„ Percentil 5
¿Qué peso es superado sólo por el 25% de los individuos?
„ Percentil 75
El colesterol se distribuye simétricamente en la población. Se
considera patológico los valores extremos. El 90% de los
individuos son normales ¿Entre qué valores se encuentran los
individuos normales?
„ Entre el percentil 5 y el 95
¿Entre qué valores se encuentran la mitad de los individuos “más
normales” de una población?
„ Entre el cuartil 1º y 3º
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
12
Ejemplo con datos no agrupados
De acuerdo con la revista Informes al Consumidor en su número de febrero de
1980, las cuotas anuales de 40 compañías para un seguro de $ 25000 para
hombres de 35 años de edad son la siguientes: (en $) (Canavos, 1988. p 5)
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100
100
101
101
103
103
103
104
105
105
106
107
107
107
109
110
110
112
Determine: ¿el máximo a cotizar por el cuarto menor de los empleados?, ¿ Por encima de
que valor cotizan los empleados en el quintil superior?, ¿Entre que valores cotizan las 8
décimas partes centrales de los empleados?, ¿cuánto es el mínimo a cotizar por el 32 % de
los empleados con las mayores cotizaciones?
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
13
¿El máximo a cotizar por el cuarto menor de los empleados?
El cuarto menor de los empleados corresponde al primer cuartil; asi que vamos a
definir este y el máximo a cotizar por ellos será precisamente la frontera de este
cuartil.
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100 100
101 101 103 103 103 104 105 105
Primero multiplicamos el total de
datos por la fracción correspondiente
al primer cuartil.
1
(40) = 10
4
Dado que el resultado es entero,
promediamos el dato 10 con el dato
11, obteniendo el primer cuartil.
106 107 107 107 109 110 110 112
Q1 =
.
(91) + (92) = 91,5
2
Estadística. UNITEC
91,5 $ es la máxima cotización anual
entre los empleados que se ubican en la
cuarta parte que menos cotiza.
Tema 3: Medidas de Posición
Prof. L. Lugo
14
¿ Por encima de que valor cotizan los empleados en el quintil superior?
El quintil superior corresponde a los empleados que están por encima del cuarto
quintil; asi que vamos a definir este y el valor por encima del cual cotiza el quintil
superior será precisamente la frontera del cuarto quintil.
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100 100
101 101 103 103 103 104 105 105
106 107 107 107 109 110 110 112
q4 =
.
(106) + (105) = 105,5
2
Estadística. UNITEC
Primero multiplicamos el total de
datos por la fracción correspondiente
al cuarto quintil.
4
(40) = 32
5
Dado que el resultado es entero,
promediamos el dato 32 con el dato
33, obteniendo el cuarto quintil.
Los empleados del quintil superior
tienen una cotización anual que supera
los 105,5 $
Tema 3: Medidas de Posición
Prof. L. Lugo
15
¿Entre que valores cotizan las 8 décimas partes centrales de los empleados?
Las 8 décimas partes centrales se refiere a los empleados que se ubican entre el
primer decil y el noveno decil. Por tanto debemos calcular estos y obtenemos el
intervalo de cotizaciones que se está solicitando.
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100 100
101 101 103 103 103 104 105 105
106 107 107 107 109 110 110 112
D1 =
(87 ) + (87 ) = 87
2
Primero multiplicamos el total de
datos por la fracción correspondiente
al primer decil y al noveno decil.
1
(40) = 4 ∧ 9 (40) = 36
10
10
Dado que el resultado es entero,
promediamos el dato 4 con el dato 5 y
el dato 36 con el dato 37, obteniendo
el primero y el noveno deciles.
D9 =
(107 ) + (109) = 108
2
Las 8 décimas partes centrales de los empleados cotizan entre 87 y 108 $ anuales.
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
16
¿Cuánto es el mínimo a cotizar por el 32 % de los empleados con las mayores cotizaciones?
El 32% de los empleados con las mayores cotizaciones se refiere a los empleados que
están por encima del percentil 68. Por tanto calculamos este último y el límite de
este percentil es precisamente la respuesta.
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100 100
101 101 103 103 103 104 105 105
106 107 107 107 109 110 110 112
P68 = 103
.
Estadística. UNITEC
Primero multiplicamos el total de
datos por la fracción correspondiente
al 68 percentil.
68
(40) = 27,2
100
Dado que el resultado no es entero,
redondeamos al entero inmediato; es
decir, al dato 28, obteniendo el 68
percentil.
103 $ es la mínima cotización anual entre el 32 %
de los empleados que hacen las mayores
cotizaciones anuales.
Tema 3: Medidas de Posición
Prof. L. Lugo
17
Ejemplo con datos agrupados
Para el ejemplo de los salarios semanales de los 65 empleados de la empresa P&R (clase
pasada), hallar, agrupándolos en una tabla de distribución de frecuencias, ¿cuánto gana el
segundo cuartil?, ¿cuál es el mínimo salario de los dos quintos superiores?, ¿cuál es el
máximo salario de los cuatro deciles centrales?, ¿cuál es el máximo salario del 45% de los
empleados que menos ganan?.
.
250
263
277
283.25
295
251
263.5
277
284
296
252.5
265
277.55
285
296
253
266.75
278
286
296.25
253
267
278
286
299
255.5
270.8
279
286.3
299.5
256
271
279
286.5
302.75
258
271
279
287
304
260
272
281
288
305
260.25
272.25
281.35
292
306.35
261
272.5
281.5
293
308
262
275
282
294.25
314.1
263
276.75
283
295
319.5
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
18
Ejemplo con datos agrupados
R = 319,5 − 250 = 69,5 ≅ 70
Asi, podemos construir una tabla con 7 clases y un Ic =10.
En cada clase vamos a considerar incluidos los límites inferiores; y por ende,
excluidos los límites superiores.
.
Ic
xi
fi
Fi
xi*fi
250 – 260
255
8
8
2040
260 – 270
265
10
18
2650
270 – 280
275
16
34
4400
280 – 290
285
14
48
3990
290 – 300
295
10
58
2950
300 – 310
305
5
63
1525
310 - 320
315
2
65
630
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
19
¿Cuánto gana el segundo cuartil?
 kn

− Fi −1 

 Ic
Cuartil = Q k = L i +  4
fi




En primer lugar hallamos los límites correspondientes al segundo cuartil; es
decir, entre los datos 16 y 17 para el primer cuartil (segunda clase) y entre
los datos 32 y 33 para el segundo cuartil (tercera clase).
Calculamos cada uno aplicando la fórmula anterior.
.
 65 − 8 
 (10) = 268,25
Q1 = 260 +  4
 10 


Los empleados ubicados
en el segundo cuartil
tienen un salario semanal
que oscila entre 268,25 y
279,06 $.
 (65)* 2 − 18 


4
Q 2 = 270 + 
 (10 ) = 279,06
16




Observe que el límite del
segundo cuartil es la
mediana que calculamos
la semana pasada.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
20
Ojiva de Frecuencias Acumuladas
Q2 = Mediana
(279,06)
Frecuencia Acumulada
70
60
58
50
63
65
48
40
34
30
20
18
10
8
0
255
265
Q1
(268,25)
.
Estadística. UNITEC
275
285
295
305
315
Salario Semanal
Tema 3: Medidas de Posición
Prof. L. Lugo
21
¿Cuál es el mínimo salario de
los dos quintos superiores?
 kn

− Fi −1 

 Ic
Qu int il = q k = L i +  5
fi






En primer lugar hallamos el límite correspondientes al tercer quintil; es decir,
las tres quintas partes del total de datos, o sea entre los datos 39 y 40
que se encuentran en la cuarta clase.
Calculamos aplicando la fórmula anterior.
 (65)* 3 − 34 


5
q 3 = 280 + 
 (10 ) = 283,57
14




Los empleados ubicados en los dos quintos superiores tienen un salario semanal
superior a 283,57 $.
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
22
Ojiva de Frecuencias Acumuladas
q3
(283,57)
Frecuencia Acumulada
70
60
58
50
63
65
48
40
34
30
20
18
10
8
0
255
265
275
285
295
305
315
Salario Semanal
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
23
¿Cuál es el máximo salario de los cuatro
deciles centrales?

 kn
− Fi −1 

 Ic
Decil = D k = L i +  10
fi






En primer lugar hallamos el límite correspondiente al séptimo decil; es decir, entre los
datos 45 y 46 (cuarta clase).
Calculamos aplicando la fórmula anterior.
 (65)* 7 − 34 


10
D 7 = 280 + 
 (10) = 289,71
14




Los empleados ubicados en los cuatro deciles centrales tienen un salario semanal
máximo de 289,71 $.
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
24
Ojiva de Frecuencias Acumuladas
D7
(289,71)
Frecuencia Acumulada
70
60
58
50
63
65
48
40
34
30
20
18
10
8
0
255
265
275
285
295
305
315
Salario Semanal
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
25
¿Cuál es el máximo salario del
45% de los empleados que
menos ganan?
 kn

− Fi −1 

 Ic
Percentil = Pk = L i +  100
f


i




En primer lugar hallamos el límite correspondientes al 45 percentil; es decir,
multiplicar por 0,45 el total de datos, o sea entre los datos 29 y 30 que se
encuentran en la tercera clase.
Calculamos aplicando la fórmula anterior.
 (65)* 45
− 18 

100
P45 = 270 + 
 (10 ) = 277,03
16




El máximo salario semanal del 45 % de los empleados que menos ganan es 277,03 $.
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
26
Ojiva de Frecuencias Acumuladas
P45
(277,03)
Frecuencia Acumulada
70
60
58
50
63
65
48
40
34
30
20
18
10
8
0
255
265
275
285
295
305
315
Salario Semanal
.
Estadística. UNITEC
Tema 3: Medidas de Posición
Prof. L. Lugo
27
Download