Uploaded by rgarciaseija

Solución a Ejercicios - Estadística - UBA

advertisement
ESTADÍSTICA – SUMATIVA III – RESPUESTAS
INSTRUCCIONES GENERALES

Construye la tabla de distribución de frecuencia para datos no agrupados, mostrando el
procedimiento de cada cálculo, utilizando tres decimales.

Interpreta fr2 y Fac3, mostrando el procedimiento de cada cálculo, determinando el significado
del estadístico obtenido.

Ordenar los datos de menor a mayor.

Construye la tabla de distribución de frecuencias para datos no agrupados, mostrando el
procedimiento de cada cálculo.

Determina los cálculos de la MTC, Media, Mediana, Moda, para datos agrupados, mostrando la
fórmula y el procedimiento de cada cálculo, determinando el significado del estadístico
obtenido.

Determina los cálculos de las Medidas de Dispersión o Variabilidad: Rango, Desviación Media,
Desviación Estándar, Varianza, Coeficiente de Variación para datos agrupados, mostrando la
fórmula y el procedimiento de cada cálculo, determinando el significado del estadístico
obtenido.

Interpreta las Medidas de Dispersión o Variabilidad: Rango, Desviación Media, Desviación
Estándar, Varianza, Coeficiente de Variación para datos agrupados. Muestra procedimiento y
uso de fórmulas. Expresa los resultados con dos decimales.
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 1 de 18
ACTIVIDADES A REALIZAR
1. Completar el cuadro en la siguiente distribución
Tabla de distribución de frecuencias para datos no agrupados,
mostrando el procedimiento de cada cálculo y utilizando tres
decimales:
Xi
fi
Fac
fri
Fri
3
3
𝐹𝑎𝑐1 = 𝑓1 = 𝟑
0,075
𝐹𝑟1 = 𝑓𝑟1
= 𝟎, 𝟎𝟕𝟓
4
5
5
𝐹𝑎𝑐2 = 𝐹𝑎𝑐1 + 𝑓2
= 3+5 = 𝟖
0,125
𝐹𝑟2
= 𝐹𝑟1 + 𝑓𝑟2
= 0,075
+ 0,125
= 𝟎, 𝟐𝟎𝟎
12
20
0,300
0,500
0,750
(*) VER NOTA 1
6
10
30
𝑓5
𝑓𝑟5 =
𝑁
10
=
40
= 𝟎, 𝟐𝟓𝟎
7
6
36
0,150
0,900
40
𝑓6
𝑓𝑟6 =
𝑁
4
=
40
= 𝟎, 𝟏𝟎𝟎
𝐹𝑟6
= 𝐹𝑟5 + 𝑓𝑟6
= 0,900
+ 0,100
= 𝟏, 𝟎𝟎𝟎
8
4
Total
40
1,00
(*) NOTA 1:
Dado que la sumatoria de las frecuencias (fi) es igual al número de datos
(n):
𝑛
𝑛 = ∑ 𝑓𝑖
𝑖=1
Para nuestro ejercicio, su valor se calcula de la siguiente manera:
6
∑ 𝑓𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5 + 𝑓6 = 3 + 5 + 𝑓3 + 10 + 6 + 4 = 40
𝑖=1
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 2 de 18
Al efectuar las operaciones indicadas en la fórmula obtenemos:
28 + 𝑓3 = 40
Despejamos f3 de la fórmula, obteniendo así el valor faltante en la tabla:
𝑓3 = 40 − 28 = 𝟏𝟐
RESUMEN
Xi
fi
Fac
fri
Fri
3
3
3
0,075
0,075
4
5
8
0,125
0,200
5
12
20
0,300
0,500
6
10
30
0,250
0,750
7
6
36
0,150
0,900
8
4
40
0,100
1,000
Total
40
1,00
Interpretación de fr2 y Fac3 mostrando el procedimiento de cada
cálculo, determinando el significado del estadístico obtenido:
fr2:
Es la frecuencia relativa correspondiente al valor número 2 (X2 = 4) en
la tabla de distribución de frecuencias. Es una medida estadística que se
calcula como el cociente de la frecuencia absoluta (f2 = 5) de dicho valor (X2
= 4) entre el total de valores (n = 40) que componen la población o muestra
y que se corresponde con la suma de todas las frecuencias absolutas, como
se detalló anteriormente (ver Nota 1):
𝑓2 =
𝑓2
5
=
= 𝟎, 𝟏𝟐𝟓
𝑛 40
INTERPRETACIÓN:
fr2 = 0,125 = 12,5%
Número de veces que un evento se reitera en una
muestra o experimento.
Ejemplo: “El 12,5% (o el 0,125) de los estudiantes de la
Universidad han solicitado 4 veces el libro de Estadística
Comparada en la biblioteca”
Fac3:
Es la frecuencia absoluta acumulada del valor (X3 = 5), resultado de ir
sumando las frecuencias absolutas de las observaciones o valores de una
población o muestra. Para calcularla se suma, a la frecuencia absoluta
acumulada del valor anterior (Fac2 = 8), la frecuencia absoluta del valor bajo
análisis (f3 = 12):
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 3 de 18
𝐹𝑎𝑐3 = 𝐹𝑎𝑐2 + 𝑓3 = 8 + 12 = 𝟐𝟎
INTERPRETACIÓN:
Fac3 = 20
Señala la cantidad de frecuencias absolutas para la totalidad
de los eventos que, en un listado ordenado, son menores o
idénticos que un determinado valor.
Ejemplo: “20 estudiantes de la Universidad han solicitado el libro de
Estadística Comparada un máximo de 5 veces”
2. Un operador local ha considerado una muestra aleatoria de 31
transformadores, anotando el tiempo necesario que requiere
en cada uno para lograr un plan integral de trabajo,
obteniéndose lo siguiente (en horas):
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29,
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32
Para datos no agrupados:
Calcule las medidas de tendencia central de estos datos,
indicando a qué tipo de medida pertenece.
RESPUESTAS
Para construir la Tabla de Distribución de Frecuencias para datos no
agrupados, en primer lugar se ordenan los datos de menor a mayor:
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29, 32, 31, 28,
29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32
Datos ordenados:
27, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 31, 31,
31, 31, 31, 31, 31, 32, 32, 32, 33, 33, 33, 34
Disponemos estos valores en una columna de una tabla y determinamos la
cantidad de veces que se repite cada uno de ellos:
HORAS
(Xi)
FRECUENCIA
(fi)
27
1
28
28
2
29
29
29
29
6
29
29
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 4 de 18
30
30
30
30
7
30
30
30
31
31
31
31
31
8
31
31
31
32
32
3
32
33
33
3
33
34
1
TOTALES
31
Determinadas las repeticiones de los valores, lo que sería la Frecuencia
absoluta (fi) de los mismos, se rescribe la tabla y se agregan columnas para
determinar: Frecuencia Absoluta Acumulada (Faci), Frecuencia Relativa (fri) y
Frecuencia Relativa Acumulada (Fri):
HORAS
(Xi)
fi
Faci
27
1
𝐹𝑎𝑐1 = 𝑓1 = 1,000
28
2
𝐹𝑎𝑐2 = 𝐹𝑎𝑐1 + 𝑓2
= 1,000 + 2,000
= 3,000
29
6
𝐹𝑎𝑐3 = 𝐹𝑎𝑐2 + 𝑓3
= 3,000 + 6,000
= 9,000
30
7
𝐹𝑎𝑐4 = 𝐹𝑎𝑐3 + 𝑓4
= 9,000 + 7,000
= 16,000
31
8
𝐹𝑎𝑐5 = 𝐹𝑎𝑐4 + 𝑓5
= 16,000 + 8,000
= 24,000
𝑓𝑟5 =
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
fri
Fri
𝑓1
1
=
𝑛 31
= 0,032
𝐹𝑟1 = 𝑓𝑟1
= 0,032
𝑓𝑟2 =
𝑓2
2
=
𝑛 31
= 0,065
𝐹𝑟2 = 𝐹𝑟1 + 𝑓𝑟2
= 0.097
𝑓𝑟3 =
𝑓3
6
=
𝑛 31
= 0,194
𝐹𝑟3 = 𝐹𝑟2 + 𝑓𝑟3
= 0.290
𝑓𝑟4 =
𝑓4
7
=
𝑛 31
= 0,226
𝐹𝑟4 = 𝐹𝑟3 + 𝑓𝑟4
= 0.516
𝑓5
8
=
𝑛 31
= 0,258
𝐹𝑟5 = 𝐹𝑟4 + 𝑓𝑟5
= 0.774
𝑓𝑟1 =
Página 5 de 18
32
3
𝐹𝑎𝑐6 = 𝐹𝑎𝑐5 + 𝑓6
= 24,000 + 3,000
= 27,000
𝑓𝑟6 =
𝑓6
3
=
𝑛 31
= 0,097
𝐹𝑟6 = 𝐹𝑟5 + 𝑓𝑟6
= 0.871
33
3
𝐹𝑎𝑐7 = 𝐹𝑎𝑐6 + 𝑓7
= 27,000 + 3,000
= 30,000
𝑓𝑟7 =
𝑓7
3
=
𝑛 31
= 0,097
𝐹𝑟7 = 𝐹𝑟6 + 𝑓𝑟7
= 0.968
34
1
𝐹𝑎𝑐8 = 𝐹𝑎𝑐7 + 𝑓8
= 30,000 + 1,000
= 31,000
𝑓𝑟8 =
𝑓8
1
=
𝑛 31
= 0,032
𝐹𝑟8 = 𝐹𝑟7 + 𝑓𝑟8
= 1.000
TOTALES
31
1,000
En esta tabla se incluye, en cada celda y donde aplique, las fórmulas para el
cálculo de su respectivo valor.
La Tabla de Distribución de Frecuencias para el conjunto de datos de la
muestra aleatoria de 31 transformadores, indicando la cantidad de horas
necesarias para lograr un plan de trabajo integral sería:
HORAS
(Xi)
fi
Faci
fri
Fri
27
1
1,000
0,032
0,032
28
2
3,000
0,065
0,097
29
6
9,000
0,194
0,290
30
7
16,000
0,226
0,516
31
8
24,000
0,258
0,774
32
3
27,000
0,097
0,871
33
3
30,000
0,097
0,968
34
1
31,000
0,032
1,000
TOTALES
31
1,000
Las medidas de tendencia central para datos no agrupados son un conjunto
de indicadores estadísticos que van a mostrar hacia qué valores se agrupan
los datos numéricos, es decir, son medidas estadísticas que buscan resumir
en un solo valor un conjunto de valores.
Hay tres medidas que son comunes para poder identificar el centro de los
conjuntos de datos: la media, mediana y moda, cada una de ellas ubicadas
alrededor del punto donde se aglomeran los datos.
La Media, Promedio o Media Aritmética:
Está determinada por el valor en promedio de una serie de conjunto de datos
numéricos.
Para su cálculo se procede de la siguiente manera:

Sumamos todos los números del conjunto de datos.

Dividimos esa suma entre el número total de datos en el conjunto.
La fórmula para el cálculo sería:
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 6 de 18
𝑥̅ =
∑𝑛𝑖=1 𝑥𝑖
𝑛
Para nuestro ejercicio:
𝑥̅ =
27+28+28+29+29+29+29+29+29+30+30+30+30+30+30+30+31+31+31+31+31+31+31+31++32+32+32++33+33+33+34
31
=
944
31
= 30,452
̅ = 𝟑𝟎, 𝟒𝟓𝟐 𝒉𝒐𝒓𝒂𝒔
𝒙
Este valor se interpreta como el “punto de equilibrio” o “centro de masas” del
conjunto de datos.
La media del conjunto de datos es 30,75 horas, lo que indica el tiempo
promedio necesario para lograr un plan de trabajo integral para los
transformadores en estudio.
La Mediana o Mediana Aritmética:
Es el valor encontrado en el centro del conjunto de los datos luego de haber
sido ordenados. Las medianas son útiles siempre que estemos tratando de
averiguar cuál es el centro de un conjunto de datos.
Para determinarla se procede de la siguiente manera:

Ordenar los datos en orden ascendente (de menor a mayor),
asegurándose de incluir los números repetidos en caso de existir.
27
30
31

28
30
31
28
30
32
29
30
32
29
30
32
29
31
33
29
31
33
29
31
33
29
31
34
30
31
30
31
Encontrar el número medio del conjunto de datos:
i. Si el conjunto de datos tiene un número impar de valores, como es
nuestro caso (N = 31), la mediana será el valor que se encuentra en el
punto medio del conjunto.
Me = 30 horas
Siendo entonces el valor de la mediana 30 para nuestro conjunto de
datos, lo que se interpreta como que la mitad de los valores del
conjunto de datos es menor que o igual a 30 y la otra mitad de los
valores es mayor o igual que 30.
La moda:
La moda es el valor que aparece con mayor frecuencia en un conjunto de
datos.
Para determinarla se procede de la siguiente manera:

Ordenar los datos en orden ascendente (de menor a mayor),
asegurándose de incluir los números repetidos en caso de existir.
27
30
31

28
30
31
28
30
32
29
30
32
29
30
32
29
31
33
29
31
33
29
31
33
29
31
34
30
31
30
31
Encontrar los números que se repiten, determinando las veces que lo
hacen (frecuencia):
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 7 de 18
Valor
Frecuencia de
repetición
27
1
28
2
29
6
30
7
31
8
32
3
33
3
34
1
Mo = 31 horas
Observando la tabla anterior, vemos que el valor 31 se repite 8 veces en
el conjunto de datos, por lo que este será el valor de la moda del conjunto.
Dado que 31 es el valor que se repite el mayor número de veces, se
concluye que 31 horas es el tiempo con más frecuencia en lograr un plan
integral de trabajo para los transformadores en estudio.
Estas medidas de tendencia central para datos no agrupados nos permitirán
analizar los datos de un conjunto.
Calcular las medidas de variabilidad:

Rango:
El Rango es el intervalo entre el valor máximo y el valor mínimo del
conjunto de datos. Permite obtener una idea de la dispersión de los datos
entre los valores extremos de una variable; cuanto mayor es el rango,
aún más dispersos están los datos (sin considerar la afectación de los
valores extremos).
Para su cálculo, luego de ordenados los datos en forma creciente (de
menor a mayor), tomamos el valor máximo y los restamos del valor
mínimo:
27
30
31
28
30
31
28
30
32
29
30
32
29
30
32
29
31
33
29
31
33
29
31
33
29
31
34
30
31
30
31
Valor máximo (Xmáx) = 34 | Valor mínimo (Xmin) = 27
𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛 = 34 − 27 = 𝟕
R = 7 horas

Desviación Media
La desviación media de un conjunto de datos, es la media aritmética de
los valores absolutos de lo que se desvía cada valor respecto a la media
aritmética.
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 8 de 18
Para entender el concepto, definamos desviación respecto a la media, que
es la diferencia, en valor absoluta, entre cada valor de la variable y la
media aritmética. La desviación media sería entonces el promedio de las
desviaciones respecto a la media:
∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |
𝐷. 𝑀. =
𝑛
Para calcular la Desviación Media en nuestro ejercicio, nos apoyaremos en
la siguiente tabla auxiliar, para facilitar los cálculos. En la tabla
disponemos de tres columnas, la primera con el valor de los datos de la
muestra (horas), la segunda y tercera para calcular el numerador de la
fórmula, lo cual hacemos en dos pasos; en el primero (segunda columna)
calculamos la diferencia entre el valor bajo análisis y la Media Aritmética
y en el segundo tomamos el valor absoluto de la columna anterior (para
que siempre sea un valor positivo):
Xi
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
̅
𝒙𝒊 − 𝒙
|𝒙𝒊 − 𝒙
̅|
27
28
28
29
29
29
29
29
29
30
30
30
30
30
30
-3,452
-2,452
-2,452
-1,452
-1,452
-1,452
-1,452
-1,452
-1,452
-0,452
-0,452
-0,452
-0,452
-0,452
-0,452
3,452
2,452
2,452
1,452
1,452
1,452
1,452
1,452
1,452
0,452
0,452
0,452
0,452
0,452
0,452
30
-0,452
0,452
31
31
31
31
31
31
31
31
32
32
32
33
0,548
0,548
0,548
0,548
0,548
0,548
0,548
0,548
1,548
1,548
1,548
2,548
0,548
0,548
0,548
0,548
0,548
0,548
0,548
0,548
1,548
1,548
1,548
2,548
Página 9 de 18
33
33
34
2,548
2,548
3,548
2,548
2,548
3,548
40,452
Calculados los valores, procedemos a sumar los obtenidos en la última
columna, y así completar el numerador de la fórmula (∑31
𝑖=1|𝑥𝑖 − 𝑥̅ |).
Finalmente, procedemos a reemplazarlos para completar el cálculo:
𝐷. 𝑀. =
40,452
= 1,305 ℎ𝑜𝑟𝑎𝑠
31
D.M. = 1,305 horas

Varianza:
Es una medida de dispersión que representa la variabilidad de una serie
de datos respecto a su media.
Se distinguen dos medidas, dependiendo de si se analiza una población o
una muestra y las fórmulas de cálculo serían:
Para una población
𝜎2 =
Para una muestra
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑛
𝑠2 =
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑛−1
En nuestro ejercicio, tal como lo dice el enunciado (“Un operador local ha
considerado una muestra aleatoria de 31 transformadores…”), los datos son de una
muestra, por lo que utilizaremos para el cálculo de la varianza la fórmula
correspondiente a la muestra:
𝑠2 =
2
∑31
𝑖=1(𝑥𝑖 − 𝑥̅ )
𝑛−1
Para calcular la Varianza en nuestro ejercicio, nos apoyaremos en la
siguiente tabla auxiliar, para facilitar los cálculos. En la tabla disponemos
de tres columnas, la primera con el valor de los datos de la muestra
(horas), la segunda y tercera para calcular el numerador de la fórmula, lo
cual hacemos en dos pasos; en el primero (segunda columna) calculamos
la diferencia entre el valor bajo análisis y la Media Aritmética y en el
segundo elevamos el valor obtenido en la columna anterior a la potencia
2:
𝒙𝒊
27
28
28
29
29
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
̅)
(𝒙𝒊 − 𝒙
-3,452
-2,452
-2,452
-1,452
-1,452
̅)𝟐
(𝒙𝒊 − 𝒙
11,914
6,010
6,010
2,107
2,107
Página 10 de 18
29
29
29
29
30
30
30
30
30
-1,452
-1,452
-1,452
-1,452
-0,452
-0,452
-0,452
-0,452
-0,452
2,107
2,107
2,107
2,107
0,204
0,204
0,204
0,204
0,204
30
-0,452
0,204
30
-0,452
0,204
31
31
31
31
31
31
31
31
32
32
32
33
33
33
0,548
0,548
0,548
0,548
0,548
0,548
0,548
0,548
1,548
1,548
1,548
2,548
2,548
2,548
0,301
0,301
0,301
0,301
0,301
0,301
0,301
0,301
2,398
2,398
2,398
6,494
6,494
6,494
34
3,548
12,591
Totales
79,677
Calculados los valores, procedemos a sumar los obtenidos en la última
2
columna, y así completar el numerador de la fórmula (∑31
𝑖=1(𝑥𝑖 − 𝑥̅ ) )
Finalmente, procedemos a reemplazarlos para completar el cálculo:
𝑠2 =
79,677
= 𝟐, 𝟔𝟓𝟔
31 − 1
Varianza = s2 = 2,656 horas2

Desviación Estándar
Es una medida que se usa para cuantificar la variación o dispersión de un
conjunto de datos numéricos. Una desviación estándar baja, indica que la
mayor parte de los datos de una muestra tienden a estar agrupados cerca
de su media.
La desviación típica se obtiene extrayendo la raíz cuadrada a la varianza
y, al igual que la varianza, puede ser para una población o una muestra,
siendo sus fórmulas de cálculo las siguientes:
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 11 de 18
Para una población
Para una muestra
𝜎 = √𝜎 2
𝑠 = √𝑠 2
En nuestro ejercicio se dispone de una muestra y luego de haber calculado
la varianza en el apartado anterior, procedemos a extraer su raíz cuadrada
para obtener la Desviación Típica o Estándar:
𝑠 = √(2,656)2 = 1,630 ℎ𝑜𝑟𝑎𝑠
s = 1,630 horas

Coeficiente de Variación
El coeficiente de variación, también denominado como coeficiente de
variación de Pearson, es una medida estadística que nos informa acerca
de la dispersión relativa de un conjunto de datos. Es decir, nos informa,
al igual que otras medidas de dispersión, de si una variable se mueve
mucho, poco, más o menos que otra.
Se define como el cociente de la desviación estándar entre la media
aritmética:
Al igual que en la Varianza y la Desviación Estándar, el cálculo puede
hacerse para una población o una muestra, siendo sus fórmulas las
siguientes:
Para una población
Para una muestra
𝜎
𝑠
𝐶𝑉 =
𝐶𝑉 =
𝑥̅
𝑥̅
Algunos autores expresan el Coeficiente de Variación en forma porcentual,
en cuyo caso solo debemos multiplicar la fórmula por el 100%.
Para nuestro ejercicio, como ya calculamos tanto la Desviación Estándar
como la Media Aritmética para la muestra de datos proporcionada,
utilizaremos la fórmula para la muestra y reemplazamos los valores
conocidos:
S = 1,630 horas | 𝑥̅ = 30,452 horas
𝐶𝑉 =
𝑠
1,630
=
= 𝟎, 𝟎𝟓𝟒
𝑥̅ 30,452
Y. si lo queremos expresar en porcentaje, multiplicamos el resultado por
100%, obteniéndose el valor: 5,4%
CV = 0,054 = 5,40%
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 12 de 18
3. Calcule las medias de dispersión para Datos Agrupados (debe
elaborar el cuadro de Datos Agrupados):

Cuadro de datos agrupados:
Datos
fi
Fac
fri
Fri
155
3
3
0,09
0,09
156
3
6
0,09
0,17
157
2
8
0,06
0,23
158
2
10
0,06
0,29
159
2
12
0,06
0,34
160
8
20
0,23
0,57
161
3
23
0,09
0,66
162
6
29
0,17
0,83
163
6
35
0,17
1,00
Totales
35
1,00
fi (Frecuencia absoluta): Número de veces que aparece el dato.
Fac (Frecuencia acumulada): Frecuencia que se va acumulando y es igual
a la frecuencia acumulada del dato anterior más la frecuencia absoluta del
dato bajo análisis. La frecuencia acumulada del último dato debe ser igual
a la suma de las frecuencias absolutas.
fri
(Frecuencia relativa): Es el valor correspondiente a la frecuencia
absoluta entre el número de datos. La suma de las frecuencias relativas
debe ser igual a 1.
Fri
(Frecuencia relativa acumulada): Frecuencia relativa que se va
acumulando y es igual a la frecuencia relativa acumulada del dato anterior
más la frecuencia relativa del dato bajo análisis. La frecuencia relativa
acumulada del último dato debe ser igual a 1.

Rango
El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello,
comparte unidades con los datos. Permite obtener una idea de la
dispersión de los datos, cuanto mayor es el rango, aún más dispersos
están los datos (sin considerar la afectación de los valores extremos).
Valor máximo (Xmáx) = 163 | Valor mínimo (Xmin) = 155
𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛 = 163 − 155 = 𝟖
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 13 de 18
R=8
Interpretación:
Como mencionamos anteriormente, el rango es la diferencia entre los
valores más grande y más pequeño de los datos, por lo que representa el
intervalo que contiene todos los valores de los datos.

Desviación Media
La desviación media mide la dispersión de los datos de un conjunto con
respecto a su media aritmética. Para su cálculo se utiliza la fórmula:
∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |
𝑛
Y también necesitamos calcular la media aritmética que, para el caso de
datos agrupados es:
𝐷𝑀 =
𝑥̅ =
∑𝑛𝑖=1 𝑥𝑖 × 𝑓𝑖
𝑛
Vamos a calcular en primer lugar la Media Aritmética y, para facilitar los
cálculos, nos valemos de la siguiente tabla auxiliar, donde dispondremos
de tres columnas, la primera con los datos, La segunda con el valor de la
frecuencia absoluta y la tercera donde se multiplica el valor de la variable
por su frecuencia absoluta:
Xi
fi
xifi
155
3
465
156
3
468
157
2
314
158
2
316
159
2
318
160
8
1280
161
3
483
162
6
972
163
6
978
TOTALES
35
5594
En ella tenemos el total (suma) de las frecuencias absolutas, que
corresponde al número de datos (n = 35) y la columna xifi,
correspondiente al producto de cada dato por su frecuencia absoluta y
que al final, su suma (∑xifi = 5594), corresponde al numerador de la
fórmula.
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 14 de 18
Remplazamos valores y obtenemos:
𝑥̅ =
5594
= 𝟏𝟓𝟗, 𝟖𝟑
35
Calculamos ahora la Desviación Media, para lo cual añadimos unas
columnas adicionales a la tabla auxiliar que usamos anteriormente, para
facilitar los cálculos; una cuarta columna para calcular el valor absoluto
de la diferencia entre el valor de la variable y la Media Aritmética del
conjunto de datos, calculada en el paso anterior, y finalmente una quinta
columna para multiplicar el valor obtenido en la columna anterior por la
frecuencia absoluta correspondiente:
Datos
fi
xifi
|𝒙𝒊 − 𝒙
̅|
|𝒙𝒊 − 𝒙
̅ | ∙ 𝒇𝒊
155
3
465
4,83
14,49
156
3
468
3,83
11,49
157
2
314
2,83
5,66
158
2
316
1,83
3,66
159
2
318
0,83
1,66
160
8
1280
0,17
1,37
161
3
483
1,17
3,51
162
6
972
2,17
13,03
163
6
978
3,17
19,03
TOTALES
35
5594,00
73,89
Calculados los valores, procedemos a sumar los obtenidos en la última
2
columna, y así completar el numerador de la fórmula (∑31
𝑖=1(𝑥𝑖 − 𝑥̅ ) )
Finalmente, procedemos a reemplazarlos para completar el cálculo:
𝐷𝑀 =
∑9𝑖=1|𝑥𝑖 − 𝑥̅ | 73,89
=
= 𝟐, 𝟏𝟏
𝑛
35
DM = 2,11
Interpretación:
Esto indica que la desviación promedio de los datos es 2,11 unidades en
la que se estén expresando los datos.

Varianza
La varianza es la media aritmética del cuadrado de las desviaciones
respecto a la media de una distribución estadística.
Para calcular la varianza en datos agrupados aplicaremos la siguiente
fórmula:
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 15 de 18
𝜎2 =
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖
𝑛
Para facilitar los cálculos, nos valdremos de la siguiente tabla auxiliar y
utilizaremos el valor de la Media Aritmética previamente calculado; en la
primera columna colocamos los valores de la variable (datos), en la
segunda su frecuencia absoluta, en la tercera el cálculo del valor de la
variable menos la Media Aritmética previamente calculada y al resultado
lo elevamos a la potencia 2, finalizando con una columna donde
multiplicamos los valores obtenidos en la columna anterior por la
frecuencia absoluta correspondiente:
Datos
fi
̅)𝟐
(𝒙𝒊 − 𝒙
̅)𝟐
(𝒙𝒊 − 𝒙
∙ 𝑓𝑖
155
3
23,32
69,95
156
3
14,66
43,97
157
2
8,00
16,00
158
2
3,34
6,69
159
2
0,69
1,37
160
8
0,03
0,24
161
3
1,37
4,12
162
6
4,72
28,29
163
6
10,06
60,35
TOTALES
35
230,97
Calculados los valores, procedemos a sumar los obtenidos en la última
columna, y así completar el numerador de la fórmula (∑9𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖 )
Finalmente, procedemos a reemplazarlos para completar el cálculo:
∑9𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖 230,97
𝜎 =
=
= 𝟔, 𝟔𝟎
𝑛
35
2
Varianza = σ2 = 6,60
Interpretación:
Mientras mayor sea la varianza, mayor será la dispersión de los datos.
Puesto que la varianza (σ2) es una cantidad elevada al cuadrado, sus
unidades también están elevadas al cuadrado, lo que puede dificultar su
uso en la práctica. La desviación estándar generalmente es más fácil de
interpretar porque utiliza las mismas unidades que los datos.
Por ejemplo, una muestra del tiempo de espera en una caja de pago de
una tienda de venta de comestibles puede tener una media de 15 minutos
y una varianza de 9 minutos2. Debido a que la varianza no está en las
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 16 de 18
mismas unidades que los datos, ésta suele mostrarse con su raíz
cuadrada, que sería la desviación estándar. Una varianza de 9 minutos2
es equivalente a una desviación estándar de 3 minutos.

Desviación Estándar
La desviación típica, también conocida como desviación estándar, es una
medida de dispersión, que lo que hace es expresar que tanto varían en
promedio los elementos dentro de un conjunto de datos con respecto a
su media aritmética, la desviación media no hace diferencia entre
números que se desvían hacia arriba de la media o números que se
desvían hacia abajo de la media, lo único que importa es el valor promedio
que se desvían los datos, sin importar si son números mucho mayores o
mucho menores al promedio, por este motivo en la fórmula de la
desviación media se hace uso de valores absolutos.
La desviación estándar es la raíz cuadrada de la varianza y su fórmula de
cálculo es:
𝜎 = √𝜎 2 = √6,60 = 𝟐, 𝟔𝟎
Desviación estándar = σ = 2,60
Interpretación:
Se utiliza la desviación estándar para determinar qué tan dispersos están
los datos con respecto a la media. Un valor de desviación estándar más
alto indica una mayor dispersión de los datos. Una buena regla empírica
para una distribución normal es que aproximadamente 68% de los valores
se ubican a no más de una desviación estándar de la media, 95% de los
valores se ubican a no más de dos desviaciones estándar y 99.7% de los
valores se ubican a no más de tres desviaciones estándar.
La desviación estándar también se puede utilizar para establecer un valor
de referencia para estimar la variación general de un proceso.

Coeficiente de Variación
El coeficiente de variación, también denominado como coeficiente de
variación de Pearson, se define como el cociente de la desviación estándar
entre la media aritmética:
Para nuestro ejercicio, como ya calculamos tanto la Desviación Estándar
como la Media Aritmética, reemplazaremos los valores conocidos en la
fórmula correspondiente:
σ = 2,60 | 𝑥̅ = 159,83
𝐶𝑉 =
𝜎
2,60
=
= 𝟎, 𝟎𝟏𝟔
𝑥̅ 159,83
Y. si lo queremos expresar en porcentaje, multiplicamos el resultado por
100%, obteniéndose el valor: 1,60%
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 17 de 18
CV = 0,016 = 1,60%
Interpretación:
Mientras mayor sea el coeficiente de variación, mayor será la dispersión en los
datos.
Conclusiones
Estos datos resultan muy útiles y necesarios para analizar y describir
información, dado que nos ofrecen distintos puntos de vista, así como diferentes
tendencias de los mismos, que caracterizan el objeto en cuestión y permiten
establecer parámetros de comparación más complejos y dinámicos que los
meros valores aislados o simplemente sometidos a su promedio aritmético.
En los procesos de comprobación de una teoría, es importante anticiparse a los
posibles resultados, y la desviación sirve para analizar el comportamiento de los
valores alrededor de su promedio. Establece nuevos puntos que abren puertas
a diferentes clasificaciones y a datos que pueden no haber sido considerados en
un principio.
Valiéndose tan sólo de la media entre un conjunto de valores, no es posible saber
si alguno de ellos está excesivamente alejando de la normalidad existente en
dicho contexto. Por ejemplo, la desviación estándar permite establecer dos
nuevos límites alrededor de dicha línea central, para saber cuándo un elemento
es demasiado pequeño o grande.
Estadística | Sumativa III
AACM - Ejercicios - Respuestas
Página 18 de 18
Download