ESTADÍSTICA – SUMATIVA III – RESPUESTAS INSTRUCCIONES GENERALES Construye la tabla de distribución de frecuencia para datos no agrupados, mostrando el procedimiento de cada cálculo, utilizando tres decimales. Interpreta fr2 y Fac3, mostrando el procedimiento de cada cálculo, determinando el significado del estadístico obtenido. Ordenar los datos de menor a mayor. Construye la tabla de distribución de frecuencias para datos no agrupados, mostrando el procedimiento de cada cálculo. Determina los cálculos de la MTC, Media, Mediana, Moda, para datos agrupados, mostrando la fórmula y el procedimiento de cada cálculo, determinando el significado del estadístico obtenido. Determina los cálculos de las Medidas de Dispersión o Variabilidad: Rango, Desviación Media, Desviación Estándar, Varianza, Coeficiente de Variación para datos agrupados, mostrando la fórmula y el procedimiento de cada cálculo, determinando el significado del estadístico obtenido. Interpreta las Medidas de Dispersión o Variabilidad: Rango, Desviación Media, Desviación Estándar, Varianza, Coeficiente de Variación para datos agrupados. Muestra procedimiento y uso de fórmulas. Expresa los resultados con dos decimales. Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 1 de 18 ACTIVIDADES A REALIZAR 1. Completar el cuadro en la siguiente distribución Tabla de distribución de frecuencias para datos no agrupados, mostrando el procedimiento de cada cálculo y utilizando tres decimales: Xi fi Fac fri Fri 3 3 𝐹𝑎𝑐1 = 𝑓1 = 𝟑 0,075 𝐹𝑟1 = 𝑓𝑟1 = 𝟎, 𝟎𝟕𝟓 4 5 5 𝐹𝑎𝑐2 = 𝐹𝑎𝑐1 + 𝑓2 = 3+5 = 𝟖 0,125 𝐹𝑟2 = 𝐹𝑟1 + 𝑓𝑟2 = 0,075 + 0,125 = 𝟎, 𝟐𝟎𝟎 12 20 0,300 0,500 0,750 (*) VER NOTA 1 6 10 30 𝑓5 𝑓𝑟5 = 𝑁 10 = 40 = 𝟎, 𝟐𝟓𝟎 7 6 36 0,150 0,900 40 𝑓6 𝑓𝑟6 = 𝑁 4 = 40 = 𝟎, 𝟏𝟎𝟎 𝐹𝑟6 = 𝐹𝑟5 + 𝑓𝑟6 = 0,900 + 0,100 = 𝟏, 𝟎𝟎𝟎 8 4 Total 40 1,00 (*) NOTA 1: Dado que la sumatoria de las frecuencias (fi) es igual al número de datos (n): 𝑛 𝑛 = ∑ 𝑓𝑖 𝑖=1 Para nuestro ejercicio, su valor se calcula de la siguiente manera: 6 ∑ 𝑓𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5 + 𝑓6 = 3 + 5 + 𝑓3 + 10 + 6 + 4 = 40 𝑖=1 Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 2 de 18 Al efectuar las operaciones indicadas en la fórmula obtenemos: 28 + 𝑓3 = 40 Despejamos f3 de la fórmula, obteniendo así el valor faltante en la tabla: 𝑓3 = 40 − 28 = 𝟏𝟐 RESUMEN Xi fi Fac fri Fri 3 3 3 0,075 0,075 4 5 8 0,125 0,200 5 12 20 0,300 0,500 6 10 30 0,250 0,750 7 6 36 0,150 0,900 8 4 40 0,100 1,000 Total 40 1,00 Interpretación de fr2 y Fac3 mostrando el procedimiento de cada cálculo, determinando el significado del estadístico obtenido: fr2: Es la frecuencia relativa correspondiente al valor número 2 (X2 = 4) en la tabla de distribución de frecuencias. Es una medida estadística que se calcula como el cociente de la frecuencia absoluta (f2 = 5) de dicho valor (X2 = 4) entre el total de valores (n = 40) que componen la población o muestra y que se corresponde con la suma de todas las frecuencias absolutas, como se detalló anteriormente (ver Nota 1): 𝑓2 = 𝑓2 5 = = 𝟎, 𝟏𝟐𝟓 𝑛 40 INTERPRETACIÓN: fr2 = 0,125 = 12,5% Número de veces que un evento se reitera en una muestra o experimento. Ejemplo: “El 12,5% (o el 0,125) de los estudiantes de la Universidad han solicitado 4 veces el libro de Estadística Comparada en la biblioteca” Fac3: Es la frecuencia absoluta acumulada del valor (X3 = 5), resultado de ir sumando las frecuencias absolutas de las observaciones o valores de una población o muestra. Para calcularla se suma, a la frecuencia absoluta acumulada del valor anterior (Fac2 = 8), la frecuencia absoluta del valor bajo análisis (f3 = 12): Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 3 de 18 𝐹𝑎𝑐3 = 𝐹𝑎𝑐2 + 𝑓3 = 8 + 12 = 𝟐𝟎 INTERPRETACIÓN: Fac3 = 20 Señala la cantidad de frecuencias absolutas para la totalidad de los eventos que, en un listado ordenado, son menores o idénticos que un determinado valor. Ejemplo: “20 estudiantes de la Universidad han solicitado el libro de Estadística Comparada un máximo de 5 veces” 2. Un operador local ha considerado una muestra aleatoria de 31 transformadores, anotando el tiempo necesario que requiere en cada uno para lograr un plan integral de trabajo, obteniéndose lo siguiente (en horas): 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29, 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32 Para datos no agrupados: Calcule las medidas de tendencia central de estos datos, indicando a qué tipo de medida pertenece. RESPUESTAS Para construir la Tabla de Distribución de Frecuencias para datos no agrupados, en primer lugar se ordenan los datos de menor a mayor: 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29, 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32 Datos ordenados: 27, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 33, 33, 33, 34 Disponemos estos valores en una columna de una tabla y determinamos la cantidad de veces que se repite cada uno de ellos: HORAS (Xi) FRECUENCIA (fi) 27 1 28 28 2 29 29 29 29 6 29 29 Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 4 de 18 30 30 30 30 7 30 30 30 31 31 31 31 31 8 31 31 31 32 32 3 32 33 33 3 33 34 1 TOTALES 31 Determinadas las repeticiones de los valores, lo que sería la Frecuencia absoluta (fi) de los mismos, se rescribe la tabla y se agregan columnas para determinar: Frecuencia Absoluta Acumulada (Faci), Frecuencia Relativa (fri) y Frecuencia Relativa Acumulada (Fri): HORAS (Xi) fi Faci 27 1 𝐹𝑎𝑐1 = 𝑓1 = 1,000 28 2 𝐹𝑎𝑐2 = 𝐹𝑎𝑐1 + 𝑓2 = 1,000 + 2,000 = 3,000 29 6 𝐹𝑎𝑐3 = 𝐹𝑎𝑐2 + 𝑓3 = 3,000 + 6,000 = 9,000 30 7 𝐹𝑎𝑐4 = 𝐹𝑎𝑐3 + 𝑓4 = 9,000 + 7,000 = 16,000 31 8 𝐹𝑎𝑐5 = 𝐹𝑎𝑐4 + 𝑓5 = 16,000 + 8,000 = 24,000 𝑓𝑟5 = Estadística | Sumativa III AACM - Ejercicios - Respuestas fri Fri 𝑓1 1 = 𝑛 31 = 0,032 𝐹𝑟1 = 𝑓𝑟1 = 0,032 𝑓𝑟2 = 𝑓2 2 = 𝑛 31 = 0,065 𝐹𝑟2 = 𝐹𝑟1 + 𝑓𝑟2 = 0.097 𝑓𝑟3 = 𝑓3 6 = 𝑛 31 = 0,194 𝐹𝑟3 = 𝐹𝑟2 + 𝑓𝑟3 = 0.290 𝑓𝑟4 = 𝑓4 7 = 𝑛 31 = 0,226 𝐹𝑟4 = 𝐹𝑟3 + 𝑓𝑟4 = 0.516 𝑓5 8 = 𝑛 31 = 0,258 𝐹𝑟5 = 𝐹𝑟4 + 𝑓𝑟5 = 0.774 𝑓𝑟1 = Página 5 de 18 32 3 𝐹𝑎𝑐6 = 𝐹𝑎𝑐5 + 𝑓6 = 24,000 + 3,000 = 27,000 𝑓𝑟6 = 𝑓6 3 = 𝑛 31 = 0,097 𝐹𝑟6 = 𝐹𝑟5 + 𝑓𝑟6 = 0.871 33 3 𝐹𝑎𝑐7 = 𝐹𝑎𝑐6 + 𝑓7 = 27,000 + 3,000 = 30,000 𝑓𝑟7 = 𝑓7 3 = 𝑛 31 = 0,097 𝐹𝑟7 = 𝐹𝑟6 + 𝑓𝑟7 = 0.968 34 1 𝐹𝑎𝑐8 = 𝐹𝑎𝑐7 + 𝑓8 = 30,000 + 1,000 = 31,000 𝑓𝑟8 = 𝑓8 1 = 𝑛 31 = 0,032 𝐹𝑟8 = 𝐹𝑟7 + 𝑓𝑟8 = 1.000 TOTALES 31 1,000 En esta tabla se incluye, en cada celda y donde aplique, las fórmulas para el cálculo de su respectivo valor. La Tabla de Distribución de Frecuencias para el conjunto de datos de la muestra aleatoria de 31 transformadores, indicando la cantidad de horas necesarias para lograr un plan de trabajo integral sería: HORAS (Xi) fi Faci fri Fri 27 1 1,000 0,032 0,032 28 2 3,000 0,065 0,097 29 6 9,000 0,194 0,290 30 7 16,000 0,226 0,516 31 8 24,000 0,258 0,774 32 3 27,000 0,097 0,871 33 3 30,000 0,097 0,968 34 1 31,000 0,032 1,000 TOTALES 31 1,000 Las medidas de tendencia central para datos no agrupados son un conjunto de indicadores estadísticos que van a mostrar hacia qué valores se agrupan los datos numéricos, es decir, son medidas estadísticas que buscan resumir en un solo valor un conjunto de valores. Hay tres medidas que son comunes para poder identificar el centro de los conjuntos de datos: la media, mediana y moda, cada una de ellas ubicadas alrededor del punto donde se aglomeran los datos. La Media, Promedio o Media Aritmética: Está determinada por el valor en promedio de una serie de conjunto de datos numéricos. Para su cálculo se procede de la siguiente manera: Sumamos todos los números del conjunto de datos. Dividimos esa suma entre el número total de datos en el conjunto. La fórmula para el cálculo sería: Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 6 de 18 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 𝑛 Para nuestro ejercicio: 𝑥̅ = 27+28+28+29+29+29+29+29+29+30+30+30+30+30+30+30+31+31+31+31+31+31+31+31++32+32+32++33+33+33+34 31 = 944 31 = 30,452 ̅ = 𝟑𝟎, 𝟒𝟓𝟐 𝒉𝒐𝒓𝒂𝒔 𝒙 Este valor se interpreta como el “punto de equilibrio” o “centro de masas” del conjunto de datos. La media del conjunto de datos es 30,75 horas, lo que indica el tiempo promedio necesario para lograr un plan de trabajo integral para los transformadores en estudio. La Mediana o Mediana Aritmética: Es el valor encontrado en el centro del conjunto de los datos luego de haber sido ordenados. Las medianas son útiles siempre que estemos tratando de averiguar cuál es el centro de un conjunto de datos. Para determinarla se procede de la siguiente manera: Ordenar los datos en orden ascendente (de menor a mayor), asegurándose de incluir los números repetidos en caso de existir. 27 30 31 28 30 31 28 30 32 29 30 32 29 30 32 29 31 33 29 31 33 29 31 33 29 31 34 30 31 30 31 Encontrar el número medio del conjunto de datos: i. Si el conjunto de datos tiene un número impar de valores, como es nuestro caso (N = 31), la mediana será el valor que se encuentra en el punto medio del conjunto. Me = 30 horas Siendo entonces el valor de la mediana 30 para nuestro conjunto de datos, lo que se interpreta como que la mitad de los valores del conjunto de datos es menor que o igual a 30 y la otra mitad de los valores es mayor o igual que 30. La moda: La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Para determinarla se procede de la siguiente manera: Ordenar los datos en orden ascendente (de menor a mayor), asegurándose de incluir los números repetidos en caso de existir. 27 30 31 28 30 31 28 30 32 29 30 32 29 30 32 29 31 33 29 31 33 29 31 33 29 31 34 30 31 30 31 Encontrar los números que se repiten, determinando las veces que lo hacen (frecuencia): Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 7 de 18 Valor Frecuencia de repetición 27 1 28 2 29 6 30 7 31 8 32 3 33 3 34 1 Mo = 31 horas Observando la tabla anterior, vemos que el valor 31 se repite 8 veces en el conjunto de datos, por lo que este será el valor de la moda del conjunto. Dado que 31 es el valor que se repite el mayor número de veces, se concluye que 31 horas es el tiempo con más frecuencia en lograr un plan integral de trabajo para los transformadores en estudio. Estas medidas de tendencia central para datos no agrupados nos permitirán analizar los datos de un conjunto. Calcular las medidas de variabilidad: Rango: El Rango es el intervalo entre el valor máximo y el valor mínimo del conjunto de datos. Permite obtener una idea de la dispersión de los datos entre los valores extremos de una variable; cuanto mayor es el rango, aún más dispersos están los datos (sin considerar la afectación de los valores extremos). Para su cálculo, luego de ordenados los datos en forma creciente (de menor a mayor), tomamos el valor máximo y los restamos del valor mínimo: 27 30 31 28 30 31 28 30 32 29 30 32 29 30 32 29 31 33 29 31 33 29 31 33 29 31 34 30 31 30 31 Valor máximo (Xmáx) = 34 | Valor mínimo (Xmin) = 27 𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛 = 34 − 27 = 𝟕 R = 7 horas Desviación Media La desviación media de un conjunto de datos, es la media aritmética de los valores absolutos de lo que se desvía cada valor respecto a la media aritmética. Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 8 de 18 Para entender el concepto, definamos desviación respecto a la media, que es la diferencia, en valor absoluta, entre cada valor de la variable y la media aritmética. La desviación media sería entonces el promedio de las desviaciones respecto a la media: ∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ | 𝐷. 𝑀. = 𝑛 Para calcular la Desviación Media en nuestro ejercicio, nos apoyaremos en la siguiente tabla auxiliar, para facilitar los cálculos. En la tabla disponemos de tres columnas, la primera con el valor de los datos de la muestra (horas), la segunda y tercera para calcular el numerador de la fórmula, lo cual hacemos en dos pasos; en el primero (segunda columna) calculamos la diferencia entre el valor bajo análisis y la Media Aritmética y en el segundo tomamos el valor absoluto de la columna anterior (para que siempre sea un valor positivo): Xi Estadística | Sumativa III AACM - Ejercicios - Respuestas ̅ 𝒙𝒊 − 𝒙 |𝒙𝒊 − 𝒙 ̅| 27 28 28 29 29 29 29 29 29 30 30 30 30 30 30 -3,452 -2,452 -2,452 -1,452 -1,452 -1,452 -1,452 -1,452 -1,452 -0,452 -0,452 -0,452 -0,452 -0,452 -0,452 3,452 2,452 2,452 1,452 1,452 1,452 1,452 1,452 1,452 0,452 0,452 0,452 0,452 0,452 0,452 30 -0,452 0,452 31 31 31 31 31 31 31 31 32 32 32 33 0,548 0,548 0,548 0,548 0,548 0,548 0,548 0,548 1,548 1,548 1,548 2,548 0,548 0,548 0,548 0,548 0,548 0,548 0,548 0,548 1,548 1,548 1,548 2,548 Página 9 de 18 33 33 34 2,548 2,548 3,548 2,548 2,548 3,548 40,452 Calculados los valores, procedemos a sumar los obtenidos en la última columna, y así completar el numerador de la fórmula (∑31 𝑖=1|𝑥𝑖 − 𝑥̅ |). Finalmente, procedemos a reemplazarlos para completar el cálculo: 𝐷. 𝑀. = 40,452 = 1,305 ℎ𝑜𝑟𝑎𝑠 31 D.M. = 1,305 horas Varianza: Es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Se distinguen dos medidas, dependiendo de si se analiza una población o una muestra y las fórmulas de cálculo serían: Para una población 𝜎2 = Para una muestra ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑛 𝑠2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑛−1 En nuestro ejercicio, tal como lo dice el enunciado (“Un operador local ha considerado una muestra aleatoria de 31 transformadores…”), los datos son de una muestra, por lo que utilizaremos para el cálculo de la varianza la fórmula correspondiente a la muestra: 𝑠2 = 2 ∑31 𝑖=1(𝑥𝑖 − 𝑥̅ ) 𝑛−1 Para calcular la Varianza en nuestro ejercicio, nos apoyaremos en la siguiente tabla auxiliar, para facilitar los cálculos. En la tabla disponemos de tres columnas, la primera con el valor de los datos de la muestra (horas), la segunda y tercera para calcular el numerador de la fórmula, lo cual hacemos en dos pasos; en el primero (segunda columna) calculamos la diferencia entre el valor bajo análisis y la Media Aritmética y en el segundo elevamos el valor obtenido en la columna anterior a la potencia 2: 𝒙𝒊 27 28 28 29 29 Estadística | Sumativa III AACM - Ejercicios - Respuestas ̅) (𝒙𝒊 − 𝒙 -3,452 -2,452 -2,452 -1,452 -1,452 ̅)𝟐 (𝒙𝒊 − 𝒙 11,914 6,010 6,010 2,107 2,107 Página 10 de 18 29 29 29 29 30 30 30 30 30 -1,452 -1,452 -1,452 -1,452 -0,452 -0,452 -0,452 -0,452 -0,452 2,107 2,107 2,107 2,107 0,204 0,204 0,204 0,204 0,204 30 -0,452 0,204 30 -0,452 0,204 31 31 31 31 31 31 31 31 32 32 32 33 33 33 0,548 0,548 0,548 0,548 0,548 0,548 0,548 0,548 1,548 1,548 1,548 2,548 2,548 2,548 0,301 0,301 0,301 0,301 0,301 0,301 0,301 0,301 2,398 2,398 2,398 6,494 6,494 6,494 34 3,548 12,591 Totales 79,677 Calculados los valores, procedemos a sumar los obtenidos en la última 2 columna, y así completar el numerador de la fórmula (∑31 𝑖=1(𝑥𝑖 − 𝑥̅ ) ) Finalmente, procedemos a reemplazarlos para completar el cálculo: 𝑠2 = 79,677 = 𝟐, 𝟔𝟓𝟔 31 − 1 Varianza = s2 = 2,656 horas2 Desviación Estándar Es una medida que se usa para cuantificar la variación o dispersión de un conjunto de datos numéricos. Una desviación estándar baja, indica que la mayor parte de los datos de una muestra tienden a estar agrupados cerca de su media. La desviación típica se obtiene extrayendo la raíz cuadrada a la varianza y, al igual que la varianza, puede ser para una población o una muestra, siendo sus fórmulas de cálculo las siguientes: Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 11 de 18 Para una población Para una muestra 𝜎 = √𝜎 2 𝑠 = √𝑠 2 En nuestro ejercicio se dispone de una muestra y luego de haber calculado la varianza en el apartado anterior, procedemos a extraer su raíz cuadrada para obtener la Desviación Típica o Estándar: 𝑠 = √(2,656)2 = 1,630 ℎ𝑜𝑟𝑎𝑠 s = 1,630 horas Coeficiente de Variación El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. Es decir, nos informa, al igual que otras medidas de dispersión, de si una variable se mueve mucho, poco, más o menos que otra. Se define como el cociente de la desviación estándar entre la media aritmética: Al igual que en la Varianza y la Desviación Estándar, el cálculo puede hacerse para una población o una muestra, siendo sus fórmulas las siguientes: Para una población Para una muestra 𝜎 𝑠 𝐶𝑉 = 𝐶𝑉 = 𝑥̅ 𝑥̅ Algunos autores expresan el Coeficiente de Variación en forma porcentual, en cuyo caso solo debemos multiplicar la fórmula por el 100%. Para nuestro ejercicio, como ya calculamos tanto la Desviación Estándar como la Media Aritmética para la muestra de datos proporcionada, utilizaremos la fórmula para la muestra y reemplazamos los valores conocidos: S = 1,630 horas | 𝑥̅ = 30,452 horas 𝐶𝑉 = 𝑠 1,630 = = 𝟎, 𝟎𝟓𝟒 𝑥̅ 30,452 Y. si lo queremos expresar en porcentaje, multiplicamos el resultado por 100%, obteniéndose el valor: 5,4% CV = 0,054 = 5,40% Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 12 de 18 3. Calcule las medias de dispersión para Datos Agrupados (debe elaborar el cuadro de Datos Agrupados): Cuadro de datos agrupados: Datos fi Fac fri Fri 155 3 3 0,09 0,09 156 3 6 0,09 0,17 157 2 8 0,06 0,23 158 2 10 0,06 0,29 159 2 12 0,06 0,34 160 8 20 0,23 0,57 161 3 23 0,09 0,66 162 6 29 0,17 0,83 163 6 35 0,17 1,00 Totales 35 1,00 fi (Frecuencia absoluta): Número de veces que aparece el dato. Fac (Frecuencia acumulada): Frecuencia que se va acumulando y es igual a la frecuencia acumulada del dato anterior más la frecuencia absoluta del dato bajo análisis. La frecuencia acumulada del último dato debe ser igual a la suma de las frecuencias absolutas. fri (Frecuencia relativa): Es el valor correspondiente a la frecuencia absoluta entre el número de datos. La suma de las frecuencias relativas debe ser igual a 1. Fri (Frecuencia relativa acumulada): Frecuencia relativa que se va acumulando y es igual a la frecuencia relativa acumulada del dato anterior más la frecuencia relativa del dato bajo análisis. La frecuencia relativa acumulada del último dato debe ser igual a 1. Rango El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, aún más dispersos están los datos (sin considerar la afectación de los valores extremos). Valor máximo (Xmáx) = 163 | Valor mínimo (Xmin) = 155 𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛 = 163 − 155 = 𝟖 Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 13 de 18 R=8 Interpretación: Como mencionamos anteriormente, el rango es la diferencia entre los valores más grande y más pequeño de los datos, por lo que representa el intervalo que contiene todos los valores de los datos. Desviación Media La desviación media mide la dispersión de los datos de un conjunto con respecto a su media aritmética. Para su cálculo se utiliza la fórmula: ∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ | 𝑛 Y también necesitamos calcular la media aritmética que, para el caso de datos agrupados es: 𝐷𝑀 = 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 × 𝑓𝑖 𝑛 Vamos a calcular en primer lugar la Media Aritmética y, para facilitar los cálculos, nos valemos de la siguiente tabla auxiliar, donde dispondremos de tres columnas, la primera con los datos, La segunda con el valor de la frecuencia absoluta y la tercera donde se multiplica el valor de la variable por su frecuencia absoluta: Xi fi xifi 155 3 465 156 3 468 157 2 314 158 2 316 159 2 318 160 8 1280 161 3 483 162 6 972 163 6 978 TOTALES 35 5594 En ella tenemos el total (suma) de las frecuencias absolutas, que corresponde al número de datos (n = 35) y la columna xifi, correspondiente al producto de cada dato por su frecuencia absoluta y que al final, su suma (∑xifi = 5594), corresponde al numerador de la fórmula. Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 14 de 18 Remplazamos valores y obtenemos: 𝑥̅ = 5594 = 𝟏𝟓𝟗, 𝟖𝟑 35 Calculamos ahora la Desviación Media, para lo cual añadimos unas columnas adicionales a la tabla auxiliar que usamos anteriormente, para facilitar los cálculos; una cuarta columna para calcular el valor absoluto de la diferencia entre el valor de la variable y la Media Aritmética del conjunto de datos, calculada en el paso anterior, y finalmente una quinta columna para multiplicar el valor obtenido en la columna anterior por la frecuencia absoluta correspondiente: Datos fi xifi |𝒙𝒊 − 𝒙 ̅| |𝒙𝒊 − 𝒙 ̅ | ∙ 𝒇𝒊 155 3 465 4,83 14,49 156 3 468 3,83 11,49 157 2 314 2,83 5,66 158 2 316 1,83 3,66 159 2 318 0,83 1,66 160 8 1280 0,17 1,37 161 3 483 1,17 3,51 162 6 972 2,17 13,03 163 6 978 3,17 19,03 TOTALES 35 5594,00 73,89 Calculados los valores, procedemos a sumar los obtenidos en la última 2 columna, y así completar el numerador de la fórmula (∑31 𝑖=1(𝑥𝑖 − 𝑥̅ ) ) Finalmente, procedemos a reemplazarlos para completar el cálculo: 𝐷𝑀 = ∑9𝑖=1|𝑥𝑖 − 𝑥̅ | 73,89 = = 𝟐, 𝟏𝟏 𝑛 35 DM = 2,11 Interpretación: Esto indica que la desviación promedio de los datos es 2,11 unidades en la que se estén expresando los datos. Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Para calcular la varianza en datos agrupados aplicaremos la siguiente fórmula: Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 15 de 18 𝜎2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖 𝑛 Para facilitar los cálculos, nos valdremos de la siguiente tabla auxiliar y utilizaremos el valor de la Media Aritmética previamente calculado; en la primera columna colocamos los valores de la variable (datos), en la segunda su frecuencia absoluta, en la tercera el cálculo del valor de la variable menos la Media Aritmética previamente calculada y al resultado lo elevamos a la potencia 2, finalizando con una columna donde multiplicamos los valores obtenidos en la columna anterior por la frecuencia absoluta correspondiente: Datos fi ̅)𝟐 (𝒙𝒊 − 𝒙 ̅)𝟐 (𝒙𝒊 − 𝒙 ∙ 𝑓𝑖 155 3 23,32 69,95 156 3 14,66 43,97 157 2 8,00 16,00 158 2 3,34 6,69 159 2 0,69 1,37 160 8 0,03 0,24 161 3 1,37 4,12 162 6 4,72 28,29 163 6 10,06 60,35 TOTALES 35 230,97 Calculados los valores, procedemos a sumar los obtenidos en la última columna, y así completar el numerador de la fórmula (∑9𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖 ) Finalmente, procedemos a reemplazarlos para completar el cálculo: ∑9𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖 230,97 𝜎 = = = 𝟔, 𝟔𝟎 𝑛 35 2 Varianza = σ2 = 6,60 Interpretación: Mientras mayor sea la varianza, mayor será la dispersión de los datos. Puesto que la varianza (σ2) es una cantidad elevada al cuadrado, sus unidades también están elevadas al cuadrado, lo que puede dificultar su uso en la práctica. La desviación estándar generalmente es más fácil de interpretar porque utiliza las mismas unidades que los datos. Por ejemplo, una muestra del tiempo de espera en una caja de pago de una tienda de venta de comestibles puede tener una media de 15 minutos y una varianza de 9 minutos2. Debido a que la varianza no está en las Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 16 de 18 mismas unidades que los datos, ésta suele mostrarse con su raíz cuadrada, que sería la desviación estándar. Una varianza de 9 minutos2 es equivalente a una desviación estándar de 3 minutos. Desviación Estándar La desviación típica, también conocida como desviación estándar, es una medida de dispersión, que lo que hace es expresar que tanto varían en promedio los elementos dentro de un conjunto de datos con respecto a su media aritmética, la desviación media no hace diferencia entre números que se desvían hacia arriba de la media o números que se desvían hacia abajo de la media, lo único que importa es el valor promedio que se desvían los datos, sin importar si son números mucho mayores o mucho menores al promedio, por este motivo en la fórmula de la desviación media se hace uso de valores absolutos. La desviación estándar es la raíz cuadrada de la varianza y su fórmula de cálculo es: 𝜎 = √𝜎 2 = √6,60 = 𝟐, 𝟔𝟎 Desviación estándar = σ = 2,60 Interpretación: Se utiliza la desviación estándar para determinar qué tan dispersos están los datos con respecto a la media. Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican a no más de una desviación estándar de la media, 95% de los valores se ubican a no más de dos desviaciones estándar y 99.7% de los valores se ubican a no más de tres desviaciones estándar. La desviación estándar también se puede utilizar para establecer un valor de referencia para estimar la variación general de un proceso. Coeficiente de Variación El coeficiente de variación, también denominado como coeficiente de variación de Pearson, se define como el cociente de la desviación estándar entre la media aritmética: Para nuestro ejercicio, como ya calculamos tanto la Desviación Estándar como la Media Aritmética, reemplazaremos los valores conocidos en la fórmula correspondiente: σ = 2,60 | 𝑥̅ = 159,83 𝐶𝑉 = 𝜎 2,60 = = 𝟎, 𝟎𝟏𝟔 𝑥̅ 159,83 Y. si lo queremos expresar en porcentaje, multiplicamos el resultado por 100%, obteniéndose el valor: 1,60% Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 17 de 18 CV = 0,016 = 1,60% Interpretación: Mientras mayor sea el coeficiente de variación, mayor será la dispersión en los datos. Conclusiones Estos datos resultan muy útiles y necesarios para analizar y describir información, dado que nos ofrecen distintos puntos de vista, así como diferentes tendencias de los mismos, que caracterizan el objeto en cuestión y permiten establecer parámetros de comparación más complejos y dinámicos que los meros valores aislados o simplemente sometidos a su promedio aritmético. En los procesos de comprobación de una teoría, es importante anticiparse a los posibles resultados, y la desviación sirve para analizar el comportamiento de los valores alrededor de su promedio. Establece nuevos puntos que abren puertas a diferentes clasificaciones y a datos que pueden no haber sido considerados en un principio. Valiéndose tan sólo de la media entre un conjunto de valores, no es posible saber si alguno de ellos está excesivamente alejando de la normalidad existente en dicho contexto. Por ejemplo, la desviación estándar permite establecer dos nuevos límites alrededor de dicha línea central, para saber cuándo un elemento es demasiado pequeño o grande. Estadística | Sumativa III AACM - Ejercicios - Respuestas Página 18 de 18