EVALUACIÓN II MEDIDAS DE TENDENCIA CENTRAL VARIABILIDAD – RESPUESTAS (MTC) Y Ejercicio No. 1: Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 5, 4, 6 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7 a. Realizar la distribución de frecuencia de las calificaciones obtenidas a por los 50 alumnos. Para el caso de “Datos no agrupados” la primera actividad a realizar sobre los datos presentados, es ordenarlos de menor a mayor (forma creciente), tomando TODOS los datos, incluyendo los que estén repetidos. Procedemos entonces a ordenarlos, quedando de la siguiente manera: Dato menor = 0 Dato mayor = 10 Número de datos (n) = 50 0, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10 Una vez ordenados los datos, se procede a construir la tabla de distribución de frecuencias, la cual es una tabla que muestra cómo se distribuyen los datos de acuerdo a su frecuencia. En el caso de datos no agrupados, se usa este tipo de tablas cuando se tienen variables cualitativas o cuantitativas (estas últimas el caso de nuestro ejercicio) con pocos valores (50 en nuestro caso). La tabla está compuesta de las siguientes columnas: Valores de la variable (Xi): los diferentes valores que toma la variable en el estudio. Las calificaciones de los 50 alumnos en la asignatura Matemáticas. Frecuencia absoluta (fi): es la cantidad de veces que aparece el valor en el estudio. Para nuestro caso es la cantidad de calificaciones iguales. La sumatoria de las frecuencias absolutas es igual al número de datos. Frecuencia a acumulada (Fac): es el acumulado de las frecuencias absolutas e indica cuántos datos se van contando hasta ese momento o cuántos datos se van reportando. MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 1 de 18 Frecuencia relativa (fri): es la fracción o proporción de elementos que pertenecen a una clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos del estudio. Frecuencia relativa acumulada (Fri): es la proporción de datos respecto al total que se han reportado hasta ese momento. Es la suma de las frecuencias relativas y se puede calcular también dividiendo la frecuencia acumulada entre el número de datos del estudio. A continuación se detalla cómo se completa la tabla sobre la base de los datos suministrados: (Xi): En la primera columna se tendrán los datos repetidos, una sola vez, ordenados de mayor a menor. (fi): Es el número de veces que se repite el dato colocado en la fila correspondiente de la primera columna. En la última fila se coloca el total de la columna y debe ser igual al número de datos. (Fac): En la primera fila se coloca el valor correspondiente a la frecuencia absoluta y, en las filas sucesivas, se calcula sumando su frecuencia absoluta más la frecuencia absoluta de la fila que le precede. (fri): Se calcula dividiendo la frecuencia absoluta (fi) entre el número total de datos. (Fri): En la primera fila se coloca el valor correspondiente a la frecuencia relativa y, en las filas sucesivas, se calcula sumando su frecuencia relativa más la frecuencia relativa de la fila que le precede. MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 2 de 18 La tabla de distribución de frecuencias para nuestro ejercicio sería: DATOS FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA FRECUENCIA RELATIVA FRECUENCIA RELATIVA ACUMULADA ( Xi ) ( fi ) ( Fac ) ( fri ) ( Fri ) Fac1 = f1 Fac1 = 1 Fac2 = Fac1 + f2 Fac2= 1+1 = 2 Fac3 = Fac2 + f3 Fac3= 2+2= 4 Fac4 = Fac3 + f4 Fac4= 4+3= 7 Fac5 = Fac4 + f5 Fac5= 7+6= 13 Fac6 = Fac5 + f6 Fac6= 13+11= 24 Fac7 = Fac6 + f7 Fac7=24+12= 36 Fac8 = Fac7 + f8 Fac8=36+7= 43 Fac9 = Fac8 + f9 Fac9=43+4= 47 Fac10 = Fac9 + f10 Fac10=47+2= 49 Fac11 = Fac10 + f11 Fac8=49+1= 50 fri1 = (f1/n)*100 fri1=(1/50)*100= 2 fri2 = (f2/n)*100 fri2=(1/50)*100= 2 fri3 = (f3/n)*100 fri3=(2/50)*100= 4 fri4 = (f4/n)*100 fri4=(3/50)*100= 6 fri5 = (f5/n)*100 fri5=(6/50)*100= 12 fri6 = (f6/n)*100 fri6=(11/50)*100= 22 fri7 = (f7/n)*100 fri7=(12/50)*100= 24 fri8 = (f8/n)*100 fri7=(7/50)*100= 14 fri9 = (f9/n)*100 fri7=(4/50)*100= 8 fri10 = (f10/n)*100 fri7=(2/50)*100= 4 fri11 = (f11/n)*100 fri8=(1/50)*100= 2 Fri1 = fri1 Fri1 = 2 Fri2=Fri1 + fri2 Fri2=2+2= 4 Fri3=Fri2+fri3 Fri2=4+4= 8 Fri4=Fri3+fri4 Fri4=8+6= 14 Fri5=Fri4+fri5 Fri5=14+12= 26 Fri6=Fri5+fri6 Fri6=26+22= 48 Fri7=Fri6+fri7 Fri7=48+24= 72 Fri8=Fri7+fri8 Fri7=72+14= 86 Fri9=Fri8+fri9 Fri7=86+8= 94 Fri10=Fri9+fri10 Fri7=94+4= 98 Fri11=Fri11+fri10 Fri8=98+2= 100 X1 = 0 f1 = 1 X2 = 1 f2 = 1 X3 = 2 f3 = 2 X4 = 3 f4 = 3 X5 = 4 f5 = 6 X6 = 5 f6 = 11 X7 = 6 f7 = 12 X8 = 7 F8 = 7 X9 = 8 F9 = 4 X10 = 9 F10 = 2 X11 = 10 F11 = 1 Total n = 50 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM 100 Página 3 de 18 En resumen: DATOS FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA FRECUENCIA RELATIVA FRECUENCIA RELATIVA ACUMULADA ( Xi ) ( fi ) ( Fac ) ( fri ) ( Fri ) 0 1 1 2 2 1 1 2 2 4 2 2 4 4 8 3 3 7 6 14 4 6 13 12 26 5 11 24 22 48 6 12 36 24 72 7 7 43 14 86 8 4 47 8 94 9 2 49 4 98 10 1 50 2 100 Total n = 50 (CALIFICACIONES) 100 b. Analizar (para Datos no Agrupados) fr2 (frecuencia relativa de la calificación cuyo valor es “2” y que aparece dos veces en el estudio) Respuesta: fr2 = 4. La frecuencia absoluta de la calificación “2” es 2, pues ella aparece dos veces en el grupo de calificaciones dado. Entonces, la frecuencia relativa de la calificación 2 es 4, porque corresponde a la división de 2/50, 2 de las veces que aparece de las 50 calificaciones que aparecen en total, pudiendo expresarse como fracción (2/50), decimal (0,04) o porcentaje (4%). Podemos decir entonces que el 4% de los estudiantes obtuvieron 2 puntos de calificación en la asignatura Matemáticas. Fac3 (Frecuencia acumulada de la calificación cuyo valor es “3” y que aparece tres veces en el estudio) Respuesta: Fac3 = 7. En este caso, la frecuencia acumulada de la calificación 3, indica cuántos elementos cumplen con la condición de tener menos de 3 puntos en la calificación de la asignatura Matemáticas; dado que el valor de la frecuencia acumulada para esta nota fue de 7, podemos decir entonces que hay 7 estudiantes cuya nota es menor de 7 en la asignatura Matemáticas. c. Elaborar o construir la tabla de distribución de frecuencias para Datos Agrupadas. Por lo general una tabla de distribución de frecuencias con datos agrupados se realiza cuando la cantidad de datos es grande o la variable es continua. Básicamente MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 4 de 18 consiste en agrupar los datos en intervalos de una misma amplitud, denominados clases y a cada clase se le asigna su frecuencia correspondiente. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase y la marca de clase es el punto medio de cada intervalo, siendo ésta el valor que representa a todo el intervalo para el cálculo de algunos parámetros. La marca de clase se representa por ci y su fórmula para el cálculo es: 𝑐𝑖 = 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 − 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 2 El procedimiento a seguir para construir la tabla de distribución de frecuencias para datos agrupados son los siguientes: 1. Identificar el valor máximo y el valor mínimos del conjunto de datos del estudio En nuestro ejercicio se tiene que: Valor máximo = Xmáx = 10 Valor mínimo = Xmín = 0 2. Calcular el Rango: El rango de un conjunto de datos es la diferencia entre el valor máximo y el valor mínimo de dicho conjunto 𝑹𝒂𝒏𝒈𝒐 = 𝑿𝒎á𝒙 − 𝑿𝒎í𝒏 En nuestro ejemplo para obtener el rango de calificaciones en la asignatura Matemáticas sólo basta con determinar la diferencia que hay entre la calificación más alta (valor máximo) y la más baja (valor mínimo): 𝑹𝒂𝒏𝒈𝒐 = 𝟏𝟎 − 𝟎 = 𝟏𝟎 Rango = 10 3. Calcular la cantidad de intervalos: A los intervalos también se les conoce como clases. Simplemente son las categorías en las cuales vamos a agrupar las calificaciones, en nuestro ejemplo. Hay varias formas de calcular cuántos intervalos debemos utilizar. Para nuestro ejercicio analizaremos dos de ellas: 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 (𝐶𝑙𝑎𝑠𝑒𝑠) = √𝑛 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 (𝐶𝑙𝑎𝑠𝑒𝑠) = 1 + 3,322 × log(𝑛) Para ambas formas de calcular la cantidad de intervalos a utilizar, el valor n corresponde a la cantidad de datos que tenemos para analizar. En nuestro ejemplo son 50 datos. Con la primera forma tendríamos que redondear el resultado, ya que los intervalos corresponden a cantidades enteras: 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 (𝐶𝑙𝑎𝑠𝑒𝑠) = √50 = 7,07 ≅ 7 La segunda forma se conoce como Regla de Sturges y el resultado obtenido se debe aproximar por arriba, es decir, al entero siguiente. Para nuestro ejercicio tenemos: MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 5 de 18 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 (𝐶𝑙𝑎𝑠𝑒𝑠) = 1 + 3,322 × log(50) = 6,64 ≅ 7 Para ambas formas de cálculo se obtienen 7 intervalos o clases. 4. Calcular la amplitud de los intervalos: Ya conocemos el rango de calificaciones en la asignatura de Matemáticas y entre cuántos intervalos hay que repartir las categorías o clases. Para calcular su amplitud utilizaremos la siguiente fórmula: 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 10 = = 1,43 ≅ 1,5 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 7 Debemos asegurarnos que el producto de los intervalos o número de clases por la amplitud o tamaño de los intervalos tiene que ser lo suficiente para cubrir el rango, es decir, si multiplicamos 7 (número de clases) por 1,5 (tamaño o amplitud del intervalo) que da 10,5, debe cubrir el rango, que en nuestro caso es 10. 5. Construcción de los intervalos: El primer intervalo tiene como límite inferior el valor mínimo de los datos, en nuestro ejemplo 0. Le sumamos el valor de la amplitud, es decir 1,5, y obtenemos el límite superior de 1,5. Esto nos daría el primer intervalo: [0 − 1,5) Utilizamos corchete para el dato que se incluye en el intervalo (el 0, límite inferior) y paréntesis para el dato que no se incluye (1,5, límite superior). Esto significa que las calificaciones de 0 se cuentan, pero no las de 1,5. El 1,5 se cuenta en el siguiente intervalo y allí vendría siendo el límite inferior. Le sumamos el valor de la amplitud, es decir, 1,5 puntos y obtenemos el límite superior de 3 puntos. Eso nos daría el segundo intervalo: [1,5 − 3) En este intervalo contamos la calificación 1,5 puntos pero no incluimos la calificación 3 puntos. Los 7 intervalos construidos serían: Calificaciones Intervalos o Clases [0 – 1,5) [1,5 – 3) [3 – 4,5) [4.5 – 6) [6 – 7,5) [7,5 – 9) [9 – 10,5] MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 6 de 18 Dado que los datos con los que se están trabajando son números enteros, convendría que los intervalos fuesen números enteros para facilitar los cálculos. Para ello vamos a disminuir el número de intervalos a 5 e incrementar su amplitud a 2, valores que también nos aseguran. Al multiplicarse, que cubren el rango (5 x 2 = 10, valor del rango) Bajo esta premisa, los intervalos o clase serían: Calificaciones Intervalos o Clases [0 – 2) [2 – 4) [4 – 6) [6 – 8) [8 – 10] Nótese que el último intervalo o clase tiene un corchete en ambos límites (superior e inferior) ya que, al tratarse del último, se deben tomar los valores restantes. 6. Cálculo de la Marca de Clase de cada intervalo: La marca de clase es el punto medio que hay en cada intervalo. Su cálculo es la semisuma del límite superior e inferior de cada intervalo o clase: Marca de clase ci Calificaciones Intervalos o Clases [0 – 2) 𝐶𝑖 = 𝐿𝑆 + 𝐿𝐼 (2 + 0) 2 = = =𝟏 2 2 2 [2 – 4) 𝐶𝑖 = 𝐿𝑆 + 𝐿𝐼 (4 + 2) 6 = = =𝟑 2 2 2 [4 – 6) 𝐶𝑖 = 𝐿𝑆 + 𝐿𝐼 (6 + 4) 10 = = =𝟓 2 2 2 [6 – 8) 𝐶𝑖 = 𝐿𝑆 + 𝐿𝐼 (8 + 6) 14 = = =𝟕 2 2 2 [8 – 10] 𝐶𝑖 = 𝐿𝑆 + 𝐿𝐼 (10 + 8) 18 = = =𝟗 2 2 2 7. Determinar la frecuencia absoluta de cada intervalo o clase: La frecuencia absoluta es la cantidad de datos contenidos en cada intervalo. Para ellos inspeccionamos los datos, ordenados de menor a mayor e indicamos la cantidad de ellos que pertenecen a cada intervalo o clase, considerando que el dato analizado debe ser mayor o igual que el límite superior (lo incluye) y menor que el límite inferior (no lo incluye). MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 7 de 18 Calificaciones (n = 50): 0, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10 Calificaciones ci Frecuencia Absoluta (fi) [0 – 2) 1 2 [2 – 4) 3 5 [4 – 6) 5 17 [6 – 8) 7 19 [8 – 10] 9 7 50 La sumatoria de todas las frecuencias absolutas debe ser igual al número de datos (50) 8. Determinar la Frecuencia Absoluta Acumulada de cada intervalo o clase: La Frecuencia Absoluta Acumulada (Fac) de cada intervalo o clase consiste en sumar todas las frecuencias absolutas de los intervalos anteriores y el actual. Calificaciones ci fi Frecuencia Absoluta Acumulada (Fac) [0 – 2) 1 2 𝐹𝑎𝑐1 = 𝑓1 = 𝟐 [2 – 4) 3 5 𝐹𝑎𝑐2 = 𝐹𝑎𝑐1 + 𝑓2 = 2 + 5 = 𝟕 [4 – 6) 5 17 𝐹𝑎𝑐3 = 𝐹𝑎𝑐2 + 𝑓3 = 7 + 17 = 𝟐𝟒 [6 – 8) 7 19 𝐹𝑎𝑐4 = 𝐹𝑎𝑐3 + 𝑓4 = 24 + 19 = 𝟒𝟑 [8 – 10] 9 7 𝐹𝑎𝑐5 = 𝐹𝑎𝑐4 + 𝑓5 = 43 + 7 = 𝟓𝟎 50 9. Determinar la Frecuencia Relativa de cada intervalo o clase: Para calcular la frecuencia relativa de cada intervalo clase se divide la Frecuencia Absoluta de ese mismo intervalo o clase entre el número total de datos. MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 8 de 18 Para nuestro ejercicio, tendremos: Calificaciones ci fi Fac 1 2 2 3 5 7 5 17 24 7 19 43 9 7 50 [0 – 2) [2 – 4) [4 – 6) [6 – 8) [8 – 10] Frecuencia Relativa (fr) 𝑓𝑟1 = 𝑓1 2 𝑥100 = 𝑥100 = 𝟒 𝑛 50 𝑓𝑟2 = 𝑓2 5 𝑥100 = 𝑥100 = 𝟏𝟎 𝑛 50 𝑓𝑟3 = 𝑓3 17 𝑥100 = 𝑥100 = 𝟑𝟒 𝑛 50 𝑓𝑟4 = 𝑓4 19 𝑥100 = 𝑥100 = 𝟑𝟖 𝑛 50 𝑓𝑟5 = 𝑓5 7 𝑥100 = 𝑥100 = 𝟏𝟒 𝑛 50 50 100 La frecuencia relativa se puede expresar en decimal o en porcentaje y la suma de todas las frecuencias relativas debe ser 100% 10. Determinar la Frecuencia Relativa de cada intervalo o clase: La Frecuencia Relativa de cada intervalo o clase consiste en sumar todas las frecuencias relativas de los intervalos o clases anteriores y el actual. Para nuestro ejercicio, tendremos: Calificaciones ci fi Fac fr Frecuencia Relativa Acumulada (Fri) [0 – 2) 1 2 2 4 𝐹𝑟1 = 𝑓𝑟1 = 𝟒 [2 – 4) 3 5 7 10 𝐹𝑟2 = 𝐹𝑟1 + 𝑓𝑟2 = 4 + 10 = 𝟏𝟒 [4 – 6) 5 17 24 34 𝐹𝑟3 = 𝐹𝑟2 + 𝑓𝑟3 = 14 + 34 = 𝟒𝟖 [6 – 8) 7 19 43 38 𝐹𝑟4 = 𝐹𝑟3 + 𝑓𝑟4 = 48 + 38 = 𝟖𝟔 [8 – 10] 9 7 50 14 𝐹𝑟5 = 𝐹𝑟4 + 𝑓𝑟5 = 86 + 14 = 𝟏𝟎𝟎 50 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM 100 Página 9 de 18 Queda de esta manera construida la Tabla de Distribución de Frecuencias para los datos agrupados: Calificaciones Marca de clase Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada Intervalos ci fi Fac fr Fri [0 – 2) 1 2 2 4 4 [2 – 4) 3 5 7 10 14 [4 – 6) 5 17 24 34 48 [6 – 8) 7 19 43 38 86 [8 – 10] 9 7 50 14 100 50 100 d. Graficar el Histograma y Polígono de Frecuencias de la parte (c) Las representaciones gráficas son importantes porque a través de ellas se puede visualizar con mayor facilidad el comportamiento de una variable estadística, permitiendo así mismo la comprensión, comparación y análisis de la variable. Los Histogramas son gráficos de barras utilizados para representar variables cuantitativas que estén agrupadas en intervalos. Están formados por rectángulos contiguos. La variable (intervalos) se grafica en el eje horizontal y en el eje vertical se representa la frecuencia absoluta o relativa. Sirve para interpretar las variaciones de los datos, investigar cómo se puede solucionar un problema o mejorar un proceso. El Polígono de frecuencias se forma uniendo los puntos medios de las barras de un histograma en su parte superior mediante segmentos. Se usa para determinar la forma que sigue la distribución de frecuencias de las observaciones con el fin de ajustar alguna función probabilística determinada. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (DATOS AGRUPADOS) Clase ci fi Fac fri Fri [0 - 2) [2 - 4) [4 - 6) [6 - 8) [8 - 10] 1 3 5 7 9 2 5 17 19 7 2 7 24 43 50 4 10 34 38 14 4 14 48 86 100 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 10 de 18 Histograma y polígono de frecuencias 20 19 18 17 16 14 12 10 8 7 6 5 4 2 2 0 [0 - 2) [2 - 4) MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM [4 - 6) [6 - 8) [8 - 10] Página 11 de 18 Ejercicio No. 2: Un operador local ha considerado una muestra aleatoria de 20 transformadores, anotando el tiempo necesario que requiere en cada uno para lograr un plan integral de trabajo, obteniéndose lo siguiente (en horas): 6–6–7–8–8 – 8 –8 –9 –9–9 9 – 9 – 9 – 9 – 10 – 10 – 10 – 10 – 10 - 11 Para Datos no Agrupados: a. Calcule las medidas de tendencia central de estos datos, indicando a qué tipo de medida pertenece. Los datos no agrupados constituyen el conjunto de datos que no han sido clasificados y que son presentados en una tabla de datos en forma individual, es decir que no forman parte de un conjunto. De manera general constituye una cantidad de elementos que es menor a 30 con muy poca o nula repetición. Las medidas de tendencia central para datos no agrupados son un conjunto de indicadores estadísticos que van a mostrar hacia qué valores se agrupan los datos numéricos, es decir, son medidas estadísticas que buscan resumir en un solo valor un conjunto de valores. Hay tres medidas que son comunes para poder identificar el centro de los conjuntos de datos: la media, mediana y moda, cada una de ellas ubicadas alrededor del punto donde se aglomeran los datos. La media, promedio o media aritmética: Está determinada por el valor en promedio de una serie de conjunto de datos numéricos. Para su cálculo se procede de la siguiente manera: Sumamos todos los números del conjunto de datos. Dividimos esa suma entre el número total de datos en el conjunto. La fórmula para el cálculo sería: ∑𝑛𝑖=1 𝑥𝑖 𝑥̅ = 𝑛 Para nuestro ejercicio: 𝑥̅ = 6 + 6 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 9 + 9 + 9 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 11 175 = 20 20 ̅ = 𝟖, 𝟕𝟓 𝒙 Este valor se interpreta como el “punto de equilibrio” o “centro de masas” del conjunto de datos. La media del conjunto de datos es 8,75 horas, lo que indica el tiempo promedio necesario para lograr un plan de trabajo integral para los transformadores en estudio. MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 12 de 18 La mediana o mediana aritmética Es el valor encontrado en el centro del conjunto de los datos luego de haber sido ordenados. Las medianas son útiles siempre que estemos tratando de averiguar cuál es el centro de un conjunto de datos. Para determinarla se procede de la siguiente manera: Ordenar los datos en orden ascendente (de menor a mayor), asegurándose de incluir los números repetidos en caso de existir. 6 6 7 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 11 Encontrar el número medio del conjunto de datos, presentándose dos casos: i. Si el conjunto de datos tiene un número impar de valores, la mediana será el valor que se encuentra en el punto medio del conjunto. ii. Si el conjunto de datos tiene un número par de valores, que es nuestro caso, ya que tenemos 20, se deben encontrar los dos valores centrales del conjunto de datos y calcular la media de dichos valores: 6 6 7 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 11 Los valores centrales son: 9 y 9 La media de esos valores será: 𝑀𝑒𝑑𝑖𝑎 = 9 + 9⁄2 = 18⁄2 = 9 Siendo entonces el valor de la mediana 9 para nuestro conjunto de datos, lo que se interpreta como que la mitad de los valores del conjunto de datos es menor que o igual a 9 y la otra mitad de los valores es mayor o igual que 9. La moda La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Para determinarla se procede de la siguiente manera: Ordenar los datos en orden ascendente (de menor a mayor), asegurándose de incluir los números repetidos en caso de existir. 6 6 7 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 11 Encontrar los números que se repiten, determinando las veces que lo hacen (frecuencia): MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Valor Frecuencia de repetición 6 2 7 1 8 4 9 7 10 5 11 1 Página 13 de 18 Observando la tabla anterior, vemos que el valor 9 se repite 7 veces en el conjunto de datos, por lo que este será el valor de la moda del conjunto. Dado que 9 es el valor que se repite el mayor número de veces, se concluye que 9 horas es el tiempo con más frecuencia en lograr un plan integral de trabajo para los transformadores en estudio. Estas medidas de tendencia central para datos no agrupados nos permitirán analizar los datos de un conjunto. b. Graficar Conocidas las medidas de tendencia central (MTC) para datos no agrupados, como lo hicimos en el aparte anterior del ejercicio, procedemos a organizar los datos, los cuales se pueden distribuir en tablas de frecuencia, a efectos de proceder con la elaboración de las gráficas correspondientes (Histograma y polígono de frecuencias y gráfico de sectores). Para ello calcularemos: Frecuencia absoluta Es la cantidad de veces que se encuentra un valor y está denotado o representado con “fi“, donde el subíndice simboliza cada uno de los valores o datos numéricos. Cabe destacar que la suma de las frecuencias absolutas es la cantidad de números total de los datos. Frecuencia relativa Es la medida estadística que constituye el cociente de frecuencia absoluta de un valor de la población entre el total de valores que componen la población muestra y se encuentra representado por las letras “fr”. Frecuencia acumulada Está representada por “Fac”, es la sumatoria de las frecuencias absolutas, dadas por todos los valores que son iguales o inferiores al valor que se está calculando. Frecuencia relativa acumulada Está representada por “Fri”, es la división de la frecuencia acumulada entre el número total de datos. Para nuestro ejercicio tenemos: MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 14 de 18 Horas Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia acumulada relativa xi fi Fac fr (Fri) 2 𝐹𝑎𝑐1 = 𝑓1 = 𝟐 𝑓1 𝑓𝑟1 = 𝑥100 𝑛 2 = 𝑥100 = 𝟏𝟎 20 𝐹𝑟1 = 𝑓𝑟1 = 𝟏𝟎 1 𝐹𝑎𝑐2 = 𝐹𝑎𝑐1 + 𝑓2 =2+1=𝟑 𝑓2 𝑓𝑟2 = 𝑥100 𝑛 1 = 𝑥100 = 𝟓 20 𝐹𝑟2 = 𝐹𝑟1 + 𝑓𝑟2 = 10 +5 = 𝟏𝟓 4 𝐹𝑎𝑐3 = 𝐹𝑎𝑐2 + 𝑓3 = 3 + 4 =7 𝑓3 𝑓𝑟3 = 𝑥100 𝑛 4 = 𝑥100 = 𝟐𝟎 20 𝐹𝑟3 = 𝐹𝑟2 + 𝑓𝑟3 = 15 + 20 = 𝟑𝟓 7 𝐹𝑎𝑐4 = 𝐹𝑎𝑐3 + 𝑓4 = 7 + 7 = 14 𝑓4 𝑓𝑟4 = 𝑥100 𝑛 7 = 𝑥100 = 𝟑𝟓 20 𝐹𝑟4 = 𝐹𝑟3 + 𝑓𝑟4 = 35 + 35 = 𝟕𝟎 5 𝐹𝑎𝑐5 = 𝐹𝑎𝑐4 + 𝑓5 = 14 + 5 = 𝟏𝟗 6 7 8 9 10 11 1 𝐹𝑎𝑐6 = 𝐹𝑎𝑐5 + 𝑓6 = 19 + 1 = 𝟐𝟎 20 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM 𝑓𝑟5 = = 𝑓5 𝑥100 𝑛 5 𝑥100 = 𝟐𝟓 20 𝑓6 𝑓𝑟6 = 𝑥100 𝑛 1 = 𝑥100 = 𝟓 20 𝐹𝑟5 = 𝐹𝑟4 + 𝑓𝑟5 = 70 + 25 = 𝟗𝟓 𝐹𝑟6 = 𝐹𝑟5 + 𝑓𝑟6 = 95 + 5 = 𝟏𝟎𝟎 100 Página 15 de 18 Resumiendo: Horas Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia acumulada relativa xi fi Fac fr (Fri) 6 2 2 10 10 7 1 3 5 15 8 4 7 20 35 9 7 14 35 70 10 5 19 25 95 11 1 20 5 100 20 100 Procedemos a elaborar el histograma y polígono de frecuencias con los datos de la tabla, ploteando los valores de los datos (xi) en el eje de las abscisas (eje x) y los valores de frecuencia absoluta en el eje de las ordenadas (eje y), obteniéndose la siguiente gráfica: Histograma y polígono de frecuencias 8 7 7 6 5 5 4 4 3 2 2 1 1 1 0 1 2 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM 3 4 5 6 Página 16 de 18 El diagrama de sectores, también denominado diagrama de pastel, es un círculo dividido en partes y que se usa para representar variables cualitativas. Muestra la proporción que le corresponde a cada valor del conjunto de datos en función de su frecuencia. Para hacer la gráfica agregaremos una columna a la tabla de distribución de frecuencias para calcular los grados que le corresponde a cada sector del gráfico, utilizando la siguiente fórmula: 360° 𝐺𝑟𝑎𝑑𝑜𝑠 = × 𝑓𝑖 = 360° × 𝑓𝑟 𝑛 Para nuestro ejercicio: Horas Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia acumulada relativa Grados xi fi Fac fr (Fri) 𝛼° 6 2 2 10 10 𝐺𝑟𝑎𝑑𝑜𝑠 = = 7 1 3 5 15 8 4 7 20 35 7 14 35 70 10 5 19 25 95 11 1 20 20 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM 5 100 100 360° × 𝑓4 𝑛 360° × 7 = 𝟏𝟐𝟔 20 𝐺𝑟𝑎𝑑𝑜𝑠 = = 360° × 𝑓3 𝑛 360° × 4 = 𝟕𝟐 20 𝐺𝑟𝑎𝑑𝑜𝑠 = = 360° × 𝑓2 𝑛 360° × 1 = 𝟏𝟖 20 𝐺𝑟𝑎𝑑𝑜𝑠 = = 9 360° × 2 = 𝟑𝟔 20 𝐺𝑟𝑎𝑑𝑜𝑠 = = 360° × 𝑓1 𝑛 360° × 𝑓5 𝑛 360° × 5 = 𝟗𝟎 20 𝐺𝑟𝑎𝑑𝑜𝑠 = 360° × 𝑓6 𝑛 360° = × 1 = 𝟏𝟖 20 360° Página 17 de 18 Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia acumulada relativa Grados Horas xi fi Fac fr (Fri) 𝛼° 6 2 2 10 10 36 7 1 3 5 15 18 8 4 7 20 35 72 9 7 14 35 70 126 10 5 19 25 95 90 11 1 20 5 100 18 20 100 360° Diagrama de sectores 5 10 5 25 20 35 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD EVALUACIÓN SUMATIVA II | AACM Página 18 de 18