TRABAJO PROBABILIDAD Y ESTADÍSTICA Datos agrupados Los siguientes datos fueron tomados de una población de 417 datos con una muestra de 145 datos donde se puede evidenciar la marca de clase, frecuencia relativa, la frecuencia absoluta y la frecuencia relativa y absoluta acumulada donde con estos datos agrupados podemos analizar la media, mediana, moda varianza y curtosis con mas exactitud. Se tiene una muestra de 145 datos de la vida en horas de 417 lámparas incandescentes, se determina que el número de intervalos es m= 9 Muestra tomada aleatoriamente: 1162 1185 1009 1561 1011 833 1126 1303 1690 1258 943 928 895 1562 1035 1037 1171 1381 1415 773 883 1081 1058 1425 814 1135 1110 912 1058 917 1203 1173 1085 929 956 1324 1157 836 1147 1176 1195 1118 943 759 1255 898 918 831 529 958 856 1248 1195 732 787 972 999 989 1063 901 612 910 1157 904 878 1127 1000 932 1022 1324 938 1049 1228 964 1117 827 1485 1002 1061 1211 1104 1037 1148 885 972 1220 968 965 1000 1240 1252 919 623 1033 1170 765 1201 1229 765 1141 1093 1107 956 992 610 1337 716 1069 1105 844 1115 653 889 880 1013 1106 1358 883 769 854 1160 1143 1014 1385 909 675 900 1022 1028 1002 1080 801 905 995 1234 1430 896 1056 1635 944 1209 1343 1490 1173 1156 Para construir la tabla la tabla de frecuencia seguimos los siguientes pasos 1. Hallar el rango R=Xmin-XMax En este caso el rango se hallar restando el valor mayor de vida de las lámparas menos el valor menor asi RANGO R=1690-529=1161 2. Seleccionar el numero de clases deseada “m” que en nuestro caso es m=9 o se puede hallar con la siguiente ecuación m=1+3.332 log n 3. Formar los intervalos de clase con con amplitud apropiada, la amplitud se halla con el rango dividido en los intervalos de clase m 4. Formar los limites reales de clase AMPLITUD DE INTERVALO A=1161/9=129 Se encuentra que el x min es 529 y el x es 1690, el rango es de 1161 y la amplitud de los max intervalos es 129 INTERVALOS DE CLASE MARCA DE CLASE y; FRECUENCIA FRECUENCIA FREC. ABS. FREC. REL. ABSOLUTA RELATIVA ACUMULADA ACUMULADA ni hi Ni Hi 529 - 658 593.5 5 0.0344 5 0.0344 658-787 722.5 9 0.0620 14 0.0964 787-916 851.5 25 0.1724 39 0.2688 916-1045 980.5 37 0.2551 76 0.5239 1045-1174 1109.5 35 0.2413 111 0.7652 1174-1303 1238.5 18 0.1241 129 0.8893 1303-1432 1367.5 10 0.0689 139 0.9582 1432-1561 1496.5 3 0.0206 142 0.9788 1561-1690 1625.5 3 0.0206 145 1 Marcas de clase y; en nuestro caso se refiere al promedio de cada intervalo, este se refiere al promedio de vida de cada lampara incandescente en cada intervalo dado un ejemplo de esto es el valor marcado de color amarillo es de 980.5 esto quiere decir que de un intervalo dado 916-1045 en promedio 980.5 horas de vida duran 37 lámparas incandescentes. Frecuencia absoluta ni; Esta hace referencia a la cantidad de lamparas en un intervalo de clase dado .un ejemplo de esto es el numero selecionado de azul es 35 es decir 35 lamparas emn promedio duran 1109.5 horas de vida útil. Frecuencia relativa hi; se refiere al porcentaje en cuanto a la cantidad de lamparas en cada intervalo un ejemplo de esto que el valor selecionado de color rojo es 0.1724 que el 17.24 de las lamparas totales corresponden a 25 lamparas que tienen una vida útil de 851.5 horas de vida en promedio. Frecuencia absoluta acumulada Ni; Hace referencia al numero de lamparas acumuladas hasta un intervalo dado ejemplo en nuestro caso dado el valor de color verde es 14 esto quiere decir que 14 lámparas tiene una duración o vida útil por debajo de 787 horas de vida Frecuencia relativa acumulada Hi;se refiere al porcentaje acumulado de la cantidad de lámparas hasta cierto intervalo dado por ejemplo 0.8893 este valor corresponde a que el 88.93 porciento corresponde a 129 lámparas que tienen una vida útil por debajo de 1303 horas, esto tomando el intervalo mayor de esa fila para que sea interpretado correctamente. TABLA MAYOR Y MENOR QUE Límites < QUE >QUE 529 0 0 145 1 658 5 0.0344 140 0.9655 787 14 0.0964 131 0.9034 916 39 0.2688 106 0.7310 1045 76 0.5239 69 0.4759 1174 111 0.7652 34 0.2345 1303 129 0.8893 16 0.1103 1432 139 0.9582 6 0.0413 1561 142 0.9788 3 0.0207 1690 145 1 0 0 Media aritmética ese el promedio de mas común de todos los datos. 𝑛𝑖𝑦𝑖 𝑛 (5∗593.3)+(9∗722.5)+(25∗851.5)+(37∗980.5)…+(10∗1367.5)+(3∗1496.5)+(3∗1625.5) = 145 =1042.7758 Análisis: Esto significa que de una muestra de 145 de 417 datos el promedio es de 1042.77 es decir que 145 lamparas incandescentes en promedio tiene una vida útil de 1042.7758 horas de vida en promedio. MEDIANA Es el único valor de un conjunto de datos que representa el elemento central y lo divide en dospartes iguales. es justo el valor central, es decir, el que se encuentra en la mitad de la lista. Para datos agrupados la mediana se calcula por interpolación. 26.88%----916 50----X X=1032.9141 52.39----1045 Me= 1032.9141 Análisis: esto hace referencia a que el dato central es de 1032.9141 horas es decir 1032.91 es dato intermedio de duración en horas de 145 lamparas Moda: En estadística, la moda es el valor que aparece con mayor frecuencia en un conjunto de datos. para datos agrupados se utiliza la siguiente formula. Moda :Lm+(Δ1/ Δ1+ Δ2)*A Donde Lm :limite inferior de clase modal=916 Δ1=12 Δ2=2 MODA Mo= 918 + (12/12+2)129 = 1026.57 Análisis: esto hace referencia a que 1026.57 es con frecuencia la duración de vida de las 145 lamparas tomadas como muestra es decir con frecuencia podemos encontrar lamparas con vida útil de 1026.57 horas de vida Cuartiles: Dividen el conjunto de datos en 4 partes iguales CUANTILES Q3= 1101.374 52.39% =====> 980.5 75% =====> Q3 76.52% =====> 1109.5 Q1= 837.433 9.64% =====> 722.5 25% =====> Q1 26.88% =====> 851.5 Desarrollado por interpolación Q2= 968.414 26.88% =====> 851.5 50% =====> Q2 52.39% =====> 980.5 Desarrollado por interpolación DECILES :dividen el conjunto de datos en 10 partes iguales D1= 725.194 9.64% =====> 722.5 10% =====> D10 26.88% =====> 851.5 Desarrollado por interpolación D2= 800.02 9.64% =====> 722.5 20% =====> D20 26.88% =====> 851.5 Desarrollado por interpolación D3=867.277 26.88% =====> 851.5 30% =====> D30 52.39% =====> 980.5 Desarrollado por interpolación D4= 917.845 26.88% =====> 851.5 40% =====> D40 52.39% =====> 980.5 Desarrollado por interpolación D5= 968.414 26.88% =====> 851.5 50% =====> D50 52.39% =====> 980.5 Desarrollado por interpolación D6= 1021.183 52.39% =====> 980.5 60% =====> D60 76.52% =====> 1109.5 Desarrollado por interpolación D7= 1074.643 52.39% =====> 980.5 70% =====> D70 76.52% =====> 1109.5 Desarrollado por interpolación D8= 1145.674 76.52% =====> 1109.5 80% =====> D80 88.93% =====> 1238.5 Desarrollado por interpolación D9= 1258.533 88.93% =====> 1238.5 70% =====> D90 95.82% =====> 1367.5 Desarrollado por interpolación PERCENTILES: dividen el conjunto de datos en 100 partes iguales P1= 1.453 0% =====> 0 1% =====> P1 3.44% =====>5 P2=2.907 0% =====> 0 2% =====> P2 3.44% =====>5 P3=4.360 0% =====> 0 3% =====> P3 3.44% =====>5 P4=5.8129 3.44% =====> 5 4% =====> P4 9.64% =====> 14 P5=7.265 3.44% =====> 5 5% =====> P5 9.64% =====> 14 P6=8.716 3.44% =====> 5 6% =====> P6 9.64% =====> 14 P7=10.168 3.44% =====> 5 7% =====> P7 9.64% =====> 14 P8=11.619 3.44% =====> 5 8% =====> P8 9.64% =====> 14 P9=13.071 3.44% =====> 5 9% =====> P9 9.64% =====> 14 P10=14.522 9.64% =====> 14 10% =====> P10 26.88% =====> 39 P11=15.972 9.64% =====> 14 11% =====> P11 26.88% =====> 39 P12= 17.422 9.64% =====> 14 12% =====> P12 26.88% =====> 39 P13=18.872 9.64% =====> 14 13% =====> P13 26.88% =====> 39 P14=20.323 9.64% =====> 14 14% 26.88% =====> P14 =====> 39 P15=21.773 9.64% =====> 14 15% =====> P15 26.88% =====> 39 P16=23.223 9.64% =====> 14 16% =====> P16 26.88% =====> 39 P17=24.673 9.64% =====> 14 17% =====> P17 26.88% =====> 39 P18=26.123 9.64% =====> 14 18% =====> P18 26.88% =====> 39 P19=27.573 9.64% =====> 14 19% =====> P19 26.88% =====> 39 P20=29.023 9.64% =====> 14 20% =====> P20 26.88% =====> 39 P21=30.473 9.64% =====> 14 21% =====> P21 26.88% =====> 39 P22=31.923 9.64% =====> 14 22% =====> P22 26.88% =====> 39 P23=33.374 9.64% =====> 14 23% =====> P23 26.88% =====> 39 P24=34.824 9.64% =====> 14 24% 26.88% =====> P24 =====> 39 P25=36.274 9.64% =====> 14 25% =====> P25 26.88% =====> 39 P26=37.724 9.64% =====> 14 26% =====> P26 26.88% =====> 39 P27=39.174 26.88% =====> 39 27% =====> P27 52.39% =====> 76 P28=40.624 26.88% =====> 39 28% =====> P28 52.39% =====> 76 P29=42.075 26.88% =====> 39 29% =====> P29 52.39% =====> 76 P30=43.525 26.88% =====> 39 30% =====> P30 52.39% =====> 76 P31=44.976 26.88% =====> 39 31% =====> P31 52.39% =====> 76 P32=46.426 26.88% =====> 39 32% =====> P32 52.39% =====> 76 P33=47.877 26.88% =====> 39 33% =====> P33 52.39% =====> 76 P34=49.327 26.88% 34% 52.39% =====> 39 =====> P34 =====> 76 P35=50.777 26.88% =====> 39 35% =====> P35 52.39% =====> 76 P36=52.227 26.88% =====> 39 46% =====> P36 52.39% =====> 76 P37=53.678 26.88% =====> 39 37% =====> P37 52.39% =====> 76 P38=55.129 26.88% =====> 39 38% =====> P38 52.39% =====> 76 P39=56.579 26.88% =====> 39 39% =====> P39 52.39% =====> 76 P40=58.029 26.88% =====> 39 40% =====> P40 52.39% =====> 76 RANGO INTERCUARTIL RIQ=Q3-Q1= 1101.374 - 837.433 = 263.941 Este valor representa el 50% de los datos central es 263.941 Diagrama de cajas y bigotes Ofrece una representación visual del conjunto de datos basada en el resumen de cinco valores. También se puede definir como una representación visual que representa varias características como el valor mínimo, el valor máximo, los cuartiles 1 y 3 y la media aritmética de un determinado grupo de datos y representa características como la dispersión y simetría. Xmax Q3 me Q1 Xmin Interpretación: Max: Este indica el valor máximo de la muestra tomada en este caso es de 1625.5 es el máximo de duración de una lampara incandescente en horas. Q3=El 75% de duración o vida de una lampara en horas esta por debajo de 1109.5 horas de vida, el 75% de los datos están por debajo de este valor. Me: Indica que el valor central o intermedio es de 980.5 horas de vida de 145 lámparas en total. Q1: Indica que el 25% de las horas útiles de las lámparas está por debajo de 851.5 horas de vida de las lamparas Xmin: El valor mínimo es de 593.5 es decir la duración mínima de una lampara en horas es de 593.5 horas esto tomando una muestra de 25145datos aleatorios. =Esto significa que de una muestra de 145 de 417 datos el promedio es de 1042.77 es decir que 145 lamparas incandescentes en promedio tiene una vida útil de 1042.7758 horas de vida en promedio. Varianza: Es una medida que expresa el grado de desviación de las observaciones con respecto a su media. ni En nuestro ejemplo tenemos que: 5 ∗ (593.5 − 1042.77)2 +(9)(722.5 − 1042.7)2 + (25)(851.5 − 1042.7)2 + +(10)(1303 − 1042.7)2 + (3)(1496.5 − 1042.7)2 + (3)(1625.5 − 1042.7)2 144 =45324.40 Desviación estándar: Una medida estadística de la expansión de los valores desde su valor medio, calculado como la raíz cuadrada de la suma de las desviaciones cuadradas del valor medio, dividido por el número de elementos menos uno. Recuerda que la desviación estándar es la raíz cuadrada positiva de la varianza. yi *ni En nuestro caso seria En nuestro caso tenemos que la desviación estándar es de S= 5 ∗ (593.5 − 1042.77)2 +(9)(722.5 − 1042.7)2 + (25)(851.5 − 1042.7)2 + +(10)(1303 − 1042.7)2 + (3)(1496.5 − 1042.7)2 + (3)(1625.5 − 1042.7)2 144 =212.8953 Esto hace referencia que hay una desviación estándar de 212.89 con respecto a la media aritmética en horas de duración de una lampara. Medidas de asimetría y apuntamiento Analizando la siguiente grafica podemos observar que el tipo de curva en la gráfica es asimétrica positiva porque la media aritmética es mayor que la mediana además según el coeficiente de Fisher la asimetría es positiva porque es mayor que 0 esta es de 0.3064 es decir los datos están mas distribuidos hacia la derecha. Coeficiente de asimetría de Fisher En estadística, el coeficiente de asimetría de Fisher es un coeficiente que sirve para determinar la asimetría de una distribución. Es decir, el coeficiente de asimetría de Fisher permite saber si una distribución de probabilidad es asimétrica positiva, asimétrica negativa o simétrica. 𝐶𝐴F = (593.5 − 1042.7)3 +(722.5 − 1042.7)3 + (851.5 − 1042.7)3 + ⋯ . +(1367.5 − 1042.7)3 + (1496.5 − 1042.7)3 + (1625.7 − 1042.7)3 30859,05 COf=0.30641871 Análisis Asimetría positiva es decir los datos están mas distribuidos hacia la derecha Curtosis Esta mide cuanto esta escarpada o achatada una curva o distribución (593.5 − 1042.7)3 +(722.5 − 1042.7)3 + (851.5 − 1042.7)3 +. . +(1367.5 − 1042.7)3 + (1496.5 − 1042.7)3 + (1625.7 − 1042.7)3 −3 145 ∗ ((212.8))4 K=0.1684 curtosis 0,002 0,0018 0,0016 0,0014 0,0012 0,001 0,0008 0,0006 0,0004 0,0002 0 0 200 400 600 800 1000 1200 1400 1600 1800 Analisis: el grado de achatamiento de la curva es de 0.1684 es decir tiene una curtosis leptocúrtica porque esta curtosis es mayor que 0