Uploaded by Juan Esteban Medina

TRABAJO PROBABILIDAD Y ESTADÍSTICA...

advertisement
TRABAJO PROBABILIDAD Y ESTADÍSTICA
Datos agrupados
Los siguientes datos fueron tomados de una población de 417 datos con una muestra de 145
datos donde se puede evidenciar la marca de clase, frecuencia relativa, la frecuencia absoluta
y la frecuencia relativa y absoluta acumulada donde con estos datos agrupados podemos
analizar la media, mediana, moda varianza y curtosis con mas exactitud.

Se tiene una muestra de 145 datos de la vida en horas de 417 lámparas
incandescentes, se determina que el número de intervalos es m= 9
Muestra tomada aleatoriamente:
1162
1185
1009
1561
1011
833
1126
1303
1690
1258
943
928
895
1562
1035
1037
1171
1381
1415
773
883
1081
1058
1425
814
1135
1110
912
1058
917
1203
1173
1085
929
956
1324
1157
836
1147
1176
1195
1118
943
759
1255
898
918
831
529
958
856
1248
1195
732
787
972
999
989
1063
901
612
910
1157
904
878
1127
1000
932
1022
1324
938
1049
1228
964
1117
827
1485
1002
1061
1211
1104
1037
1148
885
972
1220
968
965
1000
1240
1252
919
623
1033
1170
765
1201
1229
765
1141
1093
1107
956
992
610
1337
716
1069
1105
844
1115
653
889
880
1013
1106
1358
883
769
854
1160
1143
1014
1385
909
675
900
1022
1028
1002
1080
801
905
995
1234
1430
896
1056
1635
944
1209
1343
1490
1173
1156
Para construir la tabla la tabla de frecuencia seguimos los siguientes pasos
1. Hallar el rango R=Xmin-XMax
En este caso el rango se hallar restando el valor mayor de vida de las lámparas menos el
valor menor asi
RANGO
R=1690-529=1161
2. Seleccionar el numero de clases deseada “m” que en nuestro caso es m=9 o se
puede hallar con la siguiente ecuación m=1+3.332 log n
3. Formar los intervalos de clase con con amplitud apropiada, la amplitud se halla
con el rango dividido en los intervalos de clase m
4. Formar los limites reales de clase
AMPLITUD DE INTERVALO
A=1161/9=129
Se encuentra que el x
min
es 529 y el x es 1690, el rango es de 1161 y la amplitud de los
max
intervalos es 129
INTERVALOS
DE
CLASE
MARCA
DE
CLASE
y;
FRECUENCIA FRECUENCIA FREC. ABS.
FREC. REL.
ABSOLUTA
RELATIVA
ACUMULADA ACUMULADA
ni
hi
Ni
Hi
529 - 658
593.5
5
0.0344
5
0.0344
658-787
722.5
9
0.0620
14
0.0964
787-916
851.5
25
0.1724
39
0.2688
916-1045
980.5
37
0.2551
76
0.5239
1045-1174
1109.5
35
0.2413
111
0.7652
1174-1303
1238.5
18
0.1241
129
0.8893
1303-1432
1367.5
10
0.0689
139
0.9582
1432-1561
1496.5
3
0.0206
142
0.9788
1561-1690
1625.5
3
0.0206
145
1
Marcas de clase y; en nuestro caso se refiere al promedio de cada intervalo, este se refiere
al promedio de vida de cada lampara incandescente en cada intervalo dado un ejemplo de
esto es el valor marcado de color amarillo es de 980.5 esto quiere decir que de un intervalo
dado 916-1045 en promedio 980.5 horas de vida duran 37 lámparas incandescentes.
Frecuencia absoluta ni; Esta hace referencia a la cantidad de lamparas en un intervalo de
clase dado .un ejemplo de esto es el numero selecionado de azul es 35 es decir 35 lamparas
emn promedio duran 1109.5 horas de vida útil.
Frecuencia relativa hi; se refiere al porcentaje en cuanto a la cantidad de lamparas en cada
intervalo un ejemplo de esto que el valor selecionado de color rojo es 0.1724 que el 17.24
de las lamparas totales corresponden a 25 lamparas que tienen una vida útil de 851.5 horas
de vida en promedio.
Frecuencia absoluta acumulada Ni; Hace referencia al numero de lamparas acumuladas
hasta un intervalo dado ejemplo en nuestro caso dado el valor de color verde es 14 esto quiere
decir que 14 lámparas tiene una duración o vida útil por debajo de 787 horas de vida
Frecuencia relativa acumulada Hi;se refiere al porcentaje acumulado de la cantidad de
lámparas hasta cierto intervalo dado por ejemplo 0.8893 este valor corresponde a que el 88.93
porciento corresponde a 129 lámparas que tienen una vida útil por debajo de 1303 horas, esto
tomando el intervalo mayor de esa fila para que sea interpretado correctamente.
TABLA MAYOR Y MENOR QUE
Límites
< QUE
>QUE
529
0
0
145 1
658
5
0.0344 140 0.9655
787
14
0.0964 131 0.9034
916
39
0.2688 106 0.7310
1045
76
0.5239 69
0.4759
1174
111 0.7652 34
0.2345
1303
129 0.8893 16
0.1103
1432
139 0.9582 6
0.0413
1561
142 0.9788 3
0.0207
1690
145 1
0
0
Media aritmética ese el promedio de mas común de todos los datos.
𝑛𝑖𝑦𝑖
𝑛
(5∗593.3)+(9∗722.5)+(25∗851.5)+(37∗980.5)…+(10∗1367.5)+(3∗1496.5)+(3∗1625.5)
=
145
=1042.7758
Análisis: Esto significa que de una muestra de 145 de 417 datos el promedio es de 1042.77
es decir que 145 lamparas incandescentes en promedio tiene una vida útil de 1042.7758
horas de vida en promedio.
MEDIANA
Es el único valor de un conjunto de datos que representa el elemento central y lo divide en
dospartes iguales. es justo el valor central, es decir, el que se encuentra en la mitad de la
lista. Para datos agrupados la mediana se calcula por interpolación.
26.88%----916
50----X
X=1032.9141
52.39----1045
Me= 1032.9141
Análisis: esto hace referencia a que el dato central es de 1032.9141 horas es decir 1032.91
es dato intermedio de duración en horas de 145 lamparas
Moda: En estadística, la moda es el valor que aparece con mayor frecuencia en un conjunto
de datos. para datos agrupados se utiliza la siguiente formula.
Moda :Lm+(Δ1/
Δ1+ Δ2)*A
Donde Lm :limite inferior de clase modal=916
Δ1=12
Δ2=2
MODA
Mo= 918 + (12/12+2)129 = 1026.57
Análisis: esto hace referencia a que 1026.57 es con frecuencia la duración de vida de las
145 lamparas tomadas como muestra es decir con frecuencia podemos encontrar lamparas
con vida útil de 1026.57 horas de vida
Cuartiles: Dividen el conjunto de datos en 4 partes iguales
CUANTILES Q3= 1101.374
52.39%
=====> 980.5
75%
=====> Q3
76.52% =====> 1109.5
Q1= 837.433
9.64%
=====> 722.5
25%
=====> Q1
26.88% =====> 851.5
Desarrollado por interpolación
Q2= 968.414
26.88%
=====> 851.5
50%
=====> Q2
52.39% =====> 980.5
Desarrollado por interpolación
DECILES :dividen el conjunto de datos en 10 partes iguales
D1= 725.194
9.64%
=====> 722.5
10%
=====> D10
26.88% =====> 851.5
Desarrollado por interpolación
D2= 800.02
9.64%
=====> 722.5
20%
=====> D20
26.88% =====> 851.5
Desarrollado por interpolación
D3=867.277
26.88%
=====> 851.5
30%
=====> D30
52.39% =====> 980.5
Desarrollado por interpolación
D4= 917.845
26.88%
=====> 851.5
40%
=====> D40
52.39% =====> 980.5
Desarrollado por interpolación
D5= 968.414
26.88%
=====> 851.5
50%
=====> D50
52.39% =====> 980.5
Desarrollado por interpolación
D6= 1021.183
52.39% =====> 980.5
60%
=====> D60
76.52% =====> 1109.5
Desarrollado por interpolación
D7= 1074.643
52.39% =====> 980.5
70%
=====> D70
76.52% =====> 1109.5
Desarrollado por interpolación
D8= 1145.674
76.52% =====> 1109.5
80%
=====> D80
88.93% =====> 1238.5
Desarrollado por interpolación
D9= 1258.533
88.93% =====> 1238.5
70%
=====> D90
95.82% =====> 1367.5
Desarrollado por interpolación
PERCENTILES: dividen el conjunto de datos en 100 partes iguales
P1= 1.453
0% =====> 0
1%
=====> P1
3.44% =====>5
P2=2.907
0% =====> 0
2%
=====> P2
3.44% =====>5
P3=4.360
0% =====> 0
3% =====> P3
3.44% =====>5
P4=5.8129
3.44% =====> 5
4%
=====> P4
9.64% =====> 14
P5=7.265
3.44% =====> 5
5%
=====> P5
9.64% =====> 14
P6=8.716
3.44% =====> 5
6%
=====> P6
9.64% =====> 14
P7=10.168
3.44% =====> 5
7%
=====> P7
9.64% =====> 14
P8=11.619
3.44% =====> 5
8%
=====> P8
9.64% =====> 14
P9=13.071
3.44% =====> 5
9%
=====> P9
9.64% =====> 14
P10=14.522
9.64%
=====> 14
10%
=====> P10
26.88% =====> 39
P11=15.972
9.64%
=====> 14
11%
=====> P11
26.88% =====> 39
P12= 17.422
9.64%
=====> 14
12%
=====> P12
26.88% =====> 39
P13=18.872
9.64%
=====> 14
13%
=====> P13
26.88% =====> 39
P14=20.323
9.64%
=====> 14
14%
26.88%
=====> P14
=====> 39
P15=21.773
9.64%
=====> 14
15%
=====> P15
26.88% =====> 39
P16=23.223
9.64%
=====> 14
16%
=====> P16
26.88% =====> 39
P17=24.673
9.64%
=====> 14
17%
=====> P17
26.88% =====> 39
P18=26.123
9.64%
=====> 14
18%
=====> P18
26.88% =====> 39
P19=27.573
9.64%
=====> 14
19%
=====> P19
26.88% =====> 39
P20=29.023
9.64%
=====> 14
20%
=====> P20
26.88% =====> 39
P21=30.473
9.64%
=====> 14
21%
=====> P21
26.88% =====> 39
P22=31.923
9.64%
=====> 14
22%
=====> P22
26.88% =====> 39
P23=33.374
9.64%
=====> 14
23%
=====> P23
26.88% =====> 39
P24=34.824
9.64%
=====> 14
24%
26.88%
=====> P24
=====> 39
P25=36.274
9.64%
=====> 14
25%
=====> P25
26.88% =====> 39
P26=37.724
9.64%
=====> 14
26%
=====> P26
26.88% =====> 39
P27=39.174
26.88%
=====> 39
27%
=====> P27
52.39% =====> 76
P28=40.624
26.88%
=====> 39
28%
=====> P28
52.39% =====> 76
P29=42.075
26.88%
=====> 39
29%
=====> P29
52.39% =====> 76
P30=43.525
26.88%
=====> 39
30%
=====> P30
52.39% =====> 76
P31=44.976
26.88%
=====> 39
31%
=====> P31
52.39% =====> 76
P32=46.426
26.88%
=====> 39
32%
=====> P32
52.39% =====> 76
P33=47.877
26.88%
=====> 39
33%
=====> P33
52.39% =====> 76
P34=49.327
26.88%
34%
52.39%
=====> 39
=====> P34
=====> 76
P35=50.777
26.88%
=====> 39
35%
=====> P35
52.39% =====> 76
P36=52.227
26.88%
=====> 39
46%
=====> P36
52.39% =====> 76
P37=53.678
26.88%
=====> 39
37%
=====> P37
52.39% =====> 76
P38=55.129
26.88%
=====> 39
38%
=====> P38
52.39% =====> 76
P39=56.579
26.88%
=====> 39
39%
=====> P39
52.39% =====> 76
P40=58.029
26.88%
=====> 39
40%
=====> P40
52.39% =====> 76
RANGO INTERCUARTIL
RIQ=Q3-Q1= 1101.374 - 837.433 = 263.941
Este valor representa el 50% de los datos central es 263.941
Diagrama de cajas y bigotes
Ofrece una representación visual del conjunto de datos basada en el resumen de cinco valores.
También se puede definir como una representación visual que representa varias
características como el valor mínimo, el valor máximo, los cuartiles 1 y 3 y la media
aritmética de un determinado grupo de datos y representa características como la dispersión
y simetría.
Xmax
Q3
me
Q1
Xmin
Interpretación:
Max: Este indica el valor máximo de la muestra tomada en este caso es de 1625.5 es el
máximo de duración de una lampara incandescente en horas.
Q3=El 75% de duración o vida de una lampara en horas esta por debajo de 1109.5 horas de
vida, el 75% de los datos están por debajo de este valor.
Me: Indica que el valor central o intermedio es de 980.5 horas de vida de 145 lámparas en
total.
Q1: Indica que el 25% de las horas útiles de las lámparas está por debajo de 851.5 horas de
vida de las lamparas
Xmin: El valor mínimo es de 593.5 es decir la duración mínima de una lampara en horas es
de 593.5 horas esto tomando una muestra de 25145datos aleatorios.
=Esto significa que de una muestra de 145 de 417 datos el promedio es de 1042.77 es decir
que 145 lamparas incandescentes en promedio tiene una vida útil de 1042.7758 horas de vida
en promedio.
Varianza: Es una medida que expresa el grado de desviación de las observaciones con
respecto a su media.
ni
En nuestro ejemplo tenemos que:
5 ∗ (593.5 − 1042.77)2 +(9)(722.5 − 1042.7)2 + (25)(851.5 − 1042.7)2 + +(10)(1303 − 1042.7)2 + (3)(1496.5 − 1042.7)2 + (3)(1625.5 − 1042.7)2
144
=45324.40
Desviación estándar: Una medida estadística de la expansión de los valores desde su valor
medio, calculado como la raíz cuadrada de la suma de las desviaciones cuadradas del valor
medio, dividido por el número de elementos menos uno. Recuerda que la desviación
estándar es la raíz cuadrada positiva de la varianza.
yi
*ni
En nuestro caso seria
En nuestro caso tenemos que la desviación estándar es de S=
5 ∗ (593.5 − 1042.77)2 +(9)(722.5 − 1042.7)2 + (25)(851.5 − 1042.7)2 + +(10)(1303 − 1042.7)2 + (3)(1496.5 − 1042.7)2 + (3)(1625.5 − 1042.7)2
144
=212.8953
Esto hace referencia que hay una desviación estándar de 212.89 con respecto a la media
aritmética en horas de duración de una lampara.
Medidas de asimetría y apuntamiento
Analizando la siguiente grafica podemos observar que el tipo de curva en la gráfica es
asimétrica positiva porque la media aritmética es mayor que la mediana además según el
coeficiente de Fisher la asimetría es positiva porque es mayor que 0 esta es de 0.3064 es
decir los datos están mas distribuidos hacia la derecha.
Coeficiente de asimetría de Fisher En estadística, el coeficiente de asimetría de
Fisher es un coeficiente que sirve para determinar la asimetría de una distribución. Es
decir, el coeficiente de asimetría de Fisher permite saber si una distribución de probabilidad
es asimétrica positiva, asimétrica negativa o simétrica.
𝐶𝐴F
=
(593.5 − 1042.7)3 +(722.5 − 1042.7)3 + (851.5 − 1042.7)3 + ⋯ . +(1367.5 − 1042.7)3 + (1496.5 − 1042.7)3 + (1625.7 − 1042.7)3
30859,05
COf=0.30641871
Análisis Asimetría positiva es decir los datos están mas distribuidos hacia la derecha
Curtosis
Esta mide cuanto esta escarpada o achatada una curva o distribución
(593.5 − 1042.7)3 +(722.5 − 1042.7)3 + (851.5 − 1042.7)3 +. . +(1367.5 − 1042.7)3 + (1496.5 − 1042.7)3 + (1625.7 − 1042.7)3
−3
145 ∗ ((212.8))4
K=0.1684
curtosis
0,002
0,0018
0,0016
0,0014
0,0012
0,001
0,0008
0,0006
0,0004
0,0002
0
0
200
400
600
800
1000
1200
1400
1600
1800
Analisis: el grado de achatamiento de la curva es de 0.1684 es decir tiene una curtosis
leptocúrtica porque esta curtosis es mayor que 0
Download