Uploaded by Valeria Guzman

REGRESION LINEAL

advertisement
UNIVERSIDAD MICHOACANA DE SAN NICOLAS DE HIDALGO
FACULTAD DE CONTADURIA Y CIENCIAS ADMINISTRATIVAS
Análisis cuantitativos
Karla Valeria Guzmán Pérez
Turno Matutino, 12va generación.
Curso parcial de la Maestría en Administración para Titulación
Problemas de Regresión lineal
Dr. Pedro Chávez Lugo
Querétaro, a Lunes, 22 de Agosto de 2022.
INTRODUCCIÓN
Este trabajo pretende explicar cómo mediante el método de mínimos cuadrados, se
quiere explicar la relación entre la variable independiente (para que el análisis sea
de regresión lineal simple) o más variables independientes (para que el análisis sea
de regresión múltiple) con una dependiente para poder tomar decisiones o predecir
situaciones que nos beneficiarían o afectarían al analizarlas. A este análisis se le
llama de regresión y se obtiene mediante la siguiente ecuación:
𝐸 (π‘₯ ) = 𝛽0 + 𝛽1 π‘₯
La relación se debe dar entre E(x) que es la media o valor que se espera analizar
de y para con el valor x. βº es la intersección con el eje de las y, β¹ es la pendiente,
que es la razón de análisis y comportamiento de la variable dependiente para con
la variable independiente.
Para no tomar toda una población y tardar para sacar estos datos, obtenemos de
forma muestral la población y entonces esta ecuación de regresión se hace
estimada, para decir que estos datos son muestrales los valores estadísticos de la
ecuación anterior cambian a:
Ε· = 𝑏0 + 𝑏1 π‘₯
Entonces ya teniendo los datos muestrales ahora si podemos implementar el
método de cuadrados mínimos para representar la ecuación lineal f(x) que sigue:
𝑏1 =
∑(π‘₯𝑖 −π‘₯)(𝑦𝑖 −𝑦)
∑(π‘₯𝑖 −π‘₯)2
𝑏0 = 𝑦 − 𝑏1 · π‘₯
Problema 4
Los datos siguientes son estaturas y pesos de nadadoras.
Estatura
(Pulg)
Peso (Lb)
68
64
62
65
66
132
108
102
115
128
a. Trace el diagrama de dispersión de estos datos usando la estatura como
variable independiente.
Relacion entre la estaura y peso de las nadadoras
140
120
100
80
60
40
20
0
61
62
63
64
65
66
67
68
69
b. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación
entre las dos variables?
R= Nos indica que tiene una regresión lineal positiva en cuanto mas peso
tienen las nadadoras miden más, una relación biológica normal en los seres
humanos.
c. Trate de aproximar la relación entre estatura y peso trazando una línea recta
a través de los puntos de los datos.
Relacion entre la estaura y peso de las nadadoras
150
100
50
y = 5,5x - 240,5
R² = 0,9223
0
61
62
63
64
65
66
67
68
69
d. Obtenga la ecuación de regresión estimada calculando b0 y b1.
x
y
π’™π’Š − 𝒙
π’šπ’Š − π’š
(π’™π’Š − 𝒙)(π’šπ’Š − π’š)
(π’™π’Š − 𝒙)𝟐
68
64
62
65
66
132
108
102
115
128
3
-1
-3
0
1
15
-9
-15
-2
11
45
9
45
0
11
9
1
9
0
1
65
117
110
20
𝑏1 =
∑(π‘₯𝑖 −π‘₯)(𝑦𝑖 −𝑦)
∑(π‘₯𝑖 −π‘₯)2
= 𝑏1 =
110
20
= 5.5
𝑏0 = 𝑦 − 𝑏1 · π‘₯ =
𝑏0 = 117 − (5.5 ∗ 65) = 117 − 357.5 = −240.5
Ε· = 𝑏0 + 𝑏1 π‘₯ = −240.5 + 5.5π‘₯
e. Si la estatura de una nadadora es 63 pulgadas, ¿Cuál será su peso estimado
en Lb?
𝑦 = −240.5 + 5.5π‘₯ = −240.5 + (5.5 ∗ 63) =
𝑦 = −240.5 + 346.5 = 106𝐿𝑏
Problema 5
¿Esperaría que los automóviles más confiables fueran los más caros? Consumer
Reports evaluó 15 de los mejores automóviles sedán. La confiabilidad se evaluó con
una escala de 5 puntos: mala (1), regular (2), buena (3), muy buena (4) y excelente
(5). Los precios y la evaluación sobre la confiabilidad de estos 15 automóviles se
presentan en la tabla siguiente:
(Consumer Reports, febrero de 2004).
Marca y modelo
Confiabilidad
Precio
Acura TL
4
$ 33,150.00
BMW 330 i
3
$ 40,570.00
Lexus IS300
5
$ 35,105.00
Lexus ES330
5
$ 35,174.00
Mercedes-Benz C320
1
$ 42,230.00
Lincoln LS Premium (V6)
3
$ 38,225.00
Audi A4 3.0 Quattro
2
$ 37,605.00
Cadillac CTS
1
$ 37,695.00
Nissan Maxima 3.5 SE
4
$ 34,390.00
Infiniti I35
5
$ 33,845.00
Saab 9-3 Aero
3
$ 36,910.00
Infiniti G35
4
$ 34,695.00
Jaguar X-Type 3.0
1
$ 37,995.00
Saab 9-5 Arc
3
$ 36,995.00
Volvo S60 2.5T
3
$ 33,890.00
a. Trace un diagrama de dispersión con estos datos tomando como variable
independiente las evaluaciones de confiabilidad.
Confiabilidad en autos
$45 000,00
$40 000,00
$35 000,00
$30 000,00
$25 000,00
y = -1301,4x + 40643
R² = 0,4991
$20 000,00
$15 000,00
$10 000,00
$5 000,00
$0
1
2
3
4
5
6
b. Obtenga la ecuación de regresión obtenida por el método de mínimos
cuadrados.
x
y
π’™π’Š − 𝒙
π’šπ’Š − π’š
(π’™π’Š − 𝒙)(π’šπ’Š − π’š)
(π’™π’Š − 𝒙)𝟐
4
3
5
5
1
3
2
1
4
5
3
4
1
3
3
$ 33,150.00
$ 40,570.00
$ 35,105.00
$ 35,174.00
$ 42,230.00
$ 38,225.00
$ 37,605.00
$ 37,695.00
$ 34,390.00
$ 33,845.00
$ 36,910.00
$ 34,695.00
$ 37,995.00
$ 36,995.00
$ 33,890.00
1
0
2
2
-2
0
-1
-2
1
2
0
1
-2
0
0
-3414.9
4005.06667
-1459.93333
-1390.93333
5665.06667
1660.06667
1040.06667
1130.06667
-2174.93333
-2719.93333
345.066667
-1869.93333
1430.1
430.066667
-2674.93333
-2959.60889
-534.008889
-2725.20889
-2596.40889
-12085.4756
-221.342222
-1178.74222
-2410.80889
-1884.94222
-5077.20889
-46.0088889
-1620.60889
-3050.80889
-57.3422222
356.657778
0.75111111
0.01777778
3.48444444
3.48444444
4.55111111
0.01777778
1.28444444
4.55111111
0.75111111
3.48444444
0.01777778
0.75111111
4.55111111
0.01777778
0.01777778
3
$ 36,564.90
-36091.8667
27.7333333
𝑏1 =
∑(π‘₯𝑖 −π‘₯)(𝑦𝑖 −𝑦)
∑(π‘₯𝑖 −π‘₯)2
= 𝑏1 =
−36091.8667
27.73333
= −1301.4
𝑏0 = 𝑦 − 𝑏1 · π‘₯ =
𝑏0 = 36564.90 − (−1301.4 ∗ 3) = 36564.90 −
(−4077.686859)
𝑏0 = 40642.62 ≠ 40643
Ε· = 𝑏0 + 𝑏1 π‘₯ = 40643 − 1301.4π‘₯
c. De acuerdo con este análisis, ¿Cree usted que los automóviles más
confiables sean más caros?
R= No de hecho de acuerdo a este análisis los carros con mayor confiabilidad
son más baratos, presenta un análisis de regresión negativo para con el
precio de los autos, entre más barato más confiable.
d. Estime el precio de un automóvil sedán cuya evaluación de confiabilidad sea
4.
𝑦 = 40643 − 1301.4π‘₯ = 40643 + (−1301.4 ∗ 4) =
𝑦 = 40643 + (−5205.5577) = $ 35,437.06
Problema 6
Un gerente de ventas recolectó los datos siguientes sobre ventas anuales y años
de experiencia.
Vendedor Años de experiencia
1
2
3
4
5
6
7
8
9
10
Ventas anuales
(miles de $)
$
$
$
$
$
$
$
$
$
$
1
3
4
4
6
8
10
10
11
13
80
97
92
102
103
111
119
123
117
136
a) Elabore un diagrama de dispersión con estos datos, en el que la variable
independiente sean los años de experiencia.
Ventas anuales por años de experiencia
$160
$140
$120
$100
$80
y = 4x + 80
R² = 0,9304
$60
$40
$20
$0
2
4
6
8
10
12
14
b) Obtenga la ecuación de regresión estimada que puede emplearse para
predecir las ventas anuales cuando se conocen los años de experiencia.
x
y
1
3
4
4
6
8
10
10
11
13
$
$
$
$
$
$
$
$
$
$
80
97
92
102
103
111
119
123
117
136
7
$
108
𝑏1 =
∑(π‘₯𝑖 −π‘₯)(𝑦𝑖 −𝑦)
∑(π‘₯𝑖 −π‘₯)2
π’™π’Š − 𝒙
π’šπ’Š − π’š
(π’™π’Š
− 𝒙)(π’šπ’Š
− π’š)
-6
-4
-3
-3
-1
1
3
3
4
6
-28.0
-11
-16
-6
-5
3
11
15
9
28
168
44
48
18
5
3
33
45
36
168
36
16
9
9
1
1
9
9
16
36
568
142
= 𝑏1 =
568
142
(π’™π’Š
− 𝒙)𝟐
=4
𝑏0 = 𝑦 − 𝑏1 · π‘₯ =
𝑏0 = 108 − (4 ∗ 7) = 108 − 28 = 80
Ε· = 𝑏0 + 𝑏1 π‘₯ = 80 + 4π‘₯
c) Use la ecuación de regresión estimada para pronosticar las ventas anuales
de un vendedor de 9 años de experiencia.
𝑦 = 80 + 4π‘₯ = 80 + (4 ∗ 9) =
𝑦 = 80 + 36 = 116
CONCLUSIONES
El análisis de los datos dieron como resultado la relación que tienen las variables
independientes con las dependientes unas obvias por ser biológicamente naturales
como las estaturas de las nadadoras, y como la confiabilidad de los carros resulto
ser de regresión negativa pero dando a conocer que entre más barato un automóvil
más confiabilidad tienen y las ventas se dio como conclusión que entre mas
experiencia tienen los vendedores sus ventas son mas altas.
Download