Uploaded by fmhfevnbszufnaornm

(5) bondad del ajuste (1)

advertisement
Bondad del ajuste: R2 o coef. de determinación
Queremos evaluar como se ajusta la regresión estimada a la muestra de datos de
Y.
Para analizar la bondad del ajuste, descomponemos el valor observado en el
valor ajustado y el residuo.
ˆ
ˆ
ei  Yi  Yi
 Yi  Yi  ei
Descomponemos la varianza de Y:
Var (Yi )  Var(Yˆi  ei )  Var(Yˆi )  Var( ei )  2Cov(Yˆi, ei )
 Var(Yˆi )  Var( ei )
1
1
1
(Yi  Y i )2   (Yˆi  Yˆi )2   (ei  e i )2

n
n
n
 (Y  Y )   (Yˆ  Y )   e
i
i
2
i
i
2
i
2
Bondad del ajuste: R2 o coef. de determinación
 (Y  Y )   (Yˆ  Y )   e
i
2
i
i
i
2
También se puede escribir como:
i
2
Por tanto, la variación total de los valores
observados puede ser dividida en dos partes,
una atribuible a la recta de regresión y otra a la
perturbación aleatoria.
n
n
n
i 1
i 1
i 1
2
2
2
ˆ
ˆ
(
Y

Y
i
)

(
Y

Y
i
)

(
Y

Y
)
 i
 i
 i i
Donde
n
 1
 ei2
 (Yi  Y )2
2 = SCT (suma de cuadrados totales): Variación total de los
(
Y

Y
i
)
 i
valores reales respecto a su media muestral.
i 1
n
 (Yˆ  Y )
i 1
n
i
i
2
 (Y  Yˆ )
i
i1
i
2
= SCR (suma de cuadrados explicada (o de regresión):
Variación de los valores estimados alrededor de su media.
= SCE (suma de cuadrados de los errores): Variación residual
o no explicada, es decir la suma de los residuos al cuadrado.
Bondad del ajuste: R2 o coef. de determinación
n
n
n
2
ˆ
ˆ
(
Y

Y
i
)

(
Y

Y
i
)

(
Y

Y
)
 i
 i
 i i
2
2
i 1
i 1
i 1
Si se divide todo por la SCT nos da:
n
 (Y  Y )
i 1
n
i
i 1
1
n
i
 (Y  Y )
i
2
i
2

 (Yˆ  Y )
i 1
n
n
2
i 1
n
2
 (Yˆi  Y i )
 (Y  Y )
i 1
i
i
2

 (Y  Yˆ )
i
i 1
n
i
i 1
n
2
i 1
n
2
 (Yi  Yˆi )
 (Y  Y )
i 1
i
i
2
i
 (Y  Y )
i
i

n
i
i
 (Y  Y )
i 1
2
2
i
O de otro modo
SCR SCE
1

SCT SCT
Bondad del ajuste: R2 o coef. de determinación
El coeficiente de determinación, R2, es una medida basada en el porcentaje
de variación de la variable dependiente que es explicada por la regresión.
Recoge el porcentaje de variaciones de la variable dependiente que viene
explicado por variaciones en las variables explicativas.
SCR
SCE
R 
 1
SCT
SCT
2
Que también se puede escribir como
n
R2 
 (Yˆi  Y i)2
i 1
n
 (Yi  Y i)
i 1
2
n
 1
 ei
2
i 1
n
2
(
Y

Y
i
)
 i
i 1
Bondad del ajuste: R2 o coef. de determinación
El coeficiente de determinación, R2, es una medida de la bondad de la
regresión que está acotada entre cero y uno:
0  R2  1
SCR
R 
 1  SCR  SCT
SCT
2
SCE
R  1
 0  SCE  SCT
SCT
2
Ajuste perfecto. Todas las variaciones
del regresando (v. dependiente) vienen
explicadas por el modelo.
Ajuste pésimo. Todas las variaciones del
regresando (v. dependiente) vienen
explicadas por los residuos.
Bondad del ajuste: R2 o coef. de determinación
Ventajas: (1) Es una medida invariante ante cambios de escala (lo cuál nos
permite comparar la bondad del ajuste de varios modelos aún cuando las
variables estén expresadas en unidades diferentes). (2) Está acotado inferior y
superiormente (siempre que exista ordenada en el origen).
Desventaja: A mayor número de variables explicativas mayor coeficiente de
determinación, independientemente de si la variable es relevante o no.
Solución: Utilizar el R2 ajustado
R2 ajustado
Este coeficiente penaliza la incorporación de variables no relevantes. De ahí
que si queremos comparar dos modelos con la misma variable explicada y
distinto número de variables explicativas en una misma muestra, utilicemos
el coeficiente de determinación ajustado o corregido.
SCE / T  K  1
R ajustado  1 
SCT / T  1
2
Download