Bondad del ajuste: R2 o coef. de determinación Queremos evaluar como se ajusta la regresión estimada a la muestra de datos de Y. Para analizar la bondad del ajuste, descomponemos el valor observado en el valor ajustado y el residuo. ˆ ˆ ei Yi Yi Yi Yi ei Descomponemos la varianza de Y: Var (Yi ) Var(Yˆi ei ) Var(Yˆi ) Var( ei ) 2Cov(Yˆi, ei ) Var(Yˆi ) Var( ei ) 1 1 1 (Yi Y i )2 (Yˆi Yˆi )2 (ei e i )2 n n n (Y Y ) (Yˆ Y ) e i i 2 i i 2 i 2 Bondad del ajuste: R2 o coef. de determinación (Y Y ) (Yˆ Y ) e i 2 i i i 2 También se puede escribir como: i 2 Por tanto, la variación total de los valores observados puede ser dividida en dos partes, una atribuible a la recta de regresión y otra a la perturbación aleatoria. n n n i 1 i 1 i 1 2 2 2 ˆ ˆ ( Y Y i ) ( Y Y i ) ( Y Y ) i i i i Donde n 1 ei2 (Yi Y )2 2 = SCT (suma de cuadrados totales): Variación total de los ( Y Y i ) i valores reales respecto a su media muestral. i 1 n (Yˆ Y ) i 1 n i i 2 (Y Yˆ ) i i1 i 2 = SCR (suma de cuadrados explicada (o de regresión): Variación de los valores estimados alrededor de su media. = SCE (suma de cuadrados de los errores): Variación residual o no explicada, es decir la suma de los residuos al cuadrado. Bondad del ajuste: R2 o coef. de determinación n n n 2 ˆ ˆ ( Y Y i ) ( Y Y i ) ( Y Y ) i i i i 2 2 i 1 i 1 i 1 Si se divide todo por la SCT nos da: n (Y Y ) i 1 n i i 1 1 n i (Y Y ) i 2 i 2 (Yˆ Y ) i 1 n n 2 i 1 n 2 (Yˆi Y i ) (Y Y ) i 1 i i 2 (Y Yˆ ) i i 1 n i i 1 n 2 i 1 n 2 (Yi Yˆi ) (Y Y ) i 1 i i 2 i (Y Y ) i i n i i (Y Y ) i 1 2 2 i O de otro modo SCR SCE 1 SCT SCT Bondad del ajuste: R2 o coef. de determinación El coeficiente de determinación, R2, es una medida basada en el porcentaje de variación de la variable dependiente que es explicada por la regresión. Recoge el porcentaje de variaciones de la variable dependiente que viene explicado por variaciones en las variables explicativas. SCR SCE R 1 SCT SCT 2 Que también se puede escribir como n R2 (Yˆi Y i)2 i 1 n (Yi Y i) i 1 2 n 1 ei 2 i 1 n 2 ( Y Y i ) i i 1 Bondad del ajuste: R2 o coef. de determinación El coeficiente de determinación, R2, es una medida de la bondad de la regresión que está acotada entre cero y uno: 0 R2 1 SCR R 1 SCR SCT SCT 2 SCE R 1 0 SCE SCT SCT 2 Ajuste perfecto. Todas las variaciones del regresando (v. dependiente) vienen explicadas por el modelo. Ajuste pésimo. Todas las variaciones del regresando (v. dependiente) vienen explicadas por los residuos. Bondad del ajuste: R2 o coef. de determinación Ventajas: (1) Es una medida invariante ante cambios de escala (lo cuál nos permite comparar la bondad del ajuste de varios modelos aún cuando las variables estén expresadas en unidades diferentes). (2) Está acotado inferior y superiormente (siempre que exista ordenada en el origen). Desventaja: A mayor número de variables explicativas mayor coeficiente de determinación, independientemente de si la variable es relevante o no. Solución: Utilizar el R2 ajustado R2 ajustado Este coeficiente penaliza la incorporación de variables no relevantes. De ahí que si queremos comparar dos modelos con la misma variable explicada y distinto número de variables explicativas en una misma muestra, utilicemos el coeficiente de determinación ajustado o corregido. SCE / T K 1 R ajustado 1 SCT / T 1 2