Uploaded by paulbovalente

TD6 reglin

advertisement
Exercices sur les régressions linéaires
Exercice 1
Montrer que dans la cas d’une régression bivariée, la minimisation du carré des résidus
donne les coefficients suivants pour l’équation de la droite de régression :
n
P
b
a=
(Xi − X)(Yi − Y )
i=1
n
P
,
(Xi − X)2
bb = y − b
ax
i=1
Quelle est la signification des coefficients b
a et bb ?
Que pourra-t-on dire de la droite de régression linéaire si les points du nuage sont très
dispersés autour de la droite ?
Exercice 2
On reprend les données de l’exercice 4 sur les tests d’hypothèses. Vous vous intéressez
toujours au lien entre le rendement d’un certain actif financier A et le rendement du
portefeuille de marché M. On vous montre le tableau suivant regroupant les taux de
rendement mensuels de l’actif A et du portefeuille de marché l’année dernière. Donnez
l’équation de la droite de régression de R(A) sur R(M) et expliquez ce que cela signifie.
Mois
1
2
3
4
5
6
R(A)
0.0952
0.0195
-0.0033
0.0677
-0.0113
-0.0418
R(M)
0.0587
0.0278
0.0053
0.0359
-0.0079
-0.0743
Mois
7
8
9
10
11
12
R(A)
0.0459
0.0449
0.0271
0.0400
-0.0122
-0.0495
R(M)
0.0291
0.0451
0.0308
0.0474
0.0300
0.0327
Exercice 3
Les notes obtenues par 12 étudiants lors de 2 examens sont rapportés dans le tableau
ci-dessous.
Examen 1
Examen 2
3
8
4
9
4
19
6
10
7
13
9
15
10
14
9
13
11
16
12
13
13
19
15
6
1. Représentez le nuage de point avec les notes obtenues à l’examen 1 en abscisse et les
notes obtenues à l’examen 2 en ordonnée. Donnez l’équation de la droite de régression
1
permettant d’expliquer la note du 2ème examen en fonction de la note du 1er examen.
Calculez le R2 .
2. Quels sont les 2 étudiants qui semblent se distinguer des autres ? Retirez-les de l’échantillon et donnez à nouveau l’équation de la doite de régression et le R2 avec les 10 observations restantes. Commentez.
Exercice 4
Une société de livraison essaie de comprendre ce qui détermine le temps de travail de ses
livreurs. La première hypothèse de son directeur est que la durée de travail d’un livreur
dépend du nombre de kilomètres parcourus. Il effectue donc une régression linéaire bivariée
de la durée de travail (y) sur le nombre de km parcourus (x1 ). Le logiciel de statistiques
lui renvoie l’équation estimée suivante : ŷ = 1.36 + 0.0595x1 avec une p-value égale à 0.003
pour le coefficient de x1 . Le R2 ajusté est égal à 0.53.
1. Que pouvez-vous dire de la relation entre le nombre de kilomètres effectués et la durée
de travail ? Interprétez le R2
Le directeur a l’idée d’ajouter une variable explicative à son modèle : le nombre de livraisons effectué (noté x2 ). Le logiciel de statistiques renvoie l’équation estimée suivante :
ŷ = 0.67 + 0.0482x1 + 1.2x2 avec des p-values égales respectivement à 0.001 et 0.004 pour
x1 et x2 . Le R2 ajusté est égal à 0.83.
2. Interprétez ces résultats.
Exercice 5
On s’intéresse aux déterminants du salaire dans un pays fictif. Une statisticienne vous
fournit les résultats de deux régressions linéaires. La variable expliquée est le salaire mensuel net. Les variables explicatives sont le nombre d’années d’étude requis pour occuper le
poste (NivEtRequis), une variable indiquant le sexe du ou de la salari(e) (Femme=1 s’il
s’agit d’une femme, =0 s’il s’agit d’un homme) et, dans la deuxième régression, le terme
d’intéraction entre ces deux variables. Les p-values des coefficients sont entre parenthèses.
(1) Ŝ = 1453 + 86(< 0.01)NivEtRequis − 123(< 0.01)Femme
(2) Ŝ = 1461+67(< 0.01)NivEtRequis−98(< 0.01)Femme−24(< 0.01)NivEtRequis×
Femme
Interprétez ces résultats (hors constantes).
2
Download