Uploaded by Nils Van Roy

econometrie-exam-2021

advertisement
lOMoARcPSD|9802779
Econometrie-exam-2021
Econometrie (Vrije Universiteit Brussel)
Scan to open on Studocu
Studocu is not sponsored or endorsed by any college or university
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
Econometrie exam 2021
De gemiddelde impact op het loon is gemiddeld genomen ceteris paribus 45,06 dollarcent
per uur wanneer iemand 1 extra jaar gaat studeren is.
Het gemiddelde van de gescha琀琀e storingstermen is gelijk aan 0, dit is een numerieke
eigenschap van de scha琀琀er OLS. Dit leert ons niets over de sta琀椀s琀椀sche eigenschappen van de
gebruikte scha琀琀er.
𝛽3=51,013 en 𝛽4=-1,343 Dit zijn de co攃ࠀffici攃ࠀnten voor ervaring.
De co攃ࠀ昀케ci攃ࠀnt van ervaring kwadraat is nega琀椀ef, dit zorgt ervoor dat een bergparabool
gevormd wordt. Ervaring zal dus gemiddeld genomen ceteris paribus een posi琀椀eve invloed
hebben op het uurloon tot een moment wanneer de impact 0 zal zijn en terug zal dalen.
Bepaling keerpunt:
Om het keerpunt (de top van de parabool) te bepalen gaan we de vergelijking par琀椀eel
a昀氀eiden naar ervaring:
𝛿𝑙𝑜𝑜𝑛/𝛿𝐸=𝛽3+2 𝑥 𝛽4 𝑥 𝐸𝛿loon/𝛿E=𝛽3+2 x 𝛽4 x E
∆𝑙𝑜𝑜𝑛/∆𝐸=51,013 − 2,686𝐸∆loon/∆E=51,013 − 2,686E
We bepalen nu de top van de parabool, dit doen we door de horizontale raaklijn van de
vergelijking te bepalen.
𝐸=51,0132,686=18,99≈19E=51,0132,686=18,99≈19
Na 19 jaar ervaring zal de impact op het uurloon gemiddeld genomen ceteris paribus dalen.
Conclusie: de impact van ervaring op het uurloon hangt af van het niveau van ervaring.
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
We verwachten dat wanneer een persoon niet-blank is deze minder zal verdienen, dus dat de
𝛼1 negatief is, dit zetten we in de alternatieve hypothese.
Hypothese: H0: 𝛼1≥0 ; Ha: 𝛼1<0
T-test: t = (𝛼1 ^- 𝛼1 *)/σ = -95,988-0/10,594 = -9,06
De t-test is significant kleiner dan -1,64 dus zullen we de nul hypothese verwerpen en
aannemen dat de impact. van het ras op het loon significant is.
Determinanten varian琀椀e:
posi琀椀ef, beïnvloedt de varian琀椀e op een posi琀椀eve manier
VIF:
Groo琀琀e steekproef N=3010 posi琀椀ef -> beïnvloedt de varian琀椀e op een nega琀椀eve manier
Standaardafwijking van de storingstermen: Kennen we niet maar kunnen het wel scha琀琀en ->
224,9^2 = posi琀椀ef -> beïnvloedt de varian琀椀e op een posi琀椀eve manier
Varian琀椀e van de verklarende variabele = varian琀椀e van de variabele uit onze dataset
genomen: = 17.15344 = posi琀椀ef -> beïnvloedt de varian琀椀e op een nega琀椀eve manier
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
De verklaringskracht gee昀琀 ons de mate weer waarin de varian琀椀e van de a昀栀ankelijke
variabele (loon) verklaard wordt door de varian琀椀e van de ona昀栀ankelijke variabelen. In de
regressie-output, wordt er een R^2 = 0.27 gegeven. D.w.z. dat 27% van de varian琀椀e in het
loon wordt verklaard door de varian琀椀e in de variabelenn. Dit is posi琀椀ef, maar het is een
rela琀椀ef lage verklaringskracht.
Om te testen of de verklaringskracht signi昀椀cant verschillend van nul is, kunnen we een
algemene F-test uitvoeren:
De kri琀椀sche F-waarde van ons model levert ons de volgende op:
Hypothese: H0: R^2 = 0 , Ha: R^2 =/=0
F-stat = 185,1 (dit komt uit onze regressieoutput)
P-waarde < 2,2 e-16 (uit de regressieoutput)
We verwerpen de nulhypothese omdat de F-stat signi昀椀cant verschillend is
van de kritische F- waarde en de p-waarde nadert naar nul en dus
signi昀椀cant kleinder is dan het signi昀椀cantieniveau van 5%. Dus 27% van de
variante in het loon wordt inderdaad verklaard door de variantie in de
variabelen.
De opname van E^2 zorgt niet voor perfecte mul琀椀collineariteit want perfecte
mul琀椀collinearteit is wanneer er een exacte lineare rela琀椀e bestaat tussen verklarende
variabelen. In ons geval hebben we wel een graad van mul琀椀collineariteit doordat ervaring
kwadraat kwadra琀椀sch bepaald wordt door ervaring.
We hebben een VIF = 1/1-R^2 = 1/1-0.9357 = 15.55
D.w.z. dat de varian琀椀e van de scha琀琀er met 15 wordt opgeblazen dit leidt tot grotere
betrouwbaarheids intervallen en lagere t waarden
De varian琀椀e van ervaring kwadraat komt uit op 0.0365
Sinds we een steekproefgroo琀琀e hebben van 3010 en mul琀椀collineariteit een
steekproefprobleem is kunnen we stellen dat de mul琀椀collineariteit in ons model niet
problema琀椀sch is.
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
De veronderstelling is niet voldaan en we stellen heteroscedas琀椀citeit vast.
We gebruiken de White’s general heteroscedas琀椀city test, dit is een formele test.
De test is niet zuiver voor kleinere steekproeven maar wel consistent, namelijk het is een
asympto琀椀sche test waar we normaal verdeeld zijn indien we naar oneindig gaan.
Daarnaast veronderstellen we een algemeen heteroscedas琀椀citeitspatroon van sigma i
hoedje ^2 en dus geen posi琀椀eve rela琀椀e met 1 van de verklarende variabelen zoals bij de
Goldfeld Quandt test, we gaan dus ook niet de middelste observa琀椀es uit ons model halen.
We bekomen na de test een white sta琀椀s琀椀ek van (white sta琀椀s琀椀c : N x R^2) 3010 x 0.04235 =
127,4>15.5 (kri琀椀sche chikwadraat waarde (qchisq(0.95,8))) dus we verwerpen H0 en stellen
heteroscedas琀椀citeit vast
De white’s general heteroscedas琀椀city test is het meest adequaat omdat deze niet enkel een
posi琀椀eve rela琀椀e onderzoekt zoals bij de goldfeld quandt test maar hij onderzoekt een
algemeen heteroscedas琀椀citeit patroon. De goldfeld quandt test laat ook de middelste
observa琀椀es weg waardoor we een vertekend beeld krijgen, dit doet de white’s general
heteroscedas琀椀city test niet.
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
Bij aanwezigheid van heteroscedas琀椀citeit in het model, is de OLS scha琀琀er is vertekend en
inconsistent.
De implica琀椀es voor hypothesetesten zijn dat we de t-test niet meer kunnen uitvoeren omdat
de scha琀琀er inconsistent is. We remedi攃ࠀren dit door de White’s heteroscedas琀椀city consisten
variance toe te passen, hiermee maken we de varian琀椀e van de regressie resisten tegen
heteroscedas琀椀citeit.
Coe昀琀est
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
Als er correla琀椀e is tussen de storingstermen en verklarend variabel wil dit zeggen dat we een
endogeniteitsprobleem hebben. Dit is het gevolg van een afwijking van de veronderstelling.
De implica琀椀es voor de sta琀椀s琀椀sche eigenschappen van de OLS scha琀琀er zijn:
De OLS scha琀琀er is vertekend en inconsistent want er is een terugkoppelend e昀昀ect tussen de
a昀栀ankelijke en de ona昀栀ankelijke variabelen.
We kunnen er van uitgaan dat al onze dummy variabelen exogeen zijn omdat deze 0 of 1 zijn
en zullen niet beïnvloed worden door een hoger loon.
We leiden wel een endogeniteitsprobleem af bij:
Langere scholing kan ervoor zorgen dat je minder ervaring hebt en dus is Si endogeen. Er zal
dus correla琀椀e zijn tussen scholing en de storingstermen
Ervaring kan impliceren dat je al dan niet langer geschoold bent geweest en dus is Ei
endogeen. Ervaring zal dan ook gecorreleerd zijn met de storingstermen.
Wij gebruiken 2SLS om het endogeniteitsprobleem op te lossen. We gaan eerst het exogeen
deel van de endogene x variabele zo goed mogelijk scha琀琀en, we zoeken een proxy voor X en
deze proxy moet gecorreleerd zijn met X en niet gecorreleerd met de storingstermen.
Daarna gaan we de endogene x variabele vervangen door het geschat exogeen deel (de
proxy). Vervolgens gaan we X regresseren op een set instrument variabelen (dit zijn de
variabelen die een impact hebben op X maar niet gecorreleerd zijn met de storingstermen =
instrument variabelen) en halen onze proxy hieruit. Nu we onze proxy hebben kunnen we
opnieuw OLS toepassen en is het endogeniteits probleem opgelost.
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
-Consisten琀椀e: Een scha琀琀er is consistent wanneer de scha琀琀er oneindig keer wordt uitgevoerd
de gemiddelde waarde van de co攃ࠀ昀케cienten tenderen naar de werkelijke waarden van de
popula琀椀e.
-Zuiverheid: De scha琀琀er is zuiver indien zijn verwach琀椀ngswaarde (E(co攃ࠀ昀케ci攃ࠀnt)) gelijk is aan
de werkelijke popula琀椀e co攃ࠀ昀케ci攃ࠀnt.
-E昀케cien琀椀e: De scha琀琀er is e昀케ci攃ࠀnt indien een scha琀琀er binnen de klasse van de zuivere
scha琀琀ers de laagste varian琀椀e hee昀琀.
Wanneer de storingstermen niet normaal verdeeld zijn kunnen we nog al琀椀jd de t en f testen
uitvoeren op voorwaarde dat we de asympto琀椀sche theorie toepassen en de centrale
limietstelling toepassen zodat we stellen dat de scha琀琀ers asympto琀椀sch normaal verdeeld
zijn, namelijk dat de scha琀琀er consistent is.
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
lOMoARcPSD|9802779
Dit is een speci昀椀ac琀椀e fout. Hieruit volgt dat de OLS scha琀琀er vertekend en inconsistent is.
De weggelaten variabele zit volledig in de storingsterm. De gescha琀琀e co攃ࠀ昀케cienten op de
overblijvende variabelen zijn mogelijks ook vertekend en inconsistent.
Autocorrela琀椀e -> niet te kennen
Downloaded by Nils Van Roy (nils.v.roy@gmail.com)
Download