lOMoARcPSD|9802779 Econometrie-exam-2021 Econometrie (Vrije Universiteit Brussel) Scan to open on Studocu Studocu is not sponsored or endorsed by any college or university Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 Econometrie exam 2021 De gemiddelde impact op het loon is gemiddeld genomen ceteris paribus 45,06 dollarcent per uur wanneer iemand 1 extra jaar gaat studeren is. Het gemiddelde van de gescha琀琀e storingstermen is gelijk aan 0, dit is een numerieke eigenschap van de scha琀琀er OLS. Dit leert ons niets over de sta琀椀s琀椀sche eigenschappen van de gebruikte scha琀琀er. 𝛽3=51,013 en 𝛽4=-1,343 Dit zijn de co攃ࠀffici攃ࠀnten voor ervaring. De co攃ࠀ昀케ci攃ࠀnt van ervaring kwadraat is nega琀椀ef, dit zorgt ervoor dat een bergparabool gevormd wordt. Ervaring zal dus gemiddeld genomen ceteris paribus een posi琀椀eve invloed hebben op het uurloon tot een moment wanneer de impact 0 zal zijn en terug zal dalen. Bepaling keerpunt: Om het keerpunt (de top van de parabool) te bepalen gaan we de vergelijking par琀椀eel a昀氀eiden naar ervaring: 𝛿𝑙𝑜𝑜𝑛/𝛿𝐸=𝛽3+2 𝑥 𝛽4 𝑥 𝐸𝛿loon/𝛿E=𝛽3+2 x 𝛽4 x E ∆𝑙𝑜𝑜𝑛/∆𝐸=51,013 − 2,686𝐸∆loon/∆E=51,013 − 2,686E We bepalen nu de top van de parabool, dit doen we door de horizontale raaklijn van de vergelijking te bepalen. 𝐸=51,0132,686=18,99≈19E=51,0132,686=18,99≈19 Na 19 jaar ervaring zal de impact op het uurloon gemiddeld genomen ceteris paribus dalen. Conclusie: de impact van ervaring op het uurloon hangt af van het niveau van ervaring. Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 We verwachten dat wanneer een persoon niet-blank is deze minder zal verdienen, dus dat de 𝛼1 negatief is, dit zetten we in de alternatieve hypothese. Hypothese: H0: 𝛼1≥0 ; Ha: 𝛼1<0 T-test: t = (𝛼1 ^- 𝛼1 *)/σ = -95,988-0/10,594 = -9,06 De t-test is significant kleiner dan -1,64 dus zullen we de nul hypothese verwerpen en aannemen dat de impact. van het ras op het loon significant is. Determinanten varian琀椀e: posi琀椀ef, beïnvloedt de varian琀椀e op een posi琀椀eve manier VIF: Groo琀琀e steekproef N=3010 posi琀椀ef -> beïnvloedt de varian琀椀e op een nega琀椀eve manier Standaardafwijking van de storingstermen: Kennen we niet maar kunnen het wel scha琀琀en -> 224,9^2 = posi琀椀ef -> beïnvloedt de varian琀椀e op een posi琀椀eve manier Varian琀椀e van de verklarende variabele = varian琀椀e van de variabele uit onze dataset genomen: = 17.15344 = posi琀椀ef -> beïnvloedt de varian琀椀e op een nega琀椀eve manier Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 De verklaringskracht gee昀琀 ons de mate weer waarin de varian琀椀e van de a昀栀ankelijke variabele (loon) verklaard wordt door de varian琀椀e van de ona昀栀ankelijke variabelen. In de regressie-output, wordt er een R^2 = 0.27 gegeven. D.w.z. dat 27% van de varian琀椀e in het loon wordt verklaard door de varian琀椀e in de variabelenn. Dit is posi琀椀ef, maar het is een rela琀椀ef lage verklaringskracht. Om te testen of de verklaringskracht signi昀椀cant verschillend van nul is, kunnen we een algemene F-test uitvoeren: De kri琀椀sche F-waarde van ons model levert ons de volgende op: Hypothese: H0: R^2 = 0 , Ha: R^2 =/=0 F-stat = 185,1 (dit komt uit onze regressieoutput) P-waarde < 2,2 e-16 (uit de regressieoutput) We verwerpen de nulhypothese omdat de F-stat signi昀椀cant verschillend is van de kritische F- waarde en de p-waarde nadert naar nul en dus signi昀椀cant kleinder is dan het signi昀椀cantieniveau van 5%. Dus 27% van de variante in het loon wordt inderdaad verklaard door de variantie in de variabelen. De opname van E^2 zorgt niet voor perfecte mul琀椀collineariteit want perfecte mul琀椀collinearteit is wanneer er een exacte lineare rela琀椀e bestaat tussen verklarende variabelen. In ons geval hebben we wel een graad van mul琀椀collineariteit doordat ervaring kwadraat kwadra琀椀sch bepaald wordt door ervaring. We hebben een VIF = 1/1-R^2 = 1/1-0.9357 = 15.55 D.w.z. dat de varian琀椀e van de scha琀琀er met 15 wordt opgeblazen dit leidt tot grotere betrouwbaarheids intervallen en lagere t waarden De varian琀椀e van ervaring kwadraat komt uit op 0.0365 Sinds we een steekproefgroo琀琀e hebben van 3010 en mul琀椀collineariteit een steekproefprobleem is kunnen we stellen dat de mul琀椀collineariteit in ons model niet problema琀椀sch is. Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 De veronderstelling is niet voldaan en we stellen heteroscedas琀椀citeit vast. We gebruiken de White’s general heteroscedas琀椀city test, dit is een formele test. De test is niet zuiver voor kleinere steekproeven maar wel consistent, namelijk het is een asympto琀椀sche test waar we normaal verdeeld zijn indien we naar oneindig gaan. Daarnaast veronderstellen we een algemeen heteroscedas琀椀citeitspatroon van sigma i hoedje ^2 en dus geen posi琀椀eve rela琀椀e met 1 van de verklarende variabelen zoals bij de Goldfeld Quandt test, we gaan dus ook niet de middelste observa琀椀es uit ons model halen. We bekomen na de test een white sta琀椀s琀椀ek van (white sta琀椀s琀椀c : N x R^2) 3010 x 0.04235 = 127,4>15.5 (kri琀椀sche chikwadraat waarde (qchisq(0.95,8))) dus we verwerpen H0 en stellen heteroscedas琀椀citeit vast De white’s general heteroscedas琀椀city test is het meest adequaat omdat deze niet enkel een posi琀椀eve rela琀椀e onderzoekt zoals bij de goldfeld quandt test maar hij onderzoekt een algemeen heteroscedas琀椀citeit patroon. De goldfeld quandt test laat ook de middelste observa琀椀es weg waardoor we een vertekend beeld krijgen, dit doet de white’s general heteroscedas琀椀city test niet. Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 Bij aanwezigheid van heteroscedas琀椀citeit in het model, is de OLS scha琀琀er is vertekend en inconsistent. De implica琀椀es voor hypothesetesten zijn dat we de t-test niet meer kunnen uitvoeren omdat de scha琀琀er inconsistent is. We remedi攃ࠀren dit door de White’s heteroscedas琀椀city consisten variance toe te passen, hiermee maken we de varian琀椀e van de regressie resisten tegen heteroscedas琀椀citeit. Coe昀琀est Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 Als er correla琀椀e is tussen de storingstermen en verklarend variabel wil dit zeggen dat we een endogeniteitsprobleem hebben. Dit is het gevolg van een afwijking van de veronderstelling. De implica琀椀es voor de sta琀椀s琀椀sche eigenschappen van de OLS scha琀琀er zijn: De OLS scha琀琀er is vertekend en inconsistent want er is een terugkoppelend e昀昀ect tussen de a昀栀ankelijke en de ona昀栀ankelijke variabelen. We kunnen er van uitgaan dat al onze dummy variabelen exogeen zijn omdat deze 0 of 1 zijn en zullen niet beïnvloed worden door een hoger loon. We leiden wel een endogeniteitsprobleem af bij: Langere scholing kan ervoor zorgen dat je minder ervaring hebt en dus is Si endogeen. Er zal dus correla琀椀e zijn tussen scholing en de storingstermen Ervaring kan impliceren dat je al dan niet langer geschoold bent geweest en dus is Ei endogeen. Ervaring zal dan ook gecorreleerd zijn met de storingstermen. Wij gebruiken 2SLS om het endogeniteitsprobleem op te lossen. We gaan eerst het exogeen deel van de endogene x variabele zo goed mogelijk scha琀琀en, we zoeken een proxy voor X en deze proxy moet gecorreleerd zijn met X en niet gecorreleerd met de storingstermen. Daarna gaan we de endogene x variabele vervangen door het geschat exogeen deel (de proxy). Vervolgens gaan we X regresseren op een set instrument variabelen (dit zijn de variabelen die een impact hebben op X maar niet gecorreleerd zijn met de storingstermen = instrument variabelen) en halen onze proxy hieruit. Nu we onze proxy hebben kunnen we opnieuw OLS toepassen en is het endogeniteits probleem opgelost. Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 -Consisten琀椀e: Een scha琀琀er is consistent wanneer de scha琀琀er oneindig keer wordt uitgevoerd de gemiddelde waarde van de co攃ࠀ昀케cienten tenderen naar de werkelijke waarden van de popula琀椀e. -Zuiverheid: De scha琀琀er is zuiver indien zijn verwach琀椀ngswaarde (E(co攃ࠀ昀케ci攃ࠀnt)) gelijk is aan de werkelijke popula琀椀e co攃ࠀ昀케ci攃ࠀnt. -E昀케cien琀椀e: De scha琀琀er is e昀케ci攃ࠀnt indien een scha琀琀er binnen de klasse van de zuivere scha琀琀ers de laagste varian琀椀e hee昀琀. Wanneer de storingstermen niet normaal verdeeld zijn kunnen we nog al琀椀jd de t en f testen uitvoeren op voorwaarde dat we de asympto琀椀sche theorie toepassen en de centrale limietstelling toepassen zodat we stellen dat de scha琀琀ers asympto琀椀sch normaal verdeeld zijn, namelijk dat de scha琀琀er consistent is. Downloaded by Nils Van Roy (nils.v.roy@gmail.com) lOMoARcPSD|9802779 Dit is een speci昀椀ac琀椀e fout. Hieruit volgt dat de OLS scha琀琀er vertekend en inconsistent is. De weggelaten variabele zit volledig in de storingsterm. De gescha琀琀e co攃ࠀ昀케cienten op de overblijvende variabelen zijn mogelijks ook vertekend en inconsistent. Autocorrela琀椀e -> niet te kennen Downloaded by Nils Van Roy (nils.v.roy@gmail.com)