Uploaded by Nils Van Roy

joho econometrie h1

advertisement
JoHo Samenvatting: Using Econometrics (6e druk, 2010) – Studenmund
1. ‘Regressie analyses, een overzicht’
Econometrie betekent letterlijk economisch maatsysteem. In minder formele zin betekent
econometrie het kwantitatieve meetsysteem en analyses van een actuele economische en
bedrijfsgerelateerde fenomenen.
Econometrie heeft drie belangrijke toepassingen:
• Het beschrijven van de economische realiteit: econometrie schat de relatie tussen
variabelen, die je in kan vullen in een economische vergelijking. Deze relatie heet ook
wel geschatte regressie coëfficiënt.
• Hypotheses testen: theoretische modellen moeten getest worden voordat ze als
waar/significant beschouwd mogen worden. Alleen als er genoeg bewijs gevonden is
dat de coëfficiënt van een variabele bijna correct is, mag deze meegenomen worden
in het model.
• Prognose: de nauwkeurigheid van een prognose hangt af van de mate waar in het
verleden cijfers in het heden goed heeft voorspelt.
Regressie analyses: kwantitatieve schattingen van economische relaties maken, die een
volledig theoretisch karakter hebben. Om de richting van de verandering van een product te
voorspellen, heb je de kennis van de economische theorie nodig. Om de hoeveelheid van de
verandering van een product te voorspellen, heb je een dataset nodig en een manier
(=regressie analyse) om de relatie te schatten.
In een regressie analyse wordt de verandering in de afhankelijke variabele weergegeven
als een functie van de veranderingen in een set van onafhankelijke variabelen. De
afhankelijke variabele is niet alleen afhankelijk van de onafhankelijke variabelen, er zijn ook
weggelaten variabelen die niet in de dataset staan. De nauwkeurigheid van de regressie
analyse is dus niet volledig, ook al blijkt dit wel uit de testen.
Enkele-vergelijking lineaire modellen: de meest simpele vorm van een lineair
regressiemodel is:
lineair is, kun je de niet-lineaire variabele vervangen door een ander teken om het lineair te
maken, bijvoorbeeld:
Hierboven is gezegd dat de afhankelijke variabele niet alleen bepaald wordt, maar ook door
weggelaten variabelen. Als je deze weggelaten variabelen toevoegt aan het regressiemodel,
blijft er een alsnog een inherente onverklaarbare error over, een stochastische error term
(ε = epsilon).De regressie vergelijking (1.1) ziet er als volgt uit:
Kijk voor het volledige aanbod van samenvattingen op www.joho.org!
JoHo Samenvatting: Using Econometrics (6e druk, 2010) – Studenmund
zijn de deterministische componenten van de regressie vergelijking en ε is de
stochastische. De deterministische componenten zijn de verwachte waarde van Y bij X
gegeven. De stochastische error term moet je altijd vernoemen in de regressie vergelijking,
omdat er altijd weggelaten variabelen aanwezig zullen zijn, fouten in de meting anders niet
meegenomen worden, de vergelijking kan een andere functionele vorm hebben en niet alles
is te voorspellen. De nieuwe vergelijking met de verwachte waarde ziet er zo uit:
Een dataset bijna altijd meerdere observaties van meerdere personen of jaren. Door het
subscript i aan de variabelen toe te voegen, laat je zien om welke observatie het gaat. N
geeft aan hoeveel observaties er zijn gedaan. Vergelijking 1.6 verandert als volgt:
Vergelijking 1.7 is een bivariaat lineair regressie model, Y is afhankelijk van één variabele
namelijk X. Wanneer Y afhankelijk is van meerdere variabelen, is er sprake van een
multivariaat lineair regressie model:
De regressie coëfficiënt van één van de variabelen in het multivariate model is het effect van
een verhoging van de desbetreffende variabele met één unit op Y, terwijl de overige
variabelen gelijk blijven. Het subscript K geeft het aantal onafhankelijke variabelen weer in
het multivariate model.
Geschatte regressie vergelijking: de gekwantificeerde versie van een specifieke
vergelijking. De geschatte regressie vergelijking wordt verkregen uit een dataset en ziet er
als volgt uit:
(Y-hat) is de geschatte waarde van Y en
en
zijn de geschatte regressie
coëfficiënten. Het is echter moeilijk om gelijk te krijgen aan Y. Het verschil tussen en Y
i) en kan je schrijven als:
De residual is dus het verschil tussen de geobserveerde Y en de geschatte regressie lijn ( ),
terwijl de error term het verschil tussen de geobserveerde Y en de verwachte waarde van Y
(E(Yi|Xi)) is. De error term is puur theoretisch en kan niet bestudeerd worden.
Cross-sectional: de observaties in een dataset zijn van hetzelfde punt in de tijd en
representeren verschillende economische gehelen (bv. huizen) van dat punt in de tijd.
Time series: de observaties in een dataset zijn een serie van jaren of maanden.
Kijk voor het volledige aanbod van samenvattingen op www.joho.org!
Download