JoHo Samenvatting: Using Econometrics (6e druk, 2010) – Studenmund 1. ‘Regressie analyses, een overzicht’ Econometrie betekent letterlijk economisch maatsysteem. In minder formele zin betekent econometrie het kwantitatieve meetsysteem en analyses van een actuele economische en bedrijfsgerelateerde fenomenen. Econometrie heeft drie belangrijke toepassingen: • Het beschrijven van de economische realiteit: econometrie schat de relatie tussen variabelen, die je in kan vullen in een economische vergelijking. Deze relatie heet ook wel geschatte regressie coëfficiënt. • Hypotheses testen: theoretische modellen moeten getest worden voordat ze als waar/significant beschouwd mogen worden. Alleen als er genoeg bewijs gevonden is dat de coëfficiënt van een variabele bijna correct is, mag deze meegenomen worden in het model. • Prognose: de nauwkeurigheid van een prognose hangt af van de mate waar in het verleden cijfers in het heden goed heeft voorspelt. Regressie analyses: kwantitatieve schattingen van economische relaties maken, die een volledig theoretisch karakter hebben. Om de richting van de verandering van een product te voorspellen, heb je de kennis van de economische theorie nodig. Om de hoeveelheid van de verandering van een product te voorspellen, heb je een dataset nodig en een manier (=regressie analyse) om de relatie te schatten. In een regressie analyse wordt de verandering in de afhankelijke variabele weergegeven als een functie van de veranderingen in een set van onafhankelijke variabelen. De afhankelijke variabele is niet alleen afhankelijk van de onafhankelijke variabelen, er zijn ook weggelaten variabelen die niet in de dataset staan. De nauwkeurigheid van de regressie analyse is dus niet volledig, ook al blijkt dit wel uit de testen. Enkele-vergelijking lineaire modellen: de meest simpele vorm van een lineair regressiemodel is: lineair is, kun je de niet-lineaire variabele vervangen door een ander teken om het lineair te maken, bijvoorbeeld: Hierboven is gezegd dat de afhankelijke variabele niet alleen bepaald wordt, maar ook door weggelaten variabelen. Als je deze weggelaten variabelen toevoegt aan het regressiemodel, blijft er een alsnog een inherente onverklaarbare error over, een stochastische error term (ε = epsilon).De regressie vergelijking (1.1) ziet er als volgt uit: Kijk voor het volledige aanbod van samenvattingen op www.joho.org! JoHo Samenvatting: Using Econometrics (6e druk, 2010) – Studenmund zijn de deterministische componenten van de regressie vergelijking en ε is de stochastische. De deterministische componenten zijn de verwachte waarde van Y bij X gegeven. De stochastische error term moet je altijd vernoemen in de regressie vergelijking, omdat er altijd weggelaten variabelen aanwezig zullen zijn, fouten in de meting anders niet meegenomen worden, de vergelijking kan een andere functionele vorm hebben en niet alles is te voorspellen. De nieuwe vergelijking met de verwachte waarde ziet er zo uit: Een dataset bijna altijd meerdere observaties van meerdere personen of jaren. Door het subscript i aan de variabelen toe te voegen, laat je zien om welke observatie het gaat. N geeft aan hoeveel observaties er zijn gedaan. Vergelijking 1.6 verandert als volgt: Vergelijking 1.7 is een bivariaat lineair regressie model, Y is afhankelijk van één variabele namelijk X. Wanneer Y afhankelijk is van meerdere variabelen, is er sprake van een multivariaat lineair regressie model: De regressie coëfficiënt van één van de variabelen in het multivariate model is het effect van een verhoging van de desbetreffende variabele met één unit op Y, terwijl de overige variabelen gelijk blijven. Het subscript K geeft het aantal onafhankelijke variabelen weer in het multivariate model. Geschatte regressie vergelijking: de gekwantificeerde versie van een specifieke vergelijking. De geschatte regressie vergelijking wordt verkregen uit een dataset en ziet er als volgt uit: (Y-hat) is de geschatte waarde van Y en en zijn de geschatte regressie coëfficiënten. Het is echter moeilijk om gelijk te krijgen aan Y. Het verschil tussen en Y i) en kan je schrijven als: De residual is dus het verschil tussen de geobserveerde Y en de geschatte regressie lijn ( ), terwijl de error term het verschil tussen de geobserveerde Y en de verwachte waarde van Y (E(Yi|Xi)) is. De error term is puur theoretisch en kan niet bestudeerd worden. Cross-sectional: de observaties in een dataset zijn van hetzelfde punt in de tijd en representeren verschillende economische gehelen (bv. huizen) van dat punt in de tijd. Time series: de observaties in een dataset zijn een serie van jaren of maanden. Kijk voor het volledige aanbod van samenvattingen op www.joho.org!