Uploaded by Alex B

Zusammenfassung Statistik

advertisement
Kapitel 0 – Vorwort
Liebe Leser,
diese Zusammenfassung erhebt keinerlei Anspruch auf Vollständigkeit, sie soll lediglich das
Skript von Prof. Schuhr in kondensierter Form darstellen und somit einen Überblick
vermitteln, welche Themen, Begriffe oder Formeln besondere Relevanz haben. Sie ist daher
vielmehr eine Art Checkliste, anhand derer die vielen Themen übersichtlich zusammengestellt
werden und somit die Prüfungsvorbereitung erleichtert werden soll.
Sie orientiert sich stark an Skript und Formelsammlung der Vorlesung „Statistik und
Wahrscheinlichkeitsrechnung“ von Prof. Schuhr und kann auch begleitend zum Skript
verwendet werden bzw. das Skript kann helfen, die Stichworte in diesem Dokument noch
einmal nachzuschlagen und besser zu verstehen. Ein weiterer Hinweis sei an dieser Stelle
gestattet: Es wird an mancher Stelle auf Teile im Skript hingewiesen. So ist D-X.Y zu
verstehen als Definition Y in Kapitel X – oder noch einfacher: D-1.1 ist Definition D-1.1, so
wie sie auch im Skript bezeichnet wurde. Analoges gilt für die Beispiele B-X.Y. Ebenso
beziehen sich alle Seitenangaben auf die entsprechende Seite im Skript.
Es werden nur wenige Rechenfähigkeiten vermittelt, vielmehr wird Theorie komprimiert, was
helfen soll die Logik, die hinter den Formeln steckt, zu verstehen. Jedoch kann dies
keinesfalls das Rechnen der Aufgaben und Umgehen mit der Formelsammlung ersetzen. Es
gilt also, die komprimierte Theorie zu begreifen und selbstständig anzuwenden, d. h.
Aufgaben zu lösen, damit beste Erfolge erzielt werden können.
Entsprechend soll diese Zusammenfassung verstanden und benutzt werden. Der Autor
wünscht ein gutes Arbeiten mit derselben und maximale Erfolge!
Leipzig, Januar 2015
Christopher Krohn
1
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 1 – Grundbegriffe
a) Daten, Einheiten, Merkmalsvariablen
-
statistische Einheit / Gesamtheit Ω (D-1.1) οƒ  Untersuchungsmerkmal / Realisation
(D-1.2) οƒ  Variable X / Realisation (D-1.4) οƒ  statistische Daten / Datensatz (D-1.3)
statistische Einheit: wird untersucht, da sie eine Information besitzt, die uns
interessiert (WER wird untersucht?) οƒ  „Gesamtheit“ Ω wird aus Einheiten gebildet
Untersuchungsmerkmal: Eigenschaften statistischer Einheiten, die untersucht werden
(WAS wird untersucht)
Bsp.: B-1.1 (statistische Einheiten: WiWi-Studenten; Untersuchungsmerkmal: Datum
der Immatrikulation)
Daten: Gesamtheit der statistischen Einheiten und ihren Untersuchungsmerkmalen mit
dazugehörigen Zahlenwerten
Variable: 𝑋: 𝛺 → ℝ bzw. elementeweise πœ” → 𝑋(πœ”)
Notation: X... Variable, π‘₯𝑖 ... Ausprägung , π‘₯̃𝑖 ... Beobachtung
b) Klassifikation von Variablen / Datensätzen
-
Skalenniveaus von Variablen
Nominal
Kategorien werden
festgelegt
Beschreibung
- Entscheidung (ja,
nein)
- Geschlecht (m, w)
Beispiele
- Nationalität
(Deutsch, Englisch,
Französisch,
…)
Vergleiche = / ≠
Praktisch nicht (es
lassen sich lediglich
Anzahlen bestimmen:
Rechnung
von 28 Personen sind
15 Frauen und 13
Männer anwesend)
Tab. 1: Skalenniveaus
Christopher Krohn
Ordinal
Rangfolgen sind
bestimmbar, Abstände
zwischen 2
Ausprägungen sind
jedoch unklar
- Noten (1 bis 6)
- Bewertungen (sehr
gut bis sehr schlecht:
-2 bis +2)
Metrisch
Rangfolgen sind
bestimmbar, Abstände
zwischen 2
Ausprägungen sind klar
definiert und immer
gleich groß
- Längen
- Zeit
- Geld
- Haushaltsgröße
- Anzahl der
gewürfelten 6en
=/≠/>/<
=/≠/>/<
Praktisch auch nicht
zulässig
(auch hier ist es streng
genommen nur zulässig
die Häufigkeiten der
einzelnen
Ausprägungen)
2
Institut für VWL, insb. Institutionenökonomische Umweltforschung
-
diskrete Variablen vs. stetige Variablen
o stetig: Der Abstand zwischen 2 Ausprägungen ist unendlich klein (z. B.
Variable „Zeit“: zwischen der Ausprägung „1 s“ und der Ausprägung „2 s“
liegen noch unendlich viele weitere, z. B. „1 s und 10 ms“ oder „1 s und 11
ms“ oder „1 s und 437 ms“; weiterhin lassen sich zwischen „1 s und 10 ms“
und „1 s und 11 ms“ wieder unendliche viele weitere Ausprägungen finden)1
o diskret: Abstände sind endlich klein (Würfelspiel: 1, 2, 3, 4, 5, 6; Abstand
zwischen 2 Ausprägungen ist jeweils 1; zwischen 1 und 2 kann keine weitere
Ausprägung gefunden werden: 1,5 ist unmöglich)
-
univariate vs. multivariate Datensätze
univariat
multivariat
bivariat
multivariat allgemein
Nur 1 Variable wird
2 Variablen werden
Mehrere Variablen werden
untersucht
untersucht
untersucht
Tab. 2: Univariate vs. multivariate Datensätze
1
Notation entsprechend gesetzlicher Vereinbarung: s… Sekunde, ms... Millisekunde
Christopher Krohn
3
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 2 – Deskription univariater Datensätze
a) Häufigkeiten
-
Häufigkeitsverteilung: Variable X mit Realisationen π‘₯̃𝑖
o Absolute Häufigkeit:
𝑛𝑖 = 𝑛(𝑋 = π‘₯̃𝑖 )2
𝑛
o Relative Häufigkeit:
β„Žπ‘– = 𝑛𝑖
o Kumulierte Häufigkeit:
𝑁𝑖 = ∑𝑖𝑒=1 𝑛𝑒 bzw.
o Darstellung: Häufigkeitstabelle
𝐻𝑖 = ∑𝑖𝑒=1 β„Žπ‘’
Überschrift
Merkmalsvariable
Häufigkeiten 1)
kumulierte Häufigkeiten 2)
absolut
relativ
absolut
relativ
~
x1
n1
h1
H1

~
xi

~
xm

ni

nm

hi

hm
N1

Ni

Nm = n

Hm = 1
Summe
n
1
---
---

Hi
1) unabhängig vom Skalenniveau, 2) nicht bei Nominalskala
Abb. 1: Schema einer Häufigkeitstabelle (Quelle: Schuhr 2011: „Statistik und
Wahrscheinlichkeitsrechnung“, Abb. 2.2 S. 18)
o Grafische Darstellungen: Stab- / Säulen- / Kreisdiagramm etc.
-
Klassierte Häufigkeitsverteilung (relative Häufigkeit der Klasse j: β„Žπ‘— =
𝑛
𝑛𝑗
𝑛
)
o Grafische Darstellung: Histogramm (Achtung! 𝑛𝑗 ∗ = 𝑏𝑗 )
𝑗
∗
-
-
o Vergleich der Flächen (𝑛𝑗 ), da reziprok gilt: 𝑛𝑗 = 𝑛𝑗 ∗ 𝑏𝑗 (Fläche des
Rechtecks Höhe (𝑛𝑗 ∗ ) mal Breite (𝑏𝑗 ))
Empirische Verteilungsfunktion 𝜈(π‘₯); Eigenschaften:
o Treppenfunktion
o 0 ≤ 𝜈(π‘₯) ≤ 1
o Monoton steigend
Schiefe (s. S. 34, 35, 53) es gilt für
symmetrische Verteilungen
x
=
xmed =
xmod
rechtsschiefe Verteilungen
xmod <
xmed <
x
linksschiefe Verteilungen
x
<
xmed <
xmod
Sprich: Die Häufigkeit 𝑛𝑖 ist gleich der Häufigkeit dafür, dass die Variable X genau den Wert der Realisation
π‘₯̃𝑖 annimmt
2
Christopher Krohn
4
Institut für VWL, insb. Institutionenökonomische Umweltforschung
b) Lagemaße
-
-
Modus: häufigster Wert der Verteilung
o 𝑛(𝑋 = π‘₯π‘šπ‘œπ‘‘ ) ≥ 𝑛(𝑋 = π‘₯𝑖 )∀𝑖
Quantile π‘₯[𝑝] : p*100 Prozent der Werte der Verteilung sind kleiner oder gleich π‘₯[𝑝]
o Spezialfall Median: mittlerer Wert, 50 % der Werte sind kleiner oder gleich
dem Median (entsprechend sind 50 % der Werte größer)
o π‘₯π‘šπ‘’π‘‘ = π‘₯[0,5] , es gilt: β„Ž(𝑋 ≤ π‘₯[0,5] ) = 0,5
Mittelwerte
o Arithmetischer MW
o Gewogener arithmetischer MW
o (Geometrischer MW)
o (harmonischer MW)
c) Streuungsmaße
-
Varianz: mittlere quadratische Abweichung vom MW (siehe Formel)
o Klassenvarianz (vgl. S. 60)
 Interne Varianz: Varianz innerhalb einer Klasse gewichtet mit den
2
Klassenhäufigkeiten (∑π‘š
𝑗=1 𝑠̃𝑗 ∗ β„Žπ‘— )
 Externe Varianz: Varianz zwischen den Klassen (außerhalb), d. h. es
entsteht dadurch Streuung, dass die Klassen verschiedene Mittelwerte
haben (im Sinne der „Abweichung vom Mittelwert“ werden hier die
Abweichungen der Klassenmittelwerte vom Gesamt-MW betrachtet),
2
ebenfalls gewichtet über relative Häufigkeiten (∑π‘š
𝑗=1(π‘₯̅𝑗 − π‘₯Μ… ) ∗ β„Žπ‘— )
 Summe aus beiden ergibt Gesamtklassenvarianz
o Spannweite: Abstand vom höchsten zum niedrigsten Wert: π‘Š = π‘₯π‘šπ‘Žπ‘₯ − π‘₯π‘šπ‘–π‘›
o Quartilsabstand: Abstand vom zwischen den Quartilen: 𝑄𝐴 = π‘₯[0,75] − π‘₯[0,25]
d) Box-Plots
-
5-Zahlen-Zusammenfassung benötigt:
o Minimum π‘₯1 = π‘₯π‘šπ‘–π‘› und Maximumπ‘₯𝑛 = π‘₯π‘šπ‘Žπ‘₯
o Quartile π‘₯[0,75] und π‘₯[0,25]
o Median π‘₯[0,5]
e) Lineartransformation
-
π‘Œ = π‘Ž + 𝑏𝑋 (z. B. nützlich bei Wechselkursumrechnungen u. ä.)
Christopher Krohn
5
Institut für VWL, insb. Institutionenökonomische Umweltforschung
d) Konzentrationsmessung
-
-
-
-
Typische Fragestellung: Ist eine statistische Masse (Merkmalssumme) auf ihre
Einheiten gleichmäßig verteilt? Z. B.: Ist das (Gesamt-)Einkommen der Bürger in
einer Volkswirtschaft gleichmäßig verteilt oder haben viele Menschen wenig und
wenige Menschen viel?
Nur für metrische Variablen mit bereits geordneten und nicht-negativen
Beobachtungen
Entfällt ein großer Anteil der Merkmalssumme auf…
o Einen geringen Anteil der statistischen Einheiten, so spricht man von relativer
Konzentration
o Eine geringe Anzahl der statistischen Einheiten, so spricht man von absoluter
Konzentration (für die Veranstaltung nicht relevant)
Lorenzkurve:
o 𝐻𝜈 = ∑πœˆπ‘’=1 β„Žπ‘’ bezeichnet die kumulierte relative Häufigkeit (bis zur ν-ten
statistischen Einheit)
o π‘„πœˆ = ∑πœˆπ‘’=1 π‘₯𝑒 ⁄∑𝑛𝑒=1 π‘₯𝑒 bezeichnet den kumulierten Anteil an der
Merkmalssumme (bis zur ν-ten statistischen Einheit)
o Der resultierende Streckenzug, der die Punkte
(0,0), (𝐻1 , 𝑄1 ), … , (𝐻𝑛−1 , 𝑄𝑛−1 ), (1,1) verbindet, wird Lorenzkurve genannt
o Monoton wachsende Funktion, die bei Gleichverteilung genau der
Winkelhalbierenden entspricht
Gini-Koeffizient:
o 𝐺𝐾 = 𝐹/0.5, mit 𝐹 = 0.5 − 0.5 βˆ™ ∑𝑛𝑒=1 β„Žπ‘’ (𝑄𝑒−1 + 𝑄𝑒 )3
Auch Variationskoeffizient lässt sich (ggf.) als Konzentrationsmaß interpretieren
Probleme:
o Unabhängig von n
o Vergleich zweier Verteilungen kann schwierig sein, wenn sich die
Lorenzkurven schneiden
3
Erinnert sei an die Flächenberechnung eines Trapezes mit den beiden parallelen Seiten a und c sowie der
π‘Ž+𝑐
Distanz zwischen diesen beiden Seiten, welche die Höhe ist: 𝐹 =
β„Ž.
2
Christopher Krohn
6
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 3 – Deskription bivariater Datensätze (Korrelation)
a) Übersicht
SkalenArt des
Korrelationskoeffizient
Beschränkung
4
niveau
Zusammenhangs
2
2
Nominal
Empirisch
πœ’ ∈ [0, ∞), πΎπ‘‹π‘Œ ∈ [0,1]
πΎπ‘‹π‘Œ / πœ’
Ordinal
Monoton
π‘Ÿπ‘†π‘ƒ ∈ [−1,1]
π‘Ÿπ‘†π‘ƒ
Metrisch
π‘Ÿπ‘₯𝑦
π‘Ÿπ‘₯𝑦 ∈ [−1,1]
Linear
Tab. 3: Korrelationskoeffizienten (Hinweis: Vgl. auch Schuhr 2011, Abb. 3.5, S. 104)
-
-
Bsp.: Hat X das Niveau metrisch, Y aber nur ordinales Skalenniveau, so ist der KK
nach Bravais-Pearson unzulässig, wohingegen Spearman und Kontingenzkoeffizient
sinnvoll zu verwenden sind
Streudiagramme (s. Schuhr 2011, Abb. 3.7, S. 108) (nicht bei nominalen Daten)
b) πœ’ 2 -Koeffizient
-
Bedingte Häufigkeiten β„Ž(π‘₯̃𝑖 |𝑦̃𝑖 ), sprich: relative Häufigkeit der Beobachtung π‘₯̃𝑖 ,
bedingt auf die spezielle (vorher festgelegte) Ausprägung 𝑦̃𝑖
Sind bedingte Häufigkeiten für jede Ausprägung 𝑦̃𝑖 gleich,
Untersucht Stärke des empirischen Zusammenhangs / ob X und Y abhängig sind
-
π‘˜
πœ’ 2 = ∑π‘š
𝑖=1 ∑𝑗=1
-
-
(𝑛𝑖𝑗 −𝑒𝑖𝑗 )2
𝑒𝑖𝑗
, mit 𝑒𝑖𝑗 … bei Unabhängigkeit erwartete Häufigkeiten
Bei Unabhängigkeit müsste gelten: 𝑛𝑖𝑗 − 𝑒𝑖𝑗 = 0, d. h. die Differenz zwischen den
tatsächlich vorliegenden und den erwarteten Häufigkeiten müsste verschwinden
Vice versa gilt: je größer die Differenzen und demnach πœ’ 2 , desto stärker der Grad des
empirischen Zusammenhangs
Da πœ’ 2 nicht interpretierbar (kann jeden nicht-negativen Wert annehmen): Normierung
durch Kontingenzkoeffizienten πΎπ‘‹π‘Œ
c) Rangkorrelationskoeffizient nach Spearman
-
Mathematische Ordnung der Daten (vom kleinsten zum größten Wert)
Dabei gehen Informationen verloren (es wird lediglich ein monotoner Zusammenhang
untersucht)
Dafür ist der Rang-KK robuster gegenüber Ausreißern im Vgl. zum KK nach BravaisPearson
Positive wie negative Zusammenhänge sind möglich (s. Abschnitt d) )
4
Hiermit ist gemeint, dass die Variable mit dem niedrigsten Skalenniveau mindestens das in der entsprechenden
Zeile vermerkte Skalenniveau haben muss
Christopher Krohn
7
Institut für VWL, insb. Institutionenökonomische Umweltforschung
d) Korrelationskoeffizient nach Bravais-Pearson
-
π‘Ÿπ‘₯𝑦 ∈ [−1,1] οƒ  positive (gleichsinnige), wie negative (gegensinnige) Beziehungen
können festgestellt werden
Stehen hohen (niedrigen) X-Werten hohe (niedrige) Y-Werte gegenüber, ergibt sich
ein positiver Zusammenhang οƒ  gleichsinnig
Stehen hohen (niedrigen) X-Werten niedrige (hohe) Y-Werte gegenüber, ergibt sich
ein negativer Zusammenhang οƒ  gegensinnig
e) Beurteilung der Stärke des Zusammenhangs
-
π‘Ÿπ‘₯𝑦 = 0
οƒ 
X und Y unkorreliert
-
0 < |π‘Ÿπ‘₯𝑦 | ≤ 0,5
οƒ 
X und Y schwach korreliert
-
0,5 < |π‘Ÿπ‘₯𝑦 | ≤ 0,8
οƒ 
X und Y mittelstark korreliert
-
0,8 < |π‘Ÿπ‘₯𝑦 | < 1
οƒ 
X und Y stark korreliert
-
|π‘Ÿπ‘₯𝑦 | = 1
οƒ 
X und Y perfekt korreliert
Christopher Krohn
8
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 4 – Mess- und Indexzahlen
a) Messzahlen und Änderungsfaktoren / -raten
-
π‘₯𝑑 π‘šπ‘–π‘‘ 𝑑 = {0,1, … , 𝑇} wird als Zeitreihe, die Zeitpunkte t als Messzeitpunkte
bezeichnet (Beachte: Zeitpunkte t sind äquidistant)
π‘₯
π‘šπ‘˜,𝑑 = π‘₯ 𝑑 ist die Messzahl für die Berichtszeit t zur Basiszeit k (oft: k=0); äquivalent:
π‘˜
Änderungs- oder Wachstumsfaktor
π‘šπ‘˜,𝑑
=
π‘₯𝑑
π‘₯π‘˜
π‘₯𝑠
π‘₯π‘˜
π‘₯
= π‘₯𝑑 = π‘šπ‘ ,𝑑 (neue Basis ist s)
-
Ggf. Umbasierung möglich: π‘š
-
Verschiedene Konzepte von „Veränderungen“:
o Absolute Änderung: π‘₯𝑑 − π‘₯π‘˜
π‘₯ −π‘₯
o Relative Änderung (Änderungsrate): π‘Ÿπ‘˜,𝑑 = 𝑑π‘₯ π‘˜ = π‘šπ‘˜,𝑑 − 1
π‘˜,𝑠
𝑠
π‘˜
π‘₯𝑑
o Änderungsfaktor (s.o.): π‘šπ‘˜,𝑑 = π‘₯
π‘˜
o Logarithmische Änderungsrate: π‘€π‘˜,𝑑 = 𝑙𝑛
-
π‘₯𝑑
π‘₯π‘˜
= 𝑙𝑛π‘₯𝑑 − 𝑙𝑛π‘₯π‘˜ (für hinreichend
kleine π‘Ÿπ‘˜,𝑑 gilt π‘Ÿπ‘˜,𝑑 ≈ π‘€π‘˜,𝑑 , d. h. die logarithmische Änderung ist eine gute
Annäherung)
Durchschnittliche Änderungen (Beachte: es werden Ein-Perioden-Veränderungen
betrachtet (k = t – 1)):
1⁄𝑇
π‘₯
o Faktor: π‘š
Μ… 𝑔 = (π‘š0,1 βˆ™ π‘š1,2 βˆ™ … βˆ™ π‘š 𝑇−1,𝑇 )1⁄𝑇 = ( π‘₯𝑇 )
0
(geometrisches Mittel)
o Rate: π‘ŸΜ… = π‘š
̅𝑔 − 1
1
o Logarithmisch: 𝑀
Μ… = 𝑇 𝑀0,𝑇 (arithmetisches Mittel)
a) Indexzahlen
-
Es werden Warenkörbe konstruiert mit n Gütern, die durch Preise 𝑝𝑖,𝑑 und Mengen
π‘žπ‘–,𝑑 charakterisiert sind
Preisindizes: geben das Verhältnis zwischen dem Wert des Warenkorbs der
Berichtszeit im Verhältnis zum Wert des Warenkorbs der Basiszeit, wenn…
o Laspeyres: … man die Mengen aus der Basiszeit zur Bewertung heranzieht
o Paasche: … man die Mengen aus der Berichtszeit zur Bewertung heranzieht
(𝐹𝑖)
(πΏπ‘Ž)
o Fisher: bildet das geometrische Mittel aus den vorigen: 𝑃0,𝑑 = √𝑃0,𝑑
-
(π‘ƒπ‘Ž)
βˆ™ 𝑃0,𝑑
Der Verbraucherpreisindex (VPI) gilt als ein Beispiel für einen Laspeyres-Preisindex
(wird zur Deflationierung von Zeitreihen benutzt)
Mengenindizes: funktionieren genau so, nur werden die Preise konstant gehalten, um
Mengenänderungen zu analysieren
Wertindex: analysiert Veränderungen des Wertes des Warenkorbs der Berichtszeit
gegenüber dem Wert der Basiszeit
Christopher Krohn
9
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 5 – Elementare Wahrscheinlichkeitsrechnung
-
-
Neues Bild von Menge und Element (ähnlich zur deskriptiven Statistik):
o Gesamtheit ٠∢= Ergebnisraum
o Element πœ” ∢= Ereignisbild
Laplace-Wahrscheinlichkeit (Gleichmöglichkeitssatz):
|𝐴|
o 𝑃(𝐴) = |Ω| =
-
-
-
𝑃(𝐴∩𝐡)
𝑃(𝐡)
(sprich: Wahrscheinlichkeit von A unter der Bedingung B)
Multiplikationssatz (Eintreten zweier Ereignisse):
o 𝑃(𝐴 ∩ 𝐡) = 𝑃(𝐴|𝐡) ∗ 𝑃(𝐡) (Umstellen der Formel für die bedingte WS)
o οƒ  WS, dass A und B eintreten ist gleich der WS, dass A eintritt, wenn B
bereits eingetreten ist mal die WS, dass B überhaupt eintritt (entsprechend der
1. Pfadregel)
Satz der totalen Wahrscheinlichkeit
o 𝑃(𝐡) = ∑π‘š
𝑖=1 𝑃(𝐡|𝐴𝑖 ) ∗ 𝑃(𝐴𝑖 )
o Ausnutzen der Pfadregeln!
o 1.) entlang des Pfades: Multiplizieren
o 2.) Einzelpfade summieren
Theorem von Bayes
o Bedeutung: Die gewöhnliche chronologische Reihenfolge ist: erst tritt B ein,
dann A (siehe bedingte WS)
o Bayes: Reihenfolge umgekehrt
o wir suchen𝑃(𝐡|𝐴), d. h.
o wenn wir wissen, dass A das Ergebnis ist, wie groß ist dann die WS, dass
vorher B eingetreten war
o 𝑃(𝐡|𝐴) =
-
π΄π‘›π‘§π‘Žβ„Žπ‘™ π‘‘π‘’π‘Ÿ π‘šöπ‘”π‘™π‘–π‘β„Žπ‘’π‘› πΈπ‘Ÿπ‘’π‘–π‘”π‘›π‘–π‘ π‘ π‘’
Bedingte Wahrscheinlichkeit:
o Beschränkung des Ergebnisraums Ω auf eine Menge B (neue
„Grundgesamtheit“ B)
o 𝑃(𝐴|𝐡) =
-
π΄π‘›π‘§π‘Žβ„Žπ‘™ π‘‘π‘’π‘Ÿ 𝑓üπ‘Ÿ 𝐴 𝑔ü𝑛𝑠𝑑𝑖𝑔𝑒𝑛 πΈπ‘Ÿπ‘’π‘–π‘”π‘›π‘–π‘ π‘ π‘’
𝑃(𝐡∩𝐴)
𝑃(𝐴)
π‘€π‘’π‘™π‘‘π‘–π‘π‘™π‘–π‘˜π‘Žπ‘‘π‘–π‘œπ‘›π‘ π‘ π‘Žπ‘‘π‘§
= π‘†π‘Žπ‘‘π‘§ π‘‘π‘’π‘Ÿ π‘‘π‘œπ‘‘π‘Žπ‘™π‘’π‘› π‘Šπ‘† (s.o.)
Unabhängigkeit
o Bei Unabhängigkeit gilt: 𝑃(𝐴 ∩ 𝐡) = 𝑃(𝐴) ∗ 𝑃(𝐡)
o Laut Multiplikationssatz: 𝑃(𝐴 ∩ 𝐡) = 𝑃(𝐴|𝐡) ∗ 𝑃(𝐡)
o Warum gilt 𝑃(𝐴|𝐡) = 𝑃(𝐴)? Antwort: wegen der Unabhängigkeit ist B keine
Bedingung für A
Christopher Krohn
10
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 6 – Zufallsvariablen
a) Übersicht
Diskret
Stetig
f(x)
f(x)
2/6
0.1
1/6
0.05
0
f(x)
x
-1
0
1
2
3
4
5
6
7
8
0
-4
-2
0
2
a
4
b
6
x
8
10
12
14
Wahrscheinlichkeitsfunktion
Dichtefunktion
𝑓(π‘₯) = 𝑃(𝑋 = π‘₯)
(Punkt-WS)
(keine Punkt-WS; quasi-unmögliches
Ereignis)
F(x )
F(x ) 1
1
0.75
4/6
0.5
2/6
0.25
F(x)
0
x
-1
0
1
2
3
4
5
6
Verteilungsfunktion
7
8
0
x
-4
-2
0
2
4
6
8
10
12
14
Verteilungsfunktion
𝐹(π‘₯) = 𝑃(𝑋 ≤ π‘₯)
𝐹(π‘₯) = 𝑃(𝑋 ≤ π‘₯)
(Intervall-WS)
(Intervall-WS)
Abb. 2: Übersicht über Verteilungs-, Wahrscheinlichkeits-, Dichtefunktion
(Abbildungen aus: Schuhr 2011, S. 168, 171, 173)
-
von Wahrscheinlichkeitsfunktion zu Verteilungsfunktion: Summe ∑
von Dichtefunktion zu Verteilungsfunktion: Integral ∫
Christopher Krohn
11
Institut für VWL, insb. Institutionenökonomische Umweltforschung
b) Momente
-
Stetige Zufallsvariablen
∞
o Erwartungswert 𝐸(𝑋) = πœ‡ = ∫−∞ π‘₯ ∗ 𝑓(π‘₯) 𝑑π‘₯ (hierbei sind als
Integrationsgrenzen -∞ bzw. +∞ die Grenzen des Definitionsbereiches der
Dichtefunktion einzusetzen)
∞
o Allgemein gilt: 𝐸(𝑔(π‘₯)) = ∫−∞ 𝑔(π‘₯) ∗ 𝑓(π‘₯) 𝑑π‘₯
∞
o Für 𝑔(π‘₯) = π‘₯² ⇒ ∫−∞ π‘₯² ∗ 𝑓(π‘₯) 𝑑π‘₯ (wird für Varianz benötigt)
-
-
-
o Varianz π‘‰π‘Žπ‘Ÿ(𝑋) = 𝜎² = 𝐸(𝑋 2 ) − 𝐸(𝑋)² (Verschiebungssatz)
Diskrete Zufallsvariablen
o Erwartungswert 𝐸(𝑋) = πœ‡ = ∑𝑖 π‘₯𝑖 ∗ 𝑓(π‘₯𝑖 )
o Varianz π‘‰π‘Žπ‘Ÿ(𝑋) = 𝜎² = 𝐸(𝑋 2 ) − 𝐸(𝑋)² (Verschiebungssatz)
Interpretation:
o Ähnlich wie in deskriptiver Statistik
o Erwartungswert für diskrete Variablen: Summe der Ausprägungen π‘₯𝑖
gewichtet mit deren WS 𝑓(π‘₯𝑖 )
o Erwartungswert für stetige Variablen: gleiche Logik, hier wird lediglich das
Integral benötigt
o Varianz: nach wie vor „mittlere (erwartete) quadratische Abweichung vom
Mittelwert (bzw. Erwartungswert)“
Quantile: 𝑃(𝑋 ≤ π‘₯[𝑝] ) = 𝐹(π‘₯[𝑝] ) (Bsp. Median: Wahrscheinlichkeit, dass Werte
kleiner oder gleich dem Median sind, ist 50 %, was dem Wert der Verteilungsfunktion
an der Stelle des Medians entspricht)
Christopher Krohn
12
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 7 – Spezielle Verteilungsmodelle
a) diskrete Verteilungsmodelle
-
-
-
Gleichverteilung 𝑋~π‘ˆ(π‘š)
o Alle Ausprägungen haben die gleiche WS
Binomialverteilung 𝑋~𝐡(𝑛, 𝑝)
o Basis: Bernoulli-Versuch οƒ  es gibt nur 2 mögliche Ausgänge des Versuchs:
Erfolg (𝐴) oder Misserfolg (𝐴̅)
o Die Variable X ist definiert als: X… Anzahl der Erfolge
o (Ein) Erfolg tritt mit WS p ein: 𝑃(𝐴) = 𝑝 ⇒ 𝑃(𝐴̅) = 1 − 𝑝
o Der Bernoulli-Versuch wird n-mal wiederholt
o Dabei bleibt p konstant (Unabhängigkeit)
o 𝑃(𝑋 = π‘₯) = 𝑓(π‘₯) = (𝑛π‘₯)𝑝 π‘₯ (1 − 𝑝)𝑛−π‘₯ (Baumdiagramm!)
Poissonverteilung 𝑋~π‘ƒπ‘œ(πœ†)
o „Verteilung seltener Ereignisse“ οƒ  geht aus Binomialverteilung hervor, wenn
n sehr hoch und p sehr gering ist
o Es existiert ein Zeitintervall, …
o Das für die WS des Eintretens des Erfolgs ausschlaggebend ist
Geometrische Verteilung 𝑋~𝐺(𝑝)
o X… Anzahl der Misserfolge bis zum ersten Erfolg
o οƒ  Erfolgs-WS p definiert wie bei der Binomialverteilung
o οƒ  es gilt für x Fehlversuche bis der erste Erfolg eintritt ((x+1)-te
Wiederholung!): 𝑃(π‘₯) = 𝑓(π‘₯) = (1 − 𝑝)π‘₯ ∗ 𝑝 (Baumdiagramm!)
Christopher Krohn
13
Institut für VWL, insb. Institutionenökonomische Umweltforschung
-
Hypergeometrische Verteilung 𝑋~𝐻(𝑛, 𝑁, 𝑀)
o Zufallsversuche ohne Zurücklegen
o Grundgesamtheit N, M davon besitzen eine interessierende Eigenschaft
o Binomialkoeffizient (𝑁𝑛)… Anzahl der möglichen Stichproben beim Ziehen
von n Elementen aus der Menge N
o Bsp.: Lotto (6 aus 49); X… Anzahl der Richtigen
o 𝑋~𝐻(𝑛 = 6, 𝑁 = 49, 𝑀 = 6); M: 6 Zahlen sind richtig; n: 6 Zahlen werden
getippt; N: insgesamt gibt es 49 Zahlen (Zahlen können nicht mehr als einmal
auf dem Tippschein auftauchen οƒ  ohne Zurücklegen)
b) stetige Verteilungsmodelle
-
-
Rechteckverteilung 𝑋~𝑅(𝛼, 𝛽)
o Stetige Gleichverteilung
Exponentialverteilung 𝑋~𝐸π‘₯(πœ†)
o Lebensdauern, Zeitspannen, Wartezeiten
o Markov-Eigenschaft: Gedächtnislosigkeit
Normalverteilung 𝑋~𝑁(πœ‡, 𝜎 2 )
o Nahezu alle Variablen sind in der Realität näherungsweise normalverteilt (bei
genügend großem n)
o Standardisierung: 𝑍 =
𝑋−πœ‡
𝜎
οƒ  hatte X zuvor Erwartungswert πœ‡ und Varianz
𝜎 2 , so gilt jetzt 𝐸(𝑍) = 0 und außerdem π‘‰π‘Žπ‘Ÿ(𝑍) = 1
c) Stichprobenverteilungen
-
Chi-Quadrat-Verteilung 𝑋~πœ’²(𝑛)
Student-t-Verteilung 𝑋~𝑑(𝑛)
Fisher-F-Verteilung 𝑋~𝐹(𝑛, π‘š)
Christopher Krohn
14
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 8 – Parameterschätzungen
a) Punktschätzungen
-
-
Für eine Zufallsvariable X werden n Stichproben gezogen und entsprechende
Stichprobenvariablen erstellt (𝑋1 , 𝑋2 , … , 𝑋𝑛 ); es sind gewisse Parameter unbekannt,
die geschätzt werden sollen
Gesucht: Schätzfunktion 𝑇(𝑛, πœƒ), die einen interessierenden Parameter πœƒ der
Verteilung von X möglichst gut annähert
Dazu müssen gewisse Eigenschaften erfüllt sein
Erwartungstreue: 𝐸(𝑇𝑛,πœƒ ) = πœƒ οƒ  wenn sehr viele Stichproben gezogen werden, muss
die Schätzfunktion den Parameter πœƒ treffen
Konsistenz: Erwartungstreue muss gelten, UND: lim𝑛→∞ π‘‰π‘Žπ‘Ÿ(𝑇𝑛,πœƒ ) = 0 οƒ  bei
unendlich großer Stichprobe muss die Varianz der Schätzung verschwinden
erwartungstreuer Schätzer für 𝐸(𝑋): 𝑋̅
erwartungstreuer Schätzer für π‘‰π‘Žπ‘Ÿ(𝑋): 𝑆 2 ≠ 𝑠̃ 2 (!), da durch n-1 geteilt wird
b) Intervallschätzungen
-
mit Punktschätzung wird wahrer Parameter nie auf den Punkt genau getroffen (ähnlich
zum quasiunmöglichen Ereignis)
stattdessen wird ein Intervall geschätzt, das den Parameter πœƒ mit WS 1 − 𝛼 abdeckt
Vorgehen:
1. Welcher Parameter wird geschätzt? (πœ‡, 𝜎 2 , 𝑝)
2. Welche Verteilung liegt für X vor?
3. In Formelsammlung entsprechende Formel für das Konfidenzintervall nutzen
Christopher Krohn
15
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 9 - Hypothesentests
-
Hypothesen: Vermutungen / Aussagen über WS-Verteilungen
Vorgehen:
1. Art des Tests
 Momente einer Verteilung: 1-Stichproben-Test, z. B. πœƒ = πœƒ0 (Vgl. mit
vorgegebenem Wert)
 Vgl. der Momente zweier Verteilungen: 2- Stichproben-Test, z. B.
πœƒ1 = πœƒ2 (Vgl. der verteilungen)
 Test auf Verteilung: Anpassungstest, 𝐹(π‘₯) = 𝐹0 (π‘₯)
2. Was wird getestet? (falls nicht Anpassungstest)
 Erwartungswert πœ‡
 Varianz 𝜎 2
 Erfolgs-WS 𝑝
3. Verteilung feststellen
4. Entsprechende Formel nutzen (entlang der Spalten vorgehen)
 Aufstellen der Hypothesen
 Berechnung der Teststatistik
 Nachschlagen der kritischen Werte in der entsprechenden Tabelle
5. Entscheidung treffen
 Fällt die Teststatistik in den kritischen Bereich, so wird 𝐻0 abgelehnt
Christopher Krohn
16
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Kapitel 10 - Regressionsanalyse
-
-
-
-
-
-
Erweiterung der Korrelationsrechnung
Bisher: Zusammenhang zweier Variablen, jetzt: Kausalität οƒ  Welche Variable
beeinflusst welche?
Linearer Zusammenhang wird unterstellt: π‘Œ = π‘Ž + 𝑏𝑋 („wahres Modell“)
Parameter a und b sind unbekannt οƒ  werden geschätzt: 𝑦̂ = π‘ŽΜ‚ + 𝑏̂π‘₯ („geschätztes
Modell“)
Y… Regressand, endogene Variable, abhängige Variable
X… Regressor, exogene Variable, unabhängige Variable
Schätzmethode: KQ-Methode (Kleinste Quadrate: Quadratische Abweichungen der
Schätzungen 𝑦̂ von den tatsächlichen Werten 𝑦)
Abweichungen werden auch Residuen genannt: π‘’Μ‚πœˆ = π‘¦πœˆ − π‘¦Μ‚πœˆ
o π‘’Μ‚πœˆ > 0 οƒ  Unterschätzung
o π‘’Μ‚πœˆ < 0 οƒ  Überschätzung
Streuung der abhängigen Variablen y: TSS = RSS + ESS
o 𝑇𝑆𝑆 = ∑( π‘¦πœˆ − π‘¦Μ…πœˆ )² οƒ  Gesamtstreuung: Abweichungen der Variable Y vom
Mittelwert; ähnlich wie bei Varianz
o 𝑅𝑆𝑆 = ∑( π‘¦πœˆ − π‘¦Μ‚πœˆ )² = ∑ π‘’Μ‚πœˆ 2 οƒ  Residualstreuung / nicht-erklärte Streuung:
Summe der quadrierten Schätzfehler
o 𝐸𝑆𝑆 = ∑( π‘¦Μ‚πœˆ − 𝑦̅)² οƒ  erklärte Streuung: inwieweit kann die Streuung durch
die Schätzung erklärt werden οƒ  Abweichungen der geschätzten Werte vom
Mittelwert, welche durch die Schätzgerade zustande kommen, letztere
wiederum variiert mit x οƒ  dies ist der erklärte Teil
𝐸𝑆𝑆
2
𝑅 2 = 𝑇𝑆𝑆 = π‘Ÿπ‘₯𝑦
οƒ  Interpretation: Anteil der erklärten Streuung an der
Gesamtstreuung, wie viel Prozent der Gesamtstreuung kann durch die Schätzung
erklärt werden οƒ  „Erklärungsgüte“
Geschätzte Parameter können getestet werden
o 𝐻0 : π‘Ž = 0 οƒ  Ist der Parameter a signifikant von 0 verschieden?
o 𝐻0 : 𝑏 = 0 οƒ  Ist der Parameter b signifikant von 0 verschieden? οƒ  besonders
interessant, da bei Nicht-Verwerfung von 𝐻0 : 𝑏 = 0 gilt: 𝑦 = π‘Ž + 0 ∗ π‘₯ = π‘Ž,
folglich gilt, dass x keinen Einfluss auf y hat
Interpretation der Parameter
o a: Wenn x = 0 ist, dann ist y = a
o b: Wenn x um eine Einheit steigt, so steigt y um b Einheiten
(Anstiegsparameter)
mit Werten für π‘ŽΜ‚ und 𝑏̂ und einer Vorgabe für x (π‘₯0 ) kann prognostiziert werden:
𝑦̂0 = π‘ŽΜ‚ + 𝑏̂π‘₯0 (Punktprognose, ggf. kann auch ein Intervall bestimmt werden
Christopher Krohn
17
Institut für VWL, insb. Institutionenökonomische Umweltforschung
Download