Statistik Zusammenfassung: Prüfungsvorbereitung

Kapitel 0 – Vorwort Liebe Leser, diese Zusammenfassung erhebt keinerlei Anspruch auf Vollständigkeit, sie soll lediglich das Skript von Prof. Schuhr in kondensierter Form darstellen und somit einen Überblick vermitteln, welche Themen, Begriffe oder Formeln besondere Relevanz haben. Sie ist daher vielmehr eine Art Checkliste, anhand derer die vielen Themen übersichtlich zusammengestellt werden und somit die Prüfungsvorbereitung erleichtert werden soll. Sie orientiert sich stark an Skript und Formelsammlung der Vorlesung „Statistik und Wahrscheinlichkeitsrechnung“ von Prof. Schuhr und kann auch begleitend zum Skript verwendet werden bzw. das Skript kann helfen, die Stichworte in diesem Dokument noch einmal nachzuschlagen und besser zu verstehen. Ein weiterer Hinweis sei an dieser Stelle gestattet: Es wird an mancher Stelle auf Teile im Skript hingewiesen. So ist D-X.Y zu verstehen als Definition Y in Kapitel X – oder noch einfacher: D-1.1 ist Definition D-1.1, so wie sie auch im Skript bezeichnet wurde. Analoges gilt für die Beispiele B-X.Y. Ebenso beziehen sich alle Seitenangaben auf die entsprechende Seite im Skript. Es werden nur wenige Rechenfähigkeiten vermittelt, vielmehr wird Theorie komprimiert, was helfen soll die Logik, die hinter den Formeln steckt, zu verstehen. Jedoch kann dies keinesfalls das Rechnen der Aufgaben und Umgehen mit der Formelsammlung ersetzen. Es gilt also, die komprimierte Theorie zu begreifen und selbstständig anzuwenden, d. h. Aufgaben zu lösen, damit beste Erfolge erzielt werden können. Entsprechend soll diese Zusammenfassung verstanden und benutzt werden. Der Autor wünscht ein gutes Arbeiten mit derselben und maximale Erfolge! Leipzig, Januar 2015 Christopher Krohn 1 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 1 – Grundbegriffe a) Daten, Einheiten, Merkmalsvariablen - statistische Einheit / Gesamtheit Ω (D-1.1)  Untersuchungsmerkmal / Realisation (D-1.2)  Variable X / Realisation (D-1.4)  statistische Daten / Datensatz (D-1.3) statistische Einheit: wird untersucht, da sie eine Information besitzt, die uns interessiert (WER wird untersucht?)  „Gesamtheit“ Ω wird aus Einheiten gebildet Untersuchungsmerkmal: Eigenschaften statistischer Einheiten, die untersucht werden (WAS wird untersucht) Bsp.: B-1.1 (statistische Einheiten: WiWi-Studenten; Untersuchungsmerkmal: Datum der Immatrikulation) Daten: Gesamtheit der statistischen Einheiten und ihren Untersuchungsmerkmalen mit dazugehörigen Zahlenwerten Variable: 𝑋: 𝛺 → ℝ bzw. elementeweise 𝜔 → 𝑋(𝜔) Notation: X... Variable, 𝑥𝑖 ... Ausprägung , 𝑥̃𝑖 ... Beobachtung b) Klassifikation von Variablen / Datensätzen - Skalenniveaus von Variablen Nominal Kategorien werden festgelegt Beschreibung - Entscheidung (ja, nein) - Geschlecht (m, w) Beispiele - Nationalität (Deutsch, Englisch, Französisch, …) Vergleiche = / ≠ Praktisch nicht (es lassen sich lediglich Anzahlen bestimmen: Rechnung von 28 Personen sind 15 Frauen und 13 Männer anwesend) Tab. 1: Skalenniveaus Christopher Krohn Ordinal Rangfolgen sind bestimmbar, Abstände zwischen 2 Ausprägungen sind jedoch unklar - Noten (1 bis 6) - Bewertungen (sehr gut bis sehr schlecht: -2 bis +2) Metrisch Rangfolgen sind bestimmbar, Abstände zwischen 2 Ausprägungen sind klar definiert und immer gleich groß - Längen - Zeit - Geld - Haushaltsgröße - Anzahl der gewürfelten 6en =/≠/>/< =/≠/>/< Praktisch auch nicht zulässig (auch hier ist es streng genommen nur zulässig die Häufigkeiten der einzelnen Ausprägungen) 2 Institut für VWL, insb. Institutionenökonomische Umweltforschung - diskrete Variablen vs. stetige Variablen o stetig: Der Abstand zwischen 2 Ausprägungen ist unendlich klein (z. B. Variable „Zeit“: zwischen der Ausprägung „1 s“ und der Ausprägung „2 s“ liegen noch unendlich viele weitere, z. B. „1 s und 10 ms“ oder „1 s und 11 ms“ oder „1 s und 437 ms“; weiterhin lassen sich zwischen „1 s und 10 ms“ und „1 s und 11 ms“ wieder unendliche viele weitere Ausprägungen finden)1 o diskret: Abstände sind endlich klein (Würfelspiel: 1, 2, 3, 4, 5, 6; Abstand zwischen 2 Ausprägungen ist jeweils 1; zwischen 1 und 2 kann keine weitere Ausprägung gefunden werden: 1,5 ist unmöglich) - univariate vs. multivariate Datensätze univariat multivariat bivariat multivariat allgemein Nur 1 Variable wird 2 Variablen werden Mehrere Variablen werden untersucht untersucht untersucht Tab. 2: Univariate vs. multivariate Datensätze 1 Notation entsprechend gesetzlicher Vereinbarung: s… Sekunde, ms... Millisekunde Christopher Krohn 3 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 2 – Deskription univariater Datensätze a) Häufigkeiten - Häufigkeitsverteilung: Variable X mit Realisationen 𝑥̃𝑖 o Absolute Häufigkeit: 𝑛𝑖 = 𝑛(𝑋 = 𝑥̃𝑖 )2 𝑛 o Relative Häufigkeit: ℎ𝑖 = 𝑛𝑖 o Kumulierte Häufigkeit: 𝑁𝑖 = ∑𝑖𝑢=1 𝑛𝑢 bzw. o Darstellung: Häufigkeitstabelle 𝐻𝑖 = ∑𝑖𝑢=1 ℎ𝑢 Überschrift Merkmalsvariable Häufigkeiten 1) kumulierte Häufigkeiten 2) absolut relativ absolut relativ ~ x1 n1 h1 H1  ~ xi  ~ xm  ni  nm  hi  hm N1  Ni  Nm = n  Hm = 1 Summe n 1 --- ---  Hi 1) unabhängig vom Skalenniveau, 2) nicht bei Nominalskala Abb. 1: Schema einer Häufigkeitstabelle (Quelle: Schuhr 2011: „Statistik und Wahrscheinlichkeitsrechnung“, Abb. 2.2 S. 18) o Grafische Darstellungen: Stab- / Säulen- / Kreisdiagramm etc. - Klassierte Häufigkeitsverteilung (relative Häufigkeit der Klasse j: ℎ𝑗 = 𝑛 𝑛𝑗 𝑛 ) o Grafische Darstellung: Histogramm (Achtung! 𝑛𝑗 ∗ = 𝑏𝑗 ) 𝑗 ∗ - - o Vergleich der Flächen (𝑛𝑗 ), da reziprok gilt: 𝑛𝑗 = 𝑛𝑗 ∗ 𝑏𝑗 (Fläche des Rechtecks Höhe (𝑛𝑗 ∗ ) mal Breite (𝑏𝑗 )) Empirische Verteilungsfunktion 𝜈(𝑥); Eigenschaften: o Treppenfunktion o 0 ≤ 𝜈(𝑥) ≤ 1 o Monoton steigend Schiefe (s. S. 34, 35, 53) es gilt für symmetrische Verteilungen x = xmed = xmod rechtsschiefe Verteilungen xmod < xmed < x linksschiefe Verteilungen x < xmed < xmod Sprich: Die Häufigkeit 𝑛𝑖 ist gleich der Häufigkeit dafür, dass die Variable X genau den Wert der Realisation 𝑥̃𝑖 annimmt 2 Christopher Krohn 4 Institut für VWL, insb. Institutionenökonomische Umweltforschung b) Lagemaße - - Modus: häufigster Wert der Verteilung o 𝑛(𝑋 = 𝑥𝑚𝑜𝑑 ) ≥ 𝑛(𝑋 = 𝑥𝑖 )∀𝑖 Quantile 𝑥[𝑝] : p*100 Prozent der Werte der Verteilung sind kleiner oder gleich 𝑥[𝑝] o Spezialfall Median: mittlerer Wert, 50 % der Werte sind kleiner oder gleich dem Median (entsprechend sind 50 % der Werte größer) o 𝑥𝑚𝑒𝑑 = 𝑥[0,5] , es gilt: ℎ(𝑋 ≤ 𝑥[0,5] ) = 0,5 Mittelwerte o Arithmetischer MW o Gewogener arithmetischer MW o (Geometrischer MW) o (harmonischer MW) c) Streuungsmaße - Varianz: mittlere quadratische Abweichung vom MW (siehe Formel) o Klassenvarianz (vgl. S. 60)  Interne Varianz: Varianz innerhalb einer Klasse gewichtet mit den 2 Klassenhäufigkeiten (∑𝑚 𝑗=1 𝑠̃𝑗 ∗ ℎ𝑗 )  Externe Varianz: Varianz zwischen den Klassen (außerhalb), d. h. es entsteht dadurch Streuung, dass die Klassen verschiedene Mittelwerte haben (im Sinne der „Abweichung vom Mittelwert“ werden hier die Abweichungen der Klassenmittelwerte vom Gesamt-MW betrachtet), 2 ebenfalls gewichtet über relative Häufigkeiten (∑𝑚 𝑗=1(𝑥̅𝑗 − 𝑥̅ ) ∗ ℎ𝑗 )  Summe aus beiden ergibt Gesamtklassenvarianz o Spannweite: Abstand vom höchsten zum niedrigsten Wert: 𝑊 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 o Quartilsabstand: Abstand vom zwischen den Quartilen: 𝑄𝐴 = 𝑥[0,75] − 𝑥[0,25] d) Box-Plots - 5-Zahlen-Zusammenfassung benötigt: o Minimum 𝑥1 = 𝑥𝑚𝑖𝑛 und Maximum𝑥𝑛 = 𝑥𝑚𝑎𝑥 o Quartile 𝑥[0,75] und 𝑥[0,25] o Median 𝑥[0,5] e) Lineartransformation - 𝑌 = 𝑎 + 𝑏𝑋 (z. B. nützlich bei Wechselkursumrechnungen u. ä.) Christopher Krohn 5 Institut für VWL, insb. Institutionenökonomische Umweltforschung d) Konzentrationsmessung - - - - Typische Fragestellung: Ist eine statistische Masse (Merkmalssumme) auf ihre Einheiten gleichmäßig verteilt? Z. B.: Ist das (Gesamt-)Einkommen der Bürger in einer Volkswirtschaft gleichmäßig verteilt oder haben viele Menschen wenig und wenige Menschen viel? Nur für metrische Variablen mit bereits geordneten und nicht-negativen Beobachtungen Entfällt ein großer Anteil der Merkmalssumme auf… o Einen geringen Anteil der statistischen Einheiten, so spricht man von relativer Konzentration o Eine geringe Anzahl der statistischen Einheiten, so spricht man von absoluter Konzentration (für die Veranstaltung nicht relevant) Lorenzkurve: o 𝐻𝜈 = ∑𝜈𝑢=1 ℎ𝑢 bezeichnet die kumulierte relative Häufigkeit (bis zur ν-ten statistischen Einheit) o 𝑄𝜈 = ∑𝜈𝑢=1 𝑥𝑢 ⁄∑𝑛𝑢=1 𝑥𝑢 bezeichnet den kumulierten Anteil an der Merkmalssumme (bis zur ν-ten statistischen Einheit) o Der resultierende Streckenzug, der die Punkte (0,0), (𝐻1 , 𝑄1 ), … , (𝐻𝑛−1 , 𝑄𝑛−1 ), (1,1) verbindet, wird Lorenzkurve genannt o Monoton wachsende Funktion, die bei Gleichverteilung genau der Winkelhalbierenden entspricht Gini-Koeffizient: o 𝐺𝐾 = 𝐹/0.5, mit 𝐹 = 0.5 − 0.5 ∙ ∑𝑛𝑢=1 ℎ𝑢 (𝑄𝑢−1 + 𝑄𝑢 )3 Auch Variationskoeffizient lässt sich (ggf.) als Konzentrationsmaß interpretieren Probleme: o Unabhängig von n o Vergleich zweier Verteilungen kann schwierig sein, wenn sich die Lorenzkurven schneiden 3 Erinnert sei an die Flächenberechnung eines Trapezes mit den beiden parallelen Seiten a und c sowie der 𝑎+𝑐 Distanz zwischen diesen beiden Seiten, welche die Höhe ist: 𝐹 = ℎ. 2 Christopher Krohn 6 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 3 – Deskription bivariater Datensätze (Korrelation) a) Übersicht SkalenArt des Korrelationskoeffizient Beschränkung 4 niveau Zusammenhangs 2 2 Nominal Empirisch 𝜒 ∈ [0, ∞), 𝐾𝑋𝑌 ∈ [0,1] 𝐾𝑋𝑌 / 𝜒 Ordinal Monoton 𝑟𝑆𝑃 ∈ [−1,1] 𝑟𝑆𝑃 Metrisch 𝑟𝑥𝑦 𝑟𝑥𝑦 ∈ [−1,1] Linear Tab. 3: Korrelationskoeffizienten (Hinweis: Vgl. auch Schuhr 2011, Abb. 3.5, S. 104) - - Bsp.: Hat X das Niveau metrisch, Y aber nur ordinales Skalenniveau, so ist der KK nach Bravais-Pearson unzulässig, wohingegen Spearman und Kontingenzkoeffizient sinnvoll zu verwenden sind Streudiagramme (s. Schuhr 2011, Abb. 3.7, S. 108) (nicht bei nominalen Daten) b) 𝜒 2 -Koeffizient - Bedingte Häufigkeiten ℎ(𝑥̃𝑖 |𝑦̃𝑖 ), sprich: relative Häufigkeit der Beobachtung 𝑥̃𝑖 , bedingt auf die spezielle (vorher festgelegte) Ausprägung 𝑦̃𝑖 Sind bedingte Häufigkeiten für jede Ausprägung 𝑦̃𝑖 gleich, Untersucht Stärke des empirischen Zusammenhangs / ob X und Y abhängig sind - 𝑘 𝜒 2 = ∑𝑚 𝑖=1 ∑𝑗=1 - - (𝑛𝑖𝑗 −𝑒𝑖𝑗 )2 𝑒𝑖𝑗 , mit 𝑒𝑖𝑗 … bei Unabhängigkeit erwartete Häufigkeiten Bei Unabhängigkeit müsste gelten: 𝑛𝑖𝑗 − 𝑒𝑖𝑗 = 0, d. h. die Differenz zwischen den tatsächlich vorliegenden und den erwarteten Häufigkeiten müsste verschwinden Vice versa gilt: je größer die Differenzen und demnach 𝜒 2 , desto stärker der Grad des empirischen Zusammenhangs Da 𝜒 2 nicht interpretierbar (kann jeden nicht-negativen Wert annehmen): Normierung durch Kontingenzkoeffizienten 𝐾𝑋𝑌 c) Rangkorrelationskoeffizient nach Spearman - Mathematische Ordnung der Daten (vom kleinsten zum größten Wert) Dabei gehen Informationen verloren (es wird lediglich ein monotoner Zusammenhang untersucht) Dafür ist der Rang-KK robuster gegenüber Ausreißern im Vgl. zum KK nach BravaisPearson Positive wie negative Zusammenhänge sind möglich (s. Abschnitt d) ) 4 Hiermit ist gemeint, dass die Variable mit dem niedrigsten Skalenniveau mindestens das in der entsprechenden Zeile vermerkte Skalenniveau haben muss Christopher Krohn 7 Institut für VWL, insb. Institutionenökonomische Umweltforschung d) Korrelationskoeffizient nach Bravais-Pearson - 𝑟𝑥𝑦 ∈ [−1,1]  positive (gleichsinnige), wie negative (gegensinnige) Beziehungen können festgestellt werden Stehen hohen (niedrigen) X-Werten hohe (niedrige) Y-Werte gegenüber, ergibt sich ein positiver Zusammenhang  gleichsinnig Stehen hohen (niedrigen) X-Werten niedrige (hohe) Y-Werte gegenüber, ergibt sich ein negativer Zusammenhang  gegensinnig e) Beurteilung der Stärke des Zusammenhangs - 𝑟𝑥𝑦 = 0  X und Y unkorreliert - 0 < |𝑟𝑥𝑦 | ≤ 0,5  X und Y schwach korreliert - 0,5 < |𝑟𝑥𝑦 | ≤ 0,8  X und Y mittelstark korreliert - 0,8 < |𝑟𝑥𝑦 | < 1  X und Y stark korreliert - |𝑟𝑥𝑦 | = 1  X und Y perfekt korreliert Christopher Krohn 8 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 4 – Mess- und Indexzahlen a) Messzahlen und Änderungsfaktoren / -raten - 𝑥𝑡 𝑚𝑖𝑡 𝑡 = {0,1, … , 𝑇} wird als Zeitreihe, die Zeitpunkte t als Messzeitpunkte bezeichnet (Beachte: Zeitpunkte t sind äquidistant) 𝑥 𝑚𝑘,𝑡 = 𝑥 𝑡 ist die Messzahl für die Berichtszeit t zur Basiszeit k (oft: k=0); äquivalent: 𝑘 Änderungs- oder Wachstumsfaktor 𝑚𝑘,𝑡 = 𝑥𝑡 𝑥𝑘 𝑥𝑠 𝑥𝑘 𝑥 = 𝑥𝑡 = 𝑚𝑠,𝑡 (neue Basis ist s) - Ggf. Umbasierung möglich: 𝑚 - Verschiedene Konzepte von „Veränderungen“: o Absolute Änderung: 𝑥𝑡 − 𝑥𝑘 𝑥 −𝑥 o Relative Änderung (Änderungsrate): 𝑟𝑘,𝑡 = 𝑡𝑥 𝑘 = 𝑚𝑘,𝑡 − 1 𝑘,𝑠 𝑠 𝑘 𝑥𝑡 o Änderungsfaktor (s.o.): 𝑚𝑘,𝑡 = 𝑥 𝑘 o Logarithmische Änderungsrate: 𝑤𝑘,𝑡 = 𝑙𝑛 - 𝑥𝑡 𝑥𝑘 = 𝑙𝑛𝑥𝑡 − 𝑙𝑛𝑥𝑘 (für hinreichend kleine 𝑟𝑘,𝑡 gilt 𝑟𝑘,𝑡 ≈ 𝑤𝑘,𝑡 , d. h. die logarithmische Änderung ist eine gute Annäherung) Durchschnittliche Änderungen (Beachte: es werden Ein-Perioden-Veränderungen betrachtet (k = t – 1)): 1⁄𝑇 𝑥 o Faktor: 𝑚 ̅ 𝑔 = (𝑚0,1 ∙ 𝑚1,2 ∙ … ∙ 𝑚 𝑇−1,𝑇 )1⁄𝑇 = ( 𝑥𝑇 ) 0 (geometrisches Mittel) o Rate: 𝑟̅ = 𝑚 ̅𝑔 − 1 1 o Logarithmisch: 𝑤 ̅ = 𝑇 𝑤0,𝑇 (arithmetisches Mittel) a) Indexzahlen - Es werden Warenkörbe konstruiert mit n Gütern, die durch Preise 𝑝𝑖,𝑡 und Mengen 𝑞𝑖,𝑡 charakterisiert sind Preisindizes: geben das Verhältnis zwischen dem Wert des Warenkorbs der Berichtszeit im Verhältnis zum Wert des Warenkorbs der Basiszeit, wenn… o Laspeyres: … man die Mengen aus der Basiszeit zur Bewertung heranzieht o Paasche: … man die Mengen aus der Berichtszeit zur Bewertung heranzieht (𝐹𝑖) (𝐿𝑎) o Fisher: bildet das geometrische Mittel aus den vorigen: 𝑃0,𝑡 = √𝑃0,𝑡 - (𝑃𝑎) ∙ 𝑃0,𝑡 Der Verbraucherpreisindex (VPI) gilt als ein Beispiel für einen Laspeyres-Preisindex (wird zur Deflationierung von Zeitreihen benutzt) Mengenindizes: funktionieren genau so, nur werden die Preise konstant gehalten, um Mengenänderungen zu analysieren Wertindex: analysiert Veränderungen des Wertes des Warenkorbs der Berichtszeit gegenüber dem Wert der Basiszeit Christopher Krohn 9 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 5 – Elementare Wahrscheinlichkeitsrechnung - - Neues Bild von Menge und Element (ähnlich zur deskriptiven Statistik): o Gesamtheit Ω ∶= Ergebnisraum o Element 𝜔 ∶= Ereignisbild Laplace-Wahrscheinlichkeit (Gleichmöglichkeitssatz): |𝐴| o 𝑃(𝐴) = |Ω| = - - - 𝑃(𝐴∩𝐵) 𝑃(𝐵) (sprich: Wahrscheinlichkeit von A unter der Bedingung B) Multiplikationssatz (Eintreten zweier Ereignisse): o 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵) ∗ 𝑃(𝐵) (Umstellen der Formel für die bedingte WS) o  WS, dass A und B eintreten ist gleich der WS, dass A eintritt, wenn B bereits eingetreten ist mal die WS, dass B überhaupt eintritt (entsprechend der 1. Pfadregel) Satz der totalen Wahrscheinlichkeit o 𝑃(𝐵) = ∑𝑚 𝑖=1 𝑃(𝐵|𝐴𝑖 ) ∗ 𝑃(𝐴𝑖 ) o Ausnutzen der Pfadregeln! o 1.) entlang des Pfades: Multiplizieren o 2.) Einzelpfade summieren Theorem von Bayes o Bedeutung: Die gewöhnliche chronologische Reihenfolge ist: erst tritt B ein, dann A (siehe bedingte WS) o Bayes: Reihenfolge umgekehrt o wir suchen𝑃(𝐵|𝐴), d. h. o wenn wir wissen, dass A das Ergebnis ist, wie groß ist dann die WS, dass vorher B eingetreten war o 𝑃(𝐵|𝐴) = - 𝐴𝑛𝑧𝑎ℎ𝑙 𝑑𝑒𝑟 𝑚ö𝑔𝑙𝑖𝑐ℎ𝑒𝑛 𝐸𝑟𝑒𝑖𝑔𝑛𝑖𝑠𝑠𝑒 Bedingte Wahrscheinlichkeit: o Beschränkung des Ergebnisraums Ω auf eine Menge B (neue „Grundgesamtheit“ B) o 𝑃(𝐴|𝐵) = - 𝐴𝑛𝑧𝑎ℎ𝑙 𝑑𝑒𝑟 𝑓ü𝑟 𝐴 𝑔ü𝑛𝑠𝑡𝑖𝑔𝑒𝑛 𝐸𝑟𝑒𝑖𝑔𝑛𝑖𝑠𝑠𝑒 𝑃(𝐵∩𝐴) 𝑃(𝐴) 𝑀𝑢𝑙𝑡𝑖𝑝𝑙𝑖𝑘𝑎𝑡𝑖𝑜𝑛𝑠𝑠𝑎𝑡𝑧 = 𝑆𝑎𝑡𝑧 𝑑𝑒𝑟 𝑡𝑜𝑡𝑎𝑙𝑒𝑛 𝑊𝑆 (s.o.) Unabhängigkeit o Bei Unabhängigkeit gilt: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵) o Laut Multiplikationssatz: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵) ∗ 𝑃(𝐵) o Warum gilt 𝑃(𝐴|𝐵) = 𝑃(𝐴)? Antwort: wegen der Unabhängigkeit ist B keine Bedingung für A Christopher Krohn 10 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 6 – Zufallsvariablen a) Übersicht Diskret Stetig f(x) f(x) 2/6 0.1 1/6 0.05 0 f(x) x -1 0 1 2 3 4 5 6 7 8 0 -4 -2 0 2 a 4 b 6 x 8 10 12 14 Wahrscheinlichkeitsfunktion Dichtefunktion 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) (Punkt-WS) (keine Punkt-WS; quasi-unmögliches Ereignis) F(x ) F(x ) 1 1 0.75 4/6 0.5 2/6 0.25 F(x) 0 x -1 0 1 2 3 4 5 6 Verteilungsfunktion 7 8 0 x -4 -2 0 2 4 6 8 10 12 14 Verteilungsfunktion 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) (Intervall-WS) (Intervall-WS) Abb. 2: Übersicht über Verteilungs-, Wahrscheinlichkeits-, Dichtefunktion (Abbildungen aus: Schuhr 2011, S. 168, 171, 173) - von Wahrscheinlichkeitsfunktion zu Verteilungsfunktion: Summe ∑ von Dichtefunktion zu Verteilungsfunktion: Integral ∫ Christopher Krohn 11 Institut für VWL, insb. Institutionenökonomische Umweltforschung b) Momente - Stetige Zufallsvariablen ∞ o Erwartungswert 𝐸(𝑋) = 𝜇 = ∫−∞ 𝑥 ∗ 𝑓(𝑥) 𝑑𝑥 (hierbei sind als Integrationsgrenzen -∞ bzw. +∞ die Grenzen des Definitionsbereiches der Dichtefunktion einzusetzen) ∞ o Allgemein gilt: 𝐸(𝑔(𝑥)) = ∫−∞ 𝑔(𝑥) ∗ 𝑓(𝑥) 𝑑𝑥 ∞ o Für 𝑔(𝑥) = 𝑥² ⇒ ∫−∞ 𝑥² ∗ 𝑓(𝑥) 𝑑𝑥 (wird für Varianz benötigt) - - - o Varianz 𝑉𝑎𝑟(𝑋) = 𝜎² = 𝐸(𝑋 2 ) − 𝐸(𝑋)² (Verschiebungssatz) Diskrete Zufallsvariablen o Erwartungswert 𝐸(𝑋) = 𝜇 = ∑𝑖 𝑥𝑖 ∗ 𝑓(𝑥𝑖 ) o Varianz 𝑉𝑎𝑟(𝑋) = 𝜎² = 𝐸(𝑋 2 ) − 𝐸(𝑋)² (Verschiebungssatz) Interpretation: o Ähnlich wie in deskriptiver Statistik o Erwartungswert für diskrete Variablen: Summe der Ausprägungen 𝑥𝑖 gewichtet mit deren WS 𝑓(𝑥𝑖 ) o Erwartungswert für stetige Variablen: gleiche Logik, hier wird lediglich das Integral benötigt o Varianz: nach wie vor „mittlere (erwartete) quadratische Abweichung vom Mittelwert (bzw. Erwartungswert)“ Quantile: 𝑃(𝑋 ≤ 𝑥[𝑝] ) = 𝐹(𝑥[𝑝] ) (Bsp. Median: Wahrscheinlichkeit, dass Werte kleiner oder gleich dem Median sind, ist 50 %, was dem Wert der Verteilungsfunktion an der Stelle des Medians entspricht) Christopher Krohn 12 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 7 – Spezielle Verteilungsmodelle a) diskrete Verteilungsmodelle - - - Gleichverteilung 𝑋~𝑈(𝑚) o Alle Ausprägungen haben die gleiche WS Binomialverteilung 𝑋~𝐵(𝑛, 𝑝) o Basis: Bernoulli-Versuch  es gibt nur 2 mögliche Ausgänge des Versuchs: Erfolg (𝐴) oder Misserfolg (𝐴̅) o Die Variable X ist definiert als: X… Anzahl der Erfolge o (Ein) Erfolg tritt mit WS p ein: 𝑃(𝐴) = 𝑝 ⇒ 𝑃(𝐴̅) = 1 − 𝑝 o Der Bernoulli-Versuch wird n-mal wiederholt o Dabei bleibt p konstant (Unabhängigkeit) o 𝑃(𝑋 = 𝑥) = 𝑓(𝑥) = (𝑛𝑥)𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 (Baumdiagramm!) Poissonverteilung 𝑋~𝑃𝑜(𝜆) o „Verteilung seltener Ereignisse“  geht aus Binomialverteilung hervor, wenn n sehr hoch und p sehr gering ist o Es existiert ein Zeitintervall, … o Das für die WS des Eintretens des Erfolgs ausschlaggebend ist Geometrische Verteilung 𝑋~𝐺(𝑝) o X… Anzahl der Misserfolge bis zum ersten Erfolg o  Erfolgs-WS p definiert wie bei der Binomialverteilung o  es gilt für x Fehlversuche bis der erste Erfolg eintritt ((x+1)-te Wiederholung!): 𝑃(𝑥) = 𝑓(𝑥) = (1 − 𝑝)𝑥 ∗ 𝑝 (Baumdiagramm!) Christopher Krohn 13 Institut für VWL, insb. Institutionenökonomische Umweltforschung - Hypergeometrische Verteilung 𝑋~𝐻(𝑛, 𝑁, 𝑀) o Zufallsversuche ohne Zurücklegen o Grundgesamtheit N, M davon besitzen eine interessierende Eigenschaft o Binomialkoeffizient (𝑁𝑛)… Anzahl der möglichen Stichproben beim Ziehen von n Elementen aus der Menge N o Bsp.: Lotto (6 aus 49); X… Anzahl der Richtigen o 𝑋~𝐻(𝑛 = 6, 𝑁 = 49, 𝑀 = 6); M: 6 Zahlen sind richtig; n: 6 Zahlen werden getippt; N: insgesamt gibt es 49 Zahlen (Zahlen können nicht mehr als einmal auf dem Tippschein auftauchen  ohne Zurücklegen) b) stetige Verteilungsmodelle - - Rechteckverteilung 𝑋~𝑅(𝛼, 𝛽) o Stetige Gleichverteilung Exponentialverteilung 𝑋~𝐸𝑥(𝜆) o Lebensdauern, Zeitspannen, Wartezeiten o Markov-Eigenschaft: Gedächtnislosigkeit Normalverteilung 𝑋~𝑁(𝜇, 𝜎 2 ) o Nahezu alle Variablen sind in der Realität näherungsweise normalverteilt (bei genügend großem n) o Standardisierung: 𝑍 = 𝑋−𝜇 𝜎  hatte X zuvor Erwartungswert 𝜇 und Varianz 𝜎 2 , so gilt jetzt 𝐸(𝑍) = 0 und außerdem 𝑉𝑎𝑟(𝑍) = 1 c) Stichprobenverteilungen - Chi-Quadrat-Verteilung 𝑋~𝜒²(𝑛) Student-t-Verteilung 𝑋~𝑡(𝑛) Fisher-F-Verteilung 𝑋~𝐹(𝑛, 𝑚) Christopher Krohn 14 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 8 – Parameterschätzungen a) Punktschätzungen - - Für eine Zufallsvariable X werden n Stichproben gezogen und entsprechende Stichprobenvariablen erstellt (𝑋1 , 𝑋2 , … , 𝑋𝑛 ); es sind gewisse Parameter unbekannt, die geschätzt werden sollen Gesucht: Schätzfunktion 𝑇(𝑛, 𝜃), die einen interessierenden Parameter 𝜃 der Verteilung von X möglichst gut annähert Dazu müssen gewisse Eigenschaften erfüllt sein Erwartungstreue: 𝐸(𝑇𝑛,𝜃 ) = 𝜃  wenn sehr viele Stichproben gezogen werden, muss die Schätzfunktion den Parameter 𝜃 treffen Konsistenz: Erwartungstreue muss gelten, UND: lim𝑛→∞ 𝑉𝑎𝑟(𝑇𝑛,𝜃 ) = 0  bei unendlich großer Stichprobe muss die Varianz der Schätzung verschwinden erwartungstreuer Schätzer für 𝐸(𝑋): 𝑋̅ erwartungstreuer Schätzer für 𝑉𝑎𝑟(𝑋): 𝑆 2 ≠ 𝑠̃ 2 (!), da durch n-1 geteilt wird b) Intervallschätzungen - mit Punktschätzung wird wahrer Parameter nie auf den Punkt genau getroffen (ähnlich zum quasiunmöglichen Ereignis) stattdessen wird ein Intervall geschätzt, das den Parameter 𝜃 mit WS 1 − 𝛼 abdeckt Vorgehen: 1. Welcher Parameter wird geschätzt? (𝜇, 𝜎 2 , 𝑝) 2. Welche Verteilung liegt für X vor? 3. In Formelsammlung entsprechende Formel für das Konfidenzintervall nutzen Christopher Krohn 15 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 9 - Hypothesentests - Hypothesen: Vermutungen / Aussagen über WS-Verteilungen Vorgehen: 1. Art des Tests  Momente einer Verteilung: 1-Stichproben-Test, z. B. 𝜃 = 𝜃0 (Vgl. mit vorgegebenem Wert)  Vgl. der Momente zweier Verteilungen: 2- Stichproben-Test, z. B. 𝜃1 = 𝜃2 (Vgl. der verteilungen)  Test auf Verteilung: Anpassungstest, 𝐹(𝑥) = 𝐹0 (𝑥) 2. Was wird getestet? (falls nicht Anpassungstest)  Erwartungswert 𝜇  Varianz 𝜎 2  Erfolgs-WS 𝑝 3. Verteilung feststellen 4. Entsprechende Formel nutzen (entlang der Spalten vorgehen)  Aufstellen der Hypothesen  Berechnung der Teststatistik  Nachschlagen der kritischen Werte in der entsprechenden Tabelle 5. Entscheidung treffen  Fällt die Teststatistik in den kritischen Bereich, so wird 𝐻0 abgelehnt Christopher Krohn 16 Institut für VWL, insb. Institutionenökonomische Umweltforschung Kapitel 10 - Regressionsanalyse - - - - - - Erweiterung der Korrelationsrechnung Bisher: Zusammenhang zweier Variablen, jetzt: Kausalität  Welche Variable beeinflusst welche? Linearer Zusammenhang wird unterstellt: 𝑌 = 𝑎 + 𝑏𝑋 („wahres Modell“) Parameter a und b sind unbekannt  werden geschätzt: 𝑦̂ = 𝑎̂ + 𝑏̂𝑥 („geschätztes Modell“) Y… Regressand, endogene Variable, abhängige Variable X… Regressor, exogene Variable, unabhängige Variable Schätzmethode: KQ-Methode (Kleinste Quadrate: Quadratische Abweichungen der Schätzungen 𝑦̂ von den tatsächlichen Werten 𝑦) Abweichungen werden auch Residuen genannt: 𝑢̂𝜈 = 𝑦𝜈 − 𝑦̂𝜈 o 𝑢̂𝜈 > 0  Unterschätzung o 𝑢̂𝜈 < 0  Überschätzung Streuung der abhängigen Variablen y: TSS = RSS + ESS o 𝑇𝑆𝑆 = ∑( 𝑦𝜈 − 𝑦̅𝜈 )²  Gesamtstreuung: Abweichungen der Variable Y vom Mittelwert; ähnlich wie bei Varianz o 𝑅𝑆𝑆 = ∑( 𝑦𝜈 − 𝑦̂𝜈 )² = ∑ 𝑢̂𝜈 2  Residualstreuung / nicht-erklärte Streuung: Summe der quadrierten Schätzfehler o 𝐸𝑆𝑆 = ∑( 𝑦̂𝜈 − 𝑦̅)²  erklärte Streuung: inwieweit kann die Streuung durch die Schätzung erklärt werden  Abweichungen der geschätzten Werte vom Mittelwert, welche durch die Schätzgerade zustande kommen, letztere wiederum variiert mit x  dies ist der erklärte Teil 𝐸𝑆𝑆 2 𝑅 2 = 𝑇𝑆𝑆 = 𝑟𝑥𝑦  Interpretation: Anteil der erklärten Streuung an der Gesamtstreuung, wie viel Prozent der Gesamtstreuung kann durch die Schätzung erklärt werden  „Erklärungsgüte“ Geschätzte Parameter können getestet werden o 𝐻0 : 𝑎 = 0  Ist der Parameter a signifikant von 0 verschieden? o 𝐻0 : 𝑏 = 0  Ist der Parameter b signifikant von 0 verschieden?  besonders interessant, da bei Nicht-Verwerfung von 𝐻0 : 𝑏 = 0 gilt: 𝑦 = 𝑎 + 0 ∗ 𝑥 = 𝑎, folglich gilt, dass x keinen Einfluss auf y hat Interpretation der Parameter o a: Wenn x = 0 ist, dann ist y = a o b: Wenn x um eine Einheit steigt, so steigt y um b Einheiten (Anstiegsparameter) mit Werten für 𝑎̂ und 𝑏̂ und einer Vorgabe für x (𝑥0 ) kann prognostiziert werden: 𝑦̂0 = 𝑎̂ + 𝑏̂𝑥0 (Punktprognose, ggf. kann auch ein Intervall bestimmt werden Christopher Krohn 17 Institut für VWL, insb. Institutionenökonomische Umweltforschung

Statistik Zusammenfassung: Prüfungsvorbereitung

Products

Support

Statistik Zusammenfassung: Prüfungsvorbereitung

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib