1.1 Datenerhebung,Skalen,Beschreibungvon Daten Primärdaten vs. Sekundärdaten Stat. Grundgesamtheit: Einheiten mit denselben Ausprägungen sachlicher, zeitlicher und räumlicher Identifikationsmerkmale, Beobachtungswerte erheben ο einzelnen Merkmalsträgern werden Merkmalsausprägungen zugeordnet Merkmalsart Skala Eigenschaften Beispiele Qualitativ Nominalskala Geschlecht Komparativ Ordinalskala Quantitativ (metrisch) Intervallskala Quantitativ (metrisch) Verhältnisskala A=B oder A!=B Verschiedenartigkeit A=B, A<B, A>B Rangfolge möglich Ordinal + Randordnung Abstandbestimmung möglich Intervall + absoluter Nullpunkt, Berechnung Verhältnisse möglich Nur sie erlauben Mal/geteilt-rechnen Noten, Bonitätsklassen Geburtsjahr, Normabweichung Preise, Einkommen Qualitative Variablen: Zuordnung Objekteο Kategorie Quantitative Variablen: Zuordnung Objekte ο Werte Diskret: Annahme endlicher Anzahl Werten Kontinuierlich: Annahme jedes reellen Wert Datenbeschreibung: grafisch mittels: Häufigkeitsverteilung, emp. Verteilungsfunktion (Treppenf.), Balkendiagramm, Häufigkeitsverteilung = Histogramm (Fläche=1) Normierte rel. Häufigkeit: πΏπ (π₯) πΏ π¦ (π₯π ) = βπ₯π 1.2 Lageparameter Mittelwert: π (GG) = ∑ππ=1 ππ π ; π₯ (Stichprobe) = ∑ππ=1 π₯π π N=Anzahl Beobachtungen GG, n=Anzahl Beobachtungen Stichprobe, X=Beobachungen GG, x Beobachtungen Stichprobe Arithmetisches Mittel: ∑π΅π=π πΏπ π= π΅ Gewichtetes arithmetisches Mittel: ∑π΅π=π ππ πΏπ π= ∑π΅π=π ππ Gewichtetes Harmonisches Mittel: (für Verhältniszahlen, Anteilswerte, x als Anteilswert, n als Anzahl, wenn ungewichtet steht statt n im Nenner einfach 1): ∑ππ=1 ππ π= π ∑ππ=1 π π₯π Geometrisches Mittel: für prozentuale Veränderungen (z.B. Wachstumsraten) (X als Wachstumsraten) (falls gewichtet, dann jeweilige X mit absoluter Häufigkeit hochrechnen): πΊπ₯Μ = π√π1 ∗ … ∗ ππ Median: teilt die Beobachtungen genau in der Mitte ο bei gerader Anzahl beide mittlere halbieren Modus: häufigster Wert der Stichprobe Symm. Verteilung ο Mittelwert = Median = Modus, Schiefe = 0 Schiefe: Positiv: Mittelwert > Median > Modus (rechtsschief, linkssteil) Negativ: Mittelwert < Median < Modus (linksschief, rechtssteil) ο zeigt untersch. Häufung am Ende der Verteilungen, dort wo schief 1.3 Streuungsparameter Varianz: π 2 (GG) = ∑ππ=1(ππ − π)2 π ; π 2(Stichprobe) = ∑ππ=1(π₯π − π₯Μ )2 π−1 n-1 notwendig, da Erwartungstreue und Varianz dadurch erhöht Standardabweichung: Grundgesamtheit: π = √π 2 / Stichprobe: π = √π 2 Mittlere absolute Abweichung: ∑ππ=1|ππ − π| ∑ππ=1|π₯π − π₯Μ | ππ΄π· (GG) = ; ππ΄π·(Stichprobe) = π π−1 Quartilsabstand: Spannweite der mittleren 50% der Stichprobe, einzelne Quartile Lageparameter, Quartilsabstand Streuungsparameter Quartil/Dezil: wobei #: wievielte Position und Z: Anzahl Unterteilungen #(π + 1) = π₯[ ] π Boxplots: Spannweite: ππππ₯ − ππππ π π₯ Variationskoeffizient: ππΆπ₯ = |π Μ | Chebyshev Theorem: (auch auf bimodale Vert. anwendbar) prozentualer Anteil, der innert k Standardabweichungen um den Mittelwert liegt beträgt mindestens 1 (1 − 2) ∗ 100% π Faustregeln für glockenförmige, symm. Verteilungen: 68% innert einer SD, 95% innert zwei SD, 99.7% innert drei SD Kurtosis: im Vergleich zur Normalverteilung schmal-(Kurtosis hoch)/breitgipflig (Kurtosis tief) Kurtosis Normalverteilung = 3; Exzess Kurtosis = Kurtosis – 3 2.1 Korrelation vs. Kausalität Korrelation: Zusammenhang zwischen Variablen, (keine) Ursache-Wirkung-ZSHG Kausalität: zwei Variablen mit Ursache-Wirkung-ZSHG Korrelationskoeffizient (π): Messung Stärke/Ausgeprägtheit eines statistischen ZSHG zweier metrisch messbarer Merkmale Perfekte negative Korrelation (π = −1) – keine Korrelation (π = 0) – perfekte positive Korrelation (π = 1) Standardisiertes Mass ο unabhängig von der Masseinheit πΎππ£ππππππ§ (π, π) πΎππ£ππππππ§ (π₯, π¦) π (GG) = ; π (Stichprobe) = ππ ππ π π₯ π π¦ Kovarianz: ∑ππ=1(ππ − ππ ) (ππ − ππ ) ∑ππ=1(π₯π − π₯Μ )(π¦π − π¦Μ ) πΆππ£(πΊπΊ) = ; πΆππ£(ππ‘ππβπππππ) = π π−1 ∑ππ=1(π₯π π¦π ) − ππ₯Μ π¦Μ = π−1 Kovarianz lässt nur Richtung beurteilen, da nicht standardisiert Korrelationskoeffizient lässt Richtung & Stärke beurteilen