Uploaded by luca.gmuer

Statistik Cheat Sheet v1

advertisement
1.1 Datenerhebung,Skalen,Beschreibungvon Daten
Primärdaten vs. Sekundärdaten
Stat. Grundgesamtheit: Einheiten mit denselben Ausprägungen sachlicher,
zeitlicher und räumlicher Identifikationsmerkmale, Beobachtungswerte erheben
οƒ  einzelnen Merkmalsträgern werden Merkmalsausprägungen zugeordnet
Merkmalsart
Skala
Eigenschaften
Beispiele
Qualitativ
Nominalskala
Geschlecht
Komparativ
Ordinalskala
Quantitativ
(metrisch)
Intervallskala
Quantitativ
(metrisch)
Verhältnisskala
A=B oder A!=B
Verschiedenartigkeit
A=B, A<B, A>B
Rangfolge möglich
Ordinal +
Randordnung
Abstandbestimmung
möglich
Intervall + absoluter
Nullpunkt,
Berechnung
Verhältnisse möglich
Nur sie erlauben
Mal/geteilt-rechnen
Noten,
Bonitätsklassen
Geburtsjahr,
Normabweichung
Preise,
Einkommen
Qualitative Variablen: Zuordnung ObjekteKategorie
Quantitative Variablen: Zuordnung Objekte οƒ  Werte
Diskret: Annahme endlicher Anzahl Werten
Kontinuierlich: Annahme jedes reellen Wert
Datenbeschreibung: grafisch mittels: Häufigkeitsverteilung, emp.
Verteilungsfunktion (Treppenf.), Balkendiagramm, Häufigkeitsverteilung =
Histogramm (Fläche=1)
Normierte rel. Häufigkeit:
𝛿𝑖 (π‘₯)
𝛿 𝑦 (π‘₯𝑖 ) =
βˆ†π‘₯𝑖
1.2 Lageparameter
Mittelwert:
πœ‡ (GG) =
∑𝑁𝑖=1 𝑋𝑖
𝑁
; π‘₯ (Stichprobe) =
∑𝑁𝑖=1 π‘₯𝑖
𝑛
N=Anzahl Beobachtungen GG, n=Anzahl Beobachtungen Stichprobe,
X=Beobachungen GG, x Beobachtungen Stichprobe
Arithmetisches Mittel:
∑π‘΅π’Š=𝟏 π‘Ώπ’Š
πœ‡=
𝑡
Gewichtetes arithmetisches Mittel:
∑π‘΅π’Š=𝟏 π’˜π’Š π‘Ώπ’Š
πœ‡=
∑π‘΅π’Š=𝟏 π’˜π’Š
Gewichtetes Harmonisches Mittel: (für Verhältniszahlen, Anteilswerte, x als
Anteilswert, n als Anzahl, wenn ungewichtet steht statt n im Nenner einfach 1):
∑π‘˜π‘–=1 𝑛𝑖
πœ‡=
𝑛
∑π‘˜π‘–=1 𝑖
π‘₯𝑖
Geometrisches Mittel: für prozentuale Veränderungen (z.B. Wachstumsraten) (X
als Wachstumsraten) (falls gewichtet, dann jeweilige X mit absoluter Häufigkeit
hochrechnen):
𝐺π‘₯Μ… = 𝑛√𝑋1 ∗ … ∗ 𝑋𝑖
Median: teilt die Beobachtungen genau in der Mitte οƒ  bei gerader Anzahl beide
mittlere halbieren
Modus: häufigster Wert der Stichprobe
Symm. Verteilung οƒ  Mittelwert = Median = Modus, Schiefe = 0
Schiefe: Positiv: Mittelwert > Median > Modus (rechtsschief, linkssteil)
Negativ: Mittelwert < Median < Modus (linksschief, rechtssteil)
οƒ  zeigt untersch. Häufung am Ende der Verteilungen, dort wo schief
1.3 Streuungsparameter
Varianz:
𝜎 2 (GG) =
∑𝑁𝑖=1(𝑋𝑖 − πœ‡)2
𝑁
; 𝑠 2(Stichprobe) =
∑𝑛𝑖=1(π‘₯𝑖 − π‘₯Μ… )2
𝑛−1
n-1 notwendig, da Erwartungstreue und Varianz dadurch erhöht
Standardabweichung: Grundgesamtheit: 𝜎 = √𝜎 2 / Stichprobe: 𝑠 = √𝑠 2
Mittlere absolute Abweichung:
∑𝑁𝑖=1|𝑋𝑖 − πœ‡|
∑𝑛𝑖=1|π‘₯𝑖 − π‘₯Μ… |
𝑀𝐴𝐷 (GG) =
; 𝑀𝐴𝐷(Stichprobe) =
𝑁
𝑛−1
Quartilsabstand: Spannweite der mittleren 50% der Stichprobe, einzelne Quartile
Lageparameter, Quartilsabstand Streuungsparameter
Quartil/Dezil: wobei #: wievielte Position und Z: Anzahl
Unterteilungen
#(𝑛 + 1)
= π‘₯[
]
𝑍
Boxplots:
Spannweite: π‘‹π‘šπ‘Žπ‘₯ − π‘‹π’Žπ’Šπ’
𝑠π‘₯
Variationskoeffizient: 𝑉𝐢π‘₯ =
|𝒙
Μ…|
Chebyshev Theorem: (auch auf bimodale Vert. anwendbar) prozentualer Anteil,
der innert k Standardabweichungen um den Mittelwert liegt beträgt mindestens
1
(1 − 2) ∗ 100%
π‘˜
Faustregeln für glockenförmige, symm. Verteilungen: 68% innert einer SD, 95%
innert zwei SD, 99.7% innert drei SD
Kurtosis: im Vergleich zur Normalverteilung schmal-(Kurtosis hoch)/breitgipflig
(Kurtosis tief)
Kurtosis Normalverteilung = 3; Exzess Kurtosis = Kurtosis – 3
2.1 Korrelation vs. Kausalität
Korrelation: Zusammenhang zwischen Variablen, (keine) Ursache-Wirkung-ZSHG
Kausalität: zwei Variablen mit Ursache-Wirkung-ZSHG
Korrelationskoeffizient (𝝆): Messung Stärke/Ausgeprägtheit eines statistischen
ZSHG zweier metrisch messbarer Merkmale
Perfekte negative Korrelation (𝜌 = −1) – keine Korrelation (𝜌 = 0) – perfekte
positive Korrelation (𝜌 = 1)
Standardisiertes Mass οƒ  unabhängig von der Masseinheit
πΎπ‘œπ‘£π‘Žπ‘Ÿπ‘–π‘Žπ‘›π‘§ (𝑋, π‘Œ)
πΎπ‘œπ‘£π‘Žπ‘Ÿπ‘–π‘Žπ‘›π‘§ (π‘₯, 𝑦)
𝜌 (GG) =
; π‘Ÿ (Stichprobe) =
πœŽπ‘‹ πœŽπ‘Œ
𝑠π‘₯ 𝑠𝑦
Kovarianz:
∑𝑁𝑖=1(𝑋𝑖 − πœ‡π‘‹ ) (π‘Œπ‘– − πœ‡π‘Œ )
∑𝑛𝑖=1(π‘₯𝑖 − π‘₯Μ… )(𝑦𝑖 − 𝑦̅)
πΆπ‘œπ‘£(𝐺𝐺) =
; πΆπ‘œπ‘£(π‘†π‘‘π‘–π‘β„Žπ‘π‘Ÿπ‘œπ‘π‘’) =
𝑁
𝑛−1
∑𝑛𝑖=1(π‘₯𝑖 𝑦𝑖 ) − 𝑛π‘₯Μ… 𝑦̅
=
𝑛−1
Kovarianz lässt nur Richtung beurteilen, da nicht standardisiert
Korrelationskoeffizient lässt Richtung & Stärke beurteilen
Download