MULTIVARIATE DATEN (1) TEIL 5 1 Vorbereitung auf Vorlesung und Übung ▪ Beachten Sie die Ethik und Verhaltensregeln des RRZK und aus Vorlesung 1 ▪ Melden Sie sich mit Ihrem vollständigen Namen und Uni Köln account an ▪ Schalten Sie Ton und Video aus ▪ Empfehlung: Bereiten Sie Ihren Arbeitsplatz vor dem Online-Unterricht ordentlich vor: ▪ Halten alle notwendigen Unterrichtsmaterialien und Schreibzeug bereit. ▪ Zoom aus PC oder Großem Tablet wg Bildern notwendig ▪ Fragen erfolgen als Nachricht im Chat an DozentIn oder Meldung per Handzeichen (nur in Übung) ▪ Rückmeldung Buttons 2 Video vom Montag gesehen? 3 Agenda Zusammenfassung: Visualisierungstechniken für multivariate quantitative Daten 1. Scatterplotmatrix (Rolling the dice) 2. Radial Plots 3. Parallele Koordinaten Data Item V1 V2 V3 V4 V5 V6 4 … Vn Agenda Erweiterung: Visualisierungstechniken für multivariate quantitative Daten 1. Scatterplotmatrix (Rolling the dice) 2. Radial Plots 3. Parallele Koordinaten Data Item V1 V2 V3 V4 V5 V6 1-3 Vertiefung und Flexible Achsen 4. Glyphen - Chernoff Faces 5. RadViz 6. Principal Component Analysis (PCA) 5 … Vn ZUSAMMENFASSUNG 6 Datentabellen nD = multivariate Daten n = (3+) 4+ Data Item V1 V2 V3 V4 V5 V6 … Vn 7 Scatterplot Matrix (SPLOM oder SCM) ▪(Iris Datensatz) Scatterplotmatrix: + paarweise Relationen + Verständlichkeit - Relationen mehrerer Variablen - Platz - Objektkorrespondenz 8 Identifizieren sie Korrespondenz des Punkts 1 in der Scatterplotmatrix A B D C 1 10 Identifizieren sie Korrespondenz des Punkts 2 in der Scatterplotmatrix A B D C 2 11 Identifizieren sie Korrespondenz des ausgewählten Punkts in der Scatterplotmatrix Wie würde „Rolling the Dice“ diese Aufgabe unterstützen? 12 RadialPlot oder StarPlot IDEE Y X x1 x1,y1 X y1 13 Y RadialPlot oder StarPlot ▪(Iris Datensatz) Radial/Star Plot: + Relationen mehrerer Variablen - Abhängig von Achsenreihenfolge - Wahrnehmungsprobleme 0 (ungeeignet) für bipolare Daten 14 Parallele Koordinaten IDEE Y X Y x1 x1,y1 y1 X 15 Parallele Koordinaten (PCP) ▪(Iris Datensatz) Paralelle Koordinaten: + Relationen mehrerer Variablen 0 Platz - Abhängig von Achsenreihenfolge - Möglicherweise uneindeutig 16 Parallele Koordinaten – Overplotting ▪ Problem: ▪ Overplotting ▪ Lösung: ▪ Dimension umsortieren Problem: Manuelles Umsortieren: n! Möglichkeiten! 18 ERWEITERUNG 20 Zusammenhang SCM und PCP Y X x1 x1,y1 X y1 21 Beispiel 1 22 Beispiel 1 Antwort 1 Antwort 2 23 24 Beispiel 2 25 Beispiel 2 26 27 FLEXIBLE AXES 28 29 Flexible Axis 30 SCM – PCP Korrespondenz 31 SCM – PCP Korrespondenz 32 Brushing Patterns 33 Brushing Patterns 34 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 35 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 36 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 37 Achse Umdrehen 38 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 39 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 40 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 41 SCM und PCP Achsen Physik Physik Mathe Literatur 100% Literatur Mathe 0% Physik Literatur Mathe 42 Flexible axes 43 Flexible axes 44 Flexible Achsen ▪Ihre Meinung? 45 GLYPHS - CHERNOFF FACES 46 nD Daten Möglichkeiten für quantitative Daten 1. 2. 3. 4. Multiple Scatterplots Star Plots Parallele Koordinaten Glyphs - Chernoff faces Data Item V1 V2 V3 V4 V5 47 V6 … Vn Glyphs – Chernoff faces Variablen werden als Gesichtsmerkmale abgebildet 48 Glyphs – Chernoff faces Variablen werden als Gesichtsmerkmale abgebildet Vorteile: Menschen können Gesichter intuitiv sehr gut unterscheiden Viele Variablen abbildbar Mund, Augen, Augenbrauen, Haare, Ohren, Nase, Gesichtform, … 49 Glyphs – Chernoff faces 50 Glyphs – Chernoff faces ▪Vorteil: ▪Problem: 52 Glyphs – Chernoff faces ▪Vorteil: Kein Overplotting ▪Problem: viele Merkmale auf ein Mal schwer vergleichbar 53 Glyphs – Chernoff faces ▪Problem 2: 54 Glyphs – Chernoff faces ▪Problem 2: viele Objekte schwer vergleichbar 55 Chernoff Faces (Iris Datensatz) Chernoff Faces: + Relationen mehrerer Variablen + Überlappungsfrei - Platz - Schwierig Werte Ablesen und vergleichen 56 RADVIZ 59 nD Daten Möglichkeiten für Quantitative Daten 1. 2. 3. 4. 5. Multiple Scatterplots Star plots Parallele Koordinaten Glyph - Chernoff faces Radviz V1 V2 V3 V4 60 V5 V6 … Vn RadViz ▪ Es ist eine Art Projektion nD→ 2D ▪ Idee: Punkte im Kreis so zu positionieren, dass die Kräfte die auf den Punkt wirkenden den Werten entsprechen 61 RadViz ▪ Es ist eine Art Projektion nD→ 2D ▪ Idee: Punkte im Kreis so zu positionieren, dass die Kräfte die auf den Punkt wirkenden den Werten entsprechen Algo: 1. Normalize data [0;1] (→ stiffness/weights) 2. Place dimensional anchors Si 3. calculate u1,u2 and place the objects 62 RadViz Oid S1 S2 S3 S4 O1 O2 O3 O4 O5 1 1 3 5 1 0 1 3 5 1 0 1 0 5 2 0 1 0 5 2 63 RadViz Oid S1 S2 S3 S4 O1 O2 O3 O4 O5 1 1 3 5 1 0 1 3 5 1 0 1 0 5 2 0 1 0 5 2 64 RadViz S1 Oid S1 S2 S3 S4 O1 O2 O3 O4 O5 1 1 3 5 1 0 1 3 5 1 0 1 0 5 2 0 1 0 5 2 S4 S2 S3 65 RadViz – Identifizieren Sie die Korrespondenz S1 Oid S1 S2 S3 S4 O1 O2 O3 O4 O5 1 1 3 5 1 0 1 3 5 1 0 1 0 5 2 0 1 0 5 2 A B E S4 S2 C D S3 66 RadViz – Identifizieren Sie die Korrespondenz S1 Oid S1 S2 S3 S4 O1 O2 O3 O4 O5 1 1 3 5 1 0 1 3 5 1 0 1 0 5 2 0 1 0 5 2 A B E S4 S2 C D S3 67 RadViz S1 Oid S1 S2 S3 S4 O1 O2 O3 O4 O5 1 1 3 5 1 0 1 3 5 1 0 1 0 5 2 0 1 0 5 2 A-O1 B – O3 E S4 S2 C– O2,O5 D – O5 S3 68 nD Daten – RadViz ▪RadViz ▪Vorteile: ▪ Platzsparend ▪ Relative Datenverhältnisse gut sichtbar ▪Probleme: ▪ Position der Objekte hängt von Anordnung der Koordinaten ab ▪ Punktposition ist nicht eindeutig (2 Punkte mit verschiedenen Werten können auf der gleichen Position landen) 69 RadViz (Iris Datensatz) RadViz: + Relationen mehrerer Variablen + Platzsparend 0 nur relationen der Werte ablesbar - Uneindeutig - Abhängig von Achsenreihenfolge 70 PRINCIPAL COMPONENT ANALYSIS (PCA) 71 Datentabellen nD = multivariate Daten n = (3+) 4+ Data Item V1 V2 V3 V4 V5 V6 … Vn 72 PCP ▪(Iris Datensatz) Paralelle Koordinaten: + Relationen mehrere Variablen 0 Platz - Abhängig von Achsenreihenfolge - Möglicherweise uneindeutig 73 Problem von vielen Dimensionen ▪Beispiel ▪Gesprochene Buchstaben – letter recognition ▪1559 audio samples of the letters A to Z spoken by different persons (26 letters) ▪The samples are represented by 616-dimensional feature vectors encoding certain aural properties of the samples. 74 Hauptkomponentenanalyse (Principal Component Analysis, PCA) Dimensionsreduktion ▪ Multivariate Daten X → Y ▪ Dimensionen D→ m, m<D Eingabe Anwendung ▪ Visualisierung ▪ Techniken für niedrige Dimensionen anwendbar, z.B. Scatterplot Ergebnis 75 PCA Beispiel: Gesprochene Buchstaben U, Q Y P, T, V A, J, K, H 76 Interesse an Visualisierung und Visual Analytics? Haben Sie Interesse an ▪ Interaktiver Visualisierung und Datenanalyse? ▪ Spannende Themen bearbeiten? ▪ Neues entdecken und erforschen? ▪ Ergebnisse Präsentieren? ▪Wir bieten ▪ Doktorandenstellen ▪ Studentische Hilfskräfte ▪ Bachelor/Masterarbeiten ▪ Seminar im WS Visualization 0.92 0.99 Wissen Data ▪Sprechen Sie uns an!!! Machine Learning 92 Umfrage zu Visualisierung von Social Distancing in VR ▪ 6 kurze Videos ▪ Fragen beantworten ▪ Deutsch / Englisch ▪ Farbschwächen berücksichtigt ▪ Circa 15 bis 25 Minuten English Deutsch : https://www2.visus.uni-stuttgart.de/limesurvey/index.php?r=survey/index&sid=875826&lang=en : https://www2.visus.uni-stuttgart.de/limesurvey/index.php?r=survey/index&sid=875826&lang=de 94 VIELEN DANK FÜR IHRE AUFMERKSAMKEIT 95