Uploaded by William Shi

V9MultivariateB

advertisement
MULTIVARIATE DATEN (1)
TEIL 5
1
Vorbereitung auf Vorlesung und Übung
▪ Beachten Sie die Ethik und Verhaltensregeln des RRZK und aus Vorlesung 1
▪ Melden Sie sich mit Ihrem vollständigen Namen und Uni Köln account an
▪ Schalten Sie Ton und Video aus
▪ Empfehlung: Bereiten Sie Ihren Arbeitsplatz vor dem Online-Unterricht ordentlich vor:
▪ Halten alle notwendigen Unterrichtsmaterialien und Schreibzeug bereit.
▪ Zoom aus PC oder Großem Tablet wg Bildern notwendig
▪ Fragen erfolgen als Nachricht im Chat an DozentIn oder
Meldung per Handzeichen (nur in Übung)
▪ Rückmeldung Buttons
2
Video vom Montag gesehen?
3
Agenda
Zusammenfassung:
Visualisierungstechniken für multivariate quantitative Daten
1. Scatterplotmatrix
(Rolling the dice)
2. Radial Plots
3. Parallele Koordinaten
Data
Item
V1
V2
V3
V4
V5
V6
4
…
Vn
Agenda
Erweiterung:
Visualisierungstechniken für multivariate quantitative Daten
1. Scatterplotmatrix
(Rolling the dice)
2. Radial Plots
3. Parallele Koordinaten
Data
Item
V1
V2
V3
V4
V5
V6
1-3 Vertiefung und Flexible Achsen
4. Glyphen - Chernoff Faces
5. RadViz
6. Principal Component Analysis (PCA)
5
…
Vn
ZUSAMMENFASSUNG
6
Datentabellen
nD = multivariate Daten
n = (3+) 4+
Data
Item
V1
V2
V3
V4
V5
V6
…
Vn
7
Scatterplot Matrix (SPLOM oder SCM)
▪(Iris Datensatz)
Scatterplotmatrix:
+ paarweise Relationen
+ Verständlichkeit
- Relationen mehrerer Variablen
- Platz
- Objektkorrespondenz
8
Identifizieren sie Korrespondenz des Punkts 1 in der Scatterplotmatrix
A
B
D
C
1
10
Identifizieren sie Korrespondenz des Punkts 2 in der Scatterplotmatrix
A
B
D
C
2
11
Identifizieren sie Korrespondenz des ausgewählten Punkts in der Scatterplotmatrix
Wie würde „Rolling the
Dice“ diese Aufgabe
unterstützen?
12
RadialPlot oder StarPlot
IDEE
Y
X
x1
x1,y1
X
y1
13
Y
RadialPlot oder StarPlot
▪(Iris Datensatz)
Radial/Star Plot:
+ Relationen mehrerer Variablen
- Abhängig von Achsenreihenfolge
- Wahrnehmungsprobleme
0 (ungeeignet) für bipolare Daten
14
Parallele Koordinaten
IDEE
Y
X
Y
x1
x1,y1
y1
X
15
Parallele Koordinaten (PCP)
▪(Iris Datensatz)
Paralelle Koordinaten:
+ Relationen mehrerer Variablen
0 Platz
- Abhängig von Achsenreihenfolge
- Möglicherweise uneindeutig
16
Parallele Koordinaten – Overplotting
▪ Problem:
▪ Overplotting
▪ Lösung:
▪ Dimension umsortieren
Problem: Manuelles Umsortieren:
n! Möglichkeiten!
18
ERWEITERUNG
20
Zusammenhang SCM und PCP
Y
X
x1
x1,y1
X
y1
21
Beispiel 1
22
Beispiel 1
Antwort 1
Antwort 2
23
24
Beispiel 2
25
Beispiel 2
26
27
FLEXIBLE AXES
28
29
Flexible Axis
30
SCM – PCP Korrespondenz
31
SCM – PCP Korrespondenz
32
Brushing Patterns
33
Brushing Patterns
34
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
35
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
36
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
37
Achse Umdrehen
38
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
39
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
40
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
41
SCM und PCP Achsen
Physik
Physik
Mathe
Literatur
100%
Literatur
Mathe
0%
Physik
Literatur
Mathe
42
Flexible axes
43
Flexible axes
44
Flexible Achsen
▪Ihre Meinung?
45
GLYPHS - CHERNOFF FACES
46
nD Daten
Möglichkeiten für quantitative Daten
1.
2.
3.
4.
Multiple Scatterplots
Star Plots
Parallele Koordinaten
Glyphs - Chernoff faces
Data
Item
V1
V2
V3
V4
V5
47
V6
…
Vn
Glyphs – Chernoff faces
Variablen werden als
Gesichtsmerkmale
abgebildet
48
Glyphs – Chernoff faces
Variablen werden als
Gesichtsmerkmale
abgebildet
Vorteile:
Menschen können Gesichter
intuitiv sehr gut unterscheiden
Viele Variablen abbildbar
Mund, Augen,
Augenbrauen,
Haare, Ohren,
Nase, Gesichtform, …
49
Glyphs – Chernoff faces
50
Glyphs – Chernoff faces
▪Vorteil:
▪Problem:
52
Glyphs – Chernoff faces
▪Vorteil: Kein Overplotting
▪Problem: viele Merkmale auf ein Mal
schwer vergleichbar
53
Glyphs – Chernoff faces
▪Problem 2:
54
Glyphs – Chernoff faces
▪Problem 2: viele Objekte schwer vergleichbar
55
Chernoff Faces (Iris Datensatz)
Chernoff Faces:
+ Relationen mehrerer Variablen
+ Überlappungsfrei
- Platz
- Schwierig Werte Ablesen und
vergleichen
56
RADVIZ
59
nD Daten
Möglichkeiten für Quantitative Daten
1.
2.
3.
4.
5.
Multiple Scatterplots
Star plots
Parallele Koordinaten
Glyph - Chernoff faces
Radviz
V1
V2
V3
V4
60
V5
V6
…
Vn
RadViz
▪ Es ist eine Art Projektion nD→ 2D
▪ Idee: Punkte im Kreis so zu positionieren, dass
die Kräfte die auf den Punkt wirkenden den Werten entsprechen
61
RadViz
▪ Es ist eine Art Projektion nD→ 2D
▪ Idee: Punkte im Kreis so zu positionieren,
dass die Kräfte die auf den Punkt wirkenden
den Werten entsprechen
Algo:
1. Normalize data [0;1]
(→ stiffness/weights)
2. Place dimensional anchors Si
3. calculate u1,u2 and place the objects
62
RadViz
Oid
S1
S2
S3
S4
O1
O2
O3
O4
O5
1
1
3
5
1
0
1
3
5
1
0
1
0
5
2
0
1
0
5
2
63
RadViz
Oid
S1
S2
S3
S4
O1
O2
O3
O4
O5
1
1
3
5
1
0
1
3
5
1
0
1
0
5
2
0
1
0
5
2
64
RadViz
S1
Oid
S1
S2
S3
S4
O1
O2
O3
O4
O5
1
1
3
5
1
0
1
3
5
1
0
1
0
5
2
0
1
0
5
2
S4
S2
S3
65
RadViz – Identifizieren Sie die Korrespondenz
S1
Oid
S1
S2
S3
S4
O1
O2
O3
O4
O5
1
1
3
5
1
0
1
3
5
1
0
1
0
5
2
0
1
0
5
2
A
B
E
S4
S2
C
D
S3
66
RadViz – Identifizieren Sie die Korrespondenz
S1
Oid
S1
S2
S3
S4
O1
O2
O3
O4
O5
1
1
3
5
1
0
1
3
5
1
0
1
0
5
2
0
1
0
5
2
A
B
E
S4
S2
C
D
S3
67
RadViz
S1
Oid
S1
S2
S3
S4
O1
O2
O3
O4
O5
1
1
3
5
1
0
1
3
5
1
0
1
0
5
2
0
1
0
5
2
A-O1
B – O3
E
S4
S2
C–
O2,O5
D – O5
S3
68
nD Daten – RadViz
▪RadViz
▪Vorteile:
▪ Platzsparend
▪ Relative Datenverhältnisse gut sichtbar
▪Probleme:
▪ Position der Objekte hängt von Anordnung der
Koordinaten ab
▪ Punktposition ist nicht eindeutig
(2 Punkte mit verschiedenen Werten
können auf der gleichen Position landen)
69
RadViz (Iris Datensatz)
RadViz:
+ Relationen mehrerer Variablen
+ Platzsparend
0 nur relationen der Werte ablesbar
- Uneindeutig
- Abhängig von Achsenreihenfolge
70
PRINCIPAL COMPONENT ANALYSIS
(PCA)
71
Datentabellen
nD = multivariate Daten
n = (3+) 4+
Data
Item
V1
V2
V3
V4
V5
V6
…
Vn
72
PCP
▪(Iris Datensatz)
Paralelle Koordinaten:
+ Relationen mehrere Variablen
0 Platz
- Abhängig von Achsenreihenfolge
- Möglicherweise uneindeutig
73
Problem von vielen Dimensionen
▪Beispiel
▪Gesprochene Buchstaben – letter recognition
▪1559 audio samples of the letters A to Z spoken by different persons (26 letters)
▪The samples are represented by 616-dimensional feature vectors encoding
certain aural properties of the samples.
74
Hauptkomponentenanalyse
(Principal Component Analysis, PCA)
Dimensionsreduktion
▪ Multivariate Daten X → Y
▪ Dimensionen D→ m, m<D
Eingabe
Anwendung
▪ Visualisierung
▪ Techniken für niedrige Dimensionen
anwendbar, z.B. Scatterplot
Ergebnis
75
PCA Beispiel: Gesprochene Buchstaben
U, Q
Y
P, T, V
A, J, K, H
76
Interesse an Visualisierung und Visual Analytics?
Haben Sie Interesse an
▪ Interaktiver Visualisierung und Datenanalyse?
▪ Spannende Themen bearbeiten?
▪ Neues entdecken und erforschen?
▪ Ergebnisse Präsentieren?
▪Wir bieten
▪ Doktorandenstellen
▪ Studentische Hilfskräfte
▪ Bachelor/Masterarbeiten
▪ Seminar im WS
Visualization
0.92
0.99
Wissen
Data
▪Sprechen Sie uns an!!!
Machine Learning
92
Umfrage zu Visualisierung von Social Distancing in VR
▪ 6 kurze Videos
▪ Fragen beantworten
▪ Deutsch / Englisch
▪ Farbschwächen
berücksichtigt
▪ Circa
15 bis 25 Minuten
English
Deutsch
: https://www2.visus.uni-stuttgart.de/limesurvey/index.php?r=survey/index&sid=875826&lang=en
: https://www2.visus.uni-stuttgart.de/limesurvey/index.php?r=survey/index&sid=875826&lang=de
94
VIELEN DANK FÜR IHRE
AUFMERKSAMKEIT
95
Related documents
Download