ΔΙΚΤΥΑ – Networks

advertisement
ΔΙΚΤΥΑ - Networks
Η τρέχουσα πραγματικότητα
ΓΕΝΙΚΑ
•
•
•
•
•
Δίκτυα στα οποία ζούμε (social life)
Δίκτυα πληροφοριών (web – news)
Δίκτυα οικονομικά – τεχνολογικά
Δίκτυα κρατών – Οργανισμών
Δίκτυα τρομοκρατικά (!)
Όψεις (1)
• Αντικείμενα συνδεδεμένα μεταξύ τους
Όψεις (2)
Emails in HP
Όψεις (3)
Αρχικές παρατηρήσεις
• Δυσκολία επεξήγησης
• Υπάρχουν αραιές και πυκνές περιοχές
• Υπάρχουν αντικείμενα «κεντρικά» και
περιφερειακά
• Υπάρχουν αντικείμενα που συνδέουν
απομακρυσμένες περιοχές ή όχι
(παρατηρήσεις σχετικές με τη δομή του δικτύου)
Επιπλέον… στρατηγική
• Συμπεριφορά?
– Πώς συμπεριφέρεται κάθε αντικείμενο?
– Πώς η συμπεριφορά επηρεάζει τις αποφάσεις των
άλλων?
– Πώς η συμπεριφορά των άλλων επηρεάζει τις δικές
μας αποφάσεις?
– Οι αλλαγές πρέπει να προγραμματίζονται όχι σε ένα
στατικό περιβάλλον αλλά σε δυναμικό (η εισαγωγή
ενός νέου προϊόντος ή υπηρεσίας έχει πάντα
επίπτωση σε όλο το δίκτυο το οποίο θα αντιδράσει…)
Υπάρχει ή όχι δίκτυο?
• Κάποιες φορές, ακόμα κι αν το δίκτυο δεν είναι
εμφανές ή δεν μπορούμε να το καταγράψουμε, η
συμπεριφορά του συνόλου δείχνει ότι υπάρχει
εσωτερική δομή (συλλογικότητα)
Μελέτη δικτύων
•
•
•
•
•
•
•
•
Κοινωνιολογία
Computer science
Μαθηματικά
Επιχειρησιακή Έρευνα
Οικονομία
Επιδημιολογία
Χρήμα – διακίνηση
……… (!)
Πώς καταγράφονται τα δίκτυα
•
•
•
•
•
Από απλή παρατήρηση (κοινωνιολογία)
Από μελέτες ιστορικών πηγών
Από τρέχοντα δεδομένα
Από το Διαδίκτυο
Με τη βοήθεια μοντέλων δημιουργίας
δικτύων
Network dynamics
• Γιατί συμπεριφέρεται έτσι ένας πληθυσμός?
– Λόγω κοινωνικής συμφωνίας – τηρουμένων
κοινωνικών κανόνων?
– Λόγω φαινομένων επηρεασμού από τους
άλλους?
– Λόγω μίμησης (φυσικής ροπής)
– Λόγω της υπόθεσης ότι υπάρχει περισσότερος
πλούτος εκεί που παν οι άλλοι
– Λόγω προστιθέμενης αξίας μετά από την
κατάκτηση ενός μεγέθους?
Network dynamics - structure
• Global – local
– Η συμπεριφορά κάποιες φορές αλλάζει σε τοπικό
επίπεδο
– Φαινόμενα «καταρράκτη»
• Η δομή επηρεάζει τη διάδοση
• Η ύπαρξη communities μπορεί να σταματήσει την
πρόοδο
• Η συνεχιζόμενη αύξηση θα οδηγήσει σε πλήρη
επιρρόή
Epidemics
φυματίωση
Αντίθετη περίπτωση
Σεξουαλικές
σχέσεις σε Λύκειο
GRAPHS – NETWORKS
(Γράφοι – Δίκτυα)
• Κόμβοι (κορυφές – nodes) και γραμμές (ακμές - edges – links)
• Συμμετρία – ασυμμετρία (directed – undirected)
• Relationship – Σχέση.
Δρόμοι, μονοπάτια, κύκλοι
(walks – paths – cycles)
Connectivity
• Component – συνεκτική συνιστώσα
– Όλοι οι κόμβοι συνδέονται
– Δεν μπορεί να βελτιωθεί
Giant component
•
•
•
•
•
Είμαστε όλοι συνδεδεμένοι με όλους?
Υπάρχουν απομακρυσμένα «τροπικά νησιά»?
Υπάρχει άνθρωπος που είναι απόλυτα απομονωμένος?
Συχνά υπάρχει ΜΟΝΟ ΜΙΑ γιγάντια συνεκτική συνιστώσα
Σπάνια υπάρχουν περισσότερες (πχ πριν την ανακάλυψη της
Αμερικής
• Συχνά υπάρχει ο χρόνος ως σημαντικός παράγοντας
ΑΠΟΣΤΑΣΗ (μήκος μονοπατιού) – breath –
first search
Φαινόμενα Small world
• Πείραμα Milgram
Six degrees or six Worlds
Instant messenger
Erdos number (4-5)
Bacon number (2.9)
Network Datasets
•
•
•
•
•
•
•
•
Collaboration graphs
Who-talks-to-whom graph
Information graphs
Who-transacts-to-whom
Technological linking
Biological linking
Natural world
………….
Strong and weak ties (Granovetter)
• Εύρεση εργασίας
– Ρωτώ το στενό κύκλο?
– Ρωτάω μακρινούς γνωστούς?
– Πηγαίνω σε υπηρεσία?
• Triadic closure (τριαδική κλειστότητα)
Λόγοι ύπαρξης της τριαδικής
κλειστότητας
• Ευκαιρία (opportunity) (πιθανότερες
συναντήσεις)
• Εμπιστοσύνη (καλύτερα με αυτόν τον οποίο
εμπιστεύεται ο φίλος μου)
• Κίνητρο (ο κεντρικός κόμβος χαλαρώνει την
ένταση του ανταγωνισμού)
Γέφυρες και τοπικές γέφυρες
Κάθε τοπική γέφυρα είναι weak
FACEBOOK
GEPHI
•
•
•
•
•
•
•
•
•
https://gephi.github.io/
Start Gephi
Δημιουργία απλού γράφου
Center on graph, enlarge
Edit node (? Tools)
Dining table partners
Force atlas 2
Reset colors, reset size (right click)
Show node labels, size
Δομές Δεδομένων
• Edges partition (choice) apply
• Data laboratory
• Preview
Node metrics
Degree distribution
Components
Gephi (dining table…)
•
•
•
•
•
Ranking nodes indegree size (spline)
Compute average degree (statistics δεξιά)
Data laboratory – nodes sort
Statistics connected components..
Partition nodes strongly connected
Καθολική πυκνότητα
• Το πλήθος των ακμών που υπάρχουν προς το
πλήθος των ακμών που θα μπορούσαν να
υπάρχουν
• 𝑑=
𝐿
𝑁(𝑁−1)
2
=
2𝐿
𝑁(𝑁−1)
• Διαφορετικό για directed graphs
• Gephi compute
Clustering coefficient (ego density – local
density)
• Η πιθανότητα δύο φίλοι μας να είναι και μεταξύ τους φίλοι
• Η αναλογία των ζευγαριών των φίλων μας που είναι φίλοι
μεταξύ τους.
• Το πλήθος των ακμών ανάμεσα στους φίλους μας προς το
μέγιστο πλήθος των πιθανών ακμών
•
•
•
•
CC(A) = 1/6 (εικόνα α)
CC(A) = ½ (εικόνα β)
CC ε [0, 1]
Gephi compute
Centrality
• http://moviegalaxies.com/
Y
X
X
Y
indegree
Y
outdegree
To Χ έχει σημαντικότερη θέση από το Y
X
betweenness
X
Y
closeness
παράδειγμα
•
•
•
•
Import.net
Εύρεση μεγαλύτερων εισαγωγέων
Εύρεση μεγαλύτερων εξαγωγέων
Degree – indegree - outdegree
Αριθμοί
normalization
divide degree by
the max. possible,
i.e. (N-1)
real-world examples
example financial trading networks
high in-centralization:
one node buying from
many others
low in-centralization:
buying is more evenly
distributed
Τι δεν είναι καλό με το degree centrality?
Με ποιούς τρόπους η κεντρικότητα βαθμού δεν τα καταφέρνει καλά στα
ακόλουθα?
Η μεσιτεία και ο περιορισμός
betweenness: μεσιτεία?
• Πόσα ζεύγη κόμβων πρέπει να περάσουν
από εσένα για να φτάσουν με
συντομότερο τρόπο ο ένας στον άλλον?
X
Y
Παράδειγμα (γιατί?)
Κι άλλο παράδειγμα
A
B
C
D
E
 A lies between no two other vertices
 B lies between A and 3 other vertices: C, D, and E
 C lies between 4 pairs of vertices (A,D),(A,E),(B,D),(B,E)
 note that there are no alternate paths for these pairs to
take, so C gets full credit
Quiz:
Find a node that has high betweenness but
low degree
Quiz Q:
Find a node that has low betweenness but
high degree
closeness
• Εάν δεν είναι τόσο σημαντικό να έχω
άμεσους φίλους?
• Η να βρίσκομαι ανάμεσα σε άλλους?
• Πάντως θέλω να είναι στο «κέντρο των
εξελίξεων», όχι μακριά από όλους…
Y
Closeness… To Μέσο συντομότερο μονοπάτι
μεταξύ ενός και όλων των άλλων
X
Y
XX Y
X
Y
Partitioning
• Components
• Κλίκες
• Άλλα (cores – k-cores – clans, …)
Κλίκες – υπογραφήματα (overlap)
Communities
• Μία ομάδα κόμβων ανήκουν στην ίδια
κοινότητα αν έχουν περισσότερους δεσμούς
μεταξύ τους παρά με τους υπόλοιπους…
• Εύρεση μέσω συνεχόμενης αφαίρεσης ακμών
με μεγάλη betweenness centrality.
• Παράδειγμα στο Gephi (strike), και με netvizz
(facebook)
• Παράδειγμα στο Nodexl με emails
Kάλυψη
• Spanning tree
Initialize: Vnew = {x}, where x is an arbitrary node (starting
point) from V, Enew = {}
Repeat until Vnew = V:
Choose an edge (u, v) with minimal weight such
that u is in Vnew and v is not (if there are multiple
edges with the same weight, any of them may be
picked)
Add v to Vnew, and (u, v) to Enew
Output: Vnew and Enew describe a minimal spanning tree
Χρηματοοικονομικά?
•
•
•
•
•
•
Πίνακας cross corellation
Πίνακας γειτνίασης
Δημιουργία γράφου με φιλτράρισμα…
Τι σημαίνει ένα asset graph?
MST asset graph?
Planar maximally filtered graph?
Download