산업공학특수연구_20140911 ( 1024619 Bytes )

advertisement
What is Twitter, a Social Network or a News Media?
Haewoon Kwak, Changhyun Lee, Hosung Park, and Sue Moon
1/ 16
개요
1. INTRODUCTION
2. TWITTER SPACE CRAWL
3. ON TWITTERERS’ TRAIL
4. RANKING TWITTER USERS
5. TRENDING THE TRENDS
6. IMPACT OF RETWEET
7. RELATED WORK
8. CONCLUSIONS
2 / 16
1. INTRODUCTION
Problem
•How are people connected on Twitter?
•Who are the most influential people?
•What do people talk about? How does information diffuse via retweet?
•The goal of this work is to study the topological characteristics of Twitter
and its power as a new medium of information sharing.
Method
41.7 million user profiles, 1.47 billion social relations, 106 million tweets를 조사할 것이다.
3 / 16
2. TWITTER SPACE CRAWL
- 주로 어떻게 data를 끌어모았는지 방법론적, 정량적으로 설명
- 트위터가 제공하는 API 사용.
- user profile은 41.7 million개 수집.
- 트위터 검색 API사용해서 총 4,262개의 트렌드 토픽 수집-(정확한 매커니즘은 공개되어있지 않지만)
- 스팸 트윗은 날리고 수집한 총 트윗개수 106 million개.
4 / 16
3. ON TWITTERERS’ TRAIL
3.2 Followers vs. Tweets
Figure 2: The number of followers and that of tweets per user
5 / 16
3. ON TWITTERERS’ TRAIL
3.3 Reciprocity
- 트위터는 77.9%의 단방향 연결관계를 가지고 있고 단지 22.1%만 서로 상호관계를 가지고 있음.
- 22.1%의 이 유저들을 r-friends라고 부름.
- 그리고 67.6%의 유저들은 그들이 팔로우 한 유저로부터 맞팔을 받지 못한다. 이들은 트위터를 단
지 정보를 얻는 목적으로만 사용한다고 말할 수 있다.
6 / 16
3. ON TWITTERERS’ TRAIL
3.4 Degree of Separation
Figure 4: Degree of separation
7 / 16
3. ON TWITTERERS’ TRAIL
3.5 Homophily
Figure 5: The average time differences between a user and rfriends
Figure 6: The average number of followers of r-friends per user
8 / 16
챕터 3 결론 : 트위터는 기존의 소셜네트웍과 다음과 같은 부분에서 구분된다. 팔로워의
분포도는 power law를 따르지도 않으며 degree of separation은 예상치보다 더 짧으며
대부분의 연결고리들은 서로 상호관계를 이루고 있지도 않다. 그러나 우리가 상호관계를
보고자 한다면 분명 어느 정도의 동질성은 가지고 있음.
9 / 16
4. RANKING TWITTER USERS
Figure 7: Top 20 users ranked by the number of followers, PageRank in the follower network, and the number of retweets
10 / 16
4. RANKING TWITTER USERS
Kendall’s tau-켄달의 등위상관계수
•“팔로워수가 아무리 많아도 리트윗수는 적을수도 있다.”
•RT의 파급력에 관해서 의견을 제시
•실제로 팔로워 수가 높으면 RT 수도 높아야 될 것 같은데 그렇지가 않음을 켄달 타우로 보여줌
•랭킹의 신뢰도를 알 수 있음.
11 / 16
5. TRENDING THE TRENDS
5.3 User Participation in Trending Topics
(a) Topic ’apple’
(b) Topic ’#iranelection’
Figure 11: Cumulative numbers of tweets and users over time
오랜기간동안 특정 트렌드 주제에 관하여 트윗을 남기는 핵심 User들이 있다.
12 / 16
5. TRENDING THE TRENDS
5.4 Active Period of Trends
Figure 13: The examples of classified popularity patterns
13 / 16
5. TRENDING THE TRENDS
5.4 Active Period of Trends
5장 정리 : 트위터 유저들은 헤드라인 뉴스 또는 매우 최신의 뉴스들을 떠들길 좋아한다는 것을 알 수
있다.
14 / 16
6. IMPACT OF RETWEET
6.3 Temporal Analysis of Retweet
Figure 17: Time lag between a retweet and the original tweet
15 / 16
Thank you
16 /16
Download