Uploaded by Amir Ohadi

9231061

advertisement
‫بیشینهسازی پخشتأثیرات‪ 1‬در شبکههای اجتماعی با استفاده از‬
‫گرافکاوی‬
‫امیرمحمد اوحدی‬
‫دانشکده مهندسی کامپیوتر و فناوری اطالعات‪ ،‬دانشگاه صنعتی امیرکبیر ‪ ،‬تهران‪،‬‬
‫‪am.ohadi@aut.ac.ir‬‬
‫چکیده‬
‫مسئله بیشینه سازی پخش تأثیرات در شبکه اجتماعی عبارت است از انتخاب ‪ N‬رأس از گراف شبکه اجتمااعی رروا س گاراف‬
‫نماینده افراد عض شبکه اجتماعی هستند) که کار قصد انجام کار خاصی دارند و می ت انند روی بیشترین افراد در شبکه برای انجاام‬
‫همان کار تأثیر بگذارند‪ .‬مسئله ف ق از ن ع مساول ‪ NP-hard‬است و برای حل آن از روش های مکاشفه ای استفاده شده است‪.‬مشکل‬
‫دیگر حجم بسیار باالی اطالعات در شبکه های اجتماعی است که حتی اجرای الگ ریتم های تقریبی را روی این شابکه هاا در عمال‬
‫ناکارا می سازد‪ .‬برای حل مشکل داده های مرب ط به گراف شبکه قبل از اجرای الگ ریتم با استفاده از تکنینک های گراف کاوی خالصه‬
‫می ش ند تا الگ ریتم روی حجم به مراتب کمتری از داده ها اجرا ش د‪.‬از س ی دیگر روش های گراف کاوی تضامین مای کنناد کاه‬
‫الگ ریتم پس از اجرا روی داده های خالصه شده داری دقتی نزدیک به حالتی است که روی داده های اصلی اجرا ش د‪.‬‬
‫کلمات کلیدی‬
‫تحلیااال شااابکه هاااای اجتمااااعی داده کااااوی گاااراف کااااوی پخاااش تاااأثیر الگااا ریتم هاااای تقریبااای ‪.‬‬
‫‪Spread of Influence1‬‬
‫‪ -1‬مقدمه‬
‫شبکه های اجتماعی دارای نقش اساسی به عنوان ابزاری برای نشر اطالعاات‬
‫هستند]‪ .[1‬یافتن عوامل مؤثر و میزان تأثیر آن ها در شبکه های اجتمااعی ا‬
‫مسائل مهم تحلیل این گونه شبکه هاست‪ .‬به طور مثاا پاسا باه ساؤا تی‬
‫مثل این که کدام اشخاص یا سا مان ها بیشترین اثرگذاری را در یک شابکه‬
‫اجتماعی دارند؟ کدام صفحات وب دارای بیشترین تأثیر در یک موضوع خاص‬
‫هستند؟ هم ا نظر تجاری مهم هستند و هم به ما کمک می کنناد تاا درک‬
‫بهتری ا فعل و انفعاالت و شاار داده هاا در شابکه هاای اجتمااعی داشاته‬
‫باشیم]‪.[2‬‬
‫در حالتی که به دنبا افراد تأثیرگذار هستیم (کساانی کاه دادرناد روی افاراد‬
‫دیگر در یک شبکه اجتماعی تأثیر بگذارند) پاس به مسئله یار حاائز اهمیات‬
‫است‪.‬‬
‫چگونه باید میزان تأثیر این افراد را در شبکه اجتماعی بیشینه کرد؟‬
‫پاس به سؤا فوق می تواند باه یاک شارکت تجااری بارای تبلیغاات و یاا‬
‫با اریابی با هزینه کمتر و میزان اثرگذاری بیشتر کمک کند‪ ،‬یا میزان بهرهوری‬
‫یک رسانه خبری را در یک شبکه اجتماعی افزایش دهد‪.‬‬
‫اگر شبکه اجتماعی را به صورت گرافی مد کنایم کاه رئاون آن اشاخاص‬
‫باشند‪،‬مسئله بیشینهسا ی پخش تاأثیر در حالات سااده باه صاورت انتخااب‬
‫یرمجموعه ‪ N‬عضوی ا رئون یک گراف که می خواهند کار خاصی انجاام‬
‫دهند (مثال خرید یک کا ی خاص) و می توانند روی بیشترین افاراد ( دیگار‬
‫رئون گراف) اثر بگذارند تا آن ها نیز همان کار را انجام دهند‪ ،‬بیان می شاود‪.‬‬
‫مسئله فوق ا نوع مسائلسخت‪ 1‬است و الگاوریتمی ا ماان چناد جملاه ای‬
‫برای آن یافت نشده است‪ .‬برای کاهش ماان جسات و جاو ا هیوریساتیک‬
‫هایی مثل "مرکزیت فاصله"‪ 2‬و "مرکزیت درجه"‪ 3‬استفاده می شود‪ .‬دو مد‬
‫برای نشر اطالعات در نظر گرفته می شود‪ ،‬مد "آساتانه ساا ی خ ای"‪ 4‬و‬
‫مد "آبشار مستقل"‪. 5‬مد های مذکور مبنای دو روش متفاوتی هستند کاه‬
‫برای حل مسئله بیشینه سا ی پخش تأثیر به کار می رود‪.‬‬
‫همان طور که گفته شد مسئله فوق ا نوع مسائل سخت است‪ ،‬در نتیجه برای‬
‫حل آن در عمل الگوریتم های تقریبی و یا مکاشفهای ارائه شده که در اداماه‬
‫به برخی ا آنها اشاره خواهیم کرد‪ ،‬اما مسئله دیگر این است که معمو حجم‬
‫داده های موجود در شبکه های اجتماعی بسیار یاد اسات و گااهی باه چناد‬
‫میلیاد هم می رسد لذا حتی الگوریتم های تقریبی نیاز نمای توانناد باا تاوان‬
‫پردا شی امرو به در مان معقو (دابل دبو درعمل) روی این حجم عظایم‬
‫داده انجام شوند‪ .‬برای حل این مشکل ما دبال ا اینکاه تماام داده هاا را باه‬
‫الگوریتم اصلی بدهیم آنها را با استفاده ا تکنیک های داده کاوی روی گراف‬
‫ها موسوم به "گراف کاوی" خالصه سا ی کرده و اطالعات اید را حذف می‬
‫کنیم تا حجم داده هایی که باید پردا ش شوند را کاهش دهیم‪ .‬ا سوی دیگر‬
‫‪NP-hard 1‬‬
‫‪Distance Centrality 2‬‬
‫‪Degree Centrality 3‬‬
‫‪Linear Threshold 4‬‬
‫‪Independent Cascade 5‬‬
‫این خال صه سا ی نباید باع شود که نتای به دست آمده ا اجرای الگاوریتم‬
‫روی داده های خالصه شده نسبت به اجرا روی داده های اصلی ناددیق باشند‪.‬‬
‫برای خالصه سا ی گراف ا روش ارائه شده در ]‪ [3‬و بارای بیشاینه ساا ی‬
‫نشر تأثیر هم ا الگوریتم های ارائه شده در]‪ [2‬بهره گرفته ایم‪ .‬روش فوق بار‬
‫روی گراف دوستی فیسبوک با ‪ 12‬میلیارد رأن تست و نتای حاصل گزارش‬
‫شده اند‪ .‬نتای نشان می دهد روش ما دادر است که مسااله فاوق را باه طاور‬
‫تقریبی با خ ای م رح شده در ]‪ [2‬را در مان معقو (دابال اجارا در عمال)‬
‫روی گراف هایی با بیش ا یک میلیارد رأن حل کند‪(.‬دسمت آ مایش و نتای‬
‫فرض شده است!)‬
‫‪ -2‬مروری بر کارهای گذشته‬
‫هر‬
‫مراجع‬
‫‪[1] Wei Chen, Yajun Wang, and Siyu Yang. 2009. Efficient‬‬
‫‪influence maximization in social networks. In‬‬
‫‪Proceedings of the 15th ACM SIGKDD international‬‬
‫‪conference on Knowledge discovery and data mining‬‬
‫‪(KDD '09). ACM, New York, NY, USA, 199-208.‬‬
‫‪[2] David F. Nettleton, Data mining of social networks‬‬
‫‪represented as graphs, Computer Science Review,‬‬
‫‪Volume 7, February 2013, Pages 1-34, ISSN 1574-0137‬‬
‫‪[3] Danai Koutra. Large Graph Mining and Sense-making.‬‬
‫‪Thesis proposal, CMU, March 2014.‬‬
Download