بیشینهسازی پخشتأثیرات 1در شبکههای اجتماعی با استفاده از گرافکاوی امیرمحمد اوحدی دانشکده مهندسی کامپیوتر و فناوری اطالعات ،دانشگاه صنعتی امیرکبیر ،تهران، am.ohadi@aut.ac.ir چکیده مسئله بیشینه سازی پخش تأثیرات در شبکه اجتماعی عبارت است از انتخاب Nرأس از گراف شبکه اجتمااعی رروا س گاراف نماینده افراد عض شبکه اجتماعی هستند) که کار قصد انجام کار خاصی دارند و می ت انند روی بیشترین افراد در شبکه برای انجاام همان کار تأثیر بگذارند .مسئله ف ق از ن ع مساول NP-hardاست و برای حل آن از روش های مکاشفه ای استفاده شده است.مشکل دیگر حجم بسیار باالی اطالعات در شبکه های اجتماعی است که حتی اجرای الگ ریتم های تقریبی را روی این شابکه هاا در عمال ناکارا می سازد .برای حل مشکل داده های مرب ط به گراف شبکه قبل از اجرای الگ ریتم با استفاده از تکنینک های گراف کاوی خالصه می ش ند تا الگ ریتم روی حجم به مراتب کمتری از داده ها اجرا ش د.از س ی دیگر روش های گراف کاوی تضامین مای کنناد کاه الگ ریتم پس از اجرا روی داده های خالصه شده داری دقتی نزدیک به حالتی است که روی داده های اصلی اجرا ش د. کلمات کلیدی تحلیااال شااابکه هاااای اجتمااااعی داده کااااوی گاااراف کااااوی پخاااش تاااأثیر الگااا ریتم هاااای تقریبااای . Spread of Influence1 -1مقدمه شبکه های اجتماعی دارای نقش اساسی به عنوان ابزاری برای نشر اطالعاات هستند] .[1یافتن عوامل مؤثر و میزان تأثیر آن ها در شبکه های اجتمااعی ا مسائل مهم تحلیل این گونه شبکه هاست .به طور مثاا پاسا باه ساؤا تی مثل این که کدام اشخاص یا سا مان ها بیشترین اثرگذاری را در یک شابکه اجتماعی دارند؟ کدام صفحات وب دارای بیشترین تأثیر در یک موضوع خاص هستند؟ هم ا نظر تجاری مهم هستند و هم به ما کمک می کنناد تاا درک بهتری ا فعل و انفعاالت و شاار داده هاا در شابکه هاای اجتمااعی داشاته باشیم].[2 در حالتی که به دنبا افراد تأثیرگذار هستیم (کساانی کاه دادرناد روی افاراد دیگر در یک شبکه اجتماعی تأثیر بگذارند) پاس به مسئله یار حاائز اهمیات است. چگونه باید میزان تأثیر این افراد را در شبکه اجتماعی بیشینه کرد؟ پاس به سؤا فوق می تواند باه یاک شارکت تجااری بارای تبلیغاات و یاا با اریابی با هزینه کمتر و میزان اثرگذاری بیشتر کمک کند ،یا میزان بهرهوری یک رسانه خبری را در یک شبکه اجتماعی افزایش دهد. اگر شبکه اجتماعی را به صورت گرافی مد کنایم کاه رئاون آن اشاخاص باشند،مسئله بیشینهسا ی پخش تاأثیر در حالات سااده باه صاورت انتخااب یرمجموعه Nعضوی ا رئون یک گراف که می خواهند کار خاصی انجاام دهند (مثال خرید یک کا ی خاص) و می توانند روی بیشترین افاراد ( دیگار رئون گراف) اثر بگذارند تا آن ها نیز همان کار را انجام دهند ،بیان می شاود. مسئله فوق ا نوع مسائلسخت 1است و الگاوریتمی ا ماان چناد جملاه ای برای آن یافت نشده است .برای کاهش ماان جسات و جاو ا هیوریساتیک هایی مثل "مرکزیت فاصله" 2و "مرکزیت درجه" 3استفاده می شود .دو مد برای نشر اطالعات در نظر گرفته می شود ،مد "آساتانه ساا ی خ ای" 4و مد "آبشار مستقل". 5مد های مذکور مبنای دو روش متفاوتی هستند کاه برای حل مسئله بیشینه سا ی پخش تأثیر به کار می رود. همان طور که گفته شد مسئله فوق ا نوع مسائل سخت است ،در نتیجه برای حل آن در عمل الگوریتم های تقریبی و یا مکاشفهای ارائه شده که در اداماه به برخی ا آنها اشاره خواهیم کرد ،اما مسئله دیگر این است که معمو حجم داده های موجود در شبکه های اجتماعی بسیار یاد اسات و گااهی باه چناد میلیاد هم می رسد لذا حتی الگوریتم های تقریبی نیاز نمای توانناد باا تاوان پردا شی امرو به در مان معقو (دابل دبو درعمل) روی این حجم عظایم داده انجام شوند .برای حل این مشکل ما دبال ا اینکاه تماام داده هاا را باه الگوریتم اصلی بدهیم آنها را با استفاده ا تکنیک های داده کاوی روی گراف ها موسوم به "گراف کاوی" خالصه سا ی کرده و اطالعات اید را حذف می کنیم تا حجم داده هایی که باید پردا ش شوند را کاهش دهیم .ا سوی دیگر NP-hard 1 Distance Centrality 2 Degree Centrality 3 Linear Threshold 4 Independent Cascade 5 این خال صه سا ی نباید باع شود که نتای به دست آمده ا اجرای الگاوریتم روی داده های خالصه شده نسبت به اجرا روی داده های اصلی ناددیق باشند. برای خالصه سا ی گراف ا روش ارائه شده در ] [3و بارای بیشاینه ساا ی نشر تأثیر هم ا الگوریتم های ارائه شده در] [2بهره گرفته ایم .روش فوق بار روی گراف دوستی فیسبوک با 12میلیارد رأن تست و نتای حاصل گزارش شده اند .نتای نشان می دهد روش ما دادر است که مسااله فاوق را باه طاور تقریبی با خ ای م رح شده در ] [2را در مان معقو (دابال اجارا در عمال) روی گراف هایی با بیش ا یک میلیارد رأن حل کند(.دسمت آ مایش و نتای فرض شده است!) -2مروری بر کارهای گذشته هر مراجع [1] Wei Chen, Yajun Wang, and Siyu Yang. 2009. Efficient influence maximization in social networks. In Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD '09). ACM, New York, NY, USA, 199-208. [2] David F. Nettleton, Data mining of social networks represented as graphs, Computer Science Review, Volume 7, February 2013, Pages 1-34, ISSN 1574-0137 [3] Danai Koutra. Large Graph Mining and Sense-making. Thesis proposal, CMU, March 2014.