pptx - WordPress.com

advertisement
Topics in Algorithmic Game Theory
‫נושאים אלגוריתמיים בתורת המשחקים‬
Game Theory
●
●
●
●
●
What is it about ?
Games are thought experiments to help us learn how
to predict rational behavior in situations of conflict.
Rational: The players want to maximize their own expected utility.
Situation of conflict: Everybody's actions affect others. This is
captured by the tabular game formalism.
Predict: We want to know whant happens in a game. Such
predictions are called solution concepts (e.g., Nash equilibrium).
Game Theory
●
●
●
●
●
What is it about ?
Games are thought experiments to help us learn how
to predict rational behavior in situations of conflict.
Rational: The players want to maximize their own (expected) utility.
Situation of conflict: Everybody's actions affect others. This is
captured by the tabular game formalism.
Predict: We want to know whant happens in a game. Such
predictions are called solution concepts (e.g., Nash equilibrium).
Game Theory
●
●
●
●
●
What is it about ?
Games are thought experiments to help us learn how
to predict rational behavior in situations of conflict.
Rational: The players want to maximize their own expected utility.
Situation of conflict: Everybody's actions affect others. This is
captured by the tabular game formalism.
Predict: We want to know whant happens in a game. Such
predictions are called solution concepts (e.g., Nash equilibrium).
Game Theory
●
●
●
●
●
What is it about ?
Games are thought experiments to help us learn how
to predict rational behavior in situations of conflict.
Rational: The players want to maximize their own expected utility.
Situation of conflict: Everybody's actions affect others. This is
captured by the tabular game formalism.
Predict: We want to know what happens in a game. Such predictions
are called solution concepts (e.g., Nash equilibrium).
Game Theory
●
●
●
●
●
What is it about ?
Games are thought experiments to help us learn how
to predict rational behavior in situations of conflict.
Rational: The players want to maximize their own (expected) utility.
Situation of conflict: Everybody's actions affect others. This is
captured by the tabular game formalism.
Predict: We want to know whant happens in a game. Such
predictions are called solution concepts (e.g., Nash equilibrium).
‫דוגמאות למשחקים‬
‫אבן‪ ,‬נייר ומספריים‬
‫‪ 2‬שחקנים‪ :‬שחקן שורה ושחקן עמודה‬
‫לכל שחקן יש ‪ 3‬פעולות (‪ )actions‬אפשריות לבחירה‬
‫משחק סכום אפס‬
‫צ'יקן‬
‫‪ 2‬שחקנים‬
‫לכל שחקן ‪ 2‬פעולות‬
‫דוגמא למשחק של ‪ 3‬שחקנים‪ ,‬עם ‪ 2‬פעולות לכל שחקן‬
‫דוגמא למשחק של ‪ n‬שחקנים‪ ,‬לכל שחקן יש אינסוף‬
‫פעולות‬
‫פורמלית‪ ,‬משחק מוגדר על ידי ) 𝑖𝑢 ‪ ,(𝑁, 𝐴𝑖 ,‬כאשר‪:‬‬
‫• }‪ N = {1, 2, …, n‬היא קבוצה של ‪ n‬שחקנים‪.‬‬
‫• ‪ Ai‬היא קבוצת הפעולות האפשריות של שחקן ‪i‬‬
‫• התועלת של שחקן ‪ i‬מוגדרת ע"י הפונקציה‬
‫‪ui: A1 x A2 x A3 ··· x An  R‬‬
‫• (ז"א התועלת של שחקן ‪ i‬תלויה בפעולות שנבחרו‬
‫על ידי ‪ i‬וע"י שאר השחקנים)‬
‫𝑖𝑢 ‪ 𝑁, 𝑆𝑖 ,‬ייקרא משחק סופי אם ‪ N‬היא‬
‫• משחק‬
‫קבוצה סופית ואם ‪ Ai‬היא קבוצה סופית לכל שחקן ‪.i‬‬
‫בשבוע שעבר ‪...‬‬
‫●‬
‫●‬
‫●‬
‫אם שחקן העמודות בוחר עו"ד רגיל‪ ,‬אז כדאי לשחקן השורות‬
‫לבחור עו"ד מומחה‪.‬‬
‫אם שחקן העמודות בוחר עו"ד מומחה‪ ,‬אז כדאי לשחקן השורות‬
‫לבחור עו"ד מומחה‪.‬‬
‫ראינו שתחת הנחת ה"רציונליות"‬
‫כל שחקן יבחר בעו"ד מומחה‬
‫”‪“E‬‬
‫‪-1 , 5‬‬
‫”‪“R‬‬
‫‪4,4‬‬
‫”‪“R‬‬
‫בלי קשר לבחירת השחקן האחר‪.‬‬
‫●‬
‫התוצאה תהיה "‪."0 ,0‬‬
‫‪0,0‬‬
‫‪5 , -1‬‬
‫”‪“E‬‬
‫במשחק הצ'יקן‪ ,‬לא קיימת אסטרטגיה שהיא מועדפת בלי‬
‫כל קשר לבחירת השחקן האחר‪.‬‬
‫לדוגמא אם שחקן העמודות בחר לעצור אז לשחקן השורות‬
‫כדאי יותר להאיץ‪ ,‬ואם שחקן העמודות בחר להאיץ אז‬
‫כדאי לשחקן העמודות לעצור‪.‬‬
‫פתרון = תוצאת המשחק‬
‫התוצאה "‪ "0 ,0‬שמתייחסת לזוג הפעולות ‪E ,E‬‬
‫מהווה שיווי משקל‪:‬‬
‫בהינתן שכל אחד מהשחקנים‬
‫מתכוון לבחור את ‪,E‬‬
‫אף שחקן לא ירצה לשנות‬
‫את דעתו באופן חד צדדי‬
‫”‪“E‬‬
‫‪-1 , 5‬‬
‫”‪“R‬‬
‫‪4,4‬‬
‫”‪“R‬‬
‫ולבחור את ‪.R‬‬
‫‪0,0‬‬
‫‪5 , -1‬‬
‫”‪“E‬‬
‫‪" ≈ DSE‬לא משנה איזה עו"ד בוחר השחקן האחר‪ ,‬לי כדאי לשכור עו"ד מומחה"‬
‫‪" ≈ PNE‬אם השחקן האחר בוחר עו"ד מומחה‪ ,‬לי כדאי גם לשכור עו"ד מומחה"‬
‫‪PNE‬‬
‫‪DSE‬‬
‫‪ E,E‬הוא שיווי משקל יחיד‬
‫בדוגמא זו‪ ,‬קל לראות שכל זוג פעולות שאינו ‪E ,E‬‬
‫אינו מהווה שיווי משקל‪ ,‬כלומר תמיד יהיה שחקן שיעדיף לסטות‬
‫באופן חד צדדי‪:‬‬
‫”‪“E‬‬
‫‪-1 , 5‬‬
‫‪‬‬
‫‪0,0‬‬
‫”‪“R‬‬
‫‪‬‬
‫‪‬‬
‫‪4,4‬‬
‫‪‬‬
‫‪5 , -1‬‬
‫”‪“R‬‬
‫”‪“E‬‬
‫אסטרטגיה טהורה‬
‫●‬
‫הגדרה‪ :‬אסטרטגיה טהורה היא הפעולה שאותה בחר השחקן‬
‫לשחק מתוך אוסף הפעולות האפשריות‪.‬‬
‫●‬
‫לדוגמא‪ ,‬הראינו שזוג‬
‫●‬
‫האסטרטגיות הטהורות ‪E,E‬‬
‫●‬
‫מהווה שיווי משקל כאשר‬
‫●‬
‫השחקנים פועלים באופן רציונלי‬
‫”‪“E‬‬
‫‪-1 , 5‬‬
‫‪0,0‬‬
‫”‪“R‬‬
‫‪4,4‬‬
‫‪5 , -1‬‬
‫”‪“R‬‬
‫”‪“E‬‬
‫מלחמת המינים‬
‫יש שני שיוויי משקל באסטרטגיות טהורות (שבכל אחד‬
‫מהם לאף שחקן לא כדאי לסטות באופן חד צדדי)‬
‫מהו שיווי המשקל כאן?‬
?‫איך משחקים צ'יקן‬
‫משחק באסטרטגיות טהורות בנוסח הוליווד‬
http://www.youtube.com/watch?v=YDSj6ptcwbw&feature
=related
22:40
‫●‬
‫בעיה‪ :‬במשחק זוג או פרט לא קיים שיווי משקל‬
‫נאש באסטרטגיות טהורות‬
‫‪‬‬
‫‪‬‬
‫אסטרטגיה מעורבת ‪ -‬דוגמא‬
‫●‬
‫דוגמא לאסטרטגיה מעורבת לשחקן השורות‪ :‬הגרל כל פעולה בהסתברות ½‬
‫●‬
‫דוגמא לאסטרטגיה מעורבת לשחקן העמודות‪ :‬הגרל כל פעולה בהסתברות ½‬
‫●‬
‫נשים לב‪ :‬כעת תהיה לנו התפלגות אחידה על התוצאות האפשריות‪:‬‬
‫●‬
‫לדוגמא התוצאה (‪ )-1 ,1‬תיבחר בהסתברות ¼‪.‬‬
‫●‬
‫בנוסף‪ :‬נגדיר את תועלת השחקן להיות תוחלת התועלת (ביחס להתפלגות‬
‫על התוצאות)‪.‬‬
‫‪ ui: A1 x A2 ··· x An  R‬לעומת ‪Ui: (A1) x (A2) ··· x (An)  R‬‬
‫אסטרטגיה מעורבת ‪ -‬דוגמא‬
‫●‬
‫דוגמא לאסטרטגיה מעורבת לשחקן השורות‪ :‬הגרל כל פעולה בהסתברות ½‬
‫●‬
‫דוגמא לאסטרטגיה מעורבת לשחקן העמודות‪ :‬הגרל כל פעולה בהסתברות ½‬
‫●‬
‫נשים לב‪ :‬כעת תהיה לנו התפלגות אחידה על התוצאות האפשריות‪:‬‬
‫●‬
‫לדוגמא התוצאה (‪ )T, H‬תיבחר בהסתברות ¼‪.‬‬
‫●‬
‫בנוסף‪ :‬נגדיר את תועלת השחקן להיות תוחלת התועלת (ביחס להתפלגות‬
‫על התוצאות)‪.‬‬
‫‪ ui: A1 x A2 ··· x An  R‬לעומת ‪Ui: (A1) x (A2) ··· x (An)  R‬‬
‫‪u1(H, T) = 1, u1(T, H) = 1, u1(H, H) = -1, u1(T, T) = -1‬‬
‫… ‪u2(H, T) = -1,‬‬
‫לעומת‬
‫= ))‪U1 ((1/2, 1/2), (1/2, 1/2‬‬
‫?=‬
‫●‬
‫)‪¼ u1 (H, H) + ¼ u1 (H, T) + ¼ u1 (T, H) + ¼ u1 (T, T‬‬
‫ובאופן דומה נגדיר את הפונקציה ‪U2‬‬
‫אם כל שחקן יגריל כל פעולה בהסתברות ½‬
‫נקבל שיווי משקל נאש באסטרטגיות מעורבות‬
‫במשחק זוג או פרט‬
NE
PNE
DSE
Dominant Strategy Equilibrium:
(a1, a2, …, an)  A1 x A2 ··· x An is a DSE if
ui(ai, b-i) > ui(a’i, b-i)
for every b-i and every a’i  Ai
Pure Nash Equilibrium:
(a1, a2, …, an)  A1 x A2 ··· x An is a PNE if
ui(ai, a-i) > ui(a’i, a-i)
for every a’i  Ai
Nash Equilibrium:
(p1, p2, …, pn)   (A1) x  (A2) ··· x  (An) is a NE
if Ui(pi, p-i) > Ui(p’i, p-i)
for every p’i   (Ai)
‫ראינו ששיווי משקל באסטרטגיות‬
‫טהורות ‪ PNE‬לא תמיד קיים במשחקים‬
‫סופיים (למשל‪ ,‬זוג או פרט)‬
‫נ‬
‫מה לגבי ‪?NE‬‬
‫משפט (‪:(JOHN NASH, 1951‬‬
‫לכל משחק סופי קיים שיווי משקל ‪NE‬‬
‫ג'ון נאש זכה בפרס נובל בשנת ‪1994‬‬
‫על תרומתו לתורת המשחקים‬
‫נראה את הוכחת משפט נאש‪,‬‬
‫בשלבים ‪...‬‬
‫נתחיל בחידה‪:‬‬
‫נזיר יצא בשמונה בבוקר לצעוד על שביל המוביל‬
‫ממורד ההר לפסגת ההר‪ ,‬מדי פעם הוא נח והתפלל‪,‬‬
‫ולבסוף הגיע לפסגת ההר בשמונה בערב‪.‬‬
‫למחרת‪ ,‬צעד הנזיר במהירות קבועה וללא עצירה‬
‫במורד השביל החל משמונה בבוקר עד שמונה בערב‪.‬‬
‫הוכיחו שיש נקודה על השביל שבה ביקר הנזיר בדיוק‬
‫באותה שעה‪ ,‬יום אחרי יום‪.‬‬
‫חידה‪ :‬נזיר יצא בשמונה בבוקר לצעוד על שביל‬
‫המוביל ממורד ההר לפסגת ההר‪ ,‬מדי פעם הוא נח‬
‫והתפלל‪ ,‬ולבסוף הגיע לפסגת ההר בשמונה בערב‪.‬‬
‫למחרת‪ ,‬צעד הנזיר במהירות קבועה וללא עצירה‬
‫במורד השביל החל משמונה בבוקר עד שמונה בערב‪.‬‬
‫הוכיחו שיש נקודה על השביל שבה ביקר הנזיר בדיוק‬
‫באותה שעה‪ ,‬יום אחרי יום‬
‫פתרון‪ :‬נדמיין שתי נזירות שמתחילות לצעוד בשמונה‬
‫בבוקר על השביל בכיוונים מנוגדים‪ :‬הנזירה הראשונה‬
‫"מסמלצת" את מסלול הנזיר ביום הראשון‪ ,‬והשנייה את‬
‫מסלול הנזיר ביום השני‪ .‬שתי הנזירות בהכרח ייפגשו‪.‬‬
?
‫הערה חשובה‪ :‬משפט נקודת השבת‬
‫של בראואר הוא משפט קיום‬
‫הערה חשובה‪:‬‬
‫משפט נאש הוא משפט קיום‬
‫דילמת האסיר ומשחקים אחרים‬
‫דילמת האסיר‬
“R”
“E”
“NC”
“C”
“R”
4,4
-1 , 5
“NC”
-1 , -1
-6 , 0
“E”
5 , -1
0,0
“C”
0 , -6
-5 , -5
Interpretations of the Prisoner's
Dilemma
Using drugs is a strictly dominant strategy for every athlete, and so we
have a situation where the players use drugs even though they
understand that there's a better outcome for both of them.
‫‪Interpretations of the Prisoner's‬‬
‫‪Dilemma‬‬
‫מסקנות "מהמשחק המחשבתי" הזה‪:‬‬
‫●‬
‫●‬
‫●‬
‫צריך אולי להגדיל את תדירות בדיקות הפתע לגילוי סמים משפרי‬
‫ביצועים‪ ,‬ולא לבצע בדיקות רק לפני תחרויות‪.‬‬
‫וכו' וכו'‬
‫באופן כללי‪ :‬לנסות לשנות את התועלות‪ ,‬ו‪/‬או להוסיף "פעולות"‬
‫ו"שחקנים" חדשים למשחק‪.‬‬
http://en.wikipedia.org/wiki/File:Frankfurt_Airport_tunnel.JPG
‫משחק "מחשבתי"‪ :‬כל שחקן צריך לבחור‬
‫נקודה (פיקסל) בתמונה‪ ,‬אם כולם בוחרים את‬
‫אותה נקודה אז כל משתתף מקבל דולר‪,‬‬
‫אחרת כל אחד מקבל אפס‬
‫משחק‪ :‬כל שחקן צריך לבחור נקודה‬
‫בתמונה‪ ,‬אם כולם בוחרים את אותה נקודה‬
‫אז כל משתתף מקבל דולר‪ ,‬אחרת אפס‬
‫פתרון‪ :‬נשים לב שכל נקודה בתמונה היא‬
‫שיווי משקל נאש‪ ,‬אבל סביר ששיווי המשקל‬
‫שייבחר הוא "נקודת המגוז"‬
‫מלחמת המינים שייך למשפחת משחקי הקואורדינציה‪,‬‬
‫שבהם כדאי לשחקן לבחור את מה ששאר השחקנים בחרו‪.‬‬
‫בעיה‪ :‬יש שני שיוויי משקל באסטרטגיות טהורות‪ ,‬איזה‬
‫מהם ייבחר?‬
‫לא תמיד יש קונבנציה חברתית מתאימה שתנחה את‬
‫השחקנים‪ ,‬בסגנון "זכות קדימה לרכב הבא מימין"‬
Focal Point / Two Drivers
Two drivers are approaching each other at night
on an undivided country road:
England vs. the U.S.
‫‪Real World Interpretations of Mixed‬‬
‫‪Strategy Equilibria‬‬
‫כנראה שהמוח האנושי מסוגל לפעול בצורה הסתברותית‬
‫ולהטיל מטבעות "מדומיינות"‪ ,‬במיוחד אצל ספורטאים‪.‬‬
‫האם זה אומר בהכרח שעבור משחק עם שיווי משקל‬
‫יחיד‪ ,‬שהוא שיווי משקל באסטרטגיות מעורבות (למשל‬
‫אבן נייר ומספריים‪ ,‬זוג או פרט)‪ ,‬אנשים יפעלו בהכרח על‬
‫פי אסטרטגיית שיווי המשקל?‬
The 2009 World Rock-Paper-Scissors Championship, Toronto
Bibliography
Lecture notes by Chandra Chekuri, CS 573: Algorithmic
Game Theory, 2008, UIUC
Lecture notes by Constantinos Daskalakis, 6.853: Topics in
Algorithmic Game Theory, 2011, MIT
Lecture notes by Dov Monderer, 096750, Non-cooperative
Game Theory, 2002, Technion
Lecture notes by Christos H. Papadimitriou, CS294-P29,
Algorithmic Game Theory, 2011, UC Berkeley
David Easley and Jon Kleinberg, Networks, Crowds, and
Markets, Cambridge University Press, 2010
Download