pptx - WordPress.com

Topics in Algorithmic Game Theory ‫נושאים אלגוריתמיים בתורת המשחקים‬ Game Theory ● ● ● ● ● What is it about ? Games are thought experiments to help us learn how to predict rational behavior in situations of conflict. Rational: The players want to maximize their own expected utility. Situation of conflict: Everybody's actions affect others. This is captured by the tabular game formalism. Predict: We want to know whant happens in a game. Such predictions are called solution concepts (e.g., Nash equilibrium). Game Theory ● ● ● ● ● What is it about ? Games are thought experiments to help us learn how to predict rational behavior in situations of conflict. Rational: The players want to maximize their own (expected) utility. Situation of conflict: Everybody's actions affect others. This is captured by the tabular game formalism. Predict: We want to know whant happens in a game. Such predictions are called solution concepts (e.g., Nash equilibrium). Game Theory ● ● ● ● ● What is it about ? Games are thought experiments to help us learn how to predict rational behavior in situations of conflict. Rational: The players want to maximize their own expected utility. Situation of conflict: Everybody's actions affect others. This is captured by the tabular game formalism. Predict: We want to know whant happens in a game. Such predictions are called solution concepts (e.g., Nash equilibrium). Game Theory ● ● ● ● ● What is it about ? Games are thought experiments to help us learn how to predict rational behavior in situations of conflict. Rational: The players want to maximize their own expected utility. Situation of conflict: Everybody's actions affect others. This is captured by the tabular game formalism. Predict: We want to know what happens in a game. Such predictions are called solution concepts (e.g., Nash equilibrium). Game Theory ● ● ● ● ● What is it about ? Games are thought experiments to help us learn how to predict rational behavior in situations of conflict. Rational: The players want to maximize their own (expected) utility. Situation of conflict: Everybody's actions affect others. This is captured by the tabular game formalism. Predict: We want to know whant happens in a game. Such predictions are called solution concepts (e.g., Nash equilibrium). ‫דוגמאות למשחקים‬ ‫אבן‪ ,‬נייר ומספריים‬ ‫‪ 2‬שחקנים‪ :‬שחקן שורה ושחקן עמודה‬ ‫לכל שחקן יש ‪ 3‬פעולות (‪ )actions‬אפשריות לבחירה‬ ‫משחק סכום אפס‬ ‫צ'יקן‬ ‫‪ 2‬שחקנים‬ ‫לכל שחקן ‪ 2‬פעולות‬ ‫דוגמא למשחק של ‪ 3‬שחקנים‪ ,‬עם ‪ 2‬פעולות לכל שחקן‬ ‫דוגמא למשחק של ‪ n‬שחקנים‪ ,‬לכל שחקן יש אינסוף‬ ‫פעולות‬ ‫פורמלית‪ ,‬משחק מוגדר על ידי ) 𝑖𝑢 ‪ ,(𝑁, 𝐴𝑖 ,‬כאשר‪:‬‬ ‫• }‪ N = {1, 2, …, n‬היא קבוצה של ‪ n‬שחקנים‪.‬‬ ‫• ‪ Ai‬היא קבוצת הפעולות האפשריות של שחקן ‪i‬‬ ‫• התועלת של שחקן ‪ i‬מוגדרת ע"י הפונקציה‬ ‫‪ui: A1 x A2 x A3 ··· x An  R‬‬ ‫• (ז"א התועלת של שחקן ‪ i‬תלויה בפעולות שנבחרו‬ ‫על ידי ‪ i‬וע"י שאר השחקנים)‬ ‫𝑖𝑢 ‪ 𝑁, 𝑆𝑖 ,‬ייקרא משחק סופי אם ‪ N‬היא‬ ‫• משחק‬ ‫קבוצה סופית ואם ‪ Ai‬היא קבוצה סופית לכל שחקן ‪.i‬‬ ‫בשבוע שעבר ‪...‬‬ ‫●‬ ‫●‬ ‫●‬ ‫אם שחקן העמודות בוחר עו"ד רגיל‪ ,‬אז כדאי לשחקן השורות‬ ‫לבחור עו"ד מומחה‪.‬‬ ‫אם שחקן העמודות בוחר עו"ד מומחה‪ ,‬אז כדאי לשחקן השורות‬ ‫לבחור עו"ד מומחה‪.‬‬ ‫ראינו שתחת הנחת ה"רציונליות"‬ ‫כל שחקן יבחר בעו"ד מומחה‬ ‫”‪“E‬‬ ‫‪-1 , 5‬‬ ‫”‪“R‬‬ ‫‪4,4‬‬ ‫”‪“R‬‬ ‫בלי קשר לבחירת השחקן האחר‪.‬‬ ‫●‬ ‫התוצאה תהיה "‪."0 ,0‬‬ ‫‪0,0‬‬ ‫‪5 , -1‬‬ ‫”‪“E‬‬ ‫במשחק הצ'יקן‪ ,‬לא קיימת אסטרטגיה שהיא מועדפת בלי‬ ‫כל קשר לבחירת השחקן האחר‪.‬‬ ‫לדוגמא אם שחקן העמודות בחר לעצור אז לשחקן השורות‬ ‫כדאי יותר להאיץ‪ ,‬ואם שחקן העמודות בחר להאיץ אז‬ ‫כדאי לשחקן העמודות לעצור‪.‬‬ ‫פתרון = תוצאת המשחק‬ ‫התוצאה "‪ "0 ,0‬שמתייחסת לזוג הפעולות ‪E ,E‬‬ ‫מהווה שיווי משקל‪:‬‬ ‫בהינתן שכל אחד מהשחקנים‬ ‫מתכוון לבחור את ‪,E‬‬ ‫אף שחקן לא ירצה לשנות‬ ‫את דעתו באופן חד צדדי‬ ‫”‪“E‬‬ ‫‪-1 , 5‬‬ ‫”‪“R‬‬ ‫‪4,4‬‬ ‫”‪“R‬‬ ‫ולבחור את ‪.R‬‬ ‫‪0,0‬‬ ‫‪5 , -1‬‬ ‫”‪“E‬‬ ‫‪" ≈ DSE‬לא משנה איזה עו"ד בוחר השחקן האחר‪ ,‬לי כדאי לשכור עו"ד מומחה"‬ ‫‪" ≈ PNE‬אם השחקן האחר בוחר עו"ד מומחה‪ ,‬לי כדאי גם לשכור עו"ד מומחה"‬ ‫‪PNE‬‬ ‫‪DSE‬‬ ‫‪ E,E‬הוא שיווי משקל יחיד‬ ‫בדוגמא זו‪ ,‬קל לראות שכל זוג פעולות שאינו ‪E ,E‬‬ ‫אינו מהווה שיווי משקל‪ ,‬כלומר תמיד יהיה שחקן שיעדיף לסטות‬ ‫באופן חד צדדי‪:‬‬ ‫”‪“E‬‬ ‫‪-1 , 5‬‬ ‫‪‬‬ ‫‪0,0‬‬ ‫”‪“R‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪4,4‬‬ ‫‪‬‬ ‫‪5 , -1‬‬ ‫”‪“R‬‬ ‫”‪“E‬‬ ‫אסטרטגיה טהורה‬ ‫●‬ ‫הגדרה‪ :‬אסטרטגיה טהורה היא הפעולה שאותה בחר השחקן‬ ‫לשחק מתוך אוסף הפעולות האפשריות‪.‬‬ ‫●‬ ‫לדוגמא‪ ,‬הראינו שזוג‬ ‫●‬ ‫האסטרטגיות הטהורות ‪E,E‬‬ ‫●‬ ‫מהווה שיווי משקל כאשר‬ ‫●‬ ‫השחקנים פועלים באופן רציונלי‬ ‫”‪“E‬‬ ‫‪-1 , 5‬‬ ‫‪0,0‬‬ ‫”‪“R‬‬ ‫‪4,4‬‬ ‫‪5 , -1‬‬ ‫”‪“R‬‬ ‫”‪“E‬‬ ‫מלחמת המינים‬ ‫יש שני שיוויי משקל באסטרטגיות טהורות (שבכל אחד‬ ‫מהם לאף שחקן לא כדאי לסטות באופן חד צדדי)‬ ‫מהו שיווי המשקל כאן?‬ ?‫איך משחקים צ'יקן‬ ‫משחק באסטרטגיות טהורות בנוסח הוליווד‬ http://www.youtube.com/watch?v=YDSj6ptcwbw&feature =related 22:40 ‫●‬ ‫בעיה‪ :‬במשחק זוג או פרט לא קיים שיווי משקל‬ ‫נאש באסטרטגיות טהורות‬ ‫‪‬‬ ‫‪‬‬ ‫אסטרטגיה מעורבת ‪ -‬דוגמא‬ ‫●‬ ‫דוגמא לאסטרטגיה מעורבת לשחקן השורות‪ :‬הגרל כל פעולה בהסתברות ½‬ ‫●‬ ‫דוגמא לאסטרטגיה מעורבת לשחקן העמודות‪ :‬הגרל כל פעולה בהסתברות ½‬ ‫●‬ ‫נשים לב‪ :‬כעת תהיה לנו התפלגות אחידה על התוצאות האפשריות‪:‬‬ ‫●‬ ‫לדוגמא התוצאה (‪ )-1 ,1‬תיבחר בהסתברות ¼‪.‬‬ ‫●‬ ‫בנוסף‪ :‬נגדיר את תועלת השחקן להיות תוחלת התועלת (ביחס להתפלגות‬ ‫על התוצאות)‪.‬‬ ‫‪ ui: A1 x A2 ··· x An  R‬לעומת ‪Ui: (A1) x (A2) ··· x (An)  R‬‬ ‫אסטרטגיה מעורבת ‪ -‬דוגמא‬ ‫●‬ ‫דוגמא לאסטרטגיה מעורבת לשחקן השורות‪ :‬הגרל כל פעולה בהסתברות ½‬ ‫●‬ ‫דוגמא לאסטרטגיה מעורבת לשחקן העמודות‪ :‬הגרל כל פעולה בהסתברות ½‬ ‫●‬ ‫נשים לב‪ :‬כעת תהיה לנו התפלגות אחידה על התוצאות האפשריות‪:‬‬ ‫●‬ ‫לדוגמא התוצאה (‪ )T, H‬תיבחר בהסתברות ¼‪.‬‬ ‫●‬ ‫בנוסף‪ :‬נגדיר את תועלת השחקן להיות תוחלת התועלת (ביחס להתפלגות‬ ‫על התוצאות)‪.‬‬ ‫‪ ui: A1 x A2 ··· x An  R‬לעומת ‪Ui: (A1) x (A2) ··· x (An)  R‬‬ ‫‪u1(H, T) = 1, u1(T, H) = 1, u1(H, H) = -1, u1(T, T) = -1‬‬ ‫… ‪u2(H, T) = -1,‬‬ ‫לעומת‬ ‫= ))‪U1 ((1/2, 1/2), (1/2, 1/2‬‬ ‫?=‬ ‫●‬ ‫)‪¼ u1 (H, H) + ¼ u1 (H, T) + ¼ u1 (T, H) + ¼ u1 (T, T‬‬ ‫ובאופן דומה נגדיר את הפונקציה ‪U2‬‬ ‫אם כל שחקן יגריל כל פעולה בהסתברות ½‬ ‫נקבל שיווי משקל נאש באסטרטגיות מעורבות‬ ‫במשחק זוג או פרט‬ NE PNE DSE Dominant Strategy Equilibrium: (a1, a2, …, an)  A1 x A2 ··· x An is a DSE if ui(ai, b-i) > ui(a’i, b-i) for every b-i and every a’i  Ai Pure Nash Equilibrium: (a1, a2, …, an)  A1 x A2 ··· x An is a PNE if ui(ai, a-i) > ui(a’i, a-i) for every a’i  Ai Nash Equilibrium: (p1, p2, …, pn)   (A1) x  (A2) ··· x  (An) is a NE if Ui(pi, p-i) > Ui(p’i, p-i) for every p’i   (Ai) ‫ראינו ששיווי משקל באסטרטגיות‬ ‫טהורות ‪ PNE‬לא תמיד קיים במשחקים‬ ‫סופיים (למשל‪ ,‬זוג או פרט)‬ ‫נ‬ ‫מה לגבי ‪?NE‬‬ ‫משפט (‪:(JOHN NASH, 1951‬‬ ‫לכל משחק סופי קיים שיווי משקל ‪NE‬‬ ‫ג'ון נאש זכה בפרס נובל בשנת ‪1994‬‬ ‫על תרומתו לתורת המשחקים‬ ‫נראה את הוכחת משפט נאש‪,‬‬ ‫בשלבים ‪...‬‬ ‫נתחיל בחידה‪:‬‬ ‫נזיר יצא בשמונה בבוקר לצעוד על שביל המוביל‬ ‫ממורד ההר לפסגת ההר‪ ,‬מדי פעם הוא נח והתפלל‪,‬‬ ‫ולבסוף הגיע לפסגת ההר בשמונה בערב‪.‬‬ ‫למחרת‪ ,‬צעד הנזיר במהירות קבועה וללא עצירה‬ ‫במורד השביל החל משמונה בבוקר עד שמונה בערב‪.‬‬ ‫הוכיחו שיש נקודה על השביל שבה ביקר הנזיר בדיוק‬ ‫באותה שעה‪ ,‬יום אחרי יום‪.‬‬ ‫חידה‪ :‬נזיר יצא בשמונה בבוקר לצעוד על שביל‬ ‫המוביל ממורד ההר לפסגת ההר‪ ,‬מדי פעם הוא נח‬ ‫והתפלל‪ ,‬ולבסוף הגיע לפסגת ההר בשמונה בערב‪.‬‬ ‫למחרת‪ ,‬צעד הנזיר במהירות קבועה וללא עצירה‬ ‫במורד השביל החל משמונה בבוקר עד שמונה בערב‪.‬‬ ‫הוכיחו שיש נקודה על השביל שבה ביקר הנזיר בדיוק‬ ‫באותה שעה‪ ,‬יום אחרי יום‬ ‫פתרון‪ :‬נדמיין שתי נזירות שמתחילות לצעוד בשמונה‬ ‫בבוקר על השביל בכיוונים מנוגדים‪ :‬הנזירה הראשונה‬ ‫"מסמלצת" את מסלול הנזיר ביום הראשון‪ ,‬והשנייה את‬ ‫מסלול הנזיר ביום השני‪ .‬שתי הנזירות בהכרח ייפגשו‪.‬‬ ? ‫הערה חשובה‪ :‬משפט נקודת השבת‬ ‫של בראואר הוא משפט קיום‬ ‫הערה חשובה‪:‬‬ ‫משפט נאש הוא משפט קיום‬ ‫דילמת האסיר ומשחקים אחרים‬ ‫דילמת האסיר‬ “R” “E” “NC” “C” “R” 4,4 -1 , 5 “NC” -1 , -1 -6 , 0 “E” 5 , -1 0,0 “C” 0 , -6 -5 , -5 Interpretations of the Prisoner's Dilemma Using drugs is a strictly dominant strategy for every athlete, and so we have a situation where the players use drugs even though they understand that there's a better outcome for both of them. ‫‪Interpretations of the Prisoner's‬‬ ‫‪Dilemma‬‬ ‫מסקנות "מהמשחק המחשבתי" הזה‪:‬‬ ‫●‬ ‫●‬ ‫●‬ ‫צריך אולי להגדיל את תדירות בדיקות הפתע לגילוי סמים משפרי‬ ‫ביצועים‪ ,‬ולא לבצע בדיקות רק לפני תחרויות‪.‬‬ ‫וכו' וכו'‬ ‫באופן כללי‪ :‬לנסות לשנות את התועלות‪ ,‬ו‪/‬או להוסיף "פעולות"‬ ‫ו"שחקנים" חדשים למשחק‪.‬‬ http://en.wikipedia.org/wiki/File:Frankfurt_Airport_tunnel.JPG ‫משחק "מחשבתי"‪ :‬כל שחקן צריך לבחור‬ ‫נקודה (פיקסל) בתמונה‪ ,‬אם כולם בוחרים את‬ ‫אותה נקודה אז כל משתתף מקבל דולר‪,‬‬ ‫אחרת כל אחד מקבל אפס‬ ‫משחק‪ :‬כל שחקן צריך לבחור נקודה‬ ‫בתמונה‪ ,‬אם כולם בוחרים את אותה נקודה‬ ‫אז כל משתתף מקבל דולר‪ ,‬אחרת אפס‬ ‫פתרון‪ :‬נשים לב שכל נקודה בתמונה היא‬ ‫שיווי משקל נאש‪ ,‬אבל סביר ששיווי המשקל‬ ‫שייבחר הוא "נקודת המגוז"‬ ‫מלחמת המינים שייך למשפחת משחקי הקואורדינציה‪,‬‬ ‫שבהם כדאי לשחקן לבחור את מה ששאר השחקנים בחרו‪.‬‬ ‫בעיה‪ :‬יש שני שיוויי משקל באסטרטגיות טהורות‪ ,‬איזה‬ ‫מהם ייבחר?‬ ‫לא תמיד יש קונבנציה חברתית מתאימה שתנחה את‬ ‫השחקנים‪ ,‬בסגנון "זכות קדימה לרכב הבא מימין"‬ Focal Point / Two Drivers Two drivers are approaching each other at night on an undivided country road: England vs. the U.S. ‫‪Real World Interpretations of Mixed‬‬ ‫‪Strategy Equilibria‬‬ ‫כנראה שהמוח האנושי מסוגל לפעול בצורה הסתברותית‬ ‫ולהטיל מטבעות "מדומיינות"‪ ,‬במיוחד אצל ספורטאים‪.‬‬ ‫האם זה אומר בהכרח שעבור משחק עם שיווי משקל‬ ‫יחיד‪ ,‬שהוא שיווי משקל באסטרטגיות מעורבות (למשל‬ ‫אבן נייר ומספריים‪ ,‬זוג או פרט)‪ ,‬אנשים יפעלו בהכרח על‬ ‫פי אסטרטגיית שיווי המשקל?‬ The 2009 World Rock-Paper-Scissors Championship, Toronto Bibliography Lecture notes by Chandra Chekuri, CS 573: Algorithmic Game Theory, 2008, UIUC Lecture notes by Constantinos Daskalakis, 6.853: Topics in Algorithmic Game Theory, 2011, MIT Lecture notes by Dov Monderer, 096750, Non-cooperative Game Theory, 2002, Technion Lecture notes by Christos H. Papadimitriou, CS294-P29, Algorithmic Game Theory, 2011, UC Berkeley David Easley and Jon Kleinberg, Networks, Crowds, and Markets, Cambridge University Press, 2010

pptx - WordPress.com

Related documents

Products

Support

pptx - WordPress.com

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib