February 11, 2015

Welcome to Game Theory Week 3 - 4

本文為 MOOC 學習筆記。

課程為 University of Tokyo(東京大學) 在 Coursera 開的 Welcome to Game Theory

相關連結:


目錄


Week 3

3-1 Digression: The card game revisited

Card Game by O’neil, B

用 Nash equilibrium 去驗證卡片遊戲的結果,結果跟我和替代役學長們做的實驗符合,我們的確也說不出來為什麼要這樣出牌,蠻有趣的。

3-4 What does it mean that a player is rational?

Rationality is the quality or state of being reasonable, based on facts or reason. Rationality implies the conformity of one’s beliefs with one’s reasons to believe, or of one’s actions with one’s reasons for action.

Rationality by Wikipedia.

課程中的 Rationality 解釋:

Rational 的人會觀察遊戲規則,嘗試從遊戲中找各種客觀機率,並選擇報酬率最高的;若沒有客觀機率,則會用主觀機率判斷。

An agent is rational if he/she

  • is aware of all possible events
  • assigns (objective or subjective) probabilities over events
  • maxmizes expectied utility

但這個定義用在兩人對決的遊戲中,會遇到 Infinite Regress problem.

3-5 Domination: Strategies that are “obviously good or bad”

回憶 Prisoner’s Dilemma 的 Payoff 表格

嫌犯A / 嫌犯B 合作 背叛
合作 -1,-1 -15,0
背叛 0,-15 -10,-10

不管嫌犯 B 選擇合作或是背叛 ,嫌犯 A 選擇背叛都會獲得更好利益,在此情況下,背叛這個 strategy 對於嫌犯 A 來說就是 Domination Strategy

3-6 Common knowledge of rationality

A rational player never choose a strategy which is strictly dominated. 因為他們有判斷的能力。

這裡 Common Knowledge 舉例頗有趣。

3-7 Low rationality: What happens if players are not very smart?

這段要證明 Nash equilibrium 對不聰明的人也有作用。

Low rationality 的人一開始無法觀察藉由觀察遊戲規則推斷出最好的選擇,但在經歷過多次失敗後,憑著經驗以及基本的學習能力,low rationality 的人也會產生趨向 Nash equilibrium 的結果。

由於人類常常犯下類似的錯誤,因此 Low Rationality 有一個很夯的研究領域叫做 Behavioral Game Theory/Economics,這個領域在研究如何 finding patterns of low-rationality behavior,如果能從中找出 pattern,就能找到可能的解法,進而減少人們犯錯的機會。

3-8 Game theory under zero-intelligence: Biological evolution

3-9 Fig wasps play a Nash equilibrium

Evolutionary Game Theory by Wikipedia。

用 game theory 來解釋物競天擇,player 變成各種(突變)基因,Strategy 則是各種行為。

用實際數據證明 Evolutionary Game Theory 在某些實驗中成立。


Week 4

4-1 Group rationality and the rationality of individuals

回憶 Prisoner’s Dilemma 的 Payoff 表格

嫌犯A / 嫌犯B 合作 背叛
合作 -1,-1 -15,0
背叛 0,-15 -10,-10
  • Rationality of Individuals => 背叛是最好的選擇
  • Group Rationality => 互相合作是最好的選擇

Group Rationality 與 Individual Rationality 一樣,可以存在於很多種狀態。符合 Group rationality 的狀態稱之為 Best points for society,也稱作 Efficient outcomes。

Nash equilibrium 算出來的是 rationality of individuals,而 rationality of individuals 跟 Group rationality 不相等

此現象稱為 Inefficiency of Nash equilibria 或是 Price of anarchy

4-2 Why is group rationality different from rationality of individuals?

Society may be trapped in a bad Nash equilibrium: Coordination failure。

例如 QWERTY 鍵盤並不是最適合英打的鍵盤,但是大家習慣了,就 trap 在這種相對來說較沒效率的鍵盤。

這章節與其用 game theory ,感覺更適合用 社會心理學 來解釋。

4-3 Group rationality vs. rationality of individuals in biological evolution

剛剛得到的結論:Nash equilibrium 算出來的是 rationality of individuals,而 rationality of individuals 跟 Group rationality 不相等。

用這個概念去推論 生物演化,可以推斷出:取得生物演化勝利的基因並不是最好的基因(Group rationality),而是最自私/最保有自己生存能力的基因(rationality of individuals)。

4-4 Group rationality vs. rationality of individuals in social thought

亞當史密斯 / 自由經濟/ 看不見的手。

用 Game Theory 來解釋 Laissez failure: the policy of leaving things to take their own course, without intervene。

Game Theory 認為 rational 的 individuals 會為私人利益而犧牲公眾利益。

4-5 How to enforce socially desirable outcomes

  • 藉由修改遊戲規則,使 rationality of individuals == Group rationality,又稱為 Mechanism Design/ Market Design。

例如住院醫師的配對制度,Matching young doctors to hospitals for on the job training。(“Deferred Acceptance” 獲得 Nobel Prize in Economics 2012)

又例如電信頻段拍賣。

  • Sign a legally binding contract

合約受到法律強制限制,違反會有懲處,故雖然某些行為可以增進自己利益,怕違法所以不實行。

  • Use long term relationship

The partner will punish you in the future。(文明帝國IV)

4-6 Cooperation of gas stations in long-term relationship Part I: Need for cooperation

4-7 Cooperation of gas stations in long-term relationship Part II: Mechanism of cooperation

Trigger Strategy(冷酷戰略)

  • Starts with cooperation
  • Keep on cooperation if no one has deviated
  • If anyone has deviated, play Nash equilibrium of stage game forever

一旦有人破壞這個平衡,大家就都來自私的玩 Nash equilibrium,看誰撐得下去。

但我覺得這章節與其用 Game Theory ,更適合用 社會心理學 來解釋。

Summary

  • Game Theory provides a governing principle that can be applied to all social problems.
  • Nash eq may emerge by a variety of reasons.
  • Prediction power of game theory varies across applications.
  • Prediction power of game theory is not perfect, but it is useful.
  • One of the most important thing is that there is a conflict between group rationality and rationality of individuals.

pro

  • 最基本的介紹,幾乎沒有數學公式。
  • 現實生活的實際例子。
  • 實驗很有趣。
  • 投影片做的很好,簡潔明瞭,前後也有關聯。
  • quiz 提供 pdf 避免網路壞掉。
  • 不只助教,教授也主動關心 forum,與學生互動。
  • 教學團隊主動發現錯誤,縱使沒有學生發現並回報,顯見教學團隊用心。
  • 課程結束後,新錄製 final message,結算 final card game 結果。推薦許多書,並期許對遊戲理論有興趣的學生去修 stanford 在 coursera 開的 game theory。

con

  • 幾乎只有介紹 Nash Equilibrium
  • 日式英文,但基本上開字幕也是可以輕鬆 2.0X
  • 課程後半段的例子感覺用 社會心理學 解釋,會比用 Game Theory 解釋有說服力。
  • 看似很多東西都可以用 game theory 解釋,但會不會其實是陷入 hindsight bias(also called the I-knew-it-all-along phenomenon)?
  • 為什麼 final exam 可以先下載 pdf,外加兩次嘗試,外加每題都附有 hint,太過簡單。
  • quiz 及 final exam 有 70% 的題目都太過簡單。

VoiceTube 看影片學英文