2015-05-26 00:46:05
我們現(xiàn)在很難知道冥冥中是什么樣一種力量驅(qū)使著約翰·納什在5月23日作出了他的判斷和選擇,但可以肯定的是,諾貝爾經(jīng)濟學獎獲得者、博弈論大師納什以一場意外終結(jié)了他一生的博弈。
◎李華芳
從機場回家有多條道路可供選擇:可以走較快的收費公路,可以走較慢的普通公路;從機場回家的交通工具也有不同的選擇:可以乘的哥甲的車,也可以乘的哥乙的車;甚至坐上車也有不同選擇:可以系上安全帶,同樣也可以不系……
如果用博弈論的理論框架來看待人生,也許幾個重要時刻所選擇的策略就決定了一個人終生的命運。我們現(xiàn)在很難知道冥冥中是什么樣一種力量驅(qū)使著約翰·納什在5月23日作出了他的判斷和選擇,但可以肯定的是,諾貝爾經(jīng)濟學獎獲得者、博弈論大師納什以一場意外終結(jié)了他一生的博弈。
謹以本版文章向數(shù)學界、經(jīng)濟學界這一杰出的天才致以哀悼。
意外的車禍
從美國新澤西州紐瓦克國際機場出發(fā)到夢落鎮(zhèn)有很多條路可以走,要么走收費的新澤西高速公路,要么走其他不收費的路。一般來說,收費的路車少點,快一點;不收費的,稍微慢一點,也許還會擁堵。
不過,如果大家都想快一點而忽略那一點點成本,那么收費高速也可能形成擁堵,各條路最終會差不多。這背后的道理是博弈論,擁堵是非合作博弈中,個體理性決策相互博弈最終未必導致最優(yōu)結(jié)果的一個現(xiàn)實案例。這也是約翰·納什(JohnF.Nash)1950年博士論文的研究重點。
上周六(5月23日),納什和妻子艾麗西亞從挪威回美國。他們是去領取阿貝爾(Abel)數(shù)學獎。他和路易斯·尼倫伯格(LouisNirenberg)分享了阿貝爾獎,該獎項旨在表彰他們在非線性偏微分方程方面所作出的卓越貢獻。對納什來說,這才是他作為數(shù)學家應得的榮譽。
從機場出來,納什和妻子搭上了格吉斯開的出租車,回普林斯頓的家。格吉斯像多數(shù)出租車司機一樣,選擇了收費公路。車到夢落鎮(zhèn)時,他試圖超車,結(jié)果車失去控制,撞在路邊,納什夫婦被甩出車外。這場意外的車禍奪去了他們的生命。
21歲取得博士學位
多數(shù)人知道納什或許是因為電影《美麗心靈》。盡管這部電影如果直譯成《出色的頭腦》(BeautifulMind)也許會減少很多誤解,因為孤僻桀驁古怪的天才納什,和美麗的心靈實在相去甚遠。
對于學者來說,“非合作博弈中的納什均衡”和“在低維歐幾里得空間中實現(xiàn)局部光滑嵌入黎曼流形”才是納什最值得稱道的貢獻。
1994年,納什在領取諾貝爾經(jīng)濟學獎時,回顧了自己的求學經(jīng)歷。1948年,納什需要在普林斯頓和哈佛之間做個選擇,普林斯頓給的獎學金更加豐厚,所以納什來到了普林斯頓。1950年,納什博士畢業(yè)。兩年多拿到普林斯頓的數(shù)學博士,正應了杜豐(R.J.Duffin)為納什寫的推薦信,這封著名的推薦信里只有一句話“這是個天才”。
納什回憶說,自己為了博士有兩手準備:一方面已經(jīng)逐步建立起非合作博弈的理論;另一方面在流形及實代數(shù)簇方面做了準備工作。如果非合作博弈的論文不被數(shù)學系接受,他還有流形方面的論文可以當成博士論文交差。這篇名為《非合作博弈》(Non-cooperativegames)的論文總共只有27頁,寫完論文拿到博士的納什當年21歲。這篇論文在1994年為納什贏得了諾貝爾經(jīng)濟學獎。
論文獲諾獎委員會好評
納什在博士論文中首先區(qū)分了兩種不同的博弈:合作博弈和非合作博弈。隨后在論文中納什提供了兩種對非合作博弈中的均衡的解釋:第一種基于個體理性,第二種則基于群體行為。
基于個體理性,如果所有人都知道各自的偏好以及在當前博弈框架下的可能收益,也就是說信息是完全的并且是所有人共享的,那么理性的個體就能計算出其他個體的潛在收益從而預測出其他人的最優(yōu)行為,最后的結(jié)果必然是一個均衡狀態(tài)。在這個狀態(tài)中,沒有人有意愿改變自己的行為策略?;谌后w行為,就有所謂的演化博弈。納什指出在群體規(guī)模有限的情況下,存在混合策略納什均衡。
諾獎委員會1994年評價納什的工作稱幾乎所有的經(jīng)濟行為分析都可以用到博弈論,從壟斷廠商到競爭個體,概莫能外。發(fā)展至今的博弈論也的確證實了這一點。
突遭精神疾病折磨
博士畢業(yè)后,納什非常想留在普林斯頓,但普林斯頓當時并沒有給他終身教職。這或許傷害了納什的自尊心。但納什沒有意識到的是,這或許并不是因為他個人的學術水平不夠,而是他那種以自我為中心、完全無視其他人感受的傲慢態(tài)度,令同行難以忍受所致。
另一個原因,也許是納什在1994年諾獎演說中提到的那樣,麻省理工學院(MIT)給了更多的報酬,所以他前往MIT任教,隨后發(fā)表了《實代數(shù)流形》。
當然,納什在MIT也不受歡迎。據(jù)說有一位同事受不了納什每天牛氣沖天的自傲,怒激納什:“既然這么牛,那你去解決嵌入性問題(嵌入性問題是指所有黎曼流形都可以嵌入到歐幾里得空間里)。”納什隨即和其打賭,兩年后證明“在低維歐幾里得空間中可以實現(xiàn)局部光滑嵌入黎曼流形”。納什隨后稱這不過是為了一個賭局。
人生滿是意外,或者上帝是公平的。當納什學術如日中天時,精神疾病纏上了他。納什在諾獎演說中回憶自己解決了一個偏微分方程的問題,但意大利的另一位數(shù)學家EnniodeGiorgi也同時解決了這個問題,現(xiàn)在這個定理也被稱為Nash-deGiorgi定理。
但1958年,同為菲爾茨獎的候選人,EnniodeGiorgi獲獎,但納什失之交臂。數(shù)學家們認為這觸發(fā)了他的病情,因為他是一個自傲的人,處處想要爭先,想要在知識上高人一等,所以無法容忍這一失敗。
一年后,納什的精神狀況迅速惡化,無法履行教書職責,不得不從MIT辭職。艾麗西亞送他到精神病院治療,稍有好轉(zhuǎn)后,納什出院。但隨即病情惡化,納什幻想自己遭受迫害,被人追殺,于是出逃歐洲,避難日內(nèi)瓦。艾麗西亞雖然將納什帶回美國,但隨后卻不得不為了孩子,以離婚告別精神失常的納什。此后納什的精神每況愈下。順便說一句,納什和艾麗西亞的孩子小納什也是一位數(shù)學家,同樣飽受精神疾病的折磨。
病情穩(wěn)定終獲諾獎
幾年后,艾麗西亞將納什接回普林斯頓,共同居住。電影《美麗心靈》美化了這一點。普林斯頓大學也算是接納了納什。其后多年,瘋瘋癲癲的納什就游蕩在普林斯頓的校園里。精神疾病困擾納什長達25年。
1994年,納什病情穩(wěn)定,普林斯頓大學的寬厚幽靜開始治愈這位天才。同年,諾獎委員會有意向給納什諾獎,普林斯頓大學數(shù)學系的教授哈羅德·庫恩極力游說委員會,且力證納什已經(jīng)完全康復。并且游說普林斯頓大學為納什增設了一個“訪問研究合作者”的職位給長久沒有工作的納什。
納什獲獎后,又是庫恩教授主持了當年的諾獎研討會。庫恩在研討會中問納什,為什么1951年發(fā)表在《數(shù)學年鑒》上的非合作博弈的論文沒有包括基于個人理性和群體行為的兩個解釋時,納什表示,無法回答這個問題,因為他“忘記了”。
實際上,解釋的一部分于1953年發(fā)表在著名的《計量經(jīng)濟學》雜志上,題目是《兩人合作博弈》。
沒有盡頭的美好假期來臨
與人相處困難,幾乎是天才的固有特征。但納什是幸運的,有艾麗西亞相伴終身。只是“兩人合作博弈”又何嘗是件容易的事情,要考慮信息的動態(tài)變化,是否重復博弈,雙方是否有信息共識等。心靈美麗的艾麗西亞接納包容支持納什直到生命終結(jié)。
人生是場意外的博弈。當納什自信滿滿,以為窺見了完全的信息,卻受到妄想癥的折磨;當納什精神恍惚,陷入低谷,卻是艾麗西亞和普林斯頓大學接納包容他;當納什恢復健康,功成名就,卻已垂垂老矣;當納什老來獲獎,堪稱圓滿之際,卻被一場車禍奪去生命。
納什在諾獎演講中說,“瘋癲的25年是我人生中的一段假期”,但那未必是美好的假期。現(xiàn)在,沒有盡頭的美好假期終于來了。
安息吧,納什教授。
(作者為上海金融與法律研究院研究員,本文摘自互聯(lián)網(wǎng)原創(chuàng)專欄騰訊《大家》http://dajia.qq.com,騰訊《大家》微信號:ipress)
《《《
納什年表
◎1928年6月13日 納什出生于美國西弗吉尼亞州
◎1945年6月 納什進入卡耐基梅隆大學,在數(shù)學領域展現(xiàn)出杰出才能
◎1950年 22歲的納什獲得普林斯頓研究院博士學位,并在博士論文中提出后來被稱為“納什均衡”的博弈理論
◎1952年 24歲的納什開始在麻省理工學院執(zhí)教
◎1958年 納什取得麻省理工學院終身教職,同年因幻聽、幻視被確診為嚴重精神分裂癥,他也因該病癥在1962年與有數(shù)學領域諾貝爾獎之稱的菲爾茨獎失之交臂
◎1994年 納什與另外兩位博弈論學家海薩尼和澤爾騰共同獲得諾貝爾經(jīng)濟學獎
◎2015年5月23日 納什夫婦遇車禍,在美國新澤西州逝世
《《《
借經(jīng)典案例讀懂博弈論與納什均衡
名詞解釋
【博弈論】亦名“對策論”、“賽局理論”,屬應用數(shù)學的一個分支,它起源于研究人們玩撲克、象棋等游戲時的行為決策,觀察游戲中每一個體的預測行為和實際行為,并研究它們的優(yōu)化策略,但后來作為一種研究人類經(jīng)濟行為的數(shù)學工具得到了充分發(fā)展。【納什均衡】又稱非合作博弈均衡,是以約翰·納什命名的博弈論重要術語,它指的是這樣一種策略組合,該組合由所有參與博弈者的最優(yōu)策略組成,并使自己的利益最大化——即假定在給定別人策略的情況下,沒有人有足夠的理由打破這種均衡。從實質(zhì)上說,這是一種非合作博弈狀態(tài)。
經(jīng)典案例
【智豬博弈】
現(xiàn)象:豬圈里有一大一小兩頭豬,豬圈一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
策略:那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。
解析:小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,明知小豬不會去踩動踏板,自己親自去踩踏板總比不踩強,所以只好親力親為。
【囚徒困境】
現(xiàn)象:假設有兩個小偷A和B聯(lián)合犯案后被抓住。警方將兩人分別置于兩個不同的房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
策略:最好的策略顯然是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保;其次才是亞當·斯密的理論,假設每個人都是“理性的經(jīng)濟人”,都會從利己的目的出發(fā)進行選擇。
解析:兩個人都會有這樣一個盤算過程——假如A坦白,B抵賴,B得坐10年監(jiān)獄,B坦白最多才8年;B要是抵賴,A就可以被釋放,而B會坐10年牢。綜合以上幾種情況考慮,不管A坦白與否,對B而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終兩個人都選擇了坦白,結(jié)果都被判8年刑期。
重要影響
博弈論不是納什發(fā)明的,但他擴大了該理論的范圍,為之提供了解決實際問題的更有力工具。
如今,經(jīng)濟學家繼續(xù)使用博弈論分析人們?nèi)绾巫鞒鲇嘘P金錢的決策;生物學家用它來建立假說以解釋適者生存的原理;人類學家使用它來研究原始文化,從而說明人性的多樣化;神經(jīng)科學者也加入了博弈論研究的行列,通過研究博弈者的大腦,試圖發(fā)現(xiàn)決策如何反映人們的動機和情感。
簡言之,納什的數(shù)學理論連同在其基礎上建立起來的現(xiàn)代博弈論已經(jīng)成為科學家研究眾多與人類行為相關課題時的首選方法。
博弈論所研究的是理性的決策者之間沖突及合作的理論,可以為實際決策提供理論基礎和方向指導。其最終追求結(jié)果是使博弈方達到利益最大化的均衡。在生活中,博弈無處不在,博弈論代表著一種全新的分析方法和全新的思想??梢赃@樣說,要想贏得生意,不可不學博弈論;要想贏得生活,同樣不可不學博弈論。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP