首页
/
每日頭條
/
教育
/
通俗解釋博弈論
通俗解釋博弈論
更新时间:2025-01-31 20:44:05

通俗解釋博弈論?《博弈論究竟是什麼》是我執行“51工程”閱讀的第一本書,博弈論也是我最近在思考的新算法,這本書很薄,但是内容很多,由于我是第一次接觸博弈論,所以理解博弈論有一些困難為了更深入理解博弈論,我又找到《博弈與社會》,可是這本書對我來說更複雜,我隻好又看了兩遍《博弈論究竟是什麼》,我來為大家科普一下關于通俗解釋博弈論?以下内容希望對你有幫助!

通俗解釋博弈論(博弈論究竟是什麼①)1

通俗解釋博弈論

《博弈論究竟是什麼》是我執行“51工程”閱讀的第一本書,博弈論也是我最近在思考的新算法,這本書很薄,但是内容很多,由于我是第一次接觸博弈論,所以理解博弈論有一些困難。為了更深入理解博弈論,我又找到《博弈與社會》,可是這本書對我來說更複雜,我隻好又看了兩遍《博弈論究竟是什麼》。

《博弈論究竟是什麼》有非常多的概念,這篇文章我想把這些概念整理出來,方便我自己應用,所以這篇文章還是為我自己寫的,如果你想了解更多博弈論,最好還是去閱讀《博弈論究竟是什麼》和《博弈與社會》。

概念一:何謂博弈論

博弈論研究如果你想要的東西别人也想要,你們在這件事上有沖突,那你應該怎麼辦才能讓自己在這個東西的利益最大化?

博弈論研究的決策不是情緒化的,而是由利益格局決定的。

博弈論研究有對手情況下的決策。

博弈論研究理性人之間的博弈。

博弈論能幫助我們理解長期存在的各種現象,如果你觀察到社會上有很多不合理的現象,而這些現象長期存在,博弈論會幫助你考察現象背後的博弈規則。

博弈論最重要的作用是告訴我們如何改變不好的局面。

下面我們通過一個小案例,理解博弈論。

很多人都有這樣的經曆——景區的飯菜不僅貴而且很難吃。

為什麼景區的飯不能做得既實惠又可口?

因為這裡有一個單次博弈概念。

我們去過一個景區,可能這輩子就不會再去,所以景區的飯店和我們隻交易一次,這就是單次博弈,既然我們以後不會再來,飯店會盡可能在我們身上獲取最大收益,在這種情況下,景區的飯菜既貴又難吃。

和單次博弈對應的是重複博弈。

你家樓下的小飯店做的就是重複博弈,他希望你每天都來,所以飯菜既實惠又好吃。

當我們和别人交易時,我們要考慮是一錘子買賣還是長期合作,如果是一錘子買賣我們被騙的可能性比較高,所以我們需要一些方法保護我們的利益,比如簽合同。

以前我們可能認為博弈論是非常高大上的東西,國家和國家之間才會有博弈,實際博弈論就在我們身邊,我們每天都在參與各種各樣的博弈,隻是因為之前我們缺乏這方面的知識,沒有發現博弈的存在。

概念二——博弈論三個基本概念:帕累托最優、壓倒性策略、納什均衡

帕累托最優

帕累托改進的意思是這個改進在不傷害任何一個人利益的同時,使至少一個人的境遇變得更好。如果一個局面已經好到沒有帕累托改進的餘地,這個局面就是帕累托最優。

比如一條一百米的步行街要開兩家奶茶店,而這兩家奶茶店開在什麼樣的位置才是帕累托最優?

第一家奶茶店在步行街的25米處,第二家在步行街的75米處,這樣兩家奶茶店都能輻射50米距離,這就是帕累托最優。

因為帕累托最優是不穩定的,總有一家奶茶店想往中間(50米)移動,因為這樣可以輻射整條步行街,當第一家奶茶店開始移動,第二家也會移動,最終兩家奶茶店都會集中在中間。

這樣就會形成紮堆現象,我們生活中有很多紮堆現象,比如麥當勞和肯德基、中石油和中石化,所有的服裝店都聚集在一起,所有的飯店也聚集在一起,當一個熱點新聞出現後所有的媒體都在報道。

壓倒性策略

在談壓倒性策略之前,我們需要知道囚徒困境概念。

兩個罪犯被抓到,但是警察沒有直接證據,隻能通過口供才能定罪。如果兩個都招供,各判3年;如果一個不招供,一個招供,招供的有戴罪立功表現,釋放,不招供的就會判5年;兩個人都不招供,警方因證據不足,各判1年。

在囚徒困境中,我們看到,對兩個罪犯最好的策略是都不招供,各判1年,這就是帕累托最優,可是帕累托最優是不穩定的,因為在做決策的時候,我們還要考慮對方。

如果罪犯A選擇不招供,但是罪犯B選擇招供,結果罪犯A判5年,罪犯B無罪釋放,這顯然對罪犯A不利。

如果罪犯A選擇招供,但是罪犯B不招供,結果是罪犯A無罪釋放,罪犯B判5年,這是對罪犯A最好的選擇。

基于這個因素,無論罪犯B怎麼選,罪犯A最好的選擇都是招供。

這就是壓倒性策略,不管對手怎麼選,這個選擇對你來說都是最好的。

與壓倒性策略對應的是被壓倒性策略,不管别人怎麼做,你這麼做都是對你最不好的。

作為理性人,如果博弈中有壓倒性策略,就一定要選它。任何情況下都不要選被壓倒性策略。

納什均衡

納什均衡是博弈論中最重要的概念。

何謂納什均衡,我們再回到囚徒困境。

罪犯A最好的策略是招供,罪犯B最好的策略也是招供,結果兩個人各判3年,這肯定不是帕累托最優,但這是納什均衡。

納什均衡指的是這樣的一種局面:在這個策略組合裡,沒有任何一方願意單方面改變自己的策略。

不招供是最好的選擇,但是要變大家要一起變,但是每個人都不願意先變,最終這個局面就不變了。

如果一種現象能夠在社會中長期穩定存在,它對參與的各方來說一定是納什均衡。

納什均衡告訴我們評價一個局面不能隻看它是不是對整體最好,他必須得讓每個參與者都不願單方面改變才行。

理想青年喜歡帕累托最優,理性青年尋找納什均衡。

可能有些人覺得納什均衡難以理解,我們再舉一個簡單案例。

我們國家的交通規則是右側通行,這實際就是一個納什均衡。

如果你逆向而行,輕則開罰單,重則造成車禍,所以沒有人願意單方面違反這條規則。

還有一個案例可能更生動,前段時間,很多教育股大跌,我沒有關注具體情況,但是教育股涉及一個問題——補課,補課實際就是一個納什均衡,而且還是一個多人囚徒困境。

如果學生每天都在有限的時間内學習,并且保證一定的休息和玩耍時間,大學的錄取名額還是這麼多。

但是現在很多學生花費了更多時間去補課,但是大學的錄取名額并沒有增加。

如果别人都在複習,而你不複習就會吃虧,所以你不可能單方面改變這個局面。

納什均衡是一個美麗概念,它能解釋很多現象,能讓我們迅速破解各種博弈局面,更能給我們設計博弈機制提供約束條件。

未完,待續……

備注:這篇文章參考了很多《博弈論究竟是什麼》的内容。

Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
福建省教育廳關于省課程标準
福建省教育廳關于省課程标準
福建省教育廳關于省課程标準?來源:【福建省教育廳】日前,省教育廳印發《福建省本科高校教育教學研究項目管理辦法(試行)》全文如下:,現在小編就來說說關于福建省教育廳關于省課程标準?下面内容希望能幫助到你,我們來一起看看吧!福建省教育廳關于省課...
2025-01-31
小學年齡段的教育模式
小學年齡段的教育模式
為了不讓學生輸在起跑線上面,家長幾乎是從幼兒園就開始抓孩子的學習,選擇幼兒園的時候慎之又慎,生怕給孩子選擇一所不好的幼兒園。幼兒園屬于學生的“學前教育”,對于學生來說,如果可以在幼兒園接受到良好的教育,對于他們的腦力和智力來說可以起到關鍵性...
2025-01-31
某高中女生發朋友圈被學校處分
某高中女生發朋友圈被學校處分
近日(暑假),某地高中女生發了一個自拍朋友圈,配文:“有一天,我漂亮生動,我望遠山,遠山悲憫!”詩化的文字,表達了女生對美好生活的向往,盡管經過技術處理,依然難掩女生腹有詩書氣自華的青春風采。美好的事物被破壞,人們常用“牛嚼牡丹”來形容。讓...
2025-01-31
6s管理幼兒園
6s管理幼兒園
你的幼兒園是否有這樣的困擾:1、活動室日常淩亂,區域操作材料擺放不整潔。2、室内張貼幼兒作品沒有規劃布置顯得很亂。3、牆角、辦公桌上面擺放物品多而不整齊,桌子底下、旁邊經常放置一些不用的物品。4、電腦裡的文件有沒有經常性地進行分類整理,不要...
2025-01-31
什麼時候查成績啊高中
什麼時候查成績啊高中
不知道大家是不是在考前就已經想好自己考完之後要幹些什麼?通宵追劇?打遊戲?聚一聚?但是也有不少朋友在“狂歡”之後發現自己心裡空落落的!好像生活少了些什麼?其實研研也十分理解大家的心情,畢竟自己心裡崩了很久的那條弦可以放松了,總歸是有些不适應...
2025-01-31
Copyright 2023-2025 - www.tftnews.com All Rights Reserved