谷歌alphago和李世石的比賽棋譜吸引了不少的圍棋愛好者,通過觀察此次AlphaGo圍棋VS李世石的棋譜,可以看出,人工智能還是比較強大的,下面來一起看下谷歌alphago和李世石的比賽棋譜精彩對局吧。
比賽采用5局3勝制,最終比賽獲勝方將獲得獎金100萬美元。李世石在本輪戰(zhàn)敗后,只有剩下3局全部獲勝才能以3:2總比分戰(zhàn)勝AlphaGo,而AlphaGo下一局只需獲勝即可宣布戰(zhàn)勝李世石。
剩余賽程如下(北京時間中午12點開賽):
第三場比賽:3月12日(周六)
第四場比賽:3月13日(周日)
第五場比賽:3月15日(周二)
終盤畫面,有網(wǎng)友說黑棋像個“死”字
在剛剛結(jié)束的人機圍棋大戰(zhàn)中,李世石再一次輸給了谷歌的AlphaGo。目前來看,總體形勢不容樂觀,有可能李世石會連敗五局。而機智的網(wǎng)友們馬上開始發(fā)揮P圖本領(lǐng),通過棋譜來對可憐的小李子進行嘲諷。
▲這張圖說AlphaGo在嘲諷小李子是一個弱雞。
▲這兩張棋譜寫著李世石今天一定會輸,因為寫著今天我死。
網(wǎng)友嘲諷歸嘲諷,但是李世石的實力還是毋庸置疑的。作為韓國最強棋手,李世石九段還是具有很大的實力的。希望小李子調(diào)整好心態(tài),勇敢地面對接下來的三場對AlphaGo的比賽。
AlphaGo贏了,但我找到了它的兩個“弱點”
谷歌人工智能(AI)程序AlphaGo圍棋逆轉(zhuǎn)戰(zhàn)敗李世乭九段的消息讓人頗為震驚,大呼“最后的驕傲”也喪失了。確實,在很多事情上,人工智能都能夠代替人類來完成。但就今天這局“世紀圍棋”之戰(zhàn)來說, 勝負在棋盤之外。或者說,AlphaGo的勝利并沒有神奇到可以說“人工智能戰(zhàn)勝人類”。
一、計算力強勢碾壓
在AlphaGo的系統(tǒng)上,開發(fā)團隊使用了更大的計算機網(wǎng)絡(luò)——包括170個GPU和1200個標準CPU。結(jié)合蒙特卡洛搜索算法,AlphaGo能夠看到的可能性走法清晰而全面,純計算的方式同時避免了失誤的可能。計算機一分鐘的計算量(實戰(zhàn)中AlphaGo前期步時約1分鐘),人腦也許需要半小時甚至更多。
而據(jù)搜狗CEO表示,如今AlphaGo的配置已有了極大的改善,其中GPU達到2000以上。也就是說,AlphaGo擁有了這個先決的優(yōu)勢條件,在走子上的表現(xiàn)也不足為奇。在Alphago之前,也已經(jīng)有多種純計算軟件戰(zhàn)勝棋力高強的人類選手。
從今天的對局來看,AlphaGo(執(zhí)白)非常擅長近身肉搏,可見其局部計算之精密。
二、不懂大局謀劃,形勢判斷仍未突破
AlphaGo和李世乭今天的對局中,前期李世乭使用大規(guī)模布局的作戰(zhàn)方式,形勢上偶有領(lǐng)先。但是,形勢屬虛,在后來近身肉搏的過程中,AlphaGo比李世乭要兇猛。比如下圖,黑棋在左下方定型時,白子回到上方挑事,非常頑強,所以黑子才會被白子挖走一塊又一塊。
但是,這樣說明計算機程序?qū)τ诓季诌沒學(xué)會。布局變數(shù)比應(yīng)著要多,形勢要虛,判斷依賴棋感。在這一點上,AlphaGo仍然體現(xiàn)出了電腦的弱點。古力九段表示,AlphaGo對厚勢(外勢)的判斷沒有搞清楚。
而恰好,李世乭的強項和弱項都和AlphaGo的特性對上了!爸袊鴩宓谝蝗恕笨聺嵕哦畏治龇Q:“李世乭的強項是后半盤的翻盤能力,布局則是李世乭最差的地方,判斷力也不是太好,這對于AlphaGo來說是個重大利好,因為計算機一般來說也是強在后半盤!
三、AlphaGo在進取,但更多的是反應(yīng)
到了中盤,盡管黑方已經(jīng)定勢,但AlphaGo非常進取,以致黑方未能坐實優(yōu)勢。這是AlphaGo表現(xiàn)優(yōu)秀的一面。因為按理說,要破這種形勢需要找到最優(yōu)的妙手,可見AlphaGo的蒙特卡洛搜索算法的準確度有了極大的提高。
不過, AI目前只能在特定場景下,遵循規(guī)則產(chǎn)生特定的結(jié)果。在此對局中,AlphaGo雖然執(zhí)白屬后手,但基本無法搶得先手,也很少能夠主導(dǎo)局面形勢的變化,更多的是順著對方走,直到對手失誤。
曹大元九段在對局結(jié)束時表示,AlphaGo的表現(xiàn)令人吃驚,但人工智能與人類本質(zhì)上還沒有分出勝負。就弈棋而言,低手比棋譜,強手比計算,高手比棋理。
我們不能否認AlphaGo在人工智能上取得的突破,人工智能的復(fù)雜性和艱巨性不言而喻,它的每一小步都意味著人類科學(xué)邁出的一大步,即便它還是這么“蠢”,我們?nèi)詾樗鼩g欣鼓舞。
圖片來源:弈客直播
本人作為一名圍棋愛好者,就此發(fā)表了一些個人見解,不喜勿噴,也歡迎交流。
【AlphaGo分析】
AlphaGo簡介
AlphaGo去年10月?lián)魯W洲冠軍
谷歌曾于2014年以4億歐元收購人工智能公司DeepMind。由DeepMind研發(fā)的AlphaGo項目已有兩年歷史,AlphaGo曾在去年戰(zhàn)勝了歐洲圍棋冠軍樊麾(職業(yè)二段)。
去年10月5日-10月9日,谷歌AlphaGo在比賽中以5:0的比分完勝了歐洲冠軍。除了戰(zhàn)勝人類外,AlphaGo還與其他的圍棋程序?qū)?zhàn),獲得了500場勝利。
AlphaGo原理簡介
傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹 ,但這種方法對圍棋并不適用。此次谷歌推出的AlphaGo,將高級搜索樹與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)通過12個處理層傳遞對棋盤的描述,處理層則包含數(shù)百萬個類似于神經(jīng)的連接點。
其中一個神經(jīng)網(wǎng)絡(luò)“決策網(wǎng)絡(luò)”(policy network)負責選擇下一步走法,另一個神經(jīng)網(wǎng)絡(luò)“值網(wǎng)絡(luò)”(“value network)則預(yù)測比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò),與此同時,AlphaGo也自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò) 之間運行了數(shù)千局圍棋,利用反復(fù)試驗調(diào)整連接點,這個流程也稱為鞏固學(xué)習(xí)(reinforcement learning)。通過廣泛使用Google云平臺,完成了大量研究工作。
AlphaGo在與人的對弈中用了“兩個大腦”來解決問題:“決策網(wǎng)絡(luò)”和“值網(wǎng)絡(luò)”。通俗來說就是,一個大腦用來決策當前應(yīng)該如何落子,另一個大腦來預(yù)測比賽最終的勝利方。
值得一提的是,李世石也是第一次與機器對戰(zhàn),所以他無法像和人類對戰(zhàn)那樣,先研究對方的棋譜和下棋風格。李世石所能做的就是和自己對弈。谷歌AlphaGo也是通過這種方式鍛煉自己,真正做到了“人工智能”。
關(guān)于這盤棋,會有很多解讀。不止在今天,甚至在數(shù)十年之后,這盤棋還可能會被拿出來研究,從棋譜上,更從人機不同的思維上。不論未來回看這盤棋的是人類還是真正有了自我意識的AI,想必都會有與當下的我們不同的感受。而我們有義務(wù)把我們的感受和思考記錄下來,讓后人知道當時的人究竟是如何理解這盤棋,他們有哪些錯誤的認識、可笑的想法,又有哪些深刻的洞察。
我們來看看,今天這盤棋,究竟發(fā)生了什么。這盤棋可能將是有史以來職業(yè)棋手最難以統(tǒng)一意見的對局,以下觀點是我個人見解,只是在圍棋AI時代毫無預(yù)兆迅猛而來時,一名棋手盡可能理性的分析和思考。
一、李世石的針對性策略
從棋譜來看,我認為李世石在這盤棋前后主要使用了一個試探,和兩個策略。
1)試探:從未出現(xiàn)過的布局
棋譜復(fù)盤人機大戰(zhàn)
李世石第7手,沒有按常規(guī)布局在上邊連片,而選擇走在右邊。李世石自己在職業(yè)比賽中從未使用過這一開局,甚至整個職業(yè)圍棋界,沒有人見過這一開局。
李世石不按常規(guī)布局,顯然是對電腦的一種試探。在去年10月AlphaGo對樊麾的五盤棋中,所有開局都是常規(guī)布局,雖然那五盤的開局在今天已經(jīng)不是主流,但都是曾經(jīng)流行一時的布局。
避開流行布局,甚至避開曾經(jīng)流行過的已經(jīng)被淘汰的布局,選擇一個從未出現(xiàn)過的布局。李世石在考驗AlphaGo在布局階段的應(yīng)變能力。我們知道AlphaGo的深度學(xué)習(xí)基于大量已有對局的數(shù)據(jù),那么,面對一個棋譜庫里從未見過的布局,AlphaGo你將如何應(yīng)對?
AlphaGo給出了完美的回答。
棋譜復(fù)盤人機大戰(zhàn)
白8掛角正常,黑9二間高夾最為激烈。白10,這一手……非常出色。
通常情況下,在右上白8遭遇二間高夾的時候,白10是“不存在”的一手,它不在任何定式之中。面對黑9,白棋有諸多定式選擇,卻沒有白10這一手。
然而,我認為白10是好手。
白10的好處在于使黑7變成效率低下的一手,雖然在右上局部白棋稍稍虧損,但加上黑7的低效,白棋一點也不吃虧。
AI竟然會通盤考慮!傳統(tǒng)的圍棋AI,會根據(jù)已有棋譜來走定式,定式是經(jīng)過長期檢驗的局部雙方可以接受的定型。然而定式的弊端就在于,不同的周圍環(huán)境,定式的適用性有所不同。從這盤棋來看,黑9夾擊之后,白棋如果選擇面對二間高夾最常用的“妖刀”定式,即走在15位,反而將使黑7的位置成為絕對的好點,黑7的效率將會大大提升。
實戰(zhàn)白棋選擇了一個定式里沒有的、局部稍虧的、卻使得黑7這個遙遠棋子的效率變低的下法,非常清楚地證明了兩點:
電腦不依靠背譜來下棋
電腦的考慮基于全局而非局部。
當然,第一點其實在對樊麾的棋譜中已經(jīng)可以看出來。在對樊麾的常規(guī)開局中,AI出現(xiàn)了數(shù)次不同于“譜著”的下法。其中有一盤出現(xiàn)“大雪崩”定式,電腦選擇的次序是定式和棋譜里沒有的,而且是從邏輯上不如譜著的。注意,這里強調(diào)是邏輯上不如譜著,而不是在經(jīng)驗上。即,AI當時的次序是“絕對弱于”譜著,只可能虧沒可能便宜,雖然選點是正確的,但在我們看來是“次序錯誤”。這體現(xiàn)出,AlphaGo不依賴于定式和譜著,但也暴露出AI在邏輯上的不足,反應(yīng)在棋盤上就可能會出現(xiàn)次序錯誤。這一點,也是棋手普遍不看好AI能戰(zhàn)勝李世石的一個原因。
但這一問題在這盤棋我們并沒有看到。起碼,沒有非常明顯地顯現(xiàn)出來(后面會提到一個細微的類似問題)。
而第二點則是這盤棋AI開局給我們秀出的能力。他輕易擺脫了李世石設(shè)下的定式圈套,以全局的視野作出了定式中不存在的選擇。
如果說第一點是我們在AlphaGo對樊麾時已經(jīng)能夠看到的情況,那么第二點則是這局棋在布局階段對人類試探的完美答復(fù)。如果只依靠大量棋譜堆砌出來的局部圖像識別,AI做不出這樣的選擇。