人機(jī)圍棋大戰(zhàn)首局李世石認(rèn)輸:揭秘AlphaGo到底多可怕
2016-03-11 18:32:41

AlphaGo的深度學(xué)習(xí)能力是可以不斷強(qiáng)化的,人類的棋譜可以輸入,機(jī)器可以不斷的自我對(duì)局來(lái)積累經(jīng)驗(yàn),選擇最佳點(diǎn)。求最優(yōu)解的計(jì)算也可以積累。所以AlphaGo的進(jìn)步實(shí)際上是非常非??斓模視?huì)越來(lái)越快。

3月9日下午,谷歌AlphaGo在人機(jī)對(duì)戰(zhàn)的第一盤(pán)戰(zhàn)勝李世石。雖然李世石賽前曾經(jīng)表示,人工智能擊敗人類長(zhǎng)期來(lái)看將是不可避免的事,但這次他將堅(jiān)決為捍衛(wèi)人類尊嚴(yán)而戰(zhàn)。但是他還是出現(xiàn)了幾個(gè)失誤,輸給了AlphaGo。
 

\


2016年1月,國(guó)際頂尖期刊《自然》曾經(jīng)報(bào)道了谷歌研究開(kāi)發(fā)的名為AlphaGo的人工智能電腦,這款人工智能于去年10月以5比0完勝歐洲圍棋冠軍、職業(yè)二段樊麾。

當(dāng)谷歌旗下的DeepMind公司宣布邀請(qǐng)韓國(guó)著名職業(yè)九段棋手李世石五局比賽的時(shí)候。大多數(shù)人并不看好AlphaGo,包括中國(guó)古力,聶衛(wèi)平和目前第一高手柯杰,很多人都預(yù)測(cè)AlphaGo會(huì)0比5輸。而第一局是李世石輸了。

雖然,李世石有幾個(gè)明顯失誤,但是AlphaGo所表現(xiàn)出來(lái)的戰(zhàn)斗力遠(yuǎn)不是1月份的水平,為何高手紛紛走眼?AlphaGo為何表現(xiàn)出比1月份強(qiáng)出若干倍的戰(zhàn)斗力呢?這得從AlphaGo是什么說(shuō)起。

一、AlphaGo牛在哪?

AlphaGo 是什么?在今年一月的Nature上有AlphaGo的詳細(xì)介紹,AlphaGo是一套為了圍棋優(yōu)化的設(shè)計(jì)周密的深度學(xué)習(xí)引擎,使用了神經(jīng)網(wǎng)路加上 MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云計(jì)算資源,使用了GPU的通用計(jì)算能力。

AlphaGo 的特點(diǎn)在于充分利用現(xiàn)在的機(jī)器學(xué)習(xí)技術(shù),可擴(kuò)張的架構(gòu),它不僅僅是用一臺(tái)超級(jí)計(jì)算機(jī),而是可以利用谷歌龐大的計(jì)算資源來(lái)做這個(gè)深度學(xué)習(xí),提升學(xué)習(xí)能力。谷歌提供了15-20名世界頂級(jí)的計(jì)算機(jī)科學(xué)家和機(jī)器學(xué)習(xí)專家和全世界最龐大的谷歌后臺(tái)計(jì)算平臺(tái),看看能把圍棋這種高難度的人類游戲項(xiàng)目做到什么高度?

圍棋是相當(dāng)感性的項(xiàng)目,它不像象棋每個(gè)子都有價(jià)值計(jì)算,目標(biāo)明確就是將死對(duì)方的王,不被對(duì)方將死。圍棋的形好壞是相當(dāng)感性的東西。對(duì)優(yōu)劣的判斷也不是純計(jì)算的結(jié)果。

而且,圍棋的棋盤(pán)太大,手?jǐn)?shù)太多,五子棋的復(fù)雜度是10的28次冪,國(guó)際象棋是10的46次冪,而圍棋因?yàn)槠灞P(pán)大,復(fù)雜度是10的172次冪。復(fù)雜度越高,對(duì)計(jì)算能力的要求就越高,所以圍棋計(jì)算機(jī)程序的水平一直無(wú)法與人類高手相比。

所以,雖然從1997年以來(lái),計(jì)算機(jī)性能遵照摩爾定律一直在飛速增長(zhǎng),超級(jí)計(jì)算機(jī)每年性能都刷新紀(jì)錄,但是要挑戰(zhàn)圍棋這種復(fù)雜游戲的人類高手,要到2016年才開(kāi)始。

AlphaGo雖然有谷歌的龐大計(jì)算資源,雖然有GPU通用計(jì)算能力。但是它也算不了圍棋這種超高復(fù)雜度的游戲,不能像簡(jiǎn)單的棋一樣把每一步算清楚。

所以AlphaGo綜合了各種人工智能的成果,首先通過(guò)深度學(xué)習(xí)引擎,AlphaGo搞來(lái)人類的數(shù)千萬(wàn)盤(pán)對(duì)局,學(xué)習(xí)人類高手的招數(shù),來(lái)選擇每一步可能下的幾個(gè)點(diǎn)。

這個(gè)深度學(xué)習(xí)是可以不斷進(jìn)化的,學(xué)習(xí)過(guò)的越多,選點(diǎn)的水平就越高,而在選擇了有限的點(diǎn)之后,就可以用MCTS (Monte Carlo tree search)來(lái)算下去了,求出最優(yōu)解。

當(dāng)然,圍棋的棋盤(pán)太大,手?jǐn)?shù)太多,即使是選擇有限的點(diǎn),計(jì)算量也無(wú)法承受,所以AlphaGo又對(duì)棋盤(pán)分了區(qū),算局部而整體。

以前結(jié)合深度學(xué)習(xí)和運(yùn)算能力,配上谷歌龐大的計(jì)算資源加以訓(xùn)練(深度學(xué)習(xí)是可以自己與自己下棋不斷提高的)AlphaGo的水平就超越了以前的圍棋AI,可以挑戰(zhàn)職業(yè)棋手了。

二、為何高手會(huì)看錯(cuò)

在對(duì)局前,從李世石自己到中國(guó)高手們,對(duì)AlphaGo都是不屑一顧的,因?yàn)樗鼈兛吹降氖茿lphaGo對(duì)樊麾的棋譜,這個(gè)棋譜的水平只是贏了,并沒(méi)有高到那里。所以高手們認(rèn)為AlphaGo不堪一擊。

而事實(shí)上,AlphaGo是根據(jù)對(duì)手的每一步棋在選擇,只要贏的概率大,AlphaGo不會(huì)像人類一樣走追求完美的棋,所以AlphaGo被低估了。

而AlphaGo的深度學(xué)習(xí)能力是可以不斷強(qiáng)化的,人類的棋譜可以輸入,機(jī)器可以不斷的自我對(duì)局來(lái)積累經(jīng)驗(yàn),選擇最佳點(diǎn)。求最優(yōu)解的計(jì)算也可以積累。所以AlphaGo的進(jìn)步實(shí)際上是非常非常快的,而且會(huì)越來(lái)越快。

如同谷歌工程師所說(shuō),李世石一年最多下一千盤(pán),而計(jì)算機(jī)可以一天一百萬(wàn)盤(pán),而且每一盤(pán)的經(jīng)驗(yàn)和計(jì)算都可以儲(chǔ)存積累。

所以3月份的AlphaGo與1月份的AlphaGo也有了非常大的不同。高手們看到第一盤(pán)的棋譜,紛紛認(rèn)為自己走了眼。中國(guó)棋院的一些高手對(duì)AlphaGo的認(rèn)識(shí)從職業(yè)初段的水平提升到職業(yè)五六段,而圍棋第一人柯杰的評(píng)價(jià)更高,他表示自己也只有六成勝算。

AlphaGo以前的棋譜不能代表其極限水平,它是遇強(qiáng)更強(qiáng)的,另外AlphaGo的進(jìn)步速度也遠(yuǎn)超人類,所以AlphaGo超越人類高手也許很快就可以做到。

三、人類還有機(jī)會(huì)嗎?

其實(shí),以圍棋的復(fù)雜程度,現(xiàn)在計(jì)算機(jī)雖然用上GPU通用計(jì)算,用上了分布式計(jì)算,依然沒(méi)有計(jì)算清楚圍棋所有的變化。

所以,圍棋還要深度學(xué)習(xí)模擬人類選擇點(diǎn),還要用棋盤(pán)分區(qū)來(lái)減輕計(jì)算量,在布局和中盤(pán),計(jì)算機(jī)由于時(shí)間和運(yùn)算能力限制并非能拿出最優(yōu)解。

因?yàn)樯疃葘W(xué)習(xí)選擇的點(diǎn)未必是最優(yōu)的,而靠MCTS 完全計(jì)算清楚再有時(shí)間限制的情況下也很困難。
但是到了最后的宮子階段,計(jì)算量大大減少,AlphaGo可以完全算清楚,讓每一步都是最優(yōu)解。人類最多也是與之平手。

所以AlphaGo至少在目前還不是不可戰(zhàn)勝,在開(kāi)局和中盤(pán),人類還是有機(jī)會(huì)領(lǐng)先的,在宮子階段可以與之戰(zhàn)成平手。實(shí)際上1月份二段水平的樊麾也贏了兩局快棋。

但是,由于AlphaGo強(qiáng)大的深度學(xué)習(xí)能力,其深度學(xué)習(xí)后選擇點(diǎn)的能力會(huì)越來(lái)越高,它也會(huì)越來(lái)越難戰(zhàn)勝。

而今后若干年,隨著計(jì)算機(jī)能力的再擴(kuò)充,AlphaGo有可能通過(guò)MCTS把圍棋每一步都計(jì)算清楚,那個(gè)時(shí)候圍棋這個(gè)運(yùn)動(dòng)的意義就不大了。

四、AlphaGo的意義

圍棋本來(lái)認(rèn)為是無(wú)法算清的,至少現(xiàn)在的計(jì)算能力不行,而AlphaGo把人類感性的東西,通過(guò)計(jì)算機(jī)龐大的計(jì)算能力和高水平的人工智能程序來(lái)解釋,通過(guò)機(jī)器的自我學(xué)習(xí)來(lái)提升,這是很有意義的。

AlphaGo里面的深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、MCTS,和AlphaGo的擴(kuò)張能力計(jì)算能力都是通用的技術(shù)。AlphaGo今天要進(jìn)入一個(gè)新的應(yīng)用領(lǐng)域,用AlphaGo的底層技術(shù)和AlphaGo的團(tuán)隊(duì),應(yīng)該可以更快更有效地開(kāi)發(fā)出解決方案。

AlphaGo如果有朝一日在圍棋上擊敗頂級(jí)的人類智能,那么這種學(xué)習(xí)能力用于其他難以精確計(jì)算而依靠人類經(jīng)驗(yàn)判斷的領(lǐng)域,也會(huì)擊敗人類。

要知道,現(xiàn)在傳感器實(shí)際上有遠(yuǎn)遠(yuǎn)優(yōu)于人類的感知能力,如果計(jì)算機(jī)對(duì)非精確描述的事物學(xué)習(xí)能力也超過(guò)人類,那么人類真的就可以被替代了。

無(wú)人駕駛是小菜一碟,人類能學(xué)會(huì)的,計(jì)算機(jī)都可以學(xué)會(huì),而且學(xué)得更好,那么人類的所有的技能與經(jīng)驗(yàn)就全部變成可替代的了,包括編程。計(jì)算機(jī)可以自我發(fā)展,完成各種功能,人類的各種勞動(dòng)都可以解放了。

計(jì)算機(jī)具備了深度學(xué)習(xí)能力以后,人類的所有勞動(dòng)都可以被替代。工廠是無(wú)人的,車(chē)輛是無(wú)人的,飛機(jī)是無(wú)人的,飯店服務(wù)員是機(jī)器人,名廚是一臺(tái)自動(dòng)烹調(diào)的機(jī)器, 人類只復(fù)雜在機(jī)器故障或者失靈時(shí)候,做人為的干預(yù)與檢修。而機(jī)器給人創(chuàng)造的財(cái)富幾乎沒(méi)有上限,只取決于自然資源的多少。
這個(gè)世界聽(tīng)上去似乎很熟悉,沒(méi)錯(cuò),天網(wǎng)就在不遠(yuǎn)的將來(lái)。

(來(lái)源:百略網(wǎng)    作者:maomaobear[投稿百略網(wǎng)]    原文鏈接:http://www.ibailve.com/show/6-4547-1.html

最新文章
1
都是科技的狠活?2024中國(guó)國(guó)際消費(fèi)電子博覽會(huì)即將全新亮相!
2
重磅!2024中國(guó)“冷暖智造”大獎(jiǎng)獲獎(jiǎng)名單揭曉
3
2024中國(guó)暖通空調(diào)產(chǎn)業(yè)發(fā)展峰會(huì)盛大召開(kāi)
4
2024中國(guó)“冷暖智造”大獎(jiǎng)-冷暖百?gòu)?qiáng)榜公布
5
勵(lì)志與甜寵完美融合,快手星芒短劇《我在公司掃垃圾》歡樂(lè)開(kāi)播
6
快手發(fā)布《磁力引擎雙11營(yíng)銷作戰(zhàn)圖》,賦能品牌、商家全域增長(zhǎng)
7
《打球嘛鵬友》探訪廣州與上海,明星達(dá)人對(duì)決燃動(dòng)城市籃球基因
8
電動(dòng)兩輪車(chē):無(wú)智能,不增長(zhǎng)?
9
IFA2024上,德國(guó)總理到訪的唯一中國(guó)品牌有何魅力?
10
以舊換新多管齊下,TCL將“政策紅利”轉(zhuǎn)化為“市場(chǎng)優(yōu)勢(shì)”
11
“兩新”3000億國(guó)資下達(dá),助力家電行業(yè)十一實(shí)現(xiàn)高增長(zhǎng)
12
高通,憑什么收購(gòu)英特爾?
13
外賣(mài)都卷到9塊9了,京東為什么還來(lái)?yè)揭荒_?
14
vivo X200系列首發(fā)!索尼光喻LYT-818傳感器降臨
15
被小米超越成全球第三!iPhone中國(guó)出貨量同比下滑12.7%:蘋(píng)果還不降價(jià)換量嗎
16
追覓勇闖“無(wú)人區(qū)”
17
主力企業(yè)激戰(zhàn)100英寸+市場(chǎng)!電視越來(lái)越大,誰(shuí)是最大贏家?
18
清潔電器均價(jià)普遍下探的2024上半年,品牌更重創(chuàng)新還是營(yíng)銷?
19
追覓發(fā)布頭皮護(hù)理吹風(fēng)機(jī)D10 驅(qū)動(dòng)頭皮養(yǎng)護(hù)體驗(yàn)革新
20
引領(lǐng)行業(yè)多項(xiàng)技術(shù)革新,追覓科技重磅發(fā)布T40 Ultra洗地機(jī)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512