昨日李世石九段,當(dāng)前人類圍棋界最強(qiáng)者之一輸給了谷歌的電腦機(jī)器,在棋類游戲中人機(jī)大戰(zhàn)并不少見,如世界著名國象大師卡斯帕羅夫就曾經(jīng)與電腦對決過,當(dāng)然他贏了,至于日本將棋的電王戰(zhàn),一些知名棋手都不敢和電腦硬對了,輸了會影響自己的聲名,所以李九段輸?shù)膶用鏁笠恍┮彩呛苷5摹?/p>
大戰(zhàn)結(jié)果:
3月9日,韓國世界冠軍李世石九段與谷歌AlphaGo對抗賽首局在韓國的四季酒店戰(zhàn)罷,李世石執(zhí)黑186手中盤負(fù)AlphaG
完整對局動態(tài)棋譜:
http://www.sinaimg.cn/dy/slidenews/2_img/2016_10/820_1729832_868827.gif
棋譜截圖:
失敗總結(jié):
李世石在比賽開始時選擇了他并不太擅長的進(jìn)攻性打法,在 AlphaGo 出現(xiàn)一次重大失誤后,李世石沒有捉住機(jī)會一舉拿下比賽,而是在之后多次的正面交鋒中節(jié)節(jié)敗退最終選擇了認(rèn)輸。
讓敵人用不擅長的方式應(yīng)戰(zhàn),這是李世石陌生的套路,也是 AlphaGo 勝利的正確方法。
「早期象棋機(jī)器會有盲點和可加利用的弱點,而且吸引棋手的是將(利用)這些(弱點)作為目標(biāo),而不是正兒八經(jīng)對弈。對戰(zhàn)深藍(lán)時,我就沒有抵擋住這一誘惑。心智(Mind)運動,比如象棋和圍棋,需要高度集中的精神,當(dāng)你的注意力被試圖對計算機(jī);ㄕ写騺y時,最終就是誘惑自己下出客觀上并不可靠的棋招。隨著機(jī)器變得強(qiáng)大,這些做法會受到懲罰!
20年前曾輸給 IBM 「深藍(lán)」機(jī)器人的國際象棋大師 Garry Kasparov 輸給了曾經(jīng)的「窮舉法」,而 AlphaGo 進(jìn)步的地方在于,他在更為復(fù)雜的運算體系里只使用了「窮舉法」幾千分之一的計算量。
AlphaGo 的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)——「策略網(wǎng)絡(luò)」(policy network)和 「價值網(wǎng)絡(luò)」(value network)。它們通過相互配合來計算出相對有優(yōu)勢的步法并摒棄差棋,從而將計算量控制在計算機(jī)可以完成的范圍里。