柯潔對陣乃單機版AlphaGo,依靠TPU

作者：藍天 2017-05-23

來源：新浪科技 #浙江# #負責(zé)人# #人工智能# #新聞發(fā)布會# #席爾瓦#

1.7w

柯潔與Deepmind團隊負責(zé)人哈薩比斯(左)AlphaGo團隊負責(zé)人席爾瓦(右)
　　5月23日，圍棋峰會柯潔對陣AlphaGo三番棋首局人機大戰(zhàn)在浙江桐鄉(xiāng)戰(zhàn)罷。最終，柯潔執(zhí)黑1/4子負圍棋人工智能AlphaGo。賽后新聞發(fā)布會上，Deepmind團隊負責(zé)人哈薩比斯與AlphaGo團隊負責(zé)人席爾瓦在接受采訪時坦言：“此次出戰(zhàn)的AlphaGo是單機版，是李世石對弈的版本資源的十分之一?！?br>
　　華學(xué)明：請問是否發(fā)現(xiàn)AlphaGo弱點？

　　哈薩比斯：即使是AlphaGo自我對局，我們也沒有發(fā)現(xiàn)弱點所在。來參加峰會就是希望柯潔去發(fā)現(xiàn)AlphaGo的弱點。與李世石對弈時，我們發(fā)現(xiàn)了AlphaGo的缺陷，回去改善體系，讓AlphaGo自我學(xué)習(xí)以不斷自我完善。

　　問：有說法AlphaGo并非只是去爭勝，而是去控制勝負差距？

　　哈薩比斯：AlphaGo總是希望將獲勝概率最大化，需要做決策來實現(xiàn)完勝。

　　席爾瓦：AlphaGo擴大獲勝概率，我們也可以想象其他目標，如果AlphaGo只是想獲勝的話，他就會降低取勝的風(fēng)險。

　　華學(xué)明：我理解是未來AlphaGo可以探索人類極限？

　　席爾瓦：希望通過與像柯潔、李世石這樣偉大的棋手比賽，來獲得更多收獲。

　　問：請問這次是純凈版AlphaGo嗎？

　　哈薩比斯：AlphaGo仍需要和人類對弈，是先學(xué)人類棋譜，隨后開始通過自我對局來進步提高，所以AlphaGo是依靠人類棋譜數(shù)據(jù)和此前版本來進一步提升。僅通過自身對決可能發(fā)現(xiàn)不了缺陷，和頂尖棋手對決才能提高。我們希望通過完善AlphaGo，在其他領(lǐng)域為人類服務(wù)。

　　問：AlphaGo這次是什么版本，這是最后一次現(xiàn)身嗎？

　　席爾瓦：AlphaGo算法超越數(shù)據(jù)計算，比去年李世石對弈的版本強了十倍。

　　哈薩比斯：我們在科學(xué)雜志《自然》發(fā)表了論文，這周之后我們會公布更多細節(jié)和計劃，眾所周知目前也有很多強大人工智能軟件，我們也會在今后公開AlphaGo更多技術(shù)細節(jié)，使其他實驗室或團隊能夠建造自己的AlphaGo。

　　問：AlphaGo用了多少GPU？

　　席爾瓦：AlphaGo這次是單獨機器，利用谷歌云。和去年不一樣，去年是分布式實施，有很多機器。這次這臺機器是更好、更快、結(jié)果更好的，依靠TPU，是李世石對弈的版本資源的十分之一。

　　華學(xué)明：對于我這樣不懂計算機的，可以理解這是單機版的AlphaGo嗎？

　　哈薩比斯：是的。