
柯潔與Deepmind團隊負責(zé)人哈薩比斯(左)AlphaGo團隊負責(zé)人席爾瓦(右)
5月23日,圍棋峰會柯潔對陣AlphaGo三番棋首局人機大戰(zhàn)在浙江桐鄉(xiāng)戰(zhàn)罷。最終,柯潔執(zhí)黑1/4子負圍棋人工智能AlphaGo。賽后新聞發(fā)布會上,Deepmind團隊負責(zé)人哈薩比斯與AlphaGo團隊負責(zé)人席爾瓦在接受采訪時坦言:“此次出戰(zhàn)的AlphaGo是單機版,是李世石對弈的版本資源的十分之一?!?br>
華學(xué)明:請問是否發(fā)現(xiàn)AlphaGo弱點?
哈薩比斯:即使是AlphaGo自我對局,我們也沒有發(fā)現(xiàn)弱點所在。來參加峰會就是希望柯潔去發(fā)現(xiàn)AlphaGo的弱點。與李世石對弈時,我們發(fā)現(xiàn)了AlphaGo的缺陷,回去改善體系,讓AlphaGo自我學(xué)習(xí)以不斷自我完善。
問:有說法AlphaGo并非只是去爭勝,而是去控制勝負差距?
哈薩比斯:AlphaGo總是希望將獲勝概率最大化,需要做決策來實現(xiàn)完勝。
席爾瓦:AlphaGo擴大獲勝概率,我們也可以想象其他目標,如果AlphaGo只是想獲勝的話,他就會降低取勝的風(fēng)險。
華學(xué)明:我理解是未來AlphaGo可以探索人類極限?
席爾瓦:希望通過與像柯潔、李世石這樣偉大的棋手比賽,來獲得更多收獲。
問:請問這次是純凈版AlphaGo嗎?
哈薩比斯:AlphaGo仍需要和人類對弈,是先學(xué)人類棋譜,隨后開始通過自我對局來進步提高,所以AlphaGo是依靠人類棋譜數(shù)據(jù)和此前版本來進一步提升。僅通過自身對決可能發(fā)現(xiàn)不了缺陷,和頂尖棋手對決才能提高。我們希望通過完善AlphaGo,在其他領(lǐng)域為人類服務(wù)。
問:AlphaGo這次是什么版本,這是最后一次現(xiàn)身嗎?
席爾瓦:AlphaGo算法超越數(shù)據(jù)計算,比去年李世石對弈的版本強了十倍。
哈薩比斯:我們在科學(xué)雜志《自然》發(fā)表了論文,這周之后我們會公布更多細節(jié)和計劃,眾所周知目前也有很多強大人工智能軟件,我們也會在今后公開AlphaGo更多技術(shù)細節(jié),使其他實驗室或團隊能夠建造自己的AlphaGo。
問:AlphaGo用了多少GPU?
席爾瓦:AlphaGo這次是單獨機器,利用谷歌云。和去年不一樣,去年是分布式實施,有很多機器。這次這臺機器是更好、更快、結(jié)果更好的,依靠TPU,是李世石對弈的版本資源的十分之一。
華學(xué)明:對于我這樣不懂計算機的,可以理解這是單機版的AlphaGo嗎?
哈薩比斯:是的。