首頁 > 業界動態 > 正文

360首席科學家評AlphaGo：成功的關鍵是反應速度快
2016-03-15 11:29:55 來源：TechWeb 評論：0 點擊：

今日AlphaGo與李世石將進行最后一場比賽，而此前的四場比賽雙方的比分為3:1。360首席科學家顏水成向TechWeb等媒體解析了AlphaGo的“神勇”表現，他指出，AlphaGo的勝利在意料之中，尤其圍棋這樣特定的問題人工智能戰勝可能性比較大，不像人工智能在其他領域應用更困難一些。

顏水成指出，AlphaGo成功的關鍵是搜索策略比以前快很多，快了之后效率就能保證，因為它本身快了，不用損失太大精度情況下滿足比賽時的要求。“任何算法剛出來時，大家想的比較多的是算法在精度上能贏，在速度上考慮的不是特別多。當到了實戰時，你要考慮娛樂性和實際比賽過程中肯定有時間限制，有會以損失精度的情況下去滿足時間的要求，這時候性能就打了一個折扣，實際比賽中效果有會稍微差點。”

顏水成還形象的解析了AlphaGo的學習過程：可以模擬成是一種練武的過程，首先是師父先教你武功，教了基本的招式之后你就可以有一些大概的印象，師父一般教武功時教兩點，一是在當前某個姿勢下應該怎么樣動作會具有攻擊性；二是還得考慮我出招時對手會拆招，后面再出招，再拆招你的贏面有多大。

具體到圍棋，AlphaGo這樣學習：

第一步，Policy network告訴你怎么樣出招最具有殺傷力，Value network是通盤考慮對手拆招你再出招再拆招再出招是不是有比較大的贏面。

第二步，AlphaGo，相當于兩個徒弟，兩個版本的AlphaGo模型會根據師父教的內容開始博弈或練習下棋，有時候這個人贏了，有時候那個人贏了。這些數據拿過來重新訓練 AlphaGo系統，“經驗”就逐步積累起來了。

顏水成指出，AlphaGo的優勢是，練武時真的要兩個人試錯才可以，真的練武才行。AlphaGo就直接在電腦里，或者在一臺電腦里運行兩個版本的程序，自己對招就可以了。如果機器資源足夠多，時間足夠長，你會認為它會把各種各樣場景下的圍棋過程都會涉及到，會有新樣例產生出來，幫助訓練AlphaGo。而且AlphaGo隨著演變過程可能會形成自己的招式。

在顏水成看來，機器的勝算更大一些，水平會越來越高，而且速度會越來越快。“機器是根據歷史經驗直接算出來的，它信息量某種意義上要比人多很多，人再厲害也能記住的東西，能推算的步驟還是有限的，比如網上也有過一些人的分析，在圍棋里，出現棋局的數量相當于10的幾百次方，這種東西人的大腦是不可能存下來的，而且這比象棋的難度要大很多，而人不可能記這么多東西，而電腦有這個能力逐步模擬。”

上一篇：[視頻]卡西歐首款戶外智能手表WSD-F10近期上市售500美元
下一篇：什么在吃掉冥王星？NASA公布冥王星清晰圖像

分享到：

足球资料库数据/孙祥/nba五佳球/足球直播哪个平台好 - cctv5今日现场直播

360首席科學家評AlphaGo：成功的關鍵是反應速度快
2016-03-15 11:29:55 來源：TechWeb 評論：0 點擊：

頻道總排行

頻道本月排行

足球资料库数据/孙祥/nba五佳球/足球直播哪个平台好 - cctv5今日现场直播

360首席科學家評AlphaGo：成功的關鍵是反應速度快 2016-03-15 11:29:55 來源：TechWeb 評論：0 點擊：

頻道總排行

頻道本月排行

360首席科學家評AlphaGo：成功的關鍵是反應速度快
2016-03-15 11:29:55 來源：TechWeb 評論：0 點擊：