柯潔
雷鋒網按:AlphaGo 終于又來了。5 月23 日,也就是明天,曾在去年以一己之力將“人工智能” 浪潮帶到新層次的圍棋人工智能AlphaGo 就將再次出馬。在這次為期5 天的活動當中,AlphaGo 將會與世界最頂尖圍棋選手柯潔展開正式對決,同時還會進行耳目一新的“配對賽” 以及“團體賽”。
賽程
目前雷鋒網了解到的具體賽程如下:
5 月23 日,開幕式、柯潔vs AlphaGo 三番棋第一場;
5 月24 日,人工智能論壇;
5 月25 日,柯潔vs AlphaGo 三番棋第二場;
5 月26 日,配對賽,團隊賽(相談棋);
5 月27 日,柯潔vs AlphaGo 三番棋第三場。
這次比賽核心目的只有一個——在公開場合驗證AlphaGo 的實力,看是否已經打造出了在圍棋上超越所有人類的“AI”。
作為國內最重要的科技媒體,雷鋒網也將全程跟蹤此次賽事。但在比賽正式開始前,有幾個問題你可能需要了解一下:
1. 這次的“新AlphaGo” 跟“老AlphaGo” 有什么不同?
2. 柯潔能否戰(zhàn)勝“新AlphaGo”?
3. 比賽相關直播應該如何觀看?
新AlphaGo:砍斷“人類束縛”
作為一個從2014 年發(fā)展至今的圍棋人工智能項目,其實AlphaGo 在發(fā)展歷程中使用過多個名字,比如最早期亦城圍棋上的“DeepMind”,又或者是之前在野狐平臺上的“Master”。那么這次的“新AlphaGo” 是否也只是一個新名字?
答案必然是否定的,之前起新名字很可能有保密、個人喜好等原因,但這次新添加的“新” 字只為了突出一點——這是“機器自學” 為主的一版AlphaGo。
這一點判斷的線索,來自于今年初,Master 在網絡上一口氣橫掃60名人類棋手的時候。
這種表現(xiàn),與將近一年前的“老AlphaGo” 可謂天差地別。想要達成這樣的成績只有一種可能——DeepMind 尋找到了一種機制來擺脫圍棋中的“人類束縛”。
迷之改進:一舉讓AlphaGo 成為人類老師
作為一個極其特殊的棋類和任務,圍棋擁有數(shù)量極其龐大的可能性,總的局面數(shù)量達到10^172,而可觀測宇宙范圍內的原子數(shù)量不過10^80。這也意味著窮舉絕對不是一條明智的路線。
最終DeepMind 給出了一套能夠“模擬” 出人類頂尖高手的方案:深度學習+ 蒙特卡洛搜索樹+ 自我進化。
如果你對其中的細節(jié)感興趣,推薦閱讀國內人工智能創(chuàng)業(yè)公司彩云AI 創(chuàng)始人、CEO 袁行遠在知乎上的相應回答。
深度學習用以分析人類棋盤,蒙特卡洛搜索樹用來減輕工作量,自我進化用來提升能力。但有限的運算能力還是給DeepMind 出了一個不小的難題,后者最終想出了一個辦法:只對學習到的人類棋招進行蒙特卡洛搜索樹運算,這恰如人類棋手依賴定式。
定式,又名定石,指的是人類下圍棋長久積累下來的一種經驗,對弈雙方在特定情況下會遵循固定下法。著名棋手吳清源則將簡單描述為“在角部彼我棋子接觸時最合理的走法”。
這些定式被記載在各式各樣的棋譜當中,成為新手入門必看的書籍。
雖然定式是某種意義上是最合理的走法,但它卻是理想化條件下的產物,想要完整復現(xiàn)定式,意味著雙方都必須抱有同樣的理想化思路。而歷史上并不缺乏不遵守定式,或者用新定式打敗對方的事例。
問題來了,為什么千變萬化的圍棋會出現(xiàn)定式?而且死守定式會輸,不學習定式也會輸。答案只有一個——人類需要定式來減少圍棋上面的變化,這樣進入中盤之后人類才能利用自身能力掌握棋局走向。
湊巧的是,這回我們遇到的是運算能力遠超人類的計算機,讓掌握更多乃至全部圍棋奧秘擁有了一絲可能。
但究竟新AlphaGo 怎么樣擺脫“人類束縛”?參考之前“老AlphaGo” 的工作方式,排除運算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運算壓力的策略。目前來看,這個秘密也只能等DeepMind 方面稍后公開了。
人類敗局已定?
盡管去年人類代表是韓國選手,但明眼人都可以看出當下和去年圍棋人機比賽的熱度差別。這從另外一個側面也反映出了絕大部分觀眾的看法:這次人類要輸。
1.《阿爾法狗vs柯潔直播 柯潔VS阿爾法狗大戰(zhàn)之前,你需要知道的幾大看點》援引自互聯(lián)網,旨在傳遞更多網絡信息知識,僅代表作者本人觀點,與本網站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《阿爾法狗vs柯潔直播 柯潔VS阿爾法狗大戰(zhàn)之前,你需要知道的幾大看點》僅供讀者參考,本網站未對該內容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉載時請保留本站內容來源地址,http://f99ss.com/tiyu/100656.html