華爾街見聞 2017-05-23 11:57:03
本文發(fā)布于10:37,更新于14:47
周二,為期5天的“中國烏鎮(zhèn)·圍棋峰會”開幕,中國棋手世界排名第一的柯潔與AlphaGo人工智能展開人機大戰(zhàn),三番棋首局較量在今日10:30打響,第二局將于25日(周四)上午正式開始。
下圖為最新進展,柯潔執(zhí)黑子,AlphaGo執(zhí)白子,裁判宣布AlphaGo贏四分之一子。
圖片來自直播視頻
下圖為23日-27日峰會時間表,除了AlphaGo與柯潔進行的三場比賽和AI論壇,峰會還包括配對賽與團體賽。配對賽中,兩位棋手將分別與AlphaGo組隊,挑戰(zhàn)棋手除了要理解AlphaGo的風格,還要與之合作。在團體賽中,五位中國頂尖職業(yè)棋手則組成戰(zhàn)團,集體對抗人工智能AlphaGo。
人類勝率幾何?
柯潔此前表示,半年前得知對陣AlphaGo,能代表人類出戰(zhàn)是自己的榮幸,將全力而為。
李開復評價稱,AlphaGo和李世石的人機大戰(zhàn)是第一次,可能還有懸念。但進化了的AlphaGo與柯潔展開對決,不會再有其他可能,“這場比賽并非沒有意義,而是在科學價值層面失去看點。”
去年解說李世石對陣AlphaGo的圍棋世界冠軍古力則對《華商報》表示,“柯潔贏一盤10%的可能吧。”但他也表示,AlphaGo與圍棋的完美境界還是有差距的。
圍棋AI:人工智能發(fā)展的縮影
廣發(fā)證券分析師張超在報告中指出,圍棋AI的迅速發(fā)展是近年人工智能突破性一個縮影。后者突飛猛進的原因主要有以下幾點:算法的突破、數據的增長、硬件的發(fā)展和開源軟件的流行。
廣發(fā)張超進一步指出,深度增強學習是AlphaGo的核心技術:
圍棋AI的決策是一個增強學習的過程。當前的棋局是狀態(tài),能否贏棋是獎賞,策略就是根據狀態(tài)走子的決策方法。AlphaGo通過兩個深層神經網絡解決了價值函數的估計和策略的計算,就是策略網絡和價值網絡。通過價值網絡與策略網絡相結合的方式,AlphaGo擺脫了窮舉法的龐大計算量;通過大量的訓練,ALphaGo迅速成長,最終站到了圍棋人工智能的最高點。
文章更新中。。。
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP