每日經(jīng)濟(jì)新聞

推薦

每經(jīng)網(wǎng)首頁 > 推薦 > 正文

阿爾法狗的“弟弟”出道：人類1:10慘敗，5分鐘崩盤！

每日經(jīng)濟(jì)新聞 2019-01-25 14:21:11

僅僅5分鐘，谷歌旗下的人工智能公司DeepMind開發(fā)的全新AI程序AlphaStar就讓《星際爭霸2》職業(yè)選手MaNa投降。“AlphaStar在每局游戲中采用的操作和不同策略令人印象十分深刻，近乎人類選手般的游戲策略出乎我的意料，”職業(yè)選手MaNa說，“我們很期待未來的無限可能?！?/p>

每經(jīng)記者謝陶每經(jīng)編輯李凈翰

圖片來源：DeepMind博客

繼圍棋之后，強(qiáng)大的人工智能（AI）在北京時(shí)間25日凌晨再次震撼世界：

僅僅5分鐘，谷歌旗下的人工智能公司DeepMind開發(fā)的全新AI程序AlphaStar就讓《星際爭霸2》（以下簡稱星際2）職業(yè)選手MaNa投降。

DeepMind當(dāng)天公布的錄像顯示，去年12月，AlphaStar分別以5-0戰(zhàn)勝星際2的兩位職業(yè)選手TLO和MaNa，成為第一個(gè)打敗電競(jìng)職業(yè)選手的人工智能。在比賽之前，AlphaStar的訓(xùn)練量，相當(dāng)于打了200年的星際2。

但在之后的現(xiàn)場(chǎng)比賽中，MaNa因?yàn)榘l(fā)現(xiàn)了AI操作上的缺陷，才成功為人類扳回一局。這同樣也創(chuàng)造了歷史——AlphaStar首次成為職業(yè)選手的手下敗將。

每日經(jīng)濟(jì)新聞（微信號(hào)：nbdnews）記者注意到，盡管10戰(zhàn)連敗，人類職業(yè)高手仍然對(duì)AlphaStar不吝稱贊。

“AlphaStar在每局游戲中采用的操作和不同策略令人印象十分深刻，近乎人類選手般的游戲策略出乎我的意料，”MaNa說，“我這才意識(shí)到，自己之前的策略過分依賴對(duì)手失誤和人類的反應(yīng)力，因此這場(chǎng)比賽讓我對(duì)游戲有了全新的認(rèn)識(shí)。我們很期待未來的無限可能。”

而TLO的說法跟李世石輸給AlphaGo后很像。他說：相信我，和AlphaStar比賽很難。不像和人在打，有種手足無措的感覺。他還說，每局比賽都是完全不一樣的套路。

賽后，DeepMind在其官方博客上表示，實(shí)現(xiàn)最高水平的星際2對(duì)弈代表了人工智能在有史以來最復(fù)雜電子游戲中取得的重大突破。AlphaStar背后的技術(shù)可以用來解決其他的問題，比如天氣預(yù)報(bào)、氣候建模、語言理解等。

讓AI玩星際爭霸有多難？

暴雪出品的星際2近年來已被公認(rèn)為AI研究的“大挑戰(zhàn)（grand challenge）”。與下圍棋相比，星際2可難得多——在圍棋世界，動(dòng)作空間只有361種，而星際2大約是10的26次方。

DeepMind也在其官方博客上解釋了人工智能玩星際2的難點(diǎn)：

游戲理論：星際2是個(gè)游戲，就想剪刀石頭布一樣，沒有單一最佳戰(zhàn)略。因此人工智能訓(xùn)練過程中需不斷探索和擴(kuò)展最戰(zhàn)略知識(shí)前沿。

瑕疵信息：不同于國際象棋或圍棋那種一覽無余的狀態(tài)，星際玩家無法直接觀察到重要信息，必須積極探索“探路”。

長期規(guī)劃：和許多現(xiàn)實(shí)世界中的問題并非是從“因”立即生“果”一樣，游戲是可以從任何一個(gè)地方開始，需要1個(gè)小時(shí)時(shí)間出結(jié)果，這意味著在游戲開始時(shí)的行動(dòng)可能在很長一段時(shí)間不會(huì)有收效。

即時(shí)性：不像傳統(tǒng)桌面游戲，玩家輪流行動(dòng)，星際玩家必須在游戲時(shí)間內(nèi)持續(xù)排兵布陣。

龐大的行動(dòng)空間：要同時(shí)控制上百個(gè)單位及建筑，這就導(dǎo)致了大量的可能性，行動(dòng)是分級(jí)別的，可以被修改和擴(kuò)張。我們將游戲參數(shù)化后，每個(gè)時(shí)間步驟平均約有10到26個(gè)合理行為。

AlphaStar是如何做到跟星際2職業(yè)選手對(duì)戰(zhàn)的呢？

DeepMind表示，對(duì)決時(shí)，AlphaStar借助原始界面與星際2游戲引擎交流，也就是說，它可以直接觀察地圖上的我方單位和敵方可見單位，不需要移動(dòng)攝像頭。如果是人類玩家，注意力有限，必須調(diào)整攝像頭，讓它瞄準(zhǔn)應(yīng)該關(guān)注的地方。分析AlphaStar游戲能發(fā)現(xiàn)，它有一個(gè)隱藏的注意力焦點(diǎn)。平均來說，游戲代理每分鐘會(huì)切換環(huán)境約30次，和MaNa、TLO的頻率差不多。

AlphaStar玩星際2的過程（圖片來源：DeepMind博客）

事實(shí)證明，AlphaStar與MaNa和TLO對(duì)決時(shí)之所以占據(jù)上風(fēng)，主要是因?yàn)樗暮暧^戰(zhàn)略、微觀戰(zhàn)略決策能力更強(qiáng)，靠的并不是超級(jí)點(diǎn)擊率、超快響應(yīng)時(shí)間。

AlphaStar在APM和延遲方面與人類玩家的比較（圖片來源：DeepMind博客）

DeepMind還表示，團(tuán)隊(duì)的一些訓(xùn)練方法或可有助于研究開發(fā)安全穩(wěn)定的人工智能。人工智能的一大挑戰(zhàn)是，系統(tǒng)出錯(cuò)的方式各種各樣。先前，星際2的職業(yè)玩家可以通過各種新穎方式誘導(dǎo)代理失誤，輕易擊敗AI系統(tǒng)。AlphaStar采用的基于league模式的創(chuàng)新訓(xùn)練方式，可以找到最可靠、最不容易出錯(cuò)的方式。這一創(chuàng)新方式對(duì)改進(jìn)整體AI系統(tǒng)（尤其是在諸如能源等安全至上、且解決復(fù)雜邊緣案例十分關(guān)鍵的領(lǐng)域）的安全性和穩(wěn)定性的前景亦值得期待。

DeepMind去年虧損27億元

DeepMind取得的成績，是大把大把的鈔票“燒”出來的。

2018年10月，DeepMind在英國“工商局”CompaniesHouse上公布的財(cái)務(wù)報(bào)告顯示，DeepMind在上一個(gè)財(cái)年（2017年）虧損了3.02億英鎊，相當(dāng)于人民幣27億元，相比去年同期9395萬英鎊的虧損額，增長了221%。

DeepMind的賺錢能力并未同步增加。財(cái)報(bào)顯示，DeepMind 2017年的營業(yè)收入僅為5442萬英鎊，相比2016年的4028萬英鎊，只增長了35%。

據(jù)Business Insider透露，DeepMind的收入全部來自于其為母公司谷歌旗下部門所提供的服務(wù)，而非外部客戶，比如用人工智能幫谷歌其它部門提高效率等，DeepMind和英國NHS合作的醫(yī)療業(yè)務(wù)還沒賺錢。

DeepMind之所以遭受巨額虧損，除了營收不振之外，主要是因?yàn)閱T工成本和相關(guān)支出（staff costs and other related costs）這個(gè)名目，僅這一項(xiàng)支出就高達(dá)2.01億英鎊，占到全年總虧損的三分之二。

據(jù)英國招聘網(wǎng)站e Financial Careers估算，已知DeepMind一共700名員工，其中400個(gè)博士，可以大致折算出DeepMind員工平均年收入：約為28萬英鎊，折合人民幣超過250萬元。

對(duì)于大規(guī)模虧損可能帶來的質(zhì)疑，DeepMind也在報(bào)告中透露，其母公司谷歌會(huì)在未來12個(gè)月內(nèi)，繼續(xù)向他們提供充足的資金，去招募人工智能人才。

燒了這么多錢的DeepMind對(duì)谷歌有何意義？

每日經(jīng)濟(jì)新聞（微信號(hào)：nbdnews）記者注意到，《經(jīng)濟(jì)學(xué)人》曾寫過一篇文章討論此事：

首先就是品牌，DeepMind一直走在人工智能的最前沿，圍棋事件更被認(rèn)為是新一輪人工智能發(fā)展的里程碑。這一品牌效應(yīng)幫助谷歌吸引到了最頂級(jí)的AI人才，同時(shí)也讓投資方對(duì)谷歌AI的研究實(shí)力有了更多的信心。

其次是技術(shù)合作和應(yīng)用。谷歌可以直接將DeepMind的技術(shù)加入到旗下產(chǎn)品中，并快速向全球消費(fèi)者輸出。最新的案例是，DeepMind的語音合成系統(tǒng)WaveNet的升級(jí)版本正被用于在各個(gè)平臺(tái)上生成谷歌語音助手（Google Assistant）的聲音。

此外，DeepMind此前也宣布，通過使用其最新的算法，為谷歌數(shù)據(jù)中心節(jié)能了15％——這相當(dāng)于節(jié)省了數(shù)百萬美元的開銷。

而Deepmind可以稱得上是英美合作案例，結(jié)合了英國的研究實(shí)力和美國的資本與市場(chǎng)；也可以說是英國人燒美國人的錢做研究，最后共享成果。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

人工智能星際爭霸

上一篇文章

暴風(fēng)集團(tuán)午后跌停被列入一系列被執(zhí)行人名單

返回每經(jīng)網(wǎng)首頁

下一篇文章

繼續(xù)水逆：報(bào)道稱50%用戶是僵尸 Facebook股價(jià)應(yīng)聲下挫

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费