每日經(jīng)濟(jì)新聞

商訊推薦

每經(jīng)網(wǎng)首頁 > 商訊推薦 > 正文

上帝不擲骰子？商湯科技AI大裝置想試試

量子位 2021-05-25 16:51:27

對撞機(jī)，發(fā)現(xiàn)新物理粒子的方法和裝置。

眾所周知的高能物理基礎(chǔ)設(shè)施，人類基礎(chǔ)物理領(lǐng)域研究的集大成成果。

現(xiàn)在，商湯科技也搞了一個，同樣是其多年產(chǎn)學(xué)研積蓄后的成果轉(zhuǎn)換，是其最新技術(shù)成果的集大成體現(xiàn)，是一整套完整的AI基礎(chǔ)設(shè)施。

取名SenseCore商湯AI大裝置。

商湯CEO徐立說，這是商湯長線核心競爭力的標(biāo)志、公司持續(xù)經(jīng)營和更大規(guī)模躍遷的護(hù)城河，以及推動AI時代生產(chǎn)要素降低的關(guān)鍵一步。

實際上，企業(yè)家一面的徐立對此還顯得克制，當(dāng)他科學(xué)家的那一面流露，會激動得語速飛快：

靠人腦的方式可能永遠(yuǎn)趕不上宇宙膨脹的速度，如果要真正解開宇宙真理，輸入的依據(jù)就不能單靠此時此地此身的人類有限認(rèn)知，甚至不必追求當(dāng)下的過程可解釋，可以試著用更大的數(shù)據(jù)，更強(qiáng)的算力，或許還會撞出更多預(yù)期之外的結(jié)果。

所以商湯的AI大裝置，你可以理解為GPT-3、AlphaFold路徑上的更大規(guī)模落地，是大數(shù)據(jù)、大模型和超強(qiáng)算力的三位一體實踐，也是input到output之間沿著“大致正確方向”的大力出奇跡。

商湯AI大裝置如何組成？

在上海臨港新片區(qū)，一座宛如芯片的建筑群將在今年年底投入使用。

這是商湯全新的AI算力中心（AIDC），計算峰值速度將達(dá)到3740 Petaflops（1 petaflop等于每秒1千萬億次浮點運算）——作為參照，OpenAI的千億參數(shù)模型GPT-3完整訓(xùn)練一次需要3.14E23次浮點運算，而商湯臨港AIDC的算力僅在一天內(nèi)即可完成。

毫無疑問，商湯的這個全新AIDC，目標(biāo)就是為更大規(guī)模參數(shù)模型的訓(xùn)練而來。

但在商湯AI大裝置中，AIDC不到1/3又1/3。

商湯AI大裝置SenseCore的全貌，包含了三層：

算力層（AI芯片及處理卡+AIDC+AI傳感器）

平臺層（模型生產(chǎn)+訓(xùn)練平臺+數(shù)據(jù)平臺）

算法層（算法工具箱+開源框架）

三位一體，以基礎(chǔ)設(shè)施方式輸出模型，把AI能力輸出到企業(yè)服務(wù)、城市管理和個人生活等三大落地方向中。

區(qū)別于“AI模型”小作坊式的打造，AI大裝置更像流水線工廠，可以實現(xiàn)不同場景的算法模型的底層抽象，以模塊化平臺套件打造通用型服務(wù)平臺。

特別是針對AI落地中更長尾的客戶和場景，能夠在組合不同算法套件的基礎(chǔ)上完成新場景的定制，以低邊際成本實現(xiàn)對新場景的規(guī)?；采w。

并且商湯基于AI平臺基礎(chǔ)設(shè)施的系統(tǒng)協(xié)同性，可以以半自動化、自適應(yīng)的方式，就能實現(xiàn)批量的算法模型生產(chǎn)和迭代升級。

為什么商湯要搞AI大裝置？

商湯CEO徐立說，本質(zhì)是讓AI落地擺脫人力密集的狀態(tài)。

他認(rèn)為AI之所以人力密集，是因為生產(chǎn)效率不高，而生產(chǎn)效率提升的關(guān)鍵，是生產(chǎn)要素的成本能足夠低。

在AI落地初期階段，項目定制是行業(yè)最普遍的方式，比如做一個手機(jī)檢測的算法，需要上百人的團(tuán)隊，但換一種場景的應(yīng)用模型，又得上百人進(jìn)來……

好比不同的場景里蓋樓，堆人是解決問題常用的方法。

但如果按照上述項目包工的方式搞，AI落地就會顯得天方夜譚。

商湯的模式不是秘密：“商湯驅(qū)動，賦能百業(yè)”，用“1（基礎(chǔ)研究）+1（產(chǎn)品及解決方案）+X（行業(yè)）”的方式展開各行各業(yè)的落地。

據(jù)官方數(shù)據(jù)，創(chuàng)辦6年來，商湯集結(jié)起一支2000人規(guī)模的研發(fā)團(tuán)隊，推出了13000多個技術(shù)模型，以及17000多個商業(yè)模型。

所以規(guī)?；鄨鼍安煌I(lǐng)域落地的過程中，就提出了通用模型的要求。

只是問題也隨之而來，模型越通用，訓(xùn)練數(shù)據(jù)就越大，模型參數(shù)也越大，對算力的要求也就越高。

在GPT-3一炮打響之前，對于這種大規(guī)模參數(shù)的通用模型，業(yè)內(nèi)外都存在質(zhì)疑。

因為之前的共識是：越厲害的算法，參數(shù)和算力可以更少，提升模型精度才是正道。

而且這種“精妙”著稱的算法方向，意味著模型對于運算和執(zhí)行的精準(zhǔn)部署，就像數(shù)學(xué)解題中，嚴(yán)絲合縫的過程推導(dǎo)，最后精準(zhǔn)給出結(jié)果。

所需的“算力”，理應(yīng)越少越好。

要來一個暴力解題的方式：吃最多數(shù)據(jù)，一通暴力計算，最后給出結(jié)果——即便是正確答案，也不被推崇。

商湯起步伊始，為手機(jī)、互聯(lián)網(wǎng)公司供應(yīng)AI方案，走的就是精妙模型的路線。

但隨著規(guī)?；瘮U(kuò)張，開始進(jìn)入To B行業(yè)和城市業(yè)務(wù)領(lǐng)域后，精妙技術(shù)模型在行業(yè)長尾需求和應(yīng)用中的“短板”也就暴露出來。

比如在業(yè)務(wù)落地中，優(yōu)先選擇的自然是流量大、顯示度高、高頻，投入產(chǎn)出比高的頭部應(yīng)用。于是大家爭奪的就是像地鐵刷臉通行這樣的應(yīng)用。

而城市里防火、防水等應(yīng)用，頻次低，需要累積和投入的資源又一點不比頭部應(yīng)用少，雖然有剛需，但處于長尾端，不受青睞。

最終，從需求方角度，如果不能在一個場景里解決包括長尾在內(nèi)的問題，切換新方案、并為此買單的意愿就會降低。

所以從AI落地的商業(yè)化和價值閉環(huán)出發(fā)，從需求端推動來看，“眉毛頭發(fā)一把抓”，大參數(shù)模型也就變得自然而然。

此外，AI技術(shù)的演進(jìn)路線上，反共識的趨勢從更多維度顯現(xiàn)。

從AlexNet以來看過去十年AI模型的發(fā)展，每年最新的算法網(wǎng)絡(luò)、最好的技術(shù)，對于算力的需求，幾乎是呈數(shù)量級的增長，每年都大概會有十倍的算力需求增長。

徐立躬身其間，對這種趨勢的感知也非常明顯。

他認(rèn)為造成這種趨勢的原因其實很簡單：表達(dá)越來越豐富，模型越來越通用，參數(shù)也就越來越多，算力要求也就越高。

行業(yè)整體而言，最領(lǐng)先的算法對于算力的需求翻了近百萬倍。

其次，技術(shù)本身的演進(jìn)。

原先的技術(shù)路線朝著單一方向、單一路線前進(jìn)。通用AI看起來可望不可即，然而過去幾年在通用問題的剛需驅(qū)動下，一些通用語言模型、通用視覺模型，甚至通用多模態(tài)模型開始取得突破，曾經(jīng)不work的正在變成可能。

商湯CEO坦承，通用模型的打造確實花費了大力氣，但好處是在長尾問題解決上效果顯著。

伴隨而來的挑戰(zhàn)，是對新一波以算力為核心的AI基礎(chǔ)設(shè)施的渴求。

“就好像在物理探索中，如果沒有粒子對撞機(jī)，很多核心工作沒法展開。”

徐立強(qiáng)調(diào)，商湯在AI規(guī)?；涞氐拇蟪崩?，必須到了解決通用模型挑戰(zhàn)、必須有集中化大規(guī)模算力的時候。

他回溯稱，2016年、2017年開始，商湯就開始了大參數(shù)模型的挑戰(zhàn)，SenseNet被做到了1000多層。

隨著模型網(wǎng)絡(luò)越深、參數(shù)越大，算力的問題變得突出。

于是2018年開始，商湯開始更加嚴(yán)肅地審視芯片、硬件，并在自建算力中心的基礎(chǔ)上，完成了大裝置的“原型機(jī)”打造。

其后，投資56億的AIDC智算中心開工，2021年底交付。

當(dāng)然，過程中還發(fā)生了兩件AI領(lǐng)域的最大新突破，給商湯上下吃下定心丸。

一件發(fā)生在2019年，OpenAI開始大參數(shù)模型打造，并在2020年以GPT-3轟動全球。

另一件則是DeepMind的AlphaFold 2。

在徐立看來，兩大不同方向的進(jìn)展，背后其實有同一個核心路徑：

輸出方向大致可確定，輸入更大的數(shù)據(jù)，“撞”出結(jié)果。

而商湯的AI大裝置，不正是這種核心路徑的實踐機(jī)器、基礎(chǔ)設(shè)施，AI領(lǐng)域的粒子對撞機(jī)嗎？

AI大裝置有什么用？

自然是可以打造大參數(shù)模型。

首先可以解決AI落地中的長尾問題。

比如在城市的日常治理中，把“城管”的工作場景，實現(xiàn)全AI流程覆蓋。

無論是暴露垃圾的問題，共享單車亂堆亂放的問題，還是疫情、火災(zāi)、汛情、人群擁擠踩踏、?；沸孤?hellip;…等等公共場景中的各類問題，不管高頻還是低頻，都能實現(xiàn)一站式解決。

從發(fā)現(xiàn)、報警、執(zhí)行到結(jié)案，全流程都可以實現(xiàn)AI化，用人機(jī)交互的方式實現(xiàn)更加高效的城市治理。

而且這不是設(shè)想，是商湯用AI大裝置原型機(jī)，在上海一網(wǎng)統(tǒng)管項目中落地的現(xiàn)實。

其次，大參數(shù)模型的打造，還是批量打造的那種。

按商業(yè)場景分，大的如城市、汽車、工業(yè)，小的像螺絲螺帽、冰箱內(nèi)物品識別……

按技術(shù)場景分，視覺領(lǐng)域、語言領(lǐng)域、自動駕駛領(lǐng)域、醫(yī)療領(lǐng)域、制藥領(lǐng)域……

每一個領(lǐng)域，是不是都可以足夠多的數(shù)據(jù)輸入，然后用大裝置對撞生成結(jié)果？

比如在蛋白質(zhì)結(jié)構(gòu)預(yù)測方向，之前即便用AI的方法，也需要既有非常懂生物的專家，還得非常懂AI的專家協(xié)作……雙方精心設(shè)計流程，精心準(zhǔn)備輸入數(shù)據(jù)，最后才有可能得到正確的結(jié)果？

大裝置會有什么不同？

知道大致正確的方向和目標(biāo)，就是預(yù)測蛋白質(zhì)結(jié)構(gòu)，但不用精心準(zhǔn)備輸入數(shù)據(jù)和流程，甚至可以群策群力，把所有可能相關(guān)的數(shù)據(jù)都輸入，最后“大裝置”窮盡所有可能性，同樣解出正確的結(jié)果。

所以沿著這個層面展開，AI大裝置意味著落地門檻的降低。

從AI展開行業(yè)落地那一天開始，主導(dǎo)權(quán)到底是歸屬AI博士們，還是傳統(tǒng)行業(yè)老兵的話題，討論從未有過間斷，也從未有過共識。

最具參考的一種答案是既要也要，強(qiáng)調(diào)融合共生。

然而如果需要融合，那落地的規(guī)模和速度自然就會大受局限，畢竟懂AI、掌握AI能力的人，相比傳統(tǒng)行業(yè)人才，實在九牛一毛。

而作為基礎(chǔ)設(shè)施，AI大裝置在本質(zhì)路徑上，把AI能力變成了一個輸入→輸出的機(jī)器和工具。

運用這個工具的，可以來自任何行業(yè)和領(lǐng)域。

只要有數(shù)據(jù)思維，定義清楚目標(biāo)方向，懂得找可能的數(shù)據(jù)，然后大裝置就跟“相機(jī)”、“電腦”沒有本質(zhì)不同，都是工具。

所以徐立說，這就是為什么商湯把AI教育作為重要業(yè)務(wù)組成的原因。

“現(xiàn)在的教育告訴年輕人，需要每一步嚴(yán)格推導(dǎo)產(chǎn)生正確結(jié)果才能給分，但未來可能也有一種得出正確結(jié)果的方法，不需要你掌握推導(dǎo)過程。”

用好你需要的數(shù)據(jù)，知道如何操作和使用，然后把數(shù)據(jù)放入“裝置”，一樣能解題。

這也是為什么會有一種觀點認(rèn)為：下一個柯潔李世石一樣的圍棋高手，不一定要學(xué)圍棋。

實際上，這種思維下，教育方法確實值得被重新審視。

畢竟現(xiàn)如今我們稱贊的“計算天才”，不是口算、心算最厲害的那類人，而是最懂得如何利用計算機(jī)工具的人。

當(dāng)然，如果沿著“AI大裝置”的思路，擴(kuò)展到更宏觀的“認(rèn)識世界”，人類對于規(guī)律的發(fā)現(xiàn)和認(rèn)知，是否也會被刷新？

人類對于世界的認(rèn)識和改造，究竟是一種怎樣的模式？

亞里士多德提倡演繹，這是一種強(qiáng)調(diào)因果的強(qiáng)推導(dǎo)，是一種線性的演進(jìn)和發(fā)展。

但另一種模式，牛頓的時代、愛因斯坦的時代，展現(xiàn)的卻是躍遷式進(jìn)步。

他們帶來的基礎(chǔ)理論突破，當(dāng)時甚至只是一種“假設(shè)”，是在其后一代甚至幾代天才歸因中，才完成過程論證。

只是歷史車輪相似的是，每一次基礎(chǔ)理論的突破，都帶來一波更有力量的發(fā)明創(chuàng)造和更高級的文明。

徐立把這種天才推動的文明躍遷，笑稱為“上帝拍腦袋”。

不過更令他著迷的是，接下來是不是可以由大裝置來拍？

回顧過去，人類的科學(xué)探索都是基于已知認(rèn)知推未知，毫無疑問就會受限于“已知認(rèn)知”，更何況人類歷史上不少重要的發(fā)明和發(fā)現(xiàn)，還是“無心插柳”的結(jié)果。

但AI大裝置提供的新范式，提供了另一種路徑：

探索未知，可以不依賴于人類已經(jīng)理解的輸入來作為輸入，可以嘗試把更大更多的數(shù)據(jù)放進(jìn)來，搞不好就能找出更趨近本質(zhì)的規(guī)律。

而AI最終極的工具能力，不正是幫助人類發(fā)現(xiàn)、找出更多，更終極的規(guī)律和真理嗎？

刷新商湯

最后，在AI大裝置浮出水面之際，也是時候重新審視商湯。

商湯是一家什么樣的公司？

創(chuàng)辦6年來，它備受矚目，但又面目“模糊”。

商湯時常被談?wù)撍囊?guī)模增速和融資估值，也始終被熱議“AI賦能百業(yè)”的可能性和可行性。

更因為其落地領(lǐng)域廣泛，技術(shù)和產(chǎn)品不直接To C，又容易在輿論認(rèn)知中被盲人摸象。

但現(xiàn)如今，最新集大成成果AI大裝置建立完成，商湯的歸去來都得到了最好的連點成線，商湯的核心和邊界、商湯的護(hù)城河、商湯從技術(shù)到商業(yè)的可持續(xù)，以及商湯將會帶來的AI變革，都能在AI大裝置得到完整解答。

在AI大裝置的思路之下，商湯把聚集的AI博士之力，架構(gòu)成了不需要AI博士才能使用的AI工具，并且可以在各個領(lǐng)域都實現(xiàn)輸出和賦能。

就像電被發(fā)現(xiàn)后，發(fā)電機(jī)和發(fā)電廠所承擔(dān)的角色一樣。

徐立透露，2018年開始大膽設(shè)想時，這種發(fā)展路線甚至是反共識的，但商湯內(nèi)部還是頂住壓力，做重做深，碰硬件碰底層，然后一搞就是3年。

這有點像黎明前的登山，知道在向上走，卻不知道是否是登頂?shù)恼_道路。

好在OpenAI的GPT-3、DeepMind的AlphaFold，以及越來越多業(yè)內(nèi)巨頭玩家拿出的超大參數(shù)模型，不同維度驗證了這確實是一條通向未來的路。

徐立還透露，按照內(nèi)部規(guī)劃，硬件成本投入56億起的AI大裝置，在開起運行的2年后就能回本，到2025年就會進(jìn)入盈利軌道。

這是商湯面向未來的長線核心競爭力，而建立這種長線競爭力的時間周期，則構(gòu)成壁壘和護(hù)城河。

更重要的是，AI大裝置啟動，AI賦能的門檻進(jìn)一步降低，整個數(shù)字化和智能化的進(jìn)程，就會進(jìn)一步被加速。

商湯當(dāng)前的北京辦公室所在地，理想國際大廈，是上一代原創(chuàng)技術(shù)公司百度，從技術(shù)創(chuàng)新到商業(yè)創(chuàng)新的“福地”。

徐立也喜歡用搜索引擎來類比“AI大裝置”會給商湯、給AI行業(yè)帶來的變革。

他認(rèn)為今天互聯(lián)網(wǎng)的繁榮，是因為搜索引擎成功地把信息——高頻的、低頻的、高價值的、長尾的，在虛擬空間實現(xiàn)了鏈接。

而現(xiàn)實世界，始終缺少一樣的“搜索引擎”。

因為現(xiàn)實世界中很多東西還無法結(jié)構(gòu)化的、可解析。但AI大裝置如果成功，就能加速這種真實世界的結(jié)構(gòu)化、數(shù)字化。

順理成章，互聯(lián)網(wǎng)發(fā)展中兩大核心技術(shù)——搜索和推薦，也就能在現(xiàn)實世界得到復(fù)刻和應(yīng)用。

并且相比互聯(lián)網(wǎng)經(jīng)濟(jì)創(chuàng)造的價值，人類更大一部分的經(jīng)濟(jì)活動和創(chuàng)造，原本就在線下。

所以徐立堅信，AI正在進(jìn)入下一個時間點，一個從技術(shù)創(chuàng)新周期轉(zhuǎn)入商業(yè)創(chuàng)新周期的時間點。

“搜索引擎起來的時候，有圍繞搜索引擎創(chuàng)業(yè)的生態(tài)；視頻平臺起來的時候，有圍繞視頻平臺展開的商業(yè)生態(tài)。”

這位商湯聯(lián)合創(chuàng)始人說，很多人問他，AI創(chuàng)業(yè)是不是過時了？

他的回答是：

恰恰是正當(dāng)其時的時候。

—完—

責(zé)編方奕奕

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

商湯科技

上一篇文章

貝殼回應(yīng)市監(jiān)總局發(fā)起反壟斷調(diào)查：是舊聞，所有平臺在配合總局內(nèi)檢

返回每經(jīng)網(wǎng)首頁

下一篇文章

弘訊科技：公司控股股東已累計減持404.21萬股

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟(jì)新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费