每日經(jīng)濟(jì)新聞
商訊推薦

每經(jīng)網(wǎng)首頁 > 商訊推薦 > 正文

上帝不擲骰子?商湯科技AI大裝置想試試

量子位 2021-05-25 16:51:27

對撞機(jī),發(fā)現(xiàn)新物理粒子的方法和裝置。

眾所周知的高能物理基礎(chǔ)設(shè)施,人類基礎(chǔ)物理領(lǐng)域研究的集大成成果。

現(xiàn)在,商湯科技也搞了一個,同樣是其多年產(chǎn)學(xué)研積蓄后的成果轉(zhuǎn)換,是其最新技術(shù)成果的集大成體現(xiàn),是一整套完整的AI基礎(chǔ)設(shè)施。

取名SenseCore商湯AI大裝置。

商湯CEO徐立說,這是商湯長線核心競爭力的標(biāo)志、公司持續(xù)經(jīng)營和更大規(guī)模躍遷的護(hù)城河,以及推動AI時代生產(chǎn)要素降低的關(guān)鍵一步。

實際上,企業(yè)家一面的徐立對此還顯得克制,當(dāng)他科學(xué)家的那一面流露,會激動得語速飛快:

靠人腦的方式可能永遠(yuǎn)趕不上宇宙膨脹的速度,如果要真正解開宇宙真理,輸入的依據(jù)就不能單靠此時此地此身的人類有限認(rèn)知,甚至不必追求當(dāng)下的過程可解釋,可以試著用更大的數(shù)據(jù),更強(qiáng)的算力,或許還會撞出更多預(yù)期之外的結(jié)果。

所以商湯的AI大裝置,你可以理解為GPT-3、AlphaFold路徑上的更大規(guī)模落地,是大數(shù)據(jù)、大模型和超強(qiáng)算力的三位一體實踐,也是input到output之間沿著“大致正確方向”的大力出奇跡。

商湯AI大裝置如何組成?

在上海臨港新片區(qū),一座宛如芯片的建筑群將在今年年底投入使用。

這是商湯全新的AI算力中心(AIDC),計算峰值速度將達(dá)到3740 Petaflops(1 petaflop等于每秒1千萬億次浮點運算)——作為參照,OpenAI的千億參數(shù)模型GPT-3完整訓(xùn)練一次需要3.14E23次浮點運算,而商湯臨港AIDC的算力僅在一天內(nèi)即可完成。

毫無疑問,商湯的這個全新AIDC,目標(biāo)就是為更大規(guī)模參數(shù)模型的訓(xùn)練而來。

但在商湯AI大裝置中,AIDC不到1/3又1/3。

商湯AI大裝置SenseCore的全貌,包含了三層:

算力層(AI芯片及處理卡+AIDC+AI傳感器)

平臺層(模型生產(chǎn)+訓(xùn)練平臺+數(shù)據(jù)平臺)

算法層(算法工具箱+開源框架)

三位一體,以基礎(chǔ)設(shè)施方式輸出模型,把AI能力輸出到企業(yè)服務(wù)、城市管理和個人生活等三大落地方向中。

區(qū)別于“AI模型”小作坊式的打造,AI大裝置更像流水線工廠,可以實現(xiàn)不同場景的算法模型的底層抽象,以模塊化平臺套件打造通用型服務(wù)平臺。

特別是針對AI落地中更長尾的客戶和場景,能夠在組合不同算法套件的基礎(chǔ)上完成新場景的定制,以低邊際成本實現(xiàn)對新場景的規(guī)?;采w。

并且商湯基于AI平臺基礎(chǔ)設(shè)施的系統(tǒng)協(xié)同性,可以以半自動化、自適應(yīng)的方式,就能實現(xiàn)批量的算法模型生產(chǎn)和迭代升級。

為什么商湯要搞AI大裝置?

商湯CEO徐立說,本質(zhì)是讓AI落地擺脫人力密集的狀態(tài)。

他認(rèn)為AI之所以人力密集,是因為生產(chǎn)效率不高,而生產(chǎn)效率提升的關(guān)鍵,是生產(chǎn)要素的成本能足夠低。

在AI落地初期階段,項目定制是行業(yè)最普遍的方式,比如做一個手機(jī)檢測的算法,需要上百人的團(tuán)隊,但換一種場景的應(yīng)用模型,又得上百人進(jìn)來……

好比不同的場景里蓋樓,堆人是解決問題常用的方法。

但如果按照上述項目包工的方式搞,AI落地就會顯得天方夜譚。

商湯的模式不是秘密:“商湯驅(qū)動,賦能百業(yè)”,用“1(基礎(chǔ)研究)+1(產(chǎn)品及解決方案)+X(行業(yè))”的方式展開各行各業(yè)的落地。

據(jù)官方數(shù)據(jù),創(chuàng)辦6年來,商湯集結(jié)起一支2000人規(guī)模的研發(fā)團(tuán)隊,推出了13000多個技術(shù)模型,以及17000多個商業(yè)模型。

所以規(guī)?;鄨鼍安煌I(lǐng)域落地的過程中,就提出了通用模型的要求。

只是問題也隨之而來,模型越通用,訓(xùn)練數(shù)據(jù)就越大,模型參數(shù)也越大,對算力的要求也就越高。

在GPT-3一炮打響之前,對于這種大規(guī)模參數(shù)的通用模型,業(yè)內(nèi)外都存在質(zhì)疑。

因為之前的共識是:越厲害的算法,參數(shù)和算力可以更少,提升模型精度才是正道。

而且這種“精妙”著稱的算法方向,意味著模型對于運算和執(zhí)行的精準(zhǔn)部署,就像數(shù)學(xué)解題中,嚴(yán)絲合縫的過程推導(dǎo),最后精準(zhǔn)給出結(jié)果。

所需的“算力”,理應(yīng)越少越好。

要來一個暴力解題的方式:吃最多數(shù)據(jù),一通暴力計算,最后給出結(jié)果——即便是正確答案,也不被推崇。

商湯起步伊始,為手機(jī)、互聯(lián)網(wǎng)公司供應(yīng)AI方案,走的就是精妙模型的路線。

但隨著規(guī)?;瘮U(kuò)張,開始進(jìn)入To B行業(yè)和城市業(yè)務(wù)領(lǐng)域后,精妙技術(shù)模型在行業(yè)長尾需求和應(yīng)用中的“短板”也就暴露出來。

比如在業(yè)務(wù)落地中,優(yōu)先選擇的自然是流量大、顯示度高、高頻,投入產(chǎn)出比高的頭部應(yīng)用。于是大家爭奪的就是像地鐵刷臉通行這樣的應(yīng)用。

而城市里防火、防水等應(yīng)用,頻次低,需要累積和投入的資源又一點不比頭部應(yīng)用少,雖然有剛需,但處于長尾端,不受青睞。

最終,從需求方角度,如果不能在一個場景里解決包括長尾在內(nèi)的問題,切換新方案、并為此買單的意愿就會降低。

所以從AI落地的商業(yè)化和價值閉環(huán)出發(fā),從需求端推動來看,“眉毛頭發(fā)一把抓”,大參數(shù)模型也就變得自然而然。

此外,AI技術(shù)的演進(jìn)路線上,反共識的趨勢從更多維度顯現(xiàn)。

從AlexNet以來看過去十年AI模型的發(fā)展,每年最新的算法網(wǎng)絡(luò)、最好的技術(shù),對于算力的需求,幾乎是呈數(shù)量級的增長,每年都大概會有十倍的算力需求增長。

徐立躬身其間,對這種趨勢的感知也非常明顯。

他認(rèn)為造成這種趨勢的原因其實很簡單:表達(dá)越來越豐富,模型越來越通用,參數(shù)也就越來越多,算力要求也就越高。

行業(yè)整體而言,最領(lǐng)先的算法對于算力的需求翻了近百萬倍。

其次,技術(shù)本身的演進(jìn)。

原先的技術(shù)路線朝著單一方向、單一路線前進(jìn)。通用AI看起來可望不可即,然而過去幾年在通用問題的剛需驅(qū)動下,一些通用語言模型、通用視覺模型,甚至通用多模態(tài)模型開始取得突破,曾經(jīng)不work的正在變成可能。

商湯CEO坦承,通用模型的打造確實花費了大力氣,但好處是在長尾問題解決上效果顯著。

伴隨而來的挑戰(zhàn),是對新一波以算力為核心的AI基礎(chǔ)設(shè)施的渴求。

“就好像在物理探索中,如果沒有粒子對撞機(jī),很多核心工作沒法展開。”

徐立強(qiáng)調(diào),商湯在AI規(guī)?;涞氐拇蟪崩?,必須到了解決通用模型挑戰(zhàn)、必須有集中化大規(guī)模算力的時候。

他回溯稱,2016年、2017年開始,商湯就開始了大參數(shù)模型的挑戰(zhàn),SenseNet被做到了1000多層。

隨著模型網(wǎng)絡(luò)越深、參數(shù)越大,算力的問題變得突出。

于是2018年開始,商湯開始更加嚴(yán)肅地審視芯片、硬件,并在自建算力中心的基礎(chǔ)上,完成了大裝置的“原型機(jī)”打造。

其后,投資56億的AIDC智算中心開工,2021年底交付。

當(dāng)然,過程中還發(fā)生了兩件AI領(lǐng)域的最大新突破,給商湯上下吃下定心丸。

一件發(fā)生在2019年,OpenAI開始大參數(shù)模型打造,并在2020年以GPT-3轟動全球。

另一件則是DeepMind的AlphaFold 2。

在徐立看來,兩大不同方向的進(jìn)展,背后其實有同一個核心路徑:

輸出方向大致可確定,輸入更大的數(shù)據(jù),“撞”出結(jié)果。

而商湯的AI大裝置,不正是這種核心路徑的實踐機(jī)器、基礎(chǔ)設(shè)施,AI領(lǐng)域的粒子對撞機(jī)嗎?

AI大裝置有什么用?

自然是可以打造大參數(shù)模型。

首先可以解決AI落地中的長尾問題。

比如在城市的日常治理中,把“城管”的工作場景,實現(xiàn)全AI流程覆蓋。

無論是暴露垃圾的問題,共享單車亂堆亂放的問題,還是疫情、火災(zāi)、汛情、人群擁擠踩踏、?;沸孤?hellip;…等等公共場景中的各類問題,不管高頻還是低頻,都能實現(xiàn)一站式解決。

從發(fā)現(xiàn)、報警、執(zhí)行到結(jié)案,全流程都可以實現(xiàn)AI化,用人機(jī)交互的方式實現(xiàn)更加高效的城市治理。

而且這不是設(shè)想,是商湯用AI大裝置原型機(jī),在上海一網(wǎng)統(tǒng)管項目中落地的現(xiàn)實。

其次,大參數(shù)模型的打造,還是批量打造的那種。

按商業(yè)場景分,大的如城市、汽車、工業(yè),小的像螺絲螺帽、冰箱內(nèi)物品識別……

按技術(shù)場景分,視覺領(lǐng)域、語言領(lǐng)域、自動駕駛領(lǐng)域、醫(yī)療領(lǐng)域、制藥領(lǐng)域……

每一個領(lǐng)域,是不是都可以足夠多的數(shù)據(jù)輸入,然后用大裝置對撞生成結(jié)果?

比如在蛋白質(zhì)結(jié)構(gòu)預(yù)測方向,之前即便用AI的方法,也需要既有非常懂生物的專家,還得非常懂AI的專家協(xié)作……雙方精心設(shè)計流程,精心準(zhǔn)備輸入數(shù)據(jù),最后才有可能得到正確的結(jié)果?

大裝置會有什么不同?

知道大致正確的方向和目標(biāo),就是預(yù)測蛋白質(zhì)結(jié)構(gòu),但不用精心準(zhǔn)備輸入數(shù)據(jù)和流程,甚至可以群策群力,把所有可能相關(guān)的數(shù)據(jù)都輸入,最后“大裝置”窮盡所有可能性,同樣解出正確的結(jié)果。

所以沿著這個層面展開,AI大裝置意味著落地門檻的降低。

從AI展開行業(yè)落地那一天開始,主導(dǎo)權(quán)到底是歸屬AI博士們,還是傳統(tǒng)行業(yè)老兵的話題,討論從未有過間斷,也從未有過共識。

最具參考的一種答案是既要也要,強(qiáng)調(diào)融合共生。

然而如果需要融合,那落地的規(guī)模和速度自然就會大受局限,畢竟懂AI、掌握AI能力的人,相比傳統(tǒng)行業(yè)人才,實在九牛一毛。

而作為基礎(chǔ)設(shè)施,AI大裝置在本質(zhì)路徑上,把AI能力變成了一個輸入→輸出的機(jī)器和工具。

運用這個工具的,可以來自任何行業(yè)和領(lǐng)域。

只要有數(shù)據(jù)思維,定義清楚目標(biāo)方向,懂得找可能的數(shù)據(jù),然后大裝置就跟“相機(jī)”、“電腦”沒有本質(zhì)不同,都是工具。

所以徐立說,這就是為什么商湯把AI教育作為重要業(yè)務(wù)組成的原因。

“現(xiàn)在的教育告訴年輕人,需要每一步嚴(yán)格推導(dǎo)產(chǎn)生正確結(jié)果才能給分,但未來可能也有一種得出正確結(jié)果的方法,不需要你掌握推導(dǎo)過程。”

用好你需要的數(shù)據(jù),知道如何操作和使用,然后把數(shù)據(jù)放入“裝置”,一樣能解題。

這也是為什么會有一種觀點認(rèn)為:下一個柯潔李世石一樣的圍棋高手,不一定要學(xué)圍棋。

實際上,這種思維下,教育方法確實值得被重新審視。

畢竟現(xiàn)如今我們稱贊的“計算天才”,不是口算、心算最厲害的那類人,而是最懂得如何利用計算機(jī)工具的人。

當(dāng)然,如果沿著“AI大裝置”的思路,擴(kuò)展到更宏觀的“認(rèn)識世界”,人類對于規(guī)律的發(fā)現(xiàn)和認(rèn)知,是否也會被刷新?

人類對于世界的認(rèn)識和改造,究竟是一種怎樣的模式?

亞里士多德提倡演繹,這是一種強(qiáng)調(diào)因果的強(qiáng)推導(dǎo),是一種線性的演進(jìn)和發(fā)展。

但另一種模式,牛頓的時代、愛因斯坦的時代,展現(xiàn)的卻是躍遷式進(jìn)步。

他們帶來的基礎(chǔ)理論突破,當(dāng)時甚至只是一種“假設(shè)”,是在其后一代甚至幾代天才歸因中,才完成過程論證。

只是歷史車輪相似的是,每一次基礎(chǔ)理論的突破,都帶來一波更有力量的發(fā)明創(chuàng)造和更高級的文明。

徐立把這種天才推動的文明躍遷,笑稱為“上帝拍腦袋”。

不過更令他著迷的是,接下來是不是可以由大裝置來拍?

回顧過去,人類的科學(xué)探索都是基于已知認(rèn)知推未知,毫無疑問就會受限于“已知認(rèn)知”,更何況人類歷史上不少重要的發(fā)明和發(fā)現(xiàn),還是“無心插柳”的結(jié)果。

但AI大裝置提供的新范式,提供了另一種路徑:

探索未知,可以不依賴于人類已經(jīng)理解的輸入來作為輸入,可以嘗試把更大更多的數(shù)據(jù)放進(jìn)來,搞不好就能找出更趨近本質(zhì)的規(guī)律。

而AI最終極的工具能力,不正是幫助人類發(fā)現(xiàn)、找出更多,更終極的規(guī)律和真理嗎?

刷新商湯

最后,在AI大裝置浮出水面之際,也是時候重新審視商湯。

商湯是一家什么樣的公司?

創(chuàng)辦6年來,它備受矚目,但又面目“模糊”。

商湯時常被談?wù)撍囊?guī)模增速和融資估值,也始終被熱議“AI賦能百業(yè)”的可能性和可行性。

更因為其落地領(lǐng)域廣泛,技術(shù)和產(chǎn)品不直接To C,又容易在輿論認(rèn)知中被盲人摸象。

但現(xiàn)如今,最新集大成成果AI大裝置建立完成,商湯的歸去來都得到了最好的連點成線,商湯的核心和邊界、商湯的護(hù)城河、商湯從技術(shù)到商業(yè)的可持續(xù),以及商湯將會帶來的AI變革,都能在AI大裝置得到完整解答。

在AI大裝置的思路之下,商湯把聚集的AI博士之力,架構(gòu)成了不需要AI博士才能使用的AI工具,并且可以在各個領(lǐng)域都實現(xiàn)輸出和賦能。

就像電被發(fā)現(xiàn)后,發(fā)電機(jī)和發(fā)電廠所承擔(dān)的角色一樣。

徐立透露,2018年開始大膽設(shè)想時,這種發(fā)展路線甚至是反共識的,但商湯內(nèi)部還是頂住壓力,做重做深,碰硬件碰底層,然后一搞就是3年。

這有點像黎明前的登山,知道在向上走,卻不知道是否是登頂?shù)恼_道路。

好在OpenAI的GPT-3、DeepMind的AlphaFold,以及越來越多業(yè)內(nèi)巨頭玩家拿出的超大參數(shù)模型,不同維度驗證了這確實是一條通向未來的路。

徐立還透露,按照內(nèi)部規(guī)劃,硬件成本投入56億起的AI大裝置,在開起運行的2年后就能回本,到2025年就會進(jìn)入盈利軌道。

這是商湯面向未來的長線核心競爭力,而建立這種長線競爭力的時間周期,則構(gòu)成壁壘和護(hù)城河。

更重要的是,AI大裝置啟動,AI賦能的門檻進(jìn)一步降低,整個數(shù)字化和智能化的進(jìn)程,就會進(jìn)一步被加速。

商湯當(dāng)前的北京辦公室所在地,理想國際大廈,是上一代原創(chuàng)技術(shù)公司百度,從技術(shù)創(chuàng)新到商業(yè)創(chuàng)新的“福地”。

徐立也喜歡用搜索引擎來類比“AI大裝置”會給商湯、給AI行業(yè)帶來的變革。

他認(rèn)為今天互聯(lián)網(wǎng)的繁榮,是因為搜索引擎成功地把信息——高頻的、低頻的、高價值的、長尾的,在虛擬空間實現(xiàn)了鏈接。

而現(xiàn)實世界,始終缺少一樣的“搜索引擎”。

因為現(xiàn)實世界中很多東西還無法結(jié)構(gòu)化的、可解析。但AI大裝置如果成功,就能加速這種真實世界的結(jié)構(gòu)化、數(shù)字化。

順理成章,互聯(lián)網(wǎng)發(fā)展中兩大核心技術(shù)——搜索和推薦,也就能在現(xiàn)實世界得到復(fù)刻和應(yīng)用。

并且相比互聯(lián)網(wǎng)經(jīng)濟(jì)創(chuàng)造的價值,人類更大一部分的經(jīng)濟(jì)活動和創(chuàng)造,原本就在線下。

所以徐立堅信,AI正在進(jìn)入下一個時間點,一個從技術(shù)創(chuàng)新周期轉(zhuǎn)入商業(yè)創(chuàng)新周期的時間點。

“搜索引擎起來的時候,有圍繞搜索引擎創(chuàng)業(yè)的生態(tài);視頻平臺起來的時候,有圍繞視頻平臺展開的商業(yè)生態(tài)。”

這位商湯聯(lián)合創(chuàng)始人說,很多人問他,AI創(chuàng)業(yè)是不是過時了?

他的回答是:

恰恰是正當(dāng)其時的時候。

—完—

責(zé)編 方奕奕

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

商湯科技

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费