每日經(jīng)濟(jì)新聞 2024-09-20 16:43:20
“前期更多出現(xiàn)的是通用大模型,無所不能,但缺乏深度無法滿足具體需求。因?yàn)轭A(yù)期缺少回報(bào),市場對通用大模型的投資越來越謹(jǐn)慎,但同時(shí)越來越看好在具體領(lǐng)域的發(fā)展,因此,所謂‘下半場’的重心應(yīng)該在垂直大模型,比如醫(yī)療、教育、交通或者某個(gè)制造業(yè)垂類?!?/p>
每經(jīng)記者 楊棄非 每經(jīng)編輯 楊歡
圖片來源:攝圖網(wǎng)_402624474
短短一年時(shí)間,國內(nèi)大模型從“百模大戰(zhàn)”,到如今被認(rèn)為格局漸成。而“牌桌”上僅剩“大模型五虎”和互聯(lián)網(wǎng)大廠等少數(shù)“牌手”。越來越多的人開始發(fā)問,有關(guān)大模型競爭的“下半場”是否正在逼近?
在9月19日由成都市政府港澳辦主辦的“智匯天府AI啟航”蓉港澳三地交流活動上,電子科技大學(xué)(深圳)高等研究院執(zhí)行院長湯志偉在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí),對此論斷的態(tài)度顯得較為謹(jǐn)慎。在他看來,從技術(shù)上講,現(xiàn)有大模型并不夠成熟、且仍在快速發(fā)展,相關(guān)技術(shù)還需要不斷創(chuàng)新,難論“下半場”的出現(xiàn)。
但反觀應(yīng)用層面,一些改變確實(shí)正在發(fā)生。“前期更多出現(xiàn)的是通用大模型,無所不能,但缺乏深度無法滿足具體需求。因?yàn)轭A(yù)期缺少回報(bào),市場對通用大模型的投資越來越謹(jǐn)慎,但同時(shí)越來越看好在具體領(lǐng)域的發(fā)展,因此,所謂‘下半場’的重心應(yīng)該在垂直大模型,比如醫(yī)療、教育、交通或者某個(gè)制造業(yè)垂類。”而在他看來,這也將是我國在大模型領(lǐng)域能夠快速產(chǎn)生價(jià)值的重要方向。
自ChatGPT3.5問世以來,國產(chǎn)大模型層出不窮,有人統(tǒng)計(jì),至少有300余個(gè)國產(chǎn)大模型已對外發(fā)布。但從話題度上看,似乎尚未出現(xiàn)絕對超越ChatGPT的國產(chǎn)大模型。
湯志偉指出,在通用大模型領(lǐng)域,美國優(yōu)勢較為明顯,我國還處于跟隨和學(xué)習(xí)階段。但在垂直大模型領(lǐng)域,因?yàn)槲覈鴪鼍案迂S富,有助于對大模型進(jìn)行垂直場景訓(xùn)練,更好地促進(jìn)大模型的性能評估和部署落地。
他格外強(qiáng)調(diào)“實(shí)體經(jīng)濟(jì)”的價(jià)值。“大模型最終目的是要為大家解決實(shí)際問題,它不僅要能推動經(jīng)濟(jì)轉(zhuǎn)型,還要能帶來收益。因此,應(yīng)用場景對于大模型來說十分重要。因?yàn)槲覈浅?qiáng)調(diào)實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)的深度融合發(fā)展,且實(shí)體經(jīng)濟(jì)是我國的強(qiáng)項(xiàng),因此,在這一點(diǎn)上,我國擁有其他國家難以比擬的優(yōu)勢。”
向垂直大模型深入,也有助于解決企業(yè)智能化改造過程中面臨的成本問題。
湯志偉特別提到了去年國內(nèi)的“百模大戰(zhàn)”。在他看來,通用大模型領(lǐng)域,主要仍需靠世界級的頂尖龍頭企業(yè)進(jìn)行突破,并向外開源共享。
而對于大部分面向行業(yè)細(xì)分應(yīng)用場景的小型公司來說,無須重走高成本研發(fā)的道路,更多資源可以投向訓(xùn)練垂直大模型,使其能符合企業(yè)獨(dú)特的發(fā)展需要。從這個(gè)意義上說,不同企業(yè)能開發(fā)出大量的行業(yè)垂直大模型。這一思路能降低企業(yè)使用大模型的成本,政府也應(yīng)出臺相應(yīng)政策鼓勵(lì)這類行業(yè)垂直大模型的開發(fā)。
垂直大模型的發(fā)展還將推動國內(nèi)大模型行業(yè)形成新的格局。在當(dāng)天活動上,來自港澳的專家均提到對于推進(jìn)與成都在人工智能領(lǐng)域的科研和產(chǎn)業(yè)合作的期望,大模型也是雙方關(guān)注的焦點(diǎn)。
如湯志偉所說,基于超算中心的平臺優(yōu)勢,成都算力水平在全國名列前茅,而成都萬億級電子信息產(chǎn)業(yè)中,不少環(huán)節(jié)與人工智能發(fā)展緊密相關(guān),多所高校也為當(dāng)?shù)胤e累了大量電子信息領(lǐng)域的人才。更重要的一點(diǎn)是,不同于港澳金融服務(wù)業(yè)的比較優(yōu)勢,成都在發(fā)展實(shí)體經(jīng)濟(jì)上明顯更勝一籌,雙方合作可以推動大模型的快速發(fā)展。
但同時(shí),大模型發(fā)展也面臨多重掣肘。
無論是通用大模型還是垂直大模型,都需要強(qiáng)大算力支撐。而湯志偉提到,尤其是我國芯片面臨“卡脖子”以后,算力資源的獲得難度進(jìn)一步增大。目前,國內(nèi)已經(jīng)有公司進(jìn)行科技攻關(guān)和市場轉(zhuǎn)化,提升算力供給能力,但一來其與國外相比差距仍然不小,二來也需要進(jìn)一步提升芯片性能、降低價(jià)格,讓更多實(shí)體經(jīng)濟(jì)企業(yè)“用得起、用得上”。
而在聚焦解決芯片“卡脖子”問題的基礎(chǔ)上,他還提醒,要注意整個(gè)生態(tài)的完善。
“計(jì)算芯片不是孤立的,與之相關(guān)的還有相應(yīng)的軟硬件驅(qū)動、軟件開發(fā)框架、操作系統(tǒng)、數(shù)據(jù)庫、硬件環(huán)境等關(guān)鍵技術(shù)。”他指出,目前,我國對各環(huán)節(jié)的突破并不同步,部分器件不匹配當(dāng)下所需,而各環(huán)節(jié)之間也存在不匹配的問題。因此,即便相關(guān)芯片單看性能或許已經(jīng)接近甚至達(dá)到國際一流水平,但生態(tài)缺失導(dǎo)致整體效應(yīng)和系統(tǒng)效應(yīng)不足,很多環(huán)節(jié)還是以進(jìn)口為主。
這還可能造成一種“惡性循環(huán)”。如湯志偉分析,通過數(shù)十年的使用,這些主要依賴進(jìn)口的環(huán)節(jié)得以創(chuàng)新迭代并實(shí)現(xiàn)發(fā)展,相比之下,國產(chǎn)化環(huán)節(jié)則剛起步,同樣需要經(jīng)歷創(chuàng)新迭代的過程。我們在環(huán)境“倒逼”下可能縮短周期,但無論如何要“先用起來”。
總而言之,軟硬件驅(qū)動、軟件開發(fā)框架、操作系統(tǒng)、數(shù)據(jù)庫和其他硬件環(huán)節(jié)的突破也應(yīng)同步推進(jìn)。而若放在信創(chuàng)產(chǎn)業(yè)下來講,同樣需要一種整體性的思路,“現(xiàn)在是部分局部問題解決了,但只有整體問題解決了,才能算是真正解決問題。”
而當(dāng)談及國產(chǎn)大模型的迭代時(shí),湯志偉還提到數(shù)據(jù)方面的難點(diǎn)。他指出,大量高質(zhì)量訓(xùn)練數(shù)據(jù)是提升大模型準(zhǔn)確性和廣泛適用性的關(guān)鍵因素。我們在準(zhǔn)備高質(zhì)量數(shù)據(jù)的時(shí)候,既要保證數(shù)據(jù)本身的準(zhǔn)確性,還要考慮數(shù)據(jù)的多樣性和代表性。這樣才能更好地消除大模型普遍存在的偏見問題。
在國家“數(shù)據(jù)二十條”基礎(chǔ)上,2024年1月,國家數(shù)據(jù)局出臺的《“數(shù)據(jù)要素×”三年行動計(jì)劃(2024—2026年)》明確提出了數(shù)據(jù)要素的放大、疊加、倍增作用,以及帶動數(shù)據(jù)要素高質(zhì)量供給、合規(guī)高效流通,這為各行各業(yè)的發(fā)展提供了堅(jiān)實(shí)的數(shù)據(jù)政策支持。湯志偉認(rèn)為,這對于我國數(shù)據(jù)規(guī)模和質(zhì)量的提升均將起到重要作用,也將是推動大模型快速發(fā)展的又一關(guān)鍵利好。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP