每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

“可以解決99%的使用場景！”微軟、英偉達紛紛押注小模型，大模型不香了？

每日經(jīng)濟新聞 2024-08-23 12:56:06

每經(jīng)記者文巧每經(jīng)編輯孫志成高涵

在人工智能發(fā)展的道路上，科技巨頭們曾經(jīng)競相開發(fā)規(guī)模龐大的語言模型，但如今出現(xiàn)了一種新趨勢：小型語言模型（SLM）正逐漸嶄露頭角，挑戰(zhàn)著過去“越大越好”的觀念。

當?shù)貢r間8月21日，微軟和英偉達相繼發(fā)布了最新的小型語言模型——Phi-3.5-mini-instruct和Mistral-NeMo-Minitron 8B。這兩款模型的主要賣點是它們在計算資源使用和功能表現(xiàn)之間實現(xiàn)了良好的平衡。在某些方面，它們的性能甚至可以媲美大型模型。

人工智能初創(chuàng)公司Hugging Face的首席執(zhí)行官Clem Delangue指出，高達99%的使用場景可以通過SLM來解決，并預測2024年將成為SLM之年。據(jù)不完全統(tǒng)計，包括Meta、微軟、谷歌在內(nèi)的科技巨頭們今年已經(jīng)發(fā)布了九款小型模型。

大模型訓練成本攀升 性能提升卻有限

SLM的崛起并非偶然，而是與大模型（LLM）在性能提升與資源消耗方面的挑戰(zhàn)密切相關(guān)。

AI初創(chuàng)公司Vellum和Hugging Face今年四月份發(fā)布的性能比較表明，LLM之間的性能差距正在迅速縮小，特別是在多項選擇題、推理和數(shù)學問題等特定任務中，頂級模型之間的差異極小。例如，在多項選擇題中，Claude 3 Opus、GPT-4和Gemini Ultra的得分均超過83%，而在推理任務中，Claude 3 Opus、GPT-4和Gemini 1.5 Pro的準確率均超過92%。

Uber AI 前負責人Gary Marcus指出，LLM的最新研究論文都指向同一個方向，十幾個LLM都與GPT-4在一個領域，“其中一些性能比GPT-4略好一些，但并沒有質(zhì)的飛躍。我想每個人都會說GPT-4比GPT-3.5領先了一步，但此后的一年多沒有任何質(zhì)的飛躍?！?/span>

與有限的性能提升相比，LLM的訓練成本卻在不斷攀升。訓練這些模型需要海量數(shù)據(jù)和數(shù)以億計甚至萬億個參數(shù)，導致了極高的資源消耗。訓練和運行LLM所需的計算能力和能源消耗令人咋舌，這使得小型組織或個人難以參與核心LLM開發(fā)。

國際能源署估計，數(shù)據(jù)中心、加密貨幣和人工智能相關(guān)的電力消耗到2026年，會大致相當于日本全國的用電量。

OpenAI首席執(zhí)行官Sam Altman曾在麻省理工學院的一次活動上表示，訓練GPT-4的成本至少為1億美元，而Anthropic首席執(zhí)行官Dario Amodei預測，未來訓練模型的成本可能達到1000億美元。

此外，使用LLM所需的工具和技術(shù)的復雜性也增加了開發(fā)人員的學習曲線。從訓練到部署，整個過程耗時漫長，減緩了開發(fā)速度。劍橋大學的一項研究顯示，公司可能需要90天或更長時間才能部署一個機器學習模型。

LLM的另一個重大問題是容易產(chǎn)生“幻覺”——即模型生成的輸出看似合理，但實際上并不正確。這是由于LLM的訓練方式是根據(jù)數(shù)據(jù)中的模式預測下一個最可能的單詞，而非真正理解信息。因此，LLM可能會自信地生成虛假陳述、編造事實或以荒謬的方式組合不相關(guān)的概念。如何檢測和減少這些“幻覺”是開發(fā)可靠且可信賴語言模型的持續(xù)挑戰(zhàn)。

CFF20LXzkOybcWmTAr4sRfFzWGeLsnLLdmKN0oAhDdISMEFD6Tsd8RkalckzKVuXSEaUnTBMYkmKvSE0s1Nk6A.png

圖片來源：視覺中國

擴展參數(shù)并非提高性能的唯一路徑

對LLM巨大能源需求的擔憂，以及為企業(yè)提供更多樣化AI選項的市場機會，讓科技公司將注意力逐漸轉(zhuǎn)向了SLM。

《每日經(jīng)濟新聞》記者注意到，不管是Arcee、Sakana AI和Hugging Face等AI初創(chuàng)公司，還是科技巨頭都在通過SLM和更經(jīng)濟的方式吸引投資者和客戶。

此前，谷歌、Meta、OpenAI和Anthropic都發(fā)布了比旗艦LLM更緊湊、更靈活的小型語言模型。這不僅降低了開發(fā)和部署的成本，也為商業(yè)客戶提供了更便宜的解決方案。鑒于投資者越來越擔心AI企業(yè)的高成本和不確定的回報，更多的科技公司可能會選擇這條道路。即便是微軟和英偉達，如今也先后推出了自己的小型模型（SLM）。

SLM是LLM的精簡版本，具有更少的參數(shù)和更簡單的設計，它們需要更少的數(shù)據(jù)和訓練時間——只需幾分鐘或幾小時。這使得SLM更高效，更易于在小型設備上部署。例如，它們可以嵌入到手機中，而無需占用超算資源，從而降低成本，并顯著提升響應速度。

微軟在小型模型技術(shù)報告中指出，Phi-3.5-mini-instruct是一款為手機本地部署設計的高性能語言模型。

SLM的另一個主要優(yōu)勢是其針對特定應用的專業(yè)化。SLM專注于特定任務或領域，這使它們在實際應用中更加高效。例如，在情緒分析、命名實體識別或特定領域的問答中，SLM的表現(xiàn)往往優(yōu)于通用模型。這種定制化使得企業(yè)能夠創(chuàng)建高效滿足其特定需求的模型。

SLM在特定領域內(nèi)也不易出現(xiàn)“幻覺”，因為它們通常在更窄、更有針對性的數(shù)據(jù)集上訓練，這有助于模型學習與其任務最相關(guān)的模式和信息。SLM的專注性降低了生成不相關(guān)、意外或不一致輸出的可能性。

盡管規(guī)模較小，SLM在某些方面的性能并不遜色于大模型。微軟最新推出的Phi-3.5-mini-instruct僅擁有38億個參數(shù)，但其性能優(yōu)于Llama3.18B和Mistral 7B等參數(shù)遠高于它的模型。美國東北大學語言模型研究專家Aaron Mueller指出，擴展參數(shù)數(shù)量并非提高模型性能的唯一途徑，使用更高質(zhì)量的數(shù)據(jù)訓練也可以產(chǎn)生類似效果。

OpenAI首席執(zhí)行官Sam Altman在4月的一次活動中表示，他相信當前正處于巨型模型時代的末期，“我們將通過其他方式來提升它們的表現(xiàn)。”

不過，需要注意的是，雖然 SLM 的專業(yè)化是一大優(yōu)勢，但也有局限性。這些模型可能在其特定訓練領域之外表現(xiàn)不佳，缺乏廣泛的知識庫，和 LLM相比無法生成廣泛主題的相關(guān)內(nèi)容。這一限制要求組織可能部署多個 SLM 來覆蓋不同的需求領域，這可能會使 AI 基礎設施復雜化。

隨著AI領域的快速發(fā)展，小型模型的標準可能會不斷變化。東京小型模型初創(chuàng)公司Sakana的聯(lián)合創(chuàng)始人兼首席執(zhí)行官David Ha表示，幾年前看似龐大的AI模型，現(xiàn)在看來已經(jīng)顯得“適中”?！按笮】偸窍鄬Φ?，”David Ha說道。

記者|文巧????實習記者|岳楚鵬

編輯|孫志成?高涵?杜恒峰

校對|趙慶

｜每日經(jīng)濟新聞 ?nbdnews??原創(chuàng)文章｜

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復制及鏡像等使用

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

上千萬人次卷入，涉案資金超1000億元！“巨騙”張某某，從泰國引渡回國

返回每經(jīng)網(wǎng)首頁

下一篇文章

云南境內(nèi)，一高鐵在建項目發(fā)生事故，致6人死亡

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费