每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

百度文心一言發(fā)來測試邀請發(fā)方言語音、秒畫大熊貓生成式AI時代啟幕

每日經(jīng)濟新聞 2023-03-16 22:43:04

每經(jīng)編輯蒙錦濤

CFF20LXzkOybgpnFhF8I58ibUFNXIEAic4gaGDpBykekJ22na65Ma0QcEQSiaPte9SdJFfa0plmJvZnicJcOibiaib6xA.png

一闕《青玉案·元夕》，辛棄疾用時間制造了順理成章的浪漫。八百多年后，由詞化名的科技公司百度，用大語言模型開啟了“生成式AI”時代。通過文心一言，“眾里尋他”只需要幾秒鐘的時間。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARorOiaUTFvmlCWsk1PMUdiatg6YUTfRDUianRvQJdwT867XFUzRTnGYibKkTw.png

3月16日，百度召開新聞發(fā)布會。從百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏現(xiàn)場演示的demo效果上看，文心一言具備文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算等大語言模型較常見的優(yōu)勢和能力，還在中文理解、多模態(tài)生成能力上更具特色。

不過，文心一言、ChatGPT背后的技術(shù)邏輯，與通過海量無標(biāo)注數(shù)據(jù)訓(xùn)練的大模型之間差異鮮明，即需要人的參與。整體而言，這類大語言模型還未到發(fā)展完善的階段，部分場景足夠驚艷，但一些場景下也有bug出現(xiàn)，存在很大進步空間。

人類向往科技，是期待它更好地理解人類意圖，生成符合人類價值觀、表達習(xí)慣的回復(fù)。這一點上，唯有真實的體驗才能帶給用戶驚喜。從技術(shù)發(fā)展趨勢上，大語言模型和生成式AI成為新的技術(shù)范式已毋庸置疑，百度方面透露，已有超650家合作伙伴宣布加入生態(tài)，如李彥宏所說，AI的長期價值，對千行百業(yè)的顛覆性改變，才剛剛開始。

“十年分娩，一朝懷胎”

今起開放首批測試

ChatGPT出現(xiàn)后，一向走在創(chuàng)新路上的百度立刻官宣了對標(biāo)產(chǎn)品文心一言?？此仆蝗?，但李彥宏介紹，百度在過去十幾年間一直在AI研發(fā)上持續(xù)投入，文心大模型的第一個版本在2019年就發(fā)布了，此后每一年都要發(fā)布一個新的版本。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARor17cqj72DavJ4LW6yc0Q4fiavgiczzgO2M25xMHVTkySdviaw6ruiadRb1w.png

最新的版本在新聞發(fā)布會現(xiàn)場亮相，李彥宏與文心一言在5個場景展開了問答互動。

在文學(xué)創(chuàng)作場景中，文心一言根據(jù)對話問題將知名科幻小說《三體》的核心內(nèi)容進行了總結(jié)，并提出了五個續(xù)寫《三體》的建議角度，體現(xiàn)出對話問答、總結(jié)分析、內(nèi)容創(chuàng)作生成的綜合能力。面對《三體》電視劇演員于和偉和張魯一“有哪些共同點”“誰更高”這類問題，文心一言也基于推理能力得出了準(zhǔn)確答案。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARorADjDibL2RWbUIXpIsBVYS578VH8t21o52tsR6yFJkw0WqmVZuO9OpGg.png

除了文學(xué)創(chuàng)作，商業(yè)文案也是用戶使用較為廣泛的場景。在這一創(chuàng)作場景中，李彥宏對文心一言下達了“如果要成立一個用大模型服務(wù)中小企業(yè)數(shù)字化升級的科技服務(wù)公司，可以起個什么公司名”“數(shù)智云圖這個名稱不錯，給我起一個公司的服務(wù)Slogan，表達共贏的概念”“幫我生成一篇公司成立的新聞稿，數(shù)智云圖以共贏的服務(wù)理念用大模型服務(wù)中小企業(yè)數(shù)字化升級，字?jǐn)?shù)600字”等指令。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARordvxd8n88XFk6rOKIR7aHjIcLDzXrQXC2Bj7f4Iog7ys6Ndm8jOL0KQ.png

搜索業(yè)務(wù)的基因是文心一言的基石。

李彥宏介紹，文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)，數(shù)十億搜索數(shù)據(jù)和圖片數(shù)據(jù)，百億級語音日均調(diào)用數(shù)據(jù)，及5500億事實的知識圖譜，是數(shù)據(jù)規(guī)模發(fā)生的“智能涌現(xiàn)”。而在百度搜索中，問答和生成類的搜索請求占比極高，因此文心一言在自然語言問答和創(chuàng)意內(nèi)容的生成上有相對突出的表現(xiàn)。

值得關(guān)注的是，過去的幾個月，讓AI自行展開創(chuàng)作，“一本正經(jīng)地胡說八道”是用戶最頭疼的問題。在這方面，文心一言表現(xiàn)如何？根據(jù)李彥宏的介紹，為減少錯誤率，百度對文心一言做了知識增強和檢索增強，大幅度提升了事實性問題的準(zhǔn)確率。

此外，李彥宏介紹，文心一言具備一定的思維能力，能夠?qū)W會數(shù)學(xué)推演及邏輯推理等相對復(fù)雜任務(wù)。面對“雞兔同籠”這類鍛煉人類邏輯思維的經(jīng)典題，文心一言能理解題意，并有正確的解題思路，進而像學(xué)生做題一樣，按正確的步驟，一步步算出正確答案。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARor4czjEWAicTENl64Phqco54ZQGEGGA7vXUiaPaKmYhHI98vHKbojPyCPw.png

不過，李彥宏也直言，現(xiàn)階段文心一言的準(zhǔn)確率還不是100%，需要更多的時間學(xué)習(xí)和成長。

發(fā)布產(chǎn)品細則的同時，百度也公布了文心一言的邀請測試方案：3月16日起首批用戶即可通過邀請測試碼，在文心一言官網(wǎng)嘗鮮。企業(yè)方面，百度智能云企業(yè)客戶也可開始預(yù)約申請加入文心一言云服務(wù)測試。

根植本土文化

支持多模態(tài)拓展

文學(xué)創(chuàng)作、商業(yè)文案寫作、數(shù)理邏輯推算是大語言模型相對常見的優(yōu)勢和能力。被李彥宏稱為“十年分娩，一朝懷胎”的文心一言，還有哪些特殊之處？

首先，作為扎根于中國市場的大語言模型，文心一言具備中文領(lǐng)域極先進的自然語言處理能力，在中文語言和中國文化上有較好的表現(xiàn)。

為展示文心一言的中文表達能力，李彥宏現(xiàn)場就“洛陽紙貴”的典故輸入了以下問題：洛陽紙貴是什么意思？當(dāng)時洛陽的紙到底有多貴？這個成語在現(xiàn)在的經(jīng)濟學(xué)原理里，對應(yīng)的理論是什么？用洛陽紙貴四個字寫一首藏頭詩。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARorSicCI2UCWLjCkUBWnRWeBrp8jjIdCtKGSxA8SGHTJ00c7DmtEHuB9YQ.png

文心一言所作藏頭詩如下：“洛陽城里春光好，陽艷無雙不負賞。紙貴漫天詩詞賦，貴比黃金樂未央?！毙懔艘徊ㄖ形膬?yōu)勢后，李彥宏也直截了當(dāng)?shù)乇硎荆壳拔男囊谎詫τ⑽恼Z種、代碼場景的訓(xùn)練還不夠多，表現(xiàn)還不夠好，未來會加緊訓(xùn)練，完善上述能力。

值得一提的是，對于生成式AI，用戶還有一個期待，即多模態(tài)生成。李彥宏也強調(diào)，多模態(tài)是生成式AI一個明確的發(fā)展趨勢。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARorxHmFThjVO7wt9uFbtcwFaTDP5czeX3RRJnfh930b0WyC5Aibl3FU0Ag.png

從現(xiàn)場展示來看，文心一言具備生成文本、圖片、音頻和視頻的能力。

CFF20LXzkOxxXJnaczCSBDJ6v5q1ARor18trr5ia4dvEsfY1bmaVdq4nodeQMa5uOerymhUUjibuOIyYV2dYBnGg.png

有趣的是，文心一言還能生成四川話等方言語音。據(jù)李彥宏透露，每日有幾萬篇文章正通過該能力轉(zhuǎn)成視頻內(nèi)容并在百度分發(fā)。不過，受成本限制，現(xiàn)階段視頻生成功能還未對全部用戶開放。在李彥宏的設(shè)想里，通過定向微調(diào)，文心一言將在百度內(nèi)外部各類產(chǎn)品上逐步展示出親和力，拉近產(chǎn)品和用戶的距離。

回應(yīng)市場需求

在反饋中迭代進步

從宣布存在到此次上線，百度用了一個月時間。

最近一段時間，李彥宏接到最多的提問是：“你們真的ready了嗎？”對此，李彥宏直言：“也不能說完全ready了，畢竟文心一言對標(biāo)的是ChatGPT甚至是CGT-4，門檻還是很高的。無論哪家公司，都不可能靠突擊幾個月就做出這樣的大語言模型。深度學(xué)習(xí)、自然語言處理，需要多年的堅持和積累，沒法速成?！?/span>

截至目前，盡管官宣推進此類產(chǎn)品的企業(yè)不少，但在國內(nèi)，百度是第一個“吃螃蟹的人”。從內(nèi)在因素上看，文心一言是百度過去多年努力成果的延續(xù)。自從進入人工智能時代，IT技術(shù)的技術(shù)棧發(fā)生了根本性變化，從過去三層到“芯片－框架－模型－應(yīng)用”四層，百度是為數(shù)不多、在四層進行全棧布局的人工智能公司。

而文心一言，就是百度在ERNIE及PLATO系列模型的基礎(chǔ)上所研發(fā)，其關(guān)鍵技術(shù)包括監(jiān)督精調(diào)、人類反饋的強化學(xué)習(xí)、提示、知識增強、檢索增強和對話增強。其中前三項為大語言模型普遍采用技術(shù)，后三項則是百度已有技術(shù)優(yōu)勢的再創(chuàng)新。

萬眾矚目下交出成品，百度也沒有避諱問題。在應(yīng)對媒體采訪時，李彥宏多次提到，自己在測試的過程中感覺到，（文心一言）還有很多不完美的地方。選擇在此時推出，是因為市場有龐大的需求。

“百度的很多產(chǎn)品，從搜索到智能云、自動駕駛，再到小度，都是在市場需求下誕生的。從我們承認(rèn)文心一言的存在到今日上線，一個月的時間里已有超過650家合作伙伴宣布加入文心一言生態(tài)，大家都希望能早一點用上先進的大語言模型?！?/span>

在李彥宏看來，上線意味著大量的用戶反饋，將加速文心一言的迭代速度，通過真實、及時的反饋倒逼大模型、深度學(xué)習(xí)框架和芯片的優(yōu)化，給用戶“士別三日，當(dāng)刮目相看”的驚喜。

綜合文心一言的整體表現(xiàn)，從某種程度上看它確實具有對人類意圖的理解能力，回答的準(zhǔn)確性、邏輯性、流暢性，都逐漸接近人類水平。但文心一言與ChatGPT背后，實際都是SFT（模型微調(diào)）、RLHF（強化學(xué)習(xí)）、Prompt（真實的用戶指令）等技術(shù)邏輯，這些方法與通過海量無標(biāo)注數(shù)據(jù)訓(xùn)練的大模型有明顯差距，需要人的參與。

目前來看，這類大語言模型還未到發(fā)展完善的階段，部分場景足夠驚艷，但一些場景下也還有bug，存在很大的進步空間。人類向往科技，是期待它能更好地理解人類意圖，生成符合人類價值觀、表達習(xí)慣的回復(fù)。這一點上，唯有真實的體驗才能帶給用戶驚喜。

編輯|蒙錦濤

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

CFF20LXzkOyuoQNVLRGWjVfciaeNyib50W3Y9TDLicWBibJKOzIkD8GjeQ1UXS4mD9ONYY5AAMMOvRlWic9Oh3K3Lrw.jpg

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

21歲“網(wǎng)紅”莊慕卿意外身亡，事故認(rèn)定公布

返回每經(jīng)網(wǎng)首頁

下一篇文章

中寶新材集團有限公司向港交所提交上市申請

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费