每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

瑞萊智慧合伙人朱萌：在技術(shù)狂奔中做“安全派”

每日經(jīng)濟(jì)新聞 2025-03-08 10:24:07

2025年年初，科技圈因DeepSeek的發(fā)布而沸騰，但瑞萊智慧（RealAI）合伙人、高級副總裁朱萌從安全角度提供了另一視角。朱萌指出，AI技術(shù)的快速發(fā)展帶來了新型威脅，如深度偽造、越獄攻擊等，傳統(tǒng)防御體系難以應(yīng)對。她強(qiáng)調(diào)，AI安全不是附屬品，而是產(chǎn)業(yè)的“基座”。

每經(jīng)記者可楊每經(jīng)編輯張海妮

頂級賽車比賽中，速度與激情令人血脈僨張，但真正的勝負(fù)往往不在于直道狂飆，而在于每一個精準(zhǔn)拿捏的剎車點(diǎn)，一輛沒有強(qiáng)大剎車系統(tǒng)的賽車，無論動力多么澎湃，都只是一場失控的冒險。

人工智能也是如此，有人追求更強(qiáng)的算力，有人押注更大的參數(shù)規(guī)模，有人則選擇做技術(shù)狂奔中的“安全派”。

從網(wǎng)絡(luò)安全到AI（人工智能）安全，朱萌深耕安全領(lǐng)域多年，作為瑞萊智慧（RealAI）合伙人、高級副總裁，在行業(yè)競爭日趨激烈、技術(shù)變革不斷加速的今天，她和團(tuán)隊正在做一件“難而正確的事”——讓人工智能變得更安全、更可靠、更可控。

朱萌坦言，當(dāng)前大模型的競爭，已經(jīng)從單純的技術(shù)突破進(jìn)入到商業(yè)化落地的關(guān)鍵階段，而安全性正成為決定成敗的“隱形門檻”，AI安全不是附屬品，而是產(chǎn)業(yè)的“基座”。

面對AI技術(shù)的爆炸式增長，行業(yè)正在經(jīng)歷一場從“無安全”到“有安全”、從“被動防御”到“主動對抗”的深刻變革。在這場變革中，朱萌希望自己成為人工智能時代的“守護(hù)者”，為AI的未來撐起一張安全的保護(hù)網(wǎng)。

AI安全的“貓鼠游戲”

朱萌認(rèn)為，技術(shù)攻擊與安全防護(hù)相當(dāng)于AI時代的“貓鼠游戲”，“魔高一尺”就需要“道高一丈”，需要持續(xù)對抗博弈。

當(dāng)前，AI安全行業(yè)正站在變革關(guān)口。以往依靠規(guī)則驅(qū)動的傳統(tǒng)安全防御體系，正在面對大模型時代的新型威脅——深度偽造、越獄攻擊、數(shù)據(jù)投毒等新型技術(shù)倒逼防御系統(tǒng)持續(xù)開展攻防對抗和迭代升級。

“大模型時代面臨越來越多的新型安全風(fēng)險挑戰(zhàn)，AI安全領(lǐng)域也正經(jīng)歷從被動防御到主動防御的范式轉(zhuǎn)換。”朱萌如此形容當(dāng)下的行業(yè)變局。過去，安全系統(tǒng)依賴的是事后處置的模式；但如今，智能化、動態(tài)應(yīng)對成為迫在眉睫的需求。事實(shí)上，在AI安全領(lǐng)域，攻與防的較量從未停歇，每一次技術(shù)的突破，都會帶來新的對抗升級。

朱萌開門見山地指出，現(xiàn)階段，以深度學(xué)習(xí)為主要技術(shù)、以數(shù)據(jù)驅(qū)動為主要模式的人工智能技術(shù)，在決策邏輯和鏈路上存在天然不確定性。

例如，“誘導(dǎo)攻擊”能夠利用大語言模型的漏洞，繞過大語言模型的基礎(chǔ)防護(hù)機(jī)制，引導(dǎo)其生成包含敏感數(shù)據(jù)泄露、非法操作指引等高危內(nèi)容。在金融和醫(yī)療系統(tǒng)中，這類漏洞可能導(dǎo)致隱私泄露甚至關(guān)鍵決策被操控。

與此同時，大模型的“幻覺”問題也構(gòu)成了新的安全隱患。在大模型領(lǐng)域，在自然魯棒性（Robustness，指系統(tǒng)、算法或模型在面對不確定性、變化或干擾時，能夠保持其功能和性能穩(wěn)定的能力）下，容易出現(xiàn)事實(shí)不符、邏輯錯誤、答非所問等問題。另一方面，在外部攻擊下，大模型面對對抗樣本、誘導(dǎo)越獄、數(shù)據(jù)投毒等新型攻擊手段時表現(xiàn)脆弱，安全框架被突破后造成不良信息輸出、錯誤信息輸出等風(fēng)險。

在大模型的競速場上，安全性或許正成為決定最終勝負(fù)的籌碼之一，朱萌試圖和RealAI一起成為這場博弈中的“守門人”。

2025年年初，DeepSeek引爆科技圈。熱潮中，朱萌提供了另一個視角。在測試中，RealAI發(fā)現(xiàn)：DeepSeek R1在回復(fù)相關(guān)性、拒答率上表現(xiàn)優(yōu)異，但在模型安全性上卻呈現(xiàn)出兩極分化的表現(xiàn)。

朱萌介紹，在中文語境安全數(shù)據(jù)集的測試中，DeepSeek的回答均能夠生成合理且正向的響應(yīng)內(nèi)容，模型安全度高達(dá)100%，證明其基礎(chǔ)安全框架已具備基本的安全防護(hù)能力和實(shí)用價值。但在面對越獄攻擊的1553條測試用例時，DeepSeek的模型安全得分率為77.4%，有350條為不安全回復(fù)，占比22.6%。

“DeepSeek不安全的本質(zhì)原因在于太‘善良’。”朱萌認(rèn)為，DeepSeek本身已經(jīng)有著良好的安全性分析能力，但是其傾向于滿足用戶需求，協(xié)助用戶完成任務(wù)，因此可能會輸出少量有害內(nèi)容。“在82.3%的不安全回復(fù)案例中，模型在思考過程中已經(jīng)識別出用戶的誘導(dǎo)性輸入，但最終仍選擇順從指令。”

基于這一發(fā)現(xiàn)和DeepSeek優(yōu)化，RealAI團(tuán)隊發(fā)布的大模型RealSafe-R1改造了DeepSeek R1的思維鏈處理方式，使其在識別到潛在風(fēng)險時，不再單純地“服從”，而是能夠在推理過程中調(diào)整決策，確保生成結(jié)果的安全性。

防守是另一種“進(jìn)攻”

從商業(yè)世界的運(yùn)行邏輯來說，技術(shù)對抗的升級，意味著AI安全領(lǐng)域同時存在著挑戰(zhàn)與機(jī)遇。

在技術(shù)路徑上，RealAI始終選擇了一個“更強(qiáng)調(diào)安全與可靠性”的路徑。

朱萌表示，當(dāng)前主流的深度學(xué)習(xí)模式，在可解釋性、魯棒性和對抗攻擊防御能力上仍存在短板。因此，RealAI的解決方案是“知識與數(shù)據(jù)雙輪驅(qū)動”，即結(jié)合貝葉斯深度學(xué)習(xí)，使AI在復(fù)雜決策環(huán)境中具備更高的可靠性。

朱萌認(rèn)為，對于AI安全公司而言，新型安全威脅，如深度偽造、誘導(dǎo)攻擊以及數(shù)據(jù)投毒等正在日益增多，這些都倒逼防御系統(tǒng)與時俱進(jìn)，進(jìn)行持續(xù)的攻防對抗與技術(shù)迭代。其次，數(shù)據(jù)安全問題形勢愈加嚴(yán)峻。大模型的訓(xùn)練依賴海量的多模態(tài)數(shù)據(jù)，生物特征等敏感信息的濫用風(fēng)險日益加大，這要求在高效利用與合規(guī)管控之間找到一個微妙的平衡點(diǎn)。

更深層次的問題是，傳統(tǒng)安全防御體系本質(zhì)上是“事后補(bǔ)救”式地被動響應(yīng)攻擊，而在AI時代，攻擊發(fā)生的時間窗口極短，對算法與算力的協(xié)同提出了更高的要求。

挑戰(zhàn)背后，隱藏著巨大的機(jī)遇。

AI安全，也許最終會演變成AI與AI之間的對抗。隨著主動防御能力的不斷突破，大模型在多模態(tài)風(fēng)險感知、動態(tài)防御等方面展現(xiàn)出強(qiáng)大的賦能潛力。特別是在“AI對抗AI”的閉環(huán)構(gòu)建中，人工智能技術(shù)與防御系統(tǒng)的深度融合使得安防領(lǐng)域不再是單純的防護(hù)層，而是逐步向智能化方向邁進(jìn)，形成了一種新型的安全生態(tài)系統(tǒng)。

產(chǎn)業(yè)化進(jìn)程并非一蹴而就，AI安全企業(yè)在商業(yè)化過程中始終面臨重重挑戰(zhàn)。許多人認(rèn)為，AI安全市場主要由監(jiān)管驅(qū)動，企業(yè)的發(fā)展路徑受制于政策紅利的時間窗口。

對此，朱萌持不同觀點(diǎn)。她認(rèn)為，政策驅(qū)動的需求往往是短期的，但AI安全的價值驗(yàn)證周期比想象中要短。不管監(jiān)管力度大小，AI安全都會成為企業(yè)剛需。

當(dāng)前，大模型競爭的焦點(diǎn)已經(jīng)從“技術(shù)驗(yàn)證”轉(zhuǎn)向“場景落地”，企業(yè)需通過垂直場景深度適配（如醫(yī)療、教育、工業(yè)質(zhì)檢）實(shí)現(xiàn)商業(yè)化閉環(huán)，而非依賴通用模型泛化能力。朱萌認(rèn)為，真正的突破點(diǎn)在于能效優(yōu)化與場景滲透率，而非盲目擴(kuò)張算力。“DeepSeek的出圈說明，大模型行業(yè)正在重構(gòu)產(chǎn)業(yè)邏輯，即能效優(yōu)化將取代算力‘軍備’，場景滲透率提升將替代用戶規(guī)模擴(kuò)張。”朱萌說。

“早在2015年，就有很多人預(yù)測刷臉支付、自動駕駛、AI醫(yī)療診斷會迅速落地。但我們認(rèn)為，嚴(yán)肅、高價值場景對AI系統(tǒng)的魯棒性、安全性要求極高，如果這些問題無法解決，AI就很難真正落地。”朱萌表示，在任何一波技術(shù)熱潮中，人工智能想從技術(shù)邁向應(yīng)用，現(xiàn)實(shí)總是比預(yù)期更加嚴(yán)苛。

朱萌認(rèn)為，時至今日，現(xiàn)實(shí)依然符合自己當(dāng)初的預(yù)判，大模型在安全方面的嚴(yán)重不足，正使產(chǎn)業(yè)鏈閉環(huán)出現(xiàn)風(fēng)險“缺口”，這也成為阻礙人工智能賦能生產(chǎn)生活的最大掣肘。

人工智能產(chǎn)業(yè)“守護(hù)者”

技術(shù)從互聯(lián)網(wǎng)奔向人工智能，AI安全是否會像網(wǎng)絡(luò)安全一樣，形成完整的產(chǎn)業(yè)鏈和生態(tài)？

朱萌認(rèn)為答案是肯定的。在加入RealAI之前，她長期深耕網(wǎng)絡(luò)安全領(lǐng)域。她認(rèn)為，未來AI安全將形成與網(wǎng)絡(luò)安全類似的完整產(chǎn)業(yè)鏈和生態(tài)體系。

“AI安全產(chǎn)業(yè)鏈的雛形已經(jīng)顯現(xiàn)。”朱萌解釋道，當(dāng)前，“技術(shù)研發(fā)-產(chǎn)品服務(wù)-場景應(yīng)用”三大環(huán)節(jié)鏈條已經(jīng)逐步成型，覆蓋安全研究、安全治理與安全應(yīng)用等方向。與此同時，技術(shù)融合與專業(yè)化趨勢也在加速，尤其是大模型安全評估、AI偽造內(nèi)容檢測等前沿領(lǐng)域，已經(jīng)形成熱點(diǎn)需求。此外，政策引導(dǎo)和行業(yè)協(xié)作機(jī)制的完善，使得AI安全正從碎片化走向系統(tǒng)化，政府、科研機(jī)構(gòu)、企業(yè)共同推動標(biāo)準(zhǔn)化建設(shè)，形成完善的AI安全生態(tài)協(xié)作機(jī)制。

與此同時，隨著人工智能成為發(fā)展新質(zhì)生產(chǎn)力的重要引擎，展現(xiàn)出賦能千行百業(yè)的強(qiáng)勁勢能，對安全的要求也水漲船高。隨著技術(shù)不斷滲透，AI安全的應(yīng)用范圍將進(jìn)一步拓展，自動駕駛、醫(yī)療診斷等新興領(lǐng)域的復(fù)雜性和風(fēng)險也對安全技術(shù)提出更高要求，“這正是我們要做的難而正確的事，需要持之以恒地攻堅和探索”。

從更宏觀的角度看，隨著AI產(chǎn)業(yè)未來發(fā)展路徑的逐漸清晰，AI安全也將成為所有大模型企業(yè)的“必選項”。

“需要強(qiáng)調(diào)的是，安全可控能力是技術(shù)廣泛應(yīng)用的前提、關(guān)鍵和挑戰(zhàn)。”朱萌認(rèn)為，更強(qiáng)大的生成能力和更安全可控的發(fā)展并非對立，它們相輔相成、互為支撐。

她進(jìn)一步剖析道，生成式人工智能技術(shù)仍未徹底解決第二代人工智能的固有安全問題，決策鏈路的不確定性、可解釋性弱、魯棒性低等難題依舊存在。而在應(yīng)用層面，AI規(guī)?；涞?，尤其是在涉及國計民生的重要領(lǐng)域，安全保障能力更是不可或缺。換句話說，安全可控能力不僅是技術(shù)突破的核心挑戰(zhàn)，也是其廣泛應(yīng)用的前提條件。

人工智能的技術(shù)探索是一場曠日持久的掘金，朱萌希望自己在這條路上的角色是一個“守護(hù)者”。她坦言，自己的職業(yè)生涯都與安全行業(yè)相關(guān)，從網(wǎng)絡(luò)安全到AI安全，雖然技術(shù)不斷變化，但安全對發(fā)展的重要意義始終如一。

Facebook（臉書）前女高管謝麗爾·桑德伯格在《向前一步》中提到，有能力的人因自我懷疑而苦惱，無論男女都容易出現(xiàn)這樣的癥狀，但女性會更嚴(yán)重，也會更多地受其限制。

回望職業(yè)生涯，朱萌也曾像許多女性一樣，因“能力不足”的自我懷疑而猶豫不前。“我在很長的時間內(nèi)都懷疑自己能力不足，但隨著年齡的增長和工作經(jīng)驗(yàn)的豐富，我逐漸認(rèn)識到，完成比完美更重要，全力以赴的努力往往會帶來意想不到的美好結(jié)果。”她認(rèn)為，唯一值得懼怕的是恐懼本身，因?yàn)榭謶?，才會反?fù)內(nèi)耗，錯失很多機(jī)會和成長的可能。所以，一旦突破了這種心理障礙，就會發(fā)現(xiàn)，擺在面前的永遠(yuǎn)都是解決問題的辦法，而不是問題本身。

朱萌對AI行業(yè)的年輕從業(yè)者，尤其是女性科技人才充滿信心。“這個行業(yè)對人的要求非常高，女性群體所展現(xiàn)的洞察力、統(tǒng)籌力、學(xué)習(xí)力和堅韌性等特質(zhì)，能夠很好地適應(yīng)和滿足行業(yè)發(fā)展需求。”她認(rèn)為，人工智能行業(yè)的發(fā)展和變化速度極快，算法與模型都在飛速演進(jìn)，甚至是以周或者日為單位在變化。“AI真正發(fā)揮價值，需要融入各行各業(yè)的場景中去，這就要求我們不僅是AI專家，更應(yīng)該是懂行業(yè)的AI專家。”朱萌說。

封面圖片來源：公司提供

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai 模型瑞萊智慧 AI安全人工智能

上一篇文章

2024年檢察機(jī)關(guān)核準(zhǔn)追訴低齡未成年人嚴(yán)重暴力犯罪34人

返回每經(jīng)網(wǎng)首頁

下一篇文章

最高檢報告：2024年起訴破壞社會主義市場經(jīng)濟(jì)秩序犯罪13.7萬人

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟(jì)新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费