每日經(jīng)濟(jì)新聞 2025-03-08 10:24:07
2025年年初,科技圈因DeepSeek的發(fā)布而沸騰,但瑞萊智慧(RealAI)合伙人、高級副總裁朱萌從安全角度提供了另一視角。朱萌指出,AI技術(shù)的快速發(fā)展帶來了新型威脅,如深度偽造、越獄攻擊等,傳統(tǒng)防御體系難以應(yīng)對。她強(qiáng)調(diào),AI安全不是附屬品,而是產(chǎn)業(yè)的“基座”。
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
頂級賽車比賽中,速度與激情令人血脈僨張,但真正的勝負(fù)往往不在于直道狂飆,而在于每一個精準(zhǔn)拿捏的剎車點(diǎn),一輛沒有強(qiáng)大剎車系統(tǒng)的賽車,無論動力多么澎湃,都只是一場失控的冒險。
人工智能也是如此,有人追求更強(qiáng)的算力,有人押注更大的參數(shù)規(guī)模,有人則選擇做技術(shù)狂奔中的“安全派”。
從網(wǎng)絡(luò)安全到AI(人工智能)安全,朱萌深耕安全領(lǐng)域多年,作為瑞萊智慧(RealAI)合伙人、高級副總裁,在行業(yè)競爭日趨激烈、技術(shù)變革不斷加速的今天,她和團(tuán)隊正在做一件“難而正確的事”——讓人工智能變得更安全、更可靠、更可控。
朱萌坦言,當(dāng)前大模型的競爭,已經(jīng)從單純的技術(shù)突破進(jìn)入到商業(yè)化落地的關(guān)鍵階段,而安全性正成為決定成敗的“隱形門檻”,AI安全不是附屬品,而是產(chǎn)業(yè)的“基座”。
面對AI技術(shù)的爆炸式增長,行業(yè)正在經(jīng)歷一場從“無安全”到“有安全”、從“被動防御”到“主動對抗”的深刻變革。在這場變革中,朱萌希望自己成為人工智能時代的“守護(hù)者”,為AI的未來撐起一張安全的保護(hù)網(wǎng)。
朱萌認(rèn)為,技術(shù)攻擊與安全防護(hù)相當(dāng)于AI時代的“貓鼠游戲”,“魔高一尺”就需要“道高一丈”,需要持續(xù)對抗博弈。
當(dāng)前,AI安全行業(yè)正站在變革關(guān)口。以往依靠規(guī)則驅(qū)動的傳統(tǒng)安全防御體系,正在面對大模型時代的新型威脅——深度偽造、越獄攻擊、數(shù)據(jù)投毒等新型技術(shù)倒逼防御系統(tǒng)持續(xù)開展攻防對抗和迭代升級。
“大模型時代面臨越來越多的新型安全風(fēng)險挑戰(zhàn),AI安全領(lǐng)域也正經(jīng)歷從被動防御到主動防御的范式轉(zhuǎn)換。”朱萌如此形容當(dāng)下的行業(yè)變局。過去,安全系統(tǒng)依賴的是事后處置的模式;但如今,智能化、動態(tài)應(yīng)對成為迫在眉睫的需求。事實(shí)上,在AI安全領(lǐng)域,攻與防的較量從未停歇,每一次技術(shù)的突破,都會帶來新的對抗升級。
朱萌開門見山地指出,現(xiàn)階段,以深度學(xué)習(xí)為主要技術(shù)、以數(shù)據(jù)驅(qū)動為主要模式的人工智能技術(shù),在決策邏輯和鏈路上存在天然不確定性。
例如,“誘導(dǎo)攻擊”能夠利用大語言模型的漏洞,繞過大語言模型的基礎(chǔ)防護(hù)機(jī)制,引導(dǎo)其生成包含敏感數(shù)據(jù)泄露、非法操作指引等高危內(nèi)容。在金融和醫(yī)療系統(tǒng)中,這類漏洞可能導(dǎo)致隱私泄露甚至關(guān)鍵決策被操控。
與此同時,大模型的“幻覺”問題也構(gòu)成了新的安全隱患。在大模型領(lǐng)域,在自然魯棒性(Robustness,指系統(tǒng)、算法或模型在面對不確定性、變化或干擾時,能夠保持其功能和性能穩(wěn)定的能力)下,容易出現(xiàn)事實(shí)不符、邏輯錯誤、答非所問等問題。另一方面,在外部攻擊下,大模型面對對抗樣本、誘導(dǎo)越獄、數(shù)據(jù)投毒等新型攻擊手段時表現(xiàn)脆弱,安全框架被突破后造成不良信息輸出、錯誤信息輸出等風(fēng)險。
在大模型的競速場上,安全性或許正成為決定最終勝負(fù)的籌碼之一,朱萌試圖和RealAI一起成為這場博弈中的“守門人”。
2025年年初,DeepSeek引爆科技圈。熱潮中,朱萌提供了另一個視角。在測試中,RealAI發(fā)現(xiàn):DeepSeek R1在回復(fù)相關(guān)性、拒答率上表現(xiàn)優(yōu)異,但在模型安全性上卻呈現(xiàn)出兩極分化的表現(xiàn)。
朱萌介紹,在中文語境安全數(shù)據(jù)集的測試中,DeepSeek的回答均能夠生成合理且正向的響應(yīng)內(nèi)容,模型安全度高達(dá)100%,證明其基礎(chǔ)安全框架已具備基本的安全防護(hù)能力和實(shí)用價值。但在面對越獄攻擊的1553條測試用例時,DeepSeek的模型安全得分率為77.4%,有350條為不安全回復(fù),占比22.6%。
“DeepSeek不安全的本質(zhì)原因在于太‘善良’。”朱萌認(rèn)為,DeepSeek本身已經(jīng)有著良好的安全性分析能力,但是其傾向于滿足用戶需求,協(xié)助用戶完成任務(wù),因此可能會輸出少量有害內(nèi)容。“在82.3%的不安全回復(fù)案例中,模型在思考過程中已經(jīng)識別出用戶的誘導(dǎo)性輸入,但最終仍選擇順從指令。”
基于這一發(fā)現(xiàn)和DeepSeek優(yōu)化,RealAI團(tuán)隊發(fā)布的大模型RealSafe-R1改造了DeepSeek R1的思維鏈處理方式,使其在識別到潛在風(fēng)險時,不再單純地“服從”,而是能夠在推理過程中調(diào)整決策,確保生成結(jié)果的安全性。
從商業(yè)世界的運(yùn)行邏輯來說,技術(shù)對抗的升級,意味著AI安全領(lǐng)域同時存在著挑戰(zhàn)與機(jī)遇。
在技術(shù)路徑上,RealAI始終選擇了一個“更強(qiáng)調(diào)安全與可靠性”的路徑。
朱萌表示,當(dāng)前主流的深度學(xué)習(xí)模式,在可解釋性、魯棒性和對抗攻擊防御能力上仍存在短板。因此,RealAI的解決方案是“知識與數(shù)據(jù)雙輪驅(qū)動”,即結(jié)合貝葉斯深度學(xué)習(xí),使AI在復(fù)雜決策環(huán)境中具備更高的可靠性。
朱萌認(rèn)為,對于AI安全公司而言,新型安全威脅,如深度偽造、誘導(dǎo)攻擊以及數(shù)據(jù)投毒等正在日益增多,這些都倒逼防御系統(tǒng)與時俱進(jìn),進(jìn)行持續(xù)的攻防對抗與技術(shù)迭代。其次,數(shù)據(jù)安全問題形勢愈加嚴(yán)峻。大模型的訓(xùn)練依賴海量的多模態(tài)數(shù)據(jù),生物特征等敏感信息的濫用風(fēng)險日益加大,這要求在高效利用與合規(guī)管控之間找到一個微妙的平衡點(diǎn)。
更深層次的問題是,傳統(tǒng)安全防御體系本質(zhì)上是“事后補(bǔ)救”式地被動響應(yīng)攻擊,而在AI時代,攻擊發(fā)生的時間窗口極短,對算法與算力的協(xié)同提出了更高的要求。
挑戰(zhàn)背后,隱藏著巨大的機(jī)遇。
AI安全,也許最終會演變成AI與AI之間的對抗。隨著主動防御能力的不斷突破,大模型在多模態(tài)風(fēng)險感知、動態(tài)防御等方面展現(xiàn)出強(qiáng)大的賦能潛力。特別是在“AI對抗AI”的閉環(huán)構(gòu)建中,人工智能技術(shù)與防御系統(tǒng)的深度融合使得安防領(lǐng)域不再是單純的防護(hù)層,而是逐步向智能化方向邁進(jìn),形成了一種新型的安全生態(tài)系統(tǒng)。
產(chǎn)業(yè)化進(jìn)程并非一蹴而就,AI安全企業(yè)在商業(yè)化過程中始終面臨重重挑戰(zhàn)。許多人認(rèn)為,AI安全市場主要由監(jiān)管驅(qū)動,企業(yè)的發(fā)展路徑受制于政策紅利的時間窗口。
對此,朱萌持不同觀點(diǎn)。她認(rèn)為,政策驅(qū)動的需求往往是短期的,但AI安全的價值驗(yàn)證周期比想象中要短。不管監(jiān)管力度大小,AI安全都會成為企業(yè)剛需。
當(dāng)前,大模型競爭的焦點(diǎn)已經(jīng)從“技術(shù)驗(yàn)證”轉(zhuǎn)向“場景落地”,企業(yè)需通過垂直場景深度適配(如醫(yī)療、教育、工業(yè)質(zhì)檢)實(shí)現(xiàn)商業(yè)化閉環(huán),而非依賴通用模型泛化能力。朱萌認(rèn)為,真正的突破點(diǎn)在于能效優(yōu)化與場景滲透率,而非盲目擴(kuò)張算力。“DeepSeek的出圈說明,大模型行業(yè)正在重構(gòu)產(chǎn)業(yè)邏輯,即能效優(yōu)化將取代算力‘軍備’,場景滲透率提升將替代用戶規(guī)模擴(kuò)張。”朱萌說。
“早在2015年,就有很多人預(yù)測刷臉支付、自動駕駛、AI醫(yī)療診斷會迅速落地。但我們認(rèn)為,嚴(yán)肅、高價值場景對AI系統(tǒng)的魯棒性、安全性要求極高,如果這些問題無法解決,AI就很難真正落地。”朱萌表示,在任何一波技術(shù)熱潮中,人工智能想從技術(shù)邁向應(yīng)用,現(xiàn)實(shí)總是比預(yù)期更加嚴(yán)苛。
朱萌認(rèn)為,時至今日,現(xiàn)實(shí)依然符合自己當(dāng)初的預(yù)判,大模型在安全方面的嚴(yán)重不足,正使產(chǎn)業(yè)鏈閉環(huán)出現(xiàn)風(fēng)險“缺口”,這也成為阻礙人工智能賦能生產(chǎn)生活的最大掣肘。
技術(shù)從互聯(lián)網(wǎng)奔向人工智能,AI安全是否會像網(wǎng)絡(luò)安全一樣,形成完整的產(chǎn)業(yè)鏈和生態(tài)?
朱萌認(rèn)為答案是肯定的。在加入RealAI之前,她長期深耕網(wǎng)絡(luò)安全領(lǐng)域。她認(rèn)為,未來AI安全將形成與網(wǎng)絡(luò)安全類似的完整產(chǎn)業(yè)鏈和生態(tài)體系。
“AI安全產(chǎn)業(yè)鏈的雛形已經(jīng)顯現(xiàn)。”朱萌解釋道,當(dāng)前,“技術(shù)研發(fā)-產(chǎn)品服務(wù)-場景應(yīng)用”三大環(huán)節(jié)鏈條已經(jīng)逐步成型,覆蓋安全研究、安全治理與安全應(yīng)用等方向。與此同時,技術(shù)融合與專業(yè)化趨勢也在加速,尤其是大模型安全評估、AI偽造內(nèi)容檢測等前沿領(lǐng)域,已經(jīng)形成熱點(diǎn)需求。此外,政策引導(dǎo)和行業(yè)協(xié)作機(jī)制的完善,使得AI安全正從碎片化走向系統(tǒng)化,政府、科研機(jī)構(gòu)、企業(yè)共同推動標(biāo)準(zhǔn)化建設(shè),形成完善的AI安全生態(tài)協(xié)作機(jī)制。
與此同時,隨著人工智能成為發(fā)展新質(zhì)生產(chǎn)力的重要引擎,展現(xiàn)出賦能千行百業(yè)的強(qiáng)勁勢能,對安全的要求也水漲船高。隨著技術(shù)不斷滲透,AI安全的應(yīng)用范圍將進(jìn)一步拓展,自動駕駛、醫(yī)療診斷等新興領(lǐng)域的復(fù)雜性和風(fēng)險也對安全技術(shù)提出更高要求,“這正是我們要做的難而正確的事,需要持之以恒地攻堅和探索”。
從更宏觀的角度看,隨著AI產(chǎn)業(yè)未來發(fā)展路徑的逐漸清晰,AI安全也將成為所有大模型企業(yè)的“必選項”。
“需要強(qiáng)調(diào)的是,安全可控能力是技術(shù)廣泛應(yīng)用的前提、關(guān)鍵和挑戰(zhàn)。”朱萌認(rèn)為,更強(qiáng)大的生成能力和更安全可控的發(fā)展并非對立,它們相輔相成、互為支撐。
她進(jìn)一步剖析道,生成式人工智能技術(shù)仍未徹底解決第二代人工智能的固有安全問題,決策鏈路的不確定性、可解釋性弱、魯棒性低等難題依舊存在。而在應(yīng)用層面,AI規(guī)?;涞?,尤其是在涉及國計民生的重要領(lǐng)域,安全保障能力更是不可或缺。換句話說,安全可控能力不僅是技術(shù)突破的核心挑戰(zhàn),也是其廣泛應(yīng)用的前提條件。
人工智能的技術(shù)探索是一場曠日持久的掘金,朱萌希望自己在這條路上的角色是一個“守護(hù)者”。她坦言,自己的職業(yè)生涯都與安全行業(yè)相關(guān),從網(wǎng)絡(luò)安全到AI安全,雖然技術(shù)不斷變化,但安全對發(fā)展的重要意義始終如一。
Facebook(臉書)前女高管謝麗爾·桑德伯格在《向前一步》中提到,有能力的人因自我懷疑而苦惱,無論男女都容易出現(xiàn)這樣的癥狀,但女性會更嚴(yán)重,也會更多地受其限制。
回望職業(yè)生涯,朱萌也曾像許多女性一樣,因“能力不足”的自我懷疑而猶豫不前。“我在很長的時間內(nèi)都懷疑自己能力不足,但隨著年齡的增長和工作經(jīng)驗(yàn)的豐富,我逐漸認(rèn)識到,完成比完美更重要,全力以赴的努力往往會帶來意想不到的美好結(jié)果。”她認(rèn)為,唯一值得懼怕的是恐懼本身,因?yàn)榭謶?,才會反?fù)內(nèi)耗,錯失很多機(jī)會和成長的可能。所以,一旦突破了這種心理障礙,就會發(fā)現(xiàn),擺在面前的永遠(yuǎn)都是解決問題的辦法,而不是問題本身。
朱萌對AI行業(yè)的年輕從業(yè)者,尤其是女性科技人才充滿信心。“這個行業(yè)對人的要求非常高,女性群體所展現(xiàn)的洞察力、統(tǒng)籌力、學(xué)習(xí)力和堅韌性等特質(zhì),能夠很好地適應(yīng)和滿足行業(yè)發(fā)展需求。”她認(rèn)為,人工智能行業(yè)的發(fā)展和變化速度極快,算法與模型都在飛速演進(jìn),甚至是以周或者日為單位在變化。“AI真正發(fā)揮價值,需要融入各行各業(yè)的場景中去,這就要求我們不僅是AI專家,更應(yīng)該是懂行業(yè)的AI專家。”朱萌說。
封面圖片來源:公司提供
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP