每日經(jīng)濟新聞 2023-09-07 23:18:55
每經(jīng)記者 溫雅蘭 每經(jīng)編輯 張凌霄
人工智能是把雙刃劍。技術(shù)的使用在推動社會經(jīng)濟飛速發(fā)展的同時,也會帶來多重“安全隱憂”。
9月7日,在2023 Inclusion•外灘大會上,中國科學(xué)院院士何積豐以《大模型時代的安全問題》為題,與大家共同探討大模型發(fā)展所帶來的安全問題以及應(yīng)對之道。
人工智能擁有超強的自主學(xué)習(xí)能力,進化速度極快,在數(shù)次迭代升級后,是否有可能在多個方面超越人類?
何積豐提到:“人類與機器都在學(xué)習(xí)。人類指導(dǎo)機器,機器不斷學(xué)習(xí)變得更加智能;在這一過程中人類也要學(xué)習(xí)指導(dǎo)方法,使機器所生成的內(nèi)容能夠更符合人類需要。”何積豐表示,在人工智能技術(shù)發(fā)展過程中,要牢記人類的核心角色,人工智能技術(shù)將成為人類的助手,而不是替代人類創(chuàng)造未來。
談及當(dāng)前大模型帶來的安全隱患,何積豐認為,問題主要集中在隱私泄露以及對齊兩方面。
保護隱私安全至關(guān)重要
何積豐指出,隱私問題,即未經(jīng)本人同意的情況下,收集、使用和泄露個人信息,是大模型發(fā)展過程中最受關(guān)注的問題。
具體來看,他認為,隱私問題在大模型的訓(xùn)練、與用戶對話和結(jié)果生成三個階段都有所涉及。
首先,大模型與傳統(tǒng)機器學(xué)習(xí)不同,其訓(xùn)練需要大量數(shù)據(jù),在這一過程中,盡管研究人員早已采取相關(guān)措施,但是提示技術(shù)仍然使得大量用戶的個人信息和數(shù)據(jù)被大模型吸入,從而造成隱私泄露。
其次,大模型在與用戶對話過程中,可能涉及到眾多用戶私密信息,而這類信息往往沒有受到應(yīng)有的隱私保護。如在使用大模型的過程中,數(shù)據(jù)控制鍵將要求用戶選擇“結(jié)束對話”或“繼續(xù)對話并允許獲取數(shù)據(jù)”。這意味著如果選擇繼續(xù)對話,將可能造成隱私泄露;如果選擇保護隱私,將會失去使用權(quán)。
再次,大模型在產(chǎn)出結(jié)果時,其強大的生成力也讓隱私泄露的方式變得更加多元,用戶隱私獲取將更加容易,而這也將隱私保護變得更加困難。
反饋強化學(xué)習(xí)是實現(xiàn)對齊的技術(shù)途徑
而對齊問題,即引導(dǎo)智能系統(tǒng)的目標(biāo)和人類價值觀一致,使其符合設(shè)計者的利益和預(yù)期,不會產(chǎn)生意外的有害后果,是大模型發(fā)展過程中的另一大安全問題。
“如果將人工智能的能力比做《西游記》中的孫悟空,那么對齊技術(shù)就是唐僧口中的緊箍咒,它可以保證孫悟空不會隨意使用他的能力為所欲為。因此,對齊技術(shù)是控制人工智能安全的核心技術(shù)。”談及對齊技術(shù)的重要作用,何積豐拋出上述比喻。
那么,對齊問題將會帶來哪些安全挑戰(zhàn)?
何積豐表示,對齊的基礎(chǔ)是人類價值觀,而人類價值觀處于動態(tài)變化中,且具有多元化特征。這樣的特點可能導(dǎo)致對齊成為一項眼花繚亂的跨學(xué)科研究,這不僅考驗技術(shù),也審視著人類不同的文化。
此外,大模型有著“有用性”與“無害性”兩個目標(biāo)的沖突。在使用大模型的過程中,研發(fā)人員無法保證大模型是否會提供“錯誤”觀點,那么要如何糾正這類“錯誤”觀點,就是大模型發(fā)展過程中的重要挑戰(zhàn)。
對于這些問題,何積豐指出,反饋強化學(xué)習(xí)是實現(xiàn)對齊的技術(shù)途徑。
反饋技術(shù)的第一重含義,即通過反饋給模型不同的“獎勵”信號,來引導(dǎo)其高質(zhì)量的輸出。但是,每個人喜好不同,這種反饋也可能存在主觀因素,從而影響反饋的客觀性。
第二重含義,是基于給大模型提供明確的原則,使得系統(tǒng)自動訓(xùn)練模型對所有生成的輸出結(jié)果提供初始排序。這樣的反饋可以使得大模型生成效率更高,生成的內(nèi)容更加透明,每個人都可以看到系統(tǒng)受到什么樣的指令,將會生成怎樣的“答案”。
總體來看,人類與大模型都在進步,人類與機器持續(xù)共同學(xué)習(xí),將更好地使技術(shù)轉(zhuǎn)化為生產(chǎn)力,服務(wù)于經(jīng)濟社會發(fā)展。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP