每日經(jīng)濟新聞 2022-04-28 17:20:54
◎行程碼至今已經(jīng)運行了近2年,累計查詢突破458億次,近期單日查詢量維持在3億次左右,其使用量隨著全國疫情變化波動,成為疫情防控重要工具。
◎行程碼建立的備份容災(zāi)系統(tǒng)開展了多次應(yīng)急演練,可以隨時進行主備切換。相關(guān)團隊開發(fā)了全鏈路監(jiān)控系統(tǒng),能夠監(jiān)控各環(huán)節(jié)流量變化。為應(yīng)對流量高峰,團隊建立了突發(fā)情況的限流機制,保障系統(tǒng)不中斷服務(wù)。
每經(jīng)記者 張蕊 每經(jīng)編輯 陳旭
**平臺又崩了……生活中,我們不時就會碰到這類常用APP出現(xiàn)宕機的事件。
隨著各領(lǐng)域數(shù)字化轉(zhuǎn)型推進,數(shù)字系統(tǒng)應(yīng)用范圍不斷擴大,承載業(yè)務(wù)愈發(fā)關(guān)鍵,用戶高頻訪問成為常態(tài),系統(tǒng)復(fù)雜度呈指數(shù)上升,顯著增加了穩(wěn)定性方面的風險。
2021年,谷歌、亞馬遜、微軟、特斯拉等大型企業(yè)數(shù)據(jù)系統(tǒng)均發(fā)生過宕機事件,不僅對自身造成巨大損失,也嚴重影響全球范圍用戶的正常生產(chǎn)和生活。
4月27日,由中國信息通信研究院和中國通信標準化協(xié)會指導(dǎo),中國通信標準化協(xié)會大數(shù)據(jù)技術(shù)標準推進委員會(CCSA TC601)主辦的首屆“全球數(shù)據(jù)系統(tǒng)穩(wěn)定性峰會”以線上線下結(jié)合的形式召開。
《每日經(jīng)濟新聞》記者從峰會上獲悉,大會旨在助力我國數(shù)字經(jīng)濟發(fā)展“又快又穩(wěn)”,推動全球數(shù)據(jù)系統(tǒng)穩(wěn)定性邁上新臺階。
中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏在峰會上介紹,2021年全球發(fā)生多起嚴重的信息系統(tǒng)宕機事件,其中不乏互聯(lián)網(wǎng)基礎(chǔ)設(shè)施、金融核心業(yè)務(wù)系統(tǒng)等,這些關(guān)鍵系統(tǒng)的宕機事件不僅造成大量經(jīng)濟損失,也影響了社會的平穩(wěn)運行,同時也給其他系統(tǒng)建設(shè)運營者、監(jiān)管機構(gòu)敲響警鐘,系統(tǒng)的穩(wěn)定性保障成為當前熱點問題。
事實上,在我國,保障關(guān)鍵系統(tǒng)的平穩(wěn)運行一直受到高度重視。記者注意到,《關(guān)鍵信息基礎(chǔ)設(shè)施安全保護條例》自2021年9月1日起正式實施,明確要求關(guān)鍵基礎(chǔ)設(shè)施的運營者要依照條例和有關(guān)法律法規(guī)保障關(guān)鍵信息基礎(chǔ)設(shè)施的安全穩(wěn)定運行。
隨著數(shù)字技術(shù)的更新,信息化系統(tǒng)的重要性突顯,系統(tǒng)穩(wěn)定性面臨著新的挑戰(zhàn)。
何寶宏表示,互聯(lián)網(wǎng)等數(shù)字原生企業(yè)為提升數(shù)字能力、滿足用戶需求,不斷擴大系統(tǒng)規(guī)模,引入敏捷開發(fā)流程,導(dǎo)致信息系統(tǒng)復(fù)雜性直線上升,穩(wěn)定性風險點增多。
此外,金融、電信等科技密集型行業(yè)系統(tǒng)在線化程度不斷提升,新技術(shù)不斷引入,信息系統(tǒng)功能范圍和復(fù)雜度不斷升級。而政務(wù)、能源等傳統(tǒng)行業(yè)也在政策推動下,將服務(wù)模式從原來5×8小時的線下模式升級成7×24小時的線上模式,導(dǎo)致系統(tǒng)穩(wěn)定性壓力激增。
與此同時,當前信息系統(tǒng)穩(wěn)定性保障領(lǐng)域在技術(shù)、管理等方面仍存在不足。比如技術(shù)方面,隨著新技術(shù)新架構(gòu)應(yīng)用存在異構(gòu)軟硬件兼容問題,分布式架構(gòu)普及集群規(guī)模擴大導(dǎo)致硬件故障更普遍、通信交互更不穩(wěn)定。在管理方面,由于系統(tǒng)涉及的部門機構(gòu)增多,帶來大量的溝通成本,導(dǎo)致穩(wěn)定性保障鏈路變長,跨團隊協(xié)作更加困難。
為助力我國各領(lǐng)域數(shù)據(jù)系統(tǒng)穩(wěn)定性提升,中國信通院在2020年啟動了穩(wěn)定性相關(guān)工作。以通信大數(shù)據(jù)行程卡(俗稱“行程碼”)為例,何寶宏介紹,行程碼至今已經(jīng)運行了近2年,累計查詢突破458億次,近期單日查詢量維持在3億次左右,其使用量隨著全國疫情變化波動,成為疫情防控重要工具。
防疫工作人員查驗旅客健康碼、行程碼 圖片來源:新華社
為保障大數(shù)據(jù)行程卡系統(tǒng)長期穩(wěn)定平穩(wěn)運行,相關(guān)團隊實施了很多保障穩(wěn)定性的措施。
具體而言,首先,通過優(yōu)化技術(shù)架構(gòu),對不同訪問渠道的服務(wù)資源進行隔離,將三大運營商的服務(wù)通道解耦,實現(xiàn)各渠道及各運營商之間服務(wù)互不影響。
其次,對服務(wù)器負載均衡、帶寬、數(shù)據(jù)資源等進行多次擴容,以滿足不斷增長的網(wǎng)絡(luò)請求,目前系統(tǒng)峰值容量較去年已經(jīng)提升10倍以上,并通過周期性壓測隨時確認系統(tǒng)的容量情況。
第三,行程碼建立的備份容災(zāi)系統(tǒng)開展了多次應(yīng)急演練,可以隨時進行主備切換。團隊開發(fā)了全鏈路監(jiān)控系統(tǒng),能夠監(jiān)控各環(huán)節(jié)流量變化。為應(yīng)對流量高峰,團隊建立了突發(fā)情況的限流機制,保障系統(tǒng)不中斷服務(wù)。
最后,行程卡還建立健全了運營維護的管理制度,形成了日常運維、重點保障、應(yīng)急處置三位一體的運維保障體系。
談及今后持續(xù)推動信息系統(tǒng)的穩(wěn)定性保障工作,中國工程院院士廖湘科認為,應(yīng)當從以下幾方面著手:
首先,要堅持自主創(chuàng)新,優(yōu)化合作模式。
廖湘科說,對于軟件系統(tǒng)穩(wěn)定性的相關(guān)研究歷時已久,隨著軟件技術(shù)及研發(fā)理念的深度變革,對于穩(wěn)定性工作的研究也在持續(xù)革新。當前,在引進外部創(chuàng)新理論及開源技術(shù)工作的同時,也應(yīng)當堅持自主創(chuàng)新路線,夯實自身理論基礎(chǔ),強化技術(shù)創(chuàng)新,形成自主可控的穩(wěn)定性保障技術(shù)能力。
“技術(shù)的創(chuàng)新突破不可能憑空產(chǎn)生,需要產(chǎn)學研用各方更進一步深入合作,形成可持續(xù)的密切合作模式。”廖湘科建議,由應(yīng)用方提供真實的需求和場景,以真實的系統(tǒng)穩(wěn)定性問題引導(dǎo)產(chǎn)學研產(chǎn)出可以實際落地應(yīng)用的技術(shù)和技術(shù)創(chuàng)新。
其次,要統(tǒng)一行業(yè)認知,加強服務(wù)支撐。
廖湘科表示,我國軟件技術(shù)目前在各個行業(yè)高度分散,缺乏統(tǒng)一標準和平臺,在保障信息系統(tǒng)平穩(wěn)運行時也缺乏跨行業(yè)可共享的經(jīng)驗和方法論。行業(yè)內(nèi)、行業(yè)間的認知也存在碎片化、差異化的現(xiàn)象。
“通過統(tǒng)一行業(yè)認知,形成規(guī)范化系統(tǒng)的穩(wěn)定性支持體系,系統(tǒng)保障體系和技術(shù)工具,以及共享化的系統(tǒng)監(jiān)測及運營服務(wù)平臺,有利于降低建設(shè)成本,為中小企業(yè)提供普惠支持。”
此外,還要著力人才培養(yǎng),擴大產(chǎn)業(yè)革命。“人才是可持續(xù)發(fā)展的基礎(chǔ),各層面的技術(shù)專業(yè)人才是信息系統(tǒng)穩(wěn)定性保障工作可持續(xù)發(fā)展的動力源泉。”
廖湘科說,在信息系統(tǒng)穩(wěn)定性這一領(lǐng)域,人才能力往往來自大量實踐經(jīng)驗積累,因此對人才的培養(yǎng)需要產(chǎn)業(yè)界和高校共建,把行業(yè)積累的知識和實踐案例投入到教學和實踐中,同時也需要加大對系統(tǒng)穩(wěn)定性相關(guān)產(chǎn)業(yè)的投入,通過擴大產(chǎn)業(yè)規(guī)模留住更多專業(yè)人才,甚至吸引更多人才進入這個領(lǐng)域。
對于信息系統(tǒng)的穩(wěn)定運行,中央網(wǎng)信辦信息化發(fā)展局副局長張望也提出了三點建議。
一是要注重制度建設(shè)和管理。信息系統(tǒng)運營單位應(yīng)當在充分發(fā)揮各方技術(shù)能力基礎(chǔ)上,更加注重制度建設(shè)和落實,最大限度地保障信息系統(tǒng)的平穩(wěn)運行。
二是提高技術(shù)保障能力。信息系統(tǒng)安全穩(wěn)定運行是一項復(fù)雜的技術(shù)工作,既要加強技術(shù)能力建設(shè),也要加強產(chǎn)學研用的協(xié)作,推動信息系統(tǒng)穩(wěn)定性保障的理論研究和技術(shù)實踐走向深入。
三是要加強應(yīng)急演練,提高處置能力。
“信息系統(tǒng)運行過程中難以避免出現(xiàn)突發(fā)情況,及時發(fā)現(xiàn)、及時處置,是保障系統(tǒng)長期穩(wěn)定運行的關(guān)鍵一環(huán)。”張望說,信息系統(tǒng)的運營單位應(yīng)當制定針對各類問題的應(yīng)急預(yù)案,適時開展應(yīng)急演練,在突發(fā)情況時能夠快速響應(yīng)、高效處置。
封面圖片來源:新華社
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP