每日經濟新聞 2025-01-13 20:52:02
1月13日,國家發(fā)展改革委、國家數(shù)據局、財政部、人力資源社會保障部聯(lián)合發(fā)布《關于促進數(shù)據標注產業(yè)高質量發(fā)展的實施意見》?!秾嵤┮庖姟诽岢龅?027年,數(shù)據標注產業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產業(yè)規(guī)模大幅躍升,年均復合增長率超過20%,培育一批具有影響力的科技型數(shù)據標注企業(yè)。
每經記者 周逸斐 每經編輯 陳星
1月13日,國家發(fā)展改革委、國家數(shù)據局、財政部、人力資源社會保障部聯(lián)合發(fā)布《關于促進數(shù)據標注產業(yè)高質量發(fā)展的實施意見》(以下簡稱《實施意見》)。
《實施意見》提出到2027年,數(shù)據標注產業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產業(yè)規(guī)模大幅躍升,年均復合增長率超過20%,培育一批具有影響力的科技型數(shù)據標注企業(yè),打造一批產學研用聯(lián)動的創(chuàng)新載體,建設一批成效明顯、特色鮮明的數(shù)據標注基地,形成相對完善的數(shù)據標注產業(yè)生態(tài),構建創(chuàng)新要素聚集、產業(yè)鏈上下游聯(lián)動、區(qū)域協(xié)同發(fā)展的新格局。
《實施意見》包括總體要求、主要任務、保障措施三個部分。主要任務圍繞深化需求牽引、增強創(chuàng)新驅動、繁榮產業(yè)生態(tài)、優(yōu)化產業(yè)支撐四個方面提出相關政策舉措。
賽智產業(yè)研究院副院長鄧道正接受《每日經濟新聞》記者書面采訪時表示,數(shù)據標注是人工智能大模型訓練的基礎,通過為數(shù)據添加標簽或注釋,使得大模型能夠有效學習如何識別、分類或理解信息,提升模型的理解能力。全面、準確的數(shù)據標注可以顯著提高大模型的準確性和可靠性,多樣化的標注數(shù)據則能夠顯著增強大模型在不同場景下的泛化能力。
《實施意見》提出,深化需求牽引,釋放公共數(shù)據標注需求。深化人工智能在政務服務、城市治理、鄉(xiāng)村振興等領域應用,編制公共數(shù)據標注目錄,依法依規(guī)有序推動公共數(shù)據標注與開發(fā)利用。支持公共數(shù)據賦能實體經濟發(fā)展,在現(xiàn)代農業(yè)、智能制造、信息服務等重點領域發(fā)掘公共數(shù)據標注需求。支持跨部門、跨地區(qū)、跨層級公共數(shù)據融合應用,鼓勵政府部門和企業(yè)協(xié)同開展政務大模型所需數(shù)據的標注和訓練。推動數(shù)據標注服務納入政府采購范疇。
挖掘企業(yè)數(shù)據標注需求。支持數(shù)據要素賦能產業(yè)轉型升級,深挖企業(yè)生產管理全流程數(shù)據標注需求。實施“國有企業(yè)數(shù)據效能提升行動”,加大企業(yè)數(shù)據開發(fā)利用,釋放企業(yè)數(shù)據標注需求。加強交通、醫(yī)療、金融、科學、制造、農業(yè)等重點行業(yè)領域數(shù)據標注,建設行業(yè)高質量數(shù)據集,支撐人工智能在行業(yè)領域的應用賦能。圍繞醫(yī)療健康、人力資源、數(shù)字貿易、自動駕駛、低空經濟等場景,以業(yè)務創(chuàng)新拉動數(shù)據標注需求。
鄧道正告訴記者,目前,市場上大規(guī)模的數(shù)據標注應用主要集中在自然語言處理、自動駕駛、醫(yī)學影像、智能安防、數(shù)字金融等人工智能應用較為廣泛的領域。
“如在自然語言處理領域,需要對不同語言、語法結構、意圖、情感等數(shù)據進行高質量標注,以用于訓練機器學習模型,使其能夠理解和生成人類語言,從而實現(xiàn)機器翻譯、語音識別等各種應用;在自動駕駛領域,需要對交通信號識別、車道線檢測、行人檢測等領域數(shù)據進行精準標注,以便自動駕駛汽車能夠準確理解和預測道路上的各種情況,避免交通事故。”鄧道正說。
《實施意見》還提出,健全數(shù)據標注標準。圍繞數(shù)據標注關鍵環(huán)節(jié),結合文本、圖像、視頻、語音等多模態(tài)數(shù)據標注需求,建立數(shù)據標注標準體系框架,制定數(shù)據標注技術、質量、能力等國家標準。聚焦重點行業(yè)領域,加快制定相關行業(yè)數(shù)據標注標準,促進協(xié)同創(chuàng)新。
鄧道正告訴記者,目前,數(shù)據標注行業(yè)仍面臨挑戰(zhàn),主要有數(shù)據標注標準缺乏、專業(yè)人才短缺、標注效率低及數(shù)據安全風險等方面。
數(shù)據標注標準方面,由于缺乏較為統(tǒng)一的行業(yè)標準與規(guī)范,導致在標注時因為標注員的專業(yè)水平、理解差異及疲勞作業(yè)等,使得標注結果難以保證一致性,數(shù)據質量較低,不能滿足AI企業(yè)的需求。
鄧道正認為,專業(yè)人才方面,由于數(shù)據標注行業(yè)對人才的需求量大,但符合要求的專業(yè)人才卻相對稀缺,尤其是醫(yī)療、工業(yè)、科學研究等對專業(yè)知識要求較高的領域更是人才短缺,制約了行業(yè)的健康發(fā)展。
數(shù)據安全方面,由于在數(shù)據標注過程中,會接觸到大量的敏感信息,包括用戶信息、個人偏好等,如何保護這些敏感信息的安全,也是數(shù)據標注行業(yè)面臨的一大挑戰(zhàn)。
封面圖片來源:視覺中國-VCG41N1155250438
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP