人工智能正重構全球產業格局,同時也帶動一些新興產業快速發展,數據標注就是其中之一,市場已對此展現出強勁需求。
3月20日,由工業和信息化部電子第五研究所、中國移動通信集團信息技術中心、航天科工網絡信息發展有限公司聯合主辦的“2025年數據標注產業供需對接會”在四川成都召開。
供需對接會現場,12億元數據標注業務合作意向簽約。其中,由韶關市推動的戰略合作以6600萬元的簽約金額成為當天單體金額最大合作項目。
自動駕駛、醫療醫藥等行業已開始探索
所謂數據標注,是指對數據進行篩選、清洗、分類、注釋、標記和質量檢驗等加工處理的過程。國家發展改革委等部門去年底發布,明確將數據標注稱為新興產業。
“數據標注是提升數據供給質量的關鍵環節,是提升人工智能產業競爭力的先手棋。”四川省大數據中心副主任、四川省大數據標準化技術委員會主任委員周學立在對接會現場說。
工信部電子五所人工智能中心主任孔德智對“在市場和政府的協同作用下,我國的標注產業已經進入快速發展階段。”國家數據發展研究院院長胡堅波現場表示,數據標注在自動駕駛、醫療醫藥等領域,結合人工智能大模型,已構建起面向企業和個人的應用模式,成為在數據標注產業中較早的探索,且已較成熟。
胡堅波還提到,能源、交通、礦產、地質勘探等行業積累了大量專業數據,這些行業資金基礎較好、專業團隊完善,通過人工智能解決行業性全局問題的潛力巨大,他們在數據標注領域正快速發力。低空經濟、具身智能等未來產業,也在積極開展相關工作。
加快推進數據標注規范化與標準化
2024年4月,國家數據局確定了7個數據標注基地,分別是成都、沈陽、合肥、長沙、?凇⒈6、大同。截至目前,七地數據標注總規模達到17282TB,相當于中國國家圖書館數字資源總量的6倍左右。
國家數據局表示,7個數據標注基地的標注從業人員達5.8萬人,帶動數據標注行業相關產值超過83億元。
不過,雖然數據標注在快速發展,但仍處于初期階段,仍有不少方面待完善。
胡堅波建議,要加快推進行業數據標注工作的規范化與標準化,引導數據標準上下游環節對接和合作;并且要加強數據標注技術的研發和推廣,加強對基于生成式AI的合成數據的自動化標注。
孔德智表示,我國正通過政策引導和技術攻關,推動數據標注從勞動密集型向知識密集型轉型,為人工智能創新發展提供關鍵支撐。
他建議,當前數據標注產業應強化技術創新,重點突破跨模態語義對齊、大模型標注等核心技術,研發智能化標注工具,提升標注效率;同時,優化生態布局,培育龍頭企業與中小企業協同發展的產業鏈,推動數據標注基地建設,形成區域示范效應。
他還提到,應支持高校開設標注相關課程,聯動需求企業建立產教融合實訓基地,解決人才缺口問題。另外,還應保障數據安全,構建分類分級保護制度,強化隱私保護和風險防控,推動標注數據合規流通。