工聯網消息(IItime) 以人工智能為代表的新一輪科技革命和產業變革正在席卷全球,對國家產業布局以及社會生產生活產生深遠影響。其中,作為新型生產要素、被稱為數字時代“新石油”的數據,顯著影響著變革進程。
數據是近年世界互聯網大會烏鎮峰會上的高頻詞。業內認為,高水平人工智能離不開高質量數據集:它是訓練智能模型的“食糧”,是優化算法模型的“磨刀石”,更是驅動產業數字化轉型的“發動機”。
我國數據資源豐富、數字應用場景多樣,持續沉淀的海量數據,奠定了發展人工智能的獨特優勢。但相較潛力能級,從推動數據資源數量級擴面增容,到促進數據橫向碰撞產生“化學效應”,目前仍然有顯著提升空間。
究其根本,有多重因素在源頭上限制了數據價值的釋放與發展優勢的轉化。比如,數據標注質量參差不齊,甚至存在系統性數據偏見,有關標準化建設滯后于現實需要;部門之間、行業之間數據壁壘仍然存在,數據的資源屬性、市場機制有待進一步建立完善,導致數據流通受阻、陷于碎片化等。
搶抓人工智能發展機遇,需強化高質量數據供給,讓數據成為真正的生產力。“十五五”規劃建議提出:“深入推進數字中國建設。健全數據要素基礎制度,建設開放共享安全的全國一體化數據市場,深化數據資源開發利用。”
塑造數據要素,需要從數據需求梳理,到數據采集、處理、標注、合成,再到數據應用驗證、質量評估,全方位提升數據集的規范性、完整性、準確性、一致性、時效性等,加快形成覆蓋醫療、交通、教育、農業等關鍵領域的高質量公共數據集。
構建數據市場,應加快推動數據交易市場、可信空間、確權登記等,促進數據要素的合法有序流動;探索數據要素的產權保護和價值分配機制,平衡數據開發利用與個人隱私、商業秘密保護之間的關系,讓數據提供者、加工者、使用者都能分享數據創造的價值,形成正向激勵循環。
深化數據挖掘,則需加強組織協同,有力推動高質量數據集向科研機構和各類企業有序開放,降低門檻、提升質效,加快完善數據生態。與此同時,及時推動數據挖掘成果應用,引導各主體錯位競爭、形成合力,協同推動我國從“數據大國”向“數據強國”邁進。
