本報記者 郭冀川
6月19日至20日,在中國通信標準化協會主辦的“2024數據智能大會”上,大數據技術標準推進委員會發布了《數據智能白皮書(2024年)》(以下簡稱《白皮書》)。
中國信通院云計算與大數據研究所大數據與智能化部主任姜春宇向記者介紹,《白皮書》進一步梳理數據智能相關概念及知識體系,總結行業先進實踐經驗,研判數據智能領域未來發展趨勢,指引推動企業順利實現數智化轉型。
以生成式大語言模型為代表的人工智能技術發展,在掀起智能化創新浪潮同時,如何深度應用數據和智能技術也被業界廣泛關注。《證券日報》記者了解到,《白皮書》結合大數據、人工智能技術體系,對數據智能整體的技術體系進行系統性梳理。
數據智能技術體系概覽 圖片來源:《數據智能白皮書(2024年)》
《白皮書》提出,總體來看,人工智能技術與數據技術相輔相成。在模型訓練前的數據準備環節,數據的處理離不開各類高性能存儲及大數據平臺的支持;在模型訓練環節,各類數據平臺為人工智能領域各類計算框架提供了有力的算力支撐;在應用開發環節,數據應用為各類人工智能模型提供了廣闊的應用場景及用戶數據,助力模型應用效果的進一步提升。
伴隨著數據與人工智能技術的不斷融合,《白皮書》分析,“數據+人工智能”逐漸演化出“5+3”技術體系。其中,數據技術可以按照數據生命周期分為數據匯聚、數據存儲&計算、數據管理、數據開發&應用、數據安全五大部分,人工智能技術可以分為數據準備、模型訓練&推理、模型開發&應用三大階段。
在應用需求的驅動下,《白皮書》認為,數據與智能將進一步融合創新。一方面,模型的生產需要高質量的數據資源以及更高效的數據底座支撐,另一方面人工智能技術的最新成果能夠進一步賦能數據技術,提升數據處理效率和數據應用效果。由此,逐漸衍生出數據供給、多模數據存儲與治理、數據智能平臺、智能化數據安全技術等一系列新興技術。
當前,越來越多的企業運用數據智能應用技術,旨在從數據中提取有價值的信息和知識,從而驅動決策,賦能企業具體業務。根據《白皮書》研判,數據智能應用在加速賦能傳統行業的同時也會出現更多的跨行業賦能。深度方面,數據智能應用將更加深入的賦能農業、交通、制造業等傳統行業。這些行業涉及到大量來自物理世界的數據,數據采集成本高,普遍以多模態數據為主。隨著傳感器、5G、衛星遙感技術的不斷發展,數據采集成本穩步降低,大模型的落地也為多模態數據分析和處理提供了新的解決思路,傳統行業的數據智能應用能力將快速提升。
隨著數據價值的提升,數據資產也逐步成為企業的核心競爭力之一,自2023年8月份以來,《企業數據資源相關會計處理暫行規定》《數據資產評估指導意見》等相關政策發布,引導企業開展數據資源估值與入表工作,促進企業準確把握數據價值脈絡流向,提高數據賦能程度,充分參與數據要素市場建設。據統計,今年第一季度已經有20余家上市公司披露了數據資源入表情況。
中國信通院云計算與大數據研究所所長何寶宏向《證券日報》記者介紹,2024年是數據資源估值和入表的“起步年”,數據資源估值重在感知和量化數據價值,數據資源入表關鍵在于精準核算數據相關的財務信息。
何寶宏說,在實踐中,按照“先有價值,再有交易”、“先有業務,再算財務”的思路,數據資源估值是入表的基礎,為入表前的歷史成本歸集、預期收益分析等確認條件提供重要依據。