国务院新闻办公室当日举行信息发布活动,通报“十四五”数字中国建设成效,国家发展和改革委员会相关同志、国家数据管理局负责人刘烈宏指出,数据是人工智能技术演进的关键要素,我国人工智能技术应用水平正快速提高。
数据核心作用凸显
人工智能范畴中,数据根基、算法架构与运算实力形成重要支撑,刘烈宏强调,打造可靠数据集具有根本作用,现阶段智能发展水平下,文本资料的核心解析单位Token,其重要性等同互联网时代流量参数,国家高度重视数据相关工作,率先将数据定位为关键生产资源,并运用多种手段推动数据信息的汇集与开发。
应用规模增长迅速
2024年开年以来,国内每日Token消耗量已超千亿,到今年六月三十日,这一数字已突破三十万亿元,一年间增幅逾三百倍。这一趋势显著反映出人工智能在我国的应用领域正快速拓展。人工智能技术的推广,使数据需求急剧增加,也标志着我国在人工智能领域取得了长足的发展。
高质量数据集建设成果
截至今年六月三十日,国内已建成逾三万五千个优质数据集,其总体积超过四百PB,相当于中国国家图书馆数字资源存储容量的百四十倍,这一成果的取得得益于国家层面的有效推动,通过发布相关指导性文件,多个主管部门联合行动,确保了数据集建设的规范进行,此举意在提高数据供给水准,推动相关行业的有序进步。
数据交易需求攀升
人工智能技术的研发推动了数据流通的需求,截至今年六月三十日,各地区优质信息资源的累计流转金额已接近四十亿元,信息流通平台公布的优质信息资源总体容量为二百四十六皮字节,北京信息流通中心显示,优质信息资源在流转总量中的比重从去年的百分之十显著增加至将近百分之八十。信息交换领域的频繁活动,更加凸显了优质信息集合的关键作用。
新模式与标注基地助力
上海、天津及安徽等地启动了“数据资源作价入股”的创新模式,引导企业将核心数据资本转化为股份参与合资公司,成都、沈阳、合肥等七个数据检验机构也已建立,旨在推动优质数据资本的培育,这些措施不仅开辟了数据应用的新渠道,也为高质量数据资本的构建提供了根本保障。
未来建设规划
刘烈宏表明,后续将全面部署优质数据集的建设,快速打造涉及具身智能、低空经济、生物制造等核心领域的数据库体系。此外,将推动全社会增强对数据资产价值的认知,营造珍视高品位数据的市场环境,从而支持我国人工智能与数字经济的不断前行。
高质量数据集的构建在未来或可取得哪些重要突破?希望社会各界的关注与传播,并就相关主题展开讨论与交流。