24日,在第七届数字中国建设峰会上,《全国数据资源调查报告(2023年)》正式发布。这是我国首次对数据资源进行“全面体检”。根据国家数据局等多部门的最新调查结果,我国数据生产的规模优势基本形成。

我国数据年产量相当于千万个国图的数字馆藏

2023年,全国数据生产总量达到32.85泽字节(ZB),这相当于1000多万个中国国家图书馆的数字资源总量。和2022年相比,我国数据年产量增长22.44%,其中,和智能网联汽车相关的出行数据,同比增幅达到49%;和工业机器人等智能生产设备相关的制造数据,同比增幅为20%。今年,预计我国数据生产量增长将超过25%。

国家工业信息安全发展研究中心主任 蒋艳:随着5G、AI技术的快速发展,内容制作、影像视听等民生消费领域的新的业态不断涌现,随之带来的非结构性数据对我国数据总规模的贡献是巨大的。

与此同时,调查发现:在2023年全年生产的数据量中,只有2.9%被存储,这意味着一些数据在源头就被抛弃;另外,在存储数据中,一年未使用的数据占比约为四成,这说明不少数据被存储后不再被读取和复用。

北京交通大学信息管理理论与技术国际研究中心教授 张向宏:数据生产多、存储少,这是一个全球的普遍规律,数据就像我们的水果一样,容易腐烂而会失去价值。当然从另一方面也说明,我国在数据资源开发利用方面还有待于进一步提高。

算力规模增长快 智能算力占比约30%

算力,被称为人工智能的“发动机”,是新质生产力。新出炉的《全国数据资源调查报告(2023年)》显示,我国算力规模增长快,大模型计算需求不断增加。

到2023年年底,全国2200多个算力中心的算力规模约为230百亿亿次浮点计算/秒(EFLOPS)。什么概念?这可以让100辆新车的上万次碰撞测试在1分钟内完成。在过去的2023年,全国算力规模同比增长约为30%。目前,在所有算力中,智能算力占比提高到约30%。

中央财经大学中国互联网经济研究院副院长 欧阳日辉:智能算力的需求增长这么快,主要来自大模型的发展,我们的通用大模型发展很快,行业的垂直的这种大模型发展也很快。比如说,我们在金融行业、医疗行业、政务领域里面,对智能大模型和智能算力的需求是越来越大。

在算力的区域分布上,最新调查结果显示,京津冀、长三角、珠三角地区的算力规模占比达到近60%,东部地区的数据存储和计算利用率要高于西部地区。

2023年我国公共数据开放量同比增长16%

公共数据,是数据领域中最大的“富矿”。《全国数据资源调查报告(2023年)》显示,我国公共数据开放共享已经初见成效。

2023年,我国公共数据开放量同比增长16%;省级政府开放数据量比2022年增长18.5%。北京、浙江、上海、重庆等15个地区的省级数据管理部门开始探索“公共数据授权运营机制”,就是把公共数据拿出来,授权给相关企业,形成公共数据产品,向社会提供服务。

中央财经大学中国互联网经济研究院副院长 欧阳日辉:我们看到公共数据对外开放的量增速非常快,也可以看到公共数据获取的渠道和场景越来越丰富。

今年以来,记者注意到,不少地方纷纷成立“数据集团”,加快盘活公共数据。不过整体来看,现有的数据供给难以满足当下旺盛的需求,例如,在数据交易机构中,消费民生领域数据产品购买方数量是供给方的2.4倍。

国家工业信息安全发展研究中心主任 蒋艳:随着数据技术快速发展,数据基础制度不断完善,数据产业发展壮大,数据资源开发利用水平不断提升,供需不匹配的现象将在一定程度上得以缓解。

(总台央视记者 刘柏煊 陈茜 高淼 黄玮 李鹏冲)

分享到: