广西壮族自治区信息中心 - http://gxxxzx.gxzf.gov.cn/
当前位置:首页 > 决策咨询服务 > 大数据发展研究

我区公共数据高质量“聚用”问题与 对策研究

2022-08-02 16:20     来源:大数据技术开发处课题组
【字体: 打印

随着数据要素市场化改革的深入推进,我区积极推动公共数据开放,实现开放数据总量快速提升,为数字经济发展奠定坚实的数据支撑。但在公共数据开放与利用过程中,我区仍存在开放理念待强化、数据质量待提升、应用成效待深化等问题。有必要以需求侧的实际场景数据需求为牵引,依托隐私计算、数据沙箱、区块链等技术深入推动公共数据安全有序开放,不断提升公共数据开放质量,激发数据创新融合应用,助力数字广西建设迈上新台阶。


一、我区公共数据开放取得显著成效

(一)公共数据“聚”的量质提升明显

    我区统一建设了广西公共数据开放平台(简称“平台”),用于汇聚各部门各地市可开放的公共数据,并实现量质齐提升。从开放数据总量看,截止2022年6月,平台接入88个自治区级部门,14个市、86个县(区)共616个单位,汇聚公共数据资源目录6339个、接口资源561个、库表资源5992个、结构化数据5.49亿条、开放文件3.66万个。与2021年末相比,公共数据资源目录、接口、库表等数量的增速都超过12%(图1)。从开放数据可用性看,用于数据分析和应用的结构化数据占比从2021年末的82.96%提升至2022年6月的96.89%,半年增速超过13%,表明我区公共数据在开放数量增加的同时,也实现质的有效提升。从第三方评估结果看,《中国开放数林指数》系列报告显示,自平台上线以来,我区数据层指数和综合指数呈增长态势,其中数据层指数从2020年的17.6增至2021年的21.23,表明我区在数据数量、数据质量、数据规范、开放范围等方面取得良好成效(图2)。

图1 广西公共数据开放数量及增速


图2 中国开放数林指数(广西)相关指数趋势

(二)公共数据“用”的成果丰富多样

    公共数据开放的目的在于挖掘数据资源价值,促进数据资源的社会化利用。目前我区通过举办广西公共数据应用开放大赛等推动公共数据开发利用取得积极成效。一方面,公共数据应用成果数取得新飞跃。平台上“应用成果”专区数据显示,目前已形成爱南宁、乐游南宁、爱广西等140个创新应用成果,涉及移动应用、web应用、分析报告、小程序、创新方案等,覆盖了城建住房、生活服务、财税金融等16个领域(图3)。另一方面,公共数据使用量取得新突破。赛事举办和应用增加带动公共数据使用量快速提升,截至2022年6月,平台累计访问量超过1099万次,文件资源被下载逾11.49万次,接口资源被调用近119.9万次,相比2021年末,平台累计访问量增长了292.5%,文件资源累计下载量增长了53.2%。

图3 各领域公共数据应用成果数量分布

(三)公共数据“评”的成效名列前茅

在国家权威机构开展的相关测评中,我区公共数据开放水平位居前列。2022年1月,复旦大学和国家信息中心数字中国研究院联合发布的《中国地方政府数据开放报告》显示,我区“开放数林”指数为32.44,在全国省级政府数据开放综合排名中位居第十位,在西部省份中排名第三位。对比各地省级公共数据开放平台数据汇聚情况,广西开放数据总量位列全国第八。其中,我区开放目录数量在全国排名第四,西部第一;开放数据量仅次于四川省,位列西部第二。


二、我区公共数据高质量“聚用”面临问题分析

(一)开放理念有待强化

我区一些公共数据拥有部门的开放理念尚未达成共识,开放主动性不强,存在“不敢开、不愿开、不会开”的现象。一是出于风险考虑而不敢开放数据。随着《数据安全法》《个人信息保护法》等法律生效实施,我区有关公共数据拥有部门因为担心在数据开放、使用与分析过程中存在敏感数据泄露风险而不敢开放数据。二是出于路径依赖而不愿开放数据。我区少数政府部门习惯于因循固有工作模式,私有化理念仍然存在,各部门对数据开放后的数据存储、数据安全、数据确权等权责问题无法清晰界定,导致没有“硬性要求”就不愿开放数据。三是出于管理边界不清晰而不会开放数据。各部门原有政务信息系统主要建在部门内部,采集的数据格式不统一、标准不一致,加上数据资源相关管理规则不明确,数据管理人员进行数据整合、清洗、比对等工作短时间内难以完成。数据资源普查结果显示,全区80%以上部门的数据资源仍存在底数不清,导致数据开放工作无法有效推进。

(二)汇聚质量有待提升

    我区公共数据虽然汇聚数量快速提升,但仍面临“质量不高、鲜活度低、形式开放”等问题。一是开放数据的质量不够高。从数据完整性看,截止2022年6月,开放方式为“数据集”的数据目录中,信息项为空或仅有1条的占比为4.44%,信息项的完整率需要继续提升。从数据可用性看,虽然结构化数据集占比率已达到96.58%,但仍有1.85%的目录资源可继续整理为库表、接口等结构化类型资源。从数据规范性看,存在少数数据目录未按照目录编制要求对信息项用中文命名或未标明具体年份时间信息等。二是开放数据鲜活度不够高。通过对数据目录中的“数据集”、“文件集”的更新情况进行分析,截止2022年6月,约9.39%的非API(接口)数据目录没有按照更新频率更新数据,其中超过1年未更新数据的比例达0.41%(图4)。由于数据的更新不及时使得数据鲜活度下降、数据可开发利用价值逐渐降低。三是部分数据存在“形式开放”现象。我区开放数据的总量虽然较大,但涉及核心业务办理、社会公众迫切需求的数据较少,实用性较强的公共数据开放程度不足,优化营商环境急需的水、电、气等数据汇聚几乎仍是空白,数据集和数据质量无法满足社会日益增长的需求。

图4不同更新频率下超时未更新目录数与总目录数的占比

(三)数据应用有待深化

    我区基于开放数据形成的成果数量虽然较多,但精品应用少,利用水平、成果展示、促进措施等仍待完善。一是我区公共数据利用水平不高。《中国开放数林指数》相关报告显示,2021年,我区公共数据开放利用层指数仅为3.60,全国排名第12位,与部分先进省市存在较大差距(图5)。二是我区各地市数据利用成果展示差异较大。对各地市平台上的应用成果数进行统计,贺州市表现抢眼,该市平台上展示了15项应用成果,而百色市平台上尚未对有效成果进行展示(图6)。三是数据应用领域有待探索。目前应用成果主要集中在城建住房、生活服务、财税金融等领域,市场监管、商业服务、资源能源等领域的应用数还很有限。四是数据开发利用的促进措施还不完善。目前仅在自治区层面举办了一届公共数据开放大赛,常态化的公共数据开发应用激励措施尚未形成。

 图5 对标省市的中国开放数林指数的应用层指数

图6 广西各地市公共数据开放平台展示成果数分布


三、对策建议

(一)深化公共数据开放理念,激发“聚”的动能

以全面推动我区数据要素市场化改革为契机,在技术、方法、制度等方面持续推进公共数据开放宣传工作,深化开放理念。一是以新技术激发公共数据开放意愿。加快打造全区统一的公共数据资源平台,使用隐私计算、数据沙箱、区块链等技术构建可信的计算环境,降低敏感公共数据开放风险,促进数据拥有部门敢于开放数据。二是以新方法加强公共数据开放宣传。强化公共数据开放服务社会民生发展理念,在政府网站、微信、微博、短视频、直播等新媒体平台上加强对公共数据开放宣传,支持在各数据拥有部门开展公共数据开放讲座,让公共数据开放深入各部门,提高公共数据开放意愿。三是以新制度推进公共数据开放培训。完善公共数据开放相关政策和标准,加快出台我区数据条例,推动定期开展全区性的数据开放和数据治理培训。支持各单位成立数据要素使用小组,组织开展数据开放专班教育,深化数据开放意识,提高公共数据开放工作能力。

(二)深化公共数据督查机制,提高“聚”的质量

建立完善公共数据开放的长效督查机制,以监管促进各级各部门提升公共数据开放的种类、数量和质量。一是不断优化公共数据开放目录。进一步完善数据治理和审核机制,加强对当前数据开放目录的梳理和清洗,推动利用新技术用活开放目录中的文件、表格等“死数据”,实现文件、表格、图像等非结构化数据向库表、接口等结构化数据转化。二是持续强化对高价值数据监管。宣传数据更新意识,推动各部门按照更新频率及时更新数据。优化完善数据开放平台功能,告警提示超时未更新的数据目录等。三是持续完善数据开放评价体系。更新和完善我区数据开放评价指标体系,持续开展公共数据开放水平动态评估,对出现异常的指标及时进行回溯分析,定期发布公共数据开放指数报告,以评促改推动提高公共数据质量。

(三)深化公共数据应用驱动,提升“用”的成效

完善公共数据供需流程,以应用需求驱动公共数据高质量开放,提升数据使用效能。一是强化应用创新,拓展应用场景。持续举办公共数据开放大赛,以赛促用,培育公共数据应用新场景;以用促聚,推动各类公共数据开放。持续开展应用场景调研,以新场景为牵引,不断依托新技术将高价值数据开放给社会使用。二是完善专题数据,促进数据融合。根据应用场景,分阶段建设不同领域行业数据专区,以及疫情防控、热点专题等数据专区,面向政府和社会提供数据服务。鼓励企业深入开展特定领域的数据汇聚融合、清洗加工、挖掘分析等。建设重点领域大数据联合实验室试点,打通产学研用资源,积极探索多源数据融合,形成数据应用场景落地。鼓励公共数据使用单位展示优秀应用成果,提升成果影响力。三是探索数据交易,释放数据价值。完善公共数据开放利用配套制度,探索开展数据交易,引导公共服务企业参与数据开放,鼓励企业依法依规对自有不涉密数据进行开放共享和商业化运营,推动政府数据、企业数据、社会数据和互联网数据深度融合创新,以数据流通充分释放公共数据价值。

(执笔人:杨武松)










文件下载:

关联文件: