中国地方政府数据开放调查
2017年11月29日 | 作者: adminlin | 分类: 公共服务满意度 |
近年来,开放政府数据已在全球范围内迅速推进。
根据《2016 联合国电子政务调查报告》的数据,截止 2016 年,联合国 193 个成员国中已有 106 个提供了开放数据目录。
2012 年以来,我国已有近二十个地方政府陆续推出数据开放平台,先行先试,积极探索。
注:以下内容摘选自《2017中国地方政府数据开放平台报告》,由复旦大学与“提升政府治理能力大数据应用技术国家工程实验室”联合发布。
报告评估的地方政府数据开放平台共 19 个:
自 2012 年上半年上海推出我国大陆地区第一个开放数据平台起,截止到 2017 年上半年,我国陆续上线了十多个符合开放政府数据基本特征的地级以上平台。
各地平台上线时间
2015 年 8 月底国务院印发《促进大数据发展行动纲要》,各地平台增长速度明显提升。
截止 2017 年 4 月,我国各地上线的符合政府数据开放基本特征的平台的地理位置分布如下:
各地平台地理分布
图中深色的为省级平台,浅色为地级市。由图可见,我国绝大多数地方政府尚未开放数据。
另外,从各地开放数据平台的类型来看,绝大多数平台以统一专有方式呈现,即开放数据统一汇聚在一个专门的平台上进行开放。
统一专有式平台更有利于用户通过一站集中的方式发现、获取和利用数据,也是目前国际上普遍采用的方式。
政府数据开放平台通常以下载或 API 接口的形式开放数据集。各地开放数据平台开放的有效数据集总量如下图所示:
各地平台上开放的数据集总量
在 19 个开放数据平台中,武汉开放的数据集最多,与上海、贵阳处于第一梯队,都开放了超过 1000 个有效数据集或接口;其次是青岛,开放了847 个有效数据集。
其后,无锡、深圳、北京开放了 400多个的数据集;佛山、东莞、广州、南海、浙江等地开放了300 多个。
关于开放数据的格式标准,万维网发明者 Tim Berners-Lee 提出了一个开放数据五星标准:
一星:基于开放授权在网络上开放数据,对数据格式不做要求,可能采用 PDF、JPEG 等格式;
二星:以可机读、结构化格式开放数据(如采用 EXCEL 格式而非扫描格式);
三星:在满足二星标准的基础上,以非专属开放格式开放数据(如采用CSV 格式代替 EXCEL 格式);
四星:在满足以上要求的基础上,为每一个数据集设置固定的 URL 链接,便于使用者发现和链接到数据集的具体位置;
五星:在满足以上要求的基础上,数据之间实现关联 ,以展现数据的背景。
总体来看,各地平台上满可机读格式的数据集比例较高:
各地平台可下载数据集与可机读格式数据集数量
对比各地方平台上可下载数据集总量与开放格式总量发现,贵阳平台上开放格式的数据集数量最多,所有的数据集都可通过开放格式下载。
注:开放格式是指可下载数据集应以开放的、非专属的格式提供,任何实体不得在格式上排除他人使用数据的权利,以确保数据无需通过某个特定应用程序才能访问。例如 CSV 是开放格式,而 XLS 则不是。
各地平台可下载数据集与开放格式数据集数量
报告发现,在 19 个政府数据开放平台中,共有 12 个平台配有数据开放授权。
开放授权协议的内容应明确授予用户免费获取、不受歧视、自由利用、自由传播与分享“开放数据”的权利。
然而没有一个地方平台的授权协议全部明确授予了上述四项权利。
报告将开放数据主题归纳为财税金融、经贸物流、交通出行、机构团体、文化休闲、医疗卫生、教育科技、社会民生、资源环境、城建住房、公共安全、农业农村、社保就业、信用服务 14 个大类,对比结果如下:
各主题包含的数据集个数
各地平台主题覆盖数
各地平台主要数据提供部门数据集数量分布
各地开放数据集名称中出现频次最高的 48 个描述性限定词
以半年为时段进行跟踪分析,各地平台数据集持续增长情况如下:
各地平台上线时间与数据集持续增长
上海平台上线时间最早,2012 年上半年上线,至今数据已保持了 9 个时段的持续增长;北京平台于 2012 年下半年上线,持续增长时段为6 个。
在 2014 年下半年,佛山南海、湛江和无锡的平台上线,但湛江自上线之后便不再新增数据集。
2015 年以后新上线的平台基本都能保持数据集增长。
各地开放数据集承诺的更新频率分布
总体上,约半数的数据集承诺按季度或季度以下频率更新,其中又以按月更新为主。
承诺按日更新比例最高的地方分别为广州、佛山,其次是浙江、青岛、广州、上海等地,多数平台上的数据仍以承诺按年或者不定期更新为主。
实际更新情况如何呢?
报告从 2017 年 4 月 18 日开始,在之后四周内的四个时间点持续采集数据,采集时间分别为 2017 年 4 月 18 日、 2017年4月24日、2017年4月30日与2017年5月7日。
通过比对数据集更新时间的变化,各地数据集实际更新情况如下:
上海平台该时段内更新的数据集数量最多,其次为东莞、贵阳和青岛。
各地平台的单项指标分值 0-5 分,指数总分及排名如下:
2017 中国开放数林指数
在所有的地方平台中,表现最好的是上海、贵阳两地,其次是青岛、北京、东莞、武汉等地。
在省级行政区排名中,指数得分最高的是上海,其次是北京、广东、浙江、贵州。
在副省级和地级城市排名中,得分最高的是贵阳,其次是青岛、武汉、东莞、佛山、广州、佛山南海、无锡等地。
想获取更多信息,或者咨询相关业务可以关注我们的微信公众平台:SMR_gz
或者扫描下面二维码