现在的位置: 首页 > 新媒体 > 正文

开放数据,仅有平台,远远不够

2016年08月21日 ⁄ 共 1400字 ⁄ 字号

《中国传媒科技》杂志镝次元专栏

  文丨高丰

    开放数据中国创始人

    英国开放知识大使

    南安普顿大学计算机博士

    编者按:

    数据有很多分类,一种是从数据所有权角度出发,一种则是从数据的公开性或访问性的角度去甄别。那什么是开放数据?它有什么要求?目前中国各数据平台发展到了什么程度?第二期镝次元数据传媒实验室专栏为您揭开开放数据的层层薄雾。

开放数据,仅有平台,远远不够

    开放数据五界定?

    一般来说,满足开放数据必须要有五个界定。

第一, 数据是免费的、开放的、公开的、可以拿到的;

第二, 数据本身是人人可以访问到的;

第三, 数据是易下载、机器可读的Excel等形式;

第四, 数据是完整的;

第五, 数据是开放授权的,允许每个人公平不受限制地去使用数据。

是不是听起来很绕?让我们回来先看看数据是如何被分类的。为何会出现开放数据一说?这和界定之间何种关系?

我们先从数据所有权说起。假定有一个数据的汪洋大海(图一),身高、身份证号码以及微博发文等,这些内容都叫做 个人数据,属于个人拥有的数字资产,而与之相对应的概念是公共数据。即数据本身与公共利益相关,可能来自公共部门比如政府部门以及事业单位,或者跟公共利益相关的企业,比如电信公司。

若从数据的公开性或访问性的角度来说,就会出现其他一种分类方式。开放数据就此出现。

先看公开数据。公开数据虽然至少能确保人人可访问和获取,是公开了渠道的数据,但是它并不确保数据免费或每个人可以任意使用。想象一下,有很多是数据印刷在报纸上,但报纸作为公开的出版物还是需要付费的。

与公开数据相对应的一个概念则是共享数据。比如QQ群内的共享Excel文档,需要在既定条件下去共同享用此数据。和公开数据很大区别是,其限制访问数据的条件,例如访问人。

在图一中可以看到开放数据的部分,这实际上是公开数据的特例。若对公开数据有进一步的约束和限制,就可使其成为开放数据。

这些约束和限制包括数据必须完整、必须开放授权、必须可下载等等。

对于开放数据而言,还有一个很重要的概念叫非歧视的性质。数据一定是任何人都可以访问到的,即它是公开可访问的,并且免费。无论怎么使用这个数据,作新闻报道或研究,甚至用其做商业的开发。数据发布者不可加以限制,也不可收费。

最后一个界定则是开放授权。一般来说,数据本身有版权和知识产权的限制,若发布数据,发布者可以根据版权和知识产权来限制使用者,要求其不可以把数据用作某种用途。但开放数据不允许有这样限制,使用者享有任意使用数据的权利。

但在这个过程中授权条款非常重要,必须要有授权的协议和数据共同发布,从而确保使用者拥有任意使用数据的权利。

这就是开放数据源何会有五界定。

我们可以看到,开放数据和公共数据、个人数据也都有交叉重叠。例如开放数据和个人数据之间,若个人主观自愿的条件下,将一些信息以开放数据的形式主动发布给大众去使用,这样的数据叫开放的个人数据。不过个人数据牵扯到非常多的隐私问题,现在还不太适合去谈论。

另外一块则是和公共数据重叠所形成的“开放的公共数据”,这里更多指开放的政府数据,政府数据也应该以开放数据的形式提供给大众去使用。从权利角度来说,政府数据在纳税人税收资助下所完成的政府工作数据,应当归于纳税人。但要强调的是个人数据不纳入其中,比如政府所拥有的个人身份证等相关信息,是不可以作为开放数据开放给大众的。

   1 2 下一页
   1 2 下一页

 

《中国传媒科技》杂志