走入数据时代——漫谈数据、数据库、大数据


 


   大数据是数据之集大成者,此外,大数据更是一种技术,具有4v的特点,即数量量(volume)、多元性(variety)、变化性(velocity)以及精确度(veracity),具有极大的商业价值。大数据的发展极大的超出笔者的想象,可以说,互联网时代已经逐渐被(大)数据时代所取代,如今的社会生产和生活的方方面面都离不开大数据,在城市管理方面,大数据可以用于智能交通、环保监测等;在金融行业,高频交易、市场情绪分析和信贷风险分析离不开大数据的支持;在广告营销方面,大数据可以进行价格歧视性的营销以及瞄准式广告的应用;在体育和娱乐领域,大数据可以帮助训练球队、选择影视作品和预测比赛结果;在个人生活领域,大数据让我们每个人可以获得更加贴心的个性化服务。可见,大数据在城市管理、金融、体育、娱乐、安全等领域的应用都体现了很高的价值。


 

   但说到和大数据收集、制作、存储、使用、保护有关的法律规范却屈指可数,根据目前的大数据商业模式,互联网企业大多通过合同的方式合法的获取用户数据/信息的授权,虽然其合同内容的公正性、实际使用的透明性和必要性都存在争议,但在法律规范缺失的情况下,已有的商业模式之存在必然有其存在的适当合理之处,所谓“存在即合理”是也。


 

   然而,近期发生的互联网企业因数据、大数据而发生的诉讼,例如大众点评诉百度地图不正当竞争一案、新浪微博诉脉脉一案,甚至远在太平洋对岸的HIQ诉Linkedin一案,无不引起了整个行业和社会的关注。大数据的价值已经无需多言,但大数据在现行法律框架下如何正确、健康的发展而又避免和其他现有权利发生冲突,互联网公司如何合规的使用大数据,确实一个迫在眉睫的问题。立法具有滞后性,但司法却必须直面现实,并给出司法者的考量标准。作为一名关注数据法律问题的知识产权服务者,笔者在此仅对和“大数据”有关的一些问题抒发个人见解,由于笔者认知有限,如有认识得不到位之处,还请各位大神不吝赐教。


   01 数据的特殊属性


   说到大数据,首先说说大数据产业中的“石油”——数据(那数据库就是“油田”了)。


 

   数据这个东西,是信息时代下的一种特殊媒介,它不需要具体物作为物质载体,它既是载体亦是符号,只需要相应的数字化系统工具加以呈现,就可以使人的认知思维可以直观识别。换言之,信息的数据形式表明,具体物与抽象物是可以分离的,而传统知识产权法上抽象物与具体物的权利配置(具体物赋予物权,抽象物赋予知识产权)是否同样适用于数据成为一大焦点问题。


 

   此外,数据还具有技术属性,即大规模数据的集聚(构成数据库,乃至于大数据),便具有反复挖掘而获取新信息的可能性(如获取个人信息提供者的行为、消费习惯等)。由于过去技术发展和商业实践的历史局限,人们习惯于将数据所表达的不同信息内容作为区分数据相关权利的标准。于是,在数据的权利构造上,通常认为个人数据关乎个人隐私与人格权利。而数据库则因其组成的数据具有一定的商业价值而与财产权利关系紧密,各国围绕着知识产权与不正当竞争的框架,或单独立法给予数据库相应的保护,但数据库究竟可以构成何种程度的财产权,是值得我们下一步思考的。


    02 关于数据库的保护模式


   先说说欧洲的情况。《欧盟数据库法律保护指令(1996)》和《欧盟关于协调信息社会版权和相关权特定方面的指令(2001)》等立法给予了数据库制作者、权利人一项独特且相对较强的数据库权,明确认定数据库“提取”或“利用”的行为不管其是否为商业目的都在数据库权利人的控制之内,同时,还规定了经过实质更新后的数据库,其保护期限应独立计算,这几乎就等同于给了数据库权利人无限期的保护(只要在保护期到期前更新一下数据库)。欧洲的数据库立法被指以“激励投资、保护投资”为基础,侧重于保护数据库投资者的利益,希望通过赋予数据库制作者相对强大的权利来激励他们进一部对数据库进行开发、发展。由于数据库保护指令的入门门槛过高,且对数据的流通性使用形成较大阻碍,这极大的阻碍了数据业的发展,使得美国、中国的数据库发展极大的超过了欧洲的数据库产业。近期在欧洲耗时4年多出台的GDPR,似乎推翻了指令背后的数据库主体的投资保护,更侧重于数据的自由流通(有待笔者进一步研究)。


 

   相比欧洲,美国则是在反不正当竞争法中通过盗用侵权(tort of misappropriation)保护原则作为数据库保护的基本原则,通过判断具体商业竞争行为的性质和程度来展开一系列复杂的司法考量,特别是分析当事人的商业竞争行为究竟有什么具体影响,以及综合考虑当事人可能从制作数据库的资本投入中所获得的合理收益。然而,反不正竞争法保护的客体并非具体的权利,而是具有一定商业价值的法益或权益,因此,美国的立法者并不承认数据库制作者对数据库享有任何一种财产权利。


 

   我国对于数据库的保护,目前处于一个法律的真空地带。一般而言,数据库根据内容的不同,可以分为作品内容型数据库和事实内容型数据库。虽然民法总则已经明文规定了个人信息(数据为载体之一)列为民事权利的一种,然而,个人信息的集合(数据库)如何保护?数据库制作者是否享有特定的权利?都没有明确的答案。相比而言,事实内容型数据库的结构架构和制作工艺可能会有更多的相同之处,较难有空间来体现独创性。根据我们国家现行著作权法律体系,对数据(作品或事实)进行处理、加工、编排、选取后,是有可能构成汇编作品进而获得著作权法的保护。当然,数据库也可能因独创性的不足构不成著作权法意义上的作品(暂且不考虑数据库的独创性认定标准)。如果对这些数据的获取、处理、加工等方面付出了一定程度的努力和投入,则这些数据的集合可能构成该主体在商业上的竞争优势,他人不能通过非正当、非道德的方式进行获取(非公开的数据,可能构成商业秘密)或不合理的利用(爬虫得到的公开的数据,不当的后续使用则可能被法院制止),否则将可能因违反反不正当竞争法的相关条款而承担相应的侵权责任。目前这样的保护模式下,我国的数据库保护在一定程度上造成了事实内容型的数据库在中国很难获得实质有效的法律保护,而从大数据的发展趋势来看,事实内容型的数据库正是大数据制作的主要数据资源,各方对事实内容型数据库的争夺势必会刺刀见红。新浪诉脉脉案就是一个对事实内容型数据库使用发生争议而引发的案例,法院最终还是利用《反不正当竞争法》的一般条款进行了审理。


   03 大数据时代下的难题


   进一步,我们还会发现,事实内容型数据库与个人的隐私(个人信息)存在者难以调和的冲突。虽然个人信息作为一项数字时代下重要的一项财产性权利,同时兼具人身权属性,但由于大数据对个人信息的所有权并不关心,只关注其使用权和再生数据/信息的归属,因此,个人即便享有个人信息的所有权,但为了获取某些便利的智能化服务以及使得信息产生价值(往往单个信息很难具有加大价值,个别的隐私、商业秘密除外,但信息的聚合,例如大数据就具有极大的价值),个人往往将个人信息的使用权进行对外授权和分享,而一旦分享了自己的数据,则使得自己对个人数据失去了掌控的权利。在数据时代,对于收集数据的企业而言,通过协议或者个人许可的方式,拿到数据的使用权就足够自身使用了。对于数据产生者(个人)而言,即便对自己的数据、信息享有完整的权利,但是根本无法进行任何有价值的使用,目前更无法对授权出去的数据享有实际上的监控、管理权。相信每一个使用互联网的用户,都会或多或少的受到定向广告的骚扰,但我们究竟何时将自己的数据、信息进行了分享或牺牲,恐怕很少有人分得清楚,甚至连如何收回自己的授权信息,都往往无门无路。如何协调或配置数据库的相关权利和数据本身所承载的其他权利之间的关系且不影响大数据产业的发展,已是一个世界性范围的难题。


   04 结语


   大数据是在数据和数据库的基础上发展而来,数据和数据库的问题亦是大数据的基本问题。大数据并不仅仅是数据库中数据量的升级,大数据的本质是一种数据的聚合应用技术,其指向的是一种基于数据的智力洞察,所依靠的是软件算法,所获得的是数据分析能力,以数据能力提供服务。毫无疑问,大数据相较数据库具有更多的智力创造性。在制作方式上,大数据的制作,其制作商的资本投入只是其中一方面,网络用户的服务参与是数据的直接来源。随着物联网的兴起,作为财产上的物也将汇入大数据的数据收集之中。而传统的数据库制作主要为数据库制作者的主动收集和作品版权所有人的被动参与,制作和维护都非常昂贵。


 

   依据技术中立原则,一般大数据的技术本身并不产生任何法律问题(实质性非侵权用途),而我们需要对技术的使用进行监督(如快播,百度影音),防止其滥用或不正当的使用技术给消费者、公众的利益造成损害。考虑到大数据具有追踪记录信息、描写并预测行为模式的能力,同时,大数据本身又具有“隐私入侵”的天然基因,我们一旦使用它,这性格就会发作。因此,我们势必要对大数据的数据(包括个人信息、作品信息等)收集及其使用做出一定的限制和制约,给与大数据存在价值冲突的其他权利进行一定相互协调的权利配置,然而我们又必须适当又不失合理性地给大数据从业者一定的空间和发展土壤,促进大数据产业的蓬勃发展。


 

   2017年开始,我们已经步入数据时代,2018年,让我们捧稳手中的西瓜,对数据的相关立法保持密切关注!

来源:知识产权那点事

作者:低调的小琨虫

编辑:标天下

 

帅的人已经关注标天下了,百度标天下官网查看更多精彩新闻资讯