商务服务
大数据时代的数据争议——脉脉抓取使用新浪微博用户信息案
2024-10-31 17:30

本文由作者向无讼阅读供稿

大数据时代的数据争议——脉脉抓取使用新浪微博用户信息案

 

案号:(2015)海民(知)初字第12602号(一审)、(2016)京73民终588号(二审)


法院:北京市海淀区人民法院(一审)、北京知识产权法院(二审)


原告(被上诉人):北京微梦创科网络技术有限公司(新浪微博)


被告(上诉人):北京淘友天下技术有限公司、北京淘友天下科技发展有限公司(脉脉)


案情经过:2014年8月,微博方面发现在脉脉产品内,大量非脉脉用户直接显示有新浪微博用户头像、名称、职业和教育等信息。即可能在从未通过微博登录脉脉的情况下,脉脉上仍能够直接搜索到用户的个人信息。


在此之前,微博和脉脉一直有合作,用户可以通过微博账号和个人手机号注册登录脉脉(OpenAPI),用户注册时还要向脉脉上传个人手机通讯录联系人。但在上述事件发生后,双方终止合作,新浪也据此向脉脉提起诉讼,认为被告非法抓取、使用微博用户信息等。


2016年4月,北京市海淀区人民法院一审结案,认定脉脉非法抓取、使用新浪微博用户信息等行为构成不正当竞争。此后,脉脉提起上诉。2016年12月30日,北京知识产权法院做出终审判决,驳回上诉,维持原判。2017年1月9日,北京知识产权法院判决维持原判,驳回上诉。


一、为什么重要


这个案件是关于数据利用的问题,审理过程中仔细讨论了数据的收集、共享、删除等问题。这在此前的案例中是前所未有的,在此之前虽曾有大众点评诉爱帮网的案件(不正当竞争-(2011)一中民终字第7512号,著作权-(2008)海民初字第16204号/(2010)海民初字第4253号),但大众点评案是从著作权侵权与不正当竞争两个诉由分别进行诉讼,用户点评的著作权问题相对数据的属性问了来说争议较少,在大众点评的不正当竞争案中,也没有太多地关注信息本身的抓取、利用问题。毕竟在当时,大数据还没有被广泛应用,而且著作权也足以解决纠纷。但新浪微博诉脉脉的案件,所涉多是用户个人的教育与工作信息,这些信息无法构成著作权意义上的作品,所以,司法在数据属性尚不明确的情况不得不进行一些尝试。


除了案件的新颖性,新浪与脉脉的案件,本身就是一个具有高度影响力的案件。涉案的一方是在美上市的新浪微博,本身就具有很高的认知度,从案件受理、开庭、一审、二审,都有媒体的跟踪关注。


另外,一审判决书四万多字、二审的判决书七万多字,详细分析了双方的权利、义务关系,而且在诉讼中,双方律师制作了大量的公证书,专家证人也如走马灯一样提供各种技术细节,让判决书读起来十分过瘾,揭露了互联网行业数据共享的冰山一角。详尽的裁判文书还披露了许多微博经营的细节,比如判决书里提到了新浪微博的网络实名制真相:“新浪微博用户注册时,必须填写手机号或者身份证号,手机号需要验证,但身份证号没有与公安系统联网,由微梦公司自查。”可以让我们了解一些平常不易了解的技术细节。


二、用户协议——互联网时代的法律基础


在互联网环境下,用户协议是用户与厂商之间各种法律关系的基础,而所谓用户也不止是指个人用户,也包括了其他厂商。在微博诉脉脉案的两审裁判文书中,频繁引用了《开发者协议》与《脉脉服务协议》中的内容,成为了案件裁判的关键,另外也部分参考了《微博服务使用协议》与《微博个人信息保护政策》的规定。各种用户协议在争议发生时的作用并不比法律法规差,在裁判文书里被引用的次数远多于法律条文。


长期以来,用户协议的重要性被忽视了。冗长又不可修改的协议文本几乎让所有人望而却步,都是直接点击“同意”。这种草率的态度给争议的解决留下了巨大的隐患。在二审的判决书中就提到了脉脉一方对待用户协议的态度:

 

“从主观状态来讲,上诉人淘友技术公司、淘友科技公司明知自己是基于《开发者协议》从而可以通过0penAPI获取用户信息,但却无视《开发者协议》的具体内容约定,通过技术手段获得用户数据信息,其主观上具有一定的过错。同时,上诉人淘友技术公司、淘友科技公司对于用户数据信息的获取以技术的最大能力为范围,对技术的应用不加人为理性地控制,不仅忽视双方之间的《开发者协议》约定的内容及0penAPI合作模式的基本原则,还涉及对于用户数据信息的不当利用。”


脉脉一方不仅忽视了协议签订过程,在签订完以后,也没有依据自己“同意”的协议开展业务,直接导致与新浪微博合作破裂并且最终的败诉。


对用户协议来说,因为是厂商单方提供的,所以对于双方来说对用户协议作为证据进行固定都极为困难。并不是说在争议发生时,律师去公证处将用户协议公证一下就可以固定的,在争议中真正需要的是用户注册时所同意的拿一份协议,而注册时的协议与争议发生时的协议往往会存在巨大的差别。在新浪微博诉脉脉案的判决书中,因为争议双方都提供了自己不同阶段的协议文本,一审法院在审理时就发现了不同版本协议文本的区别:

 

“类似的情形同样发生在《脉脉服务协议》中,第20797号公证书与第16542号公证书所显示的协议也不完全一致,且该协议中要求用户下载、注册等行为均被视为完全了解、接受并同意遵守该协议项下的全部内容,且该协议可以由淘友科技公司单方随时修改,修改后的协议条款一经公布即替代本协议原条款,构成新协议……”


随意变更用户协议的文本已经成为了行业常态,在协议中甚至会将这种随意变更的权利明确规定,对于要接受这份协议的用户来说这显然是有失公平的,会让整份协议的效力大打折扣。


用户协议的文本起草与订立过程只有律师或者法务的参与是远远不够的,是需要与技术人员、UI设计师的共同参与才能完成,这是用户协议与传统合同最大的区别。传统合同的起草,律师可以在了解需要后一手操办,最后双方签字盖章即可。对用户协议来说,传统的合同结果并不适用,比如管辖权条款,一般的合同都是放到合同的末尾,而对用户协议来说最好放到开头,以保证其效力。除此以外,用户协议的订立过程,也需要与产品的UI设计师紧密沟通,避免在用户点击“同意”时缺少足够的意思表示。


新浪微博诉脉脉案与其他很多案件一起,展示了互联网时代用户协议的重要性,可以这种重要性并没有及时反馈到日常的法务工作中。


三、API与Robot.txt——网络界碑


新浪微博诉脉脉案在法律上,新浪微博的数据分享是以《开发者协议》为基础,在技术上则是通过API来实现。脉脉早期与新浪微博的合作是通过新浪微博开放的API接口来进行数据的分享与利用。API是ApplicationProgrammingInterface(应用程序接口/应用编程接口)的缩写,是软件系统不同组成部分衔接的约定,现在也广泛被厂商用于与合作厂商之间进行数据分享。


二审法院在判决书中认为:“0penAPI开发合作模式是在互联网环境下实现数据信息资源共享的新途径。《开发者协议》是约束0penAPI合作双方的协议,双方均应本着平等互利、诚实信用、保护用户利益的基本原则进行合作。”通过API,厂商直接可以决定哪些数据开放、哪些数据不开放,随时变更数据开放的范围与程度。


网络数据的来源,除了API以外,还可以通过爬虫程序来进行抓取,而网络爬虫抓取哪些数据,是以robots.txt为依据的。robots.txt是一种存放于网站根目录下的文本文件,它通常告诉网络爬虫,此网站中的哪些内容可以抓取,哪些内容不能抓取。


robots.txt与API是网络时代数据获取的界碑,但界碑本身没有执行力,可以被“一跃而过”,需要与用户协议这样的法律文件结合起来才具有法律效力,真正起到界碑的作用。


四、谁的数据,怎么利用


整个案件最关键的争议点是围绕着用户数据的利用展开的。新浪微博通过用户主动填写,获取了大量的职业、教育信息,这些信息结合微博用户的用户名等内容,具有高度的敏感性。法院认定脉脉构成不正当竞争,理由就是未经微博用户的同意而获取其信息,节省了经济投入,构成竞争优势:“上诉人淘友技术公司、淘友科技公司未经新浪微博用户的同意,获取并使用非脉脉用户的新浪微博信息,节省了大量的经济投入,变相降低了同为竞争者的新浪微博的竞争优势。”


在2016年11月通过的《网络安全法》中,对个人信息的收集、利用、出卖进行了严格的规定。在案件的审理中,对于新浪微博的数据共享政策,二审法院直接提出批评:

 

“微梦公司在0penAPI的接口权限设置中存在重大漏洞,被侵权后无法提供相应的网络日志进行举证,对于涉及用户隐私信息数据的保护措施不到位,暴露出其作为网络运营者在管理、监测、记录网络运行状态,应用、管理、保护用户数据,应对网络安全事件方面的技术薄弱问题。”


本案不是用户起诉新浪微博,但从两审法院的判断来看,新浪微博对于用户的数据没有尽到足够的注意义务。如果是用户起诉个人信息有关的案件,或是追究新浪微博的刑事责任(拒不履行信息网络安全管理义务罪)新浪微博的麻烦恐怕就大了。


除此以外,北京知识产权法院罕见地在判决书中建议了网络运营者在采集运用用户数据时应履行的管理义务:


制定内部数据信息安全管理制度和操作规程,确定网络安全负责人,落实网络数据信息安全保护责任;


采取防范计算机病毒和网络攻击、网络侵入等危害网络数据信息安全行为的技术措施;


采取监测、记录网络运行状态、网络安全事件的技术措施,并按照规定留存相关的网络日志;


采取数据分类、重要数据备份和加密等措施;


制定网络安全事件应急预案,及时处置系统漏洞、计算机病毒、网络攻击、网络侵入等安全风险。


北京知识产权法院所建议的内容,也是互联网企业针对数据问题进行合规的依据,如果无法达到这些标准,恐怕在日后面临纠纷时会处于不利的局面。而且,围绕着数据的纠纷,在日后将越来越多,甚至会成为一个新的业务领域。


五、律师的数据/个人隐私业务


新浪诉脉脉案,是一个里程碑性质的案件,其中值得分析的内容远不止于本文提及的内容。而从此案开始,在大数据时代会有更多关于数据的案例。


在君合最近网站的改版中,已经悄然增设了“隐私保护、网络安全与信息法”,金杜也早已将“数据及隐私权保护业务”列为其业务之一。


记得在去年冯象教授来我们学院做讲座时,就曾提到数据/信息会成为独立于知识产权的一个法律领域,而且适用的范围会超过传统的知识产权。这个预测正在一步一步成为现实,随着《网络安全法》即将正式实施,关于数据与个人信息的诉讼、合规需求也会越来越多,数据/信息的保护将成为一个新的业务领域。以后有空的话,再具体谈一谈这个问题吧。

 

 

 

    以上就是本篇文章【大数据时代的数据争议——脉脉抓取使用新浪微博用户信息案】的全部内容了,欢迎阅览 ! 文章地址:http://lianchengexpo.xrbh.cn/news/10262.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://lianchengexpo.xrbh.cn/mobile/ , 查看更多   
最新新闻
二胎概念火了!任泽平:未来四胎五胎可能给奖励
  人口政策问题再次广受关注。  昨日晚间,央行微信公众号发布题为《关于我国人口转型的认识和应对之策》的工作论文,聚焦了
全球下载量突破20亿时TikTok遭遇“围剿”,张一鸣对公司员工说了啥
抖音短视频国际版TikTok近日在美国的遭遇不断反转、不断刷新。虽然特朗普对其封禁令尚未最终拍板,但TikTok在海外年轻人中的火爆
如何查询手机流量?查询手机流量方法教学
  手机是一个我们现在广泛使用的电子产品,我们除了利用手机进行通话之外,最多的就是利用手机上网了。如果想要利用手机上网的
孙楠:希望自己的音乐带给观众快乐
  中新网杭州6月25日电 (胡小丽 刘文彬)1990年,孙楠发行了首张个人专辑《弯弯的月亮》,从此走上职业歌手的道路。到今天,已
【夜读】7条成长建议,送给正在努力的你
01改变自己会痛苦,不改变自己会吃苦不抗拒改变、不用陈旧的方式去处理新问题,是一个人走向成熟的标志。很多时候,只是一个细节
tiktok前身是什么发展历史,一文带你了解tiktok发展历程
在互联网发展如此迅速的今天,各种的媒体社交改变了我们的生活,带来了更多的便利条件,让我们了解这个周围以及世界的最新咨询。
中考倒计时,科学备考秘籍请收好
  本报记者潘洁婷通讯员王晓敏  今年是“双减”政策实施以来的首次中考,距离2022年中考还有不足一个月时间。备考冲刺阶段,
千万粉丝!他突然全网被封
近日,在抖音拥有1800多万粉丝的倪海杉账号被平台封禁。关于倪海杉账号被封原因,网络上有多种猜测。另外,倪海杉在快手上拥有50
全新 Model 3 发布!内外饰全面焕新,屏幕换挡进入全民时代
6年前,特斯拉为 Model 3的亮相开了一场盛大的发布会,特斯拉首席执行官、首席设计官悉数到场。Model 3是公司当前的头等要事。马
一部具有重大警世意义和很高文学价值的力作——评屈全绳的长篇小说《鹅头岭》
作者:汪守德一按一般人的想象,有着数十年从军经历的老将军,离休之后不再为公务缠身,不再因百事纠结,或写一点回忆录之类的轻
本企业新闻
推荐企业新闻

点击拨打: