- by by 编辑
- 2022-03-09 15:20:37
中新经纬3月18日电 题:HiQ诉LinkedIn案对我国互联网平台反垄断的启示
作者:张开平 清华大学社会科学学院政治学系准聘副教授
数据是新时期的石油,有巨大的经济价值。近日,HiQ Labs诉LinkedIn数据抓取案原判决被美国最高法院撤销,并发回联邦第九巡回法院重审。关于数据抓取行为合法性的争议再起波澜。
该案要追溯到2017年HiQ Labs对LinkedIn提起的诉讼。LinkedIn是微软旗下全球最大的职业社交网络平台,注册用户总数在全球超过7亿。根据LinkedIn的网站设置,当用户在LinkedIn建立个人档案时,他们可以自主设定档案隐私级别。如果用户设定其档案全网可见,那么任何人均可访问用户的教育背景、工作经历和技能等信息。HiQ Labs则是一家小型数据分析公司,其商业模式依赖于爬取LinkedIn用户的公开资料。该公司利用公开数据创建企业分析工具,为雇主企业客户提供雇员分析服务,以帮助雇主企业留住人才。
随着越来越多的公司爬取LinkedIn的数据,LinkedIn采取包括禁用违规者账户在内的禁止措施。然而,HiQ Labs通过利用代理服务的方式来掩盖他们进行爬取行为的IP地址,从而规避了LinkedIn对于这些IP地址的阻止措施。在允许HiQ访问并使用其数据五年之后,LinkedIn在2017年5月向HiQ Labs正式发出禁止通知函,称HiQ抓取LinkedIn数据的行为“未经许可和未经授权”,涉嫌违反了《计算机欺诈与滥用法案》(Computer Fraud and Abuse Act, “CFAA”),并通过技术手段阻止HiQ访问LinkedIn页面。对此,HiQ Labs于2017年6月向北加州地区法院提起诉讼,随后申请临时禁令,以禁止LinkedIn阻止HiQ Labs访问其数据。
北加州地区法院同意了HiQ Labs的指控。2017年8月,法院发布禁令,禁止LinkedIn拒绝HiQ访问LinkedIn用户个人资料的公开数据,要求LinkedIn在24小时之内移除任何禁止HiQ访问、复制或使用LinkedIn公开数据的阻断手段。
LinkedIn对此判决不服,提起上诉,但未能改变结果。2019年9月9日,美国联邦第九巡回法院作出上诉判决:维持北加州地区法院就HiQ Labs诉LinkedIn案颁布的裁决。然而,2021年6月14日,美国最高法院针对LinkedIn Corporation v. HiQ Labs, Inc.的上诉案件裁决撤销判决,该案现被发回美国第九巡回上诉法院重审,LinkedIn或许有机会夺回对用户数据的控制权。
HiQ Labs诉LinkedIn案件的关键点有二:一是HiQ爬取公开数据行为本身是否合法;二是LinkedIn公司的反公共数据抓取行为是否构成垄断。对于爬取行为是否合法,本案法官认为,首先,1984年通过的CFAA必须根据其制定的历史背景进行解读,而CFAA的立法目的并不包括管制互联网上的公开访问行为;其次,网络具有“公共广场”性质,公开数据存于网络公共空间中,任何人均可访问和利用。而关于LinkedIn的行为是否抑制了竞争,HiQ指控LinkedIn的行为从以下两个方面违反了美国反托拉斯法的精神。首先,LinkedIn不公正地利用了其在职业社交网络市场中的优势地位,以确保其在数据分析市场中获取竞争优势;其次,LinkedIn的行为违反了“必需设施原则”,即垄断或试图占据垄断地位的企业控制了市场准入的关键设施以阻断竞争对手进入市场。因此,HiQ Labs认为LinkedIn的行为属于加州《反不当竞争法律》所规定的不公平竞争行为。
此案对于数据抓取的合法性问题影响深远,它涉及我们这个时代最重要的数据和隐私问题之一,即数据抓取的边界在哪里。在本案当中,第九巡回上诉法院确认了这样的观点——抓取不需要授权即可访问的数据和默认情况下免费可得的数据都是正常的行为;没有对数据的“访问”采取某些步骤进行限制,便意味着抓取这些数据已经获得“授权”。而在此前这两个案件(Power Ventures案和Nosal案)中,法院认为,访问数据前如果有登录环节,那么这些数据就是私有数据而非公共数据。
该案对于争论不休的数据和隐私的归属问题也进行了讨论。从第九巡回上诉法院的裁决来看,其认为用户才是数据的所有者,平台只是依据用户的授权才使用这些数据,而不能完全拥有这些数据。
数据抓取之争亦是我国当前层出不穷的数据纷争热点。我国的经典案例是新浪微博起诉脉脉抓取微博用户信息案。2016年,新浪微博认为脉脉在与微博合作期间违反了微博授权范围,同时也未经用户许可,非法抓了用户教育、职业以及手机号等个人信息,并使用手机信息和微博用户头像进行匹配,因此构成非法抓取行为和非法使用行为。最终,脉脉败诉。法院判决认定,第三方平台要利用类似open API模式(相当于使用其他社交账户登录)获取其他社交账户平台用户信息时,就必须坚持“用户授权”+“平台授权”+“用户授权”三重授权原则,而脉脉没有取得用户同意就获取用户信息,违反了“用户授权”,因而具有不正当性。
通过案例比较可见,中美两国在数据爬虫的合法性上有不同解释。美国法院认为爬取公开数据无需获得授权即可进行,而中国法院坚持即使是爬取公开的原始数据也需要获得“三重授权”。但是,从近日LinkedIn Corporation v. HiQ Labs, Inc.一案发回重审即可看出,美国法院对于数据抓取行为的规制似乎有着逐渐趋于严格的意见导向,但由于用户与平台之间的数据权限界定标准、用户数据的跨平台流动涉及不同的数据分类、使用场景、用户意愿和平台地位等因素,需要观察案件后续进展以及综合更多的案例分析才能得出清晰的判断。(中新经纬APP)
原文链接: http://www.zdm5.com/article-203000.html
本站声明:网站内容来源于网络,本站只提供存储,如有侵权,请联系我们,我们将及时处理。