cookie|禁Cookie,挺FLoC:谷歌下了一盘什么棋

(图片来源:IC Photo)
【超级平台】
陈永伟/文
近日 , 谷歌宣布 , 从明年开始 , 其旗下的Chrome浏览器将逐步淘汰现有的第三方Cookie技术 , 并且不再会研发类似新技术或采用替代的方法来对用户行为进行追踪 。
这个消息一经披露 , 就在各界引发了震动 。 尤其是在在线广告行业 , 这个消息的发布被认为会对整个行业产生颠覆式的影响 。 但是 , 如果我们持续关注谷歌的动向 , 就会知道这个消息严格来说并不是什么新闻 。 早在2020年1月 , 谷歌就曾经宣布将在两年内停止Chrome浏览器对第三方Cookie的支持 。 从这个意义上讲 , 这次的消息其实只是对去年消息的重申和确认 。 不过 , 在去年的消息中 , 谷歌并没有提及在取消对Cookie的支持后 , 是否会采用其他方式来追踪用户行为 , 因而很多人认为 , 谷歌放弃Cookie应该只是一种技术的更新 。 但在这次的消息中 , 谷歌却十分明确地否认了这种可能性 。 这一点 , 多少还是令人有些意外 。
所谓Cookie , 就是用户访问的web网站向浏览器发送的大小不超过4kb小型文本文件 。 当用户访问某个web站点时 , 站点会对其产生一个唯一的ID , 并以Cookie文件的形式储存在用户的浏览器中 。 此后 , 用户对该站点的访问行为都会被记录在这个文件中 。 Cookie技术最早是由网景(Netscape)发明 , 并率先应用到其Navigator浏览器中的 。 后来 , 微软也在自己的IE浏览器中使用了Cookie技术 。 不久之后 , 万维网协会将这项技术作为了行业标准进行推广 。 现在 , 绝大多数浏览器都支持Cookie , 或者至少兼容Cookie技术的使用 , 而几乎所有的网站设计者都使用了Cookie技术 。
从设计初衷看 , Cookie技术的发明是为了给用户提供更好的使用体验——采用Cookie技术 , 用户可以更为便利地实现Web中的用户认证 , 还可以让网站更好地为自己提供个性化的服务 。 但在现实中 , 搜集用户信息却成为了这项技术的最重要用途 。 只要对用户浏览器中的Cookie进行分析 , 就可以清楚地了解用户的上网行为信息 。
对于在线广告等行业来讲 , 得自Cookie的信息是十分宝贵的 。 上网行为是用户偏好的最直接体现 。 很多时候 , 用户会对自己的真实偏好避而不谈 , 但在上网过程中 , 这些偏好会十分直接地体现在网站访问的记录上 。 通过对这些信息进行挖掘 , 就可以推断出用户的个人偏好 。 在获得了用户的偏好后 , 再投其所好 , 对用户进行定向广告投放 , 就可以让广告实现更高的转化率 。
由于Cookie是存储在浏览器中的 , 因而浏览器的提供者就可以十分容易地通过技术手段获取这些信息 , 然后用于定向广告或其他个性化服务 。
在现实中 , 谷歌就是采取这一商业模式的典型代表 。 众所周知 , 谷歌是当今世界上首屈一指的在线广告公司 , 这和其精准的广告推送能力分不开的 。 而谷歌之所以能够实现广告的精准推送 , 主要是因为其掌握了大量的用户行为数据 。 这些行为数据除了来自于谷歌搜索外 , 另一个重要来源就是谷歌旗下的Chrome浏览器 。 根据数据调查机构AdDuplex的数据 , 去年8月时Chrome在全球浏览器市场上的份额达到了70%以上 。 正是寄存在这些Chrome浏览器中的Cookie文件为谷歌提供了大量反映用户偏好的信息 , 为提升谷歌广告的精准性作出了巨大的贡献 。
很显然 , 在现有的技术条件下 , 谷歌停止对第三方Cookie的支持很可能会对自己的业务和整个广告行业产生巨大的影响 。 一些谷歌的支持者认为 , 不惜牺牲利润 , 放弃对用户信息的追踪是谷歌为维护用户隐私而作出的一个巨大努力 , 是其担当的体现 。 而另一些观点则认为 , 谷歌的这番举动其实只是对自己主导的行业进行洗牌 , 其目的是为了进一步巩固其在在线广告上的地位 。 这些观点究竟谁对谁错?谷歌究竟会不会因为放弃支持Cookie技术而遭受损失?谷歌的这个决定又会对整个行业产生怎样的影响?关于这些问题 , 我们还得细细说来 。
禁用Cookie , 究竟会伤了谁
要回答谷歌禁止第三方Cookie会对其自身的广告营收产生怎样的影响 , 我们有必要先对整个在线广告市场的产业状况有一个比较直观的了解 。
从总体上看 , 整个在线广告市场上的业务可以分为“买方”(BuySide)和“卖方”(SellSide)两大类 。 “买方”业务的中心是广告商(Advertiser) , 它是负责广告制作的人或企业;而“卖方”业务的中心则是发行商(Publisher) , 它是广告位的提供者 。 一个广告从被广告商设计制作出来 , 到最终通过发行商展示给用户 , 需要经过很多环节 。 无论是广告商还是发行商 , 要独自完成这些环节都需要花费很大的成本 , 在经济上并不划算 。 因此 , 市场上就衍生出了很多为广告商和发行商服务的业务 。
所谓的“买方”业务主要是为广告商服务的 , 它包括广告商adserver和DSP(即需求方平台 DemandSidePlatform的简称)等 。 其中 , 广告商adserver是负责把广告投放到网站的服务器 , 通常会对广告的点击等进行追踪记录;而DSP则是负责为广告商整合各种供给方的信息 , 并通过算法帮助其规划广告的成本收益 。
所谓的“卖方业务” , 则主要服务于发行商 。 与买方业务对应 , 卖方业务包括发行商adserver、SSP(即供给方平台SupplySidePlatform的简称)等 。 这里 , 发行商adserver是主要负责发布广告位信息的服务器;SSP则是为发行商整合需求方信息 , 并利用算法帮其进行规划的平台 。
那么 , 谷歌在整个在线广告业务中扮演了怎样的角色呢?答案是 , 它几乎同时扮演了除广告商之外的所有角色 。 首先 , 谷歌本身就是一个重要的发行商 , 它的搜索结果 , 以及旗下的Youtube都是十分重要的广告展示位置 。 其次 , 谷歌也是一个重要的“卖方”服务商 。 根据英国竞争与市场管理局(CompetitionandMarketsAuthority , 简称CMA)于2019年发布的一个报告 , 谷歌在全球发行商adserver市场上占据的份额超过了90% , 而在SSP市场上的市场份额则在40%到60%之间 。 再次 , 谷歌在“买方”业务市场上的角色也不可忽视 , 其在DSP市场商的份额大约在50%到70%之间 。
直观上看 , 如果谷歌禁止了对Cookie的使用 , 那么其在广告产业链上的各个环节都会受到影响 。 一方面 , 它可能会影响其自身提供的广告对消费者投放的精准性 , 从而降低其作为广告发行商的收入 。 另一方面 , 它也可能影响其提供的第三方服务的质量 , 从而降低其作为广告科技提供商的收入 。 不过 , 如果我们细细分析 , 就会发现从数量上看 , 这种影响或许未必有我们想象的那么大 。
先看作为广告发行商的收入 。 目前 , 谷歌提供的广告有很多种 , 其中最为重要的是搜索广告 。 根据谷歌的财报 , 其2020年搜索广告的营收达到了1041亿美元 , 占了广告总营收的70% 。 对于搜索广告来讲 , 用户自身的偏好其实并不是特别重要 , 因为用户在搜索一个关键词时 , 他已经很好地暴露了其在当时最急于了解的信息 。 作为发布商来讲 , 谷歌只需要根据关键词搜索频率的多少 , 做好对这些关键词的定价即可 。 除了搜索广告外 , 诸如视频广告、展示广告这类被动的广告形式 , 只需要根据客户的需求在指定位置进行展示即可 , 无须针对受众的偏好作额外的发挥 。 真正需要用户信息的是近年来新崛起的发现广告和智能广告 , 这些广告要求根据消费者的偏好、即时所在位置等信息进行广告推送 。 这一块广告的潜力很大 , 但从目前看 , 其在谷歌的广告版图中所占据的位置还不是那么重要 。 从这个角度可以看出 , 即使完全取消了对第三方Cookie的使用 , 对谷歌作为发行商的收入影响也是相对有限的 。
再看其对于谷歌作为第三方服务提供商的影响 。 很显然 , 这一决定对于卖方业务的影响并不大 , 因为对于卖方业务来说最为重要的是买方 , 也就是广告商的需求状况 , 而Cookie对于了解这些信息并没有很大的帮助 。 真正可能产生影响的 , 是对于谷歌在买方服务市场上的业务 , 因为对于买方而言 , 用户的信息是比较关键的 。 不过 , 考虑到这一块收入在谷歌的营收中所占比例甚小 , 因此其总影响也应该不会太大 。
综合以上分析 , 不难知道 , 谷歌禁用第三方Cookie对于谷歌的广告收入所产生的影响总体上是可控的 。
需要指出的是 , 以上所有的分析都是建立在谷歌禁用Cookie之后就无法分析消费者偏好 , 进行或辅助进行定向广告推送的假设之上的 。 但这个假设并不成立 。 事实上 , 在宣布将停用Cookie的同时 , 谷歌已经开始用“群组联邦学习”(FederatedLearningofCohorts , 简称FLoC)来取代它 。
什么是“联邦学习”呢?简而言之 , 它是一种新型的 , 无需要求数据集中化就可以进行的机器学习模式 。 对于传统的机器学习而言 , 我们需要先搜集数据 , 把所有的样本集中在一起 , 才能进行学习 。 正是基于这种学习的模式 , 对Cookie上记录的信息进行搜集才是有价值的 。 而联邦学习呢 , 则和传统的学习正好相反 , 它不是把数据收上来 , 而是把算法放到用户那儿去 , 让算法在本地执行 , 然后直接把分析的结果传回给分析者 。 最后 , 算法再根据从所有用户传回的部分结果 , 综合分析出分析者所需要的最终结果 。 在整个学习过程中 , 数据的分析者所能接触的只有从用户数据分析出的结果 , 而不会接触用户的原始信息 。 正因为联邦学习具有以上特点 , 因此不少学者认为 , 这一技术的出现将会根本上解决数据集中和数据保护之间的矛盾 。
所谓“群组联邦学习” , 则是联邦学习技术的一个具体应用 。 它可以根据用户的本地信息给用户分类 , 然后给其贴上对应群组的标签 。 例如 , 该用户是否是一个运动爱好者、是否爱好文学 , 如此等等 。 虽然相对于Cookie记录的信息来讲 , 这些标签所给出的信息是比较粗糙的 , 但对于广告推送来讲 , 这些信息已经足够了——唯一不同的是 , 过去的定向广告是定向地推送给特定的个人 , 而未来基于FLoC的定向广告推送给的却是特定的群体 。
谷歌内部曾经对基于FloC分类进行推送的广告和基于Cookie信息进行推送的广告的转化率进行过比较 。 结果显示 , 前一类推送所实现的转化率已经达到了后一类推送的90%以上 。 这表明 , 采用FloC这种新技术 , 已经可以实现和目前相当的推送精准水平 。 用这种技术来替代原有的、基于Cookie的推送技术 , 完全可以保证谷歌的定向广告业务不受显著影响 。
不过 , 谷歌一旦在Chrome浏览器禁用了第三方Cookie , 其对于在线广告市场上除谷歌之外的参与者 , 尤其是独立实行 , 或辅助实行定向广告推送的企业的影响可能是致命的 。
例如 , 电商网站本来可以根据用户的Cookie来识别其购物偏好 , 在其再度访问本网站时向他们进行个性化的商品推送 。 而如果Cookie技术被淘汰了 , 这种个性化的推送就变得不可行了 。 当然 , 现在禁用Cookie还只是谷歌一家的决定 , 这个电商网站还可以从其他浏览器的Cookie获取相关信息 , 但这显然是难以持久的 。 一方面 , 现在Chrome在浏览器市场上占有巨大的份额 , 没有了来自Chrome用户的信息 , 推送的价值会降低很多 。 另一方面 , 可以想见 , 在Chrome禁用了Cookie后 , 其他品牌的浏览器在竞争压力之下也会随之跟进 。 到了那个时候 , 这家电商继续进行定向广告的行为就变得不再可能 。 或许 , 它还有一个选择 , 就是向谷歌申请由FLoC学习后的相关信息 , 然后基于这些信息来进行推送 。 但在这种情况下 , 它的地位就从了直接的信息搜集者变成了信息购买者 , 主动性完全在谷歌一边 。 谷歌完全可以根据自己的需要 , 对提供的相应数据索取价格 , 或者对特定的竞争对手拒绝开放数据 。 这样一来 , 一个原本旨在解决隐私问题的新技术就可能成为谷歌谋求市场力量、获取超额利润的工具 。
综合以上分析 , 我们可以大胆预测 , 被一些人视为是谷歌“自断经脉”的无私付出行为 , 从总体来看非但不会对谷歌的广告业务产生负面影响 , 反而有可能更加巩固其在广告市场上的地位 。 尤其是其旗下的定向推送广告业务 , 很可能在经过此次变革之后实现更为快速的发展 。 从这个角度看 , 谷歌是打了一张悲情牌 , 但事实上却可能是“闷声发大财” 。
FLoC:重大的进步还是可怕的主意
另外一个重要的问题是 , 谷歌禁用Cookie , 转而推广FLoC的决定 , 究竟能否达到其所宣传的保护用户隐私的目的?从目前公布的消息看 , 谷歌方面对其未来是十分乐观的 。 在他们看来 , 基于FLoC进行广告推送 , 是“隐私优先”和“基于兴趣”的 , “此举代表着广告业的一个重大变化 , 也是隐私保护的一个重大进步” 。 不过 , 很多批评者却表达了截然相反的观点 。 例如 , 安全专家PieterArtnz就在一篇文章中委婉地指出 , FLoC或许只是一种“更好的隐藏追踪技术” , 而数字隐私组织电子前沿基金会(Electronic Frontier Foundation)的技术专家Benett Cyphers则更是在自己的博文中把FLoC称为一种“可怕的主意” 。
为什么像FLoC这样一种并不直接搜集用户私人信息的技术会被这些专家认为依然具有泄露隐私的风险呢?很重要的一个原因是一种名为“指纹识别”(fingerprinting)的用户识别技术的出现 。
在现实中 , 我们为了识别一个特定个人 , 想了很多的方法 。 最早时 , 人们习惯于用人的名字来识别个人 。 但人可能重名 , 可能用假名 , 这些都会阻碍对于人的识别 。 后来 , 人们开始用一些标识身份的证件 , 例如身份证 。 但这同样有缺陷 , 因为身份证也可以造假 。 现在识别个人的最好办法是什么呢?答案是生物信息 。 例如 , 指纹、虹膜、人脸等 , 都可以很好地把特定的个人精确地识别出来 。
在网络世界 , 用户名可以类比于人的姓名 , Cookie可以类比于人的身份证 , 而“指纹识别”技术则可以类比于现实世界中的指纹识别 。 和人名一样 , 用户名的造假很容易 。 而用Cookie来识别用户呢 , 道理和用身份证识别客户一样 。 一个浏览器对应一个Cookie , 因此平台看到Cookie就可以马上找出它所对应的浏览器 。 不过 , 和身份证一样 , 用户也可以通过修改、变更或掩盖Cookie来隐瞒自己的身份 。 例如 , 用户只要换一台机器 , 或者换一个浏览器 , 就可以轻松骗过网站 。
不同于以上这些直接的识别方法 , “指纹识别”尝试采用多个维度的信息来识别个人 。 例如 , 它可能同时搜集IP地址、JavaScript、字体、Canvas、WebGL等容易体现出个性化的信息 。 以字体为例 , 其提供的信息通常会被人们忽略 , 但事实上它是非常个性化的 。 不同用户的字体设置在参数上往往会存在着非常微妙的、标识个人特征的差异 。 通过对所有的这些信息进行拼合 , 人们就可以构建出一个完整的人物画像 。 由于这个画像是建筑在各种细节之上的 , 所以在识别用户时非常有效——就像用生物信息识别个人一样 。
如果FLoC技术可以推广 , 那么每一个用户都会被贴上很多不同的群组标签 。 由于广告的需求成千上万 , 这些标签的数量也就可能随之成千上万 。 尽管我们无法从单个的标签识别出某一个用户 , 但如果手里的标签足够多 , 我们就可以精确地把每一个用户都十分精确地识别出来 。 一旦相应的维度数据发生泄露 , 那么用户就可能比在Cookie技术的时代更加难以保护自己的隐私 。 从这个角度看 , 谷歌禁止Cookie , 转而推广FLoC的决定可能是在解决了一个问题的同时 , 又引进了一个新的问题 。 究竟其真实的效果如何 , 还需要等待时间的检验 。
新时代 , 如何平衡隐私与竞争
【cookie|禁Cookie,挺FLoC:谷歌下了一盘什么棋】从理论角度看 , 此次谷歌停止支持第三方Cookie事件 , 事实上向我们提出了一个十分重要的问题:应该如何思考竞争与隐私保护之间的关系 。
本来 , 竞争和隐私保护一直是两个风马牛不相及的领域 , 但近几年来 , 随着大型科技公司凭借自身的市场力量侵犯用户隐私事件的频发 , 不少学者认为应该把两个问题放到一起来思考 , 并尝试用理论模型来分析这两者之间的关系 。
例如 , 一个比较有影响的理论认为 , 对消费者隐私的保护程度 , 本质上是互联网平台所提供的服务质量的一个维度 。 当一个平台具有市场支配地位时 , 它就可以强制用户对其侵犯隐私的行为予以默许——就好像在传统条件下 , 垄断企业可以随意抬升价格 , 或者降低服务质量一样 。 根据这个理论 , 那么对大型科技企业实施反垄断和对消费者的隐私进行保护这两个目标就是相互一致的 , 反垄断可以削弱大型科技企业的市场力量 , 从而使得它们不再可以随意地侵犯用户隐私;而反过来 , 加强隐私保护则是从行为入手 , 限制大型科技企业对其市场力量的滥用 , 在一定程度上遏制其市场力量的不断累积和强化 。 现在有一些学者主张用反垄断来解决隐私保护问题 , 或者主张用加强隐私保护来帮助反垄断 , 其理论依据正在于此 。
不可否认 , 从纯理论的角度看 , 以上观点确实很有启发性 , 但其在实践当中却是极具误导性的 。 尽管在某些时候 , 保护竞争和隐私保护这两者有一定的同一性 , 但在更多情况下 , 这两个问题却是不相关的 , 需要采用不同的措施来加以应对 。 我曾经在一篇文章中提出过一个极端的思想实验:如果把某个违规搜集用户数据、侵犯用户隐私的大平台一拆为五 , 是否会提升隐私保护程度呢?答案恐怕是否定的 。 事实上 , 这更有可能是把搜集用户数据的平台从一家变成了五家 , 反而会让用户的隐私面临更大的泄露风险 。 由此可见 , 通过单纯的反垄断、加强市场上的竞争 , 恐怕并不能解决隐私保护问题 。
从某种意义上讲 , 这次谷歌的决定 , 其实是把这个思想实验在真实世界中反过来提了一遍 。 它告诉我们 , 在某些情况下 , 大型平台企业甚至可以以保护隐私为理由 , 来让自己的市场优势变得更为稳固——当第三方的cookie被禁用后 , 谷歌从其应用生态获取的第一方数据就会更加有价值 , 其在广告科技市场的地位也就更加牢不可破 。
事实上 , 这已经不是大型科技企业利用隐私来巩固市场地位的第一个案例 。 不久之前 , 由于苹果升级隐私安全标准而发生的苹果与脸书的争议 , 也可以认为是苹果以隐私作为武器 , 对脸书这个竞争对手的一次排挤 。
可以预见 , 当人们对隐私的关切程度越来越高 , 平台之间利用隐私来排挤对手、限制竞争的情况有可能越来越频繁 。 如果是这样 , 那么更好的隐私保护和更为竞争的市场这两个目标之间就不再一致了 。 这时 , 要隐私还是要竞争 , 可能就需要进行更好的权衡 , 而竞争政策和隐私政策之间的关系恐怕也会变得更为微妙 。
据报道 , 脸书很可能会因为苹果提升安全标准的行为对其进行起诉 , 而谷歌禁用Cookie的决定也已经在英国受到了竞争和市场管理局(CMA)的调查 。 看来 , 新的隐私标准和新的隐私技术还没来 , 因其而起的新官司倒是马上就要来了 。

    推荐阅读