ego008 avatar

GitHub阻止了所有GitHub页面上的FLoC

🕙 by ego008

GitHub 宣布阻止所有 GitHub 页面上的FLoC,从 github.io 域提供服务的所有 GitHub Pages 站点都将设置一个 Permissions-Policy: interest-cohort = () 标头,使用自定义域的页面站点将不会受到影响。

FLoC(Federated Learning of Cohorts) “联合队列学习”

什么是FloC?

  • 在Covid-19型停火之后,CMA(美国军事委员会)开始调查“隐私沙盒”,ICO UK(英国信息专员办公室)再次调查不正当实时竞价行为。在国际上,板图正在移动,监管正在流入。Google需要走在它的前面。
  • 联合队列学习(FLoC)是一个专注于隐私的解决方案,旨在通过“聚集具有相似兴趣的大型人群”来发布相关广告。账户被匿名化,按兴趣分组,更重要的是,用户信息是在设备上处理的,而不是在网络上传播。
  • 谷歌正在谈论“基于Chrome FLoC提议中定义的原则”的模拟交易早期测试的结果。它相信自己有一个“有效的替代信号”来替代第三方cookie。它将在三月开放测试。
  • 该公司表示,与基于cookie的广告相比,它每一美元的付费转化率达到了95%。其有效性随聚类算法的强度和目标兴趣的强度而变化。
  • 谷歌将在3月份向公众开放基于FLoc的队列。到第二季度,广告商可以开始在谷歌广告中测试基于FLoC的队列。
  • 4月份发布的Chrome 90将首次为“隐私沙盒”提供控制。对于用户来说,这将是一个初始的开关决定,但进一步的定制将稍后进行。

当前谷歌 Chrome 浏览器开始对 FLoC(全称是 Federated Learning of Cohorts)早期测试以取代第三方 cookie,目前已在很多国家的用户当中进行了 FLoC 的开发者测试,之后会在全球范围内进行测试。由于 Chrome 支持多个不同的操作系统,所以也会在 Linux、Windows 及 MacOS 平台上测试。

FLoC 的特点

FLoC 是 Chrome 选择取代第三方 cookie 的方案,根据测试公告描述,其特点有下面 3 个:

  • FLoC 的工作原理是将数千名具有相似浏览历史的用户归为一个 "用户群( cohort )",这个 "用户群" 是通过设备上的机器学习分析你的网络浏览历史而创建的。你所访问的网站列表不会暴露出来(联合学习),只有 "用户群 ID "会暴露并用于广告。
  • 与第三方 cookie 不同,FLoC 不会进行单独跟踪,且不会与 Google 或任何人分享用户的浏览历史。
  • Chrome 浏览器不会创建它认为敏感的用户群。在一个用户群成为合格的用户群之前,Chrome 浏览器会对其进行分析,以了解该用户群是否以较高的频率访问了具有敏感主题的页面,例如医疗网站或具有政治或宗教内容的网站。如果是这样,Chrome 会确保该用户群不被使用。

FLoC 在广告中的应用

FLoC 是 Google 在保护用户隐私与广告利益之间,提出的解决方案之一

FLoC想要解决的问题是,当今天没有第三方cookie之后,广告主要如何针对有特定兴趣的用户投放广告?这个问题是属于我们第一段所列出的第二种广告类型。当不同用户造访不同网站时,浏览器会根据用户浏览的内容,将用户分配到某个群组(cohort)。背后的分配机制是透过Google所开发的FLoC API。这边值得一提的是Google选择的SimHash演算法,这个演算法有几个特色和优点:

  • 每个使用者的cohord id 是可以在装置端被独立计算出来,和其他用户的资料不会共享。
  • 有类似浏览纪录的使用者,又很有可能会得到相同的cohort id。也就是说,同一个cohort 中的使用者,会有类似的兴趣。
  • 因此,不需要有一个中心化的伺服器来计算使用者的cohort id
  • 缺点是,每个cohort 的大小无法事先决定。当cohort 太小时可能就造成有隐私性的疑虑。不过这个问题好解决,透过增加一个伺服器来即时追踪每个cohort 的大小,当今天发现cohort 太小时,API 可以拒绝来自浏览器的请求。让使用者可以隐密的隐藏在一个群体之中。
  • 另外还有其他优点例如比起复杂的机器学习模型,更为清楚易懂且很透明,不会放入一些特定的参数。要推行至整个广告ecosystem 也会相对容易。另外,所需的计算资源也低。

市场对于 FLoC 的反应

在Google公布FLoC初步的结果之后,市场上的反应如何呢?多位广告领域的专家对于FLoC的看法,大部分都是对FLoC可以达到的效果存疑,并且担心这会更为巩固Google在数位广告的垄断地位。

互联网大致分为3个。排名前100的网站获得的页面浏览量为三分之一,其余排名前10k的网站获得的浏览量则为三分之一,数百万个网站获得的访问量则为最后的三分之一。

前100名拥有专门的工程和政策团队,由于他们对广告不感兴趣(Wikipedia)或拥有不需要 FLoC 的第一方实施,他们将禁用FLoC。他们将放弃FLoC。

接下来的10k可能会有可以进行更改的工程团队,但可能更想了解他们的受众群体,以便他们更轻松地获利。他们会保留FLoC。

至于剩下的几百万,只有一小部分人甚至会知道这是一件事情,更不用说足够小心进行更改或联系可以进行更改的开发人员了。这些人是与GoDaddy一起托管其wordpress网站的人,因为当他们需要一个网站时,它既便宜又快速。他们会保留FLoC。

因此,结果是 github.com、instagram.com 和 amazon.com 可能会退出,但绝大多数网络都不会这样做。以后结果可能是:用户加载的所有网页中至少有一半没有此标头。

参考

💘 相关文章

写一条评论

Based on Golang + fastHTTP + sdb | go1.17.1 Processed in 2ms