研究:全球顶级网站如何跟踪您的在线行为

研究:全球顶级网站如何跟踪您的在线行为

7月底,Google终于让我们更仔细地了解了Manifest v3,它是Chrome扩展程序工作方式的修订版。由于担心此更新会窃取广告拦截器的大部分功能,因此该更新引起了很大争议。尽管我们和下一个人一样不喜欢广告,但我们认为隐私是一个更大的问题。

很容易理解,我们正在互联网上被观看,但是很难感觉到。在黑暗中没有阴暗的人物凝视着我们的屏幕,在Facetime上我们也听不到静音的呼吸。然而,在线世界清楚地知道我们要在亚马逊上购买哪双鞋(因为它还在不断重复),而这仅仅是开始。

鉴于有争议的Chrome更新,我们决定仔细研究一下世界上50个最受欢迎的网站(根据SameWeb),以了解我们的活动被跟踪了多少。有些网站确实很糟糕,而有些网站则相当不错-显然,色情行业比构成互联网骨干的某些公司更尊重您的隐私。

如何在线跟踪您?

大多数网站使用很少的称为“ cookies”的文本文件来启用某些功能-网站通过读取它们来记住您的登录凭据,您已阅读的文章,您的语言偏好设置等。这些文件存储在您的硬盘中,称为“派对Cookie,因为它们是由您访问的网站提供给您的。但是,它们(通常)并不是您访问网站时获得的唯一cookie。

为了帮助通过其网站或服务获利,许多网站都依赖广告和分析工具。这样,他们允许第三方在其网站上运行脚本,并且这些第三方还在您的设备上创建cookie。与更温和的第一方Cookie不同,这些Cookie可以将您从互联网上的某个地方跟踪到另一个地方。

让我们来看看Google的广告服务之一-DoubleClick。在我们查看的前50个网站中,有18个使用DoubleClick的服务。假设您访问了DoubleClick服务的站点之一-Reddit。现在,您将获得一个具有唯一标识符的Cookie,看到广告的时间,您的IP地址以及看到广告的网站位置–一个家装子目录。稍后,您转到Twitch.tv,该网站也使用DoubleClick,因此可以读取设备上的原始cookie。您的唯一标识符将您的两个兴趣(房屋装饰和视频游戏)联系在一起,并提高了DoubleClick的定向广告准确性。这听起来可能很抽象,但实际上并非如此。

Google无所不在,规模巨大,这是一个诅咒,但也是一种祝福–他们很难做任何太过分的事情。对于成千上万的小型广告商和网络分析服务来说,情况并非如此,整个互联网,尤其是前50名网站。例如,Google不会将收集到的原始数据出售给第三方,但许多其他公司会出售。实际上,这通常是重要的收入来源。

Cookies并非企业跟踪消费者的唯一方式。在过去的十年中,该领域进行了许多创新,因此有许多工具可以帮助您保持关注。这包括:

网络信标。这些是大小为1像素的透明图像,必须从与托管您正在访问的网站的服务器不同的服务器中检索。通过检索它,您的浏览器会提供某些信息-您的IP地址,浏览器类型和其他信息。Web信标与cookie一起广泛使用。

Flash cookie(本地共享对象)。与常规Cookie相似,它只能保存更多数据,更持久,更难以清除。它们因用于创建僵尸cookie而臭名昭著,在这种情况下,Flash cookie被用作常规cookie的备份,因此可以在删除后将其恢复。

HTML5本地存储。在某些情况下,HTML5引入的功能可用作常规cookie的替代方法。

缓存的内容。为了节省加载时间,浏览器会缓存内容并根据服务器提供的到期标头重置缓存。这可以用来(并且正在被用来)推断用户何时已经访问了某个网站。除非您要不断删除缓存,否则很难避免。

画布指纹识别。HTML5的另一个功能– Canvas API使JavaScript能够在浏览器上绘制图像(并读取图像)。不同的GPU,不同的驱动程序和其他系统特征导致不同的图像。事实证明,这些图像有足够的差异,可以帮助识别单个计算机。

更糟的是– 100个良性跟踪器或1个不良跟踪器?

我们的文章根据跟踪器的数量对网站进行排名。这种选择的主要原因是简单性,但除此之外,还有更多。从隐私的角度来看,几乎所有跟踪器都会或多或少地减少您的隐私,因为它们都会增加您在网络上的足迹。而且,即使它们本身是良性的,它们使用的某些服务可能不是。

的确,并非所有的追踪器都是平等的,但是许多隐私政策中的法律法规使人们很难衡量差异。因此,我们认为跟踪器的数量是更客观的度量单位。

关于下面提到的第三方供应商的简要说明

通过浏览前50个网站上的跟踪器,我们选择了一些来说明有关跟踪网络技术所固有问题的几点。这些不一定是在这些网站上发现的最糟糕的隐私跟踪器,当然也不一定是最糟糕的整体。

前50名的故事

在前50个网站中,我们从132个不同来源中找到了459个第三方跟踪器。这意味着,通过访问这50个网站,您可以将访问广播到至少182个实体。实际上,这个数字要高得多,因为首先,这些第三方中的大多数与至少其他几个第三方共享数据。

其次,cookie同步(在不同平台之间共享用户数据的做法)意味着保守的182可能与事实相去甚远。

但是,并非前50名中的所有网站都是平等的,因此,让我们仔细研究一下您访问这些网站时所传递的一些详细信息。

谁拥有最多的第三方跟踪器?

前50名中并不缺少Cookie和像素,但是这里有10个拥有最多第三方广告的明确清单。这些是按照出现的顺序:

研究:全球顶级网站如何跟踪您的在线行为

Mail.ru:61个第三方跟踪器

Mail.ru是俄罗斯最大的科技公司,拥有许多不同的饼干罐。首先,他们拥有俄罗斯最大的社交媒体网站,例如VK.com和ok.ru。Mail.ru是一个做很多事情的网站,其中不仅包括传递新闻,而且在线新闻门户网站获利的主要方式之一是通过广告。因此,Mail.ru在首页上拥有多达54个广告跟踪器也就不足为奇了。

其中一些对收集和使用个人识别信息甚至敏感数据(例如健康信息,宗教,政治背景等)毫不犹豫。例如,PulsePoint(医疗保健广告服务和信息平台,依靠对个人细节的了解而生存和死亡)和Quantcast(以过去使用僵尸Cookie而臭名昭著)。

不用说,无论用户使用的是第三方服务,用户都应对自己在大型俄罗斯网站上的隐私持怀疑态度。来自Mail.Ru之类的俄罗斯公司的数据涉及国家利​​益,在俄罗斯,国家利益优先于个人自由。

Accuweather.com:59个第三方跟踪器

全球最受欢迎的天气网站和应用程序在竞争中排名第二,以获得更多广告跟踪器。它有51个,其中一些来自大型的知名广告商(例如Google,Facebook,AOL,Adobe和Yahoo),其他的则来自鲜为人知的黑手党。

DataXu为例,它看起来像是常规的有针对性的广告供应商。但是,在他们的隐私政策中,您会发现以下内容:

“有时,我们的客户在dataxu投放到网站的广告中包含自己(或合作伙伴)的像素或类似技术。”

他们继续解释说,这些“客户”的做法不属于DataXu隐私政策的管辖范围。换句话说,DataXu充当特洛伊木马,允许无名的第三方以有限的责任来监视您。

AdGear并没有好多少。这是一个采样器:

“我们与第三方共享有关消费者的某些个人信息,这些第三方向我们提供信息,以便在使用我们的技术的网站和应用程序上进行有针对性的广告。”

这听起来非常含糊,可以在与第三方共享个人信息的任何情况下使用。

Ebay.com:37个第三方跟踪器

像许多在线市场一样,Ebay在很大程度上依靠广告来通过其网站获利。该公司在过去十年中的衰落势头根本没有帮助。Ebay具有来自Google,Facebook,Adobe,AOL和Yahoo等行业巨头以及小型供应商的跟踪器。

例如,Videology是一家总部位于英国的视频广告供应商,拥有详细的《隐私权政策》文档并提供了深入的说明。虽然这很棒,但Videology还犯下了允许第三方使用其广告进行跟踪的罪过。此外,他们还将保留部分收集的数据,最长可达2年。

Ebay还使用5种不同的网站分析服务,其中ScoreCard Research Beacon是其中之一该供应商不做有针对性的广告,而是使用Cookie,像素,标签收集信息,并与客户共享“报告,研究和信息产品”。隐私政策对于他们收集哪些信息以及他们提供给客户的这些报告中包含哪些内容有些含糊。

这种情况与Live Intent相似,就像上面的ScoreCard Research Beacon一样,它不投放广告,而是收集和共享数据以帮助广告主(和其他人)。Live Intent的隐私权政策似乎暗示这可能是原始数据,而不是经过处理的报告。用户有值得关注的理由,因为在这里不知道谁使用数据,消费者无法检查如何使用它。

这种情况与Live Intent相似,就像上面的ScoreCard Research Beacon一样,它不投放广告,而是收集和共享数据以帮助广告主(和其他人)。Live Intent的隐私权政策似乎暗示这可能是原始数据,而不是经过处理的报告。用户有值得关注的理由,因为在这里不知道谁使用数据,消费者无法检查如何使用它。

OK.ru:35个第三方跟踪器

Odnoklassniki是Mail.Ru集团所有的俄罗斯社交网络,这使其成为俄罗斯最大的互联网公司的一部分。在这种情况下,讨论特定的第三方似乎毫无意义:可以理解的是,至少在涉及政府重要问题的地方,大型俄罗斯网站的用户没有隐私。

Fandom.com:33个第三方跟踪器

Wiki托管服务(以前称为Wikia和Wikicities)是一个Wiki托管服务,该站点包含许多电影,电视节目和游戏的百科全书。该网站从广告中赚了很多钱,考虑到网站上25个与广告相关的第三方,这一点应该很清楚。Fandom还使用其他外部服务–网站分析(5个跟踪器)和2个跟踪器来促进客户交互。

Fandom网站上出现的两个著名的跟踪器名称是BlueKaiDatalogix,它们都是Oracle数据云的一部分。BlueKai负责获取数据以帮助进行广告定位(即跟踪您正在访问的网站,从而确定您的兴趣所在),与此同时,Datalogix提供有关营销离线成功的信息(告诉广告客户在看到某个广告后有多少消费者购买了产品广告)。

如果您想知道Datalogix如何做到这一点,那么答案至少部分取决于超级市场会员卡收集的数据。换句话说,这是您和超级市场之间的某种令人毛骨悚然的连接。

Amazon.com:24个第三方跟踪器

世界上最大的在线市场使用许多第三方跟踪器的服务。您会看到前50名中许多网站上的一些名称(例如,Aggregate Knowledge,Advertising.com或BidSwitch),还有一些我们已经说过的不好的话(PulsePoint,BlueKai )。但是,有关Amazon的要点是Amazon本身如何跟踪您的行为。

您的用户个人资料,搜索查询和愿望清单就是一个明显的例子,但是有一些跟踪您可能未曾考虑过的用户的途径。亚马逊的流媒体服务(例如Amazon Prime)就是一个很好的例子。像亚马逊生产的各种小工具一样,Kindle,Fire TV Stick和Echo只是其中几个著名的例子。

为了对此进行扩展,我们可以说亚马逊在利用其亚马逊网络服务(AWS)中的所有这些客户数据方面取得了巨大的成功。通过简单的API,AWS的客户能够访问和使用支持Amazon产品的深度学习技术。因此,我们可以说在零售单板下,亚马逊隐藏着一个与数据息息相关的业务,而与您的隐私无关

前50名中最多产的间谍

不出所料,Google追踪器是迄今为止排名前50位的网站中数量最多的网站-我们总共发现了97个(超过所有追踪器的20%)。Facebook 以18个追踪器排在第二位。这通常代表整个互联网。这是最受欢迎的第三方的完整列表:

研究:全球顶级网站如何跟踪您的在线行为

对于其中一些公司,cookie和像素只是它们收集有关用户数据的众多方式之一。例如,谷歌还有许多其他资源可以依靠,从Gmail和YouTube开始,再到Android设备开始,到Chrome结束为止。同时,Facebook本质上是一个个人信息数据库。

发表评论

电子邮件地址不会被公开。 必填项已用*标注