违反
重磅炸弹:私人情报平台如何泄漏4800万个人数据记录

重磅炸弹:私人情报平台如何泄漏4800万个人数据记录

 UpGuard团队
UpGuard团队
2018年4月18日发布
加入27,000多个网络安全通讯订阅者

UpGuard 网络风险 团队现在可以确认,一个包含属于LocalBlox(个人和企业数据搜索服务)信息的云存储库已公开访问,从而暴露了从多个来源收集并收集的数千万个人的详细个人信息记录,共记录了4,800万条。

这些数据包括姓名,实际地址,出生日期,来自LinkedIn和Facebook的抓取数据,Twitter句柄等。 LocalBlox的联合创始人Ashfaq Rahman,该公司自称为“世界'的“关于企业,消费者和地理受众的最全面的跨设备身份图表”,向UpGuard确认公开的信息属于他们。

在之后 Facebook / Cambridge Analytica崩溃,大量的重要性 心理数据 越来越明显。公开的LocalBlox数据集将标准的个人信息(例如姓名和地址)与有关该人的互联网使用情况的数据(例如,他们的LinkedIn历史记录和Twitter提要)结合在一起。这种结合开始为每个受影响的人构建三维图,包括他们是谁,他们在谈论什么,他们喜欢什么,甚至他们为谋生而做的事情—本质上是一个蓝图,可以从中创建有针对性的说服性内容,例如广告或政治竞选活动。如果数据的合法使用不足以让用户停顿一下,则非法使用的范围包括传统的身份盗用,欺诈,弹药 社会工程学 骗局,例如 网络钓鱼 .

发现

UpGuard网络风险团队于2018年2月18日发现了位于子域“ lbdumps”的Amazon Web Services S3存储桶,该存储桶可公开下载并配置为可通过Internet访问。该存储桶包含一个151.3 GB的压缩文件,该文件在解压缩后显示为1.2 TB ndjson(以换行符表示的json) 文件。头文件中的元数据指向LocalBlox作为所有者。下载并开始分析此超大数据文件之后,UpGuard网络风险小组于2月28日通知了LocalBlox有关该漏洞的信息;那天晚些时候,水桶被固定了。

文件名提供了一些指示内容:“ final_people_data_2017_5_26_48m.json”。如提示所示,该大文件包含4800万条记录,每条记录均为json格式,并用新行分隔。该主列表证实了从各种来源收集的有关个人的信息。公开数据的广度包括个人姓名,实际地址,出生日期,LinkedIn职位历史记录刮擦,Facebook公开数据以及个人Twitter处理等信息。此外,在此过程中似乎还使用了著名的房地产网站Zillow,并且信息从服务中以某种方式被混合'将清单添加到更大的数据池中。该数据库似乎可以通过跟踪IP地址来工作,将收集到的数据与该IP地址匹配(如果有),从而在该IP地址上提供用户行为和背景的更清晰的图像。 

 人
的形象"final_people_data"存储库中的文件。

同样令人感兴趣的是公开的源字段,这些字段提供了一些数据碎片从何处收集的指示。有些是相当明确的,指向聚合的内容,购买的营销数据库,甚至是发薪日贷款运营商出售给寻求营销数据的企业的信息缓存。其他字段则更为神秘,例如标有“ ex”的来源字段。

数据中包含几个Facebook数据点,这些数据点由数据集中存在的此类查询填充。在那种情况下<query> and <email>该字段填充了该人's name and 电子邮件 address:

"term":"[name:>http://www.facebook.com/search.php?q=<query>,, 电子邮件:>http://www.facebook.com/search.php?init=s:email&q=<email>&type=users]

与这些查询关联的一些数据点包括 图片,技能,lastUpdated,公司,currentJob,familyAdditionalDetails,收藏夹,mergedIdentities, 和一个标有 全部句子 其中包括搜索结果中的其他文本。该文本包含的结果表明该信息是从Facebook html抓取的,而不是通过API收集的。例如,一条记录中的文本似乎来自2016年的Facebook页面页脚:

英文(美国),西班牙文,法兰西(法国),ä¸ææ‡(ç:registered:€ä½“),العربÙ​​ŠØ:版权所有:,Português(巴西),义大利语(Italiano),伊利诺伊州(Italieno),德意志(Deutsch),हिऀ¥,दी,æ-¥æœ¬èªž,","注册登录MessengerFacebook LiteMobile寻找朋友人页面地点游戏地点","名人团体时刻Instagram关于创建广告创建页面开发人员职业隐私隐私Cookies","广告选择条款帮助设置活动日志","FacebookÂ:版权所有:2016年"

该数据强调了Facebook数据的易用性,以及心理数据集中Facebook信息的普遍性。根据他们的网站,“ LocalBlox是第一个大规模搜索,合并和验证深层业务和人员资料的全球客户智能平台。”公开的数据不仅是客户列表,还包括LocalBlox提供的产品。他们关于其数据力量的价值陈述为深入了解为何暴露此类数据极其危险提供了一些见解。根据LocalBlox网站的说法,“对于更深入,更准确的有关单个企业和消费者的数据的需求变得越来越迫切。”此数据很有价值,因为它可以有效地使用,并且如果恶意使用,此功效可能会变得危险。

意义

社会对数据暴露及其后果的意识与全球众多组织正在汇总,存储,运输和复制的数据集的范围同时增长。 LocalBlox数据集的大小为1.2 TB,包含数量较少或相近的4800万条记录。来自诸如Facebook之类的社交媒体网站的抓取数据的存在也凸显了一个重要事实:经常被广泛使用的网站所持有的数据可能会成为未知的第三方的目标,这些第三方试图通过这些信息获利。在这种情况下,目标网站(如Facebook)和任何受影响的用户都将受到伤害,因为委托给社交网络的个人信息将被抢劫,目的是利用一个没人知道的平台。

更重要的是,在定向营销的背景下,即如何最好地说服他们,在这些人身上收集的数据将他们的身份,在线行为和活动联系在一起。正是这种有说服力的因素,是有关如何收集和出售数据的讨论的核心:当大规模汇总在一起时,您的心理数据就可以用来影响您。这就是使这种性质的曝光如此危险的原因,并且不仅推动了LocalBlox的业务模型的发展,而且推动了整个数据分析行业的发展。正如它在LocalBlox网站上所说的那样,“数据和分析市场正在蓬勃发展,"这反映在该网站使用的广告文案中。

屏幕截图2018-04-17 at 11.28.03 PM
LocalBlox网站。

出于对数据收集,处理和转售的这种商业兴趣,毫无疑问,世界上存在如此众多的海量且具有侵入性的数据集,为公司和政党提供了如何影响人们的详细蓝图。 

奇怪的是,这些数据集没有得到更好的保护和管理。这种暴露不是聪明的黑客或精心计划的结果,而是由于企业资产(S3存储桶)的简单配置错误而使数据向整个Internet开放。数据获得的利润必须承担保护其完整性和隐私的责任。云存储本身以合理的成本提供了功能和速度,但是云资产需要仔细配置-只需轻轻一按,即可消除私有和公共之间的细线。缺乏对通用IT流程的控制,导致诸如此类的严重错误进入生产环境,侵蚀了数百万人的隐私。

UpGuard客户支持团队UpGuard客户支持团队UpGuard客户支持团队

保护您的组织

取得联系或预订免费演示。
 抽象形状  抽象形状

相关违规

了解有关网络安全的最新问题的更多信息。
 传送图标

注册我们的时事通讯

每周在收件箱中获取最新精选的网络安全新闻,漏洞,事件和更新。
 抽象形状  抽象形状
免费即时安全评分

您的组织有多安全?

Request a free cybersecurity report to discover key risks on your 网站 , 电子邮件, network, and brand.
  •  检查图标
    您可以立即采取行动的即时见解
  •  检查图标
    13 risk factors, including 电子邮件 security, SSL, DNS health, open ports and common vulnerabilities
网站安全扫描结果网站安全扫描等级 抽象形状