Google Data In 2006 | |
Data |
Size (TB) |
Crawl Index |
800 |
Google Analytics |
200 |
Google Base |
2 |
Google Earth |
70 |
Orkut |
9 |
Personalized Search |
4 |
这压缩的数据的大小接近 TB(1024GB)。而 Google 透露的数据大小超过 1PB(1048576GB)。这甚至不需要考虑 AdSense,Gmail,Google Map,街景,Google图片,或者其他私有数据库。并且这些数据都是超过2年前的。
大量的数据分析
这就有点像 Charlie and the Chocolate Factory (电影《查理与巧克力工厂》)。我们都知道有很多数据都进入到 Google 那里,我们也知道有大量处理好的数据会导出来。我们就只是不知道两者之间是发生了什么,是怎么转换的。
我们也知道 Google 本身有很多运算法则组织他的数据,Page Rank 就是最出名的了。据说,Google 也有很多复杂的 spam 的过滤系统,内容复制过滤系统,类型侦查运算法则,自然语言解析程序,图像识别软件,和其他大量的复杂的软件。
永久备份
Google 上的数据最终的栖息地可能会在永久存储。Google 的隐私政策提示某些用户数据永远都不会完全被删除,因为已经被永久的备份。
理解Google收集特定用户的数据情况
以下都是一些当用户与很多网站交互的时候 Google 收集到的用户的资料的清单列表。这意味着其实有更多的数据被 Google 收集而却又没有公开的。不过其实无知就是幸福,当你看完之后,你或许会感觉很不爽:
Google用户数据收集情况汇总:Google用户数据收集情况汇总
你能相信 Google 会帮你保密一切信息么? 你敢相信 Google 会遵守所有保密要求么?
原文地址:http://semwatch.org/2009/11/evil-of-google-data