旅游

WaybackMachine收录4千亿网

2019-05-15 06:16:45来源:励志吧0次阅读

Internet Archive本日达成了一项里程碑式成就,其站历史信息查询服务工具Wayback Machine收录了4千亿页索引。数据涵盖了从1996年至今的几近所有站的历史页记录。

以下是Internet Archive总结的Wayback Machine的历史和里程碑:

2001年 - Wayback Machine项目启动

2006年 - Arichive-It启动,允许创建订阅该服务的库以收集络内容

2009年3月25日 - Internet Archive和Sun微系统公司共同启动了一个数据中心,存储全部互联的文档及为Wayback Machine提供服务。该数据中心有3PB容量,每秒处理500个请求。

2011年6月15日 - 加入HTTP Archive,增加记录站性能数据的功能。

2012年5月28日 - Wayback Machine在中国被封锁数年后再次上线。

2012年10月26日 - 被记录站抓取数据到达了80TB,该抓取数据在2011年面向研究者开放。

2013年10月 - Wayback Machine新功能保存页面开放,可以在页面被记录后一小时再查看的内容;联邦政府关闭期间也可以通过该工具访问政府站点。

白带多是什么原因
宫颈炎的治疗方法
女人为什么会经期延长
分享到: