在现代的互联网时代,信息每时每刻都充满着我们的生活,而互联网便是储存这些信息的世界最大的载体,在互联网中几乎每时每刻都会有新的信息出现,但同时也没有各种旧的信息“死”掉,而主要是由于技术故障、停电、天灾人祸、发布者改变等原因,最终信息消失无踪,没有适合的手段,这些信息将会永远销声匿迹在信息大海当中,无从知晓。

打开网易新闻 查看精彩图片

但是,就对于互联网信息丢失的问题上,便有一个名为互联网档案馆(Internet Archive)能通过其技术去寻找丢失的信息。互联网档案馆是一家非营利性数字图书馆,主要以普及利用所有知识为目标而常见的。自从1996年,互联网档案馆就开始搜集存档网页并将其内容永久储存。

打开网易新闻 查看精彩图片

根据外媒的报道,互联网档案馆的数据表示,一般网页在其被发布者修改,或者被删除前,平均在互联网上逗留的时间只能维持3个月。而这些数据一般在互联网上丢失之后,或许有人还希望能够寻找丢失的数据。为了能够让这些数据永久的储存,而不会由于被改动而永久丢失,互联网档案馆团队的Wayback Machine工具提供了一个很适合的用处,Wayback Machine会将网页保存一份副本,这样对于同一个网站上,访问者便可以利用Wayback Machine来看到一个网站上的不同历史时期的表现。

对于互联网数据的寻找,Wayback Machine能够通过其备份的副本而提供一个寻找历史的机会,现在目前来说是一个非常宝贵的工具,而随着它的进步和改善,如今已经变得越来越好用了。

据相关消息称,目前互联网档案馆团队正在为Wayback Machine引入一些新的特性,这其中包括了并排比较两个不同版本的URL的能力,文本差异用蓝色和黄色分别突出显示。用户还可以通过点击处于日历视图页面顶部的“更改(Changes)”按钮来访问它。

此外,对于网页的归档保存也非常方便,用户只需要将鼠标单击,便可以实现把所有嵌入的链接和外链进行归档,同时也可以将web进行归档,最后保存在收藏项的公共目录之下。

打开网易新闻 查看精彩图片

同时,Collections还提供了一种了解要归档URL原因的新方法,用户可以对一天内进行的每一个捕获进行查看,也就是说,通过Collections可以实现准确地找到一个时刻。尽管网页只是短暂地修改了一下,仍然是很有机会能够捕获到那个时刻。