【OHI访谈手记】访互联网档案馆的创始人布鲁斯特·卡利(BrewsterKahle)
2017-07-29 21:21:58
  • 0
  • 7
  • 15
  • 0

全球互联网口述历史采访美国非营利科技组织互联网档案馆的创始人布鲁斯特·卡利(BrewsterKahle)。卡利四肢修长、精神矍铄,而且热衷公益。他顶着一头灰白色的卷发,带着金丝眼镜,穿着亚麻裤和条纹衫,像极了狄更斯笔下的米考伯先生。

布鲁斯特·卡利(BrewsterKahle)

互联网档案馆的网址是archive.org,互联网档案馆的总部位于旧金山Richmond区Funston大道的一座宏伟的古希腊式教堂内。我们一行人从旧金山开车来到普雷西迪奥。穿过一片松柏林,那里的景象让人联想到用沾满污垢的蜡笔绘制的图像。在芬斯顿大街300号,看到一座希腊复兴式的神殿。

互联网档案馆的总部

白色的外墙,巨大的石柱,气氛肃穆而庄严。走上石阶,叩开黄铜制成的大门,就进入了它的所在。那里非常显眼,绝对不会错过它:它外墙涂成了圣洁的白色,门前立着8根科林斯柱和6个大理石瓮。但在建筑内却又是另一个世界——建筑里安放着的是一排一排密密麻麻的交换机、服务器与硬盘柜。满室的计算机设备,不断闪烁的信号灯光,让人有时空交错的感觉。

1996年,MIT毕业生,程序员布鲁斯特·卡利(BrewsterKahle)在参观搜索引擎AltaVista的总部后受到启发,在自己的阁楼上创办“互联网档案馆”。它的定位是一所“图书馆”,但又绝不只是一所普通的数字图书馆。

“我们之所以买下这里,是因为它跟我们的logo很像。”布鲁斯特·卡利(BrewsterKahle)这样解释道:“2009年,当基督教科学派第四教会决定出售这栋建筑时,我来到芬斯顿大街实地考察。当我看到这教堂时惊呼,这不就是我们的logo吗?我便把它买下来了。”互联网档案馆的logo就是一个白色希腊神殿。

卡利很看重这一段历史:那座教堂的地基早在1923年就已经打下——那一年之前,在美国发表的所有作品都不再受到美国版权法的保护。似乎是宿命的安排,才让这样一座始建于版权元年的神殿出现在卡利的面前。

卡利是1960年才在新泽西出生的。他儿时曾经看过动画片《波波鹿与飞天鼠》(TheRockyandBullwinkleShow),里面有一个叫《皮博迪的超凡历史》(Peabody’sImprobableHistory)的部分,“时光机器”的名字就来源与此。

布鲁斯特·卡利(BrewsterKahle)为我们演示“互联网档案馆”的官网

“互联网档案馆”搜集互联网的各种数据。“时光机器”就是一个万维网档案馆,它负责搜集各种旧网页。虽然还存在其他一些类似的项目,但规模都远逊于“时光机器”。几乎可以这样说:如果有什么信息没有被“时光机器”收录,这条信息等同于从来没有存在过。“时光机器”是一个机器人程序,它可以在互联网上自动抓取信息,每两个月都会将其找到的所有网页复制一遍——但具体的频率也会有所变化。(它第一次抓取newyorker.com主页是在1998年11月,自那以后已经抓取了将近7000次,最近的抓取频率约为每天6次。)

“互联网档案馆”还会存储由舒梅列夫这样的图书管理员和专家针对特定主题挑选的网页。通过一个名为ArchiveIt(网址为archive-it.org)的服务,他们都可以提交相关网页。而个人和组织也可以在上面建立自己的档案文件。(其中的所有内容都会自动复制到“时光机器”中。)任何人想要保存一个页面时,只要访问archive.org/web,输入相应的网址,然后点击“现在保存页面”即可完成这一工作。(事实上,在MH17航班被击落的当天,斯特雷尔科夫VNontakte页面的12张截屏图片多数都是通过这种方式存储到“时光机器”中的:机器人程序当天抓取了7张截屏,剩余的均由人工提交。)

在互联网档案馆上无数个网页的主题收集中。其中最近的一个叫“任期结束存档”(End of Term Archive),目标是在奥巴马的总统任期结束之前尽可能将美国联邦政府的各个网站以及上面的各种文件保存下来。如互联网档案馆的一名主要负责人 Jefferson Bailey 所介绍,每一届总统任期结束以后,政府网站上数量巨大的政府数据与信息都可能就此消失,例如在2008到2012年间,美国联邦政府各个部门上 83% 的 PDF 文件都消失了,其中包含无数研究、调查数据和报告等。而这些,距 Jefferson 所说,“都是极其重要的历史信息”。

卡利在第一轮入选互联网名人堂(InternetHallOfFame)的候选人。创办互联网档案馆却让卡利确立了自己在互联网神殿的地位。

互联网档案馆(InternetArchive)致力于为互联网上曾经存在过的网站建立数字图书馆。与线下实体图书馆一样的经营模式,面对研究者、历史学家、学者以及公众免费开放。这是一个让人感到时光飞逝物是人非的网站。记录了很多曾经辉煌一时现在早已消失或者已经走向没落的网站,也记录了存活至今的网站们一次又一次改版。

互联网档案馆作为互联网上最大的图书馆,保存了200万册图书,每天吸引着300万用户。此外,仅在过去几个月内该网站就已经收集了2PB的数据。

布鲁斯特·卡利(BrewsterKahle)为我们演示官网信息

不过,卡利并不满意。他想收集所有的东西,也就是把每一本书、每一部电影、每一首歌、每一个网页以及每一份报纸都收录进他的数字图书馆。他表示,之所以想这么做,是因为他需要一个武器来对抗他所说的“奥威尔式世界”中的政府。卡利一直以来都不相信政府,他甚至说政府“令人毛骨悚然”。五年前,FBI曾要求他提供某个访问过互联网档案馆的用户的信息,他勇敢地进行了反抗。卡利还与政府打官司,而且赢了,这让他可以公开谈论这个案子。

卡利认为,互联网最好的一点是,它证明人们并不只为了钱才做事情。而他的非营利性互联网档案馆,也集中体现了蒂姆·伯纳斯-李(TimBerners-Lee)和温特·瑟夫(VintCerf)等互联网创始人的精神。这些人感兴趣的是如何让世界成为一个更美好的地方,而不是如何赚快钱。

还有最让人震惊的事是:卡利曾经把整个万维网放进了一个集装箱里。他想知道集装箱究竟能不能装下万维网。万维网究竟有多大?尺寸是20×8×8英尺(1英尺=0.3米)——至少他测量的当天是这么大。有多重?2.6万磅(约合1.18万公斤)。但多数人都是以字节为单位来衡量数据的——这篇文章大约200千字节(KB),一本书大约100兆字节(MB)。1MB是100万字节,1GB是10亿字节,1TB是100万MB,1PB是100万GB。在“互联网档案馆”的大厅里,你可以看到一张贴纸上写着“已存档10,000,000,000,000,000字节”。换算过来就是10PB。这其实已经过时了,因为这个数字来自2012年。自那以后,数据量翻了一番。卡利觉得这意味着什么,他认为人们应该知道这些事情。

方兴东与布鲁斯特·卡利(BrewsterKahle)合影

今天一口气访谈了两位大牛级的互联网英雄特德·尼尔森(TedNelson)和布鲁斯特·卡利(BrewsterKahle),没有吃中饭,整整4个小时没有歇空,他们没有在互联网大潮中暴富,也不追求荣华富贵,为人类互联网事业做出了伟大的贡献,真正践行了互联网精神。对于唯有商业缺乏精神的中国互联网来说,有着特别的价值和意义。特德·尼尔森(TedNelson)还赠送我们当年的海报和1974年的《计算机解放》图书,这个历史价值就弥足珍贵了。不过,当下大事是,肚子饿了,又口干舌燥,我们赶紧找中餐馆。

全球互联网口述历史项目,为2019年全球互联网50年助力。全球访谈影响互联网最关键的500个人物,总结第一个50年,面向下一个50年。期待你的大力支持!预计2017年年底就可以完成300人左右,感谢世界各国朋友们的鼎力支持!

推荐大佬人选请联系我们E-mail: info@chinalabs.com


全球互联网口述历史内容博客中国独家发布,欢迎转载。

全球互联网口述历史相关推荐

【方谈美国】互联网档案馆创始人卡利访谈手记

钟布:泰德•纳尔逊对未来文本的预测

【方谈美国】访超文本之父泰德•纳尔逊

【方谈美国】获赠泰德·纳尔逊的奇书——《计算机解放》

【方谈美国】互联网口述历史访谈泰德·纳尔逊(TedNelson)

 
最新文章
相关阅读