詹姆斯·格雷克的信息史

杰弗里·农贝格(Geoffrey Nunberg,加州大学伯克利分校信息学院教授)

原刊于2011年3月20日《纽约时报》书评版,原文链接

18世纪的法国数学家、哲学家让·勒朗·达朗贝尔曾说过:“宇宙在那些知道如何一以贯之的人看来只是一个事实、一个真理。”詹姆斯·格雷克就找到了这样一个一以贯之的视角,并将其体现在了他的新书书名(The Information: A History, A Theory, A Flood)的头一个词上。他在“信息 ”一词中使用了定冠词,而这通常是我们用来表示一类事物时的做法,如宇宙、以太,以及互联网。格雷克认为,信息不只是我们不堪重负的图书馆和Web服务器中存放的那些内容,它是我们这个世界的“血液、食物和生命力”。人类意识、社会、地球上的生命,乃至整个宇宙,归根结底都是比特。

为了支持自己的论点,格雷克梳理了人类五千多年来与信息遭遇的历史,上迄文字的发明,下至最近约半个世纪信息融入各门科学,被当作一条公理看待。这是一次真正的宏大叙事,而其中的关键时刻则出现在1948年(晶体管的发明也在这一年),当时一位有着密码学和电话学背景的年轻数学家,克劳德·香农,在贝尔实验室的技术期刊上发表了一篇题为《通信的数学原理》的论文。对于香农来说,通信仅涉及如何通过有噪信道传递讯息,并使得对方能够将其还原出来。至于该讯息是否含有意义,用他的话说,“与工程问题无关”。试想电视游戏节目《幸运之轮》里的游戏,随着卡片翻转,显露出越来越多的字母,可能的答案的范围也越来越小,虽然答案可能是任何东西,如一个日常英语短语、一个波兰人姓氏,又或是一堆车牌数字。无论讯息是什么样的,其中每个信号的贡献(不无启示地,香农将这称为信号所带的“信息”)都可以用二进制数字(如0和1)来计量。为方便起见,二进制数字(binary digit)的说法被他精炼成了比特(bit)一词。

香农的这篇论文开辟了一个全新的领域——信息论,后者将在工程学和计算机科学中得到广泛应用。除此之外,它还把原本只是与请求电话接线员相关的“信息”一词变成了知识界的流行语,流行之广甚至让香农特意撰写了一篇文章《科学时尚》(“The Bandwagon”),来委婉地提醒人们不要滥用这个词。但不同于当时另一门同样蔚为时尚的新学科——由诺伯特·维纳在同年提出的控制论,信息论最终改变了从经济学到哲学的许多学科的面貌,并给生物学和物理学昭示了一种全新的思考方式,而控制论(cybernetics)最终热潮消退,仅留下了一个有用的前缀(cyber-)。

20世纪50年代,DNA结构的共同发现者弗朗西斯·克里克,在描述蛋白质如何复制核酸序列时,仍然是把“信息”一词放到了引号当中。但很快,细胞生物学家在谈论信息、编码(codes)、文库(libraries)、字母表(alphabets)、转录(transcription)等词时,便不再含有隐喻的意味。用格雷克的话来说,“基因本身由比特构成”。与此同时,当物理学家探索量子力学中被爱因斯坦称为“鬼魅般的”悖论时,他们开始把信息视为一种物质,宇宙中的其他万事万物都由此而来。正如物理学家约翰·阿奇博尔德·惠勒的一篇论文标题所说的,“万物源自比特”(“It From Bit”)。

在书中,格雷克带领着读者广泛涉足了各个科学领域,从麦克斯韦妖到哥德尔不完全定理,从黑洞到自私的基因,不一而足。尽管其中有些概念理解起来颇有难度,但就像他先前的作品,如《混沌》和《费曼传》,格雷克为那些能跟得上科学的读者提供了条理清晰的论述,也为那些仅想识其大意的读者准备了通俗易懂的类比。此外,书中还有许多老少皆宜的奇闻轶事:比如,香农曾建造过一台可对罗马数字进行算术运算的机器(THROBAC-I);又比如,英国维多利亚时代的通才查尔斯·巴贝奇,曾写信给世人丁尼生,对其诗句“每分钟都有一个人去世/每分钟也有一个人降生”中的算术提出了异议,因为这样生死相抵,人口就不会有变化。

不过不同于混沌,信息的历史有人类参与其中。在一系列章节中,格雷克不仅追溯了大家耳熟能详的故事,比如文字的发明和《牛津英语词典》的编纂等,也讲到了一些人们不那么熟悉的编码和通信手段。比如在18世纪后期,早先于塞缪尔·摩尔斯的电报,法国的沙普兄弟发明了最早的“远距离传讯系统”。这是个包括上百座通信塔的网络,每座塔上设有指示信号的横梁和悬臂。通过这个网络,只要天气合适,政府可以在不到一天的时间内把讯息从巴黎传递到波尔多。当时的一位法国议员甚至把沙普兄弟天才的信号传递系统誉为人类的四大发明之一,与指南针、印刷术和火药相提并论。而当沙普兄弟借助视觉的远距离传讯系统被更民主(而不是仅被政府所掌控)和适应性更强的电报所取代后,为了节省费用,电报用户想到了用缩写来表示常用短语的做法,比如用gmlet表示“give my love to“(问候某人)——这不就是后来的手机短信吗?尽管当时还没有这种说法。

格雷克对于这些内容的叙述引人入胜,但他对于信息系统的关注偶尔会使他夸大一些技术,如印刷术和电报的实际影响。比如,他提到,正是字母表的发明才催生了科学和哲学的发展以及”人类自我意识的真正起始“。这里他复述了英国古典学家艾里克•哈夫洛克的论调,但这种论调现在基本上已经被学界所驳斥。

类似这样的失误大多都还是小错,但格雷克叙述中脱离社会语境的倾向在该书的最后几章导致了更大的问题。在这些章节中,他不再把信息作为一个科学概念进行解释,而是把它作为一种日常关切加以考察,同时也将自身的角色从科普作家转换成了预言家。在他看来,正在吞没我们、让我们忧虑的”信息“,只是构成所有生物和实体世界的原初物质的一种体现。用他的话来说,我们是”信息的造物“,而不仅仅只是由自身的基因或化学物质所构成。

在副标题为”意义的回归“的跋中,格雷克认为,如果想要理解信息怎样成为信念和知识的源泉,我们必须抛弃香农”无情地牺牲掉意义“的做法,因为这恰好牺牲了”赋予了信息以价值和目的“的东西。事实上,香农并没有如此彻底地牺牲意义,以至于完全忽视它,就像交通工程师毫不关心高速公路上的车辆里到底装载着什么东西。他之所以会这样做,是因为倘若把信息想象成某种具有意义的东西,那么你不得不把它从数学定义中摆脱出来,这时你剩下的只有”信息“这个词本身。而在日常使用中,”信息“是个不怎么好理解的词(即便经过最近的修订后,《牛津英语词典》对这个词历史的梳理依然无法令人满意)。”信息“就如同”客观性“(objectivity)、”素养“(literacy)等词,对于这些词,我们很容易从一个意义不小心滑到另一个意义,却无人(甚至包括我们自己)意识到主题已经发生了转换。

这种意义的飘忽不定尤其体现在”信息时代“的说法上。这个说法兴起于20世纪70年代,也就是在那时,我们开始把计算机等称为”信息技术“。如果我们在比特和带宽的意义上谈论信息,那么计算机显然可以被这样叫。但这种说法也使得我们会误以为,磁盘中存储的东西与让我们感到不堪重负、同时应该人人有权接触或者应该免费的东西是一回事。

就像其他大多数撰文谈论信息时代的人一样,格雷克也无法避免这种语义上的滑转。当他描述信息爆炸时,他以字节来计量信息的增长,并引用了一连串不断增大的词头(千,兆,吉,太、拍、艾,现在更有泽和尧),以此来反映智能手机、平板电脑、游戏主机以及服务器农场的迅猛增长。

然而,在比特和意义之间没有直接的道路连通。一方面,它们的单位不对应:《战争与和平》的文本占据的磁盘空间比一段麦当娜的音乐视频占据的磁盘空间要少,那么可以据此判断两者的意义大小吗?而更为重要的是,”信息“是否就是任何能存储在硬盘、纸张或磁带上的东西呢?当然,对于思科或希捷这样的公司来说,事情就是如此,毕竟它们毫不在意所提供的字节是用来编码《魔兽世界》,还是用来编码婴儿跳舞的家庭视频。(美国人一年中所消费的电子游戏的字节数,比所有其他媒体,如电影、电视、纸质媒体和互联网等的总和还要多。)

但这些并不是我们在忧虑日益扩大的信息鸿沟或主张信息的自由交换对健康的民主来说必不可少时所想到的东西。在这种对社会而言重要的意义上,信息(这时它可存储、可转移,且具有与语境无关的重要性)既不是自古有之,也不是无所不在。它是现代媒体和现代国家的产物(瓦尔特·本雅明将其出现的时间定在了19世纪中期),并且它只是周围比特洪流中的一小部分。

不过即便是这种意义上的信息,被包围其中的我们也感到有点不堪重负,就像当初的人们曾被莱布尼茨所谓的”数量骇人且还在持续增加的书籍“压得喘不过气来一样。作为回应,17世纪的作者们编纂了各种索引、书目、合集和百科全书,以便沙里淘金。而在思考如何将信息变成有用知识的难题时,格雷克认为,博客和聚合器、像维基百科这样的合成网站,以及”广泛的、协同的过滤器“现在正起着类似的功能。他还写道,就像在任何一个旧技术被打断的时刻,”旧的知识组织方式也不再管用“。

但知识不只是信息经过评估、变得可理解那样简单。比如,”医学信息“会使人想起利用Google搜索”背痛“、”维生素D“时得到的海量结果,而”医学知识“则会令人想到那些负责创新、维护和传播已有知识的机构和组织。事实上,你可以说,搜索引擎最重要的功能是帮助找到我们仍在使用的”旧的知识组织方式“(如美国国家卫生研究院、美国证券交易委员会、《牛津英语词典》、BBC、纽约公共图书馆、ESPN等)在网络上的延伸。维基百科的编辑方针也要求条目要基于”可靠的、已出版的来源“,这就剔除了绝大多数博客,更不用说维基百科本身了。

这些想必格雷克都不会否认,但他侧重于把信息视为主要驱动力和无所不在的物质,这使得他描述的信息世界更像是与更广阔的人类世界无关,而不像是它的一种延伸。用他的话来说,”人类知识日渐融入网络,融入云“(这里他使用了更多这样表示一类事物的定冠词,所用的语气则是此类话题通常会有的先知语气)。他在全书最后一段话中描绘了一幅发人深省的图景:人类游走在博尔赫斯所想象的巴别图书馆(其中收藏了用每一种语言写成了每一本可能的图书,不论真假),在书架之上细细搜寻,以期”从一片嘈杂和混乱中找出几行意义“。但即便有朝一日真的变成这个样子,我们仍然可以得到很多帮助,找到值得阅读的图书。这些帮助不仅来自社交网络和博客,也来自图书馆、出版社以及其他旧式信息秩序的守护者。而像《信息简史》这样精彩的、愉悦智力的作品,尽管略有瑕疵,无疑应该在他们提出的值得阅读的书单中占有一席之地。

(楼伟珊译)

《信息简史》(The Information) 

原文地址:https://www.cnblogs.com/turingbooks/p/3436015.html