转载声明:除调整格式外,不得对原文做改写、改编。原创不易,谢谢!E-mail:yellow@aliyun.com

♥声明:本文为原创文本,非生成式,转载请注明出处!

商务咨询/顾问/请@yellowscholar♥作者:黄先生斜杠青年

#时间深度 #无链路的互联网 #技术的未来#计算和人工智能 #技术史

打开网易新闻 查看精彩图片

在创建匿名摘要的过程中,AI 将使互联网嗡嗡作响的所有迷人思维架构扁平化

在1990 年代后期,由于 Sergey Brin 和 Larry Page 开发的一项非凡创新:PageRank 算法,谷歌摧毁了其他搜索引擎的竞争。虽然较旧的搜索引擎,例如 AltaVista、Yahoo 和(谁能忘记)Ask Jeeves,主要依赖于将用户的查询词与网页上相同和相似词的频率相匹配,但 Google 通过跟踪哪些页面的传入链接数量和质量最高,发现了更有用的网站。PageRank 背后的基本思想是 “如果一个网页被其他重要页面指向,它就很重要”。Brin 和 Page 意识到,网络不仅仅是一个词汇环境,而是一个社交环境,其中链接对应于声望,而位于网络中心的网站往往是最可靠的网站。佩奇后来评论说,其他搜索引擎“只看文本,而不考虑其他信号”。

PageRank 背后的想法并不新鲜。社会学家约翰·西利 (John R Seeley) 在 1949 年写道,“如果一个人得到有声望的人的认可,他就是有声望的。1976 年,Gabriel Pinski 和 Francis Narin 对文献计量学应用了类似的方法,声称:“如果一本期刊被其他有影响力的期刊引用,它就是有影响力的。然而,PageRank 的新之处在于它在 Web 上的应用。PageRank 之所以成功,是因为它认识到语言不是在真空中产生的。单词的模式取决于其他形式的从属关系:使 Web 成为现实世界的代表的社会和物理联系。

我是斜杠青年,一个PE背景的杂食性学者!♥致力于剖析如何解决我们这个时代的重大问题!♥使用数据和研究来了解真正有所作为的因素!

打开网易新闻 查看精彩图片

1989 年 3 月 Tim Berners-Lee 的万维网提案的第一页。由 CERN 提供

超链接像它们这样工作的原因之一——为什么它们索引其他类型的隶属关系——是它们最初是为了展示研究人员在开发新想法时在不同来源之间建立的联系而设计的。蒂姆·伯纳斯-李 (Tim Berners-Lee) 的万维网 (World Wide Web) 的超文本协议的早期计划被描述为记录人类思维如何从一个想法移动到另一个想法、连接外部刺激和内部反思的工具。链接将创造力视为补救和重塑的工作,这在 Google 学术搜索的口号中得到了突出体现:“站在巨人的肩膀上”。

但现在 Google 和其他网站正在从依赖链接转向人工智能聊天机器人。链接被认为是相互关联的思想的保留痕迹,作为 AI 革命的早期受害者是有道理的,因为 ChatGPT、Google 的 Gemini 等大型语言模型 (LLM) 将在线表示的信息抽象出来,并以无源摘要的形式呈现。我们正处于网络历史上的某个时刻,链接本身——网站创建者建立的无数连接,整个网络中编织的无尽思想挂毯——正面临灭绝的危险。因此,有必要问一下:链接最初是如何代表信息的?从链接转向 AI 聊天界面的利害关系是什么?

回答这些问题,我们需要回到 17 世纪,当时作家和哲学家发展了心智理论,最终激发了早期的超文本计划。在这个时代,包括托马斯·霍布斯 (Thomas Hobbes) 和约翰·洛克 (John Locke) 在内的著名哲学家都在争论一个人在多大程度上控制她脑海中出现的思想的连续性。他们认为,思想的连续反映了从感官接收的数据与一个人的心理官能——理性和想象力——之间的相互作用。随后,大卫·休谟 (David Hume) 认为,所有连续的思想都是通过关联联系在一起的。他列举了思想之间的三种联想联系:相似性、连续性和因果关系。在《关于人类理解的探究》(An Inquiry Concerning Human Understanding,1748)中,休谟提供了每种关系的例子:

一幅图画自然而然地将我们的思绪引向原文:提到建筑物中的一间公寓,自然会引发对其他公寓的询问或讨论:如果我们想到一个伤口,我们几乎会忍不住反思随之而来的痛苦。

思想遵循世界上的联系。洛克和休谟认为,所有人类知识都来自经验,因此他们必须解释大脑如何接收、处理和存储外部数据。他们经常使用媒体隐喻来描述心灵与世界之间的关系。洛克将大脑比作一个空白的平板电脑、一个柜子和一个暗箱。休谟依靠印刷语言来区分印在感官上的印象的生动性和脑海中回忆起的想法。

印刷品使远距离交流成为可能,这为歧义和有争议的意义创造了新的机会

比较也走向了另一条路。洛克、休谟和其他人探索了他们周围的材料如何表现出心智模式。在后来出版的《制作普通书籍的新方法》(1706 年)中,洛克在普通书籍格式中添加了主题索引,这种体裁自古以来就用于记笔记。根据一位历史学家的说法,通过索引添加主题关联“起作用......知识转化为模式和系统,以便即时、有动力地使用。当代作家和印刷商同样为网络化、非线性的媒体形式开发了方案,这些方案可能容纳心理联系。随着印刷品在 1700 年代的爆炸式流行,作家们使用交叉引用、索引,并在那个时代的伟大作品之一中使用脚注。亚历山大·波普 (Alexander Pope) 的讽刺诗《邓西亚德》(The Dunciad,1728 年)被马歇尔·麦克卢汉 (Marshall McLuhan) 称为“印刷文字的史诗”,抨击印刷商用廉价的小册子和单页大字报充斥伦敦。然而,在它的模仿中,这首诗也将印刷格式推向了一个新的复杂水平。

这首诗讲述了一群傻瓜的故事,而女神杜尔内斯在伦敦为新的荒谬之王加冕,波普在诗句中散布了他现实生活中目标的荒谬版本。它最初是一部典型的模拟史诗讽刺小说,讽刺波普采用荷马史诗《伊利亚特》和《奥德赛》的风格来嘲讽他的文学对手的微不足道的失败。这些竞争对手中的许多人以评论和“钥匙”作为回应,声称可以破译这首诗的引用。反过来,波普又将大部分评论(以及一位虚构编辑的评论)作为这首诗后续许多版本的脚注。在 1743 年波普的最终版本中,页面通常只有一两行诗歌,后跟一段评论。这本书是超文本的。它让读者从诗句到注释,到注释上的注释,到各种序言和附录,然后回到诗句。Dunciad 类似于充满超链接和评论的网站。

在不断修改他的讽刺作品的过程中,波普发现很难用印刷品来挑选世界上的人和物。他的朋友和讽刺作家乔纳森·斯威夫特(Jonathan Swift)对波普说:“我长期以来一直观察到,在离伦敦20英里的地方,没有人能理解暗示、首字母或城镇的事实和段落;几年后,甚至连住在伦敦的人也不行。与需要紧密社区的口头和手稿文化不同,印刷品实现了远距离交流,这为歧义和有争议的意义创造了新的机会。印刷品呼吁采取新的修辞和安排策略。The Dunciad 的后期迭代转向抽象人物,因为 Pope 强调印刷媒体产生的沉闷的形状和形式。在第三卷中,胡说八道之王以圆周、反射性运动的模式提供了沉闷永久回归的愿景:

当人类的 Maeanders 走向至关重要的春天

时,他们所有的潮汐滚动,然后返回他们的圆圈带来;

或者旋转,由熟练的 swain 旋转,

将线吸进去,然后又把它吐出来:

所有废话,无论是旧的还是现代的,

都将在你的中心,从你那里流转。

“Maeanders”在古希腊指的是一条蜿蜒的河流,当然,它也指蜿蜒的一般作用。波普的诗中充满了回声、反射和漩涡的意象,这些意象暗示了复制品如何呈现其来源的更沉闷版本,就像月亮只暗示太阳的亮度一样。就像泉水一样,《邓西亚德》的诗句在伦敦流传,这些作家和印刷商的作品正是受到波普攻击的,他们的言论也同样出现在他诗歌的后期迭代中。由此产生的互文网络成为对新兴印刷世界的新描绘,取代了这首诗最初创造的世界。

在整个时期,作家和印刷商继续发展在印刷品中安排语言的方法,挑战了媒体典型的线性结构。著名的例子包括法国百科全书 (1751-72) 的交叉引用和雕刻图表。该项目建立在 Ephraim Chambers 的《英语百科全书》(1728 年)的基础上,该百科全书明确引用了关联理论,以解释交叉引用如何使读者能够从单个条目中重建知识体系。

打开网易新闻 查看精彩图片

以法莲·钱伯斯 (Ephraim Chambers) 的《百科全书》(1728 年)。由维基百科提供

一个世纪后,我们可以观察到作家如何理解心灵和媒体之间关系的另一次转变。詹姆斯·穆勒 (James Mill) 和他的儿子约翰·斯图尔特·穆勒 (John Stuart Mill) 在 18 世纪的联想描述的基础上提出了全面的心理学理论。然而,联想主义理论最持久的影响来自西格蒙德·弗洛伊德 (Sigmund Freud) 将自由联想发展为精神分析疗法的一种实践。在《联想主义与文学想象》(2007)中,凯恩斯·克雷格(Cairns Craig)观察到,“弗洛伊德的'自由联想'技巧邀请病人去做,正是经验主义传统的联想主义美学一直坚持读者在体验一首诗时要做的事。他引用了 18 世纪末散文家阿奇博尔德·艾利森 (Archibald Alison) 的话,他将阅读一首诗描述为“[让]我们的幻想'忙于追寻诗人的所有那些思路'”。

早期心理学对思想关联的强调伴随着观察一个人的思想序列的媒介的转变,从印刷到音频技术。1912 年,弗洛伊德将精神分析学家的角色比作电话接收者:

正如接收器将电话线中由声波设置的电振荡转换回声波一样,医生的潜意识也能够从传达给他的无意识的衍生物中重建那个无意识,它决定了病人的自由联想。

弗洛伊德的技术设想了一种新的联想环境,治疗师将能够观察和分析患者想法之间的每个环节。就像几个世纪前的洛克一样,弗洛伊德希望通过他那个时代的媒体来更好地了解人类的思想。

“所有的电脑工作都是关于表达和展示作品之间的相互联系”

同样,在 20 世纪初,早期的计算机技术通过将印刷的文本形式与电力的速度相结合,提供了一种在工作中捕捉思想的新方法。第二次世界大战和原子弹爆炸之后,麻省理工学院的科学家 Vannevar Bush 探索了技术如何丰富人类社会,而不是摧毁人类社会。在 1945 年发表在《大西洋》杂志上的一篇文章中,他提出了计算机技术史上最著名的蒸汽软件之一,一种他称之为“memex”的双屏缩微胶片机,是“内存扩展器”的合成词。他的想法是允许用户在文章和书籍的文本以及他们自己的笔记之间创建连接链,即“关联跟踪”,从而产生类似于洛克的普通书籍的电子版本。用户可以将代码附加到特定的段落和注释上,以创建他们可以追溯以恢复原始思路的线索。当 Ted Nelson 在 1965 年的一篇文章中创造“超文本”一词时,他以 Bush 的模拟设计为模型。Nelson 将超文本解释为“以如此复杂的方式相互关联的材料,以至于它无法方便地在纸上呈现或表示”。hyper- 前缀表示数学中用于指代多维空间的“扩展和普遍性”。Nelson 设想了一种形式,它可以代表思维的网络化形式,而不受印刷品的两个维度的限制。

打开网易新闻 查看精彩图片

Ted Nelson 在 1965 年的原始文章介绍了“超文本”一词。图片由 The Internet Archive/Ted Nelson 提供

Bush 和 Nelson 设想的媒体将允许用户捕捉他们的思维习惯——尤其是一个想法立即激发另一个想法的感觉。在 Werner Herzog 关于互联网的纪录片《Lo and Behold》(2016 年)中,Nelson 描述了一段童年记忆,他认为这段记忆激发了他对超文本的愿景:

“我的手在水中拖曳,我想着水是如何在我的手指周围移动的,一边张开,一边合拢,以及那个不断变化的关系系统......仅仅向整个宇宙推广世界是一个不断变化的关系和结构的系统,就让我感到一个巨大的真理,......因此,互连和表达这种互连一直是我所有思考的中心,我所有的计算机工作都是关于表达、表示和展示作品之间的互连。”

Nelson 被广泛认为是 1990 年代网络发展领域最有影响力的作家之一。然而,他长期以来一直认为自己是一个被抛弃的人。和布什一样,他最雄心勃勃的新媒体计划从未实现。其中包括一个名为 Xanadu 的 Web 浏览器,它本来可以容纳一个比我们熟悉的更强大的链接模型。对于 Nelson,参考文献和链接应该指向它们的来源。如果你在文本中引用了作者,那么该文本应该链接到原始文档,读者应该能够并排查看引用文档和原始文档,就像布什对模因布局的设想一样。从某种意义上说,纳尔逊想象了波普的 Dunciad 的通用版本——一部人类思想史,用户可以在其中追溯线条和短语如何从一部作品转移到另一部作品。

Herzog 想知道互联网已经并将继续改变我们与语言和世界的关系方式。在影片的结尾,赫尔佐格问他的几位受访者:“互联网是不是梦想着自己?他将这个问题解释为对普鲁士战争理论家卡尔·冯·克劳塞维茨 (Carl von Clausewitz) 的一句话的重复,即“有时战争会梦到自己”(尽管这种说法可能是杜撰的)。克劳塞维茨认为,战争可以有自己的生命;它可能会自主地继续。一位受访者认为,这个问题暗示了互联网在没有任何人积极设计的情况下产生的“活动模式”。如果对 Pope 来说,印刷机似乎鼓励在没有背景的情况下进行复制和传播,那么互联网引发了什么超出工程师和网页设计师控制的活动?

一个答案可能是链接所体现的联系。第一个实际的超文本系统比 Web 早了大约 5 年,即 1980 年代初期。正如软件历史学家 Matthew Kirschenbaum 所观察到的那样,早期的超文本应用程序,包括 Apple 的 HyperCard 和 Eastgate 的 Storyspace(最初都于 1987 年发布),是个人计算机革命的产物,而不是 Web 的产物。Jay David Bolter 和 Michael Joyce 开发了 Storyspace 作为创建超文本小说的软件,选择你自己的冒险类型的故事,读者在其中决定如何浏览通过链接连接的剧集。乔伊斯使用该软件撰写了被认为是第一部长篇超文本小说《下午,一个故事》(1987 年)。他想创造“一个每次阅读都会改变的故事”。读者通过作品的节点和链接的路径构建了故事的情节。这部作品与斯图尔特·莫尔思罗普 (Stuart Moulthrop) 的《胜利花园》(1991 年)和雪莱·杰克逊 (Shelley Jackson) 的《拼布女孩》(Patchwork Girl,1995 年)一起构成了后来被称为超文本文学的“故事空间学派”。

虽然这些作品在 1990 年代中后期受到了评论界的关注,但它们并没有产生持久的影响。然而,为使超文本小说成为可能而开发的软件和工具仍然很普遍。当然,最著名的超文本系统是万维网,它允许用户在位于世界各地的服务器上托管的站点之间进行链接,从而在早期的超文本系统的基础上进行了改进。笔记和组织应用程序也集成了超文本功能。虽然 Eastgate 最初是一家创作超文本小说的公司,但后来它凭借其 Tinderbox 应用程序获得了成功,这是一款笔记应用程序,可以根据用户创建的主题链接笔记和媒体。数字网络(从互联网到网络)鼓励的活动模式是建立联系,创建更复杂的网络。

这些平台的主要特点是它们能够综合、总结和解释信息

在网站之间和个人自己的思维中建立联系的工作是 AI 聊天机器人旨在取代的工作。大多数关于 AI 的讨论都关注 AI 模型多久能实现“通用人工智能”,或者 AI 实体在什么时候能够决定自己的任务并做出自己的选择。但一个更基本和直接的问题是:AI 平台目前产生什么活动模式?AI 会做梦吗?

如果说波普的诗让读者充满了声音——从诗句中的傻瓜到脚注中相互竞争的评论者,那么 AI 聊天机器人往往会产生相反的效果。无论是 ChatGPT 还是 Google 的 Gemini,AI 都将众多声音合成成平淡的单调。这些平台提供了开场答案、项目符号列表和结论摘要。如果你让 ChatGPT 描述它的声音,它会说它已经接受过训练,可以用中立和清晰的语气回答。该平台的重点是听起来不像任何人。

不过,并非所有基于 AI 的网站都会丢弃链接。Perplexity 是一个 AI 搜索平台,旨在通过包含外部来源的脚注来纠正 ChatGPT 和其他机器人提供的引用不足。(Arc Search 是另一个尝试这种方法的平台。Perplexity 平台可以链接到来源,因为它实际上是一个混合搜索引擎和 AI 语言模型。与所有 AI 聊天机器人一样,LLM 会生成对用户问题的回答,但 Perplexity 会将此响应与其搜索引擎的结果相结合,该搜索引擎每天都会为网络编制索引。问题在于,在抓取不同的网站时,发现 Perplexity 抄袭了文章和图片,而很少或根本没有提及来源。不过,更根本的是,搜索已经解决了为用户查询找到可靠信息的问题——至少在与 AI 平台相同的程度上。搜索是人们使用 AI 聊天机器人的原因的附带因素。这些平台的主要特点是它们能够综合、总结和解释信息。他们执行这些任务的能力取决于消化大量文本和从特定来源提取语言模式。

在文学批评中,克利斯·布鲁克斯 (Cleanth Brooks) 抨击了他所谓的“释义异端”。在《精心打造的瓮》(The Well-Wrought Urn,1947 年)中,他认为读者不能通过解释它“说”的内容来总结一首诗。诗歌不像普通语言那样工作。它不能简化为它的命题内容。相反,定义一首诗的是它的语义和非语义元素之间的互动。“一首诗的结构类似于芭蕾舞或音乐作品,”布鲁克斯争辩道。“这是一种决议、平衡和协调的模式。”

当我们通过链接浏览网络时,我们正在通过其他人建立的一系列连接

尽管领域不同,但 Brooks 的批评与 Bush 和 Nelson 在超文本系统计划中表达的想法相呼应。链接揭示了一个往往隐藏在作者脑海中的创作过程——连接思想和构建更大事物的过程:论点、故事甚至诗歌。布什和纳尔逊认为,链接展示了自然的思维模式——大脑从一个想法跳到另一个想法的方式——但也展示了我们如何阅读和写作的模式。我们读了一段话,它激发了与我们以前遇到的其他五件事的联系。释义是异端,因为它平淡了诗歌的紧张、讽刺和冲突。在他的超文本理论中,乔治·兰道 (George Landow) 将布什的模因方法描述为“诗意的机器——根据类比和联想工作的机器,捕捉和创造人类想象力的无政府主义光彩的机器。

我们可能会考虑研究某个主题的用户如何通过搜索和链接浏览 Web。初始查询会生成一个结果列表,其中一些结果相关且值得信赖,而另一些则不太相关。研究人员在新选项卡中打开多个链接。然后,她浏览了最有前途的页面,点击了指向要更详细探索的主题方面的嵌入式链接。当研究人员遵循不同的联想线索时,她面临着相互矛盾和令人困惑的观点。她必须弄清楚如何解决多个页面中出现的紧张和冲突。在第二篇关于模因的文章中,布什描述了他的链接缩微胶卷台所容纳的类似过程:

让我们说,memex 的所有者对弓箭的起源和特性感兴趣。具体来说,他正在研究为什么在十字军东征的小规模战斗中,土耳其短弓显然优于英国长弓。他的 memex 中有数十本可能相关的书籍和文章。首先,他翻阅了一本百科全书,找到了一篇有趣但粗略的文章,然后把它投影出来。接下来,在历史记录中,他找到另一个相关项目,并将两者联系在一起。就这样,他走了,建立了一条包含许多物品的小径。偶尔,他会插入自己的评论,要么将其链接到主路线,要么通过支线将其连接到特定项目。

网络通过保留关联线索,使布什所描述的调查过程成为可能。当我们通过链接浏览网页时,从某种意义上说,我们是在穿越别人建立的一系列联系,就像阅读他们写的东西一样。这是 Pope 的 Dunciad 所揭示的一部分——媒介的形式形状传达了它的内容,而形式和内容之间的互动是它产生意义的方式。这当然是 Page 和 Brin 在实施 PageRank 算法时认识到的。链接与文本一样重要。

尽管有这一突破性的发现,但 2024 年 5 月 14 日,在 Google 的 I/O 大会上,该公司宣布了从搜索结果界面转向 AI 摘要的计划。谷歌母公司 Alphabet 首席执行官桑达尔·皮查伊 (Sundar Pichai) 透露,该会议恰逢当周在美国推出“AI Overviews”。概览显示对查询的摘要响应(如 ChatGPT 的界面),而不是指向其他网站的传统链接列表。谷歌搜索主管丽兹·里德 (Liz Reid) 宣称,似乎是为了让她的工作变得多余,让谷歌“为你做谷歌搜索”。评论员指出,具有讽刺意味的是,谷歌的 AI 模型 Gemini(与所有 LLM 一样)依赖外部网站来训练数据,以便能够返回准确的回复,但聊天机器人界面似乎会危及其主要数据源,因为不鼓励用户访问这些网站。

布什提议将模因作为一种记忆辅助工具,它允许研究人员追溯思路,同时也允许其他用户更好地理解早期思想家建立的联系。Web 代表了最大的集合内存存储库,无论是在托管的单个 Web 页面中,还是在允许用户遍历它们的链接中。如果用户很少通过 Google 或 ChatGPT 的主页,将如何支持和开发这个存储库?

虽然 Web 的未来似乎很黑暗,但我们可能会从 Pope 对印刷品崛起的回应中得到启发。对波普来说,印刷体裁和惯例的扩散导致了麦克卢汉所说的“视觉能力与其他感官的相互作用日益分离”。然而,尽管印刷品似乎要求统一和规律性,波普还是找到了一种方法,以一种代表 18 世纪伦敦城市环境的嘈杂的方式,在印刷品中捕捉对立声音的相互作用。Web 可能仍会以让我们感到惊讶的方式发生变化。

了解更多时间深度剖析,尽在于此@黄先生斜杠青年

商业咨询和顾问业务,请@yellowscholar

打开网易新闻 查看精彩图片

关注我,带你先看到未来!♥

转载声明:除调整格式外,不得对原文做改写、改编。原创不易,谢谢!E-mail:yellow@aliyun.com

♥声明:本文为原创文本,非生成式,转载请注明出处!

商务咨询/顾问/请@yellowscholar♥作者:黄先生斜杠青年