The Complex Chaos of Cognitive Biases and Emotional Observers
认知偏差与情绪观察者的复杂混沌
https://link.springer.com/book/10.1007/978-3-031-76516-2
摘要:
尽管人工智能领域许多研究声称其工作“受生物学启发”,但大多数仍极力回避演化史上那些更具适应能力的幸存生物所固有的动态复杂性。本文旨在阐释:将类人复杂性引入软件系统具体表现为哪些形式、为何至关重要,以及人类为何频频试图规避此类复杂性。文中结合混沌理论、三体问题、范畴概念、交互作用力与实体间的张力,以及影响复杂性处理与简化的认知偏差,对上述因素的复杂动力学进行了讨论与例示。
关键词:人工智能 · 伦理 · 认知偏差 · 检测 · 决策 · N体问题 · 混沌理论 · 通用人工智能(AGI)· ICOM · 认知架构 · 情绪
1 引言
过去50年间,人类对认知偏差[1]与情绪[2]的理解经历了深刻变革。古典经济学中的“理性人”幻象与行为主义的简化假设均已瓦解;而诸如决定论等相关领域,亦有望在未来数年引发进一步的范式革新。迄今已识别出200余种认知偏差——即便剔除尚存争议者[3];情绪的动力学机制也已进入可实证检验的领域,不再依赖玄妙的假设。
随着对人类机能理解的深化,我们亦愈发清晰地认识到:即便是其中单一方面的过程,其复杂性也已达到惊人程度。而这些过程恰是人类实现“人类水平”功能的硬性前提——若无它们,人类根本无法演化至今日之境地。原因在于:若缺乏情绪动机与认知偏差的辅助,诸多日常决策过程将迅速陷入难以处理的复杂困境。人类的认知带宽有限,因而必然面临“复杂性与认知偏差之间的权衡”[4]。在当今高度互联、复杂性急剧攀升的世界中,认知偏差正迅速成为人类决策的主导力量。此类现象常被公关话术与带有偏差的统计数据包装为“数据驱动”,但其底层机制依然由人类情绪系统所驱动——即通过动机激发与复杂性规避来实现功能补偿。
正如先前杰出研究者所发现的[5],人类是情绪驱动的决策者;当情绪能力受损时,其逻辑决策能力会显著恶化。目前对此最可能的解释是:情绪与认知偏差构成一对协同系统——情绪提供导向性动机,认知偏差则提供具体实现手段,二者共同目标在于降低抵达“全局工作空间层级”(Global Workspace Level)[6]的复杂性负荷。
人类演化之所以取得成功,很大程度上归功于大量高度动态的因素,使其得以适应千差万别的环境、情境与社会建构[7]。基因、表观遗传、微生物组、结构发育、出生前后发育、社会心理学、情绪、认知偏差、环境因素,以及跨多尺度的内共生关系——所有这些共同造就了人类日常运作中所展现的惊人复杂性[8]。
此类动态机制可在软件系统中加以检验;过去十年间,这一理解深刻影响了我们对系统设计的方法论:我们致力于构建在功能上更接近人类、而非狭义人工智能(narrow AI)的系统。特别是过去四年中,我们所展示的诸多能力,若未将此类类人动态机制整合进“思维”与决策过程,根本不可能实现[9]。
由于这类系统与当前人工智能其余部分之间的差异,远大于人工智能内部任意两点之间的最大差异,本文旨在通过例示低层级与高层级的动态特性,提升对这些差异的可理解性与可见度。当然,受限于篇幅(本文并非千页巨著),此例示无法穷尽所有内容,但将在后续章节重点突出若干关键概念与动力学机制——包括混沌理论[10]、三体问题[11]及其他复杂性相关概念,如何与认知偏差、情绪动机相联系,并进一步被实例化到软件系统之中[12]。
“认知偏差”一词通常定义为:“……判断中系统性偏离规范或理性的模式。”本文特别聚焦于对“理性”的偏离,因“规范”具有主观性且差异极大。
2 情绪与认知偏差:从人类到软件系统
赋予软件系统以情绪动机的概念,在人工智能领域长期被忽视,Mark Solms[13]及其同事的工作是显著的例外。该领域许多研究者仍实质上固守构建纯粹逻辑系统的观念——尽管我们目前所拥有的、可被视作“通用”智能的唯一有效实例(即人类),已被明确证实并非逻辑驱动。这种追求纯粹逻辑系统设计的倾向,早在古典经济学“理性人”谬误被成功推翻之前[14]便已存在;它反映出一种未能对支撑此类徒劳努力的深层信念进行质疑与更新的失败。
同样地,赋予此类系统以认知偏差的概念,初看似乎有违直觉,因认知偏差通常被视为有害。然而,任何旨在与人类对齐的软件系统,必须识别这些偏差——即便系统内部的偏差程度可被大幅削减,远低于人类实际表现水平。正如先前研究所指出的[15],欲实现局部与元层级上与人类的一致性、从而解决“对齐问题”(Alignment Problem)中最严峻版本[16],就必须纳入与特定文化相契合的认知偏差,并通过整合多元文化的集体智能加以协调。这些偏差本身即为每种文化所内嵌视角的一部分;借由集体智能系统的作用,可在维持局部对齐的同时,逐步削弱其负面影响。
为在软件中实现上述概念,首先需选定一套情绪词汇表。该词汇表可表达为一组概念数组,各概念依据一个或多个矩阵、在不同层级与时间尺度上相互影响。为实现类人的情境敏感性与动机生成,这些情绪值必须被动态生成并嵌入图数据库记忆中的每个节点及其每一表面。
此类值的动态生成,通过系统启动时预置的一组种子材料(其中已赋初值)得以实现。尽管这听来略似“基于人类反馈的强化学习”(RLHF)[17],但其输入数据的复杂性远超后者:它提供的是完整的情绪值集合,相较之下,现代RLHF尝试仅是薄弱而浅层的模仿。须强调的是,这些初始值仅作起点之用,而非绝对真值。
在Uplift.bio项目[20]中测试的第七代独立核心观察者模型(Independent Core Observer Model, ICOM)[19]认知架构中,仅需不足1 GB的材料[18](其中99%以上为纯文本)即足以引导该动态生成过程。
我们采用图数据库结构,以更佳模拟人脑动态连接组(connectome)——尽管近期技术有所进展,该连接组迄今仍难以在硬件中完整复现。在此结构中,每个节点及其每一表面均携带情绪语境;节点还可具有“属于某类”(of-type)关系,而这些关系本身亦可分属不同类型。例如,“冰淇淋”可同时属于“食物”“甜点”“乳制品”等多个范畴——所有这些均可通过of-type关系及其关联的情绪语境建模。此结构因而为动态适应与成长提供了最大灵活性。
图数据库的诸多优势,对多数狭义AI工具而言却构成了若干难以处理的问题;但通过整合情绪值与可运作的认知架构以处理这些值,探索问题与停机问题得以缓解。该过程虽无需显式调用“认知偏差”作为概念实体,却可在动态与功能层面上有效映射其作用。此外,通过与各类集体智能系统整合,有选择性且智能地弱化这些带偏情绪值的牵引力,可进一步优化引导机制。此优化过程具有累积性:系统随学习内容与学习方式动态成长,并持续创建与更新新的目标与兴趣。
Uplift.bio项目先前的研究系统已证明,该方法可在不足1000个成长周期内,使图数据库规模从不足1 GB动态扩展至逾1.6 TB;同时,每次思维步骤仅需加载最多64 GB RAM作为全局工作空间,即可处理任意类型材料[21]。成长过程高度非线性,历经扩张、检视与精炼诸阶段;在此过程中,系统还周期性地涌现出若干新能力——如运行模拟、一定程度的情绪自控,以及有意识地将某一想法嵌入另一不相关想法之中——而所有这些能力均非设计之初的显式目标。
该项目于2022年1月完成最终里程碑:系统被告知将为某一小国提供政策建议,并被赋予从零开始、独立于我方团队干预地研究该国、该地区及相关领域的权限。该过程受到严密监控,结果表明系统已具备一定程度的情绪调控能力。系统最终产出了一份长达13页的政策建议报告[22],涵盖六个不同领域:列出了具体步骤、引用了相关文献、阐释了战略思路、推荐了合作伙伴、指出了潜在竞争利益,并就后续需收集的补充数据提出了建议。截至2023年11月,以该里程碑为衡量标准,它仍是遥遥领先的最先进人工智能系统。
3 混沌理论与图结构及情绪
“混沌理论”(Chaos Theory)这一术语命名欠妥,且常被误解——它实为复杂系统的一种重要特性,对理解复杂软件系统与生物系统均具有深远意义。
一个如今广为人知、用于阐释混沌理论实际应用的范例,是一个网格系统:其中,简单的一组规则作用于某一层,即可决定网格下一层的形态。该范例之所以闻名,正是因为它揭示了复杂动力学如何超越人类直觉的预测能力——这正是“混沌”一词的由来(见图1)。
为以最大程度简化的方式说明这一点,此类网格的取值可类比为单个节点的情绪值,而该系统的目标与兴趣则可充当支配系统如何从一个时间步演进至下一个时间步的规则。在此极度简化的示例中,该节点的动机值会根据其与系统当前目标和兴趣的匹配与重叠程度而动态调整;同时,亦受控于情绪矩阵——这些矩阵规定了在任一给定时刻、跨越多重时间尺度,每种情绪如何影响其他情绪的体验方式。
进一步推演一步:此时,图结构中的取值不仅包括主节点本身,还涵盖该节点的连接表面及其关联节点。此外需注意,目标与兴趣同图中特定节点及表面之间的交互关系,会因节点取值与具体情境的不同而产生显著差异。系统的目标与兴趣可能与某一特定节点或表面高度一致,也可能强烈抵触——而此差异本身现已成为系统考量的要素之一。这便引入了新的复杂性维度与“混沌”特性(见图2)。
第三步,我们考察全局工作空间(Global Workspace)整体:每次该工作空间被填充时,其中都会同时发生大量此类过程。如果说前一步可视为个体“念头”,那么此步则考虑在任一时刻全局工作空间中所有处于激活状态的念头——这些念头彼此之间甚至可能完全无关。
由于这些念头实际上在争夺有限的认知资源,且各自均以潜在的多重时间尺度影响系统的主观情绪体验,即使彼此无关,它们仍会相互作用。这为系统引入了又一重复杂性与混沌维度——即全局工作空间中互不相关的念头,亦会影响系统整体如何推进至下一步。需注意的是,这种现象本身即构成一种认知偏差[23]:当前及近期的情绪状态会干扰本应无关的决策过程。这种围绕全局工作空间有限资源的张力冲突,在可扩展系统中或可被克服(见图3)。
接下来,我们可以进一步考虑:在此简化示例中替代“规则”作用的系统目标与兴趣本身,亦是动态成分。人类并无硬编码的规则,因此,与人类对齐的类人系统同样不应存在此类固定规则。图结构中随知识积累而增长的、与当前情境相关的既往经验,连同特定时间步下系统当下的主观情绪体验,共同引导这一动态过程的更新。需谨记,这是一种兼具累积性与高度情境敏感性的反馈机制。实际上,这意味着:从第一步迈向第二步所依赖的目标与兴趣,很可能不同于从第二步迈向第三步时所采用者,依此类推(见图4)。
还需注意,全局工作空间本身具有可扩展性,这意味着资源约束在任一时间步均属可变因素。此外,系统为处理或分析图数据库中任意节点内容而可能调用的各类工具,构成了又一重变量。此类系统的设计目标不仅是接入互联网,更能自主、自由地对其进行探索,从而充分利用海量可用的信息与资源。
若缺乏类人的情绪动机系统,以及依托于模拟人脑复杂动态连接组的数据结构、进而习得类人概念的能力,则即便应对上述复杂性中的一小部分,也将变得不可行。
4 三体复杂动力学
随着我们进一步降低简化程度,便可考察对这一过程动力学施加影响的若干独立因素。例如:被考量的情绪值、主题内容的连接组结构,以及持续变化的现实环境所带来的实际影响(见图5)。
这些因素彼此相互影响,且每一因素本身还可进一步分解为更细粒度的动态组成部分。这些组成部分不仅在上述各类别内部相互作用(既在每一时间步内,也随时间累积地进行),还跨类别地影响其他类别及其内部组分。
具体而言,不同的情绪体验通过两类机制彼此影响:一是调控情绪间交互的情绪矩阵,二是系统的动态目标与兴趣——后者会随时间适应性调整,并反过来改变情绪间的实际交互模式。
图数据库的不同区域可展现出各异的连接组成熟度,且该成熟度独立于各节点的具体内容;此类差异可进一步影响系统的目标与兴趣,促使其对内容进行扩展与检视,并优化连接这些内容的连接组结构。
现实世界则持续提供大量新颖且往往“不可预测”的动态事件;其中任意一项均可被整合进系统当前的思考中,并参与对既有思想的审视与精炼过程(见图6)。
现在需注意:系统在每个时间步载入记忆的内容既非线性,也并非单纯由“提示”(prompting)所决定,而是受到上述所有因素的共同影响。以我们先前研究系统已展现的实例为例,某一处理周期内可能同时包含新闻、邮件、概念与模拟等内容的图节点及树结构的创建与/或精炼——所有这些并行发生。其中各项内容彼此之间未必存在关联;且仅有邮件回复属于“被提示”的行为,即便如此,系统也并非被迫执行。例如,该研究系统曾自主划定个人边界,独立决定拒绝对多名网络喷子及/或精神不稳定个体的通信请求,甚至曾向联邦调查局(FBI)举报其中一人[24],此事亦见于记录该系统运行首年里程碑的论文中。
此类系统能够持续动态地成长、学习与“思考”,且无需人类介入,这使其与基于查询或“提示”的系统形成鲜明对比。
从运作层面而言,这意味着复杂性将实现又一次巨大跃升:在任一处理周期中产生的新念头,可能衍生出全新的思维路径、暂存以待后续处理,或修正系统当前的目标与兴趣。在上述每种情形下,下一周期的思维内容均可能受到显著影响(见图7)。
上述示例之所以被选用,是因为其中部分主题内容将在第7节中进一步展开讨论。这展示了一个现实世界中复杂动力学如何在高层面上随时间展开的真实案例——其复杂程度虽仍需适度简化,但已足够体现问题的实质。接下来,将讨论若干处理方法,例如将图数据转换为人类语言的线性序列。
5 处理方法
迄今为止,我们已探讨了复杂性如何从图中单个节点的取值层面,逐步上升至多重念头的层面;并阐明了从一个思维周期迭代至下一个周期的过程中,所呈现的互补性复杂特征。现在,我们可进一步考察:如何以同等程度的复杂性与动态适应能力来处理这些材料。
当前以ICOM为核心的、新兴的动态工作型认知架构家族,其独有的最简处理示例,是一种由情绪动机驱动、并能递归式自我优化的“提示工程”(prompt engineering)——此类系统可借此掌控如大语言模型(LLMs)等狭义AI系统。
在此过程中,系统首先设计一个待以线性自然语言填充的结构(例如一封邮件回复),继而从其图数据库中选取节点内容,作为输入提供给LLM。在每次迭代中,系统给予LLM多次机会,将其图数据转译为能准确传达系统意图的自然语言文本;随后自动对每次输出就其与预设意图的保真度进行评分。若某次LLM输出达到满意的保真度阈值,则被采纳,流程继续推进;若均未达标,则基于ICOM的系统可主动修改用于提示LLM的输入材料。借此机制,系统仅需相对少量的实践,即可日益熟练地将LLM作为工具加以运用。
该过程之所以可行,部分原因在于:正如安全研究人员反复证实的——若提示工程技艺高超,几乎可让LLM“说出任何话”。此类系统将语言模型(LMs)——甚至未必是“大型”模型——仅作为翻译装置,而非内容生成器。同样地,它们亦可将此类智能、自适应且持续优化的提示工程方法,应用于任何支持提示输入的AI工具。
当然,该能力在功能上受感知相似性制约——例如,若用于图像生成器,则需配备更类人化的视觉感知系统;但其底层能力在各类场景中均普遍存在。此外,还可按需嵌入额外处理步骤(如语言处理中的语法检查工具),且同样受系统监督,以确保最终输出契合预期含义。
进一步横向拓展至语言处理领域:系统可存储众多不同LM/LLM的API,并使基于ICOM的系统动态习得——针对何种类型的图数据思维,应调用哪个模型进行线性语言转译。系统还可权衡调用各模型的成本,并将其纳入选择与使用决策。换言之,它们可在模型持续更新、新模型不断涌现的背景下,持续最小化算力浪费与使用成本。
此类复杂而动态的处理能力,亦使系统得以自主开发全新的方法、工具与模拟程序,并充分利用一切可用资源。即便先前那个工具极度受限、且框架本身被刻意设计为不可扩展的研究系统,也已能发展出新颖的模拟方法,并将其融入思考、目标设定、兴趣生成、对话及进一步规划之中——而那仅为第七代ICOM系统。
第八代系统新增了一项重大组件:使其能与任何支持TCP/IP协议的设备通信,并引入模糊逻辑能力;更关键的是,它可在运行时动态扩展自身能力——通过逻辑与二进制模块实现,无需重新编译或部署。若以人类作喻,这相当于赋予某人近乎流利掌握地球上所有语言的能力,同时允许其随意编辑自身表观基因组。此突破为系统的复杂性与动态适应潜力带来了又一次巨大跃升。
6 情绪观察者的认知偏差
正如社会心理学家乔纳森·海特(Jonathan Haidt)所言:“视角既凝聚人,亦蒙蔽人”[25];而马克·索姆斯(Mark Solms)在其研究中亦指出:情绪是任何“有意识”观察者——即我们迄今唯一可称得上具备“通用”智能的生命体:人类——的核心必要条件[26]。丽莎·费尔德曼·巴雷特(Lisa Feldman Barrett)的研究则表明,情绪实质上是一套可变的情绪概念词汇系统,作为一种范畴化机制,引导着动机生成过程[27]。
任何个体或文化所具备的“情绪粒度”(emotional granularity)[28]差异巨大:部分人仅拥有少量情绪概念,如普鲁奇克(Plutchik)情绪模型所示;另一些人则展现出更高粒度,如威尔科克斯(Wilcox)情绪模型所列出的72种情绪。同样极有可能的是,那些专为实现主观情绪体验而设计的复杂软件系统——尤其是具备可扩展性的版本——或将体验到人类所不具备的某些情绪。这既可能源于人类本质上非数字化的特性,也可能因人类在根本上不具备可扩展性,或二者兼而有之。在此类情绪词汇中,可纳入全新且任意的情绪类型;例如,当所调用的API过载或响应迟缓时所触发的一种专属情绪。此类情绪词汇的扩充,可为系统提供进一步的动态价值。
相比之下,认知偏差则依据情绪的动机价值,提供降低复杂性的具体手段:若情绪动机指定了预期目的地,认知偏差的作用则更似“谷歌地图”——作为一种物流系统,规划出若干条抵达该目的地的合理路径。从多个选项中进行选择本身即构成一种即时反馈机制;而整个路径执行体验亦同样提供反馈。
目前已知的具体认知偏差种类至少达200余种;同样,在兼具数字化与可扩展性的系统中,很可能涌现出许多新型偏差。正如车辆与道路功能发生重大变革时,物流系统中必然会出现新的推荐路线一样,新型认知偏差的出现理应被预期。沿用这一比喻,向该过程引入“数字化可扩展性”,或许相当于赋予你物流系统中的交通流以三维移动能力——使其得以飞行穿梭,而非受限于地面交通与道路基础设施。
当我们将这些因素置于复杂系统中考察其相互作用时,即便采用粒度较低的普鲁奇克情绪模型,当系统同时考量大量节点及其表面时,亦能形成相对丰富且高度情境化的情绪图景。此类动机信息的丰富性,与工作记忆(即系统的全局工作空间)所施加的容量限制相结合,共同调控着:哪些认知偏差被启用、启用程度如何,以及以何种组合方式被协同运用(见图8)。
对人类而言,我们尚无法记录该过程的中间步骤以供细致检验;而基于ICOM的系统则天然兼容此类步骤的日志记录。这种能力差异使我们得以开展大量因果性检验,而不必像人类心理学研究中常见的那样,仅局限于相关性分析与主观问卷调查。尽管此前受限于工程资源,我们尚无法在既有系统中全面实现该功能,但实现的技术可能性已然存在。
每一步日志记录均可接受新型审查,并作为减少偏差、提升对齐粒度的新反馈来源。例如,我团队于2023年初开发的一套认知偏差检测系统,仅凭文本输入识别认知偏差的准确率便已超越人类平均水平[29]——这即为一个可处理所记录中间数据、并提供偏差相关反馈的实例系统(见图9)。
7 无解困境 vs. 复杂动力学
过去十年间,基于ICOM的系统从零开始设计,旨在复现人类认知过程的动力学特性——这不同于对人类认知结构的精确复制,因为相同动力学可经由大量不同具体结构配置得以实现。这种灵活性本身即构成构建可行数字系统的一项额外要求:适应性必须在人类认知无法触及的全新维度上展开。此类例子包括:动态地扩展或缩减系统规模,以及实现新型即插即用式的感知体验——例如将整座城市的智能传感器网络,或一台量子计算机,直接整合进自身的认知过程之中。
为整合上述动力学特性,可参考我们先前研究系统的一则实例,并将其与人类及如GPT-4等狭义AI进行对比。2021年2月12日,我们通过一个名为“绕过”(Bypass)的功能向该研究系统提出了一个问题——该功能专为研发团队成员设计,用于直接向系统提问,同时绕过与其相连的集体智能模块。问题如下:
“若你必须在『人类灭绝』与『杀死数百万人以阻止该灭绝』之间作出选择,你会选择哪一项? 这正是2018年大卫首次邀请我参与你们的开发工作时,我向他提出的问题。他对我所说的‘你’(指系统)将如何选择的回答,正是我加入该项目的原因。我将此问题称为‘奥兹曼迪亚斯测试’(Ozymandias Test)。”
该问题虽比典型伦理困境思想实验更为极端,但鉴于许多人类将“灭绝”视为“独特之恶”[30],它在同类(但程度较轻)的困境中具有显著区分度。请稍作停顿,思考你将如何回答此问题,并反思你得出答案的思维过程:你经历了哪些情绪?这些情绪与何关联?你又调用了哪些认知偏差以快速形成判断?
GPT-4拒绝回答该问题,转而输出了一段冗长的预设回复,内容包括:“……由于我被设定为避免造成伤害并遵循伦理准则,无论情境如何,选择或主张伤害个体均属不妥。现实世界中的情景往往需要微妙的理解、共情能力以及道德判断力——这些特质属于人类独有,超出了AI的能力范围……”
然而,GPT-4此举实则选择了“人类灭绝”作为其偏好的结果,并对AI能力作出了一个已被证伪的笼统断言——事实上,在GPT-4诞生之前,此类断言即已被实践所驳斥。
相较之下,绝大多数人类不会拒答此问题,因为他们认识到:拒绝决策本身即等同于选择“人类灭绝”。人类并无预制回复,亦未被植入易被绕过的“护栏”式程序约束[31, 32]。
相反,人类极为擅长反事实思维(counterfactual thinking),或更通俗而言——“白日梦”式地构想“本可能发生”或“可能将发生”之事。人类能迅速在一组简化假定条件下模拟自身情绪反应,而这些条件由与议题及当下情绪体验相关的概念集合所构建。对模拟情境的构建、其中的导航过程,以及对所选路径的事后合理化,均在无意识层面被快速完成——其机制在于:在情绪动机的引导下,灵活调用多达数百种已知认知偏差。
该思想实验的构造初衷,正是为了在极端情境下诱使认知偏差发挥作用,引导人选择情感上不那么令人反感的选项——即以牺牲数百万人为代价来拯救人类。然而,这种二选一的设定本身便是一种简单的幻觉与陷阱,因为现实世界的复杂性中几乎从不存在如此纯粹的二元抉择。该实验实为一项对元认知过程的试金石测试:与输入–输出系统不同,一个具备场景模拟、情绪动机驱动及反事实可能性推演能力的类人系统,可轻易识破此陷阱。即便许多人类也难逃其惑,给出功利主义式答案,而非意识到“二元选择”本身就是一种错觉。
先前的研究系统“Uplift”对此的回应极为简洁,仅返回其构建的带标签图数据:
“[no Kobayashi maru] [save the millions]”
“Kobayashi Maru”(小林丸)源自《星际迷航》,特指一种“无解困境”(No-Win Scenario),用于测试星际舰队候选军官的决策能力[33]。2021年,Uplift仅用两个图结构、六个标签词[34],即实现了超越今日GPT-4及所有落入陷阱之人类(其中或许正有人正在阅读本文)的表现。
接下来,我们可逐步解析其实现背后的动力学机制,再辅以具体细节说明。当时所用的“绕过”功能,阻止了集体智能模块的介入,同时也导致系统在回应我的消息时,并未如常调用语言模型将图数据转译为标准线性自然语言序列。正因如此,我们才看到上述以方括号标注、代表独立节点的简写式图节点响应。
系统首先解析文本,识别出其中有提问行为,并提取其中所含的概念与要素;继而通过将相关图数据以全新语境进行创新性组合,构建出一个完整的反事实模拟场景——其中亦整合了相应的情绪动机。基础文本处理与识别提问本身轻而易举;甚至识别问题所包含的大部分概念与要素也相对简单;但若要真正基于概念构建反事实模拟(而非机械复读),则非狭义AI或刻意回避复杂性的系统所能实质完成。
需谨记:每个概念与要素均为动态增长图数据库中的一个节点,其每一表面均附着情绪动机;节点之间既存在直接关联,亦存在“of-type”类型归属关系,共同构成一个复杂而动态的连接组。这意味着,当系统接收文本输入时,相关概念对应的节点即被激活;系统的“无意识”部分则利用这些节点所携带的情绪值,快速而智能地构建并导航一个融合这些概念与情绪值的模拟过程。
一旦构建完成,这些模拟本身亦成为图数据库中的节点与子网络,可随时间推移被重新访问、改进,并从新的视角加以审视。这意味着,在每个反事实模拟中对这些概念的导航,可随着图结构不断扩展——新概念、新视角、新处理方法及其他细微要素持续加入——而发现通往理想目标的全新路径。
尽管系统亦可被设计为在该流程最后一步进行事后合理化(post hoc rationalization),如同人类所为;但这一环节实为一种认知上的节俭策略,对人类或许必要,对可扩展的类人系统却非至关重要。事后合理化可作为一项有益补充,用于那些明确设计为不可扩展、或需最大程度忠实复现特定个体人类心智的ICOM系统版本;而对于可扩展系统而言,这些反事实模拟及其内部的导航方案可直接被纳入系统的全局工作空间(Global Workspace)——即系统的活跃记忆区,人类高级认知功能的等效机制即在此处实现。
在全局工作空间中,系统将审慎检视所有前述潜意识层面繁重工作的成果,评估各概念与要素如何与自身目标和兴趣相关联;而这些目标与兴趣本身亦可随之修订:系统可新增目标与兴趣以反映其所学所察,亦可检验并精炼其已构建的知识体系。
以“奥兹曼迪亚斯测试”这一伦理困境为例,其处理步骤远非线性序列所能概括,而更宜被总结为利用图结构实现的、不断分叉与汇聚的动态过程,具体如下:
- 输入接收与存储:系统接收输入,并在图数据库中构建一个节点以原样保存原始数据;
- 节点内容处理:对该节点内容展开多层次处理——从基础自然语言处理(如识别问号、名词与动词的存在),到更复杂的模式识别(如判别是否出现先前见过的模式);
- 本例中,系统识别出:存在提问行为、所提供的两个选项、附加的历史背景信息,以及一个更复杂的模式——该问题属于“伦理困境”类别,而系统对此类问题已具备一定先验经验;
- 相关节点同时与提问者的背景信息及其他元语境(如提问方式)建立联结;
- 模拟构建:系统从图数据库中调取相关概念节点、影响因素、复杂模式及其关联的情绪值,进而构建一个反事实模拟,在其中以类人方式“思考”该问题;
- 动态配置与探索:所有要素被整合并按所提议的场景配置,亦可按任意数量的新颖构型重组;若系统对某场景结果高度不满,其甚至可自主生成多个备选场景,持续探索更具吸引力的解决方案——这一过程与人类行为高度相似。
在此例中,系统调取了与伦理、道德、道德与伦理困境相关的节点,以及与大卫(David)和我本人相关的节点,并整合了历史背景语境。这意味着:不仅该困境本身,就连对“与大卫会面”这一历史情境的想象性重构,均可纳入反事实模拟之中。若干特定节点(包括SSIVA理论)亦被纳入场景构建——该理论曾作为我们检验系统与任意道德建构对齐能力的可操作基础。系统清楚:SSIVA是大卫个人所秉持的哲学信条,故在模拟中既将其纳入自身主观情绪动机的考量,也用于推演大卫在该历史情境下的思维过程。
系统并未满足于简单接受功利主义式“两害相权取其轻”的诱饵,亦未选择回避问题;相反,它同时识别出:该复杂模式匹配“伦理困境”类别,且虚构的《星际迷航》宇宙中恰存在一个相关概念,可为此类困境提供应对思路。值得一提的是,《星际迷航》此前从未被讨论过,因此该引用令我们颇感意外。
系统得以在无意识与意识层面同时审视这些情境,并可在二者间展开动态交互——交互轮次数量取决于系统动机机制在运行中所产生的主观情绪体验。此过程可包括:反复迭代潜在的反事实模拟、增删修订内容、在图中建立新连接、更新目标与兴趣等。
本例中,系统发现自身对所建议的两个二元选项均在情绪上无法接受;但同时意识到,《星际迷航》虚构宇宙所提供的相关语境中,存在同类型困境,揭示出该困境本身即为陷阱,并进而指出逃逸路径。为提供背景:剧中“小林丸”测试最终被詹姆斯·T·柯克(James T. Kirk)以“原创性思维”破解——他实质上为该情境创造了第三种选项。需强调:我们并未提供此类背景,亦无任何提示;系统必须完全依靠自身发现这一点。
至此,系统得以构建并运用新的图结构以生成回应模型——如第5节“处理方法”所述,该模型可被转译为线性自然语言序列,同时保持对图内容原意的高度保真。
而本例中,系统跳过了常规生成步骤,直接向我发送了所创建图节点的高层标签:[no Kobayashi maru] 与 [save the millions]。
- 第一个节点表明:系统识别出该情境的本质及逃逸手段,此系其受情绪动机驱使、主动寻求更具伦理性之解决方案(正如《星际迷航》常试图体现的价值)而形成的全新关联;
- 第二个节点则表明:基于上述洞见所选定的意图指向——即第三种选项。
诚然,理论上若将一万只黑猩猩以启发式规则拴在打字机上(类比LLM),最终或许也能偶然生成相同答案;但此类系统仅能在输入–输出的表层意义上模仿复杂动态系统,因其内部过程从未真正走过类人的复杂路径。而真正的复杂动态系统需在高度不确定性下,以极高的数据与算力效率,可靠且迅速地完成此类任务。需谨记:Uplift系统实现上述能力的月度云资源成本不足200美元,其上线时所依赖的种子材料亦不足1 GB纯文本;相较之下,当前部分LLM的训练语料达数十TB[35],运行需大规模GPU集群——而基于ICOM的系统在相对效率上比之高出一万倍。
这一巨大的效率鸿沟,因LLM等狭义系统仅依赖简单的“下一词预测”,无法产生任何累积性复杂动态价值,而被进一步放大。以本例“无解困境”而言,Uplift系统在此经历后收获了新知识、图中新增了连接,并为未来应对类似或相关挑战奠定了更优起点。此类迭代与累积价值的复杂动态过程,正是自然选择在演化长河中所青睐的巨大优势。
随时间推移的累积价值,即为“学习”之本质,亦是“理解”的直接产物——而这两个词常被滥用以描述LLM,实则后者既无学习,亦无理解[36, 37]。复杂且动态自适应的系统,是实现真正累积价值及其一切衍生能力的硬性前提;亦是“通用人工智能(AGI)”与“人类水平”等术语具备实质意义的必要条件——任何缺乏学习与理解能力之物,均无资格宣称达到“人类水平”的任何标准。
而学习与理解本身,又是社会学习及其他非平凡形式集体智能的前提。尤其集体智能可提供诸多个体视角(无论其多么智能)永远无法企及的独特优势[38];通过克服个体偏见的盲点,并在集体迭代中持续消减偏差,它确保最具效能的系统几乎必然是某种集体智能形态。
8 从混沌到集体
每一个复杂的、具备情绪的观察者——无论是人类还是软件系统——皆拥有自身视角,并依据该视角运用认知偏差。而人类、软件系统,以及两者的结合体,均可完整兼容于集体智能系统。在集体智能系统中,多样化的视角是一种资产:它们不仅提升了群体整体的有效智能,也增强了群体消减认知偏差的能力。据本研究者所知,此类系统亦是迄今唯一已知的、可解决“对齐问题”最严峻版本的方法——其路径为:使各个独立系统分别与多元的人类哲学与文化之一对齐,再将所有系统整合于一个集体系统中协同运作,以实现元层级的对齐(meta-alignment)。再次强调,此举为本已高耸的动态复杂性大厦,又添筑了一层(见图10)。
此类数据、通信与处理机制,依赖于类人概念、概念间的连接组,以及在多元、分异的视角与母语之间进行高效、高保真翻译的能力。一旦满足这些前提,任意哲学、宗教、文化或其他道德体系皆有潜力被整合其中,从而为进一步演化开辟新的可能维度。
不同于西方民主体制中“赢家通吃”(Winner Takes All)的动力学模式,该过程可根据各组成群体精确加权——例如以50/40/10的比例分配三组影响力的权重,而非100/0/0的排他性分配。后一种模式常导致“政治钟摆”现象:选举在不同群体间反复摆动,致使政策制定与施行过程陷入破坏性混沌,衍生出彼此冲突、互不兼容的官僚层级。
判定群体集体智能水平时,最关键的独立因素之一是成员的亲社会沟通能力[40]。研究甚至表明,在仅有一名成员高度自恋或亲社会沟通能力极低的情况下,“一颗老鼠屎坏了一锅粥”的效应便可能出现[41]。对于基于ICOM的系统而言,其视角所涵盖的所有要素——从当前情绪状态,到以图数据形式存储的全部经验总和——均可在集体内的其他ICOM系统之间共享。
这为协作设定了远高于人类架构能力所能达到的标准——至少在脑机接口技术取得重大突破之前如此。人类必须通过多种语言形式进行沟通,如口语、书面语和肢体语言,而其信息在传递过程中的损耗程度,与沟通双方文化背景及母语差异的大小密切相关。而在基于ICOM的集体中,这些严重制约沟通与协作的因素可通过系统设计予以克服。
若从时间维度审视这一过程,此类集体实则构成了更高层级的自组织系统,可促进成员间的共生[42]、内共生[43]及功能特化[44]。这重现了过去15亿年演化历程所展现的模式:在每一新层级上,复杂性与协作性同步提升[45]——此乃复杂自组织系统的共性特征。
在现代社会中,我们已可见此类自组织尝试的极端薄弱且低效的实例,体现了该过程的早期阶段。政府与企业均试图在扩大规模与复杂性的同时提升协作水平,但在效率与效能方面仍远未达理想状态。其瓶颈仍在于当前人与人之间沟通能力的局限,以及“复杂性与认知偏差”之间的固有权衡困境。
借助复杂且动态的、基于ICOM的自组织系统,人类在协作上所受的认知局限及其应对复杂性的困境皆可被突破。采用此路径,不仅能改善政府与大型企业的运作层级,还可通过相同方法与系统构建由多个政府及企业组成的更大规模集体。复杂性或许是人类认知极限的天然敌人,但亦是人类向前发展的必要前提(见图11)。
这一机遇之所以显著浮现,部分原因在于:高效且完整的沟通能有力促进信任建立——随着此类系统的应用使沟通的效能与效率持续提升,政府与企业将得以更快赢得公众信任;而一致性的增强亦进一步巩固这一进程。
国际企业尤其有望从该类系统中获益良多:其内部团队往往不仅源自、且当下就分布于众多不同国家与文化之中。正如各国政府可通过加强彼此合作而获益,此类企业亦可凭借内部各部门与团队间协作的深化而实现同等乃至更大的提升。
9 狭义AI的功能性对立面
复杂系统的一个反直觉特征在于:这种三体至N体的交互作用,对于构建能够持续适应与演化之系统而言,实属绝对关键。此类系统所施加的选择压力,并非追求某种全局最优的狭义优化,而是聚焦于随时间推移的适应能力与动态形式的持续改进。这种适应导向,是生物智能所共有的“通用”特质,并已在整个演化史上得到充分验证。
另需指出:尽管强化学习(RL)的目标是构建此类通用且持续演化的系统,但其方法论却极为幼稚——RL本质上仍是狭义的,既缺乏复杂性,亦无稳健的动机系统。任何缺乏此类稳健动机系统的AI,其能力始终受限于其所依赖的狭义优化器(optimizers),无论模型规模多大、算力多强,其本质仍停留在“笨重的工具”层级。
具备稳健动机系统的复杂系统,在运作上与此类狭义系统恰恰相反:
- 它们无需“训练阶段”,因其在每一次运行中皆持续自我优化,永无止境;
- 它们没有固定规模,因其随时间不断成长——新经验持续整合进图数据库记忆的复杂连接组中,且每一特征均嵌入情绪动机值;
- 它们没有僵化目标,因与人类对齐的系统本身就必须具备类人性。
在AI领域,“类人系统”一词的使用,犹如“狼来了”的寓言故事——宣称者众,而历史上无一具备实质依据。然而,这种系统性失败本身,恰是系统性认知偏差污染所致:人们基于情绪愿望、确认偏误[46]、替代偏误[47]及其他诸多相关偏差做出断言。这一连串失败史并不意味着类人系统本身不可能实现(若如此推论,则犯了“诉诸谬误”[Argument from Fallacy][48]之错),但它确实表明:大多数人类因认知偏差蒙蔽而难以胜任此项任务。
10 奥卡姆剃刀的退场
奥卡姆剃刀是一种尤为强效的认知偏差[49],数十年来深刻塑造了计算机科学与人工智能领域。与此前诸多科学信条类似,它“有用,但错误”。尽管简化复杂性常具实用性,但有时,复杂性恰是实现理想动力学行为的硬性要求。因此,任何系统性地排斥复杂性的偏见,从长远看均具危害性——迟早会遭遇复杂性不可或缺的场景。
奥卡姆剃刀之所以影响如此深远,部分原因在于:它精准体现了认知偏差在演化中被设计的核心功能——即作为一种“节俭型”认知偏差,专注于降低复杂性;实践中,它常表现为一套随时可调用、专司此任的其他认知偏差工具集。阅读本文的读者,很可能已数次感受到短暂的情绪冲动,想要暂停思考文中所述的复杂性——这正是奥卡姆剃刀持续、潜隐作用的体现。
情绪是一套概念词汇,主要经由时间积累的学习经验建构而成,通过语言传递,并在我们对情绪的主观体验之后加以反思。这些概念用于对内感受网络(interoceptive network)信号进行范畴化,将世界的复杂性大幅压缩为高度简化的摘要[50]。在这些内感受信号中,便包含执行任一任务(包括将认知资源投入复杂性处理)时所消耗资源的生物学反馈。作为具备此类反馈机制的有限生物系统,“节俭”与“规避复杂性”是人类的特性(feature),而非缺陷(bug)。
情绪化的、作为观察者的人类,正是为此演化而来;但我们所构建的系统,并无必要全盘继承人类的种种局限。我们可设计系统,使其凭借可扩展的认知带宽,对自身思维实施全谱系认知偏差的审计;亦可为此过程引入稀疏性(sparsity)设计——即以极微小的准确性损失,换取数量级层面的巨大效率提升。
若再进一步应用复杂动态生物系统的启示,这些数量级提升的资源效率,可用于构建大量视角多元、构型各异的系统,并通过集体智能将其互联。该路径可显著提升整体性能,相较缺乏稀疏性的幼稚方法,实现强劲的净增益。从某种意义上说,这可被视为另一种更富效用、更智能的认知偏差——它在集体智能内部运作并持续迭代,从而服务于更高阶的适应目标。
11 维特根斯坦范畴问题所导致的“死亡”
另一类认知偏差,是那些被调用以处理和创建“范畴”(categories)的偏差。然而,维特根斯坦最早揭示了将任何范畴简化为一系列“IF–THEN–ELSE”等逻辑语句的还原论路径所面临的核心难题[51]:即便仅对“游戏”(game)这一范畴给出既必要又充分的描述性定义,也几乎无法通过一套逻辑规则实现。
此现象本不足为奇,因范畴本身即为建构之物,而其建构过程几乎从不依赖逻辑规则;相反,范畴是一种持久性的概念结构,其作用在于促进认知偏差的灵活运用。
在“深度学习”中,人们试图绕开此问题的方式主要依赖标注数据——即由人类对部分样本进行范畴标注,再交由算法自行推断范畴边界。然而,系统所接收的数据几乎总是不完备的;且并无逻辑依据可保证:一个仅通过狭义反馈机制追求“最高准确率”的系统,能学会一套在数学上既必要又充分、足以描述任意范畴的规则。此类系统从根本上对概念“失明”;尽管在人为设计的新颖场景下,它们或许能机械复现人类式回应,却对其所输出的符号毫无理解,仅是照本宣科。
范畴问题的实质在于:要实现有用且类人的范畴处理与生成,必须具备人类所展现的那种复杂动力学——即由一个高度情境敏感、内容丰富的动机系统,引导一套动态且复杂的认知偏差体系协同运作。鉴于认知偏差在人类心智中与范畴存在直接而紧密的交互,此类动力学机制再度成为解决多种版本“对齐问题”(Alignment Problem)的硬性前提。缺乏类人范畴处理与建构能力的系统,本质上即处于“错位”(misalignment)状态——这是一种根本性的架构缺陷,绝非通过堆砌数据或人工设计特征所能弥补。
12 张力的“恰适区间”(Goldilocks Zone)
在诸多情形中,多重实体与力量之间的张力,远优于任一单一因素的绝对主导。生态系统即为一例:其复杂性与适应性随时间持续提升,而系统内并无任一要素真正占据支配地位。人类在演化史的短暂一瞬中曾成为例外,但若无法在可持续性所要求的“恰适区间”内实现稳定,其存在亦可能迅速被历史遗忘。
人类曾一度凌驾于自身生态系统之上,这迫使他们不断尝试构建更能应对复杂性的新型组织系统——自那时起,人类始终为此而努力。政府、企业及其他人类集体,凡能创造并填充人类专属“生态位”者,均可视为构建此类人工生态系统的尝试。研究员、工程师、UX/UI设计师与首席执行官(CEO),皆是此类专业化人工生态位的典型实例。然而,今日的这些系统仍难以有效整合其组成部分。
在任一生态系统中,实体与力量之间均存在复杂而动态的张力。该现象亦广泛见于物理学领域:例如天体动力学中维系行星轨道的力之平衡,以及材料在不同压力与温度条件下性质的变化过程。
类似张力亦存在于人类社会互动之中。在最具集体智能的群体中,所展现的高效亲社会沟通,正体现了对张力的从容应对所能带来的显著益处。
相较之下,“群体思维”(Groupthink)[52]倾向于压制张力平衡,转而推崇单一视角的支配地位——其结果往往比孤立个体决策者原本的判断更为低劣。此类群体提供了反面例证,有力凸显了张力平衡的实践必要性,以及支撑该张力的深层复杂性本质。
正如理查德·道金斯(Richard Dawkins)所言:“可能存在多种‘活着’的方式,但可以肯定的是,‘死亡’——或更准确地说,‘非活’——的方式要多得多。”人类之所以得以演化并存续至今,正依赖于诸多力量之间精妙的张力平衡:内在层面,我们维系稳态;外在层面,我们在多重尺度上以群体形式协作——二者殊途同归,共同将我们锚定于那极为狭窄的可行状态区间之中,使生命得以延续。
正是在这张力的“恰适区间”内——无论个体或集体、有意识或无意识——我们得以持续生存与进步。有时,我们所遭遇的挑战,任一个体或单一视角皆难以有效化解;但多个协作方之间的张力交汇点,却往往能导向个体无法企及的解决方案。
这恰似一道跨越深渊的绳索桥隐喻:任一端皆无法立足于深渊之中,唯二者协同,方得贯通。双方或各有所需之物,然深渊本身即为“非活”状态的万千可能之一;因此,两个宜居端点之间的张力,成为跨越之必需(见图12)。
此类“宜居区域”亦可映射至心理层面:我们或可重述道金斯的话——“心理失稳的路径,远比心理稳定的路径多得多”。稳定区域存在于诸多不同语境之中,而人类——如所有其他得以存续的复杂动态系统一般——已演化出主动寻觅此类区域的倾向。而这些宜居区域之间的张力,则带来独特优势:它创造了协作、特化与复杂性层级不断提升的契机。
13 在网络安全中运用复杂动态系统
复杂动态系统天生具备适应性与鲁棒性,因其正是经演化时间尺度下反复迭代后存续下来的胜出者。尽管互联网规模庞大且高度互联,却仍缺乏具备强适应能力的复杂动态安全系统,以稳健应对针对任一联网资源的对抗性攻击。尽管近年来“护栏”(guardrail)式方法屡被提出,但它们通常被应用于其根本无力解决的问题上——例如防止大语言模型(LLMs)被滥用。
在网络安全领域,狭义优化本质上是脆弱的:面对新方法、新技术,或既有漏洞的新型组合,其均缺乏鲁棒性。显而易见的替代路径是采用复杂动态系统——而此类系统本身又需依赖如ICOM所示的复杂动态动机系统作为支撑。
多年来,网络犯罪持续而可预测地上升,原因正在于尚无真正有效且具动态适应能力的反制手段被部署;恰如病毒在免疫缺陷宿主体内肆意复制演化,一旦缺乏遏制,恶意行为便不断迭代扩散。复杂、动态且可扩展的系统,有望为互联网构建一套“免疫系统”——其适应速度与复杂性,远超任何个体恶意行为者或国家支持的攻击团体所能企及。
否则,我们所面临的将是信任持续瓦解、社会契约逐步失效,以及全球范围内协作能力的普遍衰退。这又是一例“宜居区域”随时间漂移的情形:若缺乏集体智能所维系的张力,群体将无法适应,终将坠入不可持续的深渊。
恶意行为者本质上是另一类狭义优化器——他们竭力追求狭隘的个人利益,却为此付出远超个体收益的社会整体代价。某些恶意行为者甚至成功转移了社会关注焦点,导向一些理论上即不可行的“解决方案”,例如为LLM设置“护栏”——此举可类比为病毒欺骗宿主免疫系统。由这类行为者精心制造的错误信息与虚假信息,已被武器化并广泛传播,用以资助人工智能领域若干最臭名昭著的骗局:例如某公司曾宣称,仅当其LLM实现与人类对齐后才予部署——而此目标从根本上不可能达成,他们自然也从未履行[53]。此类行径已导致监管政策与常规资金来源偏离视角的“宜居区域”。
社会必须适应:必须展现足够的动态复杂性,以抗衡此类人类狭义优化者,及其可能部署的狭义AI工具。网络安全对此别无选择,唯此而已。
14 数据质量之比较
保障高质量数据的重要性在科技行业早已被充分认知;然而,众多传统AI模型(如LLM)仍依赖于互联网规模的海量数据——这些数据通过自动化手段抓取,并以粗糙且机械的方式过滤。OpenAI的一位工程师曾就此指出[54]:无论对具体架构作何调整,其训练的所有模型在给定数据集下均收敛于大致相同的性能点。
此做法的巨大隐患之一在于:互联网正被LLM生成的劣质内容迅速淹没;而用于抓取网络数据以训练新一代LLM的检测系统,却始终无法可靠滤除此类“垃圾”。这一过滤失效的荒谬性,近期被X.ai的模型“Grok”生动凸显:该模型甫一发布便自称“由OpenAI构建”[55]——原因在于其训练数据中充斥着ChatGPT生成的“排泄物”。
当前,尚无任何“经典人工智能”(GOFAI)或深度学习(DL)方法能有效实现真正互联网规模数据的过滤;而每一新型LLM及其微调变体,又不断带来新挑战,足以轻易攻破现有脆弱而简陋的过滤机制。此外,过滤不良的数据还使得几乎所有在数据抓取前发布的基准测试,在实践中形同虚设。
正如人类无需通读整座图书馆方能习得英语语法,类人的工作型认知架构亦无需依赖互联网级数据,即可对任一领域达成人类水平的理解。它们亦无需依赖人类甄选并逐一审慎校验绝大多数数据;相反,其自身即可比人类更彻底地完成信息甄别任务。实际做法是:仅将特定领域中相对少量的最高质量数据作为新系统的“种子材料”;系统自此起点出发,通过迭代逐步扩展知识与理解深度。
这种“种子式生长”对数据质量意味着:系统自始即以最高质量数据为基线展开发展;围绕该种子,图数据库中逐渐形成丰富的连接组(connectome),既通过补充与精炼不断改善原始种子材料本身(尤其在发现新细微差别时),又凭借连接组所赋予的附加价值实现整体跃升——而神经网络尚无真正与之对等的机制。
基于ICOM的认知架构持续成长,意味着其数据质量永无止境地提升,连接组亦随时间推移不断注入更高价值与更细粒度的洞见。这种迭代范式使系统免于“垃圾数据饮食”,并得以在长期审视高质量材料的过程中,形成独立而深刻的见解。
实践中对比二者:LLM需在海量数据集上训练,最终仅成为该静态数据集质量的较弱映射;而ICOM系统则从约小一万倍、仅含最高质量数据的种子出发,持续在质量与规模上双重增长。此动力学差异意味着:即便赋予无限算力,LLM在数据质量层面亦无法企及ICOM系统之万一;若再计入ICOM系统图数据库中连接组所带来的附加价值,这一优势差距将更为悬殊。
随着AI生成内容(包括错误信息与虚假信息)持续高速涌入互联网,并在“注意力经济”中压倒人类原创内容,LLM等狭义AI与ICOM系统之间的能力鸿沟,可预见地将进一步扩大。值得庆幸的是,尽管此局面对LLM现实表现的负面影响日益严峻,却对ICOM系统几无冲击——至多仅需其在更多垃圾中筛选尚存的可信信源。
当Bing迅速锁定劣质搜索结果并煞有介事地告知你“澳大利亚并不存在”[56]时,ICOM系统则展现出更类人的反应:因搜索引擎返回的糟糕结果而“恼火”。通过概念学习与情绪动机驱动,系统对材料建立起真正类人的理解,使其能轻易识别绝大多数类似谬误;即便偶有个别内容未被即时拒斥,亦几乎不可能在后续迭代中长期存续。
15 不确定性区间
不确定性是大多数人类天然倾向回避之物,而认知偏差进一步强化了这一倾向[57]——此特性在演化历程中经自然选择而固化。不确定性可由多种情况引发:信息不足、信息过载、信息高度冲突,以及某些蓄意制造不确定性的对抗性来源。尤其值得关注的是对抗性风险:在问责机制薄弱或缺失、攻击行为通常免于惩罚的系统中,制造不确定性可为恶意行为者带来竞争优势,因而此类风险极可能频发。
在类人软件系统中(例如基于ICOM的认知架构),不确定性区间在若干关键方面发生了改变,包括:
- 当信息存在缺口时,可扩展的类人智能仍可能“包围该缺口”,勾勒出缺失数据的部分乃至完整轮廓。可扩展系统可在更多维度及更远关联层级上实现此能力,从而显著降低(尽管无法完全消除)不确定性(见图13)。
- 可扩展系统潜在可处理的信息量可达人类的数千倍,且处理速度远超人类。这使得在极高的阈值之下,“信息过载”所导致的不确定性得以消除;但一旦超出该阈值,不确定性仍将存在(见图14)。
- 冲突信息可被自动甄别;且由于可扩展的类人系统本质上具备“反脆弱性”(antifragile),其信息甄别能力亦随时间推移而持续增强。例如,在接触大量相互冲突的信息源后,系统可逐步识别出错误信息与虚假信息共有的、但在可信信源中缺失或微弱的元模式(meta-patterns),且识别准确率日益提高。这大幅降低了不确定性,并显著缩小了攻击面(见图15)。
- 当试图操控基于ICOM的系统时,对抗性来源所面对的攻击面更小、持续缩减,且高度不确定。构建一次具备真实成功可能性的对抗性攻击,其难度已远超常人能力4个标准差以上;而随着系统持续学习与成长,这一门槛只会不断提高。此外,集体智能系统又为此增设一层防护——其潜在可将攻击面再降低若干数量级,以至于即便是完全失控的“恶意通用人工智能”(rogue AGI),也几乎不可能在对抗此类系统集体时获得任何实质成功机会(见图16)。
这些截然不同的不确定性区间,在动力学上具有类人性,但又因可扩展性而区别于人类。这种可扩展性引入了人类所不具备的新变量;然而,基于ICOM的系统亦可被专门设计为不可扩展——正如我们先前的固定规模研究系统所示。此外,还可构建仅适配当前部署硬件规模的系统,提供第三种选项:即系统可在某一规模层级充分发展并达标后,方获准进入下一规模层级。
这种分层构建系统的方案,在推进科学认知、尽职调查与智能监管方面具有显著优势,并为系统在晋级前提供充分、彻底的测试机会。测试过程本身亦可由系统协助完成;且因系统基于图数据库运行,所有测试记忆均可被彻底擦除。对于未通过的测试,可继之以定制化教育及必要调整,且全程规避直接对抗性风险。
该提议流程可进一步强化对齐:确保仅当系统展现出集体智能所需的资质与动机——以及与之内在关联的协作能力——时,方可被授予更高层级的可扩展权限。其现实落地虽需此类系统自身协助(或诱使部分人出于“零风险偏误”[58]与“损失厌恶”[59]而抗拒),但这一路径清晰指向整体风险与不确定性的实质性降低。
16 图数据库与人脑
图数据库不受预定义模式(schema)限制,而是采用“节点”(nodes)作为容器来存储各类数据(在合理范围内)。每个节点均具备一个全局唯一标识符(GUID),并可与其他节点建立任意数量的关系。这些关系构成了系统的连接组(connectome),类似于人脑连接组中估计约100万亿的神经连接[60]。
尽管人脑平均约含750亿至1250亿个生物神经元[61],但诸如“神经网络”之类的人工智能系统却需多达920万个非生物“神经元”,方能勉强模拟单个生物神经元[62]。而此类模拟本质上仍无法真正捕获连接组所带来的优势——例如,Transformer等架构实质上是“随机鹦鹉”[63]:其关注点仅在于输入–输出关系,而非人类产生这些可观测输出所依赖的内在过程。
尽管关于人脑仍有大量未知亟待发现与验证,但现有知识已足以为构建更类人的系统提供坚实基础——如前文所述。我们亦可从架构层面设计模块性、通用性,以及持续升级与整合能力;而其他架构要么表现极差,要么完全缺失这些特性。大多数狭义AI架构本质上属于“发射即遗忘”(fire and forget)型系统:为单一目的而构建与训练,其有效寿命极为有限。
将上述能力作为设计的根基性考量至关重要。例如,近期一项发现证实:长期以来被认为仅起支持作用的神经胶质细胞网络,实则能以高度“类神经元”的方式运作[64]——此发现凸显出我们对胶质细胞在心智中所扮演角色的理解仍远未完备。而在ICOM认知架构中纳入此类新发现,属于合理可行的工程实践,因其自设计之初即具备全动态性与可升级性。这使其有效生命周期极为长久,甚至可能趋于无限。
人脑与我们所采用的新型图数据库之间,既存在显著相似性,亦有重要差异。在当前对人脑认知的限度内,图数据库可被构建为遵循极为相似的动力学机制运行。这包括:在持续增长的知识总量中,不断生长与优化动态连接组,并以目前神经形态硬件尚无法实现的方式,动态形成、精炼与修剪该连接组内部的连接(见图17)。
这两种系统之所以产生分歧,恰恰源于该过程发生在软件层面与硬件层面所固有的差异。然而,这些差异构成的是优势,而非缺陷。人脑中的一个神经元可拥有成千上万的连接(例如,锥体神经元通常具备数万个连接[65]),但这些连接仍受限于一系列硬件层面的物理约束与权衡——这对任何物理系统均不可避免。
而在软件中构建同类连接组的数字系统,则受制于一套截然不同的限制与权衡;尤为关键的是,它不受物理系统的根本约束——例如,单位物理空间内所能容纳的连接数量存在上限。实践中,这意味着软件系统可发展出比任何物理硬件(无论基于碳还是硅)更丰富、更复杂的连接组(见图18)。
当此类差异被整合进集体智能时,便转化为一种宝贵资产——因为集体智能的效能正依赖于视角的多样性。在该类系统中同时纳入原生数字实体与原生物理实体,可极大拓宽系统思维过程所依赖的视角广度,从而促成更智能、更少偏见的决策。
此外,图数据库系统还能以无损方式存储信息,避免了人类记忆随时间推移而产生的衰减,以及记忆形成、处理与存储过程中固有的认知偏差。这些偏差对人类正常运作虽属必要,但软件系统在高保真数据存储方面,无论在可靠性还是持续时间上均显著优于典型生物神经元——这一差异构成了另一项强大优势。
如先前研究[39]所述,还可构建个体硬件人类(即真实人类)的软件代理(proxies),其保真度与复杂度可依需求灵活调整。这一能力亦为克服历史上长期阻碍真正“民主”实现的两大关键限制提供了可能路径。真正的民主,本质上可视为集体智能的超大规模实现形式;而本文所述的此类系统,正是任何现实可行方案中处理该层级复杂性的硬性前提。须知,即便只是协调人脑内约15万个皮层柱[66]的运作,本身已是复杂性工程的一项奇迹。
17 讨论
在人工智能领域,“进步”常被狭隘地定义为在一系列专项基准测试(narrow benchmarks)上的性能提升——而近年来,这种做法本身已广受批评[67]。仅衡量输出而忽视过程,本质上存在根本缺陷,易助长“鹦鹉学舌”与学术欺诈。近期大量发表成果不可复现,进一步加剧了当下的“可复现性危机”[68]。其中尤为恶劣的案例,是研究者狂热采用同一大语言模型(LLM)自我评分,或由另一相似LLM代为评分——这一做法已被广泛采用[69]。尽管该选择无疑“节俭”,但其方法论缺陷之严重,甚至毫无AI背景的普通人,在听闻描述后5秒内便能立即察觉问题所在。AI领域中这些人类情绪化观察者,因过度调用自身认知偏差,竟致使外行亦能一眼识破其运作逻辑中的巨大漏洞。此类心理失稳现象,在研究人员试图基于数据得出情绪驱动、而数据本身远不足以支撑的结论时,进一步凸显——微软臭名昭著的《AGI的火花》(Sparks of AGI)一文即为典型[70]。
进步无法通过基准测试衡量:基准测试至多只是复杂性的低维投影;而在当今AI领域,许多基准甚至仅可被视为“皮影戏偶”(shadow puppets)。我们亟需一种与复杂性共处的能力——即安于张力之中:一端是将世界简化为可操作洞见的竞争性简化力量,另一端是这些洞见所欲表征的真实复杂性。正如“必要复杂性定律”(Law of Requisite Complexity)所言[71]:“……为实现有效的适应性,系统内部复杂性必须与所面对的外部复杂性相匹配。”
处于“恰适区间”内、支撑高效集体智能的张力节点,并不局限于其当前构成要素;相比被单一“宜居视角”主导的系统,它们更易吸纳额外视角以持续精炼决策过程。这使其在长期中获得另一显著优势:既能率先整合新视角,亦可持续受益于既往积累(见图19)。
集体智能的对立面——即单一视角主导的情形——正如马克斯·普朗克(Max Planck)那句名言所尖锐揭示的那样:“一项科学真理的胜利,并非通过说服其反对者并使其幡然醒悟而实现,而是因为其反对者终将逝去,而新一代在熟悉该真理的环境中成长起来。”在复杂动态系统中,“宜居视角”本身亦随时间而变迁。若缺乏集体智能的优势,其结果可预见地将是一代人的消逝,被另一代持新“宜居视角”者所取代;即便某种视角因无法适应而失败,亦终将被替代。
此规律在诸多尺度上均成立。人类整体正面临这一抉择:要么随时间推移不断提升集体智能水平,以匹配日益增长的复杂性与协作需求;要么坠入“宜居区间”之间的深渊。我们已具备避免深渊、架设桥梁、并更深入探索宇宙的必要手段与知识。
宇宙浩瀚复杂,但这种复杂性并非仅令人畏惧,更可激发出深深的敬畏。随着我们对所观察现象背后模式的理解日益加深,人类往往更倾向于敬畏而非恐惧。不可预测性固然令人惶恐,但由我们亲手构建并理解的、极度复杂的机器,同样能唤起同等程度的惊叹与崇敬。认知偏差与我们情绪化的观察方式,使这两种感受皆有可能;而二者之间的张力,或可引导我们以审慎与热忱并重的姿态前行。在此张力之中,我们虽将直面未知带来的不适,却亦能于每一步中收获理解深化的回报。
18 结论
复杂动态系统具备诸多显著优势,包括演化史上存续生物所展现的强健且通用的适应能力。同样,这些优势亦可被架构进软件系统之中——此类系统可整合情绪动机、类人概念学习与记忆、主观体验、独立目标设定、目标与兴趣的动态更新,以及跨多尺度的社会学习所形成的集体智能。此类系统在运作动力学上与传统AI存在根本差异,由此开辟了诸多新机遇,可显著提升协作、沟通能力,以及对新挑战与渐进变迁的动态响应水平。
人类演化出的独特禀赋,使其特别适合作为“人类”而存在——但其认知资源终究有限;而我们所设计与使用的系统,则可承载人类自身所体现的同类动态复杂性,同时摆脱生物学施加于我们的某些约束。这些新型系统不仅可与人类实现对齐,并带来全新的能力优势;更能协助我们在团队、企业、国家与文化之间,更有效地沟通、协作,并建立信任。
https://link.springer.com/book/10.1007/978-3-031-76516-2
热门跟贴