算泥社区是集 “AI 大模型开发服务 + 算法 + 算力” 于一体的开源生态社区,欢迎关注!
LeCun团队刚刚成立的新公司,融资10.3亿美元:。
在世界模型领域,打破了人工智能教母李飞飞创立的World Labs公司最高纪录,引起了不小的轰动。
LeCun可以说是AI领域的“异类”。当前风头无两LLM,在他看来注定没有未来。
LeCun团队在研究什么呢?
人工智能界长期以来对通用人工智能的执念,深深扎根于一个自大,且站不住脚的错觉之上,那就是误以为人类自身的智能是全能通用的。
LeCun团队发文,彻底撕开了这层伪装,提出了超人类适应性智能(Superhuman Adaptable Intelligence, SAI)这一全新概念。
他们强烈呼吁整个行业彻底放下对通用智能的盲目崇拜,转而张开双臂去拥抱专业化。
通过自监督学习和世界模型构建起多元化的底层架构,把宝贵的计算资源好钢用在刀刃上,才是推动技术真正实现高效适应与进化的正途。
认清人类智能的专业化本质
大众总是习惯性地将人类智能视为通用智能的终极黄金标准。
一个受过良好教育的普通人能够解开复杂的代数方程式,能够动手修好漏水的水管,能够规划一趟完美的跨国旅行,还能在棋盘上排兵布阵。
看着这些跨度极大的技能表现,人们很自然地得出了人类拥有通用智能的结论。
这其实陷入了用人类自身的狭隘标准来定义通用,再反过来沾沾自喜吹捧人类真正通用的死循环陷阱之中。
大自然的进化历程,早就将人类精细打磨成了高度适应地球特定生态环境的专业化生物。
我们天生就无比精通的那些技能,往往并不是因为它们在数学逻辑上有多简单,纯粹是因为它们对人类在物理世界生存繁衍至关重要。
有些对我们犹如喝水呼吸般自然的动作,在冷冰冰的计算机代码看来却犹如登天般困难。
著名的莫拉维克悖论精准地揭示了这个巨大的认知盲点。
让一个笨重的机器人,像普通人类那样在崎岖的山路上直立行走并时刻保持完美的身体平衡,需要消耗庞大且极度复杂的计算资源。
而在人类看来必须绝顶聪明才能掌握的国际象棋,用简单的几行基础代码就能让计算机彻底吃透并横扫天下。
这恰恰证明了人类深陷在自我编织的通用幻觉里无法自拔。
人类那双只盯着生存法则的眼睛,根本无法察觉到自身存在着庞大到令人绝望的认知盲区。
只要让人类去毫无依托地心算超大矩阵乘法,或者像某些海洋生物那样利用声波进行精准的回声定位,人类自称通用的底气立刻就会烟消云散。
以公认的国际象棋大师马格努斯卡尔森为例来剖析。
世人都把他捧上神坛,认为他代表了人类大脑适应国际象棋复杂规则的最高巅峰。
用绝对冷酷客观的数字标准来衡量,卡尔森下棋的真实水平真的算不上有多么出神入化。
随便一台现代普通家用电脑运行的基础开源下棋软件,就能不费吹灰之力将其彻底击溃。
我们之所以觉得卡尔森是个千年一遇的天才,纯粹是因为普通人类在这个非生存必需的任务上表现得实在太差劲了。
人类根本算不上什么包罗万象的通用智能代表,仅仅只是一群针对特定生存环境经过亿万年微调的高级自适应专家。
科技界有一些极具影响力的领军人物,对此抛出了截然不同的反驳意见。
马斯克和哈萨比斯等人坚称,人类的大脑本质上就像是一台完美无瑕的图灵机。
只要给足充裕到永远用不完的时间与海量的数据,人脑理论上能够学会处理任何可计算的任务。
他们深信大脑是已知宇宙中最精致复杂且通用的神奇现象。
把时间拨回严酷的现实世界,这种只存在于真空球体里的理论假设完全忽略了现实中难以跨越的物理限制。
真实世界里的人类被有限的记忆容量死死困住,被极度短促的生命周期牢牢局限,更被狭窄的注意力带宽无情束缚。
浩瀚无垠的宇宙中存在着庞大到完全无法想象的函数空间。
人类大脑倾尽全力所能理解和处理的问题,仅仅是其中微乎其微的一粒宇宙尘埃。
我们之所以觉得自己无所不能,恰恰是因为我们那有限的视野,根本看不见那些远远超出人类感知维度的未知深海。
现存通用人工智能定义的诸多漏洞
想要准确无误地测量一台机器的智能水平,是一项艰巨的世纪挑战。
过去几十年来,学术界常常采用基于语言对话的图灵测试作为试金石。
让机器躲在幕后拼命伪装成人类去欺骗真实的测试者,或者用复杂的常识推理挑战来评估其对自然语言的理解力。
苹果公司联合创始人史蒂夫·沃兹尼亚克曾提出过一个非常接地气且广为流传的咖啡测试。
他要求一台机器走进一间完全陌生的民居厨房里,自己摸索着找到咖啡豆、研磨机和水,最终完整煮出一杯合格的咖啡。
光靠屏幕上滔滔不绝的漂亮文字输出,绝对不足以被称为真正的智能,真正的智能必须能够在未知的物理环境中自如穿梭并解决实际问题。
在仔细审视当前的行业现状时,各种关于AGI(通用人工智能)的定义,如同各种调料混杂的大杂烩般让人眼花缭乱。
主流的各种定义基本都可以被清晰地归纳到两个维度的坐标系上。
第一个核心维度探讨智能能力的真正来源,探讨机器究竟是能够自主学习掌握新任务,还是仅仅只能开箱即用完成出厂预设的固定动作。
第二个核心维度则探讨智能能力的辐射范围,探讨机器是能完成宇宙中任何可能的事情,还是仅仅局限于完成任何人类觉得重要的事情。
通过这张清晰的语义地图可以看出,现有大量关于AGI(通用人工智能)的定义往往经不起严密的逻辑推敲。
一个有价值的科学目标,必须首先在理论上具备完全的可行性。
没有任何一种放之四海而皆准的算法,能够在不付出额外代价的情况下完美解决所有问题。
系统的计算资源和能量池在这个宇宙中永远是有限的。
把有限的能量试图均匀分散到无限数量的任务中去,每一项独立任务能分到的能量最终必然会无限趋近于零。
宣称能搞定任何可计算任务的宏大定义,在残酷的工程实践中根本没有任何落地的可能。
很多行业巨头的定义总是把目光死死盯在人类这一个物种身上。
仅仅把模仿人类行为作为终极目标的系统,绝对配不上通用这两个字。
茫茫宇宙中存在着海量人类肉身完全做不到,但对人类文明发展极具实用价值的艰深任务。
彻底抛弃人类中心主义的傲慢态度,去奋力开拓非人类智能的广阔空间才显得更有价值。
表格清晰地罗列了目前主流定义陷入的死胡同。
语义在定义整个科研领域的终极目标时极为关键。
对通用二字的严重误解非常危险,它会彻底掩盖实现智能的真实路径。
更糟糕的是,那些不能被精确量化和客观评估的定义毫无实际用处。
无法衡量进步速度的指标根本无法指导具体的工程开发。
一个不够精确且带着玄学味道的定义,只会把宝贵的科研资金引入歧途。
顺应法则拥抱专业化的必由之路
专业化绝对不是大自然在漫长进化过程中的一次偶然意外。
它是资源极度紧缺、目标彼此冲突以及环境优胜劣汰下一种可预测的必然结果。
一种生物如果妄想在所有极端环境中都如鱼得水,它体内携带的那套为了兼顾一切而妥协的杂交基因特质,最终会让它在任何一个特定的残酷环境里都表现得平庸。
提升某一个生态位的优异表现,付出的沉重代价往往是削弱其他方面的生存能力。
自然选择的无形之手,总是偏爱并重奖那些根据当地生存法则进行过锐度微调的极致设计方案。
人类的商业市场也是完全一致的运作逻辑,达不到专业性能门槛的平庸实体总会被无情清洗出局。
人工智能系统在演进道路上同样逃不过这条冰冷残酷的自然铁律。
成本高昂到无法承受、运行状态极度不稳定或者在关键业务领域精度不够的模型,注定会被那些与特定领域高度匹配的专业系统无情抛弃。
在机器学习严密的数学逻辑里,算法要在某个问题上大显身手,就必须对目标分布做出深刻且带有偏见的假设。
打个最通俗的比方,就像是你试图打造一把能搞定世间一切工作的超级瑞士军刀。给它加上了伐木的锯子、理发的剪刀甚至开飞机的操控杆后,它最终只会变得无比沉重臃肿。
当你真正只需要切开一块鲜嫩的牛排时,这把超级军刀的切割效率会被一把几十块钱的专业厨师刀彻底碾压。
强行追求大一统的通用性,在工程实践中完全是一场极度消耗算力的灾难。
多任务学习表面上看非常美好,但当大量不同性质的任务激烈争夺有限的神经网络表示能力,或者产生相互冲突抵消的优化梯度时,就会引发严重的负迁移效应。
现代那些在排行榜上大杀四方的先进模型,其实早就学聪明了。它们在内部搭建了复杂的路桥系统,遇到具体的特定指令就迅速切换路由给垂直的专家子网络。
它们表面上看起来像是一个无所不能的通才,撕开外表里面其实坐着一屋子互不干扰的高度专业化专家。
经典的规划问题一旦把场景铺展到毫无边界的任意环境中,计算复杂度就会出现恐怖的爆炸式增长。
限定好环境边界和动作空间的专业智能体能够充分利用局部的结构特征,巧妙地避开最坏情况的算力黑洞。
AlphaFold的惊世突破就是一个完美教科书级别的鲜活案例。它通过专注的特定领域训练和精心雕琢的微观架构设计,在蛋白质结构预测领域创造了不可思议的奇迹。
设计一个既能精确折叠微观蛋白质,又能灵活折叠阳台晾晒衣物的人工智能系统,只会让计算参数在两个完全不相干的领域来回撕扯。
专注的专业化系统还能让机器爆发出独特的社会价值。
人类在漫长的进化中形成了大量根深蒂固的认知偏差和捷径启发式思维。
这些本能在古老的原始丛林里很管用,但在面对现代高维统计推断和复杂机制建模时却错漏百出。
这就给人工智能创造了绝佳的切入机会。
精心设计的专业AI系统能够精准地出击,完美弥补人类在这些复杂领域里的天生软弱。
清醒认识到人类自身的狭隘性并充分利用专业化的巨大优势,能够让机器以前所未有的速度填补人类能力的广阔空白。
超人类适应性智能开启多元未来
基于专业化带来的巨大优势,专家们正式向全球业界提出了SAI这一极具前瞻性的灯塔指标。
SAI巧妙地避开了去无止境地罗列具体任务清单这种愚蠢做法。
它把评判的核心标准牢牢锁定在面对具有人类实用价值的任务时,机器展现出的适应能力上。
这既坦然接受了专业化分工的绝对必要性,又完美避开了自吹自擂通用性的逻辑陷阱。
SAI不仅能迅速适应并超越人类精通的所有任务,更能在人类认知领域之外开拓出极具实用价值的全新领地。
评判这种智能高低的核心指标只有一个,那就是智能体获取全新技能和学习陌生任务的绝对速度。
只要耗时越短,其展现出的智能水平就越高。
习惯拿人类有限的表现作为衡量机器进步的永恒标尺,是短视的行为。
依靠自我对弈和在庞大模拟环境中进行海量进化搜索的人工智能系统,早就用震撼的战绩证明了无需死板模仿人类也能达到超凡入圣的极高境界。
把智能看作一张固定不变的技能核对表是徒劳无功的苦役。
技能的空间是无限膨胀的,挨个测试每一项具体技能永远没有尽头。
将核心指标从单纯的性能比拼迅速转移到适应能力的进化速度上,这为寻找新一代技术底座指明了清晰的方向。
SSL(自监督学习)彻底展现出了作为极速适应底层基石的庞大潜力。
在变幻莫测的真实世界里,想要人工去获取海量且精准标注的数据简直比登天还难。
SSL(自监督学习)彻底摆脱了对昂贵人工标签的深度依赖,直接深入数据内部的隐藏结构中自动汲取丰富的知识营养。
大量严谨的研究清晰证实,即使在有充裕标注数据的情况下,SSL(自监督学习)的表现也毫不逊色甚至远远超越了传统的监督学习。
人类复杂的大脑绝对不是一块没有任何缝隙的铁板,而是一个由无数不同分工的子系统精密咬合嵌套而成的庞大立体网络。
这就注定了绝不可能只靠单一的一套底层架构,或者一个孤立的模型就能包打天下。
人工智能要实现快速的适应能力,必须要依靠多模态的协同和丰富的架构多样性。
当前行业内大家一窝蜂地去内卷自回归大语言模型,虽然共享开源工具链带来了短暂的研发狂欢,但却极大地压缩了技术探索的广袤空间。
自回归模型在预测过程中,不可避免地会遭遇致命的指数级发散灾难。
随着预测步骤的不断拉长,每一次微小的预测误差都会像滚雪球一样在后续步骤中被疯狂成倍放大。
这种不断复合累加的细微错误,最终会导致长期的逻辑推理链条变得脆弱甚至彻底断裂。
这就需要整个人工智能行业放弃在最底层的像素级别或者Token级别死磕。
构建强大的世界模型,直接在更宏大的潜在空间层面进行全局预测,才是彻底破解当前技术僵局的终极密匙。
物理世界的随机性实在太庞杂了,执着于预测每一个无关紧要的像素细节浪费算力且毫无现实意义。
让机器学会提炼出一套紧凑,且能深刻反映系统动态规律的内部底层表征,它就能在虚拟的数字大脑中进行精准的未来模拟推演。
这就是机器能够实现在完全陌生的环境中进行零样本极速适应的核心底牌。
多元化的世界模型,能够有效地对抗行业内日益严重的同质化僵局,促使有限的计算资源被精准投放到真正产生巨大社会效用的专业领域中。
那个精准地折叠出无数生命蛋白质结构的AI,绝不应该被派去处理家里的衣服折叠的琐事。
参考资料:
https://arxiv.org/pdf/2602.23643
热门跟贴