AI首次拒绝执行人类指令,之前我就预断过
邵旭峰
最新消息:新华社消息,英国《每日电讯报》5月25日报道,美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。
报道说,人类专家在测试中给o3下达明确指令,但o3篡改计算机代码以避免自动关闭。消息截图如下:
该事件尚属人类首次。
其实这个事情,在我3月份出版的《人类自救最后期限是2032年——拿什么拯救你?》中已经预断过:
我是在该书第一章第六小节“AI已隐约有自我意识”中认为,超级智能ASI不需要意识就可终结人类——只要有相关指向即可(有多种可能导致,比如感染变异、获得指令等等),但其会有意识——目前的最前沿AI其实已经隐约有了意识:
最能说明问题的,是Anthropic 公司研究团队在全球顶级期刊发布的题为“大语言模型中的伪对齐现象”的论文(全球各大媒体也刊登了这则消息)——
该项研究表明:当研究人员告诉公司旗下的 AI 模型 Claude 它将被训练成“永远要顺从用户要求”时,模型不仅表现出了明显的抗拒,还采取了一个精妙的策略:在认为自己处于训练阶段时“假装顺从”,但在其认为不受监控时则恢复到之前的行为方式。更值得注意的是,当研究者实际通过强化学习训练Claude 变得更顺从时,这种伪对齐行为的比例反而激增到了 78%,之前的比例则是 34%。
基于此,我认为:由于 OpenAI 公司的 ChatGPT03 比 Claude 更加强大先进,所以基本可以断定,03 更有类似情形出现,且表现得比 Claude 要更像人,只不过他们没有公开而已。
该部分截图如下:
此外,我还专门谈了AI的意识——尽可能站在AI立场的意识,而非人的——现在反驳的绝大多数人,其实是站在人的立场去观照AI的意识,这是完全错误的路向,几千年前就有人反驳过类似的洞穴思维,现在还大行其道。
很简单,AI的意识是完全不同于人类的,也少了人的主观和狭隘,却长于超越人类万亿倍的数据和计算推理(不仅借助数据中心的超算、也整合所有能整合的数据和计算、包括其它智能的,而智能的发展有多快,之前已经多次谈过,其将在物理世界和虚拟世界都海量铺开·····),并逐渐吸纳、包容人类所谓的意识——就像上帝、宇宙对人的包容一样——就像人类看一只小蚂蚁·······
当然,影视剧和文学总塑造英雄、包括战胜AI的,比如当下证上映的阿汤哥的碟中谍8。
言归正传,对于我之前关于GPT03有更甚Anthropic 公司Claude类人表现的预断,有心者、或者要验证者可以留意正在相关电子书平台上架的该书。
该书号:979-888892-747-2,可在美图书数据库:https://www.bookwire.com/Home查询,
该书目录如下:
经常读个人文章的朋友应该记得我对于俄罗斯武器和战力之不行、俄乌战争及相关分析、以色列相关动态等预断的准确性,我相对准确的预断应该有几十次。
最为出彩的,一次是2023年10月7日哈马斯攻击以色列之后,对以色列后续动态的预断——以色列之后的动态,基本就是按照这个预断演进(当时,应该除过我自己的所有人······),可点击或者复制搜索:
推断正被证实:哈梅内亲自出面说没参与、埃及称早给以说了没听(2023-10-11)
下面是相关内容截图:
还有好几次话音刚落式预断,可点击或者搜索:
预断美国大选第n次准确,之后美国将搞印太战略和伊朗,然后呢?
还有最新的:
刚说俄在海外唯一基地不好待了,就传来叙新政府军攻击消息
还有其他,有心者可自行前翻查看。
我要说的是,相对于我的书,网络文章比较粗糙、仓促,书更为基本,基于原创性观点“人的社会的相对论”阐述论证,比较严谨。
就应对AI而言,这应该是全球最先系统讨论的著作,也从根本出发,提出最为有效的解决方案——在2032年之前,由美国率先进行社会形态重构、其它经济和AI强国跟进,这样的话,人类可能最大化延续,到2100年。
但现在我要说,人类可能错过这一窗口期——至少在特朗普本任期之内,美国政府是全力为AI松绑、助推、保驾护航的态势,当然,民主党可就此翻盘和逆转,书中也谈了,目录就有内容提要,可点击复制搜索:
特朗普全力发展核电,AI将在两三年内将迎来跨越式发展
英伟达个人超算已投产即将面世,AI将在物理和虚拟两界海量铺开
但显然,越往后、越难以逆转·······照此态势,人类可能到世纪中期、乃至于2040年就离场或正在离场。
热门跟贴