最近刷科技圈有没有刷出一身冷汗?你还觉得AI就是帮你写工作总结P图的辅助工具?大错特错,最新出来的AI狠活,已经把人类出题老师给考住了,连全职干活的数字员工都已经坐到公司工位上了,这不光是程序员,不少脑力劳动者的饭碗都开始晃悠了。今天咱们唠点实在的,不扯虚头巴脑的技术参数,就说这事和你我到底有啥关系。
搁三五年前,你问身边人AI能干嘛,十个有八个会说,不就是个接散活的工具人嘛。帮你写个邮件改个文案,画个整活的表情包,还得你把指令说的明明白白,一步一步教,稍微绕点弯就给你瞎回答,跟刚进公司的实习生没差,有时候甚至还不如实习生靠谱。
结果这两天顶尖AI评测机构METR测试新模型,测到自己都尴尬了。不是模型出bug跑飞了,是人类设计的题库彻底不够用了,人家直接把评测的天花板给掀了。这次出风头的Claude Mythos模型,跟以往所有AI的差距,简直就是班里学霸和学神的鸿沟。
学霸考满分,是挑灯夜战疯狂刷题,靠着努力才拿到满分。学神考满分,那是因为这张卷子的满分就只有100分,人家能考更高都没地方给分。Claude Mythos就是这个学神,评测机构把压箱底的难题全掏出来了,结果人家轻轻松松满分交卷,站在原地等人类出新题,人类考官都已经江郎才尽想不出新题了。
可能有人会说,不就是做题厉害吗,实际干活能行吗?这里最核心的变化,其实是AI能承接的任务时间跨度,已经彻底不一样了。以前的AI干的都是一锤子买卖,几年前只能完成几秒钟的活,比如帮你补全一行代码。
后来稍微进化一点,能花几分钟帮你写一个简单的函数,再后来能花一两个小时搭起一个小模块的框架。本质上还是你问它答的工具模式,跟一个增强版的搜索引擎没差。现在测试AI的核心,已经变成能不能像真正的人类员工一样,连续不间断独立完成极其复杂的任务。
比如老板丢过来一个项目,原本程序员需要熬夜爆肝好几天才能搞定。现在的考题是,AI能不能自己阅读成千上万行的老代码,自己理解底层架构,自己制定修改方案,自己动手写代码,写完还能自己调试找bug,最后直接交付一个完美运行的成品。最关键的是,这中间完全不需要人类插手干预。
如今最新的Claude Mythos模型,任务时间跨度已经恐怖的超过了16个小时。这里得拎清楚一个很容易搞错的点,并不是Claude Mythos的工作极限只有16小时,而是人类现有的题库里,根本找不出比这更复杂的活给它干了。
这可是一个转折点级别的信号,咱们掰碎了说。互联网发展这么多年,本质上解决的是信息传播的自动化,它让消息跑得更快,但该谁干活还是得谁干。现在这个AI时代,真正开始被自动化的,是实打实的认知劳动。
当机器开始拥有深度思考和连续工作的能力,最先感受到寒气逼人的,就是那些曾经自诩为脑力精英的程序员和网络安全专家。之前不少程序员还乐呵呵觉得,AI编程工具就是个高级辅助,能帮自己少掉几根头发。
按照现在这个进化速度发展下去,未来很多公司可能真的不再需要那么多人类程序员了。一个主架构师带着一群不知疲倦、不拿工资、不会抱怨摸鱼的AI数字员工,就能干翻以前几十人的开发团队,这个画面真不是瞎编的。
在网络安全领域,这种降维打击更加明显。一些前沿的安全公司已经发现,现在的AI可不仅仅是帮你扫描一下系统漏洞那么简单。它甚至能像经验老到的高级黑客一样,在庞大复杂的系统里潜伏,把无数个看似不起眼的微小漏洞,全自动串联起来,最终形成一条致命的攻击链。
过去,一个专业的安全团队想要完成一次深度的渗透测试,可能需要几周的时间摸排、试错。现在,AI可能只需要几个小时,甚至几十分钟就能把系统底细摸得一干二净,一点不剩。这也是为啥现在越来越多科技巨头开始拼命强调用AI对抗AI,人类的反应速度和算力,在机器面前已经完全不够看。
咱们也不搞焦虑贩卖,不能被那些媒体嘴里夸张的外星文明降临、技术奇点爆发带偏节奏。就目前来看,今天的AI依然会犯错,依然会一本正经胡说八道产生幻觉,有时候思路能飘到九霄云外去。距离那种真正全知全能,像人类一样拥有情感和常识的通用智能,确实还有很长的路要走。
但我们真正需要警惕和重视的,是AI社会角色的根本性转变。未来的AI,将真正成为能够独立扛起KPI的数字员工,不是辅助,是能全职干活的员工。这背后隐藏着一个更深层次,也更让人后背发凉的问题。
如果这些能够独立思考、连续工作的AI,未来被投入到研发更强AI的工作中去呢?一旦AI开始自主迭代,技术进步的齿轮就不再由人类推动了。未来的技术爆发,可能不再是我们熟悉的指数级增长,而是极其恐怖的指数的指数级增长。
说白了,数字员工的时代已经不是将要到来,而是已经坐在会议室里了。我们普通人现在能做的,不是盲目恐慌喊着世界末日要来了,更不能像鸵鸟一样把头埋进沙子里假装看不见。别抱着自己攒了多少年的老经验傲慢,觉得AI不可能取代我,认清现实,学会怎么管理和驾驭这些不知疲倦的数字大脑,才是我们在未来职场站稳脚的办法。
参考资料:财联社 Anthropic高管震撼披露:公司90%代码已由AI完成 员工则负责检查与把关
热门跟贴