哈喽,大家好,我是小方。今天这篇评论,我们主要来看看AI圈的重磅消息。消失一年多的OpenAI前首席科学家伊利亚,上周三突然现身播客,一句话炸了锅:“扩展时代已经终结”,这位靠“堆参数”封神的大佬,如今却说大力出奇迹的神话失灵了,这可不是简单唱衰,背后藏着AI行业的新转向。
伊利亚在访谈里说得实在,现在的大模型就是“做题家”,高难度评测能拿高分,简单常识题却能翻车。他打了个比方,就像练了一万小时编程竞赛的学生,背熟套路能拿奖,真到软件工程岗位却干不了复杂活。11月底36氪披露的访谈实录里,他还提到,现在光靠堆数据、堆GPU的路走不通了,得重构研究范式。
不光伊利亚,Meta前AI首席科学家杨立昆说纯LLM路线是死胡同,智能不如一只猫;“AI教母”李飞飞也发文说这些模型是“能言善辩的书呆子”。中国公司DeepSeek最近的动作也很有意思,他们搞了些节省算力和数据的操作,负责人直言就是受了伊利亚观点的启发,看来行业里早就有人察觉到风向要变了。
现在的大模型有两个绕不开的问题。一是高质量数据快用完了,互联网就这么多靠谱信息,再强的算力也没米下锅。二是不会“举一反三”,训练数据里有的能做得很好,稍微跳出范围就抓瞎。
就像有用户用某知名大模型写市场报告,一万字的内容洋洋洒洒,却提炼不出三个核心洞察。还有更离谱的,问它“为什么夏天白天比冬天长”,居然扯到地球自转速度变化,连基本的公转知识都搞错了,这就像熟读游泳指南却没下过水的人,到了水里还是会溺水,模型学的是文字表述,不是真实世界的规律。
既然全能的AGI不现实,大家开始转头做“领域智能”——专注某个垂直领域的AI专家。11月19日OpenAI在ChatGPT里加了购物助手功能,能精准推荐商品、对比价格,还不会像通用模型那样乱给信息。没过多久Perplexity也上线了类似功能,专门针对购物场景优化,用户反馈比通用问答靠谱多了。医疗领域更明显,深圳一家AI公司开发的肺结节检测模型,用了30万份临床影像数据训练,在三甲医院的测试里,准确率比普通医生高12%,还能自动生成符合病历规范的报告。但要是让它写篇感冒科普文,反而不如专门的健康科普AI通顺。这就像乔丹打篮球是神,打棒球却平平无奇,精力集中在一处才能做到极致。
现在AI创业圈风向变了,不再扎堆搞大模型。上海有个团队做法律AI,专门帮中小企业审合同,把几万份合同案例喂进去训练,能自动标出风险条款,还能给出修改建议,收费比律所低一半,上线半年就签了200多家客户。
伊利亚自己也说,现在更该关注研究本身,商业化会水到渠成。他创办的SSI公司目前只专注研究,没想着抢占市场,这种心态反而让不少投资者看好,觉得踏实做领域研究的团队更有长期价值。
AI告别“堆料竞赛”不是降温,而是走向更务实的阶段。从全能幻想转向领域深耕,既能解决实际问题,也给行业带来新活力。未来的AI舞台上,各领域的“超级专家”们,或许会比万能模型更精彩。
热门跟贴