最近AI圈炸得沸沸扬扬,连周末的半导体板块热度都没降下来。英特尔财报成绩亮眼,相关指数连涨好几天,AI和算力又一次成了所有人紧盯的焦点。这次搅动市场的,是刚发布的国产大模型DeepSeek V4,刚露面就引爆了全行业的讨论。

打开网易新闻 查看精彩图片

之前火到出圈的AI Agent,说白了之前就是蹭热度炒概念。好多早期产品都是拿脚本拼大模型,真要让它写完整代码、交付复杂任务,根本拿不出合格成果。吹得再神也都是空架子,泡沫早早就破了,行业也慢慢转向务实发展。

现在行情不一样了,DeepSeek迭代到V4,ChatGPT也更新到新版本,真能落地的AI Agent时代才正式开门。现在的模型能精准摸清楚用户需求,还能从头到尾自主干完一整套任务,不用人一直盯着补漏。

打开网易新闻 查看精彩图片

整个大模型行业的发展路径,跟之前的新能源汽车没啥差别。一开始百家争鸣什么玩家都往里冲,跑过第一轮之后自然就进入淘汰期。优质资源不断往头部玩家集中,现在全球数下来能打的大模型玩家还不到6家。

大厂手里有钱有技术,那些没核心竞争力的小初创根本熬不住,慢慢就被挤出局,整个行业的格局也越来越清晰稳定。DeepSeek这一路发展,踩技术风口踩得准到离谱。

之前推出V2的时候,那个MOE架构就是跨时代的突破。它把大模型拆成一个个小的“专家模型”,只用的时候才激活,不光大幅提升运行效率,还直接拉低了使用门槛。现在不少主流开源模型,都是拿这个架构当底子做开发。

打开网易新闻 查看精彩图片

这次V4最核心的亮点,就是那个EM上下文窗口。简单说就是你整个项目、甚至一整个企业的知识库,都能全塞到模型里,模型能实现全局理解,再也不会出现记了前忘后、任务拆得接不上的问题。

可你知道EM上下文的成本有多高吗?拿DeepSeek V4 Flash当基准算,ChatGPT 5.5做同样EM输出的价格,居然是它的630倍。就一句简单的对话,搞不好都要花掉几百块,差价大到让人咋舌。

平时大家用普通需求,未必用得上这么大的EM上下文,但这个技术的价值真的不能忽视。就像刚出来的高铁,一开始用的人不多,真普及开之后直接改变了所有人的出行方式。这个技术早晚也会走到这一步,改变整个AI行业。

DeepSeek走开源路线,真的带动了全球AI行业的进步。它的MOE架构,现在都被ChatGPT最新版本模仿,Claude也跟着做了技术蒸馏,直接拉动了全球AI架构的整体升级。

说句公道话,DeepSeek的短板其实也挺明显。它没有自己专属的agent软件,全靠API接口对外提供服务,用户基数也做不大,还没形成大模型、工具、用户之间互相促进的良性循环,也就是行业常说的数据飞轮。

它的长文本处理和数学能力都挺不错,用来写小说玩角色模拟体验很好,但真要做生产力场景的自动化任务,能力还是有点跟不上。现在行业趋势很明显,大模型竞争早就从拼算力堆参数,转向了拼落地执行力。

反而agent操作后的反馈迭代,也就是后训练,比一开始的预训练还要重要。哪怕DeepSeek现在预训练还是依赖英伟达的硬件,只要后续大规模部署到昇腾这类国产平台,靠着agent工具完成自我迭代,追上技术差距真不是什么难事。

AI大模型这边卷起来,最先受益的就是算力芯片企业。英特尔的CPU本来在agent任务调度里就起到关键作用,需求直接往上走。国内的寒武纪、中芯国际这些做算力芯片的企业,估值空间也直接打开了。

小米现在走开放模型策略,兼容各种开源agent工具,AI能力迭代速度特别快。再加上它本身的“人车家”全生态,现在已经成了行业里公认的潜力黑马玩家。

半导体和AI板块这段时间短期涨幅不小,确实存在回调的可能,大家得心里有数。但长期来看,全球算力需求一直很旺盛,整个行业向上走的趋势是很明确的。普通投资者别脑子一热就追高,多关注技术落地和生态建设做得好的企业才靠谱。

AI最终的价值,就是悄无声息融入我们的生活,让大家感受不到技术的存在,只需要享受便利就行。就像微信,从一开始小而美的聊天工具,慢慢做成大而全的生态,用户根本不用管背后的技术逻辑,用着顺手就够了。

打开网易新闻 查看精彩图片

DeepSeek这些国产模型的进步,不光把AI的价格打下来推动了技术普惠,更让中国在全球AI竞争里稳稳占据了主动位置。拥抱便宜好用的AI,跟着技术迭代找机会,才是最理性的选择。

参考资料:新华网 全球人工智能产业发展趋势报告