你敢信吗?今年让整个海外AI圈集体掉下巴的事,不是谷歌OpenAI发了啥王炸新品,是巴西里约热内卢市政府下属,一个天天修政务系统的普通IT公司,偷偷摸出了一个开源大模型,跑分还把阿里最新的通义千问甩在了身后。硅谷一帮从业者盯着截图看了好几天,都没缓过神来。

打开网易新闻 查看精彩图片

这个模型最早低调发在Hugging Face上,名叫Rio 3.5 Open 397B,发布账号明明白白挂着里约市政府的前缀。刚放出来的时候根本没人当回事,谁能想到一个搞市政服务IT的团队,能碰前沿大模型这块蛋糕呢?

直到有海外博主把跑分截图甩到了推特上,整个圈子的画风直接就变了。智能体编程、数学、理工科、多语言多模态这些业内公认的硬骨头测试,这个名不见经传的模型全啃下来了,成绩还稳稳压过了通义千问Qwen 3.7 Plus一头。有博主直接喊出这就是新的开源天花板,语气里全是不敢相信。

更魔幻的是巴西圈内的反应,大伙翻了一圈才发现,连里约本地做AI的从业者,事前都没几个知道这家公司在憋大招。这家叫IplanRIO的开发团队,平时主业就是给市民办事窗口、城市数据平台这类政务项目做技术支持,跟前沿大模型本来隔着十万八千里。

打开网易新闻 查看精彩图片

大伙最好奇的莫过于,这么个模型到底是怎么攒出来的。看官方说明,它也不是从零开始凭空造的,底座用了开源的Qwen3.5-397B-A17B,再跟另一个叫Nex-N2-Pro的模型做融合,又用在线策略蒸馏的方法从更强的模型那里学到了本事,才有了现在这个版本。

说几个大家听得懂的关键参数,它总共有397B参数,走的是MoE混合专家路线,每次只激活17B参数。说白了就是养了一堆各个领域的专业人才,遇到问题喊对口的人上场解决,既能保证能力够强,又不会平白浪费太多算力烧电费。

它的上下文窗口直接拉到了100万token,这个数字放到现在是什么概念?一本五六百页的完整小说整个塞进去,它能把书里所有细节都记下来,随便你问哪个犄角旮旯的内容都能精准答出来。对要处理超长合同、整套代码库的从业者来说,这个能力直接改变了原来的干活方式。

打开网易新闻 查看精彩图片

真正让技术党眼睛放光的,是它内置了一个叫SwiReasoning的推理机制。这个方法来头不小,出自一篇已经被ICLR 2026收录的论文,最新版本今年3月刚刚做了修订。

现在大模型推理一直有个挺拧巴的老问题,要么把思考过程一字一句全写出来,稳是稳了但特别费token,算力成本蹭蹭往上涨。要么让模型在内部“默想”,省是省了但容易跑偏,结果压根收不住。SwiReasoning的思路就很灵活,让模型自己根据数据变化判断情况,该写出来就写,该默想就默想,随时切换。

打开网易新闻 查看精彩图片

论文给出的测试数据很漂亮,换上这套机制之后,主流推理模型的准确率能提升1.8%到3.1%。如果是算力预算比较紧张的场景,token使用效率最多能拉高79%,预算越紧省得越多,简直是小团队的福音。

Rio 3.5不光把这套机制内置进去,训练阶段就专门针对潜空间推理的效率优势做了优化,真不是单纯堆参数或者随便套个壳,是实实在在在底层做了适配优化。

语言支持这块也挺让人惊喜,主打葡萄牙语和英语很正常,毕竟是葡语国家的政府机构开发的,但它连中文还有另外几十种语言都做了覆盖。非英语团队开发的开源大模型,能把多语言支持铺得这么全,其实并不常见。

打开网易新闻 查看精彩图片

许可证它选了最宽松的MIT,也就是说不管你拿去商用、改源码还是二次发布,统通都没问题,没有任何限制。目前这个模型在Hugging Face上的下载量已经超过11万次,社区讨论区的留言滚得飞快,热度是实打实起来了。

这里还有个挺有意思的小尴尬,开发方自己在模型主页贴了道歉声明,承认之前传错了文件,把没经过最终蒸馏的半成品当成正式版上传了,发现之后正在赶工重传。这种直白的坦白反而让人觉得,这就是一群踏踏实实赶进度的普通人,不是那种包装出来骗流量的样子货。

这件事连Hugging Face的CEO都忍不住下场表态,他说AI的未来本来就没有什么注定的剧本。一条路是闭源API把持,决定权攥在硅谷少数几家公司手里,另一条是开源路线,连里约市政府这种机构都能下场参与、开发甚至共建。他最后那句“自己选路”,放在这件事的背景下,分量完全不一样。

打开网易新闻 查看精彩图片

这还真不是孤例,同一时间段里,还有一个叫Nex-N2-Pro 397B的模型冒了出来,底子也是Qwen3.5-397B-A17B,测试性能说能跟GPT-5.5、Opus 4.7这种顶级闭源模型掰掰手腕。说白了国内放出去的开源基础模型,正在被全球各路团队接力改造,长出很多谁也没预料到的新形态。

冷静下来捋一捋,Rio 3.5最值得琢磨的真不是榜单上那几个数字。跑分这东西,每个月都有新王,过两周基本就被人忘干净了。它真正的冲击力,其实来自开发方的身份。

过去大伙都心照不宣,能玩得动前沿大模型的,只有顶级实验室和互联网巨头,普通机构连入场票都摸不到。Rio 3.5这一下,直接把这个潜规则戳了个大口子。开源基础模型加上开放的研究论文,正在把AI的入场门槛一点点往下拉。

打开网易新闻 查看精彩图片

当然咱也别盲目上头,模型才刚出来,长期稳定性、实际部署后的表现、社区后续的反馈,都得再观察一段时间。开发方自己都还在补传正确版本,距离“可以闭眼随便用”还有不小的距离。

打开网易新闻 查看精彩图片

但2026年这个夏天,里约这家不起眼的市政IT公司至少把一件事讲透了:下一个让AI圈集体震惊的开源模型,可能从世界上任何一个角落冒出来,跟它来自哪个城市、属于什么机构,关系真没大家想的那么大。

参考资料:新华网 巴西市政IT公司开源大模型跻身全球AI第一梯队