5月21日,腾讯混元宣布新一代多语言翻译模型Hy-MT2正式开源。这个模型最扎眼的数据是440MB——通过1.25-bit极端量化,1.8B轻量版可以塞进手机本地运行,不需要联网。同步上线的"腾讯Hy翻译"小程序已经能用,iOS和安卓App也在路上。

Hy-MT2这次放出了三个尺寸:1.8B、7B、30B-A3B,全部支持33种语言互译,外加5种民族语言/方言。官方说法是相比上一代Hy-MT1.5,在多语言指令遵循、专业领域翻译和真实场景表现上都有明显提升。有意思的是,那个最小的1.8B版本,纸面数据已经超过了微软等主流商业API。

打开网易新闻 查看精彩图片

本地部署是这次的核心卖点。得益于AngelSlim量化技术,1.8B模型压缩到440MB,能在苹果、高通、联发科等常见手机芯片上跑推理,速度比上一代还快了1.5倍。小程序版本支持语音输入,也能自定义翻译风格。用户可以提前下载模型包,没网或者信号差的时候照样用。

腾讯同步开源了IFMTBench测试集,专门测模型能不能听懂"人话"——比如要求"每句不超过15个字"或者"用商务正式语气",模型得照做。这在翻译工具里不算常见,多数产品给什么翻什么,不会管你想要什么风格。

模型已经挂在GitHub、Hugging Face、ModelScope上,兼容性做了多品牌芯片适配。从440MB这个体积来看,腾讯明显是想抢端侧AI的场景——翻译是个高频刚需,但出国、地下室、飞机上的弱网环境一直是痛点。把模型塞进手机,比折腾云端延迟和流量更直接。

不过30B-A3B这种大版本显然还是给服务器准备的,普通用户能感知到的主要是1.8B的离线能力。翻译质量的实际差距,还得等更多人上手测了才知道。