打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

2025 年 12 月 31 日,LlamaFactory 正式发布v0.9.4版本。这是一个具有里程碑意义的版本,被官方定义为不可变发布版本(Immutable Release),仅允许修改发布标题和发布说明内容。
该版本以 “Farewell to 2025” 为主题,向整个 2025 年告别,同时也宣布 LlamaFactory 将在 2026 年持续为社区提供简单、高效、先进的大模型微调框架

以下为LlamaFactory v0.9.4的完整更新内容详解。

一、重要变更(Breaking Changes)

本次版本包含多项对使用者影响较大的变更,升级前请务必关注:

  1. 1.项目仓库名称变更
    仓库名称已从LLaMA-Factory更新为LlamaFactory,后续所有官方资源将统一使用新名称。

  2. 2.Python 版本要求升级
    Python 3.9 与 3.10 已正式废弃。
    LlamaFactory 现在要求Python 3.11 – 3.13

  3. 3.包管理工具迁移
    项目从 pip 迁移至 uv。
    安装方式更新为:
    使用uv pip install llamafactory

  4. 4.官方博客上线
    LlamaFactory 官方博客已正式发布:
    https://blog.llamafactory.net/en/

二、重磅新特性(New Features)

v0.9.4 在算法、训练后端和工程能力上实现了全面增强:

  • • 支持正交微调(Orthogonal Fine-Tuning, OFT)

  • • 支持新增 Token 的语义初始化(Semantic Initialization)

  • • 支持通过MCoreAdapter 进行 Megatron-LM 训练

  • • 支持KTransformers 后端

  • • 支持MPO 算法

  • • 支持FP8 精度训练

  • • 支持Transformers v5

  • • 支持在函数调用消息中同时使用推理内容与纯文本

  • • 支持DeepSpeed AutoTP

  • • 支持高效的 NPU 融合算子

  • • 支持TRL 0.24

这些新特性进一步提升了 LlamaFactory 在大规模模型训练、分布式效率、硬件适配以及前沿算法支持方面的能力。

三、模型支持更新(Models)

v0.9.4 新增与扩展了大量前沿模型与多模态模型支持,覆盖文本、视觉及多任务场景:

  • • Falcon H1

  • • Kimi-VL

  • • GLM-4.5V

  • • Gemma3n

  • • Granite4

  • • Qwen3-2507

  • • MiniCPM-V 4.0

  • • Intern-S1-mini

  • • Seed-OSS

  • • MiniCPM-V 4.5

  • • InternVL-3.5

  • • ERNIE-4.5-Text

  • • ERNIE-4.5-VL

  • • Ling-V2

  • • Qwen3-VL

  • • Qwen3-Omni

  • • Hunyuan-mt

  • • GLM-4.6V

  • • Ministral 3

  • • VibeThinker

  • • MiMo-V2-Flash

  • • MiniMax-M1

  • • MiniMax-M2

该版本在多模态、视觉语言建模和新一代通用模型支持方面达到了新的高度。

四、总结

代码地址:github.com/hiyouga/LlamaFactory

LlamaFactory v0.9.4不只是一次常规更新,而是一次承前启后的关键版本:

  • • 告别 2025,面向 2026 全面进化

  • • Python、工具链与训练体系全面升级

  • • 覆盖最新算法、硬件能力与模型生态

  • • 继续坚持“简单 + 高效”的 LLM 微调理念

如果你正在使用或计划使用 LlamaFactory 进行大模型训练与微调,v0.9.4 是一个值得重点关注和升级的版本

告别 2025,下一站,2026。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。