在此背景下,由北大、华为、阿里等组成的align - anything项目应运而生,在数据集、算法、评估以及代码库四个关键维度贡献开源力量。其数据集涵盖图、文、视频、语音全模态,共200k且包含人类语言反馈和二元偏好数据。算法通过从语言反馈中学习合成数据范式,提升RLHF后训练方法表现,评估面向全模态模型的模态联动与选择。 值得一提的是,该项目代码库支持全模态训练与评估,将训练流程模块化,新手仅需了解PyTorch和Transformers就能轻松理解相关代码。同时,项目还提供超30个装填好模型、数据集路径的训练脚本,简单执行即可开启训练,极大降低了新手参与全模态对齐研究的门槛。目前系列成果均已上线始智AI-wisemodel开源社区,欢迎前去体验和使用。 系列成果地址 https://wisemodel.cn/organization/PKU-Alignment
在此背景下,由北大、华为、阿里等组成的align - anything项目应运而生,在数据集、算法、评估以及代码库四个关键维度贡献开源力量。其数据集涵盖图、文、视频、语音全模态,共200k且包含人类语言反馈和二元偏好数据。算法通过从语言反馈中学习合成数据范式,提升RLHF后训练方法表现,评估面向全模态模型的模态联动与选择。 值得一提的是,该项目代码库支持全模态训练与评估,将训练流程模块化,新手仅需了解PyTorch和Transformers就能轻松理解相关代码。同时,项目还提供超30个装填好模型、数据集路径的训练脚本,简单执行即可开启训练,极大降低了新手参与全模态对齐研究的门槛。目前系列成果均已上线始智AI-wisemodel开源社区,欢迎前去体验和使用。 系列成果地址 https://wisemodel.cn/organization/PKU-Alignment