国家知识产权局信息显示,北方集成电路技术创新中心(北京)有限公司;清华大学申请一项名为“基于硅基板软硬件协同的大语言模型训练方法和装置”的专利,公开号CN121300984A,申请日期为2025年9月。
专利摘要显示,本申请涉及一种基于硅基板软硬件协同的大语言模型训练方法和装置。方法包括:确定待训练大语言模型的训练任务的多种初始切分策略;从多种初始切分策略中任选一种初始切分策略;根据选择的初始切分策略确定训练大语言模型所需的需求指标参数;基于需求指标参数对芯片的初始硬件资源分配方案进行优化,得到芯片的最优硬件资源分配方案;根据最优硬件资源分配方案从多种初始切分策略中的其他初始切分策略中选择最优切分策略;其中,最优硬件资源分配方案和最优切分策略用于训练大语言模型。采用本方法能够同时提升通信性能和训练吞吐量。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴