国家知识产权局信息显示,中债金科信息技术有限公司申请一项名为“一种多模型推理的模型切换方法”的专利,公开号CN121326436A,申请日期为2025年9月。

专利摘要显示,本发明涉及大模型推理技术领域,公开一种多模型推理的模型切换方法,本发明通过引入以层为粒度的模型切分与动态换入换出机制,结合支持多实例并发执行的多模型管理器及负载感知智能调度算法,有效解决资源受限环境下多模型部署的难题。本发明能够显著降低模型切换延迟,实现多模型的真正并发推理,并能根据实时负载动态优化资源分配,从而在有限GPU显存条件下,大幅提升系统吞吐量、降低平均响应时间,为在算力受限场景中高效运行多个大模型提供可行的解决方案。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员