国家知识产权局信息显示,杭州没有桌子人工智能科技有限公司申请一项名为“一种基于强化学习的推理大模型优化方法”的专利,公开号CN121390278A,申请日期为2025年9月。

专利摘要显示,本发明涉及推理大模型技术领域,尤其涉及一种基于强化学习的推理大模型优化方法;通过引入分阶段的、动态调整的文本擦除策略与基于正确性变化的思考质量奖励机制,显著提升了大模型思考过程的质量与效率,该方法通过在多个训练阶段中系统性地对模型生成的思考文本进行局部或全局的随机擦除,并观察擦除前后答案正确性的变化来量化思考文本中每个部分的重要性,从而引导模型在训练中学会生成更加精炼、关键信息密集且冗余度低的思考内容,使得模型在保持高准确性的同时,大幅降低了生成思考文本所需的计算开销与时间成本;解决了现有的推理大模型在训练过程中对思考质量难以有更好的控制,容易产生较多无效思考的技术问题。

天眼查资料显示,杭州没有桌子人工智能科技有限公司,成立于2025年,位于杭州市,是一家以从事专业技术服务业为主的企业。企业注册资本138.3958万人民币。通过天眼查大数据分析,杭州没有桌子人工智能科技有限公司共对外投资了1家企业,财产线索方面有商标信息1条,专利信息11条。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员