打开网易新闻 查看精彩图片

作 者

人工智能与大数据研究中心

一、发展背景及环境

体系加速完善,可信与安全成为大模型落地的硬性前提】全球主要经济体正加速构建人工智能治理体系,推动大模型从“野蛮生长”迈向“规范发展”。中国《人工智能生成合成内容标识办法》聚焦人工智能“生成合成内容标识”关键点,通过标识提醒用户辨别虚假信息,明确相关服务主体的标识责任义务,规范内容制作、传播各环节标识行为;欧盟《AI法案》将通用大模型纳入高风险系统监管,强制披露训练数据来源与风险评估;美国则通过NIST框架引导企业建立全生命周期风险管理机制。这些政策信号一致表明:未来大模型能否进入金融、政务、医疗等核心领域,不再取决于技术先进性,而取决于是否满足合规要求。这倒逼企业将安全机制前置到模型设计阶段,“可信AI”正从理念转化为基础设施。

表1 全球大模型监管政策对比

打开网易新闻 查看精彩图片

【全球大模型生态加速分化,技术路径呈现区域特色】中美欧在大模型发展上正形成各具特色的演进方向:美国依托OpenAI、Meta等企业,构建以Llama系列和商业API为核心的开放与闭源并行的生态体系;中国聚焦垂直场景深度适配,通义、文心、盘古等大模型体系注重与本土软硬件基础设施的高效协同,并在金融、制造、政务等领域加速规模化落地;欧洲则以Mistral等为代表,强调数据隐私、算法透明与伦理合规。地缘环境变化推动各方更加重视技术供应链的稳定性与长期可持续性。在此背景下,开源成为生态竞争的关键抓手,通过开放模型权重吸引开发者社区、培育工具链、定义接口标准,进而影响未来产业格局。对国家和企业而言,构建具有韧性的技术生态与可持续的创新体系,已成为战略优先级。

【技术重心从通用能力转向场景实效,轻量化、专业化成主流】2025年,千亿乃至万亿参数的通用大模型在性能提升上遭遇边际递减,训练成本高企而业务收益未同步增长,企业不再为“更大”买单,而是聚焦“更准、更快、更省”。这推动产业重心从基础模型研发转向垂直场景落地,头部厂商如阿里、百度已将资源重点投向金融、政务、制造等领域的专用模型方案。通过RAG、轻量级参数适配等低成本技术,在保留通用能力的同时快速注入行业知识。同时,混合架构(如MoE+状态空间模型)显著降低长文本推理成本,10亿级小模型在金融、法律等场景实现更高精度;轻量化模型则在手机、工控设备等终端实现本地运行,满足离线与低延迟需求。开源基座(如Qwen、Llama)虽降低创新门槛,但真正的竞争力已转向工程化能力——包括部署效率、系统集成、人机协作流程设计等。技术价值的评判标准,正从实验室指标全面转向实际业务收益。

【大模型普惠化加速,产业链分工深化推动MaaS生态成熟】大模型产业正从“巨头通吃”的垂直整合模式,转向专业化、模块化的协同生态。上游算力芯片和高质量数据服务商快速成长;中游云厂商聚焦基座模型与智能调度平台;下游大量垂直领域软件商基于开源底座开发行业智能体应用。以“模型即服务”(MaaS)为核心的商业模式日趋成熟,企业无需自建千亿级模型,只需按需调用并微调即可实现智能化升级。据赛迪顾问预测,2025年中国MaaS市场规模将接近90亿元,年复合增长率超80%。这种分工不仅降低了中小企业使用门槛,也提升了整体产业效率,使大模型真正走向规模化落地。

图1 大模型产业链架构图

打开网易新闻 查看精彩图片

二、发展趋势研判

趋势一

打开网易新闻 查看精彩图片

大模型市场持续爆发增长,企业部署量与调用量双双跃升

2025年,中国大模型市场规模约490亿元,预计2026年将超过700亿元,三年复合增长率超40%,这一增长主要由MaaS服务、行业专用模型和智能体应用驱动。与此同时,企业部署数量快速攀升。截至2025年底,已有超8万家中国企业完成大模型试点或生产部署;预计2026年将突破10万家,覆盖金融、政务、制造等核心领域。全球范围内,主流开源模型(如Llama、Qwen系列)的下载量累计突破500万次,企业私有化部署占比超60%。值得注意的是,模型调用量正从“千亿token级”迈向“万亿token级”,头部平台月均Token调用量已迈入万亿级,单个金融或制造客户月调用量常超百亿Token。这标志着大模型不再是“演示玩具”,而是成为企业数字化基础设施的标配组件。

图2 中国大模型市场规模及增长预测

打开网易新闻 查看精彩图片

趋势二

打开网易新闻 查看精彩图片

行业大模型加速落地,金融、政务、制造领跑

行业大模型在高价值、高合规需求场景率先实现规模化部署。预计2026年,金融行业应用率将达68%(覆盖智能投研、信贷审核、合规问答),政务领域达61%(政策查询、公文起草、市民服务),制造业达53%(设备预测性维护、工艺优化、供应链调度),显著领先于医疗、教育、零售等尚处试点阶段的行业。驱动这一落地潮的核心,是“小而精”的技术范式:企业普遍采用参数规模在10亿至百亿级的专用模型,通过“开源基座+私有高质量数据微调+检索增强(RAG)”组合,在保留通用语言能力的同时,精准注入领域知识。例如,某银行信贷模型准确率达98%,推理成本仅为通用大模型的1/5;工厂设备诊断模型可本地部署,满足数据不出域与毫秒级响应要求。行业大模型正以更高精度、更低算力消耗、更强合规适配性,成为企业AI落地的首选路径。

图3 2026年行业大模型渗透率预测

打开网易新闻 查看精彩图片

趋势三

打开网易新闻 查看精彩图片

大模型架构从密集同构向稀疏异构演进,效率成竞争焦点

2026年,大模型架构将经历从密集同构向稀疏异构的系统性跃迁。面对超长上下文处理、高并发服务与终端部署等现实约束,单纯依赖参数规模扩张的路径已难以为继。稀疏化成为主流技术方向——以混合专家模型(MoE)为代表,通过动态激活部分子网络,在维持甚至提升性能的同时,显著降低推理计算开销;结构异构化同步深化,研究者不再局限于纯Transformer架构,而是融合状态空间模型(SSM)、改进注意力机制或引入循环记忆单元,以更灵活地平衡建模能力、时延与能效。华为、阿里、Meta等企业已在合同解析、智能客服等高负载场景规模化部署此类混合架构。这一转变标志着,2026年大模型的核心竞争力,正从“谁的模型更大”转向“单位算力下谁能提供更高智能密度与更强落地效能”。

趋势四

打开网易新闻 查看精彩图片

世界模型从实验室走向工业仿真,AI开始理解物理规律

进入2026年,世界模型正从学术探索加速迈向工业级应用。过去,大模型擅长处理语言和图像,但对物理世界的运行规则,比如“物体如何运动、机器如何故障、流体如何流动”缺乏真正理解。而2026年,这一局面正在改变:世界模型通过融合传感器数据、多物理场仿真与基础科学知识,学习“干预—响应”的因果机制,具备对现实世界动态演化的预测与推理能力。例如,某汽车厂商用世界模型在虚拟环境中模拟千万次碰撞测试,大幅减少实车试验成本;工厂则用它预测设备振动异常是否会演变为停机故障。与纯数据驱动的大模型不同,世界模型融合了物理规律与数据学习,更可靠、可解释。虽然离通用智能还很远,但它正成为AI连接数字与物理世界的关键桥梁——不再是“猜答案”,而是“懂因果”,是大模型向具身智能、科学智能和可靠决策演进的底层技术支点,属于下一代AI核心能力的探索方向。

趋势五

打开网易新闻 查看精彩图片

智能体编排能力取代基座参数,成为平台竞争新焦点

进入2026年,企业对AI的需求已从“单点问答”升级为“端到端任务执行”,单一模型难以胜任复杂业务流程,因此智能体将从技术验证全面迈入规模化商业应用。目前,全球范围内已有大量企业开始构建以智能体为核心的自动化工作流,尤其在客服、办公协同、电商运营等领域形成可复用的落地范式。2025年,中国智能体市场规模达78.4亿元,预计2026年达135.3亿元,增速超70%。头部云厂商和AI公司正通过开放智能体开发平台,降低构建门槛,推动行业快速渗透。企业不再关注底层模型有多大,而是更看重平台能否实现任务拆解、多工具集成、记忆管理与安全可控的端到端闭环。具备强大编排能力、可观测性和系统集成能力的智能体平台,正在成为企业AI落地的“操作系统”,并逐步构建起下一代MaaS生态的价值高地。

趋势六

打开网易新闻 查看精彩图片

原生大模型应用用自然语言重构传统软件交互逻辑

传统将大模型简单嵌入传统SaaS的“插件式”做法已被市场淘汰——其功能割裂、流程中断和价值有限等问题难以满足企业对深度智能的需求。2026年,取而代之的是从底层架构围绕大模型全新设计的原生应用,它们以自然语言为统一输入与控制接口,实现“意图即操作”。例如,销售人员只需输入“识别上周流失风险最高的三位客户并生成个性化挽回方案”,系统即可自动完成数据查询、行为分析与内容生成。2026年,这一模式已在文档协作、项目管理、开发工具等领域成熟落地,并快速向人力资源、法务合规、财务流程等核心业务扩展。其核心价值不仅在于提效,更在于大幅降低复杂系统的使用门槛,让非技术人员也能高效调用AI能力。软件正从“功能导向”全面转向“意图导向”,人机协作逻辑迎来结构性重塑。

趋势七

打开网易新闻 查看精彩图片

轻量化大模型在终端设备规模化落地,形成云边端协同

伴随企业对数据隐私、实时响应和离线可用性的刚性需求,大模型正大规模从云端下沉至手机、PC、工业控制器等终端设备。参数规模在10亿以下的轻量化模型,通过先进压缩、低比特量化及与NPU等专用AI芯片的深度协同,已在终端实现高效本地推理。例如,新一代智能手机可实时完成会议语音转写与要点摘要,全程无需联网;工厂边缘设备则基于本地模型毫秒级识别设备异常振动,支撑预测性维护。在此背景下,“云训练、边调度、端执行”的三级协同架构正成为主流,云端专注模型训练与版本迭代,边缘节点聚合区域数据并做初步分析,终端聚焦低功耗、高时效任务。2026年,终端侧大模型的普及不再是个案,而是构建起兼顾安全、效率与实时性的新型智能基础设施底座。

趋势八

打开网易新闻 查看精彩图片

开源模型权重普及,但核心推理与安全能力仍高度封闭

尽管Llama、Qwen、DeepSeek等开源大模型虽已广泛普及,显著推动开发者生态繁荣,但企业级落地的关键能力,包括高性能推理引擎、内容安全过滤、专属工具链及高质量领域微调数据,仍被商业公司高度保留在闭源体系内。这是因为开源权重在长文档处理、事实一致性或合规输出等场景中,往往难以满足高可靠性与低幻觉要求。例如,同一架构的开源版本可能出现事实错误,而其商业版本则通过内部事实校验、输出控制与审计机制,显著提升准确性与合规性。2026年,“开源基座吸引生态,闭源服务兑现价值”已成为行业共识:开源用于建立标准、培养用户习惯,而高价值功能则通过订阅制服务交付。开源的价值,正从“技术开放”转向“生态占位”,真正的竞争力仍系于不可见的闭源层。

趋势九

打开网易新闻 查看精彩图片

可审计、可溯源、公平性成为大模型进入强合规领域的前提

在全球AI治理框架加速落地的推动下,政府、金融、医疗等对合规性与可靠性要求较高行业已将“可审计、可溯源、公平性”作为大模型准入的核心合规要求。模型若要用于信贷审批、诊疗辅助或政策咨询等场景,必须能够说明其决策依据、标注信息来源,并提供完整的操作记录。例如,当系统拒绝一笔贷款申请时,需清晰指出所依据的合规条款;在回答医学问题时,应标明知识出处并提示结论的不确定性。为满足这些需求,企业正加速构建“可信AI”能力:在训练阶段引入数据均衡处理与公平性约束方法,在推理过程中嵌入内容水印与溯源标识,在运行时自动记录决策链条。第三方评估体系也逐步建立,从公平性、透明度、鲁棒性等维度设定准入标准。2026年,可信性不再是附加选项或道德倡议,而是大模型能否真正进入核心业务系统的硬性门槛和合规基础设施。

趋势十

打开网易新闻 查看精彩图片

大模型人才需求从算法研究转向AI产品与流程工程设计

随着模型开发平台化与工具链高度标准化,纯算法研发岗位需求趋于饱和,而兼具业务理解力、AI任务定义能力和人机协作流程设计经验的复合型人才成为企业争夺焦点。2026年,企业更需要AI产品经理,他们能将法务合同审核、供应链预测等业务痛点转化为可执行的AI任务,并设计合理的“人机分工”机制(如AI初筛+人工复核)。同时,提示工程演进为“流程工程”,需掌握Agent编排、工具集成、失败回退等系统设计能力。高校与企业正共建“AI工程化”课程,培养兼具领域知识、产品思维与技术理解力的人才。这一转变标志着大模型从“科研驱动”全面迈入“工程与产品驱动”阶段。

三、需关注问题及建议

问题一

打开网易新闻 查看精彩图片

“落地难”与“价值虚”并存

当前,大模型发展已进入从技术突破向产业深耕的关键阶段,但“落地难”与“价值虚”问题并存,成为制约规模化应用的核心瓶颈。尽管各类大模型应用案例层出不穷,多数仍局限于演示性场景或非核心业务环节,缺乏可量化、可持续的商业闭环。部分企业陷入“为AI而AI”的实施误区,导致投入成本高企而实际收益有限。建议大模型应用从概念验证转向实效落地。企业应优先选择业务价值清晰、实施路径成熟、投入产出可测算的场景推进规模化应用,例如合同辅助审核、设备预测性维护和高并发智能客服等。为避免盲目投入,有必要建立科学的评估框架,综合考量场景匹配度、经济回报潜力与部署复杂度,并由行业协会牵头制定统一的效果验证标准和最佳实践指南,增强解决方案的可复制性与行业公信力。

问题二

打开网易新闻 查看精彩图片

核心技术受制于算力与工具链短板

核心技术能力的发展仍受到算力供给不足和工具链短板的双重制约。一方面,人工智能芯片的全球供应链格局正在重塑,国产算力平台在软件生态适配、系统兼容性以及大规模集群调度效率等方面仍处于持续优化阶段;另一方面,企业在部署大模型时普遍面临工具分散、流程割裂的问题,从模型上线到持续运维缺乏一体化支撑,显著增加了技术门槛和实施成本。为此,建议加快构建覆盖全生命周期的模型工程基础设施,鼓励头部企业与开源社区协作,共同打造轻量高效的推理引擎、智能体调度平台和安全审计工具,通过标准化和模块化降低中小企业落地难度,真正实现大模型从“能用”到“好用”的跨越。

问题三

打开网易新闻 查看精彩图片

治理滞后于技术演进,合规风险积聚

人工智能治理体系建设明显滞后于技术应用的快速推进,合规风险在金融、医疗、政务等对合规性与可靠性要求较高的领域不断累积。目前,行业尚未就如何确保模型输出的可解释性、数据来源的可追溯性以及算法决策的公平性形成统一标准,企业在实际部署中常因规则不明而陷入法律与监管的灰色地带。有必要在强化顶层设计的同时,推动“沙盒监管”制度试点与合规认证机制并行,在重点领域先行探索大模型准入规则,并配套发布操作性强的技术指引,明确企业在内容标识、人工复核、风险披露等方面的义务,从而在保障公共利益的前提下,为技术创新保留合理空间。

问题四

打开网易新闻 查看精彩图片

人才结构失配,复合型工程力量严重不足

人才供给结构与产业实际需求之间存在明显失配,具备跨领域能力的工程化人才尤为紧缺。当前人才培养仍偏重于算法理论研究,而真正支撑大模型落地的关键角色,如“能够理解业务痛点、设计人机协作流程、集成系统工具的AI产品经理和工程实施人员”严重不足。建议推动高校与龙头企业深度合作,设立面向产业实践的“AI工程化”培养项目,将行业知识、产品思维、系统设计与伦理规范融入课程体系,加快形成一支既懂技术又通业务的复合型人才队伍,为大模型在实体经济中的深度应用提供坚实支撑。

打开网易新闻 查看精彩图片

IT趋势

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

< <滑动查看全文> >

更多行业案例及其特点,请扫描下方二维码关注“赛迪顾问”,获取最新动态。

微信号:ccidconsulting

打开网易新闻 查看精彩图片

本公众号提供的内容用于个人学习、研究或欣赏,不可用于其他商业用途。如有关于作品内容、版权及其它问题,请及时在公众号留言。

如果获得转载授权,请注明作者姓名和转载的出处,不修改文章的标题、文字、图片或者音视频,以免曲解原文意思。