作者

人工智能产业创新研究中心

一、人工智能大模型的战略意义

人工智能大模型以其卓越的性能,正改变着我们理解和应对世界的方式。其战略意义主要分为三个方面:经济价值,社会影响和技术突破。

一是人工智能大模型所创造的经济价值将不可限量。大模型推动各行各业实现自动化和智能化,可以极大地提高效率并降低成本。大模型在商业销售、医疗诊断、金融预测、物流管理等领域已有广泛应用,蕴含着巨大的经济潜力。例如,在电商领域,大模型可以分析用户的行为数据,进行个性化推荐,提高交易转化率;在医疗领域,大模型可以更准确地诊断疾病和制定治疗方案,提高医疗服务的质量和效率;在金融领域,大模型可以通过大量的数据分析和预测,提高风险控制能力,增强金融风险管理的准确性和预警能力。这些应用场景的实现,不仅可以提升企业内部的经济效益,还可以带动整个产业的发展,推进产业升级和转型。作为创新驱动的新引擎,人工智能大模型将成为整个社会价值链的重要组成部分。

二是人工智能大模型的社会影响可能改变人类的生活方式。人工智能可以处理复杂任务,例如语音识别和翻译,它们可以为视障或听障人士提供新的交互方式。人工智能还可以帮助我们处理大规模的社会问题,如气候变化和疾病预防。同时,我们也必须正视它们可能带来的风险和挑战,如数据隐私、偏见和滥用等问题。人工智能的应用将塑造我们的社会,无论是教育、交通还是娱乐等都会有所影响。

三是人工智能将成为继计算机之后的第四次科技革命。人工智能不仅代表了技术的巨大飞跃,更预示着科技与社会互动方式的深刻转变。通过模拟人类智能,AI能够处理海量数据、学习复杂模式,并自主做出决策。这使得AI在自动化、流程优化、创新解决方案等方面具有巨大潜力,正推动着各行各业的变革。从工业自动化到智能医疗,从智能交通到智慧城市,人工智能的应用正在不断拓展,重塑科技发展的面貌。因此,人工智能不仅是一项技术,更是一种引领科技变革的力量,将带领我们进入一个更加智能、高效和创新的未来。

二、人工智能大模型产业图谱

人工智能大模型产业链可分为基础层、技术层、模型层和应用层四个层面。

图1 人工智能大模型产业全景图

打开网易新闻 查看精彩图片

数据来源:赛迪四川,2024.05

人工智能大模型基础层:基础层包含算力硬件供应和核心数据处理等环节。其中算力硬件供应包含芯片、服务器、智算中心、边缘计算设备等内容;核心数据处理包含数据加工、数据标注、数据训练等内容,如数据收集与存储、数据清洗与预处理、数据标注与注释、数据集管理与质量控制等。

人工智能大模型技术层:技术层包含应用技术、算法理论、平台框架等,涉及计算机视觉、自然语言处理、语音识别、机器学习、深度学习、强化学习等内容。具体内容上,如算法与模型开发方面,包含模型设计与架构、特征工程与数据挖掘、模型训练与优化、模型评估与验证;模型部署与应用方面,包含模型转换与优化、模型部署与集成、模型运行与推理、应用开发与接口设计等;数据分析与决策方面,包含数据可视化与探索、模型解释与可解释性、预测与决策支持、自动化流程与优化等。

人工智能大模型模型层:模型层是产业生态的核心环节和引擎。模型层是指在人工智能系统中的核心组成部分,是通过大规模数据训练得到的复杂数学模型。这些模型使用深度学习、机器学习等技术,对输入数据进行处理和分析,可以实现对数据的理解、预测和决策能力。模型层在人工智能应用中扮演着重要角色,它是实现智能决策、自动化处理和智能交互的关键组成部分。

人工智能大模型应用层:应用层是指将训练好的模型应用于实际问题解决的环节。它是人工智能系统中的最终应用部分,通过将模型层的能力与具体领域的需求相结合,实现各种智能化应用和解决方案。应用层可以涵盖多个功能,包括图像识别、语音识别、自然语言处理、推荐系统、智能交互等,应用领域包含医疗、金融、教育、交通、工业等。应用层的核心目标是将模型的能力应用于实际问题中,解决用户的需求,提升效率和体验。通过不断优化和改进应用层的算法和模型,可以实现更准确、更智能的应用,满足不同领域和行业的需求。

三、行业大模型创新应用案例

(一)360智脑大模型在银行金融私有化领域的示范应用

1. 功能概述

360智脑是360自主研发的语言大模型,具备生成式对话能力、多模态指令分发能力,可根据对话意图,选择所需应用和能力进行需求分发,并将收集处理的结果反馈给用户。

2.标准对话应用场景

(1)企业知识库:对某银行的基础知识库内容进行提问,并基于某银行的基本信息生成回答内容。通过频道推荐、智能问答导航、文件上传、个人中心等功能模块,实现了企业内部知识的高效存储、检索和共享,帮助员工快速找到所需的知识信息。

(2)语音识别:识别音频、视频中语音特征,区分说话对象,支持语音转文本,提供语音转写功能,默认包含中文普通话的转写,配合敏感文本检测使用,包含语义分析功能。

3.定制服务应用场景

(1)企业入职培训系统:具有智能提问、总结和交流等功能,同时还支持中英文互译和格式转换等多种应用需求,极大地提高了新员工的培训效率和质量,为企业的人才培养和发展提供了更加便捷高效的培训方式。

(2)企业合规文档系统:一个高度智能化的工具,可以为客户提供更加高效、可靠的合规文档编写服务,提高文档编写的效率和质量,通过丰富的合规信息,为用户提供更加全面、准确的合规建议和支持。同时,系统还支持Word和PDF两种格式的文档导出,为用户提供了全方位的文档制作解决方案。

(3)电销客户意向判断系统:帮助电销人员更准确地判断客户的借贷意向,并提供针对性的推销策略和服务方案,降低电销成本,提高客服的工作效率。

(4)电销客服辅助系统:电销客服辅助系统旨在帮助电销客服人员更高效地管理和服务客户,提高销售质量和效率,系统对电话销售过程中的语音内容进行深入分析和处理,从而提供精准的话术指导和建议。

(5)催收分案系统:快速识别和分析不同类型的逾期债务,结合现有的催收规则和标准,将逾期未还款的案件合理分配给催收人员和团队,自动匹配最适合的催收策略和方式,提高催收效率和成功率。

(6)系统告警提示系统:快速识别和分析当前的告警信息,并结合告警知识库和相关规则,快速定位问题和推荐解决方案,减少因故障导致的业务中断和影响,提高告警处理的及时性和准确性。

(二)国创星云大模型:打通模型落地的“最后一公里”

科大国创星云大模型电信行业大模型是针对电信行业的垂类大模型,主要负责大模型在电信行业落地的“最后一公里”,解决通用大模型在特定场景下问答效果不理想、算力资源要求高等问题。通过构建电信行业知识增强的大模型底座,并结合意图识别、智能问答、方案推荐、智能报表、拓扑分析及智能调度等多种能力提升大模型应用效果;同时,利用量化、加速并行等手段,缩小模型参数规模,提高吞吐量,从而减少大模型部署所需资源,实现消费级显卡可用。通过电信行业大模型,服务于行业关键流程和场景,解决生产痛点。

图2 国创星云大模型电信行业大模型示意图

打开网易新闻 查看精彩图片

数据来源:赛迪四川,2024.05

科大国创星云大模型电信行业大模型应用创新实践案例,旨在通过AI大模型的深度应用,推动电信行业在前端客户服务、中端运营调度、后端网络自智三大领域的智能化升级。

1. 核心功能

(1)意图识别

意图识别是指从用户输入的文本如查询、命令、对话中提取隐含语义,判断用户输入语句背后的真正目的和需求。针对客户服务、运营调度、自智网络等主要业务,对用户提出的问题进行分类,并根据分类结果进行能力构建,如话前自助拦截、装维故障问答、网络故障投诉拦截等。

(2)智能问答

模型通过检索电信行业专业知识库,快速获取过往相关专业知识,实现专业知识智能问答,及时对客户诉求进行响应,提高用户满意度。这一能力在电信行业客户服务、运营调度及自智网络等场景下具有广泛的应用需求。

(3)方案推荐

在客户服务、运营调度和自智网络等业务场景,模型能结合历史数据、业务场景、用户需求等提供个性化、精准化和多样化的解决方案,以提高工作效率和运营效能。

(4)智能报表

智能报表可通过电信行业大模型对客户服务、运营调度和自智网络场景下的数据自动收集、整理和分析,并以交互性和智能化的报表展示形式。智能报表显著提升数据获取效率,持续跟踪业务数据状态,及时发现潜在风险,为相关业务服务提供有力支撑。

(5)拓扑分析

拓扑分析通过节点和连接线的形式展示网络结构中各个元素之间的关系。针对客户服务、运营调度、自智网络等主要业务,拓扑分析通过构建用户行为拓扑图、网络资源拓扑图等,全面掌握用户的使用习惯、网络资源的利用情况等信息,为提升服务效率和质量提供决策支持。

(6)智能调度

智能调度是一种以电信行业大模型为大脑中枢,进行独立思考、决策、调用工具逐步完成给定目标的能力。在电信行业中,智能调度可将不同的业务系统集成,通过统一接口实现自动决策,并执行异步工作流。此外,智能调度还能通过调用不同的业务底层能力或工具,自动化高效处理复杂的任务,例如数据库查询、故障诊断处理、服务器配置等,提高工作效率与行业服务质量。

2.应用场景

(1)电信行业客户服务

电信行业大模型根据客户服务业务流程分别在话前自助拦截、话中服务引导、话后运营质检进行智能化升级,能够更好地满足客户需求,提供个性化、便捷和高效的服务体验,同时实现运营效能的提升和持续优化。

在人工坐席介入前,大模型根据客户输入的信息进行意图识别,直接拦截并解决客户服务问题,如账单查询、套餐咨询和业务办理等,以减少对人工坐席的依赖,降低人工服务成本。

在人工坐席服务中,电信行业大模型结合客户标签、历史咨询记录、历史订单等信息,识别并分析客户使用习惯和偏好,为每个客户推荐适合的套餐和增值服务,并结合客户的历史投诉记录,提供个性化服务体验。

在人工坐席服务后,电信行业大模型根据对话记录智能化识别客户对产品、人员服务情绪状态,深入地理解客户的情感体验,从而优化产品设计、改进服务策略、提升客户满意度。

(2)电信行业运营调度

运营调度场景下,依托电信行业大模型显著提升一线装维人员的服务能力和远程技术支撑的坐席人员工单处理效率。

装维人员现场作业时,根据问题不同难度,电信行业大模型通过意图识别和智能问答能力实现个性化解答。面对复杂问题时,电信行业大模型智能调用拓扑分析协助装维人员快速进行故障诊断和根源定位,并进行针对性解答。

坐席人员远程支撑时,大模型能够整合装维人员作业问题,辅助坐席人员深入理解现场。在支撑过程中,坐席人员可利用大模型的智能问答与方案推荐功能,迅速解答疑问。此外,大模型还能结合现有网络能力,生成一键操作按钮,极大提升坐席人员问题处理效率,优化服务流程。

(3)电信行业自智网络

电信行业自智网络旨在构建网络全生命周期的自动化、智能化运维能力,为垂直行业和消费者提供零等待、零接触、零故障的新型网络。针对自智网络的演进路径和面临的挑战,电信行业大模型利用核心能力和周边能力引擎,如意图识别、智能问答、方案推荐、智能报表、拓扑分析、智能调度等,可实现网络规划、建设、优化、维护、运营全流程内生智能。

(三)岐黄问道:探索现代科技与传统医学的完美结合

岐黄问道大模型由南京大经中医药信息技术有限公司研发,在训练过程中,大模型主要使用了1100万条中医知识图谱数据、1500本中医古籍和文献数据、10万份真实中医专家医案数据、10万条脉象、舌象、经络、穴位数据以及200万条真实的中医临床诊疗数据。

1. 主要特点和优势

(1)多维度应用:该模型不仅可用于疾病的诊断和治疗,还可以根据用户提供的症状、体征等信息,给出个性化中医健康状态辨识结果以及多维度养生方案,如食疗、茶饮、推拿、艾灸等。

(2)临床诊疗:一是该模型可根据用户提供的疾病、症状、体征信息,给出辨证(诊断)结果和治疗方案(中药处方)。二是该模型可根据用户提供的主诉症状和伴随症状、体征信息,给出辨证(诊断)结果和治疗方案(中药处方)。

(3)深度学习技术:该模型的训练过程采用了大量中医领域的文本数据,通过深度学习技术对数据进行分析和挖掘,从而实现了中医知识的语义理解和推理。同时,该模型还具备上下文理解能力,可以根据上下文语境来理解问题并进行回答和推荐。

2. 主要应用场景

(1)中医辅助诊疗:通过输入患者的症状、体征等信息,模型可以辅助医生进行疾病的诊断,提高诊断的准确性和效率。

(2)中医健康养生服务:模型可以根据用户的健康状况和需求,提供个性化的养生方案,包括中药、经络穴位、食疗等方面的建议。

此外,该模型还可以应用于智能问诊、病历生成、病历质控等多种场景。

(四)宋韵汉服模型:国潮与现代结合的服装文化大模型

宋韵汉服模型是浙江省创意设计协会与无界AI联合发布的全球首个宋韵汉服模型,一个专门为弘扬和传播中华传统服饰文化而设计的大数据AI模型。该模型深耕于中国古代服装文化的丰富内涵,特别是宋代服饰,模型内嵌了大量的历史数据和文化元素,使其具备了设计和生成各类“简朴素雅”的宋服和“唯美飘逸”的汉服的能力。宋韵汉服模型也能够将传统元素与现代审美相结合,创造具有浓郁传统文化特色的现代服装设计。这一能力使得它能够在推动国潮流行趋势的同时,也为汉服服装文化的传承与发展提供了新的动力和可能性。

1. 主要特点和优势

(1)设计普及化:通过提供简单描述,这款AI模型就能够根据用户心中的想象创造出“中国服装”的设计图案,大幅降低设计门槛。

(2)个性化定制:模型提供的不仅是设计方案,还能贯通至实际生产,用户可以实现自我设计服装的定制与购买,享受个性化的消费体验。

(3)深度文化理解:由于无界AI团队以及与宋韵汉服模型相继开发的宋韵山水、宋韵建筑模型等都表现出对中国文化的精准把握,这使得宋韵汉服模型在文化层面的表现力和适用性尤为出色。

2. 主要应用场景

(1)时尚创意设计:借助宋韵汉服绘画模型,设计师和设计爱好者可以体验到基于AI技术的服装设计流程,将传统文化与现代时尚完美结合,创作出独特的汉服和新中式服装设计稿。

(2)服装设计大赛:该模型被指定为相关设计大赛的官方推荐工具,允许参赛者利用AI技术探索宋韵服饰的魅力,并实现创新设计。优秀作品有机会被制作成实物,转化为市场商品。

(3)个性化定制:普通消费者即使没有专业的设计背景,也能通过使用宋韵汉服模型参与到个性化服饰的设计中,并借助柔性供应链实现从创意到成品的一站式服务。

(五)智海三乐大模型:天下英才而教育之,三乐也

智海三乐教育大模型,取名于孟子所言“天下英才而教育之,三乐也”,由浙江大学联合高等教育出版社、阿里云和华院计算等单位共同研制。该模型以阿里云通义千问70亿参数通用模型为基座,通过继续预训练和微调等技术手段,利用核心教材、领域论文和学位论文等教科书级高质量语料和专业指令数据集打造的一款专注于人工智能领域的教育大模型。

1. 主要优势及特点

智海三乐教育大模型专为教育领域设计,旨在通过知识强化和能力提升,满足用户在教育场景中的多样化需求。模型还集成了搜索引擎、计算引擎和本地知识库等功能,以进一步提升模型的性能和使用体验。这些功能使得智海三乐教育大模型在处理复杂的教育任务时更加高效和准确。

2. 主要应用场景

(1)教育

提供多种教育功能,如智能问答、试题生成、学习导航和教学评估等,全面满足教育场景中的多样化需求。

(2)高效推理

以阿里云灵积平台为基础,该模型获得了云上的高效推理能力,保证了其快速、准确地响应用户请求,方便开发者进行集成和应用。

(3)创新问答

智海三乐不仅能提供标准答案,还能生成富有创造力的回答,展示了其在应对复杂、多变的教育问题时的灵活性。模型的设计使其能够适应教育领域的快速发展和变化,为未来的教育改革和创新提供了有力的技术支持。

(六)“龙知政”GPT大模型:深度融合政务知识与GPT能力

1.主要优势和特点

云知声公司发布的“龙知政”GPT大模型是一个面向政务垂直领域的大模型,它以山海大模型为底座,并结合区政数局龙眼GPT系列研究成果,通过高质量的政务语料训练和参数精调,已具备在政务领域开展精准智能知识服务的能力。

2.主要应用场景

(1)招商引资

在招商引资领域,“龙知政”GPT大模型化身为“效率派”助手。它能够从各类招商引资政策、企业公开资料以及广泛的互联网数据中精准抽取关键知识,进而构建一个全面且专业的知识库。结合寻商招商的具体要求和标准,该模型能够迅速提供直观的数据分析结果,助力企业筛选、企业评估、精准对接、招商谈判以及政策制定等关键环节。

(2)智能政务服务

在政务服务方面,“龙知政”GPT大模型展现了其深厚的专业知识和语义理解能力。它能够将自身专业知识库中的所有政策文件和专业术语融为一体,对企业和群众的办事诉求进行深度语义和上下文理解。这一转变有效解决了传统线上机器问答中常见的“不解人意”和“答非所问”问题。同时,该模型还实现了信息服务由被动式的人工查找向主动的、双向的、实时的智能全程引导转变,大幅提升了政务服务的智能化水平和用户体验。

(3)智能办公

在智能办公领域,“龙知政”GPT大模型同样表现出色。它能够通过对现有政策性文件、规范性文件以及政府公文等材料的深度学习,掌握各类写作风格和行文规范。通过“龙知政”大模型,政府工作人员能更高效地完成总结摘要、公文初拟以及文本检索归纳等日常工作。这一功能不仅大幅减轻了工作人员的工作负担,还提高了政府办公的整体效率和准确性。

以下是报告目录及部分内容节选:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片