联手华为后，科大讯飞发布了全国产的讯飞星火V3.5大模型|人工智能技术|刘庆峰|大模型|星火|科大讯飞|翻译

在美国积极遏制中国算力发展的前提下，基于全国产算力训练的大模型显得尤其珍贵。

来源|锚思企服

作者|李崇

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会，正式发布了基于首个全国产算力训练的讯飞星火V3.5。

据悉，早在2023年10月24日，科大讯飞携手华为，宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。此后，讯飞星火便启动了对标GPT-4的更大参数规模的大模型训练，讯飞星火V3.5得以诞生。

科大讯飞表示，讯飞星火V3.5的语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力等七大核心能力得到全面提升。其中，数学、语言理解、语音交互能力超GPT-4 Turbo。

此外，科大讯飞还发布了深度适配国产算力的讯飞星火开源大模型“星火开源-13B”，目前已在昇思开源社区联合首发上线。

刘庆峰说，相信2024年，通用人工智能不仅能够在中国各大领域深度而广泛应用，而且在源头技术创新、在大模型的底层能力上也会站上全新台阶。

01.国产讯飞星火V3.5的潜力

在发布会上，科大讯飞对讯飞星火V3.5的能力做了全方位的比较。

其中，语言理解、数学能力超过GPT-4 Turbo，代码达到GPT-4 Turbo 96%，多模态理解达到GPT-4V 91%。

1.拟人全语音自然交互

“听说今年尔滨特别火，作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗？”

在实操演示环节，刘聪和讯飞星火V3.5现场互动，讯飞星火V3.5一口地道的东北话逗乐现场观众。幽默之余，讯飞星火V3.5快速为刘聪定制了旅游攻略，还催促他赶快买票，春运机票紧俏。

这种带有情感的全语音交互，得益于讯飞星火V3.5的超高的拟人度。它可以让大模型更具人情味，在给用户提供解决方案的同时，还能像“知冷知热”的朋友一般带入情绪互动。

2.提高工作效率

在职场中，知识问答，PPT撰写和活动策划是刚需。基于讯飞星火V3.5的能力，科大讯飞进一步将普通白领的工作效率拉升到了一个新的高度。

科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文，这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、演讲备注等。

刘聪现场演示了使用讯飞智文制作的“合肥市2024年春节旅游推广策略”PPT，短时间内超20页内容丰富的PPT一气呵成，获得台下一阵掌声。

大模型能够结合外部知识进行合理拓展，做到“旁征博引”，成为新一代“打工神器”。

02.讯飞星火语音大模型

发布会上，科大讯飞正式发布了星火语音大模型，并表示，首批37个主流语种效果超过OpenAI Whisper V3。

刘庆峰说，科大讯飞从创业之初的梦想和使命，就是要实现沟通无障碍，25年了，我们的目标和梦想一天都没有变，大模型带来了语音技术发展的全新机会。

科大讯飞介绍，借助大模型，语音具备更加丰富的属性，有语种、有内容、有韵律、有音色，还有情绪。在多语种语音合成方面，星火语音大模型的首批40个语种平均MOS分绝对提升0.25，拟人度超83%。

会上，刘庆峰介绍了搭载语音大模型的讯飞翻译机，即将上线多语种自动识别和增强式翻译两个重要功能，分别于今年1月底和3月中旬完成升级。

据介绍，升级后的多语种自动识别将支持35种语言，增强式翻译技术提供中英双语服务。

此外，在汽车、客服、家庭、陪伴机器人等场景中，星火语音大模型还有更多用武之地，带来人机交互变革。如赋能汽车，智能驾舱、智能座舱、智能导航、音乐控制等交互体验将进一步优化；通过大模型的多模态、语音能力，会让今天已经很火爆的陪伴机器人产业前进一大步，还有智能家居、穿戴式设备等。

03.星火大模型的商业化进展

科大讯飞披露，目前，在讯飞开放平台上，大模型总开发者超35万，其中企业开发者超22万，开发者数增长迅猛，大模型应用加速落地。

现场，刘庆峰提及了讯飞与奇瑞的合作。刘庆峰介绍，奇瑞汽车出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等数十个语种，汽车中应用的智能语音交互技术全都由科大讯飞提供。

此外，科大讯飞还与太平洋保险合作，通过星火太平洋计划赋能内部知识服务、办公、审计、展业等，打造数字劳动力在保险领域的应用标杆；联合交通银行，赋能客服、展业、办公、研发等，重点打造银行领域的代码能力应用标杆；与国家能源集团联合，赋能煤炭、电力、运输、化工等方面，打造央企集团一体化联动的大模型应用标杆等。

科大讯飞与中国移动强强联合，全面助力中国移动数智化转型。在赋能“5G新通话”方面，中国移动携手讯飞星火推出5G新通话创新应用“商务速记”，能够实现通话语音同步纪要，关键事项精准提炼，且无需下载APP，所有手机都支持。

刘庆峰表示，为加速企业大模型应用价值落地，讯飞星火V3.5将提供全栈自主可控的优化套件。基于全国产化算力打造的讯飞星火V3.5支持异构算力调度，可实现行业大模型训练提效90%，支持23个企业应用场景的敏捷优化。

04.匹配国产算力的星火开源-13B

发布会上，科大讯飞发布了首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源-13B。

本次开源拥有130亿稠密参数（13B），包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat，开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件，更便利地训练自己的专用大模型。

基于“飞星一号”训练，星火开源大模型全栈国产适配优化，简单易用，训练策略针对昇腾算力极致优化，训练效率达A100的90%。科大讯飞表示，这不仅是对昇腾AI硬件的进一步深度优化，也展示了国产算力在追赶国际先进水平方面的决心和能力。

目前，华为昇思开源社区已正式上架星火大模型开源版-13B，面对学术、企业研究完全免费。

05.承认差距，努力追赶GPT-4

科大讯飞表示，讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。刘庆峰强调，在大模型时代，我们绝不能只用开源模型做应用落地，在通用大模型的底座上一定要有国家队站出来；当前，发展通用人工智能是我们必须要做的事情，否则工业、科研、民生等各个专用领域都会极大落后于世界，而中国是世界唯一有望成为智慧涌现第二极的国家。

展望2024年讯飞星火大模型发展，刘庆峰指出三点：

首先，一定要在通用大模型的底层能力上持续对标国际最先进水平，从算法研究包括更小的算力上做出相对更优效果。要清醒理智看到差距，当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距，讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。

今天的通用大模型并不一定代表人工智能的全部未来，还有很多创新要做，如脑科学互动、对抗网络的深度连接等，需要整个创新的生态，但我们一定要有勇气、有期许走在最前列。

第二，2024年要真正让大模型量质齐飞，不仅是行业应用，还要在很多关键技术创新上联动大模型，中国企业界、科学界有信心实现超越。

第三，高楼大厦要建立在安全可控的平台之上，我们要实现自主可控平台上的生态繁荣。科大讯飞有信心，能够实现从算法、数据、应用场景到算力，构建一个完全自主可控的繁荣的人工智能生态。

此外，科大讯飞还同步发布了新书《星火相传》。这本书讲述了科大讯飞创业的很多真实故事，还讲述了科大讯飞奠基人王仁华的教书育人经历。科大讯飞希望通过此书能够给有志于做高校科技成果转化、有志于判断人工智能未来的朋友们以更多启发。