在美国积极遏制中国算力发展的前提下,基于全国产算力训练的大模型显得尤其珍贵。
来源|锚思企服
作者|李崇
1月30日,科大讯飞举行星火认知大模型V3.5升级发布会,正式发布了基于首个全国产算力训练的讯飞星火V3.5。
据悉,早在2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。此后,讯飞星火便启动了对标GPT-4的更大参数规模的大模型训练,讯飞星火V3.5得以诞生。
科大讯飞表示,讯飞星火V3.5的语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力等七大核心能力得到全面提升。其中,数学、语言理解、语音交互能力超GPT-4 Turbo。
此外,科大讯飞还发布了深度适配国产算力的讯飞星火开源大模型“星火开源-13B”,目前已在昇思开源社区联合首发上线。
刘庆峰说,相信2024年,通用人工智能不仅能够在中国各大领域深度而广泛应用,而且在源头技术创新、在大模型的底层能力上也会站上全新台阶。
01.国产讯飞星火V3.5的潜力
在发布会上,科大讯飞对讯飞星火V3.5的能力做了全方位的比较。
其中,语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。
1.拟人全语音自然交互
“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”
在实操演示环节,刘聪和讯飞星火V3.5现场互动,讯飞星火V3.5一口地道的东北话逗乐现场观众。幽默之余,讯飞星火V3.5快速为刘聪定制了旅游攻略,还催促他赶快买票,春运机票紧俏。
这种带有情感的全语音交互,得益于讯飞星火V3.5的超高的拟人度。它可以让大模型更具人情味,在给用户提供解决方案的同时,还能像“知冷知热”的朋友一般带入情绪互动。
2.提高工作效率
在职场中,知识问答,PPT撰写和活动策划是刚需。基于讯飞星火V3.5的能力,科大讯飞进一步将普通白领的工作效率拉升到了一个新的高度。
科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文,这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、演讲备注等。
刘聪现场演示了使用讯飞智文制作的“合肥市2024年春节旅游推广策略”PPT,短时间内超20页内容丰富的PPT一气呵成,获得台下一阵掌声。
大模型能够结合外部知识进行合理拓展,做到“旁征博引”,成为新一代“打工神器”。
02.讯飞星火语音大模型
发布会上,科大讯飞正式发布了星火语音大模型,并表示,首批37个主流语种效果超过OpenAI Whisper V3。
刘庆峰说,科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍,25年了,我们的目标和梦想一天都没有变,大模型带来了语音技术发展的全新机会。
科大讯飞介绍,借助大模型,语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。在多语种语音合成方面,星火语音大模型的首批40个语种平均MOS分绝对提升0.25,拟人度超83%。
会上,刘庆峰介绍了搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。
据介绍,升级后的多语种自动识别将支持35种语言,增强式翻译技术提供中英双语服务。
此外,在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互变革。如赋能汽车,智能驾舱、智能座舱、智能导航、音乐控制等交互体验将进一步优化;通过大模型的多模态、语音能力,会让今天已经很火爆的陪伴机器人产业前进一大步,还有智能家居、穿戴式设备等。
03.星火大模型的商业化进展
科大讯飞披露,目前,在讯飞开放平台上,大模型总开发者超35万,其中企业开发者超22万,开发者数增长迅猛,大模型应用加速落地。
现场,刘庆峰提及了讯飞与奇瑞的合作。刘庆峰介绍,奇瑞汽车出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等数十个语种,汽车中应用的智能语音交互技术全都由科大讯飞提供。
此外,科大讯飞还与太平洋保险合作,通过星火太平洋计划赋能内部知识服务、办公、审计、展业等,打造数字劳动力在保险领域的应用标杆;联合交通银行,赋能客服、展业、办公、研发等,重点打造银行领域的代码能力应用标杆;与国家能源集团联合,赋能煤炭、电力、运输、化工等方面,打造央企集团一体化联动的大模型应用标杆等。
科大讯飞与中国移动强强联合,全面助力中国移动数智化转型。在赋能“5G新通话”方面,中国移动携手讯飞星火推出5G新通话创新应用“商务速记”,能够实现通话语音同步纪要,关键事项精准提炼,且无需下载APP,所有手机都支持。
刘庆峰表示,为加速企业大模型应用价值落地,讯飞星火V3.5将提供全栈自主可控的优化套件。基于全国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。
04.匹配国产算力的星火开源-13B
发布会上,科大讯飞发布了首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源-13B。
本次开源拥有130亿稠密参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。
基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,训练策略针对昇腾算力极致优化,训练效率达A100的90%。科大讯飞表示,这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费。
05.承认差距,努力追赶GPT-4
科大讯飞表示,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。刘庆峰强调,在大模型时代,我们绝不能只用开源模型做应用落地,在通用大模型的底座上一定要有国家队站出来;当前,发展通用人工智能是我们必须要做的事情,否则工业、科研、民生等各个专用领域都会极大落后于世界,而中国是世界唯一有望成为智慧涌现第二极的国家。
展望2024年讯飞星火大模型发展,刘庆峰指出三点:
首先,一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。
今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等,需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。
第二,2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越。
第三,高楼大厦要建立在安全可控的平台之上,我们要实现自主可控平台上的生态繁荣。科大讯飞有信心,能够实现从算法、数据、应用场景到算力,构建一个完全自主可控的繁荣的人工智能生态。
此外,科大讯飞还同步发布了新书《星火相传》。这本书讲述了科大讯飞创业的很多真实故事,还讲述了科大讯飞奠基人王仁华的教书育人经历。科大讯飞希望通过此书能够给有志于做高校科技成果转化、有志于判断人工智能未来的朋友们以更多启发。
热门跟贴