随着ChatGPT的快速进化吸引了全球网友的眼球,国内厂商也纷纷表示将推出相似的产品。

而在这段时间,随着“文心一言”开启测试,除百度外的多家厂商也开启了AI模型产品的内测,希望可以提供更有竞争力的产品,抢占AI领域市场。

打开网易新闻 查看精彩图片

就在今日,钛媒体从华为内部独家获悉,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。

打开网易新闻 查看精彩图片

据介绍,盘古大模型于2020年11月在华为云内部立项成功。这款“盘古Chat ”预计将于今年7月7日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布以及内测,产品主要面向To B/G政企端客户。

打开网易新闻 查看精彩图片

根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的MindSpore框架开发。整体来看,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。

据之前的介绍可知,华为盘古大模型于2021年4月正式对外发布,后来又在2022年4月升级到2.0版本。目前,AI大模型中的NLP大模型、CV大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。

打开网易新闻 查看精彩图片

据介绍,这是首个千亿参数中文预训练大模型,CV大模型则首次达到30亿参数。盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。

对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

华为云官网显示,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。

打开网易新闻 查看精彩图片

具体的话,盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。

盘古CV大模型是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力,基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。

盘古气象大模型提供秒级天气预报,借助创新的3DEST网络结构以及分层时间聚合算法,在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,速度相比传统方法提升1000倍以上。

简单来说,此次即将发布的盘古Chat基于盘古大模型而来,但盘古模型并不局限于一个小分类,对盘古感兴趣的小伙伴可以保持关注。