Gemini 大模型主打多模态,性能对标 GPT-4

当地时间12月6日, 谷歌公司宣布推出其规模最大、功能最强的多模态大模型 Gemini, 其最强大的 TPU (张量处理单元)系统 “Cloud TPU v5p”, 以及来自谷歌云的人工智能超级计算机。

本次谷歌推出的多模态大模型Gemini 依然采用Transformer架构,采用高效Attention机制,支持32k 的上下文长度。Gemini 主打在多模态领域的突出能力,在输入端, Gemin 可以适应文本与音视频交叉的输入序列,比如自然图像、图表、截图、pdf 和视频等。在输出端,Gemini 兼具文本和图像两种输出形式。与市面上大模型不同的地方在于,Gemini 从设计之初开始就是多模态的,并不像 OpenAI 构建 DALL·E和 Whisper 单独训练图像和语音模型。

Gemini 1.0家族涵盖三类模型,各有定位:

1)Gemini Ultra: 用于高度复杂的任务,为规模最大、功能最强的类别,定位为GPT-4的竞争对手;

2)Gemini Pro: 是一款中端型号, 用于增强性能和大规模部署能力,根据谷歌技术报告,其性能优于GPT-3.5;

3)Gemini Nano: 主要用于特定任务和移动设备。

模型能力方面, Gemini 系列在文本、多模态、模态组合等领域均实现了较大进展,在绝大多数基准测试中性能领先于GPT-4。

我们认为,此次AI 模型Gemini 的推出对AI 产业链上下游均有不同程度的带动作用。上游层面,受益于AI 巨头在大模型领域的竞争白热化, AI 算力需求持续增进;下游层面AIGC产业可借助大模型应用变革内容生产方式,扩大发展空间。

国内AI 大模型加速布局,推动下游AIGC 业务发展

AIGC 相关应用方面的创新主要包括两种大模型的应用分支:

生成对抗网络 (GAN)/ 扩散模型 (Diffusion);

Transformer 预训练大模型。在国外AIGC 应用大规模运用大模型技术的同 时,我国企业也在加快对大模型产品的布局。云厂商、AI 大厂、创企、各行业 公司及技术服务商等产业各领域玩家也在陆续推出大模型或基于大模型的应用产品及各类技术服务。

AIGC 产业拥有巨大的发展潜力与成长空间,可借助大模型变革内容生产方式,提升生产效率和创意。

根据艾瑞咨询预测, 2028年我国AIGC 产业预计规模将达到7202亿元,将完成在重点领域、关键场景的技术价值兑现,并逐步建立完善的模型即服务产业 生态,预计2030年中国AIGC 产业规模将突破至11441亿元。大模型对内容理解 和内容生成的双向能力使其既能以极低门槛实现多模态内容生成,也可脱离内容生产核心场景泛化为一种人机对话的媒介。

未来,全行业将借助大模型能力衍生出的大量AI 生产工具,实现内容生产效率的飞跃,并进一步降低数字生态的人机交互门槛!

多模态大模型呼唤更多算力,开启上游服务器新发展

Gemini1.0 号称具有原生多模态能力,能够处理视频、音频、图像、文本和代码等多种形式的内容,且性能优于现有的“拼接型”多模态大模型。从谷歌官方公布的技术文档中的示例来看,Gemini 不仅能够进行双模态之间的转换(如文生图或文生视频),亦能处理需要进行多模态转换的复杂任务。

多模态大模型的算力需求远高于纯文本模态。 以 Gemini 为例,其强大的多模态能力背后,是庞大的算力需求。虽然没有正式公布,但根据内部消息,Gemini 有万亿参数,训练所用的算力甚至达到GPT-4的五倍。有别于传统大模型对英伟达硬件及生态的依赖,Gemini 训练所需的算力基于谷歌自研的 TPUv4 和 v5e等硬件。

在推出新模型的同时,谷歌顺势宣布推出迄今为止功能最强大、最高效、可扩展性最强的 TPU 系统 Cloud TPU v5p,将用于开发更高层次的AI 大模型。其 TPU v5p的训练性能是上一代 TPU v4的2.8倍,内存带宽提升3倍,芯片间互联带宽翻倍,达到4.8Tbps, 同时,v5p 单个 POD 中的芯片数量翻倍,达到8960颗。

受到人工智能大模型的发展热潮影响,AI服务器的需求量将大幅度增加。 数量方面,根据TrendForce 预测,2023 年全球 AI 服务器出货量将接近120万台,年增长率接近38.4%,占整体服务器的9%。预计到2025年整体出货量将增加至190万台,2022-2025年年复合增长率将达到30.4%。

价格方面,通用服务器价格一般为几千美金/台,而主流AI 服务器价格多在 10-15万美金/台,单价呈现指数型提升。 根据中商情报网预计,2022年全球 AI 服务器市场规模约为183亿美元,预计2023年将达到211亿美元,同比增长率高达15.3%。

我们筛选出以下潜力标的

紫光股份(000938)公司发布了全新一代自研八路关键业务服务器H3C UniServer R8900 G3,可支持高达8颗高端处理器,224个计算核心,具备96个内存插槽, 满足核心数据库,虚拟化,高性能计算,人工智能,内存计算等多种关键业务场景运算需求。

中科曙光(603019)公司通用服务器产品、存储产品在国内市场上处于领先地位。具有完整的产品线,能够满足各类细分市场的需求。

浪潮信息(000977)目前,公司已成为百度、阿里巴巴、腾讯等客户最主要的AI 服务器供应商。

参考资料:

平安证券-计算机行业动态跟踪报告:多模态能力表现亮眼,谷歌携Gemini 王者归来-231208.pdf

上海证券-通信行业周报:最强AI 模型Gemini 正式发布,多模态应用前景广阔-231215.pdf