NVIDIA 宣布推出 Nemotron 模型系列，推动代理式 AI 发展|nemotron|nvidia|大模型|工作流|智能体

作为 NVIDIA NIM 微服务，开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何加速系统上为 AI 智能体提供强效助力。

人工智能正在进入一个全新的时代——代理式 AI。在这个时代，专业智能体团队可以帮助人们解决复杂的问题并自动执行重复任务。

借助定制 AI 智能体，各行各业的企业可以构建智能解决方案，从而获得前所未有的生产力。这些先进的 AI 智能体需要一个多样化生成式 AI 模型系统，并且这些模型要针对代理式 AI 功能和能力进行优化。这样的复杂程度意味着企业对强大、高效的企业级模型产生了极大的需求。

为了给企业代理式 AI 奠定基础，NVIDIA 宣布推出开放式大语言模型 (LLM) 的 Llama Nemotron 系列。该模型基于 Llama 构建，可以帮助开发者在一系列应用中创建和部署 AI 智能体，包括客户支持、欺诈检测、产品供应链和库存管理优化。

许多 AI 智能体不仅需要语言技能，还需要感知世界并采取适当行动的能力，以更有效地发挥其作用。

借助全新的 NVIDIA Cosmos Nemotron 视觉语言模型 (VLM) 以及面向视频搜索和摘要的 NVIDIA NIM 微服务，开发者可以构建智能体，分析来自自主机器、医院、商店和仓库的图像和视频以及体育赛事、电影和新闻，并对其做出响应。针对希望为机器人和自动驾驶汽车领域生成物理感知视频的开发者，NVIDIA 还宣布推出 NVIDIA Cosmos 世界基础模型。

开放式 Llama Nemotron 模型

优化了 AI 智能体的计算效率和精度

NVIDIA Llama Nemotron 模型基于 Llama 基础模型而构建，为 AI 智能体开发提供经过优化的基础模组。Llama 基础模型是最热门的商用开源模型集合之一，下载次数超过 6.5 亿次。这一成果建立在 NVIDIA 致力于开发前沿模型的基础之上，例如 Llama 3.1 Nemotron 70B，现在可通过 NVIDIA API 目录获取。

Llama Nemotron 模型使用 NVIDIA 最新技术和高质量数据集进行剪枝和训练，可增强代理式 AI 功能。它们在指令遵循、聊天、函数调用、编码和数学方面表现出色，同时经过尺寸优化，可在广泛的 NVIDIA 加速计算资源上运行。

Meta 副总裁兼 GenAI 负责人 Ahmad Al-Dahle 表示：“代理式 AI 是 AI 开发的下一个前沿，为了抓住这次机会，需要在 LLM 系统中进行全栈优化，以提供高效、准确的 AI 智能体。通过与 NVIDIA 的合作，以及我们对开放模型的共同承诺，基于 Llama 构建的 NVIDIA Llama Nemotron 系列可以助力企业快速构建自己的定制 AI 智能体。”

包括 SAP 和 ServiceNow 在内的领先 AI 智能体平台提供商，有望成为首批使用全新 Llama Nemotron 模型的企业。

SAP 首席人工智能官 Philipp Herzig 表示：“能够跨多个业务线协作解决复杂任务的 AI 智能体将会超越当今的生成式 AI 场景，将企业生产力提升到一个全新的水平。借助 SAP 的 Joule，数亿企业用户能够与这些智能体进行交互，以前所未有的速度实现他们的目标。NVIDIA 的全新开放式 Llama Nemotron 模型系列将推动多个专用 AI 智能体的开发，助力业务流程转型。”

ServiceNow 平台 AI 副总裁 Jeremy Barnes 表示：“AI 智能体使企业组织能够事半功倍，为业务转型树立了新的标准。NVIDIA 开放式 Llama Nemotron 模型性能和精度的提升有助于构建先进的 AI 智能体服务，以解决各行业中各种职能的复杂问题。”

NVIDIA Llama Nemotron 模型使用 NVIDIA NeMo 进行蒸馏、剪枝和对齐。使用这些技术可以将这些模型保持较小的规模，以便在各种计算平台上运行，并在提供高精度的同时提高模型吞吐量。

Llama Nemotron 模型系列将以可下载模型和 NVIDIA NIM 微服务的形式提供，可轻松部署在云端、数据中心、PC 和工作站。它们可以为企业提供业界领先的性能，并且能够可靠、安全且无缝地集成到其代理式 AI 应用工作流中。

使用 NVIDIA NeMo 定制

并接入业务知识

Llama Nemotron 和 Cosmos Nemotron 模型系列将提供 Nano、Super 和 Ultra 三种规模，为部署各种规模的 AI 智能体提供广泛选择。

Nano：成本效益最高的模型，针对实时应用进行了优化，延迟低，非常适合部署在 PC 和边缘设备上。
Super：高精度模型，可在单个 GPU 上提供卓越的吞吐量。
Ultra：精度最高的模型，专为需要超高性能的数据中心级应用而设计。

企业还可以使用 NVIDIA NeMo 微服务为其特定用例和领域定制模型，以简化数据管护、加速模型定制和评估，还可以应用护栏，以确保响应正常。

借助 NVIDIA NeMo Retriever，开发者还可以集成检索增强生成功能，将模型与企业数据连接起来。

使用面向代理式 AI 的 NVIDIA Blueprint，企业可以利用 NVIDIA 先进的 AI 工具和端到端开发专长，快速构建自己的应用。事实上，NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 将为今天发布的面向视频搜索和摘要的全新 NVIDIA Blueprint 提供强效助力。

NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通过 NVIDIA AI Enterprise 软件平台使用。

可用性

Llama Nemotron 和 Cosmos Nemotron 模型将以托管应用编程接口的形式提供，可通过 NVIDIA 官网和 Hugging Face 下载：

https://www.nvidia.cn/ai/

NVIDIA 开发者计划的成员均可免费访问开发、测试和研究资源：

https://forums.developer.nvidia.com/t/nvidia-nim-faq/300317

在生产中，企业可以使用 NVIDIA AI Enterprise 软件平台在加速数据中心和云计算基础设施上运行 Llama Nemotron 和 Cosmos Nemotron NIM 微服务。

注册即可获取有关 Llama Nemotron 和 Cosmos Nemotron 模型的资讯，并可在 CES 上参加 NVIDIA 活动：

https://www.nvidia.cn/events/ces/

请参阅有关软件产品信息的通知：

https://www.nvidia.cn/about-nvidia/terms-of-service/