NVIDIA全面升级RTX PC和DGX Spark上的本地 AI 智能体|gpu|linux|nvidia|rtx|spark|开源模型|智能体

NVIDIA全面升级RTX PC 和DGX Spark 上的本地AI智能体COMPUTEX期间的GTC台北，NVIDIA OpenShell将安全智能体带到Windows，并在llama.cpp上实现高达2倍的推理性能加速。Adobe对旗下应用进行重构，以带来性能提升，Blender加入NVIDIA DLSS 4.5 光线重建支持，并适配NVIDIA RTX Spark。

个人智能体正迎来爆发式增长，OpenClaw和Hermes等开源项目在GitHub上正受到AI开发者社区的接纳和使用。这些智能体能够适配用户的个人偏好和工作流，可与应用交互、生成内容、自动执行重复流程并管理多步骤任务，同时全流程均在本地端侧运行。

6月1日，在 COMPUTEX期间的NVIDIA GTC 台北上，NVIDIA发布了 NVIDIA RTX Spark，这是一类专为个人智能体打造的全新Windows PC。同时，NVIDIA还发布了一系列更新，将本地智能体能力进一步扩展至更广泛的NVIDIA RTX 和DGX生态系统。

在本地设备上运行AI智能体，既需要强大的安全性，也需要高性能硬件。RTX Spark 凭借高达1Petaflop AI 性能和128GB统一内存，足以应对本地AI智能体的计算需求，让电脑从单纯的工具进化为智能搭档。RTXSpark 专为AI、创作和游戏而生，将NVIDIA 30年技术创新沉淀带到具备全天续航的轻薄Windows笔记本电脑和超高能效的桌面主机。

NVIDIA与Windows的合作将从个人解决方案扩展到企业解决方案。本次展会上发布了适用于Windows的NVIDIA DGX Station，一款面向专业人士的极致AI台式超级计算机，在配备 Windows桌面系统中搭载用于推理的数据中心级GPU和CPU，以实现可管理性、安全性与兼容性。

其他发布内容包括：

NVIDIA OpenShell 运行时即将登陆 Windows。它基于微软面向智能体的全新安全基元构建，为开发者提供易于部署的端侧安全智能体套件。Hermes Agent 和 OpenClaw 的全新 Windows 应用中也将集成 OpenShell 和 Microsoft 安全基元。
NVIDIA NemoClaw 蓝图正在扩展到 NVIDIA 所有本地 AI 产品线，包括 GeForce RTX、RTX PRO、RTX 和 DGX Spark，以及 RTX 和 DGX Station，并带来全新的简化安装程序和对 Hermes Agent 的支持。
借助 llama.cpp 和 vLLM 中的多 token 预测技术，顶级智能体模型可实现最高 2 倍的推理性能加速。llama.cpp 和 ComfyUI 也将迎来全新的多 GPU 优化。
H Company 发布针对 RTX 和 DGX PC 优化的computer use工具，包括全新模型和即将推出的桌面智能体运行约束框架。
Adobe 正在重构 Photoshop 和 Premiere 应用，Blender 正在加入 NVIDIA DLSS 4.5 光线重建支持，NVIDIA RTX Video 帧生成即将登陆 ComfyUI。所有这些更新都将于今年秋季随 RTX Spark 一同推出。
NVIDIA Broadcast 2.2 更新带来音棚音效功能优化和 Elgato Stream Deck 支持。NVIDIA Project G-Assist 也加入了 Stream Deck 集成。

本地代理式AI：WindowsRTX PC 上实现个性化、私密和高速的体验

智能体的大规模普及一直受到限制，核心原因在于：用户难以在自己的主力PC上安全、私密地运行智能体

NVIDIA与微软携手应对这一挑战，打造一套用于在端侧强大、安全运行AI智能体的Windows平台。

双方的合作建立在坚实的基础之上—— 包括全新的 Windows安全基元和NVIDIAOpenShell™ 运行时—— 以确保 AI智能体能安全运行，并完全处于用户掌控之下。

全新Windows安全基元为智能体的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。NVIDIAOpenShell 提供额外的策略管控能力，允许用户自定义智能体可以执行哪些操作，智能地根据用户的隐私策略将请求分配给本地模型处理，并在向云端模型发送请求前对其中的个人信息进行脱敏和隐藏。

这套强大的安全与隐私防护层正被HermesAgent 和OpenClaw等前沿AI智能体开发者采用，并集成到其新款Windows应用中。这些新应用将让用户便捷、安全地使用强大的本地AI智能体，这些智能体可在Windows应用中执行任务、对跨应用工作流进行推理、生成图像和视频、编写插件和应用，以及对本地文件进行语义搜索。

在本地设备上运行AI智能体，既需要强大的安全性，也需要高性能硬件。RTXSpark 凭借高达1Petaflop AI 性能和128GB统一内存，满足足以应对本地AI智能体的计算处理需求。

NVIDIA也正在加速这些智能体所依赖的本地开源模型生态系统。

NVIDIA与llama.cpp社区合作，引入了多token预测(MTP)等功能和优化。MTP是一种预测解码技术，由较小的草稿模型一次生成多个token，再由目标模型在单次推理中进行验证。结合程序化依赖启动等其他优化，Qwen3.6 和3.527B 可实现最高2倍的性能加速，Qwen3.6 和3.535B 可实现1.6倍性能提升。这些更新均可通过llama.cppwebUI 和LMStudio 获取使用。

对拥有多GPU设备的AI发烧友而言，NVIDIA与开源社区合作，增强了两款最热门的本地AI工具：

llama.cpp 加入张量并行执行；在两张性能相当的 GPU 上，最高可获得 2 倍容量的显存和 1.8 倍计算性能提升
ComfyUI 加入一种新的无分类器引导 (CFG) 方法，在两张性能相当的 GPU 上最高可带来 2 倍性能提升；同时还提供了将模型工作链分配到多张 GPU 的选项，以充分利用融合的显存。

图注：展示llama.cpp上张量并行Multi-GPU技术相较于流水线并行和单GPU推理的token生成性能提升。

NVIDIA正在与HCompany 携手扩展智能体能力。HCompany 的ComputerUse 框架可让智能体像真实用户一样，通过“看”屏幕并使用鼠标和键盘来操作电脑；即便某些应用没有API，也能完成交互。该框架即将支持RTX和DGXPC，并提供对本地模型的支持

NVIDIA与HCompany 合作，对其先进的HoloComputer Use 模型进行量化，并加速其运行约束框架，以在NVIDIAGPU 上2倍性能加速，同时将内存占用降低35%。这些模型现已开放下载，HoloDesktop 应用也将很快推出。

面向Linux的智能体优化

对于需要随时使用本地智能体的开发者，NVIDIADGX Spark 是在Linux环境下性能最强的个人智能体AI计算机，集成了大容量内存、快速计算和NVIDIACUDA 生态系统。

本月的DGXSpark OS 更新带来了更顺畅的开箱即用体验，包括更简洁的NemoClaw安装器，以及对主流Agentic模型更快的推理速度。

如今，NemoClaw已可用于所有采用Linux和WindowsSubsystem for Linux 的NVIDIARTX 与DGXPC。借助新的简化安装器，用户能够在Linux上安全部署本地智能体，获得自动沙盒保护，并新增HermesAgent 支持。

NVIDIA与vLLM展开合作，专门为智能体场景优化推理性能，同时推出了vLLM端的优化，以及适用于Qwen3.6 35B 的新版优化NVFP4checkpoints。相较于Unsloth之前提供的NVFP4checkpoints，这些更新在DGXSpark 上可实现2.6倍性能提升，并带来了内核优化，以及对MTP的混合精度与CUDAGraph 支持

请查看 vLLM博客，了解如何在DGXSpark 上部署NVFP4混合专家模型服务，从统一内存调优到可运行的NVIDIANemotron 3 Super 参考设置。

携手Adobe带来强大的创作体验

NVIDIA与Adobe合作，为RTXSpark 从底层重构AdobePremiere 和Photoshop。Photoshop中由Firefly驱动的生成式填充，以及Premiere中的生成式扩展，是数百种加速工具中的一员，可提供强大的创作能力、精确度和控制力。RTXSpark 将这些能力进一步提升，在创意工作流中实现最高2倍加速的AI、剪辑、调色和特效处理性能。

AdobePremiere 将采用一套全新的视频处理管线，充分利用RTXSpark 的统一内存、BlackwellGPU 和TensorRT软件，为剪辑和调色带来实时性能、GPU加速的AI表现，以及更高效的复杂时间线渲染。

此外，Adobe的Substance3D Painter 和Stager也将原生运行于RTXSpark 上，从而让3D贴图绘制和场景创建工作流程更加顺畅、响应更快速

Adobe下一代Photoshop引擎将为GPU加速的图片合成进行优化，支持实时滤镜、高动态范围和现代自然笔刷。该AI原生工作流可利用包括TensorRT在内完整的RTXSpark 强大能力。

Adobe还将进一步扩展Premiere和Photoshop，使用户能够借助Windows智能体进行创作、编辑和设计，为创作者提供协同工作的智能搭档，加速创意工作流。

面向AdobePremiere、Photoshop和Substance等创意应用的更新预计将随RTXSpark 上市陆续推出。

面向创作者的新工具和应用更新

全新NVIDIA平台更新和合作伙伴应用优化正在更广泛的RTX生态系统中陆续推出，一些更新已于6月1日发布，另一些将于今年秋季随RTXSpark 推出。

NVIDIABroadcast 2.2 中的StudioVoice 功能正式结束测试。这个AI功能可以让任何麦克风呈现出录音棚级音质；现在它已支持在GeForceRTX 3060 及以上GPU上运行，性能也有所提升。同时，该应用还加入了ElgatoStream Deck 集成和可自定义键盘快捷键功能。

BlenderCycles 将引入DLSS4.5 光线重建作为新的降噪选项，把原本的路径追踪视口提升为可实时交互的查看器。这样3D创作者可在场景中，以接近最终成片的渲染质量实时预览，从而显著改善布光和视觉风格开发流程。该更新预计会在今年秋季随Blender5.3 发布，并与RTXSpark 同步推出。

https://images.nvidia.cn/cn/youtube-replicates/XYvUsBFkJMA.mp4

RTXVideo 帧生成将随RTXSpark 一同推出。这是一款全新AI特效，可将视频帧率实时提升至2倍或4倍，非常适合增强常见的由AI模型生成的15-20FPS 视频输出。此技术将以Pythonwheel 和ComfyUI节点形式推出，让AI艺术家能够以低FPS更快生成视频，再插帧至流畅帧率。

https://images.nvidia.cn/cn/youtube-replicates/E-aMlA7lX94.mp4