NVIDIA全面升级RTX PC 和DGX Spark 上的本地AI智能体COMPUTEX期间的GTC台北,NVIDIA OpenShell将安全智能体带到Windows,并在llama.cpp上实现高达2倍的推理性能加速。Adobe对旗下应用进行重构,以带来性能提升,Blender加入NVIDIA DLSS 4.5 光线重建支持,并适配NVIDIA RTX Spark。
个人智能体正迎来爆发式增长,OpenClaw和Hermes等开源项目在GitHub上正受到AI开发者社区的接纳和使用。这些智能体能够适配用户的个人偏好和工作流,可与应用交互、生成内容、自动执行重复流程并管理多步骤任务,同时全流程均在本地端侧运行。
6月1日,在 COMPUTEX期间的NVIDIA GTC 台北上,NVIDIA发布了 NVIDIA RTX Spark,这是一类专为个人智能体打造的全新Windows PC。同时,NVIDIA还发布了一系列更新,将本地智能体能力进一步扩展至更广泛的NVIDIA RTX 和DGX生态系统。
在本地设备上运行AI智能体,既需要强大的安全性,也需要高性能硬件。RTX Spark 凭借高达1Petaflop AI 性能和128GB统一内存,足以应对本地AI智能体的计算需求,让电脑从单纯的工具进化为智能搭档。RTXSpark 专为AI、创作和游戏而生,将NVIDIA 30年技术创新沉淀带到具备全天续航的轻薄Windows笔记本电脑和超高能效的桌面主机。
NVIDIA与Windows的合作将从个人解决方案扩展到企业解决方案。本次展会上发布了适用于Windows的NVIDIA DGX Station,一款面向专业人士的极致AI台式超级计算机,在配备 Windows桌面系统中搭载用于推理的数据中心级GPU和CPU,以实现可管理性、安全性与兼容性。
其他发布内容包括:
- NVIDIA OpenShell 运行时即将登陆 Windows。它基于微软面向智能体的全新安全基元构建,为开发者提供易于部署的端侧安全智能体套件。Hermes Agent 和 OpenClaw 的全新 Windows 应用中也将集成 OpenShell 和 Microsoft 安全基元。
- NVIDIA NemoClaw 蓝图正在扩展到 NVIDIA 所有本地 AI 产品线,包括 GeForce RTX、RTX PRO、RTX 和 DGX Spark,以及 RTX 和 DGX Station,并带来全新的简化安装程序和对 Hermes Agent 的支持。
- 借助 llama.cpp 和 vLLM 中的多 token 预测技术,顶级智能体模型可实现最高 2 倍的推理性能加速。llama.cpp 和 ComfyUI 也将迎来全新的多 GPU 优化。
- H Company 发布针对 RTX 和 DGX PC 优化的computer use工具,包括全新模型和即将推出的桌面智能体运行约束框架。
- Adobe 正在重构 Photoshop 和 Premiere 应用,Blender 正在加入 NVIDIA DLSS 4.5 光线重建支持,NVIDIA RTX Video 帧生成即将登陆 ComfyUI。所有这些更新都将于今年秋季随 RTX Spark 一同推出。
- NVIDIA Broadcast 2.2 更新带来音棚音效功能优化和 Elgato Stream Deck 支持。NVIDIA Project G-Assist 也加入了 Stream Deck 集成。
本地代理式AI:WindowsRTX PC 上实现个性化、私密和高速的体验
智能体的大规模普及一直受到限制,核心原因在于:用户难以在自己的主力PC上安全、私密地运行智能体
NVIDIA与微软携手应对这一挑战,打造一套用于在端侧强大、安全运行AI智能体的Windows平台。
双方的合作建立在坚实的基础之上—— 包括全新的 Windows安全基元和NVIDIAOpenShell™ 运行时—— 以确保 AI智能体能安全运行,并完全处于用户掌控之下。
全新Windows安全基元为智能体的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。NVIDIAOpenShell 提供额外的策略管控能力,允许用户自定义智能体可以执行哪些操作,智能地根据用户的隐私策略将请求分配给本地模型处理,并在向云端模型发送请求前对其中的个人信息进行脱敏和隐藏。
这套强大的安全与隐私防护层正被HermesAgent 和OpenClaw等前沿AI智能体开发者采用,并集成到其新款Windows应用中。这些新应用将让用户便捷、安全地使用强大的本地AI智能体,这些智能体可在Windows应用中执行任务、对跨应用工作流进行推理、生成图像和视频、编写插件和应用,以及对本地文件进行语义搜索。
在本地设备上运行AI智能体,既需要强大的安全性,也需要高性能硬件。RTXSpark 凭借高达1Petaflop AI 性能和128GB统一内存,满足足以应对本地AI智能体的计算处理需求。
NVIDIA也正在加速这些智能体所依赖的本地开源模型生态系统。
NVIDIA与llama.cpp社区合作,引入了多token预测(MTP)等功能和优化。MTP是一种预测解码技术,由较小的草稿模型一次生成多个token,再由目标模型在单次推理中进行验证。结合程序化依赖启动等其他优化,Qwen3.6 和3.527B 可实现最高2倍的性能加速,Qwen3.6 和3.535B 可实现1.6倍性能提升。这些更新均可通过llama.cppwebUI 和LMStudio 获取使用。
对拥有多GPU设备的AI发烧友而言,NVIDIA与开源社区合作,增强了两款最热门的本地AI工具:
- llama.cpp 加入张量并行执行;在两张性能相当的 GPU 上,最高可获得 2 倍容量的显存和 1.8 倍计算性能提升
- ComfyUI 加入一种新的无分类器引导 (CFG) 方法,在两张性能相当的 GPU 上最高可带来 2 倍性能提升;同时还提供了将模型工作链分配到多张 GPU 的选项,以充分利用融合的显存。
图注:展示llama.cpp上张量并行Multi-GPU技术相较于流水线并行和单GPU推理的token生成性能提升。
NVIDIA正在与HCompany 携手扩展智能体能力。HCompany 的ComputerUse 框架可让智能体像真实用户一样,通过“看”屏幕并使用鼠标和键盘来操作电脑;即便某些应用没有API,也能完成交互。该框架即将支持RTX和DGXPC,并提供对本地模型的支持
NVIDIA与HCompany 合作,对其先进的HoloComputer Use 模型进行量化,并加速其运行约束框架,以在NVIDIAGPU 上2倍性能加速,同时将内存占用降低35%。这些模型现已开放下载,HoloDesktop 应用也将很快推出。
面向Linux的智能体优化
对于需要随时使用本地智能体的开发者,NVIDIADGX Spark 是在Linux环境下性能最强的个人智能体AI计算机,集成了大容量内存、快速计算和NVIDIACUDA 生态系统。
本月的DGXSpark OS 更新带来了更顺畅的开箱即用体验,包括更简洁的NemoClaw安装器,以及对主流Agentic模型更快的推理速度。
如今,NemoClaw已可用于所有采用Linux和WindowsSubsystem for Linux 的NVIDIARTX 与DGXPC。借助新的简化安装器,用户能够在Linux上安全部署本地智能体,获得自动沙盒保护,并新增HermesAgent 支持。
NVIDIA与vLLM展开合作,专门为智能体场景优化推理性能,同时推出了vLLM端的优化,以及适用于Qwen3.6 35B 的新版优化NVFP4checkpoints。相较于Unsloth之前提供的NVFP4checkpoints,这些更新在DGXSpark 上可实现2.6倍性能提升,并带来了内核优化,以及对MTP的混合精度与CUDAGraph 支持
请查看 vLLM博客,了解如何在DGXSpark 上部署NVFP4混合专家模型服务,从统一内存调优到可运行的NVIDIANemotron 3 Super 参考设置。
携手Adobe带来强大的创作体验
NVIDIA与Adobe合作,为RTXSpark 从底层重构AdobePremiere 和Photoshop。Photoshop中由Firefly驱动的生成式填充,以及Premiere中的生成式扩展,是数百种加速工具中的一员,可提供强大的创作能力、精确度和控制力。RTXSpark 将这些能力进一步提升,在创意工作流中实现最高2倍加速的AI、剪辑、调色和特效处理性能。
AdobePremiere 将采用一套全新的视频处理管线,充分利用RTXSpark 的统一内存、BlackwellGPU 和TensorRT软件,为剪辑和调色带来实时性能、GPU加速的AI表现,以及更高效的复杂时间线渲染。
此外,Adobe的Substance3D Painter 和Stager也将原生运行于RTXSpark 上,从而让3D贴图绘制和场景创建工作流程更加顺畅、响应更快速
Adobe下一代Photoshop引擎将为GPU加速的图片合成进行优化,支持实时滤镜、高动态范围和现代自然笔刷。该AI原生工作流可利用包括TensorRT在内完整的RTXSpark 强大能力。
Adobe还将进一步扩展Premiere和Photoshop,使用户能够借助Windows智能体进行创作、编辑和设计,为创作者提供协同工作的智能搭档,加速创意工作流。
面向AdobePremiere、Photoshop和Substance等创意应用的更新预计将随RTXSpark 上市陆续推出。
面向创作者的新工具和应用更新
全新NVIDIA平台更新和合作伙伴应用优化正在更广泛的RTX生态系统中陆续推出,一些更新已于6月1日发布,另一些将于今年秋季随RTXSpark 推出。
NVIDIABroadcast 2.2 中的StudioVoice 功能正式结束测试。这个AI功能可以让任何麦克风呈现出录音棚级音质;现在它已支持在GeForceRTX 3060 及以上GPU上运行,性能也有所提升。同时,该应用还加入了ElgatoStream Deck 集成和可自定义键盘快捷键功能。
BlenderCycles 将引入DLSS4.5 光线重建作为新的降噪选项,把原本的路径追踪视口提升为可实时交互的查看器。这样3D创作者可在场景中,以接近最终成片的渲染质量实时预览,从而显著改善布光和视觉风格开发流程。该更新预计会在今年秋季随Blender5.3 发布,并与RTXSpark 同步推出。
https://images.nvidia.cn/cn/youtube-replicates/XYvUsBFkJMA.mp4
RTXVideo 帧生成将随RTXSpark 一同推出。这是一款全新AI特效,可将视频帧率实时提升至2倍或4倍,非常适合增强常见的由AI模型生成的15-20FPS 视频输出。此技术将以Pythonwheel 和ComfyUI节点形式推出,让AI艺术家能够以低FPS更快生成视频,再插帧至流畅帧率。
https://images.nvidia.cn/cn/youtube-replicates/E-aMlA7lX94.mp4
热门跟贴