英伟达官方Rust编译器来了，CUDA开发告别C++

闪存猎手

2026-05-12 07:12 ·北京

写GPU代码的人终于不用在C++里挣扎了。英伟达本周放出一个实验性项目cuda-oxide，让开发者直接用Rust写CUDA核函数，编译器会把标准Rust代码转成PTX指令集——没有领域专用语言，没有外部绑定，就是纯Rust。

这个项目目前处于v0.1.0早期alpha阶段，官方明确提醒会有bug、功能不全和API变动。但核心卖点已经足够清晰：把Rust的所有权系统和类型安全带到GPU编程里。

看个实际例子。下面这段代码实现向量加法，语法完全是惯用Rust：

#[cuda_module]

mod kernels {

#[kernel]

fn vecadd(a: &[f32], b: &[f32], mut c: DisjointSlice) {

let idx = thread::index_1d();

let i = idx.get();

if let Some(c_elem) = c.get_mut(idx) {

*c_elem = a[i] + b[i];

几个关键设计值得注意。cuda-oxide不是套壳DSL，而是定制了rustc代码生成后端，直接把Rust编译到PTX。#[cuda_module]宏会把生成的设备代码嵌入主机二进制，同时生成类型化的kernels::load函数，每个核函数对应一个启动方法。

内存安全方面用了DisjointSlice这样的类型来管理GPU显存访问，编译期就能拦住不少数据竞争。但文档也诚实交代：GPU有它自己的微妙之处，安全是首要目标，但不是免费午餐。

异步支持是另一张牌。DeviceOperation可以组成惰性计算图，跨流池调度，用.await拿结果——对用过tokio的Rust开发者来说，这套模型没有学习成本。

底层API也没丢。如果你需要加载特定的sidecar产物或者写自定义启动代码，load_kernel_module和cuda_launch!仍然可用。

构建命令是cargo oxide run，前提装好依赖。项目假设你已经熟悉Rust所有权、trait、泛型，以及async/.await运行时。

这对CUDA生态意味着什么？C++在GPU编程里垄断了十几年，Rust社区之前只能靠rustacuda这类第三方绑定迂回作战。英伟达官方下场，至少说明两件事：一是Rust在系统编程领域的地位已经不可忽视，二是他们想在语言层面解决CUDA的安全性和工程体验问题。

不过别急着迁移生产代码。alpha阶段的API变动警告不是客气话，现在更适合用来探路和给反馈。英伟达在文档里直接放了反馈渠道，显然是想让实际使用者来 shaping 方向。

一个细节：项目名叫cuda-oxide，"oxide"是Rust化学式里的氧化物，命名梗对得上社区传统。从crater到cargo，Rust生态早就玩熟了这套。

GPU编程的门槛正在变化。以前你得同时懂并行算法、C++模板元编程和CUDA内存模型，现在Rust的类型系统帮你扛掉一部分认知负担。这对25-40岁这批经历过C++折磨的开发者来说，可能是比性能数字更实在的吸引力。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴