vllm刚刚发了一个推:

打开网易新闻 查看精彩图片

vLLM官方还把这个专门钻空子的培训机构的小红书拉出来做了英文翻译

打开网易新闻 查看精彩图片

全世界面前丢人现眼了

我也凑热闹去看了小红书,发现好几个和我一样看乐子的兄弟留言了

打开网易新闻 查看精彩图片

看之前的评论区,更多的是——这是一门生意

投机取巧,丢人显眼那种

打开网易新闻 查看精彩图片

我顺着 PR 链接进去仔细扒了一遍,从标题到 commit,从描述到测试方案,越看越离谱

PR 看起来「专业到不行」

先说 PR 标题:

❝ fix(eagle3): read norm_before_fc from eagle_config for NVIDIA checkpoint

修一个 Eagle3 投机解码在加载 NVIDIA 官方 GPT-OSS 系列 checkpoint 时,norm_before_fc 这个字段被藏在嵌套字典 eagle_config 里读不到的问题,导致 RMSNorm 被静默跳过、接受率下降

光看标题就让人觉得:这哥们儿对 vLLM v1 worker 里的 speculative decoding 模块门儿清,还顺手帮 NVIDIA 兜底,妥妥的核心贡献者气质

正文 Purpose 写得头头是道:

  • 明确指出问题:NVIDIA 的 Eagle3 checkpoint 把 norm_before_fc 塞在嵌套的 eagle_config 字典里,vLLM 只读了顶层字段

  • 修复方案:先从 eagle_config 读,读不到再 fallback 到顶层 attr

  • 给了对照:「Same pattern already used for use_aux_hidden_state in the same block」——还知道仿照已有同模式,专业感拉满

Test Plan 才是「灵魂注水」

PR 的 Test Plan 直接贴了三段 Python 脚本,分别做:

  1. 正确性测试 :贪心解码对比 baseline 和 eagle3 输出是否一致

  2. 性能测试 :单 request 512 tokens 解码,对比 baseline 和 eagle3 的 tok/s,输出 speedup

  3. 单元测试 :手动构造 mock config,验证两个分支都能正确读取 norm_before_fc

结尾还来一句:「Tested with Qwen3-32B + Qwen3-32B_eagle3 on 1x H200」

H200!H200 啊老铁们,整套下来300万的机器

测试结果也写得明明白白:

  • Correctness: 4/4 greedy 输出一致

  • 性能:baseline xx tok/s → eagle3 xx tok/s

正常 reviewer 看到这个 PR,心里想的是:「问题清晰、修复点小、测试齐全、还在大模型上跑过——闭眼合」

事实上,PR 最后真的就被合了,63 项 CI 全绿,benchislett 直接打了 ready 标签 merge 进 main

为啥 vLLM 又把人 ban 了

PR 都合了,结果社区有人举报:这个 PR 解决的根本是个不存在的问题

什么意思呢?

NVIDIA 那批 Eagle3 checkpoint 实际跑的时候根本没有这个 bug——norm_before_fc 该读到的地方都读到了。所谓「RMSNorm 被静默跳过、接受率下降」是这哥们儿凭空想象出来的,目的就是制造一个看起来很专业、很硬核、但其实改了等于没改的 PR

为啥要这么做?答案就藏在 vLLM 公告里那六个字——「PR training」workflow for resume building

简历注水流水线

套路拆解

我顺手翻了下作者的 GitHub 个人页,自称是 ZTE(中兴通讯)的工程师,做国产 NPU 推理引擎,从编译到运行时全栈

但是真要去给 vLLM、PyTorch、SGLang 这种顶级开源项目修真问题,门槛极高:

  • 得读懂几十万行 C++/CUDA/Python 代码

  • 得复现真实 bug,给出最小可复现样例

  • 得跑得起多卡集群验证

这门槛对绝大多数人都不友好,但「简历写上『vLLM core contributor,merged PR 』」这件事,对找工作(尤其是出海大模型岗)极具诱惑

于是这门生意就来了:

  1. 培训机构教你怎么扒 vLLM 的代码模式

  2. 找一处不痛不痒的逻辑分支,伪装成 bug

  3. 用 AI 写一段看起来很专业的 Purpose + Test Plan

  4. 声称在 H200 / 8×A100 上跑过 (反正 reviewer 没法验证)

  5. 等合并,截图发朋友圈,写进简历

低成本、低风险、高回报——直到撞上 vLLM 这种顶级项目的人肉举报

这件事的离谱之处

vLLM 这次发飙的真正原因,不是「合了一个错 PR」(毕竟 PR 真错了 revert 就行),而是:

❝ AI coding agents 让大批量低质量 PR 的生成成本无限趋近于 0,维护者却要花真金白银的时间去 review

一个 PR review 哪怕只花 maintainer 半小时,几百个这种「PR training 学员」一起冲,整个核心团队就被废了

更狠的一个数据:vLLM 现在每个月收到的 PR 已经过千,社区还在以指数增长

所以这次 vLLM 不仅把人 ban 了,还顺手挂出小红书的英文翻译——等于把整个产业链曝光给全世界看

给同行提个醒

这事儿对国内开发者的杀伤其实挺大的:

  • 简历上写过开源 contribution 的,未来招聘方会按图索骥去验证

  • 顶级项目对中文社区贡献者的信任度,被这帮人拉低了一档

  • 真有心做开源的同学,提 PR 反而会被怀疑「是不是又来注水的」

几句心里话

我自己也用 AI coding agent 干活,Claude Code、Codex、Cursor 切着用,效率确实是过去的几倍

但 AI 是放大器,放大你的真实能力,也放大你的水货含量

把 AI 当工具,去解决你真正遇到的问题,那是生产力革命

把 AI 当 PR 生成器,去骗简历骗 offer,那是把整个开源生态的信任资产烧给你自己取暖