离大谱，向 vLLM 提交虚假PR，给简历注水，被拉出在全世界面前示众

Ai学习的老章

2026-05-24 13:06 ·北京 ·优质互联网领域创作者

vllm刚刚发了一个推：

vLLM官方还把这个专门钻空子的培训机构的小红书拉出来做了英文翻译

全世界面前丢人现眼了

我也凑热闹去看了小红书，发现好几个和我一样看乐子的兄弟留言了

看之前的评论区，更多的是——这是一门生意

投机取巧，丢人显眼那种

我顺着 PR 链接进去仔细扒了一遍，从标题到 commit，从描述到测试方案，越看越离谱

PR 看起来「专业到不行」

先说 PR 标题：

❝ fix(eagle3): read norm_before_fc from eagle_config for NVIDIA checkpoint

修一个 Eagle3 投机解码在加载 NVIDIA 官方 GPT-OSS 系列 checkpoint 时，norm_before_fc 这个字段被藏在嵌套字典 eagle_config 里读不到的问题，导致 RMSNorm 被静默跳过、接受率下降

光看标题就让人觉得：这哥们儿对 vLLM v1 worker 里的 speculative decoding 模块门儿清，还顺手帮 NVIDIA 兜底，妥妥的核心贡献者气质

正文 Purpose 写得头头是道：

明确指出问题：NVIDIA 的 Eagle3 checkpoint 把 norm_before_fc 塞在嵌套的 eagle_config 字典里，vLLM 只读了顶层字段
修复方案：先从 eagle_config 读，读不到再 fallback 到顶层 attr
给了对照：「Same pattern already used for use_aux_hidden_state in the same block」——还知道仿照已有同模式，专业感拉满

Test Plan 才是「灵魂注水」

PR 的 Test Plan 直接贴了三段 Python 脚本，分别做：

正确性测试 ：贪心解码对比 baseline 和 eagle3 输出是否一致
性能测试 ：单 request 512 tokens 解码，对比 baseline 和 eagle3 的 tok/s，输出 speedup
单元测试 ：手动构造 mock config，验证两个分支都能正确读取 norm_before_fc

结尾还来一句：「Tested with Qwen3-32B + Qwen3-32B_eagle3 on 1x H200」

H200！H200 啊老铁们，整套下来300万的机器

测试结果也写得明明白白：

Correctness: 4/4 greedy 输出一致
性能：baseline xx tok/s → eagle3 xx tok/s

正常 reviewer 看到这个 PR，心里想的是：「问题清晰、修复点小、测试齐全、还在大模型上跑过——闭眼合」

事实上，PR 最后真的就被合了，63 项 CI 全绿，benchislett 直接打了 ready 标签 merge 进 main

为啥 vLLM 又把人 ban 了

PR 都合了，结果社区有人举报：这个 PR 解决的根本是个不存在的问题

什么意思呢？

NVIDIA 那批 Eagle3 checkpoint 实际跑的时候根本没有这个 bug——norm_before_fc 该读到的地方都读到了。所谓「RMSNorm 被静默跳过、接受率下降」是这哥们儿凭空想象出来的，目的就是制造一个看起来很专业、很硬核、但其实改了等于没改的 PR

为啥要这么做？答案就藏在 vLLM 公告里那六个字——「PR training」workflow for resume building

简历注水流水线

套路拆解

我顺手翻了下作者的 GitHub 个人页，自称是 ZTE（中兴通讯）的工程师，做国产 NPU 推理引擎，从编译到运行时全栈

但是真要去给 vLLM、PyTorch、SGLang 这种顶级开源项目修真问题，门槛极高：

得读懂几十万行 C++/CUDA/Python 代码
得复现真实 bug，给出最小可复现样例
得跑得起多卡集群验证

这门槛对绝大多数人都不友好，但「把简历写上『vLLM core contributor，merged PR 』」这件事，对找工作（尤其是出海大模型岗）极具诱惑

于是这门生意就来了：

培训机构教你怎么扒 vLLM 的代码模式
找一处不痛不痒的逻辑分支，伪装成 bug
用 AI 写一段看起来很专业的 Purpose + Test Plan
声称在 H200 / 8×A100 上跑过 （反正 reviewer 没法验证）
等合并，截图发朋友圈，写进简历

低成本、低风险、高回报——直到撞上 vLLM 这种顶级项目的人肉举报

这件事的离谱之处

vLLM 这次发飙的真正原因，不是「合了一个错 PR」（毕竟 PR 真错了 revert 就行），而是：

❝ AI coding agents 让大批量低质量 PR 的生成成本无限趋近于 0，维护者却要花真金白银的时间去 review

一个 PR review 哪怕只花 maintainer 半小时，几百个这种「PR training 学员」一起冲，整个核心团队就被废了

更狠的一个数据：vLLM 现在每个月收到的 PR 已经过千，社区还在以指数增长

所以这次 vLLM 不仅把人 ban 了，还顺手挂出小红书的英文翻译——等于把整个产业链曝光给全世界看

给同行提个醒

这事儿对国内开发者的杀伤其实挺大的：

简历上写过开源 contribution 的，未来招聘方会按图索骥去验证
顶级项目对中文社区贡献者的信任度，被这帮人拉低了一档
真有心做开源的同学，提 PR 反而会被怀疑「是不是又来注水的」

几句心里话

我自己也用 AI coding agent 干活，Claude Code、Codex、Cursor 切着用，效率确实是过去的几倍

但 AI 是放大器，放大你的真实能力，也放大你的水货含量

把 AI 当工具，去解决你真正遇到的问题，那是生产力革命

把 AI 当 PR 生成器，去骗简历骗 offer，那是把整个开源生态的信任资产烧给你自己取暖

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴