vllm刚刚发了一个推:
vLLM官方还把这个专门钻空子的培训机构的小红书拉出来做了英文翻译
全世界面前丢人现眼了
我也凑热闹去看了小红书,发现好几个和我一样看乐子的兄弟留言了
看之前的评论区,更多的是——这是一门生意
投机取巧,丢人显眼那种
我顺着 PR 链接进去仔细扒了一遍,从标题到 commit,从描述到测试方案,越看越离谱
PR 看起来「专业到不行」
先说 PR 标题:
❝ fix(eagle3): read norm_before_fc from eagle_config for NVIDIA checkpoint
修一个 Eagle3 投机解码在加载 NVIDIA 官方 GPT-OSS 系列 checkpoint 时,norm_before_fc 这个字段被藏在嵌套字典 eagle_config 里读不到的问题,导致 RMSNorm 被静默跳过、接受率下降
光看标题就让人觉得:这哥们儿对 vLLM v1 worker 里的 speculative decoding 模块门儿清,还顺手帮 NVIDIA 兜底,妥妥的核心贡献者气质
正文 Purpose 写得头头是道:
明确指出问题:NVIDIA 的 Eagle3 checkpoint 把
norm_before_fc塞在嵌套的eagle_config字典里,vLLM 只读了顶层字段修复方案:先从
eagle_config读,读不到再 fallback 到顶层 attr给了对照:「Same pattern already used for
use_aux_hidden_statein the same block」——还知道仿照已有同模式,专业感拉满
PR 的 Test Plan 直接贴了三段 Python 脚本,分别做:
正确性测试 :贪心解码对比 baseline 和 eagle3 输出是否一致
性能测试 :单 request 512 tokens 解码,对比 baseline 和 eagle3 的 tok/s,输出 speedup
单元测试 :手动构造 mock config,验证两个分支都能正确读取
norm_before_fc
结尾还来一句:「Tested with Qwen3-32B + Qwen3-32B_eagle3 on 1x H200」
H200!H200 啊老铁们,整套下来300万的机器
测试结果也写得明明白白:
Correctness: 4/4 greedy 输出一致
性能:baseline xx tok/s → eagle3 xx tok/s
正常 reviewer 看到这个 PR,心里想的是:「问题清晰、修复点小、测试齐全、还在大模型上跑过——闭眼合」
事实上,PR 最后真的就被合了,63 项 CI 全绿,benchislett 直接打了 ready 标签 merge 进 main
为啥 vLLM 又把人 ban 了
PR 都合了,结果社区有人举报:这个 PR 解决的根本是个不存在的问题
什么意思呢?
NVIDIA 那批 Eagle3 checkpoint 实际跑的时候根本没有这个 bug——norm_before_fc 该读到的地方都读到了。所谓「RMSNorm 被静默跳过、接受率下降」是这哥们儿凭空想象出来的,目的就是制造一个看起来很专业、很硬核、但其实改了等于没改的 PR
为啥要这么做?答案就藏在 vLLM 公告里那六个字——「PR training」workflow for resume building
简历注水流水线
套路拆解
我顺手翻了下作者的 GitHub 个人页,自称是 ZTE(中兴通讯)的工程师,做国产 NPU 推理引擎,从编译到运行时全栈
但是真要去给 vLLM、PyTorch、SGLang 这种顶级开源项目修真问题,门槛极高:
得读懂几十万行 C++/CUDA/Python 代码
得复现真实 bug,给出最小可复现样例
得跑得起多卡集群验证
这门槛对绝大多数人都不友好,但「把简历写上『vLLM core contributor,merged PR 』」这件事,对找工作(尤其是出海大模型岗)极具诱惑
于是这门生意就来了:
培训机构教你怎么扒 vLLM 的代码模式
找一处不痛不痒的逻辑分支,伪装成 bug
用 AI 写一段看起来很专业的 Purpose + Test Plan
声称在 H200 / 8×A100 上跑过 (反正 reviewer 没法验证)
等合并,截图发朋友圈,写进简历
低成本、低风险、高回报——直到撞上 vLLM 这种顶级项目的人肉举报
这件事的离谱之处
vLLM 这次发飙的真正原因,不是「合了一个错 PR」(毕竟 PR 真错了 revert 就行),而是:
❝ AI coding agents 让大批量低质量 PR 的生成成本无限趋近于 0,维护者却要花真金白银的时间去 review
一个 PR review 哪怕只花 maintainer 半小时,几百个这种「PR training 学员」一起冲,整个核心团队就被废了
更狠的一个数据:vLLM 现在每个月收到的 PR 已经过千,社区还在以指数增长
所以这次 vLLM 不仅把人 ban 了,还顺手挂出小红书的英文翻译——等于把整个产业链曝光给全世界看
给同行提个醒
这事儿对国内开发者的杀伤其实挺大的:
简历上写过开源 contribution 的,未来招聘方会按图索骥去验证
顶级项目对中文社区贡献者的信任度,被这帮人拉低了一档
真有心做开源的同学,提 PR 反而会被怀疑「是不是又来注水的」
我自己也用 AI coding agent 干活,Claude Code、Codex、Cursor 切着用,效率确实是过去的几倍
但 AI 是放大器,放大你的真实能力,也放大你的水货含量
把 AI 当工具,去解决你真正遇到的问题,那是生产力革命
把 AI 当 PR 生成器,去骗简历骗 offer,那是把整个开源生态的信任资产烧给你自己取暖
热门跟贴