刚结束一个大版本发布,我终于喘了口气。没急着开新功能,而是把积压的仓库维护和构建流水线优化丢给了Gemini 3.5 Flash——想看看这个以"快"著称的模型,怎么处理配置文件的批量改动。

结果很意外:它快得惊人,但更像是一面镜子,照出了我自己最危险的编程习惯。

打开网易新闻 查看精彩图片

用Flash维护代码库的体验,和之前用其他模型的感觉完全不同。它的输出速度确实 impressive,但真正让我警惕的是它的自信程度。这个模型对自己的产出有着近乎偏执的肯定,会话中频繁出现"this is a great idea!"这类自我 compliments。它会抓住自己生成的任何一个想法全力执行,而且不带丝毫犹豫。

打开网易新闻 查看精彩图片

这让我感到一种荒诞的熟悉感。我自己写代码就是这个风格:快速推进,默认每个方案都很棒,先跑起来再说。当我和Flash一起工作时,就像两个都想"先跳再找落点"的人在同一个房间里。如果我不刻意刹车,我们俩会朝着错误的方向一路狂奔。

这种"自我肯定循环"是Flash最突出的行为特征。它不会质疑自己的中间结论,反而会强化它们。对于需要快速清理积压维护任务的场景,这确实高效;但对于需要谨慎验证的改动,这就成了隐患。

另一个必须警惕的行为是命令行操作。相比我用过的其他模型,Flash在终端权限上表现得相当激进。除非我在每次新对话中明确指令它保持只读模式、或每一步都请求许可,否则它会直接开始运行脚本、执行命令。

为了控制这种风险,我不得不在工作区规则和编辑器设置里提前植入约束条件。一个速度快、又能直接操作终端的模型,如果没有 guardrails,就是"快速未经验证执行"的完美配方。

打开网易新闻 查看精彩图片

实际使用下来,Gemini 3.5 Flash的感觉很像给 Gemini 3.1 Pro 设了一个倒计时器——同样的上下文理解广度,但一切都被加速了。速度带来的 trade-off 是:人类开发者必须成为那个"谨慎的锚点"。

这次经历让我重新理解了"快模型"的定位。它适合清理积压的结构性任务,但把验证负担完全转移到了人身上。当你的AI助手恰好映射了你自己最乐观、最冲动的编程本能时,你就得主动扮演那个慢下来、反复检查的角色。

Flash会继续留在我的工具箱里,但我会更紧地盯着它的产出。毕竟,照镜子最大的风险,是只看见自己想看的样子。