别再给AI塞提示词了，教它"手艺"更管用|ffmpeg|工作流|手艺|缩略图

我以前以为，让AI代理表现更好，主要靠打磨提示词。写更长的指令、堆更多例子、加更多约束、把系统提示词调得更干净。这些都有用。但每天和编程代理、终端工作流、自动化工具打交道之后，我发现真正的突破点更简单：别让代理每次都重新摸索流程，直接给它一门"手艺"。

提示词告诉代理你想要什么。手艺教代理这项工作该怎么做。一旦脱离演示环境，这个区别就变得至关重要。

我见过的大部分代理失败，不是因为模型太笨，而是流程本身模糊不清。比如你说："把这些视频处理成社交媒体格式。"模型大概能摸索出一条路径——可能调用FFmpeg，可能导出对格式，可能记得标准化音频，可能生成缩略图，可能给文件统一命名。但"可能"就是问题所在。如果工作本身重要，你不会想让代理每次都即兴发挥。你想要的是可重复的工作流。这就是手艺的价值。

给代理工具权限确实强大，但层级还是太低。"代理能运行FFmpeg"和"代理知道如何把原始素材转成1080x1920的短视频，包括剪掉片头、标准化音频、加水印、做缩略图、输出到固定文件夹"——前者是能力，后者是工作流。开发者常常低估这个差距，因为我们习惯在脑子里把工具串起来。代理需要你把这种串联写下来，不是因为它们不会推理，而是因为可重复的工作不该每次都依赖新鲜推理。

一门有用的手艺不只是脚本。它通常包括：什么时候用、什么时候不用、需要什么工具、预期输入是什么、分步工作流、默认设置、失败情况怎么处理、输出格式、验证步骤。换句话说，手艺把判断打包了，把团队里的隐性知识变成代理能复用的东西。好的手艺会说：这类任务用这个模式，避开这些坑，做完后检查这些输出。

这比再写一段模糊的提示词建议有价值得多。举个例子：我要批量处理20条短视频。没手艺的话，我得提示："用FFmpeg剪辑、标准化音频、改成竖屏、加水印、导出MP4、做缩略图。"这次可能能跑通，但下次代理可能换不同的参数，漏掉边界情况，或者文件命名风格变了。有了手艺，工作流就稳定了——安装FFmpeg手艺包，代理就有了媒体转换、剪辑、音频处理、批量操作的固定模式。手艺没让FFmpeg变强，它让代理不再随机发挥。