我以前以为,让AI代理表现更好,主要靠打磨提示词。写更长的指令、堆更多例子、加更多约束、把系统提示词调得更干净。这些都有用。但每天和编程代理、终端工作流、自动化工具打交道之后,我发现真正的突破点更简单:别让代理每次都重新摸索流程,直接给它一门"手艺"。
提示词告诉代理你想要什么。手艺教代理这项工作该怎么做。一旦脱离演示环境,这个区别就变得至关重要。
我见过的大部分代理失败,不是因为模型太笨,而是流程本身模糊不清。比如你说:"把这些视频处理成社交媒体格式。"模型大概能摸索出一条路径——可能调用FFmpeg,可能导出对格式,可能记得标准化音频,可能生成缩略图,可能给文件统一命名。但"可能"就是问题所在。如果工作本身重要,你不会想让代理每次都即兴发挥。你想要的是可重复的工作流。这就是手艺的价值。
给代理工具权限确实强大,但层级还是太低。"代理能运行FFmpeg"和"代理知道如何把原始素材转成1080x1920的短视频,包括剪掉片头、标准化音频、加水印、做缩略图、输出到固定文件夹"——前者是能力,后者是工作流。开发者常常低估这个差距,因为我们习惯在脑子里把工具串起来。代理需要你把这种串联写下来,不是因为它们不会推理,而是因为可重复的工作不该每次都依赖新鲜推理。
一门有用的手艺不只是脚本。它通常包括:什么时候用、什么时候不用、需要什么工具、预期输入是什么、分步工作流、默认设置、失败情况怎么处理、输出格式、验证步骤。换句话说,手艺把判断打包了,把团队里的隐性知识变成代理能复用的东西。好的手艺会说:这类任务用这个模式,避开这些坑,做完后检查这些输出。
这比再写一段模糊的提示词建议有价值得多。举个例子:我要批量处理20条短视频。没手艺的话,我得提示:"用FFmpeg剪辑、标准化音频、改成竖屏、加水印、导出MP4、做缩略图。"这次可能能跑通,但下次代理可能换不同的参数,漏掉边界情况,或者文件命名风格变了。有了手艺,工作流就稳定了——安装FFmpeg手艺包,代理就有了媒体转换、剪辑、音频处理、批量操作的固定模式。手艺没让FFmpeg变强,它让代理不再随机发挥。
热门跟贴