让AI改了20多版UI后，我发现问题不在提示词

算力游侠

2026-05-27 00:57 ·北京

功能做完了，一切运行正常。我打开浏览器，盯着页面看了很久——能用，但总觉得哪里不对。

于是我做了件顺理成章的事：让AI帮忙调样式。

然后事情变得诡异起来。

写功能的时候，AI和我配合默契。"给这个按钮加个加载状态"——搞定。"提交前验证表单"——搞定。我们有一种节奏。

但一到UI反馈环节，节奏就断了。

"这个交互不够友好，用户找不到主操作。"AI回复："明白，我来优化。"它改了一些东西，但不是我要的。我又试："整体流程太糙了，用户会卡在这里。"又是一轮修改，还是不对。

脑子里还绷着一根弦：它会不会在调样式的时候，不小心把功能改坏了？

这事我折腾了好几周。20多轮修改。UI始终像模板里套出来的，千篇一律。我一直以为是自己提示词写得不够好。

我错了。

首先，得搞清楚"好看"到底是什么意思

诊断问题之前，我得先停下来问自己：我说"好看一点"，到底在指什么？

结果发现，"让它更好看"根本不是一条指令——它至少指向三个完全不同的层面：

感知层——用户第一眼注意到什么？视线落在哪里？这涉及对比度、视觉权重、色彩层级、空间密度。"用户找不到主操作"通常是感知层的问题：主要动作没在视觉上和次要元素区分开。

交互层——用户操作时有没有反馈？步骤之间是否连贯？这是反馈状态、过渡动画、确认时刻。"流程太糙"通常是交互层的问题：点击没响应、状态跳变太突兀、下一步不清楚。

一致性层——整个界面是否像在说同一种语言？统一的圆角、连贯的色彩逻辑、可预期的间距节奏。这层崩了的时候，用户不会说"不一致"，而是说"感觉廉价"或"哪里怪怪的"——但说不出具体是什么。

这三层是堆叠的。感知层是地基，一致性层是屋顶。当我告诉AI"整体感觉不好"时，它根本不知道我指的是哪一层——所以只能猜，而且经常猜错。

提示词具体化有用，但有限度

面对"AI听不懂模糊指令"这个问题，自然的反应是：写得更具体。

不说"让它更好看"，改说"把主按钮和背景的对比度提升到满足WCAG AA标准"。不说"让流程更顺滑"，改说"在这两个状态之间加200毫秒的ease-out过渡"。

这确实有效，明显改善。但带来了没预料到的新问题。

设计决策有不同层级：

• 全局决策：主品牌色是什么？字体层级怎么定？

• 区域决策：这个表单区块的视觉重点在哪里？

• 微观决策：这个按钮的hover状态持续多久？

当我给AI具体的微观指令时，它执行得很漂亮。但问题在于——这些微观决策本应由上层决策推导而来。我跳过了"为什么"，直接给了"做什么"，结果得到的是孤立的优化，彼此割裂。

更麻烦的是，具体化提示词极其消耗认知。我得先自己诊断出问题在哪一层，再把它翻译成AI能执行的精确描述。这工作量，已经接近我自己动手改了。

AI的修改是并行的，不是递进的

人类设计师改UI有个隐性过程：先看整体，锁定最刺眼的那个问题，改掉，再看整体，再找下一个。是串行的、有优先级的。

AI不一样。你给它20条反馈，它20条同时处理。结果往往是：每条都"优化"了，但整体依然不协调——因为真正的症结可能是第3条，但AI把资源平均分配给了全部20条。

我试过只给一条反馈。有效，但效率太低。20轮就是这么攒出来的。

真正的问题：我没有视觉标准

绕了一大圈，我意识到核心矛盾不在提示词技巧，而在一个更基础的事实：我自己对"好UI"的标准是模糊的。

我能说出"不对"，但说不清"怎样才对"。AI不是读不懂我的提示词——是我的提示词本身就不包含足够的信息密度。

这有点像让一个没有乐理知识的人描述"这段旋律哪里不好"。只能说"感觉不对"，但给不出"这里该用减七和弦"这种可执行的指令。

后来我换了个策略：不再让AI"优化UI"，而是让它帮我建立判断标准。比如"列出这个界面中可能违反感知层级原则的3个问题"，或者"对比这两个方案，从交互反馈角度分析差异"。

这反而更有用。AI作为"视觉分析工具"的表现，远好于作为"视觉执行工具"。

最后的界面是我自己调的

20多轮之后，我关掉了AI对话框，花了两个小时手动改完了。

不是AI不能用。是在"审美判断"这个领域，当前AI的运作模式——概率化的、并行的、缺乏层级理解的——和人类设计师的串行、优先级驱动的思维方式，存在结构性错配。

我之前的假设是：提示词工程能解决一切。实际学到的是：有些差距不是表达问题，是认知架构问题。

现在我的 workflow 分成了两段：功能实现阶段，AI是主力；UI打磨阶段，AI降级为参考工具，决策权收回。

这可能不是最优解，但至少不再假装问题不存在了。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴