功能做完了,一切运行正常。我打开浏览器,盯着页面看了很久——能用,但总觉得哪里不对。

于是我做了件顺理成章的事:让AI帮忙调样式。

打开网易新闻 查看精彩图片

然后事情变得诡异起来。

写功能的时候,AI和我配合默契。"给这个按钮加个加载状态"——搞定。"提交前验证表单"——搞定。我们有一种节奏。

但一到UI反馈环节,节奏就断了。

"这个交互不够友好,用户找不到主操作。"AI回复:"明白,我来优化。"它改了一些东西,但不是我要的。我又试:"整体流程太糙了,用户会卡在这里。"又是一轮修改,还是不对。

脑子里还绷着一根弦:它会不会在调样式的时候,不小心把功能改坏了?

这事我折腾了好几周。20多轮修改。UI始终像模板里套出来的,千篇一律。我一直以为是自己提示词写得不够好。

我错了。

首先,得搞清楚"好看"到底是什么意思

诊断问题之前,我得先停下来问自己:我说"好看一点",到底在指什么?

结果发现,"让它更好看"根本不是一条指令——它至少指向三个完全不同的层面:

感知层——用户第一眼注意到什么?视线落在哪里?这涉及对比度、视觉权重、色彩层级、空间密度。"用户找不到主操作"通常是感知层的问题:主要动作没在视觉上和次要元素区分开。

交互层——用户操作时有没有反馈?步骤之间是否连贯?这是反馈状态、过渡动画、确认时刻。"流程太糙"通常是交互层的问题:点击没响应、状态跳变太突兀、下一步不清楚。

一致性层——整个界面是否像在说同一种语言?统一的圆角、连贯的色彩逻辑、可预期的间距节奏。这层崩了的时候,用户不会说"不一致",而是说"感觉廉价"或"哪里怪怪的"——但说不出具体是什么。

这三层是堆叠的。感知层是地基,一致性层是屋顶。当我告诉AI"整体感觉不好"时,它根本不知道我指的是哪一层——所以只能猜,而且经常猜错。

提示词具体化有用,但有限度

面对"AI听不懂模糊指令"这个问题,自然的反应是:写得更具体。

不说"让它更好看",改说"把主按钮和背景的对比度提升到满足WCAG AA标准"。不说"让流程更顺滑",改说"在这两个状态之间加200毫秒的ease-out过渡"。

这确实有效,明显改善。但带来了没预料到的新问题。

设计决策有不同层级

• 全局决策:主品牌色是什么?字体层级怎么定?

• 区域决策:这个表单区块的视觉重点在哪里?

• 微观决策:这个按钮的hover状态持续多久?

当我给AI具体的微观指令时,它执行得很漂亮。但问题在于——这些微观决策本应由上层决策推导而来。我跳过了"为什么",直接给了"做什么",结果得到的是孤立的优化,彼此割裂。

更麻烦的是,具体化提示词极其消耗认知。我得先自己诊断出问题在哪一层,再把它翻译成AI能执行的精确描述。这工作量,已经接近我自己动手改了。

AI的修改是并行的,不是递进的

人类设计师改UI有个隐性过程:先看整体,锁定最刺眼的那个问题,改掉,再看整体,再找下一个。是串行的、有优先级的。

AI不一样。你给它20条反馈,它20条同时处理。结果往往是:每条都"优化"了,但整体依然不协调——因为真正的症结可能是第3条,但AI把资源平均分配给了全部20条。

我试过只给一条反馈。有效,但效率太低。20轮就是这么攒出来的。

真正的问题:我没有视觉标准

绕了一大圈,我意识到核心矛盾不在提示词技巧,而在一个更基础的事实:我自己对"好UI"的标准是模糊的。

我能说出"不对",但说不清"怎样才对"。AI不是读不懂我的提示词——是我的提示词本身就不包含足够的信息密度。

这有点像让一个没有乐理知识的人描述"这段旋律哪里不好"。只能说"感觉不对",但给不出"这里该用减七和弦"这种可执行的指令。

后来我换了个策略:不再让AI"优化UI",而是让它帮我建立判断标准。比如"列出这个界面中可能违反感知层级原则的3个问题",或者"对比这两个方案,从交互反馈角度分析差异"。

这反而更有用。AI作为"视觉分析工具"的表现,远好于作为"视觉执行工具"。

最后的界面是我自己调的

20多轮之后,我关掉了AI对话框,花了两个小时手动改完了。

不是AI不能用。是在"审美判断"这个领域,当前AI的运作模式——概率化的、并行的、缺乏层级理解的——和人类设计师的串行、优先级驱动的思维方式,存在结构性错配。

我之前的假设是:提示词工程能解决一切。实际学到的是:有些差距不是表达问题,是认知架构问题。

现在我的 workflow 分成了两段:功能实现阶段,AI是主力;UI打磨阶段,AI降级为参考工具,决策权收回。

这可能不是最优解,但至少不再假装问题不存在了。