这个程序员用AI写了3万行代码，用户却以为他偷懒了|代码|工作流|电子表格|知名企业|程序员|编程|谷歌

Claude Code（Anthropic公司推出的AI编程助手）上线8个月，有人拿它写了个完整应用，用户反馈是"终于不像半成品了"。

这话听着像骂人，其实是夸。Parker Klein做的笔记应用Twos，最近刚发了个大版本更新，从界面到交互全翻新。老用户的第一反应不是"加了什么新功能"，而是"这App终于完工了"。

Klein自己说的：「整个新版本都是用Claude Code写的。」3万行代码，AI生成。他以前在Google干过，出来做独立开发， Twos折腾了两年多，设计一直是短板。这次干脆把短板外包给AI，结果反而对了。

Twos的定位很怪：它想做你所有清单的终点站。

待办事项、购物清单、随想笔记、会议记录、甚至"这周要追的剧"——全塞一个App里。Klein的逻辑是：人脑不分"任务"和"笔记"，想到什么记什么，回头再整理。所以Twos的界面就一页，上面是日历，下面是输入框，输入的东西自动带时间戳，以后按日期翻就行。

这个设计哲学叫"捕捉优先，分类靠后"。跟Notion的"先搭框架再填内容"反着来。Notion适合项目制工作，Twos适合碎片化生活。Klein的原话是：「你的大脑不像数据库，它像一条河。」

但河不能是浑的。老版Twos的问题就是太"河"了——功能堆得多，视觉没主心骨。按钮大小不一，配色忽冷忽热，列表和日历像两个App硬拼在一起。用户能忍，是因为核心流程确实顺，但"半成品"的吐槽从没停过。

AI写代码，人做判断

Claude Code不是让Klein当甩手掌柜。他的工作流是：先写一段自然语言描述，比如"做一个周视图，能左右滑动切换周，每天显示前三个任务"，AI生成代码，他跑一遍，不对的地方再描述，再生成。

关键在这：Klein要判断"什么是对的"。AI能写一百种周视图，但只有他知道Twos用户要的是"扫一眼就知道今天忙不忙"，不是"精确到小时的甘特图"。这种产品直觉，AI替不了。

新版的改动清单很长，但核心就三条：统一了视觉语言（圆角、间距、配色全规范化了）、强化了"今天"的存在感（打开App默认看今天，不是看日历网格）、优化了空状态（没内容的时候不显示空白，而是给引导）。

全是设计决策，不是技术难题。Klein说，以前他得先学SwiftUI的某个API，再试错，再调整。现在跳过中间步骤，直接到"调效果"环节。开发周期从几个月压到几周。

但有个坑他没踩：没让AI碰数据层。

Twos的同步逻辑、离线存储、冲突解决，全是Klein手写。AI写界面，人写引擎。他的理由是：「界面写坏了，用户骂一句还能改。数据写坏了，用户就跑了。」

这个分工很聪明。AI擅长生成"有明确对错"的代码——布局对不对、动画顺不顺，一眼能看出来。数据同步是"没有标准答案"的问题，得理解业务场景、用户习惯、甚至网络环境的极端情况，AI容易想当然。

"Vibe Coding"的第一次正经交付

AI圈最近有个词叫"Vibe Coding"（氛围编程），意思是开发者描述个大概感觉，AI负责实现，人只管" vibe对不对"。这个词带点调侃，暗示代码质量不重要，感觉对了就行。

Klein这次算是Vibe Coding的正经案例——不是做着玩的，是商业产品的核心版本。3万行代码，用户付费订阅，得长期维护。他证明了一件事：Vibe Coding能产出"感觉对了"的东西，但前提是人对"对的感觉"有准确定义。

Twos的新设计有个细节：任务前面的复选框，选中之后不是简单打勾，而是有个小动画，框慢慢填满，然后任务文字变淡、下沉。这个"完成感"的反馈，是Klein跟AI反复调了七八版才定的。

AI能写动画代码，但写不出"让用户觉得爽"的动画。Klein得试：太快了像Bug，太慢了拖沓；线性匀速太机械，缓出曲线又太腻。最后定了个0.3秒的弹性曲线，他自己说「有点像关门时的阻尼感，知道事情结束了，但不 abrupt（突兀）」。

这种颗粒度的打磨，Vibe Coding做不到全自动。AI是杠杆，放大的是人的判断力，不是替代判断。

独立开发的生存公式变了

Klein的背景值得细说。Google干了四年，做Google Assistant的产品经理，2019年出来创业，先做了一款叫"Mindful"的冥想App，没成。2021年转做Twos，个人项目，没融资，靠订阅活着。

这种路径在硅谷很典型：大厂镀层金，出来单干，赌一个产品idea。但以前的大瓶颈是：产品经理懂需求，不懂实现；工程师懂实现，不懂设计。一个人要做完"需求-设计-代码-运营"全链条，要么得是全才，要么得有钱请人。

AI抹掉了一部分门槛。Klein不会画图标，Claude Code能生成；他不懂高级动画，AI能写。他只需要知道"好设计长什么样"，不需要知道"怎么做出好设计"。

但这个"只需要"其实很难。大多数人说不清"好设计"是什么，只能凭感觉说"舒服"或"别扭"。Klein的优势是：在Google做过产品，见过足够多的"好"，能把这个感觉翻译成AI听得懂的指令。

Twos的新版上线一周，App Store评分从4.3涨到4.6。评论里高频出现的词是"polished"（精致）、"finally"（终于）、"worth paying for"（值得付费）。没人提AI，没人关心代码谁写的。

这就是产品层面的成功：用户感知到价值，不关心生产成本。

AI编程工具的隐性成本

但不是所有人都像Klein这么顺。The Verge的编辑David Pierce在同一期Newsletter里提到，他自己也在用Claude Code"vibe-code"东西，但"第一次做出能用的东西"之前，失败了无数次。

Pierce的观察是：AI让"从0到1"变容易了，但"从1到能用"还是难。他做了个小工具，能用的标准是"我自己愿意每天用"，结果前几个版本要么逻辑有漏洞，要么交互反人类，要么代码结构乱到没法改。

Klein能成，有个前提条件：Twos的底层架构是他手写的，AI只在表层改动。Pierce是从零开始全交给AI，地基不稳，上面盖什么都晃。

这引出一个实际问题：Vibe Coding的适用范围是什么？

目前看，最适合的场景是"有明确界面的工具型产品"——笔记、清单、计算器、简单的小游戏。用户路径短，状态少，AI不容易搞混。复杂的业务系统、多角色协作平台、需要精密数据一致性的应用，AI还扛不住。

另一个限制是维护。Klein的3万行AI代码，以后要改怎么办？他说现在的策略是：小改动继续用AI，大重构再评估。但"小"和"大"的边界很模糊，只能靠经验判断。

有个风险他没说：如果Claude Code的下个版本改了代码风格，或者Klein想换工具，这3万行代码的迁移成本谁承担？AI生成的代码往往"能跑但难读"，耦合度高，不像人写的那么模块化。

Twos的商业模式也很有意思。

基础功能免费，高级功能订阅制，年费30美元。在笔记工具里算便宜的，Notion个人版年费96美元，Roam Research 165美元。Klein的定价逻辑是：Twos不是工作工具，是生活工具，用户付费意愿本来就更低，得靠量取胜。

但"生活工具"的市场很难打。手机自带的备忘录、提醒事项已经覆盖了80%场景，Twos要争的是那20%的"进阶用户"——对效率有执念、愿意为多一点的灵活性付费。

这类用户挑剔，对设计敏感，对价格却不敏感。Klein以前的设计短板，恰好卡在这个群体的痛点上。新版解决的是"配得上用户的挑剔"，不是"吸引新用户"。

从数据看，这个策略有效。版本更新后，日活没暴涨，但付费转化率提了12%。老用户升级，比拉新便宜多了。

一个反直觉的行业信号

Twos的案例有个副作用：它让"独立开发者用AI"这件事，从"实验性"变成了"可预期"。

以前投资人看单人创业项目，默认天花板低——一个人能做的事有限。现在得重新算：如果AI能替代1-2个全职工程师，单人项目的产出预期要上调。

但硬币另一面是竞争加剧。门槛降低，意味着更多人进来，同质化更严重。Twos的差异化是Klein的产品直觉，不是技术壁垒。这个直觉能守多久？

笔记工具的市场格局正在重组。Notion往"All-in-one workspace"走，越做越重；Apple Notes靠系统级整合守基本盘；新玩家像Capacities、Anytype打"本地优先""隐私牌"。Twos的位置是"轻量、日期驱动、捕捉优先"，这个定位够独特，但市场规模有限。

Klein的下一步计划是：加强协作功能，但不做实时协作，做"异步共享"——比如把某天的笔记生成链接发给别人，对方能看能评论，不需要注册。这个设计延续了Twos的"低摩擦"哲学，也避开了和Notion正面打。

他还有个想法是做"回顾"功能，自动整理过去某段时间的内容，生成摘要。这需要AI理解笔记内容，Twos目前没做，因为Klein担心隐私——用户的生活碎片，他不想碰。

这个克制很少见。大多数笔记工具现在都在加AI摘要、智能标签，Twos反而强调"我们不读你的内容"。这是差异化，也是限制：功能天花板肉眼可见。

回到那个核心问题：AI到底改变了什么？

Klein的答案是：改变了"完成"的定义。以前"完成一个功能"意味着设计、编码、测试、上线，周期以月计。现在"完成"可以指"描述清楚需求，AI生成能跑的版本"，周期以天计。

但这个加速是有代价的。快速迭代容易让人沉迷"做新东西"，忘记"维护旧东西"。Twos的老用户有个抱怨：新版虽然好看，但之前提的某个小功能请求（比如支持Markdown表格）还是没做。Klein的优先级被"重做界面"占满了。

这是AI时代的经典困境：生产能力过剩，决策能力稀缺。能做什么不再是问题，该做什么才是。

Pierce在Newsletter结尾说，他这周还在"fine-tuning the first vibe-coded thing I've ever made that's actually any good"（微调他第一个真正好用的Vibe Coding作品）。这句话的时态很有意思："actually any good"是完成时，"fine-tuning"是现在进行时——好用的标准是动态的，今天够用，明天可能就不够。

Twos的新版本能撑多久的好评？Klein没给数字，但他说了另一件事：Claude Code的订阅费，每月20美元，比Twos的高级会员还便宜。这笔账怎么算，他也没想明白。

如果AI编程工具的价格继续跌，独立开发者的成本结构要重写。但现在的问题是：当所有人都能3周做个App，什么决定了谁能活到第4周？