Claude Code(Anthropic公司推出的AI编程助手)上线8个月,有人拿它写了个完整应用,用户反馈是"终于不像半成品了"。
这话听着像骂人,其实是夸。Parker Klein做的笔记应用Twos,最近刚发了个大版本更新,从界面到交互全翻新。老用户的第一反应不是"加了什么新功能",而是"这App终于完工了"。
Klein自己说的:「整个新版本都是用Claude Code写的。」3万行代码,AI生成。他以前在Google干过,出来做独立开发, Twos折腾了两年多,设计一直是短板。这次干脆把短板外包给AI,结果反而对了。
Twos的定位很怪:它想做你所有清单的终点站。
待办事项、购物清单、随想笔记、会议记录、甚至"这周要追的剧"——全塞一个App里。Klein的逻辑是:人脑不分"任务"和"笔记",想到什么记什么,回头再整理。所以Twos的界面就一页,上面是日历,下面是输入框,输入的东西自动带时间戳,以后按日期翻就行。
这个设计哲学叫"捕捉优先,分类靠后"。跟Notion的"先搭框架再填内容"反着来。Notion适合项目制工作,Twos适合碎片化生活。Klein的原话是:「你的大脑不像数据库,它像一条河。」
但河不能是浑的。老版Twos的问题就是太"河"了——功能堆得多,视觉没主心骨。按钮大小不一,配色忽冷忽热,列表和日历像两个App硬拼在一起。用户能忍,是因为核心流程确实顺,但"半成品"的吐槽从没停过。
AI写代码,人做判断
Claude Code不是让Klein当甩手掌柜。他的工作流是:先写一段自然语言描述,比如"做一个周视图,能左右滑动切换周,每天显示前三个任务",AI生成代码,他跑一遍,不对的地方再描述,再生成。
关键在这:Klein要判断"什么是对的"。AI能写一百种周视图,但只有他知道Twos用户要的是"扫一眼就知道今天忙不忙",不是"精确到小时的甘特图"。这种产品直觉,AI替不了。
新版的改动清单很长,但核心就三条:统一了视觉语言(圆角、间距、配色全规范化了)、强化了"今天"的存在感(打开App默认看今天,不是看日历网格)、优化了空状态(没内容的时候不显示空白,而是给引导)。
全是设计决策,不是技术难题。Klein说,以前他得先学SwiftUI的某个API,再试错,再调整。现在跳过中间步骤,直接到"调效果"环节。开发周期从几个月压到几周。
但有个坑他没踩:没让AI碰数据层。
Twos的同步逻辑、离线存储、冲突解决,全是Klein手写。AI写界面,人写引擎。他的理由是:「界面写坏了,用户骂一句还能改。数据写坏了,用户就跑了。」
这个分工很聪明。AI擅长生成"有明确对错"的代码——布局对不对、动画顺不顺,一眼能看出来。数据同步是"没有标准答案"的问题,得理解业务场景、用户习惯、甚至网络环境的极端情况,AI容易想当然。
"Vibe Coding"的第一次正经交付
AI圈最近有个词叫"Vibe Coding"(氛围编程),意思是开发者描述个大概感觉,AI负责实现,人只管" vibe对不对"。这个词带点调侃,暗示代码质量不重要,感觉对了就行。
Klein这次算是Vibe Coding的正经案例——不是做着玩的,是商业产品的核心版本。3万行代码,用户付费订阅,得长期维护。他证明了一件事:Vibe Coding能产出"感觉对了"的东西,但前提是人对"对的感觉"有准确定义。
Twos的新设计有个细节:任务前面的复选框,选中之后不是简单打勾,而是有个小动画,框慢慢填满,然后任务文字变淡、下沉。这个"完成感"的反馈,是Klein跟AI反复调了七八版才定的。
AI能写动画代码,但写不出"让用户觉得爽"的动画。Klein得试:太快了像Bug,太慢了拖沓;线性匀速太机械,缓出曲线又太腻。最后定了个0.3秒的弹性曲线,他自己说「有点像关门时的阻尼感,知道事情结束了,但不 abrupt(突兀)」。
这种颗粒度的打磨,Vibe Coding做不到全自动。AI是杠杆,放大的是人的判断力,不是替代判断。
独立开发的生存公式变了
Klein的背景值得细说。Google干了四年,做Google Assistant的产品经理,2019年出来创业,先做了一款叫"Mindful"的冥想App,没成。2021年转做Twos,个人项目,没融资,靠订阅活着。
这种路径在硅谷很典型:大厂镀层金,出来单干,赌一个产品idea。但以前的大瓶颈是:产品经理懂需求,不懂实现;工程师懂实现,不懂设计。一个人要做完"需求-设计-代码-运营"全链条,要么得是全才,要么得有钱请人。
AI抹掉了一部分门槛。Klein不会画图标,Claude Code能生成;他不懂高级动画,AI能写。他只需要知道"好设计长什么样",不需要知道"怎么做出好设计"。
但这个"只需要"其实很难。大多数人说不清"好设计"是什么,只能凭感觉说"舒服"或"别扭"。Klein的优势是:在Google做过产品,见过足够多的"好",能把这个感觉翻译成AI听得懂的指令。
Twos的新版上线一周,App Store评分从4.3涨到4.6。评论里高频出现的词是"polished"(精致)、"finally"(终于)、"worth paying for"(值得付费)。没人提AI,没人关心代码谁写的。
这就是产品层面的成功:用户感知到价值,不关心生产成本。
AI编程工具的隐性成本
但不是所有人都像Klein这么顺。The Verge的编辑David Pierce在同一期Newsletter里提到,他自己也在用Claude Code"vibe-code"东西,但"第一次做出能用的东西"之前,失败了无数次。
Pierce的观察是:AI让"从0到1"变容易了,但"从1到能用"还是难。他做了个小工具,能用的标准是"我自己愿意每天用",结果前几个版本要么逻辑有漏洞,要么交互反人类,要么代码结构乱到没法改。
Klein能成,有个前提条件:Twos的底层架构是他手写的,AI只在表层改动。Pierce是从零开始全交给AI,地基不稳,上面盖什么都晃。
这引出一个实际问题:Vibe Coding的适用范围是什么?
目前看,最适合的场景是"有明确界面的工具型产品"——笔记、清单、计算器、简单的小游戏。用户路径短,状态少,AI不容易搞混。复杂的业务系统、多角色协作平台、需要精密数据一致性的应用,AI还扛不住。
另一个限制是维护。Klein的3万行AI代码,以后要改怎么办?他说现在的策略是:小改动继续用AI,大重构再评估。但"小"和"大"的边界很模糊,只能靠经验判断。
有个风险他没说:如果Claude Code的下个版本改了代码风格,或者Klein想换工具,这3万行代码的迁移成本谁承担?AI生成的代码往往"能跑但难读",耦合度高,不像人写的那么模块化。
Twos的商业模式也很有意思。
基础功能免费,高级功能订阅制,年费30美元。在笔记工具里算便宜的,Notion个人版年费96美元,Roam Research 165美元。Klein的定价逻辑是:Twos不是工作工具,是生活工具,用户付费意愿本来就更低,得靠量取胜。
但"生活工具"的市场很难打。手机自带的备忘录、提醒事项已经覆盖了80%场景,Twos要争的是那20%的"进阶用户"——对效率有执念、愿意为多一点的灵活性付费。
这类用户挑剔,对设计敏感,对价格却不敏感。Klein以前的设计短板,恰好卡在这个群体的痛点上。新版解决的是"配得上用户的挑剔",不是"吸引新用户"。
从数据看,这个策略有效。版本更新后,日活没暴涨,但付费转化率提了12%。老用户升级,比拉新便宜多了。
一个反直觉的行业信号
Twos的案例有个副作用:它让"独立开发者用AI"这件事,从"实验性"变成了"可预期"。
以前投资人看单人创业项目,默认天花板低——一个人能做的事有限。现在得重新算:如果AI能替代1-2个全职工程师,单人项目的产出预期要上调。
但硬币另一面是竞争加剧。门槛降低,意味着更多人进来,同质化更严重。Twos的差异化是Klein的产品直觉,不是技术壁垒。这个直觉能守多久?
笔记工具的市场格局正在重组。Notion往"All-in-one workspace"走,越做越重;Apple Notes靠系统级整合守基本盘;新玩家像Capacities、Anytype打"本地优先""隐私牌"。Twos的位置是"轻量、日期驱动、捕捉优先",这个定位够独特,但市场规模有限。
Klein的下一步计划是:加强协作功能,但不做实时协作,做"异步共享"——比如把某天的笔记生成链接发给别人,对方能看能评论,不需要注册。这个设计延续了Twos的"低摩擦"哲学,也避开了和Notion正面打。
他还有个想法是做"回顾"功能,自动整理过去某段时间的内容,生成摘要。这需要AI理解笔记内容,Twos目前没做,因为Klein担心隐私——用户的生活碎片,他不想碰。
这个克制很少见。大多数笔记工具现在都在加AI摘要、智能标签,Twos反而强调"我们不读你的内容"。这是差异化,也是限制:功能天花板肉眼可见。
回到那个核心问题:AI到底改变了什么?
Klein的答案是:改变了"完成"的定义。以前"完成一个功能"意味着设计、编码、测试、上线,周期以月计。现在"完成"可以指"描述清楚需求,AI生成能跑的版本",周期以天计。
但这个加速是有代价的。快速迭代容易让人沉迷"做新东西",忘记"维护旧东西"。Twos的老用户有个抱怨:新版虽然好看,但之前提的某个小功能请求(比如支持Markdown表格)还是没做。Klein的优先级被"重做界面"占满了。
这是AI时代的经典困境:生产能力过剩,决策能力稀缺。能做什么不再是问题,该做什么才是。
Pierce在Newsletter结尾说,他这周还在"fine-tuning the first vibe-coded thing I've ever made that's actually any good"(微调他第一个真正好用的Vibe Coding作品)。这句话的时态很有意思:"actually any good"是完成时,"fine-tuning"是现在进行时——好用的标准是动态的,今天够用,明天可能就不够。
Twos的新版本能撑多久的好评?Klein没给数字,但他说了另一件事:Claude Code的订阅费,每月20美元,比Twos的高级会员还便宜。这笔账怎么算,他也没想明白。
如果AI编程工具的价格继续跌,独立开发者的成本结构要重写。但现在的问题是:当所有人都能3周做个App,什么决定了谁能活到第4周?
热门跟贴