我们发起「」时,想支持的,是在 AI 时代涌现出的新一代创业者和创造者。
歸藏就是这群人的一个缩影。
他原本是一位 UI/UX 设计师,从 ChatGPT 问世起就不断写出神级提示词,有人说他几乎「养活了半个 AI 自媒体圈」。最近几个月,他开始尝试 vibe coding,做出了 CodePilot。这个项目最初只是「给 Claude 命令行做一个 UI」的想法,最终却演变成一片关于 Harness、上下文和 AI Native 产品形态的实验田。
真正驱动这一切的,不是传统意义上的编程能力,而是对问题的理解、对产品的判断,以及持续调动 AI 完成复杂任务的能力。他把 10 年经验都写进了 skill。
Token Grant 想支持的正是这些站在变化之处的人。
我们希望它成为你起跑时的推力: 如果你已经在用 AI 构建新的工具、产品或组织,不必等到万事俱备。
先做出来,先发布,先让用户找到你,先让世界给你反馈。
然后,让未来自己长出来。
真格投资合伙人 Koji
从 Prompt 到 Harness
Q:请介绍一下你自己以及现在做的事。
歸藏:我之前是一位 UI/UX 设计师,最近几个月开始 vibe coding,做了一个产品叫 CodePilot。
Q:Harness Engineering 带来最大的变化是什么?作为一个很会写 prompt 的人,你觉得现在还有优势吗?
歸藏:Prompt 的核心不是提示词,是其中蕴含的一整套解决问题的思路和思维模式。
如果你真的是会写提示词的人,Harness 反倒会把你的上限提高很多。以前你只能在一个非常有限的上下文和长度里规划任务,但现在你有了一整套工具,包括 memory、skill、CLI、MCP。
你的代码、图像,甚至不同模态的提示词,都可以被组合进一整套工作流里。你的提示词会变得更长、更通用,上限也更高。
Q:在上限提高之后,你觉得最重要的能力会是什么?
歸藏:第一是主观能动性,第二是学习能力,第三是品位。
这不一定是某一类的品位,而是你在当前行业里的独特经验,是你过去学习、工作、内容消费沉淀在身体里的那套审美和判断。
每个人的上下文都不一样。
Q:当时是什么契机让你来申请 Token Grant?整个流程里,有没有什么特别打动你的瞬间?
歸藏:海辛(实验电影人、AIGC 艺术家)转给我一个表单,我点进去一看就觉得:「呀,这个东西好。」
我很好奇真格资助 agent 的理念是什么,于是就填了申请。
最打动我的是整个流程特别精简。我觉得这代表了一种信任和尊重。我最怕复杂流程和各种约束,但这次体验下来完全没有,所以我最近一直在疯狂跟开发者朋友们安利 Token Grant。
Token 是虚拟世界的原料
Q:拿到 Token Grant 之后,你做第一件事是什么?
歸藏:充 Token,再买两个号。
Q:对于你来说,Token 像是什么东西?
歸藏:Token 就是虚拟世界里 3D 打印机的原料。3D 打印最常用的就是 PLA。它是通用的,但最后打印出来的东西都不一样。
Q:你今天花了多少 Token?
歸藏:我今天早上起来一直在忙物理世界的事情。我最多的一个月花了 7600 万 Token。很多人都在说「1 亿 Token 俱乐部」,但我发现我的产出很高,Token 消耗量却不算多。很多人消耗大,是因为会并发使用 Token,开好几个 worktree 或 agent teams,但我把握不住,我审核不过来。
Q:最近一次觉得「这个 TOKEN 花得特别值」是什么时候?
歸藏:我现在所有精力都在维护一个项目。
它整体 TOKEN 消耗没有多夸张,但产出非常可怕。我拉了个数据,现在这个项目累计已经写了超过 30 万行代码,来来回回删减之后,项目里还保留着 11 万行代码。
还有一个是最近在玩 Claude Buddy。我给它写了一个硬件固件,是一个墨水屏。我第一次发现,做 AI 硬件的成本已经低到了这种程度。
另外还有一个特别重要的是产品思考。
我把它通过 USB 插到 Mac 上,然后告诉 Claude Code:「这里有个官方项目,但我的设备跟它不一样,我现在用的是这个设备,你帮我改一下。」结果它一个小时就帮我做出了一个完整的固件。
它不是普通软件,是一个完整系统。整个设备只为这一件事服务。
这件事对我影响特别大。以前我根本不想碰硬件,学校里也学过面包板、Arduino,过程特别痛苦,因为它的代码逻辑跟普通开发完全不一样。现在不管了,直接怼上去就完事了。
搞完这个之后,我又买了一堆别的硬件,想继续试试看。
Q:如果有一天有了无限 TOKEN,你会做什么?
歸藏:现在限制我的不是 Token 了,而是我自己。
对我来说,Token 其实已经接近无限了,因为我根本消费不完。在有限的 24 小时里,我还得吃饭、睡觉、维持正常生活。
但 Token 的质量可以提高。
我之前拉过一个统计,我到现在已经有几百个 commit 了,其中 47% 都是 fix。
所以核心问题不是 Token 的量,是单位 Token 能解决多少问题。就像现在 47% 的 commit 都在修 bug,如果未来这个比例降到 20%,剩下 27% 就会变成功能增量,让我构建更多东西。
Q:你现在一天的生活是什么状态?
歸藏:我现在的生活大概分成几个部分。
早上起来第一件事是开发,写 CodePilot。每晚睡觉前,我都会给 Codex 和 Claude Code 布置定时任务,让它们从凌晨 5 点开始工作。这样我起床之后,就能直接拿到一个版本去测试和审核。
第二部分是内容和信息消费。我的 skills 会自动爬取我常看的一些 newsletter、网站和邮件,也会结合我的日程做提醒、生成报告。我自己也会刷 X。
再往后就是内容发布。短的内容,我一般直接语音输入,因为它自带润色。长的内容,我会交给 AI。我有一整套内容生产流程会自动跑完,我只需要完成第一步:给上下文定调。
我一整天都在这个循环里。
很多人觉得做这些都不睡觉,但我睡觉很正常,一般 1 点就睡了,下午还会去健身。正常生活还是能保证的。AI 解放了很多时间,但同时你也会去做更多事情。
一个小时,产品的第一版
Q:当时是哪个具体瞬间让你意识到要做 CodePilot?
歸藏:我跟很多人讲过这个故事。
我现在这个项目最开始的文件夹名字叫「Opus 4.6 test」。
我一直觉得 Claude 命令行有一个很烦的问题,就是看不到聊天历史记录。但聊天历史是很重要的资产。虽然能调出来,但过程特别复杂,看着也不爽。所以我当时就想:那我给它做个 UI 吧。
刚好那时候 Opus 4.6 发了,我就想试试看,给它一个特别大、特别难搞、但又要求很稳的任务。结果它一个小时就给我做出了第一版,且第一版已经非常可用了。
后来我就把它发出来了。发出去之后,很多人说特别需要这个东西。我就把它简单打了个包发给大家用。结果用着用着,大家成了你的用户,你没法不继续做下去了。很多人会在 GitHub 提 issue、提 PR,然后你就会被用户推着往前走。
卷着卷着,你自己也开始想做更多。
我自己的想法是把它当成一个 Harness 的实验田。因为做 Harness 不只是把一些能力暴露出来而已。你研究越深,就越会发现:上下文控制才是最核心的东西。
Q:你现在怎么理解 Harness ?
歸藏:我觉得它就是整套 agent 本身。这个定义现在已经跟 AGI 一样,被无限泛化了。
我们今天想到的所有东西,比如提示词、skills、MCP、CRM,这些都是 Harness 的一部分。它们最后都会汇聚成 context,再传给模型。
它本质上是一整套流程。如果从模型往外倒着看,第一层是 context,也就是上下文的组织和管理。再往外,就是各种组件:工具调用、function call、MCP、scale、CRM、memory……这些全部都属于 Harness。
某种意义上,模型之外的一切都算 Harness。
对大多数人来说,只要你愿意花钱,一个月买 200 块的 Max,Token 就已经接近无限了。
Q:你在迭代的过程有什么感受?
歸藏:我现在慢慢迭代出了一套自己的方法。
因为我之前没用 Vibe coding 写过这么大的项目,所以现在整个开发流程已经变成了文档驱动。所有东西都是文档,整个 Harness 也是靠文档来完成的。
其中有三个最核心的文档:Claude Code 文档、目录路由文档,还有护栏文件。
Claude Code 文档本质上就是 AI 的宪法:什么绝对不能做,什么绝对必须做。
目录文档包含整个项目里所有文档的入口和结构。
护栏文件则要保护两个东西:一个是上下文,另一个是接口。我是一个多服务商的平台,会接各种 code plan。一旦这里坏掉,用户整个软件都没法用,这属于 P0 级问题。其它 bug 都不算 bug。
我现在基本不用 code 自带的计划模式,我觉得那个很弱。我大约 70% 的时间都花在调研上。我会不断和 AI 讨论技术方案、反复审核计划文档,再让它按文档执行。你计划得越细,后面出问题的概率就越小。
这样它才能长时间、连续地完成任务。
一个任务拆成 10 个 pass,它一晚上就能全部做完,还会自动调用 MCP、跑测试、做 smoke test。
另外还有一个特别重要的是产品思考。
因为你做的东西不是给机器用的,是给人用的。Vibe coding 最终是产品,不只是代码。你要不断思考:这个功能对用户意味着什么?产品层面应该怎么设计?未来会怎么演化?
AI 不知道很多东西。
第一,它不了解用户真实的运行环境。AI 默认世界上只有 macOS。如果你做多端产品,它最后一定会把 Windows 忘掉。
第二,它缺乏特定领域的知识。对于没见过、已经过时的事实性信息,它非常容易出错。就像它以为 Anthropic 只更新到了 Opus 4.0,实际上都 4.7 了。
最可怕的不是它不知道,是它以为自己知道,但知道的是过时信息。而过时的信息,本质上就是错误信息。
最后一个问题是决策。AI 不知道什么东西是好的,也不知道你真正想要什么。长期磨合之后,通过 memory 和文档,它会慢慢对你的偏好产生感知。但遇到一些全新的、你从来没做过决策的事情时,它还是不解。
Q:你怎么帮他判断就是什么好,什么不好?
歸藏:我自己判断。它只需要给我足够的信息就行。
我自己其实不写代码,一行都没写,到现在整个软件我一行代码都没碰过。我也不懂代码,最多懂点 HTML、CSS,但现在这些也不用我碰。
遇到我不懂的,它会给我讲。我懂,我就自己做判断。
Q:不管是你之前写提示词,还是现在跟 AI 一起写代码,很重要的一环都是调研,把知识沉淀下来。
歸藏:我之前对外分享的时候,经常有人问我什么最重要。我说得最多的一句话是:上下文就是一切。
对于使用者来说,你要给 agent 准备足够精准、足够丰富的上下文;对于开发者来说,你 agent 里最核心的组件也是上下文。
上下文都是一切。
一个人能做的事没有上限
Q:你理想中的 AI Native 产品应该是什么样?
歸藏:我昨天参加了一个会,大家一直在聊产品。但我后来觉得,有一个东西比产品本身更重要:组织。
以前我没有意识到这个事,因为我一直是单打独斗。但后来我发现,当一个组织本身是 AI Native 的时候,它产出的东西天然就会是 AI Native 产品。
看组织有时候比看产品更精准。
因为「产品」这个词现在已经被泛化了。比如你说 Notion,它最开始肯定不是按 AI Native 去设计的,但它现在几乎所有地方都在加 AI。你宽泛一点说,它也算 AI Native,但严格一点又不算。
但如果一个公司本身就是 AI Native 的,即便它产出的产品跟 AI 一点关系都没有,里面没有任何 AI 功能,我觉得它依然算 AI Native。
Q:OPC 组织层面最大的挑战会是什么?
歸藏:最大的挑战还是跟物理世界接触。
作为公司、主体、自然人,你始终要跟这个世界交互,要建立信任。公司的财税、身份认证,这些其实才是最核心的挑战,也是 AI 短期解决不了的部分。
但我觉得今天,一个人能做到的事情已经没有上限了。
像我一个人 70 天写了几十万行代码,同时还作为自媒体一个人更新 9 个平台,而且都在持续更新。这在以前是完全不可能做到的。
现在 TOKEN 对我们来说已经接近无限了。但当生产力上来后,真正重要的东西就变了。
Q:如果 CodePilot 只留下一种功能,会是什么?
歸藏:聊天输入框,再加一个语音按钮。
Q:为什么?
歸藏:因为 agent 产品最后都可以被砍成这样。这是最自然的形态。我自己也是这么工作的。
所有东西都从上下文来,最后也要回到聊天框去。
AI 可以感知一切上下文,产品里的所有东西理论上它都能感知。只要它能感知,它就可以自己改、自己迭代、自升级。
坏了以后,它甚至还能自己修。
Q:有什么是你希望 AI 可以做,但现在还做不到的?
歸藏:是我们的互联网基建限制了 AI。
即便像 Vercel 这种已经算最简单的工具了,它里面依然有很多复杂部分,服务器配置还是繁琐。且它本身也不是 AI Native。
我们真正需要的是 AI Native 的基础设施。
我之前分享过一句话:AI 的能力等于你给它提供的工具。
Q:你预期一年之后自己会有什么变化?
歸藏:我希望 AI 能替我做更多事情,让我有更多时间去线下做一些事。
我觉得 AI 这两年一定会大规模转向物理世界。
我过年的时候写过一篇文章。当时很多人都觉得,AI 改变物理世界的形态会是机器人。但我一直觉得,最先真正落地 AI 的一定是汽车。
因为车本身就有电池、有轮子,移动速度比机器人更快,想去哪就去哪。
现在很多电车已经像 AI 的物理载体了。它是多卡并发网络,跟一个超强 Wi-Fi 一样稳定。它还有很大的电池、空间,车里的屏幕可以直接当副屏。
现在 OPC 越来越多,整个组织形态也在慢慢解体。如果再跟 AI、跟新的工作方式结合,我觉得这里面的未来想象空间特别大。
还有一个让我很震撼的是硬件。
做了替代 Claude Buddy 的墨水屏设备后,我发现中国的硬件生态非常厉害。有个设备才 500 块,还有更小的是 200 块钱,里面带麦克风、全键盘、蓝牙、Wi-Fi、声音、摄像头,还能自己跑 Linux 系统。
你完全可以在里面装一个 agent,挂在背包上,让它实时跟你的手机交互。
这些东西现在人人都能做。200 块钱,一根 USB 线插上就能开始。
大部分技术已经齐备了。很多事情发生会比大家想象得更快。
智能又往前迈了一步
Q:让你印象最深的一次发布是什么?
歸藏:还是 ChatGPT。
如果你跟得足够久,后面多少都是有预期的。但 GPT 当时是完全没有预期,它带来的震撼是最大的。
接下来一个是 Sora,再往后是 NanoBanana。所有让我感觉到「智能」本身在提升的东西,都会让我特别震撼。
我觉得它真正重要的不是美学,是智能本身。它又往前迈了一步。
Q:你还记得第一次跟 NanoBanana 交互的场景吗?
歸藏:我第一次让 NanoBanana 去处理一些需要推理的信息,看它把排版展示在图片上的时候,非常惊喜。那个瞬间我就意识到,我们整个多模态的新时代要来了。
Q:CodePilot 让你最意料之外的是什么?
歸藏:我健身教练给我印象很深。
我每次健身中间休息的时候都会跟他闲聊,也会聊 AI。他原来一直自称「电脑白痴」,复制粘贴都不太会,甚至分不清 macOS 和 Windows。
但有一天我练完之后,顺手给他装了一个 CodePilot。
结果过了两天,他特别兴奋地跑来跟我说,他做出了一个自己一直想做的东西。
他干这行十年,从来没请过假,但那段时间天天请年假。
仅仅一个月,他就从一个完全的小白,快速完成了很多原本像是计算机专业四年才会积累下来的基础能力。后来我跟他说很多东西,他都能接得上。他自己做了很多 skills,甚至还开发了一个软件。
Q:你觉得一个产品做到什么程度就可以发布了?
歸藏:现在 X 上有很多产品构建的方法分享。
在你开始做第一版,甚至还没开始写第一行代码的时候,你就应该发布它。
当你起心动念的时候,就应该先发出来,然后不断迭代、不断获取反馈。
不用担心没人看,你的用户会自己找到你。等你第一个版本真正上线的时候,你可能已经积累了一批用户了。
最重要的是避免陷入完美主义。
尤其是设计师,我们这个群体天然会特别在意品质、特别想精益求精。我不是说完美主义有问题,只是在 AI 时代做产品,快速迭代、快速曝光非常重要。
Q:给那些还在申请 Token Grant 的开发者一句话,你会说什么?
歸藏:上下文就是一切。
热门跟贴