歸藏：从 Prompt 到 Harness，上下文就是一切|prompt|上下文|代码|归藏|歸藏|自然语言|调用

我们发起「」时，想支持的，是在 AI 时代涌现出的新一代创业者和创造者。

歸藏就是这群人的一个缩影。

他原本是一位 UI/UX 设计师，从 ChatGPT 问世起就不断写出神级提示词，有人说他几乎「养活了半个 AI 自媒体圈」。最近几个月，他开始尝试 vibe coding，做出了 CodePilot。这个项目最初只是「给 Claude 命令行做一个 UI」的想法，最终却演变成一片关于 Harness、上下文和 AI Native 产品形态的实验田。

真正驱动这一切的，不是传统意义上的编程能力，而是对问题的理解、对产品的判断，以及持续调动 AI 完成复杂任务的能力。他把 10 年经验都写进了 skill。

Token Grant 想支持的正是这些站在变化之处的人。

我们希望它成为你起跑时的推力：如果你已经在用 AI 构建新的工具、产品或组织，不必等到万事俱备。

先做出来，先发布，先让用户找到你，先让世界给你反馈。

然后，让未来自己长出来。

真格投资合伙人 Koji

从 Prompt 到 Harness

Q：请介绍一下你自己以及现在做的事。

歸藏：我之前是一位 UI/UX 设计师，最近几个月开始 vibe coding，做了一个产品叫 CodePilot。

Q：Harness Engineering 带来最大的变化是什么？作为一个很会写 prompt 的人，你觉得现在还有优势吗？

歸藏：Prompt 的核心不是提示词，是其中蕴含的一整套解决问题的思路和思维模式。

如果你真的是会写提示词的人，Harness 反倒会把你的上限提高很多。以前你只能在一个非常有限的上下文和长度里规划任务，但现在你有了一整套工具，包括 memory、skill、CLI、MCP。

你的代码、图像，甚至不同模态的提示词，都可以被组合进一整套工作流里。你的提示词会变得更长、更通用，上限也更高。

Q：在上限提高之后，你觉得最重要的能力会是什么？

歸藏：第一是主观能动性，第二是学习能力，第三是品位。

这不一定是某一类的品位，而是你在当前行业里的独特经验，是你过去学习、工作、内容消费沉淀在身体里的那套审美和判断。

每个人的上下文都不一样。

Q：当时是什么契机让你来申请 Token Grant？整个流程里，有没有什么特别打动你的瞬间？

歸藏：海辛（实验电影人、AIGC 艺术家）转给我一个表单，我点进去一看就觉得：「呀，这个东西好。」

我很好奇真格资助 agent 的理念是什么，于是就填了申请。

最打动我的是整个流程特别精简。我觉得这代表了一种信任和尊重。我最怕复杂流程和各种约束，但这次体验下来完全没有，所以我最近一直在疯狂跟开发者朋友们安利 Token Grant。

Token 是虚拟世界的原料

Q：拿到 Token Grant 之后，你做第一件事是什么？

歸藏：充 Token，再买两个号。

Q：对于你来说，Token 像是什么东西？

歸藏：Token 就是虚拟世界里 3D 打印机的原料。3D 打印最常用的就是 PLA。它是通用的，但最后打印出来的东西都不一样。

Q：你今天花了多少 Token？

歸藏：我今天早上起来一直在忙物理世界的事情。我最多的一个月花了 7600 万 Token。很多人都在说「1 亿 Token 俱乐部」，但我发现我的产出很高，Token 消耗量却不算多。很多人消耗大，是因为会并发使用 Token，开好几个 worktree 或 agent teams，但我把握不住，我审核不过来。

Q：最近一次觉得「这个 TOKEN 花得特别值」是什么时候？

歸藏：我现在所有精力都在维护一个项目。

它整体 TOKEN 消耗没有多夸张，但产出非常可怕。我拉了个数据，现在这个项目累计已经写了超过 30 万行代码，来来回回删减之后，项目里还保留着 11 万行代码。

还有一个是最近在玩 Claude Buddy。我给它写了一个硬件固件，是一个墨水屏。我第一次发现，做 AI 硬件的成本已经低到了这种程度。

另外还有一个特别重要的是产品思考。

我把它通过 USB 插到 Mac 上，然后告诉 Claude Code：「这里有个官方项目，但我的设备跟它不一样，我现在用的是这个设备，你帮我改一下。」结果它一个小时就帮我做出了一个完整的固件。

它不是普通软件，是一个完整系统。整个设备只为这一件事服务。

这件事对我影响特别大。以前我根本不想碰硬件，学校里也学过面包板、Arduino，过程特别痛苦，因为它的代码逻辑跟普通开发完全不一样。现在不管了，直接怼上去就完事了。

搞完这个之后，我又买了一堆别的硬件，想继续试试看。

Q：如果有一天有了无限 TOKEN，你会做什么？

歸藏：现在限制我的不是 Token 了，而是我自己。

对我来说，Token 其实已经接近无限了，因为我根本消费不完。在有限的 24 小时里，我还得吃饭、睡觉、维持正常生活。

但 Token 的质量可以提高。

我之前拉过一个统计，我到现在已经有几百个 commit 了，其中 47% 都是 fix。

所以核心问题不是 Token 的量，是单位 Token 能解决多少问题。就像现在 47% 的 commit 都在修 bug，如果未来这个比例降到 20%，剩下 27% 就会变成功能增量，让我构建更多东西。

Q：你现在一天的生活是什么状态？

歸藏：我现在的生活大概分成几个部分。

早上起来第一件事是开发，写 CodePilot。每晚睡觉前，我都会给 Codex 和 Claude Code 布置定时任务，让它们从凌晨 5 点开始工作。这样我起床之后，就能直接拿到一个版本去测试和审核。

第二部分是内容和信息消费。我的 skills 会自动爬取我常看的一些 newsletter、网站和邮件，也会结合我的日程做提醒、生成报告。我自己也会刷 X。

再往后就是内容发布。短的内容，我一般直接语音输入，因为它自带润色。长的内容，我会交给 AI。我有一整套内容生产流程会自动跑完，我只需要完成第一步：给上下文定调。

我一整天都在这个循环里。

很多人觉得做这些都不睡觉，但我睡觉很正常，一般 1 点就睡了，下午还会去健身。正常生活还是能保证的。AI 解放了很多时间，但同时你也会去做更多事情。

一个小时，产品的第一版

Q：当时是哪个具体瞬间让你意识到要做 CodePilot？

歸藏：我跟很多人讲过这个故事。

我现在这个项目最开始的文件夹名字叫「Opus 4.6 test」。

我一直觉得 Claude 命令行有一个很烦的问题，就是看不到聊天历史记录。但聊天历史是很重要的资产。虽然能调出来，但过程特别复杂，看着也不爽。所以我当时就想：那我给它做个 UI 吧。

刚好那时候 Opus 4.6 发了，我就想试试看，给它一个特别大、特别难搞、但又要求很稳的任务。结果它一个小时就给我做出了第一版，且第一版已经非常可用了。

后来我就把它发出来了。发出去之后，很多人说特别需要这个东西。我就把它简单打了个包发给大家用。结果用着用着，大家成了你的用户，你没法不继续做下去了。很多人会在 GitHub 提 issue、提 PR，然后你就会被用户推着往前走。

卷着卷着，你自己也开始想做更多。

我自己的想法是把它当成一个 Harness 的实验田。因为做 Harness 不只是把一些能力暴露出来而已。你研究越深，就越会发现：上下文控制才是最核心的东西。

Q：你现在怎么理解 Harness ？

歸藏：我觉得它就是整套 agent 本身。这个定义现在已经跟 AGI 一样，被无限泛化了。

我们今天想到的所有东西，比如提示词、skills、MCP、CRM，这些都是 Harness 的一部分。它们最后都会汇聚成 context，再传给模型。

它本质上是一整套流程。如果从模型往外倒着看，第一层是 context，也就是上下文的组织和管理。再往外，就是各种组件：工具调用、function call、MCP、scale、CRM、memory……这些全部都属于 Harness。

某种意义上，模型之外的一切都算 Harness。

对大多数人来说，只要你愿意花钱，一个月买 200 块的 Max，Token 就已经接近无限了。

Q：你在迭代的过程有什么感受？

歸藏：我现在慢慢迭代出了一套自己的方法。

因为我之前没用 Vibe coding 写过这么大的项目，所以现在整个开发流程已经变成了文档驱动。所有东西都是文档，整个 Harness 也是靠文档来完成的。

其中有三个最核心的文档：Claude Code 文档、目录路由文档，还有护栏文件。

Claude Code 文档本质上就是 AI 的宪法：什么绝对不能做，什么绝对必须做。

目录文档包含整个项目里所有文档的入口和结构。

护栏文件则要保护两个东西：一个是上下文，另一个是接口。我是一个多服务商的平台，会接各种 code plan。一旦这里坏掉，用户整个软件都没法用，这属于 P0 级问题。其它 bug 都不算 bug。

我现在基本不用 code 自带的计划模式，我觉得那个很弱。我大约 70% 的时间都花在调研上。我会不断和 AI 讨论技术方案、反复审核计划文档，再让它按文档执行。你计划得越细，后面出问题的概率就越小。

这样它才能长时间、连续地完成任务。

一个任务拆成 10 个 pass，它一晚上就能全部做完，还会自动调用 MCP、跑测试、做 smoke test。

另外还有一个特别重要的是产品思考。

因为你做的东西不是给机器用的，是给人用的。Vibe coding 最终是产品，不只是代码。你要不断思考：这个功能对用户意味着什么？产品层面应该怎么设计？未来会怎么演化？

AI 不知道很多东西。

第一，它不了解用户真实的运行环境。AI 默认世界上只有 macOS。如果你做多端产品，它最后一定会把 Windows 忘掉。

第二，它缺乏特定领域的知识。对于没见过、已经过时的事实性信息，它非常容易出错。就像它以为 Anthropic 只更新到了 Opus 4.0，实际上都 4.7 了。

最可怕的不是它不知道，是它以为自己知道，但知道的是过时信息。而过时的信息，本质上就是错误信息。

最后一个问题是决策。AI 不知道什么东西是好的，也不知道你真正想要什么。长期磨合之后，通过 memory 和文档，它会慢慢对你的偏好产生感知。但遇到一些全新的、你从来没做过决策的事情时，它还是不解。

Q：你怎么帮他判断就是什么好，什么不好？

歸藏：我自己判断。它只需要给我足够的信息就行。

我自己其实不写代码，一行都没写，到现在整个软件我一行代码都没碰过。我也不懂代码，最多懂点 HTML、CSS，但现在这些也不用我碰。

遇到我不懂的，它会给我讲。我懂，我就自己做判断。

Q：不管是你之前写提示词，还是现在跟 AI 一起写代码，很重要的一环都是调研，把知识沉淀下来。

歸藏：我之前对外分享的时候，经常有人问我什么最重要。我说得最多的一句话是：上下文就是一切。

对于使用者来说，你要给 agent 准备足够精准、足够丰富的上下文；对于开发者来说，你 agent 里最核心的组件也是上下文。

上下文都是一切。

一个人能做的事没有上限

Q：你理想中的 AI Native 产品应该是什么样？

歸藏：我昨天参加了一个会，大家一直在聊产品。但我后来觉得，有一个东西比产品本身更重要：组织。

以前我没有意识到这个事，因为我一直是单打独斗。但后来我发现，当一个组织本身是 AI Native 的时候，它产出的东西天然就会是 AI Native 产品。

看组织有时候比看产品更精准。

因为「产品」这个词现在已经被泛化了。比如你说 Notion，它最开始肯定不是按 AI Native 去设计的，但它现在几乎所有地方都在加 AI。你宽泛一点说，它也算 AI Native，但严格一点又不算。

但如果一个公司本身就是 AI Native 的，即便它产出的产品跟 AI 一点关系都没有，里面没有任何 AI 功能，我觉得它依然算 AI Native。

Q：OPC 组织层面最大的挑战会是什么？

歸藏：最大的挑战还是跟物理世界接触。

作为公司、主体、自然人，你始终要跟这个世界交互，要建立信任。公司的财税、身份认证，这些其实才是最核心的挑战，也是 AI 短期解决不了的部分。

但我觉得今天，一个人能做到的事情已经没有上限了。

像我一个人 70 天写了几十万行代码，同时还作为自媒体一个人更新 9 个平台，而且都在持续更新。这在以前是完全不可能做到的。

现在 TOKEN 对我们来说已经接近无限了。但当生产力上来后，真正重要的东西就变了。

Q：如果 CodePilot 只留下一种功能，会是什么？

歸藏：聊天输入框，再加一个语音按钮。

Q：为什么？

歸藏：因为 agent 产品最后都可以被砍成这样。这是最自然的形态。我自己也是这么工作的。

所有东西都从上下文来，最后也要回到聊天框去。

AI 可以感知一切上下文，产品里的所有东西理论上它都能感知。只要它能感知，它就可以自己改、自己迭代、自升级。

坏了以后，它甚至还能自己修。

Q：有什么是你希望 AI 可以做，但现在还做不到的？

歸藏：是我们的互联网基建限制了 AI。

即便像 Vercel 这种已经算最简单的工具了，它里面依然有很多复杂部分，服务器配置还是繁琐。且它本身也不是 AI Native。

我们真正需要的是 AI Native 的基础设施。

我之前分享过一句话：AI 的能力等于你给它提供的工具。

Q：你预期一年之后自己会有什么变化？

歸藏：我希望 AI 能替我做更多事情，让我有更多时间去线下做一些事。

我觉得 AI 这两年一定会大规模转向物理世界。

我过年的时候写过一篇文章。当时很多人都觉得，AI 改变物理世界的形态会是机器人。但我一直觉得，最先真正落地 AI 的一定是汽车。

因为车本身就有电池、有轮子，移动速度比机器人更快，想去哪就去哪。

现在很多电车已经像 AI 的物理载体了。它是多卡并发网络，跟一个超强 Wi-Fi 一样稳定。它还有很大的电池、空间，车里的屏幕可以直接当副屏。

现在 OPC 越来越多，整个组织形态也在慢慢解体。如果再跟 AI、跟新的工作方式结合，我觉得这里面的未来想象空间特别大。

还有一个让我很震撼的是硬件。

做了替代 Claude Buddy 的墨水屏设备后，我发现中国的硬件生态非常厉害。有个设备才 500 块，还有更小的是 200 块钱，里面带麦克风、全键盘、蓝牙、Wi-Fi、声音、摄像头，还能自己跑 Linux 系统。

你完全可以在里面装一个 agent，挂在背包上，让它实时跟你的手机交互。

这些东西现在人人都能做。200 块钱，一根 USB 线插上就能开始。

大部分技术已经齐备了。很多事情发生会比大家想象得更快。

智能又往前迈了一步

Q：让你印象最深的一次发布是什么？

歸藏：还是 ChatGPT。

如果你跟得足够久，后面多少都是有预期的。但 GPT 当时是完全没有预期，它带来的震撼是最大的。

接下来一个是 Sora，再往后是 NanoBanana。所有让我感觉到「智能」本身在提升的东西，都会让我特别震撼。

我觉得它真正重要的不是美学，是智能本身。它又往前迈了一步。

Q：你还记得第一次跟 NanoBanana 交互的场景吗？

歸藏：我第一次让 NanoBanana 去处理一些需要推理的信息，看它把排版展示在图片上的时候，非常惊喜。那个瞬间我就意识到，我们整个多模态的新时代要来了。

Q：CodePilot 让你最意料之外的是什么？

歸藏：我健身教练给我印象很深。

我每次健身中间休息的时候都会跟他闲聊，也会聊 AI。他原来一直自称「电脑白痴」，复制粘贴都不太会，甚至分不清 macOS 和 Windows。

但有一天我练完之后，顺手给他装了一个 CodePilot。

结果过了两天，他特别兴奋地跑来跟我说，他做出了一个自己一直想做的东西。

他干这行十年，从来没请过假，但那段时间天天请年假。

仅仅一个月，他就从一个完全的小白，快速完成了很多原本像是计算机专业四年才会积累下来的基础能力。后来我跟他说很多东西，他都能接得上。他自己做了很多 skills，甚至还开发了一个软件。

Q：你觉得一个产品做到什么程度就可以发布了？

歸藏：现在 X 上有很多产品构建的方法分享。

在你开始做第一版，甚至还没开始写第一行代码的时候，你就应该发布它。

当你起心动念的时候，就应该先发出来，然后不断迭代、不断获取反馈。

不用担心没人看，你的用户会自己找到你。等你第一个版本真正上线的时候，你可能已经积累了一批用户了。

最重要的是避免陷入完美主义。

尤其是设计师，我们这个群体天然会特别在意品质、特别想精益求精。我不是说完美主义有问题，只是在 AI 时代做产品，快速迭代、快速曝光非常重要。

Q：给那些还在申请 Token Grant 的开发者一句话，你会说什么？

歸藏：上下文就是一切。

歸藏：从 Prompt 到 Harness，上下文就是一切

热搜

热门跟贴

热搜

热门跟贴

相关推荐

13年不写代码，5天花200美元重建400万美元产品——YC掌门人是怎么做到的？

19岁，常青藤辍学，这群中国年轻人重构了AI记忆

冲刺3400亿估值，翁荔亲自出镜，交出一款更像人的大模型

ChatGPT、豆包集体翻车：AI没有价值观，只有「求生欲」

字节砍掉30%的AI项目？背后的真假与焦虑

1元钱285万Token的陷阱！起底“AI中转站”：封号跑路，模型降智，倒卖用户数据

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

绝杀！OpenAI正式接管人类耳朵，首个GPT-5级推理音频模型来了

终于来了！DeepSeek灰度测试聊天记录搜索功能，非常实用

DECS从源头消除冗余思考，实现推理token减半且性能不降反升

智元APC香港观察：具身智能的终极角色是先进生产力单元

200亿美元押注量子计算“iPhone时刻”：复刻AI，还是重演SPAC？

OpenAI前CTO创业的模型首秀，与面壁智能「撞车」了

对谈楼天城：Harness会成为AI时代最关键的能力之一

中国正在成为世界内容工厂

AI公司在组建经济学团队，诺奖经济学家：做研究还是搞公关？

一个不会写代码的中年男人，用一周业余时间手搓一个 APP

姚来英已任中国烟草总公司总经理

公司斥巨资挖来的程序员，老板都不敢惹她，直到有幸看到她的技术

Claude Code终于长出调度台：一个屏幕盯住所有AI会话，无需多开