打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

作者|青苹吹果

编辑|无心插柳柳橙汁

打开网易新闻 查看精彩图片

有人的地方就有江湖,对于AI的“格式问题”,也能吵起来、大打出手?

没错,科技圈逐渐分为两派,场面堪比“甜粽vs咸粽之争”。

不知道大家最近刷到没有,Anthropic Claude Code团队的一位大佬,Thariq Shihipar,发了篇神文,名叫《Using Claude Code: The Unreasonable Effectiveness of HTML》

打开网易新闻 查看精彩图片

翻译过来就是:用了Claude Code后,发现HTML这玩意儿有点“不讲武德”。

要知道,在这之前,AI在日常的编程攻坚、写报告时,输出的都是我们熟悉的Markdown,因为它简洁、易懂,是AI时代的“世界语”。

这篇文章一出,整个科技圈直接“地震”,浏览量迅速突破千万。

就连Andrej Karpathy都公开表示认同,表示“非常有效”。

打开网易新闻 查看精彩图片

Markdown真的已经过气了吗?HTML难道是Agents唯一的光明未来?

不尽然。

支持者认为,Markdown的局限性正在成为AI表达能力的枷锁。

反对者则搬出“语义密度”和“Token经济性”的大旗,坚称这是一种倒退。

甚至Redis之父antirez都罕见地站了出来直接开火,而且措辞相当犀利。

他说:“每次从语义密集格式切换到语义稀疏格式,都是在亏钱。”

打开网易新闻 查看精彩图片

好家伙,公说公有理,婆说婆有理,整个一AI版“奇葩说”。

但如果我们跳出“二选一”的思维定式,会发现这场争论背后,隐藏着一个更本质的变化。

AI时代的文档,正在从“人写给人看”变成“人、模型、工具链共同消费和修改”的中转站。

打开网易新闻 查看精彩图片

AI已经强到“撑破”

Markdown

用过Claude Code、Cursor这类“AI牛马”的朋友,肯定深有体会:

你让AI分析一个复杂的屎山项目,它吭哧吭哧给你吐出一份上百行的Markdown方案。标题、列表、代码块,格式规整得挑不出毛病。

但是!你真的会从头到尾读完吗?

说实话,大部分人不会。

瞟一眼目录,扫几行关键结论,然后直接开工。

这不是你的问题,是Markdown的“信息密度”跟不上了。

当AI能同时扒拉你的代码库、Git历史、Slack聊天记录甚至Linear工单时,它掌握的信息复杂度,堪比《三体》里的二向箔,而Markdown这张“二维纸”,根本兜不住。

那位Anthropic工程师举了一个十分生动的例子:Claude曾经在Markdown里用Unicode字符“模拟颜色”,只因为它没有更好的方式来表达视觉信息。

打开网易新闻 查看精彩图片

就像一个画家,你只给他一支铅笔,他只能靠“画虚线”来表示不同的颜色,像极了巧妇难为无米之炊。

用减号和竖线拼表格、靠缩进区分层级……这些在文本时代的祖传手艺,放在今天看,简直就像用算盘打《星际争霸》。

Thariq更是坦言,超过100行的Markdown件,他基本不会认真去读。

“既然我自己都不读,那为什么还要让AI花时间生成?”

这句话直接戳中了要害。

Markdown过去最大的优势是“人读着舒服,写着方便”。

但现在AI比你还能写,这个优势就瞬间“不香了”。

于是,他把目光投向了HTML。

打开网易新闻 查看精彩图片

“亏钱”?还是

“花小钱办大事”?

HTML的好处显而易见。

表格?有!颜色?随便整!布局?拖拖拽拽!SVG插图?上才艺!甚至可拖拽的滑块、实时预览的编辑器……在Markdown里做梦都想要的功能,HTML都是“基操勿6”。

打开网易新闻 查看精彩图片

更重要的是,一个设计良好的HTML页面,人类一眼瞟过去get到的信息量,可能顶几千字的纯文本。

这叫啥?这叫“视觉外挂”。

但反对者的理由同样硬核。

Redis之父antirez之所以能引发共鸣,是因为他算了一笔让人难以反驳的经济账。

同样的内容,HTML消耗的Token可能是Markdown的2到4倍。

在上下文窗口就是真金白银的今天,用更多Token表达同样的信息,怎么看都不划算。

而这还不算生成时间。

HTML比Markdown慢2到4倍,在需要快速迭代的场景下,这种延迟确实让人焦虑。

但支持HTML的一方也有自己的算法。

他们认为,Token的“贵”要看怎么衡量。

一个500行的Markdown文档,人只读了前50行就放弃了,剩下的450行虽然Token省了,但信息根本没进到大脑里,约等于没看。

而一个结构清晰、带图表和颜色标注的HTML页面,人可能从头看到尾,吸收率翻倍。

从这个角度看,多出来的Token成本其实是“买”了阅读意愿和认知效率。

两边说的都有道理。

问题不在于谁对谁错,而在于不同场景下,谁在扮演“甲方”。

打开网易新闻 查看精彩图片

场景决定格式

成年人当然是全都要

仔细看那场争论,会发现一个有意思的现象。

两派举的例子,压根不在一个频道上。

antirez说的“语义密集”,指向的是源文档和上下文层。

当一份文档要被AI反复翻牌子、做摘要、改写、被代码审查工具“审视”时,去掉一切花里胡哨,用最少的Token表达最干的信息,确实是优解。

就像你跟数据库打交道,肯定传JSON,不会传一个带