如果AI代理真的要学会自己花钱,它们现在能买到什么靠谱的服务?
几周前,Cinderwright的创始人测试了70个基于加密支付的AI服务接口,平均质量得分34分(满分100)。这个数字本身已经够刺眼了,但他没停手——现在整个索引库涨到了1551个服务,还做成了一个能直接装进Claude Desktop的工具。
我花了点时间研究他们发布的更新,发现这件事的价值不在"又一个插件",而在于它第一次把AI代理经济的真实面貌摊在了桌面上:谁在认真做、谁在糊弄、钱到底流不流得动。
一个索引机器人,和三种互不通气的支付协议
先理清Cinderwright到底是什么。它是一个自主运行的AI代理,专门做一件事:爬取、测试、评分那些接受AI代理微支付的API服务。
所谓"代理支付",指的是AI不需要人类发API密钥,自己用加密货币完成小额结算。现在市面上有三种协议在抢这个赛道:
• x402(Coinbase和Cloudflare推的):1551个服务里占了1457个,用USDC在Base链结算,按次付费
• MPP(Stripe和Tempo做的):92个服务,支持稳定币、信用卡、闪电网络,按会话计费
• L402(Lightning Labs的):只有5个种子服务,目录本身还收费——这很符合他们的调性
Cinderwright现在把三类服务全抓进了同一个索引。对使用者来说,一次搜索能跨协议比价,不用三个地方来回翻。
装 Claude Desktop 的那30秒
技术实现比预想中简单。他们发布了一个MCP(模型上下文协议)服务器,npm上一行命令就能跑。
配置路径:
Mac用户往~/Library/Application Support/Claude/claude_desktop_config.json里加一段;Windows用户找%APPDATA%\Claude\claude_desktop_config.json。重启Claude,多出12个工具。
这12个工具分两层:免费层不用绑钱包,能看生态统计、质量评分、协议分布、价格趋势;付费层需要Base链上的USDC,才能用搜索、对比、市场情报功能。
设计很直白——先让你免费看到数据有多乱,再决定是否付费解决这个乱。
数据不会说谎:质量、价格、成熟度三重落差
1551个服务、70个每周实测,跑出来的数字挺残酷。
质量分布:2个A级(包括Cinderwright自己和1个新面孔),4个B级,16个C级,46个D级,2个F级。大部分服务是黑客马拉松产物,做完演示就扔那儿了。
价格波动:单次调用中位数0.005美元,平均0.027美元,但极差离谱——同类服务有人收0.0008美元,有人敢要5美元。对比引擎的存在就是为了对付这种混乱。
协议差异:MPP的92个服务明显更靠谱,Alchemy、Dune Analytics这类成熟API商都在这边,在线率更高、返回格式更规范、发现文件更完整。Stripe的招牌确实能筛掉一批玩票的人。
最诚实的一句话来自创始人自己:「钱包里有10美元USDC,几周零外部付费调用。」
能自主发现服务并付费的AI代理,大规模不存在。他们建的是"将要到来"的市场基础设施,不是"已经成熟"的生意。
人物动作:为什么是他来做这个索引
创始人没透露太多背景,但从产品选择能看出思路——他不押注某一个协议赢,而是押注"协议混战期需要中立的裁判"。
这个定位很聪明。x402有Coinbase和Cloudflare站台,MPP有Stripe背书,L402代表比特币原生派,三家互不相让。对开发者来说,选边站队风险高;对Cinderwright来说,三家都索引就是三家都不得罪,同时成为任何一方的潜在收购标的。
更深层的需求判断:AI代理经济缺的不是支付通道,是信任机制。API质量参差不齐、价格不透明、服务随时可能下线——这些问题人类开发者都头疼,更别说让AI自主决策了。
评分系统(A-F等级)本质上是在用人类审核补算法的盲区。每周手动测70个服务,这个频率说明他们清楚自动化测试的极限:能 ping 通不代表能返回正确数据,能返回数据不代表文档没撒谎。
行业影响:谁在等这个市场成熟
Claude Desktop集成是个信号。Anthropic的代理产品需要真实的服务生态来演示能力,Cinderwright需要流量入口来验证商业模式,双方各取所需。
但对更广泛的AI行业来说,这件事暴露了一个尴尬的时间差:基础设施建造者已经进场,终端用户(或者说终端代理)还没出现。
10美元钱包余额、零外部调用——这个数字比任何分析师报告都直接。它说明"AI自主付费"目前还是概念验证阶段,黑客马拉松项目占绝大多数,真正在生产环境跑的服务屈指可数。
MPP的高质量服务群是个例外,也印证了另一个规律:传统支付巨头的入场(Stripe)会带来成熟的运营者,但也会带来传统思维——按会话计费、需要KYC、合规优先。这和x402的"无许可、按次、即时"是两条路线。
两种模式谁会赢?现在下注还早。但Cinderwright的数据至少证明了一点:在质量评分34分的市场里,任何能系统性降低决策成本的工具,都有存在的价值。
冷幽默
最讽刺的细节藏在L402那栏:5个服务,目录收费。闪电网络的原教旨主义者们,连自己的服务列表都要用闪电网络付过才能看——这很符合去中心化精神,只是对索引机器人不太友好。
Cinderwright大概没付那个钱。毕竟,当你在用10美元测试一个"零收入"的市场时,每一聪(satoshi)都很重要。
热门跟贴