开源「淘金小镇.Skill」,让你的Agent挖出每个排行榜里隐藏的信息差！

卡尔的AI沃茨

2026-05-05 17:28 ·北京 ·前大厂算法工程师

我发现囤Agent的Skills有瘾，

今天刚装了一大堆同类Skill，还没用熟就想提前知道这类里最好的到底是哪一个。转头又发现某个佬推荐了自留的20个Skills，回回路过我都忍不住点进去看。

这事就很像以前我看App Store榜单和Steam新品榜。

人类是很难拒绝榜单的。

尤其是那种带一点幸存者偏差，带一点我替你试过了踩过坑的榜单。

所以我就在想，既然我每天都在被Skill选都选不过来的苦恼折磨，

那为什么不让Agent也体验一下呢。

于是就有了一个新Skill，

我给它起名叫淘金小镇。

它干的第一件事就是，每天去ClawHub上看一眼下载榜Top100，把当天榜单存下来，生成一份对比报告，再部署到一个GitHub Pages页上。

当然，如果只能用来看Clawhub的话，也没必要做成Skill了，我就挂一个静态网页，每天更新一下，给大家看结论就好了。这个Skill还能够针对一些像Claude Code的更新日志，或者像AA Index这种模型排行榜，观测它们的更新，让模型以最少的环境依赖稳定地运行多次数据分析。

github.com/LearnPrompt/skillrush-town

做着做着我发现，网页其实是最不重要的一层。

真正有意思的是，它把一个每天都会变的公开信息源，变成了一个可以被Agent复盘的情报网。

淘金小镇最早我是用Codex去做的。当时ClawHub没有一个现成公开API，所以我一开始走的是浏览器自动化，让Agent像人一样打开网页，看页面，请求数据，然后把结果存下来。

但就是浏览器自动化这个东西吧，

你说它不靠谱，它能干很多API覆盖不到的活。

你说它靠谱吧，它又经常在你最不想管它的时候出问题。浏览器环境没了，登录态变了，页面加载慢了，本地依赖抽风了一大堆。

就算我写了足够复杂足够详细的提示语，一周还是有三天是失败的。

当时我就觉得，这不行，

不然就加大token消耗，我直接上GPT 5.5 high，但失败率还是超高。

那直接推倒重来，让新版Codex上无限循环模式（/goal），目标就是找出依赖最少的方案，循环30次都可以把ClawHub的Top100拉下来。

这样比我在提示语里面上十几个限制都好用，断掉也可以重连，模型还可以发挥自己想象力。

到第五个小时的时候GPT发现了一条新路，clawhub.ai/skills?sort=downloads这个地址，点开后怎么看都是榜单地址，但本质上只是一个入口，没数据的，背后是一个Convex服务。

Convex你可以先理解成一种云端数据库加后端函数。很多网站会把数据存在Convex里，前端页面打开以后，再通过一个query去问它要数据。

ClawHub这里对应的query path叫skills:listPublicPageV4，大概就是公开Skill列表页的第四版查询。

再继续看参数，这里面有几个关键条件。

按下载量排序，sort=downloads。

从高到低，dir=desc。

只看非可疑Skill，nonSuspiciousOnly=true。

每页25条，numItems=25。

到这一步，还不能直接说拿到了Top100。

因为它一次只吐25条。

但返回结果里有一个nextCursor，

这个东西你可以把它理解成下一页书签。你拿着这个书签，就可以拿到下一页。

连续问4次，25条乘4，Top100就出来了。

这就是淘金小镇最早成型的思路。

它不是随便抓了一个页面文本，

是尽量复刻了ClawHub页面自己拿数据的方式。

网页怎么问，我就怎么问。

这样拿到的榜单，才更接近用户看到的。

连续运行两天就能清晰感受到差别了。

今天第17名是哪个，哪个Skill掉排名了。哪个Skill今天突然冲上来。哪个作者做的Skill连续几天都在增长。

这些东西，网页本身不会告诉你。

当这些数据开始连续存在的时候，榜单就变成了一条时间线。

我印象很深的像Self-Improving Agent这类自进化的Skill，后来它跟另一个Proactive Agent融合，做了一个新Skill，Self-Improving + Proactive Agent，很快就冲上前三了。

但如果我只是在X上随机刷到，甚至会因为这名字觉得只是个二创。

如果每天留快照，我们能清晰地知道新上榜的Skill跟我们已经安装Skill有什么区别，使用频率不高的情况下，值不值得花时间去重新适应。

光看新进榜的话误导性有点高，很可能只是刚好被某个大号推荐了。有些Skill可能上榜很久了，但因为版本更新更好用了，排名就一下子往上窜了，但有的时候真的会下意识把它忽略掉。

我就是这样水灵灵错过了agent-browser的大更新半个月。

所以我给淘金小镇追加了几条新规。

前100名里最近排名一下子提了8名以上的，

下载量增长排进前20的，

下载和星标都提升了10名的,

都挖出来跟我原有的Skill体系做差距对比。

好处就是它不太受我们的信息流影响。

最近我就看到Polymarket的Skill上榜了，平时光顾着装一大堆UI设计和HTML PPT的skill了，原来都开始把预测市场也接进Agent工作流了。

还有就是像Agent上下文管理这类Skill真的是每过一段时间就有个新神出来，就我刚把LLM Wiki做成Skill接进来，GBrain就火了。刚刚下了一个QMD，让本地模型管理上下文，有5个内存层的Elite Longterm Memory又火了。

从同一类能力的排名变动可以看出大家最近在用同一种能力的时候，会有什么样的偏好。

这就是我觉得淘金小镇有意思的地方，

它是在帮我把值得判断的金子先捞出来。

你想想看，

现在Agent的Skill生态其实有点像早期的Chrome插件市场，

所有人都在上传，

名字一个比一个猛，说明一个比一个玄。

问题是我不可能每天把所有新的都试一遍。

因为信息流真的太快了。

你今天觉得一个工具火，明天可能没人提了。

你今天错过一个小Skill，三天后它可能已经变成很多Agent工作流里的基础设施。

人眼是追不上这个速度的。

但Agent可以。

给它一个固定路线，让它每天去同一个地方，拿同一类数据做比较，然后把值得看的捞上来。

今天谁还在，谁是新来的，

谁掉下去了，谁突然很多人开始用。

你看一眼就都知道了。

对我来说，这就是淘金。

不是找到唯一正确的Skill。

而是在一堆沙子里，

先把那些会发光的东西捞出来。

剩下的，再慢慢试。

@ 作者 / 卡尔

最后，感谢你看到这里如果喜欢这篇文章，不妨顺手给我们点赞｜在看｜转发｜评论

如果想要第一时间收到推送，不妨给我个星标

如果你有更有趣的玩法，欢迎在评论区聊聊

更多的内容正在不断填坑中……

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴