刚刚火速用Qwen3-Coder试了下我最近一直卡着的一个任务,先给大家看下消耗。这个任务跑了1个小时18分钟 ,token的使用量input用了19万多一点儿,output将近1万。

你可能觉得这个数据好像还行,但是这是我前两天跑的一样的项目,我整整坐着看了3个多小时,实际上模型跑了22个小时多,吃掉了将近2880万的token,一个小时1百万,非常恐怖的消耗,且很贵。

我先来说一下我最近一直在搞的这个项目,其实需求很简单,就是「爬虫+可视化+AI feature」。

但是具体的要求有点儿复杂,你看我最开始的需求很长,且包含了大量的链接。

因为我需要AI帮我做一个英国funding机会的整合站,要求它针对于每个funding主体设计一个爬虫,然后数据保存的时候要针对于数据类型的最大公约数进行设计,这个其实很trick,比如UKRI这个主体下面有好几个分部,比如EPSRC,ESRC等等,但是其他的主体就没这个东西,所以只有在获取到所有的funding信息后才能做这一步;最后做一个数据展示。

不过可惜的是,这个任务太复杂了,我直接给到这个页面,大多数的AI都会被页面里非常多的链接弄晕头,失败的有很多Claude-4-sonnet,Gemini-2.5-Pro。

所以我改变了策略,一个个的来,最后整合,我这里是在Qwen Code里面做的测试,结合Trae这个编辑器,可以很方便的比较代码历史记录。

使用方法很简单,先安装Node.js,版本要在20及以上,然后在命令行输入这两行代码。

npm install -g @qwen-code/qwen-code

qwen --version

然后输入qwen就能激活下面的环境。

你需要配置下这三个参数,建议使用modelscope魔搭的API,速度很快,不过开源模型,后续会上的平台会有很多。

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="your_api_base_url_here"
export OPENAI_MODEL="your_api_model_here"

我的第一句Prompt是让Qwen3 Coder先了解我的主要需求,内容如下:

做一个静态网站,从我提供的funding body整合所有的funding opportunity,要用爬虫爬取,整合所有的funding机会,并且用最大公约数来展示简要和关键信息,打开之后跳转到具体的funding详细页面

这个Prompt我在Claude和Gemini那得到的反馈都是直接给我来了一套框架,里面有详细的前端代码,后端代码,爬虫代码,数据保存逻辑等,我最开始觉得这样挺专业的,但是那3个小时的时间让我发现,它的确可以生成非常多的代码,但是后面稍微一改动就是一大片,又慢又费token。

Qwen3-Coder的思考逻辑很「克制」,表现就是它并没有想着给我从哪找一套框架先放在当前的文件夹里,它的任务分解跟其他的AI类似,但是顺序不一样,它提出的是先做爬虫,然后数据存储,最后做可视化。

也是这么一提示我,才让我觉得有点儿上道了,本来不就应该这样嘛,你不得分析下数据是什么样的再去设计存储和可视化?

Qwen3-Coder拿到我给的UKRI链接后,就试着查看下了网页信息,主要目的是找里面具体的funding信息。

定位的逻辑以及结果是很准确的,把带有opportunity字眼的链接找到了。

但是有个问题,那就是只有后面两个才是我需要的信息。

但是代码写的很惊艳,那就是它“自主”的排除了opportunity/后面是空值和feed/的两种情况,保留了正确的信息。

这一点儿我是没有告诉它的,非常聪明。

因为我这里有一个Claude Code的对比,对于同样的任务,Claude设计了一个很复杂的逻辑,但其实结果很不理想,第一页有10个funding机会,它每次都只能找到6,7个。

接下来它开始执行爬虫操作,这里碰到个问题,那就是代码运行没报错,但是也没有返回任何有用的信息。

这个挺正常的,因为爬虫总是需要修改几次的,但是Qwen3-Coder的操作让我有点儿大开眼界,它在之前的网页分析中得知UKRI是有feed的,然后它竟然很聪明的测试了下feed,结果可行。

所以它就直接重构了代码用feed来获取funding信息,结果不出意外的成功了,爬到的内容用json格式来保存,都没问题。

就这一点儿,我这两天各种Agent试过不下20次,没有一个找到用feed这个方法的。

接下来的网页可视化没问题,这一点儿对于绝大多数的AI都很简单,但是有个问题,那就是它只爬取到了20个信息,而实际上UKRI的网站上有超过100+项目,然后我就提出了这个问题。

Qwen3-Coder的反应的也很快,它做了两个操作(1)看看Feed最大的数量是多少,结果是20,所以这条路走不通了 (2)尝试返回到老办法,网页直接获取。

它接下来的操作是环环相扣的,可以很清楚的看到Agent需要的“感知-规划-行动”的循环一直都在,它行动的每一步都进行了细致的思考与调整。

这是最后做的半成品,从界面美观度,说实话不如Claude做的那么花里胡哨,但是对于一个信息集合站来说也足够了。

因为让我惊喜的是这一步,就是在我点击了其中一个funding后,它不是直接跳转到真实的地址,而是有个中间步,就是类似于对于这个funding的简要描述。

我觉得这个好的点有两个:首先我没有说,它这么做说明它“自主“的觉得这样好,其次就是我本来就打算加一个AI功能,就是调用AI工具对funding先进行初步的分析和筛选,最后做一个匹配。

那么多出来这一步,其实就是放AI分析的好去处。

与Qwen3-Coder的这次协作编程,整体体验下来非常流畅高效。首先它的任务成功率很高,处理长上下文的能力也很强。但最让我惊喜的,还是它对我编程意图的把握——基于这种深刻理解,它做出的几次“自主”决策,其精准度和前瞻性都相当出色。凭借如此卓越的表现,再结合其开源这一关键优势,我认为Qwen3-Coder已经具备了真正撼动Claude-4系列在编程领域领先地位的巨大潜力。