26年开年,从Claude Skills到Claude Cowork再到OpenClaw,总能引发AI发烧友们的疯狂讨论。
Agent能力进一步升级,生产力的大解放和流程的全面重构,似乎就在眼前。
那么国内发展到哪一步了呢?尤其是更多工作场景用的Windows生态,表现如何?
就最近,我的Windows电脑里,也多了一个“同事”:来自中国公司昆仑天工的桌面版Agent。
它不是那种只会聊天的 AI,是真能直接走进我文件夹、看懂我历史资料、帮我把杂活一口气做完的「桌面Agent」。
那种你平时要花一整天整理的文件、东拼西凑做的汇报材料、反复复制粘贴的数据表格,它可以自己翻、自己理、自己提炼重点,最后还直接把结果给你。
真的把Cowork这件事,做到了比工作助理还贴心。
01. 我第一次感受到,AI真的“看懂了整个项目”
像Claude Cowork,一直只支持苹果Mac电脑,从账号到权限,说实话,各种意义上对中国人不友好。
还得是咱们国产的PC端Agent,天工Skywork桌面版,率先支持了Windows。
以前用 AI,要不断喂材料:上传这个文档 → 再解释背景 → 再补一份表格 → 再说明这是谁写的。
AI 像一个永远刚入职的实习生。
而Skywork桌面Agent的变化是——它可以直接走进你的项目文件夹。
我做了一些测试:把一个混乱的项目文件夹丢给它,里面有各种笔记、纪要、图片、表格。
我说了一句话:“帮我整理这些资料,并做一份可以清晰展示并且交互的可视化网页。”
接下来发生的事情非常像个活人,就好像有人藏在背后帮我操作电脑——它是在理解一个完整项目,还顺手给做成网站了。
就像AI产品经理已经不再写PRD了,直接都是用Demo去演示需求思路,Skywork就好像是跳过了秘书式、助理式的普通整理,一步到位实现了汇报级的成果展示。
这是桌面 Agent 和网页 AI 的一个很大差别:有没有真的走进电脑文件夹里,能不能领会我存在本地数不清的历史信息,以及最终交付一个更基于本地、更深入洞察的结果。
处理图片,情况更复杂。
不知道大家有没有过,明明记得最近存了一张图在相册里,结果怎么也找不到。
电脑里存了上万张图片,却是用也用不上、删又舍不得,想分类整理又像面对代码屎山一样,无从下手。
Skywork能给图片去分类,不论是人物还是动物,都能分得清。
第一步是识别、分类,第二步还可以直接梳理好,用PPT来呈现。
它让人觉得非常有眼力价。
有点像那种惊才艳艳的实习生,上班第一天,就比很多老员工干得还好,让人只想感慨前途无量。
我第一次,有点嫉妒一个Agent,因为它比我强的地方,太多了。
02. 这个 AI 同事,会自己选“大脑”干活,让杂活消失
模型选得对不对,直接决定成品质量。
Skywork 桌面版有个让我很惊喜的能力:它可以在 Claude 和 Gemini 模型之间自动切换。
我不需要在外面切换模型,它自己知道什么时候该“用文科脑”,什么时候该“用理科脑”,什么时候综合在一起。
对比很多只能固定模型的桌面 Agent,这种多模型调度更像真实团队协作,都是不同问题,找不同专家,不会让一个人硬扛所有活。
真正让我上头的不是炫技功能,是那种,电脑里的“脏活累活”开始被悄悄接管的感觉。
比如这些高频又烦人的事情:
文件夹乱到不想点开
会议纪要要手动变成结构化表格
数据要来回在 Excel、Word、PPT 之间搬
做个介绍页还要找人搭网页模板
现在变成:一句话任务解决好,让Skywork自己去跑。
好比下面这个,处理银行对账单,生成excel表格,先识别再梳理再盘点。
这对模型的数学能力就很高。
慢慢产生一种感觉:我终于不再是算数、代码、写字的工人了,终于可以当家作主,自己做判断和决策。
很想说,Skywork这个桌面Agent帮我做的工作,也许不是最难的,但真的是最烦的。
那些高级的、有创意又好玩的活,让我来;那种又琐碎又麻烦、在垃圾堆里扒拉的事,让它来。
04. Skywork桌面版正在定义下一代生产力入口
如果把Skywork这次带来的桌面版Agent,放到更大的商业语境里看,它代表的也许是生产力入口的迁移。
过去二十年,企业软件的入口是浏览器和 SaaS,数据被上传到云端系统,人围着工具转;
而桌面 Agent 的逻辑正好相反——AI 主动进入本地工作环境,围着人的真实工作流转。
这意味着价值不再只来自“在线协作平台”,而来自谁能更深地嵌入操作系统层、理解本地文件上下文、接管跨软件的长链路任务。
从商业竞争看,这是一条和传统 SaaS 完全不同的赛道:它拼的不是功能模块数量,而是对真实办公场景的渗透深度,以及对复杂任务闭环的完成能力。
谁先成为“默认驻扎在你电脑里的 AI 员工”,谁就可能掌握下一代生产力分发权。
桌面 Agent 的分水岭并不在“能不能生成内容”,而在上下文边界的扩展能力。
桌面环境,天然就是一个复杂、动态、充满噪声的真实世界——
文件结构会变化、格式不统一、信息分散在不同软件里。
只有当 AI 具备 agentic 的循环决策能力,它才能从生成一段内容升级为把一件事情做完。
这也是为什么桌面 Agent 被视为 Agentic System 最早落地的高价值场景之一。
网页 AI 的上下文来自用户上传的只言片语,而桌面 Agent 的上下文来自整个项目文件夹、历史版本、跨格式资料以及文件之间的隐性关系,这对模型调度、文件理解、权限控制都提出了更高要求。
多模型自动路由的意义也在这里体现出来:
不同模型在逻辑推理、多模态理解、结构生成上的偏长被动态调用,Agent 才能在长链路任务中保持稳定输出,不致于在某一个环节智商掉线。
当上下文获取能力 + 模型调度能力 + 本地执行框架结合在一起时,AI 才真正具备从对话工具进化为生产力单元的技术基础。
而从Computer Use的技术演进角度看,让AI能点鼠标相对容易,但是让它能在操作系统层,建立可理解的环境模型,很难。
早期的Computer Use更像宏脚本自动化:按坐标点击、按流程执行,环境一变就失效了。
而新一代Agent强调语义层理解——它知道一个文件夹代表一个项目阶段,一张表格是一组结构化数据,一份 PPT 是一套表达逻辑。
这种从「像素级控制」到「语义级操作」的跨越,本质上是把操作系统,从图形界面转化为可推理的知识空间。
当 Agent 能把“看见桌面文件”转化为“理解工作上下文”,Computer Use才真正成为生产力能力,终于不再是拿来演示的demo和噱头。
两者结合的话,Agentic System提供决策循环的大脑结构,Computer Use让Agent有了进入真实数字环境的手和眼睛。
前者决定 AI 会不会思考和规划,后者决定 AI 能不能真正把规划落地执行。
看起来,Skywork已经在尝试把这两层能力,在桌面场景中稳定协同了。
这也是我看到的Skywork,对于未来Agent发展路线很有想象力的定义。
05. 这可能是AI第一次,真正走进日常
我们以前谈 AI 办公,总像是在谈一个外部工具。
开个网页、复制点内容、关掉继续干活。
但桌面 Agent 的形态变了。
AI 不再等你把世界切碎喂给它,而是开始进入你的真实工作环境,理解项目、理解文件结构、理解上下文。
就感觉,25年还显得虚空悬浮的Agent,已经很深嵌入到了工作的具体流程里。
我开始习惯,把杂活丢给Skywork,把精力留给判断、创意和真正重要的事情。
工作这件事本身,已经悄然进入了一个全新的阶段;而Agent,也进化成了完成度更高的版本。
也许再过一年,我们回头看现在,会觉得——2026年,是 AI 正式入职人类办公室的第一年。
世界是一个巨大的上下文,
而这次解锁上下文秘密的Skywork,
它不在空中、不在云端,
它就在你的桌面上。
下载地址:https://skywork.ai/desktop
热门跟贴