管理层每月最头疼的事是什么?不是定KPI,是读完几十份开发月报后,手工挑出"修复了登录bug""发布v1.2版本"这些有效信息。我们团队就这么干了两年,直到发现三个致命问题。
第一,格式混乱。有人写"JIRA-2047:修复支付超时",有人就写"调了下"。三个月后连本人都忘了"调了下"是什么。第二,重复劳动。跨月的任务被反复登记,同一段重构代码能在三个月报里出现三次。第三,也是最要命的——我们试过把整月报告丢给ChatGPT整理,效果还行,但等于把全部项目动态交给了外部服务器。
打开网易新闻 查看精彩图片
对金融、医疗这类企业,这是红线。于是我们造了个完全本地运行的AI代理,只用CPU就能搞定。
架构很简单:Ollama跑Gemma 4 E2B模型负责理解文本,nomic-embed-text生成向量做去重,Jira API补全任务描述。定时任务触发后,原始报告进去,结构化工作清单出来。没有GPU,没有云调用,数据不出内网。
关键设计在"降噪"。开发报告里大量内容不是有效工作:会议记录、学习笔记、待办事项。我们用多轮提示词让模型先识别、再过滤、最后合并同类项。嵌入模型则把历史任务向量化,新报告进来先算相似度,重复内容自动合并。
效果?原本需要数小时的手工整理,现在几分钟跑完。更重要的是,敏感项目信息始终留在自有服务器。对于想用上AI又不敢碰云服务的团队,这套CPU-only方案证明了一件事:隐私和效率可以兼得,只要你愿意把模型缩到合适的大小。
热门跟贴