用GPT-4跑一份财报分析,账单能买两杯精品咖啡。但真正的痛点不是钱——是当你把十万块仓位押在一个"可能幻觉"的数字上时,那种后背发凉的感觉。

hallucination(幻觉)在财务场景里不是理论风险。2024年某券商内部测试显示,通用大模型在处理多表合并计算时,小数点漂移率高达12%。这不是模型笨,是单一代理天生缺乏校验机制。

Google ADK(Agent Development Kit,代理开发套件)的解法很产品经理:别造一个全能神,造一个能互相挑刺的委员会。

三层验证架构:从"信我"到"验我"

三层验证架构:从"信我"到"验我"

Financial Research Agent的核心设计,是把传统投研流程拆成三个专职代理。

数据抓取代理只干一件事:从SEC EDGAR、Yahoo Finance等公开接口拉原始数据,输出结构化JSON。它不做判断,甚至不"理解"这些数据——就像交易所的行情员,只负责报数,不负责解读。

计算代理接过JSON,执行比率分析、DCF建模、同业对比。这里用了OpenRouter接入的免费模型层(DeepSeek、Qwen等),关键约束是:所有计算必须展示中间步骤,接受审计。

复核代理是最后的闸门。它拿不到原始数据,只能看到计算代理的输出,任务是反向验证逻辑一致性。比如毛利率突然跳涨20%,它会标记"请确认收入确认政策变更"——这种设计逼着前两个代理不能偷懒。

三层之间用ADK的会话状态(session state)传递数据,W&B Weave(Weights & Biases的LLM可观测性工具)记录完整调用链。哪一步出幻觉,追溯成本从"黑箱猜谜"变成"看监控回放"。

零订阅成本的实现路径

零订阅成本的实现路径

整个技术栈的月度账单理论上可以归零。

Google ADK本身是开源框架;OpenRouter聚合了多家模型的免费 tier,包括DeepSeek-V2.5、Qwen2.5-72B等足以处理财务分析的开源模型;W&B Weave的免费额度覆盖个人项目的全量追踪需求。GitHub仓库FinancialResearchAgent里,作者甚至写好了Docker Compose一键启动。

但这套系统的真正成本藏在别处:代理协作的延迟。

单次查询要经历"抓取→计算→复核"三跳,冷启动时延可能突破30秒。作者的对策是异步工作流设计——用户提交分析请求后,系统通过Webhook推送结果,而非阻塞等待。这对专业用户是可接受的:真正的投研本来就不是秒级决策。

从"AI用户"到"系统架构师"的门槛

从"AI用户"到"系统架构师"的门槛

项目文档里有个诚实的标注:"deliberately incomplete(故意未完成)"。

作者的目标读者不是找现成工具的人,是想理解多代理系统如何设计的人。代码里留了大量TODO:实时数据接入、多货币支持、合规报告模板。这些缺口恰恰是学习入口——你得自己决定,复核代理应该用规则引擎还是再挂一个大模型,状态存储用内存字典还是Redis。

这种设计哲学和LangChain、CrewAI等框架形成微妙差异。ADK更强调"代理即服务"的编排,而非预制工作流。换句话说,它给的是乐高基础块,不是成品模型。

一个值得跟踪的细节:W&B Weave的追踪数据显示,三层代理架构下,数值类幻觉的拦截率相比单代理提升了多少?作者在GitHub Issue里提到正在整理对比数据,但截至发稿尚未发布。

如果你现在就想动手,最省力的起点是fork仓库,把OpenRouter的API key换成自己的,然后让复核代理去挑第一份真实财报的毛病——它大概率能找到你肉眼忽略的矛盾。