Claude Code、Codex、OpenCode已经成为开发者的日常工具,OpenClaw和Hermes正在走进普通用户的桌面。2026年被业内称为"AI Agent元年",但这些工具究竟如何运作?本文将用纯Python从零构建一个最简Agent,不带任何框架,只保留核心机制。
Agent的本质是什么?
打开网易新闻 查看精彩图片
一个AI Agent是借助人工智能自主达成目标的程序。它感知环境、进行推理、执行动作,循环运行直至目标完成。这与传统软件的关键区别在于:它不是一次性响应,而是持续的状态维护与决策迭代。
打开网易新闻 查看精彩图片
最简Agent只需四个组件:
1. 循环结构——保持Agent持续运行
2. 大模型连接——接入具备推理能力的AI
3. 用户输入通道——接收目标指令
4. 上下文记忆——保存对话历史,避免"失忆"
打开网易新闻 查看精彩图片
本文示例采用本地部署方案:通过Ollama运行gemma4:e4b模型(40亿有效参数),完全免费且可在个人设备运行。
核心代码解析
代码分为两个函数:get_llm_client()建立与本地Ollama的连接,agent_loop()实现主循环。关键机制在于messages数组——它同时承担系统指令存储、对话历史追踪、上下文窗口管理三重职能。
执行流程如下:用户输入被追加为user角色消息,完整对话历史发送至模型,返回的assistant内容再写回messages。temperature设为0.7平衡创造性与稳定性,输入"\exit"触发循环终止。
这个不足30行的实现揭示了现代Agent的底层范式:状态管理+模型调用+循环控制。后续可在此基础上扩展工具调用、多轮规划、记忆持久化等能力——但所有复杂系统都始于这个最小可行单元。
热门跟贴