大家好,我是程序员鱼皮。
AI 编程工具这东西吧,真的是风水轮流转。最开始大家在吹 Cursor,后来 Claude Code 大火,而这次轮到了 Codex。
Codex 桌面 APP 不仅能帮你写代码,还能直接操作你电脑上的文件、浏览器、甚至是桌面应用,用好之后甚至能顶一个团队!
本期我会从 Codex 安装到项目实战,从基础功能到核心特性,用 10 多个实战案例,手把手教你玩转 Codex。
不管你是想用它来编程开发、办公提效、还是搞一些好玩的创作,看完这篇都能直接上手。
干货密集,建议先收藏,找个安静的地方慢慢食用~
想要使用 Codex APP,你只需要准备一个 ChatGPT 账号。可以免费体验,但是有条件的话最好开个 Plus 会员(每月 20 刀,约 150 元),额度更充裕,足够日常使用了。
有了账号,直接去官网下载安装 Codex APP 就好:
https://chatgpt.com/zh-Hans-CN/codex/get-started/
目前支持 macOS 和 Windows(Linux 用户可以使用命令行版本的 Codex CLI)。
下载并安装后,登录你的 ChatGPT 账号,打开之后的界面长这样:
左侧是各种面板入口,包括对话管理、插件、自动化等功能。中间就是对话框,你跟 AI 所有的交互都在这里完成。
跟平时用的 AI 聊天工具差不多,还挺清爽的,不像传统 IDE 那么复杂,上手零门槛。
接下来我们直接开始用。
基本使用 直接开聊
安装好之后,跟你用过的其他 AI 工具一样,在对话框里输入内容发送就能开始聊天了。
适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。
我让它帮我查一下今天有什么 AI 编程方面的热点:
今天有哪些值得关注的 AI 编程热点?
Codex 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了。
这只是开胃菜,Codex 真正强大的能力是操作你本地的文件和电脑,下面我们试试。
文件操作实战 - 分析磁盘空间
点击左侧的项目入口,选择一个本地文件夹。你可以把它理解为给 AI 划定了一个工作空间,AI 能在这个范围内读取和操作文件。
比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。
在对话框底部,你可以看到权限模式的选项。这里有 3 个选择:
默认权限:AI 可以读取和编辑工作区的文件,需要额外权限时会问你
自动审查:AI 自动帮你审查操作
完全访问:AI 想干啥干啥,不会弹确认框
新手建议直接选「自动审查」,既省时又省心。
选好权限后,在对话框里输入提示词:
帮我分析这个文件夹的空间占用情况
找出所有超过 500MB 的大文件,逐个分析
最后按大小排序列出来,并给出清理建议
然后你就能看到 AI 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。
最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。
我主打一个听话,让 AI 帮我删除没用的预览文件:
删除预览文件
成功帮我节省了 6.8G 的空间,效果不错吧~
但如果我让 AI 删除一个工作区外的文件呢?会发生什么?
试试看,在当前工作空间,开启一个新对话,比如我让 AI:
帮我删除「鱼皮新书出版」目录下的所有文件
可以直接把这个目录拖拽到对话框中,然后执行任务:
如果你选择的权限模式是「默认模式」,AI 想删除文件的时候会弹出一个确认框,问你同不同意,防止 AI 搞乱你的电脑。
但由于我选的是「自动审核」,AI 自己完成了审核并批准,省去了人工操作的麻烦。
这样一来,你完全可以把 Codex 当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名,以前要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的?
查看使用情况
做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?
来,一起看看用了多少额度。
点击左下角的「设置」,点击「剩余额度」,就能看到你 5 小时内还剩多少配额、本周还剩多少比例,什么时候刷新。
Codex 的额度按 5 小时和 1 周来限制,Plus 用户的额度还是比较大方的,日常使用完全够。
你也可以在对话框里输入/状态,这种以/开头的快捷输入叫做「斜杠命令」,是 Codex 内置的快捷操作方式:
输入之后,Codex 会直接在对话中显示当前的上下文余量和额度信息。
OK,到这里你已经体验了 Codex 最基础的能力:对话 + 操作本地文件。恭喜,已经超过了 60% 的同学!
接下来我们提升一下难度,用 Codex 做一个完整的网站项目。过程中你会接触到不少 Codex 的核心用法,包括计划模式、AI 生图、浏览器预览、批注修改等等。
AI Agent 编程实战
在开始之前,先进入设置,把工作模式从「适用于日常工作」切换为「适用于编程」,这样 AI 的回复会更专业、更适合开发场景。
我要用 Codex 来为自己定制一个专属的「电子名片」。
把信息告诉 AI,它帮忙生成一个精美的网站。
还能用 AI 生图能力生成个性化的头像插画,不用自己去找素材。
做完之后发给别人,他们打开链接就能看到你的信息了。
第一步、计划模式,先讨论再动手
新建一个项目文件夹(比如叫namecard),在 Codex 中打开。
模型选择目前最新的 GPT-5.5,速度选「标准」就够了,智能程度选「高」。
权限我直接给了完全访问,省得它每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。
最关键的是,点击对话框左下角的 + 号,把「计划模式」打开。计划模式下,AI 不会直接开始写代码,而是先帮你规划方案、问你细节,确认没问题了再动手。
输入下面这段提示词,启动!
帮我生成个人电子名片网站,以下是我的信息:
- 姓名:程序员鱼皮
- 职业:程序员 / AI 编程博主
- 简介:前腾讯全栈开发,现自主创业,带团队开发了编程导航、面试鸭、鱼皮 AI 导航等产品
- 联系方式:GitHub: liyupi,网站: codefather.cn要求:
1. 帮我生成一张卡通风格的程序员头像插画
2. 提供多种风格主题可切换
3. 响应式布局,手机也能正常显示
4. 界面要有设计感,参考苹果官网的简洁风格
AI 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。
最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这个文档。
如果没有问题,就确认方案,然后 AI 就开始自主干活了。
它先是使用内置的 Image Gen 技能生成了卡通头像文件:
然后编写代码,一次性生成了多个文件:
写好代码后还会检查代码、自主打开浏览器测试验证,还考虑到了一些容错:
过了 7 分多钟,AI 完成了整个任务,全程不需要你手动操作~
我们可以看到所有生成的文件,点击可以查看文件里的代码:
还可以点击「审核」,打开侧边栏的审查面板,查看本次变更的所有文件:
Codex 底层用的是 Git(一种记录代码变更历史的工具)来管理所有文件的改动。你能看到每个文件新增了什么、删除了什么,还可以灵活地应用和撤销代码,后面进阶功能部分我会详细给大家讲解。
我们做的是纯前端静态网站,找到生成的index.html文件,右键在浏览器中打开,就能直接看到效果了。
PC 端的效果我觉得还不错,布局清晰、主题切换也很丝滑。
而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。
当然,你也可以直接让 AI 帮你运行网站。AI 会执行终端命令,启动开发服务器来运行网站。
点击访问地址后,Codex 会在右侧面板打开内置浏览器,便于你来预览效果。
如果某个地方不满意,你可以点击浏览器右上角的「批注」按钮,然后直接在页面上选中要修改的元素,写上你的修改意见,发送给 AI。
AI 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置。改完之后,刷新页面就能看到效果了:
方便是方便,不过这个速度真不敢恭维。。。
做完后我们再看一眼使用情况,这次完整项目消耗了多少额度,还好还好~
总结一下,要用 AI 开发一个网站,我们只要把需求告诉 AI、确认方案、等它自己写完并测试就好,中间几乎不用手动操作。
恭喜,看到这里你已经超过了 70% 的同学!
到这里你已经能用 Codex 从零开发一个网站、预览效果、按需修改了。接下来带大家看看它还有哪些核心功能,学完之后你不仅能做网站,还能让 AI 帮你操控浏览器抓数据、定时自动执行任务、甚至操控整台电脑。
核心功能详解 - 常用功能
接下来我把 Codex 的功能分成「常用功能」和「进阶功能」两大块来讲。
常用功能是日常会高频使用的,进阶功能则是有点儿门槛、但掌握后能让你效率翻倍的。
4.1 插件系统
在左侧的「插件」面板里,你能看到 Codex 的插件市场。
Codex 内置了不少精选插件,比如 Computer Use 操控电脑、Chrome 操控浏览器、Spreadsheets 表格处理、Presentations 演示文稿,这些是 OpenAI 官方提供的核心能力。此外还有大量编程类和工具类插件,涵盖网站部署、游戏开发、对接 GitHub 等各种场景,你可以在插件市场里按需搜索和安装。
比如我们来安装 Netlify 插件。Netlify 是一个免费的网站托管服务,装好插件之后,一句话就能把你做的网站部署上线,让别人都能访问。
点击安装 Netlify 插件,同意后会自动弹出浏览器,使用 GitHub 等方式登录 Netlify,一步步完成授权,最后 Codex 成功安装并连接了 Netlify。
然后我们用 Netlify 来部署之前开发完成的电子名片网站,在对话中通过@Netlify调用插件。
执行过程中,AI 会找我们确认,并自动创建一个新的 Netlify 项目来部署网站:
搞定!以后我想展示自己的信息,直接甩这个链接就行了:
还可以打开 Netlify 后台对项目进行管理:
你可以在 Codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等:
点击后台任务,还能看到具体的终端日志,记录了网站服务器什么时候收到了请求、请求了什么资源等信息:
同样的,如果你要处理 Excel 表格、做 PPT,使用对应的插件让 AI 帮你就好,生成的文件还能在侧边栏直接预览:
前面我们用的内置浏览器可以预览页面、做批注和修改,但如果想让 AI 真正去操控浏览器、自动点击、填表单、翻页,就需要 Browser Use 浏览器操作功能了。
使用 Browser Use
进入设置 → 浏览器,确保 Browser Use 功能已开启。你还可以在这里设置权限规则和禁止打开的域名:
在对话中通过@浏览器来调用这个能力。比如我让 AI 帮我打开一个网站并截图:
@浏览器 帮我打开鱼皮的面试刷题网站 mianshiya.com,找到 AI 相关的面试题库并截图
可以看到 AI 打开了浏览器,从主页找到了 AI 大模型面试题库,然后进入了详情页,成功完成了截图。不过有时候操作不太稳定,多试几次就好。
此外,你还可以安装 Codex 的 Chrome 扩展插件,它可以操控你电脑上已经登录的 Chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行不占屏幕。适合需要登录网站才能进行的操作,比如帮我在自己的后台批量分析和管理数据。
使用前需要先在你的 Chrome 浏览器中安装 Codex 扩展程序,跟着 Codex 的指引操作就好:
安装好之后,我让 AI 帮忙从我已经登录的面试鸭网站上抓取一些数据:
@Chrome 获取我在面试鸭 mianshiya.com 最新收藏的 5 个题目信息,并汇总成表格
可以看到 AI 不仅连接了我电脑上的 Chrome 浏览器,而且还识别到了我已经打开的标签页,会控制这些标签页,跳转到我的个人主页并抓取最新的 5 条数据:
最终抓取到的数据表格非常清晰,链接前面甚至还有图标~
如果说 Browser Use 只能操控浏览器,那 Computer Use 就是让 AI 操控你的整个电脑。AI 能看到你的屏幕内容、移动鼠标、点击按钮、打字,还能操作微信、飞书等任何桌面应用。
进入设置 → 电脑操控,安装 Computer Use 插件。
你可以在这里看到所有已连接的应用,比如前面装的 Chrome 扩展,其实也属于 Computer Use 体系的一部分。
我们来体验一下。用@电脑来调用,让 AI 帮我看看当前的桌面壁纸,然后生成一张类似风格的新壁纸:
@电脑 查看我电脑的桌面壁纸,然后用 AI 生成一个相似风格的新壁纸图片
首次使用时系统会弹出权限申请框,你需要授权 Codex 访问屏幕、截图等权限,否则 AI 看不到你的屏幕、也没法帮你点击操作。
效果不错吧,生成了一张非常精美的新壁纸,我觉得比原图还好看。。。今晚可以做个好梦了~
再来一个更实用的例子。让 AI 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中。
@电脑 帮我打开备忘录,记一条笔记:
- 今天跟鱼皮用 Codex 学了很多新东西
- 今天跟鱼皮用 Codex 学了很多新东西
- 今天跟鱼皮用 Codex 学了很多新东西
并从网易云音乐下载我最喜欢的一首歌,添加到笔记中
全程自主完成,不需要找我确认
可以看到 AI 会打开音乐 APP,有个小鼠标点击了下载按钮,成功下载了音乐文件「只因你太美」:
然后 AI 打开了备忘录,写入内容,并添加了音乐文件,能够顺利播放。
虽然过程有些曲折,但还是完成了任务,而且全程由 AI 自己操作,以后我可以直接让 AI 帮我写有图有文有音乐的笔记了。
但 Computer Use 目前只支持 macOS,而且缺点一大堆。不仅操作效率偏低,还很烧 tokens,刚才那个任务就用了近 8 万的上下文空间!此外,有些软件对 Agent 的支持度不高,AI 无法成功操控。
所以建议能用终端命令行和浏览器完成的操作,就不要用 Computer Use。
4.4 Skills 技能包
Skills 你可以理解为给 AI 提供的技能包,装了某个技能后,AI 在遇到相关任务时就能自动按照这套方法来干活,不用你每次都写一大堆提示词。而且技能是按需加载的,只有任务匹配时才会调用,不会浪费上下文空间。
进入左侧的「插件」面板,切换到「技能」Tab 页,在这里能够可视化安装和管理技能。
Codex 自带了几个内置的技能,比如 Image Gen 图片生成、OpenAI Docs 查官方文档、Skill Installer 安装社区技能、Skill Creator 创建新技能、Plugin Creator 创建插件等。
下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再来自己创建一个技能。
使用图像生成技能
先来看内置的 Image Gen 图像生成技能。
前面做电子名片的时候我们已经用它生成了卡通头像。除了头像之外,你还可以用它来做 UI 素材、海报、横幅、表情包等等。
这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮,可以先到 鱼皮 AI 导航网站 上找到 AI 生图的提示词模板,然后复制提示词模板。
然后在 Codex 对话框中输入$符号 + 技能名称,可以快速调用技能。并且把提示词模板、鱼皮的照片都提供给 AI:
$image-gen 生成这个人在直播带货,卖鱼皮的图片
提示词风格参考:
@从鱼皮AI导航拿到提示词模板
看看 AI 生成的图片,你觉得怎么样?是不是夯爆了?
不过图片生成比普通对话消耗的额度更多,用的时候留意一下剩余配额。
使用社区技能
内置的技能数量有限,还有很多宝藏在社区里。
比如我自己经常用的几个技能:用于联网搜索的 Firecrawl、用于获取最新技术文档的 Context7、用于美化前端页面的 UI UX Pro Max 等等。
另外,我之前写过一篇优质 AI 编程扩展大全,推荐了几十个好用的技能和 MCP,可以到我免费开源的 《AI 编程零基础教程》 阅读:
接下来我带大家实际安装一个社区技能,顺便整个活儿,让 AI 制作一个苹果风格的快闪动画视频。
首先,要安装动画制作技能 remotion-best-practices。可以使用skill-installer技能,它能帮我们快速安装其他技能。
对了,安装社区技能时要注意安全,由于我这里安装的是知名技能,就直接输入技能名称让 Codex 帮我安装了。如果你想安装不太知名的技能,更稳妥的方式是把技能的 GitHub 链接发给 Codex,让它帮你检查后再精准安装。
安装完成后,在技能管理面板里就能看到新增的技能了:
然后我们使用技能,让 AI 制作动画:
$remotion-best-practices 帮我制作一个苹果风格的快闪动画
文案:帮我舔着个老脸找观众要点赞的故事
搭配有节奏感的纯音 BGM
最终直接给我提供视频文件,必须自主完成任务
AI 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题:
最后 AI 生成了可直接播放的视频,来看看效果:
额,他好像理解错了我文案的意思哈哈,翻车了翻车了。。。
我感觉这种方式更适合做产品发布宣传片、知识点快闪卡、节日祝福视频这类节奏紧凑的短片。
而且我根本没认真写提示词好吧!
你可以指定时长、指定文案、利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学自己玩一玩。
创建自己的技能
除了用别人的技能,你还可以把自己常用的工作流程封装成技能,以后遇到类似任务一键复用。
技能的本质就是一个SKILL.md描述文件,加上一些配套的脚本和参考资料。SKILL.md里要写清楚这个技能是做什么的、什么时候触发、具体执行步骤,AI 读取后就知道该怎么干活。
创建技能的最佳方式是,先把一个任务流程跑通一遍,觉得满意之后,使用内置的$skill-creator技能,告诉 Codex 你的技能要做什么、什么时候触发、有什么细节需要注意,它就会帮你自动生成完整的技能文件。
实操一下,比如我们前面让 AI 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个「直播带货图片技能」:
$skill-creator 帮我把上述工作封装为「直播带货图片生成技能」
交互式引导用户输入信息,并生成图片
执行成功后,AI 不仅创建了技能文件,还贴心地教你怎么调用:
之后,使用这个技能,只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便~
看看效果,AI 自己识别到我提供的是商品图,也是精准复刻我之前提供的提示词模板:
MCP(Model Context Protocol)是一个开放协议,你可以把它理解为 AI 的万能插头,装上之后就能让 AI 连接各种外部工具和数据源,获取实时信息。
进入设置 → MCP 服务器,可以在这里添加和管理 MCP 服务。
点击「添加服务器」后,你需要手动填写服务器的配置参数才能完成添加,对新手不太友好,我最讨厌填表单了!
好在大部分时候,用前面讲的 Skills 就能解决 MCP 能做的事情,而且 Skills 的安装和使用体验更好。
此外,很多主流的扩展都提供了快捷安装 MCP 的命令,不用你自己手动填参数。
比如我带大家安装 Context7,它是一个可以实时获取最新技术文档的服务,开发网站的时候用它来查 API 文档特别方便。
在 Codex 右上角可以打开集成终端,在终端里输入一行命令就能安装:
npx ctx7 setup
选择安装 MCP server、为 Codex 安装,就搞定了。
安装后重启 Codex,在设置里的 MCP 服务器列表中能看到它。首次使用前,还需要进行身份验证,
在自动弹出的 Context7 网页中登录,然后同意授权。
授权成功后,就可以愉快地使用 MCP 了:
之后开发网站,尤其是需要集成 AI 能力的网站,都可以用 Context7 来获取最新的技术文档。你还可以把它当成一个学习辅助,让 AI 基于官方文档帮你讲解知识。
比如我用它来做 OpenClaw 小龙虾的学习助手,这也是利用 AI 学习的一种方式:
$context7-mcp 你是我的 OpenClaw 学习助手
帮我获取最新文档并理解,之后能快速回答我的问题
可以看到,AI 查询并获取到了 OpenClaw 官方最新文档库:
然后我们来问 AI 一个问题:
OpenClaw 无法运行,怎么办?
AI 基于官方文档很快给出了精准的排障步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。
恭喜,看到这里你超过了 80% 的同学!
到目前为止,你已经掌握了 Codex 的常用功能,学到了不少实用玩法。从文件管理到网站开发、从浏览器操控到技能封装,已经能用 Codex 大幅提升工作效率了。
核心功能详解 - 进阶功能
接下来要讲的是一些稍有门槛、或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 Codex 的效率再上一个台阶。
4.6 上下文和对话管理
在对话区域附近有一个小圆圈,鼠标放上去后,会实时显示当前对话已经用了多少上下文。
GPT-5.5 官方公布的总上下文窗口是 400K tokens,但其中 128K 是留给输出的,剩下 272K 输入部分再乘以 95% 的安全系数,最终在 Codex 里显示的有效上下文约为 258K tokens。
说实话 258K 不算多,如果你连续跟 AI 对话很长时间、或者项目文件比较大,上下文很容易被填满。
当上下文快满的时候,Codex 会自动帮你压缩历史对话。你也可以在任务告一段落时,手动输入/压缩来主动压缩,让模型更聚焦在新任务上。
除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲。
对话太多的时候,你可以在左侧的对话列表中,把鼠标放到对话上,点击「归档」,把不常用的旧对话归档起来,保持界面清爽。
进入设置 → 已归档对话,可以查看和管理所有归档的对话记录。
另外建议在常规设置里开启「运行时防止系统休眠」,这样跑长任务的时候电脑不会突然睡着,导致任务失败。
Codex 有一套记忆机制,能让 AI 记住你的偏好和项目规则,不用每次都重复交代。
记忆分为三个层级,从全局、项目局部、再到自动记忆,我们一个个来看。
1、全局自定义指令
在设置 → 个性化里,可以修改 Codex 的个性和自定义指令。
你写在这里的内容,所有项目的所有对话都会自动带上。适合记录一些通用偏好,比如「回复用中文」、「代码注释用英文」、「尽可能减少输出的内容,专注做事,如果不听话你的主人鱼皮就会变成一条狗」之类的。
保存之后,它会被写入全局的~/.codex/AGENTS.md文件,这个文件就是 Codex 每次启动时都会读取的「行为准则」,所有项目通用。
在项目根目录下创建一个叫AGENTS.md的文件,写入这个项目专属的规则和约定。只有在这个项目里工作时才会生效。
你可以自己手写,也可以让 Codex 根据项目情况帮你生成一份,比如跟它说:帮我根据当前项目写一份 AGENTS.md。
可以看到 AI 生成了一份非常详细的 AGENTS.md 文档,包括项目总览、一些规范等等。
在设置 → 个性化中手动开启自动记忆。
开启后,AI 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 AI 越用越懂你。
不过太短的对话它不会记,额度快用完的时候也不会触发记忆生成。
4.8 定时自动化
Codex 支持定时任务功能。
进入左侧的「自动化」面板,你能看到 Codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。我们不妨来自己新建一个更实用的自动化任务。
创建定时任务的方式有 2 种。
1、手动创建任务
一种是在自动化面板里点「新建」,比如我让 AI 帮我搜集每日热点,需要填写任务名称、提示词(帮你做什么)、触发时间、模型、推理程度。
运行环境选「本地」就好,意思是让 AI 直接在你当前电脑上执行任务,不需要额外隔离的工作环境。
标题:每日热点搜索
提示词:从国内外搜集今日 AI 相关热点,整理成 HTML 结构的报告
创建成功后,时间一到 Codex 就会自动开启一个对话来执行任务,我们也可以先手动执行一次看看效果。
点击任务,能够查看详细信息:
点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词:
另一种更自然的方式是,直接在对话里跟 Codex 说,让 AI 帮你创建任务。
比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。
所以我让 Codex 帮我自动整理,先选择项目,然后输入提示词:
帮我创建一个自动化任务
每小时扫描一次「鱼皮的图片库」中最近 3 小时的图片文件
并根据图片内容自动完善图片的中文名称
很快,AI 就自动帮你建好了,可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并自动选择了模型。
我们手动执行任务来测试一下,效果还不错吧,AI 会根据图片内容,自动给文件起一个能看懂的名字。
这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。
而且每次执行完,AI 还会把运行记录写入一个 Memory 文件,你随时可以回看历史执行情况,不用担心出问题了却发现不了。
你还可以结合 Skills 和插件一起用,比如每周自动生成周报 PPT、每日整理自己的学习笔记并同步到 Notion、每周用 Firecrawl 抓取竞品网站更新并生成分析报告等等。
4.9 桌面宠物
想不到吧,现在的 AI 工具已经卷到开始给用户增加情绪价值了。
1、使用内置宠物
进入设置 → 外观,下拉到底部的「宠物」区域,你会看到 Codex 内置了一排像素风的赛博宠物。
选一只后点击唤醒,桌面上就会出现一个悬浮的小家伙。
它不只是个装饰品,宠物会实时反映 Codex 的工作状态,比如 AI 在忙的时候它在干活,等你输入时安静待机,任务完成了会冲你挥手。就像一个跨应用的灵动岛,让你不用切窗口就知道 AI 干完没。
除了内置宠物,还有一个社区宠物库 PetDex,里面有两千多只玩家自制的宠物。
了解我的朋友肯定知道我要用哪个,搜索 kun,然后按喜欢数排序,一眼就能找到自己需要的:
选中宠物后,点击进入详情页,找到安装命令并复制。
然后打开 codex 的终端,执行命令进行安装,会把宠物文件下载到本地:
npx petdex@latest install kun-like
安装成功后,进入外观界面,选中刚刚安装的宠物。
然后我们回到 codex 主页,使用/宠物指令唤醒。我脑袋中已经响起那个熟悉的 BGM 了(噔),你听到了么?
你还可以通过 Codex 内置的$hatch-pet技能自定义生成宠物,上传照片或者文字描述都行。
比如我把自己的头做成宠物。AI 会先分析上传的图片,给宠物起个名字。
然后拆分出多个子任务并行处理,生成各种动作的精灵图帧(比如待机、奔跑、跳跃、失败等等),最后拼成一张完整的像素动画精灵图。
等待很长很长一段时间之后,AI 终于完成了任务,然后就能使用自己制作的宠物啦~
你还可以上传宠物到平台,和其他小伙伴分享。以后用 Codex 的时候,记得把我带在身边,保佑你 Bug 减减~
每次 AI 修改了文件,你都可以在侧边栏的「审核」面板里看到它改了什么。
这个面板会列出所有被改动的文件,展开能看到具体增加了哪些内容、删除了哪些内容。
如果你想决定哪些代码要保留,可以选择查看「未暂存」的文件,在这里你可以灵活应用和撤销修改。
大多数情况下,你不需要自己看代码,直接点击「暂存全部」就行,相当于认可了本次全部改动;如果不满意,可以直接「还原全部」,回到本次改动前的状态。
如果你不满意某个文件的改动,直接点旁边的「还原」按钮就能恢复原样;满意的话点「暂存」就能标记为待提交。
你也可以只保留部分改动。每个文件的改动会被自动拆分成多个代码块,每个代码块旁边都有独立的「暂存」和「还原」按钮,你可以逐块决定哪些保留、哪些丢弃。
确定好哪些代码要暂存之后,可以「提交」暂存的改动。提交就相当于给代码存了个档,确认这次的修改是你想要的。
Codex 还内置了提交代码、推送到远程仓库、创建 Pull Request 的能力,不用离开 APP 就能完成整个代码管理流程,非常方便。
如果你是专业的开发者,可以试试「工作树」模式。你可以在创建新对话时选择启动模式为「新工作树」:
这样 AI 会在一个隔离的分支中工作,不影响你当前的代码。很适合同时让多个 Agent 在同一个项目上并行干活,减少冲突。
如果你的项目托管在 GitHub 上,建议安装 GitHub 插件,可以直接在 Codex 里查看仓库信息、创建 Pull Request、做代码审查等等。
比如我让它帮我查一下自己最受欢迎的开源项目:
@GitHub 帮我查看自己公开的 Star 数最多的前 10 个项目
Codex 最近新上线了一个很酷的功能,用手机控制电脑上的 Codex APP 干活。
设置方法很简单,在电脑端 Codex 点击「设置 Codex 移动版」,然后点击开始设置,屏幕上会显示一个二维码。
然后在手机上打开 ChatGPT App(确保更新到最新版),扫描这个二维码,在 ChatGPT 中确认账号和工作区,完成可能需要的多因素认证步骤,就连接成功了。
连上之后,你可以随时随地通过手机给电脑上的 Codex 下达任务、审批 AI 的操作请求、查看执行进度、检查生成的代码和结果。你的项目文件、已安装的插件和技能、所有配置都在那台电脑上,手机相当于一个远程遥控器。有点 OpenClaw 小龙虾内味儿了哈?
除了手机连接电脑,你还可以从另一台 Codex App 设备继续未完成的工作。比如你在公司用台式机跑了个长任务,回家后在笔记本上打开 Codex 就能接着看结果、继续操作。
你可以在 Codex 的连接设置中管理已连接的设备,比如断开某个手机的连接、设置是否保持电脑唤醒等等。
恭喜,看到这里你超过了 90% 的同学!
Codex 使用感受
学会了怎么用 Codex 之后,我也分享一下自己使用 Codex 的感受吧。
Codex 适合零基础或者不想折腾 IDE 和命令行的同学,下载就能用,使用门槛很低。尤其适合已经是 ChatGPT 付费用户的人,不用额外花钱就能拥有一个全能 AI 助理。
我个人非常推荐大家体验一下,尤其是非程序员,这可能是目前最适合你的 AI 编程工具。
但对我来说,目前 Codex 还不能完全满足我日常 AI 编程的所有需求。
作为一名程序员和 AI 编程博主,我需要阅读和编辑代码、精细控制某一行改动、随时切换不同的 AI 模型来对比效果,而这些 Codex 目前做得还不够好,没有内置代码编辑器、阅读代码的体验也一般。
所以实际使用的时候还是会搭配 VS Code 代码编辑器,或者很多任务直接在 Cursor 里搞定。
而且 Codex 的版本管理完全依赖 Git,项目必须是 Git 仓库才行,新手有一定门槛。
切换模型不够灵活,桌面端默认只有 OpenAI 自家模型,想用其他的得去改配置文件或者用 CC Switch 之类的可视化工具。
而且目前对我来说最致命的是,GPT-5.5 在 Codex APP 的订阅模式下有效上下文只有 258K,做大型项目重构时跟其他 AI 编程工具和模型支持的 1M 上下文比,还是有差距。
不过每个工具都有自己的定位。Codex 更像一个什么都能做的「AI 助理 APP」,门槛最低;Cursor 更像一个兼顾代码编辑体验的「AI IDE」;Claude Code 更像终端里推理能力最强的 AI 大脑。
这几个工具的使用逻辑都差不多,学会一个再上手其他的会很快。
OK 就分享到这里。
看完这期,你应该已经掌握了 Codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。
其实 Codex 还有更多玩法和技巧,比如 Subagents 并行加速、Fork 分叉的妙用、自定义模型接入、Hooks 生命周期钩子这些。
如果本期视频点赞过万,我会尽快爆肝出 Codex 高级技巧篇!
对了,如果你想系统学习 AI 编程,可以看看我的免费开源教程 ,上千张图、几十万字,从 0 开始带你学会 AI 编程。本篇教程的文字版也会收录其中。
开源指路:https://github.com/liyupi/ai-guide
我是鱼皮,持续分享 AI 编程干货。觉得有用的话记得点赞收藏和关注。
也欢迎在评论区聊聊:你现在主力用哪个 AI 编程工具?觉得 Codex 怎么样?晒晒你的 AI 编程作品吧!
热门跟贴