
这段时间以来,社交媒体上对 Codex 的评价是好评如潮。
有网友发现,现在邀请一位朋友加入 Codex ,就可以重置速率限制。
即便邀请的用户并非新用户或订阅用户,只要受邀用户通过链接打开 Codex 后发送几条消息,就能获得一次重置的机会。

Codex 官方也听到了用户的反馈,一边高调宣传即将并入 ChatGPT,未来我们打开全新大改版的 ChatGPT 应用时,可以选择使用 Codex 还是 ChatGPT 来回答。
另一边,他们这几天在 OpenAI 官网一口气更新了十几个真实世界的工作流程,从常见的部署网页和应用、直接构建一个 Mac 或 iOS 应用,到大型的项目管理、150 个小时的科研任务,以及各种工作中的琐碎业务,都有相应的使用案例。
这些教程大概是帮助我们快速上手 Codex 的最佳指南,很好地解决了 Codex 能做什么,如何使用 Codex 的问题。
Hey Siri,打开微信发消息给妈妈,说 XXXX
请先解锁 iPhone
Siri 做不到,Codex 现在也做不到操作微信。
Codex 的 Computer Use 功能,主要是允许 AI 像我们一样操作电脑界面,通过点击、查看和输入来完成任务。这项功能适合的场景包括跨应用任务,如收集笔记、更新记录、在不同位置间复制细节、回复信息等。

在官方的使用案例里,他们举的例子有简单地放首音乐,也有涉及在不同应用之间切换。
@Computer 放点音乐帮我集中注意力。
@Computer 请帮我把 Notes 里的面试笔记添加到飞书里。
@Computer 请查看我的企业微信并添加提醒,提醒我今天结束前需要完成的所有事项。
具体的使用方式,我们先要在 Codex App 里面找到 Computer Use 并确认已经开启,接着在对话框里,输入指令的开头加上 @Computer ,或者提及特定的应用程序,例如 @Slack 或 @Messages 等。
选择好 Computer Use 插件之后,描述一下任务以及我们想要的结果,当 Codex 需要访问权限时,批准访问,然后让它在后台继续执行任务。

使用 Computer Use 的几个注意事项,像是确保运行时 Mac 不会锁定,或者在 Codex 里打开「锁屏操作」功能,还有 Codex 使用电脑上的应用时,我们可以在自定义设置中,告诉 Codex 默认浏览器是哪个。
以及不要使用两个 Computer Use 的任务线程来控制同一个应用,每一个线程结束后都可以要求 Codex 总结和优化该任务,甚至是将这套工作流程变成可重复的模式。
平时让 AI 干活,很需要我们站在旁边盯着,它做一小步停一下,问下一步怎么办,我们得一直搭着手。
/goal 想解决的就是这件事:给 Codex 一个长期目标,让它自己照着这个方向一直做下去,干完一轮也不停。
官方指南里,几个典型的用法是那种比一句提示词大、又比一整张待办清单小的任务,目标明确、能自己验证、做到什么程度算完都说得清。
项目迁移:不管是把游戏搬到新技术栈、把移动应用搬到新平台,还是把整个代码库换个框架,都可以用 /goal 让 Codex 把迁移一路跑完。
做原型:从零做一个新应用、新游戏或新功能时,可以用 /goal 让 Codex 交出一版打磨过的初稿。你可以写一份 PLAN.md,把想做成什么样讲清楚,让它照着做。
调提示词:手上有一套测试集,就能用 /goal 拿评测结果来优化提示词。Codex 会去看哪些案例失败了、改提示词、重跑评测,一直迭代到分数上去,或者到了你定的收尾条件为止。

对于如何写好一个能稳稳跑起来的目标,先给它一个明确目标和一个收尾条件;告诉它先去读哪些文件、文档、issue、日志或计划;定好用哪条命令、哪个产物来证明进度;让它分阶段做,顺手记一份简短的进度日志;过程里我们随时用 /goal 看状态;跑完、卡住或者要换方向时,再暂停、继续或清除。
做 PPT 最磨人的那步,常常是排版。Codex 自带两个技能:$$slides 用 PptxGenJS 直接读写 .pptx,$$imagegen 负责生成配图。
OpenAI 官方给的参考提示词是,
使用 $$slides 和 $$imagegen 技能,按以下方式编辑此幻灯片:
– 如果存在,请在每张幻灯片的右下角添加 logo.png 文件
– 在幻灯片 X、Y 和 Z 上,将文本向左移动,并使用图像生成功能在右侧生成插图(风格:抽象、数字艺术)。
– 尽可能将文本保留为文本,将简单的图表保留为 PowerPoint 原生图表。
– 添加以下幻灯片:[在此处描述新幻灯片]
– 在新幻灯片和新文本中使用现有品牌标识(颜色、字体、布局等)。
– 将更新后的演示文稿渲染成幻灯片图像,检查输出结果,并在交付前修复布局问题。
– 在交付之前运行溢出和字体替换检查,尤其是在牌组密集的情况下。
– 创建一批相关图像时,保存可重复使用的提示或生成说明。
除了从零开始做,一页页描述内容和整体风格,有 logo、图片就丢进同一个文件夹方便它取用。
我们还可以让 Codex 来处理周报、月报、季报这种,定期更新模板,让它总结一份 guidelines.md 确定好内容、结构和更新方式,再配合别的技能拉对应的数据,比如给股东的季度汇报,换上新数字和洞察就行。
而修改现成的 PPT,也可以直接在对话框里,要求 Codex 修改间距、文字错位这类毛病。

手上有几张截图、一份简短的设计说明,或者几张找灵感的参考图,Codex 能照着做成响应式界面,同时顺着项目里已有的写法来,即原有框架和语言,不会另起一套。
再配上 $playwright,Codex 能在真实浏览器里打开页面,按不同屏幕尺寸跟我们上传的截图逐一对照,反复调到接近为止。
参考提示词如下,
请以我提供的屏幕截图和注释为依据,在当前项目中实现此用户界面。
要求:
– 重用现有的设计系统组件和标记。
– 将屏幕截图转换为此存储库的实用程序和组件模式,而不是发明一个并行系统。
– 间距、布局、层级和响应行为要紧密匹配。
– 尊重仓库的路由、状态和数据获取模式。
– 使页面在桌面和移动设备上都能响应。
– 如果截图中的任何细节不明确,请选择最简单但仍符合整体方向的实现方式,并简要说明假设。
验证:
– 将最终的用户界面与提供的屏幕截图进行比较,包括外观和行为。
– 使用 $playwright-interactive 检查 UI 是否与引用匹配,并根据需要进行迭代,直到匹配为止。
做游戏大概也是能看出 Codex 不只会写代码还懂设计的场景之一。一个真正的游戏,要有写下来的玩法概念、渲染层、前端外壳、后端状态、美术素材,还得不停地调画面和手感。
动手搭架子之前,先让它写一份 PLAN.md,把游戏拆成具体几块:玩家目标、核心循环、操作和输入、胜负条件、难度和成长、视觉方向、技术栈和部署假设、里程碑的先后顺序。
再写一份 AGENTS.md,按照官方的教程,可以参考下面的写法。
游戏名
<游戏类型>
技术栈:
– 前端 NextJS(部署在 Vercel)
– 渲染用 <填技术>
– 后端 Fastify + WebSocket(部署在 <平台>)
– 数据库 Postgres,缓存和 pub/sub 用 Redis
– 生成式 AI 功能走 OpenAI
约定:
– 每做完一个功能就用 build / test 命令验一下
– 做新功能时照着 PLAN.md 来
– 把思路和决定记在 .logs 里,迭代时回头查
– 用 playwright 测画面效果,不对味就改
– 用 imagegen 出素材,每出一批就把 prompt 存进 .prompts,方便以后接着出同款
– 用 Context7 MCP 拉 <渲染框架> 的文档
把 AGENTS.md 里提到的技能都装上:$$imagegen 出美术素材,$$playwright 在真实浏览器里测游戏,$openai-docs 拉最新的 OpenAI API 文档,需要的话再加个 Context7 MCP 拉渲染框架的文档。
接下来 Codex 会照着计划先做出第一版。如果要生成的图很多,这一版可能得跑上好几个小时,Token 开始疯狂燃烧。不过借由 Playwright 的能力,Codex 可以自己在浏览器里试玩、验证游戏效果,中间基本不用我们管。计划写得越细,第一版出来就越像样。
我们让 Codex 自己写了一份游戏的 Plan.md,输入提示词「Use $playwright-interactive, $imagegen, and $openai-docs to plan and build a browser game in this repo.
Implement PLAN.md, and log your work under `.logs/`.」然后生成了一个比较完善的小游戏。
Codex 能干的不止写代码,它也能在科研里当一个长期干活的研究助手。用户给出方向和判断,它去实现、取证、打分、反复迭代。
其中一个案例是改模型架构。假设手上有个蛋白质折叠的假设,「让模型多表示一些高阶的几何结构,会不会学得更好」,可这种想法一遍写不完,得反复试。
用 Codex 的 Goal Mode,给它三样东西:一个划好边界的科学方向、一个能跑的基线模型、一套能自动打分的基准,它就会照着这个目标一路爬分,实现、测试、记实验、查故障、再改。

官方给出的例子里,Codex 连着跑了 150 多个小时,产出了一个叫 SimplexFold 的实验性架构。
另一个是给药物靶点排序。类似任务的麻烦点,在于证据散在十几个数据库里,遗传学、临床、文献、表达数据各管一摊。
用 Life Science Research 插件,Codex 能并行去各家数据库取证、每条证据线各自按 1-5 分打分,最后汇成一张打分表加一份排名,还能配上热力图之类的图。

在 OpenAI 官网给出的用例还有很多,我们这里只是列举了部分热门的用法。感兴趣的朋友可以去 OpenAI 开发者官网 developers.openai.com/codex/use-cases,尝试不同的案例。

还有网友发现,现在邀请一位朋友加入 Codex ,就可以重置速率限制,即便邀请的用户并非新用户或订阅用户,只要受邀者通过链接打开 Codex 后发送几条消息,就能获得一次重置的机会。