
石臻说AI
编辑:石臻
最近,OpenAI 又对 Codex 进行了升级,它的功能不仅仅局限于 Windows 系统了。现在,Codex 甚至可以“接管”整个 Windows 桌面,而且你可以通过 ChatGPT 的手机端远程启动、监控和管理任务。
乍一看,这似乎只是一个平台的适配,但实际上它标志着 AI 编程助手的角色发生了重大转变,从“编辑器的插件”变成了“个人电脑的操控者”。

在北京时间 5 月 30 日的凌晨,OpenAI 发布了一条简短公告:
Codex 的 Computer Use 现在正式支持 Windows。这意味着 Codex 不再仅限于代码仓库、终端和 IDE,它能直接看到并操控 Windows 电脑上的图形界面。
更令人振奋的是,ChatGPT 手机端也可以与 Windows 上的 Codex 连接。你可以在手机上启动新的任务、查看进度、添加指令,甚至审批操作,这让工作可以在 Windows 电脑上继续进行。
OpenAI 也很低调地表示:这只是一个初步体验,但未来的方向已经非常明确。
以前的 Codex 更像是一个强大的程序员朋友,尽心尽力地待在你的代码仓库里。而现在,它开始像一个远程桌面助手:你只需发出指令,它不仅能修改代码,还能打开应用程序、点击按钮、复现图形界面问题,甚至在浏览器中验证结果。
这次更新具体增加了什么功能
我们来逐一分析这些新能力。
首先,Codex App 已经覆盖 macOS 和 Windows。根据 OpenAI 的官方文档,Codex App 是一个桌面应用,用于并行处理 Codex 线程,具备工作树、自动化和 Git 功能,而 Windows 也成为了它的一个正式平台。
其次,Computer Use 现在支持 Windows。这里的意思并不是让 AI 写代码,而是让 Codex 能够看到并操作图形界面。比如,它可以打开某个桌面应用程序、测试按钮的操作流程、修改某些设置,甚至复现只能在用户界面上出现的问题。
第三,ChatGPT 手机端可以远程控制连接的 Windows 主机。官方的远程连接文档已经更新,你可以通过 ChatGPT 手机应用在连接的 Mac 或 Windows 设备上使用 Codex,启动新的线程、继续已有线程、发送后续指令、审批命令、查看差异和测试结果的截图。
把这三项功能结合起来,意义就变得更深远了。
这不单单是“Codex 发布了 Windows 版”,而是 OpenAI 正在努力将 Codex 打造成一个跨设备、跨界面、跨工作流的执行平台。
为什么 Windows 这么重要
如果单看开发者圈子,macOS 已经覆盖了很多 AI 编程用户。但若想在真实世界中完成工作,Windows 是必不可少的。
很多企业内部网络、财务系统、运营工具、传统客户端、硬件配套软件及行业软件,依然在 Windows 上运行。许多工作并不是一个 API 调用就能搞定的,也不是打开 VS Code 改几行代码就能结束的。
真正麻烦的任务往往是这样的:
- 一个老旧系统只有 Windows 客户端;
- 一个 bug 只在桌面应用中复现;
- 一个表单流程必须通过浏览器的登录状态完成;
- 某个设置项藏在多层菜单中,没有命令行入口;
- 一个测试需要观察界面变化,而不仅仅是查看单元测试结果。
过去,这些任务很难交给 AI,因为 AI 缺乏“手”。它可以告诉你如何点击,但无法替你真正去点击。
Computer Use 的出现正是为了解决这个问题。
当然,目前它还不是科幻电影中的全自动电脑管家。OpenAI 特别提示:Windows 上的计算机使用功能是在当前前台桌面上运行,Codex 会移动鼠标、输入文字、占用现有会话。这意味着,它更适合把一台 Windows 电脑专门留给它使用,或者在虚拟机中运行,而不是在你打游戏时让它偷偷操作。
不过,这种限制实际上说明了一点:OpenAI 并没有将其包装成“无感后台的魔法”,而是在真实操作系统的边界上不断推进。
手机端的潜力被低估了
在这次更新中,手机端的价值可能比 Windows 的支持更加值得关注。
许多人对“手机控制 Codex”的第一反应是:屏幕这么小,怎么写代码呢?
但手机端并不是让你在地铁上手动敲代码。它解决的是另一个问题:AI 任务越来越复杂,人根本不可能一直坐在电脑前盯着。
你可以先在电脑上配置好环境,启动 Codex。之后,在路上、吃饭时或开会的间隙,用手机检查一下:
- 它卡在哪一步;
- 它是否需要审批某个命令;
- 测试失败的原因是什么;
- 差异有没有跑偏;
- 要不要提醒它“别重构,先解决最小的问题”。
这就像是将使用 AI 的方式从“人坐在电脑前”转变为“电脑在桌子上工作,人用手机进行监督和协调”。
真正的效率提升不在于手机能写多少代码,而在于它将 AI 的任务从电脑屏幕前解放出来。
这已经不是 IDE 插件的竞争了
在过去一年里,AI 编程工具的竞争主要集中在 IDE 内部:比如补全的准确性、上下文的长度、Agent 的代码修改能力、PR 审核的智能化等。
但 Codex 现在走的方向更为广阔。
它不再仅仅是要成为 VS Code 中的一个按钮,而是希望成为一个连接本地文件、终端、浏览器、桌面应用、远程设备和手机端的工作代理。
这样的方向与普通 IDE 插件的边界显然不同。
IDE 插件擅长于在代码上下文中工作,而 Codex App 则在试图掌控“工作的发生环境”。代码只是其中一部分,图形用户界面、登录状态、浏览器、测试页面和系统设置同样都是上下文的一部分。
AI 编程的下一步,不是让模型多写几行代码,而是让它真正进入到工作现场。
这也是为什么 Windows 的支持显得如此重要。Windows 可能不是开发者心目中的“优雅平台”,但它却是现实世界中大量工作真正展开的地方。
现在能否完全信任它来工作
现在还不能完全放心。
Computer Use 的风险比普通的代码生成要高,因为它能够观察屏幕、点击按钮、操作浏览器的登录状态。OpenAI 在官方文档中也强调,要明确限定任务,敏感的操作要有人在场,并且要认真查看权限提示。
尤其是在 Windows 上,它是在前台桌面上运行,实际效果更像是“你暂时把鼠标和键盘借给了 Codex”。这适合自动化复现、测试、检查以及低风险操作,但不适合让它随意穿梭于支付、账号、安全设置和私密资料之间。
更稳妥的用法包括:
- 让它打开本地应用复现一个 UI bug;
- 可以让它用浏览器查看你刚修改的网页;
- 让它在 Windows 客户端帮你检查某个设置;
- 让它完成一些明确的小任务,这些任务是可以随时中断和回顾的;
- 手机端主要负责审批、补充指令和验收结果。
- Codex App 官方文档:https://developers.openai.com/codex/app
- Codex Remote Connections 官方文档:https://developers.openai.com/codex/remote-connections
- Codex Computer Use 官方文档:https://developers.openai.com/codex/app/computer-use
让你的 AI 变得更贴心
别把它看作什么都能干的代驾,其实更像是一个可以远程召唤的实习生:能做事情,但你需要给它设定一些界限。
真正值得注意的信号
这次公告最重要的地方,不只是 Windows 用户终于有了关注。
关键在于:OpenAI 正在将 Codex 从单纯的“写代码的 AI”转变为“能够操作电脑完成任务的 AI”。
桌面端负责提供环境,手机端则负责调度,Computer Use 让它能够跨越命令行和 API 的界限。一旦这些功能稳定下来,开发者的日常工作流程将会发生巨大的变化。
你可能不会一直盯着 AI 写代码。
你可以给它分配一个任务,然后离开电脑,回到手机上审批重要的节点,等你回来时再查看结果、验收并合并。
这就是 Agent 如何真正融入工作流程的样子:不是更会聊天,而是能够处理那些以前必须由人亲自完成的小步骤。
OpenAI 提到这是一个早期体验,没错。
但如果 Codex 能够在这复杂、喧嚣、真实的 Windows 桌面环境中站稳脚跟,它的未来可就不仅仅是“更强的代码助手”了。
它可能会真正演变成一个远程工作代理。
参考资料












从编辑器插件变成个人电脑操控者,这样的转变会对开发者的工作流程产生什么样的影响?
这更新会不会导致工作流变得更加复杂呢?有点担心。
Codex 能直接操控 Windows,真是让人眼前一亮!这功能太强大了,感觉工作效率要提升不少。
如果未来 Codex 能支持更多操作系统,那将会更有竞争力,值得关注。
如果 Codex 还能够集成更多的开发工具,那将会大大提升开发效率,值得期待。
如果未来能支持更多图形界面操作,那Codex的应用场景会更广泛吧?
这次升级能否让那些习惯用 Windows 的开发者更好地融入 AI 编程的世界?
这次更新让我想起了科幻电影中的智能助手,终于在现实中实现了!