难以置信!OpenAI 给 Codex 装上 Windows 之手,真是太酷了!

难以置信!OpenAI 给 Codex 装上 Windows 之手,真是太酷了!

石臻说AI

编辑:石臻

最近,OpenAI 又对 Codex 进行了升级,它的功能不仅仅局限于 Windows 系统了。现在,Codex 甚至可以“接管”整个 Windows 桌面,而且你可以通过 ChatGPT 的手机端远程启动、监控和管理任务。

乍一看,这似乎只是一个平台的适配,但实际上它标志着 AI 编程助手的角色发生了重大转变,从“编辑器的插件”变成了“个人电脑的操控者”。

难以置信!OpenAI 给 Codex 装上 Windows 之手,真是太酷了!

在北京时间 5 月 30 日的凌晨,OpenAI 发布了一条简短公告:

Codex 的 Computer Use 现在正式支持 Windows。这意味着 Codex 不再仅限于代码仓库、终端和 IDE,它能直接看到并操控 Windows 电脑上的图形界面。

更令人振奋的是,ChatGPT 手机端也可以与 Windows 上的 Codex 连接。你可以在手机上启动新的任务、查看进度、添加指令,甚至审批操作,这让工作可以在 Windows 电脑上继续进行。

OpenAI 也很低调地表示:这只是一个初步体验,但未来的方向已经非常明确。

以前的 Codex 更像是一个强大的程序员朋友,尽心尽力地待在你的代码仓库里。而现在,它开始像一个远程桌面助手:你只需发出指令,它不仅能修改代码,还能打开应用程序、点击按钮、复现图形界面问题,甚至在浏览器中验证结果。

这次更新具体增加了什么功能

我们来逐一分析这些新能力。

首先,Codex App 已经覆盖 macOS 和 Windows。根据 OpenAI 的官方文档,Codex App 是一个桌面应用,用于并行处理 Codex 线程,具备工作树、自动化和 Git 功能,而 Windows 也成为了它的一个正式平台。

其次,Computer Use 现在支持 Windows。这里的意思并不是让 AI 写代码,而是让 Codex 能够看到并操作图形界面。比如,它可以打开某个桌面应用程序、测试按钮的操作流程、修改某些设置,甚至复现只能在用户界面上出现的问题。

第三,ChatGPT 手机端可以远程控制连接的 Windows 主机。官方的远程连接文档已经更新,你可以通过 ChatGPT 手机应用在连接的 Mac 或 Windows 设备上使用 Codex,启动新的线程、继续已有线程、发送后续指令、审批命令、查看差异和测试结果的截图。

把这三项功能结合起来,意义就变得更深远了。

这不单单是“Codex 发布了 Windows 版”,而是 OpenAI 正在努力将 Codex 打造成一个跨设备、跨界面、跨工作流的执行平台。

为什么 Windows 这么重要

如果单看开发者圈子,macOS 已经覆盖了很多 AI 编程用户。但若想在真实世界中完成工作,Windows 是必不可少的。

很多企业内部网络、财务系统、运营工具、传统客户端、硬件配套软件及行业软件,依然在 Windows 上运行。许多工作并不是一个 API 调用就能搞定的,也不是打开 VS Code 改几行代码就能结束的。

真正麻烦的任务往往是这样的:

  • 一个老旧系统只有 Windows 客户端;
  • 一个 bug 只在桌面应用中复现;
  • 一个表单流程必须通过浏览器的登录状态完成;
  • 某个设置项藏在多层菜单中,没有命令行入口;
  • 一个测试需要观察界面变化,而不仅仅是查看单元测试结果。

过去,这些任务很难交给 AI,因为 AI 缺乏“手”。它可以告诉你如何点击,但无法替你真正去点击。

Computer Use 的出现正是为了解决这个问题。

当然,目前它还不是科幻电影中的全自动电脑管家。OpenAI 特别提示:Windows 上的计算机使用功能是在当前前台桌面上运行,Codex 会移动鼠标、输入文字、占用现有会话。这意味着,它更适合把一台 Windows 电脑专门留给它使用,或者在虚拟机中运行,而不是在你打游戏时让它偷偷操作。

不过,这种限制实际上说明了一点:OpenAI 并没有将其包装成“无感后台的魔法”,而是在真实操作系统的边界上不断推进。

手机端的潜力被低估了

在这次更新中,手机端的价值可能比 Windows 的支持更加值得关注。

许多人对“手机控制 Codex”的第一反应是:屏幕这么小,怎么写代码呢?

但手机端并不是让你在地铁上手动敲代码。它解决的是另一个问题:AI 任务越来越复杂,人根本不可能一直坐在电脑前盯着。

你可以先在电脑上配置好环境,启动 Codex。之后,在路上、吃饭时或开会的间隙,用手机检查一下:

  • 它卡在哪一步;
  • 它是否需要审批某个命令;
  • 测试失败的原因是什么;
  • 差异有没有跑偏;
  • 要不要提醒它“别重构,先解决最小的问题”。

这就像是将使用 AI 的方式从“人坐在电脑前”转变为“电脑在桌子上工作,人用手机进行监督和协调”。

真正的效率提升不在于手机能写多少代码,而在于它将 AI 的任务从电脑屏幕前解放出来。

这已经不是 IDE 插件的竞争了

在过去一年里,AI 编程工具的竞争主要集中在 IDE 内部:比如补全的准确性、上下文的长度、Agent 的代码修改能力、PR 审核的智能化等。

但 Codex 现在走的方向更为广阔。

它不再仅仅是要成为 VS Code 中的一个按钮,而是希望成为一个连接本地文件、终端、浏览器、桌面应用、远程设备和手机端的工作代理。

这样的方向与普通 IDE 插件的边界显然不同。

IDE 插件擅长于在代码上下文中工作,而 Codex App 则在试图掌控“工作的发生环境”。代码只是其中一部分,图形用户界面、登录状态、浏览器、测试页面和系统设置同样都是上下文的一部分。

AI 编程的下一步,不是让模型多写几行代码,而是让它真正进入到工作现场。

这也是为什么 Windows 的支持显得如此重要。Windows 可能不是开发者心目中的“优雅平台”,但它却是现实世界中大量工作真正展开的地方。

现在能否完全信任它来工作

现在还不能完全放心。

Computer Use 的风险比普通的代码生成要高,因为它能够观察屏幕、点击按钮、操作浏览器的登录状态。OpenAI 在官方文档中也强调,要明确限定任务,敏感的操作要有人在场,并且要认真查看权限提示。

尤其是在 Windows 上,它是在前台桌面上运行,实际效果更像是“你暂时把鼠标和键盘借给了 Codex”。这适合自动化复现、测试、检查以及低风险操作,但不适合让它随意穿梭于支付、账号、安全设置和私密资料之间。

更稳妥的用法包括:

  • 让它打开本地应用复现一个 UI bug;
  • 让你的 AI 变得更贴心

    • 可以让它用浏览器查看你刚修改的网页;
    • 让它在 Windows 客户端帮你检查某个设置;
    • 让它完成一些明确的小任务,这些任务是可以随时中断和回顾的;
    • 手机端主要负责审批、补充指令和验收结果。

    别把它看作什么都能干的代驾,其实更像是一个可以远程召唤的实习生:能做事情,但你需要给它设定一些界限。

    真正值得注意的信号

    这次公告最重要的地方,不只是 Windows 用户终于有了关注。

    关键在于:OpenAI 正在将 Codex 从单纯的“写代码的 AI”转变为“能够操作电脑完成任务的 AI”。

    桌面端负责提供环境,手机端则负责调度,Computer Use 让它能够跨越命令行和 API 的界限。一旦这些功能稳定下来,开发者的日常工作流程将会发生巨大的变化。

    你可能不会一直盯着 AI 写代码。

    你可以给它分配一个任务,然后离开电脑,回到手机上审批重要的节点,等你回来时再查看结果、验收并合并。

    这就是 Agent 如何真正融入工作流程的样子:不是更会聊天,而是能够处理那些以前必须由人亲自完成的小步骤。

    OpenAI 提到这是一个早期体验,没错。

    但如果 Codex 能够在这复杂、喧嚣、真实的 Windows 桌面环境中站稳脚跟,它的未来可就不仅仅是“更强的代码助手”了。

    它可能会真正演变成一个远程工作代理。

    参考资料

    • Codex App 官方文档:https://developers.openai.com/codex/app
    • Codex Remote Connections 官方文档:https://developers.openai.com/codex/remote-connections
    • Codex Computer Use 官方文档:https://developers.openai.com/codex/app/computer-use
来源:百家号
原文标题:OpenAI 刚给 Codex 装上了 Windows 之手
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《难以置信!OpenAI 给 Codex 装上 Windows 之手,真是太酷了!》有8条评论

发表评论