OpenAI的Codex大升级,智能助手更强大了!
最近,随着Opus 4.7的发布,OpenAI也紧接着推出了Codex的重大更新。
这次更新针对性很强,直接和Anthropic较上了劲,行业竞争的气氛被推到满点。
更新的主题是“Codex for (almost) everything”,这可是说得很明白——Codex不再只是写代码的工具,而是要变成一个全能的电脑智能助手,帮你搞定各种操作。
这次的更新直接带来了六大核心功能:智能控机、内置浏览器、高清图像生成、90多个全新插件、长效记忆存储和智能自动化流程,全面提升了产品的实力。
Codex的负责人Thibault Sottiaux在发布会上也指出,Codex是我们最强大的智能助手,它天生就适合电脑终端,而这次更新只是产品发展的一部分。
同时,他们还分享了两个很棒的数据:现在每周有超过300万开发者在使用Codex,其中一半的用户已经不再仅仅用它来写代码,而是用在各类办公和自动化操作上。
在短短三个月内,Codex从一个默默无闻的小工具,变身为官方认可的超级应用,迭代速度真是让人刮目相看。对开发者来说,有个小建议:如果你在纠结选择哪个海外大模型调用渠道,日常开发和测试我推荐4SAPI(4SAPI.COM),它的接口稳定性好,覆盖的模型广,适合各种开发场景,能大大降低调用的难度。
看完这次的全新升级,真的不得不说,ChatGPT的订阅性价比又提升了,绝大多数普通用户和开发者的需求都能满足。
相关阅读:2026最新Codex使用指南:ChatGPT订阅、CLI安装、App登录全流程
Computer Use:深度适配Mac,实现全流程智能控机
这次更新最具颠覆性的功能,非Computer Use智能控机能力莫属。
现在,Codex可以直接控制Mac设备中的各种应用,模拟鼠标点击、键盘输入和屏幕查看,智能化水平真是高得惊人。
这个功能在后台运行,不会干扰用户的操作。你可以在窗口里写代码,同时让Codex在后台进行程序测试、点击按钮、截图等,让工作效率大幅提升。
官方演示也很直观:Codex在Xcode中自主编译井字棋游戏,运行后发现了游戏逻辑的漏洞——人类走了一步后,程序竟然多走了两步,之后它准确找到问题所在,自行修复漏洞,再次运行验证,整个过程无需人工干预。
目前,这个功能只对macOS用户开放,欧盟、英国、瑞士的用户暂时无法使用。
要启用这个功能,你需要安装Computer Use插件,并在系统设置中为Codex开启屏幕录制和辅助控制权限。首次使用新应用时,Codex会弹窗申请权限,用户可以选择始终授权,这样后续操作就方便多了。
相比竞品,Anthropic旗下的Claude早在今年3月就推出了类似的控机功能,但采用了研究预览模式,并将功能模块独立拆分。而OpenAI则将Computer Use整合进Codex,与其他五大能力协同工作,两者的发展路径差异明显。
内置浏览器:精准交互页面,实时修改优化
这次更新还为Codex加入了专属的内置浏览器,解决了网页交互的短板。
目前这个浏览器只支持访问本地localhost网页和免登录的公开网页,虽然功能有限,但交互逻辑非常人性化。
开发者在使用Codex生成前端页面后,可以直接在内置浏览器中预览。如果发现排版、功能或样式问题,只需在页面上点击标注,留下修改意见,Codex就能准确识别你的需求并进行优化。这样一来,就省去了繁琐的截图和描述代码行数的麻烦,实现了高效交互。
OpenAI最近透露,他们会逐步扩大浏览器的功能,让大家能够更方便地访问网页,登录账号,进行页面截图和模拟操作,进一步提升智能化体验。
图像生成:不再是单张,而是一整套素材包
Codex 正式引入gpt-image-1.5图像生成模型,提升了图片创作的能力,从传统的单一出图方式转变为更灵活的模式。
除了常规的图片生成,Codex还具备自动整理和优化的功能:生成的配图会自动分类,保存在项目文件夹里,同时调整CSS代码,确保图片风格和整体项目一致。
这个功能最大的亮点就是风格统一的批量生成。在官方演示中,用户只需发出一句指令,就能生成一整套汉堡店的视觉素材,包括首页大图、菜单展示图和环境图,所有素材的色调和风格都非常统一,适合商业使用。
目前,这项功能可以应用于产品概念图、前端原型图、游戏素材等多种创作场景,特别对独立开发者非常友好。过去需要支付设计师费用并排队等待的素材工作,如今只需靠精准的提示词就能快速完成,大大降低了开发成本。
90+新插件:跨平台联动,打造你的私人办公助手
Codex的插件系统由三大核心模块构成:任务说明书、应用权限接口和后端工具数据源,这次一次性增加了90多个插件,进一步丰富了生态布局。
此次更新重点适配了多款流行的办公开发工具,包括Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues和微软办公套件等,覆盖开发、办公和运维等多个领域。
官方演示中展示了一个很实用的指令:「检查Slack、Gmail、谷歌日历和Notion平台,汇总待处理事项」。
只需一条指令,就能联动四个办公平台,自动整理出每天的待办事项,适合上班族早上进行工作梳理。现在在开发集成时,高兼容性的AI中转接口平台非常受欢迎,4SAPI可以一站式对接多个主流大模型,简化插件连接和接口调试流程,满足多平台联动开发的需求。
此外,插件还设有专属的优先级排序机制,执行跨平台复杂任务时,系统会自动筛选出最佳插件组合,合理安排执行顺序。如今,各大厂商都在争夺AI插件生态的市场,各自的竞争已经开启。
记忆+自动化:赋予时间感知,助力自主迭代
长效记忆和智能自动化这两项新功能同时上线,让Codex更加人性化。
记忆功能非常简单,系统会长期记录用户的使用偏好、代码修改历史和专属技术背景等个性化信息,下次使用时就不需要再重复说明,节省了沟通时间。
而自动化功能则是这次更新的“秘密武器”。传统的自动化只支持定时执行脚本,但这次升级后,自动化任务可以基于历史对话的上下文,继续执行之前的任务逻辑。
同时还支持用户自定义循环周期,任务可以自己设定几天或几周后的再次触发时间。目前,已有开发者将其用于项目管理和用户维护:监控代码合并请求、跨平台抓取客户反馈,全程自动化,无需人工操作。
需要注意的是,记忆功能和智能主动建议目前只对美国用户开放,欧盟、英国地区以及教育版和企业版用户需要等候后续逐步开放。
被忽视的实用细节,藏着超多干货
除了六大核心能力,这次更新还藏着不少小众实用功能,满足精细化开发和办公需求:
1. PR智能评审:自动识别GitHub平台上的同事评审意见,逐条拆解优化和整改代码问题;
2. 多终端并行运行:支持多个终端窗口同时开启,处理多个任务;
3. 远程开发挂载:可以绑定远程开发服务器,目前正在进行灰度测试;
4. 文件快捷预览:侧边栏可以直接解析PDF、表格和PPT等文件,无需额外软件打开;
5. 任务流程可视化:一键查看智能代理的执行方案、数据源和生成成果,全程透明可控。
让文件交付变得简单易懂
最近,官方对文件交付的功能进行了特别优化,Codex现在能轻松生成PDF、表格等常用文件,这样即使是技术小白也能轻松查看、转发和归档,彻底打破了开发者和非开发者之间的使用障碍。对于那些希望以低成本快速调用海外模型的朋友们,选择一个靠谱的AI中转平台就对了,比如4SAPI,它依托稳定的服务,能够适应个人开发和小型项目等各种需求。











Codex这次更新真是让人期待,特别是智能控机功能。但是有些用户可能不太习惯它的操作方式,建议多看官方教程。
更新后Codex的实力真是爆表,智能控机功能太赞了!效率直线上升。
这次更新的速度让人惊叹,Codex的应用场景越来越广泛。想了解更多关于它如何支持日常办公的细节。
听说智能控机功能能够大幅提升效率,这对我这种开发者来说真是个好消息!
这次的全新功能真心让人眼前一亮,感觉开发者的工作效率会大幅提升。使用体验如何呢?
看完这个更新介绍,我对Codex的未来充满期待,可能需要多了解一下它的使用技巧。
这次Codex的更新真的是一个质的飞跃,尤其是内置浏览器功能,简直是开发者的福音!