实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

OpenAI又给Codex来了个大升级!

大家好,最近OpenAI悄悄推出了Codex for Chrome的扩展功能。就在5月7号,它们正式宣布这个功能上线,意味着Codex可以直接在用户的Chrome浏览器里工作,帮你完成已经登录的网站和工具上的任务。

根据官方的说法,接入这个新功能后,Codex能够读取网页内容、操作系统内部、浏览后台、填写表单等等。而且,用户还能选择Codex可以访问哪些网站。简单来说,现在的Codex真的是可以“接管”你的Chrome浏览器了。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

(图源:OpenAI)

看完官方介绍,大家可能会觉得这个新功能很不错,但其实体验过之前OpenAI推出的ChatGPT Atlas的朋友应该知道,理想和现实之间总有些差距。因此,我们雷科技AGI(ID:leikejiagi)决定亲自试试看。

接入Codex,浏览器开始自己“动”起来了

使用Codex for Chrome的过程其实不复杂,分两步就能搞定。首先,在Chrome浏览器里找到扩展功能,去Chrome应用商店搜索“Codex”进行安装。安装完后,它会出现在浏览器右上角,但这时还没有连接。

接下来,打开Codex,在设置里找到“电脑操控”,把“Google Chrome”这个插件安装上,完成后点击激活,就能成功连接了。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

我们的第一次测试选择了一个简单的任务:让Codex for Chrome帮我们整理标签页。发出指令后,Codex开始思考,这个过程中我们根本不用担心Chrome在干什么,它会在后台自动运行。

虽然操作看似简单,却让Codex遇到了一点小麻烦。最开始它没有完全识别到所有的标签页,而且没有专门的控件来执行这个操作。于是,它决定先关闭所有标签页,然后再按分类顺序重新打开。遗憾的是,第一步就出错了,Codex误操作把所有页面都关闭了,但却没记录下具体网址,所以没法再打开。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

接下来,我们测试Codex for Chrome在数据整理上的能力。我们让它唤醒Chrome,收集苹果、华为和小米最新旗舰手机的信息,并输出资料卡,同时给我们5个选题建议。这次测试非常顺利,我们可以清晰地看到它在调用Chrome进行信息搜索和整理,整个过程大约花了三分钟。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

提供的5个选题建议超出了我的预期,涉及到影像、屏幕、AI大模型等热门话题,看来Codex还是挺了解读者想看的内容的。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

既然这个任务不算太难,那我们干脆来个长点的任务吧。我让Codex在Chrome上找到Deepseek,并写一篇符合雷科技风格的文章,主题正好用之前分析三款旗舰手机时的建议选题,全程让它自己操作。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

这次Codex for Chrome的反应速度很快,基本上30秒就把指令完整贴到了Deepseek上,开始写文章,完成也只花了大约1分钟。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

然后我们又尝试了更复杂的操作,让Codex for Chrome制作一份AI新闻日报的表格。因为我之前已经给Codex安排过相关的技能,所以这部分的进展还是挺顺利的,大概1分钟就完成了信息的收集。接下来就是打开腾讯文档,新建表格,把内容粘贴进去,整个过程也算顺利,偶尔会出现识别不准确的问题,但都能及时纠正过来。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

从目前的体验来看,Codex for Chrome的实用性还是相当高的。一方面,Codex的能力确实处于领先水平,依托它来执行的操作基本上不会出现太大的错误,至少我们尝试的几种方法都没有完全做不到的情况;另一方面,打通Chrome和Codex的最大优势在于,用户无需更换其他AI浏览器就能实现相同效果,降低了用户的适应成本。

OpenAI这次聪明地选择了辅助而不是替代

当我们看到OpenAI推出这个扩展应用时,脑海中不禁联想到之前被冷落的ChatGPT Atlas。作为OpenAI的首款AI浏览器,它曾承载着很多希望,但大家也知道,ChatGPT Atlas并没有带来太大变化。

包括Firefox、Atlas和美团光年团队开发的Tabbit浏览器在内,这些AI浏览器一直在告诉用户,现代浏览器不仅仅是用来浏览网页的工具,它应该能理解你正在看的内容,知道你接下来要做什么,甚至在需要的时候直接帮你完成操作。

比如Atlas,它能在你浏览网页、查资料、做研究时,AI会在旁边协助,必要时还能进入代理模式,自动化处理任务。但问题是,大家还是习惯在Chrome上处理工作,这个习惯很简单,因为浏览器不仅是一个普通的应用,它承载了书签、密码、历史记录、插件、登录状态等,很多人对某些按钮的位置有固定的偏好。而且,Chrome目前的扩展功能也是最多的。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

所以,再回头看Codex for Chrome,我认为OpenAI这一招挺有意思。或许是因为ChatGPT Atlas没有成功,OpenAI重新思考了一个问题:既然用户习惯无法改变,那就在用户的习惯范围内赋予更强的能力。

虽然都是AI主导,但它们之间还是有区别的。Atlas和Tabbit更像是浏览器+AI,浏览器是主角,而AI则是核心体验,尤其在搜索和信息总结等基于网页的能力上表现突出。而Codex for Chrome其实是借助Codex的能力来落地,Codex本身就是OpenAI专门为任务执行打造的代理,优势自然在于“干实事”。

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

从之前的实测来看,Codex for Chrome确实能做到很多,比如整理旗舰手机资料、生成选题建议、调用DeepSeek写稿、在腾讯文档新建表格等等,整体速度也不慢。尤其是在调用DeepSeek写稿那次,体验比我预想中顺畅,它能唤醒Chrome,进入对应页面,找到输入区域,把内容写进去。整个过程我根本不用去监视Chrome的操作,也没有需要接管的情况。

我觉得Codex for Chrome最有价值的地方就是能处理一些琐碎的日常工作。比如我把AI日报做成表格,实际上对于科技数码行业的从业者来说,这可能是每天都要做的任务,把这个交给Codex for Chrome,真的能节省不少时间和精力。

Codex for Chrome:半自动的好帮手,还是要留个心眼

实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!

就像所有的 AI 浏览器一样,Codex for Chrome 也有一些小问题。你在使用的时候,可能能判断哪些网页没加载好,哪些按钮能点,登录和广告的位置在哪儿,但 AI 却需要花费较长的时间来搞清楚这些。我最担心的就是,假如它不小心点了发布,那我没写完的文章就会被发布出去,那可真是个大麻烦。

所以,现在我更倾向于把 Codex for Chrome 当作一个半自动的助手。特别是涉及安全、金融、隐私等敏感事务的时候,我还是会比较谨慎,最好有个人在旁边看着,以免出错。

最后说一句,虽然浏览器的 Agent 对普通用户来说形态不算太重要,但是在查资料、写文章、填表和整理网页的过程中,它的帮助可就显得尤为关键了。

从这次体验来看,Codex for Chrome 已经能胜任一些工作。它可以帮你处理一些中间环节,还能把原本需要频繁切换的网页任务串联起来。不过,现阶段它还没有做到“你一句话就能完全放手”的程度。

至于那些需要关闭标签页、提交表单或者修改后台数据的操作,还是得多加小心。并不是说它完全不能做这些,但用户最好了解它执行到什么程度,也要在关键时刻留个心眼。说白了,你还是得看着点,别把浏览器完全交给它。

这或许就是 Codex for Chrome 目前最实在的价值:虽然它还没能将浏览器的 Agent 完全带到终点,但至少让人感受到这不是个空谈。等它更稳定,出错率更低,用户自然会愿意交给它更多的任务。到那时,浏览器会不会被 AI 改变,咱们也不急着下结论,先看看它能否把这些小事做好就行了。

来源:百家号
原文标题:实测Codex Chrome:简单任务翻车,复杂任务反而成了
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《实测Codex Chrome:简单任务竟然翻车,复杂任务却表现惊艳!》有8条评论

发表评论