OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

（

新智元报道

编辑：定慧元宇

【新智元导读】AI编程的竞争越来越激烈！Claude Code刚刚引起热议，OpenAI紧接着放出两个重磅消息：首次揭开Codex背后的核心「Agent Loop」，同时还透露了惊人的基础设施：仅仅依靠1个PostgreSQL主库，就能承受全球8亿用户的访问高峰！

最近，Anthropic推出的Claude Code在AI编程领域引发了不小的轰动！

这个能在终端中自动读取、修改代码并执行测试的AI助手，令许多开发者感叹「这才是未来的样子」。

于是，社交网络上纷纷出现「Claude Code轻松超越Cursor、Codex、Antigravity」这样的评论。

就在大家猜测OpenAI是否在酝酿GPT-5.3的重磅更新时，今天他们的官方微博和奥特曼在X平台推出了两项重磅内容：

1.Agent Loop架构揭秘：首次公开Codex的「大脑」是如何运作的

2.PostgreSQL极限架构：1个主库如何支撑8亿用户的疯狂访问

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

这波操作真是太精彩了！

今天我们就来深入分析一下，OpenAI究竟放出了什么大招。

Agent Loop

Codex的「大脑」是如何运作的

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

什么是Agent Loop？

如果你用过Codex CLI、Claude Code等终端工具，可能会想知道：

它们究竟是怎么知道我想做什么的？怎么能够自己读取文件、编写代码、执行命令呢？

答案就藏在一个叫Agent Loop（智能体循环）的机制中。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

简单来说，Agent Loop就像是一个指挥官，负责把「用户的意图」「模型的思维」和「执行工具」紧密联系起来，形成一个完美的闭环。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

这不仅仅是「你问我答」，而是一个包含「观察-思考-行动-反馈」的高效工作系统。

接下来，让我们拆解一下，看看一个真正的AI Agent是如何运行的。

完整的Agent Loop是如何运作的

让我们通过一个具体的例子来演示一下。

假设你在终端输入：给项目的README.md添加架构图。

第一步：构建Prompt

这就像是给大脑发出一份工作指令。

Codex不会直接把你说的话传给模型，而是会先精心构建一个「Prompt」：

这就像给模型写一封详细的工作邮件，而不只是简单地说「帮我工作」。

第二步：模型推理（Inference）

在这一阶段，大脑开始运转。

Codex将这个Prompt发送给ResponsesAPI，模型开始思考：

「用户想要添加架构图，我得先看看现在的README内容……」

然后模型决定：调用shell工具，执行cat README.md。

第三步：工具调用（ToolCall）

Codex接到模型的请求后，开始在本地执行命令，读取README.md的内容。

这就像是身体开始行动起来。

第四步：结果反馈

这一阶段，终端将README.md的内容反馈出来。

但流程并没有结束。Codex会把命令的输出添加到Prompt中，然后再发回模型。

第五步：循环

模型看到README的内容后，再次进行推理：

可能生成一个Mermaid图，或者直接绘制一段ASCII图形……然后再调用工具将其写入文件。

这个循环会持续进行，直到模型判断任务完成，并反馈一条「我搞定了」的消息。

它不是在回答问题，而是在解决问题。

为什么这很重要呢？

你可能会问：「这不就是多次调用了API吗？」

AI的进化：从问答到独立工作的小助手

其实，这事儿可没那么简单呢。

传统的LLM应用就像是「问问题、给答案」的简单互动：你提问，它回应，问题就算解决了。

然而，Agent Loop的出现，把AI变成了一个能自我完成任务的员工。

这才是真正意义上的AI代理。

而Agent Loop正是那座重要的桥梁，让AI从「陪你聊天」一步跨越到「独立完成工作」。

性能优化

两个重要技术

OpenAI在文章中提到两项厉害的优化措施，解决了Agent开发中的两大难题：

难题一：成本过高

每次Agent Loop运行时，都需要把之前的对话记录（包括那些冗长的错误信息和文件内容）再次发送给模型。

想想，谈话越长，花费就越大。如果不做优化，成本会呈平方级别飙升。

解决办法：PromptCaching（提示词缓存）

OpenAI采用了一种类似于「前缀匹配」的缓存策略。

简单来说，只要你给模型发送的前半部分内容（系统指令、工具定义、历史对话）没有变化，服务器就无需重新计算，直接调用缓存就行了。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

这一策略让长对话的成本，从平方级别暴跌到线性级别。

不过这里有个小陷阱：只要改变Prompt前缀，缓存就会失效。比如：

OpenAI团队在文章中坦承，早期的MCP工具集成存在bug：工具列表的顺序不稳定，导致缓存频繁失效。

难题二：上下文窗口有限

不管模型多强大，它的上下文窗口都是有限的。

假如Agent需要读取一个巨大的日志文件，瞬间上下文就会被填满，之前的记忆也就被挤掉了。

对于程序员而言，这意味着：「你居然忘记我前面定义的函数了？！」

这不仅是个失误，更是个大问题。

解决方案：Compaction（对话压缩）

当Token数量超过设定值时，Codex不会简单地「删除旧消息」，而是会调用一个特殊的/responses/compact接口，将对话历史「压缩」成一个更简洁的总结。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

普通的总结（Summary）只是把长文本缩短，很多细节会丢失。

而OpenAI的Compaction会返回一段encrypted_content（加密内容），保留了模型对原始对话的「隐性理解」。

这就像把一本厚厚的书压缩成一张「记忆卡片」，模型读了这张卡片就能回忆起整本书的内容。

这样一来，Agent在处理长任务时，依然能保持「聪明」在线。

这次，OpenAI揭示了Codex CLI背后的「大脑」和「Agent Loop」，发出一个信号：AI真的是要把工作做好。

1个主库扛8亿用户

PostgreSQL的极限操作

当大家都在讨论AI模型多牛的时候，OpenAI却悄悄透露了一个更惊人的消息：

支撑全球8亿ChatGPT用户、每秒处理数百万次查询的，竟然只是一个单一主节点的PostgreSQL数据库！

它只用1个PostgreSQL主节点加50个只读副本就做到了。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

8亿用户，这简直让人难以置信！许多网友都惊呆了。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

在如今分布式架构盛行的时代，大家都在谈论「微服务」「分片」「NoSQL」。

能用庞大的分布式集群解决的问题，绝不屑于单机。

但OpenAI却告诉我们：我们就用PostgreSQL，也一样能扛住。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

他们是如何做到的呢？

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

根据OpenAI工程师的透露，关键技术包括：

1. PgBouncer连接池代理：大幅降低数据库的连接开销

2. 缓存锁定机制：防止缓存穿透造成的写入压力

3. 跨地域级联复制：将读请求分散到全球的副本上

这套架构的核心理念是：读写分离，极致优化读路径。

毕竟对于ChatGPT这样的应用，读请求的数量远远超过写请求。用户发条消息，系统可能需要读取几十次数据（用户信息、对话历史、配置信息等），但写入只有一次。

根据OpenAI官方博客的披露，关键技术还包括：

1.连接池代理（PgBouncer）

架构优化与开发工具的未来

通过连接池的管理，平均连接建立的时间从50毫秒降到了5毫秒，这可不是小数目哦！

想象一下，在每秒要处理上百万次查询的情况下，这样的提升真是相当可观。

2. 缓存锁定/租约机制（Cache Locking/Leasing）

这个设计真是非常聪明呢。

当缓存没有命中时，系统会限制只有一个请求去数据库查询并更新缓存，其它请求只能乖乖等着。

这样一来，就有效避免了「缓存雪崩」这种糟糕的情况——也就是大量请求同时冲向数据库的惨状。

3. 查询优化与负载隔离

团队发现并解决了一个涉及12张表的复杂查询问题。

他们把繁琐的逻辑转移到应用层，避免在数据库中进行不当的OLTP操作。

而且，他们把请求分成高优先级和低优先级，由不同的实例处理，这样就能避免「吵闹邻居」效应带来的性能问题。

4. 高可用与故障转移

主数据库采用高可用（HA）模式，并且有热备节点支持。

所有读取流量都转移到副本上，这样即使主库出现故障，服务依然可以保持只读状态，从而减小故障的影响。

天花板终究会到来

不过，OpenAI也承认这个架构已经遇到了物理极限，主要问题出在两个方面：

PostgreSQL的MVCC限制

PostgreSQL的多版本并发控制（MVCC）机制会导致写放大（更新一行时需复制整行）和读放大（扫描时需跳过死元组）。这对写密集型负载来说可真是个麻烦。

WAL复制压力

随着副本数量的增多，主库需要向所有副本推送预写日志（WAL）。副本越多，主库承受的网络压力就越大，副本延迟也会增加。

为了解决这些问题，OpenAI正在进行两项工作：

1. 将可分片、高写入负载迁移到Azure Cosmos DB等分布式系统；

2. 测试级联复制：让中间副本将WAL转发到下游副本，目标是支持超过100个副本。

这个案例很好地阐释了一个架构哲学：如无必要，勿增实体。

一开始不必盲目追求分布式，先用简单的解决方案应对，如果撑不住再说。

很多公司在还没到需要分布式的阶段时，就已经把架构弄得异常复杂，结果既没有享受到分布式的好处，反而背负了分布式的复杂性。

OpenAI用实践证明，一个优化得当的单机架构，能够走得比你想象的更远。

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

Codex与Claude Code的较量

Claude Code的秘密武器是什么呢？就是端到端的开发体验。

它不仅仅是个简单的代码补全工具，而是一个能够独立在终端上工作的Agent。

它可以阅读、修改代码，运行测试，处理Git，甚至能自己修复Bug，现在还可以写文档和制作PPT。

这对Codex CLI的地位构成了直接威胁。

OpenAI这次更新其实传递了几个重要信息：

第一，我的Agent架构更成熟。

Agent Loop的揭示，展示了OpenAI在Agent架构上的深厚积淀，这不是一个随便拼凑的产品，而是经过精心设计的系统。

Prompt Caching、Compaction、MCP工具集成……这些都是实打实的工程实力。

第二，我的基础设施更强。

PostgreSQL的案例，体现了OpenAI的后端能力。8亿用户的规模，可不是随便哪个创业公司能驾驭的。

这也在暗示：我们的「护城河」不仅仅是模型，还有整个工程体系。

第三，我的模型正变得更强大。

网络安全评级的公开，既是在进行「预期管理」，告诉大家模型是有风险的，我们也在负责任地处理这些问题。

同时，这也是在展示实力：我们的模型已经强大到需要专门评估网络安全风险了。

这场AI编程工具的竞争才刚刚拉开帷幕。

Claude Code的出现迫使OpenAI加快了Codex的迭代，而OpenAI的回应又将推动Anthropic的持续创新。

最终获益的，必然是我们这些开发者。

参考资料：

https://openai.com/index/unrolling-the-codex-agent-loop/

https://x.com/gdb/status/2014744842941956606

来源：百家号

原文标题：OpenAI绝地反击！Codex大脑首曝，8亿用户极限架构硬刚Claude

原文链接：https://baijiahao.baidu.com/s?id=1855174378835588493

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

OpenAI逆袭来袭！Codex大脑首次亮相，8亿用户的极限架构竟然能硬刚Claude！

AI的进化：从问答到独立工作的小助手

架构优化与开发工具的未来

大家在看

发表评论取消回复

AI的进化：从问答到独立工作的小助手

架构优化与开发工具的未来

相关阅读

大家在看

发表评论 取消回复

发表评论取消回复