123,123,123

OpenAI 最強(qiáng) AI 智能體編程模型：GPT-5.3-Codex 登場(chǎng)，基準(zhǔn)測(cè)試全面霸榜

訊石光通訊網(wǎng) 2026/2/6 14:43:06

ICC訊 OpenAI 昨日（2 月 5 日）發(fā)布公告，宣布推出 GPT-5.3-Codex，宣稱(chēng)這是其迄今最強(qiáng)的 AI 智能體編程模型。

附上相關(guān)基準(zhǔn)測(cè)試結(jié)果如下：

在 SWE-bench Pro（公開(kāi)版）測(cè)試中，該模型得分 56.8%，超越了前代的 56.4%；

在 Terminal-Bench 2.0 測(cè)試中，其得分從前代的 64.0% 大幅躍升至 77.3%；

最為顯著的是在 OSWorld-Verified 智能體計(jì)算機(jī)操作基準(zhǔn)測(cè)試中，得分從 38.2% 飆升至 64.7%，表明其在復(fù)雜環(huán)境下的操作能力實(shí)現(xiàn)了質(zhì)的飛躍。

官方數(shù)據(jù)顯示，該模型不僅在多項(xiàng)編程基準(zhǔn)測(cè)試中創(chuàng)下新高，運(yùn)行速度也比前代 GPT-5.2-Codex 提升了 25%。

OpenAI 致力于將 GPT-5.3-Codex 打造為更優(yōu)秀的開(kāi)發(fā)者協(xié)作工具。新模型支持用戶(hù)在任務(wù)執(zhí)行過(guò)程中進(jìn)行“引導(dǎo)與交互”，且不會(huì)導(dǎo)致上下文丟失。

在 Codex 應(yīng)用中，模型會(huì)高頻更新工作進(jìn)度，允許開(kāi)發(fā)者實(shí)時(shí)提問(wèn)、討論方案并修正方向。官方博文指出，Codex 正從單一的編程智能體演變?yōu)楦ㄓ玫挠?jì)算機(jī)協(xié)作者，大幅降低了構(gòu)建應(yīng)用的門(mén)檻。

GPT-5.3-Codex 目前已全面向 ChatGPT 付費(fèi)用戶(hù)開(kāi)放，涵蓋 Plus、Team 及 Enterprise 等訂閱計(jì)劃。用戶(hù)可通過(guò) Codex 應(yīng)用、命令行工具（CLI）、IDE 擴(kuò)展插件及網(wǎng)頁(yè)端立即訪(fǎng)問(wèn)，API 版本也將在近期上線(xiàn)。

OpenAI 最強(qiáng) AI 智能體編程模型：GPT-5.3-Codex 登場(chǎng)，基準(zhǔn)測(cè)試全面霸榜

OpenAI 最強(qiáng) AI 智能體編程模型：GPT-5.3-Codex 登場(chǎng)，基準(zhǔn)測(cè)試全面霸榜