ICC訊 OpenAI 昨日(2 月 5 日)發(fā)布公告,宣布推出 GPT-5.3-Codex,宣稱這是其迄今最強的 AI 智能體編程模型。
附上相關基準測試結果如下:
在 SWE-bench Pro(公開版)測試中,該模型得分 56.8%,超越了前代的 56.4%;
在 Terminal-Bench 2.0 測試中,其得分從前代的 64.0% 大幅躍升至 77.3%;
最為顯著的是在 OSWorld-Verified 智能體計算機操作基準測試中,得分從 38.2% 飆升至 64.7%,表明其在復雜環(huán)境下的操作能力實現(xiàn)了質(zhì)的飛躍。
官方數(shù)據(jù)顯示,該模型不僅在多項編程基準測試中創(chuàng)下新高,運行速度也比前代 GPT-5.2-Codex 提升了 25%。
OpenAI 致力于將 GPT-5.3-Codex 打造為更優(yōu)秀的開發(fā)者協(xié)作工具。新模型支持用戶在任務執(zhí)行過程中進行“引導與交互”,且不會導致上下文丟失。
在 Codex 應用中,模型會高頻更新工作進度,允許開發(fā)者實時提問、討論方案并修正方向。官方博文指出,Codex 正從單一的編程智能體演變?yōu)楦ㄓ玫挠嬎銠C協(xié)作者,大幅降低了構建應用的門檻。
GPT-5.3-Codex 目前已全面向 ChatGPT 付費用戶開放,涵蓋 Plus、Team 及 Enterprise 等訂閱計劃。用戶可通過 Codex 應用、命令行工具(CLI)、IDE 擴展插件及網(wǎng)頁端立即訪問,API 版本也將在近期上線。
新聞來源:IT之家