中國電競網(wǎng)

中國電競網(wǎng)

OpenAI發(fā)布AI編程智能體Codex:30分鐘完成數(shù)天任務(wù),72.1%得分領(lǐng)跑行業(yè)

OpenAI今日在在線直播中重磅推出全新云端AI編程智能體——Codex,正式開啟AI編程新時(shí)代。該產(chǎn)品由Greg Brockman領(lǐng)導(dǎo)的OpenAI六人團(tuán)隊(duì)研發(fā),號(hào)稱能將原本需耗時(shí)數(shù)天的軟件工程任務(wù)縮短至半小時(shí)內(nèi)完成,大幅革新開發(fā)效率。

核心技術(shù)解析

1. **模型架構(gòu)**:Codex基于專門優(yōu)化的codex-1模型,這是OpenAI o3模型的定制版本,專攻軟件開發(fā)場景。

2. **云端沙盒環(huán)境**:支持并行處理多任務(wù),每個(gè)任務(wù)在獨(dú)立虛擬沙盒運(yùn)行,配備隔離文件系統(tǒng)、CPU、內(nèi)存和網(wǎng)絡(luò)策略,確保高效與安全。

3. **GitHub無縫集成**:可直接調(diào)用代碼庫,實(shí)現(xiàn)功能模塊構(gòu)建、代碼庫問題解答、漏洞修復(fù)、提交PR及自動(dòng)測試驗(yàn)證等全流程覆蓋。

性能突破:

- 基準(zhǔn)測試顯示,codex-1在SWE-bench上取得72.1%的得分,超越Claude3.7和o3-high。

- 實(shí)戰(zhàn)案例覆蓋astropy、matplotlib、django、expensify等4個(gè)開源庫,驗(yàn)證其跨項(xiàng)目泛化能力。

安全與訓(xùn)練特色:

- 計(jì)算基礎(chǔ)設(shè)施與強(qiáng)化學(xué)習(xí)系統(tǒng)共享,兼顧性能與資源優(yōu)化。

- 訓(xùn)練數(shù)據(jù)聚焦真實(shí)編碼任務(wù)與多樣化環(huán)境,確保輸出符合人類編碼習(xí)慣與行業(yè)標(biāo)準(zhǔn)。

該工具通過系統(tǒng)化整合開發(fā)流程中的重復(fù)性工作,有望重塑軟件開發(fā)協(xié)作模式。OpenAI團(tuán)隊(duì)強(qiáng)調(diào),Codex的推出標(biāo)志著AI從輔助工具向深度參與工程實(shí)踐的質(zhì)變階段邁進(jìn)。


標(biāo)簽:OpenAI AI編程 智能體 Codex