3月6日,OpenAI宣布推出GPT-5.4系列模型,包括GPT-5.4Thinking和GPT-5.4Pro版本。GPT-5.4Thinking新增“思考過程預(yù)覽”功能,允許用戶實(shí)時(shí)調(diào)整模型處理復(fù)雜查詢的方向,減少溝通成本。同時(shí),該模型增強(qiáng)了深度網(wǎng)絡(luò)研究能力,尤其在處理具體查詢時(shí)保持長(zhǎng)上下文連貫性。GPT-5.4Pro則面向復(fù)雜任務(wù),是OpenAI首個(gè)具備原生計(jì)算機(jī)使用能力的通用模型,支持通過截圖和指令操作計(jì)算機(jī),完成跨應(yīng)用的復(fù)雜工作流程。
GPT-5.4系列模型在專業(yè)工作領(lǐng)域?qū)崿F(xiàn)突破,83.0%的項(xiàng)目上達(dá)到或超過行業(yè)專業(yè)水平,相比前代GPT-5.2的70.9%有顯著提升。在減少錯(cuò)誤方面,GPT-5.4的錯(cuò)誤率降低33%,完整回答中出現(xiàn)任一錯(cuò)誤的可能性降低18%。此外,GPT-5.4在計(jì)算機(jī)使用基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,成功率達(dá)75.0%,超過人類表現(xiàn)的72.4%。視覺感知能力方面,GPT-5.4在MMMU-Pro視覺理解與推理測(cè)試中取得81.2%的成功率。
GPT-5.4還融合了GPT-5.3-Codex的編碼優(yōu)勢(shì),在SWE-BenchPro基準(zhǔn)上表現(xiàn)更優(yōu),同時(shí)延遲更低。新增的“工具搜索”功能使模型能夠高效處理各種工具。在安全性方面,GPT-5.4延續(xù)了GPT-5.3-Codex的安全防護(hù)措施,并引入新的開源評(píng)估“CoT可控性”。GPT-5.4Thinking即日起面向ChatGPTPlus、Team和Pro用戶開放,GPT-5.4Pro面向Pro和Enterprise計(jì)劃用戶開放。



來源:一電快訊
返回第一電動(dòng)網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(m.cbbreul.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。