然(rán )而,這一高分似乎是一個(gè)(gè )上(shàng )限值(zhí ),是通過(guò)一個(gè)計(jì)算資源更為強(qiáng)大的 o3 模型(xíng )版本(běn )實(shí)現(xiàn)的,而(ér )并(bìng )非是 OpenAI 上周公開(kāi)發(fā)布的版本。負(fù)責(zé) FrontierMath 的 Epoch 研究(jiū )所于上(shàng )周五公布(bù )了(le )其對(duì) o3 模型的獨(dú)立基準(zhǔn)測(cè)試結(jié)果(guǒ ),發(fā)現(xiàn) o3 的得分僅為約 10%,遠(yuǎn)低于 OpenAI 此前聲稱的最高分?jǐn)?shù)。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利