然而,這一高分(fèn )似乎是一個上限值,是通(tōng )過(guò )一(yī )個計算資源更(gèng )為強大(dà )的 o3 模型版本實現(xiàn)(xiàn )的,而并非(fēi )是 OpenAI 上周公開發(fā)布的版本。負(fù)責(zé) FrontierMath 的 Epoch 研究(jiū )所于上周五公布了其對 o3 模型的獨立(lì )基準(zhǔn)測試(shì )結(jié)果,發(fā)現(xiàn)(xiàn ) o3 的得分僅(jǐn )為約 10%,遠(yuǎn)低于 OpenAI 此前聲稱的最(zuì )高(gāo )分?jǐn)?shù)。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利