這(zhè )并不意味著 OpenAI 故意撒(sā )謊,該公(gōng )司在 12 月份公布的基準測試結(jié)果中(zhōng )也包含了一個與(yǔ ) Epoch 測試結(jié)(jié )果相符的較低分(fèn )數(shù)。Epoch 還(hái )指出,其測試設(shè )置可能與 OpenAI 有所不(bú )同,并且(qiě )其評估使用了更新版(bǎn )本的 FrontierMath。Epoch 在(zài )報告中寫(xiě )道(dào ):“我們與 OpenAI 的結(jié)(jié )果差異可(kě )能是因為(wéi ) OpenAI 在內(nèi)部評估時使(shǐ )用了更強大的計算框架、更(gèng )多的測試時計算資(zī )源,或者是因為這些結(jié)果是在 FrontierMath 的不(bú )同子集上(shàng )運行的(de )(例如 2024 年 11 月 26 日版(bǎn )本的(de ) 180 個問題與 2025 年 2 月 28 日私有(yǒu )版本的 290 個問題)?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利