O3深陷成绩造假风波,60余位数学泰斗遭OpenAI瞒天过海,考卷疑遭提前泄露

导读 OpenAI发布的最新推理模型O3在FrontierMath基准测试中表现惊艳,准确率较O1提升了12倍。然而,近日曝出O3之所以能在短时间内取得如此突破,...

OpenAI发布的最新推理模型O3在FrontierMath基准测试中表现惊艳,准确率较O1提升了12倍。然而,近日曝出O3之所以能在短时间内取得如此突破,是因为OpenAI资助了FrontierMath且能访问大部分数据集,而数学家们对此毫不知情。这引发了人们对O3成绩可信度的质疑,以及对OpenAI诚信的怀疑。

Epoch AI回应称,虽然OpenAI可以访问大部分数据集,但有一个未见过的保留集用于独立验证模型能力。然而,这一“口头协议”难以令人信服。Epoch AI首席数学家承认错误并向数学家致歉,联创也表示将致力于提高透明度。此事激起热议,多位学术界大佬对OpenAI的行为表示谴责。同时,也有分析认为,OpenAI可能只是用FrontierMath的题库指导新训练数据的设计,而非直接作弊。然而,这一行为依然让O3在FrontierMath上的表现显得过于亮眼,引发了对O3实际能力的质疑。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。