o1 Pro 挑战最难本科数学熟练,东说念主类要考 6 小时,AI 半小时交卷! 普特南数学竞赛(The Putnam exam),本年刚刚举行,卷子崭新出炉就被拿来测试 AI 了。 这个比赛有多难呢?看了一下积年收获,只可说令东说念主咂舌—— 经常由数学专科的本科生参加,满分 120 分,但平平分经常是 0 分或 1 分。 自 1938 年举办以来,限度 2021 年唯一 5 东说念主满分。 再看一组 2003 年的数据,在 3615 名参赛学生中,有 1024 东说念主(28%)得分 10...

