ENGLISH

电子新闻

新闻|电子系电路与系统研究所带队获得AIMO-2全球第二名

发布时间:2025-04-19 点击数:

4月9日,由XTX Markets和Kaggle主办,陶哲轩、Timothy Gowers等数学家担任大赛顾问的AI Mathematical Olympiad - Progress Prize 2(Aimo2)正式结束,全球有2200余支队伍参加了此次比赛。比赛链接为:https://www.kaggle.com/c/ai-mathematical-olympiad-progress-prize-2/overview。第一名为NVIDIA 的NemoSkills团队,清华大学电子系电路与系统研究所教师宁雪妃带领的团队在此次比赛中获得第二名,团队成员包括尤忆晨(清华大学电子系三年级本科生)、宁雪妃(清华大学电子系助理研究员)、林梓楠(微软研究院研究员)。

Aimo系列比赛旨在推动AI模型在数学推理能力上的发展,比赛要求选手使用AI模型解决100道国际奥林匹克数学竞赛难度的问题。最终,团队提交的解决方案在public榜单的50道题中解决了34道,在private榜单的50道题中解决了31道,排名第二。

图片图片

左:比赛最终评测结果 右:比赛荣誉证书

数学推理能力是人工智能发展的关键里程碑,也是解决广泛复杂问题的基础——从卓越的工程实践到精密的金融模型分析,无不依赖于此。Deepseek-R1的问世向业界展示了大语言模型在推理领域的非凡潜力。在此背景下,团队以Deepseek-R1的14B蒸馏模型为基础,进行了三方面的优化(1)面向推理能力的SFT-DPO训练,(2)效率优化,(3)推理时策略设计。下图展示了团队获奖方案的推理时流程。整体方案已开源于 https://github.com/imagination-research/aimo2。

图片

团队获奖方案的推理时流程

供稿|电路与系统研究所

编辑|陶旋姿

审核|汪 玉 沈 渊 李冬梅

分享到: