作者:李惠钰 来源:中国科学报 发布时间:2026/1/26 20:19:26
选择字号:
从“解题”到“出题”,我国科学家研发“通几何”系统
在通用人工智能逻辑推理领域实现重大跨越

 

1月26日,由北京通用人工智能研究院(BIGAI)、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院,以及北京大学武汉人工智能研究院组成的联合团队,在人工智能(AI)逻辑推理与数学发现领域取得突破性进展。该成果以《基于引导树搜索的奥数几何问题提出与解答系统》为题发表于《自然-机器智能》。

研究团队开发的“通矩模型”(TongGeometry)系统,是全球首个同时具备自主出题与自动解题双重能力的通用人工智能系统。这一突破标志着中国科研团队在自动化推理和具身智能的逻辑核心领域实现关键技术自研自控,不仅在性能上对标并超越了以DeepMind AlphaGeometry为代表的国际顶尖水平,更在功能多样性和效率上实现了质的飞跃。

张驰(左)、朱毅鑫(中)与博士生马煜曦讨论TongGeometry算法。


突破“最后堡垒”:为何几何推理如此困难?

AI领域,奥林匹克数学竞赛一直被视为衡量机器逻辑思维与空间想象力的“最高殿堂”。其中,平面几何问题因其独特的数值精度与空间直觉的结合,被公认为自动化推理的“最后堡垒”。

长期以来,AI在该领域面临着两大核心挑战:一是“组合爆炸”,几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,现有的几何题目库规模较小,难以支持大规模模型的训练。

2024年初,DeepMind开发的AlphaGeometry虽然在解题能力上取得了重要进展,但其主要依赖于大规模离线合成数据和昂贵的计算资源集群。

与之相比,我国科研团队自主研发的TongGeometry则展现出更具原创性的底层逻辑:它不仅是一个能解题的“优等生”,更是一位能从无到有、创造出具备数学审美价值的题目的“金牌教练”。

深度解码:神经符号架构下的“数学直觉”

TongGeometry的技术核心在于一套“精密而优雅”的神经符号引导树搜索架构。与传统大模型的暴力搜索不同,研究团队将复杂的几何世界抽象地建模为有限树上的马尔可夫过程,即依据系统当前的状态推断系统下一个最大可能性的状态。在这种设定下,几何图形的构建不再是杂乱无章的尝试,而变成了一个有序的随机演化过程。这使得AI系统能够像人类数学家一样,在逻辑树的每一个节点上进行系统性探索,确保每一个动作都指向潜在的真理,从根本上避免了无效的重复尝试。

为解决几何证明中困扰学界已久的“路径爆炸”难题,团队创新性引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。

TongGeometry能够自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,不仅极大提升了搜索效率,更体现了我国学者在基础算法优化上的领先思维。

而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——它不仅判断结论是否成立,更在乎推导过程是否简洁、优美。

论文第一作者、北京通用人工智能研究院的张驰谈到,“当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹“直觉性的灵感”。这种‘价值引导’让TongGeometry在海量数据中精准筛选出那些具备奥赛水准的“优雅好题”,真正实现了从机械计算向智能创造的跨越。”

张驰(左)与朱毅鑫讨论TongGeometry算法。受访者供图


从“暴力计算”到“数学审美”的范式升级

在性能表现上,TongGeometry展现了国产原创技术的强大生命力。相比DeepMind AlphaGeometry需要依赖庞大的算力集群进行训练和推理,TongGeometry仅需一张普通的国产消费级显卡(如RTX 4090),即可在最多38分钟内解决近25年来所有的IMO几何难题。 这种高效、低功耗、极具数学美感的推理范式,证明了中国在通专融合技术路径上的领先地位。

目前,TongGeometry的原创能力已获得学术界和数学竞赛圈的高度评价。其自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛(Ersatz Math Olympiad)。这是AI原创题目首次进入高规格人类数学竞赛,实现了从实验室研究到真实场景应用的重大跨越。

论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示:“TongGeometry的意义远超数学竞赛本身。它通过‘小数据、大任务’的范式转换,证明了人工智能可以不再单纯依赖暴力计算,而是通过理解逻辑底层的对称性与美感,实现自主的科学发现。这对于未来具身智能在复杂环境下的逻辑决策、自动化定理证明以及个性化教育,都具有深远的战略价值。”

此次成果由北京通用人工智能研究院主导,并集结了北京大学多个相关顶尖院系的科研力量,充分体现了我国在通用人工智能基础研究领域“学-研-产”深度融合的正向研发优势。未来,团队将继续沿着“小数据,大任务”的研究范式拓展“通系列”通用人工智能模型,推动中国AI在更多“无人区”实现零的突破。

相关论文信息:https://doi.org/10.1038/s42256-025-01164-x

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学家破解深海弱光能量利用密码 口腔微生物群会让人变胖吗?
北极“最后冰区”正显示出脆弱迹象 世界首次!FAST破解天体物理学重要谜团
>>更多
 
一周新闻排行
 
编辑部推荐博文