这场特别活动上，他们共话AI数学解题能力—新闻

作者：江庆龄来源：中国科学报发布时间：2026/1/7 22:13:14

选择字号：小中大

这场特别活动上，他们共话AI数学解题能力

1月6日，第十届世界华人数学家大会（ICCM 2025）特别活动——“人工智能与数学”夜话顺利举行。青年数学家与人工智能（AI）团队代表齐聚，共同探讨如何用数学的“冷”逻辑，去救赎AI的“热”幻觉。

活动现场，大会主席、上海数学与交叉学科研究院理事长丘成桐院士在致辞中讲起了一段往事。20世纪60年代，计算机处理信号的复杂度被卡在了N2物理的墙上。随着数据量增加，计算时间呈指数级爆炸，那是硬件无法逾越的鸿沟。直到1965年，库利和图基重新发现了快速傅里叶变换（FFT）。数学家仅仅通过利用复数根的对称性，就将复杂度大幅降低，由此改变了整个工业界。

值得一提的是，这不是一场按照PPT念稿的发布会，而是一场真刀真枪的“图灵测试”。面对数学家们抛出的难题，国内四大模型战队——上海AI实验室、阿里通义、商汤、字节跳动逐一进行展示。

大会现场。图源ICCM 2025

上海人工智能实验室的张文蔚团队让AI学会了“长考”。他们展示的“书生”模型，在处理一道涉及矩阵递归的前沿引理时，进行了长达数小时的“系统2”深度推理。在刚刚结束的中国数学奥林匹克冬令营中，书生模型在与人类顶尖选手的同台竞技中拿下了102分，远超金牌线的78分。阅卷专家评价模型的回答“是一个新的解法，巧妙的调整法，结合了几种观察到的东西。在学生的解法中没有见过”

阿里通义实验室Qwen预训练负责人刘大一恒演示了更深层的思维进化。Qwen3-Max模型在解决一道关于“有限阿贝尔群自同构”的抽象代数难题时，起初顺着概率惯性给出了一个推导。但在中间某个节点，屏幕上的光标突然停住了。“Let me verify（让我验证一下）”，模型输出了这样一行字。它“意识到”了自己的逻辑风险，主动推翻了之前的结论，调用了另一种方法进行交叉验证。经过预训练和强化学习的大规模算力scaling后，在没有对数学能力做针对性设计前提下，模型已具备了强大的数学解题和思考泛化能力。

商汤研究院高级算法研究员肖鹏带来的“日日新”模型，展示了某种数学家的直觉。在计算一个复杂的广义积分时，模型没有陷入暴力的数值计算，而是敏锐地捕捉到了函数的对称性，利用倒数代换将难题化归为零。这种“避繁就简”的能力，被在场数学家称为“机器的审美”，它开始懂得“巧妙”。

字节跳动Seed团队代表则介绍了Seed-Prover模型采用形式化数学的路径，既保障最终答案正确，也确保每一步推理严格，没有幻觉；借助严格的形式化监督信号，模型可开展持续的强化学习；通过测试时扩展的技术，模型可以提高自己的思考深度、宽度，解决更困难的数学问题。

随后，“人类知识边界：全球数学征解”正式发布。其中，“初探”是面向本科生的逻辑迷宫，“突破”为面向硕博的结构洞察，“拓界”则是面向全人类的终极猜想，这三层挑战也对应着上海构建“数学—模型—产业”生态的决心。

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！人-智能体协同的信任研究数字迷雾：人工智能模糊了真实与虚拟的边界 Adolescents期刊诚聘青年编委作者专访\|自动化时代，大学毕业生如何重新定义未来更多>>