能辅助计算的AI到攻克数学难题的AI,这中间的鸿沟如何跨越?

如今数学那可是关键领域的基石,但是进步那叫一个慢,几年才能实现一点!可美国国防高级研究计划局搞出个事,说不定能让情况大大的不一样

新计划促转机

美国国防高级研究计划局在今年4月整出了个“指数性数学”计划这计划的目标可宏大了,要开发一种人工智能“合著者”系统。咱过去数学家只能靠计算机辅助计算或者验证命题,而现在有这AI说不定能更上一层楼,去挑战那些人类好久都没解开的难题这听起来能不让人激动

新模型展风采

现在新一代大型推理模型出现,像那个OpenAI的o3、Anthropic的Claude 4 Thinking。它们跟过去可完全不一样,以前是“一锤定音”式的输出,现在开始模拟数学家逐步推理的思考过程。而且今年5月谷歌的AlphaEvolve模型更厉害,在好几个长期未解的难题上找到比人类现在方案还好的解法,这真是让人眼前一亮

测试露短板差距

Epoch AI这家初创公司去年推出了FrontierMath测试,还联合了60多位数学家设计全新高难度题目,就是为了避开模型训练过的数据大连市同乐中小企业商会,好好测测AI到底咋样。可结果,大语言模型几乎集体“交白卷”。这一对比就发现AI离真正攻克难题还是有不小距离

解难题多是挑战

咱们仔细瞧瞧数学问题,解决它就得完成一系列连续步骤。高中数学可能就10到40步,但像黎曼猜想这类难题,路径得长达百万步好比下围棋找制胜序列,AI要在指数级增长的路径里找出正确解法,困难程度简直无法想象

新方法提供巧思

物理学家组织网在今年2月有报道,古科夫团队开发了一种把多个步骤打包成“超级步骤”的方法。就像穿上“巨人靴”跨越大段路程一样。虽然还没证明或推翻黎曼猜想,可借AI推翻了个40年被广泛引用的“反例”。牛津大学马丁·布里森那是可肯定了,觉得能排除错误路径是科研里超有价值的一步

AI辅助难替代

英国《新科学家》网站讲,马丁·布里森还和Meta合作开发PatternBoost AI系统,能根据数学想法生成相似概念来激发灵感。可专家都说,就算有AlphaEvolve和PatternBoost这些工具当人类直觉的“侦察兵”,能帮着发现路径、避开死路,但真正的创新和突破,还是得靠咱们人类

各位看客朋友们,你们觉得未来人类靠AI一起攻克数学难题可行不?

关注公众号:人民网财经