导语:2025 年世界人工智能大会提出的 AI 三问—— 数学之问科学之问模型之问如同一把钥匙打开了探索人工智能本质与未来的大门
2025 年世界人工智能大会提出的 “AI 三问”—— 数学之问、科学之问、模型之问,如同一把钥匙,打开了探索人工智能本质与未来的大门。这三个问题直指 AI 发展的核心瓶颈与突破方向,既关乎技术底层逻辑,也涉及产业应用与科学创新的深层关联。深入剖析 “AI 三问”,不仅能厘清当下 AI 发展的关键矛盾,更能为未来智能革命的路径提供思考框架。
一、数学之问:双向奔赴中的边界重构
“数学之问” 的核心命题,在于厘清人工智能与数学之间的深层关系 —— 是 “Math for AI”(数学支撑 AI),还是 “AI for Math”(AI 反哺数学)?这一问题的背后,是智能系统从 “规律验证者” 向 “规律探索者” 进化的迫切需求,也是 AI 技术突破经验主义瓶颈的必然选择。
从 “Math for AI” 的维度看,人工智能的每一次跃升都离不开数学理论的支撑。当前大模型参数已突破万亿,传统基于经验的调参方法陷入困境,模型的泛化能力、安全性、能耗控制等核心问题,亟待数学理论的系统性重构。菲尔兹数学科学研究院可持续发展中心主席路易斯・塞科曾指出:“人工智能的诞生基于积累几千年的数学智慧,其未来的进步也将依赖于数学未来的发展。” 这一观点在实践中得到印证 —— 几何深度学习通过拓扑学原理优化模型对复杂数据结构的理解,微分方程与神经网络的融合为动态系统建模提供了新框架,这些进展正是数学为 AI 注入的 “公理级” 支撑。中国科学院院士徐宗本强调:“发展人工智能必须从基础研究、原始创新抓起,这才是正确之路”,而基础研究的核心,正是数学理论的突破。
与此同时,“AI for Math” 的反哺效应正日益显著。DeepMind 开发的 AI 系统 AlphaGeometry 在证明欧几里得平面几何定理时,性能超越国际数学奥林匹克竞赛参赛者平均水平,改写了数学研究的范式。在 2025 世界人工智能大会的现场测试中,上海人工智能实验室的 Intern-IMO 成功破解国际奥数几何题,商汤 “日日新” 展现多路径推理能力,MiniMax 的 M1 甚至能回答 “条件减弱后结论是否成立” 的延伸问题。这些案例证明,AI 已从 “验证工” 升级为 “发现助手”,能够通过海量试错与策略优化,找到人类难以想到的特殊结构,为数学研究提供全新视角。
然而,AI 在数学领域的局限依然清晰。剑桥大学数学家凯文・巴扎德指出:“AI 能生成漂亮的证明步骤,却提不出‘朗兰兹纲领’这样的宏大理论。” 机器的突破多源于对海量数据的统计归纳,而人类数学家能从看似无关的领域中提炼出统一框架 —— 这种从 0 到 1 的原创性,仍是 AI 尚未跨越的鸿沟。因此,“数学之问” 的答案并非非此即彼,而是构建 “双向协同” 的生态:一方面,通过 Hitchin–Ngo 实验室、Fefferman 实验室等跨学科机构,推动数学理论与 AI 技术需求的直接对接;另一方面,推广 “机器发现规律 — 人类证明定理” 的协同模式,在数论、纽结理论等领域实现人机优势互补。
上海的实践为这种协同提供了范本。凭借 “AI 产业集群 + 顶尖数学学科” 的双重优势 —— 华为 384 超节点等算力设施提供支撑,复旦、交大在微分几何、组合数学等领域的深厚积累 —— 上海正围绕三大方向布局:基础理论突破、AI 辅助数学研究、产业场景转化。这种布局既夯实了 AI 的数学根基,也为数学研究开辟了新路径,印证了 “数学与 AI 协同发展” 的必然性。
二、科学之问:跨学科融合与科研范式的革命
“科学之问” 的核心,是如何让 AI 从 “技术工具” 进化为科学研究的 “协同伙伴”,推动学科融合与科研范式的根本性变革。这一问题的提出,源于大模型技术与科学研究的深度碰撞 —— 当 AI 能够预测蛋白质结构、发现新天体、辅助设计新材料时,传统的科研模式正站在重构的十字路口。
当前科学基础大模型的发展仍处于 “打地基” 阶段。中国科学院自动化研究所副所长曾大军曾以 “三十年前的电脑操作系统” 类比:“能做的事很有限,能加载的应用程序也很有限。我们需要先把这个底座打好,再反复迭代。” 这一现状折射出跨学科融合的核心挑战:不同学科的数据格式、精度要求、研究逻辑存在显著差异,如何在保证学科深度的同时兼顾广度,成为科学界的共同困惑。例如,流体力学研究依赖高精度数值模拟,而生物学实验数据多为离散观测结果,将两者纳入统一模型体系,需要突破数据异构性与理论体系差异的双重壁垒。
尽管挑战重重,科学界对学科融合的大方向已形成共识。AI 的独特优势在于突破人类认知的时空局限 ——“我们人有局限性,每天只有 24 小时还要睡觉和休息,但人工智能可以克服这些,只要有算力支撑,再加上算法优化,机器一定能做到跨学科知识的融合。” 这种融合并非简单的知识堆砌,而是通过多模态技术实现的 “化学反应”:如同文字大模型与图像大模型从并行走向融合,基础科学大模型也将经历 “各学科独立发展 — 跨领域知识关联 — 统一智能框架” 的演进路径。上海人工智能实验室发布的 “书生” 科学发现平台便是这一思路的实践 —— 以通用大模型为基座,搭载 200 多个专业智能体,既保留各学科的深度,又通过知识图谱实现跨领域关联,已在肝癌、结直肠癌治疗靶点发现中展现出 “从理论到实验” 的闭环能力。
开放科学范式的构建,成为加速这一进程的关键。中国工程院院士、之江实验室主任王坚指出:“AI 重构的科研范式是开放的科学范式,不仅仅是赋能科学家,甚至是人人都可能成为科学家。” 两个月前,一位美国高中生利用 NASA 公开的 NEOWISE 望远镜数据,通过 AI 技术发现 150 万个新天体并发表顶级期刊论文的案例,生动诠释了开放的力量。这种开放不仅体现在数据共享,更包括算法开源、工具普惠 ——“书生” 平台正推动与全球科研机构的协同开发,其目标便是让 AI 工具跨越专业壁垒,使 “科研民主化” 从理念变为现实。
“AI + 科研” 的终极形态并非 “机器取代科学家”,而是 “人机一体” 的协同模式。上海人工智能实验室青年科学家白磊的比喻形象而深刻:“AI 能让每个人都有机会成为科学家,能让更专业的科学家成为爱因斯坦,能让爱因斯坦更早更快发现相对论。” 在 “元生” 系统的研发中,这种模式得到充分体现 ——AI 自动发现治疗靶点 GPR160 和 ARG2,科学家则聚焦临床验证与机制解析,形成 “机器提出假设 — 人类验证规律” 的创新闭环。这种分工既发挥了 AI 在数据挖掘与模式识别中的优势,又保留了人类在创造性思维与价值判断上的核心作用。
上海在推动科学之问解答上的实践颇具启示性。一方面,通过 Hitchin–Ngo 实验室、Fefferman 实验室等实体落地,强化 AI 与基础科学的交叉研究;另一方面,依托 “书生” 科学发现平台等载体,构建 “数据开放 — 工具共享 — 协同创新” 的生态体系。这种 “理论突破 + 生态构建” 的双轮驱动,为科学基础大模型的迭代提供了土壤,也为全球科学智能的发展提供了 “上海方案”。
三、模型之问:从专用智能到通用智能的进化逻辑
“模型之问” 直指人工智能的终极目标 —— 如何构建兼具通用能力与专业深度的智能系统,实现从 “特定任务执行者” 到 “通用问题解决者” 的跨越?这一问题的核心,是模型泛化能力的本质突破,也是 AGI(通用人工智能)路径的方向性探索。
当前大模型训练范式正经历深刻变革。过去半年,主流模式已从 OpenAI 开创的 “预训练为主、监督学习为辅”,转向 “注重提升推理能力的强化学习范式”。这一转变的直接动因,是传统模式在现实场景中的 “失效困境”—— 一些大模型在特定数据集上准确率达 99%,却在实际应用中频繁翻车。阶跃星辰首席科学家张祥雨认为,强化学习的优势在于 “大模型能够自行推理,找到一条逻辑自洽的因果链达成目标”,这种能力使模型在复杂任务中表现得更加智能,也弥补了数据不足带来的限制。
然而,强化学习并非完美解决方案。商汤科技联合创始人、首席科学家林达华指出其明显弊端:“幻觉现象会更加明显,思考过程较为冗长。” 更根本的瓶颈在于,当前强化学习仅能接受 “确定性的、数学代码式的反馈”,而现实世界的问题往往充满模糊性与不确定性。上海人工智能实验室青年领军科学家、书生大模型负责人陈恺强调:“未来强化学习还需解决‘如何接受自然场景非确定性答案’”,这一判断揭示了范式变革的下一阶段 —— 从 “精确反馈驱动” 向 “模糊环境适应” 进化。
模型架构的创新同样至关重要。“单一架构无法包打天下” 已成为业界共识,对 Transformer 的优化与超越成为探索焦点。MoE(混合专家模型)通过动态调用不同 “专家模块” 提升效率,非 Transformer 架构则尝试从神经符号系统、脉冲神经网络等方向寻找突破。这些探索的共同目标,是打破 “数据饥渴” 的桎梏 —— 商汤科技董事长兼 CEO 徐立曾警示:“据说到 2027 年前后,整个互联网上的自然语言的数据都会被用尽。语言生成的速度远没有算力生长的速度来得快,那这样显然形成了一种模型的倒挂差。” 解决这一问题的关键,在于从 “互联网文本数据依赖” 转向 “现实世界交互学习”,正如人类智能的发展源于与物理世界的持续互动,未来模型需要通过 “强大的现实世界理解模型 + 深度 3D 理解模型”,从环境反馈中自主积累知识。
“通专融合” 成为破解通用与专业矛盾的核心思路。上海人工智能实验室主任周伯文提出:“如果通用和专业能力是 AGI 本质特征,能否从一开始设计路线的时候就瞄准通用和专业能力的兼得展开。” 这一思路包含三层实现方案:基础模型层聚焦架构创新,融合层实现专业技能与通用能力的有机结合,评估层建立可泛化的性能标准。这种设计打破了 “通用即平庸” 的误区,通过模块化架构让模型在特定领域深度专精的同时,保持跨领域迁移的灵活性 —— 如同人类既能掌握专业知识,又能运用常识解决新问题。
安全与伦理问题是模型进化中不可忽视的维度。AI “教父” 杰弗里・辛顿的警示振聋发聩:“一旦其拥有长期目标,就可能会发展出与人类目标不一致的‘子目标’,甚至试图欺骗人类、操纵人类、逃脱人类的控制。” 因此,模型的进化必须同步伴随 “向善” 机制的构建。辛顿建议:“各国应该分享让它善良的技术,即使大家不愿意分享让它聪明的技术”,这一观点为全球协同治理提供了方向 —— 在技术竞争的同时,建立安全技术共享与风险监测的国际机制,确保智能进化的可控性。
从上海的实践来看,“模型之问” 的解答路径已逐渐清晰:通过架构创新突破性能瓶颈,借助 “通专融合” 平衡通用与专业能力,依托现实世界交互解决数据困境,同时以安全机制护航进化之路。这种多维度协同的思路,不仅为当前模型困境提供了解决方案,更为 AGI 的长远发展奠定了逻辑基础。
总结
“AI 三问” 的本质,是人工智能与人类文明对话的三种维度:数学之问探索智能的逻辑根基,科学之问重构人类认知世界的方式,模型之问则指向人机共生的未来形态。从上海出发的这场思辨,不仅是技术层面的路径探讨,更是对智能本质、科学边界、人类定位的深层思考。在数学理论的严密性、科学探索的实证性、模型应用的实用性之间找到平衡点,或许正是人工智能真正服务于人类文明进步的关键所在。
暂无评论,等你抢沙发