Home/AI for Science/AI for Science — 全景与方法谱系
中文English

AI for Science — 全景与方法谱系

AI/ML 如何改变基础科学的"做法"——方法家族、旗舰系统,以及"领域模型"与通用大模型之间的分界线。

板块: aifs-biology · aifs-chemistry · aifs-physics · aifs-mathematics · aifs-ml-self · aifs-operations-research

顶层迁移:从"AI 辅助"到"Agentic Science(自主科学)"

2025 年多篇综述与立场论文共同指向同一框架:AI for Science 正从"局部辅助"走向"完整科学能动性"——系统把假设生成 → 实验设计 → 执行 → 分析 → 迭代优化串成闭环 [1]。NeurIPS 2025 立场论文把方法论之争框成两派 [2]:

  • 范式增强(Paradigm Enhancement)——AI 加速传统科研任务。这是当下主流,且压倒性地是领域专用 / 任务专用模型
  • 范式转变(Paradigm Transition)——一个通用模型从根本上重定义科学怎么做。这是前沿押注,但证据仍弱("基础模型把材料科学重构为通用、具涌现能力的 AI 系统"这一主张在我们 2026-06 的对抗验证中被否决)。

所以更准确的说法不是"通用 vs 专业",而是 "领域基础模型 vs 任务专用模型"——真正跨科学的通用模型基本还不存在。

方法谱系(实际在用什么)

层面 主流方法 代表系统
求解物理方程 PINNs + 神经算子(FNO / AFNO / DeepONet) aifs-physics、NVIDIA PhysicsNeMo
结构预测与从头设计 生成模型(扩散、流匹配)+ GNN alphafold3、MatterGen、RFdiffusion
原子尺度模拟 机器学习原子间势(MLIP) mattersim、MACE-MP-0
发现闭环 GNN + 主动学习 + 第一性原理(DFT)验证 gnome
推理 / 证明 LLM + 形式化验证(Lean)+ 搜索 aifs-mathematics

定义打法的两个旗舰

  • alphafold3——统一扩散模型,联合预测蛋白/核酸/小分子/离子复合物,大幅超越经典对接 [3]。值得注意:它去掉了 AF2 的等变结构模块,改用对原始原子坐标的扩散——这是"大生成模型"一方在等变之争中的一次数据规模胜利。
  • gnome——图网络 + 主动学习 + DFT 验证,发现约 220 万新晶体(约 38 万高稳定候选),在 MatBench Discovery 上把材料稳定性发现率从 ~50% 提升到 80% [4]。

为什么是领域模型,而非通用 LLM

骨架同源(Transformer / 扩散 / GNN 复用),但与通用 LLM 在四个结构层面不同:

  1. Token 不是文字——是氨基酸、原子、晶格、物理场网格点。
  2. 对称性硬编码——SE(3)/E(3) 等变网络把旋转/平移不变性写进架构,通用 LLM 只能靠数据"背"。
  3. 目标不是预测下一词——掩码建模(ESM)、扩散去噪(AlphaFold 3 / MatterGen)、或物理残差损失(PINNs 可在标注数据下训练)。
  4. 规模小 1–2 个数量级——蛋白/材料基础模型是百万~十亿级参数,不是前沿 LLM 的万亿级;它们用归纳偏置换规模。

学者怎么选最终落到三个问题:有没有足够可自监督的数据预训练基础模型(序列有、PDE 没有);问题是否受硬物理约束(偏向专用 + 物理先验);有没有便宜的验证回路(DFT、实验)让你敢用大规模生成。

本板块如何组织

每个学科页追踪前沿方法、旗舰系统、当前基准与开放问题:

  • aifs-biology——蛋白结构与设计、基因组/序列基础模型(AlphaFold、ESM、Evo)
  • aifs-chemistry——分子生成、逆合成、反应预测、化学 MLIP
  • aifs-physics——PINNs、神经算子、仿真代理、天气/气候、聚变
  • aifs-mathematics——定理证明、自动形式化、AI 辅助猜想(AlphaProof、AlphaGeometry、Lean)
  • aifs-ml-self——AI for AI:自主 AI 科学家、神经架构搜索、AI 驱动的 ML 研究
  • aifs-operations-research——组合优化的 ML、学习型求解器、OR + RL

Caveats

  • SOTA 时效性极强——排行榜(MLIP、天气)几个月就翻盘;任何"最佳"都按"发布时最佳"理解。
  • 来源质量分层——同行评审结果(AlphaFold 3、GNoME)高置信;很多"统一框架/分类法"来自未经评审的 arXiv 预印本,是一种合理框架而非定论。
  • 截至 2026 年中,"通用科学基础模型"叙事基本仍是愿景

Sources

  • [1] Agentic Science 综述 — arXiv:2508.14111 (2026-06-14)
  • [2] NeurIPS 2025 立场论文 — OpenReview:PegEYWWXvx / arXiv:2510.15280 (2026-06-14)
  • [3] AlphaFold 3 — Nature s41586-024-07487-w, Abramson et al. 2024 (2026-06-14)
  • [4] GNoME — DeepMind blog + Nature s41586-023-06735-9 (2026-06-14)
  • local: ai_for_science_landscape_2026-06-14.md — deep-research 汇编(29 来源,25 条对抗验证主张)
Last compiled: 2026-06-14