AI for Science — 全景与方法谱系

AI/ML 如何改变基础科学的"做法"——方法家族、旗舰系统，以及"领域模型"与通用大模型之间的分界线。

板块： aifs-biology · aifs-chemistry · aifs-physics · aifs-mathematics · aifs-ml-self · aifs-operations-research

顶层迁移：从"AI 辅助"到"Agentic Science（自主科学）"

2025 年多篇综述与立场论文共同指向同一框架：AI for Science 正从"局部辅助"走向"完整科学能动性"——系统把假设生成 → 实验设计 → 执行 → 分析 → 迭代优化串成闭环 [1]。NeurIPS 2025 立场论文把方法论之争框成两派 [2]：

范式增强（Paradigm Enhancement）——AI 加速传统科研任务。这是当下主流，且压倒性地是领域专用 / 任务专用模型。
范式转变（Paradigm Transition）——一个通用模型从根本上重定义科学怎么做。这是前沿押注，但证据仍弱（"基础模型把材料科学重构为通用、具涌现能力的 AI 系统"这一主张在我们 2026-06 的对抗验证中被否决）。

所以更准确的说法不是"通用 vs 专业"，而是 "领域基础模型 vs 任务专用模型"——真正跨科学的通用模型基本还不存在。

层面	主流方法	代表系统
求解物理方程	PINNs + 神经算子（FNO / AFNO / DeepONet）	aifs-physics、NVIDIA PhysicsNeMo
结构预测与从头设计	生成模型（扩散、流匹配）+ GNN	alphafold3、MatterGen、RFdiffusion
原子尺度模拟	机器学习原子间势（MLIP）	mattersim、MACE-MP-0
发现闭环	GNN + 主动学习 + 第一性原理（DFT）验证	gnome
推理 / 证明	LLM + 形式化验证（Lean）+ 搜索	aifs-mathematics

alphafold3——统一扩散模型，联合预测蛋白/核酸/小分子/离子复合物，大幅超越经典对接 [3]。值得注意：它去掉了 AF2 的等变结构模块，改用对原始原子坐标的扩散——这是"大生成模型"一方在等变之争中的一次数据规模胜利。
gnome——图网络 + 主动学习 + DFT 验证，发现约 220 万新晶体（约 38 万高稳定候选），在 MatBench Discovery 上把材料稳定性发现率从 ~50% 提升到 80% [4]。

骨架同源（Transformer / 扩散 / GNN 复用），但与通用 LLM 在四个结构层面不同：

Token 不是文字——是氨基酸、原子、晶格、物理场网格点。
对称性硬编码——SE(3)/E(3) 等变网络把旋转/平移不变性写进架构，通用 LLM 只能靠数据"背"。
目标不是预测下一词——掩码建模（ESM）、扩散去噪（AlphaFold 3 / MatterGen）、或物理残差损失（PINNs 可在零标注数据下训练）。
规模小 1–2 个数量级——蛋白/材料基础模型是百万~十亿级参数，不是前沿 LLM 的万亿级；它们用归纳偏置换规模。

学者怎么选最终落到三个问题：有没有足够可自监督的数据预训练基础模型（序列有、PDE 没有）；问题是否受硬物理约束（偏向专用 + 物理先验）；有没有便宜的验证回路（DFT、实验）让你敢用大规模生成。

每个学科页追踪前沿方法、旗舰系统、当前基准与开放问题：

SOTA 时效性极强——排行榜（MLIP、天气）几个月就翻盘；任何"最佳"都按"发布时最佳"理解。
来源质量分层——同行评审结果（AlphaFold 3、GNoME）高置信；很多"统一框架/分类法"来自未经评审的 arXiv 预印本，是一种合理框架而非定论。
截至 2026 年中，"通用科学基础模型"叙事基本仍是愿景。

[1] Agentic Science 综述 — arXiv:2508.14111 (2026-06-14)
[2] NeurIPS 2025 立场论文 — OpenReview:PegEYWWXvx / arXiv:2510.15280 (2026-06-14)
[3] AlphaFold 3 — Nature s41586-024-07487-w, Abramson et al. 2024 (2026-06-14)
[4] GNoME — DeepMind blog + Nature s41586-023-06735-9 (2026-06-14)
local: ai_for_science_landscape_2026-06-14.md — deep-research 汇编（29 来源，25 条对抗验证主张）