AI for Science — 全景与方法谱系
AI/ML 如何改变基础科学的"做法"——方法家族、旗舰系统,以及"领域模型"与通用大模型之间的分界线。
板块: aifs-biology · aifs-chemistry · aifs-physics · aifs-mathematics · aifs-ml-self · aifs-operations-research
顶层迁移:从"AI 辅助"到"Agentic Science(自主科学)"
2025 年多篇综述与立场论文共同指向同一框架:AI for Science 正从"局部辅助"走向"完整科学能动性"——系统把假设生成 → 实验设计 → 执行 → 分析 → 迭代优化串成闭环 [1]。NeurIPS 2025 立场论文把方法论之争框成两派 [2]:
- 范式增强(Paradigm Enhancement)——AI 加速传统科研任务。这是当下主流,且压倒性地是领域专用 / 任务专用模型。
- 范式转变(Paradigm Transition)——一个通用模型从根本上重定义科学怎么做。这是前沿押注,但证据仍弱("基础模型把材料科学重构为通用、具涌现能力的 AI 系统"这一主张在我们 2026-06 的对抗验证中被否决)。
所以更准确的说法不是"通用 vs 专业",而是 "领域基础模型 vs 任务专用模型"——真正跨科学的通用模型基本还不存在。
方法谱系(实际在用什么)
| 层面 | 主流方法 | 代表系统 |
|---|---|---|
| 求解物理方程 | PINNs + 神经算子(FNO / AFNO / DeepONet) | aifs-physics、NVIDIA PhysicsNeMo |
| 结构预测与从头设计 | 生成模型(扩散、流匹配)+ GNN | alphafold3、MatterGen、RFdiffusion |
| 原子尺度模拟 | 机器学习原子间势(MLIP) | mattersim、MACE-MP-0 |
| 发现闭环 | GNN + 主动学习 + 第一性原理(DFT)验证 | gnome |
| 推理 / 证明 | LLM + 形式化验证(Lean)+ 搜索 | aifs-mathematics |
定义打法的两个旗舰
- alphafold3——统一扩散模型,联合预测蛋白/核酸/小分子/离子复合物,大幅超越经典对接 [3]。值得注意:它去掉了 AF2 的等变结构模块,改用对原始原子坐标的扩散——这是"大生成模型"一方在等变之争中的一次数据规模胜利。
- gnome——图网络 + 主动学习 + DFT 验证,发现约 220 万新晶体(约 38 万高稳定候选),在 MatBench Discovery 上把材料稳定性发现率从 ~50% 提升到 80% [4]。
为什么是领域模型,而非通用 LLM
骨架同源(Transformer / 扩散 / GNN 复用),但与通用 LLM 在四个结构层面不同:
- Token 不是文字——是氨基酸、原子、晶格、物理场网格点。
- 对称性硬编码——SE(3)/E(3) 等变网络把旋转/平移不变性写进架构,通用 LLM 只能靠数据"背"。
- 目标不是预测下一词——掩码建模(ESM)、扩散去噪(AlphaFold 3 / MatterGen)、或物理残差损失(PINNs 可在零标注数据下训练)。
- 规模小 1–2 个数量级——蛋白/材料基础模型是百万~十亿级参数,不是前沿 LLM 的万亿级;它们用归纳偏置换规模。
学者怎么选最终落到三个问题:有没有足够可自监督的数据预训练基础模型(序列有、PDE 没有);问题是否受硬物理约束(偏向专用 + 物理先验);有没有便宜的验证回路(DFT、实验)让你敢用大规模生成。
本板块如何组织
每个学科页追踪前沿方法、旗舰系统、当前基准与开放问题:
- aifs-biology——蛋白结构与设计、基因组/序列基础模型(AlphaFold、ESM、Evo)
- aifs-chemistry——分子生成、逆合成、反应预测、化学 MLIP
- aifs-physics——PINNs、神经算子、仿真代理、天气/气候、聚变
- aifs-mathematics——定理证明、自动形式化、AI 辅助猜想(AlphaProof、AlphaGeometry、Lean)
- aifs-ml-self——AI for AI:自主 AI 科学家、神经架构搜索、AI 驱动的 ML 研究
- aifs-operations-research——组合优化的 ML、学习型求解器、OR + RL
Caveats
- SOTA 时效性极强——排行榜(MLIP、天气)几个月就翻盘;任何"最佳"都按"发布时最佳"理解。
- 来源质量分层——同行评审结果(AlphaFold 3、GNoME)高置信;很多"统一框架/分类法"来自未经评审的 arXiv 预印本,是一种合理框架而非定论。
- 截至 2026 年中,"通用科学基础模型"叙事基本仍是愿景。
Sources
- [1] Agentic Science 综述 — arXiv:2508.14111 (2026-06-14)
- [2] NeurIPS 2025 立场论文 — OpenReview:PegEYWWXvx / arXiv:2510.15280 (2026-06-14)
- [3] AlphaFold 3 — Nature s41586-024-07487-w, Abramson et al. 2024 (2026-06-14)
- [4] GNoME — DeepMind blog + Nature s41586-023-06735-9 (2026-06-14)
- local: ai_for_science_landscape_2026-06-14.md — deep-research 汇编(29 来源,25 条对抗验证主张)
Related
Last compiled: 2026-06-14