跳转至

15. 化简 5:XC 泛函近似——Jacob's ladder 与精度/成本权衡

本篇对应化简链的第 5 步。化简 4 的 Kohn-Sham 方程把所有"未知"都塞进 \(E_{xc}[\rho]\) 一项;化简 5 就是用具体可评估的模型去近似这一项。不同的近似等级(LDA → GGA → meta-GGA → Hybrid)构成了 Perdew 命名的 "Jacob's ladder"——阶梯越往上,精度越高、成本越贵。


1. 化简位置

化简 3:HK 定理         ρ_0 承载一切基态信息;E[ρ] 存在但形式未知
化简 4:Kohn-Sham       把未知打包成 E_xc[ρ](V_eff + 单粒子方程)
化简 5:XC 泛函近似     ★ 本篇 ★  给出 E_xc[ρ] 的具体函数式
化简 6:赝势            处理核+内层电子

化简 5 是 DFT 从"原理"走到"能给数"的最后一块拼图。有了 XC 泛函,KS 方程完全闭合,剩下的都是数值技巧(化简 6-12)。


2. 上一步的困难

Kohn-Sham(化简 4)给出:

\[E[\rho] = T_s[\rho] + V_{ext}[\rho] + J[\rho] + E_{xc}[\rho]\]

除了 \(E_{xc}[\rho]\),其他三项都可以直接算(\(T_s\) 用 KS 轨道;\(V_{ext}\)\(J\) 是已知积分)。

\(E_{xc}[\rho]\) 打包了两种复杂物理:

  1. 交换能 Exchange:来自电子反对称性(同自旋电子互斥、不能同时在一点),这是纯量子效应
  2. 关联能 Correlation:所有真实多体关联(动能关联 + 超 Hartree 的电-电关联)

精确的 \(E_{xc}[\rho]\) 不存在解析表达式——如果有,我们就解决了 N 体量子多体问题。所以必须近似。

ML 类比:这像训练一个大模型时,你已经搭好了骨架(Kohn-Sham 框架),但有一个核心模块(\(E_{xc}\))是黑盒。你必须用一个可以评估的代理模型(surrogate)去近似它。不同的 surrogate 复杂度不同,效果也不同——这就是 Jacob's ladder。


3. 引入的假设/近似

Jacob's ladder(Perdew's ladder of XC functionals)

Perdew 提出把 XC 泛函按所用的局部信息分级。阶梯越往上,用的信息越多,精度越高,成本越贵。

             ┌────────────────────────────────────────┐
 第 5 阶     │  Fully non-local (RPA, double hybrid)   │  最贵,化学精度
             ├────────────────────────────────────────┤
 第 4 阶     │  Hybrid (HSE06, PBE0, B3LYP)            │  加精确 HF 交换
             ├────────────────────────────────────────┤
 第 3 阶     │  meta-GGA (SCAN, TPSS, r²SCAN)          │  + 动能密度 τ
             ├────────────────────────────────────────┤
 第 2 阶     │  GGA (PBE, PBEsol, BLYP)                │  + 梯度 ∇ρ
             ├────────────────────────────────────────┤
 第 1 阶     │  LDA (PW92, PZ81)                       │  只用 ρ 局部值
             └────────────────────────────────────────┘
                        Hartree ladder 起点

LDA(Local Density Approximation,第 1 阶)

假设:每一点处的 XC 能密度等同于均匀电子气在该处密度值下的 XC 能密度。

\[E_{xc}^{LDA}[\rho] = \int \varepsilon_{xc}^{\text{hom}}(\rho(\vec{r})) \, \rho(\vec{r}) \, d^3r\]
  • \(\varepsilon_{xc}^{\text{hom}}(\rho)\):均匀电子气的单粒子 XC 能,交换部分有解析解(Dirac),关联部分由 QMC 数值给出(Ceperley-Alder 1980),用 PW92 / PZ81 之类的解析拟合
  • 本质:完全局部的 functional——第 \(\vec{r}\) 点的能密度只看 \(\rho(\vec{r})\) 一个数

GGA(Generalized Gradient Approximation,第 2 阶)

假设:除了 \(\rho(\vec{r})\),还让 XC 能密度依赖 \(|\nabla \rho(\vec{r})|\),以捕捉密度的空间非均匀性

\[E_{xc}^{GGA}[\rho] = \int f(\rho, |\nabla\rho|) \, d^3r\]

代表泛函: - PBE(Perdew-Burke-Ernzerhof 1996):固体物理和凝聚态的事实标准。无自由参数,全部靠理论约束推导 - PBEsol:专门为固体重新参数化的 PBE,给出更好的晶格常数(PBE 偏大 ~1%,PBEsol 更接近实验) - BLYP:量子化学领域常用(Becke + Lee-Yang-Parr)

meta-GGA(第 3 阶)

假设:再加上动能密度 \(\tau(\vec{r}) = \frac{1}{2} \sum_i |\nabla \phi_i^{KS}|^2\),也就是说 \(E_{xc}\) 依赖于 KS 轨道的一个聚合量。

\[E_{xc}^{\text{meta-GGA}}[\rho] = \int f(\rho, |\nabla\rho|, \tau) \, d^3r\]

代表泛函: - SCAN(Strongly Constrained and Appropriately Normed,2015):满足 17 条已知精确约束,在分子/固体/表面都表现好;但数值不稳定,常用 r²SCAN(2020 regularized 版本) - TPSSM06-L

成本相比 GGA 贵约 2×,精度提升显著(键长、能量、磁性更准)。

Hybrid(第 4 阶)

假设:把一部分(10-25%)精确的 Hartree-Fock 交换(non-local)混进 GGA 交换中。

\[E_{xc}^{\text{hybrid}} = \alpha \, E_x^{HF} + (1-\alpha) E_x^{GGA} + E_c^{GGA}\]

代表泛函: - PBE0:25% HF + 75% PBE 交换 + PBE 关联;分子/小带隙半导体好 - HSE06(Heyd-Scuseria-Ernzerhof):短程用 HF 交换,长程用 PBE 交换(screened hybrid)。对半导体带隙表现非常好——Si 实验 1.17 eV,HSE06 算 ~1.15 eV - B3LYP:化学领域的主力(3 参数 Becke + LYP)

成本:相对 PBE 贵 10-100×(HF 交换是非局域的,需要对两两对计算 \(\int\int \phi_i^* \phi_j^* \phi_i \phi_j / r_{12}\))。

第 5 阶及以上

  • RPA(Random Phase Approximation):完全非局域,捕捉长程色散;太贵,研究用
  • Double hybrid(B2PLYP 等):混入 MP2 关联
  • Machine-learned functionals(DM21 等):用 ML 拟合精确数据——和你的 ML 背景直接相关的前沿方向

代价(所有泛函的共同问题)

  1. 没有系统改进路径:不像 coupled cluster CCSD → CCSD(T),爬 XC ladder 不保证必然变好。某些场景 PBE 比 SCAN 好
  2. 每个泛函有自己的系统性偏差
  3. LDA:倾向于过度束缚(over-binding),晶格常数偏小 ~1-2%
  4. PBE:偏大 ~1%(过度离域)
  5. PBEsol / SCAN:接近实验
  6. DFT 带隙问题(LDA/GGA):系统性低估带隙 30-50%(见下文坑 1)
  7. 色散(vdW)缺失:LDA/GGA/meta-GGA 不含长程色散相互作用;需要额外加 D3/D4 修正或 vdW-DF 泛函
  8. 自相互作用误差(SIE):LDA/GGA 的近似交换不能完全抵消 Hartree 的自相互作用,导致过度离域化
  9. 强关联体系(过渡金属氧化物、稀土):所有普通泛函都不对,需要 DFT+U 或 hybrid 或超越 DFT 方法

4. 引入的新概念

概念 含义
LDA / Local Density Approximation 只依赖局部 ρ 的 XC 泛函族
GGA / Generalized Gradient Approximation 依赖 ρ 和 ∇ρ 的泛函族
meta-GGA 再加动能密度 τ
Hybrid 混入 HF 精确交换
PBE GGA 事实上的固体标准
PBEsol PBE 的固体优化版(更准的晶格常数)
SCAN / r²SCAN 主流 meta-GGA
HSE06 屏蔽 hybrid,半导体带隙标杆
PBE0 全程 hybrid
Jacob's ladder Perdew 提出的 XC 近似等级图
自相互作用误差 SIE 近似泛函中残留的电子与自己的人工斥力
DFT 带隙问题 LDA/GGA 系统性低估半导体/绝缘体带隙
均匀电子气 / jellium LDA 的物理参考系:密度均匀的自由电子海
动能密度 τ meta-GGA 用到的 \(\frac{1}{2}\sum \|\nabla \phi_i\|^2\)
精确交换(exact exchange, EXX) 用 HF 表达式代替近似交换

5. 对应 QE 字段

QE 里 XC 泛函主要由赝势文件决定——每个 .upf 文件在 header 里标注了自己是按哪个泛函生成的,必须与实际使用的泛函一致。 | 化简 5 的概念 | QE 中的位置 | |---|---| | 泛函选择(LDA/PBE/PBEsol) | 间接:通过 pseudo_dir 指向的赝势库 | | 显式覆盖泛函 | &SYSTEM input_dft = 'pbe' / 'pbesol' / 'scan' / 'hse' | | 赝势 header 里的功能标记 | .upf 文件里 <PP_HEADER functional="PBE"> | | Hybrid 的 HF 交换 | &SYSTEM input_dft = 'hse',附加 &CONTROL 里的 exxdiv 设置,并通过 ecutfock 控制 HF 交换截断能 | | 色散修正 | &SYSTEM vdw_corr = 'grimme-d3' / 'grimme-d2' / 'ts' | | 自相互作用校正 | lda_plus_u = .true. + Hubbard_U(...)(DFT+U) | | XC 能输出 | SCF 输出的 xc contribution = ... Ry |

TritonDFT 的赝势库位置(已在项目中):

TritonDFT/tritonDFT-src/PseudoDojo/SR_v0.4.1/
├── LDA_standard/         ← LDA 泛函
├── PBE_standard/         ← PBE 泛函(默认,多数测试使用)
└── PBEsol_standard/      ← PBEsol 泛函

切换泛函 = 切换 pseudo_dir 路径 + (需要时)显式写 input_dft赝势必须和 XC 泛函匹配,否则结果错误。


6. 对应 benchmark 条目

XC 泛函选择是 benchmark 评分的隐藏上游变量——不是评分字段本身,但决定了所有几何与能量结果。

benchmark 字段 泛函敏感性
a, b, c(晶格长度) 很敏感:LDA ↓1-2%,PBE ↑0-1%,PBEsol ≈ 实验
total_energy_ev_per_fu 绝对值对泛函极敏感,但相对能量(形成能、反应能)常常更稳
space_group, crystal_system 一般不敏感(对称性是拓扑性质),除非泛函偏差大到改变相对稳定性(铁电、马氏体)
band_gap(若被评) 极敏感:LDA/PBE 低估 30-50%,HSE06 接近实验

benchmark 设计建议:ground_truth 要明确说明基于哪个泛函算出的。同一个材料用 PBE 和 HSE06 给出的晶格常数可能差 1%,不讲清楚就没法评。


7. ML 类比

类比 1:XC 泛函 ≈ backbone 网络

每个 XC 泛函就像一个 backbone / 特征提取器,有自己的 inductive bias 和成本/精度 trade-off:

ML Backbone XC 泛函 共同点
Linear / 小 MLP LDA 便宜、对简单场景够用、系统性偏差
ResNet PBE 中等复杂度、广泛通用的 workhorse
ViT / EfficientNet SCAN / r²SCAN 精度提升但训练/推理更贵
GPT-class 大模型 HSE06 / Hybrid 精度显著更高但成本 10-100×
专家模型 / MoE RPA / double hybrid 只在研究里偶尔用
ML 拟合 DM21 等 直接用数据拟合,没有 physics prior

这个类比在精度-成本边界系统性偏差没有 free lunch 方面都很贴切。

类比 2:局部 vs 全局信息

爬 Jacob's ladder 相当于给模型更多上下文

阶梯 输入特征
LDA 只看当前位置的密度(相当于 patch-size = 1)
GGA 加上梯度(相当于 patch-size = 3 + 边缘检测)
meta-GGA 加上动能密度(相当于 patch + 轨道池化)
Hybrid 把 fully non-local 的 HF 交换混进去(相当于加 self-attention)

Hybrid 的 HF 交换项是两两对之间的 \(\int\int\) 积分,完全非局域——这和 attention 的 \(O(N^2)\) 成本爆炸完全对应。HSE06 的"screened"(屏蔽)处理相当于把长距离 attention 截断(linear / local attention),降成本不牺牲太多精度。

类比 3:系统性偏差是可校准的

ML 里如果你的模型系统性低估某个量,可以用校准(calibration)或后处理修正。DFT 也有类似做法: - 用 scissor operator 把 PBE 带隙整体拉开到实验值 - 用 DFT+U 修正过渡金属 d 电子的局域化 - 这些都不严谨但工程上有用

类比 4:没有 single best 模型

ML 里你不会说"CNN 永远比 Transformer 好"。DFT 里也没有"universally best" 泛函: - 分子化学:B3LYP 主导(但 SCAN 在追赶) - 固体物理:PBE / PBEsol - 半导体带隙:HSE06 - 过渡金属磁性:PBE + U,或 SCAN - 色散主导体系(分子晶体、vdW 材料):PBE-D3 或 vdW-DF


8. 典型取值 / 常见坑

坑 1:DFT 带隙问题(最著名的系统性误差)

LDA/GGA 系统性低估半导体/绝缘体带隙约 30-50%:

材料 实验带隙 (eV) PBE KS gap (eV) HSE06 (eV)
Si 1.17 ~0.6 ~1.15
Ge 0.74 ~0.0(甚至金属化) ~0.6
C (diamond) 5.47 ~4.2 ~5.3
GaAs 1.52 ~0.5 ~1.4
MgO 7.83 ~4.7 ~6.4

原因: - KS 本征值不是真实电子能级(这是 Kohn-Sham 虚构系统的本征值) - 精确泛函下 KS gap 也等于 \(E_g - \Delta_{xc}\),与真实 fundamental gap 差一个 derivative discontinuity - LDA/GGA 的近似泛函进一步加重低估

工程对策: - 要实验级带隙 → HSE06 / GW / DFT+U - 只比较趋势 / 做结构弛豫 → PBE 足够 - 注意 Ge 在 PBE 下直接被算成金属(没有带隙)——经典"假金属"问题

坑 2:LDA vs PBE 晶格常数偏差方向

  • LDA:低估晶格常数 ~1-2%(over-binding)
  • PBE:高估 ~0-1%(slight under-binding)
  • PBEsol:介于两者之间,对大多数固体接近实验
  • SCAN:通常很接近实验,但对少数体系过度束缚

Si(典型测试体系): | 泛函 | a (Å) | 相对实验 (5.431 Å) | |---|---|---| | LDA | ~5.40 | -0.6% | | PBE | ~5.47 | +0.7% | | PBEsol | ~5.43 | ~0.0% | | SCAN | ~5.44 | +0.2% |

坑 3:赝势必须和泛函匹配

不能用 PBE 赝势跑 PBEsol 或 LDA 计算,否则结果完全错误。赝势生成时已经"烘焙"了特定的 XC 泛函假设。QE 会在输出开头打印 warning 如果不匹配:

Using functional 'PBE' but pseudopotentials generated for 'PBESOL'

TritonDFT 的三个赝势目录(LDA_standard, PBE_standard, PBEsol_standard)就是为了解决这个问题。

坑 4:Hybrid 贵得吓人

HSE06 相比 PBE: - 小体系(8-16 原子):慢 10-50× - 大体系(>100 原子):慢 50-500×(HF 交换是 \(O(N^4)\)) - 需要 ecutfock(HF 交换截断能,一般 = ecutwfc) - 并行伸缩性差

benchmark 用 HSE06 跑 vc-relax 要谨慎评估预算。一般先 PBE 弛豫,再 HSE06 做 scf 单点能和带隙。

坑 5:色散缺失

LDA/GGA/meta-GGA 都不含长程色散(van der Waals)。对层状材料(石墨、MoS₂)、分子晶体、吸附问题,会严重低估结合能或给出错误层间距。

工程对策:加 D3 修正(vdw_corr='grimme-d3')几乎零成本就显著改善。

坑 6:强关联体系(过渡金属氧化物、稀土、磁性绝缘体)

NiO、MnO、CoO 这类经典的"Mott 绝缘体"在 PBE 下算出来是金属(错),需要: - DFT+U(给 d / f 电子加 Hubbard U,典型 4-8 eV) - Hybrid(HSE06 能部分救回带隙) - 超越 DFT(DMFT、GW)

benchmark 设计时涉及到这类材料要特别注意。

典型选择指南(工程速记)

场景 推荐
快速结构弛豫,体系简单 PBE(默认选择)
高精度晶格常数 PBEsol 或 SCAN
半导体/绝缘体带隙 HSE06(预算够)或 PBE + scissor 校准
分子晶体 / vdW 层状 PBE + D3 或 vdW-DF
过渡金属氧化物磁性 PBE + U 或 SCAN
分子化学(非固体) B3LYP(Gaussian/ORCA)或 SCAN
DFTBench baseline PBE(赝势库已就绪,通用性好)

下一步阅读