15. 化简 5：XC 泛函近似——Jacob's ladder 与精度/成本权衡¶

本篇对应化简链的第 5 步。化简 4 的 Kohn-Sham 方程把所有"未知"都塞进 \(E_{xc}[\rho]\) 一项；化简 5 就是用具体可评估的模型去近似这一项。不同的近似等级（LDA → GGA → meta-GGA → Hybrid）构成了 Perdew 命名的 "Jacob's ladder"——阶梯越往上，精度越高、成本越贵。

1. 化简位置¶

化简 3：HK 定理         ρ_0 承载一切基态信息；E[ρ] 存在但形式未知
化简 4：Kohn-Sham       把未知打包成 E_xc[ρ]（V_eff + 单粒子方程）
化简 5：XC 泛函近似     ★ 本篇 ★  给出 E_xc[ρ] 的具体函数式
化简 6：赝势            处理核+内层电子

化简 5 是 DFT 从"原理"走到"能给数"的最后一块拼图。有了 XC 泛函，KS 方程完全闭合，剩下的都是数值技巧（化简 6-12）。

2. 上一步的困难¶

Kohn-Sham（化简 4）给出：

\[E[\rho] = T_s[\rho] + V_{ext}[\rho] + J[\rho] + E_{xc}[\rho]\]

除了 \(E_{xc}[\rho]\)，其他三项都可以直接算（\(T_s\) 用 KS 轨道；\(V_{ext}\) 和 \(J\) 是已知积分）。

\(E_{xc}[\rho]\) 打包了两种复杂物理：

交换能 Exchange：来自电子反对称性（同自旋电子互斥、不能同时在一点），这是纯量子效应
关联能 Correlation：所有真实多体关联（动能关联 + 超 Hartree 的电-电关联）

精确的 \(E_{xc}[\rho]\) 不存在解析表达式——如果有，我们就解决了 N 体量子多体问题。所以必须近似。

ML 类比：这像训练一个大模型时，你已经搭好了骨架（Kohn-Sham 框架），但有一个核心模块（\(E_{xc}\)）是黑盒。你必须用一个可以评估的代理模型（surrogate）去近似它。不同的 surrogate 复杂度不同，效果也不同——这就是 Jacob's ladder。

3. 引入的假设/近似¶

Jacob's ladder（Perdew's ladder of XC functionals）¶

Perdew 提出把 XC 泛函按所用的局部信息分级。阶梯越往上，用的信息越多，精度越高，成本越贵。

             ┌────────────────────────────────────────┐
 第 5 阶     │  Fully non-local (RPA, double hybrid)   │  最贵，化学精度
             ├────────────────────────────────────────┤
 第 4 阶     │  Hybrid (HSE06, PBE0, B3LYP)            │  加精确 HF 交换
             ├────────────────────────────────────────┤
 第 3 阶     │  meta-GGA (SCAN, TPSS, r²SCAN)          │  + 动能密度 τ
             ├────────────────────────────────────────┤
 第 2 阶     │  GGA (PBE, PBEsol, BLYP)                │  + 梯度 ∇ρ
             ├────────────────────────────────────────┤
 第 1 阶     │  LDA (PW92, PZ81)                       │  只用 ρ 局部值
             └────────────────────────────────────────┘
                                ↑
                        Hartree ladder 起点

LDA（Local Density Approximation，第 1 阶）¶

假设：每一点处的 XC 能密度等同于均匀电子气在该处密度值下的 XC 能密度。

\[E_{xc}^{LDA}[\rho] = \int \varepsilon_{xc}^{\text{hom}}(\rho(\vec{r})) \, \rho(\vec{r}) \, d^3r\]

\(\varepsilon_{xc}^{\text{hom}}(\rho)\)：均匀电子气的单粒子 XC 能，交换部分有解析解（Dirac），关联部分由 QMC 数值给出（Ceperley-Alder 1980），用 PW92 / PZ81 之类的解析拟合
本质：完全局部的 functional——第 \(\vec{r}\) 点的能密度只看 \(\rho(\vec{r})\) 一个数

GGA（Generalized Gradient Approximation，第 2 阶）¶

假设：除了 \(\rho(\vec{r})\)，还让 XC 能密度依赖 \(|\nabla \rho(\vec{r})|\)，以捕捉密度的空间非均匀性。

\[E_{xc}^{GGA}[\rho] = \int f(\rho, |\nabla\rho|) \, d^3r\]

代表泛函： - PBE（Perdew-Burke-Ernzerhof 1996）：固体物理和凝聚态的事实标准。无自由参数，全部靠理论约束推导 - PBEsol：专门为固体重新参数化的 PBE，给出更好的晶格常数（PBE 偏大 ~1%，PBEsol 更接近实验） - BLYP：量子化学领域常用（Becke + Lee-Yang-Parr）

meta-GGA（第 3 阶）¶

假设：再加上动能密度 \(\tau(\vec{r}) = \frac{1}{2} \sum_i |\nabla \phi_i^{KS}|^2\)，也就是说 \(E_{xc}\) 依赖于 KS 轨道的一个聚合量。

\[E_{xc}^{\text{meta-GGA}}[\rho] = \int f(\rho, |\nabla\rho|, \tau) \, d^3r\]

代表泛函： - SCAN（Strongly Constrained and Appropriately Normed，2015）：满足 17 条已知精确约束，在分子/固体/表面都表现好；但数值不稳定，常用 r²SCAN（2020 regularized 版本） - TPSS、M06-L 等

成本相比 GGA 贵约 2×，精度提升显著（键长、能量、磁性更准）。

Hybrid（第 4 阶）¶

假设：把一部分（10-25%）精确的 Hartree-Fock 交换（non-local）混进 GGA 交换中。

\[E_{xc}^{\text{hybrid}} = \alpha \, E_x^{HF} + (1-\alpha) E_x^{GGA} + E_c^{GGA}\]

代表泛函： - PBE0：25% HF + 75% PBE 交换 + PBE 关联；分子/小带隙半导体好 - HSE06（Heyd-Scuseria-Ernzerhof）：短程用 HF 交换，长程用 PBE 交换（screened hybrid）。对半导体带隙表现非常好——Si 实验 1.17 eV，HSE06 算 ~1.15 eV - B3LYP：化学领域的主力（3 参数 Becke + LYP）

成本：相对 PBE 贵 10-100×（HF 交换是非局域的，需要对两两对计算 \(\int\int \phi_i^* \phi_j^* \phi_i \phi_j / r_{12}\)）。

第 5 阶及以上¶

RPA（Random Phase Approximation）：完全非局域，捕捉长程色散；太贵，研究用
Double hybrid（B2PLYP 等）：混入 MP2 关联
Machine-learned functionals（DM21 等）：用 ML 拟合精确数据——和你的 ML 背景直接相关的前沿方向

代价（所有泛函的共同问题）¶

没有系统改进路径：不像 coupled cluster CCSD → CCSD(T)，爬 XC ladder 不保证必然变好。某些场景 PBE 比 SCAN 好
每个泛函有自己的系统性偏差：
LDA：倾向于过度束缚（over-binding），晶格常数偏小 ~1-2%
PBE：偏大 ~1%（过度离域）
PBEsol / SCAN：接近实验
DFT 带隙问题（LDA/GGA）：系统性低估带隙 30-50%（见下文坑 1）
色散（vdW）缺失：LDA/GGA/meta-GGA 不含长程色散相互作用；需要额外加 D3/D4 修正或 vdW-DF 泛函
自相互作用误差（SIE）：LDA/GGA 的近似交换不能完全抵消 Hartree 的自相互作用，导致过度离域化
强关联体系（过渡金属氧化物、稀土）：所有普通泛函都不对，需要 DFT+U 或 hybrid 或超越 DFT 方法

4. 引入的新概念¶

概念	含义
LDA / Local Density Approximation	只依赖局部 ρ 的 XC 泛函族
GGA / Generalized Gradient Approximation	依赖 ρ 和 ∇ρ 的泛函族
meta-GGA	再加动能密度 τ
Hybrid	混入 HF 精确交换
PBE	GGA 事实上的固体标准
PBEsol	PBE 的固体优化版（更准的晶格常数）
SCAN / r²SCAN	主流 meta-GGA
HSE06	屏蔽 hybrid，半导体带隙标杆
PBE0	全程 hybrid
Jacob's ladder	Perdew 提出的 XC 近似等级图
自相互作用误差 SIE	近似泛函中残留的电子与自己的人工斥力
DFT 带隙问题	LDA/GGA 系统性低估半导体/绝缘体带隙
均匀电子气 / jellium	LDA 的物理参考系：密度均匀的自由电子海
动能密度 τ	meta-GGA 用到的 \(\frac{1}{2}\sum \\|\nabla \phi_i\\|^2\)
精确交换（exact exchange, EXX）	用 HF 表达式代替近似交换

5. 对应 QE 字段¶

QE 里 XC 泛函主要由赝势文件决定——每个 .upf 文件在 header 里标注了自己是按哪个泛函生成的，必须与实际使用的泛函一致。 | 化简 5 的概念 | QE 中的位置 | |---|---| | 泛函选择（LDA/PBE/PBEsol） | 间接：通过 pseudo_dir 指向的赝势库 | | 显式覆盖泛函 | &SYSTEM input_dft = 'pbe' / 'pbesol' / 'scan' / 'hse' | | 赝势 header 里的功能标记 | .upf 文件里 <PP_HEADER functional="PBE"> | | Hybrid 的 HF 交换 | &SYSTEM input_dft = 'hse'，附加 &CONTROL 里的 exxdiv 设置，并通过 ecutfock 控制 HF 交换截断能 | | 色散修正 | &SYSTEM vdw_corr = 'grimme-d3' / 'grimme-d2' / 'ts' | | 自相互作用校正 | lda_plus_u = .true. + Hubbard_U(...)（DFT+U） | | XC 能输出 | SCF 输出的 xc contribution = ... Ry |

TritonDFT 的赝势库位置（已在项目中）：

TritonDFT/tritonDFT-src/PseudoDojo/SR_v0.4.1/
├── LDA_standard/         ← LDA 泛函
├── PBE_standard/         ← PBE 泛函（默认，多数测试使用）
└── PBEsol_standard/      ← PBEsol 泛函

切换泛函 = 切换 pseudo_dir 路径 + （需要时）显式写 input_dft。赝势必须和 XC 泛函匹配，否则结果错误。

6. 对应 benchmark 条目¶

XC 泛函选择是 benchmark 评分的隐藏上游变量——不是评分字段本身，但决定了所有几何与能量结果。

benchmark 字段	泛函敏感性
`a, b, c`（晶格长度）	很敏感：LDA ↓1-2%，PBE ↑0-1%，PBEsol ≈ 实验
`total_energy_ev_per_fu`	绝对值对泛函极敏感，但相对能量（形成能、反应能）常常更稳
`space_group`, `crystal_system`	一般不敏感（对称性是拓扑性质），除非泛函偏差大到改变相对稳定性（铁电、马氏体）
`band_gap`（若被评）	极敏感：LDA/PBE 低估 30-50%，HSE06 接近实验

benchmark 设计建议：ground_truth 要明确说明基于哪个泛函算出的。同一个材料用 PBE 和 HSE06 给出的晶格常数可能差 1%，不讲清楚就没法评。

7. ML 类比¶

类比 1：XC 泛函 ≈ backbone 网络¶

每个 XC 泛函就像一个 backbone / 特征提取器，有自己的 inductive bias 和成本/精度 trade-off：

ML Backbone	XC 泛函	共同点
Linear / 小 MLP	LDA	便宜、对简单场景够用、系统性偏差
ResNet	PBE	中等复杂度、广泛通用的 workhorse
ViT / EfficientNet	SCAN / r²SCAN	精度提升但训练/推理更贵
GPT-class 大模型	HSE06 / Hybrid	精度显著更高但成本 10-100×
专家模型 / MoE	RPA / double hybrid	只在研究里偶尔用
ML 拟合	DM21 等	直接用数据拟合，没有 physics prior

这个类比在精度-成本边界、系统性偏差、没有 free lunch 方面都很贴切。

类比 2：局部 vs 全局信息¶

爬 Jacob's ladder 相当于给模型更多上下文：

阶梯	输入特征
LDA	只看当前位置的密度（相当于 patch-size = 1）
GGA	加上梯度（相当于 patch-size = 3 + 边缘检测）
meta-GGA	加上动能密度（相当于 patch + 轨道池化）
Hybrid	把 fully non-local 的 HF 交换混进去（相当于加 self-attention）

Hybrid 的 HF 交换项是两两对之间的 \(\int\int\) 积分，完全非局域——这和 attention 的 \(O(N^2)\) 成本爆炸完全对应。HSE06 的"screened"（屏蔽）处理相当于把长距离 attention 截断（linear / local attention），降成本不牺牲太多精度。

类比 3：系统性偏差是可校准的¶

ML 里如果你的模型系统性低估某个量，可以用校准（calibration）或后处理修正。DFT 也有类似做法： - 用 scissor operator 把 PBE 带隙整体拉开到实验值 - 用 DFT+U 修正过渡金属 d 电子的局域化 - 这些都不严谨但工程上有用

类比 4：没有 single best 模型¶

ML 里你不会说"CNN 永远比 Transformer 好"。DFT 里也没有"universally best" 泛函： - 分子化学：B3LYP 主导（但 SCAN 在追赶） - 固体物理：PBE / PBEsol - 半导体带隙：HSE06 - 过渡金属磁性：PBE + U，或 SCAN - 色散主导体系（分子晶体、vdW 材料）：PBE-D3 或 vdW-DF

8. 典型取值 / 常见坑¶

坑 1：DFT 带隙问题（最著名的系统性误差）¶

LDA/GGA 系统性低估半导体/绝缘体带隙约 30-50%：

材料	实验带隙 (eV)	PBE KS gap (eV)	HSE06 (eV)
Si	1.17	~0.6	~1.15
Ge	0.74	~0.0（甚至金属化）	~0.6
C (diamond)	5.47	~4.2	~5.3
GaAs	1.52	~0.5	~1.4
MgO	7.83	~4.7	~6.4

原因： - KS 本征值不是真实电子能级（这是 Kohn-Sham 虚构系统的本征值） - 精确泛函下 KS gap 也等于 \(E_g - \Delta_{xc}\)，与真实 fundamental gap 差一个 derivative discontinuity - LDA/GGA 的近似泛函进一步加重低估

工程对策： - 要实验级带隙 → HSE06 / GW / DFT+U - 只比较趋势 / 做结构弛豫 → PBE 足够 - 注意 Ge 在 PBE 下直接被算成金属（没有带隙）——经典"假金属"问题

坑 2：LDA vs PBE 晶格常数偏差方向¶

LDA：低估晶格常数 ~1-2%（over-binding）
PBE：高估 ~0-1%（slight under-binding）
PBEsol：介于两者之间，对大多数固体接近实验
SCAN：通常很接近实验，但对少数体系过度束缚

Si（典型测试体系）： | 泛函 | a (Å) | 相对实验 (5.431 Å) | |---|---|---| | LDA | ~5.40 | -0.6% | | PBE | ~5.47 | +0.7% | | PBEsol | ~5.43 | ~0.0% | | SCAN | ~5.44 | +0.2% |

坑 3：赝势必须和泛函匹配¶

不能用 PBE 赝势跑 PBEsol 或 LDA 计算，否则结果完全错误。赝势生成时已经"烘焙"了特定的 XC 泛函假设。QE 会在输出开头打印 warning 如果不匹配：

Using functional 'PBE' but pseudopotentials generated for 'PBESOL'

TritonDFT 的三个赝势目录（LDA_standard, PBE_standard, PBEsol_standard）就是为了解决这个问题。

坑 4：Hybrid 贵得吓人¶

HSE06 相比 PBE： - 小体系（8-16 原子）：慢 10-50× - 大体系（>100 原子）：慢 50-500×（HF 交换是 \(O(N^4)\)） - 需要 ecutfock（HF 交换截断能，一般 = ecutwfc） - 并行伸缩性差

benchmark 用 HSE06 跑 vc-relax 要谨慎评估预算。一般先 PBE 弛豫，再 HSE06 做 scf 单点能和带隙。

坑 5：色散缺失¶

LDA/GGA/meta-GGA 都不含长程色散（van der Waals）。对层状材料（石墨、MoS₂）、分子晶体、吸附问题，会严重低估结合能或给出错误层间距。

工程对策：加 D3 修正（vdw_corr='grimme-d3'）几乎零成本就显著改善。

坑 6：强关联体系（过渡金属氧化物、稀土、磁性绝缘体）¶

NiO、MnO、CoO 这类经典的"Mott 绝缘体"在 PBE 下算出来是金属（错），需要： - DFT+U（给 d / f 电子加 Hubbard U，典型 4-8 eV） - Hybrid（HSE06 能部分救回带隙） - 超越 DFT（DMFT、GW）

benchmark 设计时涉及到这类材料要特别注意。

典型选择指南（工程速记）¶

场景	推荐
快速结构弛豫，体系简单	PBE（默认选择）
高精度晶格常数	PBEsol 或 SCAN
半导体/绝缘体带隙	HSE06（预算够）或 PBE + scissor 校准
分子晶体 / vdW 层状	PBE + D3 或 vdW-DF
过渡金属氧化物磁性	PBE + U 或 SCAN
分子化学（非固体）	B3LYP（Gaussian/ORCA）或 SCAN
DFTBench baseline	PBE（赝势库已就绪，通用性好）

下一步阅读¶

下一篇：16-pseudopotential.md — 化简 6：赝势近似，把核和内层电子打包
上一篇：14-kohn-sham.md — 化简 4：Kohn-Sham 方程
返回总图：00-simplification-chain.md
相关反查：01-keywords-index.md B 节（电子结构核心）