13. 化简 3:Hohenberg-Kohn 定理——3N 维波函数坍缩到 3 维密度¶
本篇对应化简链的第 3 步。这一步是 DFT 能够存在的理论基石,把"找 3N 维波函数"的问题改写成"找 3 维电子密度"的问题。没有 HK 定理,后续所有工程化简都没有立足点。
1. 化简位置¶
化简 1:Born-Oppenheimer 核冻住 → 得到 V_ext(r)
化简 2:Slater 行列式 反对称 + 单电子分解
化简 3:Hohenberg-Kohn 定理 ★ 本篇 ★
化简 4:Kohn-Sham 方程 落地成可算的方程
化简 5:XC 泛函近似 把未知函数用模型替代
HK 定理是 化简 2 → 化简 4 的桥梁:化简 2 把问题化简到 N 个单电子轨道,但这些轨道仍然通过电子-电子相互作用耦合;HK 定理提供了"其实你不需要波函数,只需要密度"的新视角,让化简 4 的 Kohn-Sham 映射有了落脚点。
2. 上一步的困难¶
化简 2 结束时问题是:
即使用 Slater 行列式,我们仍然要处理: - N 个单电子轨道 \(\phi_i(\vec{r}, s)\),每个是 3 维(+ 自旋)复函数 - 轨道之间通过电子-电子库仑斥力 \(\sum_{i<j} 1/|\vec{r}_i - \vec{r}_j|\) 紧耦合 - 真实基态 \(\Psi_0\) 一般不是单个 Slater 行列式(真实物质有电子关联)
维度困境:波函数 \(\Psi\) 本质是 3N 维函数。哪怕只存一个简单的 \(\Psi\)(在每个维度 10 个格点)也需要 \(10^{3N}\) 个数——对 N=100 已经比宇宙原子数多几百个数量级。这叫 "exponential wall"(Walter Kohn 原话)。
ML 类比:想象让你训一个 3N 维输入的神经网络。不是参数量 3N,是输入维度 3N。N=100 时相当于 300 维输入空间中每个网格点都要有函数值——tabulate 不可能,网络也没法密采样。
3. 引入的假设/近似¶
Hohenberg-Kohn 1964 年的这两个定理严格成立,不是近似:
HK 第一定理(existence theorem)¶
基态电子密度 \(\rho_0(\vec{r})\) 唯一确定外势 \(V_{ext}(\vec{r})\)(至多差一个常数),从而唯一确定整个哈密顿量和一切基态物理量。
换句话说:存在一个映射
3 维标量函数 \(\rho_0\) 和 3N 维复函数 \(\Psi_0\) 承载同等的基态信息量。
反证法证明提纲¶
假设两个不同的外势 \(V_{ext}\) 和 \(V'_{ext}\)(差不止一个常数)产生同一个基态密度 \(\rho_0\)。对应基态分别为 \(\Psi_0\) 和 \(\Psi'_0\),能量 \(E_0\) 和 \(E'_0\)。
由变分原理:
(严格不等号来自 \(\Psi_0 \neq \Psi'_0\),严格不等仅在非退化基态成立)
对调 primed / unprimed 角色再写一次:
两式相加得 \(E_0 + E'_0 < E_0 + E'_0\),矛盾。∎
HK 第二定理(variational principle)¶
对任意候选密度 \(\rho_{\text{trial}}(\vec{r})\)(满足 \(\int \rho = N\) 且 \(\rho \geq 0\)),能量泛函 \(E[\rho_{\text{trial}}]\) 给出基态能量的上界:
\[E[\rho_{\text{trial}}] \geq E[\rho_0] = E_0\]并在 \(\rho_{\text{trial}} = \rho_0\) 时取等。
这把求解变成优化:
能量泛函的形式¶
基态总能量被写成密度的泛函:
| 项 | 物理含义 | 是否已知 |
|---|---|---|
| \(T[\rho]\) | 电子动能 | 未知(真实多体动能不能写成 ρ 的显式泛函) |
| \(V_{ext}[\rho] = \int V_{ext}(\vec{r}) \rho(\vec{r}) d^3r\) | 电子在核外势中的势能 | 已知,简单积分 |
| $J[\rho] = \frac{1}{2} \iint \frac{\rho(\vec{r})\rho(\vec{r}')}{ | \vec{r}-\vec{r}' | } d^3r \, d^3r'$ |
| \(E_{xc}[\rho]\) | 交换-关联能:真实 T 与 \(T_s\) 之差 + 非经典电-电关联 | 未知(需要近似,见化简 5) |
代价¶
- HK 定理是存在性证明,不构造 \(E[\rho]\),也不告诉你怎么找 \(\rho_0\)
- \(T[\rho]\) 直接用 ρ 写出来效果差(Thomas-Fermi 模型就这样做的,精度远不够)——这个问题要等化简 4 的 Kohn-Sham 映射解决
- \(E_{xc}[\rho]\) 精确形式未知,必须近似(见化简 5)
- 定理严格只对非退化基态 + v-representable 密度成立(绝大多数实际体系满足)
4. 引入的新概念¶
| 概念 | 符号 | 含义 |
|---|---|---|
| 电子密度 | \(\rho(\vec{r})\) | 单位体积电子数,\(\int \rho \, d^3r = N\),单位 \([\text{length}]^{-3}\) |
| 能量泛函 | \(E[\rho]\) | 把密度映射为能量标量的"函数的函数",中括号强调泛函 |
| HK 第一定理 | — | 密度 → 外势 → 一切物理量 的唯一映射 |
| HK 第二定理 | — | \(E[\rho]\) 关于 \(\rho\) 取极小时达到基态 |
| Hartree 能 | \(J[\rho]\) | 经典库仑能,含自相互作用(SIE),DFT 要靠 \(E_{xc}\) 抵消 |
| 交换-关联能 | \(E_{xc}[\rho]\) | 所有"未知难以显式表示"的量都塞进这里 |
| v-representable | — | 密度 \(\rho\) 能作为某个外势 \(V_{ext}\) 下非退化基态的密度 |
电子密度的定义:
这是对波函数的边缘化——积掉 N-1 个电子,对第一个电子的位置 marginal;因电子不可区分,乘以 N。
5. 对应 QE 字段¶
HK 定理不是某个参数,它是整个 DFT 游戏存在的前提。但化简 3 的落地可以在 QE 里具体看到:
| 化简 3 的物理量 | QE 中的具体表现 |
|---|---|
| 基态密度 \(\rho_0(\vec{r})\) | SCF 收敛后存到 outdir/<prefix>.save/charge-density.hdf5(或 .dat) |
| 外势 \(V_{ext}\) | 由 ATOMIC_POSITIONS + ATOMIC_SPECIES + 赝势文件隐式构造 |
| 能量泛函 \(E[\rho]\) 的值 | 输出文件 ! total energy = ... Ry |
| Hartree 能 \(J[\rho]\) | 输出 hartree contribution = ... Ry |
| XC 能 \(E_{xc}[\rho]\) | 输出 xc contribution = ... Ry |
| 动能(KS 形式下的 \(T_s\)) | 输出 kinetic energy = ... Ry |
| 电子数守恒约束 \(\int \rho = N\) | 输出 number of electrons = ... |
用 pp.x(post-processing)可以把 charge-density.hdf5 导出成 cube / xsf 格式做可视化,亲眼看一次基态密度对理解 HK 很有帮助。
6. 对应 benchmark 条目¶
HK 定理本身不是 benchmark 评分字段,但所有评分字段都建立在"DFT 有意义"这个 HK 承诺之上:
| benchmark 字段 | 为什么依赖 HK |
|---|---|
total_energy_ev_per_fu |
HK 第二定理保证 DFT 给出的基态能量对同一构型可比较 |
relaxed_structure / a,b,c,α,β,γ |
结构弛豫本质是在原子位置参数空间做变分——HK 第二定理为每个核位置提供一个良定义的 \(E(\{\vec{R}_I\})\) |
space_group, crystal_system |
对称性分析作用在弛豫结构上,结构由 HK 变分给出 |
换句话说:如果 HK 定理不成立,benchmark 里的"参考值"概念本身就没法定义。
7. ML 类比¶
类比 1:存在性证明 vs 构造性算法¶
HK 第一定理 ≈ 无损降维的"存在性证明"。
类似深度学习里的万能逼近定理(universal approximation theorem):它告诉你"存在一个 ReLU 网络可以 \(\epsilon\)-逼近任意连续函数",但不告诉你怎么训;同样,HK 告诉你"存在一个 ρ → 一切物理量的无损映射",但不告诉你 \(E[\rho]\) 的显式形式。
| HK | ML 类比 |
|---|---|
| 3N 维 \(\Psi_0\) → 3 维 \(\rho_0\) 无损 | autoencoder 在理论上可以达到某种无损的 low-dim embedding |
| 第一定理是存在性 | 万能逼近定理是存在性 |
| 第二定理给变分原理 | 把"找基态"转成"最小化 loss" |
| \(E_{xc}[\rho]\) 未知 | loss 函数的一部分未知,需要用 surrogate 模型近似 |
类比 2:变分原理 = 训练损失¶
\(\rho_0 = \arg\min_\rho E[\rho]\) 的结构和 ML 训练一模一样:
# ML 训练
theta_optimal = argmin_theta Loss(theta; data)
# DFT 基态
rho_0 = argmin_rho E[rho] # 约束:∫ρ = N, ρ ≥ 0
- 变量:\(\rho(\vec{r})\)(∞ 维函数,在 QE 里离散化成网格值)
- 损失:\(E[\rho]\)
- 约束:粒子数、非负性
关键区别:ML 的 loss 已知(你写出来的),DFT 的 \(E[\rho]\) 中 \(T[\rho]\) 和 \(E_{xc}[\rho]\) 未知,必须建模(化简 4、5 就是干这个)。
类比 3:信息瓶颈¶
HK 说 \(\rho_0\) 和 \(\Psi_0\) 承载等量基态信息——听起来像 information bottleneck:能否从系统里榨出一个最小充分统计量?\(\rho\) 就是基态问题的充分统计量。
注意:HK 只说基态信息等价。激发态信息一般不能从基态密度恢复——这正是 DFT 带隙问题的根源(见化简 5)。
8. 典型取值 / 常见坑¶
坑 1:HK 只管基态,不管激发态¶
DFT 是严格的基态理论。激发态(带隙、光学吸收、电离能)原则上超出 HK 管辖范围。实践中人们把 KS 轨道本征值 \(\varepsilon_i\) 当作电子能级来画能带——这是近似(严格只有 HOMO 对应负电离能,Koopmans-like),其他都是启发式解读。
这直接导致化简 5 的"DFT 带隙问题":LDA/GGA 系统性低估带隙 30-50%。不是泛函不够好,是 DFT 本身不是算激发态的工具。
坑 2:\(E[\rho]\) 不是直接用来算的¶
现代 DFT 实践(1965 Kohn-Sham 以后)不直接对 \(\rho\) 做变分。而是先引入 KS 辅助轨道 \(\{\phi_i^{KS}\}\),再用 \(\rho = \sum_i |\phi_i|^2\) 回到密度。这是因为动能项 \(T[\rho]\) 用 ρ 直接写(Thomas-Fermi)效果太差。
也就是说:HK 给了理论合法性;Kohn-Sham(化简 4)给了工程可行性。
坑 3:自相互作用误差(SIE)¶
经典 Hartree 项 \(J[\rho]\) 把密度当"流体"算库仑能,导致每个电子和自己也产生排斥(self-interaction error)。精确理论下 \(E_{xc}\) 的交换部分应当精确抵消这个人工斥力——但 LDA/GGA 的近似泛函抵消不干净,残留的 SIE 是导致 DFT 高估离域化(过度流动化电子)、低估带隙、误判磁性的元凶之一。
坑 4:"Levy-Lieb constrained search" 是 HK 的现代改写¶
原版 HK 要求密度 v-representable(存在对应外势)。Levy 和 Lieb 后来给出更干净的形式:对所有 N-representable 的 ρ 都能定义泛函,不需要 v-representability。这些是数学细节,工程上默认成立即可。
典型数值感受¶
一个 Si 原胞(2 原子,8 价电子)的基态密度 \(\rho(\vec{r})\): - 峰值在 Si-Si 共价键中点,约 \(\rho \sim 0.05\) bohr\(^{-3}\)(即每 bohr\(^3\) 约 0.05 个电子) - 靠近原子核处 \(\rho \gtrsim 1\) bohr\(^{-3}\)(但赝势会把这个峰压平,见化简 6) - \(\int \rho \, d^3r = 8\)(电子数严格守恒,是 SCF 收敛的必要条件之一)
下一步阅读¶
- 下一篇:
14-kohn-sham.md— 化简 4:Kohn-Sham 映射,把 \(E[\rho]\) 的变分问题转化成 N 个单粒子方程 - 返回总图:
00-simplification-chain.md - 前置:
12-slater-determinant.md— 化简 2