13. 化简 3：Hohenberg-Kohn 定理——3N 维波函数坍缩到 3 维密度¶

本篇对应化简链的第 3 步。这一步是 DFT 能够存在的理论基石，把"找 3N 维波函数"的问题改写成"找 3 维电子密度"的问题。没有 HK 定理，后续所有工程化简都没有立足点。

1. 化简位置¶

化简 1：Born-Oppenheimer        核冻住 → 得到 V_ext(r)
化简 2：Slater 行列式           反对称 + 单电子分解
化简 3：Hohenberg-Kohn 定理     ★ 本篇 ★
化简 4：Kohn-Sham 方程          落地成可算的方程
化简 5：XC 泛函近似             把未知函数用模型替代

HK 定理是 化简 2 → 化简 4 的桥梁：化简 2 把问题化简到 N 个单电子轨道，但这些轨道仍然通过电子-电子相互作用耦合；HK 定理提供了"其实你不需要波函数，只需要密度"的新视角，让化简 4 的 Kohn-Sham 映射有了落脚点。

2. 上一步的困难¶

化简 2 结束时问题是：

\[\Psi(\vec{r}_1, s_1, \ldots, \vec{r}_N, s_N) = \text{Slater det}\{\phi_1, \ldots, \phi_N\}\]

即使用 Slater 行列式，我们仍然要处理： - N 个单电子轨道 $\phi_i(\vec{r}, s)$，每个是 3 维（+ 自旋）复函数 - 轨道之间通过电子-电子库仑斥力 $\sum_{i<j} 1/|\vec{r}_i - \vec{r}_j|$ 紧耦合 - 真实基态 $\Psi_0$ 一般不是单个 Slater 行列式（真实物质有电子关联）

维度困境：波函数 $\Psi$ 本质是 3N 维函数。哪怕只存一个简单的 $\Psi$（在每个维度 10 个格点）也需要 $10^{3N}$ 个数——对 N=100 已经比宇宙原子数多几百个数量级。这叫 "exponential wall"（Walter Kohn 原话）。

ML 类比：想象让你训一个 3N 维输入的神经网络。不是参数量 3N，是输入维度 3N。N=100 时相当于 300 维输入空间中每个网格点都要有函数值——tabulate 不可能，网络也没法密采样。

3. 引入的假设/近似¶

Hohenberg-Kohn 1964 年的这两个定理严格成立，不是近似：

HK 第一定理（existence theorem）¶

基态电子密度 $\rho_0(\vec{r})$ 唯一确定外势 $V_{ext}(\vec{r})$（至多差一个常数），从而唯一确定整个哈密顿量和一切基态物理量。

换句话说：存在一个映射

\[\rho_0(\vec{r}) \;\longleftrightarrow\; V_{ext}(\vec{r}) \;\longleftrightarrow\; \hat{H} \;\longleftrightarrow\; \Psi_0 \;\longleftrightarrow\; \text{一切基态物理量}\]

3 维标量函数 $\rho_0$ 和 3N 维复函数 $\Psi_0$ 承载同等的基态信息量。

反证法证明提纲¶

假设两个不同的外势 $V_{ext}$ 和 $V'_{ext}$（差不止一个常数）产生同一个基态密度 $\rho_0$。对应基态分别为 $\Psi_0$ 和 $\Psi'_0$，能量 $E_0$ 和 $E'_0$。

由变分原理：

\[E_0 < \langle \Psi'_0 | \hat{H} | \Psi'_0 \rangle = E'_0 + \int (V_{ext} - V'_{ext}) \rho_0 \, d^3r\]

（严格不等号来自 $\Psi_0 \neq \Psi'_0$，严格不等仅在非退化基态成立）

对调 primed / unprimed 角色再写一次：

\[E'_0 < E_0 + \int (V'_{ext} - V_{ext}) \rho_0 \, d^3r\]

两式相加得 $E_0 + E'_0 < E_0 + E'_0$，矛盾。∎

HK 第二定理（variational principle）¶

对任意候选密度 $\rho_{\text{trial}}(\vec{r})$（满足 $\int \rho = N$ 且 $\rho \geq 0$），能量泛函 $E[\rho_{\text{trial}}]$ 给出基态能量的上界：

\[E[\rho_{\text{trial}}] \geq E[\rho_0] = E_0\]

并在 $\rho_{\text{trial}} = \rho_0$ 时取等。

这把求解变成优化：

\[\rho_0 = \arg\min_{\rho \,:\, \int \rho = N} E[\rho]\]

能量泛函的形式¶

基态总能量被写成密度的泛函：

\[E[\rho] = T[\rho] + V_{ext}[\rho] + J[\rho] + E_{xc}[\rho]\]

项	物理含义	是否已知
$T[\rho]$	电子动能	未知（真实多体动能不能写成 ρ 的显式泛函）
$V_{ext}[\rho] = \int V_{ext}(\vec{r}) \rho(\vec{r}) d^3r$	电子在核外势中的势能	已知，简单积分
$J[\rho] = \frac{1}{2} \iint \frac{\rho(\vec{r})\rho(\vec{r}')}{	\vec{r}-\vec{r}'	} d^3r \, d^3r'$
$E_{xc}[\rho]$	交换-关联能：真实 T 与 $T_s$ 之差 + 非经典电-电关联	未知（需要近似，见化简 5）

代价¶

HK 定理是存在性证明，不构造 $E[\rho]$，也不告诉你怎么找 $\rho_0$
$T[\rho]$ 直接用 ρ 写出来效果差（Thomas-Fermi 模型就这样做的，精度远不够）——这个问题要等化简 4 的 Kohn-Sham 映射解决
$E_{xc}[\rho]$ 精确形式未知，必须近似（见化简 5）
定理严格只对非退化基态 + v-representable 密度成立（绝大多数实际体系满足）

4. 引入的新概念¶

概念	符号	含义
电子密度	$\rho(\vec{r})$	单位体积电子数，$\int \rho \, d^3r = N$，单位 $[\text{length}]^{-3}$
能量泛函	$E[\rho]$	把密度映射为能量标量的"函数的函数"，中括号强调泛函
HK 第一定理	—	密度 → 外势 → 一切物理量的唯一映射
HK 第二定理	—	$E[\rho]$ 关于 $\rho$ 取极小时达到基态
Hartree 能	$J[\rho]$	经典库仑能，含自相互作用（SIE），DFT 要靠 $E_{xc}$ 抵消
交换-关联能	$E_{xc}[\rho]$	所有"未知难以显式表示"的量都塞进这里
v-representable	—	密度 $\rho$ 能作为某个外势 $V_{ext}$ 下非退化基态的密度

电子密度的定义：

\[\rho(\vec{r}) = N \int |\Psi(\vec{r}, s_1, \vec{r}_2, s_2, \ldots, \vec{r}_N, s_N)|^2 \, ds_1 d\vec{r}_2 ds_2 \cdots d\vec{r}_N ds_N\]

这是对波函数的边缘化——积掉 N-1 个电子，对第一个电子的位置 marginal；因电子不可区分，乘以 N。

5. 对应 QE 字段¶

HK 定理不是某个参数，它是整个 DFT 游戏存在的前提。但化简 3 的落地可以在 QE 里具体看到：

化简 3 的物理量	QE 中的具体表现
基态密度 $\rho_0(\vec{r})$	SCF 收敛后存到 `outdir/<prefix>.save/charge-density.hdf5`（或 `.dat`）
外势 $V_{ext}$	由 `ATOMIC_POSITIONS` + `ATOMIC_SPECIES` + 赝势文件隐式构造
能量泛函 $E[\rho]$ 的值	输出文件 `! total energy = ... Ry`
Hartree 能 $J[\rho]$	输出 `hartree contribution = ... Ry`
XC 能 $E_{xc}[\rho]$	输出 `xc contribution = ... Ry`
动能（KS 形式下的 $T_s$）	输出 `kinetic energy = ... Ry`
电子数守恒约束 $\int \rho = N$	输出 `number of electrons = ...`

用 pp.x（post-processing）可以把 charge-density.hdf5 导出成 cube / xsf 格式做可视化，亲眼看一次基态密度对理解 HK 很有帮助。

6. 对应 benchmark 条目¶

HK 定理本身不是 benchmark 评分字段，但所有评分字段都建立在"DFT 有意义"这个 HK 承诺之上：

benchmark 字段	为什么依赖 HK
`total_energy_ev_per_fu`	HK 第二定理保证 DFT 给出的基态能量对同一构型可比较
`relaxed_structure` / `a,b,c,α,β,γ`	结构弛豫本质是在原子位置参数空间做变分——HK 第二定理为每个核位置提供一个良定义的 $E(\{\vec{R}_I\})$
`space_group`, `crystal_system`	对称性分析作用在弛豫结构上，结构由 HK 变分给出

换句话说：如果 HK 定理不成立，benchmark 里的"参考值"概念本身就没法定义。

7. ML 类比¶

类比 1：存在性证明 vs 构造性算法¶

HK 第一定理 ≈ 无损降维的"存在性证明"。

类似深度学习里的万能逼近定理（universal approximation theorem）：它告诉你"存在一个 ReLU 网络可以 $\epsilon$-逼近任意连续函数"，但不告诉你怎么训；同样，HK 告诉你"存在一个 ρ → 一切物理量的无损映射"，但不告诉你 $E[\rho]$ 的显式形式。

HK	ML 类比
3N 维 $\Psi_0$ → 3 维 $\rho_0$ 无损	autoencoder 在理论上可以达到某种无损的 low-dim embedding
第一定理是存在性	万能逼近定理是存在性
第二定理给变分原理	把"找基态"转成"最小化 loss"
$E_{xc}[\rho]$ 未知	loss 函数的一部分未知，需要用 surrogate 模型近似

类比 2：变分原理 = 训练损失¶

$\rho_0 = \arg\min_\rho E[\rho]$ 的结构和 ML 训练一模一样：

# ML 训练
theta_optimal = argmin_theta Loss(theta; data)

# DFT 基态
rho_0 = argmin_rho E[rho]   # 约束：∫ρ = N, ρ ≥ 0

变量：$\rho(\vec{r})$（∞ 维函数，在 QE 里离散化成网格值）
损失：$E[\rho]$
约束：粒子数、非负性

关键区别：ML 的 loss 已知（你写出来的），DFT 的 $E[\rho]$ 中 $T[\rho]$ 和 $E_{xc}[\rho]$ 未知，必须建模（化简 4、5 就是干这个）。

类比 3：信息瓶颈¶

HK 说 $\rho_0$ 和 $\Psi_0$ 承载等量基态信息——听起来像 information bottleneck：能否从系统里榨出一个最小充分统计量？$\rho$ 就是基态问题的充分统计量。

注意：HK 只说基态信息等价。激发态信息一般不能从基态密度恢复——这正是 DFT 带隙问题的根源（见化简 5）。

8. 典型取值 / 常见坑¶

坑 1：HK 只管基态，不管激发态¶

DFT 是严格的基态理论。激发态（带隙、光学吸收、电离能）原则上超出 HK 管辖范围。实践中人们把 KS 轨道本征值 $\varepsilon_i$ 当作电子能级来画能带——这是近似（严格只有 HOMO 对应负电离能，Koopmans-like），其他都是启发式解读。

这直接导致化简 5 的"DFT 带隙问题"：LDA/GGA 系统性低估带隙 30-50%。不是泛函不够好，是 DFT 本身不是算激发态的工具。

坑 2：$E[\rho]$ 不是直接用来算的¶

现代 DFT 实践（1965 Kohn-Sham 以后）不直接对 $\rho$ 做变分。而是先引入 KS 辅助轨道 $\{\phi_i^{KS}\}$，再用 $\rho = \sum_i |\phi_i|^2$ 回到密度。这是因为动能项 $T[\rho]$ 用 ρ 直接写（Thomas-Fermi）效果太差。

也就是说：HK 给了理论合法性；Kohn-Sham（化简 4）给了工程可行性。

坑 3：自相互作用误差（SIE）¶

经典 Hartree 项 $J[\rho]$ 把密度当"流体"算库仑能，导致每个电子和自己也产生排斥（self-interaction error）。精确理论下 $E_{xc}$ 的交换部分应当精确抵消这个人工斥力——但 LDA/GGA 的近似泛函抵消不干净，残留的 SIE 是导致 DFT 高估离域化（过度流动化电子）、低估带隙、误判磁性的元凶之一。

坑 4："Levy-Lieb constrained search" 是 HK 的现代改写¶

原版 HK 要求密度 v-representable（存在对应外势）。Levy 和 Lieb 后来给出更干净的形式：对所有 N-representable 的 ρ 都能定义泛函，不需要 v-representability。这些是数学细节，工程上默认成立即可。

典型数值感受¶

一个 Si 原胞（2 原子，8 价电子）的基态密度 $\rho(\vec{r})$： - 峰值在 Si-Si 共价键中点，约 $\rho \sim 0.05$ bohr$^{-3}$（即每 bohr$^3$ 约 0.05 个电子） - 靠近原子核处 $\rho \gtrsim 1$ bohr$^{-3}$（但赝势会把这个峰压平，见化简 6） - $\int \rho \, d^3r = 8$（电子数严格守恒，是 SCF 收敛的必要条件之一）

下一步阅读¶

下一篇：14-kohn-sham.md — 化简 4：Kohn-Sham 映射，把 $E[\rho]$ 的变分问题转化成 N 个单粒子方程
返回总图：00-simplification-chain.md
前置：12-slater-determinant.md — 化简 2

项	物理含义	是否已知
\(T[\rho]\)	电子动能	未知（真实多体动能不能写成 ρ 的显式泛函）
\(V_{ext}[\rho] = \int V_{ext}(\vec{r}) \rho(\vec{r}) d^3r\)	电子在核外势中的势能	已知，简单积分
$J[\rho] = \frac{1}{2} \iint \frac{\rho(\vec{r})\rho(\vec{r}')}{	\vec{r}-\vec{r}'	} d^3r \, d^3r'$
\(E_{xc}[\rho]\)	交换-关联能：真实 T 与 \(T_s\) 之差 + 非经典电-电关联	未知（需要近似，见化简 5）

概念	符号	含义
电子密度	\(\rho(\vec{r})\)	单位体积电子数，\(\int \rho \, d^3r = N\)，单位 \([\text{length}]^{-3}\)
能量泛函	\(E[\rho]\)	把密度映射为能量标量的"函数的函数"，中括号强调泛函
HK 第一定理	—	密度 → 外势 → 一切物理量的唯一映射
HK 第二定理	—	\(E[\rho]\) 关于 \(\rho\) 取极小时达到基态
Hartree 能	\(J[\rho]\)	经典库仑能，含自相互作用（SIE），DFT 要靠 \(E_{xc}\) 抵消
交换-关联能	\(E_{xc}[\rho]\)	所有"未知难以显式表示"的量都塞进这里
v-representable	—	密度 \(\rho\) 能作为某个外势 \(V_{ext}\) 下非退化基态的密度

化简 3 的物理量	QE 中的具体表现
基态密度 \(\rho_0(\vec{r})\)	SCF 收敛后存到 `outdir/<prefix>.save/charge-density.hdf5`（或 `.dat`）
外势 \(V_{ext}\)	由 `ATOMIC_POSITIONS` + `ATOMIC_SPECIES` + 赝势文件隐式构造
能量泛函 \(E[\rho]\) 的值	输出文件 `! total energy = ... Ry`
Hartree 能 \(J[\rho]\)	输出 `hartree contribution = ... Ry`
XC 能 \(E_{xc}[\rho]\)	输出 `xc contribution = ... Ry`
动能（KS 形式下的 \(T_s\)）	输出 `kinetic energy = ... Ry`
电子数守恒约束 \(\int \rho = N\)	输出 `number of electrons = ...`

HK	ML 类比
3N 维 \(\Psi_0\) → 3 维 \(\rho_0\) 无损	autoencoder 在理论上可以达到某种无损的 low-dim embedding
第一定理是存在性	万能逼近定理是存在性
第二定理给变分原理	把"找基态"转成"最小化 loss"
\(E_{xc}[\rho]\) 未知	loss 函数的一部分未知，需要用 surrogate 模型近似