12. 化简 2：Slater 行列式与泡利不相容¶

化简 1 把核冻住了，我们现在只剩一个 $3N$ 维、带反对称约束的电子波函数 $\psi_e(\{\vec{r}_i, s_i\})$ 要对付。本步不是一个"动力学近似"而是一个结构性假设：我们限定 $\psi_e$ 只能长成一个 Slater 行列式的样子。代价是丢失"多参考电子关联"。

1. 化简位置¶

12 步化简链中的第 2 步
上一步输出（化简 1 之后）：电子问题 $$\hat{H}_e \psi_e = E_e \psi_e, \quad \hat{H}_e = \hat{T}_e + \hat{V}_{ee} + \hat{V}_{ext}$$ 其中 $\psi_e(\vec{r}_1, s_1, ..., \vec{r}_N, s_N)$ 是 $3N$ 维函数，还带 $N$ 个自旋指标
本步输出：把 $\psi_e$ 限定为单电子轨道的 Slater 行列式形式——从"任意 $3N$ 维反对称函数"缩到"$N$ 个 3 维（+自旋）单电子函数 $\phi_i$ 的结构化组合"

2. 上一步的困难¶

电子是费米子，多电子波函数必须满足反对称性（antisymmetry）：交换任意两个电子坐标，波函数变号。

\[\psi_e(..., \vec{x}_i, ..., \vec{x}_j, ...) = -\psi_e(..., \vec{x}_j, ..., \vec{x}_i, ...)\]

其中 $\vec{x}_i = (\vec{r}_i, s_i)$ 合并了空间坐标和自旋。

两个具体困难：

维度：$3N$ 维复值函数，即使按每维 20 格离散化，$N=10$ 时要存 $20^{30} \approx 10^{39}$ 个复数——还是不可能
反对称是硬约束：在优化中必须始终满足，不能当 soft penalty。一般方法（有限元、样条、任意神经网络）不自动满足

最"自然"的想法是 Hartree 乘积（Hartree product）——独立单电子： $$\psi_H(\vec{x}_1, ..., \vec{x}_N) = \phi_1(\vec{x}_1) \, \phi_2(\vec{x}_2) \cdots \phi_N(\vec{x}_N)$$

看起来漂亮（$N$ 个 3 维函数，就像 mean-field），但不反对称：交换两个电子得到 $\phi_1(\vec{x}_2)\phi_2(\vec{x}_1)\cdots$，一般不等于原来的负值。所以 Hartree 乘积违反费米统计，不能用。

3. 引入的假设 / 近似¶

Slater 行列式（Slater determinant）：把 Hartree 乘积反对称化。给定 $N$ 个单电子轨道 / spin-orbital（正交归一）$\{\phi_i(\vec{x})\}_{i=1}^N$，定义

\[ \psi_e(\vec{x}_1, ..., \vec{x}_N) = \frac{1}{\sqrt{N!}} \begin{vmatrix} \phi_1(\vec{x}_1) & \phi_2(\vec{x}_1) & \cdots & \phi_N(\vec{x}_1) \\ \phi_1(\vec{x}_2) & \phi_2(\vec{x}_2) & \cdots & \phi_N(\vec{x}_2) \\ \vdots & \vdots & \ddots & \vdots \\ \phi_1(\vec{x}_N) & \phi_2(\vec{x}_N) & \cdots & \phi_N(\vec{x}_N) \end{vmatrix} \]

行列式有两个关键性质，正好编码了我们要的物理：

交换两行（两电子）→ 行列式变号 → 自动反对称 ✓
两行相同（两电子占同一态）→ 行列式为零 → 自动满足泡利不相容 ✓

换句话说：Slater 行列式是"满足费米统计的最简形式"。任何完整的反对称 $\psi_e$ 都可以展成 Slater 行列式的线性组合（类似傅里叶展开），而这一步我们只取一个（单参考，single-reference）。

4. 代价¶

单 Slater 行列式 ≠ 精确多电子波函数。差的部分叫做电子关联（electron correlation）——电子之间除了平均场排斥外的"关联"行为。

按概念分两类： - 交换（exchange）：反对称本身带来的排斥，Slater 行列式精确包含 - 关联（correlation）：超出单 Slater 描述的部分——需要多 Slater 行列式的叠加才能描述

描述完整关联的方法（量子化学阵营）： - CI（Configuration Interaction）：显式叠加很多 Slater 行列式 - CCSD / CCSD(T)（Coupled Cluster）：指数 ansatz，把激发算符作用到参考态上 - CASSCF / MRCC：多参考方法 - FCI（Full CI）：金标准，成本 $\sim \binom{\text{basis}}{N}$，$N$ 稍大就崩

DFT 的做法：接受单 Slater 行列式这个结构性限制（到了化简 4 会变成 Kohn-Sham 轨道），把电子关联的效应塞到一个未知泛函 $E_{xc}[\rho]$ 里（化简 5）。这是 DFT 和量子化学的分水岭——DFT 不"直接"用更多 Slater 行列式，而是用泛函来参数化修正。

对哪些体系失效： - 强关联（strongly correlated）系统：过渡金属氧化物、稀土、Mott 绝缘体（如 NiO、MnO）——单 Slater + 近似泛函经常质变 - 键断裂 / 过渡态（bond dissociation）：H₂ 拉远时必须多参考 - 简并 / 近简并基态

DFTBench 内的潜在问题区： - 磁性类（Fe, Co, Ni, NiO, MnO...）——标准 DFT 精度有限，可能需要 DFT+U 或 hybrid 泛函 - 拓扑类涉及 SOC（自旋轨道耦合）——轨道不再是简单的实数空间函数 × 实自旋

5. 引入的新概念¶

Slater determinant / Slater 行列式
single-particle orbital / spin-orbital / 单电子轨道、自旋轨道 $\phi_i(\vec{r}, s)$
Hartree product / Hartree 乘积（错误参照物）
antisymmetrization / 反对称化
electron correlation / 电子关联
single-reference vs multi-reference / 单参考 vs 多参考
CI, CCSD, CASSCF, FCI（量子化学方法——不在 DFT 主线但要知道）
Hartree-Fock (HF) —— 直接对 Slater 行列式做变分的方法。KS-DFT 可以看成"用 Slater 行列式 + XC 泛函修正"的 HF 改版

6. 对应 QE 字段¶

Slater 行列式不是用户参数——它是 KS-DFT 的固定框架假设。QE 里的反映是"所有轨道都在行列式里出现"，对应这些字段：

字段	体现什么
`nbnd` (SYSTEM)	计算多少条带（Slater 行列式的列数 + 未占据的额外空轨道）
`nspin` (SYSTEM)	1 = 自旋成对填入空间轨道（闭壳层 Slater 行列式）；2 = up/down 分开，相当于用两组自旋轨道
`occupations` (SYSTEM)	`fixed` / `smearing` / `from_input`——填充电子到 Slater 行列式哪些列
`tot_magnetization`, `starting_magnetization`	在 nspin=2 时指定初始自旋填充
`lspinorb=.true.` (SOC 打开)	行列式里每列变成 2 分量旋量（spinor），不再能简单拆成空间 × 自旋
`input_dft='hse'`	杂化泛函——引入一部分精确交换，即直接对 Slater 行列式算 Fock 交换积分

输出里： - number of Kohn-Sham states = ...：就是行列式的列数 - highest occupied, lowest unoccupied level = HOMO / LUMO（Slater 行列式填入/没填入分界）

si.vc-relax.in 里的体现：

&SYSTEM
  ...
  ntyp = 1
  nat  = 2          ! N_e = 2 × 4 = 8 价电子（Si 赝势每原子 4 价电子）
                    ! → Slater 行列式 4 列（闭壳层，nspin=1 默认）
/

Si 原胞 2 个原子 × 每原子 4 价电子 = 8 个电子。nspin=1 时每个空间轨道装 2 个自旋相反的电子，所以占据 4 条带。nbnd 默认 = $N_e/2 + $ 少量空带。

隐式但重要：即使用户没写 Slater 行列式的任何参数，QE 解的就是单 Slater 行列式对应的 KS 方程。这是 KS-DFT 的基石假设。

7. 对应 benchmark 条目¶

Slater 行列式这一化简本身没有直接的 benchmark 评分字段——它是框架假设，不产生单独的数值。但它决定了整个 DFT 计算能做到的精度天花板：

materials/magnetic.json 里的材料（Fe, NiO, MnO, Cr₂O₃...）——单 Slater + 近似 XC 常误判磁序、基态
materials/topological.json 里的材料——SOC 使 Slater 行列式要用旋量轨道，计算更贵

benchmark 的评分（a, b, c, α, β, γ, space_group, ...）对强关联材料的误差大，部分根源就是化简 2 的单 Slater 限制 + 化简 5 的泛函近似。

8. ML 类比¶

Inductive bias 的正确加入¶

Slater 行列式 = 把"排列反对称"这个强先验写进模型结构，而不是加成软惩罚。类比：

ML 场景	加约束方式	类比的 QM
CNN 里做平移等变	结构性：参数共享	Slater 行列式反对称
EGNN / E(3)-equivariant GNN	结构性：输出按 E(3) 变换	行列式按交换变号
GNN 里的排列对称（DeepSet-style）	结构性：sum/mean pooling	—
普通 MLP + loss penalty	软约束（会违反）	Hartree 乘积硬塞反对称化——没人这么干

Slater 行列式是带反对称 inductive bias 的特征组合： - 每列 $\phi_i$ 是一个"原子特征"（单电子轨道） - 行列式操作 = 对 $N!$ 种排列做带符号求和 - 输出自动对任意两个"样本"（电子）的交换反对称

单 Slater 近似类比¶

把"任意 $3N$ 维反对称函数"限到"单 Slater 行列式"≈ 用秩为 1 的低秩近似去逼近完整张量。完整张量是多个 Slater 行列式的叠加（像多秩 CP 分解）——我们只取 rank-1。

Rank-1 近似 / mean-field 在弱关联 / 强对称性下足够
强关联体系需要更高秩 ≈ 需要多参考方法

也类似 VAE 里的 mean-field 假设：后验 $q(z|x) = \prod_i q(z_i|x)$。简单、可操作，但会低估复杂相关性——所以才有 normalizing flows、autoregressive posterior 等更强后验。DFT 的"更强后验"就是 CI / CCSD，但 DFT 选了另一条路：mean-field 结构 + 学一个修正项（XC 泛函）。

与 KS-DFT 的桥¶

化简 2 给出的单 Slater 行列式 + 化简 3（HK 把一切表成 ρ 的泛函）+ 化简 4（把 Slater 行列式的轨道换成 KS 辅助系统的轨道）→ 组成完整的 KS-DFT。所以"Slater 行列式"这个概念在 KS-DFT 里是不可见的背景，但它规定了求解的形状。

9. 典型取值 / 常见坑¶

nspin 选错：磁性体系用 nspin=1 会把 up/down 强制压成一样，得不到磁性基态。必须 nspin=2 + 合理的 starting_magnetization
nbnd 太小：nbnd 只包括占据 + 少量空带。绝缘体够用；金属或要做 nscf/dos 时需要更多空带（经验：占据数 × 1.2 到 1.5）
闭壳层 vs 开壳层：
闭壳层（closed-shell）：所有轨道自旋成对占据——单 Slater + nspin=1 精确
开壳层（open-shell）：有未配对电子（磁性原子、自由基）——单 Slater 只能给 UHF 类近似，可能有自旋污染
强关联提示：
过渡金属 3d / 稀土 4f 体系——考虑 DFT+U、hybrid、或认命精度
Mott 绝缘体被 DFT 误判为金属——是化简 2+5 的综合失败
行列式 $\frac{1}{\sqrt{N!}}$ 的归一化：编程里经常忘；QE 内部自动处理

关键词清单（本篇引入）¶

Slater determinant / Slater 行列式
single-particle orbital, spin-orbital / 单电子轨道、自旋轨道 $\phi_i$
Hartree product / Hartree 乘积
antisymmetry / 反对称性
Pauli exclusion principle / 泡利不相容
electron correlation / 电子关联
exchange / 交换
single-reference, multi-reference / 单参考、多参考
Hartree-Fock (HF)
CI, CCSD, CCSD(T), FCI, CASSCF / 量子化学的"多 Slater"方法
closed-shell, open-shell / 闭壳层、开壳层

下一步阅读¶

→ 13-hk-theorem.md — 化简 3：Hohenberg-Kohn 定理——把 $3N$ 维波函数问题降到 3 维密度问题