跳转至

12. 化简 2:Slater 行列式与泡利不相容

化简 1 把核冻住了,我们现在只剩一个 \(3N\) 维、带反对称约束的电子波函数 \(\psi_e(\{\vec{r}_i, s_i\})\) 要对付。本步不是一个"动力学近似"而是一个结构性假设:我们限定 \(\psi_e\) 只能长成一个 Slater 行列式的样子。代价是丢失"多参考电子关联"。


1. 化简位置

  • 12 步化简链中的第 2 步
  • 上一步输出(化简 1 之后):电子问题 $\(\hat{H}_e \psi_e = E_e \psi_e, \quad \hat{H}_e = \hat{T}_e + \hat{V}_{ee} + \hat{V}_{ext}\)$ 其中 \(\psi_e(\vec{r}_1, s_1, ..., \vec{r}_N, s_N)\)\(3N\) 维函数,还带 \(N\) 个自旋指标
  • 本步输出:把 \(\psi_e\) 限定为单电子轨道的 Slater 行列式形式——从"任意 \(3N\) 维反对称函数"缩到"\(N\) 个 3 维(+自旋)单电子函数 \(\phi_i\) 的结构化组合"

2. 上一步的困难

电子是费米子,多电子波函数必须满足反对称性(antisymmetry):交换任意两个电子坐标,波函数变号。

\[\psi_e(..., \vec{x}_i, ..., \vec{x}_j, ...) = -\psi_e(..., \vec{x}_j, ..., \vec{x}_i, ...)\]

其中 \(\vec{x}_i = (\vec{r}_i, s_i)\) 合并了空间坐标和自旋。

两个具体困难:

  1. 维度\(3N\) 维复值函数,即使按每维 20 格离散化,\(N=10\) 时要存 \(20^{30} \approx 10^{39}\) 个复数——还是不可能
  2. 反对称是硬约束:在优化中必须始终满足,不能当 soft penalty。一般方法(有限元、样条、任意神经网络)不自动满足

最"自然"的想法是 Hartree 乘积(Hartree product)——独立单电子: $\(\psi_H(\vec{x}_1, ..., \vec{x}_N) = \phi_1(\vec{x}_1) \, \phi_2(\vec{x}_2) \cdots \phi_N(\vec{x}_N)\)$

看起来漂亮(\(N\) 个 3 维函数,就像 mean-field),但不反对称:交换两个电子得到 \(\phi_1(\vec{x}_2)\phi_2(\vec{x}_1)\cdots\),一般不等于原来的负值。所以 Hartree 乘积违反费米统计,不能用。


3. 引入的假设 / 近似

Slater 行列式(Slater determinant):把 Hartree 乘积反对称化。给定 \(N\)单电子轨道 / spin-orbital(正交归一)\(\{\phi_i(\vec{x})\}_{i=1}^N\),定义

\[ \psi_e(\vec{x}_1, ..., \vec{x}_N) = \frac{1}{\sqrt{N!}} \begin{vmatrix} \phi_1(\vec{x}_1) & \phi_2(\vec{x}_1) & \cdots & \phi_N(\vec{x}_1) \\ \phi_1(\vec{x}_2) & \phi_2(\vec{x}_2) & \cdots & \phi_N(\vec{x}_2) \\ \vdots & \vdots & \ddots & \vdots \\ \phi_1(\vec{x}_N) & \phi_2(\vec{x}_N) & \cdots & \phi_N(\vec{x}_N) \end{vmatrix} \]

行列式有两个关键性质,正好编码了我们要的物理

  1. 交换两行(两电子)→ 行列式变号 → 自动反对称 ✓
  2. 两行相同(两电子占同一态)→ 行列式为零 → 自动满足泡利不相容

换句话说:Slater 行列式是"满足费米统计的最简形式"。任何完整的反对称 \(\psi_e\) 都可以展成 Slater 行列式的线性组合(类似傅里叶展开),而这一步我们只取一个(单参考,single-reference)


4. 代价

单 Slater 行列式 ≠ 精确多电子波函数。差的部分叫做电子关联(electron correlation)——电子之间除了平均场排斥外的"关联"行为。

按概念分两类: - 交换(exchange):反对称本身带来的排斥,Slater 行列式精确包含 - 关联(correlation):超出单 Slater 描述的部分——需要多 Slater 行列式的叠加才能描述

描述完整关联的方法(量子化学阵营): - CI(Configuration Interaction):显式叠加很多 Slater 行列式 - CCSD / CCSD(T)(Coupled Cluster):指数 ansatz,把激发算符作用到参考态上 - CASSCF / MRCC:多参考方法 - FCI(Full CI):金标准,成本 \(\sim \binom{\text{basis}}{N}\)\(N\) 稍大就崩

DFT 的做法:接受单 Slater 行列式这个结构性限制(到了化简 4 会变成 Kohn-Sham 轨道),把电子关联的效应塞到一个未知泛函 \(E_{xc}[\rho]\)(化简 5)。这是 DFT 和量子化学的分水岭——DFT 不"直接"用更多 Slater 行列式,而是用泛函来参数化修正。

对哪些体系失效: - 强关联(strongly correlated)系统:过渡金属氧化物、稀土、Mott 绝缘体(如 NiO、MnO)——单 Slater + 近似泛函经常质变 - 键断裂 / 过渡态(bond dissociation):H₂ 拉远时必须多参考 - 简并 / 近简并基态

DFTBench 内的潜在问题区: - 磁性类(Fe, Co, Ni, NiO, MnO...)——标准 DFT 精度有限,可能需要 DFT+U 或 hybrid 泛函 - 拓扑类涉及 SOC(自旋轨道耦合)——轨道不再是简单的实数空间函数 × 实自旋


5. 引入的新概念

  • Slater determinant / Slater 行列式
  • single-particle orbital / spin-orbital / 单电子轨道、自旋轨道 \(\phi_i(\vec{r}, s)\)
  • Hartree product / Hartree 乘积(错误参照物)
  • antisymmetrization / 反对称化
  • electron correlation / 电子关联
  • single-reference vs multi-reference / 单参考 vs 多参考
  • CI, CCSD, CASSCF, FCI(量子化学方法——不在 DFT 主线但要知道)
  • Hartree-Fock (HF) —— 直接对 Slater 行列式做变分的方法。KS-DFT 可以看成"用 Slater 行列式 + XC 泛函修正"的 HF 改版

6. 对应 QE 字段

Slater 行列式不是用户参数——它是 KS-DFT 的固定框架假设。QE 里的反映是"所有轨道都在行列式里出现",对应这些字段:

字段 体现什么
nbnd (SYSTEM) 计算多少条带(Slater 行列式的列数 + 未占据的额外空轨道)
nspin (SYSTEM) 1 = 自旋成对填入空间轨道(闭壳层 Slater 行列式);2 = up/down 分开,相当于用两组自旋轨道
occupations (SYSTEM) fixed / smearing / from_input——填充电子到 Slater 行列式哪些列
tot_magnetization, starting_magnetization 在 nspin=2 时指定初始自旋填充
lspinorb=.true. (SOC 打开) 行列式里每列变成 2 分量旋量(spinor),不再能简单拆成空间 × 自旋
input_dft='hse' 杂化泛函——引入一部分精确交换,即直接对 Slater 行列式算 Fock 交换积分

输出里: - number of Kohn-Sham states = ...:就是行列式的列数 - highest occupied, lowest unoccupied level = HOMO / LUMO(Slater 行列式填入/没填入分界)

si.vc-relax.in 里的体现

&SYSTEM
  ...
  ntyp = 1
  nat  = 2          ! N_e = 2 × 4 = 8 价电子(Si 赝势每原子 4 价电子)
                    ! → Slater 行列式 4 列(闭壳层,nspin=1 默认)
/
Si 原胞 2 个原子 × 每原子 4 价电子 = 8 个电子。nspin=1 时每个空间轨道装 2 个自旋相反的电子,所以占据 4 条带。nbnd 默认 = $N_e/2 + $ 少量空带。

隐式但重要:即使用户没写 Slater 行列式的任何参数,QE 解的就是单 Slater 行列式对应的 KS 方程。这是 KS-DFT 的基石假设。


7. 对应 benchmark 条目

Slater 行列式这一化简本身没有直接的 benchmark 评分字段——它是框架假设,不产生单独的数值。但它决定了整个 DFT 计算能做到的精度天花板

  • materials/magnetic.json 里的材料(Fe, NiO, MnO, Cr₂O₃...)——单 Slater + 近似 XC 常误判磁序、基态
  • materials/topological.json 里的材料——SOC 使 Slater 行列式要用旋量轨道,计算更贵

benchmark 的评分(a, b, c, α, β, γ, space_group, ...)对强关联材料的误差大,部分根源就是化简 2 的单 Slater 限制 + 化简 5 的泛函近似。


8. ML 类比

Inductive bias 的正确加入

Slater 行列式 = 把"排列反对称"这个强先验写进模型结构,而不是加成软惩罚。类比:

ML 场景 加约束方式 类比的 QM
CNN 里做平移等变 结构性:参数共享 Slater 行列式反对称
EGNN / E(3)-equivariant GNN 结构性:输出按 E(3) 变换 行列式按交换变号
GNN 里的排列对称(DeepSet-style) 结构性:sum/mean pooling
普通 MLP + loss penalty 软约束(会违反) Hartree 乘积硬塞反对称化——没人这么干

Slater 行列式是带反对称 inductive bias 的特征组合: - 每列 \(\phi_i\) 是一个"原子特征"(单电子轨道) - 行列式操作 = 对 \(N!\) 种排列做带符号求和 - 输出自动对任意两个"样本"(电子)的交换反对称

单 Slater 近似类比

把"任意 \(3N\) 维反对称函数"限到"单 Slater 行列式"≈ 用秩为 1 的低秩近似去逼近完整张量。完整张量是多个 Slater 行列式的叠加(像多秩 CP 分解)——我们只取 rank-1。

  • Rank-1 近似 / mean-field 在弱关联 / 强对称性下足够
  • 强关联体系需要更高秩 ≈ 需要多参考方法

也类似 VAE 里的 mean-field 假设:后验 \(q(z|x) = \prod_i q(z_i|x)\)。简单、可操作,但会低估复杂相关性——所以才有 normalizing flows、autoregressive posterior 等更强后验。DFT 的"更强后验"就是 CI / CCSD,但 DFT 选了另一条路:mean-field 结构 + 学一个修正项(XC 泛函)。

与 KS-DFT 的桥

化简 2 给出的单 Slater 行列式 + 化简 3(HK 把一切表成 ρ 的泛函)+ 化简 4(把 Slater 行列式的轨道换成 KS 辅助系统的轨道)→ 组成完整的 KS-DFT。所以"Slater 行列式"这个概念在 KS-DFT 里是不可见的背景,但它规定了求解的形状


9. 典型取值 / 常见坑

  • nspin 选错:磁性体系用 nspin=1 会把 up/down 强制压成一样,得不到磁性基态。必须 nspin=2 + 合理的 starting_magnetization
  • nbnd 太小:nbnd 只包括占据 + 少量空带。绝缘体够用;金属或要做 nscf/dos 时需要更多空带(经验:占据数 × 1.2 到 1.5)
  • 闭壳层 vs 开壳层
  • 闭壳层(closed-shell):所有轨道自旋成对占据——单 Slater + nspin=1 精确
  • 开壳层(open-shell):有未配对电子(磁性原子、自由基)——单 Slater 只能给 UHF 类近似,可能有自旋污染
  • 强关联提示
  • 过渡金属 3d / 稀土 4f 体系——考虑 DFT+U、hybrid、或认命精度
  • Mott 绝缘体被 DFT 误判为金属——是化简 2+5 的综合失败
  • 行列式 \(\frac{1}{\sqrt{N!}}\) 的归一化:编程里经常忘;QE 内部自动处理

关键词清单(本篇引入)

  • Slater determinant / Slater 行列式
  • single-particle orbital, spin-orbital / 单电子轨道、自旋轨道 \(\phi_i\)
  • Hartree product / Hartree 乘积
  • antisymmetry / 反对称性
  • Pauli exclusion principle / 泡利不相容
  • electron correlation / 电子关联
  • exchange / 交换
  • single-reference, multi-reference / 单参考、多参考
  • Hartree-Fock (HF)
  • CI, CCSD, CCSD(T), FCI, CASSCF / 量子化学的"多 Slater"方法
  • closed-shell, open-shell / 闭壳层、开壳层

下一步阅读

13-hk-theorem.md — 化简 3:Hohenberg-Kohn 定理——把 \(3N\) 维波函数问题降到 3 维密度问题