10. 量子力学前置（化简 0）¶

DFT 是一个把"多体量子系统"化简到"可计算形式"的工程。在开始化简 1（Born-Oppenheimer）之前，要先把量子力学（Quantum Mechanics, QM）的几个基本"公设 / postulate"过一遍，这样后面每一步化简才知道自己在对什么东西做近似。

本篇不严格遵守 8 段模板，因为这是起点，不是一次化简步骤；但仍标注关键词与 ML 类比。

0. 读这篇笔记前需要知道的¶

读者是 ML/CS 背景，线代、特征值分解、期望值、优化都熟
QM 的形式系统就是复希尔伯特空间 + 线性算符，数学上和 ML 没什么两样
真正"陌生"的只是物理诠释（波函数为什么是概率幅？为什么是复值？）——这部分不要试图"推导"，它们是公设（不可推导的基本假设），记下来就好
ML 里其实有类似的"公设"：比如为什么 softmax 是这个形式？为什么分类用交叉熵？背后都有信息论理由，但日常就是接受它

1. 波函数 ψ（wavefunction）¶

定义：一个量子粒子的状态由一个复值函数 \(\psi(\vec{r}, t)\) 描述，\(\vec{r} \in \mathbb{R}^3\) 是空间坐标，\(t\) 是时间。多粒子系统则是 \(\psi(\vec{r}_1, ..., \vec{r}_N, t)\)。

关键性质： - 复值（complex-valued）：\(\psi \in \mathbb{C}\)。这不是花哨，是量子干涉必需的——实值函数没有相位 - 归一化（normalized）：\(\int |\psi|^2 \, d\vec{r} = 1\) - 所有具有上述性质的函数构成一个希尔伯特空间（Hilbert space）\(\mathcal{H}\)

ML 类比： - 波函数 ≈ 一个模型的"完整状态"。在 ML 里模型状态是参数 \(\theta \in \mathbb{R}^d\)；在 QM 里系统状态是 \(\psi \in \mathcal{H}\)（无穷维复函数空间） - 多电子波函数是 \(3N\) 维函数——相当于一个 loss landscape 在 \(3N\) 维空间上定义。这就是为什么 DFT 必须做化简：直接存 \(\psi\) 需要 \(\text{grid}^{3N}\) 个复数，指数爆炸

常见坑： - 不要把 \(\psi(\vec{r})\) 读作"粒子在 \(\vec{r}\) 的值"——它本身没有直接物理意义，只有 \(|\psi|^2\) 才有（见下节）

2. Born 规则（Born rule）¶

内容：\(|\psi(\vec{r})|^2\) 是在位置 \(\vec{r}\) 找到粒子的概率密度（probability density）。

\[P(\vec{r} \in V) = \int_V |\psi(\vec{r})|^2 \, d\vec{r}\]

为什么是平方而不是绝对值？为什么是这个而不是别的？ ——它是公设，不能推导。实验验证了几十年。

ML 类比： - Born 规则 ≈ softmax 的归一化选择。你问"为什么分类概率用 \(\exp(z_i)/\sum_j \exp(z_j)\) 而不是 \(|z_i|/\sum_j |z_j|\)？"——因为它能从最大熵 / 信息几何推导，也因为它"工作得好"。Born 规则同样：从线性代数 + 测量一致性（Gleason 定理）有半推导，但核心上它是理论的公设 - \(\psi \to |\psi|^2\) 相当于把"带相位的模型输出"降到"可观测的概率分布"。相位信息没丢失（干涉时恢复），只是测量时看不见

与 DFT 的关系：电子密度 \(\rho(\vec{r}) = N \int |\psi(\vec{r}, \vec{r}_2, ..., \vec{r}_N)|^2 \, d\vec{r}_2 \cdots d\vec{r}_N\) 就是 Born 规则推到多电子情况，再边缘化到单个坐标。DFT 的"密度"就是这个概率密度乘以电子数。

3. 算符（operator）与物理量¶

公设：每个可观测物理量对应一个线性厄米算符（Hermitian operator） \(\hat{A}\)，作用在 \(\psi\) 上。

常见例子： | 物理量 | 算符 | 形式 | |---|---|---| | 位置 \(\hat{\vec{r}}\) | 乘以坐标 | \(\hat{\vec{r}} \psi = \vec{r} \psi\) | | 动量 \(\hat{\vec{p}}\) | 梯度 | \(\hat{\vec{p}} \psi = -i\hbar \nabla \psi\) | | 动能 \(\hat{T}\) | 拉普拉斯 | \(\hat{T} \psi = -\frac{\hbar^2}{2m}\nabla^2 \psi\) | | 势能 \(\hat{V}\) | 乘以势函数 | \(\hat{V}\psi = V(\vec{r})\psi\) | | 总能量 \(\hat{H}\) | 哈密顿量 | \(\hat{H} = \hat{T} + \hat{V}\) |

厄米性（Hermitian）：\(\langle \phi | \hat{A} \psi \rangle = \langle \hat{A} \phi | \psi \rangle\)。保证本征值是实数。

ML 类比： - 算符 ≈ 作用在模型上的函数。梯度、海森、Jacobi 都是算符 - 厄米算符 ≈ 对称矩阵。在有限维都是实特征值 + 正交特征向量的场景——这就是 PCA、谱方法背后的结构

4. 期望值（expectation value）¶

定义：对处于状态 \(\psi\) 的系统，物理量 \(\hat{A}\) 的期望测量结果是

\[\langle \hat{A} \rangle_\psi = \int \psi^*(\vec{r}) \, \hat{A} \, \psi(\vec{r}) \, d\vec{r} = \langle \psi | \hat{A} | \psi \rangle\]

这就是 QM 里所有"算一个数字出来"的套路——准备态 \(\psi\)、夹 \(\hat{A}\)、积分。

在 DFT 中的用途：总能量 = \(\langle \hat{H} \rangle_\psi\)。这就是 QE 输出里 ! total energy = -15.83XXX Ry 那个数。

ML 类比： - 期望值 ≈ forward 算一个标量输出。\(\psi\) 是参数/状态，\(\hat{A}\) 是目标函数，\(\langle \hat{A} \rangle\) 是该状态下的 loss / metric - 积分 \(\int \psi^* \hat{A} \psi\) 在离散化后就是 \(c^\dagger A c\)（三明治形式），和 Rayleigh quotient 完全一样

5. 本征值方程与薛定谔方程¶

定态薛定谔方程（time-independent Schrödinger equation）：

\[\hat{H} \psi = E \psi\]

这就是一个本征值问题（eigenvalue problem）：找满足 \(\hat{H} \psi = E \psi\) 的 \((\psi, E)\) 对。

\(\psi\) 是本征态（eigenstate），\(E\) 是本征值 / 能级（eigenvalue / energy level）
因为 \(\hat{H}\) 厄米，解构成一组正交完备基：\(\{\psi_0, \psi_1, \psi_2, ...\}\) 对应 \(E_0 \leq E_1 \leq E_2 \leq \cdots\)

基态 vs 激发态： - \(\psi_0\)：最低能量态，称基态（ground state）——DFT 要找的就是它 - \(\psi_{n \geq 1}\)：激发态（excited state）——超出标准 DFT 能力；TDDFT、GW 等方法专治此

ML 类比： - 本征值方程 ≈ PCA 找主成分：\(C v = \lambda v\)，协方差矩阵 \(C\) 的前几个特征向量就是 \(\psi_0, \psi_1, ...\) - 基态 \(\psi_0\) ≈ loss 最小的模型参数。DFT 在找的是"能量 loss"的全局最小 - \(\hat{H}\) 的谱 ≈ 把整个系统的所有模式按能量排好——和 Laplacian 谱、kernel 的特征值分解是同一套语言

在 QE 里的体现： - SCF 迭代的每一步都在做对角化（Davidson 算法）：把 \(\hat{H}\) 用平面波基组表示成有限矩阵 \(\mathbf{H}\)，算最低几个特征值/向量 - 输出里的 k = ..., band energies (ev): ... 就是每个 k 点下 \(\hat{H}\) 的本征值

6. 费米子、玻色子、泡利不相容¶

自旋（spin）：每个粒子除了空间坐标还有一个内禀自由度 \(s \in \{-1/2, +1/2\}\)（电子）或更大（其他粒子）。

两大类粒子： - 费米子（fermion）：自旋半整数（电子、质子、中子、...）。多粒子波函数对交换两个粒子变号：\(\psi(..., \vec{r}_i, ..., \vec{r}_j, ...) = -\psi(..., \vec{r}_j, ..., \vec{r}_i, ...)\) - 玻色子（boson）：自旋整数（光子、声子、...）。交换不变号

泡利不相容原理（Pauli exclusion principle）：两个相同量子态不能同时被两个费米子占据。这是反对称性的直接推论（\(\psi = -\psi \Rightarrow \psi = 0\)）。

为什么重要： - DFT 的主角是电子——费米子。所以多电子波函数必须反对称 - 化简 2（Slater 行列式）就是把反对称性编码进波函数的结构里 - 声子是玻色子（晶格振动的量子），在 DFT+声子计算里出现，但不在本期主线

ML 类比： - 反对称性 ≈ 一种强 inductive bias。像 EGNN 要求 E(3)-equivariance、CNN 要求平移等变、GNN 要求排列对称——都是把先验写进模型结构里。费米子的反对称是"排列反对称" - 泡利不相容 ≈ 一种硬约束（hard constraint）而非软惩罚——模型结构让违反它的状态根本不存在

在 QE 里的体现： - nspin=1：所有轨道默认自旋成对（up/down 共占），非磁性 - nspin=2：显式区分自旋，磁性材料必需 - occupations='smearing'：金属里费米能级附近部分占据（Fermi-Dirac 分布的反映）

7. 单位制（units）¶

QM / DFT 混用多套单位，一定要搞清楚：

单位	等价	用在哪
Hartree (Ha)	\(\approx 27.2114\) eV	理论公式、一些 DFT 代码
Rydberg (Ry)	\(\approx 13.6057\) eV = 0.5 Ha	Quantum ESPRESSO 默认能量单位
eV	1 eV ≈ \(1.602 \times 10^{-19}\) J	固体物理、实验对比
bohr (\(a_0\))	\(\approx 0.5292\) Å	原子单位长度，QE 部分输入
Å (angstrom)	\(10^{-10}\) m	晶格常数常用

换算速记： - \(1 \text{ Ha} = 2 \text{ Ry} \approx 27.2 \text{ eV}\) - \(1 \text{ bohr} \approx 0.529 \text{ Å}\)，\(1 \text{ Å} \approx 1.89 \text{ bohr}\) - \(k_B T\) at 300 K \(\approx 0.025\) eV（热能量级参考） - 化学键能量级 ~ eV；声子 ~ meV；超导能隙 ~ meV

QE 中的典型单位： - ecutwfc = 40.0 → 40 Ry - celldm(1) = 10.20 → 10.20 bohr（ibrav != 0 时） - CELL_PARAMETERS angstrom → Å - ATOMIC_POSITIONS crystal → 无量纲（晶格矢量分数坐标） - 输出 ! total energy = -15.83 Ry → 注意是 Ry，乘 13.6057 转 eV

常见坑： - 看到能量不加核查单位：QE 输出是 Ry，benchmark 的 total_energy_ev_per_fu 是 eV，差两倍还加 13.6 换算因子 - 赝势文件里的 cutoff 建议值通常是 Ry

8. 对 DFT 化简链的铺垫¶

到了下一篇我们进入化简 1（Born-Oppenheimer）。带着这些问题： 1. 原始多体 \(\hat{H}\) 有哪几项？每项是什么算符？ 2. 为什么直接解 \(\hat{H}\Psi = E\Psi\) 不现实？（答：\(\Psi\) 维度 \(3(N+M)\)，存不下） 3. 核和电子哪个动得快？差多少？（答：电子 ~ 1800 倍快，这是化简 1 的支点）

关键词清单（本篇引入）¶

wavefunction \(\psi\) / 波函数
Hilbert space / 希尔伯特空间
Born rule / Born 规则
operator / 算符
Hermitian / 厄米
expectation value / 期望值
eigenvalue problem / 本征值问题
Schrödinger equation / 薛定谔方程
Hamiltonian \(\hat{H}\) / 哈密顿量
ground state, excited state / 基态、激发态
fermion, boson / 费米子、玻色子
spin / 自旋
Pauli exclusion / 泡利不相容
Hartree, Rydberg, eV, bohr, Å / 单位制

下一步阅读¶

→ 11-born-oppenheimer.md — 化简 1：把核"冻住"，分出电子子问题