10. 量子力学前置(化简 0)¶
DFT 是一个把"多体量子系统"化简到"可计算形式"的工程。在开始化简 1(Born-Oppenheimer)之前,要先把量子力学(Quantum Mechanics, QM)的几个基本"公设 / postulate"过一遍,这样后面每一步化简才知道自己在对什么东西做近似。
本篇不严格遵守 8 段模板,因为这是起点,不是一次化简步骤;但仍标注关键词与 ML 类比。
0. 读这篇笔记前需要知道的¶
- 读者是 ML/CS 背景,线代、特征值分解、期望值、优化都熟
- QM 的形式系统就是复希尔伯特空间 + 线性算符,数学上和 ML 没什么两样
- 真正"陌生"的只是物理诠释(波函数为什么是概率幅?为什么是复值?)——这部分不要试图"推导",它们是公设(不可推导的基本假设),记下来就好
- ML 里其实有类似的"公设":比如为什么 softmax 是这个形式?为什么分类用交叉熵?背后都有信息论理由,但日常就是接受它
1. 波函数 ψ(wavefunction)¶
定义:一个量子粒子的状态由一个复值函数 \(\psi(\vec{r}, t)\) 描述,\(\vec{r} \in \mathbb{R}^3\) 是空间坐标,\(t\) 是时间。多粒子系统则是 \(\psi(\vec{r}_1, ..., \vec{r}_N, t)\)。
关键性质: - 复值(complex-valued):\(\psi \in \mathbb{C}\)。这不是花哨,是量子干涉必需的——实值函数没有相位 - 归一化(normalized):\(\int |\psi|^2 \, d\vec{r} = 1\) - 所有具有上述性质的函数构成一个希尔伯特空间(Hilbert space)\(\mathcal{H}\)
ML 类比: - 波函数 ≈ 一个模型的"完整状态"。在 ML 里模型状态是参数 \(\theta \in \mathbb{R}^d\);在 QM 里系统状态是 \(\psi \in \mathcal{H}\)(无穷维复函数空间) - 多电子波函数是 \(3N\) 维函数——相当于一个 loss landscape 在 \(3N\) 维空间上定义。这就是为什么 DFT 必须做化简:直接存 \(\psi\) 需要 \(\text{grid}^{3N}\) 个复数,指数爆炸
常见坑: - 不要把 \(\psi(\vec{r})\) 读作"粒子在 \(\vec{r}\) 的值"——它本身没有直接物理意义,只有 \(|\psi|^2\) 才有(见下节)
2. Born 规则(Born rule)¶
内容:\(|\psi(\vec{r})|^2\) 是在位置 \(\vec{r}\) 找到粒子的概率密度(probability density)。
为什么是平方而不是绝对值?为什么是这个而不是别的? ——它是公设,不能推导。实验验证了几十年。
ML 类比: - Born 规则 ≈ softmax 的归一化选择。你问"为什么分类概率用 \(\exp(z_i)/\sum_j \exp(z_j)\) 而不是 \(|z_i|/\sum_j |z_j|\)?"——因为它能从最大熵 / 信息几何推导,也因为它"工作得好"。Born 规则同样:从线性代数 + 测量一致性(Gleason 定理)有半推导,但核心上它是理论的公设 - \(\psi \to |\psi|^2\) 相当于把"带相位的模型输出"降到"可观测的概率分布"。相位信息没丢失(干涉时恢复),只是测量时看不见
与 DFT 的关系:电子密度 \(\rho(\vec{r}) = N \int |\psi(\vec{r}, \vec{r}_2, ..., \vec{r}_N)|^2 \, d\vec{r}_2 \cdots d\vec{r}_N\) 就是 Born 规则推到多电子情况,再边缘化到单个坐标。DFT 的"密度"就是这个概率密度乘以电子数。
3. 算符(operator)与物理量¶
公设:每个可观测物理量对应一个线性厄米算符(Hermitian operator) \(\hat{A}\),作用在 \(\psi\) 上。
常见例子: | 物理量 | 算符 | 形式 | |---|---|---| | 位置 \(\hat{\vec{r}}\) | 乘以坐标 | \(\hat{\vec{r}} \psi = \vec{r} \psi\) | | 动量 \(\hat{\vec{p}}\) | 梯度 | \(\hat{\vec{p}} \psi = -i\hbar \nabla \psi\) | | 动能 \(\hat{T}\) | 拉普拉斯 | \(\hat{T} \psi = -\frac{\hbar^2}{2m}\nabla^2 \psi\) | | 势能 \(\hat{V}\) | 乘以势函数 | \(\hat{V}\psi = V(\vec{r})\psi\) | | 总能量 \(\hat{H}\) | 哈密顿量 | \(\hat{H} = \hat{T} + \hat{V}\) |
厄米性(Hermitian):\(\langle \phi | \hat{A} \psi \rangle = \langle \hat{A} \phi | \psi \rangle\)。保证本征值是实数。
ML 类比: - 算符 ≈ 作用在模型上的函数。梯度、海森、Jacobi 都是算符 - 厄米算符 ≈ 对称矩阵。在有限维都是实特征值 + 正交特征向量的场景——这就是 PCA、谱方法背后的结构
4. 期望值(expectation value)¶
定义:对处于状态 \(\psi\) 的系统,物理量 \(\hat{A}\) 的期望测量结果是
这就是 QM 里所有"算一个数字出来"的套路——准备态 \(\psi\)、夹 \(\hat{A}\)、积分。
在 DFT 中的用途:总能量 = \(\langle \hat{H} \rangle_\psi\)。这就是 QE 输出里 ! total energy = -15.83XXX Ry 那个数。
ML 类比: - 期望值 ≈ forward 算一个标量输出。\(\psi\) 是参数/状态,\(\hat{A}\) 是目标函数,\(\langle \hat{A} \rangle\) 是该状态下的 loss / metric - 积分 \(\int \psi^* \hat{A} \psi\) 在离散化后就是 \(c^\dagger A c\)(三明治形式),和 Rayleigh quotient 完全一样
5. 本征值方程与薛定谔方程¶
定态薛定谔方程(time-independent Schrödinger equation):
这就是一个本征值问题(eigenvalue problem):找满足 \(\hat{H} \psi = E \psi\) 的 \((\psi, E)\) 对。
- \(\psi\) 是本征态(eigenstate),\(E\) 是本征值 / 能级(eigenvalue / energy level)
- 因为 \(\hat{H}\) 厄米,解构成一组正交完备基:\(\{\psi_0, \psi_1, \psi_2, ...\}\) 对应 \(E_0 \leq E_1 \leq E_2 \leq \cdots\)
基态 vs 激发态: - \(\psi_0\):最低能量态,称基态(ground state)——DFT 要找的就是它 - \(\psi_{n \geq 1}\):激发态(excited state)——超出标准 DFT 能力;TDDFT、GW 等方法专治此
ML 类比: - 本征值方程 ≈ PCA 找主成分:\(C v = \lambda v\),协方差矩阵 \(C\) 的前几个特征向量就是 \(\psi_0, \psi_1, ...\) - 基态 \(\psi_0\) ≈ loss 最小的模型参数。DFT 在找的是"能量 loss"的全局最小 - \(\hat{H}\) 的谱 ≈ 把整个系统的所有模式按能量排好——和 Laplacian 谱、kernel 的特征值分解是同一套语言
在 QE 里的体现:
- SCF 迭代的每一步都在做对角化(Davidson 算法):把 \(\hat{H}\) 用平面波基组表示成有限矩阵 \(\mathbf{H}\),算最低几个特征值/向量
- 输出里的 k = ..., band energies (ev): ... 就是每个 k 点下 \(\hat{H}\) 的本征值
6. 费米子、玻色子、泡利不相容¶
自旋(spin):每个粒子除了空间坐标还有一个内禀自由度 \(s \in \{-1/2, +1/2\}\)(电子)或更大(其他粒子)。
两大类粒子: - 费米子(fermion):自旋半整数(电子、质子、中子、...)。多粒子波函数对交换两个粒子变号:\(\psi(..., \vec{r}_i, ..., \vec{r}_j, ...) = -\psi(..., \vec{r}_j, ..., \vec{r}_i, ...)\) - 玻色子(boson):自旋整数(光子、声子、...)。交换不变号
泡利不相容原理(Pauli exclusion principle):两个相同量子态不能同时被两个费米子占据。这是反对称性的直接推论(\(\psi = -\psi \Rightarrow \psi = 0\))。
为什么重要: - DFT 的主角是电子——费米子。所以多电子波函数必须反对称 - 化简 2(Slater 行列式)就是把反对称性编码进波函数的结构里 - 声子是玻色子(晶格振动的量子),在 DFT+声子计算里出现,但不在本期主线
ML 类比: - 反对称性 ≈ 一种强 inductive bias。像 EGNN 要求 E(3)-equivariance、CNN 要求平移等变、GNN 要求排列对称——都是把先验写进模型结构里。费米子的反对称是"排列反对称" - 泡利不相容 ≈ 一种硬约束(hard constraint)而非软惩罚——模型结构让违反它的状态根本不存在
在 QE 里的体现:
- nspin=1:所有轨道默认自旋成对(up/down 共占),非磁性
- nspin=2:显式区分自旋,磁性材料必需
- occupations='smearing':金属里费米能级附近部分占据(Fermi-Dirac 分布的反映)
7. 单位制(units)¶
QM / DFT 混用多套单位,一定要搞清楚:
| 单位 | 等价 | 用在哪 |
|---|---|---|
| Hartree (Ha) | \(\approx 27.2114\) eV | 理论公式、一些 DFT 代码 |
| Rydberg (Ry) | \(\approx 13.6057\) eV = 0.5 Ha | Quantum ESPRESSO 默认能量单位 |
| eV | 1 eV ≈ \(1.602 \times 10^{-19}\) J | 固体物理、实验对比 |
| bohr (\(a_0\)) | \(\approx 0.5292\) Å | 原子单位长度,QE 部分输入 |
| Å (angstrom) | \(10^{-10}\) m | 晶格常数常用 |
换算速记: - \(1 \text{ Ha} = 2 \text{ Ry} \approx 27.2 \text{ eV}\) - \(1 \text{ bohr} \approx 0.529 \text{ Å}\),\(1 \text{ Å} \approx 1.89 \text{ bohr}\) - \(k_B T\) at 300 K \(\approx 0.025\) eV(热能量级参考) - 化学键能量级 ~ eV;声子 ~ meV;超导能隙 ~ meV
QE 中的典型单位:
- ecutwfc = 40.0 → 40 Ry
- celldm(1) = 10.20 → 10.20 bohr(ibrav != 0 时)
- CELL_PARAMETERS angstrom → Å
- ATOMIC_POSITIONS crystal → 无量纲(晶格矢量分数坐标)
- 输出 ! total energy = -15.83 Ry → 注意是 Ry,乘 13.6057 转 eV
常见坑:
- 看到能量不加核查单位:QE 输出是 Ry,benchmark 的 total_energy_ev_per_fu 是 eV,差两倍还加 13.6 换算因子
- 赝势文件里的 cutoff 建议值通常是 Ry
8. 对 DFT 化简链的铺垫¶
到了下一篇我们进入化简 1(Born-Oppenheimer)。带着这些问题: 1. 原始多体 \(\hat{H}\) 有哪几项?每项是什么算符? 2. 为什么直接解 \(\hat{H}\Psi = E\Psi\) 不现实?(答:\(\Psi\) 维度 \(3(N+M)\),存不下) 3. 核和电子哪个动得快?差多少?(答:电子 ~ 1800 倍快,这是化简 1 的支点)
关键词清单(本篇引入)¶
- wavefunction \(\psi\) / 波函数
- Hilbert space / 希尔伯特空间
- Born rule / Born 规则
- operator / 算符
- Hermitian / 厄米
- expectation value / 期望值
- eigenvalue problem / 本征值问题
- Schrödinger equation / 薛定谔方程
- Hamiltonian \(\hat{H}\) / 哈密顿量
- ground state, excited state / 基态、激发态
- fermion, boson / 费米子、玻色子
- spin / 自旋
- Pauli exclusion / 泡利不相容
- Hartree, Rydberg, eV, bohr, Å / 单位制
下一步阅读¶
→ 11-born-oppenheimer.md — 化简 1:把核"冻住",分出电子子问题