跳转至

10. 量子力学前置(化简 0)

DFT 是一个把"多体量子系统"化简到"可计算形式"的工程。在开始化简 1(Born-Oppenheimer)之前,要先把量子力学(Quantum Mechanics, QM)的几个基本"公设 / postulate"过一遍,这样后面每一步化简才知道自己在对什么东西做近似。

本篇不严格遵守 8 段模板,因为这是起点,不是一次化简步骤;但仍标注关键词与 ML 类比。


0. 读这篇笔记前需要知道的

  • 读者是 ML/CS 背景,线代、特征值分解、期望值、优化都熟
  • QM 的形式系统就是复希尔伯特空间 + 线性算符,数学上和 ML 没什么两样
  • 真正"陌生"的只是物理诠释(波函数为什么是概率幅?为什么是复值?)——这部分不要试图"推导",它们是公设(不可推导的基本假设),记下来就好
  • ML 里其实有类似的"公设":比如为什么 softmax 是这个形式?为什么分类用交叉熵?背后都有信息论理由,但日常就是接受它

1. 波函数 ψ(wavefunction)

定义:一个量子粒子的状态由一个复值函数 \(\psi(\vec{r}, t)\) 描述,\(\vec{r} \in \mathbb{R}^3\) 是空间坐标,\(t\) 是时间。多粒子系统则是 \(\psi(\vec{r}_1, ..., \vec{r}_N, t)\)

关键性质: - 复值(complex-valued)\(\psi \in \mathbb{C}\)。这不是花哨,是量子干涉必需的——实值函数没有相位 - 归一化(normalized)\(\int |\psi|^2 \, d\vec{r} = 1\) - 所有具有上述性质的函数构成一个希尔伯特空间(Hilbert space)\(\mathcal{H}\)

ML 类比: - 波函数 ≈ 一个模型的"完整状态"。在 ML 里模型状态是参数 \(\theta \in \mathbb{R}^d\);在 QM 里系统状态是 \(\psi \in \mathcal{H}\)(无穷维复函数空间) - 多电子波函数是 \(3N\) 维函数——相当于一个 loss landscape 在 \(3N\) 维空间上定义。这就是为什么 DFT 必须做化简:直接存 \(\psi\) 需要 \(\text{grid}^{3N}\) 个复数,指数爆炸

常见坑: - 不要把 \(\psi(\vec{r})\) 读作"粒子在 \(\vec{r}\) 的值"——它本身没有直接物理意义,只有 \(|\psi|^2\) 才有(见下节)


2. Born 规则(Born rule)

内容\(|\psi(\vec{r})|^2\) 是在位置 \(\vec{r}\) 找到粒子的概率密度(probability density)。

\[P(\vec{r} \in V) = \int_V |\psi(\vec{r})|^2 \, d\vec{r}\]

为什么是平方而不是绝对值?为什么是这个而不是别的? ——它是公设,不能推导。实验验证了几十年。

ML 类比: - Born 规则 ≈ softmax 的归一化选择。你问"为什么分类概率用 \(\exp(z_i)/\sum_j \exp(z_j)\) 而不是 \(|z_i|/\sum_j |z_j|\)?"——因为它能从最大熵 / 信息几何推导,也因为它"工作得好"。Born 规则同样:从线性代数 + 测量一致性(Gleason 定理)有半推导,但核心上它是理论的公设 - \(\psi \to |\psi|^2\) 相当于把"带相位的模型输出"降到"可观测的概率分布"。相位信息没丢失(干涉时恢复),只是测量时看不见

与 DFT 的关系:电子密度 \(\rho(\vec{r}) = N \int |\psi(\vec{r}, \vec{r}_2, ..., \vec{r}_N)|^2 \, d\vec{r}_2 \cdots d\vec{r}_N\) 就是 Born 规则推到多电子情况,再边缘化到单个坐标。DFT 的"密度"就是这个概率密度乘以电子数。


3. 算符(operator)与物理量

公设:每个可观测物理量对应一个线性厄米算符(Hermitian operator) \(\hat{A}\),作用在 \(\psi\) 上。

常见例子: | 物理量 | 算符 | 形式 | |---|---|---| | 位置 \(\hat{\vec{r}}\) | 乘以坐标 | \(\hat{\vec{r}} \psi = \vec{r} \psi\) | | 动量 \(\hat{\vec{p}}\) | 梯度 | \(\hat{\vec{p}} \psi = -i\hbar \nabla \psi\) | | 动能 \(\hat{T}\) | 拉普拉斯 | \(\hat{T} \psi = -\frac{\hbar^2}{2m}\nabla^2 \psi\) | | 势能 \(\hat{V}\) | 乘以势函数 | \(\hat{V}\psi = V(\vec{r})\psi\) | | 总能量 \(\hat{H}\) | 哈密顿量 | \(\hat{H} = \hat{T} + \hat{V}\) |

厄米性(Hermitian)\(\langle \phi | \hat{A} \psi \rangle = \langle \hat{A} \phi | \psi \rangle\)。保证本征值是实数。

ML 类比: - 算符 ≈ 作用在模型上的函数。梯度、海森、Jacobi 都是算符 - 厄米算符 ≈ 对称矩阵。在有限维都是实特征值 + 正交特征向量的场景——这就是 PCA、谱方法背后的结构


4. 期望值(expectation value)

定义:对处于状态 \(\psi\) 的系统,物理量 \(\hat{A}\) 的期望测量结果是

\[\langle \hat{A} \rangle_\psi = \int \psi^*(\vec{r}) \, \hat{A} \, \psi(\vec{r}) \, d\vec{r} = \langle \psi | \hat{A} | \psi \rangle\]

这就是 QM 里所有"算一个数字出来"的套路——准备态 \(\psi\)、夹 \(\hat{A}\)、积分。

在 DFT 中的用途:总能量 = \(\langle \hat{H} \rangle_\psi\)。这就是 QE 输出里 ! total energy = -15.83XXX Ry 那个数。

ML 类比: - 期望值 ≈ forward 算一个标量输出。\(\psi\) 是参数/状态,\(\hat{A}\) 是目标函数,\(\langle \hat{A} \rangle\) 是该状态下的 loss / metric - 积分 \(\int \psi^* \hat{A} \psi\) 在离散化后就是 \(c^\dagger A c\)(三明治形式),和 Rayleigh quotient 完全一样


5. 本征值方程与薛定谔方程

定态薛定谔方程(time-independent Schrödinger equation)

\[\hat{H} \psi = E \psi\]

这就是一个本征值问题(eigenvalue problem):找满足 \(\hat{H} \psi = E \psi\)\((\psi, E)\) 对。

  • \(\psi\)本征态(eigenstate)\(E\)本征值 / 能级(eigenvalue / energy level)
  • 因为 \(\hat{H}\) 厄米,解构成一组正交完备基:\(\{\psi_0, \psi_1, \psi_2, ...\}\) 对应 \(E_0 \leq E_1 \leq E_2 \leq \cdots\)

基态 vs 激发态: - \(\psi_0\):最低能量态,称基态(ground state)——DFT 要找的就是它 - \(\psi_{n \geq 1}\)激发态(excited state)——超出标准 DFT 能力;TDDFT、GW 等方法专治此

ML 类比: - 本征值方程 ≈ PCA 找主成分:\(C v = \lambda v\),协方差矩阵 \(C\) 的前几个特征向量就是 \(\psi_0, \psi_1, ...\) - 基态 \(\psi_0\) ≈ loss 最小的模型参数。DFT 在找的是"能量 loss"的全局最小 - \(\hat{H}\) 的谱 ≈ 把整个系统的所有模式按能量排好——和 Laplacian 谱、kernel 的特征值分解是同一套语言

在 QE 里的体现: - SCF 迭代的每一步都在做对角化(Davidson 算法):把 \(\hat{H}\) 用平面波基组表示成有限矩阵 \(\mathbf{H}\),算最低几个特征值/向量 - 输出里的 k = ..., band energies (ev): ... 就是每个 k 点下 \(\hat{H}\) 的本征值


6. 费米子、玻色子、泡利不相容

自旋(spin):每个粒子除了空间坐标还有一个内禀自由度 \(s \in \{-1/2, +1/2\}\)(电子)或更大(其他粒子)。

两大类粒子: - 费米子(fermion):自旋半整数(电子、质子、中子、...)。多粒子波函数对交换两个粒子变号\(\psi(..., \vec{r}_i, ..., \vec{r}_j, ...) = -\psi(..., \vec{r}_j, ..., \vec{r}_i, ...)\) - 玻色子(boson):自旋整数(光子、声子、...)。交换不变号

泡利不相容原理(Pauli exclusion principle):两个相同量子态不能同时被两个费米子占据。这是反对称性的直接推论(\(\psi = -\psi \Rightarrow \psi = 0\))。

为什么重要: - DFT 的主角是电子——费米子。所以多电子波函数必须反对称 - 化简 2(Slater 行列式)就是把反对称性编码进波函数的结构里 - 声子是玻色子(晶格振动的量子),在 DFT+声子计算里出现,但不在本期主线

ML 类比: - 反对称性 ≈ 一种强 inductive bias。像 EGNN 要求 E(3)-equivariance、CNN 要求平移等变、GNN 要求排列对称——都是把先验写进模型结构里。费米子的反对称是"排列反对称" - 泡利不相容 ≈ 一种硬约束(hard constraint)而非软惩罚——模型结构让违反它的状态根本不存在

在 QE 里的体现: - nspin=1:所有轨道默认自旋成对(up/down 共占),非磁性 - nspin=2:显式区分自旋,磁性材料必需 - occupations='smearing':金属里费米能级附近部分占据(Fermi-Dirac 分布的反映)


7. 单位制(units)

QM / DFT 混用多套单位,一定要搞清楚:

单位 等价 用在哪
Hartree (Ha) \(\approx 27.2114\) eV 理论公式、一些 DFT 代码
Rydberg (Ry) \(\approx 13.6057\) eV = 0.5 Ha Quantum ESPRESSO 默认能量单位
eV 1 eV ≈ \(1.602 \times 10^{-19}\) J 固体物理、实验对比
bohr (\(a_0\)) \(\approx 0.5292\) Å 原子单位长度,QE 部分输入
Å (angstrom) \(10^{-10}\) m 晶格常数常用

换算速记: - \(1 \text{ Ha} = 2 \text{ Ry} \approx 27.2 \text{ eV}\) - \(1 \text{ bohr} \approx 0.529 \text{ Å}\)\(1 \text{ Å} \approx 1.89 \text{ bohr}\) - \(k_B T\) at 300 K \(\approx 0.025\) eV(热能量级参考) - 化学键能量级 ~ eV;声子 ~ meV;超导能隙 ~ meV

QE 中的典型单位: - ecutwfc = 40.0 → 40 Ry - celldm(1) = 10.20 → 10.20 bohr(ibrav != 0 时) - CELL_PARAMETERS angstrom → Å - ATOMIC_POSITIONS crystal → 无量纲(晶格矢量分数坐标) - 输出 ! total energy = -15.83 Ry → 注意是 Ry,乘 13.6057 转 eV

常见坑: - 看到能量不加核查单位:QE 输出是 Ry,benchmark 的 total_energy_ev_per_fu 是 eV,差两倍还加 13.6 换算因子 - 赝势文件里的 cutoff 建议值通常是 Ry


8. 对 DFT 化简链的铺垫

到了下一篇我们进入化简 1(Born-Oppenheimer)。带着这些问题: 1. 原始多体 \(\hat{H}\) 有哪几项?每项是什么算符? 2. 为什么直接解 \(\hat{H}\Psi = E\Psi\) 不现实?(答:\(\Psi\) 维度 \(3(N+M)\),存不下) 3. 核和电子哪个动得快?差多少?(答:电子 ~ 1800 倍快,这是化简 1 的支点)


关键词清单(本篇引入)

  • wavefunction \(\psi\) / 波函数
  • Hilbert space / 希尔伯特空间
  • Born rule / Born 规则
  • operator / 算符
  • Hermitian / 厄米
  • expectation value / 期望值
  • eigenvalue problem / 本征值问题
  • Schrödinger equation / 薛定谔方程
  • Hamiltonian \(\hat{H}\) / 哈密顿量
  • ground state, excited state / 基态、激发态
  • fermion, boson / 费米子、玻色子
  • spin / 自旋
  • Pauli exclusion / 泡利不相容
  • Hartree, Rydberg, eV, bohr, Å / 单位制

下一步阅读

11-born-oppenheimer.md — 化简 1:把核"冻住",分出电子子问题