泛函

  泛函分析(Functional Analysis)将一个函数视为函数空间( H,  B\mathcal{H},\;\mathcal{B} )中的一个向量,通过定义合适的范数来将连续性等分析概念移植到函数对象上来,并将代数结构的“理念”推广,从而研究一族函数的特定结构,比如函数族

{1,sinx,cosx,sin2x,cos2x} \{1, \sin x,\cos x ,\sin 2x ,\cos 2x \dots \}

是完备的,任意定义域有界的连续函数 f(x)f(x) 均存在唯一的 Fourier 级数

F(x)=Cnsinωnx+Dncosωnx \mathcal{F}(x)=\sum C_n \sin \omega_n x + D_n \cos \omega_n x

一致收敛于它。这个结论在论证分离变量法对偏微分方程的有效性时已经有所应用。

  再比如,对于处在两个相隔一定距离的相同圆环之间的肥皂膜,根据物理化学中的表面热力学公式

ΔG=SdT+VdP+γdσ \Delta G = -SdT + V dP + \gamma d\sigma

在物质的量不变的条件下,每一种可能的曲面 Ω\Omega 都能给出一个对应的吉布斯自由能

G=kΩγ(x,y,z)dS G = k \iint_{\Omega} \gamma(x,y,z)\, \mathrm{d}S

为使得 GG 达到最小值,在温度压强不变的条件下,表面的总面积应当取条件极值

G=kΩγ(x,y,z)dS,    where  Ωρ(x,y,z)dSM G = k \iint_{\Omega} \gamma(x,y,z)\, \mathrm{d}S,\;\;\text{where}\;\iint_{\Omega} \rho(x,y,z)\,\mathrm{d}S \equiv M

  又比如,由于哈密顿量在经典力学中是时间演化的生成元,借用这个概念,将量子力学的无穷小时间平移算符写作如下形式:

U(t+dt,t)=1iH^dt \mathcal{U}(t+dt,t) = 1 - \frac{i\hat{H}dt}{\hbar}

物理学家不在意最严谨的数学——本性如此。由于时间演化算符应当具有结合性,那么为了知道时间演化算符如何依赖于时间,他们是不择手段的:

U(t+dt,t0)=U(t+dt,t)U(t,t0)=(1iH^dt)U(t,t0) \begin{aligned} \mathcal{U}(t+dt,t_0) &= \mathcal{U}(t+dt,t)\,\mathcal{U}(t,t_0)\\ &= \left(1 - \frac{i\hat{H}dt}{\hbar}\right)\,\mathcal{U}(t,t_0) \end{aligned}

U(t+dt,t0)U(t,t0)=iH^dtU(t,t0),itU(t,t0)=H^U(t,t0) \begin{aligned} \therefore \mathcal{U}(t+dt,t_0)-\mathcal{U}(t,t_0) &= - \frac{i\hat{H}}{\hbar}dt\, \mathcal{U}(t,t_0),\\ i\hbar \frac{\partial}{\partial t} \mathcal{U}(t,t_0) &= \hat{H}\,\mathcal{U}(t,t_0) \end{aligned}

物理学家们“大言不惭”地称其为时间演化算符所满足的“微分方程”,并且不难看出,两边同时作用一个右矢就得到了薛定谔方程。那么此时,数学家发出了诘难:怎样合理地定义一个算符的微分?因为这可能不再是对有限维向量做的线性映射(映射的微分就是Jacobi 矩阵,线性映射的 Jacobi 矩阵就是映射对应的矩阵),而是对函数空间中的一个波函数映射为另一个波函数的“映射”。

  总之,泛函分析这门学科的应用如此广泛,以至于已经成为理论学习中不可忽视的存在。我们先简短地讨论一下数学上的泛函定义,然后转向物理中的相应应用。

什么是泛函

  泛函 F\mathcal{F}(functional),与通常的函数(function)类似,它的定义域是函数空间 H\mathcal{H} 的子集。由于理论力学中碰到的泛函都是实值函数,我们不妨将它的值域固定在实数域(量子力学路径积分才需要复数域的泛函):

UB,  fU,F:UR U \subset \mathcal{B},\;\forall f\in U, \mathcal{F}: U \mapsto \mathbb{R}

具体一点,它的自变量是函数(可以是单变量也可以是多变量),是函数的函数,比如连接两个端点的绳长 LL 是绳 y(x)y(x) 的函数:

L=x1x21+y2dx L = \int_{x_1}^{x_2} \sqrt{1+y'^2}\,\mathrm{d}x

Ω\partial \Omega 为边界的曲面面积 SS 是曲面 z=f(x,y)z = f(x,y) 的函数:

S=Ω1+(fx)2+(fy)2dxdy S = \iint_\Omega \sqrt{1+\left(\frac{\partial f}{\partial x}\right)^2 + \left(\frac{\partial f}{\partial y}\right)^2}\,\mathrm{d}x\mathrm{d}y

等等。而在物理中,我们更感兴趣函数的条件极值与条件极值点,比如物质的量一定的情况下肥皂膜取到的最小曲面长什么样、平面上周长一定的情况下怎样才能围出最大的面积等等。这对应着泛函的极值问题,便需要知道一个泛函的分析性质如何。

泛函的微分

定义

  一个泛函 Φ\Phi 如果有 Φ(γ+h)Φ(γ)=F+R\Phi(\gamma +h)-\Phi(\gamma) = F + R ,其中 FF 线性依赖于 hh (即对固定的 γF(h1+h2)=F(h1)+F(h2)\gamma,F(h_1+h_2) = F(h_1)+F(h_2)F(ch)=cF(h)F(ch) = c F(h)) ,而 R(h,γ)=O(h2)R(h, \gamma)=\mathrm{O}\left(h^2\right) ,就称 Φ\Phi 是可微的,增量的线性部分 F(h)F(h) 称为其微分。

  此处对于微分的定义在形式上与普通函数完全相同,都取线性主部、线性增量。泛函的微分又称为变分hh 则称为曲线的变分

  在理论力学中,我们更感兴趣的是如下形式的作用量泛函:

Φ(γ)=t0t1L(x(t),x˙(t),t)dt \Phi(\gamma) = \int_{t_0}^{t_1}L(x(t),\dot{x}(t),t)\,\mathrm{d}t

它是可微的,其微分为

F(h)=t0t1[LxddtLx˙]hdt+(Lx˙h)t0t1 F(h)=\int_{t_0}^{t_1}\left[\frac{\partial L}{\partial x}-\frac{d}{d t} \frac{\partial L}{\partial \dot{x}}\right] h d t+\left.\left(\frac{\partial L}{\partial \dot{x}} h\right)\right|_{t_0} ^{t_1}

证明如下:

Φ(γ+h)Φ(γ)=t0t1[L(x+h,x˙+h˙,t)L(x,x˙,t)]dt=t0t1[Lxh+Lx˙h˙]dt+O(h2)=F(h)+R \begin{aligned} \Phi(\gamma+h)-\Phi(\gamma) &=\int_{t_0}^{t_1}[L(x+h, \dot{x}+\dot{h}, t)-L(x, \dot{x}, t)] d t \\ &=\int_{t_0}^{t_1}\left[\frac{\partial L}{\partial x} h+\frac{\partial L}{\partial \dot{x}} \dot{h}\right] d t+\mathrm{O}\left(h^2\right)=F(h)+R \end{aligned}

所以

F(h)=t0t1(Lxh+Lx˙h˙)dt and R=O(h2) F(h)=\int_{t_0}^{t_1}\left(\frac{\partial L}{\partial x} h+\frac{\partial L}{\partial \dot{x}} \dot{h}\right) d t \quad \text { and } \quad R=\mathrm{O}\left(h^2\right)

对第二项分部积分则有

t0t1Lx˙h˙dt=t0t1hddt(Lx˙)dt+(hLx˙)t0t1 \int_{t_0}^{t_1} \frac{\partial L}{\partial \dot{x}} \dot{h} d t=-\int_{t_0}^{t_1} h \frac{d}{d t}\left(\frac{\partial L}{\partial \dot{x}}\right) d t+\left.\left(h \frac{\partial L}{\partial \dot{x}}\right)\right|_{t_0} ^{t_1}

  这一系列操作与通常的函数形式完全一致,因为它们是代数同构的(李群),就像我们可以直接按照一阶线性微分方程来写出 Schrödinger 方程的形式解一般。

Schrödinger 方程

itΨ(t)=H^Ψ(t) i\hbar \frac{\partial }{\partial t} |\Psi(t)\rangle = \hat{H} |\Psi(t)\rangle

的形式解为:

Ψ(t)=eiH^t/Ψ(0) |\Psi(t)\rangle = e^{-i\hat{H}t/\hbar} |\Psi(0)\rangle

将时间演化算符在能量本征基下展开:

ψ(t)=neiEn(tt0)/nnψ(t0) |\psi(t)\rangle=\sum_n e^{-i E_n\left(t-t_0\right) / \hbar}\left|n \rangle\langle n | \psi\left(t_0\right)\right\rangle

所以 U^(t)eiH^t/\hat{U}(t)\equiv e^{-i\hat{H}t/\hbar} 也被称为传播子,它控制着波矢的时间演化。

  读者如果仍然感到困惑,不妨沿着这篇文章:Axeho:变分法求最速降线方程 的思路,将泛函的微分先转化为对偏移程度 α\alpha 的微分进行推导,然后再换回来。

变分导数

哈密顿原理

  定义如下形式的作用量

S=t1t2L(q,q˙,t)dt S = \int_{t_1}^{t_2} L(q,\dot{q},t)\, dt

哈密顿原理声称:如果在 t1t_1 时刻观测到粒子处于 x1x_1,而 t2t_2 时刻观测到粒子处于 x2x_2 ,那么粒子在 t1t2t_1\backsim t_2 之间通过的路径使得作用量 SS 取驻值。

  这表明,我们似乎并不需要知道究竟是什么样的“力”正施加在物体上,进而求解已知初值条件的二阶微分方程来告诉我们粒子的轨迹是什么。哈密顿原理告诉我们,系统的拉格朗日函数 LL 已经包含了与粒子运动状态相关联的一切信息,我们只需要输入轨迹的边界,并从连接这两个端点的所有路径中找出驻值路径,而驻值路径就是实际路径。

  看起来粒子似乎有某种智慧:它在 t1t_1 时刻处于 x1x_1 ,并接到命令让它在 t2t_2 时刻运动到 x2x_2 。它迅速地制定了一个行进计划,在所有可能的路径中选出了那条使得这个作用量取驻值的路径,并在接下来的时间中完成这个计划。

  这显然是不太可能的,经典力学也无法对此作出解释。不过当微观粒子的量子效应趋近于0时,的确可以经过一定的“选择”过程“挑出”那条路径——“走”驻值路径的概率相对与其他非驻值路径的概率的比例逐渐增大,这是费曼路径积分的一个推论。

欧拉-拉格朗日方程

  要想泛函取极值,泛函的微分应当处处为 00。可以看到这种泛函的变分中既有积分项,又有端点项。我们感兴趣的是积分项,因为通常而言端点的位置总是已知的:在 t1t_1 时刻观察到粒子处于 x1x_1 ,而在 t2t_2 时刻观察到粒子处于 x2x_2 。这相当于在求解泛函的条件极值,拉格朗日乘数法仍然适用,但是现在我们先考虑简单一些的情形。

  既然端点固定,那么任意函数 h(t)h(t) 就不是那么任意,它应当满足 h(t1)=h(t2)=0h(t_1) = h(t_2) = 0 ,所以端点项消失,变分约减为

F(h)=t0t1[LxddtLx˙]hdt F(h)=\int_{t_0}^{t_1}\left[\frac{\partial L}{\partial x}-\frac{d}{d t} \frac{\partial L}{\partial \dot{x}}\right] h \mathrm{d} t

hh 代表 γ\gamma 周围任意一个函数,要使积分为 00,必须要求

t(t1,t2),LxddtLx˙=0. \forall t \in (t_1,t_2),\quad \frac{\partial L}{\partial x}-\frac{d}{d t} \frac{\partial L}{\partial \dot{x}}=0.

  这一点不难理解,因为 Riemann 积分本就是求和的极限:

ϵ,N,whenn>N,i=1nf(ξi)(xi+1xi)Aϵ \forall \epsilon, \exists N ,\quad\text{when}\quad n>N,\,\left|\sum_{i=1}^{n}f(\xi_i)(x_{i+1}-x_{i}) - A\right| \leq \epsilon

对任意的 ξi\xi_i 的取法都成立。所以如果将积分视作内积、函数视作向量,那么一个对任意向量的内积都为 00 的向量必定是 0\bold{0} 向量,注意这里“任意向量”的核心含义是方向任意。

  称方程

δLδq=LqddtLq˙=0 \frac{\delta L}{\delta q} = \frac{\partial L}{\partial q}-\frac{d}{d t} \frac{\partial L}{\partial \dot{q}}=0

为泛函 Φ\Phi 的欧拉-拉格朗日方程,处处满足这个微分方程的曲线 γ\gamma 即是泛函的驻定曲线,这可推广至 nn 维坐标空间。

  可以看到,一个泛函驻定曲线的等价定义是一个微分方程,求解这个微分方程即可得知驻定曲线的形状。那么反过来,求解微分方程也可以构造一个等价的泛函——这就是微分方程的变分解法。

雅可比积分

拉格朗日方程的几何意义

流形

广义势能

耗散

拉格朗日乘子

对不同情形的总结

  1. 自由粒子:

δTδqk=0 \frac{\delta T}{\delta q_k} =0

  1. 保守力场:

δTδqk=δUδqk=Qk=Uqk \frac{\delta T}{\delta q_k} = \frac{\delta U}{\delta q_k} = -Q_k = \frac{\partial U}{\partial q_k}

  1. 广义势能:

δTδqk=δUδqk=Qk=UqkddtUqk \frac{\delta T}{\delta q_k} = \frac{\delta \mathcal{U}}{\delta q_k} = -Q_k = \frac{\partial \mathcal{U}}{\partial q_k} - \frac{d }{d t}\frac{\partial \mathcal{U}}{\partial q_k}

  1. 耗散:

δTδqk=QkDk=δUδqk+Fq˙k=UqkddtUqk+Fq˙k \begin{aligned} \frac{\delta T}{\delta q_k} &= -Q_k - D_k\\ &= \frac{\delta \mathcal{U}}{\delta q_k} + \frac{\partial \mathcal{F}}{\partial \dot{q}_k} \\ &= \frac{\partial \mathcal{U}}{\partial q_k} - \frac{d }{d t}\frac{\partial \mathcal{U}}{\partial q_k} + \frac{\partial \mathcal{F}}{\partial \dot{q}_k} \end{aligned}

  1. 求解约束力

δLδqk+λδfδqk=0f(q)=0N=λfr \begin{aligned} \frac{\delta L}{\delta q_k} + \lambda \frac{\delta f}{\delta q_k} = 0\\ f(q) = 0\\ \vec{N} = \lambda \frac{\partial f}{\partial \vec{r}} \end{aligned}

对称与守恒

  这里只给出一些结论,细节请参见本文:

空间变换的 Noether 定理

  若变换 qkQk=Qk(q,t,ε) ~q_k \mapsto Q_k = Q_k (q, t, \varepsilon)~为体系 L(q,q˙,t) ~L(q, \dot q, t)~的对称变换,即

Lε(q,q˙,t)=L(Q,Q˙,t)=L(q,q˙,t)+dF(q,t,ε)dtL_\varepsilon(q, \dot q, t) = L(Q, \dot Q, t) = L(q, \dot q, t) + \frac{\mathrm d F(q, t, \varepsilon)}{\mathrm d t}

Γ=pkSkG \Gamma = p_kS_k - G

为运动常数,其中

Sk=Qkεε=0,G=Fqε=0,pk=Lq˙kS_k = \left.\frac{\partial Q_k}{\partial \varepsilon}\right|_{\varepsilon = 0},\quad G = \left.\frac{\partial F}{\partial q}\right|_{\varepsilon = 0},\quad p_k = \frac{\partial L}{\partial \dot q_k}

   Noether ~\text{Noether}~定理即是说,若我们能找到一个对称变换,就说明体系有一个对应的运动常数。对称与守恒由此联系起来。

  由 Noether ~\text{Noether}~定理可以得到很多常见的守恒关系。例如由空间平移可以得到动量守恒,由空间转动可以得到角动量守恒。

时空联合变换

  前面我们只是将空间变来变去,根据空间平移不变性以及空间转动不变性分别找到了线动量 pp 和角动量 ll 这两类守恒量。现在,我们希望能将时间 tt 纳入变换中,找到更多的守恒量。

  为了使得对时间做变换时,作用量的积分上下限不变,进而将时间 tt 也在形式上作为一个新的广义坐标参与到讨论之中,我们考虑用参数变换(实际上是相对论的原时)t=t(σ)t = t(\sigma)

S=t1t2L(q,q˙,t)dt=σ1σ2L(q,q˙,t)tdσ S = \int_{t_1}^{t_2} L(q,\dot{q},t)\, dt = \int_{\sigma _1}^{\sigma _2} L(q,\dot{q},t)t'\, d\sigma

并且有

q˙=dqdt=dq/dσdt/dσ=qt \dot{q} = \frac{dq}{dt} = \frac{dq/d\sigma}{dt/d\sigma} = \frac{q'}{t'}

则令

L^=tL(q,q˙,t)=tL(q,qt,t)=L^(q,t,q,t) \hat{L} = t' L(q,\dot{q},t) = t' L(q,\frac{q'}{t'},t) = \hat{L} (q,t,q',t')

作用量现在可以写成

S=σ1σ2L^(q,t,q,t)dσ S = \int_{\sigma _1}^{\sigma _2} \hat{L} (q,t,q',t')\, d\sigma

新的拉格朗日函数被积变量是 σ\sigma ,现在时间 tt 就称为了一个更加“广义”的广义坐标。

  在这种情况下,守恒量为

Γ=pkSkhtStG \Gamma = p_kS_k - h_tS_t - G

其中 hh 即是拉格朗日函数的雅可比积分,而其他的部分与仅做空间变换时相同。


[1]. 阿诺尔德,经典力学中的数学方法

[2]. 樱井纯,现代量子力学

[3]. 戈德斯坦,经典力学

[4]. 李尚志,线性代数(数学专业用)

[5]. 狄拉克,量子力学原理

[6]. 梁昆淼,力学(下册):理论力学