变分法 是处理泛函 的数学 领域,和处理函数的普通微积分 相对。譬如,这样的泛函 可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值 函数:它们使得泛函取得极大或极小值。有些曲线 上的经典问题采用这种形式表达:一个例子是最速降线 ,在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。
变分法的关键定理是欧拉-拉格朗日方程 。它对应于泛函的临界点 。在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值(或者都不是)。
变分法在理论物理 中非常重要:在拉格朗日力学 中,以及在最小作用量原理 在量子力学 的应用中。变分法提供了有限元方法 的数学基础,它是求解边界值问题 的强力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有,黎曼 在调和函数 中使用狄利克雷原理 。
同样的材料可以出现在不同的标题中,例如希尔伯特空间 技术,莫尔斯理论 ,或者辛几何 。变分 一词用于所有极值泛函问题。微分几何 中的测地线 的研究是很显然的变分性质的领域。极小曲面 (肥皂泡 )上也有很多研究工作,称为普拉托问题 。
变分法可能是从约翰·伯努利 (1696)提出最速曲线 (brachistochrone curve)问题开始出现的。[ 1] 它立即引起了雅各布·伯努利 和洛必达 (Marquis de l'Hôpital)的注意。但欧拉 首先详尽的阐述了这个问题。他的贡献始于1733年,他的《变分原理》(Elementa Calculi Variationum)寄予了这门科学这个名字。欧拉 对这个理论的贡献非常大。
勒让德 (1786)确定了一种方法,但在对极大和极小的区别不完全令人满意。牛顿 和莱布尼茨 也是在早期关注这一学科,对于这两者的区别Vincenzo Brunacci(1810)、高斯 (1829)、泊松 (1831)、Mikhail Ostrogradsky(1834)、和雅可比 (1837)都曾做出过贡献。Sarrus(1842)的由柯西 (1844)浓缩和修改的是一个重要的具有一般性的成就。Strauch(1849)、Jellett(1850)、Otto Hesse(1857)、Alfred Clebsch(1858)、和Carll(1885)写了一些其他有价值的论文和研究报告,但可能那个世纪最重要的成果是Weierstrass所取得的。他关于这个理论的著名教材是划时代的,并且他可能是第一个将变分法置于一个稳固而不容置疑的基础上的。1900年希尔伯特 发表的23个问题中的第20和23个问题促进了其更深远的发展。
在20世纪希尔伯特 、埃米·诺特 、列奥尼达·托内利 、昂利·勒贝格 和雅克·阿达马 等人做出重要贡献。Marston Morse将变分法应用在莫尔斯理论 中。Lev Pontryagin、Ralph Rockafellar和Clarke广义变分法最优控制理论 发展了新的数学工具。
在理想情形下,一函数的极大值及极小值会出现在其导数 为
0
{\displaystyle 0}
的地方。同样地,求解变分问题时也可以先求解相关的欧拉-拉格朗日方程 。以下以寻找连接平面上两点
(
x
1
,
y
1
)
{\displaystyle (x_{1},y_{1})}
和
(
x
2
,
y
2
)
{\displaystyle (x_{2},y_{2})}
最短曲线的例子,说明求解的过程。曲线的长度为
A
[
f
]
=
∫
x
1
x
2
1
+
[
f
′
(
x
)
]
2
d
x
{\displaystyle A[f]=\int _{x_{1}}^{x_{2}}{\sqrt {1+[f'(x)]^{2}}}\,dx}
其中
f
′
(
x
)
=
d
f
d
x
,
{\displaystyle f'(x)={\frac {df}{dx}},\,}
f
(
x
1
)
=
y
1
,
{\displaystyle f(x_{1})=y_{1},\,}
f
(
x
2
)
=
y
2
{\displaystyle f(x_{2})=y_{2}\,}
。
函数
f
{\displaystyle f}
至少需为一阶可微的函数。若
f
0
{\displaystyle f_{0}}
是一个局部最小值 ,而
f
1
{\displaystyle f_{1}}
是一个在端点
x
1
{\displaystyle x_{1}}
及
x
2
{\displaystyle x_{2}}
取值为零并且至少有一阶导数的函数,则可得到以下的式子
A
[
f
0
]
≤
A
[
f
0
+
ϵ
f
1
]
{\displaystyle A[f_{0}]\leq A[f_{0}+\epsilon f_{1}]}
其中
ϵ
{\displaystyle \epsilon }
为任意接近
0
{\displaystyle 0}
的数字。
因此
A
[
f
0
+
ϵ
f
1
]
{\displaystyle A[f_{0}+\epsilon f_{1}]}
对
ϵ
{\displaystyle \epsilon }
的导数(A的一阶导数 )在
ϵ
=
0
{\displaystyle \epsilon =0}
时必为
0
{\displaystyle 0}
:
d
d
ϵ
∫
x
1
x
2
1
+
[
f
0
′
(
x
)
+
ϵ
f
1
′
(
x
)
]
2
d
x
|
ϵ
=
0
=
∫
x
1
x
2
(
f
0
′
(
x
)
+
ϵ
f
1
′
(
x
)
)
f
1
′
(
x
)
1
+
[
f
0
′
(
x
)
+
ϵ
f
1
′
(
x
)
]
2
|
ϵ
=
0
d
x
=
∫
x
1
x
2
f
0
′
(
x
)
f
1
′
(
x
)
1
+
[
f
0
′
(
x
)
]
2
d
x
=
0
{\displaystyle {\frac {d}{d\epsilon }}\int _{x_{1}}^{x_{2}}\left.{\sqrt {1+[f_{0}'(x)+\epsilon f_{1}'(x)]^{2}}}dx\right|_{\epsilon =0}=\int _{x_{1}}^{x_{2}}\left.{\frac {(f_{0}'(x)+\epsilon f_{1}'(x))f_{1}'(x)}{\sqrt {1+[f_{0}'(x)+\epsilon f_{1}'(x)]^{2}}}}\right|_{\epsilon =0}dx=\int _{x_{1}}^{x_{2}}{\frac {f_{0}'(x)f_{1}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\,dx=0}
此条件可视为在可微分函数的空间中,
A
[
f
0
]
{\displaystyle A[f_{0}]}
在各方向的导数均为
0
{\displaystyle 0}
。若假设
f
0
{\displaystyle f_{0}}
二阶可微(或至少弱微分 存在),则利用分部积分法 可得
∫
x
1
x
2
f
1
(
x
)
d
d
x
[
f
0
′
(
x
)
1
+
[
f
0
′
(
x
)
]
2
]
d
x
=
0
,
{\displaystyle \int _{x_{1}}^{x_{2}}f_{1}(x){\frac {d}{dx}}\left[{\frac {f_{0}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\right]\,dx=0,}
其中
f
1
{\displaystyle f_{1}}
为在两端点皆为0的任意二阶可微函数。这是变分法基本引理 的一个特例:
I
=
∫
x
1
x
2
f
1
(
x
)
H
(
x
)
d
x
=
0
{\displaystyle I=\int _{x_{1}}^{x_{2}}f_{1}(x)H(x)dx=0}
,
其中
f
1
{\displaystyle f_{1}}
为在两端点皆为
0
{\displaystyle 0}
的任意可微函数。
若存在
x
=
x
^
{\displaystyle x={\hat {x}}}
使
H
(
x
)
>
0
{\displaystyle H(x)>0}
,则在
x
^
{\displaystyle {\hat {x}}}
周围有一区间的H也是正值。可以选择
f
1
{\displaystyle f_{1}}
在此区间外为
0
{\displaystyle 0}
,在此区间内为非负值,因此
I
>
0
{\displaystyle I>0}
,和前提不合。若存在
x
=
x
^
{\displaystyle x={\hat {x}}}
使
H
(
x
)
<
0
{\displaystyle H(x)<0}
,也可证得类似的结果。因此可得到以下的结论:
d
d
x
[
f
0
′
(
x
)
1
+
[
f
0
′
(
x
)
]
2
]
=
0
{\displaystyle {\frac {d}{dx}}\left[{\frac {f_{0}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\right]=0}
,
由结论可推得下式:
d
2
f
0
d
x
2
=
0
{\displaystyle {\frac {d^{2}f_{0}}{dx^{2}}}=0}
,
因此两点间最短曲线为一直线。
在一般情形下,则需考虑以下的计算式
A
[
f
]
=
∫
x
1
x
2
L
(
x
,
f
,
f
′
)
d
x
{\displaystyle A[f]=\int _{x_{1}}^{x_{2}}L(x,f,f')dx}
,
其中f 需有二阶连续的导函数。在这种情形下,拉格朗日量L在极值
f
0
{\displaystyle f_{0}}
处满足欧拉-拉格朗日方程
−
d
d
x
∂
L
∂
f
′
+
∂
L
∂
f
=
0
{\displaystyle -{\frac {d}{dx}}{\frac {\partial L}{\partial f'}}+{\frac {\partial L}{\partial f}}=0}
,
不过在此处,欧拉-拉格朗日方程只是有极值的必要条件 ,并不是充分条件。
费马原理 指出:光会沿着两端点之间所需光程 最短的路径前进。假设
y
=
f
(
x
)
{\displaystyle y=f(x)}
为光的路径,则光程可以下式表示:
A
[
f
]
=
∫
x
=
x
0
x
1
n
(
x
,
f
(
x
)
)
1
+
f
′
(
x
)
2
d
x
{\displaystyle A[f]=\int _{x=x_{0}}^{x_{1}}n(x,f(x)){\sqrt {1+f'(x)^{2}}}dx}
,
其中折射率
n
(
x
,
y
)
{\displaystyle n(x,y)}
依材料特性而定。
若选择
f
(
x
)
=
f
0
(
x
)
+
ϵ
f
1
(
x
)
{\displaystyle f(x)=f_{0}(x)+\epsilon f_{1}(x)}
,则
A
{\displaystyle A}
的一阶导数(
A
{\displaystyle A}
对
ϵ
{\displaystyle \epsilon }
的微分)为:
δ
A
[
f
0
,
f
1
]
=
∫
x
=
x
0
x
1
[
n
(
x
,
f
0
)
f
0
′
(
x
)
f
1
′
(
x
)
1
+
f
0
′
(
x
)
2
+
n
y
(
x
,
f
0
)
f
1
1
+
f
0
′
(
x
)
2
]
d
x
{\displaystyle \delta A[f_{0},f_{1}]=\int _{x=x_{0}}^{x_{1}}\left[{\frac {n(x,f_{0})f_{0}'(x)f_{1}'(x)}{\sqrt {1+f_{0}'(x)^{2}}}}+n_{y}(x,f_{0})f_{1}{\sqrt {1+f_{0}'(x)^{2}}}\right]dx}
,
将括号中的第一项用分部积分处理,可得欧拉-拉格朗日方程
−
d
d
x
[
n
(
x
,
f
0
)
f
0
′
1
+
f
0
′
2
]
+
n
y
(
x
,
f
0
)
1
+
f
0
′
(
x
)
2
=
0
{\displaystyle -{\frac {d}{dx}}\left[{\frac {n(x,f_{0})f_{0}'}{\sqrt {1+f_{0}'^{2}}}}\right]+n_{y}(x,f_{0}){\sqrt {1+f_{0}'(x)^{2}}}=0}
。
光线的路径可由上述的积分式而得。
当光进入或离开透镜面时,折射率会有不连续的变化。考虑
n
(
x
,
y
)
=
n
−
if
x
<
0
{\displaystyle n(x,y)=n_{-}\quad {\hbox{if}}\quad x<0}
,
n
(
x
,
y
)
=
n
+
if
x
>
0
{\displaystyle n(x,y)=n_{+}\quad {\hbox{if}}\quad x>0}
,
其中
n
−
{\displaystyle n_{-}}
和
n
+
{\displaystyle n_{+}}
是常数。在x <0或x >0的区域,欧拉-拉格朗日方程均和以上描述的相同。因为折射率在二个区域均为定值,在二个区域光都以直线前进。而在x =0的位置,f 必须连续,不过f' 可以不连续。在上述二个区域用分部积分的方式解欧拉-拉格朗日方程,则其变分量为
δ
A
[
f
0
,
f
1
]
=
f
1
(
0
)
[
n
−
f
0
′
(
0
−
)
1
+
f
0
′
(
0
−
)
2
−
n
+
f
0
′
(
0
+
)
1
+
f
0
′
(
0
+
)
2
]
{\displaystyle \delta A[f_{0},f_{1}]=f_{1}(0)\left[n_{-}{\frac {f_{0}'(0_{-})}{\sqrt {1+f_{0}'(0_{-})^{2}}}}-n_{+}{\frac {f_{0}'(0_{+})}{\sqrt {1+f_{0}'(0_{+})^{2}}}}\right]}
。
和
n
−
{\displaystyle n_{-}}
相乘的系数是入射角的正弦值,和
n
+
{\displaystyle n_{+}}
相乘的系数则是折射角的正弦值。若依照斯涅尔定律 ,上述二项的乘积相等,因此上述的变分量为0。因此斯涅尔定律所得的路径也就是要求光程一阶变分量为0的路径。
费马原理可以用向量的形式表示:令
X
=
(
x
1
,
x
2
,
x
3
)
{\displaystyle X=(x_{1},x_{2},x_{3})}
,而t 为其参数,
X
(
t
)
{\displaystyle X(t)}
是曲线C 参数化的表示,而令
X
˙
(
t
)
{\displaystyle {\dot {X}}(t)}
为其法线向量。因此在曲线上的光程长为
A
[
C
]
=
∫
t
=
t
0
t
1
n
(
X
)
X
˙
⋅
X
˙
d
t
{\displaystyle A[C]=\int _{t=t_{0}}^{t_{1}}n(X){\sqrt {{\dot {X}}\cdot {\dot {X}}}}dt}
。
上述积分和t无关,因此也和C 的参数表示方式无关。使曲线最短的欧拉-拉格朗日方程有以下的对称形式
d
d
t
P
=
X
˙
⋅
X
˙
∇
n
{\displaystyle {\frac {d}{dt}}P={\sqrt {{\dot {X}}\cdot {\dot {X}}}}\nabla n}
,
其中
P
=
n
(
X
)
X
˙
X
˙
⋅
X
˙
{\displaystyle P={\frac {n(X){\dot {X}}}{\sqrt {{\dot {X}}\cdot {\dot {X}}}}}}
。
依P的定义可得下式
P
⋅
P
=
n
(
X
)
2
{\displaystyle P\cdot P=n(X)^{2}}
。
因此上述积分可改为下式
A
[
C
]
=
∫
t
=
t
0
t
1
P
⋅
X
˙
d
t
{\displaystyle A[C]=\int _{t=t_{0}}^{t_{1}}P\cdot {\dot {X}}\,dt}
。
依照上式,若可以找到一个函数ψ,其梯度为P ,则以上的积分A 就可以由在积分端点上ψ的差求得。以上求解曲线使积分量不变的问题就和ψ的level surface有关。为了要找到满足此条件的函数ψ,需要对控制光线传动的波动方程式进行进一步的研究。
最优控制 的理论是变分法的一个推广。
^ Gelfand, I. M. ; Fomin, S. V. Silverman, Richard A. , 编. Calculus of variations Unabridged repr. Mineola, N.Y.: Dover Publications. 2000: 3 [2013-05-22 ] . ISBN 978-0486414485 . (原始内容存档 于2019-05-03).
Fomin, S.V. and Gelfand, I.M. : Calculus of Variations, Dover Publ., 2000
Lebedev, L.P. and Cloud, M.J.: The Calculus of Variations and Functional Analysis with Optimal Control and Applications in Mechanics, World Scientific, 2003, pages 1-98
Charles Fox: An Introduction to the Calculus of Variations, Dover Publ., 1987
Forsyth, A.R.: Calculus of Variations, Dover, 1960
Sagan, Hans: Introduction to the Calculus of Variations, Dover, 1992
Weinstock, Robert: Calculus of Variations with Applications to Physics and Engineering, Dover, 1974
Clegg, J.C.: Calculus of Variations, Interscience Publishers Inc., 1968
Elsgolc, L.E.: Calculus of Variations, Pergamon Press Ltd., 1962