变分法 是处理泛函 的数学 领域,和处理函数的普通微积分 相对。譬如,这样的泛函 可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值 函数:它们使得泛函取得极大或极小值。有些曲线 上的经典问题采用这种形式表达:一个例子是最速降线 ,在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。
变分法的关键定理是欧拉-拉格朗日方程 。它对应于泛函的临界点 。在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值(或者都不是)。
变分法在理论物理 中非常重要:在拉格朗日力学 中,以及在最小作用量原理 在量子力学 的应用中。变分法提供了有限元方法 的数学基础,它是求解边界值问题 的强力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有,黎曼 在调和函数 中使用狄利克雷原理 。
同样的材料可以出现在不同的标题中,例如希尔伯特空间 技术,莫尔斯理论 ,或者辛几何 。变分 一词用于所有极值泛函问题。微分几何 中的测地线 的研究是很显然的变分性质的领域。极小曲面 (肥皂泡 )上也有很多研究工作,称为普拉托问题 。
变分法可能是从约翰·伯努利 (1696)提出最速曲线 (brachistochrone curve)问题开始出现的。[ 1] 它立即引起了雅各布·伯努利 和洛必达 (Marquis de l'Hôpital)的注意。但欧拉 首先详尽的阐述了这个问题。他的贡献始于1733年,他的《变分原理》(Elementa Calculi Variationum)寄予了这门科学这个名字。欧拉 对这个理论的贡献非常大。
勒让德 (1786)确定了一种方法,但在对极大和极小的区别不完全令人满意。牛顿 和莱布尼茨 也是在早期关注这一学科,对于这两者的区别Vincenzo Brunacci(1810)、高斯 (1829)、泊松 (1831)、Mikhail Ostrogradsky(1834)、和雅可比 (1837)都曾做出过贡献。Sarrus(1842)的由柯西 (1844)浓缩和修改的是一个重要的具有一般性的成就。Strauch(1849)、Jellett(1850)、Otto Hesse(1857)、Alfred Clebsch(1858)、和Carll(1885)写了一些其他有价值的论文和研究报告,但可能那个世纪最重要的成果是Weierstrass所取得的。他关于这个理论的著名教材是划时代的,并且他可能是第一个将变分法置于一个稳固而不容置疑的基础上的。1900年希尔伯特 发表的23个问题中的第20和23个问题促进了其更深远的发展。
在20世纪希尔伯特 、埃米·诺特 、列奧尼達·托內利 、昂利·勒貝格 和雅克·阿达马 等人做出重要贡献。Marston Morse将变分法应用在莫尔斯理论 中。Lev Pontryagin、Ralph Rockafellar和Clarke广义变分法最优控制理论 发展了新的数学工具。
在理想情形下,一函數的极大值及极小值會出現在其導數 為
0
{\displaystyle 0}
的地方。同樣地,求解變分問題時也可以先求解相關的欧拉-拉格朗日方程 。以下以尋找連接平面上兩點
(
x
1
,
y
1
)
{\displaystyle (x_{1},y_{1})}
和
(
x
2
,
y
2
)
{\displaystyle (x_{2},y_{2})}
最短曲線的例子,說明求解的過程。曲線的長度為
A
[
f
]
=
∫
x
1
x
2
1
+
[
f
′
(
x
)
]
2
d
x
{\displaystyle A[f]=\int _{x_{1}}^{x_{2}}{\sqrt {1+[f'(x)]^{2}}}\,dx}
其中
f
′
(
x
)
=
d
f
d
x
,
{\displaystyle f'(x)={\frac {df}{dx}},\,}
f
(
x
1
)
=
y
1
,
{\displaystyle f(x_{1})=y_{1},\,}
f
(
x
2
)
=
y
2
{\displaystyle f(x_{2})=y_{2}\,}
。
函數
f
{\displaystyle f}
至少需為一階可微的函數。若
f
0
{\displaystyle f_{0}}
是一個局部最小值 ,而
f
1
{\displaystyle f_{1}}
是一個在端點
x
1
{\displaystyle x_{1}}
及
x
2
{\displaystyle x_{2}}
取值为零并且至少有一階導數的函數,則可得到以下的式子
A
[
f
0
]
≤
A
[
f
0
+
ϵ
f
1
]
{\displaystyle A[f_{0}]\leq A[f_{0}+\epsilon f_{1}]}
其中
ϵ
{\displaystyle \epsilon }
為任意接近
0
{\displaystyle 0}
的數字。
因此
A
[
f
0
+
ϵ
f
1
]
{\displaystyle A[f_{0}+\epsilon f_{1}]}
對
ϵ
{\displaystyle \epsilon }
的導數(A的一階導數 )在
ϵ
=
0
{\displaystyle \epsilon =0}
時必為
0
{\displaystyle 0}
:
d
d
ϵ
∫
x
1
x
2
1
+
[
f
0
′
(
x
)
+
ϵ
f
1
′
(
x
)
]
2
d
x
|
ϵ
=
0
=
∫
x
1
x
2
(
f
0
′
(
x
)
+
ϵ
f
1
′
(
x
)
)
f
1
′
(
x
)
1
+
[
f
0
′
(
x
)
+
ϵ
f
1
′
(
x
)
]
2
|
ϵ
=
0
d
x
=
∫
x
1
x
2
f
0
′
(
x
)
f
1
′
(
x
)
1
+
[
f
0
′
(
x
)
]
2
d
x
=
0
{\displaystyle {\frac {d}{d\epsilon }}\int _{x_{1}}^{x_{2}}\left.{\sqrt {1+[f_{0}'(x)+\epsilon f_{1}'(x)]^{2}}}dx\right|_{\epsilon =0}=\int _{x_{1}}^{x_{2}}\left.{\frac {(f_{0}'(x)+\epsilon f_{1}'(x))f_{1}'(x)}{\sqrt {1+[f_{0}'(x)+\epsilon f_{1}'(x)]^{2}}}}\right|_{\epsilon =0}dx=\int _{x_{1}}^{x_{2}}{\frac {f_{0}'(x)f_{1}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\,dx=0}
此條件可視為在可微分函數的空間中,
A
[
f
0
]
{\displaystyle A[f_{0}]}
在各方向的導數均為
0
{\displaystyle 0}
。若假設
f
0
{\displaystyle f_{0}}
二階可微(或至少弱微分 存在),則利用分部積分法 可得
∫
x
1
x
2
f
1
(
x
)
d
d
x
[
f
0
′
(
x
)
1
+
[
f
0
′
(
x
)
]
2
]
d
x
=
0
,
{\displaystyle \int _{x_{1}}^{x_{2}}f_{1}(x){\frac {d}{dx}}\left[{\frac {f_{0}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\right]\,dx=0,}
其中
f
1
{\displaystyle f_{1}}
為在兩端點皆為0的任意二階可微函數。這是變分法基本引理 的一個特例:
I
=
∫
x
1
x
2
f
1
(
x
)
H
(
x
)
d
x
=
0
{\displaystyle I=\int _{x_{1}}^{x_{2}}f_{1}(x)H(x)dx=0}
,
其中
f
1
{\displaystyle f_{1}}
為在兩端點皆為
0
{\displaystyle 0}
的任意可微函數。
若存在
x
=
x
^
{\displaystyle x={\hat {x}}}
使
H
(
x
)
>
0
{\displaystyle H(x)>0}
,則在
x
^
{\displaystyle {\hat {x}}}
周圍有一區間的H也是正值。可以選擇
f
1
{\displaystyle f_{1}}
在此區間外為
0
{\displaystyle 0}
,在此區間內為非負值,因此
I
>
0
{\displaystyle I>0}
,和前提不合。若存在
x
=
x
^
{\displaystyle x={\hat {x}}}
使
H
(
x
)
<
0
{\displaystyle H(x)<0}
,也可證得類似的結果。因此可得到以下的結論:
d
d
x
[
f
0
′
(
x
)
1
+
[
f
0
′
(
x
)
]
2
]
=
0
{\displaystyle {\frac {d}{dx}}\left[{\frac {f_{0}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\right]=0}
,
由結論可推得下式:
d
2
f
0
d
x
2
=
0
{\displaystyle {\frac {d^{2}f_{0}}{dx^{2}}}=0}
,
因此兩點間最短曲線為一直線。
在一般情形下,則需考慮以下的計算式
A
[
f
]
=
∫
x
1
x
2
L
(
x
,
f
,
f
′
)
d
x
{\displaystyle A[f]=\int _{x_{1}}^{x_{2}}L(x,f,f')dx}
,
其中f 需有二階連續的導函數。在這種情形下,拉格朗日量L在極值
f
0
{\displaystyle f_{0}}
处滿足欧拉-拉格朗日方程
−
d
d
x
∂
L
∂
f
′
+
∂
L
∂
f
=
0
{\displaystyle -{\frac {d}{dx}}{\frac {\partial L}{\partial f'}}+{\frac {\partial L}{\partial f}}=0}
,
不過在此處,欧拉-拉格朗日方程只是有極值的必要條件 ,並不是充分條件。
費馬原理 指出:光會沿着兩端點之間所需光程 最短的路徑前進。假設
y
=
f
(
x
)
{\displaystyle y=f(x)}
為光的路徑,則光程可以下式表示:
A
[
f
]
=
∫
x
=
x
0
x
1
n
(
x
,
f
(
x
)
)
1
+
f
′
(
x
)
2
d
x
{\displaystyle A[f]=\int _{x=x_{0}}^{x_{1}}n(x,f(x)){\sqrt {1+f'(x)^{2}}}dx}
,
其中折射率
n
(
x
,
y
)
{\displaystyle n(x,y)}
依材料特性而定。
若選擇
f
(
x
)
=
f
0
(
x
)
+
ϵ
f
1
(
x
)
{\displaystyle f(x)=f_{0}(x)+\epsilon f_{1}(x)}
,則
A
{\displaystyle A}
的一階導數(
A
{\displaystyle A}
對
ϵ
{\displaystyle \epsilon }
的微分)為:
δ
A
[
f
0
,
f
1
]
=
∫
x
=
x
0
x
1
[
n
(
x
,
f
0
)
f
0
′
(
x
)
f
1
′
(
x
)
1
+
f
0
′
(
x
)
2
+
n
y
(
x
,
f
0
)
f
1
1
+
f
0
′
(
x
)
2
]
d
x
{\displaystyle \delta A[f_{0},f_{1}]=\int _{x=x_{0}}^{x_{1}}\left[{\frac {n(x,f_{0})f_{0}'(x)f_{1}'(x)}{\sqrt {1+f_{0}'(x)^{2}}}}+n_{y}(x,f_{0})f_{1}{\sqrt {1+f_{0}'(x)^{2}}}\right]dx}
,
將括號中的第一項用分部積分處理,可得歐拉-拉格朗日方程
−
d
d
x
[
n
(
x
,
f
0
)
f
0
′
1
+
f
0
′
2
]
+
n
y
(
x
,
f
0
)
1
+
f
0
′
(
x
)
2
=
0
{\displaystyle -{\frac {d}{dx}}\left[{\frac {n(x,f_{0})f_{0}'}{\sqrt {1+f_{0}'^{2}}}}\right]+n_{y}(x,f_{0}){\sqrt {1+f_{0}'(x)^{2}}}=0}
。
光線的路徑可由上述的積分式而得。
當光進入或離開透鏡面時,折射率會有不連續的變化。考慮
n
(
x
,
y
)
=
n
−
if
x
<
0
{\displaystyle n(x,y)=n_{-}\quad {\hbox{if}}\quad x<0}
,
n
(
x
,
y
)
=
n
+
if
x
>
0
{\displaystyle n(x,y)=n_{+}\quad {\hbox{if}}\quad x>0}
,
其中
n
−
{\displaystyle n_{-}}
和
n
+
{\displaystyle n_{+}}
是常數。在x <0或x >0的區域,歐拉-拉格朗日方程均和以上描述的相同。因為折射率在二個區域均為定值,在二個區域光都以直線前進。而在x =0的位置,f 必須連續,不過f' 可以不連續。在上述二個區域用分部積分的方式解歐拉-拉格朗日方程,則其變分量為
δ
A
[
f
0
,
f
1
]
=
f
1
(
0
)
[
n
−
f
0
′
(
0
−
)
1
+
f
0
′
(
0
−
)
2
−
n
+
f
0
′
(
0
+
)
1
+
f
0
′
(
0
+
)
2
]
{\displaystyle \delta A[f_{0},f_{1}]=f_{1}(0)\left[n_{-}{\frac {f_{0}'(0_{-})}{\sqrt {1+f_{0}'(0_{-})^{2}}}}-n_{+}{\frac {f_{0}'(0_{+})}{\sqrt {1+f_{0}'(0_{+})^{2}}}}\right]}
。
和
n
−
{\displaystyle n_{-}}
相乘的係數是入射角的正弦值,和
n
+
{\displaystyle n_{+}}
相乘的係數則是折射角的正弦值。若依照斯涅爾定律 ,上述二項的乘積相等,因此上述的變分量為0。因此斯涅爾定律所得的路徑也就是要求光程一階變分量為0的路徑。
費馬原理可以用向量的形式表示:令
X
=
(
x
1
,
x
2
,
x
3
)
{\displaystyle X=(x_{1},x_{2},x_{3})}
,而t 為其參數,
X
(
t
)
{\displaystyle X(t)}
是曲線C 參數化的表示,而令
X
˙
(
t
)
{\displaystyle {\dot {X}}(t)}
為其法線向量。因此在曲線上的光程長為
A
[
C
]
=
∫
t
=
t
0
t
1
n
(
X
)
X
˙
⋅
X
˙
d
t
{\displaystyle A[C]=\int _{t=t_{0}}^{t_{1}}n(X){\sqrt {{\dot {X}}\cdot {\dot {X}}}}dt}
。
上述積分和t無關,因此也和C 的參數表示方式無關。使曲線最短的歐拉-拉格朗日方程有以下的對稱形式
d
d
t
P
=
X
˙
⋅
X
˙
∇
n
{\displaystyle {\frac {d}{dt}}P={\sqrt {{\dot {X}}\cdot {\dot {X}}}}\nabla n}
,
其中
P
=
n
(
X
)
X
˙
X
˙
⋅
X
˙
{\displaystyle P={\frac {n(X){\dot {X}}}{\sqrt {{\dot {X}}\cdot {\dot {X}}}}}}
。
依P的定義可得下式
P
⋅
P
=
n
(
X
)
2
{\displaystyle P\cdot P=n(X)^{2}}
。
因此上述積分可改為下式
A
[
C
]
=
∫
t
=
t
0
t
1
P
⋅
X
˙
d
t
{\displaystyle A[C]=\int _{t=t_{0}}^{t_{1}}P\cdot {\dot {X}}\,dt}
。
依照上式,若可以找到一個函數ψ,其梯度为P ,則以上的積分A 就可以由在積分端點上ψ的差求得。以上求解曲線使積分量不變的問題就和ψ的level surface有關。為了要找到滿足此條件的函數ψ,需要對控制光線傳動的波動方程式進行進一步的研究。
最优控制 的理论是变分法的一个推广。
^ Gelfand, I. M. ; Fomin, S. V. Silverman, Richard A. , 编. Calculus of variations Unabridged repr. Mineola, N.Y.: Dover Publications. 2000: 3 [2013-05-22 ] . ISBN 978-0486414485 . (原始内容存档 于2019-05-03).
Fomin, S.V. and Gelfand, I.M. : Calculus of Variations, Dover Publ., 2000
Lebedev, L.P. and Cloud, M.J.: The Calculus of Variations and Functional Analysis with Optimal Control and Applications in Mechanics, World Scientific, 2003, pages 1-98
Charles Fox: An Introduction to the Calculus of Variations, Dover Publ., 1987
Forsyth, A.R.: Calculus of Variations, Dover, 1960
Sagan, Hans: Introduction to the Calculus of Variations, Dover, 1992
Weinstock, Robert: Calculus of Variations with Applications to Physics and Engineering, Dover, 1974
Clegg, J.C.: Calculus of Variations, Interscience Publishers Inc., 1968
Elsgolc, L.E.: Calculus of Variations, Pergamon Press Ltd., 1962