변분법 (變分法, 영어 : calculus of variations )이란 미적분학 의 한 분야로, 일반 미적분학 과는 달리 범함수 를 다룬다. 이런 미적분학은 알려지지 않은 함수와 이 함수의 도함수를 다루는데, 주로, 어떠한 값을 최대화 하거나, 최소화하는 함수 모양이 어떻게 되는가를 다룬다.
변분법은 범함수의 극댓값, 극솟값을 연구하는데, 이를 합쳐서 정류값 이라 한다. 함수 가 변수 에 의존하듯이, 범함수는 함수 에 의존하므로 흔히 함수의 함수로 설명한다. 범함수는 정의역의 원소인 y {\displaystyle y} 에 대해 정류값을 갖는다. 범함수 J [ y ] {\displaystyle J[y]} 가 함수 f {\displaystyle f} 에서 정류값을 갖는다는 것은 Δ J = J [ y ] − J [ f ] {\displaystyle \Delta J=J[y]-J[f]} 이 f {\displaystyle f} 의 미소근방에서 같은 부호 를 갖는다는 것이다. 함수 f {\displaystyle f} 은 ‘’정류‘’함수 또는 정류점이라 한다. 정류값 J [ f ] {\displaystyle J[f]} 은 f {\displaystyle f} 의 미소근방에서 Δ J ≤ 0 {\displaystyle \Delta J\leq 0} 이면 극댓값이라 하고 Δ J ≥ 0 {\displaystyle \Delta J\geq 0} 이면 극솟값이라 한다.
오일러-라그랑주 방정식은 함수 q {\displaystyle q} 의 함수인 범함수 S {\displaystyle S} 를 최소나 최대로 하는 함수 q ( t ) {\displaystyle q\left(t\right)} 를 찾기 위한 것이다. 여기서 S {\displaystyle S} 는
S ( q ) = ∫ a b L ( t , q ( t ) , q ′ ( t ) ) d t {\displaystyle \displaystyle S(q)=\int _{a}^{b}L(t,q(t),q'(t))\,\mathrm {d} t} 이다. 여기서:
q {\displaystyle q} 는 구하고자 하는 함수이며, 다음과 같은 성질을 만족한다: q : [ a , b ] ⊂ R → X t ↦ x = q ( t ) {\displaystyle {\begin{aligned}q\colon [a,b]\subset \mathbb {R} &\to X\\t&\mapsto x=q(t)\end{aligned}}} 여기서 q {\displaystyle q} 는 미분 가능한 함수고, q ( a ) = x a , q ( b ) = x b {\displaystyle q\left(a\right)=x_{a},q\left(b\right)=x_{b}} 로 정해져 있다. q ′ {\displaystyle q'} 는 q {\displaystyle q} 를 미분한 함수이다. 함수 f {\displaystyle f} 가, 경계값 조건 f ( a ) = c , f ( b ) = d {\displaystyle f\left(a\right)=c,f\left(b\right)=d} 를 만족하고, 다음과 같이 주어지는 범함수 J {\displaystyle J} 를 최대 또는 최소로 만든다고 하자.
J [ f ] = ∫ a b F ( x , f ( x ) , f ′ ( x ) ) d x . {\displaystyle J[f]=\int _{a}^{b}F(x,f(x),f'(x))\,dx.\,\!} 여기서 F {\displaystyle F} 가 연속적인 편미분값을 가진다고 가정한다.
만일 f {\displaystyle f} 가 범함수 J {\displaystyle J} 를 최대, 최소로 한다고 하면, f {\displaystyle f} 에 매우 작은 변화를 가했을 때,
J {\displaystyle J} 의 값이 늘거나( f {\displaystyle f} 가 J {\displaystyle J} 를 최소화할때) , J {\displaystyle J} 의 값이 줄 수 있다( f {\displaystyle f} 가 J {\displaystyle J} 를 최대화할때).
여기서 f {\displaystyle f} 에 매우 작은 변화를 준 함수 g ϵ ( x ) = f ( x ) + ϵ η ( x ) {\displaystyle g_{\epsilon }\left(x\right)=f\left(x\right)+\epsilon \eta \left(x\right)} 를 도입하자. 여기서 η ( x ) {\displaystyle \eta \left(x\right)} 는 η ( a ) = η ( b ) = 0 {\displaystyle \eta \left(a\right)=\eta \left(b\right)=0} 를 만족하는 미분가능한 함수이다. 이제, y {\displaystyle y} 대신 g ϵ ( x ) {\displaystyle g_{\epsilon }(x)} 를 넣은 J {\displaystyle J} 는 다음과 같은 함수가 된다.
J ( g ϵ ( x ) ) = ∫ a b F ( x , g ϵ ( x ) , g ε ′ ( x ) ) d x . {\displaystyle J(g_{\epsilon }(x))=\int _{a}^{b}F(x,g_{\epsilon }(x),g_{\varepsilon }'(x))\,dx.\,\!} 이제 J {\displaystyle J} 를 ϵ {\displaystyle \epsilon } 에 대해 미분한 전미분 을 구하면,
d J d ε = ∫ a b d F d ϵ ( x , g ε ( x ) , g ε ′ ( x ) ) d x . {\displaystyle {\frac {\mathrm {d} J}{\mathrm {d} \varepsilon }}=\int _{a}^{b}{\frac {\mathrm {d} F}{\mathrm {d} \epsilon }}(x,g_{\varepsilon }(x),g_{\varepsilon }'(x))\,dx.} 전미분의 정의에서 다음과 같은 식이 나오며,
d F d ϵ = ∂ F ∂ x ∂ x ∂ ε + ∂ F ∂ g ε ∂ g ε ∂ ε + ∂ F ∂ g ε ′ ∂ g ε ′ ∂ ε = η ( x ) ∂ F ∂ g ε + η ′ ( x ) ∂ F ∂ g ε ′ . {\displaystyle {\frac {\mathrm {d} F}{\mathrm {d} \epsilon }}={\frac {\partial F}{\partial x}}{\frac {\partial x}{\partial \varepsilon }}+{\frac {\partial F}{\partial g_{\varepsilon }}}{\frac {\partial g_{\varepsilon }}{\partial \varepsilon }}+{\frac {\partial F}{\partial g'_{\varepsilon }}}{\frac {\partial g'_{\varepsilon }}{\partial \varepsilon }}=\eta (x){\frac {\partial F}{\partial g_{\varepsilon }}}+\eta '(x){\frac {\partial F}{\partial g_{\varepsilon }'}}.} 그러므로
d J d ϵ = ∫ a b [ η ( x ) ∂ F ∂ g ε + η ′ ( x ) ∂ F ∂ g ε ′ ] d x . {\displaystyle {\frac {\mathrm {d} J}{\mathrm {d} \epsilon }}=\int _{a}^{b}\left[\eta (x){\frac {\partial F}{\partial g_{\varepsilon }}}+\eta '(x){\frac {\partial F}{\partial g_{\varepsilon }'}}\,\right]\,dx.} 만약 ϵ = 0 {\displaystyle \epsilon =0} 이 되면 g ϵ = f {\displaystyle g_{\epsilon }=f} 이고, f {\displaystyle f} 가 J {\displaystyle J} 를 극값으로 만드는 함수이므로, J ′ ( 0 ) = J ′ ( g ϵ ) ϵ = 0 = J ′ ( f ) = 0 {\displaystyle J'(0)=J'(g_{\epsilon })_{\epsilon =0}=J'(f)=0} 이고,
J ′ ( 0 ) = ∫ a b [ η ( x ) ∂ F ∂ f + η ′ ( x ) ∂ F ∂ f ′ ] d x = 0. {\displaystyle J'(0)=\int _{a}^{b}\left[\eta (x){\frac {\partial F}{\partial f}}+\eta '(x){\frac {\partial F}{\partial f'}}\,\right]\,dx=0.} 좀 더 정리하기 위해, 두 번째 항에 부분적분 을 한다. 그러면 다음과 같은 식을 얻는다.
0 = ∫ a b [ ∂ F ∂ f − d d x ∂ F ∂ f ′ ] η ( x ) d x + [ η ( x ) ∂ F ∂ f ′ ] a b . {\displaystyle 0=\int _{a}^{b}\left[{\frac {\partial F}{\partial f}}-{\frac {d}{dx}}{\frac {\partial F}{\partial f'}}\right]\eta (x)\,dx+\left[\eta (x){\frac {\partial F}{\partial f'}}\right]_{a}^{b}.} η ( a ) = η ( b ) = 0 {\displaystyle \eta (a)=\eta (b)=0} 이므로,
0 = ∫ a b [ ∂ F ∂ f − d d x ∂ F ∂ f ′ ] η ( x ) d x . {\displaystyle 0=\int _{a}^{b}\left[{\frac {\partial F}{\partial f}}-{\frac {d}{dx}}{\frac {\partial F}{\partial f'}}\right]\eta (x)\,dx.\,\!} 변분법의 기본정리 를 적용하면, 다음과 같은 오일러-라그랑주 방정식을 얻는다. 0 = ∂ F ∂ f − d d x ∂ F ∂ f ′ . {\displaystyle 0={\frac {\partial F}{\partial f}}-{\frac {d}{dx}}{\frac {\partial F}{\partial f'}}.}
( ∵ {\displaystyle \because } (a,b)에서의 모든 컴팩트이면서 매끄러운 함수 η ( t ) {\displaystyle \eta (t)} 에 대해 ∂ F ∂ f − d d x ∂ F ∂ f ′ = 0 {\displaystyle {\frac {\partial F}{\partial f}}-{\frac {d}{dx}}{\frac {\partial F}{\partial f'}}=0} )
2차원 좌표평면상에 두 점 ( a , y a ) {\displaystyle \left(a,y_{a}\right)} 와 ( b , y b ) {\displaystyle \left(b,y_{b}\right)} 가 있다고 하자. 그렇다면 이 두 점을 연결하는 가장 짧은 곡선은 다음과 같은 범함수 L {\displaystyle L} 를 최소로 만드는 곡선이다.
L [ f ] = ∫ a b 1 + f ′ ( x ) 2 d x {\displaystyle L\left[f\right]=\int _{a}^{b}{\sqrt {1+f'\left(x\right)^{2}}}\,dx} 여기서 f {\displaystyle f} 의 경우 두 점을 지나야 하므로 f ( a ) = y a , f ( b ) = y b {\displaystyle f\left(a\right)=y_{a},f\left(b\right)=y_{b}} 를 만족하는 함수이다.
위에서 증명한 오일러-라그랑주 방정식을 적용하게 되면, 함수 f {\displaystyle f} 는
0 = − d d x ∂ ∂ f ′ 1 + f ′ ( x ) 2 {\displaystyle 0=-{\frac {d}{dx}}{\frac {\partial }{\partial f'}}{\sqrt {1+f'\left(x\right)^{2}}}} 를 만족하여야 한다. 식을 조금 정리해보면,
0 = d d x ∂ ∂ f ′ 1 + f ′ ( x ) 2 = d d x f ′ ( x ) 1 + f ′ ( x ) 2 {\displaystyle {\begin{matrix}0&=&{\frac {d}{dx}}{\frac {\partial }{\partial f'}}{\sqrt {1+f'\left(x\right)^{2}}}\\&=&{\frac {d}{dx}}{\frac {f'\left(x\right)}{\sqrt {1+f'\left(x\right)^{2}}}}\end{matrix}}} 평균값 정리 에 의해 미분해서 0이되는 함수는 그 구간에선 상수함수이므로,
f ′ ( x ) 1 + f ′ ( x ) 2 = k {\displaystyle {\frac {f'\left(x\right)}{\sqrt {1+f'\left(x\right)^{2}}}}=k} 가 되고, 좌변의 분모를 양변에 곱한 후 양변을 제곱하여 정리하면 f ′ ( x ) {\displaystyle f'\left(x\right)} 에 대한 이차방정식이므로 다음과 같은 해를 얻을 수 있다.
f ′ ( x ) = C {\displaystyle f'\left(x\right)=C} 따라서 두 점 사이의 곡선중 길이가 최소인 곡선은 f ( x ) = C x + D {\displaystyle f\left(x\right)=Cx+D} 를 만족하는 직선이다.
페르마의 원리 는 빛이 광로를 극소로 하는 경로를 따라 진행한다고 말한다. x 좌표가 경로 y = f ( x ) {\displaystyle y=f(x)} 의 매개변수일 때 광로는
A [ f ] = ∫ x = x 0 x 1 n ( x , f ( x ) ) 1 + f ′ ( x ) 2 d x , {\displaystyle A[f]=\int _{x=x_{0}}^{x_{1}}n(x,f(x)){\sqrt {1+f'(x)^{2}}}dx,\,} 으로 주어진다. 굴절률 n ( x , y ) {\displaystyle n(x,y)} 는 매질에 따라 달라진다.
f ( x ) = f 0 ( x ) + ε f 1 ( x ) {\displaystyle f(x)=f_{0}(x)+\varepsilon f_{1}(x)} 을 이용하면 A 의 일계 변분(A 의 ε에 대한 일계 도함수)는
δ A [ f 0 , f 1 ] = ∫ x 0 x 1 [ n ( x , f 0 ) f 0 ′ ( x ) f 1 ′ ( x ) 1 + f 0 ′ ( x ) 2 + n y ( x , f 0 ) f 1 1 + f 0 ′ ( x ) 2 ] d x . {\displaystyle \delta A[f_{0},f_{1}]=\int _{x_{0}}^{x_{1}}\left[{\frac {n(x,f_{0})f_{0}'(x)f_{1}'(x)}{\sqrt {1+f_{0}'(x)^{2}}}}+n_{y}(x,f_{0})f_{1}{\sqrt {1+f_{0}'(x)^{2}}}\right]dx.} 이다. 첫째항에 대해 부분적분을 하면 오일러-라그랑주 공식을 얻게된다.
− d d x [ n ( x , f 0 ) f 0 ′ 1 + f 0 ′ 2 ] + n y ( x , f 0 ) 1 + f 0 ′ ( x ) 2 = 0. {\displaystyle -{\frac {d}{dx}}\left[{\frac {n(x,f_{0})f_{0}'}{\sqrt {1+f_{0}'^{2}}}}\right]+n_{y}(x,f_{0}){\sqrt {1+f_{0}'(x)^{2}}}=0.\,} 빛의 경로는 위 식을 적분함으로써 결정된다. 이 유도는 라그랑주 광학, 해밀턴 광학에 이용된다.
빛이 렌즈를 들어가거나 나갈때 굴절률은 불연속이다.
n ( x , y ) = n − if x < 0 , {\displaystyle n(x,y)=n_{-}\quad {\hbox{if}}\quad x<0,\,} n ( x , y ) = n + if x > 0 , {\displaystyle n(x,y)=n_{+}\quad {\hbox{if}}\quad x>0,\,} 이라 하자. (여기서 n − {\displaystyle n_{-}} , n + {\displaystyle n_{+}} 은 상수이다.) 오일러 라그랑주 공식은 x <0 또는 x >0인 구간에서 성립하며 굴절률이 상수이므로 경로는 일직선이 된다. x =0,에서 f 가 연속이어야 하지만 f' 는 불연속일 수도 있다. 각 범위에서 오일러-라그랑주 방정식에서 부분적분을 하면 일계 변분은
δ A [ f 0 , f 1 ] = f 1 ( 0 ) [ n − f 0 ′ ( 0 − ) 1 + f 0 ′ ( 0 − ) 2 − n + f 0 ′ ( 0 + ) 1 + f 0 ′ ( 0 + ) 2 ] . {\displaystyle \delta A[f_{0},f_{1}]=f_{1}(0)\left[n_{-}{\frac {f_{0}'(0_{-})}{\sqrt {1+f_{0}'(0_{-})^{2}}}}-n_{+}{\frac {f_{0}'(0_{+})}{\sqrt {1+f_{0}'(0_{+})^{2}}}}\right].\,} 이 된다.
n − {\displaystyle n_{-}} 에 곱해진 항은 입사각의 sine값이며 n + {\displaystyle n_{+}} 에 곱해진 항은 굴절각의 sine이다. 굴절의 스넬의 법칙 은 이 두항이 같아야 한다는 것이다. 즉, 스넬의 법칙은 광로의 일계 변분이 사라지는 것과 동치이다.
고전역학에서 작용 S 는 라그랑지안 L 의 시간에 대한 적분으로 정의된다. 라그랑지안은 에너지의 차이이다.
L = T − U , {\displaystyle L=T-U,\,} T 는 역학계의 운동에너지 이고 U 는 퍼텐셜 에너지 이다. 해밀턴의 원리 (또는 작용 원리)는 보존계는 작용 적분
S = ∫ t = t 0 t 1 L ( x , x ˙ , t ) d t {\displaystyle S=\int _{t=t_{0}}^{t_{1}}L(x,{\dot {x}},t)dt\,} 이 경로 x(t) 에 대해 정류값을 갖도록 운동한다는 것이다. 이런 역학계의 오일러-라그랑주 방정식은 라그랑주 방정식이라 불린다.
d d t ∂ L ∂ x ˙ = ∂ L ∂ x , {\displaystyle {\frac {d}{dt}}{\frac {\partial L}{\partial {\dot {x}}}}={\frac {\partial L}{\partial x}},\,} 이는 뉴턴의 운동 방정식과 동치이다.
운동량 P 는 다음과 같이 정의된다.
p = ∂ L ∂ x ˙ . {\displaystyle p={\frac {\partial L}{\partial {\dot {x}}}}.\,} 예로
T = 1 2 m x ˙ 2 , {\displaystyle T={\frac {1}{2}}m{\dot {x}}^{2},\,} 이면
p = m x ˙ . {\displaystyle p=m{\dot {x}}.\,} 해밀턴 역학 은 x ˙ {\displaystyle {\dot {x}}} 대신 운동량이 도입되고, 라그랑지안 L 이 다음과 같이 정의된 해밀토니안 H 으로 대채될 때 유도된다.
H ( x , p , t ) = p x ˙ − L ( x , x ˙ , t ) . {\displaystyle H(x,p,t)=p\,{\dot {x}}-L(x,{\dot {x}},t).\,} 해밀토니안은 계의 역학적 에너지이다 : H = T + U .