从最小作用量原理推导牛顿三大定律
引言
在物理学中,牛顿三大定律是描述经典力学中物体运动的基本定律。然而,这些定律并不是孤立存在的,它们可以从一个更为普遍的原理——最小作用量原理中推导出来。最小作用量原理是一个深刻而优雅的理论,它指出物理系统的演化路径是使作用量达到极小值的路径。
本文的结构如下:首先,我们将介绍拉格朗日量的概念,并通过简单的例子帮助理解。接着,我们将详细解释最小作用量原理,并通过光的传播和物体的抛物线运动等例子来说明其应用。然后,我们会介绍变分法,这是推导欧拉-拉格朗日方程的数学工具。最后,我们将利用欧拉-拉格朗日方程推导出牛顿的三大定律。
通过这种结构,我们希望展示出最小作用量原理如何统一地解释经典力学中的基本定律,并揭示出自然界中运动的深层次规律。
拉格朗日量的直观理解
在开始之前,让我们先理解什么是拉格朗日量(Lagrangian)。拉格朗日量可以简单理解为系统"动能"和"势能"的差值:
L = T − V L = T - V L=T−V
其中 T T T 是动能, V V V 是势能。
让我们通过几个简单的例子来理解:
- 自由落体
想象你从高处扔下一个球。这个球有:
- 动能 T = 1 2 m v 2 T = \frac{1}{2}mv^2 T=21mv2(由运动产生)
- 势能 V = m g h V = mgh V=mgh(由高度产生)
所以它的拉格朗日量是:
L = 1 2 m v 2 − m g h L = \frac{1}{2}mv^2 - mgh L=21mv2−mgh
- 弹簧振动
想象一个弹簧上挂着的小球:
- 动能 T = 1 2 m v 2 T = \frac{1}{2}mv^2 T=21mv2(小球运动产生)
- 势能 V = 1 2 k x 2 V = \frac{1}{2}kx^2 V=21kx2(弹簧压缩或拉伸产生)
它的拉格朗日量是:
L = 1 2 m v 2 − 1 2 k x 2 L = \frac{1}{2}mv^2 - \frac{1}{2}kx^2 L=21mv2−21kx2
- 单摆
想象一个挂在绳子上摆动的小球:
- 动能 T = 1 2 m v 2 T = \frac{1}{2}mv^2 T=21mv2
- 势能 V = m g h = m g L ( 1 − cos θ ) V = mgh = mgL(1-\cos\theta) V=mgh=mgL(1−cosθ)(其中 L L L是绳长, θ \theta θ是摆角)
拉格朗日量为:
L = 1 2 m v 2 − m g L ( 1 − cos θ ) L = \frac{1}{2}mv^2 - mgL(1-\cos\theta) L=21mv2−mgL(1−cosθ)
拉格朗日量的物理意可以理解为系统的"活力":
- 动能代表系统的"运动活力"
- 势能代表系统的"储存活力"
- 它们的差值(拉格朗日量)描述了系统的总体状态
最小作用量原理简介
最小作用量原理是物理学中的一个重要概念,它告诉我们自然界中的物体总是沿着使某个量(称为“作用量”)最小的路径运动。这个原理可以帮助我们理解为什么物体会以某种方式运动。
作用量的定义
作用量 S S S 是一个物理量,它是拉格朗日量 L L L 在时间上的积分:
S = ∫ t 1 t 2 L d t S = \int_{t_1}^{t_2} L \, dt S=∫t1t2Ldt
其中, L L L 是拉格朗日量, t 1 t_1 t1 和 t 2 t_2 t2 分别是运动的起始时间和结束时间。
例子:光的最短路径
一个经典的例子是光的传播。光在两点之间传播时,总是选择最短的路径,这就是我们常说的“光走直线”。实际上,光选择的是使作用量最小的路径。
- 光在空气中传播:光在均匀介质中传播时,路径是一条直线,因为这条路径使作用量最小。
- 光在不同介质中传播:当光从空气进入水中时,它会发生折射。光的路径不再是直线,而是折射后的曲线。这是因为光在不同介质中传播时,速度不同,作用量的计算也不同。光选择的路径是使总作用量最小的路径。
例子:抛物线轨迹
想象一个物体在重力作用下从高处抛出。我们知道它的轨迹是一条抛物线。通过最小作用量原理,我们可以理解这条抛物线是物体选择的使作用量最小的路径。
- 动能和势能:物体的动能 T = 1 2 m v 2 T = \frac{1}{2}mv^2 T=21mv2,势能 V = m g h V = mgh V=mgh。
- 拉格朗日量: L = T − V = 1 2 m v 2 − m g h L = T - V = \frac{1}{2}mv^2 - mgh L=T−V=21mv2−mgh。
- 作用量: S = ∫ t 1 t 2 ( 1 2 m v 2 − m g h ) d t S = \int_{t_1}^{t_2} \left(\frac{1}{2}mv^2 - mgh\right) \, dt S=∫t1t2(21mv2−mgh)dt。
通过最小作用量原理,我们可以找到使得 S S S 最小的路径,这条路径就是物体的真实运动轨迹。
变分法基础
变分法是用来寻找某个量(通常是积分)达到极值的数学方法。在物理学中,我们用变分法来寻找使作用量 S S S 达到极值的路径。
变分法的基本思想
变分法的核心思想是:如果我们想要找到一个函数,使得某个积分(比如作用量)达到最小值,我们可以考虑对这个函数做微小的变化,然后观察积分的变化。
设想一条真实路径 x ( t ) x(t) x(t) 和一条微小偏离的路径 x ( t ) + δ x ( t ) x(t) + \delta x(t) x(t)+δx(t),其中 δ x ( t ) \delta x(t) δx(t) 是微小的变化。在路径的起点和终点,变化为零:
δ x ( t 1 ) = δ x ( t 2 ) = 0 \delta x(t_1) = \delta x(t_2) = 0 δx(t1)=δx(t2)=0
我们希望找到这样的路径,使得作用量 S S S 的变化 δ S \delta S δS 为零:
δ S = δ ∫ t 1 t 2 L ( x , x ˙ , t ) d t = 0 \delta S = \delta \int_{t_1}^{t_2} L(x, \dot{x}, t) \, dt = 0 δS=δ∫t1t2L(x,x˙,t)dt=0
例子:寻找最短路径
假设你在一个平面上有两点 A A A 和 B B B,你想找到从 A A A 到 B B B 的最短路径。直觉告诉我们,这条路径应该是一条直线。变分法就是用来证明这条直线确实是最短路径的方法。
- 路径的表示:假设路径用函数 y ( x ) y(x) y(x) 表示。
- 路径长度的积分:路径的长度可以表示为积分 ∫ x 1 x 2 1 + ( y ′ ) 2 d x \int_{x_1}^{x_2} \sqrt{1 + (y')^2} \, dx ∫x1x21+(y′)2dx,其中 y ′ = d y d x y' = \frac{dy}{dx} y′=dxdy。
- 变分法应用:通过对 y ( x ) y(x) y(x) 做微小变化 y ( x ) + δ y ( x ) y(x) + \delta y(x) y(x)+δy(x),并要求路径长度的变化为零,我们可以找到最短路径。
欧拉-拉格朗日方程的推导
考虑作用量的变分:
δ S = δ ∫ t 1 t 2 L ( x , x ˙ , t ) d t = 0 \delta S = \delta \int_{t_1}^{t_2} L(x, \dot{x}, t) \, dt = 0 δS=δ∫t1t2L(x,x˙,t)dt=0
展开变分:
δ S = ∫ t 1 t 2 ( ∂ L ∂ x δ x + ∂ L ∂ x ˙ δ x ˙ ) d t = 0 \delta S = \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial x} \delta x + \frac{\partial L}{\partial \dot{x}} \delta \dot{x} \right) dt = 0 δS=∫t1t2(∂x∂Lδx+∂x˙∂Lδx˙)dt=0
注意到 δ x ˙ = d d t ( δ x ) \delta \dot{x} = \frac{d}{dt}(\delta x) δx˙=dtd(δx),对第二项进行分部积分:
∫ t 1 t 2 ∂ L ∂ x ˙ δ x ˙ d t = ∂ L ∂ x ˙ δ x ∣ t 1 t 2 − ∫ t 1 t 2 d d t ( ∂ L ∂ x ˙ ) δ x d t \int_{t_1}^{t_2} \frac{\partial L}{\partial \dot{x}} \delta \dot{x} \, dt = \left. \frac{\partial L}{\partial \dot{x}} \delta x \right|_{t_1}^{t_2} - \int_{t_1}^{t_2} \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{x}}\right) \delta x \, dt ∫t1t2∂x˙∂Lδx˙dt=∂x˙∂Lδx t1t2−∫t1t2dtd(∂x˙∂L)δxdt
由于端点处 δ x = 0 \delta x = 0 δx=0,第一项消失。代回原式:
δ S = ∫ t 1 t 2 [ ∂ L ∂ x − d d t ( ∂ L ∂ x ˙ ) ] δ x d t = 0 \delta S = \int_{t_1}^{t_2} \left[ \frac{\partial L}{\partial x} - \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{x}}\right) \right] \delta x \, dt = 0 δS=∫t1t2[∂x∂L−dtd(∂x˙∂L)]δxdt=0
由于 δ x \delta x δx 是任意的,根据变分法的基本引理,方括号中的式子必须为零:
d d t ( ∂ L ∂ x ˙ ) − ∂ L ∂ x = 0 \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{x}}\right) - \frac{\partial L}{\partial x} = 0 dtd(∂x˙∂L)−∂x∂L=0
这就是著名的欧拉-拉格朗日方程。它是最小作用量原理的数学表达,也是我们推导牛顿运动定律的基础。
牛顿第一定律推导
牛顿第一定律(惯性定律)指出,如果一个物体不受外力作用,它将保持静止状态或匀速直线运动状态。我们可以利用前面推导的欧拉-拉格朗日方程来证明这一结论。
假设一个物体的拉格朗日量 L L L 仅依赖于位置 x x x 和速度 x ˙ \dot{x} x˙,且不受外力作用:
L = 1 2 m x ˙ 2 L = \frac{1}{2} m \dot{x}^2 L=21mx˙2
其中, m m m 是物体的质量。将此拉格朗日量代入前面推导的欧拉-拉格朗日方程:
d d t ( ∂ L ∂ x ˙ ) − ∂ L ∂ x = 0 \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{x}}\right) - \frac{\partial L}{\partial x} = 0 dtd(∂x˙∂L)−∂x∂L=0
得到:
d d t ( m x ˙ ) = 0 \frac{d}{dt} (m \dot{x}) = 0 dtd(mx˙)=0
这意味着 m x ˙ m \dot{x} mx˙ 是一个常数,即物体的速度 x ˙ \dot{x} x˙ 保持不变。因此,如果物体不受外力作用,它将保持静止状态或匀速直线运动状态,这就是牛顿第一定律。
牛顿第二定律推导
牛顿第二定律(加速度定律)指出,物体的加速度与所受外力成正比,且加速度的方向与外力的方向相同。同样可以利用欧拉-拉格朗日方程来推导。
考虑包含势能的拉格朗日量:
L = 1 2 m x ˙ 2 − V ( x ) L = \frac{1}{2} m \dot{x}^2 - V(x) L=21mx˙2−V(x)
其中, V ( x ) V(x) V(x) 是势能,满足 F = − d V d x F = -\frac{dV}{dx} F=−dxdV。将此拉格朗日量代入欧拉-拉格朗日方程:
d d t ( ∂ L ∂ x ˙ ) − ∂ L ∂ x = 0 \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{x}}\right) - \frac{\partial L}{\partial x} = 0 dtd(∂x˙∂L)−∂x∂L=0
得到:
d d t ( m x ˙ ) + d V d x = 0 \frac{d}{dt} (m \dot{x}) + \frac{dV}{dx} = 0 dtd(mx˙)+dxdV=0
由于 F = − d V d x F = -\frac{dV}{dx} F=−dxdV,可以得到牛顿第二定律:
m x ¨ = F m \ddot{x} = F mx¨=F
牛顿第三定律推导
牛顿第三定律(作用与反作用定律)同样可以通过欧拉-拉格朗日方程推导。考虑两个相互作用物体的拉格朗日量:
L = 1 2 m 1 x ˙ 1 2 + 1 2 m 2 x ˙ 2 2 − V ( x 1 , x 2 ) L = \frac{1}{2} m_1 \dot{x}_1^2 + \frac{1}{2} m_2 \dot{x}_2^2 - V(x_1, x_2) L=21m1x˙12+21m2x˙22−V(x1,x2)
对两个坐标分别应用欧拉-拉格朗日方程:
d d t ( ∂ L ∂ x ˙ i ) − ∂ L ∂ x i = 0 , i = 1 , 2 \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{x}_i}\right) - \frac{\partial L}{\partial x_i} = 0, \quad i = 1,2 dtd(∂x˙i∂L)−∂xi∂L=0,i=1,2
得到:
m 1 x ¨ 1 = − ∂ V ∂ x 1 = F 12 m_1 \ddot{x}_1 = -\frac{\partial V}{\partial x_1} = F_{12} m1x¨1=−∂x1∂V=F12
m 2 x ¨ 2 = − ∂ V ∂ x 2 = F 21 m_2 \ddot{x}_2 = -\frac{\partial V}{\partial x_2} = F_{21} m2x¨2=−∂x2∂V=F21
由于势能 V ( x 1 , x 2 ) V(x_1, x_2) V(x1,x2) 的对称性,可以证明 F 12 = − F 21 F_{12} = -F_{21} F12=−F21,这就是牛顿第三定律。
总结与思考
通过本文的推导,我们展示了如何从最小作用量原理出发,利用拉格朗日量和变分法,推导出经典力学中牛顿的三大定律。这一过程不仅揭示了牛顿定律背后的深层次原理,也展示了物理学中不同理论之间的内在联系。
最小作用量原理作为一个普遍的物理原理,不仅适用于经典力学,还在量子力学、相对论和场论中发挥着重要作用。它为我们提供了一种统一的视角来理解自然界的规律。
思考1:如何寻找作用量的拉格朗日量?
思考2:最小作用量原理和哈密顿原理的关系?
思考3:最小作用量原理和哈密顿原理的局限性?