梯度

多元导数的泛化

向量微积分中,梯度(英语:gradient)是一种关于多元导数的概括[1]。平常的一元(单变量)函数的导数是标量值函数,而多元函数的梯度是向量值函数多元可微函数在点上的梯度,是以上的偏导数为分量的向量[2]

上面两个图中,标量场的值用灰度表示,越暗表示越大的数值,而其相应的梯度用蓝色箭头表示。

就像一元函数的导数表示这个函数图形切线斜率[3],如果多元函数在点上的梯度不是零向量,则它的方向是这个函数在上最大增长的方向、而它的是在这个方向上的增长率[4]

梯度向量中的幅值和方向是与坐标的选择无关的独立量[5]

欧几里德空间或更一般的流形之间的多元可微映射的向量值函数的梯度推广是雅可比矩阵[6]。在巴拿赫空间之间的函数的进一步推广是弗雷歇导数

梯度的解释

编辑
 
将2D函数f(x, y) = xe−(x2 + y2)的梯度绘制为蓝色箭头,还绘制了这个函数的伪色图。

假设有一个房间,房间内所有点的温度由一个标量场 给出的,即点 的温度是 。假设温度不随时间改变。然后,在房间的每一点,该点的梯度将显示变热最快的方向。梯度的大小将表示在该方向上的温度变化率。

考虑一座高度在 点是 的山。 这一点的梯度是在该点坡度(或者说斜度)最陡的方向。梯度的大小告诉我们坡度到底有多陡。

梯度也可以告诉我们一个数量在不是最快变化方向的其他方向的变化速度。再次考虑山坡的例子。可以有条直接上山的路其坡度是最大的,则其坡度是梯度的大小。也可以有一条和上坡方向成一个角度的路,例如投影在水平面上的夹角为60°。则,若最陡的坡度是40%,这条路的坡度小一点,是20%,也就是40%乘以60°的余弦。

这个现象可以如下数学的表示。山的高度函数 的梯度点积一个单位向量给出表面在该向量的方向上的斜率。这称为方向导数

定义 

编辑
 
将函数f(x,y) = −(cos2x + cos2y)2的梯度描绘为在底面上投影的向量场

标量函数  的梯度表示为:  ,其中  nabla)表示向量微分算子

函数  的梯度, , 为向量场且对任意单位向量 v 满足下列方程式:

 

直角坐标系

编辑

 在三维直角坐标系中表示为

 

i, j, k 为标准的单位向量,分别指向 x, y 跟 z 座标的方向。 (参看偏导数向量

虽然使用坐标表达,但结果是在正交变换下不变,从几何的观点来看,这是应该的。

举例来讲,函数 的梯度为:

 

圆柱坐标系

编辑

圆柱坐标系中,  的梯度为:[7]

 

ρ 是 P 点与 z-轴的垂直距离。 φ 是线 OP 在 xy-面的投影线与正 x-轴之间的夹角。 z直角坐标  等值。 eρ, eφ 跟 ez 为单位向量,指向座标的方向。

球坐标系

编辑

球坐标系中:

 

其中θ为极角,φ方位角。

实值函数相对于向量和矩阵的梯度

编辑

相对于n×1向量x的梯度算子记作 ,定义为[8]

 

对向量的梯度

编辑

以n×1实向量x为变元的实标量函数f(x)相对于x的梯度为一n×1列向量x,定义为

 

m维行向量函数 相对于n维实向量x的梯度为一n×m矩阵,定义为

 

对矩阵的梯度

编辑

标量函数 相对于m×n实矩阵A的梯度为一m×n矩阵,简称梯度矩阵,定义为

 

法则

编辑

以下法则适用于实标量函数对向量的梯度以及对矩阵的梯度。

  • 线性法则:若  分别是矩阵A的实标量函数,c1和c2为实常数,则
     
  • 乘积法则:若   分别是矩阵A的实标量函数,则
     
     
  • 商法则:若 ,则
     
  • 链式法则:若A为m×n矩阵,且  分别是以矩阵A和标量y为变元的实标量函数,则
     

流形上的梯度

编辑

一个黎曼流形 上的对于任意可微函数 的梯度 是一个向量场,使得对于每个向量  

 

其中 代表 上的内积(度量)而   在点 ,方向为 方向导数。换句话说,如果  附近的局部座标,在此座标下有 ,则 将成为:

 

函数的梯度和外微分相关,因为 ,实际上内积容许我们可以用一种标准的方式将1-形式 和向量场 建立联系。由 的定义, ,这样 的梯度可以"等同"于0-形式的外微分 ,这里"等同"意味着:两集合  之间有1对1的满射

由定义可算流形 的局部座标表达式为:

 

请注意这是流形上对黎曼度量  的公式,跟  里直角座标的公式不同。常常我们写时会省略求和 符号,不过为了避免混淆,在这里的公式还是加上去了。

参看

编辑

参考文献

编辑

引用

编辑
  1. ^ Beauregard & Fraleigh (1973,第84页)
  2. ^ Bachman (2007,第76页)
    Beauregard & Fraleigh (1973,第84页)
    Downing (2010,第316页)
    Harper (1976,第15页)
    Kreyszig (1972,第307页)
    McGraw-Hill (2007,第196页)
    Moise (1967,第683页)
    Protter & Morrey, Jr. (1970,第714页)
    Swokowski et al. (1994,第1038页)
  3. ^ Protter & Morrey, Jr. (1970,第21,88页)
  4. ^ Bachman (2007,第77页)
    Downing (2010,第316–317页)
    Kreyszig (1972,第309页)
    McGraw-Hill (2007,第196页)
    Moise (1967,第684页)
    Protter & Morrey, Jr. (1970,第715页)
    Swokowski et al. (1994,第1036,1038–1039页)
  5. ^ Kreyszig (1972,第308–309页)
    Stoker (1969,第292页)
  6. ^ Beauregard & Fraleigh (1973,第87,248页)
    Kreyszig (1972,第333,353,496页)
  7. ^ Schey 1992,第139–142页.
  8. ^ 张贤达 (2004,第258页)

来源

编辑
书籍