共轭梯度法可以看作是应用于二次函数最小化的共轭方向法的特例
-
在共轭方向上求最小化:
-
从最初的猜测 开始,以及相应的残差 , 并通过公式计算迭代和残差
-
其中, 为一系列相互共轭的方向,例如:
- ,对于任何
由于共轭方向法没有给出用于选择方向的公式,因此该方法具有误差
而共轭方向法也有多种方法分支,包括共轭梯度法和高斯消元法。
共轭梯度法可以看作Arnoldi/Lanczos迭代应用于求解线性方程组时的一个变种。
Arnoldi迭代从一个向量 开始,通过定义 ,其中
-
逐步建立Krylov子空间
-
的一组标准正交基 。
换言之,对于 , 由将 相对于 进行Gram-Schmidt正交化然后归一化得到。
写成矩阵形式,迭代过程可以表示为
-
其中
-
当应用于求解线性方程组时,Arnoldi迭代对应于初始解 的残量 开始迭代,在每一步迭代之后计算 和新的近似解 .
在余下的讨论中,我们假定 是对称正定矩阵。由于 的对称性, 上Hessenberg矩阵 变成对阵三对角矩阵。于是它可以被更明确地表示为
-
这使得迭代中的 有一个简短的三项递推式。Arnoldi迭代从而简化为Lanczos迭代。
由于 对称正定, 同样也对称正定。因此, 可以通过不选主元的LU分解分解为
-
其中 和 有简单的递推式:
-
改写 为
-
其中
-
此时需要观察到
-
实际上, 和 同样有简短的递推式:
-
通过这个形式,我们得到 的一个简单的递推式:
-
以上的递推关系立即导出比共轭梯度法稍微更复杂的直接Lanczos方法。
如果我们允许缩放 并通过常数因子补偿缩放的系数,我们可能可以得到以下形式的更简单的递推式:
-
作为简化的前提,我们现在推导 的正交性和 的共轭性,即对于 ,
-
各个残量之间满足正交性的原因是 实际上可由 乘上一个系数而得。这是因为对于 , ,对于 ,
-
要得到 的共轭性,只需证明 是对角矩阵:
-
是对称的下三角矩阵,因而必然是对角矩阵。
现在我们可以单纯由 的正交性和 的共轭性推导相对于缩放后的 的常数因子 和 。
由于 的正交性,必然有 。于是
-
类似地,由于 的共轭性,必然有 。于是
-
推导至此完成。