LQG控制(linear–quadratic–Gaussian control)的全名是线性二次高斯控制,是控制理论中的基础最优控制问题之一。此问题和存在加性高斯白噪声线性系统有关。此问题是要找到最佳的输出回授律,可以让二次费用函数的期望值最小化。其输出量测假设受到高斯噪声的影响,其初值也是高斯随机向量。

在“使用线性控制律”的最佳控制假设下,可以用completion-of-squares论述进行推导[1]。此控制律即为LQG控制器,就是卡尔曼滤波(线性二次状态估测器,LQE)和LQR控制器的结合。分离原理指出状态估测器和状态回授可以独立设计。LQG控制可以应用在线性时不变系统及线性时变系统,产生容易计算以及实现的线性动态回授控制器。LQG控制器本身是一个类似其受控系统的动态系统,两者有相同的维度。

根据分离原理,在一些范围较宽可能是非线性的控制器中,LQG控制器仍然是最佳的。也就是说“使用非线性控制架构不一定可以改善费用泛函的期望值”。这个版本的分离原理是随机控制的分离原理英语Separation principle in stochastic control(separation principle of stochastic control)提到就算过程及输出噪声源可能是非高斯,只要其系统动态是线性的,其最佳控制仍可以分离为最佳状态估测器(不再是卡尔曼滤波器)及LQR控制器[2][3]。LQR控制器也有用来控制扰动的非线性系统[4]

问题和解的数学描述 编辑

连续时间 编辑

考虑连续时间的线性动态系统

 
 

其中 是系统状态变量的向量, 是控制输入向量, 是输出量测值的向量,可用在回授上。系统受到加成性的高斯系统噪声 及加成性的高斯量测噪声 所影响。给定一系统,其目标是找到一控制输入 ,此控制输入在每个时间 下,和以往的量测量 有线性关系,而且此控制输入可以让以下的费用函数有最小值:

 
 

其中 期望值。最终时间(horizon) 可能是有限值或是无限值。若最终时间为无限,则费用函数的第一项 可以忽略,和问题无关。而为了要让费用函数为有限值,会定义费用函数为 

求解上述LQG问题的LQG控制器可以用以下方程表示:

 
 

矩阵 称为卡尔曼增益(Kalman gain),和第一个方程卡尔曼滤波有关。在时间 ,滤波器会根据过去量测及输入来产生状态 的估测值 。卡尔曼增益 是根据 、二个和白色高斯噪声有关密度矩阵  及最后的 来计算。这五个矩阵会透过以下的矩阵Riccati微分方程来决定卡尔曼增益:

 
 

假设其解 ,则卡尔曼增益等于

 

矩阵 称为回授增益(feedback gain)矩阵,是由  矩阵,透过以下的矩阵Riccati微分方程来决定

 
 

假设其解 ,回授增益等于

 

观察上述二个矩阵Riccati微分方程,第一个沿时间从前往后算,而第二个是沿时间从后往前算,这称为“对偶性”。第一个矩阵Riccati微分方程解了线性平方估测问题(LQE),第二个矩阵Riccati微分方程解了LQR控制器问题。这二个问题是对偶的,合起来就解了线性平方高斯控制问题(LQG),因此LQG问题分成了LQE问题以及LQR问题,且可以独立求解,因此LQG问题是“可分离的”。

 和噪声密度矩阵 ,  不随时间变化 ,且 趋于无限大时,LQG控制器会变成非时变动态系统。此时上述二个矩阵Riccati微分方程会变成代数Riccati方程

离散时间 编辑

离散时间的LQG控制问题和连续时间下的问题相近,因此以下只关注其数学式。

离散时间的线性系统方程为

 
 

其中 是离散时间, 是离散时间高斯白噪声过程,其共变异数矩阵为 

要最小化的二次费用函数为

 
 

离散时间的LQG控制器为

 ,
 

卡尔曼增益等于

 

其中 是由以下依时间往前进的矩阵Riccati差分方程所决定:

 

回授增益矩阵为

 

\ 其中 是由以下时间从后往前算的矩阵Riccati差分方程所决定:

 

若问题中所有的矩阵都是非时变的,且时间长度 趋近无穷大,则离散时间的LQG控制器就是非时变的。此时矩阵Riccati差分方程可以用离散时间的代数Riccati方程取代。可以决定非时变的离散线性二次估测器,以及非时变的离散LQR控制器。为了让费用是有限值,会用 来代替 

降阶LQG问题 编辑

在传统LQG设置中,当系统维度很大时,实现LQG控制器会有困难。降阶LQG问题(reduced-order LQG problem)也称为固定阶数LQG问题(fixed-order LQG problem)先设置了LQG控制的状态数。因为分离原理已不适用,此问题会更不容易求解,而且其解也不唯一。即使如此,降阶LQG问题已有不少的数值算法[5][6][7][8]可以求解相关的最佳投影方程(optimal projection equations)[9][10],其中建构了局部优化的降阶LQG问题的充份及必要条件[5]

LQG控制的鲁棒性 编辑

LQG优化本身不确保有良好的鲁棒性[11],需要在设计好LQG控制后,另外确认闭回路系统的鲁棒稳定性。为了提升系统的鲁棒性,可能会将一些系统参数由确定值改假设是随机值。相关的控制问题会更加复杂,会得到一个类似的最佳控制器,只有控制器参数不同[6]

相关条目 编辑

参考资料 编辑

  1. ^ Karl Johan Astrom. Introduction to Stochastic Control Theory 58. Academic Press. 1970. ISBN 0-486-44531-3. .
  2. ^ Anders Lindquist. On Feedback Control of Linear Stochastic Systems. SIAM Journal on Control. 1973, 11: 323––343. .
  3. ^ Tryphon T. Georgiou and Anders Lindquist. The Separation Principle in Stochastic Control, Redux. IEEE Transactions on Automatic Control. 2013, 58 (10): 2481––2494. doi:10.1109/TAC.2013.2259207. .
  4. ^ Athans M. The role and use of the stochastic Linear-Quadratic-Gaussian problem in control system design. IEEE Transaction on Automatic Control. 1971, AC–16 (6): 529–552. doi:10.1109/TAC.1971.1099818. 
  5. ^ 5.0 5.1 Van Willigenburg L.G.; De Koning W.L. Numerical algorithms and issues concerning the discrete-time optimal projection equations. European Journal of Control. 2000, 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4.  Associated software download from Matlab Central页面存档备份,存于互联网档案馆).
  6. ^ 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters. Automatica. 1999, 35: 129–138. doi:10.1016/S0005-1098(98)00138-1.  Associated software download from Matlab Central页面存档备份,存于互联网档案馆).
  7. ^ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem. International Journal of Control. 1996, 56 (1): 173–191. doi:10.1080/00207179208934308. 
  8. ^ Collins Jr. E.G; Haddad W.M.; Ying S. A homotopy algorithm for reduced-order dynamic compensation using the Hyland-Bernstein optimal projection equations. Journal of Guidance Control & Dynamics. 1996, 19 (2): 407–417. doi:10.2514/3.21633. 
  9. ^ Hyland D.C; Bernstein D.S. The optimal projection equations for fixed order dynamic compensation. IEEE Transaction on Automatic Control. 1984, AC–29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. 
  10. ^ Bernstein D.S.; Davis L.D.; Hyland D.C. The optimal projection equations for reduced-order discrete-time modeling estimation and control. Journal of Guidance Control and Dynamics. 1986, 9 (3): 288–293. doi:10.2514/3.20105. 
  11. ^ Green, Michael; Limebeer, David J. N. Linear Robust Control. Englewood Cliffs: Prentice Hall. 1995: 27. ISBN 0-13-102278-4. 

延伸阅读 编辑