最优控制

设计和实施控制技术以满足系统目标

最优控制是动态系统满足设计目标的条件。最优控制是通过执行以下定义的最优标准的控制律来实现的。一些广泛使用的最佳控制技术包括:

线性二次调节器(LQR)/线性二次高斯(LQG)控制

线性二次型调节器(LQR)是一种全状态反馈最优控制律,\(u=-Kx\),它使调节控制系统的二次成本函数最小化。

图1。线性二次调节器控制器原理图。

此成本函数取决于系统状态\((x)\)和控制输入\((u)\),如下所示。

$$J(u)=\int_{0}{\infty}(x^tqx+u^tru+2x^tnu)dt$$

基于性能规范,为该最优控制律设置权重因子Q、R和N,以定义系统状态调节和控制驱动成本之间的适当平衡。

在许多最优控制问题中,并非所有的状态测量都是可访问的。在这些情况下,必须使用观察员对状态进行估计。这通常是使用诸如卡尔曼滤波器之类的观测器来完成的。卡尔曼滤波器与LQR控制器相结合构成了线性二次高斯(LQG)控制器。

图2。线性二次高斯控制器原理图。

要了解更多信息,请查看此MATLAB技术讲座关于LQR控制。

模型预测控制

模型预测控制(MPC)用于最小化受输入和输出约束的多输入多输出(MIMO)系统的成本函数。这种最优控制技术使用系统模型来预测未来的电厂输出。使用预测的设备输出,控制器解决在线优化问题,即二次规划,以确定可操纵变量的最佳调整,该变量将预测输出驱动至参考。MPC变型包括自适应、增益调度和非线性MPC控制器。使用的MPC控制器类型取决于预测模型(线性/非线性)、约束(线性/非线性)、成本函数(二次/非二次)、吞吐量和采样时间。要了解更多信息,请查看这是MATLAB技术讲座关于MPC变体。

图3。模型预测控制原理图。

微处理器技术和高效算法的进步增加了这种最优控制方法在自动化驾驶、航空航天应用中的最优地形跟踪等应用中的采用。

要了解更多信息,请查看这是MATLAB技术谈话系列关于模型预测控制。

强化学习

强化学习是一种机器学习技术,其中计算机代理通过与动态环境的反复尝试和错误交互来学习最佳行为。代理使用来自环境的观察来执行一系列操作,目的是最大化代理对任务的累积奖励度量。这种学习是在没有人为干预和明确编程的情况下进行的。

该最优控制方法可用于决策问题,也可作为使用传统控制方法(如自动驾驶、机器人技术、调度问题和系统动态校准)的应用的非线性控制替代方案。

要了解更多信息,请查看这是MATLAB技术谈话系列关于强化学习。

极值搜索控制

极值搜索是一种最优控制技术,它使用无模型实时优化自动调整控制系统参数以使目标函数最大化。该方法不需要系统模型,可用于参数和干扰随时间缓慢变化的系统。该最优控制技术适用于对于在控制中能够容忍噪声的稳定系统,并且只需要调整少量控制系统参数。

极值搜索控制的应用包括自适应巡航控制、太阳能电池阵列的最大功率点跟踪(MPPT)和防抱死制动系统(ABS)。

图5。极值搜索控制原理图。

H无穷合成

H∞综合是设计单输入单输出(SISO)或MIMO反馈控制器以实现鲁棒性能和稳定性的最佳控制工具/技术。与经典控制技术(如带bode或PID调节的回路成形)相比,H∞更适合于需要通道间交叉耦合的多变量控制系统。

在H∞条件下,根据归一化闭环增益制定控制目标。H∞综合自动计算控制器,该控制器通过最小化该增益来优化性能。这是有用的,因为许多控制目标可以用最小化增益来表示。这包括干扰抑制、噪声敏感性、跟踪、回路成形、回路解耦和鲁棒稳定性等目标。H∞综合的变化可用于处理固定结构或全阶控制器。

要了解更多信息,请查看此MATLAB技术讲座关于H无穷合成。

下表比较了上述最佳控制方法:

最优控制方法 优化是否在运行时执行?(是/否) 优化过程是如何为这个优化控制过程工作的? 它能处理硬约束吗?*(是/否) 是否使用基于模型的技术?(是/否) 吞吐量是多少?(高/低)
LQR/LQG 使用闭式解这适用于已知的线性时不变系统 高的
隐式MPC(是) 使用预测模型,解决了一个在线优化问题计算最优控制动作 低(非线性MPC),高(线性MPC)
显式MPC(否) 解决问题优化问题计算最优控制动作的方法是离线计算 高的
强化学习 对** 学习要执行的任务的最佳行为最大化奖励指标 没有*** 依赖于训练算法 低(经过培训),中高(推理期间)
极值搜索控制 扰动和调整控制参数使目标函数最大化 高的
H无穷合成 自动计算一个控制器,该控制器最小化标准化闭环增益 高的

*可以使用约束强制块施加约束。了解更多在这里.

**与强化学习工具箱™,您可以针对模拟环境对代理进行培训。部署的代理是经过培训的策略,在运行时不会更新。

***您可以通过策略结构施加行动约束,并通过奖励功能鼓励其他约束。


另见:什么是强化学习?,伯德图,频率响应,根轨迹,PID控制,PID调节