最优控制

设计和实施控制技术以满足系统目标

最优控制是动态系统满足设计目标的条件。最优控制是通过按照定义的最优准则执行的控制律来实现的。一些广泛应用的最优控制技术有:

线性二次调节器(LQR)/线性二次高斯(LQG)控制

线性二次型调节器(LQR)是一种全状态反馈最优控制律,\(u=-Kx\),它使调节控制系统的二次成本函数最小化。

图1。线性二次调节器控制器原理图。

此成本函数取决于系统状态\((x)\)和控制输入\((u)\),如下所示。

$$J(u)=\int_{0}{\infty}(x^tqx+u^tru+2x^tnu)dt$$

根据性能指标,设置最优控制律的权重因子Q、R和N,以确定系统状态调节与控制执行成本之间的适当平衡。

在许多最优控制问题中,并非所有的状态测量都是可访问的。在这些情况下,必须使用观察员对状态进行估计。这通常是使用诸如卡尔曼滤波器之类的观测器来完成的。由一个二次型卡尔曼滤波器(LQG)和一个二次型卡尔曼滤波器(LQG)组合而成。

图2。线性二次高斯控制器原理图。

想要了解更多,请查看这个MATLAB技术讨论等控制。

模型预测控制

模型预测控制(MPC)用于最小化多输入多输出(MIMO)系统中受输入和输出约束的成本函数。这种最优控制技术使用一个系统模型来预测未来的设备产量。利用预测的设备输出,控制器解决一个在线优化问题,即一个二次规划,以确定最优调整到一个可操作变量,驱动预测输出到参考。MPC变量包括自适应、增益计划和非线性MPC控制器。MPC控制器的类型取决于预测模型(线性/非线性)、约束(线性/非线性)、成本函数(二次/非二次)、吞吐量和采样时间。要了解更多信息,请查看MATLAB技术讲座关于MPC变体。

图3所示。模型预测控制原理图。

随着微处理器技术和高效算法的发展,这种最优控制方法越来越多地应用于自动驾驶、航空航天应用中的最优地形跟踪等领域。

要了解更多信息,请查看这是MATLAB技术谈话系列模型预测控制。

强化学习

强化学习是一种机器学习技术,其中计算机代理通过与动态环境的反复尝试和错误交互来学习最佳行为。代理使用来自环境的观察来执行一系列操作,目的是最大化代理对任务的累积奖励度量。这种学习是在没有人为干预和明确编程的情况下进行的。

该最优控制方法可用于决策问题,也可作为使用传统控制方法(如自动驾驶、机器人技术、调度问题和系统动态校准)的应用的非线性控制替代方案。

要了解更多信息,请查看这是MATLAB技术谈话系列关于强化学习。

极值搜索控制

极值寻优是一种利用无模型实时优化自动调整控制系统参数使目标函数最大化的最优控制技术。这种方法不需要系统模型,可以用于参数和扰动随时间缓慢变化的系统。这种最优控制技术适用于能够容忍控制中的噪声和只需要适应少量控制系统参数的稳定系统。

极值搜索控制的应用包括自适应巡航控制、太阳能电池板的最大功率点跟踪(MPPT)和防抱死制动系统(ABS)。

图5。极值搜索控制原理图。

H无穷合成

h∞综合是一种最优控制工具/技术,用于设计单输入单输出(SISO)或MIMO反馈控制器,以实现鲁棒性能和稳定性。与经典控制技术如波德环整形或PID整定相比,h -∞更适合需要通道间交叉耦合的多变量控制系统。

在H∞条件下,根据归一化闭环增益制定控制目标。H∞综合自动计算控制器,该控制器通过最小化该增益来优化性能。这是有用的,因为许多控制目标可以用最小化增益来表示。这包括干扰抑制、噪声敏感性、跟踪、回路成形、回路解耦和鲁棒稳定性等目标。H∞综合的变化可用于处理固定结构或全阶控制器。

想要了解更多,请查看这个MATLAB技术讨论摘要针对合成。

下表对上述最优控制方法进行了比较:

最优控制方法 优化是否在运行时进行?(是/否) 优化过程是如何为这个优化控制过程工作的? 它能处理硬约束吗?*(是/否) 它使用基于模型的技术吗?(是/否) 吞吐量是多少?(高/低)
LQR/LQG 没有 使用闭式解这适用于已知的线性时不变系统 没有
隐式MPC(是的) 使用一个预测模型,解决了一个在线优化问题计算最优控制动作 低(非线性MPC),高(线性MPC)
明确的政策委员会(没有) 解决问题优化问题计算最优控制动作的方法是离线计算
强化学习 是的* * 学习要执行的任务的最佳行为最大化奖励指标 没有* * * 依赖于训练算法 低(经过培训),中高(推理期间)
极值搜索控制 扰动和调整控制参数使目标函数最大化 没有 没有
摘要针对合成 没有 自动计算一个控制器最小化归一化闭环增益 没有

*你可以使用约束强制块来强制约束。了解更多在这里.

**与强化学习工具箱™,您可以针对模拟环境训练代理。部署的代理是经过训练的策略,不会在运行时更新。

***您可以通过策略结构施加行动约束,并通过奖励功能鼓励其他约束。


另见:什么是强化学习?,波德图,频率响应,根轨迹,PID控制,PID调节