本系列概述了强化学习,这是一种机器学习,有可能解决一些传统技术难以解决的控制系统问题。
我们将介绍强化问题的基本知识,以及它与传统控制技术的区别。我们将展示为什么神经网络用于表示未知函数,以及代理如何使用来自环境的奖励来训练它们。
本系列结束时,您将更好地准备回答以下问题:
第1部分:什么是强化学习?从工程师的角度对强化学习进行概述。强化学习是一种机器学习,有可能解决一些真正难以控制的问题。
第2部分:了解环境和奖励在本视频中,我们通过探索工作流程,建立对强化学习的基本理解。什么是环境?奖励功能如何激励和代理?政策是如何构建的?
第3部分:政策和学习算法本视频介绍驻留在代理中的算法。我们将介绍为什么我们使用神经网络来表示函数,以及为什么您可能必须在一个名为actor-critic的强大方法家族中设置两个神经网络。
第四部分:步行机器人问题本视频演示了如何使用强化学习工作流让两足机器人行走,以及如何通过在设计中添加参考信号,将RL问题设置为更像传统控制问题。
第5部分:克服强化学习的实际挑战在生产系统中使用强化学习时会遇到一些挑战,有一些方法可以缓解这些挑战。本视频介绍了验证所学解决方案的困难以及您可以对此采取的措施。