Les médias ont récemment montré que Les algorithmes de Reinforcement Learning sont désormais competent de batttre des jouers de professional de GO, Dota 2和Starcraft 2。强化学习是一个méthode d '学徒在复杂的应用程序中,智能人工智能告诉我们jeux vidéo,机器人或véhicule自主。

您喜欢强化学习à votre项目,但您不喜欢utilisé吗?你们可以从où开始。

用MATLAB编写的强化学习初始化的Cet电子书®等仿真金宝app软件®术语、示例、教程和信息处理的描述。

Lire ces电子书pour en savoir plus:

第1部分:环境基础和配置概念
学习强化学习的基础,并评论être comparé au design de contrôle traditions。在电子书中,你们可以理解différence entre l' tissage supervisé,不是supervisé,还有强化学习,也可以是découvrir,在MATLAB和Simulink中对学徒的环境进行评论。金宝app

第二部分:补偿和政治原则
Découvrez在强化学习中探索和开发的阶段,以及façon, créer,和récompense的函数。探索les différentes options pour représenter les politiques, notamment les réseaux de neurones,以及评论ces derniers peuvent être utilisées comme approateurs de functions。

第三部分:评估与开发综合
探索les différents types d 'algorithmes d ' apprentice tisage,而不是amment les méthodes basées关于les politiques, les values和les algorithmes actors -critique。Découvrez les avages和les inconvénients de chaque méthode d ' apprentice tissage,所以是équation de Bellman。Enfin, étudiez les différents éléments à predre en compte avant de déployer une politique entraînée,我希望les défis和inconvénients associés à使用这种技术。

30日免费版

运用MATLAB, Simuli金宝appnk等软件。

在知道+