最近的新闻报道突出了加固学习算法现在如何在游戏中击败专业人员,如Go,Dota 2和Starcraft 2.加固学习是一种机器学习,可以在复杂应用中使用从视频游戏到机器人,自我中的复杂应用中的人工智能使用- 驾驶汽车等等。

如果您有兴趣为您的项目使用强化学习技术,但您以前从未使用过,您从哪里开始?

此电子书将帮助您开始在Matlab中获得钢筋学习®和仿真软金宝app件®通过解释术语并提供对示例,教程和试用软件的访问。

阅读此电子书以了解:

第1节:了解基础知识并建立环境
学习强化学习的基础知识,以及它与传统控制设计的比较。了解有监督学习、无监督学习和强化学习之间的区别,以及如何在MATLAB和Simulink中建立学习环境。金宝app

第二部分:理解奖励和政策结构
学习强化学习中的探索和利用,以及如何形成奖励功能。探索表示策略(包括神经网络)的不同选项,以及如何将它们用作函数近似器。

第三部分:理解培训和部署
了解不同类型的培训算法,包括基于政策、基于价值和行为者-批评方法。了解每种培训方法的优缺点以及流行的贝尔曼方程。最后,看看在部署经过培训的策略之前应该考虑什么,以及与此技术相关的总体挑战和缺点。

30天的免费试用

尝试MATLAB, Si金宝appmulink等等。

开始