Emmanouil Tzorakoleftherakis, MathWorks
强化学习允许您使用深度学习解决控制问题,而不使用标记数据。相反,它使用系统模型来捕获环境的适当动态,并通过执行多个模拟进行学习。这些模拟数据被用来训练一个策略,这个策略通常由一个深度神经网络表示,然后将取代传统的控制器或决策系统。
在本次演讲中,您将学习如何使用Reinforcement Learning Toolbox™和其他MathWorks产品来设置环境模型,定义策略及其各种超参数,并通过并行计算进行扩展训下载188bet金宝搏练以提高性能。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。