如何导出和只使用一个强化学习算法的最终产品吗?

29日视图(30天)

显示旧的评论

迈克尔Urbanski 2021年8月5日

0
链接

这个问题直接联系

//www.tatmou.com/matlabcentral/answers/893022-how-to-export-and-use-only-the-end-product-of-a-reinforcement-learning-algorithm

评论道: 迈克尔Urbanski2021年8月7日

答:接受 Arkadiy Turevskiy

你好

我用强化学习训练TD3代理。现在我想用这个代理和实际部署它作为控制器的仿真软件模型,然后可能在嵌入式平台上。金宝app从我了解的强化学习,演员网络是计算实际的最终产品控制行动。因此,我不想出口一切RL的经纪人表示,神经网络。有什么我应该提防的时候这样做?还什么仿真软件块我可金宝app以用深神经网络控制器吗?我不确定如果预测块适用于这里的任务没有分类和输出应该是行动,而不是百分比可能性。

同时,我已经创建了一个TD3代理与MATLAB R2021a LSTM层。R2020b当我试着进口代理,它不兼容,代理意外得到进口但是当我试着模拟验证结果得到不同的R2021a当我尝试做它。LSTM层内部的代理不正常工作在R2020b还是完全不兼容(仅供模拟代理,而不是培训)?只会做一些我上面描述的(进口神经网络作为控制器)请允许我使用网络作为控制器在旧版本的MATLAB ?

谢谢你的帮助。

0评论
显示1年长的评论藏1年长的评论

登录置评。

在回答这个问题。

接受的答案

Arkadiy Turevskiy 2021年8月6日

1
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/893022-how-to-export-and-use-only-the-end-product-of-a-reinforcement-learning-algorithm answer_762687

你好,

部署培训RL代理,你需要:

从RL代理提取培训政策。为你使用generatePolicyFunction。医生解释说,这个函数将创建一个函数evaluatePolicy。m和agentData。垫文件。
培训政策上运行推理模型,使用MATLAB仿真软件的功能块。金宝app在MATLAB函数块evaluatePolicy打电话
你做的!你现在可以模拟仿真软件的培训政策。金宝app从21日开始我们支持ANSI C代码创深学金宝app习网络。你可以从你的仿真软件模型生成ANSI C代码,其中包含whetever算法加上训练有金宝app素的RL政策由MATLAB函数块。
生成的代码应该兼容任何单片机,或快速原型设置,例如,speedgoat机。

看到什么细节层目前支持ANSI C(通用C),请参考金宝app 文档页面。

至于第二个问题,T3D支持LSTMs 21在强化学习工具箱。金宝app所以当你指出你将无法使用该代理在20 b。然而,您应该能够提取培训政策如上所述,它在20 b上运行推理。21我们添加了一个金宝app仿真软件块为模拟LSTMs深度学习工具箱 ,但我认为你应该能够模拟在20 b使用MATLAB函数块。如果你能;t或解的没有意义,请联系技术支持。金宝app

1评论
显示没有隐藏没有

迈克尔Urbanski 2021年8月7日

非常感谢,这是现货!

登录置评。

类别

人工智能,数据科学和统计数据深度学习工具箱应用程序自主和控制系统强化学习

找到更多的在强化学习在帮助中心和文件交换

下载188bet金宝搏

释放

R2021a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!