如何导出和只使用一个强化学习算法的最终产品吗?

29日视图(30天)
你好
我用强化学习训练TD3代理。现在我想用这个代理和实际部署它作为控制器的仿真软件模型,然后可能在嵌入式平台上。金宝app从我了解的强化学习,演员网络是计算实际的最终产品控制行动。因此,我不想出口一切RL的经纪人表示,神经网络。有什么我应该提防的时候这样做?还什么仿真软件块我可金宝app以用深神经网络控制器吗?我不确定如果预测块适用于这里的任务没有分类和输出应该是行动,而不是百分比可能性。
同时,我已经创建了一个TD3代理与MATLAB R2021a LSTM层。R2020b当我试着进口代理,它不兼容,代理意外得到进口但是当我试着模拟验证结果得到不同的R2021a当我尝试做它。LSTM层内部的代理不正常工作在R2020b还是完全不兼容(仅供模拟代理,而不是培训)?只会做一些我上面描述的(进口神经网络作为控制器)请允许我使用网络作为控制器在旧版本的MATLAB ?
谢谢你的帮助。

接受的答案

Arkadiy Turevskiy
Arkadiy Turevskiy 2021年8月6日
你好,
部署培训RL代理,你需要:
  1. 从RL代理提取培训政策。为你使用generatePolicyFunction。医生解释说,这个函数将创建一个函数evaluatePolicy。m和agentData。垫文件。
  2. 培训政策上运行推理模型,使用MATLAB仿真软件的功能块。金宝app在MATLAB函数块evaluatePolicy打电话
  3. 你做的!你现在可以模拟仿真软件的培训政策。金宝app从21日开始我们支持ANSI C代码创深学金宝app习网络。你可以从你的仿真软件模型生成ANSI C代码,其中包含whetever算法加上训练有金宝app素的RL政策由MATLAB函数块。
  4. 生成的代码应该兼容任何单片机,或快速原型设置,例如,speedgoat机
看到什么细节层目前支持ANSI C(通用C),请参考金宝app 文档页面
至于第二个问题,T3D支持LSTMs 21在强化学习工具箱。金宝app所以当你指出你将无法使用该代理在20 b。然而,您应该能够提取培训政策如上所述,它在20 b上运行推理。21我们添加了一个 金宝app仿真软件块为模拟LSTMs深度学习工具箱 ,但我认为你应该能够模拟在20 b使用MATLAB函数块。如果你能;t或解的没有意义,请联系技术支持。金宝app

更多的答案(0)

下载188bet金宝搏


释放

R2021a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!