培训代理强化学习作为电动机的控制器,但Matlab并不不训练吗?

3视图(30天)
你好,我是试图利用强化学习培训代理作为汽车的一个控制器。
我的电机的传递函数是:
%这个传递函数的输入和输出电流和速度,分别。
69.4 / (s + 69.4)
在阅读 这个例子 ,我只做了一些小的修改:
1。取代watertank模型和电机的传递函数如下:
1. png
2。设置示例Ts和仿真时间Tf 1/8000和10个,分别。
2. png
然而,结果是:
3. png
它不工作:
回报永远是零,我不知道为什么。
谁能给我建议如何处理这个问题?
非常感激。

答案(2)

Emmanouil Tzorakoleftherakis
Emmanouil Tzorakoleftherakis 2019年9月16日
编辑:Emmanouil Tzorakoleftherakis 2019年9月16日
你好,
很难查明这个问题完全没有再生产模型,但是听起来像训练过早地停止。你能把“停止仿真子系统从你的模型吗?我怀疑这个标志为新工厂总是设置为true。

Smita Sadhukhan
Smita Sadhukhan 2022年7月14日
编辑:Smita Sadhukhan 2022年7月14日
我曾经尝试过删除停止模拟块但不给予适当的奖励训练模型。训练后输出是不会接近设置点。你能看看这个问题,帮助我。

下载188bet金宝搏


释放

R2019a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!