getMaxQValue
在给定环境观测的情况下,从具有离散动作空间的q值函数评论家获得所有可能动作的最大估计值
语法
描述
[
对离散动作空间q值函数进行评价maxQ
,maxActionIndex
= getMaxQValue(qValueFcnObj
,奥林匹克广播服务公司
)qValueFcnObj
并返回所有可能操作的最大估计值maxQ
,具有相应的动作索引maxActionIndex
,给定环境观测奥林匹克广播服务公司
.
[
的更新状态maxQ
,maxActionIndex
,状态
= getMaxQValue(___)qValueFcnObj
当它包含一个循环神经网络时。
例子
输入参数
输出参数
版本历史
R2020a中引入