文件帮助中心文件
从强化学习环境或agent获取观测数据规范
ObsInfo = getobservationInfo(Env)
ObsInfo = getobservationInfo(代理)
例子
obsinfo.= getobservationInfo(env.)从强化学习环境中提取观察信息env.。
obsinfo.= getobservationInfo(env.)
obsinfo.
env.
obsinfo.= getobservationInfo(代理人)从钢筋学习代理中提取观察信息代理人。
obsinfo.= getobservationInfo(代理人)
代理人
全部收缩
提取您可以用于创建其他环境或代理的操作和观察信息。
本例的增强学习环境是自助式汽车和铅轿车的简单纵向动态。培训目标是使自助式汽车以设定的速度行进,同时通过控制纵向加速(和制动)保持与引线的安全距离。此示例使用相同的车型模型基于模型预测控制的自适应巡航控制系统(模型预测控制工具箱)例子。
打开模型并创建强化学习环境。
mdl ='rlaccmdl';Open_System(MDL);AppletBlk = [MDL'/ rl代理'];%创建观察信息obsInfo = rlNumericSpec([3 1],'lowerimit',-inf *那些(3,1),'上限',INF * of(3,1));ObsInfo.name =.'观察';Obsinfo.description =.“关于速度误差和自我速度的信息”;%行动信息Actinfo = rlnumericspec([1 1],'lowerimit',-3,'上限',2);Actinfo.name =.'加速';%定义环境Env = Rl金宝appsimulinkenv(MDL,AppertBlk,Obsinfo,Actinfo)
env = 金宝appSimulinkenvwithAgent具有属性:型号:RLACCMDL AppletBlock:RLACCMDL / RL代理RESETFCN:[] USEFASTRESTR:ON
强化学习环境env.是A.金宝appSimulinkWithAgent对象具有上述属性。
金宝appSimulinkWithAgent
从加强学习环境中提取动作和观察信息env.。
Actinfoext = GetActionInfo(ENV)
ACTINFOEXT = RLNUMERICSPEC具有属性:LowerMit:-3 Upperlimit:2名称:“加速”描述:[0x0字符串]尺寸:[1]数据类型:“double”
ObsInfoext = getobservationInfo(env)
obsInfoExt = rlNumericSpec with properties: LowerLimit: [3x1 double] UpperLimit: [3x1 double] Name: "observations" Description: "information on velocity error and ego velocity" Dimension: [3 1] DataType: "double"
动作信息包含加速度值,而观察信息包含自我车辆的速度和速度误差值。
金宝appSimulinkenvwithagent.
需要从其中提取观测信息的强化学习环境,指定为金宝appSimulinkenvwithagent.对象。
有关强化学习环境的更多信息,请参阅创建Simul金宝appink强化学习环境。
rlqagent.
rlsarsaagent.
rldqnagent.
rlddpgagent.
rlpgagent.
rlacagent.
需要提取观测信息的强化学习agent,指定为以下对象之一:
有关强化学习代理的更多信息,请参见加固学习代理人。
rlnumericspec.
rlfinitesetspec.
从强化学习环境中提取的观察数据规范,作为以下一系列返回:
rlnumericspec.对象
rlfinitesetspec.对象
混合rlnumericspec.和rlfinitesetspec.对象
getActionInfo.|rlacagent.|rlddpgagent.|rldqnagent.|rlfinitesetspec.|rlnumericspec.|rlpgagent.|rlqagent.|rlsarsaagent.
getActionInfo.
Sie Haben EineAbgeänderte版模具北美山脉。MöchtenSieDieses Beispiel Mit IhrenÄnderungenÖffnen?
Sie Haben AUF EINEN LINK GEKLICKT,DER DIESEM MATLAB-BEFEHL ONTSPRICHT:
Führensieden befehl Durch Eingabe在Das Matlab-Befehlsfenster Aus。WebBrowserUnterstützenKeineMatlab-Befehle。
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系您当地的办公室