训练多agent的路径跟踪控制- MATLAB和Simulink金宝app<GydF4y2Ba/title> <link href="//www.tatmou.com/includes_content/responsive/css/bootstrap/bootstrap.min.css" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/includes_content/responsive/css/site6.css?202103" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/includes_content/responsive/css/site6_lg.css?202103" rel="stylesheet" media="screen and (min-width: 1200px)"> <link href="//www.tatmou.com/includes_content/responsive/css/site6_md.css?202103" rel="stylesheet" media="screen and (min-width: 992px) and (max-width: 1199px)"> <link href="//www.tatmou.com/includes_content/responsive/css/site6_sm+xs.css?202103" rel="stylesheet" media="screen and (max-width: 991px)"> <link href="//www.tatmou.com/includes_content/responsive/css/site6_sm.css?202103" rel="stylesheet" media="screen and (min-width: 768px) and (max-width: 991px)"> <link href="//www.tatmou.com/includes_content/responsive/css/site6_xs.css?202103" rel="stylesheet" media="screen and (max-width: 767px)"> <link href="//www.tatmou.com/includes_content/responsive/css/site6_offcanvas_v2.css?202103" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/includes_content/responsive/css/site7_crux.css?202103" rel="stylesheet" type="text/css"> <link href="https://use.typekit.net/xvy5baa.css?display=swap" rel="stylesheet"> <link href="//www.tatmou.com/includes_content/releases/R2021a/css/doc_center.css?202103" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/includes_content/releases/R2021a/css/doc_center_print.css?202103" rel="stylesheet" type="text/css" media="print"> <style> .examples_short_list a.btn {display: none;} </style> <style> .typeahead_container.typeahead_type_grouped { margin-left:0; } @media (min-width:768px) { #suggestions { margin-left:-100px } } </style> </head> <body id="responsive_offcanvas"> <a class="skip_link sr-only" href="#content_container">跳到内容<GydF4y2Ba/a>  <div class="header visible-xs visible-sm" id="header_mobile" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="navbar-header"> <div class="container-fluid"> <div class="row"> <div class="col-xs-3"> <button type="button" class="navbar-toggle topnav_toggle" data-toggle="collapse" data-target="#topnav_collapse"><span class="sr-only">切换主要导航<GydF4y2Ba/span><span class="icon-menu"></span></button> </div> <div class="col-xs-6"> <div class="text-center"> <a href="//www.tatmou.com?s_tid=gn_logo" class="svg_link navbar-brand"><img src="//www.tatmou.com/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="Mathworks.GydF4y2Ba"></a> </div> </div> <div class="col-xs-3"> <div class="matrix_affordance_container_mobile" id="matrix_affordance_container_mobile"></div> </div> </div> </div> </div> <div class="container-fluid"> <div class="row visible-xs visible-sm"> <div class="col-xs-12"> <div class="navbar-collapse collapse" id="topnav_collapse"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tatmou.com/products.html?s_tid=gn_ps">下载188bet金宝搏</a></li> <li class="topnav_solutions "><a href="//www.tatmou.com/solutions.html?s_tid=gn_sol">金宝搏官方网站</a></li> <li class="topnav_academia "><a href="//www.tatmou.com/academia.html?s_tid=gn_acad">118bet金博宝app </a></li> <li class="topnav_community "><a href="//www.tatmou.com/matlabcentral/?s_tid=gn_mlc">118bet金博宝 </a> </div> <div class="navbar-collapse collapse hidden-xs hidden-sm"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tatmou.com/products.html?s_tid=gn_ps">下载188bet金宝搏</a></li> <li class="topnav_solutions "><a href="//www.tatmou.com/solutions.html?s_tid=gn_sol">金宝搏官方网站</a></li> <li class="topnav_academia "><a href="//www.tatmou.com/academia.html?s_tid=gn_acad">118bet金博宝app </a></li> <li class="topnav_community "><a href="//www.tatmou.com/matlabcentral/?s_tid=gn_mlc">118bet金博宝 </a></p> </div> </div> </div> <div class="col-xs-12 col-sm-6 col-md-5" id="mobile_search"> <div class="search_nested_content_container"> <div id="search_scope_support" class="collapse in"> <form id="docsearch_form" action="/support/search.html" method="get" accept-charset="utf-8" data-release="R2021a" data-language="en"> <div class="input-group"> <label class="sr-only">搜索支持金宝app<GydF4y2Ba/label> <input id="suggestion" type="hidden" name="suggestion" value=""> <span role="status" aria-live="polite" class="ui-helper-hidden-accessible"></span> <input id="docsearch" class="form-control conjoined_search" type="search" name="q" placeholder="Search Support" autocomplete="off"> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">金宝app</span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu">  <li data-toggle="collapse" data-target="#search_scope_site" class="support_search_scope_trigger"><a href="#">Mathworks.<GydF4y2Ba/a></li> </ul> <button type="submit" name="submitsearch" id="support_submitsearch" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> <div id="search_scope_site" class="collapse"> <form name="search" id="site_search" class="site_search" action="/search/site_search.html" method="get"> <div class="input-group"> <label class="sr-only">搜索MathWorks.com<GydF4y2Ba/label> <input type="hidden" name="c[]" value="entire_siteGydF4y2Ba"> <input type="search" name="q" id="query" class="form-control conjoined_search" placeholder="Search MathWorks.com" autocomplete="off" \=""> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">Mathworks.<GydF4y2Ba/span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu"> <li data-toggle="collapse" data-target="#search_scope_support" class="site_search_scope_trigger"><a href="#">金宝app</a></li> </ul> <button type="submit" id="searchbutton" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> </div> <button class="btn icon-remove btn_search pull-right icon_32 visible-xs" data-toggle="collapse" href="#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">关闭移动搜索<GydF4y2Ba/span></button> </div> <div class="visible-xs" id="search_actuator"> <button class="btn icon-search btn_search pull-right icon_16" data-toggle="collapse" href="#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">打开移动搜索<GydF4y2Ba/span></button> </div> </div> </div> </div>   <div class="row-offcanvas row-offcanvas-left"> <div class="sidebar-offcanvas" id="sidebar"> <nav class="offcanvas_nav" role="navigation"> <div class="offcanvas_actuator" data-toggle="offcanvas" data-target="#sidebar" id="nav_toggle"> <button type="button" class="btn"><span class="sr-only">off-canvas导航菜单切换<GydF4y2Ba/span><span class="icon-menu"></span></button> <span class="offcanvas_actuator_label" id="translation_icon-menu" tabindex="-1" aria-hidden="true"></span>  </div> <div class="nav_list_wrapper" id="nav_list_wrapper"> <nav class="offcanvas_nav" role="navigation"> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_breadcrumb" id="ul_left_nav_ancestors"> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tatmou.com/help/index.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">文档家里<GydF4y2Ba/span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_disambiguation"> <li><a href="//www.tatmou.com/help/reinforcement-learning/index.html?s_tid=CRUX_lftnav">加固学习工具箱<GydF4y2Ba/a></li> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tatmou.com/help/reinforcement-learning/training-and-validation.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">培训和验证<GydF4y2Ba/span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_scrollspy nav"> <li class="nav_scrollspy_function"><a href="#responsive_offcanvas">培训多个代理以进行控制后路径<GydF4y2Ba/a></li> <li class="nav_scrollspy_title" id="SSPY810-section">在这一页上<GydF4y2Ba/li>  <li><a href="#TrainMultipleAgentsForPathFollowingControlExample-1" class="intrnllnk">概述<GydF4y2Ba/a></li> <li><a href="#TrainMultipleAgentsForPathFollowingControlExample-2" class="intrnllnk">创建环境<GydF4y2Ba/a></li> <li><a href="#TrainMultipleAgentsForPathFollowingControlExample-3" class="intrnllnk">创造代理人<GydF4y2Ba/a></li> <li><a href="#TrainMultipleAgentsForPathFollowingControlExample-6" class="intrnllnk">培训代理商<GydF4y2Ba/a></li> <li><a href="#TrainMultipleAgentsForPathFollowingControlExample-7" class="intrnllnk">模拟代理<GydF4y2Ba/a></li> <li><a href="#d123e19121" class="intrnllnk">也可以看看<GydF4y2Ba/a></li> <li><a href="#d123e19129" class="intrnllnk">相关的话题<GydF4y2Ba/a></li> </ul> </nav> </div> </nav> </div>   <div class="offcanvas_content_container"> <div class="sticky_header_container"> <div class="horizontal_nav"> <div class="horizontal_nav_container"> <div class="offcanvas_horizontal_nav"> <div class="container-fluid"> <div class="row"> <div class="col-sm-12 col-md-7 col-lg-8 hidden-xs"> <nav class="navbar navbar-default" role="navigation" id="subnav"> <div> <ul class="nav navbar-nav crux_browse"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文件<GydF4y2Ba/a><a class="coming_from_product">所有<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/examples.html?category=training-and-validation&s_tid=CRUX_topnav">例子<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=function&category=training-and-validation&s_tid=CRUX_topnav">功能<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=block&category=training-and-validation&s_tid=CRUX_topnav">块<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=app&category=training-and-validation&s_tid=CRUX_topnav">应用<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tatmou.com/support/search.html?fq=asset_type_name:video%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">视频<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tatmou.com/support/search.html?fq=asset_type_name:answer%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">答案<GydF4y2Ba/a></li> </ul> </div> </nav> </div> <div class="col-md-5 col-lg-4 hidden-xs hidden-sm"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">试用软件<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>试用软件<GydF4y2Ba/a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">产品更新<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>产品更新<GydF4y2Ba/a></li> </ul> </div> </div>  <div class="visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-9"> <div class="mobile_crux_nav_trigger">  <div class="btn-group"> <button type="button" class="btn btn-default dropdown-toggle" data-toggle="dropdown" aria-haspopup="true" aria-expanded="false">资源<GydF4y2Baspan class="icon-arrow-down icon_16"></span></button> <ul class="dropdown-menu"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文件<GydF4y2Ba/a><a class="coming_from_product">所有<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/examples.html?category=training-and-validation&s_tid=CRUX_topnav">例子<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=function&category=training-and-validation&s_tid=CRUX_topnav">功能<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=block&category=training-and-validation&s_tid=CRUX_topnav">块<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=app&category=training-and-validation&s_tid=CRUX_topnav">应用<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tatmou.com/support/search.html?fq=asset_type_name:video%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">视频<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tatmou.com/support/search.html?fq=asset_type_name:answer%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">答案<GydF4y2Ba/a></li> </ul> </div>  </div> </div> <div class="col-xs-3"> <div class="translate_placeholder"></div> </div> </div> </div> </div>  </div> </div> </div> </div> </div> </div> <div class="content_container" id="content_container" tabindex="-1"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div id="offcanvas_focus_actuator" tabindex="0" class="visible-xs"> <span class="sr-only">主要内容<GydF4y2Ba/span> </div> <section xmlns="http://www.w3.org/1999/xhtml" id="doc_center_content" itemprop="content" lang="en" data-language="en"> <div id="pgtype-topic"> <section itemprop="content"> <h1 class="r2021a" itemprop="title content" id="mw_a231508a-d1c9-4d81-91ca-e007ceb6f7b7">培训多个代理以进行控制后路径<GydF4y2Ba/h1> <div class="examples_short_list hidden_ios_android"> <div data-pane="metadata" class="panel metadata_container panel-default"> <div class="panel-body metadata_content"> <a class="btn btn_secondary btn-block" href="matlab:openExample('rl/TrainMultipleAgentsForPathFollowingControlExample')" data-ex-genre="Live Script">打开生活的脚本<GydF4y2Ba/a> </div> </div> </div> <div itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/Example" itemprop="example" class="em_example"> <meta itemprop="exampleid" content="rl-TrainMultipleAgentsForPathFollowingControlExample"> <meta itemprop="exampletitle" content="Train Multiple Agents for Path Following Control"> </div> <span id="TrainMultipleAgentsForPathFollowingControlExample" class="anchor_target"></span> <p class="shortdesc">该示例演示了如何训练多个智能体协同执行车辆的路径跟踪控制(PFC)。PFC的目标是通过控制纵向加速和刹车，使自我车辆以设定的速度行驶，同时保持与领先车辆的安全距离，并通过控制前转向角度使车辆保持在车道的中心线上行驶。有关PFC的更多信息，请参见<一种href="//www.tatmou.com/help/mpc/ref/pathfollowingcontrolsystem.html" class="a">路径跟随控制系统<GydF4y2Ba/a><span role="cross_prod">（模型预测控制工具箱）<GydF4y2Ba/span>．<GydF4y2Ba/p> <div class="procedure"> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-1">概述<GydF4y2Ba/h3> <p>列出了培训钢筋学习代理的示例<一种href="//www.tatmou.com/help/reinforcement-learning/ug/train-ddpg-agent-for-path-following-control.html" class="a">列车DDPG代理用于路径跟踪控制<GydF4y2Ba/a>．在该示例中，培训单个深度确定性政策梯度（DDPG）代理以控制自工载体的纵向速度和横向转向。在此示例中，您培训了两种加强学习代理 - DDPG代理为纵向控制回路提供连续加速度值，深度Q-Network（DQN）代理提供横向控制环路的离散转向角值。<GydF4y2Ba/p> <p>经过训练的agent通过合作行为进行PFC，并取得了满意的结果。<GydF4y2Ba/p> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-2">创建环境<GydF4y2Ba/h3> <p>本示例的环境包括ego汽车的简单自行车模型和lead汽车的简单纵向模型。训练目标是通过控制纵向加速和制动使自我车以设定的速度行驶，同时保持与领先车的安全距离，同时通过控制前转向角度使自我车保持在其车道的中心线上行驶。<GydF4y2Ba/p> <p>加载环境参数。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>multiAgentPFCParams<GydF4y2Ba/pre> </div> </div> </div> <p>打开Simulin金宝appk模型。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>mdl =<GydF4y2Baspan style="color:#A020F0">“rlmultiagentpfc”<GydF4y2Ba/span>；open_system (mdl)<GydF4y2Ba/pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e18403" class="mediaobject"> <p><img src="//www.tatmou.com/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_01.png" alt=""></p> </div> </div> <p>在该模型中，两个reinforcement learning agent (RL Agent1和RL Agent2)分别提供纵向加速度和转向角度信号。<GydF4y2Ba/p> <p>当发生下列任何情况时，模拟将终止。<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mo stretchy="false"> |<GydF4y2Ba/mo> <msub> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> <mo stretchy="false"> |<GydF4y2Ba/mo> <mo> ><GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>（横向偏差的幅度超过1）<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> V.<GydF4y2Ba/mi> </mrow> <mrow> <mi> E.<GydF4y2Ba/mi> <mi> G<GydF4y2Ba/mi> <mi> O.<GydF4y2Ba/mi> </mrow> </msub> <mo> <<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> <mo stretchy="false"> ．<GydF4y2Ba/mo> <mn> 5.<GydF4y2Ba/mn> </mrow> </math></span>自我车的纵向速度降到0.5以下。<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> D.<GydF4y2Ba/mi> </mrow> <mrow> <mi> R.<GydF4y2Ba/mi> <mi> E.<GydF4y2Ba/mi> <mi> L.<GydF4y2Ba/mi> </mrow> </msub> <mo> <<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> </mrow> </math></span>(自我与领车的距离在零以下)<GydF4y2Ba/p></li> </ul> </div> <p>纵向控制器(RL Agent1):<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>自助式汽车的参考速度<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> V.<GydF4y2Ba/mi> </mrow> <mrow> <mi> R.<GydF4y2Ba/mi> <mi> E.<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>定义如下。如果相对距离小于安全距离，自我车跟踪领先车速度和驾驶员设定速度的最小值。以这种方式，自我车与领先车保持一定的距离。如果相对距离大于安全距离，自我汽车跟踪驾驶者设定的速度。在这个例子中，安全距离被定义为自我汽车纵向速度的一个线性函数<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> V.<GydF4y2Ba/mi> </mrow> </math></span>,也就是说,<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> <mrow> <mi> G<GydF4y2Ba/mi> <mi> 一种<GydF4y2Ba/mi> <mi> P.<GydF4y2Ba/mi> </mrow> </msub> <mo> *<GydF4y2Ba/mo> <mi> V.<GydF4y2Ba/mi> <mo> +<GydF4y2Ba/mo> <msub> <mrow> <mi> D.<GydF4y2Ba/mi> </mrow> <mrow> <mi> D.<GydF4y2Ba/mi> <mi> E.<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> <mi> 一种<GydF4y2Ba/mi> <mi> 你<GydF4y2Ba/mi> <mi> L.<GydF4y2Ba/mi> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>．安全距离决定了自我车的跟踪速度。<GydF4y2Ba/p></li> <li><p>来自环境的观测包含了纵向测量:速度误差<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mi> V.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <msub> <mrow> <mi> V.<GydF4y2Ba/mi> </mrow> <mrow> <mi> R.<GydF4y2Ba/mi> <mi> E.<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> </mrow> </msub> <mo> -<GydF4y2Ba/mo> <mi> V.<GydF4y2Ba/mi> </mrow> </math></span>，它的积分<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <mo stretchy="false"> ∫<GydF4y2Ba/mo> <mi> E.<GydF4y2Ba/mi> </mrow> </math></span>，和自我车的纵向速度<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> V.<GydF4y2Ba/mi> </mrow> </math></span>．<GydF4y2Ba/p></li> <li><p>动作信号由-3到2 m/s^2之间的连续加速度值组成。<GydF4y2Ba/p></li> <li><p>奖励<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true"> <msub> <mrow> <mi mathvariant="italic"> R.<GydF4y2Ba/mi> </mrow> <mrow> <mi mathvariant="italic"> T.<GydF4y2Ba/mi> </mrow> </msub> </math></span>，每次都提供<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> T.<GydF4y2Ba/mi> </mrow> </math></span>,是<GydF4y2Ba/p></li> </ul> </div> <p></p> <div class="code_responsive"> <p class="programlistingindent"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> R.<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mo> -<GydF4y2Ba/mo> <mo stretchy="false"> （<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <msubsup> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mi> V.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> +<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <msubsup> <mrow> <mi> 一种<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo stretchy="false"> ）<GydF4y2Ba/mo> <mo> ×<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <msup> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mo> -<GydF4y2Ba/mo> <mn> 3.<GydF4y2Ba/mn> </mrow> </msup> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> +<GydF4y2Ba/mo> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></p> </div> <p></p> <p>这里，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> 一种<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>为上一个时间步长的加速度输入，其中:<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>如果模拟终止，则为<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> </mrow> </math></span>．<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>如果<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msubsup> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mi> V.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> <<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>，否则<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> </mrow> </math></span>．<GydF4y2Ba/p></li> </ul> </div> <p>对于横向控制器(RL Agent2):<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>来自环境的观察结果包含横向测量：横向偏差<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi mathvariant="italic"> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>，相对横摆角<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi mathvariant="italic"> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>,他们的衍生品<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <munderover accent="true"> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow></mrow> <mrow> <mo stretchy="false"> ˙<GydF4y2Ba/mo> </mrow> </munderover> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>和<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <munderover accent="true"> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow></mrow> <mrow> <mo stretchy="false"> ˙<GydF4y2Ba/mo> </mrow> </munderover> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>，他们的积分<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mrow> <mo> ∫<GydF4y2Ba/mo> <mrow> <msub> <mrow> <mi mathvariant="italic"> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </mrow> </mrow> </math></span>和<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mo> ∫<GydF4y2Ba/mo> <msub> <mrow> <mi mathvariant="italic"> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>．<GydF4y2Ba/p></li> <li><p>动作信号由离散转向角动作组成，其在1度（0.0175Rad）的步长的-15度（-0.2618 rad）到15度（0.2618 rad）的离散转向角动作。<GydF4y2Ba/p></li> <li><p>奖励<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true"> <msub> <mrow> <mi mathvariant="italic"> R.<GydF4y2Ba/mi> </mrow> <mrow> <mi mathvariant="italic"> T.<GydF4y2Ba/mi> </mrow> </msub> </math></span>，每次都提供<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> T.<GydF4y2Ba/mi> </mrow> </math></span>,是<GydF4y2Ba/p></li> </ul> </div> <p></p> <div class="code_responsive"> <p class="programlistingindent"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> R.<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mo> -<GydF4y2Ba/mo> <mo stretchy="false"> （<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <msubsup> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> +<GydF4y2Ba/mo> <mn> 5.<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <msubsup> <mrow> <mi> 你<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo stretchy="false"> ）<GydF4y2Ba/mo> <mo> ×<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <msup> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mo> -<GydF4y2Ba/mo> <mn> 3.<GydF4y2Ba/mn> </mrow> </msup> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0.<GydF4y2Ba/mn> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> +<GydF4y2Ba/mo> <mn> 2<GydF4y2Ba/mn> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></p> </div> <p></p> <p>这里，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> 你<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>是前一步的转向输入，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> 一种<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>为上一个时间步长的加速度输入，其中:<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>如果模拟终止，则为<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> </mrow> </math></span>．<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mtext></mtext> </mrow> </math></span><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msubsup> <mrow> <mi> E.<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> <<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> <mo stretchy="false"> ．<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> <mn> 1<GydF4y2Ba/mn> <mtext></mtext> </mrow> </math></span>，否则<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0.<GydF4y2Ba/mn> <mtext></mtext> </mrow> </math></span>．<GydF4y2Ba/p></li> </ul> </div> <p>奖赏功能的逻辑术语(<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>那<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>,<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> T.<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>)惩罚代理如果模拟提前结束，同时鼓励代理使横向误差和速度误差都很小。<GydF4y2Ba/p> <p>创建纵向控制回路的观察和动作规范。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>obsInfo1 = rlNumericSpec([3 1]);actInfo1 = rlNumericSpec([1 1]，<GydF4y2Baspan style="color:#A020F0">'lowerimit'<GydF4y2Ba/span>3,<GydF4y2Baspan style="color:#A020F0">'上限'<GydF4y2Ba/span>2);<GydF4y2Ba/pre> </div> </div> </div> <p>创建横向控制回路的观察和动作规范。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>obsInfo2 = rlNumericSpec([6 1]);actInfo2 = rlFiniteSetSpec((15:15) *π/ 180);<GydF4y2Ba/pre> </div> </div> </div> <p>将观察和动作规范结合为单元阵列。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>ObsInfo = {ObsInfo1，ObsInfo2};Actinfo = {Actinfo1，Actinfo2};<GydF4y2Ba/pre> </div> </div> </div> <p>创建一个Simul金宝appink环境接口，指定两个代理块的块路径。块路径的顺序必须与观察和动作规范单元阵列的顺序匹配。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>blks = mdl + [<GydF4y2Baspan style="color:#A020F0">“/ rl代理1”<GydF4y2Ba/span>那<GydF4y2Baspan style="color:#A020F0">“/ rl代理2”<GydF4y2Ba/span>];env = rl金宝appsimulinkenv（mdl，blks，obsinfo，Actinfo）;<GydF4y2Ba/pre> </div> </div> </div> <p>使用该环境为环境指定重置函数<GydF4y2Bacode class="literal">ResetFcn<GydF4y2Ba/code>财产。这个函数<GydF4y2Bacode class="literal">pfcResetFcn<GydF4y2Ba/code>在训练期间的每一集开始时，随机设置领头和自我战车的初始姿态。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>env.resetfcn = @pfcresetfcn;<GydF4y2Ba/pre> </div> </div> </div> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-3">创造代理人<GydF4y2Ba/h3> <p>对于本例，您将创建两个强化学习代理。首先，确定随机种子的重现性。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>RNG（0）<GydF4y2Ba/pre> </div> </div> </div> <p>两个代理在该示例中在相同的采样时间下运行。设置采样时间值（以秒为单位）。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>ts = 0.1;<GydF4y2Ba/pre> </div> </div> </div> <h4 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-4">纵向控制<GydF4y2Ba/h4> <p>用于纵向控制回路的试剂是DDPG剂。DDPG代理近似于使用批评值函数表示，使用批评值函数表示来达到长期奖励，并使用Actor策略表示选择操作。有关创建深度神经网络价值函数和策略表示的更多信息，请参阅<一种href="//www.tatmou.com/help/reinforcement-learning/ug/create-policy-and-value-function-representations.html" class="a">创建策略和值函数表示<GydF4y2Ba/a>．<GydF4y2Ba/p> <p>使用<GydF4y2Bacode class="literal">createCCAgent<GydF4y2Ba/code>函数创建用于纵向控制的DDPG代理。该制剂的结构类似于<一种href="//www.tatmou.com/help/reinforcement-learning/ug/train-ddpg-agent-for-adaptive-cruise-control.html" class="a">训练自适应巡航控制的DDPG Agent<GydF4y2Ba/a>的例子。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>Agent1 = CreateAccagent（ObsInfo1，Actinfo1，TS）;<GydF4y2Ba/pre> </div> </div> </div> <h4 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-5">横向控制<GydF4y2Ba/h4> <p>横向控制回路的代理是DQN代理。DQN代理近似于使用批评价值函数表示给定的长期奖励和操作。<GydF4y2Ba/p> <p>使用<GydF4y2Bacode class="literal">createlkaagent.<GydF4y2Ba/code>函数创建用于横向控制的DQN代理。该制剂的结构类似于<一种href="//www.tatmou.com/help/reinforcement-learning/ug/train-dqn-agent-for-lane-keeping-assist.html" class="a">对DQN代理进行车道保持协助培训<GydF4y2Ba/a>的例子。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>agent2 = createLKAAgent (obsInfo2 actInfo2, Ts);<GydF4y2Ba/pre> </div> </div> </div> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-6">培训代理商<GydF4y2Ba/h3> <p>指定培训选项。对于此示例，请使用以下选项。<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>每一集最多5000集，每一集最多持续<GydF4y2Bacode class="literal">maxsteps<GydF4y2Ba/code>时间步骤。<GydF4y2Ba/p></li> <li><p>在Episode Manager对话框中显示培训进度（设置<GydF4y2Bacode class="literal">详细的<GydF4y2Ba/code>和<GydF4y2Bacode class="literal">情节<GydF4y2Ba/code>选项)。<GydF4y2Ba/p></li> <li><p>当分别收到大于480和1195的平均奖励时，停止培训DDPG和DQN代理。当一个代理达到其停止标准时，它会模拟自己的政策而不学习，而另一个代理继续培训。<GydF4y2Ba/p></li> </ul> </div> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>Tf = 60;<GydF4y2Baspan style="color:#228B22">%的仿真时间<GydF4y2Ba/span>maxepisodes = 5000;maxsteps =装天花板(Tf / Ts);trainingOpts = rlTrainingOptions (<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“MaxEpisodes”<GydF4y2Ba/span>，maxepisodes，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“MaxStepsPerEpisode”<GydF4y2Ba/span>maxsteps,<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“详细”<GydF4y2Ba/span>假的,<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'plots'<GydF4y2Ba/span>那<GydF4y2Baspan style="color:#A020F0">'培训 - 进步'<GydF4y2Ba/span>那<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'stoptrinaincriteria'<GydF4y2Ba/span>那<GydF4y2Baspan style="color:#A020F0">“AverageReward”<GydF4y2Ba/span>那<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“StopTrainingValue”<GydF4y2Ba/span>，[480,1195]）;<GydF4y2Ba/pre> </div> </div> </div> <p>训练特工使用<一种href="//www.tatmou.com/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html" class="a"><code class="olink">火车<GydF4y2Ba/code></a>函数。训练这些代理是一个计算密集型的过程，需要几分钟才能完成。为了节省运行此示例的时间，请通过设置加载预先训练过的代理<GydF4y2Bacode class="literal">用圆形<GydF4y2Ba/code>到<GydF4y2Bacode class="literal">假<GydF4y2Ba/code>．自己训练代理人，设置<GydF4y2Bacode class="literal">用圆形<GydF4y2Ba/code>到<GydF4y2Bacode class="literal">真正的<GydF4y2Ba/code>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>doTraining = false;<GydF4y2Baspan style="color:#0000FF">如果<GydF4y2Ba/span>用圆形<GydF4y2Baspan style="color:#228B22">％训练代理人。<GydF4y2Ba/span>trainingStats =火车([agent1 agent2], env, trainingOpts);<GydF4y2Baspan style="color:#0000FF">其他的<GydF4y2Ba/span><span style="color:#228B22">%为示例加载预先训练过的代理。<GydF4y2Ba/span>加载（<GydF4y2Baspan style="color:#A020F0">'rlpfcagents.mat'<GydF4y2Ba/span>）<GydF4y2Baspan style="color:#0000FF">结束<GydF4y2Ba/span></pre> </div> </div> </div> <p>下图显示了两个代理的训练进度快照。<GydF4y2Ba/p> <div class="informalfigure"> <div id="d123e19074" class="mediaobject"> <p><img src="//www.tatmou.com/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_02.png" alt=""></p> </div> </div> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-7">模拟代理<GydF4y2Ba/h3> <p>要验证培训的代理的性能，请通过取消注释以下命令来模拟Simulink环境中的代理。金宝app有关代理模拟的更多信息，请参阅<一种href="//www.tatmou.com/help/reinforcement-learning/ref/rlsimulationoptions.html" class="a"><code class="olink">rlSimulationOptions<GydF4y2Ba/code></a>和<一种href="//www.tatmou.com/help/reinforcement-learning/ref/rl.env.abstractenv.sim.html" class="a"><code class="olink">sim卡<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre><span style="color:#228B22">％simoptions = rlsimulationoptions（'maxsteps'，maxsteps）;<GydF4y2Ba/span><span style="color:#228B22">% experience = sim(env，[agent1, agent2]，simOptions);<GydF4y2Ba/span></pre> </div> </div> </div> <p>要使用确定性初始条件展示培训的代理，请在Simulink中模拟模型。金宝app<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>e1_initial = -0.4;e2_initial = 0.1;x0_lead = 80;sim (mdl)<GydF4y2Ba/pre> </div> </div> </div> <p>下图是模拟开始时，领头车领先自我车70米时的结果。<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>引车的速度从24米/秒周期性地变化到30米/秒(右上图)。ego汽车在整个模拟过程中保持安全距离(右下图)。<GydF4y2Ba/p></li> <li><p>自我汽车从0到30秒追踪设定的速度（右上角）并体验一些加速度（左上绘图）。之后，加速度降低到0。<GydF4y2Ba/p></li> <li><p>左下角显示横向偏差。如图所示，横向偏差在1秒内大大降低。横向偏差仍然小于0.1μm。<GydF4y2Ba/p></li> </ul> </div> <p><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tatmou.com/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_03.png" alt=""></span></span><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tatmou.com/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_04.png" alt=""></span></span></p> <p><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tatmou.com/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_05.png" alt=""></span></span><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tatmou.com/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_06.png" alt=""></span></span></p> </div> <h2 id="d123e19121">也可以看看<GydF4y2Ba/h2> <p><span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/reinforcement-learning/ref/rlsimulinkenv.html"><span itemprop="name"><code class="olink">Rl金宝appsimulinkenv.<GydF4y2Ba/code></span></a></span>|<GydF4y2Baspan itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html"><span itemprop="name"><code class="function">火车<GydF4y2Ba/code></span></a></span></p> <h2 id="d123e19129">相关的话题<GydF4y2Ba/h2> <ul> <li><a href="//www.tatmou.com/help/reinforcement-learning/ug/train-reinforcement-learning-agents.html" class="a">火车加固学习代理<GydF4y2Ba/a></li> </ul> </section> </div> <div class="modal fade" id="open-example-dialog" tabindex="-1" role="dialog" aria-labelledby="openExampleDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×<GydF4y2Ba/span></button> <h2 class="modal-title">开放的例子<GydF4y2Ba/h2> </div> <div class="modal-body" id="dialog-body"> <p>您有这个示例的修改版本。您想打开这个示例与您的编辑吗?<GydF4y2Ba/p> </div> <div class="modal-footer"> <a id="open-example-dialog-replace" class="btn btn_color_blue companion_btn" data-dismiss="modal">不，请覆盖修改后的版本<GydF4y2Ba/a> <a id="open-example-dialog-continue" class="btn btn_color_blue" data-dismiss="modal">是的<GydF4y2Ba/a> </div> </div> </div> </div> <div class="clearfix"></div> <div align="center" class="feedbackblock"> <iframe id="doc_survey"></iframe> </div> </section> <div class="modal fade" id="matlab-command-dialog" tabindex="-1" role="dialog" aria-labelledby="matlabCommandDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×<GydF4y2Ba/span></button> <h2 class="modal-title">MATLAB命令<GydF4y2Ba/h2> </div> <div class="modal-body" id="dialog-body"> <p>你点击一个链接对应于这个MATLAB命令:<GydF4y2Ba/p> <pre id="dialog-matlab-command"></pre> <p>通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app<GydF4y2Ba/p> </div> <div class="modal-footer"> <button type="button" class="btn btn_secondary" data-dismiss="modal">关<GydF4y2Ba/button> </div> </div> </div> </div> <div id="location_content" style="display:none;"></div> <div class="modal fade" id="country-unselected" tabindex="-1" role="dialog" aria-labelledby="country-unselected-title" translate="no"> <div id="country-select-container"> <div class="modal-dialog modal-lg"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×<GydF4y2Ba/span></button> <img alt="Mathworks.GydF4y2Ba" src="//www.tatmou.com/images/responsive/global/pic-header-mathworks-logo2.svg" style="width:167px; height:auto;"> </div> <div class="modal-body"> <div class="row add_margin_40"> <div class="col-xs-12"> <h1 class="icon-globe icon_color_secondary" id="country-unselected-title">选择网站<GydF4y2Ba/h1> <p>选择一个网站，以便在可用的地方进行翻译的内容，并查看本地活动和优惠。根据您的位置，我们建议您选择：<GydF4y2Bastrong class="recommended-country"></strong>．<GydF4y2Ba/p> <a href="#" id="recommended_domain_button" class="btn btn_color_blue containsResourceName resourceClass-button">选择<GydF4y2Baspan class="recommended-country"></span>网站<GydF4y2Ba/a> </div> </div> <p>你也可以从以下列表中选择一个网站:<GydF4y2Ba/p> <div class="alert alert-warning" id="china_performance_alert" style="display:none;"> <span class="alert_icon icon-alert-warning"></span> <h2>如何获得最佳网站性能<GydF4y2Ba/h2> <p>选择中国网站（以中文或英文）以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。<GydF4y2Ba/p> </div> <div class="row add_margin_30"> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">美洲<GydF4y2Ba/h3> <ul class="list-unstyled"> <li><a href="https://la.mathworks.com" class="domain_selector_link" data-country-code="LA" data-subdomain="la" data-lang="es" data-default-lang="true" data-selected-text="América Latina" data-recommended-text="América Latina" data-do-not-rewrite="true">美国拉丁<GydF4y2Ba/a>(西班牙语)<GydF4y2Ba/li> <li><a href="//www.tatmou.com" class="domain_selector_link" data-country-code="CA" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">加拿大<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="//www.tatmou.com" class="domain_selector_link" data-country-code="US" data-subdomain="www" data-lang="en" data-default-lang="true" data-selected-text="United States" data-recommended-text="United States" data-do-not-rewrite="true">美国<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> </ul> </div> <div class="col-sm-4 col-md-6"> <h3 class="add_bottom_rule">欧洲<GydF4y2Ba/h3> <div class="row"> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled add_margin_0_sm"> <li><a href="https://nl.mathworks.com" class="domain_selector_link" data-country-code="BE" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">比利时<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://se.mathworks.com" class="domain_selector_link" data-country-code="DK" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">丹麦<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://de.mathworks.com" class="domain_selector_link" data-country-code="DE" data-subdomain="de" data-lang="de" data-default-lang="true" data-selected-text="Deutschland" data-recommended-text="Deutschland" data-do-not-rewrite="true">德意志<GydF4y2Ba/a>(德语)<GydF4y2Ba/li> <li><a href="https://es.mathworks.com" class="domain_selector_link" data-country-code="ES" data-subdomain="es" data-lang="es" data-default-lang="true" data-selected-text="España" data-recommended-text="España" data-do-not-rewrite="true">西班牙<GydF4y2Ba/a>(西班牙语)<GydF4y2Ba/li> <li><a href="https://se.mathworks.com" class="domain_selector_link" data-country-code="FI" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">芬兰<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://fr.mathworks.com" class="domain_selector_link" data-country-code="FR" data-subdomain="fr" data-lang="fr" data-default-lang="true" data-selected-text="France" data-recommended-text="France" data-do-not-rewrite="true">法国<GydF4y2Ba/a>（Français）<GydF4y2Ba/li> <li><a href="https://uk.mathworks.com" class="domain_selector_link" data-country-code="IE" data-subdomain="uk" data-lang="en" data-do-not-rewrite="true">爱尔兰<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://it.mathworks.com" class="domain_selector_link" data-country-code="IT" data-subdomain="it" data-lang="it" data-default-lang="true" data-selected-text="Italia" data-recommended-text="Italia" data-do-not-rewrite="true">意大利<GydF4y2Ba/a>(意大利语)<GydF4y2Ba/li> <li><a href="https://nl.mathworks.com" class="domain_selector_link" data-country-code="LU" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">卢森堡<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> </ul> </div> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled"> <li><a href="https://nl.mathworks.com" class="domain_selector_link" data-country-code="NL" data-subdomain="nl" data-lang="en" data-default-lang="true" data-selected-text="Benelux" data-recommended-text="Netherlands" data-do-not-rewrite="true">荷兰<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://se.mathworks.com" class="domain_selector_link" data-country-code="NO" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">挪威<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://de.mathworks.com" class="domain_selector_link" data-country-code="AT" data-subdomain="de" data-lang="de" data-do-not-rewrite="true">Österreich.<GydF4y2Ba/a>(德语)<GydF4y2Ba/li> <li><a href="//www.tatmou.com" class="domain_selector_link" data-country-code="PT" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">葡萄牙<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://se.mathworks.com" class="domain_selector_link" data-country-code="Sweden" data-subdomain="se" data-lang="en" data-default-lang="true" data-selected-text="Nordic" data-recommended-text="Sweden" data-do-not-rewrite="true">瑞典<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li>瑞士<你L.class="list-unstyled add_indent_20"> <li><a href="https://ch.mathworks.com" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="de" data-selected-text="Schweiz" data-recommended-text="Schweiz" data-do-not-rewrite="true">多伊奇<GydF4y2Ba/a></li> <li><a href="https://ch.mathworks.com" id="swiss_english" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="en" data-default-lang="true" data-selected-text="Switzerland" data-recommended-text="Switzerland" data-do-not-rewrite="true">英语<GydF4y2Ba/a></li> <li><a href="https://ch.mathworks.com" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="fr" data-selected-text="Suisse" data-recommended-text="Suisse" data-do-not-rewrite="true">Français.<GydF4y2Ba/a></li> </ul></li> <li><a href="https://uk.mathworks.com" class="domain_selector_link" data-country-code="GB" data-subdomain="uk" data-lang="en" data-default-lang="true" data-selected-text="United Kingdom" data-recommended-text="United Kingdom" data-do-not-rewrite="true">联合王国<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> </ul> </div> </div> </div> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">亚太地区<GydF4y2Ba/h3> <ul class="list-unstyled"> <li><a href="https://au.mathworks.com" class="domain_selector_link" data-country-code="AU" data-subdomain="au" data-lang="en" data-default-lang="true" data-selected-text="Australia" data-recommended-text="Australia" data-do-not-rewrite="true">澳大利亚<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://in.mathworks.com" class="domain_selector_link" data-country-code="IN" data-subdomain="in" data-lang="en" data-default-lang="true" data-selected-text="India" data-recommended-text="India" data-do-not-rewrite="true">印度<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li><a href="https://au.mathworks.com" class="domain_selector_link" data-country-code="NZ" data-subdomain="au" data-lang="en" data-do-not-rewrite="true">新西兰<GydF4y2Ba/a>(英语)<GydF4y2Ba/li> <li>中国<你L.class="list-unstyled add_indent_20"> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="zh" data-default-lang="true" data-selected-text="中国" data-recommended-text="中国" data-do-not-rewrite="true">简体中文<GydF4y2Ba/a></li> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="en" data-default-lang="true" data-selected-text="China" data-recommended-text="China" data-do-not-rewrite="true">英语<GydF4y2Ba/a></li> </ul></li> <li><a href="https://jp.mathworks.com" class="domain_selector_link" data-country-code="JP" data-subdomain="jp" data-lang="ja" data-default-lang="true" data-selected-text="日本" data-recommended-text="日本" data-do-not-rewrite="true">日本<GydF4y2Ba/a>(日本語)<GydF4y2Ba/li> <li><a href="https://kr.mathworks.com" class="domain_selector_link" data-country-code="KR" data-subdomain="kr" data-lang="ko" data-default-lang="true" data-selected-text="한국" data-recommended-text="한국" data-do-not-rewrite="true">한국<GydF4y2Ba/a>(한국어)<GydF4y2Ba/li> </ul> </div> </div> <p class="text-center"><a href="#" class="worldwide_link">与当地办事处联系<GydF4y2Ba/a></p> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="cta_container_mobile visible-sm visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">试用软件<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>试用软件<GydF4y2Ba/a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">产品更新<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>产品更新<GydF4y2Ba/a></li> </ul> </div> </div> </div> </div> </div>   <div class="body_trail_container"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="row"> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tatmou.com/help/reinforcement-learning/index.html?s_cid=doc_ftr">强化学习工具箱文档<GydF4y2Ba/a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tatmou.com/help/reinforcement-learning/examples.html?s_cid=doc_ftr">例子<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/help/reinforcement-learning/referencelist.html?type=function&s_cid=doc_ftr">功能及其他参考<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/help/reinforcement-learning/release-notes.html?s_cid=doc_ftr">发布说明<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/help/pdf_doc/reinforcement-learning/index.html?s_cid=doc_ftr">PDF文档<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tatmou.com/support.html?s_cid=doc_ftr">金宝app</a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tatmou.com/matlabcentral/answers/index?s_cid=doc_ftr">MATLAB的答案<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/support/install-matlab.html?s_cid=doc_ftr">安装帮助<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/support/bugreports/?s_cid=doc_ftr">错误报告<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/support/requirements/product-requirements-platform-availability-list.html?s_cid=doc_ftr">产品需求<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/downloads/?s_cid=doc_ftr">软件下载<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <div class="panel panel_color_transparent panel_color_fill"> <div class="panel-body"> <div class="thumbnail add_margin_5"> <a href="//www.tatmou.com/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer"><img class="fluid_image" alt="强化学习与MATLAB和Simulink金宝appGydF4y2Ba" src="//www.tatmou.com/content/dam/mathworks/mathworks-dot-com/images/responsive/supporting/campaigns/products/reinforcement-learning-ebook-offer-thumbnail.jpg"></a> </div> <h4><a href="//www.tatmou.com/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">强化学习与MATLAB和Simulink金宝app<GydF4y2Ba/a></h4> <a class="icon-download" href="//www.tatmou.com/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">下载电子书<GydF4y2Ba/a> </div> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer" class="bs-footer">  <div class="container-fluid"> <div class="fat_footer_container"> <div class="execmatlabweb">  <div class="row"> <div class="col-xs-12 col-md-12 col-lg-9 col-lg-push-3 add_margin_20"> <div class="row"> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title">探索产品下载188bet金宝搏<GydF4y2Ba/p> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/products/matlab.html?s_tid=hp_ff_p_matlab">MATLAB<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/products/simulink.html?s_tid=hp_ff_p_simulink">金宝app</a></li> <li><a href="//www.tatmou.com/products/matlab/student.html?s_tid=hp_ff_p_student">学生的软件<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/hardware-support/home.html?s_tid=hp_ff_p_hwsupport">硬件支持金宝app<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/matlabcentral/fileexchange/?s_tid=hp_ff_p_fx">文件交换<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title">尝试或购买<GydF4y2Ba/p> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/downloads/web_downloads/?s_iid=hp_ff_t_downloads">下载<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/campaigns/products/trials.html?s_iid=hp_ff_p_trial">试用软件<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/company/aboutus/contact_us/contact_sales.html?s_iid=hp_ff_t_sales">联系销售<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/pricing-licensing.html?s_iid=hp_ff_t_pricing">定价和许可<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/store/?s_tid=hp_ff_t_buy">如何购买<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title">学习使用<GydF4y2Ba/p> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/help/?s_tid=hp_ff_l_doc">文件<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/support/learn-with-matlab-tutorials.html?s_tid=hp_ff_l_tutorials">教程<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/help/examples.html?s_tid=hp_ff_l_examples">例子<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/videos.html?s_tid=hp_ff_l_videos">视频和网络研讨会<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/services/training.html?s_tid=hp_ff_l_training">培训<GydF4y2Ba/a></li> </ul> </div> <div class="clearfix" id="offcanvas_clearfix" style="display:none"></div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title">得到支持金宝app<GydF4y2Ba/p> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/help/install/?s_tid=hp_ff_s_install">安装帮助<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/matlabcentral/answers/index?s_tid=hp_ff_s_answers">答案<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/services/consulting.html?s_tid=hp_ff_s_consulting">咨询<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/licensecenter/?s_tid=hp_ff_s_license">授权中心<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/support/contact_us.html?s_tid=hp_ff_s_support">联系支持金宝app<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title">关于<GydF4y2Baspan translate="no">Mathworks.<GydF4y2Ba/span></p> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/company/jobs/opportunities.html?s_tid=hp_ff_a_careers">职业生涯<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/company/newsroom.html?s_tid=hp_ff_a_newsroom">编辑部<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/company/aboutus/soc_mission.html?s_tid=hp_ff_a_socialmission">社会使命<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/company/aboutus/contact_us/contact_sales.html?s_tid=hp_ff_a_sales">联系销售<GydF4y2Ba/a></li> <li><a href="//www.tatmou.com/company.html?s_tid=hp_ff_a_company">关于<GydF4y2Baspan translate="no">Mathworks.<GydF4y2Ba/span></a></li> </ul> </div> </div> </div> <div class="col-xs-12 col-md-12 col-lg-3 col-lg-pull-9"> <p class="h4 add_font_futura_medium add_margin_0"><span translate="no">Mathworks.<GydF4y2Ba/span></p> <p><em>加快工程和科学的步伐<GydF4y2Ba/em></p> <p><span translate="no">Mathworks.<GydF4y2Ba/span>是工程师和科学家的数学计算软件的领先开发商。<GydF4y2Ba/p> <p><a href="//www.tatmou.com/discovery.html?s_tid=all_disc_mw_ff">发现……<GydF4y2Ba/a></p> </div> </div> </div> </div> </div>  <div class="container-fluid"> <div class="footer" translate="no"> <div class="row"> <div class="col-xs-12 col-md-9"> <ul class="countrynav" id="countrynav"> <li class="footernav_country"><a href="#" data-toggle="modal" data-target="#country-unselected"><span class="icon-globe icon_color_quinary icon_16"></span>美国<GydF4y2Ba/a></li> </ul> <div class="clearfix"></div> <ul class="footernav"> <li class="footernav_patents"><a href="//www.tatmou.com/company/aboutus/policies_statements/patents.html?s_tid=gf_pat">专利<GydF4y2Ba/a></li> <li class="footernav_trademarks"><a href="//www.tatmou.com/company/aboutus/policies_statements/trademarks.html?s_tid=gf_trd">商标<GydF4y2Ba/a></li> <li class="footernav_privacy"><a href="//www.tatmou.com/company/aboutus/policies_statements.html?s_tid=gf_priv">隐私政策<GydF4y2Ba/a></li> <li class="footernav_piracy"><a href="//www.tatmou.com/company/aboutus/policies_statements/piracy.html?s_tid=gf_pir">防止盗版<GydF4y2Ba/a></li> <li class="footernav_status"><a href="https://status.mathworks.com/?s_tid=gf_application">应用程序状态<GydF4y2Ba/a></li> </ul> <div class="clearfix"></div> <div class="clearfix"></div> <p class="copyright" translate="no">©1994-2021 The MathWorks公司<GydF4y2Ba/p> </div> <div class="clearfix visible-sm add_margin_10"></div> <div class="col-xs-12 col-md-3"> <div class="social_media"> <ul class="social_media_icons"> <li><a href="https://www.facebook.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-facebook.svg" alt="脸谱网GydF4y2Ba" class="ico_facebook"></a></li> <li><a href="https://www.twitter.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-twitter.svg" alt="推特GydF4y2Ba" class="ico_twitter"></a></li> <li><a href="https://www.instagram.com/matlab/" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_instagram" alt="Instagram.GydF4y2Ba" src="//www.tatmou.com/etc.clientlibs/mathworks/clientlibs/customer-ui/templates/common/resources/images/ico-instagram.svg"></a></li> <li><a href="https://www.youtube.com/user/MATLAB" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_youtube" alt="YouTubeGydF4y2Ba" src="//www.tatmou.com/images/responsive/global/ico-youtube.svg"></a></li> <li><a href="https://www.linkedin.com/company/the-mathworks_2" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-linkedin.svg" alt="linkedinGydF4y2Ba" class="ico_linkedin"></a></li> <li><a href="//www.tatmou.com/company/rss.html" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-rss.svg" alt="rss.GydF4y2Ba" class="ico_rss"></a></li> </ul> <div class="clearfix"></div> <p><em>加入谈话<GydF4y2Ba/em></p> </div> </div> </div> </div> <div id="cookie-banner-text" style="display:none;"></div>   </div> </footer> </div> </div>  </body> </html>