创建Simul金宝appink环境和火车代理 - Matlab＆Simulink - Mathworks France据/title> <link href="//www.tatmou.com/fr/includes_content/responsive/css/bootstrap/bootstrap.min.css" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6_lg.css?202109" rel="stylesheet" media="screen and (min-width: 1200px)"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6_md.css?202109" rel="stylesheet" media="screen and (min-width: 992px) and (max-width: 1199px)"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6_sm+xs.css?202109" rel="stylesheet" media="screen and (max-width: 991px)"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6_sm.css?202109" rel="stylesheet" media="screen and (min-width: 768px) and (max-width: 991px)"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6_xs.css?202109" rel="stylesheet" media="screen and (max-width: 767px)"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site6_offcanvas_v2.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/site7_crux.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/fr/includes_content/responsive/css/localized/site6_fr.css" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/fr/includes_content/releases/R2021b/css/doc_center.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tatmou.com/fr/includes_content/releases/R2021b/css/doc_center_print.css?202109" rel="stylesheet" type="text/css" media="print"> <link href="//www.tatmou.com/fr/includes_content/releases/R2021b/css/doc_center_fr.css?202109" rel="stylesheet" type="text/css"> <style> .examples_short_list a.btn {display: none;} </style> <style> .typeahead_container.typeahead_type_grouped { margin-left:0; } @media (min-width:768px) { #suggestions { margin-left:-100px } } </style> </head> <body id="responsive_offcanvas"> <a class="skip_link sr-only" href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#content_container">跳到内容据/a>  <div class="header visible-xs visible-sm" id="header_mobile" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="navbar-header"> <div class="container-fluid"> <div class="row"> <div class="col-xs-3"> <button type="button" class="navbar-toggle topnav_toggle" data-toggle="collapse" data-target="#topnav_collapse"><span class="sr-only">切换主导航据/span><span class="icon-menu"></span></button> </div> <div class="col-xs-6"> <div class="text-center"> <a href="//www.tatmou.com/fr/?s_tid=gn_logo" class="svg_link navbar-brand"><img src="//www.tatmou.com/fr/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="MathWorks"></a> </div> </div> <div class="col-xs-3"> <div class="matrix_affordance_container_mobile" id="matrix_affordance_container_mobile"></div> </div> </div> </div> </div> <div class="container-fluid"> <div class="row visible-xs visible-sm"> <div class="col-xs-12"> <div class="navbar-collapse collapse" id="topnav_collapse"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tatmou.com/fr/products.html?s_tid=gn_ps">潜营培训据/a></li> <li class="topnav_solutions "><a href="//www.tatmou.com/fr/solutions.html?s_tid=gn_sol">金宝搏官方网站</a></li> <li class="topnav_academia "><a href="//www.tatmou.com/fr/academia.html?s_tid=gn_acad">Le MondeAcadémique据/a></li> <li class="topnav_support "><a href="//www.tatmou.com/fr/support.html?s_tid=gn_supp">金宝app</a></li> <li class="topnav_community "><a href="//www.tatmou.com/fr/matlabcentral/?s_tid=gn_mlc">communauté.据/a></li> <li class="topnav_events "><a href="//www.tatmou.com/fr/company/events.html?s_tid=gn_ev">Événements.据/a></li> <li class="headernav_store"><a href="//www.tatmou.com/fr/products/get-matlab.html?s_tid=gn_getml">Obtenir MATLAB据/a></li> </ul> </div> <div class="navbar-collapse collapse" id="matrix_collapse"> <div class="matrix_menu_container_mobile" id="matrix_menu_container_mobile"></div> </div> </div> </div> </div> </nav> </div>   <div class="header hidden-xs hidden-sm" id="header_desktop" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="container-fluid"> <div class="row"> <div class="col-md-9"> <div class="navbar-header"> <div class="logo_container hidden-xs hidden-sm"> <a href="//www.tatmou.com/fr/?s_tid=gn_logo" class="svg_link pull-left"><img src="//www.tatmou.com/fr/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="MathWorks"></a> </div> <div class="navbar-collapse collapse hidden-xs hidden-sm"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tatmou.com/fr/products.html?s_tid=gn_ps">潜营培训据/a></li> <li class="topnav_solutions "><a href="//www.tatmou.com/fr/solutions.html?s_tid=gn_sol">金宝搏官方网站</a></li> <li class="topnav_academia "><a href="//www.tatmou.com/fr/academia.html?s_tid=gn_acad">Le MondeAcadémique据/a></li> <li class="topnav_support "><a href="//www.tatmou.com/fr/support.html?s_tid=gn_supp">金宝app</a></li> <li class="topnav_community "><a href="//www.tatmou.com/fr/matlabcentral/?s_tid=gn_mlc">communauté.据/a></li> <li class="topnav_events "><a href="//www.tatmou.com/fr/company/events.html?s_tid=gn_ev">Événements.据/a></li> </ul> </div> </div> </div> <div class="col-md-3"> <div class="collapse navbar-collapse" id="headernav_collapse"> <ul class="nav navbar-nav navbar-right" id="headernav"> <li class="headernav_store"><a href="//www.tatmou.com/fr/products/get-matlab.html?s_tid=gn_getml" class="btn btn_color_blue companion_btn btn-xs">Obtenir MATLAB据/a></li> </ul> </div> </div> </div> </div> </nav> </div>    <div class="section_header level_3"> <div class="container-fluid"> <div class="row" id="mobile_search_row"> <div class="col-sm-6 col-md-7 has_horizontal_local_nav" id="section_header_title"> <div class="section_header_content"> <div class="section_header_title"> <p class="h1"><a xmlns="http://www.w3.org/1999/xhtml" href="//www.tatmou.com/fr/help/index.html" class="coming_from_product">文件据/a><a xmlns="http://www.w3.org/1999/xhtml" href="//www.tatmou.com/fr/help/index.html" class="not_coming_from_product"><span class="doc_section_title">帮助中心据/span><span class="archived_doc_section_title">文件据/span></a></p> </div> </div> </div> <div class="col-xs-12 col-sm-6 col-md-5" id="mobile_search"> <div class="search_nested_content_container"> <div id="search_scope_support" class="collapse in"> <form id="docsearch_form" action="/support/search.html" method="get" accept-charset="utf-8" data-release="R2021b" data-language="en"> <div class="input-group"> <label class="sr-only">搜索支持金宝app据/label> <input id="suggestion" type="hidden" name="suggestion" value=""> <span role="status" aria-live="polite" class="ui-helper-hidden-accessible"></span> <input id="docsearch" class="form-control conjoined_search" type="search" name="q" placeholder="Search Support" autocomplete="off"> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">金宝app</span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu">  <li data-toggle="collapse" data-target="#search_scope_site" class="support_search_scope_trigger"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#">MathWorks据/a></li> </ul> <button type="submit" name="submitsearch" id="support_submitsearch" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> <div id="search_scope_site" class="collapse"> <form name="search" id="site_search" class="site_search" action="/search/site_search.html" method="get"> <div class="input-group"> <label class="sr-only">搜索mathworks.com.据/label> <input type="hidden" name="c[]" value="entire_site"> <input type="search" name="q" id="query" class="form-control conjoined_search" placeholder="Search MathWorks.com" autocomplete="off" \=""> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">MathWorks据/span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu"> <li data-toggle="collapse" data-target="#search_scope_support" class="site_search_scope_trigger"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#">金宝app</a></li> </ul> <button type="submit" id="searchbutton" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> </div> <button class="btn icon-remove btn_search pull-right icon_32 visible-xs" data-toggle="collapse" href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">关闭移动搜索据/span></button> </div> <div class="visible-xs" id="search_actuator"> <button class="btn icon-search btn_search pull-right icon_16" data-toggle="collapse" href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">打开移动搜索据/span></button> </div> </div> </div> </div>   <div class="row-offcanvas row-offcanvas-left"> <div class="sidebar-offcanvas" id="sidebar"> <nav class="offcanvas_nav" role="navigation"> <div class="offcanvas_actuator" data-toggle="offcanvas" data-target="#sidebar" id="nav_toggle"> <button type="button" class="btn"><span class="sr-only">Off-Canvas Navigation Menu切换据/span><span class="icon-menu"></span></button> <span class="offcanvas_actuator_label" id="translation_icon-menu" tabindex="-1" aria-hidden="true"></span>  </div> <div class="nav_list_wrapper" id="nav_list_wrapper"> <nav class="offcanvas_nav" role="navigation"> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_breadcrumb" id="ul_left_nav_ancestors"> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tatmou.com/fr/help/index.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">文档之家据/span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_disambiguation"> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/index.html?s_tid=CRUX_lftnav">加固学习工具箱据/a></li> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tatmou.com/fr/help/reinforcement-learning/getting-started-with-reinforcement-learning-toolbox.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">开始使用强化学习工具箱据/span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_disambiguation"> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/index.html?s_tid=CRUX_lftnav">加固学习工具箱据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/training-and-validation.html?s_tid=CRUX_lftnav">培训和验证据/a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_scrollspy nav"> <li class="nav_scrollspy_function"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#responsive_offcanvas">创建Simul金宝appink环境和培训代理据/a></li> <li class="nav_scrollspy_title" id="SSPY810-section">在这一页上据/li>  <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#CreateSimulinkEnvironmentAndTrainAgentExample-1" class="intrnllnk">水箱模型据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#CreateSimulinkEnvironmentAndTrainAgentExample-2" class="intrnllnk">创建环境接口据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#CreateSimulinkEnvironmentAndTrainAgentExample-3" class="intrnllnk">创建DDPG代理据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#CreateSimulinkEnvironmentAndTrainAgentExample-4" class="intrnllnk">火车代理据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#CreateSimulinkEnvironmentAndTrainAgentExample-5" class="intrnllnk">验证培训代理据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#CreateSimulinkEnvironmentAndTrainAgentExample-6" class="intrnllnk">本地函数据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#d123e1042" class="intrnllnk">也可以看看据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#d123e1048" class="intrnllnk">相关的话题据/a></li> </ul> </nav> </div> </nav> </div>   <div class="offcanvas_content_container"> <div class="sticky_header_container"> <div class="horizontal_nav"> <div class="horizontal_nav_container"> <div class="offcanvas_horizontal_nav"> <div class="container-fluid"> <div class="row"> <div class="col-sm-12 col-md-7 col-lg-8 hidden-xs"> <nav class="navbar navbar-default" role="navigation" id="subnav"> <div> <ul class="nav navbar-nav crux_browse"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文件据/a><a class="coming_from_product">全部据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/examples.html?category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">例子据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=function&category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">职能据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=block&category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">块据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=app&category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">应用程序据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tatmou.com/fr/support/search.html?fq[]=asset_type_name:video%20category:reinforcement-learning/getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav" class="not_coming_from_product">视频据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tatmou.com/fr/support/search.html?fq[]=asset_type_name:answer%20category:reinforcement-learning/getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav" class="not_coming_from_product">答案据/a></li> </ul> </div> </nav> </div> <div class="col-md-5 col-lg-4 hidden-xs hidden-sm"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">试用据/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>试用据/a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">MesesàJourdu Produit据/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>MesesàJourdu Produit据/a></li> </ul> </div> </div>  <div class="visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-9"> <div class="mobile_crux_nav_trigger">  <div class="btn-group"> <button type="button" class="btn btn-default dropdown-toggle" data-toggle="dropdown" aria-haspopup="true" aria-expanded="false">资源据span class="icon-arrow-down icon_16"></span></button> <ul class="dropdown-menu"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文件据/a><a class="coming_from_product">全部据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/examples.html?category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">例子据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=function&category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">职能据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=block&category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">块据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=app&category=getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav">应用程序据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tatmou.com/fr/support/search.html?fq[]=asset_type_name:video%20category:reinforcement-learning/getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav" class="not_coming_from_product">视频据/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tatmou.com/fr/support/search.html?fq[]=asset_type_name:answer%20category:reinforcement-learning/getting-started-with-reinforcement-learning-toolbox&s_tid=CRUX_topnav" class="not_coming_from_product">答案据/a></li> </ul> </div>  </div> </div> <div class="col-xs-3"> <div class="translate_placeholder"></div> </div> </div> </div> </div>  </div> </div> </div> </div> </div> </div> <div class="content_container" id="content_container" tabindex="-1"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div id="offcanvas_focus_actuator" tabindex="0" class="visible-xs"> <span class="sr-only">主要内容据/span> </div> <section xmlns="http://www.w3.org/1999/xhtml" id="doc_center_content" itemprop="content" lang="en" data-language="en"> <div id="pgtype-topic"> <section itemprop="content"> <h1 class="r2021b" itemprop="title content" id="mw_873bd3fc-b713-4e71-b776-9758762d592c">创建Simul金宝appink环境和培训代理据/h1> <div class="pull-right examples_short_list" style="width:250px; margin-left: 10px; margin-bottom: 10px;"> <div data-pane="metadata" style="margin-bottom: 0px;" class="panel panel-default metadata_container"> <div class="panel-body metadata_content"> <p class="add_margin_0">这个示例使用:据/p> <ul class="list-unstyled example_product_list" itemprop="requiredprods"> <li><a class="coming_from_product" href="matlab:matlab.internal.language.introspective.showAddon('RL')">加固学习工具箱据/a><a class="not_coming_from_product" href="//www.tatmou.com/fr/help/reinforcement-learning/index.html">加固学习工具箱据/a></li> <li><a class="coming_from_product" href="matlab:matlab.internal.language.introspective.showAddon('NN')">深度学习工具箱据/a><a class="not_coming_from_product" href="//www.tatmou.com/fr/help/deeplearning/index.html">深度学习工具箱据/a></li> <li><a class="coming_from_product" href="matlab:matlab.internal.language.introspective.showAddon('SL')">金宝app</a><a class="not_coming_from_product" href="//www.tatmou.com/fr/help/simulink/index.html">金宝app</a></li> </ul> <div class="clearfix add_margin_10"></div> <div class="row"> <div class="col-xs-12"> <a class="btn btn_secondary btn-block" href="matlab:openExample('control_deeplearning/CreateSimulinkEnvironmentAndTrainAgentExample')" data-ex-genre="Live Script">打开直播脚本据/a> </div> </div> </div> </div> </div> <div itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/Example" itemprop="example" class="em_example"> <meta itemprop="exampleid" content="control_deeplearning-CreateSimulinkEnvironmentAndTrainAgentExample"> <meta itemprop="exampletitle" content="Create Simulink Environment and Train Agent"> </div> <span id="CreateSimulinkEnvironmentAndTrainAgentExample" class="anchor_target"></span> <p class="shortdesc">这个例子演示了如何在据code class="literal">水缸据/code>金宝appSimulink®模型到钢筋学习深度确定性政策梯度（DDPG）代理。有关在Matlab®中列出DDPG代理的示例，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/train-ddpg-agent-to-balance-double-integrator-system.html" class="a">火车DDPG代理控制双积分系统据/a>．据/p> <div class="procedure"> <h3 class="title" id="CreateSimulinkEnvironmentAndTrainAgentExample-1">水箱模型据/h3> <p>这个例子的原始模型是水箱模型。目标是控制水箱中的水的水平。有关水箱模型的更多信息，请参阅据a href="//www.tatmou.com/fr/help/slcontrol/gs/watertank-simulink-model.html" class="a">Watertank 金宝appSimulink模型据/a><span role="cross_prod">（金宝appSimulink Control Design）据/span>．据/p> <div class="informalfigure"> <div id="d123e731" class="mediaobject"> <p><img src="//www.tatmou.com/fr/help/examples/control_deeplearning/win64/CreateSimulinkEnvironmentAndTrainAgentExample_01.png" alt="" height="241" width="756" style="width: 756px; height: 241px"></p> </div> </div> <p>修改原型号，修改如下:据/p> <div class="orderedlist"> <ol style="list-style: decimal;"> <li><p>删除PID控制器。据/p></li> <li><p>插入RL代理块。据/p></li> <li><p>连接观察向量据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msup> <mrow> <mrow> <mo> [据/mo> <mtable> <mtr> <mtd> <mrow> <mrow> <mo> ∫据/mo> <mrow> <mi mathvariant="italic"> E.据/mi> <mtext> </mtext> <mi mathvariant="normal"> DT.据/mi> </mrow> </mrow> </mrow> </mtd> <mtd> <mrow> <mi mathvariant="italic"> E.据/mi> </mrow> </mtd> <mtd> <mrow> <mi mathvariant="italic"> H据/mi> </mrow> </mtd> </mtr> </mtable> <mo> ]据/mo> </mrow> </mrow> <mrow> <mi mathvariant="italic"> T.据/mi> <mtext> </mtext> </mrow> </msup> </mrow> </math></span>,在那里据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> H据/mi> </mrow> </math></span>是水箱的高度，据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> E.据/mi> <mo> =据/mo> <mi mathvariant="italic"> R.据/mi> <mo> -据/mo> <mi mathvariant="italic"> H据/mi> </mrow> </math></span>，和据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> R.据/mi> </mrow> </math></span>为参考高度。据/p></li> <li><p>设置奖励据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="normal"> 奖励据/mi> <mo> =据/mo> <mn> 10据/mn> <mrow> <mo> （据/mo> <mrow> <mo> |据/mo> <mi mathvariant="italic"> E.据/mi> <mo> |据/mo> <mo> 据据/mo> <mn> 0.据/mn> <mo> ．据/mo> <mn> 1据/mn> </mrow> <mo> ）据/mo> </mrow> <mo> -据/mo> <mn> 1据/mn> <mrow> <mo> （据/mo> <mrow> <mo> |据/mo> <mi mathvariant="italic"> E.据/mi> <mo> |据/mo> <mo> ≥据/mo> <mn> 0.据/mn> <mo> ．据/mo> <mn> 1据/mn> </mrow> <mo> ）据/mo> </mrow> <mo> -据/mo> <mn> One hundred.据/mn> <mrow> <mo> （据/mo> <mrow> <mi mathvariant="italic"> H据/mi> <mo> ≤据/mo> <mn> 0.据/mn> <mo> |据/mo> <mo> |据/mo> <mi mathvariant="italic"> H据/mi> <mo> ≥据/mo> <mn> 20.据/mn> </mrow> <mo> ）据/mo> </mrow> </mrow> </math></span>．据/p></li> <li><p>配置终止信号，使模拟停止如果据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> H据/mi> <mo> ≤据/mo> <mn> 0.据/mn> </mrow> </math></span>或据span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tatmou.com/namespace/MathMLextensions" mwmmlx:extension="true"> <mi mathvariant="italic"> H据/mi> <mo> ≥据/mo> <mn> 20.据/mn> </math></span>．据/p></li> </ol> </div> <p>得到的模型是据code class="literal">Rlwatertank.slx.据/code>．有关此模型和更改的更多信息，请参见据a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/create-simulink-environments-for-reinforcement-learning.html" class="a">创建Simul金宝appink强化学习环境据/a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>open_system (据span style="color:#A020F0">'rlwatertank'据/span>）据/pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e880" class="mediaobject"> <p><img src="//www.tatmou.com/fr/help/examples/control_deeplearning/win64/CreateSimulinkEnvironmentAndTrainAgentExample_02.png" alt="" height="301" width="602" style="width: 602px; height: 301px"></p> </div> </div> <h3 class="title" id="CreateSimulinkEnvironmentAndTrainAgentExample-2">创建环境接口据/h3> <p>创建环境模型包括定义以下内容：据/p> <div class="itemizedlist"> <ul> <li><p>动作和观察信号是主体与环境交互的信号。有关更多信息，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rl.util.rlnumericspec.html" class="a"><code class="olink">rlnumericspec.据/code></a>和据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rl.util.rlfinitesetspec.html" class="a"><code class="olink">rlFiniteSetSpec据/code></a>．据/p></li> <li><p>奖励信号是代理用来衡量其成功的信号。有关更多信息，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/define-reward-signals.html" class="a">定义奖励信号据/a>．据/p></li> </ul> </div> <p>定义观察规范据code class="literal">obsinfo.据/code>和行动规范据code class="literal">actInfo据/code>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>obsInfo = rlNumericSpec([3 1]，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">“LowerLimit”据/span>，[-inf -inf 0]'，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'上限'据/span>，[inf inf inf]');obsInfo。Name =据span style="color:#A020F0">“观察”据/span>；obsInfo。描述=据span style="color:#A020F0">“综合误差、误差和测量高度”据/span>；numObservations = obsInfo.Dimension (1);actInfo = rlNumericSpec([1 1]);actInfo。Name =据span style="color:#A020F0">'流动'据/span>；numActions = actInfo.Dimension (1);据/pre> </div> </div> </div> <p>构建环境接口对象。据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>env = rl金宝appSimulinkEnv (据span style="color:#A020F0">'rlwatertank'据/span>那据span style="color:#A020F0">“rlwatertank / RL代理”据/span>那据span style="color:#0000FF">．．.据/span>Obsinfo，Actinfo）;据/pre> </div> </div> </div> <p>设置自定义重置函数，随机化模型的参考值。据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>env.resetfcn = @（in）localresetfcn（in）;据/pre> </div> </div> </div> <p>指定模拟时间据code class="literal">特遣部队据/code>和代理采样时间据code class="literal">Ts据/code>片刻之间。据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>ts = 1.0;tf = 200;据/pre> </div> </div> </div> <p>修复随机生成器种子的再现性。据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>rng (0)据/pre> </div> </div> </div> <h3 class="title" id="CreateSimulinkEnvironmentAndTrainAgentExample-3">创建DDPG代理据/h3> <p>给定观察和行动，DDPG代理使用批判价值函数表示近似长期奖励。要创建批评家，首先要创建一个深度神经网络，它有两个输入，一个是观察和行动，一个是输出。有关创建深度神经网络值函数表示的更多信息，请参见据a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/create-policy-and-value-function-representations.html" class="a">创建策略和价值功能表示据/a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>statepath = [featureInputLayer（numobservations，据span style="color:#A020F0">“归一化”据/span>那据span style="color:#A020F0">'没有任何'据/span>那据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“状态”据/span>）全连接列（50，据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">'批评福尔福克'据/span>）剥离（据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“CriticRelu1”据/span>) fullyConnectedLayer (25,据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">'批评福尔2'据/span>）];ActionPath = [featuredupputlayer（nations，据span style="color:#A020F0">“归一化”据/span>那据span style="color:#A020F0">'没有任何'据/span>那据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“行动”据/span>) fullyConnectedLayer (25,据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“CriticActionFC1”据/span>）];commonpath = [附加层（2，据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“添加”据/span>）剥离（据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">'批判杂志'据/span>) fullyConnectedLayer (1,据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“CriticOutput”据/span>）];批判性= layergraph（）;criticNetwork = addLayers（criticNetwork，statePath）;批评网络= addlayers（批判性，ActionPath）;批评网络= addlayers（批判性，commonpath）;批评网络= ConnectLayers（批评者，据span style="color:#A020F0">'批评福尔2'据/span>那据span style="color:#A020F0">'添加/ in1'据/span>）;批评网络= ConnectLayers（批评者，据span style="color:#A020F0">“CriticActionFC1”据/span>那据span style="color:#A020F0">“添加/ in2”据/span>）;据/pre> </div> </div> </div> <p>查看批评批评网络配置。据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>图情节（批评性）据/pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e937" class="mediaobject"> <p><img src="//www.tatmou.com/fr/help/examples/control_deeplearning/win64/CreateSimulinkEnvironmentAndTrainAgentExample_03.png" alt="图中包含一个轴对象。axis对象包含一个graphplot类型的对象。" width="583" style="width: 583px"></p> </div> </div> <p>指定使用批评者的选项据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rlrepresentationoptions.html" class="a"><code class="olink">rlrepresentationOptions.据/code></a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>批评= rlrepresentationOptions（据span style="color:#A020F0">'学习'据/span>1 e 03据span style="color:#A020F0">'gradientthreshold'据/span>1);据/pre> </div> </div> </div> <p>使用指定的深度神经网络和选项创建批评家表示。您还必须为评论家指定操作和观察规范，这是从环境接口获得的。有关更多信息，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rlqvaluerepresentation.html" class="a"><code class="olink">rlQValueRepresentation据/code></a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>评论家= rlqvalueerepresentation（批评，undernfo，Actinfo，据span style="color:#A020F0">“观察”据/span>，{据span style="color:#A020F0">“状态”据/span>}，据span style="color:#A020F0">“行动”据/span>，{据span style="color:#A020F0">“行动”据/span>}，批评）;据/pre> </div> </div> </div> <p>鉴于观察，DDPG代理决定使用演员表示采取的行动。要创建演员，首先创建一个输入的深度神经网络，一个输入，观察和一个输出，动作。据/p> <p>以与评论家类似的方式构建演员。有关更多信息，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rldeterministicactorrepresentation.html" class="a"><code class="olink">rlDeterministicActorRepresentation据/code></a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>actorNetwork = [featureInputLayer(numobobservations，据span style="color:#A020F0">“归一化”据/span>那据span style="color:#A020F0">'没有任何'据/span>那据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“状态”据/span>) fullyConnectedLayer (3据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“actorFC”据/span>) tanhLayer (据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">'actortanh'据/span>) fullyConnectedLayer (numActions据span style="color:#A020F0">'姓名'据/span>那据span style="color:#A020F0">“行动”据/span>));actorOptions = rlRepresentationOptions (据span style="color:#A020F0">'学习'据/span>1 e-04据span style="color:#A020F0">'gradientthreshold'据/span>1);演员= rlDeterministicActorRepresentation (actorNetwork obsInfo actInfo,据span style="color:#A020F0">“观察”据/span>，{据span style="color:#A020F0">“状态”据/span>}，据span style="color:#A020F0">“行动”据/span>，{据span style="color:#A020F0">“行动”据/span>}, actorOptions);据/pre> </div> </div> </div> <p>要创建DDPG代理，首先使用DDPG代理选项使用据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rlddpgagentoptions.html" class="a"><code class="olink">rlddpgagentoptions.据/code></a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>agentOpts = rlDDPGAgentOptions (据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">“SampleTime”据/span>，ts，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'targetsmoothfactor'据/span>1 e - 3,据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'贴花因子'据/span>，1.0，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">“MiniBatchSize”据/span>，64，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'经验BufferLength'据/span>，1E6）;agentopts.noiseOptions.variance = 0.3;代理.NoiseOptions.varecedecayrate = 1E-5;据/pre> </div> </div> </div> <p>然后，使用指定的Actor表示，批评者表示和代理选项创建DDPG代理。有关更多信息，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rlddpgagent.html" class="a"><code class="olink">rlDDPGAgent据/code></a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>代理= rlddpgagent（演员，批评者，代理商）;据/pre> </div> </div> </div> <h3 class="title" id="CreateSimulinkEnvironmentAndTrainAgentExample-4">火车代理据/h3> <p>要培训代理，首先指定培训选项。对于本例，使用以下选项:据/p> <div class="itemizedlist"> <ul> <li><p>每次训练最多跑一次据code class="literal">5000据/code>集。指定每一集最多持续时间据code class="literal">CEIL（TF / TS）据/code>(即据code class="literal">200.据/code>)时间的步骤。据/p></li> <li><p>在“插曲管理器”对话框中显示培训进度(设置据code class="literal">情节据/code>选项）并禁用命令行显示（设置据code class="literal">verb据/code>选项据code class="literal">错误的据/code>）。据/p></li> <li><p>当代理收到平均累积奖励时停止培训大于据code class="literal">800据/code>超过据code class="literal">20.据/code>连续发作。此时，药剂可以控制罐中的水平。据/p></li> </ul> </div> <p>有关更多信息，请参阅据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rltrainingoptions.html" class="a"><code class="olink">rltringOptions.据/code></a>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>maxepisodes = 5000;maxsteps =装天花板(Tf / Ts);trainOpts = rlTrainingOptions (据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">“MaxEpisodes”据/span>maxepisodes,据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">“MaxStepsPerEpisode”据/span>，maxsteps，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'scoreaveragingwindowlength'据/span>, 20岁,据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">“详细”据/span>，错误的，据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'plots'据/span>那据span style="color:#A020F0">“训练进步”据/span>那据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'stoptrinaincriteria'据/span>那据span style="color:#A020F0">“AverageReward”据/span>那据span style="color:#0000FF">．．.据/span><span style="color:#A020F0">'stoptriningvalue'据/span>，800）;据/pre> </div> </div> </div> <p>训练代理人使用据a href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html" class="a"><code class="olink">火车据/code></a>函数。培训是一个计算密集型的过程，需要几分钟才能完成。为了节省运行此示例的时间，请通过设置加载预先训练过的代理据code class="literal">用圆形据/code>来据code class="literal">错误的据/code>．训练代理人，套装据code class="literal">用圆形据/code>来据code class="literal">真的据/code>．据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>doTraining = false;据span style="color:#0000FF">如果据/span>用圆形据span style="color:#228B22">培训代理商。据/span>trainingStats =火车(代理,env, trainOpts);据span style="color:#0000FF">别的据/span><span style="color:#228B22">%加载示例的预训练代理。据/span>负载(据span style="color:#A020F0">“WaterTankDDPG.mat”据/span>那据span style="color:#A020F0">“代理”据/span>）据span style="color:#0000FF">结尾据/span></pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e1023" class="mediaobject"> <p><img src="//www.tatmou.com/fr/help/examples/control_deeplearning/win64/CreateSimulinkEnvironmentAndTrainAgentExample_04.png" alt="" height="431" width="717" style="width: 717px; height: 431px"></p> </div> </div> <h3 class="title" id="CreateSimulinkEnvironmentAndTrainAgentExample-5">验证培训代理据/h3> <p>通过仿真验证了该模型的有效性。据/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>Simopts = RlsimulationOptions（据span style="color:#A020F0">“MaxSteps”据/span>，maxsteps，据span style="color:#A020F0">“StopOnError”据/span>那据span style="color:#A020F0">'在'据/span>）;体验= SIM（ENV，Agent，Simopts）;据/pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e1032" class="mediaobject"> <p><img src="//www.tatmou.com/fr/help/examples/control_deeplearning/win64/CreateSimulinkEnvironmentAndTrainAgentExample_05.png" alt="" height="676" width="519" style="width: 519px; height: 676px"></p> </div> </div> <h3 class="title" id="CreateSimulinkEnvironmentAndTrainAgentExample-6">本地函数据/h3> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre><span style="color:#0000FF">功能据/span>= localResetFcn(中)据span style="color:#228B22">％随机化参考信号据/span>黑色= sprintf (据span style="color:#A020F0">“rlwatertank /期望\ nWater级别”据/span>）;H = 3*randn + 10;据span style="color:#0000FF">尽管据/span>H <= 0 || >= 20 H = 3*randn + 10;据span style="color:#0000FF">结尾据/span>在= setBlockParameter（IN，BLK，据span style="color:#A020F0">'价值'据/span>，num2str（h））;据span style="color:#228B22">％随机化初始高度据/span>H = 3*randn + 10;据span style="color:#0000FF">尽管据/span>H <= 0 || >= 20 H = 3*randn + 10;据span style="color:#0000FF">结尾据/span>BLK =据span style="color:#A020F0">“rlwatertank /水箱系统/ H”据/span>；在= setBlockParameter（IN，BLK，据span style="color:#A020F0">“InitialCondition”据/span>，num2str（h））;据span style="color:#0000FF">结尾据/span></pre> </div> </div> </div> </div> <h2 id="d123e1042">也可以看看据/h2> <p><span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/fr/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html"><span itemprop="name"><code class="function">火车据/code></span></a></span></p> <h2 id="d123e1048">相关的话题据/h2> <ul> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/train-reinforcement-learning-agents.html" class="a">火车加固学习代理据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/create-simulink-environments-for-reinforcement-learning.html" class="a">创建Simul金宝appink强化学习环境据/a></li> </ul> </section> </div> <div class="modal fade" id="open-example-dialog" tabindex="-1" role="dialog" aria-labelledby="openExampleDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×据/span></button> <h2 class="modal-title">打开举例据/h2> </div> <div class="modal-body" id="dialog-body"> <p>vouspossédezune版modifiéede cet exemple。Souhaitez-Vous Ouvrir CET Exemple Avec VOS修改？据/p> </div> <div class="modal-footer"> <a id="open-example-dialog-replace" class="btn btn_color_blue companion_btn" data-dismiss="modal">不，écraser la版本modifiée据/a> <a id="open-example-dialog-continue" class="btn btn_color_blue" data-dismiss="modal">是的据/a> </div> </div> </div> </div> <div class="clearfix"></div> <div align="center" class="feedbackblock"> <iframe id="doc_survey"></iframe> </div> </section> <div class="modal fade" id="matlab-command-dialog" tabindex="-1" role="dialog" aria-labelledby="matlabCommandDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×据/span></button> <h2 class="modal-title">Matlab命令据/h2> </div> <div class="modal-body" id="dialog-body"> <p>您avez cliqué sur un lien qui对应à cette command MATLAB:据/p> <pre id="dialog-matlab-command"></pre> <p>PourExécuterLaMatchee，Saisissez-La Dans LaFenêtrededamedede Matlab。les naviveurs web ne sh金宝appiftent pas les命令matlab。据/p> </div> <div class="modal-footer"> <button type="button" class="btn btn_secondary" data-dismiss="modal">Fermer.据/button> </div> </div> </div> </div> <div id="location_content" style="display:none;"></div> <div class="modal fade" id="country-unselected" tabindex="-1" role="dialog" aria-labelledby="country-unselected-title" translate="no"> <div id="country-select-container"> <div class="modal-dialog modal-lg"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×据/span></button> <img alt="MathWorks" src="//www.tatmou.com/fr/images/responsive/global/pic-header-mathworks-logo2.svg" style="width:167px; height:auto;"> </div> <div class="modal-body"> <div class="row add_margin_40"> <div class="col-xs-12"> <h1 class="icon-globe icon_color_secondary" id="country-unselected-title">选择一个网站据/h1> <p>选择一个网站，在那里获得翻译的内容，并看到当地的活动和优惠。根据您的位置，我们建议您选择:据strong class="recommended-country"></strong>．据/p> <a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#" id="recommended_domain_button" class="btn btn_color_blue containsResourceName resourceClass-button">选择据span class="recommended-country"></span>网站据/a> </div> </div> <p>您还可以从以下列表中选择一个网站：据/p> <div class="alert alert-warning" id="china_performance_alert" style="display:none;"> <span class="alert_icon icon-alert-warning"></span> <h2>如何获得最佳的网站性能据/h2> <p>选择中国网站（以中文或英文）以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。据/p> </div> <div class="row add_margin_30"> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">美洲据/h3> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/la" class="domain_selector_link" data-country-code="LA" data-subdomain="la" data-lang="es" data-default-lang="true" data-selected-text="América Latina" data-recommended-text="América Latina" data-do-not-rewrite="true">美国拉丁据/a>(西班牙语)据/li> <li><a href="//www.tatmou.com/fr/" class="domain_selector_link" data-country-code="CA" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">加拿大据/a>(英语)据/li> <li><a href="//www.tatmou.com/fr/" class="domain_selector_link" data-country-code="US" data-subdomain="www" data-lang="en" data-default-lang="true" data-selected-text="United States" data-recommended-text="United States" data-do-not-rewrite="true">美国据/a>(英语)据/li> </ul> </div> <div class="col-sm-4 col-md-6"> <h3 class="add_bottom_rule">欧洲据/h3> <div class="row"> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled add_margin_0_sm"> <li><a href="//www.tatmou.com/nl" class="domain_selector_link" data-country-code="BE" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">比利时据/a>(英语)据/li> <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="DK" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">丹麦据/a>(英语)据/li> <li><a href="//www.tatmou.com/de" class="domain_selector_link" data-country-code="DE" data-subdomain="de" data-lang="de" data-default-lang="true" data-selected-text="Deutschland" data-recommended-text="Deutschland" data-do-not-rewrite="true">德国据/a>（德意志）据/li> <li><a href="//www.tatmou.com/es" class="domain_selector_link" data-country-code="ES" data-subdomain="es" data-lang="es" data-default-lang="true" data-selected-text="España" data-recommended-text="España" data-do-not-rewrite="true">España.据/a>(西班牙语)据/li> <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="FI" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">芬兰据/a>(英语)据/li> <li><a href="//www.tatmou.com/fr/" class="domain_selector_link" data-country-code="FR" data-subdomain="fr" data-lang="fr" data-default-lang="true" data-selected-text="France" data-recommended-text="France" data-do-not-rewrite="true">法国据/a>（Français）据/li> <li><a href="//www.tatmou.com/uk" class="domain_selector_link" data-country-code="IE" data-subdomain="uk" data-lang="en" data-do-not-rewrite="true">爱尔兰据/a>(英语)据/li> <li><a href="//www.tatmou.com/it" class="domain_selector_link" data-country-code="IT" data-subdomain="it" data-lang="it" data-default-lang="true" data-selected-text="Italia" data-recommended-text="Italia" data-do-not-rewrite="true">意大利据/a>（意大利语）据/li> <li><a href="//www.tatmou.com/nl" class="domain_selector_link" data-country-code="LU" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">卢森堡据/a>(英语)据/li> </ul> </div> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/nl" class="domain_selector_link" data-country-code="NL" data-subdomain="nl" data-lang="en" data-default-lang="true" data-selected-text="Benelux" data-recommended-text="Netherlands" data-do-not-rewrite="true">荷兰据/a>(英语)据/li> <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="NO" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">挪威据/a>(英语)据/li> <li><a href="//www.tatmou.com/de" class="domain_selector_link" data-country-code="AT" data-subdomain="de" data-lang="de" data-do-not-rewrite="true">Österreich.据/a>（德意志）据/li> <li><a href="//www.tatmou.com/fr/" class="domain_selector_link" data-country-code="PT" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">葡萄牙据/a>(英语)据/li> <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="Sweden" data-subdomain="se" data-lang="en" data-default-lang="true" data-selected-text="Nordic" data-recommended-text="Sweden" data-do-not-rewrite="true">瑞典据/a>(英语)据/li> <li>瑞士据ul class="list-unstyled add_indent_20"> <li><a href="//www.tatmou.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="de" data-selected-text="Schweiz" data-recommended-text="Schweiz" data-do-not-rewrite="true">德意志据/a></li> <li><a href="//www.tatmou.com/ch" id="swiss_english" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="en" data-default-lang="true" data-selected-text="Switzerland" data-recommended-text="Switzerland" data-do-not-rewrite="true">英语据/a></li> <li><a href="//www.tatmou.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="fr" data-selected-text="Suisse" data-recommended-text="Suisse" data-do-not-rewrite="true">法语据/a></li> </ul></li> <li><a href="//www.tatmou.com/uk" class="domain_selector_link" data-country-code="GB" data-subdomain="uk" data-lang="en" data-default-lang="true" data-selected-text="United Kingdom" data-recommended-text="United Kingdom" data-do-not-rewrite="true">联合王国据/a>(英语)据/li> </ul> </div> </div> </div> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">亚太地区据/h3> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/au" class="domain_selector_link" data-country-code="AU" data-subdomain="au" data-lang="en" data-default-lang="true" data-selected-text="Australia" data-recommended-text="Australia" data-do-not-rewrite="true">澳大利亚据/a>(英语)据/li> <li><a href="//www.tatmou.com/in" class="domain_selector_link" data-country-code="IN" data-subdomain="in" data-lang="en" data-default-lang="true" data-selected-text="India" data-recommended-text="India" data-do-not-rewrite="true">印度据/a>(英语)据/li> <li><a href="//www.tatmou.com/au" class="domain_selector_link" data-country-code="NZ" data-subdomain="au" data-lang="en" data-do-not-rewrite="true">新西兰据/a>(英语)据/li> <li>中国据ul class="list-unstyled add_indent_20"> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="zh" data-default-lang="true" data-selected-text="中国" data-recommended-text="中国" data-do-not-rewrite="true">简体中文据/a></li> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="en" data-default-lang="true" data-selected-text="China" data-recommended-text="China" data-do-not-rewrite="true">英语据/a></li> </ul></li> <li><a href="//www.tatmou.com/jp" class="domain_selector_link" data-country-code="JP" data-subdomain="jp" data-lang="ja" data-default-lang="true" data-selected-text="日本" data-recommended-text="日本" data-do-not-rewrite="true">日本据/a>(日本語)据/li> <li><a href="//www.tatmou.com/kr" class="domain_selector_link" data-country-code="KR" data-subdomain="kr" data-lang="ko" data-default-lang="true" data-selected-text="한국" data-recommended-text="한국" data-do-not-rewrite="true">한국据/a>（한국어）据/li> </ul> </div> </div> <p class="text-center"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#" class="worldwide_link">与当地办事处联系据/a></p> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="cta_container_mobile visible-sm visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">试用据/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>试用据/a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">MesesàJourdu Produit据/a></li> <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>MesesàJourdu Produit据/a></li> </ul> </div> </div> </div> </div> </div>   <div class="body_trail_container"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="row"> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tatmou.com/fr/help/reinforcement-learning/index.html?s_tid=doc_ftr">强化学习工具箱文档据/a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/examples.html?s_tid=doc_ftr">例子据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/referencelist.html?type=function&s_tid=doc_ftr">功能和其他参考据/a></li> <li><a href="//www.tatmou.com/fr/help/reinforcement-learning/release-notes.html?s_tid=doc_ftr">发布说明据/a></li> <li><a href="//www.tatmou.com/fr/help/pdf_doc/reinforcement-learning/index.html?s_tid=doc_ftr">PDF文档据/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tatmou.com/fr/support.html?s_tid=doc_ftr">金宝app</a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tatmou.com/fr/matlabcentral/answers/index?s_tid=doc_ftr">matlab答案据/a></li> <li><a href="//www.tatmou.com/fr/help/install/?s_tid=doc_ftr">安装帮助据/a></li> <li><a href="//www.tatmou.com/fr/support/bugreports/?s_tid=doc_ftr">错误报告据/a></li> <li><a href="//www.tatmou.com/fr/support/requirements/product-requirements-platform-availability-list.html?s_tid=doc_ftr">产品需求据/a></li> <li><a href="//www.tatmou.com/fr/downloads/?s_tid=doc_ftr">软件下载据/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <div class="panel panel_color_transparent panel_color_fill"> <div class="panel-body"> <div class="thumbnail add_margin_5"> <a href="//www.tatmou.com/fr/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer"><img class="fluid_image" alt="强化学习与MATLAB和Simulink金宝app" src="//www.tatmou.com/fr/content/dam/mathworks/mathworks-dot-com/images/responsive/supporting/campaigns/products/reinforcement-learning-ebook-offer-thumbnail.jpg"></a> </div> <h4><a href="//www.tatmou.com/fr/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">强化学习与MATLAB和Simulink金宝app据/a></h4> <a class="icon-download" href="//www.tatmou.com/fr/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">下载电子书据/a> </div> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer" class="bs-footer">  <div class="container-fluid"> <div class="fat_footer_container"> <div class="fat_footer"> <div class="execmatlabweb">  <div class="row"> <div class="col-xs-12 col-md-12 col-lg-3 add_margin_20"> <p class="h4 add_margin_0"><span translate="no">MathWorks据/span></p> <p><em>加快工程与科学的步伐据/em></p> <p class="hidden-xs">MathWorks是计算逻辑学mathématique pour les ingénieurs和科学的领导者。据/p> <p class="hidden-xs"><a href="//www.tatmou.com/fr/discovery.html?s_tid=all_disc_mw_ff">découvrir......据/a></p> </div> <div class="col-xs-12 col-md-12 col-lg-9"> <div class="row"> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#fatfooter_products" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_products">Decouvrir莱斯的据span class="caret"></span></a></p> <div class="collapse" id="fatfooter_products"> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/fr/products/matlab.html?s_tid=hp_ff_p_matlab">MATLAB据/a></li> <li><a href="//www.tatmou.com/fr/products/simulink.html?s_tid=hp_ff_p_simulink">金宝app</a></li> <li><a href="//www.tatmou.com/fr/products/matlab/student.html?s_tid=hp_ff_p_student">版本Étudiante.据/a></li> <li><a href="//www.tatmou.com/fr/hardware-support/home.html?s_tid=hp_ff_p_hwsupport">金宝app支持硬件据/a></li> <li><a href="//www.tatmou.com/fr/matlabcentral/fileexchange/?s_tid=hp_ff_p_fx">文件交换据/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#fatfooter_buy" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_buy">Essayer Ou Acheter.据span class="caret"></span></a></p> <div class="collapse" id="fatfooter_buy"> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/fr/downloads/web_downloads/?s_iid=hp_ff_t_downloads">Telechargements据/a></li> <li><a href="//www.tatmou.com/fr/campaigns/products/trials.html?s_iid=hp_ff_p_trial">版本d 'essai据/a></li> <li><a href="//www.tatmou.com/fr/company/aboutus/contact_us/contact_sales.html?s_iid=hp_ff_t_sales">接触商业据/a></li> <li><a href="//www.tatmou.com/fr/pricing-licensing.html?s_iid=hp_ff_t_pricing">费率等牌照据/a></li> <li><a href="//www.tatmou.com/fr/store/?s_tid=hp_ff_t_buy">评论ACHETER.据/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a role="button" data-toggle="collapse" href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#fatfooter_use" aria-expanded="false" aria-controls="fatfooter_use">硒据span class="caret"></span></a></p> <div class="collapse" id="fatfooter_use"> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/fr/help/?s_tid=hp_ff_l_doc">文件据/a></li> <li><a href="//www.tatmou.com/fr/support/learn-with-matlab-tutorials.html?s_tid=hp_ff_l_tutorials">Tutoriels据/a></li> <li><a href="//www.tatmou.com/fr/help/examples.html?s_tid=hp_ff_l_examples">ex据/a></li> <li><a href="//www.tatmou.com/fr/videos.html?s_tid=hp_ff_l_videos">Vidéos等网络研讨会据/a></li> <li><a href="//www.tatmou.com/fr/services/training.html?s_tid=hp_ff_l_training">形成据/a></li> </ul> </div> </div> <div class="clearfix" id="offcanvas_clearfix" style="display:none"></div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#fatfooter_support" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_support">Obtenir de l'Aide据span class="caret"></span></a></p> <div class="collapse" id="fatfooter_support"> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/fr/help/install/?s_tid=hp_ff_s_install">助手一个l 'installation据/a></li> <li><a href="//www.tatmou.com/fr/matlabcentral/answers/index?s_tid=hp_ff_s_answers">论坛Matlab.据/a></li> <li><a href="//www.tatmou.com/fr/services/consulting.html?s_tid=hp_ff_s_consulting">服务咨询据/a></li> <li><a href="//www.tatmou.com/fr/licensecenter/?s_tid=hp_ff_s_license">治理牌照据/a></li> <li><a href="//www.tatmou.com/fr/support/contact_us.html?s_tid=hp_ff_s_support">contacter l'帮助据/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a role="button" data-toggle="collapse" href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#fatfooter_about" aria-expanded="false" aria-controls="fatfooter_about">LaSociété.据span class="caret"></span></a></p> <div class="collapse" id="fatfooter_about"> <ul class="list-unstyled"> <li><a href="//www.tatmou.com/fr/company/jobs/opportunities.html?s_tid=hp_ff_a_careers">Offres d 'emploi据/a></li> <li><a href="//www.tatmou.com/fr/company/newsroom.html?s_tid=hp_ff_a_newsroom">Actualités.据/a></li> <li><a href="//www.tatmou.com/fr/company/aboutus/soc_mission.html?s_tid=hp_ff_a_socialmission">社会使命据/a></li> <li><a href="//www.tatmou.com/fr/company/aboutus/contact_us/contact_sales.html?s_tid=hp_ff_a_sales">接触商业据/a></li> <li><a href="//www.tatmou.com/fr/company.html?s_tid=hp_ff_a_company">LaSociété.据/a></li> </ul> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="container-fluid"> <div class="footer" translate="no"> <div class="row"> <div class="col-xs-12 col-md-9"> <ul class="countrynav" id="countrynav"> <li class="footernav_country"><a href="//www.tatmou.com/fr/help/reinforcement-learning/ug/#" data-toggle="modal" data-target="#country-unselected"><span class="icon-globe icon_color_quinary icon_16"></span>法国据/a></li> </ul> <div class="clearfix"></div> <ul class="footernav"> <li class="footernav_patents"><a href="//www.tatmou.com/fr/company/aboutus/policies_statements/trust-center.html?s_tid=gf_tc">信任中心据/a></li> <li class="footernav_trademarks"><a href="//www.tatmou.com/fr/company/aboutus/policies_statements/trademarks.html?s_tid=gf_trd">品牌推翻据/a></li> <li class="footernav_privacy"><a href="//www.tatmou.com/fr/company/aboutus/policies_statements.html?s_tid=gf_priv">Charte de confidentialite据/a></li> <li class="footernav_piracy"><a href="//www.tatmou.com/fr/company/aboutus/policies_statements/piracy.html?s_tid=gf_pir">防止盗版据/a></li> <li class="footernav_status"><a href="//www.tatmou.com/status/?s_tid=gf_application">des应用状况据/a></li> </ul> <div class="clearfix"></div> <div class="clearfix"></div> <p class="copyright" translate="no">©1994-2021 The MathWorks公司据/p> </div> <div class="clearfix visible-sm add_margin_10"></div> <div class="col-xs-12 col-md-3"> <div class="social_media"> <ul class="social_media_icons"> <li><a href="https://www.facebook.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/fr/images/responsive/global/ico-facebook.svg" alt="脸谱网" class="ico_facebook"></a></li> <li><a href="https://www.twitter.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/fr/images/responsive/global/ico-twitter.svg" alt="推特" class="ico_twitter"></a></li> <li><a href="https://www.instagram.com/matlab/" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_instagram" alt="Instagram" src="//www.tatmou.com/fr/etc.clientlibs/mathworks/clientlibs/customer-ui/templates/common/resources/images/ico-instagram.svg"></a></li> <li><a href="https://www.youtube.com/user/MATLAB" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_youtube" alt="YouTube" src="//www.tatmou.com/fr/images/responsive/global/ico-youtube.svg"></a></li> <li><a href="https://www.linkedin.com/company/the-mathworks_2" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/fr/images/responsive/global/ico-linkedin.svg" alt="LinkedIn" class="ico_linkedin"></a></li> <li><a href="//www.tatmou.com/fr/company/rss.html" class="svg_link"><img src="//www.tatmou.com/fr/images/responsive/global/ico-rss.svg" alt="RSS" class="ico_rss"></a></li> </ul> <div class="clearfix"></div> <p><em>Rejoignez La谈话据/em></p> </div> </div> </div> </div> <div id="cookie-banner-text" style="display:none;"> 本网站使用cookie来改善您的用户体验，个性化内容和广告，并分析网站流量。继续使用本网站，即表示您同意我们使用cookies。请参阅我们的据a href="//www.tatmou.com/fr/company/aboutus/policies_statements.html">隐私政策据/a>了解有关cookie的更多信息以及如何更改设置。据/div> </div> </footer> </div> </div>  </body> </html>