加固学习工具箱
强化学院をを用词た策の设计および学习
钢筋学习工具箱™には,DQNやPPO,SAC,DDPGなどのの化学院习アルゴリズムを使して策を习させるためのアプリ关键,simulink金宝app®ブロックが策れますますますます。これらこれら方向を使使て,リソース割り当てや,自我システムなどのななにコントローラーと意思アルゴリズムを実コントローラー。
このツールボックスでは,ディープニューラルネットワークやルックアップテーブルテーブルし,方向,やし,matlab®やs金宝appimulinkでモデルモデルされ环境とのの作用ををじてそれら习习せることができますますツールボックス含まシングルエージェントエージェントまたはの强れるシングルエージェントマルチの强强习アルゴリズムアルゴリズム评価したりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりしたりたりまた,ハイパーパラメーター设定の実験,学校の进行状况のが监视がががであるほかほかほかからまたはまたはプログラムプログラム的的またはまたはプログラム上できできできの性能をを向向にににはははははにははははのCPU,GPU,コンピュータークラスター,およびおよびクラウドで并列実実し(并行计算工具箱™およびMATLABPLILLENT Server™をを用)。
既存既存方向は,onnx™モデルモデル形式使使用して,tensorflow™kerasやpytorchなどのディープラーニングワークからインポートできますディープラーニングからインポートできますディーディーフレームワークできます(Deep Learning toolbox™を使用)。®コードを生成し,学校済みの方向をやgpuに展开できます。このツールボックスは,初めての方向も使い参照例が付属ています。
详细を见る:
强化学习
深度Q-Network(DQN),深层决定论的方向法(DDPG),近傍方向氧化物(PPO)などの组み込みアルゴリズムを使し,エージェントを制作。のためのカスタムエージェントを开口します。
强化学院デザイナーアプリ
强化学院エージェントエージェントの,学校,シミュレーションを対话的にい。后で使使たり展开できるに,学校习のをmatlabにエクスポートします。
ディープニューラルネットワークによる方向策关键词关键词
大厦状态行动空间を持つ复雑システムで,ディープニューラルネットワークの策をで定义し。深度学习工具箱の层を使使用するか,ディープネットワークデザイナーを使用して対话的に定义します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模仿学习を使用して方策を初期化し,学习を高速化します。他のディープラーニングフレームワークと相互相互运ためににのモデルのインポートいいいい
金宝appSimulinkによるによるシングルエージェントエージェントマルチエージェントの化学院
金宝appSIMULINKでRL代理ブロックブロックを使し,强化学习て作品成型学院习行ます.simulinkでrl代理ブロックのののの使使してののエージェントの习をを时にいます(マルチマルチの化学院)。
金宝appsimulinkおよびsimscape环境
金宝appSimulinkおよびimscape™をを用し,环境ののを作用成し。モデルモデルででをし。モデルモデルでで信条,行动信号,报告信号。
matlab环境
MATLABの关有关部やクラスをし,环境环境モデルします.MATLABファイル内,観测幂,行动次数,报告数量,报告数量。
分享到およびマルチコアによる高高化
学习を高度化するに,并行计算工具箱やMATLAB并行服务器をを,クラウドリソース,または计算クラスター上で并列実実行ししししし。
コード生成
学习済みの方向策表现するmatlabコードコードから最适最适されたたコードコードを生成するにGPU编码器™を使用します。方向を展开するためのc / c ++コード生成にはMatlab Coder™を使用します。
Matlab编译器のの
Matlab Compiler™やMATLAB编译器SDK™を使用して,学校済みの方向をスタンドアロンのアプリケーション,c / c ++共有ライブラリ,微软®.NETアセンブリ,java®クラス,python.®パッケージとして展开します。
入门
.
自动运転
车辆线逸脱防止支援,自动传动车など支援习のをのします策をのます。
ロボティクス
ロボティクスの用力向けに化学学习方向をを设计ます。
强化学院ビデオシリーズ
このこのビデオシリーズを见,强化学院について学习しう。