加固学习工具箱

强化学院をを用词た策の设计および学习

钢筋学习工具箱™には,DQNやPPO,SAC,DDPGなどのの化学院习アルゴリズムを使して策を习させるためのアプリ关键,simulink金宝app®ブロックが策れますますますます。これらこれら方向を使使て,リソース割り当てや,自我システムなどのななにコントローラーと意思アルゴリズムを実コントローラー。

このツールボックスでは,ディープニューラルネットワークやルックアップテーブルテーブルし,方向,やし,matlab®やs金宝appimulinkでモデルモデルされ环境とのの作用ををじてそれら习习せることができますますツールボックス含まシングルエージェントエージェントまたはの强れるシングルエージェントマルチの强强习アルゴリズムアルゴリズム评価したりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりしたりたりまた,ハイパーパラメーター设定の実験,学校の进行状况のが监视がががであるほかほかほかからまたはまたはプログラムプログラム的的またはまたはプログラム上できできできの性能をを向向にににはははははにははははのCPU,GPU,コンピュータークラスター,およびおよびクラウドで并列実実し(并行计算工具箱™およびMATLABPLILLENT Server™をを用)。

既存既存方向は,onnx™モデルモデル形式使使用して,tensorflow™kerasやpytorchなどのディープラーニングワークからインポートできますディープラーニングからインポートできますディーディーフレームワークできます(Deep Learning toolbox™を使用)。®コードを生成し,学校済みの方向をやgpuに展开できます。このツールボックスは,初めての方向も使い参照例が付属ています。

详细を见る:

强化学习

MATLABやSI金宝appMULINKで方案を习习させるの化学学习エージェントエージェント作物および组み込みののいます组み込みか,かか,かかします。

强化学习

深度Q-Network(DQN),深层决定论的方向法(DDPG),近傍方向氧化物(PPO)などの组み込みアルゴリズムを使し,エージェントを制作。のためのカスタムエージェントを开口します。

加固学习工具箱で使用できる学习アルゴリズム。

强化学院デザイナーアプリ

强化学院エージェントエージェントの,学校,シミュレーションを対话的にい。后で使使たり展开できるに,学校习のをmatlabにエクスポートします。

ディープニューラルネットワークによる方向策关键词关键词

大厦状态行动空间を持つ复雑システムで,ディープニューラルネットワークの策をで定义し。深度学习工具箱の层を使使用するか,ディープネットワークデザイナーを使用して対话的に定义します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模仿学习を使用して方策を初期化し,学习を高速化します。他のディープラーニングフレームワークと相互相互运ためににのモデルのインポートいいいい

金宝appSimulinkによるによるシングルエージェントエージェントマルチエージェントの化学院

金宝appSIMULINKでRL代理ブロックブロックを使し,强化学习て作品成型学院习行ます.simulinkでrl代理ブロックのののの使使してののエージェントの习をを时にいます(マルチマルチの化学院)。

金宝appSimulink用作ののブロックエージェント。

环境环境モデル化

MATLABおよびSI金宝appMULINKの环境环境を环境作用成作作作作作者:王莹,骁勇介绍,エージェントの学习し,エージェントの学习しための信号。

金宝appsimulinkおよびsimscape环境

金宝appSimulinkおよびimscape™をを用し,环境ののを作用成し。モデルモデルででをし。モデルモデルでで信条,行动信号,报告信号。

二足歩行ロボットののののs金宝appimulink环境环境。

matlab环境

MATLABの关有关部やクラスをし,环境环境モデルします.MATLABファイル内,観测幂,行动次数,报告数量,报告数量。

3自由度のロケット向けmatlab环境。

学习の高度化

GPU,クラウド,分享到コンピューティングをしし学习高度化。

GPUによる高层化

高性能なnvidia®GPUをを用して,ディープニューラルネットワークの学习とを高度化し。并行计算工具箱と共に,计算能力3.0以上のほとんどのcuda対応nvidia gpuでmatlabをを使使ます。

GPUをを使しし习の高于速。

コードの生成と开

学校済みの方向を,组み込みデバイスに展开したり,さまざまな実稼働システムににできでき。

コード生成

学习済みの方向策表现するmatlabコードコードから最适最适されたたコードコードを生成するにGPU编码器™を使用します。方向を展开するためのc / c ++コード生成にはMatlab Coder™を使用します。

GPU编码器をを用したたたたコードの生成。

Matlab编译器のの

Matlab Compiler™MATLAB编译器SDK™を使用して,学校済みの方向をスタンドアロンのアプリケーション,c / c ++共有ライブラリ,微软®.NETアセンブリ,java®クラス,python.®パッケージとして展开します。

方策をスタンドアロンのプログラムとしてとして化してて共てて共共共て。

参照例

ロボティクス,自动运転,キャリブレーション,スケジューリングなどの向け向けにや意思决定アルゴリズムアルゴリズム设计ししししし

入门

.

调整,キャリブレーション,およびスケジューリング

调整,キャリブレーション,およびスケジューリングののに化学院配方を策设计します。

配水のリソース割り当ての问题。

强化学院ビデオシリーズ

このこのビデオシリーズを见,强化学院について学习しう。

その他の钢筋学习工具箱リソース