强化学习工具箱

更新

强化学习工具箱

強化学習を用いた方策の設計および学習

详细を见る:

強化学習エージェント

MATLABや仿真金宝app软件で方策を学習させるための強化学習エージェントの作成および構成を行います。組み込みの強化学習アルゴリズムを使用するか,カスタムの強化学習アルゴリズムを開発します。

強化学習アルゴリズム

深度Q-Network(DQN),深层决定论的方向法(DDPG),近傍方向氧化物(PPO)などの组み込みアルゴリズムを使し,エージェントを制作。のためのカスタムエージェントを开口します。

强化学习工具箱で使用できる学習アルゴリズム。

强化学院デザイナーアプリ

强化学院エージェントエージェントの,学校,シミュレーションを対话的にい。后で使使たり展开できるに,学校习のをmatlabにエクスポートします。

ディープニューラルネットワークによる方策と価値関数の表現

大きな状態行動空間を持つ複雑なシステムでは,ディープニューラルネットワークの方策をプログラムで定義します。この場合,深度学习工具箱の層を使用するか,ディープネットワークデザイナーを使用して対話的に定義します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模倣学習を使用して方策を初期化し,学習を高速化します。他のディープラーニングフレームワークとの相互運用のためにONNXモデルのインポートおよびエクスポートを行います。

金宝appSimulinkによるによるシングルエージェントエージェントマルチエージェントの化学院

金宝app仿真软件でRL代理ブロックを使用して,強化学習エージェントの作成と学習を行います。金宝app仿真软件でRL代理ブロックの複数のインスタンスを使用して,複数のエージェントの学習を同時に行います(マルチエージェントの強化学習)。

金宝appSimulink用作ののブロックエージェント。

环境环境モデル化

MATLABおよび仿真金宝app软件の環境モデルを作成します。システムダイナミクスを記述し,エージェントの学習のための観測信号と報酬信号を指定します。

金宝app仿真软件およびSimscape環境

金宝appSimulinkおよびimscape™をを用し,环境ののを作用成し。モデルモデルででをし。モデルモデルでで信条,行动信号,报告信号。

二足歩行ロボットのための仿金宝app真软件環境モデル。

MATLAB環境

MATLABの関数やクラスを使用して,環境をモデル化します。MATLABファイル内で、観測変数、行動変数、報酬変数を指定します。

3自由度のロケット向けmatlab环境。

学習の高速化

GPU,クラウド,分享到コンピューティングをしし学习高度化。

分散コンピューティングおよびマルチコアによる高速化

学習を高速化するために,并行计算工具箱MATLAB并行服务器を使用して,マルチコアコンピューター,クラウドリソース,または計算クラスター上で並列シミュレーションを実行します。

並列計算を使用して,学習を高速化。

GPUによる高层化

高性能なnvidia®GPUをを用して,ディープニューラルネットワークの学习とを高度化し。并行计算工具箱と共に,以3.0计算能力上のほとんどのcuda対応nvidia gpuでmatlabをを使使ます。

GPUを使用した学習の高速化。

コードの生成と开

学習済みの方策を,組み込みデバイスに展開したり,さまざまな実稼働システムに統合できます。

コード生成

学習済みの方策を表現するMATLABコードから最適化されたCUDAコードを生成するにはGPU编码器™を使用します。方策を展開するためのC / c++コードの生成にはMATLAB编码器™を使用します。

GPU编码器を使用したCUDAコードの生成。

MATLAB编译器のサポート

MATLAB编译器™MATLAB编译器SDK™を使用して,学習済みの方策をスタンドアロンのアプリケーション,C / c++共有ライブラリ,微软®netアセンブリ,Java®クラス,python.®パッケージとして展开します。

方策をスタンドアロンのプログラムとしてパッケージ化して共有。

参照例

ロボティクス,自动运転,キャリブレーション,スケジューリングなどの向け向けにや意思决定アルゴリズムアルゴリズム设计ししししし

入門

.

调整,キャリブレーション,およびスケジューリング

調整,キャリブレーション,およびスケジューリングの用途向けに強化学習方策を設計します。

配水のリソース割り当ての問題。

強化学習ビデオシリーズ

このビデオシリーズを見て,強化学習について学習しましょう。