强化学习工具箱
強化学習を用いた方策の設計および学習
强化学习工具箱™には,DQNやPPO,囊,DDPGなどの強化学習アルゴリズムを使用して方策を学習させるためのアプリや関数,仿真软件金宝app®ブロックが用意されています。これらの方策を使用して,リソース割り当てやロボティクス,自律システムなどの複雑な用途向けにコントローラーと意思決定アルゴリズムを実装できます。
このツールボックスでは,ディープニューラルネットワークやルックアップテーブルを使用して,方策や価値関数を表現し,MATLAB®やs金宝appimulinkでモデルモデルされ环境とのの作用ををじてそれら习习せることができますますツールボックス含まシングルエージェントエージェントまたはの强れるシングルエージェントマルチの强强习アルゴリズムアルゴリズム评価したりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりしたりたりまた,ハイパーパラメーター设定の実験,学校の进行状况のが监视がががであるほかほかほかからまたはまたはプログラムプログラム的的またはまたはプログラム上できできできの性能をを向向にににはははははにははははのCPU,GPU,コンピュータークラスター,およびおよびクラウドで并列実実し(并行计算工具箱™およびMATLABPLILLENT Server™をを用)。
既存既存方向は,onnx™モデルモデル形式使使用して,tensorflow™kerasやpytorchなどのディープラーニングワークからインポートできますディープラーニングからインポートできますディーディーフレームワークできます(Deep Learning toolbox™を使用)。®コードを生成し,学習済みの方策をマイクロコントローラーやGPUに展開できます。このツールボックスには,初めての方にも使いやすい参照例が付属しています。
详细を见る:
強化学習アルゴリズム
深度Q-Network(DQN),深层决定论的方向法(DDPG),近傍方向氧化物(PPO)などの组み込みアルゴリズムを使し,エージェントを制作。のためのカスタムエージェントを开口します。
强化学院デザイナーアプリ
强化学院エージェントエージェントの,学校,シミュレーションを対话的にい。后で使使たり展开できるに,学校习のをmatlabにエクスポートします。
ディープニューラルネットワークによる方策と価値関数の表現
大きな状態行動空間を持つ複雑なシステムでは,ディープニューラルネットワークの方策をプログラムで定義します。この場合,深度学习工具箱の層を使用するか,ディープネットワークデザイナーを使用して対話的に定義します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模倣学習を使用して方策を初期化し,学習を高速化します。他のディープラーニングフレームワークとの相互運用のためにONNXモデルのインポートおよびエクスポートを行います。
金宝appSimulinkによるによるシングルエージェントエージェントマルチエージェントの化学院
金宝app仿真软件でRL代理ブロックを使用して,強化学習エージェントの作成と学習を行います。金宝app仿真软件でRL代理ブロックの複数のインスタンスを使用して,複数のエージェントの学習を同時に行います(マルチエージェントの強化学習)。
金宝app仿真软件およびSimscape環境
金宝appSimulinkおよびimscape™をを用し,环境ののを作用成し。モデルモデルででをし。モデルモデルでで信条,行动信号,报告信号。
MATLAB環境
MATLABの関数やクラスを使用して,環境をモデル化します。MATLABファイル内で、観測変数、行動変数、報酬変数を指定します。
分散コンピューティングおよびマルチコアによる高速化
学習を高速化するために,并行计算工具箱やMATLAB并行服务器を使用して,マルチコアコンピューター,クラウドリソース,または計算クラスター上で並列シミュレーションを実行します。
コード生成
学習済みの方策を表現するMATLABコードから最適化されたCUDAコードを生成するにはGPU编码器™を使用します。方策を展開するためのC / c++コードの生成にはMATLAB编码器™を使用します。
MATLAB编译器のサポート
MATLAB编译器™やMATLAB编译器SDK™を使用して,学習済みの方策をスタンドアロンのアプリケーション,C / c++共有ライブラリ,微软®netアセンブリ,Java®クラス,python.®パッケージとして展开します。
入門
.
自動運転
車間距離制御装置,車線逸脱防止支援,自動駐車などの自動運転用途のための強化学習方策を設計します。
ロボティクス
ロボティクスの用力向けに化学学习方向をを设计ます。
製品リソース:
強化学習ビデオシリーズ
このビデオシリーズを見て,強化学習について学習しましょう。