强化学习工具箱

強化学習を用いた方策の設計および学習

価格を表示する

强化学习工具箱™には,DQNやPPO,囊,DDPGなどの強化学習アルゴリズムを使用して方策を学習させるためのアプリや関数,仿真软件金宝app^®ブロックが用意されています。これらの方策を使用して,リソース割り当てやロボティクス,自律システムなどの複雑な用途向けにコントローラーと意思決定アルゴリズムを実装できます。

このツールボックスでは,ディープニューラルネットワークやルックアップテーブルを使用して,方策や価値関数を表現し,MATLAB^®やs金宝appimulinkでモデルモデルされ环境とのの作用ををじてそれら习习せることができますますツールボックス含まシングルエージェントエージェントまたはの强れるシングルエージェントマルチの强强习アルゴリズムアルゴリズム评価したりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりたりしたりたりまた，ハイパーパラメーター设定の実験，学校の进行状况のが监视がががであるほかほかほかからまたはまたはプログラムプログラム的的またはまたはプログラム上できできできの性能をを向向にににはははははにははははのCPU，GPU，コンピュータークラスター，およびおよびクラウドで并列実実し（并行计算工具箱™およびMATLABPLILLENT Server™をを用）。

既存既存方向は，onnx™モデルモデル形式使使用して，tensorflow™kerasやpytorchなどのディープラーニングワークからインポートできますディープラーニングからインポートできますディーディーフレームワークできます（Deep Learning toolbox™を使用）。^®コードを生成し,学習済みの方策をマイクロコントローラーやGPUに展開できます。このツールボックスには,初めての方にも使いやすい参照例が付属しています。

详细を见る：

强化学习工具箱とは

強化学習エージェント

MATLABや仿真金宝app软件で方策を学習させるための強化学習エージェントの作成および構成を行います。組み込みの強化学習アルゴリズムを使用するか,カスタムの強化学習アルゴリズムを開発します。

強化学習アルゴリズム

深度Q-Network（DQN），深层决定论的方向法（DDPG），近傍方向氧化物（PPO）などの组み込みアルゴリズムを使し，エージェントを制作。のためのカスタムエージェントを开口します。

強化学習エージェントの学習

組み込みエージェント

カスタムエージェントの作成

2足歩行ロボットの学习习歩行制御

强化学习工具箱で使用できる学習アルゴリズム。

强化学院デザイナーアプリ

强化学院エージェントエージェントの，学校，シミュレーションを対话的にい。后で使使たり展开できるに，学校习のをmatlabにエクスポートします。

強化学習デザイナー

强化学习デザイナーアプリアプリ使したエージェント设计设计と学习

強化学習エージェントの対話的な作成と学習

ディープニューラルネットワークによる方策と価値関数の表現

大きな状態行動空間を持つ複雑なシステムでは,ディープニューラルネットワークの方策をプログラムで定義します。この場合,深度学习工具箱の層を使用するか,ディープネットワークデザイナーを使用して対話的に定義します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模倣学習を使用して方策を初期化し,学習を高速化します。他のディープラーニングフレームワークとの相互運用のためにONNXモデルのインポートおよびエクスポートを行います。

ディープニューラルネットワーク表現の作成とインポート

ディープディープネットワークデザイナーによるによる作作作者：作者

模倣学習によるDDPG演员ネットワークの初期化

强化学院エージェントエージェントののの