ドキュメンテーションヘルプセンタードキュメンテーション

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

深層ニューラルネットワークを使用した強化学習

不明な動的環境とのやり取りによる深層ニューラルネットワークエージェントの学習

強化学習は目標指向型の計算手法で,エージェントが不明な動的環境とやり取りすることによってタスクの実行を学習します。学習が実行されている間,学習アルゴリズムがエージェントの方策パラメーターを更新します。学習アルゴリズムの目標は,タスク実行中に受け取る長期的な報酬が最大になる最適な方策を見つけることです。

方策は,エージェントのタイプに応じて1つ以上の方策関数と価値関数で表されます。深層ニューラルネットワークを使用して,これらの表現を実装することができます。その後,强化学习工具箱™ソフトウェアを使用してこれらのネットワークに学習させることができます。

詳細については,使用深度神经网络的强化学习を参照してください。

トピック

使用深度神经网络的强化学习

强化学习是一种目标导向的计算方法，计算机通过与未知的动态环境交互来学习执行任务。

金宝app仿真软件環境の作成とエージェントの学習

金宝app^®で学習環境としてモデル化されたプラントを使用し,強化学習を使ってコントローラーに学習させる。

ディープネットワークデザイナーを使用したエージェントの作成およびイメージ観測値を使用した学習

深度学习工具箱™のディープネットワークデザイナーアプリを使用して,強化学習エージェントを作成する。

振子の振り上げと平衡化のための,イメージ観測を使用したDDPGエージェントの学習

イメージベースの観測信号を使用して,強化学習エージェントに学習させる。

並列計算を使用した車線維持支援用DQNエージェントの学習

車線維持支援アプリケーション用に,強化学習エージェントに学習させる。

模拟MPC控制器的车道保持辅助

训练一个深度神经网络来模仿模型预测控制器的行为。

注目の例

飛行ロボットを制御するためのDDPGエージェントの学習

飛行ロボットを制御するためのDDPGエージェントの学習

飛行ロボットモデルを制御するために,強化学習エージェントに学習させる。

ライブスクリプトを開く

強化学習エージェントを使用した二足歩行ロボットの学習

強化学習エージェントを使用した二足歩行ロボットの学習

Simscape™多体™でモデル化された二足歩行ロボットを制御するために,強化学習エージェントの学習を実行します。

ライブスクリプトを開く

アダプティブクルーズコントロール用のDDPGエージェントの学習

アダプティブクルーズコントロール用のDDPGエージェントの学習

アダプティブクルーズコントロールアプリケーション用の強化学習エージェントに学習させる。

ライブスクリプトを開く

経路追従制御用のDDPGエージェントの学習

経路追従制御用のDDPGエージェントの学習

レーン追従制御アプリケーション用に,強化学習エージェントの学習を実行します。

ライブスクリプトを開く

火车人形沃克

火车人形沃克

使用遗传算法或强化学习训练人形机器人行走。

ライブスクリプトを開く

培训自动代客泊车的PPO代理

培训自动代客泊车的PPO代理

训练一个强化学习代理在一个开放的停车位停车。

ライブスクリプトを開く

深度学习工具箱ドキュメンテーション

サポート

MATLABで始めるディープラーニング

MATLABで始めるディープラーニング

电子书をダウンロードする