このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
強化学習は目標指向型の計算手法で,エージェントが不明な動的環境とやり取りすることによってタスクの実行を学習します。学習が実行されている間,学習アルゴリズムがエージェントの方策パラメーターを更新します。学習アルゴリズムの目標は,タスク実行中に受け取る長期的な報酬が最大になる最適な方策を見つけることです。
方策は,エージェントのタイプに応じて1つ以上の方策関数と価値関数で表されます。深層ニューラルネットワークを使用して,これらの表現を実装することができます。その後,强化学习工具箱™ソフトウェアを使用してこれらのネットワークに学習させることができます。
詳細については,使用深度神经网络的强化学习を参照してください。
强化学习是一种目标导向的计算方法,计算机通过与未知的动态环境交互来学习执行任务。
金宝app®で学習環境としてモデル化されたプラントを使用し,強化学習を使ってコントローラーに学習させる。
ディープネットワークデザイナーを使用したエージェントの作成およびイメージ観測値を使用した学習
深度学习工具箱™のディープネットワークデザイナーアプリを使用して,強化学習エージェントを作成する。
振子の振り上げと平衡化のための,イメージ観測を使用したDDPGエージェントの学習
イメージベースの観測信号を使用して,強化学習エージェントに学習させる。
車線維持支援アプリケーション用に,強化学習エージェントに学習させる。
训练一个深度神经网络来模仿模型预测控制器的行为。