加固学习ondramp.
웹브라우저를통한matlab액세스
유익한비디오튜토리얼
자동자동가및피드백방식의실습형예제
영어로만학습가능
교육과정목차
1。
강화학습개요
강화강화학습의개념개념과과정에대해소개합니다
- 강화학습이란?
- 교육과정개요
- 사전전훈련에이전트로로이션하기
2。
환경정의하기
이전트와환경모델의상호작용방법을정의합니다。
- 강화강화학습모델의구성요소
- 환경인터페이스정의정의
- 보상및훈련
- 보상에행동포함하기
- MATLAB에이전트에si金宝appmulink®환경연결하기
3.
에이전트정의하기
강화학습에이전트의표현을생성합니다。
- 크리틱및q값
- 연속적문제의크리틱표현하기
- 신경망생성하기
- 액터및크리틱
- 에이전트요약
4.
에이전트훈련하기
시뮬레이션에피소드를사용에해이전트를를훈련。
- 훈련
- 훈련개선하기