主要内容

이번역최신을있지않습니다않습니다。최신내용으로보려면를하십시오하십시오하십시오。

加固学习工具箱

강화학습사용하여정책훈련훈련

强化学习工具箱™는dqn,ppo,sac,ddpg를를강화학습알고리즘사용하여정책을을을시킬수수있는앱앱,함수金宝app®블록을합니다。이러한정책리소스할당,로보틱스,자치자치같은응용사례를제어기제어기와의사결정알고리즘알고리즘구현할할있습니다있습니다있습니다있습니다있습니다있습니다。

툴박스를심층신경망또는룩업테이블을하여정책및가치함수를를표현표현하고하고®sim金宝appulink simulink에서된환경의상호작용이러한정책및가치함수를훈련할있습니다있습니다있습니다。툴박스에서또는다중에이전트학습을실행하거나알고리즘을개발할수있습니다있습니다。하이퍼파라미터해보고,훈련훈련모니터링하고하고하고하고하고에이전트를앱을통해통해대화형방식방식으로으로또는프로그래밍방식방식방식으로으로으로시뮬레이션시뮬레이션수수수CPU,GPU,컴퓨터클러스터,클라우드클라우드클라우드에서에서에서에서병렬로병렬로시뮬레이션시뮬레이션을실행실행MATLAB Parallel Server™사용)。

Onnx™모델형식통해기존정책을을tensorflow™keras및pytorch와와와프레임워크프레임워크에서가져올(深度学习工具箱™사용)。C+c,C ++,CUDA®코드를하여컨트롤러및및에에된을할있습니다있습니다있습니다。툴박스에는데이되는참조가포함있습니다있습니다있습니다。

强化学习工具箱시작하기

强化学习工具箱의의배우기배우기배우기

matlab환경

matlab을사용강화학습동특성모델링하기

金宝appSimulink환경

金宝appsimulink모델을하여강화환경동특성모델링하기

에이전트

sarsa,dqn,ddpg,ppo와같이알고리즘을강화학습에이전트구성구성하기하기하기

정책및가치함수

심층이나Q테이블같은및가치함수표현하기하기하기

훈련및검증

강화학습훈련및시뮬레이션하기

정책배포

코드생성훈련된정책배포