加固学习工具箱

강화학습사용하여정책훈련훈련

强化学习工具箱™는dqn，ppo，sac，ddpg를를강화학습알고리즘사용하여정책을을을시킬수수있는앱앱，함수金宝app^®블록을합니다。이러한정책리소스할당，로보틱스，자치자치같은응용사례를제어기제어기와의사결정알고리즘알고리즘구현할할있습니다있습니다있습니다있습니다있습니다있습니다。

툴박스를심층신경망또는룩업테이블을하여정책및가치함수를를표현표현하고하고^®sim金宝appulink simulink에서된환경의상호작용이러한정책및가치함수를훈련할있습니다있습니다있습니다。툴박스에서또는다중에이전트학습을실행하거나알고리즘을개발할수있습니다있습니다。하이퍼파라미터해보고，훈련훈련모니터링하고하고하고하고하고에이전트를앱을통해통해대화형방식방식으로으로또는프로그래밍방식방식방식으로으로으로시뮬레이션시뮬레이션수수수CPU，GPU，컴퓨터클러스터，클라우드클라우드클라우드에서에서에서에서병렬로병렬로시뮬레이션시뮬레이션을실행실행MATLAB Parallel Server™사용）。

Onnx™모델형식통해기존정책을을tensorflow™keras및pytorch와와와프레임워크프레임워크에서가져올（深度学习工具箱™사용）。C+c，C ++，CUDA^®코드를하여컨트롤러및및에에된을할있습니다있습니다있습니다。툴박스에는데이되는참조가포함있습니다있습니다있습니다。

加固学习工具箱

强化学习工具箱시작하기

matlab환경

金宝appSimulink환경

에이전트

정책및가치함수

훈련및검증

정책배포