加固学习工具箱
강화학습을사용하여하여정책을설계하고훈련할수
强化学习工具箱™는DQN,PPO,SAC및DDPG와같은강화학습알고리즘을사용하는정책을훈련시키기위한앱,함수,Simulink的金宝app®블록을제공합니다。이러한정책을사용하여자원할당,로봇공학,자율시스템과같은복잡한응용사례의제어기및의사결정알고리즘을구현할수있습니다。
이툴박스를사용하면심층신경망또는룩업테이블을사용하여정책및가치함수를표현할수있고MATLAB®또는s金宝appimulink에서모델링된환경의상호작용을통해이런정책정책가치함수를훈련수있습니다있습니다수수있습니다있습니다있습니다있습니다있습니다수있습니다있습니다있습니다수수수수에툴박스제공단일단일이전트또는또는에이전트학습학습알고리즘평가하거나하거나개발할수있습니다。무훈련훈련을향상하기위해이션을다중cpu,gpu,컴퓨터클러스터및클라우드에서병렬로할있습니다。(并行计算工具箱™및MATLABPLARTALLER SELVER™照片)
ONNX™모델형식을통해TensorFlow™Keras및PyTorch등의딥러닝프레임워크에서기존정책을가져올수있습니다。(深学习工具箱™사용)최적화된C,C ++,CUDA®코드를생성하여훈련된정책을마이크로컨트롤러및GPU에배포할수있습니다。툴박스에는시작을돕기위한참조예제가포함되어있습니다。
시작하기:
강화학습알고리즘
DQN(深Q-网络),DDPG(深确定性的政策梯度),PPO(近端政策优化)및기타내장알고리즘을사용하여에이전트를만들수있습니다。템플릿을사용하여정책을훈련시키는사용자지정에이전트를개발할수있습니다。
强化学习设计앱
에대화형으로학습학습이전트를를,훈련,시뮬레이션할수。향후사용및배포를위해된된에이전트를matlab으로으로보낼수있습니다。
金宝appSimulink的의단일에이전트및다중에이전트강화학습
rl代理블록을사용하여simulin金宝appk에서강화학습에이전트를를만들고훈련할수수。여러개의rl代理블록블록사용하여simulink에서동시에金宝app여러이전트를를(다중다중이전트강화강화)할할있습니다。
金宝appsimulink및simscape환경
金宝appSimulink및simscape™를사용하여하여환경모델을만들수수모델내에서관측값,행동및보상신호를지정할있습니다수있습니다。
MATLAB환경
matlab함수와클래스를사용하여하여환경을모델링모델링수수Matlab파일내에서관측,행동및보상변수를지정할수수있습니다。
분산연산및멀티코어가속화
并行计算工具箱및MATLAB并行服务器를사용하는멀티코어컴퓨터,클라우드리소스또는연산클러스터에서병렬시뮬레이션을실행하여훈련속도를높일수있습니다。
코드생성
GPU编码器™를사용하면하면훈련된된을표현하는하는하는하는코드에서에서최적화수수수된코드코드코드코드를수수수Matlab Coder™를사용하여정책배포를위한C / C ++코드를생성할수있습니다。
MATLAB编译지원
Matlab Compiler™및MATLAB编译器SDK™를사용하여하여훈련훈련된정책독립형응용,C / C ++공유라이브러리,微软®.NET어셈어셈,java®클래스및的Python®패키지로배포할수있습니다。
시작하기
단순단순반전,网格世界탐색,카트 - 폴시스템의균형잡기일반마르코프결정과과문제을위해강화학습정책을하는방법을알아볼학습수수수수수하는방법을알아볼수수을하는방법을알아볼수수수하는을
자율주행
로봇공학
로봇공학응용사례를를위한강화학습정책을설계수수
제품리소스:
강화학습비디오시리즈
이비디오시리즈시리즈를통해통해강화학습에대해자세히알아볼수