加固学习工具箱

주요주요이트

加固学习工具箱

강화학습을사용하여하여정책을설계하고훈련할수

시작하기:

강화학습에이전트

강화학습에이전트를생성하고구성하여MATLAB및Simulin金宝appk的에서정책을훈련할수있습니다。내장된강화학습알고리즘을사용하거나사용자지정강화학습알고리즘을개발할수있습니다。

강화학습알고리즘

DQN(深Q-网络),DDPG(深确定性的政策梯度),PPO(近端政策优化)및기타내장알고리즘을사용하여에이전트를만들수있습니다。템플릿을사용하여정책을훈련시키는사용자지정에이전트를개발할수있습니다。

强化学习工具箱에서사용가능한훈련알고리즘。

强化学习设计앱

에대화형으로학습학습이전트를를,훈련,시뮬레이션할수。향후사용및배포를위해된된에이전트를matlab으로으로보낼수있습니다。

심층신경망을사용한정책가치함수함수

대규모상태 - 행동공간을사용하는하는시스템시스템의深度学习工具箱의계층을사용하거나하거나대화형방식심층신경망디자이너를통해심층신경망정책을프로그래밍방식으로정의할수있습니다。또는툴박스에서제안하는기본네트워크아키텍처를사용할수도있습니다。모방학습으로정책을초기화하여훈련을가속화할수있습니다。다른딥러닝프레임워크와의상호운용성을위해ONNX모델을가져오고내보낼수있습니다。

金宝appSimulink的의단일에이전트및다중에이전트강화학습

rl代理블록을사용하여simulin金宝appk에서강화학습에이전트를를만들고훈련할수수。여러개의rl代理블록블록사용하여simulink에서동시에金宝app여러이전트를를(다중다중이전트강화강화)할할있습니다。

金宝appSimulink的의강화학습에이전트블록。

환경모델링

matlab및si金宝appmulink환경모델을만들수있습니다。시스템동특성을설명하고훈련이전트에에관측값및보상를제공할수수보상신호를제공할수

金宝appsimulink및simscape환경

金宝appSimulink및simscape™를사용하여하여환경모델을만들수수모델내에서관측값,행동및보상신호를지정할있습니다수있습니다。

이족보행로봇을위한simu金宝applink환경환경。

MATLAB환경

matlab함수와클래스를사용하여하여환경을모델링모델링수수Matlab파일내에서관측,행동및보상변수를지정할수수있습니다。

3자유도로켓을위한matlab환경。

훈련가속화

GPU,클라우드및분산컴퓨팅리소스를사용하여훈련속도를높일수있습니다。

병렬병렬을사용하여훈련속도를。

GPU가속.

고성능nvidia.®GPU를사용하여하여심층신경망훈련및추론속도높일수수并行计算工具箱와대부분의计算能力3.0이상CUDA지원NVIDIAGPU와함께MATLAB을사용할할수있습니다수수수수수수수수수수수수

GPU를사용하여을가속화합니다。

코드생성및배포

훈련된정책을임베디드기기에배포하거나광범위한프로덕션시스템과통합할수있습니다。

코드생성

GPU编码器™를사용하면하면훈련된된을표현하는하는하는하는코드에서에서최적화수수수된코드코드코드코드를수수수Matlab Coder™를사용하여정책배포를위한C / C ++코드를생성할수있습니다。

GPU编码器를사용하여하여하여코드를합니다。

MATLAB编译지원

Matlab Compiler™MATLAB编译器SDK™를사용하여하여훈련훈련된정책독립형응용,C / C ++공유라이브러리,微软®.NET어셈어셈,java®클래스및的Python®패키지로배포할수있습니다。

정책을독립형프로그램으로패키징하고공유합니다。

참조예제

로봇공학,자율주행,보정,스케줄링및기타응용사례를위한제어기와의사결정알고리즘을설계할수있습니다。

시작하기

단순단순반전,网格世界탐색,카트 - 폴시스템의균형잡기일반마르코프결정과과문제을위해강화학습정책을하는방법을알아볼학습수수수수수하는방법을알아볼수수을하는방법을알아볼수수수하는을

자율주행



조정,보정및스케줄링

조정,보정및스케줄링응용사례를위한강화학습정책을설계할수있습니다。

상수관망시스템의리소스할당문제。

강화학습비디오시리즈

이비디오시리즈시리즈를통해통해강화학습에대해자세히알아볼수