Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

金宝app환경

金宝app ®모델을 사용하여 강화 학습 환경 동특성 모델링하기

강화 학습 시나리오에서 환경은 에이전트가 상호 작용하는 동특성을 모델링합니다. 환경은 다음을 수행합니다.

  1. 에이전트로부터 행동을 받음

  2. 환경 모델의 동적 동작의 결과로 생성되는 관측값을 출력

  3. 특정 행동이 임무 달성에 얼마나 기여하는지 측정하는 보상을 생성

Simulink 모델을 사용하여 미리 정의된 환경과 사용자 지정 환경을 만들 수 있습니다. 자세한 내용은Simulink 강화 학습 환경 만들기항목을참조하십시오。

함수

모두 확장

rlPredefinedEnv 미리정의된강화학습 환경 만들기
rlSimulinkEnv Create reinforcement learning environment using dynamic model implemented in金宝app
createIntegratedEnv Create金宝appmodel for reinforcement learning, using reference model as environment
validateEnvironment Validate custom reinforcement learning environment
SimulinkEnvWithAgent Reinforcement learning environment with a dynamic model implemented in金宝app
generateRewardFunction Generate a reward function from control specifications to train a reinforcement learning agent
exteriorPenalty Exterior penalty value for a point with respect to a bounded region
hyperbolicPenalty Hyperbolic penalty value for a point with respect to a bounded region
barrierPenalty Logarithmic barrier penalty value for a point with respect to a bounded region
rlFiniteSetSpec 강화 학습 환경에 대한 이산 행동 또는 관측값 데이터 사양 만들기
rlNumericSpec 강화 학습 환경에 대한 연속 행동 또는 관측값 데이터 사양 만들기
getActionInfo Obtain action data specifications from reinforcement learning environment or agent
getObservationInfo 강화 학습 환경 또는 에이전트에서 관측값 데이터 사양 가져오기
bus2RLSpec Create reinforcement learning data specifications for elements of a金宝appbus

블록

RL Agent 강화 학습 에이전트

도움말 항목