帮助中心帮助中心
一个点关于有界区域的外部惩罚值
p = exteriorPenalty(x,xmin,xmax,method)
例子
p= exteriorPenalty (x,xmin,xmax,方法)使用指定的方法计算非负的(外部)惩罚向量p为了说明这一点x对于边界的区域xmin而且xmax.p与x.
p= exteriorPenalty (x,xmin,xmax,方法)
p
x
xmin
xmax
方法
全部折叠
方法的使用exteriorPenalty函数来计算一个给定点的外部惩罚,相对于一个有界区域。
exteriorPenalty
计算该点的惩罚值0.1在[-2,2],使用一步方法。
0.1
-2
2
一步
exteriorPenalty (0.1, 2, 2,“步骤”)
Ans = 0
计算该点的惩罚值4在区间之外[-2,2],使用一步方法。
4
exteriorPenalty(4、2、2、“步骤”)
Ans = 1
计算该点的惩罚值4在区间之外[-2,2],使用二次方法。
二次
exteriorPenalty(4、2、2、“二次”)
Ans = 4
计算该点的罚则值[-2,0,4]对于由区间[定义的方框0,1]、[-1,1],及[-2,2]沿x, y和z维度,分别使用二次方法。
0
1
-1
exterorpenalty ([-2 0 4],[0 -1 -2],[1 1 2],“二次”)
ans =3×14 0 4
可视化一个区间的惩罚值
创建一个分布在-之间的1001个等距点的向量5而且5.
5
X = -5:0.01:5;
计算向量中所有点的惩罚,使用二次方法。
p = exteriorPenalty(x,-2,2,“二次”);
绘制点并添加网格、标签和标题。
Plot (x,p) grid xlabel(“位置”);ylabel (“刑罚价值”);标题("间隔上的惩罚值");
计算外部惩罚的点,指定为数值标量、向量或矩阵。
例子:[-0.1, 1.3]
[-0.1, 1.3]
的下界x,指定为数值标量、向量或矩阵。中所有元素使用相同的最小值x,指定xmin作为一个标量。
例子:-2
的上界x,指定为数值标量、向量或矩阵。中的所有元素使用相同的最大值x,指定xmax作为一个标量。
例子:10 [5]
10 [5]
“步骤”
“二次”
函数用于计算惩罚,指定为“步骤”或“二次”.你也可以使用字符串来代替字符向量。
例子:“二次”
惩罚值,作为非负元素的向量返回。使用这两个方法中的任意一个,每个元素p我如果对应为0x我在?指定的区域内xmin我而且xmax我,否则为正。惩罚函数通常用于在违反约束时产生负奖励,例如在generateRewardFunction.
p我
x我
xmin我
xmax我
generateRewardFunction
R2021b中引入
hyperbolicPenalty
barrierPenalty
Tiene una versión modificada de este ejemplo。¿Desea abrir este ejemplo con sus modificaciones?
Ha hecho clic en unenlace que对应一个este commando de MATLAB:
弹射突击队introduciéndolo en la ventana de commandos de MATLAB。Los navegadores web no permission comandos de MATLAB。
选择一个网站,在可用的地方获得翻译的内容,并查看当地的活动和优惠。根据您所在的位置,我们建议您选择:.
您也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
联系当地办事处