主要内容gydF4y2Ba

编写标量目标函数gydF4y2Ba

函数文件gydF4y2Ba

例如,标量目标函数文件接受一个输入gydF4y2BaxgydF4y2Ba,并返回一个实标量输出,例如gydF4y2BafgydF4y2Ba。输入gydF4y2BaxgydF4y2Ba可以是标量,向量,还是gydF4y2Ba矩阵gydF4y2Ba。函数文件可以返回更多输出(参见gydF4y2Ba包括梯度和黑森gydF4y2Ba).gydF4y2Ba

例如,假设你的目标是三个变量的函数,gydF4y2BaxgydF4y2Ba,gydF4y2BaygydF4y2Ba,gydF4y2BazgydF4y2Ba:gydF4y2Ba

fgydF4y2Ba(gydF4y2BaxgydF4y2Ba) = 3*(gydF4y2BaxgydF4y2Ba- - - - - -gydF4y2BaygydF4y2Ba)gydF4y2Ba4gydF4y2Ba+ 4 * (gydF4y2BaxgydF4y2Ba+gydF4y2BazgydF4y2Ba)gydF4y2Ba2gydF4y2Ba/ (1 +)gydF4y2BaxgydF4y2Ba2gydF4y2Ba+gydF4y2BaygydF4y2Ba2gydF4y2Ba+gydF4y2BazgydF4y2Ba2gydF4y2Ba) + cosh(gydF4y2BaxgydF4y2Ba- 1) + tanh(gydF4y2BaygydF4y2Ba+gydF4y2BazgydF4y2Ba).gydF4y2Ba

  1. 将这个函数写成一个接受vector的文件gydF4y2Ba鑫gydF4y2Ba= (gydF4y2BaxgydF4y2Ba;gydF4y2BaygydF4y2Ba;gydF4y2BazgydF4y2Ba]并返回gydF4y2BafgydF4y2Ba:gydF4y2Ba

    函数f = myObjective(鑫)f = 3 *(鑫(1)新(2))^ 4 + 4 *(鑫(1)+鑫(3))^ 2 /(1 +规范(鑫)^ 2)……+ cosh(xin(1)-1) + tanh(xin(2)+xin(3));gydF4y2Ba
  2. 将其保存为名为gydF4y2BamyObjective.mgydF4y2Ba到MATLAB上的一个文件夹gydF4y2Ba®gydF4y2Ba路径。gydF4y2Ba

  3. 检查函数是否正确计算:gydF4y2Ba

    myObjective([1;2;3]) ans = 9.2666gydF4y2Ba

有关如何包含额外参数的信息,请参见gydF4y2Ba传递额外参数gydF4y2Ba。有关函数文件的更复杂示例,请参见gydF4y2Ba梯度最小化和Hessian稀疏模式gydF4y2Ba或gydF4y2Ba有界约束和带状预调节器的最小化gydF4y2Ba。gydF4y2Ba

局部函数和嵌套函数gydF4y2Ba

函数可以存在于其他文件中,如gydF4y2Ba本地函数gydF4y2Ba或gydF4y2Ba嵌套函数gydF4y2Ba。使用本地函数或嵌套函数可以减少保存的不同文件的数量。使用嵌套函数还允许访问额外的参数,如gydF4y2Ba嵌套函数gydF4y2Ba。gydF4y2Ba

例如,假设你想最小化gydF4y2BamyObjective.mgydF4y2Ba目标函数,在gydF4y2Ba函数文件gydF4y2Ba,以gydF4y2Baellipseparabola.mgydF4y2Ba约束,描述于gydF4y2Ba非线性约束gydF4y2Ba。而不是写两个文件,gydF4y2BamyObjective.mgydF4y2Ba和gydF4y2Baellipseparabola.mgydF4y2Ba,写一个文件,其中包含两个函数作为本地函数:gydF4y2Ba

function [x fval] = callObjConstr(x0,options) %如果margin < 2 options = optimoptions('fmincon','Algorithm',' internal -point');结束[x fval] = fmincon (x0 @myObjective ,[],[],[],[],[],[], ...@ellipseparabola选项);函数f = myObjective(鑫)f = 3 *(鑫(1)新(2))^ 4 + 4 *(鑫(1)+鑫(3))^ 2 /(1 +总和(鑫^ 2))…+ cosh(xin(1)-1) + tanh(xin(2)+xin(3));功能测查[c] = ellipseparabola c (1) (x) = (x (1) ^ 2) / 9 + (x (2) ^ 2) / 4 - 1;C (2) = x(1)^2 - x(2) - 1;[qh];gydF4y2Ba

从该点出发求解约束最小化问题gydF4y2Ba(1, 1, 1)gydF4y2Ba:gydF4y2Ba

[x fval] = callObjConstr(ones(3,1))找到满足约束的局部最小值。由于目标函数在可行方向上不减小,优化完成后达到函数容差的默认值以内,并且约束满足于约束容差的默认值以内。X = 1.1835 0.8345 -1.6439 fval = 0.5383gydF4y2Ba

匿名功能目标gydF4y2Ba

使用匿名函数来编写简单的目标函数。有关匿名函数的详细信息,请参见gydF4y2Ba什么是匿名函数?gydF4y2Ba。gydF4y2BaRosenbrock的函数很简单,可以写成匿名函数:gydF4y2Ba

anonrosen = @ (x) (100 * (x (2) - (1) ^ 2) ^ 2 + (1 - x (1)) ^ 2);gydF4y2Ba
检查gydF4y2BaanonrosengydF4y2Ba正确地求值于gydF4y2Ba(1 2)gydF4y2Ba:gydF4y2Ba
Anonrosen ([-1 2]) ans = 104gydF4y2Ba
最小化gydF4y2BaanonrosengydF4y2Ba与gydF4y2BafminuncgydF4y2Ba产生以下结果:gydF4y2Ba
options = optimoptions(@fminunc,'Algorithm','准牛顿');[x fval] = fminunc(anonrosen,[-1;2],options)找到局部最小值。优化完成是因为梯度的大小小于函数公差的默认值。X = 1.0000 1.0000 fval = 1.2266e-10gydF4y2Ba

包括梯度和黑森gydF4y2Ba

为求解器提供导数gydF4y2Ba

为gydF4y2BafmincongydF4y2Ba和gydF4y2BafminuncgydF4y2Ba,您可以在目标函数中包含梯度。一般来说,求解器更健壮,并且在包含梯度时可以稍微快一些。看到gydF4y2Ba纳入衍生品的好处gydF4y2Ba。也包括二阶导数(黑森式),参见gydF4y2Ba包括麻布gydF4y2Ba。gydF4y2Ba

下表显示了哪些算法可以使用梯度和Hessians。gydF4y2Ba

解算器gydF4y2Ba 算法gydF4y2Ba 梯度gydF4y2Ba 黑森gydF4y2Ba
fmincongydF4y2Ba 有效集gydF4y2Ba 可选gydF4y2Ba 没有gydF4y2Ba
内点gydF4y2Ba 可选gydF4y2Ba 可选(见gydF4y2BaHessian for fmincon内点算法gydF4y2Ba)gydF4y2Ba
sqpgydF4y2Ba 可选gydF4y2Ba 没有gydF4y2Ba
trust-region-reflectivegydF4y2Ba 要求gydF4y2Ba 可选(见gydF4y2Bafminunc trust-region或fmincon trust-region反射算法的HessiangydF4y2Ba)gydF4y2Ba
fminuncgydF4y2Ba 拟牛顿gydF4y2Ba 可选gydF4y2Ba 没有gydF4y2Ba
信赖域gydF4y2Ba 要求gydF4y2Ba 可选(见gydF4y2Bafminunc trust-region或fmincon trust-region反射算法的HessiangydF4y2Ba)gydF4y2Ba

如何包含渐变gydF4y2Ba

  1. 编写代码返回:gydF4y2Ba

    • 目标函数(标量)作为第一个输出gydF4y2Ba

    • 梯度(向量)作为第二个输出gydF4y2Ba

  2. 设置gydF4y2BaSpecifyObjectiveGradientgydF4y2Ba选项gydF4y2Ba真正的gydF4y2Ba使用gydF4y2BaoptimoptionsgydF4y2Ba。如果合适,也可以设置gydF4y2BaSpecifyConstraintGradientgydF4y2Ba选项gydF4y2Ba真正的gydF4y2Ba。gydF4y2Ba

  3. 可选地,检查你的梯度函数是否匹配有限差分近似。看到gydF4y2Ba检验梯度或雅可比矩阵的有效性gydF4y2Ba。gydF4y2Ba

提示gydF4y2Ba

为了获得最大的灵活性,请写gydF4y2Ba条件化gydF4y2Ba代码。条件化意味着函数输出的数量可以变化,如下面的示例所示。的值不会导致条件化代码出错gydF4y2BaSpecifyObjectiveGradientgydF4y2Ba选择。非条件化代码要求您适当地设置选项。gydF4y2Ba

例如,考虑gydF4y2Ba。海涅的功能gydF4y2Ba

fgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba One hundred.gydF4y2Ba (gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba −gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba 2gydF4y2Ba +gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba )gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba

哪个是描述和绘制的gydF4y2Ba约束非线性问题的优化实时编辑任务或求解器gydF4y2Ba。的梯度gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba)gydF4y2Ba是gydF4y2Ba

∇gydF4y2Ba fgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba [gydF4y2Ba −gydF4y2Ba 400gydF4y2Ba (gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba −gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba −gydF4y2Ba 2gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba )gydF4y2Ba 200gydF4y2Ba (gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba −gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba ]gydF4y2Ba ,gydF4y2Ba

rosentwogydF4y2Ba是一个条件化函数,返回求解器需要的任何内容:gydF4y2Ba

计算目标f = 100*(x(2) -x(1) ^2)^2 + (1-x(1))^2;如果nargout > 1%梯度需要g = (-400 * (x (2) - x (1) ^ 2) * x (1) 2 * (1 - x (1));200 * (x (2) - x (1) ^ 2)];结束gydF4y2Ba

nargoutgydF4y2Ba检查调用函数指定的参数数量。看到gydF4y2Ba查找函数参数的个数gydF4y2Ba。gydF4y2Ba

的gydF4y2BafminuncgydF4y2Ba为无约束优化而设计的求解器,允许您最小化Rosenbrock函数。告诉gydF4y2BafminuncgydF4y2Ba通过设置来使用渐变和黑森gydF4y2Ba选项gydF4y2Ba:gydF4y2Ba

options = optimoptions(@fminunc,“算法”,“信任区域”,…“SpecifyObjectiveGradient”,真正的);gydF4y2Ba

运行gydF4y2BafminuncgydF4y2Ba从gydF4y2Ba[1, 2]gydF4y2Ba:gydF4y2Ba

[x fval] = fminunc(@rosentwo,[-1;2],options)找到本地最小值。优化完成是因为梯度的大小小于函数公差的默认值。X = 1.0000 1.0000 fval = 1.9886e-17gydF4y2Ba

如果您有Symbolic Math Toolbox™许可证,您可以自动计算梯度和黑森数,如gydF4y2Ba计算梯度和黑森使用符号数学工具箱gydF4y2Ba。gydF4y2Ba

包括麻布gydF4y2Ba

你可以把二阶导数包含在gydF4y2BafmincongydF4y2Ba“trust-region-reflective”gydF4y2Ba和gydF4y2Ba“内点”gydF4y2Ba算法,并与gydF4y2BafminuncgydF4y2Ba“信赖域”gydF4y2Ba算法。根据信息的类型和算法,有几种方法可以包含Hessian信息。gydF4y2Ba

你还必须包括渐变(设置)gydF4y2BaSpecifyObjectiveGradientgydF4y2Ba来gydF4y2Ba真正的gydF4y2Ba如果适用的话,gydF4y2BaSpecifyConstraintGradientgydF4y2Ba来gydF4y2Ba真正的gydF4y2Ba),以便包括黑森人。gydF4y2Ba

海赛的gydF4y2BafminuncgydF4y2Ba信赖域或gydF4y2BafmincongydF4y2Batrust-region-reflective算法。gydF4y2Ba这些算法要么没有约束,要么只有有界约束或线性等式约束。因此黑森矩阵是目标函数二阶导数的矩阵。gydF4y2Ba

将Hessian矩阵作为目标函数的第三个输出。比如黑森人gydF4y2BaHgydF4y2Ba(gydF4y2BaxgydF4y2Ba)gydF4y2Ba罗森布洛克的函数是(见gydF4y2Ba如何包含渐变gydF4y2Ba)gydF4y2Ba

HgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba [gydF4y2Ba 1200gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba −gydF4y2Ba 400gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba +gydF4y2Ba 2gydF4y2Ba −gydF4y2Ba 400gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba −gydF4y2Ba 400gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 200gydF4y2Ba ]gydF4y2Ba 。gydF4y2Ba

把这个黑森人包括在目标中:gydF4y2Ba

函数gydF4y2Ba[f, g, H] = rosenboth(x)gydF4y2Ba%计算目标fgydF4y2BaF = 100*(x(2) -x(1)²)²+ (1-x(1))²;gydF4y2Ba如果gydF4y2BaNargout b> 1gydF4y2Ba所需梯度%gydF4y2BaG = [-400*(x(2)-x(1)^2)*x(1)-2*(1-x(1))];200 * (x (2) - x (1) ^ 2)];gydF4y2Ba如果gydF4y2BaNargout bbbb20gydF4y2Ba%黑森要求gydF4y2BaH = [1200*x(1)^2-400*x(2)+2, -400*x(1)];-400 * x (1), 200);gydF4y2Ba结束gydF4y2Ba结束gydF4y2Ba

集gydF4y2BaHessianFcngydF4y2Ba来gydF4y2Ba“目标”gydF4y2Ba。例如,gydF4y2Ba

选项= optimoptions(gydF4y2Ba“fminunc”gydF4y2Ba,gydF4y2Ba“算法”gydF4y2Ba,gydF4y2Ba“信赖域”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“SpecifyObjectiveGradient”gydF4y2Ba,真的,gydF4y2Ba“HessianFcn”gydF4y2Ba,gydF4y2Ba“目标”gydF4y2Ba);gydF4y2Ba

海赛的gydF4y2BafmincongydF4y2Ba内点算法gydF4y2Ba。gydF4y2Ba黑森函数是拉格朗日的黑森函数,拉格朗日函数gydF4y2BalgydF4y2Ba(gydF4y2BaxgydF4y2Ba,gydF4y2BaλgydF4y2Ba)是gydF4y2Ba

lgydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba λgydF4y2Ba )gydF4y2Ba =gydF4y2Ba fgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba +gydF4y2Ba ∑gydF4y2Ba λgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba ggydF4y2Ba 我gydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba +gydF4y2Ba ∑gydF4y2Ba λgydF4y2Ba hgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba hgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba 。gydF4y2Ba

ggydF4y2Ba和gydF4y2BahgydF4y2Ba向量函数是否分别表示所有不等式和不等式约束(意界约束、线性约束和非线性约束),那么最小化问题是什么gydF4y2Ba

最小值gydF4y2Ba xgydF4y2Ba fgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba 受gydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba ≤gydF4y2Ba 0gydF4y2Ba ,gydF4y2Ba hgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba 0.gydF4y2Ba

有关详情,请参阅gydF4y2Ba约束最优论gydF4y2Ba。拉格朗日的黑森函数是gydF4y2Ba

∇gydF4y2Ba xgydF4y2Ba xgydF4y2Ba 2gydF4y2Ba lgydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba λgydF4y2Ba )gydF4y2Ba =gydF4y2Ba ∇gydF4y2Ba 2gydF4y2Ba fgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba +gydF4y2Ba ∑gydF4y2Ba λgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba ∇gydF4y2Ba 2gydF4y2Ba ggydF4y2Ba 我gydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba +gydF4y2Ba ∑gydF4y2Ba λgydF4y2Ba hgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba ∇gydF4y2Ba 2gydF4y2Ba hgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba 。gydF4y2Ba (1)gydF4y2Ba

要包含一个Hessian,用下面的语法编写一个函数gydF4y2Ba

Hessian = hessianfcn(x,lambda)gydF4y2Ba

黑森gydF4y2Ba是一个gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BangydF4y2Ba矩阵,稀疏或稠密,其中gydF4y2BangydF4y2Ba是变量的个数。如果gydF4y2Ba黑森gydF4y2Ba的值较大,并且具有相对较少的非零条目,通过表示来节省运行时间和内存gydF4y2Ba黑森gydF4y2Ba作为一个稀疏矩阵。gydF4y2BaλgydF4y2Ba是与非线性约束相关的拉格朗日乘子向量的结构:gydF4y2Ba

λ。我neqnonlin lambda.eqnonlin

fmincongydF4y2Ba计算结构gydF4y2BaλgydF4y2Ba并将其传递给Hessian函数。gydF4y2BahessianfcngydF4y2Ba必须计算总数吗gydF4y2Ba方程1gydF4y2Ba。通过设置这些选项表明您正在提供Hessian:gydF4y2Ba

选项= optimoptions(gydF4y2Ba“fmincon”gydF4y2Ba,gydF4y2Ba“算法”gydF4y2Ba,gydF4y2Ba“内点”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“SpecifyObjectiveGradient”gydF4y2Ba,真的,gydF4y2Ba“SpecifyConstraintGradient”gydF4y2Ba,真的,gydF4y2Ba…gydF4y2Ba“HessianFcn”gydF4y2Ba, @hessianfcn);gydF4y2Ba

例如,要包含约束于单位磁盘的Rosenbrock函数的HessiangydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba +gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba ≤gydF4y2Ba 1gydF4y2Ba 注意约束函数gydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba +gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba ≤gydF4y2Ba 0gydF4y2Ba 有梯度和二阶导数矩阵吗gydF4y2Ba

∇gydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba [gydF4y2Ba 2gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba ]gydF4y2Ba HgydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba [gydF4y2Ba 2gydF4y2Ba 0gydF4y2Ba 0gydF4y2Ba 2gydF4y2Ba ]gydF4y2Ba 。gydF4y2Ba

将Hessian函数写成gydF4y2Ba

函数gydF4y2BaHout = hessianfcn(x,lambda)gydF4y2Ba目标的黑森gydF4y2BaH = [1200*x(1)^2-400*x(2)+2, -400*x(1)];-400 * x (1), 200);gydF4y2Ba黑森的非线性不等式约束gydF4y2BaHg = 2*眼(2);H = H + lambda.ineqnonlin*Hg;gydF4y2Ba

保存gydF4y2BahessianfcngydF4y2Ba在你的MATLAB路径上。为了完成示例,包含梯度的约束函数为gydF4y2Ba

函数gydF4y2Ba[c,测查,gc, gceq] = unitdisk2 c (x) = x (1) ^ 2 + x (2) ^ 2 - 1;[qh];gydF4y2Ba如果gydF4y2Ba[2*x(1);2*x(2)];[qh];gydF4y2Ba结束gydF4y2Ba

解决包括梯度和黑森在内的问题。gydF4y2Ba

Fun = @rosenboth;Nonlcon = @unitdisk2;X0 = [-1;2];选项= optimoptions(gydF4y2Ba“fmincon”gydF4y2Ba,gydF4y2Ba“算法”gydF4y2Ba,gydF4y2Ba“内点”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“SpecifyObjectiveGradient”gydF4y2Ba,真的,gydF4y2Ba“SpecifyConstraintGradient”gydF4y2Ba,真的,gydF4y2Ba…gydF4y2Ba“HessianFcn”gydF4y2Ba, @hessianfcn);[x, fval exitflag,输出]= fmincon (x0有趣, ,[],[],[],[],[],[],@ unitdisk2选项);gydF4y2Ba

有关使用内点Hessian的其他示例,请参见gydF4y2Ba基于解析Hessian的fmincon内点算法gydF4y2Ba和gydF4y2Ba计算梯度和黑森使用符号数学工具箱gydF4y2Ba。gydF4y2Ba

黑森乘法。gydF4y2Ba而不是一个完整的Hessian函数gydF4y2BafmincongydF4y2Ba内点gydF4y2Ba和gydF4y2Batrust-region-reflectivegydF4y2Ba算法允许你提供一个黑森乘法函数。这个函数给出了一个Hessian-times-vector乘积的结果,而不直接计算Hessian。这可以节省内存。的gydF4y2BaSubproblemAlgorithmgydF4y2Ba选项必须是gydF4y2Ba“重心”gydF4y2Ba让黑森乘法函数起作用;这是gydF4y2Batrust-region-reflectivegydF4y2Ba违约。gydF4y2Ba

这两种算法的语法不同。gydF4y2Ba

  • 为gydF4y2Ba内点gydF4y2Ba算法,语法是gydF4y2Ba

    W = HessMultFcn(x,lambda,v);gydF4y2Ba

    结果gydF4y2BaWgydF4y2Ba应该是产品gydF4y2BaH * vgydF4y2Ba,在那里gydF4y2BaHgydF4y2Ba拉格朗日的黑森量是多少gydF4y2BaxgydF4y2Ba(见gydF4y2Ba方程1gydF4y2Ba),gydF4y2BaλgydF4y2Ba拉格朗日乘数是由gydF4y2BafmincongydF4y2Ba),gydF4y2BavgydF4y2Ba向量有大小吗gydF4y2BangydF4y2Ba1。设置选项如下:gydF4y2Ba

    选项= optimoptions(gydF4y2Ba“fmincon”gydF4y2Ba,gydF4y2Ba“算法”gydF4y2Ba,gydF4y2Ba“内点”gydF4y2Ba,gydF4y2Ba“SpecifyObjectiveGradient”gydF4y2Ba,真的,gydF4y2Ba…gydF4y2Ba“SpecifyConstraintGradient”gydF4y2Ba,真的,gydF4y2Ba“SubproblemAlgorithm”gydF4y2Ba,gydF4y2Ba“重心”gydF4y2Ba,gydF4y2Ba“HessianMultiplyFcn”gydF4y2Ba, @HessMultFcn);gydF4y2Ba

    提供功能gydF4y2BaHessMultFcngydF4y2Ba,它返回gydF4y2BangydF4y2Ba- × 1向量,其中gydF4y2BangydF4y2Ba维数是gydF4y2BaxgydF4y2Ba。的gydF4y2BaHessianMultiplyFcngydF4y2Ba选项使您可以传递黑森数乘以矢量的结果,而无需计算黑森数。gydF4y2Ba

  • 的gydF4y2Batrust-region-reflectivegydF4y2Ba算法不涉及gydF4y2BaλgydF4y2Ba:gydF4y2Ba

    W = HessMultFcn(H,v);gydF4y2Ba

    结果gydF4y2BaW = H*vgydF4y2Ba。gydF4y2BafmincongydF4y2Ba通过gydF4y2BaHgydF4y2Ba作为目标函数的第三个输出返回的值(参见gydF4y2Bafminunc trust-region或fmincon trust-region反射算法的HessiangydF4y2Ba).gydF4y2BafmincongydF4y2Ba也通过gydF4y2BavgydF4y2Ba的向量或矩阵gydF4y2BangydF4y2Ba行。中的列数gydF4y2BavgydF4y2Ba可以变化,所以写gydF4y2BaHessMultFcngydF4y2Ba接受任意数量的列。gydF4y2BaHgydF4y2Ba不一定非得是黑森人;相反,它可以是任何能让你计算的东西gydF4y2BaW = H*vgydF4y2Ba。gydF4y2Ba

    设置选项如下:gydF4y2Ba

    选项= optimoptions(gydF4y2Ba“fmincon”gydF4y2Ba,gydF4y2Ba“算法”gydF4y2Ba,gydF4y2Ba“trust-region-reflective”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“SpecifyObjectiveGradient”gydF4y2Ba,真的,gydF4y2Ba“HessianMultiplyFcn”gydF4y2Ba, @HessMultFcn);gydF4y2Ba

    使用Hessian乘法函数的示例gydF4y2Batrust-region-reflectivegydF4y2Ba算法,看到gydF4y2Ba密集结构Hessian,线性等式的最小化gydF4y2Ba。gydF4y2Ba

纳入衍生品的好处gydF4y2Ba

如果不提供梯度,求解器将通过有限差分估计梯度。如果您提供梯度,则求解器不需要执行此有限差分估计,因此可以节省时间并更准确,尽管有限差分估计对于复杂的导数可能更快。此外,求解器使用近似的黑森量,这可能与真正的黑森量相差甚远。提供Hessian可以在更少的迭代中产生解决方案。例如,参见end ofgydF4y2Ba计算梯度和黑森使用符号数学工具箱gydF4y2Ba。gydF4y2Ba

对于受限问题,提供梯度还有另一个好处。求解器可以到达一个点gydF4y2BaxgydF4y2Ba这样gydF4y2BaxgydF4y2Ba是可行的,但是,对于这个gydF4y2BaxgydF4y2Ba,有限差gydF4y2BaxgydF4y2Ba总是导致一个不可行的点。进一步假设目标函数在不可行点处返回复杂输出,gydF4y2Ba正gydF4y2Ba,gydF4y2Ba南gydF4y2Ba,或错误。在这种情况下,求解器可能会失败或过早停止。提供一个梯度允许求解器继续进行。为了获得这种好处,您可能还需要包含非线性约束函数的梯度,并设置gydF4y2BaSpecifyConstraintGradientgydF4y2Ba选项gydF4y2Ba真正的gydF4y2Ba。看到gydF4y2Ba非线性约束gydF4y2Ba。gydF4y2Ba

内点选择输入黑森近似gydF4y2BafmincongydF4y2Ba

的gydF4y2BafmincongydF4y2Ba内点gydF4y2Ba算法有许多选择输入黑森近似的选项。有关语法细节,请参见gydF4y2Ba黑森作为输入gydF4y2Ba。以下是这些选项,以及对它们的相对特征的估计。gydF4y2Ba

黑森gydF4y2Ba 相对内存使用率gydF4y2Ba 相对效率gydF4y2Ba
“蓄热”gydF4y2Ba(默认)gydF4y2Ba 高(针对大问题)gydF4y2Ba 高gydF4y2Ba
“lbfgs”gydF4y2Ba 低至中gydF4y2Ba 温和的gydF4y2Ba
“fin-diff-grads”gydF4y2Ba 低gydF4y2Ba 温和的gydF4y2Ba
“HessianMultiplyFcn”gydF4y2Ba 低(可能取决于您的代码)gydF4y2Ba 温和的gydF4y2Ba
“HessianFcn”gydF4y2Ba ?(取决于你的代码)gydF4y2Ba 高(取决于你的代码)gydF4y2Ba

使用默认值gydF4y2Ba“蓄热”gydF4y2Ba黑森人,除非你gydF4y2Ba

的原因gydF4y2Ba“lbfgs”gydF4y2Ba只有适度的效率是双重的。它有相对昂贵的谢尔曼-莫里森更新。结果迭代步骤可能有些不准确,因为gydF4y2Ba“lbfgs”gydF4y2Ba有限的记忆。gydF4y2Ba

的原因gydF4y2Ba“fin-diff-grads”gydF4y2Ba和gydF4y2BaHessianMultiplyFcngydF4y2Ba只有适度的效率是他们使用共轭梯度方法。它们能准确地估计目标函数的Hessian,但不能生成最精确的迭代步长。有关更多信息,请参见gydF4y2Bafmincon内点算法gydF4y2Ba,并讨论了低密度脂蛋白法和共轭梯度法的求解gydF4y2Ba方程38gydF4y2Ba。gydF4y2Ba

相关的话题gydF4y2Ba