ベイズ最適化のアルゴリズム- MATLAB和Sim金宝appulink MathWorks日本 - 金宝app,下载188bet金宝搏,金宝搏官方网站

ベイズ最適化のアルゴリズム

アルゴリズムの概要

ベイズ最適化のアルゴリズムでは,有界領域でスカラー目的関数f (x)をxについて最小化しようとします。関数は確定的でも確率的 (同じ点 x で評価したときに異なる結果を返す可能性がある) でもかまいません。x の成分は、連続的な実数、整数、カテゴリカル (離散的な名前の集合) のいずれにすることもできます。

メモ

この説明全体でDはxの成分の個数を表します。

最小化の主な要素は以下になります。

f (x)のガウス過程モデル。
f (x)の新しい評価位置のそれぞれでガウス過程モデルを変更するためのベイズ更新法。
次の評価点xを決定するために最大化する(fのガウス過程モデルに基づく)"獲得関数"(x)。詳細は,獲得関数のタイプと獲得関数の最大化を参照してください。

アルゴリズムの概要:

変数の範囲内で無作為に選択したNumSeedPoints個の点x_我についてy_我= f (x_我）を評価します。NumSeedPointsはbayesoptの設定です。評価の失敗がある場合は,評価がNumSeedPoints回成功するまで無作為な点を選択します。各成分の確率分布は,optimizableVariableの变换の値に応じて均等スケールまたは対数スケールのいずれかになります。

次に,以下の手順を繰り返します。

f (x)のガウス過程モデルを更新して,问(f | x_我y_我For I = 1，…，t)の各関数に対する事後分布を取得します(内部的に,bayesoptはfitrgpを使用してガウス過程モデルをデータにあてはめます)。
獲得関数(x)を最大化する新しい点xを求めます。

このアルゴリズムは次のいずれかに達すると停止します。

一定の反復回数(既定は30)
一定の時間(既定は無制限)
ベイズ最適化の出力関数またはベイズ最適化のプロット関数で指定した停止基準

並列におけるアルゴリズムの違いについては,並列ベイズアルゴリズムを参照してください。

モデルをあてはめるためのガウス過程回帰

目的関数fの基となる確率モデルは,観測値にガウスノイズが追加されたガウス過程の事前分布です。つまり,f (x)の事前分布は,平均がμ(x;θ),共分散カーネル関数がk (x, x ';θ)のガウス過程です。ここで,θ はカーネルパラメーターのベクトルです。bayesoptが使用する特定のカーネル関数については,カーネル関数を参照してください。

少し詳しく説明すると,一連の点X = X_我は関連する目的関数の値F = F_我で表されます。関数値 F の事前分布の同時分布は、平均が μ(X)、共分散行列が K(X,X) の多変量正規分布になります。ここで、K_ij= k (x_我, x_j）です。

一般性を失うことなく,事前平均は0になります。

さらに,分散がσ²のガウスノイズが観測値に追加されていると考えられます。したがって,事前分布の共分散はK (X, X;θ)+σ²我になります。

ガウス過程回帰モデルを観測値にあてはめるには,ノイズ分散σ²とカーネルパラメーターθを求めることになります。このあてはめは,fitrgpによって実行される計算負荷の高いプロセスです。

観測値へのガウス過程のあてはめの詳細については,ガウス過程回帰を参照してください。

カーネル関数

カーネル関数k (x, x ';θ)はガウス過程回帰の品質に大きく影響を与える可能性があります。bayesoptは,カーネル(共分散)関数のオプションで定義されているARD Matern 5/2カーネルを使用します。

杖鱼,Larochelleおよび亚当斯［３］を参照してください。

獲得関数のタイプ

bayesoptでは6種類の獲得関数を使用できます。3つの基本タイプがありますが,expected-improvementには每秒または+による修正もあります。

“expected-improvement-per-second-plus”(既定の設定)
“expected-improvement”
“expected-improvement-plus”
“expected-improvement-per-second”
“lower-confidence-bound”
“probability-of-improvement”

獲得関数は,事後分布関数问に基づいて点xの適合度を評価します。エラー制約(目的関数のエラーを参照)など連結制約がある場合,すべての獲得関数は基尔巴特,杖鱼および亚当斯［2］の提案に従って”適合度”の推定を変更します。制約が満たされる確率の推定値を適合度に乗算することにより獲得関数が得られます。

期待改善量

“expected-improvement”群の獲得関数は,目的関数の増大要因となる値を無視して,目的関数の期待改善量を評価します。つまり,以下を定義します。

最小の事後平均の位置としてx_最好的
事後平均の最小値としてμ_问(x_最好的）

その場合,期待改善量は

$E 我（ x ，问）＝ E_{问} ［马克斯（ 0 ， μ_{问} （ x_{最好的} ） - f （ x ））］．$

改善の確率

“probability-of-improvement”の獲得関数は,“expected-improvement”と同様の計算をよりシンプルな方法で行います。どちらの場合も,bayesoptはじめにx_最好的とμ_问(x_最好的）を計算します。そして,“probability-of-improvement”の場合,bayesoptはマージンパラメーターmで修正することにより新しい点xで目的関数の値が向上する確率πを計算します。

$P 我（ x ，问）＝ P_{问} （ f （ x ） < μ_{问} （ x_{最好的} ） - 米）．$

bayesoptは推定ノイズ標準偏差としてmを使用します。bayesoptはこの確率を次のように計算します。

$P 我＝ Φ （ ν_{问} （ x ）），$

ここで

$ν_{问} （ x ）＝ \frac{μ_{问} （ x_{最好的} ） - 米 - μ_{问} （ x ）}{σ_{问} （ x ）} ．$

ここで,Φ(·)は単位正規CDF,σ_问はxにおけるガウス過程の事後標準偏差です。

信頼限界の下限

“lower-confidence-bound”の獲得関数は,各点で事後平均から標準偏差の2倍を減算した曲線Gを調べます。

$G （ x ）＝ μ_{问} （ x ） - 2 σ_{问} （ x ）．$

G (x)は目的関数モデルの信頼包絡線より2σ_问小さくなります。そして,bayesoptはGの負数を最大化します。

$l C B ＝ 2 σ_{问} （ x ） - μ_{问} （ x ）．$

秒単位

目的関数を評価する時間は,領域によって異なる場合があります。たとえば,多くのサポートベクターマシンは特定の点の範囲で大幅に計算時間が変化します。このような場合,bayesoptは獲得関数で時間の重みを使用することにより,秒単位で向上させることができます。コストに重みを付けた獲得関数には,名前に每秒という語句が含まれています。

これらの獲得関数は以下のように機能します。目的関数の評価時に,bayesoptは目的関数の評価時間を点xの関数として別のベイズモデルに保持します。獲得関数が使用する毎秒の期待改善量は次のようになります。

$E 我 p 年代（ x ）＝ \frac{E 我_{问} （ x ）}{μ_{年代} （ x ）} ，$

ここで,μ_年代(x)は時間のガウス過程モデルの事後平均です。

プラス

目的関数の局所的な最小値を回避するため,名前に+がある獲得関数は,領域を"過剰利用"していると推定した場合に動作を変更します。過剰利用について理解するため,σ_F(x)がxにおける事後目的関数の標準偏差であるとします。σを加法性ノイズの事後標準偏差であるとします。したがって

σ_问²(x) =σ_F²(x) +σ²．

正の数値であるExplorationRatioオプションの値になるようにt_σを定義します。bayesoptの+の獲得関数は,各反復後に次の点xが以下を満たすかどうかを評価します。

σ_F(x) < t_σσ。

条件が満たされる場合,xは過剰利用であると判断されます。そして,公牛[1]が提案しているように,θに反復回数を乗算することにより獲得関数のカーネル関数が修正されます。この変更により,観測値の間にある点の分散σ_问が大きくなります。次に,新しくあてはめたカーネル関数に基づいて新しい点が生成されます。新しいが点x再び過剰利用になる場合,θに10という追加係数を乗算して再度試します。これを最大5回繰り返して,過剰利用にならない点xを生成しようとします。このアルゴリズムでは,次の点として新しxいが受け入れられます。

したがって,ExplorationRatioは大域解を向上させる新しい点を探索するか,あるいは既に調べた点の近傍に集中するかのトレードオフを制御します。

獲得関数の最大化

内部的に,bayesoptは以下の一般的な手順を使用して獲得関数を最大化します。

“expected-improvement”で始まるアルゴリズムの場合と“probability-of-improvement”の場合,bayesoptは変数の範囲内で数千個の点を抽出し,最良(平均値が小さい)実行可能点をいくつか選択し,局所探索を使用して改善を行い,表面上の最良実行可能点を見つけることにより,事後分布について最小実行可能平均μ_问(x_最好的）を推定します。実行可能とは,点が制約(ベイズ最適化の制約を参照)を満たすことを意味します。
すべてのアルゴリズムの場合,bayesoptは変数の範囲内で数千個の点を抽出し,最良(獲得関数の値が大きい)実行可能点を選択し,局所探索を使用して改善を行い,表面上の最良実行可能点を見つけます。獲得関数の値は目的関数のサンプルではなくモデル化された事後分布に基づくので,高速に計算することができます。