결정경계로서의최적의초평면학습하기

金宝app支持向量机(SVM)은신호처리,의료응용분야,자연어처리,음성및영상인식을비롯한여러분류및회귀문제에사용되는지도학습알고리즘입니다。

SVM알고리즘의목표는한클래스의데이터점을다른클래스의데이터점과가능한한가장잘구분해내는초평면을찾는것입니다。”여기서가장잘구분해내는"은두클래스사이의가장큰마진을갖는초평면으로정의되며,이는아래그림에서+와-로표현됩니다。마진은내부에데이터점이없는초평면에평행인슬래브의최대너비를의미합니다。이알고리즘은선형적으로구분되는문제에대해서만이러한초평면을찾을수있으며,대부분의실전문제에서는적은수의오분류를허용하고소프트마진을최대화합니다。

SVM이최대화하는기준인클래스간”마진“의정의。

서포트벡터는구분하는초평면의위치를식별하는훈련관측값중일부를가리킵니다。표준SVM알고리즘은이진분류문제에대해형성되며,다중클래스문제는보통일련의이진클래스문제로축소됩니다。

수학적인세부사항을더자세히살펴보면,支持向量机은金宝app커널함수를사용하여특징을변환할수있는,커널방법이라는머신러닝알고리즘에속합니다。커널함수는데이터를다른(일반적으로는더높은차원의)차원공간으로매핑합니다。이런변환후에는클래스를구분하기가쉬워지고,이로인해복잡한비선형결정경계가매핑된높은차원의특징공간에서선형결정경계로단순화될것으로기대됩니다。이과정에서데이터를명시적으로변환할필요가없습니다(명시적변환에는높은연산비용이따름)。이를”커널트릭“이라고합니다。

MATLAB®은다음과같은여러커널을지원합니다。

SVM의종류 머서커널 설명
가우스또는방사형기저함수(RBF) \ (K (x_1、x_2) = \ exp \离开(- \压裂{\ | x_1——x_2 \ | ^ 2}{2 \σ^ 2}\)\) 단일클래스학습。σ\(\ \)는커널의너비입니다。
선형 \ (K (x_1、x_2) = x_1 ^ {\ mathsf {T}} x_2 \)
2 -클래스학습。
다항식 \ (K (x_1、x_2) = \离开(x_1 ^ {\ mathsf {T}} x_2 + 1 \右)^{\ρ}\)
ρ\ (\ \)는다항식의차수입니다。
시그모이드 \ (K (x_1、x_2) = \双曲正切\离开(\ beta_ {0} x_1 ^ {\ mathsf {T}} x_2 + \ beta_ {1} \) \)
특정\ (\ beta_{0} \)및\ (\ beta_{1} \)값에대해서만머서커널입니다。

金宝app支持向量机을훈련시키는것은클래스간소프트마진을최소화하는초평면에피팅되도록2차최적화문제를푸는것에상응합니다。변환된특징의개수는서포트벡터의개수에따라정해집니다。

요점:

  • 金宝app支持向量机은널리사용되며,여러분류및회귀작업에서좋은성능을보입니다。
  • 金宝app支持向量机은이진분류에대해형성되지만,이진분류기를여러개결합하면다중클래스SVM을형성할수있습니다。
  • 커널은SVM을더유연하고비선형문제를처리할수있도록만듭니다。
  • 결정곡면을생성하려면훈련데이터에서선택된서포트벡터만필요할뿐입니다。훈련된후에는나머지훈련데이터는무의미하기때문에자동화된코드생성에적합한간략한모델표현이생성됩니다。

金宝app支持向量机은결정경계가이상값임계값을사용하여객체가”정상”클래스에속하는지여부를판별하는단일클래스SVM을형성하여이상감지에도사용할수있습니다。이예에서는MATLAB이모든표본을다음과같이이상값의목표비율을토대로단일클래스의파라미터로매핑합니다。fitcsvm(样本,(…),‘OutlierFraction’,…)。아래그래프는인간활동분류작업의데이터에대해OutlierFractions의특정범위에대해구분되는초평면을보여줍니다。

참조:统计和机器学习工具箱,MATLAB을활용한머신러닝

딥러닝과전통적인머신러닝:최상의접근방식선택하기