程序员人生 网站导航

复习机器学习算法:SVM

栏目:php教程时间:2015-09-10 08:06:44

 

SVM的本质是寻觅最大间隔的分割超平面。

SVM的假定也是在样本的每一个属性前面乘以1个系数,代价函数是基于LR演变而来的。LR中是S型函数的假定,SVM中是分段函数cost的情势,再包括正则项,最后SVM的代价函数为:

 

当C1般要设置地很大,这模样的SVM才能够找到最大间隔的超平面,thetaT*x>=1或thetaT*x<=⑴的时候,我们可以把第1项疏忽。这样,转换以后的SVM的目标函数就是我们熟习的:


我们构建拉格朗日函数:


分别对w和b求偏导,令偏导等于0,回代,可以得到w和b的最优解,以下:


W和b都是alpha表示的,我们使用SMO算法求得alpha。

 

 

利用核函数的概念,解决数据的线性不可分问题。核函数的作用,把显示映照到高维空间转换到隐式映照到高维空间。

 

SVM还可以扩大到多类分类中,利用one vs. one或one vs. other的规则。

  

SVM的优点:效果较好,既可以适用线性数据,也能够非线性。

缺点:对参数选择敏感。

 

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐