实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 软件开发 > 后端开发 > Python

支持向量机——介绍与原理推导（SVM上篇）

Python 更新时间：2026-05-22 00:42:00 发布时间：1863天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

支持向量机
支持向量机（Support Vector Machine，简称SVM），是机器学习中运用较为广泛的一种的算法，在神经网络出现之前，应用十分广泛。SVM算法是一种二分类算法，通过构建超平面函数，来进行样本分类，如下图所示：
如上图，我们希望找到紫色的边界函数（分类超平面），因为紫色的线有更大的几何间距，对于离群点有更好的兼容性，鲁棒性更好，即泛化能力更好。

问题分析
对于样本空间:
$T = {(x_{1}, y_{1}), (x_{2}, y_{2}), \dots, (x_{N}, y_{N})} T=left{ left( x_1,y_1 right) ,left( x_2,y_2 right) ,cdots,left( x_N,y_N right) right}$ T={(x1,y1),(x2,y2),⋯,(xN,yN)}
其中， $x_{i} \in R^{n}, y_{i} \in {+ 1, - 1}, i = 1, 2, \dots, N x_iin R^n,y_iin left{ +1,-1 right} ,i=1,2,cdots,N$ xi∈Rn,yi∈{+1,−1},i=1,2,⋯,N
$x_{i} x_i$ xi为第 $i i$ i个特征向量，也称为实例， $y_{i} y_i$ yi为 $x_{i} x_i$ xi的类标记，当 $y_{i} = + 1 y_i =+1$ yi=+1时，称 $x_{i} x_i$ xi为正例；当 $y_{i} = - 1 y_i=-1$ yi=−1时，称 $x_{i} x_i$ xi为负例， $(x i, y i) (xi,yi)$ (xi,yi)称为样本点。
假设超平面决策边界函数为： $w^{T} \cdot x + b = 0 w^Tcdot x+b=0$ wT⋅x+b=0
其中 $w = (w_{1}, w_{2}, \dots, w_{N}) w=(w_1,w_2,cdots,w_N)$ w=(w1,w2,⋯,wN)为法向量，决定了超平面的方向， $b b$ b为位移项，决定了超平面与原点之间的距离。
由于超平面由 $w w$ w和 $b b$ b唯一确定，故可以将超平面函数记为 $(w, b) (w,b)$ (w,b)
又根据，点到平面的距离公式可得，任一点 $x x$ x到超平面 $(w, b) (w,b)$ (w,b)的距离表示为：
$r = \frac{∣ w^{T} x + b ∣}{∣ ∣ w ∣ ∣} r=frac{|w^Tx+b|}{||w||}$ r=∣∣w∣∣∣wTx+b∣
其中 $r r$ r表示距离， $∣ ∣ w ∣ ∣ ||w||$ ∣∣w∣∣表示法向量 $w w$ w的模。
假设超平面 $(w, b) (w,b)$ (w,b)能对样本进行正确分类，那么对于 $(x_{i}, y_{i}) \in T (x_i,y_i)in T$ (xi,yi)∈T，若 $y_{i} = + 1 y_i=+1$ yi=+1,则有 $w^{T} x_{i} + b > 0 w^Tx_i+b>0$ wTxi+b>0,相反，若若 $y_{i} = - 1 y_i=-1$ yi=−1,则有 $w^{T} x_{i} + b < 0 w^Tx_i+b<0$ wTxi+b<0。我们假设
${\begin{matrix} w^{T} x_{i} + b > = + 1, y_{i} = + 1 \\ w^{T} x_{i} + b < = - 1, y_{i} = - 1 \end{matrix} begin{cases}
w^Tx_i+b>=+1,y_i=+1\
w^Tx_i+b<=-1,y_i=-1
end{cases}$ {wTxi+b>=+1,yi=+1wTxi+b<=−1,yi=−1
这两个式子表示的几何意义如下所示：

在图中，有红色边框的样本在上式所表示的平面之上，我们称之为“支持向量”，上式两个公式之间的距离可以表示为：
$r = \frac{2}{∣ ∣ w ∣ ∣} r=frac{2}{||w||}$ r=∣∣w∣∣2
该公式由平面间距离公式而得，它被称作“间隔”。
我们的目的是为了求得“最大间隔”，即
${max}_{w, b} \frac{2}{∣ ∣ w ∣ ∣} underset{w,b}{max} frac{2}{||w||}$ w,bmax∣∣w∣∣2
其中 $y_{i} (w^{T} x_{i} + b) > = 1, i = 1, 2, \dots, N y_i(w^Tx_i+b)>=1,i=1,2,cdots,N$ yi(wTxi+b)>=1,i=1,2,⋯,N
将最大化问题转化为最小化问题：
${min}_{w, b} \frac{1}{2} ∣ ∣ w ∣ ∣^{2} underset{w,b}{min} frac{1}{2}||w||^2$ w,bmin21∣∣w∣∣2
其中 $y_{i} (w^{T} x_{i} + b) > = 1, i = 1, 2, \dots, N y_i(w^Tx_i+b)>=1,i=1,2,cdots,N$ yi(wTxi+b)>=1,i=1,2,⋯,N
这就是支持向量机的基本型，也即优化目标函数。

解释：
为什么选
${\begin{matrix} w^{T} x_{i} + b > = + 1, y_{i} = + 1 \\ w^{T} x_{i} + b < = - 1, y_{i} = - 1 \end{matrix} begin{cases}
w^Tx_i+b>=+1,y_i=+1\
w^Tx_i+b<=-1,y_i=-1
end{cases}$ {wTxi+b>=+1,yi=+1wTxi+b<=−1,yi=−1
作为样本边界平行函数？
已知，任意一个空间平面可表示为：
$A x + B y + C z + d = 0 Ax+By+Cz+d=0$ Ax+By+Cz+d=0
而平面的平行向量公式为：
$M x + N y + W z + e = 0 Mx+Ny+Wz+e=0$ Mx+Ny+Wz+e=0
其中， $\frac{A}{M} = \frac{B}{N} = \frac{C}{W} \neq \frac{d}{e} frac{A}{M}=frac{B}{N}=frac{C}{W}neqfrac{d}{e}$ MA=NB=WC≠ed,如果比例相等的话，表示的是同一个平面函数。且平行平面之间的距离公式为：
$r = \frac{∣ d - e ∣}{\sqrt{A^{2} + B^{2} + C^{2}}} r=frac{|d-e|}{sqrt{A^2+B^2+C^2}}$ r=A2+B2+C2∣d−e∣
所以针对这种情况，我们完全可以固定分子，通过调整分母大小来改变平行平面之间的距离。不仿，令 $∣ d - e ∣ = 1 |d-e|=1$ ∣d−e∣=1,我们可以通过改变法向量的大小来改变距离大小。再次返回到我们的问题，由于对超平面 $(w, b) (w,b)$ (w,b)的系数 $w w$ w和 $b b$ b进行等比例缩放不改变平面在空间中的几何位置，所以将函数差值固定为1，通过调节 $w w$ w也可以起到改变间距的目的。所以我们假设的边界函数：
${\begin{matrix} w^{T} x_{i} + b > = + 1, y_{i} = + 1 \\ w^{T} x_{i} + b < = - 1, y_{i} = - 1 \end{matrix} begin{cases}
w^Tx_i+b>=+1,y_i=+1\
w^Tx_i+b<=-1,y_i=-1
end{cases}$ {wTxi+b>=+1,yi=+1wTxi+b<=−1,yi=−1
其实表示的是平行函数系，即平行超平面的集合。

拉格朗日对偶性
通过上面的分析，支持向量机算法要优化的目标函数为：
${min}_{w, b} \frac{1}{2} ∣ ∣ w ∣ ∣^{2} 其中 y_{i} (w^{T} x_{i} + b) > = 1, i = 1, 2, \dots, N underset{w,b}{min} frac{1}{2}||w||^2 qquad text{其中}y_i(w^Tx_i+b)>=1,i=1,2,cdots,N$ w,bmin21∣∣w∣∣2其中yi(wTxi+b)>=1,i=1,2,⋯,N
对于此类问题的优化求解，我们可以利用凸优化的凸二次规划来求解具体做法请参考机器学习算法系列（12）：SVM（1）—线性可分支持向量机，也可以采用拉格朗日对偶性来求解。

拉格朗日乘子法的一般形式：
${min}_{x} f_{0} (x) underset{x}{min}f_0(x)$ xminf0(x)
约束条件
$f_{i} (x) \leq 0 i = 1, 2, \dots, m f_i(x)leq0 qquad i=1,2,cdots,m$ fi(x)≤0i=1,2,⋯,m
$h_{i} (x) = 0 i = 1, 2, \dots, q h_i(x)=0 qquad i=1,2,cdots,q$ hi(x)=0i=1,2,⋯,q
进一步转化为：
$m i n L (x, λ, v) = f_{0} (x) + \sum_{i = 1}^{m} λ_{i} f_{i} (x) + \sum_{i = 1}^{q} v_{i} h_{i} (x) min L(x,lambda,v)=f_0(x)+sum_{i=1}^{m}lambda_if_i(x)+sum_{i=1}^{q}v_ih_i(x)$ minL(x,λ,v)=f0(x)+∑i=1mλifi(x)+∑i=1qvihi(x)

根据以上一般形式，我们对最大间隔进行变形,因为有N个样本：
$L (w, b, a) = \frac{1}{2} ∣ ∣ w ∣ ∣^{2} - \sum_{i = 1}^{N} a_{i} (y_{i} (w \cdot x_{i} + b) - 1) L(w,b,a)=frac{1}{2}||w||^2-sum_{i=1}^Na_i(y_i(wcdot x_i+b)-1)$ L(w,b,a)=21∣∣w∣∣2−i=1∑Nai(yi(w⋅xi+b)−1)
其中, $a = (a_{1}, a_{2}, \dots, a_{N})^{T} a=(a_1,a_2,cdots,a_N)^T$ a=(a1,a2,⋯,aN)T
然后我们令 $θ (w) = {max}_{a_{i} \geq 0} L (w, b, a) theta(w)=underset{a_igeq0}{max} L(w,b,a)$ θ(w)=ai≥0maxL(w,b,a)
容易验证，当某个约束条件不满足时，例如 $y_{i} (w^{T} x_{i} + b) < 1 y_i(w^Tx_i+b)<1$ yi(wTxi+b)<1，那么我们显然有 $θ (w) = \infty theta(w)=infty$ θ(w)=∞（只要令 $α_{i} = \infty α_i=infty$ αi=∞即可）。而当所有约束条件都满足时，则有 $θ (w) = \frac{1}{2} ∣ ∣ w ∣ ∣^{2} θ(w)=frac{1}{2}||w||^2$ θ(w)=21∣∣w∣∣2，亦即我们最初要最小化的量。因此，在要求约束条件得到满足的情况下最小化 $\frac{1}{2} ∣ ∣ w ∣ ∣^{2} frac{1}{2}||w||^2$ 21∣∣w∣∣2实际上等价于直接最小化 $θ (w) θ(w)$ θ(w)（当然，这里也有约束条件，就是 $α_{i} \geq 0, i = 1, \dots, n α_i≥0,i=1,…,n$ αi≥0,i=1,…,n），因为如果约束条件没有得到满足， $θ (w) θ(w)$ θ(w) 会等于无穷大，自然不会是我们所要求的最小值。具体写出来，我们现在的目标函数变成了：
${min}_{w, b} θ (w) = \min_{w, b} \max_{a_{i} \geq 0} L (w, b, a) = p^{} underset{w,b}{min}theta(w)=underset{w,b}{min}underset{a_i≥0}{max}Lleft( w,b,a right) =p^$ w,bminθ(w)=w,bminai≥0maxL(w,b,a)=p∗
这里用 $p^{} p^$ p∗ 表示这个问题的最优值，这个问题和我们最初的问题是等价的。不过，现在我们来把最小和最大的位置交换一下：
$\max_{a_{i} \geq 0} \min_{w, b} L (w, b, a) = d^{} underset{a_i≥0}{max}underset{w,b}{min}Lleft( w,b,a right) =d^$ ai≥0maxw,bminL(w,b,a)=d∗
当然，交换以后的问题不再等价于原问题，这个新问题的最优值用 $d^{} d^$ d∗ 来表示。并，我们有 $d^{} \leq p^{} d^leq p^$ d∗≤p∗，这在直观上也不难理解，最大值中最小的一个总也比最小值中最大的一个要大吧！总之，第二个问题的最优值 $d^{} d^$ d∗,在这里提供了一个第一个问题的最优值 $p^{} p^$ p∗ 的一个下界，在满足某些条件的情况下，这两者相等，这个时候我们就可以通过求解第二个问题来间接地求解第一个问题。这就是KKT对偶性原则（其实没必要理解什么是KKT），我们需要知道的是：在满足所有约束条件的情况下：
$\min_{w, b} \max_{a_{i} \geq 0} L (w, b, a) = \max_{a_{i} \geq 0} \min_{w, b} L (w, b, a) = d^{} = p^{} underset{w,b}{min}underset{a_i≥0}{max}Lleft( w,b,a right) =underset{a_i≥0}{max}underset{w,b}{min}Lleft( w,b,a right) =d^=p^$ w,bminai≥0maxL(w,b,a)=ai≥0maxw,bminL(w,b,a)=d∗=p∗
综合以上的所有结论，整理如下：
$θ (w) = \frac{1}{2} ∣ ∣ w ∣ ∣^{2} θ(w)=frac{1}{2}||w||^2$ θ(w)=21∣∣w∣∣2
求解 ${min}_{w, b} \frac{1}{2} ∣ ∣ w ∣ ∣^{2} underset{w,b}{min} frac{1}{2}||w||^2$ w,bmin21∣∣w∣∣2转化为求解 $m i n θ (w) mintheta(w)$ minθ(w),即
${min}_{w, b} \frac{1}{2} ∣ ∣ w ∣ ∣^{2} = {min}_{w, b} θ (w) = \min_{w, b} \max_{a_{i} \geq 0} L (w, b, a) underset{w,b}{min} frac{1}{2}||w||^2=underset{w,b}{min}theta(w)=underset{w,b}{min}underset{a_i≥0}{max}Lleft( w,b,a right)$ w,bmin21∣∣w∣∣2=w,bminθ(w)=w,bminai≥0maxL(w,b,a)
又根据KKT对偶性可得：
${min}_{w, b} \frac{1}{2} ∣ ∣ w ∣ ∣^{2} = \max_{a_{i} \geq 0} \min_{w, b} L (w, b, a) underset{w,b}{min} frac{1}{2}||w||^2=underset{a_i≥0}{max}underset{w,b}{min}Lleft( w,b,a right)$ w,bmin21∣∣w∣∣2=ai≥0maxw,bminL(w,b,a)

推导过程
第一步，求解 $\min_{w, b} L (w, b, a) underset{w,b}{min}Lleft( w,b,a right)$ w,bminL(w,b,a)
对拉格朗日函数 $L (w, b, a) = \frac{1}{2} ∣ ∣ w ∣ ∣^{2} - \sum_{i = 1}^{N} a_{i} (y_{i} (w \cdot x_{i} + b) - 1) L(w,b,a)=frac{1}{2}||w||^2-sum_{i=1}^Na_i(y_i(wcdot x_i+b)-1)$ L(w,b,a)=21∣∣w∣∣2−i=1∑Nai(yi(w⋅xi+b)−1)
的 $w, b w,b$ w,b分别求偏导,并令其偏导为0，求极值，可得：
$\frac{\partial L}{\partial w} = w - \sum_{i = 1}^{N} a_{i} y_{i} x_{i} = 0 frac{partial L}{partial w}=w-sum_{i=1}^Na_iy_ix_i=0$ ∂w∂L=w−i=1∑Naiyixi=0
$\frac{\partial L}{\partial b} = \sum_{i = 1}^{N} a_{i} y_{i} = 0 frac{partial L}{partial b}=sum_{i=1}^Na_iy_i=0$ ∂b∂L=i=1∑Naiyi=0
将以上两式代入拉格朗日公式可得：
$\begin{matrix} L (w, b, a) & = \frac{1}{2} \sum_{i = 1}^{N} \sum_{j = 1}^{N} a_{i} a_{j} y_{i} y_{j} (x_{i} \cdot x_{j}) - \sum_{i = 1}^{N} a_{i} y_{i} ((\sum_{j = 1}^{N} a_{j} y_{j} x_{j}) \cdot x_{i} + b) + \sum_{i = 1}^{N} a_{i} \\ = - \frac{1}{2} \sum_{i = 1}^{N} \sum_{j = 1}^{N} a_{i} a_{j} y_{i} y_{j} (x_{i} \cdot x_{j}) + \sum_{i = 1}^{N} a_{i} \end{matrix} begin{aligned}
L(w,b,a)&=frac{1}{2}sum_{i=1}^N{sum_{j=1}^N{a_ia_jy_iy_jleft( x_icdot x_j right) -sum_{i=1}^N{a_iy_ileft( left( sum_{j=1}^N{a_jy_jx_j} right) cdot x_i+b right) +sum_{i=1}^N{a_i}}}}\
&=-frac{1}{2}sum_{i=1}^N{sum_{j=1}^N{a_ia_jy_iy_jleft( x_icdot x_j right) +sum_{i=1}^N{a_i}}}
end{aligned}$ L(w,b,a)=21i=1∑Nj=1∑Naiajyiyj(xi⋅xj)−i=1∑Naiyi((j=1∑Najyjxj)⋅xi+b)+i=1∑Nai=−21i=1∑Nj=1∑Naiajyiyj(xi⋅xj)+i=1∑Nai

第二步，求解 $\max_{a_{i} \geq 0} \min_{w, b} L (w, b, a) underset{a_i≥0}{max}underset{w,b}{min}Lleft( w,b,a right)$ ai≥0maxw,bminL(w,b,a)
结合第一步，我们第二步要求的目标函数为：
$\max_{a} \sum_{i = 1}^{N} a_{i} - \frac{1}{2} \sum_{i = 1}^{N} \sum_{j = 1}^{N} a_{i} a_{j} y_{i} y_{j} (x_{i} \cdot x_{j}) underset{a}{max} sum_{i=1}^N{a_i}-frac{1}{2}sum_{i=1}^N{sum_{j=1}^N{a_ia_jy_iy_jleft( x_icdot x_j right)}}$ amaxi=1∑Nai−21i=1∑Nj=1∑Naiajyiyj(xi⋅xj)
其中约束条件为：
$\sum_{i = 1}^{N} a_{i} y_{i} = 0 sum_{i=1}^Na_iy_i=0$ i=1∑Naiyi=0
$a_{i} \geq 0, i = 1, 2, \dots, N a_igeq0,i=1,2,cdots,N$ ai≥0,i=1,2,⋯,N
根据式子形式，我们将求最大值问题转换为求最小值问题：
$\min_{a} \frac{1}{2} \sum_{i = 1}^{N} \sum_{j = 1}^{N} a_{i} a_{j} y_{i} y_{j} (x_{i} \cdot x_{j}) - \sum_{i = 1}^{N} a_{i} underset{a}{min} frac{1}{2}sum_{i=1}^N{sum_{j=1}^N{a_ia_jy_iy_jleft( x_icdot x_j right)}}-sum_{i=1}^N{a_i}$ amin 21i=1∑Nj=1∑Naiajyiyj(xi⋅xj)−i=1∑Nai
其中约束条件为：
$\sum_{i = 1}^{N} a_{i} y_{i} = 0 sum_{i=1}^Na_iy_i=0$ i=1∑Naiyi=0
$a_{i} \geq 0, i = 1, 2, \dots, N a_igeq0,i=1,2,cdots,N$ ai≥0,i=1,2,⋯,N
至此推导至这一步，已经可以通过样本计算出 $a_{i} a_i$ ai的值了，然后又根据 $a_{i} a_i$ ai和 $w, b w,b$ w,b的关系，我们可以求出模型：
$\begin{matrix} f (x) & = w^{T} x + b \\ = (\sum_{i = 1}^{N} a_{i} y_{i} x_{i})^{T} x + b \end{matrix} begin{aligned}
f(x)&=w^Tx+b\
&=(sum_{i=1}^Na_iy_ix_i)^Tx+b
end{aligned}$ f(x)=wTx+b=(i=1∑Naiyixi)Tx+b
对于b的计算，选取不为0的 $a_{i} a_i$ ai,然后代入公式：
$b = y_{i} - \sum_{i = 1}^{N} a_{i} y_{i} (x_{i} \cdot x_{j}) b=y_i-sum_{i=1}^N{a_{i}y_ileft( x_i cdot x_j right)}$ b=yi−i=1∑Naiyi(xi⋅xj)
举例：
假设有三个样本点，其中正例 $X_{1} (3, 3) X_1(3,3)$ X1(3,3), $X_{2} (4, 3) X_2(4,3)$ X2(4,3),负例 $X_{3} (1, 1) X_3(1,1)$ X3(1,1)
求解：
$\min_{a} \frac{1}{2} \sum_{i = 1}^{N} \sum_{j = 1}^{N} a_{i} a_{j} y_{i} y_{j} (x_{i} \cdot x_{j}) - \sum_{i = 1}^{N} a_{i} underset{a}{min} frac{1}{2}sum_{i=1}^N{sum_{j=1}^N{a_ia_jy_iy_jleft( x_icdot x_j right)}}-sum_{i=1}^N{a_i}$ amin 21i=1∑Nj=1∑Naiajyiyj(xi⋅xj)−i=1∑Nai
约束条件为：
${\begin{matrix} a_{i} + a_{2} - a_{3} = 0 \\ a_{i} \geq 0, i = 1, 2, 3 \end{matrix} begin{cases}a_i+a_2-a_3=0\
a_igeq0,qquad i=1,2,3end{cases}$ {ai+a2−a3=0ai≥0,i=1,2,3
示意图如下所示：

将数据代入求解公式可得：
$\frac{1}{2} (18 a_{1}^{2} + 25 a_{2}^{2} + 2 a_{3}^{2} + 42 a_{1} a_{2} - 12 a_{1} a_{3} - 14 a_{2} a_{3}) - a_{1} - a_{2} - a_{3} frac{1}{2}left(18a_1^2+25a_2^2+2a_3^2+42a_1a_2-12a_1a_3-14a_2a_3right)-a_1-a_2-a_3$ 21(18a12+25a22+2a32+42a1a2−12a1a3−14a2a3)−a1−a2−a3
由于 $a_{i} + a_{2} - a_{3} = 0 a_i+a_2-a_3=0$ ai+a2−a3=0,化简可得：
$4 a_{1}^{2} + \frac{13}{2} a_{2}^{2} + 10 a_{1} a_{2} - 2 a_{1} - 2 a_{2} 4a_1^2+frac{13}{2}a_2^2+10a_1a_2-2a_1-2a_2$ 4a12+213a22+10a1a2−2a1−2a2
分别对 $a_{1} a_1$ a1和 $a_{2} a_2$ a2求偏导，令偏导等于0，可得， $a_{1} = 1.5, a_{2} = - 1 a_1=1.5,a_2=-1$ a1=1.5,a2=−1
这显然与 $a_{i} \geq 0 a_igeq0$ ai≥0相违背，所以解应该在边界上，分别令 $a_{1} = 0 a_1=0$ a1=0,得 $a_{2} = - \frac{2}{13} a_2=-frac{2}{13}$ a2=−132,同样不满足条件。
令 $a_{2} = 0 a_2=0$ a2=0，满足条件，可得最小值在 $(0.25, 0, 0.25) (0.25,0,0.25)$ (0.25,0,0.25)取得。
将 $a a$ a的取值代入 $w = \sum_{i = 1}^{N} a_{i} y_{i} x_{i} w=sum_{i=1}^Na_iy_ix_i$ w=i=1∑Naiyixi
可得 $w = \frac{1}{4} * 1 * (3, 3) + \frac{1}{4} * (- 1) * (1, 1) = (\frac{1}{2}, \frac{1}{2}) w=frac{1}{4}1(3,3)+frac{1}{4}(-1)(1,1)=(frac{1}{2},frac{1}{2})$ w=41∗1∗(3,3)+41∗(−1)∗(1,1)=(21,21)
$\begin{matrix} b & = y_{i} - \sum_{i = 1}^{N} a_{i} y_{i} (x_{i} \cdot x_{j}) \\ = 1 - (\frac{1}{4} * 1 * 18 + \frac{1}{4} * (- 1) * 6) \\ = - 2 \end{matrix} begin{aligned}b&=y_i-sum_{i=1}^N{a_{i}y_ileft( x_i cdot x_j right)}\
&=1-(frac{1}{4}118+frac{1}{4}(-1)6)\
&=-2
end{aligned}$ b=yi−i=1∑Naiyi(xi⋅xj)=1−(41∗1∗18+41∗(−1)∗6)=−2
故超平面方程为： $0.5 x_{1} + 0.5 x_{2} - 2 = 0 0.5x_1+0.5x_2-2=0$ 0.5x1+0.5x2−2=0

拉格朗日参数分析
对于拉格朗日乘子式,我们为约束条件添加参数 $a_{i} a_i$ ai,为了求得
${max}_{a_{i} \geq 0} L (w, b, a) = {max}_{a_{i} \geq 0} \frac{1}{2} ∣ ∣ w ∣ ∣^{2} - \sum_{i = 1}^{n} a_{i} (y_{i} (w^{T} x_{i} + b) - 1) underset{a_i≥0}{max}L(w,b,a)=underset{a_i≥0}{max}frac{1}{2}||w||^2-sum_{i=1}^na_i(y_i(w^Tx_i+b)-1)$ ai≥0maxL(w,b,a)=ai≥0max21∣∣w∣∣2−i=1∑nai(yi(wTxi+b)−1)
当样本点不在边界函数上时，函数间隔即 $y_{i} (w^{T} x_{i} + b) - 1 y_i(w^Tx_i+b)-1$ yi(wTxi+b)−1大于1，而为了让式子求得最大值，此时对应的 $a_{i} a_i$ ai必须等于0，而对于分布在边界函数上的样本， $y_{i} (w^{T} x_{i} + b) - 1 = 0 y_i(w^Tx_i+b)-1=0$ yi(wTxi+b)−1=0，此时由于 $a_{i} \geq 0 a_igeq0$ ai≥0
所以支持向量机的决策边界函数，仅有 $a_{i} \neq 0 a_ineq0$ ai≠0的量所决定，即仅有在边界函数上的点所决定。
注意：边界函数为： ${\begin{matrix} w^{T} x_{i} + b > = + 1, y_{i} = + 1 \\ w^{T} x_{i} + b < = - 1, y_{i} = - 1 \end{matrix} begin{cases}
w^Tx_i+b>=+1,y_i=+1\
w^Tx_i+b<=-1,y_i=-1
end{cases}$ {wTxi+b>=+1,yi=+1wTxi+b<=−1,yi=−1
决策边界为：
$w^{T} \cdot x + b = 0 w^Tcdot x+b=0$ wT⋅x+b=0

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/219788.html

上一篇 Python3：EOFError: Ran out of input

下一篇完美Python入门基础知识点总结

Python相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号