Uploaded by rockids

理解SVM

advertisement
决定边界 Decision_Boundary
这种使用一条直线 或者是高位空间中的超平面
上述数据分成 两组的方法为:线性分割
从上图中我们看到有很多条直线可以将数据分为蓝红两组
哪一条直线是 最好的呢 ?
直觉上 这条直线应 是与两组数据的距离越远越好。为什么呢
因为测试数据可能有噪音影响 真实数据 + 噪声 。
这些数据不应 影响分类 的准确性。
所以这条距离远的直线抗噪声能力也就最强。
所以 SVM 要做就是 :
找到一条直线 并使这条直线到 训练样本 各组数据的最短距离最大。
支持向量
支持平面
权重向量
特征向量
# 非线性数据分割
可以把一维数据转换成两维数据
简单来说就是在低维空间不能线性分割的数据在高维空间很有可能可以线性分割。
分类错误
我们需要对我们的模型进行修正来找到一个更好的决定边界
最大的边缘 最小的错误分类
Download