task05 西瓜书

6.1间隔与支持向量

支持向量:距离超平面最近的且满足一定条件的几个训练样本点
间隔:两个不同类别的支持向量到超平面的距离之和
支持向量机 (support vector machine):最大化间隔

对偶问题 (dual problem):实质相同但从不同角度提出不同提法的一对问题。
支持向量机本身是一个凸二次规划问题 (convex quadratic programming),可直接用现成的优化计算包求解,但是利用拉格朗日乘子法 可得到并进一步求解其对偶问题更加高效。
训练完成后,大部分的训练样本都不会保留,最终模型只与支持向量有关 ,模型复杂度与支持向量的数目有关。

核问题: 对于在原始空间中线性不可分的问题,可以将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分,如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使得样本可分。

核方法(kernel methods):基于核函数的学习方法,最常见的是通过“核化”(引入核函数)来将线性学习器拓展为非线性学习器
核函数直接决定了SVM和核方法的最终性能,但遗憾的是,核函数的选择是一个未决问题。

浙ICP备19012682号