scikit-learn学习笔记(5)

1.4 Support Vector Machines

建成SVM是一系列supervised learning方法的集合用于分类回归和边界探测,优势在于高维度空间效率高;在维度大于样本数量是仍然有效;在决策函数里training points的子集,使得内存利用更有效率;能在决策函数中使用不同的甚至自定义的内核函数。劣势在于如果特征数量远大于样本数量,才方法可能表现难如人意;svm不直接提供概率评估

svm在scikit里支持饱满矩阵(numpy.ndarray)和稀疏矩阵(scipy.sparse)作为样本向量输入,然而如果用一个svm预测稀疏数据那么svm实用的样本也必须是稀疏数据。出于对运算速度的考虑,使用column major ordered的numpy.ndarray或者scipy.sparse.csr_matrix比较理想

原文地址:https://www.cnblogs.com/16264412xm/p/6643768.html