scikit-learn学习笔记（5）

1.4 Support Vector Machines

建成SVM是一系列supervised learning方法的集合用于分类回归和边界探测，优势在于高维度空间效率高；在维度大于样本数量是仍然有效；在决策函数里training points的子集，使得内存利用更有效率；能在决策函数中使用不同的甚至自定义的内核函数。劣势在于如果特征数量远大于样本数量，才方法可能表现难如人意；svm不直接提供概率评估

svm在scikit里支持饱满矩阵（numpy.ndarray）和稀疏矩阵(scipy.sparse)作为样本向量输入，然而如果用一个svm预测稀疏数据那么svm实用的样本也必须是稀疏数据。出于对运算速度的考虑，使用column major ordered的numpy.ndarray或者scipy.sparse.csr_matrix比较理想