k-近邻算法

K-近邻分类算法

概述

  • knn采用测量不同特征值之间的距离方法进行分类

工作原理

存在一个样本训练集,含标签,已知样本集中每个数据与所属分类的对应关系,输入没有标签的新数据后,将新数据的每个特征与样本数据集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最邻近)的分类标签

优缺点

  • 优点:思想简单,实现起来比较容易,在多分类问题上效果很好
    缺点:效率低下。如果有m个样本和n个特征,则算法复杂度为O(m*n)。当训练数据比较多的时候,可以想象速度有多感人。计算复杂度和空间复杂度都比较大
    而且结果不具有可解释性。

自己想一遍,写一遍吧,掌握才是王道
可以参考这个了,两种实现方式

从文本中解析和导入数据

使用matplotlib创建扩散图

归一化数值

归一化处理的必要性

原文地址:https://www.cnblogs.com/gaowenxingxing/p/12293081.html