机器学习十大算法之KNN(K最近邻,k-NearestNeighbor)算法

机器学习十大算法之KNN算法

前段时间一直在搞tkinter,机器学习荒废了一阵子。如今想重新写一个,发现遇到不少问题,不过最终还是解决了。希望与大家共同进步。

闲话少说,进入正题。

KNN算法也称最近邻居算法,是一种分类算法。

算法的基本思想:假设已存在一个数据集,数据集有多个数值属性和一个标签属性,输入一个新数据,求新数据的标签。

步骤如下:

  1. 先将新数据拷贝n份,形成一个新的数据集;

  2. 逐行计算新数据集与原数据集的距离;

  3. 按距离长度排序后,统计前K个数据里,那个标签出现的次数最多,新数据就标记为哪个标签。

算法如下:

原文地址:https://www.cnblogs.com/timssd/p/6107708.html