关于海明距离和编辑距离

       上午赶回去听了武老师、魏老师的课。于是一些不解在网上搜一下。海明距离:两个码字的对应比特取值不同的比特数称为这两个码字的海明距离。一个有效编码集中,任意两个码字的海明距离的最小值称为该编码集的海明距离。举例如下:10101和00110从第一位开始依次有第一位、第四、第五位不同,则海明距离为3.

       编辑距离:编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

      Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。

      二进制码->格雷码(编码):从最右边一位起,依次将每一位与左边一位异或(XOR),作为对应格雷码该位的值,最左边一位不变(相当于左边是0);   格雷码-〉二进制码(解码):从左边第二位起,将每位与左边一位解码后的值异或,作为该位解码后的值(最左边一位依然不变)。

      若两个二进制编码的每一位都不相同,则这两个编码产生了海明悬崖(Hamming Cliff)。例如,15的二进制编码为01111,16的二进制编码为10000,则产生“Hamming Cliff”。

      于是用文库的帐号下了教程。

己所不欲勿施于人;练兵先练将
原文地址:https://www.cnblogs.com/ubiwind/p/2684766.html