从hash算法到java hashcode()

转载 https://blog.csdn.net/Walk_er/article/details/74976146

hash算法是一个摘要算法（yy：描述性算法：可以给一个物体确切的描述，但是不能通过这个描述去确定这个物体）:，从数据A的基础上，获取一个新的数据B，那么B就是A的指纹，它从某种程度上“描述”了A。

指纹数据一般都是整型数据。

hash算法有很多应用: 加密：MD5 SHA1等；辨数据完整性（是否被篡改过）；编程领域它还可以用在快速存取上，也就是Hash表。

哈希算法并不是一个特定的算法而是一类算法的统称。哈希算法也叫散列算法，满足这样的关系式：f(data)=key，输入任意长度的data数据，定长的key。这个过程是不可逆的，无法由key逆推出data，这个特性用于加密算法

场景一：快速存取
如果你只有两个对象（包含多条数据的集合），你想比较他们，那你肯定用不着hash算法，但是如果你有20,000个对象，当你新拿来一个对象想看看这20,000个对象里面有没有跟他重复的那你就要循环比较20000次，挨个进行比较，再或者你想在这20000个数据中剔除掉重复的，如果迭代进行比较那就有的忙了。而如果有一个算法可以根据对象内部的多个数据生成一个新的数据（“指纹”），之后只需要比较这个指纹，那工作就立马变的简单了。

场景二：信息摘要（既描述的对比）
比如百度云盘——人们把文件上传上云盘中。但其实很多文件是重复的，什么MP3之类的，基本就是那么相同的几个。服务器没有必要重复存储这么多信息。一个合理的方式是，当用户上传一个文件时，给文件一个哈希码。当另一个用户上传同一个文件时，先在服务器查有无这个哈希码，如果有，用户就不用上传了，这就是所谓妙传技术，有时候几百M的文件，瞬间就上传完毕就是这个道理，另一方面，再下载某个文件的时候，为了检查所下载的文件是否完整，没有损坏，会对下载完的文件做一次MD5，与之前的文件‘指纹’做对比。

场景三：加密
密码的使用，可能大家都看过谍战片，电报以密文形式传输，https也是密文传输，这是一种既可以加密也可以解密的加密方式，一旦被敌人知道了密钥就会被破解。不要局限于这种加密方式。还有一种加密方式，在特定条件下有用，比如登录密码（要求不可逆）。我们设定登录密码的初衷并非为了告知别人我的密码内容是什么，那么我们的密码就可以使用不可以解密的方式被加密，假如我设置了密码abc，它被加密成为xyz（f（abc）=xyz），在我登录的时候系统不需要解密xyz，而是要求我再次输入可以被加密为xyz的密码。

java中hashcode()方法就是产生一个对象的指纹数据，这个指纹数据有比较小的可能性会发生碰撞，这时候就只能通过equals方法来进行判断了。
而hashcode()方法的应用就是在hashmap和hashtable了。

tip：

哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值，这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母，随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入，在计算上是不可能的，所以数据的哈希值可以检验数据的完整性。一般用于快速查找和加密算法
——《数据结构与算法分析》