从hash算法到java hashcode()

转载 https://blog.csdn.net/Walk_er/article/details/74976146

hash算法是一个摘要算法(yy:描述性算法:可以给一个物体确切的描述,但是不能通过这个描述去确定这个物体):,从数据A的基础上,获取一个新的数据B,那么B就是A的指纹,它从某种程度上“描述”了A。

指纹数据一般都是整型数据。 

hash算法有很多应用: 加密:MD5 SHA1等;辨数据完整性(是否被篡改过);编程领域它还可以用在快速存取上,也就是Hash表。

哈希算法并不是一个特定的算法而是一类算法的统称。哈希算法也叫散列算法,满足这样的关系式:f(data)=key,输入任意长度的data数据,定长的key。这个过程是不可逆的,无法由key逆推出data,这个特性用于加密算法

场景一: 快速存取
如果你只有两个对象(包含多条数据的集合),你想比较他们,那你肯定用不着hash算法,但是如果你有20,000个对象,当你新拿来一个对象想看看这20,000个对象里面有没有跟他重复的那你就要循环比较20000次,挨个进行比较,再或者你想在这20000个数据中剔除掉重复的,如果迭代进行比较那就有的忙了。而如果有一个算法可以根据对象内部的多个数据生成一个新的数据(“指纹”),之后只需要比较这个指纹,那工作就立马变的简单了

场景二: 信息摘要 (既描述的对比)
比如百度云盘——人们把文件上传上云盘中。但其实很多文件是重复的,什么MP3之类的,基本就是那么相同的几个。服务器没有必要重复存储这么多信息。一个合理的方式是,当用户上传一个文件时,给文件一个哈希码。当另一个用户上传同一个文件时,先在服务器查有无这个哈希码,如果有,用户就不用上传了,这就是所谓妙传技术,有时候几百M的文件,瞬间就上传完毕就是这个道理,另一方面,再下载某个文件的时候,为了检查所下载的文件是否完整,没有损坏,会对下载完的文件做一次MD5,与之前的文件‘指纹’做对比。

场景三: 加密
密码的使用,可能大家都看过谍战片,电报以密文形式传输,https也是密文传输,这是一种既可以加密也可以解密的加密方式,一旦被敌人知道了密钥就会被破解。不要局限于这种加密方式。还有一种加密方式,在特定条件下有用,比如登录密码(要求不可逆)。我们设定登录密码的初衷并非为了告知别人我的密码内容是什么,那么我们的密码就可以使用不可以解密的方式被加密,假如我设置了密码abc,它被加密成为xyz(f(abc)=xyz),在我登录的时候系统不需要解密xyz,而是要求我再次输入可以被加密为xyz的密码。

java中hashcode()方法就是产生一个对象的指纹数据,这个指纹数据有比较小的可能性会发生碰撞,这时候就只能通过equals方法来进行判断了。 
而hashcode()方法的应用就是在hashmap和hashtable了。

tip:

哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。一般用于快速查找和加密算法 
——《数据结构与算法分析》

原文地址:https://www.cnblogs.com/brxHqs/p/9566527.html