erlang通讯解析浮点数的一些问题

这两天我弟弟遇到一个比较有意思的问题。他在前端协定数据协议的时候用到了float和double,所以他想问float和double在erlang后端中是如何解析的。我之前写协议也很少用到浮点数,所以也就顺便查了下资料。
    一般而言我们常用的类型,字符,字符串,整数,在内存中的存放都一目了然。比如
    ‘A’ = 0x41 
    “ABC” = 0x41, 0x42,0x43
    255(usigned byte) = 0xff
   10000(usinged short) = 0x27,0x10
   10000(integer) = 0x00,0x00,0x27,0x10
   但是浮点数是怎么表示的呢,浮点型变量在计算机内存中占用4字节(Byte),即32-bit。遵循IEEE-754格式标准。
一个浮点数由2部分组成:底数m 和 指数e。
                          ±mantissa × 2exponent
(注意,公式中的mantissa 和 exponent使用二进制表示)
底数部分 使用2进制数来表示此浮点数的实际值。
指数部分 占用8-bit的二进制数,可表示数值范围为0-255。 但是指数应可正可负,所以IEEE规定,此处算出的次方须减去127才是真正的指数。所以float的指数可从 -126到128.
底数部分实际是占用24-bit的一个值,由于其最高位是e位 ,所以最高位省去不存储,在存储中只有23-bit。
到目前为止, 底数部分 23位 加上指数部分 8位 使用了31位。那么前面说过,float是占用4个字节即32-bit,那么还有一位是干嘛用的呢?   还有一位,其实就是4字节中的最高位,用来指示浮点数的正负,当最高位是1时,为负数,最高位是0时,为正数。
   浮点数据就是按下表的格式存储在4个字节中:
                    Address+0       Address+1              Address+2              Address+3
Contents     SEEE EEEE     EMMM MMMM     MMMM MMMM     MMMM MMMM      S: 表示浮点数正负,1为负数,0为正数
      E: 指数加上127后的值的二进制数
      M: 24-bit的底数(只存储23-bit)
主意:这里有个特例,浮点数 为0时,指数和底数都为0,但此前的公式不成立。因为2的0次方为1,所以,0是个特例。当然,这个特例也不用人为去解决,编译器会自动去识别。
   举例将17.625换算成 float型。
   首先,将17.625换算成二进制位:10001.101   ( 0.625 = 0.5+0.125, 0.5即 1/2, 0.125即 1/8 如果不会将小数部分转换成二进制,请参考其他书籍。) 再将 10001.101 向右移,直到小数点前只剩一位 成了 1.0001101 x 2的4次方(因为右移了4位)。此时 我们的底数M和指数E就出来了:
   底数部分M,因为小数点前必为1,所以IEEE规定只记录小数点后的就好,所以此处底数为   0001101 。
   指数部分E,实际为4,但须加上127,固为131,即二进制数 10000011 
   符号部分S,由于是正数,所以S为0.
   综上所述,17.625的 float 存储格式就是:
   0 10000011 00011010000000000000000
   转换成16进制:0x41 8D 00 00 
   在实际erlang写代码中,从网络协议中接收到的字节串一般都是十进制的bitstring形式,如何从里面提取float呢,很简单,直接匹配就好了。 

这里需要注意,C++的float是32位的,而erlang中没有单精度双精度的概念,直接指定位数就好了。 

原文地址:https://www.cnblogs.com/lsm19870508/p/6003249.html