string和byte 数组转换的快速方法(采用unsafe)

最近遇到C#中string和byte相互转换的问题,通常的做法,采用下面的方法进行转换:

1. string -> byte[]

   byte[] data = System.Text.Encoding.Unicode.GetBytes(var); //var is string

2. byte[] -> string

   string var = System.Text.Encoding.Unicode.GetString(data, 0, data.Length); //data is byte[]

注:采用Unicode而不是Default,主要是因为C#中string的存储格式就是Unicode的标准形式,一个字符占用两个字节。当然具体怎么转换取决你的思路,Default采用最节省空间的方式。

这种方法是标准的方法,肯定正确,但是不够快。可以采用unsafe的方法提高效率。具体做法如下:

1. string -> byte[]

            fixed (char* str = var)   //var is string             {                 fixed (byte* ptr = data)    //data is byte[]                 {                     byte* bstr = (byte*)str;      //---------------------1                     for (int i = 0; i < var.Length * 2; i++)                     {                         ptr[i++] = bstr[i];                     }                 }             }

2. byte[] -> string

            char[] tvar = new char[length / 2];             fixed (char* str = tvar)             {                 fixed (byte* ptr = data)                 {                     byte* pstr = (byte*)str;      //-----------------------2                     for (int i = 0; i < data.Length; i++)                     {                         pstr[i] = ptr[i];                     }                 }             }             string var = new string(tvar);

注意:a. 在string中,每个字符占两个字节,所以转换成byte数组时,长度要注意乘以2,反之除以2

      b. 在1,2标记中,有一个强制转换成byte字节,这也正是为了方便下面的for语句拷贝,否则一个c#中一个char也是两个字节。

 

经过测试,对一个简单的中英文混合的字符串转换1000000次,写字符串要快10倍,读字符串大约只快2倍,这是由于最后创建string对象造成的。

原文地址:https://www.cnblogs.com/jx0906/p/3026117.html