Stream.Write 与 StreamWriter.Write 的区别(转）

Stream.Write 与 StreamWriter.Write 的区别

http://www.cnblogs.com/sorex/archive/2011/11/02/2232056.html

Stream.Write 与 StreamWriter.Write 是我们在向流中写数据时，最常用的方法。

下面就详细讲解这两个方法。

一、测试方法是否结果相同

首先看下面两段代码左侧是StreamWriter.Write 右侧是Stream.Write：

Stream ms = new MemoryStream();

string str = "这是测试字符串";

StreamWriter sw = new StreamWriter(ms, Encoding.UTF8);

sw.Write(str);

sw.Flush();

Stream ms = new MemoryStream();

string str = "这是测试字符串";

byte[] buffer = Encoding.UTF8.GetBytes(str);

ms.Write(buffer, 0, buffer.Length);

ms.Flush();

表面的解读：

（1）把str字符串填写到ms数据流中，都是不能直接写入，要通过中间的过渡。ms是直接的二进制数，相同的二进制数，不同的解码格式会有不同的表现（str)，所以有str到二进制的ms,要经过反编码，这种反编码过程就要通过中间的过渡来实现。

Stream.Write：中间是联系str的buffer

StreamReader：中间是联系stream的StreamReader,但是在底层，中间过渡的StreamReader肯定还是联系的str.

上面我们可以看到StreamWriter.Write的可读性更好一些。

但是这两段代码执行后的ms是否是相同的结果呢？

首先我们来看下长度吧，在代码最后分别加上

Console.WriteLine("StreamWriter.Write：{0}", ms.Length);

Console.WriteLine("Stream.Write：{0}", ms.Length);

执行后结果如下：各位看官，看到这里有何想法？

二、深究原因

下面继续深究一下这个多出来的3个字节

在方法后面都加上如下一段代码将MemoryStream的内容以十六进制的形式打印出来

ms.Position = 0;

byte[] bytes = new byte[ms.Length];

ms.Read(bytes, 0, bytes.Length);

foreach (var item in bytes)

{

Console.Write(item.ToString("X2") + " ");

}

Console.WriteLine(String.Empty);

再次执行结果如下：

这里我们发现用StreamWriter.Write输出多出了EF BB BF这3个字节

Google一下：

多出来的这个玩意是字节顺序记号（英语：byte-order mark，BOM）

在维基百科中可以查到：

ok，了解了这个东西后我们就需要知道在StreamWriter.Write中能否用代码控制不输出这个BOM吗？

三、查找解决办法

开始反编译StreamWriter.Write这个方法：

大致猜测是红色方框的代码输出了BOM信息，ok再进去看：

果然在这里，看上图红框处，GetPreamble方法是获取编码的字节序列，和我们之前查到的信息完全一致。好下面继续找这个haveWrittenPreamble有没设置的可能，在Init方法中找到了它的身影。

杯具了，CanSeed没有set方法，Write之前的Position肯定为0，至此结束。

四、结论由上面的结论，我们可以确定：

1.如果双方协议无BOM时，可以使用Stream.Write方法来输出，或者使用StreamWriter.Write时加入new UTF8Encoding(false)参数。

2.有BOM时，我们可以通过GetPreamble和Stream.Write来完成StreamWriter.Write的功能。

后期自己的试验：

1、使用streamWriter 将数据写入到流文件中，

StreamWriter sw = new StreamWriter(ms, new UTF8Encoding(true));

StreamWriter sw = new StreamWriter(ms, Encoding.UTF8);

效果一致，都多出3个字节（字节顺序记号（英语：byte-order mark，BOM））

sw.Write(str); //将str中数据写入sw -->ms

sw.Flush();

（1）使用StreamReader 进行流文件的读取显示，这个BOM自动识别，不予以显示

ms.Position = 0;

StreamReader sr = new StreamReader(ms);
string str2 = sr.ReadToEnd();
Console.WriteLine(str2);

（2）直接把流文件读到缓存中，通过缓存的转换为string

ms3.Position = 0;

byte[] bytes4 = new byte[ms3.Length];
ms3.Read(bytes4, 0, bytes4.Length);
for (int i = 0; i < bytes4.Length; i++)
{
Console.Write(bytes4[i].ToString("X2") + " ");
}

如果头部有3个BOM 则显示问好， StreamWriter sw = new StreamWriter(ms, new UTF8Encoding(false)); 可以去掉这3个BOM

2、使用Stream.Write 转化，不存在BOM ，直接就是文件的内容，双方的编码方式要一直，这需要双方的协商，而如果都使用StreamReader、StreamWriter,就可以自动识别BOM ,而这也要双方的协商。

3、总结，字符串 ---》流 ----》字符串，前后两个过程都存在着两种转换

字符串----》流 StreamWriter 、Stream.Write( 中间buffer)

要想看这个流的具体内容，都要转换为bytes[] buffer, StreamWriter要转换，Stream.Writer因为中间已经产生了导入到Stream的buffer,所以不用再将Stream转会为buffer，二是直接可以读取前面的buffer。

流--------》字符串 StreamReader、Stream.Read(中间 buffer)

ms3.Position = 0;

StreamReader sr = new StreamReader(ms3);
string str5 = sr.ReadToEnd();
Console.WriteLine(str5);

3、缓冲区的相关操作（这个地方的缓冲区定义为字节数据，所以里面存储的为字节数据，如果定义为其他类型，则存储其他类型）

（1）、byte[] buffer = Encoding.UTF8.GetBytes(str); ：外部string内容编码存储到缓存中

（2）、Encoding myEncoding = Encoding.GetEncoding("gb2312");string str2 = myEncoding.GetString(buffer2); 缓存内容到外部string 的转换

（3）、ms.Position = 0;byte[] bytes = new byte[ms.Length]; System.IO.Stream.Read(bytes, 0,bytes.Length); 外部流内容读取到缓存中（流中是字节）

（4）、System.IO.Stream.Write(buffer, 0, buffer.Length); 内部缓存区内容写入到流中