IL入门之旅（三）—

IL入门之旅（三）——Dump对象

Dump对象

一个成熟的系统，都少不了一个强大的Log，而Log通常需要把当时的对象的很多信息记录下来，因此Dump对象的功能在很多场合下都会使用到。

那么来看看普通的Dump如何实现：

public class Foo
{
    public string Bar { get; set; }
    public int FooBar { get; set; }
}

Foo foo = new Foo { Bar = "Bar", FooBar = 100, };
Trace.TraceInformation("Foo: Bar=" + foo.Bar + ",FooBar=" + foo.FooBar.ToString());

如此，就把Foo实例的内容记录到Log中，但是，思考一下，如果有100多个地方需要记录Foo对象，就需要写100多遍这样的代码吗?

当然不会这么傻啦，利用扩展方法可以很简单实现：

public static string Dump(this Foo foo)
{
    return "Foo: Bar=" + foo.Bar + ",FooBar=" + foo.FooBar.ToString();
}

Foo foo = new Foo { Bar = "Bar", FooBar = 100, };
Trace.TraceInformation(foo.Dump());

看起来是不是简单多了，当时，如果有100个不同的类型需要Dump，那么就需要100多个扩展方法，并且需要经常性的维护之间的关系。

别忘了，.net的还有强大的反射，来想想反射如何实现：

public static string Dump(this object obj)
{
    return obj.GetType().Name + ": " + string.Join(",",
        (from p in obj.GetType().GetProperties(BindingFlags.Instance | BindingFlags.Public)
         where p.GetGetMethod() != null && p.GetIndexParameters().Length == 0
         select p.Name + "=" + p.GetValue(obj, null)).ToArray());
}

如此简单的就打造了一个近乎万能的Dump方法，不过，别忘了反射的代价：性能。在大多数情况下，使用这种方式的性能损失是可以接受的，但是，如果在一个要求高性能的系统下，这样的性能损失缺是需要深入思考的问题。

目标制定

于是，本文的核心命题就变成寻找一个高性能的并且统一的Dumper。

当然，限于篇幅，需要做明确要实现的Dump的实现范围：

仅仅Dump编译时已知的类型（为了最大限度的利用泛型的性能优势）
仅仅Dump第一层公开实例属性（如果支持Nest，会使问题复杂化）
需要支持null
需要支持结构体
需要支持可空类型

准备外壳

那么首先准备一下Dump的外壳：

public static string Dump<T>(this T obj)
{
    var writer = new StringWriter();
    DumpCore<T>(obj, writer, null);
    return writer.ToString();
}

public static string Dump<T>(this T obj, string separator)
{
    var writer = new StringWriter();
    DumpCore<T>(obj, writer, separator);
    return writer.ToString();
}

public static void Dump<T>(this T obj, StringBuilder builder)
{
    if (builder == null)
        throw new ArgumentNullException("builder");
    DumpCore(obj, new StringWriter(builder), null);
}

public static void Dump<T>(this T obj, StringBuilder builder, string separator)
{
    if (builder == null)
        throw new ArgumentNullException("builder");
    DumpCore(obj, new StringWriter(builder), separator);
}

public static void Dump<T>(this T obj, TextWriter writer)
{
    if (writer == null)
        throw new ArgumentNullException("writer");
    DumpCore(obj, writer, null);
}

public static void Dump<T>(this T obj, TextWriter writer, string separator)
{
    if (writer == null)
        throw new ArgumentNullException("writer");
    DumpCore(obj, writer, separator);
}

其中separator是用于连接属性的分隔符。

所有的Dump方法仅仅检查一下参数，然后调用DumpCore方法，那么DumpCore方法如何实现哪？

想想还是不太好办啊，算了再转嫁一次：

private static void DumpCore<T>(this T obj, TextWriter writer, string separator)
{
    DumperImpl<T>.Action(writer, obj, separator ?? Environment.NewLine);
}

现在从DumpCore变成了DumperImpl<T>了，然后这个类型怎么实现哪？

准备内核

现在想想DumperImpl<T>的骨架：

private static class DumperImpl<T>
{
    public readonly static Action<TextWriter, T, string> Action = CreateAction();

    private static Action<TextWriter, T, string> CreateAction()
    {
        throw new NotImplementedException();
    }
}

这里利用静态构造函数只会运行一次的特性，让CLR帮助我们做同步。

来看看CreateAction方法的实现，这个方法需要创建一个Action，第一个参数是TextWriter，用于写入Dump的内容，第二个参数是T，也就是被Dump的对象，第三个参数是separator，用于分割内容属性。

当然这个Action不可能是现成的，所以需要一个DynamicMethod，于是代码就变成了这样：

private static Action<TextWriter, T, string> CreateAction()
{
    DynamicMethod dm = new DynamicMethod(string.Empty, typeof(void),
        new Type[] { typeof(TextWriter), typeof(T), typeof(string) });
    var il = dm.GetILGenerator();
    // string temp;
    var temp = il.DeclareLocal(typeof(string));
    ProcessWhenObjIsNull(il);
    WriteProperties(il, temp);
    il.Emit(OpCodes.Ret);
    return (Action<TextWriter, T, string>)dm.CreateDelegate(typeof(Action<TextWriter, T, string>));
}

里面有2个方法需要处理，一个是ProcessWhenObjIsNull，用于处理对象是null的情况，第二个是WriteProperties，用于Dump对象的属性。

先来看看第一个，不过先想一下，T在什么情况下，obj可以是null：

首先，T是引用类型
其次，T是可空类型

那么，也就是需要对这两个情况需要添加null检测。不过，首先定义一个null的输出值和TextWriter.Write方法：

private const string NullLiterals = "(null)";

private static readonly MethodInfo TextWriter_Write =
    typeof(TextWriter).GetMethod("Write", new Type[] { typeof(string) });

于是，ProcessWhenObjIsNull的实现就是：

private static void ProcessWhenObjIsNull(ILGenerator il)
{
    if (!typeof(T).IsValueType)
    {
        // if (obj == null) { writer.Write(NullLiterals); return; }
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Ldarg_1);
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Ret);
        il.MarkLabel(NotNullLable);
    }
    else if (Nullable.GetUnderlyingType(typeof(T)) != null)
    {
        // if (obj == null) { writer.Write(NullLiterals); return; }
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Ldarg_1);
        il.Emit(OpCodes.Box, typeof(T));
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Ret);
        il.MarkLabel(NotNullLable);
    }
}

第一个if判断T是否是值类型，如果不是值类型（即：引用类型）则需要判null，第二个判断T是否是可空类型，如果是，则需要判null（利用可空类型为null时装箱值为null的特性）。

剩下一个WriteProperties才是难点，先想想c#怎么写：

string propName = "Property";
writer.Write(propName + "=");
object propValue = obj.Property;
string temp;
if (propValue != null)
{
    temp = propValue.ToString();
}
else
{
    temp = "(null)";
}
writer.Write(temp);

可以发现，Dump属性分成2个部分，一个是写属性的名字，另一个是写属性的值。对了，别忘了还要写separator。

于是，方法的实现就是：

private static void WriteProperties(ILGenerator il, LocalBuilder temp)
{
    foreach (var prop in typeof(T).GetProperties(BindingFlags.Public | BindingFlags.Instance))
    {
        if (prop.GetIndexParameters().Length > 0)
            continue;
        var getMethod = prop.GetGetMethod();
        if (getMethod == null)
            continue;
        WriteHead(il, prop);
        var propCompletedLable = il.DefineLabel();
        WriteValue(il, temp, prop, getMethod, propCompletedLable);
        il.MarkLabel(propCompletedLable);
        WriteSeparator(il);
    }
}

然后就是WriteHead（即：属性名），WriteValue（属性值），WriteSeparator（分隔符），这3个方法。

其中，WriteHead和WriteSeparator方法比较简单：

private static void WriteHead(ILGenerator il, PropertyInfo prop)
{
    // writer.Write("%PropertyName%=");
    il.Emit(OpCodes.Ldarg_0);
    il.Emit(OpCodes.Ldstr, prop.Name + "=");
    il.Emit(OpCodes.Callvirt, TextWriter_Write);
}

private static void WriteSeparator(ILGenerator il)
{
    // writer.Write(separator);
    il.Emit(OpCodes.Ldarg_0);
    il.Emit(OpCodes.Ldarg_2);
    il.Emit(OpCodes.Callvirt, TextWriter_Write);
}

但是，WriteValue就比较复杂了，因为T可能是值类型，也可能是引用类型（在IL里面处理有区别），另外，属性的value同样有null的情况需要处理，另外有个性能优化，如果属性的值类型重写了ToString方法，就不要装箱后再调用object.ToString。

private static readonly MethodInfo Object_ToString =
    typeof(object).GetMethod("ToString", Type.EmptyTypes);

private static void WriteValue(ILGenerator il, LocalBuilder temp,
    PropertyInfo prop, MethodInfo getMethod, Label propCompletedLable)
{
    LoadPropertyValue(il, getMethod);
    var propType = prop.PropertyType;
    ProcessWhenValueIsNull(il, propType, propCompletedLable);
    GetValueString(il, propType, temp);
    WriteValueString(il, temp);
}

private static void LoadPropertyValue(ILGenerator il, MethodInfo getMethod)
{
    // var value = obj.%Property%;
    if (typeof(T).IsValueType)
    {
        il.Emit(OpCodes.Ldarga, 1);
        il.Emit(OpCodes.Call, getMethod);
    }
    else
    {
        il.Emit(OpCodes.Ldarg_1);
        il.Emit(OpCodes.Callvirt, getMethod);
    }
}

private static void ProcessWhenValueIsNull(ILGenerator il, Type propType, Label propCompletedLable)
{
    if (!propType.IsValueType)
    {
        // if (value == null) { writer.Write(NullLiterals); } else ...
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Dup);
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Pop);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Br, propCompletedLable);
        il.MarkLabel(NotNullLable);
    }
    else if (Nullable.GetUnderlyingType(propType) != null)
    {
        // if (value == null) { writer.Write(NullLiterals); } else ...
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Dup);
        il.Emit(OpCodes.Box, propType);
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Pop);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Br, propCompletedLable);
        il.MarkLabel(NotNullLable);
    }
}

private static void GetValueString(ILGenerator il, Type propType, LocalBuilder temp)
{
    if (propType.IsValueType)
    {
        // is override ToString method
        var toStringMethod = propType.GetMethod("ToString",
            BindingFlags.Instance | BindingFlags.Public | BindingFlags.DeclaredOnly,
            null, Type.EmptyTypes, null);
        if (toStringMethod != null)
        {
            // call ToString without boxing
            // %PropertyType% x;
            var x = il.DeclareLocal(propType);
            // x = value;
            il.Emit(OpCodes.Stloc, x);
            // temp = x.ToString();
            il.Emit(OpCodes.Ldloca, x);
            il.Emit(OpCodes.Call, toStringMethod);
            il.Emit(OpCodes.Stloc, temp);
        }
        else
        {
            // call ToString with boxing
            // temp = ((object)value).ToString();
            il.Emit(OpCodes.Box, propType);
            il.Emit(OpCodes.Callvirt, Object_ToString);
            il.Emit(OpCodes.Stloc, temp);
        }
    }
    else
    {
        // temp = value.ToString();
        il.Emit(OpCodes.Callvirt, Object_ToString);
        il.Emit(OpCodes.Stloc, temp);
    }
}

private static void WriteValueString(ILGenerator il, LocalBuilder temp)
{
    // writer.Write(temp);
    il.Emit(OpCodes.Ldarg_0);
    il.Emit(OpCodes.Ldloc, temp);
    il.Emit(OpCodes.Callvirt, TextWriter_Write);
}

终于，一个高性能的Dumper写好了，虽然比起纯反射版的代码复杂了很多。不过，性能方面可以提高很多，接下来不妨测试一下吧。

性能测试

为了测试这个高性能的Dumper到底能有多少性能优势，使用了下面的测试代码：

Foo foo = new Foo { Bar = "Bar", FooBar = 100, };
const int count = 1000000;
Stopwatch sw = Stopwatch.StartNew();
for (int i = 0; i < count; i++)
{
    foo.DumpByReflection();
}
Console.WriteLine(sw.ElapsedMilliseconds);
sw.Reset();
sw.Start();
for (int i = 0; i < count; i++)
{
    foo.Dump();
}

其中DumpByReflection使用第一节中的纯反射方式，来看看运行结果吧：

5795
906

不快嘛，才6倍，为什么哪？再加一个对比测试：

sw.Reset();
sw.Start();
for (int i = 0; i < count; i++)
{
    var temp = "Bar=" + foo.Bar + ", FooBar=" + foo.FooBar.ToString();
}
Console.WriteLine(sw.ElapsedMilliseconds);

再看看速度：

5769
892
353

拼字符串本身就用了353ms，难怪速度快不上去了，那么900ms-350ms，那还有450ms用到哪里去了？

不妨再加一个对比测试：

sw.Reset();
sw.Start();
for (int i = 0; i < count; i++)
{
    foo.Dump(TextWriter.Null);
}
Console.WriteLine(sw.ElapsedMilliseconds);

将内容Dump到TextWriter.Null，这样就不会有字符串拼接带来的性能影响，再来看看结果：

5778
894
352
291

Dumper本身花费的时间约300ms，Dumper另外使用的150ms在干什么哪？其中包括StringBuilder的扩容，还有StringWriter的包装的额外代价。

而反射本身花费的时间越5400ms，也就是9倍的时间，而拼接字符串约350ms，占到Dumper的1/3，反射的6%。

匿名类型

之前的类型都是明确定义的类型，如果是匿名类型呢？

var foo = new { Bar = "Bar", FooBar = 100, };

再次运行，就会发现报错了MethodAccessException，为什么哪？

因为匿名类型被c#编译器翻译为内部类型，而DynamicMethod默认是在Assembly之外的，所以，访问这个类型的方法是受限制的，因此需要修改一下DynamicMethod的声明：

DynamicMethod dm = new DynamicMethod(string.Empty, typeof(void),
    new Type[] { typeof(TextWriter), typeof(T), typeof(string) }, typeof(T));

完成修改后，再跑一下，完全正常了。这个重载和原来的有什么区别哪？最后一个typeof(T)的作用就是把这个动态方法声明为T类型上的方法，因此，无论T是内部类型还是外部类型，对这个方法本身而言，都是可见的，因此绕过了CLR的检查。

最后在来看看性能分析：

19395
889
353
291

除了反射外，性能基本没变，那么反射为什么会变慢哪？因为，访问内部类型的方法需要经过安全检查，这个额外的工作自然拖慢反射的性能。