IL入门之旅(三)——Dump对象

Dump对象

    一个成熟的系统,都少不了一个强大的Log,而Log通常需要把当时的对象的很多信息记录下来,因此Dump对象的功能在很多场合下都会使用到。

    那么来看看普通的Dump如何实现:

public class Foo
{
    public string Bar { get; set; }
    public int FooBar { get; set; }
}
Foo foo = new Foo { Bar = "Bar", FooBar = 100, };
Trace.TraceInformation("Foo: Bar=" + foo.Bar + ",FooBar=" + foo.FooBar.ToString());

    如此,就把Foo实例的内容记录到Log中,但是,思考一下,如果有100多个地方需要记录Foo对象,就需要写100多遍这样的代码吗?

    当然不会这么傻啦,利用扩展方法可以很简单实现:

public static string Dump(this Foo foo)
{
    return "Foo: Bar=" + foo.Bar + ",FooBar=" + foo.FooBar.ToString();
}
Foo foo = new Foo { Bar = "Bar", FooBar = 100, };
Trace.TraceInformation(foo.Dump());

    看起来是不是简单多了,当时,如果有100个不同的类型需要Dump,那么就需要100多个扩展方法,并且需要经常性的维护之间的关系。

    别忘了,.net的还有强大的反射,来想想反射如何实现:

public static string Dump(this object obj)
{
    return obj.GetType().Name + ": " + string.Join(",",
        (from p in obj.GetType().GetProperties(BindingFlags.Instance | BindingFlags.Public)
         where p.GetGetMethod() != null && p.GetIndexParameters().Length == 0
         select p.Name + "=" + p.GetValue(obj, null)).ToArray());
}

    如此简单的就打造了一个近乎万能的Dump方法,不过,别忘了反射的代价:性能。在大多数情况下,使用这种方式的性能损失是可以接受的,但是,如果在一个要求高性能的系统下,这样的性能损失缺是需要深入思考的问题。

目标制定

    于是,本文的核心命题就变成寻找一个高性能的并且统一的Dumper。

    当然,限于篇幅,需要做明确要实现的Dump的实现范围:

  • 仅仅Dump编译时已知的类型(为了最大限度的利用泛型的性能优势)
  • 仅仅Dump第一层公开实例属性(如果支持Nest,会使问题复杂化)
  • 需要支持null
  • 需要支持结构体
  • 需要支持可空类型

准备外壳

    那么首先准备一下Dump的外壳:

public static string Dump<T>(this T obj)
{
    var writer = new StringWriter();
    DumpCore<T>(obj, writer, null);
    return writer.ToString();
}

public static string Dump<T>(this T obj, string separator)
{
    var writer = new StringWriter();
    DumpCore<T>(obj, writer, separator);
    return writer.ToString();
}

public static void Dump<T>(this T obj, StringBuilder builder)
{
    if (builder == null)
        throw new ArgumentNullException("builder");
    DumpCore(obj, new StringWriter(builder), null);
}

public static void Dump<T>(this T obj, StringBuilder builder, string separator)
{
    if (builder == null)
        throw new ArgumentNullException("builder");
    DumpCore(obj, new StringWriter(builder), separator);
}

public static void Dump<T>(this T obj, TextWriter writer)
{
    if (writer == null)
        throw new ArgumentNullException("writer");
    DumpCore(obj, writer, null);
}

public static void Dump<T>(this T obj, TextWriter writer, string separator)
{
    if (writer == null)
        throw new ArgumentNullException("writer");
    DumpCore(obj, writer, separator);
}

    其中separator是用于连接属性的分隔符。

    所有的Dump方法仅仅检查一下参数,然后调用DumpCore方法,那么DumpCore方法如何实现哪?

    想想还是不太好办啊,算了再转嫁一次:

private static void DumpCore<T>(this T obj, TextWriter writer, string separator)
{
    DumperImpl<T>.Action(writer, obj, separator ?? Environment.NewLine);
}

    现在从DumpCore变成了DumperImpl<T>了,然后这个类型怎么实现哪?

准备内核

    现在想想DumperImpl<T>的骨架:

private static class DumperImpl<T>
{
    public readonly static Action<TextWriter, T, string> Action = CreateAction();

    private static Action<TextWriter, T, string> CreateAction()
    {
        throw new NotImplementedException();
    }
}

    这里利用静态构造函数只会运行一次的特性,让CLR帮助我们做同步。

    来看看CreateAction方法的实现,这个方法需要创建一个Action,第一个参数是TextWriter,用于写入Dump的内容,第二个参数是T,也就是被Dump的对象,第三个参数是separator,用于分割内容属性。

    当然这个Action不可能是现成的,所以需要一个DynamicMethod,于是代码就变成了这样:

private static Action<TextWriter, T, string> CreateAction()
{
    DynamicMethod dm = new DynamicMethod(string.Empty, typeof(void),
        new Type[] { typeof(TextWriter), typeof(T), typeof(string) });
    var il = dm.GetILGenerator();
    // string temp;
    var temp = il.DeclareLocal(typeof(string));
    ProcessWhenObjIsNull(il);
    WriteProperties(il, temp);
    il.Emit(OpCodes.Ret);
    return (Action<TextWriter, T, string>)dm.CreateDelegate(typeof(Action<TextWriter, T, string>));
}

    里面有2个方法需要处理,一个是ProcessWhenObjIsNull,用于处理对象是null的情况,第二个是WriteProperties,用于Dump对象的属性。

    先来看看第一个,不过先想一下,T在什么情况下,obj可以是null:

  • 首先,T是引用类型
  • 其次,T是可空类型

    那么,也就是需要对这两个情况需要添加null检测。不过,首先定义一个null的输出值和TextWriter.Write方法:

private const string NullLiterals = "(null)";
private static readonly MethodInfo TextWriter_Write =
    typeof(TextWriter).GetMethod("Write", new Type[] { typeof(string) });

    于是,ProcessWhenObjIsNull的实现就是:

private static void ProcessWhenObjIsNull(ILGenerator il)
{
    if (!typeof(T).IsValueType)
    {
        // if (obj == null) { writer.Write(NullLiterals); return; }
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Ldarg_1);
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Ret);
        il.MarkLabel(NotNullLable);
    }
    else if (Nullable.GetUnderlyingType(typeof(T)) != null)
    {
        // if (obj == null) { writer.Write(NullLiterals); return; }
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Ldarg_1);
        il.Emit(OpCodes.Box, typeof(T));
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Ret);
        il.MarkLabel(NotNullLable);
    }
}

    第一个if判断T是否是值类型,如果不是值类型(即:引用类型)则需要判null,第二个判断T是否是可空类型,如果是,则需要判null(利用可空类型为null时装箱值为null的特性)。

    剩下一个WriteProperties才是难点,先想想c#怎么写:

string propName = "Property";
writer.Write(propName + "=");
object propValue = obj.Property;
string temp;
if (propValue != null)
{
    temp = propValue.ToString();
}
else
{
    temp = "(null)";
}
writer.Write(temp);

    可以发现,Dump属性分成2个部分,一个是写属性的名字,另一个是写属性的值。对了,别忘了还要写separator。

    于是,方法的实现就是:

private static void WriteProperties(ILGenerator il, LocalBuilder temp)
{
    foreach (var prop in typeof(T).GetProperties(BindingFlags.Public | BindingFlags.Instance))
    {
        if (prop.GetIndexParameters().Length > 0)
            continue;
        var getMethod = prop.GetGetMethod();
        if (getMethod == null)
            continue;
        WriteHead(il, prop);
        var propCompletedLable = il.DefineLabel();
        WriteValue(il, temp, prop, getMethod, propCompletedLable);
        il.MarkLabel(propCompletedLable);
        WriteSeparator(il);
    }
}

    然后就是WriteHead(即:属性名),WriteValue(属性值),WriteSeparator(分隔符),这3个方法。

    其中,WriteHead和WriteSeparator方法比较简单:

private static void WriteHead(ILGenerator il, PropertyInfo prop)
{
    // writer.Write("%PropertyName%=");
    il.Emit(OpCodes.Ldarg_0);
    il.Emit(OpCodes.Ldstr, prop.Name + "=");
    il.Emit(OpCodes.Callvirt, TextWriter_Write);
}
private static void WriteSeparator(ILGenerator il)
{
    // writer.Write(separator);
    il.Emit(OpCodes.Ldarg_0);
    il.Emit(OpCodes.Ldarg_2);
    il.Emit(OpCodes.Callvirt, TextWriter_Write);
}

    但是,WriteValue就比较复杂了,因为T可能是值类型,也可能是引用类型(在IL里面处理有区别),另外,属性的value同样有null的情况需要处理,另外有个性能优化,如果属性的值类型重写了ToString方法,就不要装箱后再调用object.ToString。

private static readonly MethodInfo Object_ToString =
    typeof(object).GetMethod("ToString", Type.EmptyTypes);
private static void WriteValue(ILGenerator il, LocalBuilder temp,
    PropertyInfo prop, MethodInfo getMethod, Label propCompletedLable)
{
    LoadPropertyValue(il, getMethod);
    var propType = prop.PropertyType;
    ProcessWhenValueIsNull(il, propType, propCompletedLable);
    GetValueString(il, propType, temp);
    WriteValueString(il, temp);
}

private static void LoadPropertyValue(ILGenerator il, MethodInfo getMethod)
{
    // var value = obj.%Property%;
    if (typeof(T).IsValueType)
    {
        il.Emit(OpCodes.Ldarga, 1);
        il.Emit(OpCodes.Call, getMethod);
    }
    else
    {
        il.Emit(OpCodes.Ldarg_1);
        il.Emit(OpCodes.Callvirt, getMethod);
    }
}

private static void ProcessWhenValueIsNull(ILGenerator il, Type propType, Label propCompletedLable)
{
    if (!propType.IsValueType)
    {
        // if (value == null) { writer.Write(NullLiterals); } else ...
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Dup);
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Pop);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Br, propCompletedLable);
        il.MarkLabel(NotNullLable);
    }
    else if (Nullable.GetUnderlyingType(propType) != null)
    {
        // if (value == null) { writer.Write(NullLiterals); } else ...
        var NotNullLable = il.DefineLabel();
        il.Emit(OpCodes.Dup);
        il.Emit(OpCodes.Box, propType);
        il.Emit(OpCodes.Brtrue_S, NotNullLable);
        il.Emit(OpCodes.Pop);
        il.Emit(OpCodes.Ldarg_0);
        il.Emit(OpCodes.Ldstr, NullLiterals);
        il.Emit(OpCodes.Callvirt, TextWriter_Write);
        il.Emit(OpCodes.Br, propCompletedLable);
        il.MarkLabel(NotNullLable);
    }
}

private static void GetValueString(ILGenerator il, Type propType, LocalBuilder temp)
{
    if (propType.IsValueType)
    {
        // is override ToString method
        var toStringMethod = propType.GetMethod("ToString",
            BindingFlags.Instance | BindingFlags.Public | BindingFlags.DeclaredOnly,
            null, Type.EmptyTypes, null);
        if (toStringMethod != null)
        {
            // call ToString without boxing
            // %PropertyType% x;
            var x = il.DeclareLocal(propType);
            // x = value;
            il.Emit(OpCodes.Stloc, x);
            // temp = x.ToString();
            il.Emit(OpCodes.Ldloca, x);
            il.Emit(OpCodes.Call, toStringMethod);
            il.Emit(OpCodes.Stloc, temp);
        }
        else
        {
            // call ToString with boxing
            // temp = ((object)value).ToString();
            il.Emit(OpCodes.Box, propType);
            il.Emit(OpCodes.Callvirt, Object_ToString);
            il.Emit(OpCodes.Stloc, temp);
        }
    }
    else
    {
        // temp = value.ToString();
        il.Emit(OpCodes.Callvirt, Object_ToString);
        il.Emit(OpCodes.Stloc, temp);
    }
}

private static void WriteValueString(ILGenerator il, LocalBuilder temp)
{
    // writer.Write(temp);
    il.Emit(OpCodes.Ldarg_0);
    il.Emit(OpCodes.Ldloc, temp);
    il.Emit(OpCodes.Callvirt, TextWriter_Write);
}

    终于,一个高性能的Dumper写好了,虽然比起纯反射版的代码复杂了很多。不过,性能方面可以提高很多,接下来不妨测试一下吧。

性能测试

    为了测试这个高性能的Dumper到底能有多少性能优势,使用了下面的测试代码:

Foo foo = new Foo { Bar = "Bar", FooBar = 100, };
const int count = 1000000;
Stopwatch sw = Stopwatch.StartNew();
for (int i = 0; i < count; i++)
{
    foo.DumpByReflection();
}
Console.WriteLine(sw.ElapsedMilliseconds);
sw.Reset();
sw.Start();
for (int i = 0; i < count; i++)
{
    foo.Dump();
}

    其中DumpByReflection使用第一节中的纯反射方式,来看看运行结果吧:

5795
906

    不快嘛,才6倍,为什么哪?再加一个对比测试:

sw.Reset();
sw.Start();
for (int i = 0; i < count; i++)
{
    var temp = "Bar=" + foo.Bar + ", FooBar=" + foo.FooBar.ToString();
}
Console.WriteLine(sw.ElapsedMilliseconds);

    再看看速度:

5769
892
353

    拼字符串本身就用了353ms,难怪速度快不上去了,那么900ms-350ms,那还有450ms用到哪里去了?

    不妨再加一个对比测试:

sw.Reset();
sw.Start();
for (int i = 0; i < count; i++)
{
    foo.Dump(TextWriter.Null);
}
Console.WriteLine(sw.ElapsedMilliseconds);

    将内容Dump到TextWriter.Null,这样就不会有字符串拼接带来的性能影响,再来看看结果:

5778
894
352
291

    Dumper本身花费的时间约300ms,Dumper另外使用的150ms在干什么哪?其中包括StringBuilder的扩容,还有StringWriter的包装的额外代价。

    而反射本身花费的时间越5400ms,也就是9倍的时间,而拼接字符串约350ms,占到Dumper的1/3,反射的6%。

匿名类型

    之前的类型都是明确定义的类型,如果是匿名类型呢?

var foo = new { Bar = "Bar", FooBar = 100, };

    再次运行,就会发现报错了MethodAccessException,为什么哪?

    因为匿名类型被c#编译器翻译为内部类型,而DynamicMethod默认是在Assembly之外的,所以,访问这个类型的方法是受限制的,因此需要修改一下DynamicMethod的声明:

DynamicMethod dm = new DynamicMethod(string.Empty, typeof(void),
    new Type[] { typeof(TextWriter), typeof(T), typeof(string) }, typeof(T));

    完成修改后,再跑一下,完全正常了。这个重载和原来的有什么区别哪?最后一个typeof(T)的作用就是把这个动态方法声明为T类型上的方法,因此,无论T是内部类型还是外部类型,对这个方法本身而言,都是可见的,因此绕过了CLR的检查。

    最后在来看看性能分析:

19395
889
353
291

    除了反射外,性能基本没变,那么反射为什么会变慢哪?因为,访问内部类型的方法需要经过安全检查,这个额外的工作自然拖慢反射的性能。

原文地址:https://www.cnblogs.com/vwxyzh/p/1719339.html