iOS RunTime 底层原理探究

什么是RunTime

OC是一门动态性比较强的编程语言跟C,C++等静态语言有很大的不同。

静态语言：如C语言编译阶段就要决定调用哪个函数如果函数未实现就会报错。

动态语言:编译阶段并不能决定真正调用哪个函数只要函数声明过没有实现也不会报错。

OC之所以被称为动态语言就是因为它把一些决定性的工作从编译阶段推迟到运行阶段。OC代码的运行不仅需要编译器，还需要运行时系统(Runtime Sytem)来执行编译后的代码。

RunTime 是一套底层纯C语言的API。OC代码最终都会被编译器编译为运行时代码。然后通过消息机制决定函数调用的方式。这也是OC作为动态语言使用的基础。

isa详解

要想学习RunTime 首先要了解它底层的一些常用的数据结构比如isa指针。

之前我们总是认为OC中的每个对象都包含着一个isa指针，实例对象的isa指针指向类对象类对象的isa指针指向元类对象元类对象的isa指向基类。

那么isa中只有这些信息吗，其实我们可以再深入的探究一下的。在arm64的架构中isa指针并不是直接指向类对象而是要进行一次位运算本身的isa指针地址 &ISA_MASK 才能得到类对象或者元类对象。在arm64之前isa就是一个普通的指针，存储着Class meta-Class对象的内存地址。arm64架构开始，对isa指针进行了优化，变成了一个共用体结构，还使用位域来存储更多的信息。所以在arm64架构中，我们拿到isa指针地址后还要进行&ISA_MASK才能得到Class meta-Class对象的地址。

如果你看RunTime的源码你会发现objc_object中的isa指针已经变成isa_t这种共用体结构了。里面通过位域技术存储了更多的信息。

union isa_t 
{
    isa_t() { }
    isa_t(uintptr_t value) : bits(value) { }

    Class cls;
    uintptr_t bits; //存放所有的数据 一共64位 下面struct结构体中的属性 写在前面的在低地址位置 也就是位数的最右边

#if SUPPORT_PACKED_ISA
# if __arm64__
#   define ISA_MASK        0x0000000ffffffff8ULL
#   define ISA_MAGIC_MASK  0x000003f000000001ULL
#   define ISA_MAGIC_VALUE 0x000001a000000001ULL
    struct {
        uintptr_t nonpointer       : 1; //占1位 0代表普通指针 代表着isa只存储着Class meta-Class对象的内存地址 1 代表优化过 使用位域存储着更多的信息
        uintptr_t has_assoc        : 1;//是否设置过关联对象 没有释放更快
        uintptr_t has_cxx_dtor     : 1;//是否有C++的析构函数 没有释放的更快
        uintptr_t shiftcls         : 33;//存储着Class meta-Class对象的内存地址信息
        uintptr_t magic            : 6;//用于在调试时分辨对象是否未完成初始化
        uintptr_t weakly_referenced : 1;//是否被弱指针指向过
        uintptr_t deallocating      : 1;//对象是否正在释放
        uintptr_t has_sidetable_rc  : 1;//引用计数是否过大 无法存储在isa中 如果为1 那么引用计数会存储在一个叫SideTable的类的属性中
        uintptr_t extra_rc          : 19;//存储的值是引用计数减1
#       define RC_ONE   (1ULL<<45)
#       define RC_HALF  (1ULL<<18)
    };
}

很显然位域技术可以用更小的内存存储更多的信息比如BOOL值一般存储一个BOOL值需要一个字节但是如果使用位域技术一个自己 0000 0000 用每一位代表一个二进制的信息一个字节就可以存储8个BOOL值的信息了。

Class的结构

struct objc_class : objc_object {
    // Class ISA;
    objc_class;
    Class superclass;
    cache_t cache;             // 方法缓存
    class_data_bits_t bits;    // 用于获取具体的类信息 &FAST_DATA_MASK 得到 class_rw_t
}

struct class_rw_t { //可读可写
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro; //指向了另一张表 ro_t 只读表

    method_array_t methods; //方法列表 二维数组 method_array_t 装着 method_list_t 里面装着method_t
    property_array_t properties; //属性信息 二维数组
    protocol_array_t protocols; //协议信息 二维数组

    Class firstSubclass;
    Class nextSiblingClass;

    char *demangledName;
}

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize;
#ifdef __LP64__
    uint32_t reserved;
#endif

    const uint8_t * ivarLayout;
    
    const char * name;
    method_list_t * baseMethodList; //方法信息 一维数组 method_list_t 装着method_t 
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars; //属性信息

    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;

    method_list_t *baseMethods() const {
        return baseMethodList;
    }
};

上面就是objc_class的结构了可以清晰的看到存储了isa指针属性信息方法信息协议信息成员变量等重要信息。

class_rw_t 里面的methods properties protocols 是二维数组是可读可写的包含了类的初始内容(初始化时候已有的属性协议方法) 分类的内容。

class_ro_t 里面的baseMethodList baseProtocols ivars baseProperties是一维数组是只读的包含了类的初始内容

为什么class_rw_t 和 class_ro_t 都存储了类的初始信息呢是不是感觉有点浪费呢？还记得我们OC中的分类吗，一个类初始的方法协议成员变量属性等信息其实是存储在class_ro_t中的，但是在运行阶段RunTime系统会把class_ro_t存储的方法属性协议等信息和分类中的方法协议属性等信息一并合并到class_rw_t中，并且分类的方法靠前。所以class_rw_t存储的原始信息是这样来的。class_rw_t一开始是不存在的在运行的时候合并的时候创建出来的。一开始bits是指向class_ro_t的我们设置了class_rw_t后才指向class_rw_t的。

method_t

struct method_t {
    SEL name; //函数名 SEL代表方法或者函数名字 一般叫做选择器
    const char *types; //编码(返回值类型 参数类型) 是个字符串 根据encode指令编写的 比如 v代表void @代表id类型 :代表SEL类型
    IMP imp; // 指向函数的指针 IMP代表函数的具体实现

    struct SortBySELAddress :
        public std::binary_function<const method_t&,
                                    const method_t&, bool>
    {
        bool operator() (const method_t& lhs,
                         const method_t& rhs)
        { return lhs.name < rhs.name; }
    };
};

不同类中如果有相同的方法名他们的选择器是相同的即SEL相同可通过@selector() 或者 sel_registerName()获取

cache_t 方法缓存

cache 用散列表来缓存曾经调用过的方法可以提高方法的查找速度.

我们都知道当向对象发送一个消息的时候，对象会通过自己的isa指针找到类对象或者元类对象存储的方法列表中找到并实现，这个需要遍历方法列表寻找，如果在类对象或者元类对象的方法列表中找不到该方法，类对象和元类对象还会通过自己的superClass指针到自己的父类对像或者父类元类对象的方法列表中遍历寻找，直到找到该方法的实现。如果我们常用的方法每次都这样寻找会很麻烦。所以苹果对我们对象每次调用多的方法都缓存到类对象或者元类对象的cache中。这样每次调用方法，会先通过isa指针找到类对象或者元类对象的cache列表中查找，如果找到直接调用。找不到，在走以上过程，找到了就缓存到cache列表中。极大的提高了效率

缓存cache_t的底层结构

struct cache_t {
    struct bucket_t *_buckets; //散列表
    mask_t _mask; //散列表的长度-1
    mask_t _occupied;//已经缓存的方法数量
}

struct bucket_t {
private:
    cache_key_t _key; //SEL 作为key
    IMP _imp; //函数的内存地址
}

散列表为什么比较快呢，散列表可以避免遍历直接找到目标。

原理是这样的。存储的时候通过一定的规则得到一个索引那么我们就将存储的内容放到这个索引对应的位置。取出的时候可以按照规则直接得到索引，迅速找到。

方法缓存的索引规则其实是通过@selector('方法名') & _mask = 数组中的索引，得到这个索引后直接将该方法封装成bucket_t存储到该索引位置。取出时根据相同的规则得到索引，直接取值。

如果@selector('方法名') & _mask 得到索引值已经存储了东西那么会存储到@selector('方法名') & （_mask -1）的位置。取出的时候也是如果发现key和调用的方法名不对，那么会@selector('方法名') & （_mask -1)得到一个新的索引值重新取。以此类推

如果索引之间有间距直接填充NULL 所以是空间换时间散列表就是哈希表

有了Cache_t这个结构体那么消息转发机制就变成了这样先通过isa找到类对象或者元类对象然后在起cache的方法列表中查找方法，如果找不到，再遍历其存储的方法列表查找，如果找到，调用并缓存起来，找不到通过superClass找到父类对象或者父元类对象先在其cache的方法列表中查询，找到调用并缓存到自己的类或者元类。找不到在从其存储的方法列表中查询直到找到调用并缓存到自己类或者元类的cache列表中。

objc_msgSend() 消息机制

MJPerson *person = [[MJPerson alloc] init];
[person personTest];
// objc_msgSend(person, @selector(personTest));
// 消息接收者（receiver）：person
// 消息名称：personTest

OC方法的调用消息机制给方法调用者发送消息

objc_msgSend的执行流程可以分为3大阶段

1.消息发送 2.动态方法解析 3 消息转发

消息发送阶段就是我们上面讲的消息寻找流程如果能找到就调用如果不能就进入第二个阶段允许我们动态的创建方法如果这个阶段我们没做任何事情那么就进入到第三个阶段消息转发可能会找其他对象去调用者饿高方法如果这三个流程都走了还是没找到方法那就报找不到方法的错误了。

消息发送阶段我们已经讲的很清楚了。下面我们来讲一下动态解析阶段

1.先判断是否曾经有过动态解析如果有直接进入消息转发阶段

2.如果没有调用+resolveInstanceMethod或者+resolveClassMethod方法我们可以动态的添加实现标记为已经动态解析然后再次进入消息发送阶段

#import "Person.h"

@interface ViewController ()

@end

@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];
    Person *p = [[Person alloc] init];
    [p test];
    [Person classMethod];
}

@interface Person : NSObject

- (void)test;

+(void) classMethod;

@end

#import "Person.h"
#import <objc/runtime.h>

@implementation Person

//如果消息发送阶段没有找到方法 就会走到动态解析阶段 会调用这个方法
//我们有机会在这个方法里 动态添加方法的实现
//如果我们已经动态添加了方法 又回回到第一阶段 消息发送阶段
+(BOOL)resolveInstanceMethod:(SEL)sel {
    //方案一 如果方法没被实现 回调用我们写的other方法
    if (sel == @selector((test))) {
        Method otherMethod = class_getInstanceMethod(self, @selector(other));
        //相当于放到class_rw_t即类存储的方法列表里面了 所以再次回到消息发送阶段会从类存储的方法列表里找到
        class_addMethod(self, sel, method_getImplementation(otherMethod), method_getTypeEncoding(otherMethod));
        //代表已经实现了动态解析
        return YES;
    }
    return [super resolveInstanceMethod:sel];
}

//如果调用的类方法没被实现 可在这个方法里面动态实现
+ (BOOL)resolveClassMethod:(SEL)sel {
    if (sel == @selector((classMethod))) {
        Method classMethod = class_getClassMethod(self, @selector(classOtherMethod));
        //注意传参事元类对象
        class_addMethod(object_getClass(self), sel, method_getImplementation(classMethod), method_getTypeEncoding(classMethod));
        return YES;
    }
    return [super resolveClassMethod:sel];
}

- (void) other {
    NSLog(@"%s",__func__);
}

+ (void) classOtherMethod {
    NSLog(@"%s",__func__);
}

@end

如果第二阶段我们也没做什么，那么就会进入消息转发阶段。将消息转发给别人。就是自己没能力处理看看别人是否有能力处理。

调用forwradingTargetForSelector:返回一个对象让这个对象接收这个消息走这个对象的消息发送阶段

#import "Person.h"
#import "Student.h"

@interface ViewController ()

@end

@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];
    Person *p = [[Person alloc] init];
    [p test];
    [Person classMethod];
    Student *s = [[Student alloc] init];
    [s test];
}

#import "Student.h"
#import "Person.h"

@implementation Student

//消息转发阶段
- (id)forwardingTargetForSelector:(SEL)aSelector {
    if (aSelector == @selector(test)) {
        //给Person对象 发送test消息
        return [[Person alloc] init];
    }
    return [super forwardingTargetForSelector:aSelector];
}

@end

如果消息转发阶段我们没有实现forwardingTargetForSelector:方法或者该方法返回nil 系统还是给我们提供了一个流程来处理这个问题

会调用 methodSignatureForSelector:返回这个方法的签名这些信息会包装到NSInvocation对象中然后调用 forwardInvocation:方法我们可以修改NSInvocation的调用对象让另外一个对象调用这个方法。达到和实现forwardingTargetForSelector:方法一样的效果

#import "Student.h"
#import "Person.h"

@implementation Student

//消息转发阶段
//- (id)forwardingTargetForSelector:(SEL)aSelector {
//    if (aSelector == @selector(test)) {
//        //给Person对象 发送test消息
//        return [[Person alloc] init];
//    }
//    return [super forwardingTargetForSelector:aSelector];
//}

- (id)forwardingTargetForSelector:(SEL)aSelector {
    if (aSelector == @selector(test)) {
        return nil;
    }
    return [super forwardingTargetForSelector:aSelector];
}
//如果没有实现forwardingTargetForSelector 或者forwardingTargetForSelector 返回nil 会调用这个方法 获取方法签名 然后调用forwardInvocation:方法
//方法签名 返回值类型 参数类型
- (NSMethodSignature *)methodSignatureForSelector:(SEL)aSelector {
    if (aSelector == @selector(test)) {
        // v void 返回值为空 16:所有参数的大小 @0 id类型的参数从0开始 :SEL类型的参数 从第8位开始   返回nil 不会调用forwardingInvocation:方法 就报错了
        return [NSMethodSignature signatureWithObjCTypes:"v16@0:8"];
    }
    return [super methodSignatureForSelector:aSelector];
}
//NSInvocation封装了一个方法调用 包括 方法的调用者 方法 方法参数
//anInvocation.target; 方法调用者
//anInvocation.selector;//方法
//anInvocation getArgument: atIndex: 参数
- (void)forwardInvocation:(NSInvocation *)anInvocation {
//    anInvocation.target = [[Person alloc] init];
//    //调用函数
//    [anInvocation invoke];
    [anInvocation invokeWithTarget:[[Person alloc] init]];
}

@end

如果我们实现methodSignatureForSelector:和forwardInvocation:方法仅仅能达到和forwardingTargetForSelector:一样的效果，那么下面的也太麻烦了。是不是下面的方法还能实现一些不同的效果呢。我们可以看一下事实是，只要我们进入到forwardingInvocation：方法我们可以做任何事情我们甚至可以不给出转发者只打印一下也是可以的。

- (void)forwardInvocation:(NSInvocation *)anInvocation {
//    anInvocation.target = [[Person alloc] init];
//    //调用函数
//    [anInvocation invoke];
//    [anInvocation invokeWithTarget:[[Person alloc] init]];
    //不给出转发者 只打印一下
    NSLog(@"哈哈哈");
}

相当于我们调用test 方法实现的是forwardInvocation:里面的内容。类方法也有消息转发机制只要把消息转发机制的方法变成类方法就行了意思就是-变为+号。因为消息转发机制的三个方法都是用消息接收着直接调用的。如果你传的是实例对象那就是实例方法你传的是个类对象那就是类方法。

super 关键字

struct objc_super {
    __unsafe_unretained _Nonnull id receiver; // 消息接收者
    __unsafe_unretained _Nonnull Class super_class; // 消息接收者的父类
};

在arm64中 objc_super 的构成是一个消息接收者和一个消息接收者的父类

- (void)run {
    // super调用的receiver仍然是MJStudent对象
    // 但是调用的方法 先从父类的cache找 然后从父类的method_list中找
    [super run];
//    struct objc_super arg = {self, [MJPerson class]};
//    objc_msgSendSuper(arg, @selector(run));
//    NSLog(@"MJStudet.......");
}

可以看到虽然调用父类的run方法，但是从objc_msgSendSuper(arg, @selector(run));可以看到消息接收者仍然是子类只不过执行消息发送的时候是从父类开始的。
[super message]的底层实现
1.消息接收者仍然是子类对象
2.从父类开始查找方法的实现

- (instancetype)init
{
    if (self = [super init]) {
        NSLog(@"[self class] = %@", [self class]); // MJStudent
        NSLog(@"[self superclass] = %@", [self superclass]); // MJPerson

        NSLog(@"--------------------------------");

        // objc_msgSendSuper({self, [MJPerson class]}, @selector(class));
        NSLog(@"[super class] = %@", [super class]); // MJStudent
        NSLog(@"[super superclass] = %@", [super superclass]); // MJPerson
    }
    return self;
}

结果为什么是这样呢？其实我们都知道 class方法，是在基类(NSObject)实现的。所以上面的代码调用的其实都是一个方法。接收者都是self 而class 和 superClass的实现是这样的

- (Class)class
{
    return object_getClass(self);
}

- (Class)superclass
{
    return class_getSuperclass(object_getClass(self));
}

所以上面的结局也都是可以理解的了。

RunTime相关的API

#import "ViewController.h"
#import <objc/runtime.h>
#import "MJPerson.h"
#import "MJCar.h"

@interface ViewController ()

@end

@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];
    //动态创建一个类
    Class newClass = objc_allocateClassPair([NSObject class], "MJDog", 0);
    //添加成员变量 第一个参数 为谁添加 第二个 成员变量的名字 第三个 成员变量的大小 第四个对齐方式 一般传1 第五个成员变量的类型
    class_addIvar(newClass, "_age", 4, 1, @encode(int));
    class_addIvar(newClass, "_weight", 4, 1, @encode(int));
    //注册类 如果要添加成员变量和方法 要在这个方法之前调用 因为类管理的成员变量信息是只读的class_ro_t中 注册之后就不能更改了
    //也就是说 已有的类不能再动态的添加成员变量了 但是方法可以 方法是存储在类中class_rw_t中的可读可写
    objc_registerClassPair(newClass);
    //这个dog 就属于MJDog这个类了
    id dog = [[newClass alloc] init];
    [dog setValue:@10 forKey:@"_age"];
    [dog setValue:@20 forKey:@"_weight"];
    NSLog(@"%@",[dog class]); //MJDog
    NSLog(@"%zd and %@",class_getInstanceSize(newClass),[dog valueForKey:@"_age"]); //16 isa 8 _age 4 _weight 4
}

- (void)test {
    MJPerson *person = [[MJPerson alloc] init];
    //获取类对象
    NSLog(@"%p and %p",object_getClass(person),[person class]);
    //获取元类对象
    NSLog(@"%p",object_getClass([person class]));
    [person run];
    //设置类对象指向的isa
    object_setClass(person, [MJCar class]);
    [person run];
    
    //判断一个OC对象是否为calss
    object_isClass(person);
    NSLog(@"%d and %d and %d",object_isClass(person),object_isClass([MJPerson class]),object_isClass(object_getClass([MJPerson class])));
    //是否为一个元类
    class_isMetaClass(object_getClass([MJPerson class]));
}


@end

获取和设置成员变量

//获取成员变量
- (void) getIvar {
    Ivar ageIvar = class_getInstanceVariable([MJCar class], "_age");
    NSLog(@"%s %s",ivar_getName(ageIvar),ivar_getTypeEncoding(ageIvar));
    //设置或者获取成员变量的值
    MJCar *car = [[MJCar alloc] init];
    Ivar name = class_getInstanceVariable([MJCar class], "_name");
    object_setIvar(car, name, @"123");
    NSLog(@"%@",object_getIvar(car, name));
}

获取成员变量列表和获取属性列表

- (void)getIvarList {
    unsigned int count;
    Ivar *ivars = class_copyIvarList([MJCar class], &count);
    for (NSInteger i = 0; i < count ; i ++ ) {
        Ivar ivar = ivars[i];
        const char *cname = ivar_getName(ivar);
        NSString *name = [NSString stringWithCString:cname encoding:NSUTF8StringEncoding];
        NSLog(@"%@",name);
    }
    free(ivars);
    
    //获取属性列表
    unsigned int number;
    objc_property_t *propertys = class_copyPropertyList([MJCar class], &number);
    for (NSInteger i = 0; i < number; i ++) {
        objc_property_t property = propertys[i];
        const char *cname = property_getName(property);
        NSString *name = [NSString stringWithCString:cname encoding:NSUTF8StringEncoding];
        NSLog(@"%@",name);
        //属性的特性
        unsigned int attrCount = 0;
        objc_property_attribute_t *attrs = property_copyAttributeList(property, &attrCount);
        for (unsigned int j = 0; j < attrCount; j ++) {
            objc_property_attribute_t attr = attrs[j];
            const char * name = attr.name;
            const char * value = attr.value;
            NSLog(@"属性的描述：%s 值：%s", name, value);
        }
    }
    free(propertys);
}

讲一下OC的消息机制

OC中的方法调用其实都是转成了objc_msgSend函数的调用，给接收者(方法调用者)发送了一条消息(selector)

objc_msgSend底层有三大阶段消息发送动态解析消息转发阶段

消息发送:

1.判断接收者是否为nil 如果为nil 直接返回

2.实例对象调用方法先通过isa找到类对象然后在类对象的缓存方法列表中查询如果找到直接调用找不到再从类对象存储的方法列表中遍历查找找到调用并且缓存到类对象的cache列表中。找不到通过superClass指针，找到父类对象重复上述过程。类对象调用方法，先通过isa找到元类对象然后在元类对象的缓存方法列表中查询如果找到直接调用找不到再从元类对象存储的方法列表中遍历查找找到调用并且缓存到元类对象的cache列表中。如果还找不到通过superClass指针找到找到父元类对象重复上述过程。

动态解析

如果上面的消息发送阶段到了基类仍没有找到方法实现就会到达动态解析阶段这个阶段会调用两个方法resolveInstanceMethod:(实例对象调用) 或者 resolveClassMethod:(类对象调用) 在这两个方法中系统允许我们动态的添加一些方法的实现(存储到class_rw_t中)。如果实现了该方法会标记为已经动态实现过会再走一遍消息发送流程。事实上只要你重写了这两个方法都会被标记为已经实现了动态解析。

消息转发

如果动态解析阶段我们还是没做什么事情那么就会进入到消息转发阶段这个阶段我们可以指定一个其他的对象来接收这个消息。我们可以实现forwardingTargetForSelector:来指定对象实现如果没有指定对象那么系统会调用methodSignatureForSelector:来获取一个方法签名(如果返回nil 就报错找不到方法) 如果methodSigntureForSelector:没有返回nil 那么就调用 forwardInvocation:方法这个方法我们可以做任何处理

什么是RunTime?平时项目中有用过吗？

OC 是一门动态语言，相比C或者C++编译完成后就已经确定代码的结果，OC可以在运行的时候动态的改变类的实现添加属性修改方法的实现。这一切都是基于运行时的机制。

RunTIme就是C语言封装的一套底层的API 封装了很多动态性相关的函数。

平时我们写的一些代码底层都是转换成了RunTImeAPI进行调用。

1.给分类添加属性关联对象

2.遍历类的所有成员变量，然后访问私有变量或者实现字典转模型归档接档

3.交换方法的实现(一般是交换系统的方法实现，可以实现在调用系统方法的同时，实现自己的一些逻辑)

4.利用消息转发机制解决一些方法找不到的问题

@dynamic 告诉编译器不用生成getter和setter方法也不会自动生成成员变量等到运行时再添加方法的实现

@synthesize 关键字可以自动生成getter和setter方法并且生成一个_xxx的成员变量