《深入理解Android 卷III》第二章深入理解Java Binder和MessageQueue

《深入理解Android 卷III》即将公布。作者是张大伟。此书填补了深入理解Android Framework卷中的一个主要空白，即Android Framework中和UI相关的部分。在一个特别讲究颜值的时代。本书分析了Android 4.2中WindowManagerService、ViewRoot、Input系统、StatusBar、Wallpaper等重要“颜值绘制/处理”模块

注意，此处连载的节选是出版社未排版的内容。

第2章深入理解Java Binder和MessageQueue

本章主要内容：

· 介绍Binder系统的Java层框架

· 介绍MessageQueue

本章所涉及的源码文件名称及位置：

· IBinder.java

frameworks/base/core/java/android/os/IBinder.java

· Binder.java

frameworks/base/core/java/android/os/Binder.java

· BinderInternal.java

frameworks/base/core/java/com/android/intenal/os/BinderInternal.java

· android_util_Binder.cpp

frameworks/base/core/jni/android_util_Binder.cpp

· SystemServer.java

frameworks/base/services/java/com/android/servers/SystemServer.java

· ActivityManagerService.java

frameworks/base/services/java/com/android/servers/ActivityManagerService.java

· ServiceManager.java

frameworks/base/core/java/android/os/ServiceManager.java

· ServcieManagerNative.java

frameworks/base/core/java/android/os/ServcieManagerNative.java

· MessageQueue.java

frameworks/base/core/java/android/os/MessageQueue.java

· android_os_MessageQueue.cpp

frameworks/base/core/jni/android_os_MessageQueue.cpp

· Looper.cpp

frameworks/base/native/android/Looper.cpp

· Looper.h

frameworks/base/include/utils/Looper.h

· android_app_NativeActivity.cpp

frameworks/base/core/jni/android_app_NativeActivity.cpp

2.1 概述

由于本书所介绍的内容主要是以Java层的系统服务为主，因此Binder相关的应用在本书中比比皆是。

而MessageQueue作为Android中重要的任务调度工具，它的使用也是随处可见。所以本书有必要对这两个工具有所介绍。依据邓凡平的允许与推荐，本章由卷II第2章升级到4.2.2而来，并且添加了对AIDL相关的知识点的分析。

以本章作为本书Android分析之旅的开篇，将重点关注两个基础知识点，它们是：

· Binder系统在Java世界是怎样布局和工作的。

· MessageQueue的新职责。

先来分析Java层中的Binder。

建议读者先阅读《深入理解Android：卷I》（以下简称“卷I”）的第6章“深入理解Binder”。网上有样章可下载。

2.2 Java层中的Binder分析

2.2.1 Binder架构总览

假设读者读过卷I第6章“深入理解Binder”。相信就不会对Binder架构中代表Client的Bp端及代表Server的Bn端感到陌生。Java层中Binder实际上也是一个C/S架构，并且其在类的命名上尽量保持与Native层一致。因此可觉得，Java层的Binder架构是Native层Binder架构的一个镜像。Java层的Binder架构中的成员如图2-1所看到的。

图 2 - 1 Java层中的Binder家族

由图2-1可知：

· 系统定义了一个IBinder接口类以及DeathRecepient接口。

· Binder类和BinderProxy类分别实现了IBinder接口。当中Binder类作为服务端的Bn的代表，而BinderProxy作为client的Bp的代表。

· 系统中还定义一个BinderInternal类。

该类是一个仅供Binder框架使用的类。它内部有一个GcWatcher类，该类专门用于处理和Binder相关的垃圾回收。

· Java层相同提供一个用于承载通信数据的Parcel类。

注意 IBinder接口类中定义了一个叫FLAG_ONEWAY的整型，该变量的意义非常重要。当client利用Binder机制发起一个跨进程的函数调用时，调用方（即client）通常会堵塞。直到服务端返回结果。这样的方式和普通的函数调用是一样的。

可是在调用Binder函数时，在指明了FLAG_ONEWAY标志后。调用方仅仅要把请求发送到Binder驱动就可以返回，而不用等待服务端的结果，这就是一种所谓的非堵塞方式。在Native层中，涉及的Binder调用基本都是堵塞的。可是在Java层的framework中。使用FLAG_ONEWAY进行Binder调用的情况非常多，以后经常会碰到。

思考使用FLAG_ONEWAY进行函数调用的程序在设计上有什么特点？这里简单分析一下：对于使用FLAG_ONEWAY的函数来说，client仅向服务端发出了请求，可是并不能确定服务端是否处理了该请求。

所以。client通常会向服务端注冊一个回调（相同是跨进程的Binder调用），一旦服务端处理了该请求，就会调用此回调来通知client处理结果。当然，这样的回调函数也大多採用FLAG_ONEWAY的方式。

2.2.2 初始化Java层Binder框架

尽管Java层Binder系统是Native层Binder系统的一个Mirror，但这个Mirror终归还需借助Native层Binder系统来开展工作，即Mirror和Native层Binder有着千丝万缕的关系。一定要在Java层Binder正式工作之前建立这样的关系。以下分析Java层Binder框架是怎样初始化的。

在Android系统中。在Java初创时期。系统会提前注冊一些JNI函数。当中有一个函数专门负责搭建Java Binder和Native Binder交互关系。该函数是register_android_os_Binder，代码例如以下：

[android_util_Binder.cpp-->register_android_os_Binder()]

int register_android_os_Binder(JNIEnv* env)

{

// 初始化Java Binder类和Native层的关系

if(int_register_android_os_Binder(env) < 0)

return -1;

// 初始化Java BinderInternal类和Native层的关系

if(int_register_android_os_BinderInternal(env) < 0)

return -1;

// 初始化Java BinderProxy类和Native层的关系

if(int_register_android_os_BinderProxy(env) < 0)

return -1;

......

return0;

}

据上面的代码可知，register_android_os_Binder函数完毕了Java Binder架构中最重要的3个类的初始化工作。

1. Binder类的初始化

int_register_android_os_Binder函数完毕了Binder类的初始化工作，代码例如以下：

[android_util_Binder.cpp-->int_register_android_os_Binder()]

static int int_register_android_os_Binder(JNIEnv*env)

{

jclassclazz;

//kBinderPathName为Java层中Binder类的全路径名。“android/os/Binder“

clazz =env->FindClass(kBinderPathName);

/*gBinderOffSets是一个静态类对象。它专门保存Binder类的一些在JNI层中使用的信息，

如成员函数execTranscat的methodID,Binder类中成员mObject的fildID */

gBinderOffsets.mClass = (jclass) env->NewGlobalRef(clazz);

gBinderOffsets.mExecTransact

=env->GetMethodID(clazz, "execTransact", "(IIII)Z");

gBinderOffsets.mObject

=env->GetFieldID(clazz, "mObject", "I");

// 注冊Binder类中native函数的实现

returnAndroidRuntime::registerNativeMethods(

env,kBinderPathName,

gBinderMethods,NELEM(gBinderMethods));

}

从上面代码可知。gBinderOffsets对象保存了和Binder类相关的某些在JNI层中使用的信息。

它们将用来在JNI层对Java层的Binder对象进行操作。

execTransact()函数以及mObject成员的用途将在2.2.3节介绍。

建议假设读者对JNI不是非常清楚。可參阅卷I第2章“深入理解JNI”。

2. BinderInternal类的初始化

下一个初始化的类是BinderInternal。其代码在int_register_android_os_BinderInternal函数中。

[android_util_Binder.cpp-->int_register_android_os_BinderInternal()]

static intint_register_android_os_BinderInternal(JNIEnv* env)

{

jclassclazz;

// 依据BinderInternal的全路径名找到代表该类的jclass对象。

全路径名为

//“com/android/internal/os/BinderInternal”

clazz =env->FindClass(kBinderInternalPathName);

//gBinderInternalOffsets也是一个静态对象，用来保存BinderInternal类的一些信息

gBinderInternalOffsets.mClass = (jclass) env->NewGlobalRef(clazz);

// 获取forceBinderGc的methodID

gBinderInternalOffsets.mForceGc

= env->GetStaticMethodID(clazz, "forceBinderGc","()V");

// 注冊BinderInternal类中native函数的实现

returnAndroidRuntime::registerNativeMethods(

env,kBinderInternalPathName,

gBinderInternalMethods, NELEM(gBinderInternalMethods));

}

int_register_android_os_BinderInternal的工作内容和int_register_android_os_Binder的工作内容相似：

· 获取一些实用的methodID和fieldID。这表明JNI层一定会向上调用Java层的函数。

· 注冊相关类中native函数的实现。

3. BinderProxy类的初始化

int_register_android_os_BinderProxy完毕了BinderProxy类的初始化工作，代码稍显复杂。例如以下所看到的：

[android_util_Binder.cpp-->int_register_android_os_BinderProxy()]

static intint_register_android_os_BinderProxy(JNIEnv* env)

{

jclassclazz;

// ① gWeakReferenceOffsets用来和WeakReference类打交道

clazz =env->FindClass("java/lang/ref/WeakReference");

gWeakReferenceOffsets.mClass = (jclass) env->NewGlobalRef(clazz);

// 获取WeakReference类get函数的MethodID

gWeakReferenceOffsets.mGet= env->GetMethodID(clazz, "get",

"()Ljava/lang/Object;");

// ② gErrorOffsets用来和Error类打交道

clazz =env->FindClass("java/lang/Error");

gErrorOffsets.mClass = (jclass) env->NewGlobalRef(clazz);

// ③ gBinderProxyOffsets用来和BinderProxy类打交道

clazz =env->FindClass(kBinderProxyPathName);

gBinderProxyOffsets.mClass = (jclass) env->NewGlobalRef(clazz);

gBinderProxyOffsets.mConstructor= env->GetMethodID(clazz,"<init>", "()V");

......//获取BinderProxy的一些信息

// ④ gClassOffsets用来和Class类打交道

clazz =env->FindClass("java/lang/Class");

gClassOffsets.mGetName =env->GetMethodID(clazz,

"getName","()Ljava/lang/String;");

// 注冊BinderProxy native函数的实现

returnAndroidRuntime::registerNativeMethods(env,

kBinderProxyPathName,gBinderProxyMethods,

NELEM(gBinderProxyMethods));

}

据上面代码可知，int_register_android_os_BinderProxy函数除了初始化BinderProxy类外，还获取了WeakReference类和Error类的一些信息。

看来BinderProxy对象的生命周期会托付WeakReference来管理。难怪JNI层会获取该类get函数的MethodID。

至此。Java Binder几个重要成员的初始化已完毕。同一时候在代码中定义了几个全局静态对象，各自是gBinderOffsets、gBinderInternalOffsets和gBinderProxyOffsets。

框架的初始化事实上就是提前获取一些JNI层的使用信息，如类成员函数的MethodID。类成员变量的fieldID等。这项工作是必需的，由于它能节省每次使用时获取这些信息的时间。

当Binder调用频繁时，这些时间累积起来还是不容小觑的。

另外，这个过程中所创建的几个全局静态对象为JNI层訪问Java层的对象提供了依据。而在每个初始化函数中所运行的registerNativeMethods()方法则为Java层訪问JNI层打通了道路。

换句话说。Binder初始化的工作就是通过JNI建立起Native Binder与Java Binder之间互相通信的桥梁。

以下通过一个样例来分析Java Binder的工作流程。

2.2.3 窥一斑，可见全豹乎

这个样例源自ActivityManagerService，我们试图通过它揭示Java层Binder的工作原理。先来描写叙述一下该样例的分析步骤：

· 首先分析AMS怎样将自己注冊到ServiceManager。

· 然后分析AMS怎样响应client的Binder调用请求。

本例的起点是setSystemProcess，其代码例如以下所看到的：

[ActivityManagerService.java-->ActivityManagerService.setSystemProcess()]

public static void setSystemProcess() {

try {

ActivityManagerService m = mSelf;

// 将ActivityManagerService服务注冊到ServiceManager中

ServiceManager.addService("activity", m);......

} catch {... }

return;

}

上面所看到的代码行的目的是将ActivityManagerService服务（以后简称AMS）加到ServiceManager中。

在整个Android系统中有一个Native的ServiceManager（以后简称SM）进程。它统筹管理Android系统上的全部Service。成为一个Service的首要条件是先在SM中注冊。以下来看Java层的Service是怎样向SM注冊的。

1. 向ServiceManager注冊服务

（1）创建ServiceManagerProxy

向SM注冊服务的函数叫addService。其代码例如以下：

[ServiceManager.java-->ServiceManager.addService()]

public static void addService(String name, IBinderservice) {

try {

//getIServiceManager返回什么

getIServiceManager().addService(name, service);

}

......

}

首先须要搞清楚getIServiceManager()方法返回的是一个什么对象呢？參考事实上现：

[ServiceManager.java-->ServiceManager.getIServiceManager()]

private static IServiceManagergetIServiceManager() {

......

// 调用asInterface。传递的參数类型为IBinder

sServiceManager = ServiceManagerNative.asInterface(

BinderInternal.getContextObject());

returnsServiceManager;

}

asInterface()方法的參数为BinderInternal.getContextObject()的返回值。于是这个简短的方法中有两个内容值得讨论：BinderInternal.getContextObject()以及asInterface()。

BinderInternal.getContextObject()方法是一个native的函数，參考事实上现：

[android_util_Binder.cpp-->android_os_BinderInternal_getContextObject()]

static jobjectandroid_os_BinderInternal_getContextObject(JNIEnv* env, jobject clazz)

{

/* 以下这句代码在卷I第6章具体分析过。它将返回一个BpProxy对象，当中

NULL（即0，用于标识目的端）指定Proxy通信的目的端是ServiceManager*/

sp<IBinder> b = ProcessState::self()->getContextObject(NULL);

// 由Native对象创建一个Java对象,以下分析该函数

returnjavaObjectForIBinder(env, b);

}

可见，Java层的ServiceManager须要在Native层获取指向Native进程中ServiceManager的BpProxy。这个BpProxy不能由Java层的ServiceManager直接使用。于是android_os_BinderInteral_getContextObject()函数通过javaObjectForIBinder()函数将创建一个封装了这个BpProxy的一个Java对象并返回给调用者。ServiceManager便可一通过这个Java对象实现对BpProxy的訪问。參考这个Java对象的创建过程：

[android_util_Binder.cpp-->javaObjectForIBinder()]

jobject javaObjectForIBinder(JNIEnv* env, constsp<IBinder>& val)

{

//mProxyLock是一个全局的静态CMutex对象

AutoMutex _l(mProxyLock);

/* val对象实际类型是BpBinder。读者可自行分析BpBinder.cpp中的findObject函数。

事实上，在Native层的BpBinder中有一个ObjectManager，它用来管理在Native BpBinder

上创建的Java BpBinder对象。以下这个findObject用来推断gBinderProxyOffsets

是否已经保存在ObjectManager中。

假设是。那就须要删除这个旧的object */

jobjectobject = (jobject)val->findObject(&gBinderProxyOffsets);

if(object != NULL) {

jobject res = env->CallObjectMethod(object,gWeakReferenceOffsets.mGet);

android_atomic_dec(&gNumProxyRefs);

val->detachObject(&gBinderProxyOffsets);

env->DeleteGlobalRef(object);

}

// ① 创建一个新的BinderProxy对象。

并将它注冊到Native BpBinder对象的ObjectManager中

object =env->NewObject(gBinderProxyOffsets.mClass,

gBinderProxyOffsets.mConstructor);

if(object != NULL) {

/* ② 把Native层的BpProxy的指针保存到BinderProxy对象的成员字段mObject中。

于是BinderProxy对象的Native方法能够通过mObject获取BpProxy对象的指针。

这个操作是将BinderProxy与BpProxy联系起来的纽带 */

env->SetIntField(object, gBinderProxyOffsets.mObject,(int)val.get());

val->incStrong(object);

jobject refObject = env->NewGlobalRef(

env->GetObjectField(object, gBinderProxyOffsets.mSelf));

/* 将这个新创建的BinderProxy对象注冊（attach）到BpBinder的ObjectManager中，

同一时候注冊一个回收函数proxy_cleanup。

当BinderProxy对象撤销（detach）的时候，

该函数会被调用，以释放一些资源。读者可自行研究proxy_cleanup函数*/

val->attachObject(&gBinderProxyOffsets, refObject,

jnienv_to_javavm(env), proxy_cleanup);

//DeathRecipientList保存了一个用于死亡通知的list

sp<DeathRecipientList> drl = new DeathRecipientList;

drl->incStrong((void*)javaObjectForIBinder);

//将死亡通知list和BinderProxy对象联系起来

env->SetIntField(object, gBinderProxyOffsets.mOrgue,

reinterpret_cast<jint>(drl.get()));

// 添加该Proxy对象的引用计数

android_atomic_inc(&gNumProxyRefs);

/*以下这个函数用于垃圾回收。创建的Proxy对象一旦超过200个。该函数

将调用BinderInter类的ForceGc做一次垃圾回收 */

incRefsCreated(env);

}

returnobject;

}

BinderInternal.getContextObject的代码有点多，简单整理一下。可知该函数完毕了以下两个工作：

· 创建了一个Java层的BinderProxy对象。

· 通过JNI。该BinderProxy对象和一个Native的BpProxy对象挂钩，而该BpProxy对象的通信目标就是ServiceManager。

接下来讨论asInterface()方法。大家还记得在Native层Binder中那个著名的interface_cast宏吗？在Java层中，尽管没有这样的宏。可是定义了一个相似的函数asInterface。

以下来分析ServiceManagerNative类的asInterface函数，其代码例如以下：

[ServiceManagerNative.java-->ServiceManagerNative.asInterface()]

static public IServiceManager asInterface(IBinderobj)

{

......// 以obj为參数。创建一个ServiceManagerProxy对象

returnnew ServiceManagerProxy(obj);

}

上面代码和Native层interface_cast非常相似，都是以一个BpProxy对象为參数构造一个和业务相关的Proxy对象。比如这里的ServiceManagerProxy对象。ServiceManagerProxy对象的各个业务函数会将相应请求打包后交给BpProxy对象。终于由BpProxy对象发送给Binder驱动以完毕一次通信。

说明实际上BpProxy也不会直接和Binder驱动交互，真正和Binder驱动交互的是IPCThreadState。

（2）addService函数分析

如今来分析ServiceManagerProxy的addService函数，其代码例如以下：

[ServcieManagerNative.java-->ServiceManagerProxy.addService()]

public void addService(String name, IBinderservice)

throwsRemoteException {

Parceldata = Parcel.obtain();

Parcelreply = Parcel.obtain();

data.writeInterfaceToken(IServiceManager.descriptor);

data.writeString(name);

// 注意以下这个writeStrongBinder函数，后面我们会具体分析它

data.writeStrongBinder(service);

/*mRemote实际上就是BinderProxy对象。调用它的transact。将封装好的请求数据

发送出去 *

mRemote.transact(ADD_SERVICE_TRANSACTION, data, reply, 0);

reply.recycle();

data.recycle();

}

BinderProxy的transact，是一个native函数。事实上现函数的代码例如以下所看到的：

[android_util_Binder.cpp-->android_os_BinderProxy_transact()]

static jbooleanandroid_os_BinderProxy_transact(JNIEnv* env, jobject obj,

jint code, jobject dataObj,

jobject replyObj, jint flags)

{

......

// 从Java的Parcel对象中得到作为參数的Native的Parcel对象

Parcel*data = parcelForJavaObject(env, dataObj);

if (data== NULL) {

return JNI_FALSE;

}

// 得到一个用于接收回复的Parcel对象

Parcel*reply = parcelForJavaObject(env, replyObj);

if(reply == NULL && replyObj != NULL) {

return JNI_FALSE;

}

// 从Java的BinderProxy对象中得到之前已经创建好的那个Native的BpBinder对象

IBinder*target = (IBinder*)

env->GetIntField(obj, gBinderProxyOffsets.mObject);

......

// 通过Native的BpBinder对象。将请求发送给ServiceManager

status_terr = target->transact(code, *data, reply, flags);

......

signalExceptionForError(env,obj, err);

returnJNI_FALSE;

}

看了上面的代码会发现，Java层的Binder终于还是要借助Native的Binder进行通信的。

说明从架构的角度看，在Java中搭建了一整套框架，如IBinder接口，Binder类和BinderProxy类。可是从通信角度看，不论架构的编写採用的是Native语言还是Java语言，仅仅要把请求传递到Binder驱动就能够了，所以通信的目的是向binder发送请求和接收回复。

在这个目的之上，考虑到软件的灵活性和可扩展性。于是编写了一个架构。

反过来说，也能够不使用架构（即没有使用不论什么接口、派生之类的东西）而直接和binder交互，比如ServiceManager作为Binder的一个核心程序。就是直接读取/dev/binder设备。获取并处理请求。从这一点上看，Binder的目的虽是简单的（即打开binder设备，然后读请求和写回复）。可是架构是复杂的（编写各种接口类和封装类等）。

我们在研究源码时。一定要先搞清楚目的。实现仅仅只是是达到该目的的一种手段和方式。脱离目的的实现，如缘木求鱼。非常easy偏离事物本质。

在对addService进行分析时曾提示writeStrongBinder是一个特别的函数。那么它特别在哪里呢？以下将给出解释。

（3）三人行之Binder、JavaBBinderHolder和JavaBBinder

ActivityManagerService从ActivityManagerNative类派生，并实现了一些接口。当中和Binder的相关的仅仅有这个ActivityManagerNative类。其原型例如以下：

[ActivityManagerNative.java-->ActivityManagerNative]

public abstract class ActivityManagerNative

extends Binder

implementsIActivityManager

ActivityManagerNative从Binder派生，并实现了IActivityManager接口。以下来看ActivityManagerNative的构造函数：

[ActivityManagerNative.java-->ActivityManagerNative.ActivityManagerNative()]

public ActivityManagerNative() {

attachInterface(this, descriptor);// 该函数非常easy，读者可自行分析

}

而ActivityManagerNative父类的构造函数则是Binder的构造函数：

[Binder.java-->Binder.Binder()]

public Binder() {

init();

}

Binder构造函数中会调用native的init函数，事实上现的代码例如以下：

[android_util_Binder.cpp-->android_os_Binder_init()]

static void android_os_Binder_init(JNIEnv* env,jobject obj)

{

// 创建一个JavaBBinderHolder对象

JavaBBinderHolder* jbh = new JavaBBinderHolder();

bh->incStrong((void*)android_os_Binder_init);

// 将这个JavaBBinderHolder对象保存到Java Binder对象的mObject成员中

env->SetIntField(obj, gBinderOffsets.mObject, (int)jbh);

}

从上面代码可知，Java的Binder对象将和一个Native的JavaBBinderHolder对象相关联。那么，JavaBBinderHolder是何方神圣呢？其定义例如以下：

[android_util_Binder.cpp-->JavaBBinderHolder]

class JavaBBinderHolder : public RefBase

{

public:

sp<JavaBBinder> get(JNIEnv* env, jobject obj)

{

AutoMutex _l(mLock);

sp<JavaBBinder> b = mBinder.promote();

if(b == NULL) {

// 创建一个JavaBBinder，obj实际上是Java层中的Binder对象

b = new JavaBBinder(env, obj);

mBinder = b;

}

return b;

}

......

private:

Mutex mLock;

wp<JavaBBinder> mBinder;

};

从派生关系上能够发现，JavaBBinderHolder仅从RefBase派生，所以它不属于Binder家族。Java层的Binder对象为什么会和Native层的一个与Binder家族无关的对象绑定呢？细致观察JavaBBinderHolder的定义可知：JavaBBinderHolder类的get函数中创建了一个JavaBBinder对象。这个对象就是从BnBinder派生的。

那么，这个get函数是在哪里调用的？答案在以下这句代码中：

//当中。data是Parcel对象。service此时还是ActivityManagerService

data.writeStrongBinder(service);

writeStrongBinder会做一个替换工作，以下是它的native代码实现：

[android_util_Binder.cpp-->android_os_Parcel_writeStrongBinder()]

static voidandroid_os_Parcel_writeStrongBinder(JNIEnv* env,

jobject clazz, jobject object)

{

/*parcel是一个Native的对象，writeStrongBinder的真正參数是

ibinderForJavaObject()的返回值*/

conststatus_t err = parcel->writeStrongBinder(

ibinderForJavaObject(env, object));

}

[android_util_Binder.cpp-->ibinderForJavaObject()]

sp<IBinder> ibinderForJavaObject(JNIEnv*env, jobject obj)

{

/* 假设Java的obj是Binder类。则首先获得JavaBBinderHolder对象，然后调用

它的get()函数。而这个get将返回一个JavaBBinder */

if(env->IsInstanceOf(obj, gBinderOffsets.mClass)) {

JavaBBinderHolder* jbh = (JavaBBinderHolder*)env->GetIntField(obj,

gBinderOffsets.mObject);

return jbh != NULL ? jbh->get(env, obj) : NULL;

}

// 假设obj是BinderProxy类，则返回Native的BpBinder对象

if(env->IsInstanceOf(obj, gBinderProxyOffsets.mClass)) {

return (IBinder*)

env->GetIntField(obj, gBinderProxyOffsets.mObject);

}

returnNULL;

}

依据上面的介绍会发现，addService实际加入到Parcel的并非AMS本身，而是一个叫JavaBBinder的对象。

正是将它终于传递到Binder驱动。

读者此时easy想到，Java层中全部的Binder相应的都是这个JavaBBinder。当然。不同的Binder对象相应不同的JavaBBinder对象。

图2-2展示了Java Binder、JavaBBinderHolder和JavaBBinder的关系。

图 2 - 2 Java Binder 、JavaBBinderHolder和JavaBBinder三者的关系

从图2-2可知：

· Java层的Binder通过mObject指向一个Native层的JavaBBInderHolder对象。

· Native层的JavaBBinderHolder对象通过mBinder成员变量指向一个Native的JavaBBinder对象。

· Native的JavaBBinder对象又通过mObject变量指向一个Java层的Binder对象。

为什么不直接让Java层的Binder对象指向Native层的JavaBBinder对象呢？由于缺乏设计文档。这里不便妄加揣測。但从JavaBBinderHolder的实现上来分析，预计和垃圾回收（内存管理）有关，由于JavaBBinderHolder中的mBinder对象的类型被定义成弱引用wp了。

建议对此有更好的解释的读者，最好还是与大家分享一下。

2. ActivityManagerService响应请求

初见JavaBBinde时，多少有些惊讶。

回想一下Native层的Binder架构：尽管在代码中调用的是Binder类提供的接口，但其对象却是一个实际的服务端对象，比如MediaPlayerService对象。AudioFlinger对象。

而在Java层的Binder架构中，JavaBBinder却是一个和业务全然无关的对象。那么，这个对象怎样实现不同业务呢？

为回答此问题，我们必须看它的onTransact函数。当收到请求时，系统会调用这个函数。

说明关于这个问题，建议读者阅读卷I第6章“深入理解Binder”。

[android_util_Binder.cpp-->JavaBBinder::onTransact()]

virtual status_t onTransact(

uint32_t code, const Parcel& data, Parcel* reply, uint32_t flags =0)

{

JNIEnv*env = javavm_to_jnienv(mVM);

IPCThreadState* thread_state = IPCThreadState::self();

.......

// 调用Java层Binder对象的execTranscat函数

jbooleanres = env->CallBooleanMethod(mObject,

gBinderOffsets.mExecTransact,code,

(int32_t)&data, (int32_t)reply, flags);

......

returnres != JNI_FALSE ? NO_ERROR : UNKNOWN_TRANSACTION;

}

就本例而言，上面代码中的mObject就是ActivityManagerService，如今调用它的execTransact()方法，该方法在Binder类中实现。具体代码例如以下：

[Binder.java-->Binder.execTransact()]

private boolean execTransact(int code, intdataObj, int replyObj,int flags) {

Parceldata = Parcel.obtain(dataObj);

Parcelreply = Parcel.obtain(replyObj);

booleanres;

try {

//调用onTransact函数，派生类能够又一次实现这个函数，以完毕业务功能

res= onTransact(code, data, reply, flags);

} catch{ ... }

reply.recycle();

data.recycle();

returnres;

}

ActivityManagerNative类实现了onTransact函数。代码例如以下：

[ActivityManagerNative.java-->ActivityManagerNative.onTransact()]

public boolean onTransact(int code, Parcel data,Parcel reply, int flags)

throws RemoteException {

switch(code) {

caseSTART_ACTIVITY_TRANSACTION:

{

data.enforceInterface(IActivityManager.descriptor);

IBinder b = data.readStrongBinder();

......

//再由ActivityManagerService实现业务函数startActivity

intresult = startActivity(app, intent, resolvedType,

grantedUriPermissions, grantedMode, resultTo, resultWho,

requestCode, onlyIfNeeded, debug, profileFile,

profileFd, autoStopProfiler);

reply.writeNoException();

reply.writeInt(result);

return true;

}

.... // 处理其它请求的case

}

由此能够看出。JavaBBinder仅是一个传声筒。它本身不实现不论什么业务函数。其工作是：

· 当它收到请求时，仅仅是简单地调用它所绑定的Java层Binder对象的exeTransact。

· 该Binder对象的exeTransact调用其子类实现的onTransact函数。

· 子类的onTransact函数将业务又派发给其子类来完毕。

请读者务必注意当中的多层继承关系。

通过这样的方式。来自client的请求就能传递到正确的Java Binder对象了。

图2-3展示AMS响应请求的整个流程。

图 2 - 3 AMS响应请求的流程

在图2-3中，右上角的慷慨框表示AMS这个对象，其间的虚线箭头表示调用子类重载的函数。

2.2.4 理解AIDL

经过上一节的介绍。读者已经明确在Java层Binder的架构中，Bp端能够通过BinderProxy的transact()方法与Bn端发送请求。而Bn端通过继承Binder类并重写onTransact()接收并处理来自Bp端的请求。

这个结构非常清楚并且简单。可是实现起来却颇为繁琐。于是Android提供了AIDL语言以及AIDL解释器自己主动生成一个服务的Bn端即Bp端的用于处理Binder通信的代码。

AIDL的语法与定义一个Java接口的语法非常相似。为了避免业务实现对分析的干扰，本节通过一个最简单的样例对AIDL的原理进行介绍：

[IMyServer.aidl]

package com.understanding.samples;

interface IMyServer {

intfoo(String str);

}

IMyServer.aidl定义了一个名为IMyServer的Binder服务，并提供了一个能够跨Binder调用的接口foo()。能够通过aidl工具将其解析为一个实现了Bn端及Bp端通过Binder进行通信的Java源码。具体命令例如以下：

aidl com/understanding/samples/IMyServer.aidl

生成的IMyServer.java能够在com/understanding/samples/文件夹下找到。

建议读者能够阅读aidl有关的文档了解此工具的具体功能。

[IMyServer.java-->IMyServer]

package com.understanding.samples;

/* ① 首先。IMyServer.aidl被解析为一个Java接口IMyServer。这个接口定义了AIDL文件里

所定义的接口foo() */

public interface IMyServer extendsandroid.os.IInterface {

/*② aidl工具生成了一个继承自IMyServer接口的抽象类IMyServer.Stub。这个抽象类实现了

Bn端通过onTransact()方法接收来自Bp端的请求的代码。

本例中的foo()方法在这个类中

会被定义成一个抽象方法。由于aidl工具根不知道foo()方法是做什么的。它仅仅能在onTransact()

中得知Bp端希望对foo()方法进行调用。所以Stub类是抽象的。 */

publicstatic abstract class Stub extends android.os.Binder implements

com.understanding.samples.IMyServer{

...... // Stub类的其它实现

/*onTransact()依据code的值选择调用IMyServer接口中的不同方法。本例中

TRANSACTION_foo意味着须要通过调用foo()方法完毕请求 */

public boolean onTransact(int code, android.os.Parcel data,

android.os.Parcel reply, int flags)

throws android.os.RemoteException {

switch (code) {

......

case TRANSACTION_foo: {

...... // 从data中读取參数_arg0

// Stub类的子类须要实现foo()方法

int _result = this.foo(_arg0);

...... // 向reply中写入_result

return true;

}

return super.onTransact(code, data, reply, flags);

}

/* ③ aidl工具还生成了一个继承自IMyServer接口的类Proxy，它是Bp端的实现。

与Bn端的

Stub类不同。它实现了foo()函数。

由于foo()函数在Bp端的实现是确定的，即将參数存储到

Parcel中然后运行transact()方法将请求发送给Bn端。然后从reply中读取返回值并返回

给调用者 */

private static class Proxy implements com.understanding.samples.IMyServer{

...... // Proxy类的其它实现

public int foo(java.lang.String str)

throws android.os.RemoteException {

android.os.Parcel _data = android.os.Parcel.obtain();

android.os.Parcel _reply = android.os.Parcel.obtain();

int _result;

try {

...... // 将參数str写入參数_data

// mRemote就是指向IMyServer Bn端的BinderProxy

mRemote.transact(Stub.TRANSACTION_foo, _data, _reply, 0);

......// 从_replay中读取返回值_result

} finally { ...... }

return _result;

}

// TRANSACTION_foo常量用于定义foo()方法的code

static final int TRANSACTION_foo =

(android.os.IBinder.FIRST_CALL_TRANSACTION+ 0);

}

// 声明IMyServer所提供的接口

publicint foo(java.lang.String str) throws android.os.RemoteException;

}

可见一个AIDL文件被aidl工具解析之后会产生三个物件：

· IMyServer接口。

它仅仅用来在Java中声明IMyServer.aidl中所声明的接口。

· IMyServer.Stub类。这个继承自Binder类的抽象类实现了Bn端与Binder通信相关的代码。

· IMyServer.Stub.Proxy类。这个类实现了Bp端与Binder通信相关的代码。

在完毕了aidl的解析之后，为了实现一个Bn端，开发人员须要继承IMyServer.Stub类并实现其抽象方法。

例如以下所看到的：

class MyServer extends IMyServer.Stub {

intfoo(String str) {

// 做点什么都能够

returnstr.length();

}

于是每个MyServer类的实例，都具有了作为Bn端的能力。

典型的做法是将MyServer类的实例通过ServiceManager.addService()将其注冊为一个系统服务，或者在一个Android标准Service的onBind()方法中将其作为返回值使之能够被其它进程訪问。另外，也能够通过Binder调用将其传递给另外一个进程，使之成为一个跨进程的回调对象。

那么Bp端将怎样使用IMyServer.Proxy呢？在Bp端所在进程中。一旦获取了IMyServer的BinderProxy（通过ServiceManager.getService()、onServiceConnected()或者其它方式）。就能够以例如以下方式获得一个IMyServer.Proxy：

// 当中binderProxy就是通过ServiceManager.getService()所获取

IMyServer remote = IMyServer.Stub.asInterface(binderProxy);

remote.foo(“Hello AIDL!”);

IMyServer.Stub.asInterface()的实现例如以下：

[IMyServer.java-->IMyServer.Stub.asInterface()]

public static com.understanding.samples.IMyServerasInterface(

android.os.IBinder obj) {

......

// 创建一个IMyServer.Stub.Proxy。

当中參数obj将会被保存为Proxy类的mRemote成员。

return new com.understanding.samples.IMyServer.Stub.Proxy(obj);

}

可见，AIDL使得构建一个Binder服务的工作大大地简化了。

2.2.5 Java层Binder架构总结

图2-4展示了Java层的Binder架构。

图 2 - 4 Java层Binder架构

依据图2-4可知：

q 对于代表client的BinderProxy来说，Java层的BinderProxy在Native层相应一个BpBinder对象。凡是从Java层发出的请求，首先从Java层的BinderProxy传递到Native层的BpBinder，继而由BpBinder将请求发送到Binder驱动。

q 对于代表服务端的Service来说，Java层的Binder在Native层有一个JavaBBinder对象。

前面介绍过，全部Java层的Binder在Native层都相应为JavaBBinder。而JavaBBinder仅起到中转作用。即把来自client的请求从Native层传递到Java层。

q 系统中依旧仅仅有一个Native的ServiceManager。

至此，Java层的Binder架构已介绍完毕。从前面的分析能够看出，Java层Binder非常依赖Native层的Binder。

建议想进一步了解Binder的读者们，要深入了解这一问题，有必要阅读卷I的第6章“深入理解Binder”。

2.3 心系两界的MessageQueue

卷I第5章介绍过。MessageQueue类封装了与消息队列有关的操作。

在一个以消息驱动的系统中。最重要的两部分就是消息队列和消息处理循环。在Andrid 2.3曾经，仅仅有Java世界的居民有资格向MessageQueue中加入消息以驱动Java世界的正常运转，但从Android 2.3開始，MessageQueue的核心部分下移至Native层，让Native世界的居民也能利用消息循环来处理他们所在世界的事情。

因此如今的MessageQueue心系Native和Java两个世界。

2.3.1 MessageQueue的创建

如今来分析MessageQueue是怎样跨界工作的。其代码例如以下：

[MessageQueue.java-->MessageQueue.MessageQueue()]

MessageQueue() {

nativeInit();//构造函数调用nativeInit，该函数由Native层实现

}

nativeInit()方法的真正实现为android_os_MessageQueue_nativeInit()函数，其代码例如以下：

[android_os_MessageQueue.cpp-->android_os_MessageQueue_nativeInit()]

static voidandroid_os_MessageQueue_nativeInit(JNIEnv* env, jobject obj) {

// NativeMessageQueue是MessageQueue在Native层的代表

NativeMessageQueue* nativeMessageQueue = newNativeMessageQueue();

......

// 将这个NativeMessageQueue对象设置到Java层保存

android_os_MessageQueue_setNativeMessageQueue(env,obj,

nativeMessageQueue);

}

nativeInit函数在Native层创建了一个与MessageQueue相应的NativeMessageQueue对象，其构造函数例如以下：

[android_os_MessageQueue.cpp-->NativeMessageQueue::NativeMessageQueue()]

NativeMessageQueue::NativeMessageQueue() {

/* 代表消息循环的Looper也在Native层中呈现身影了。依据消息驱动的知识，一个线程会有一个

Looper来循环处理消息队列中的消息。以下一行的调用就是取得保存在线程本地存储空间

（Thread Local Storage）中的Looper对象 */

mLooper= Looper::getForThread();

if (mLooper == NULL) {

/* 如为第一次进来，则该线程没有设置本地存储，所以须先创建一个Looper，然后再将其保存到

TLS中，这是非经常见的一种以线程为单位的单例模式*/

mLooper = new Looper(false);

Looper::setForThread(mLooper);

}

Native的Looper是Native世界中參与消息循环的一位重要角色。

尽管它的类名和Java层的Looper类一样，但此二者事实上并无不论什么关系。

这一点以后还将具体分析。

2.3.2 提取消息

当一切准备就绪后，Java层的消息循环处理，也就是Looper会在一个循环中提取并处理消息。消息的提取就是调用MessageQueue的next()方法。当消息队列为空时。next就会堵塞。MessageQueue同一时候支持Java层和Native层的事件，那么其next()方法该怎么实现呢？具体代码例如以下：

[MessagQueue.java-->MessageQueue.next()]

final Message next() {

int pendingIdleHandlerCount = -1;

int nextPollTimeoutMillis = 0;

for (;;) {

......

// mPtr保存了NativeMessageQueue的指针。调用nativePollOnce进行等待

nativePollOnce(mPtr,nextPollTimeoutMillis);

synchronized (this) {

final long now = SystemClock.uptimeMillis();

// mMessages用来存储消息，这里从当中取一个消息进行处理

final Message msg = mMessages;

if (msg != null) {

final long when = msg.when;

if (now >= when) {

mBlocked = false;

mMessages = msg.next;

msg.next = null;

msg.markInUse();

return msg; // 返回一个Message给Looper进行派发和处理

} else {

nextPollTimeoutMillis = (int) Math.min(when- now,

Integer.MAX_VALUE);

}

} else {

nextPollTimeoutMillis = -1;

}

......

/* 处理注冊的IdleHandler，当MessageQueue中没有Message时，

Looper会调用IdleHandler做一些工作，比如做垃圾回收等 */

......

pendingIdleHandlerCount = 0;

nextPollTimeoutMillis = 0;

}

看到这里，可能会有人觉得这个MessageQueue非常easy，不就是从曾经在Java层的wait变成如今Native层的wait了吗？可是事情本质比表象要复杂得多，来思考以下的情况：

nativePollOnce()返回后，next()方法将从mMessages中提取一个消息。

也就是说。要让nativePollOnce()返回，至少要加入一个消息到消息队列。否则nativePollOnce()只是是做了一次无用功罢了。

假设nativePollOnce()将在Native层等待，就表明Native层也能够投递Message，可是从Message类的实现代码上看，该类和Native层没有建立不论什么关系。

那么nativePollOnce()在等待什么呢？

对于上面的问题，相信有些读者心中已有了答案：nativePollOnce()不仅在等待Java层来的Message，实际上还在Native还做了大量的工作。

以下我们来分析Java层投递Message并触发nativePollOnce工作的正常流程。

1. 在Java层投递Message

MessageQueue的enqueueMessage函数完毕将一个Message投递到MessageQueue中的工作，其代码例如以下：

[MesssageQueue.java-->MessageQueue.enqueueMessage()]

final boolean enqueueMessage(Message msg, longwhen) {

......

finalboolean needWake;

synchronized (this) {

if(mQuiting) {

return false;

}else if (msg.target == null) {

mQuiting = true;

}

msg.when = when;

Message p = mMessages;

if(p == null || when == 0 || when < p.when) {

/* 假设p为空，表明消息队列中没有消息，那么msg将是第一个消息，needWake

须要依据mBlocked的情况考虑是否触发 */

msg.next= p;

mMessages = msg;

needWake = mBlocked;

} else {

// 假设p不为空，表明消息队列中还有剩余消息，须要将新的msg加到消息尾

Message prev = null;

while (p != null && p.when <= when) {

prev = p;

p = p.next;

}

msg.next = prev.next;

prev.next = msg;

// 由于消息队列之前还剩余有消息，所以这里不用调用nativeWakeup

needWake = false;

}

if(needWake) {

// 调用nativeWake，以触发nativePollOnce函数结束等待

nativeWake(mPtr);

}

returntrue;

}

上面的代码比較简单。主要功能是：

· 将message按运行时间排序。并加入消息队。

· 依据情况调用nativeWake函数，以触发nativePollOnce函数。结束等待。

建议尽管代码简单。可是对于那些不熟悉多线程的读者，还是要细细品味一下mBlocked值的作用。我们常说细节体现美，代码也一样，这个小小的mBlocked正是如此。

2. nativeWake函数分析

nativeWake函数的代码例如以下所看到的：

[android_os_MessageQueue.cpp-->android_os_MessageQueue_nativeWake()]

static voidandroid_os_MessageQueue_nativeWake(JNIEnv* env, jobject obj,

jint ptr)

{

NativeMessageQueue* nativeMessageQueue = // 取出NativeMessageQueue对象

reinterpret_cast<NativeMessageQueue*>(ptr);

returnnativeMessageQueue->wake(); // 调用它的wake函数

}

[android_os_MessageQueue.cpp-->NativeMessageQueue::wake()]

void NativeMessageQueue::wake() {

mLooper->wake(); // 层层调用，如今转到mLooper的wake函数

}

Native Looper的wake函数代码例如以下：

[Looper.cpp-->Looper::wake()]

void Looper::wake() {

ssize_tnWrite;

do {

// 向管道的写端写入一个字符

nWrite = write(mWakeWritePipeFd, "W", 1);

} while(nWrite == -1 && errno == EINTR);

}

Wake()函数则更为简单，仅仅向管道的写端写入一个字符”W”，这样管道的读端就会由于有数据可读而从等待状态中醒来。

2.3.3 nativePollOnce函数分析

nativePollOnce()的实现函数是android_os_MessageQueue_nativePollOnce。代码例如以下：

[android_os_MessageQueue.cpp-->android_os_MessageQueue_nativePollOnce()]

static voidandroid_os_MessageQueue_nativePollOnce(JNIEnv* env, jobject obj,

jintptr, jint timeoutMillis)

NativeMessageQueue* nativeMessageQueue =

reinterpret_cast<NativeMessageQueue*>(ptr);

// 取出NativeMessageQueue对象，并调用它的pollOnce

nativeMessageQueue->pollOnce(timeoutMillis);

}

分析pollOnce函数：

[android_os_MessageQueue.cpp-->NativeMessageQueue::pollOnece()]

void NativeMessageQueue::pollOnce(inttimeoutMillis) {

mLooper->pollOnce(timeoutMillis); // 重任传递到Looper的pollOnce函数

}

Looper的pollOnce函数例如以下：

[Looper.cpp-->Looper::pollOnce()]

inline int pollOnce(int timeoutMillis) {

returnpollOnce(timeoutMillis, NULL, NULL, NULL);

}

上面的函数将调用另外一个有4个參数的pollOnce函数，这个函数的原型例如以下：

int pollOnce(int timeoutMillis, int* outFd, int*outEvents, void** outData)

当中：

· timeOutMillis參数为超时等待时间。假设为-1，则表示无限等待，直到有事件发生为止。假设值为0。则无需等待马上返回。

· outFd用来存储发生事件的那个文件描写叙述符。

· outEvents用来存储在该文件描写叙述符1上发生了哪些事件，眼下支持可读、可写、错误和中断4个事件。这4个事件事实上是从epoll事件转化而来。后面我们会介绍大名鼎鼎的epoll。

· outData用于存储上下文数据，这个上下文数据是由用户在加入监听句柄时传递的，它的作用和pthread_create函数最后一个參数param一样。用来传递用户自己定义的数据。

另外。pollOnce函数的返回值也具有特殊的意义，具体例如以下：

· 当返回值为ALOOPER_POLL_WAKE时，表示这次返回是由wake函数触发的，也就是管道写端的那次写事件触发的。

· 返回值为ALOOPER_POLL_TIMEOUT表示等待超时。

· 返回值为ALOOPER_POLL_ERROR，表示等待过程中错误发生。

· 返回值为ALOOPER_POLL_CALLBACK，表示某个被监听的句柄因某种原因被触发。

这时。outFd參数用于存储发生事件的文件句柄，outEvents用于存储所发生的事件。

上面这些知识是和epoll息息相关的。

提示查看Looper的代码会发现，Looper採用了编译选项(即#if和#else)来控制是否使用epoll作为I/O复用的控制中枢。

鉴于如今大多数系统都支持epoll，这里仅讨论使用epoll的情况。

1. epoll基础知识介绍

epoll机制提供了Linux平台上最高效的I/O复用机制，因此有必要介绍一下它的基础知识。

从调用方法上看，epoll的使用方法和select/poll非常相似。其主要作用就是I/O复用。即在一个地方等待多个文件句柄的I/O事件。

以下通过一个简单样例来分析epoll的工作流程。

/* ① 使用epoll前。须要先通过epoll_create函数创建一个epoll句柄。

以下一行代码中的10表示该epoll句柄初次创建时候分配能容纳10个fd相关信息的缓存。

对于2.6.8版本号以后的内核，该值没有实际作用，这里能够忽略。事实上这个值的主要目的是

确定分配一块多大的缓存。

如今的内核都支持动态拓展这块缓存，所以该值就没有意义了 */

int epollHandle = epoll_create(10);

/* ② 得到epoll句柄后，下一步就是通过epoll_ctl把须要监听的文件句柄加入到epoll句柄中。

除了指定文件句柄本身的fd值外，同一时候还须要指定在该fd上等待什么事件。

epoll支持四类事件，

各自是EPOLLIN(句柄可读)、EPOLLOUT(句柄可写),EPOLLERR(句柄错误)、EPOLLHUP(句柄断)。

epoll定义了一个结构体struct epoll_event来表达监听句柄的诉求。

假设如今有一个监听端的socket句柄listener，要把它加入到epoll句柄中 */

struct epoll_event listenEvent; //先定义一个event

/* EPOLLIN表示可读事件,EPOLLOUT表示可写事件。另外还有EPOLLERR,EPOLLHUP表示

系统默认会将EPOLLERR加入到事件集合中 */

listenEvent.events = EPOLLIN;// 指定该句柄的可读事件

// epoll_event中有一个联合体叫data。用来存储上下文数据。本例的上下文数据就是句柄自己

listenEvent.data.fd = listenEvent;

/* ③ EPOLL_CTL_ADD将监听fd和监听事件加入到epoll句柄的等待队列中；

EPOLL_CTL_DEL将监听fd从epoll句柄中移除。

EPOLL_CTL_MOD改动监听fd的监听事件，比如本来仅仅等待可读事件，如今须要同一时候等待

可写事件，那么改动listenEvent.events 为EPOLLIN|EPOLLOUT后，再传给epoll句柄*/

epoll_ctl(epollHandle,EPOLL_CTL_ADD,listener,&listenEvent);

/* 当把全部感兴趣的fd都加入到epoll句柄后。就能够開始坐等感兴趣的事情发生了。

为了接收所发生的事情，先定义一个epoll_event数组 */

struct epoll_event resultEvents[10];

int timeout = -1;

while(1) {

/* ④ 调用epoll_wait用于等待事件。当中timeout能够指定一个超时时间，

resultEvents用于接收发生的事件，10为该数组的大小。

epoll_wait函数的返回值有例如以下含义：

nfds大于0表示所监听的句柄上有事件发生；

nfds等于0表示等待超时；

nfds小于0表示等待过程中发生了错误*/

int nfds = epoll_wait(epollHandle,resultEvents, 10, timeout);

if(nfds == -1) {

// epoll_wait发生了错误

} else if(nfds == 0) {

//发生超时，期间没有发生不论什么事件

} else{

// ⑤resultEvents用于返回那些发生了事件的信息

for(int i = 0; i < nfds; i++) {

struct epoll_event & event =resultEvents[i];

if(event & EPOLLIN) {

/* ⑥ 收到可读事件。究竟是哪个文件句柄发生该事件呢？可通过event.data这个联合

体取得前传递给epoll的上下文数据，该上下文信息可用于推断究竟是谁发生了事件 */

......

}

.......//其它处理

}

epoll总体使用流程如上面代码所看到的，基本和select/poll相似，只是作为Linux平台最高效的I/O复用机制。这里有些内容供读者參考。

epoll的效率为什么会比select高？当中一个原因是调用方法。每次调用select时，都须要把感兴趣的事件拷贝到内核中。而epoll仅仅在epll_ctl进行加入的时候复制一次。另外。epoll内部用于保存事件的数据结构使用的是红黑树，查找速度非常快。

而select採用数组保存信息，不但一次能等待的句柄个数有限。并且查找起来速度非常慢。当然，在仅仅等待少量文件句柄时。select和epoll效率相差不是非常多，但还是推荐使用epoll。

epoll等待的事件有两种触发条件，一个是水平触发（EPOLLLEVEL），另外一个是边缘触发（EPOLLET,ET为Edge Trigger之意），这两种触发条件的差别非常重要。读者可通过man epoll查阅系统提供的更为具体的epoll机制。

最后，关于pipe，还想提出一个小问题供读者思考讨论：

为什么Android中使用pipe作为线程间通讯的方式？对于pipe的写端写入的数据，读端都不感兴趣。仅仅是为了简单的唤醒。POSIX不是也有线程间同步函数吗？为什么要用pipe呢？

关于这个问题的答案，可參见邓凡平的一篇博文“随笔之怎样实现一个线程池”。

· http://www.cnblogs.com/innost/archive/2011/11/24/2261454.html

2. pollOnce()函数分析

以下分析带4个參数的pollOnce()函数。代码例如以下：

[Looper.cpp-->Looper::pollOnce()]

int Looper::pollOnce(int timeoutMillis, int*outFd, int* outEvents,

void** outData) {

intresult = 0;

for(;;) { // 一个无限循环

// mResponses是一个Vector，这里首先须要处理response

while (mResponseIndex < mResponses.size()) {

const Response& response = mResponses.itemAt(mResponseIndex++);

ALooper_callbackFunc callback = response.request.callback;

if (!callback) {// 首先处理那些没有callback的Response

int ident = response.request.ident; // ident是这个Response的id

int fd = response.request.fd;

int events = response.events;

void* data = response.request.data;

......

if (outFd != NULL) *outFd = fd;

if (outEvents != NULL) *outEvents = events;

if (outData != NULL) *outData = data;

/* 实际上，对于没有callback的Response。pollOnce仅仅是返回它的

ident，并没有实际做什么处理。由于没有callback。所以系统也不知道怎样处理 */

return ident;

}

if(result != 0) {

if(outFd != NULL) *outFd = 0;

if (outEvents != NULL) *outEvents = NULL;

if (outData != NULL) *outData = NULL;

return result;

}

// 调用pollInner函数。

注意，它在for循环内部

result = pollInner(timeoutMillis);

}

初看上面的代码，可能会让人有些丈二和尚摸不着头脑。

可是把pollInner()函数分析完毕，大家就会明确非常多。

pollInner()函数非常长。把用于调试和统计的代码去掉。结果例如以下：

[Looper.cpp-->Looper::pollInner()]

int Looper::pollInner(int timeoutMillis) {

if(timeoutMillis != 0 && mNextMessageUptime != LLONG_MAX) {

nsecs_t now = systemTime(SYSTEM_TIME_MONOTONIC);

......//依据Native Message的信息计算此次须要等待的时间

timeoutMillis = messageTimeoutMillis;

}

intresult = ALOOPER_POLL_WAKE;

mResponses.clear();

mResponseIndex = 0;

#ifdef LOOPER_USES_EPOLL // 仅仅讨论使用epoll进行I/O复用的方式

structepoll_event eventItems[EPOLL_MAX_EVENTS];

// 调用epoll_wait，等待感兴趣的事件或超时发生

inteventCount = epoll_wait(mEpollFd, eventItems, EPOLL_MAX_EVENTS,

timeoutMillis);

#else

......//使用别的方式进行I/O复用

#endif

//从epoll_wait返回，这时候一定发生了什么事情

mLock.lock();

if(eventCount < 0) { //返回值小于零，表示错误发生

if(errno == EINTR) {

goto Done;

}

//设置result为ALLOPER_POLL_ERROR,并跳转到Done

result = ALOOPER_POLL_ERROR;

gotoDone;

}

//eventCount为零，表示发生超时，因此直接跳转到Done

if(eventCount == 0) {

result = ALOOPER_POLL_TIMEOUT;

gotoDone;

}

#ifdef LOOPER_USES_EPOLL

// 依据epoll的使用方法。此时的eventCount表示发生事件的个数

for (inti = 0; i < eventCount; i++) {

intfd = eventItems[i].data.fd;

uint32_t epollEvents = eventItems[i].events;

/* 之前通过pipe函数创建过两个fd，这里依据fd知道是管道读端有可读事件。

读者还记得对nativeWake函数的分析吗？在那里我们向管道写端写了一个”W”字符，这样

就能触发管道读端从epoll_wait函数返回了 */

if(fd == mWakeReadPipeFd) {

if (epollEvents & EPOLLIN) {

// awoken函数直接读取并清空管道数据。读者可自行研究该函数

awoken();

}

......

}else {

/* mRequests和前面的mResponse相相应，它也是一个KeyedVector，当中存储了

fd和相应的Request结构体，该结构体封装了和监控文件句柄相关的一些上下文信息，

比如回调函数等。我们在后面的小节会再次介绍该结构体 */

ssize_t requestIndex = mRequests.indexOfKey(fd);

if (requestIndex >= 0) {

int events = 0;

// 将epoll返回的事件转换成上层LOOPER使用的事件

if (epollEvents & EPOLLIN) events |= ALOOPER_EVENT_INPUT;

if (epollEvents & EPOLLOUT) events |= ALOOPER_EVENT_OUTPUT;

if (epollEvents & EPOLLERR) events |= ALOOPER_EVENT_ERROR;

if (epollEvents & EPOLLHUP) events |= ALOOPER_EVENT_HANGUP;

// 每处理一个Request，就相应构造一个Response

pushResponse(events, mRequests.valueAt(requestIndex));

}

......

}

Done: ;

#else

......

#endif

// 除了处理Request外，还处理Native的Message

mNextMessageUptime = LLONG_MAX;

while(mMessageEnvelopes.size() != 0) {

nsecs_t now = systemTime(SYSTEM_TIME_MONOTONIC);

const MessageEnvelope& messageEnvelope =mMessageEnvelopes.itemAt(0);

if(messageEnvelope.uptime <= now) {

{

sp<MessageHandler> handler = messageEnvelope.handler;

Message message = messageEnvelope.message;

mMessageEnvelopes.removeAt(0);

mSendingMessage = true;

mLock.unlock();

/* 调用Native的handler处理Native的Message

从这里也可看出Native Message和Java层的Message没有什么关系 */

handler->handleMessage(message);

}

mLock.lock();

mSendingMessage = false;

result = ALOOPER_POLL_CALLBACK;

}else {

mNextMessageUptime = messageEnvelope.uptime;

break;

}

mLock.unlock();

// 处理那些带回调函数的Response

for (size_t i = 0; i < mResponses.size();i++) {

const Response& response = mResponses.itemAt(i);

ALooper_callbackFunc callback = response.request.callback;

if(callback) {// 有了回调函数。就能知道怎样处理所发生的事情了

int fd = response.request.fd;

int events = response.events;

void* data = response.request.data;

// 调用回调函数处理所发生的事件

int callbackResult = callback(fd, events, data);

if (callbackResult == 0) {

// callback函数的返回值非常重要。假设为0。表明不须要再次监视该文件句柄

removeFd(fd);

}

result = ALOOPER_POLL_CALLBACK;

}

returnresult;

}

看完代码了，是否还有点模糊？那么，回想一下pollInner函数的几个关键点：

· 首先须要计算一下真正须要等待的时间。

· 调用epoll_wait函数等待。

· epoll_wait函数返回，这时候可能有三种情况：

a) 错误发生，则跳转到Done处。

b) 超时。这时候也跳转到Done处。

c) epoll_wait监測到某些文件句柄上有事件发生。

· 假设epoll_wait由于文件句柄有事件而返回，此时须要依据文件句柄来分别处理：

a) 假设是管道读这一端有事情，则觉得是控制命令。能够直接读取管道中的数据。

b) 假设是其它FD发生事件，则依据Request构造Response，并push到Response数组中。

· 真正開始处理事件是在有Done标志的位置。

a) 首先处理Native的Message。调用Native Handler的handleMessage处理该Message。

b) 处理Response数组中那些带有callback的事件。

上面的处理流程还是比較清楚的。但还是有个一个拦路虎，那就是mRequests，以下就来清剿这个拦路虎。

3. 加入监控请求

加入监控请求事实上就是调用epoll_ctl添加文件句柄。以下通过从Native的Activity找到的一个样例来分析mRequests。

[android_app_NativeActivity.cpp-->loadNativeCode_native()]

static jint

loadNativeCode_native(JNIEnv* env, jobject clazz,jstring path,

jstringfuncName,jobject messageQueue,

jstringinternalDataDir, jstring obbDir,

jstringexternalDataDir, int sdkVersion,

jobject jAssetMgr,jbyteArray savedState)

{

......

/* 调用Looper的addFd函数。第一个參数表示监听的fd；第二个參数0表示ident；

第三个參数表示须要监听的事件，这里为仅仅监听可读事件。第四个參数为回调函数，当该fd发生

指定事件时。looper将回调该函数；第五个參数code为回调函数的參数 */

code->looper->addFd(code->mainWorkRead,0,

ALOOPER_EVENT_INPUT,mainWorkCallback, code);

......

}

Looper的addFd()代码例如以下所看到的：

[Looper.cpp-->Looper::addFd()]

int Looper::addFd(int fd, int ident, int events,

ALooper_callbackFunccallback, void* data) {

if (!callback) {

/* 推断该Looper是否支持不带回调函数的文件句柄加入。

一般不支持，由于没有回调函数

Looper也不知道怎样处理该文件句柄上发生的事情 */

if(! mAllowNonCallbacks) {

return -1;

}

......

}

#ifdef LOOPER_USES_EPOLL

intepollEvents = 0;

// 将用户的事件转换成epoll使用的值

if(events & ALOOPER_EVENT_INPUT) epollEvents |= EPOLLIN;

if(events & ALOOPER_EVENT_OUTPUT) epollEvents |= EPOLLOUT;

{

AutoMutex _l(mLock);

Request request; // 创建一个Request对象

request.fd = fd; // 保存fd

request.ident = ident; // 保存id

request.callback = callback; //保存callback

request.data = data; // 保存用户自己定义数据

struct epoll_event eventItem;

memset(& eventItem, 0, sizeof(epoll_event));

eventItem.events = epollEvents;

eventItem.data.fd = fd;

// 推断该Request是否已经存在，mRequests以fd作为key值

ssize_t requestIndex = mRequests.indexOfKey(fd);

if(requestIndex < 0) {

// 假设是新的文件句柄，则须要为epoll添加该fd

int epollResult = epoll_ctl(mEpollFd, EPOLL_CTL_ADD, fd, &eventItem);

......

// 保存Request到mRequests键值数组

mRequests.add(fd, request);

}else {

// 假设之前加过。那么就改动该监听句柄的一些信息

int epollResult = epoll_ctl(mEpollFd, EPOLL_CTL_MOD, fd, &eventItem);

......

mRequests.replaceValueAt(requestIndex, request);

}

#else

......

#endif

return1;

}

4. 处理监控请求

我们发如今pollInner()函数中，当某个监控fd上发生事件后，就会把相应的Request取出来调用。

pushResponse(events, mRequests.itemAt(i));

此函数例如以下：

[Looper.cpp-->Looper::pushResponse()]

void Looper::pushResponse(int events, constRequest& request) {

Responseresponse;

response.events = events;

response.request = request; //事实上非常easy。就是保存所发生的事情和相应的Request

mResponses.push(response);//然后保存到mResponse数组

}

依据前面的知识可知。并非单独处理Request，而是须要先收集Request，等到Native Message消息处理完之后再做处理。这表明，在处理逻辑上，Native Message的优先级高于监控FD的优先级。

以下来了解怎样加入Native的Message。

5. Native的sendMessage

Android 2.2中仅仅有Java层才干够通过sendMessage()往MessageQueue中加入消息，从4.0開始。Native层也支持sendMessage()了。sendMessage()的代码例如以下：

[Looper.cpp-->Looper::sendMessage()]

void Looper::sendMessage(constsp<MessageHandler>& handler,

constMessage& message) {

//Native的sendMessage函数必须同一时候传递一个Handler

nsecs_tnow = systemTime(SYSTEM_TIME_MONOTONIC);

sendMessageAtTime(now, handler, message); //调用sendMessageAtTime

}

[Looper.java-->Looper::sendMessageAtTime()]

void Looper::sendMessageAtTime(nsecs_t uptime,

constsp<MessageHandler>& handler,

constMessage& message) {

size_t i= 0;

{

AutoMutex _l(mLock);

size_t messageCount = mMessageEnvelopes.size();

// 按时间排序，将消息插入到正确的位置上

while (i < messageCount &&

uptime >= mMessageEnvelopes.itemAt(i).uptime) {

i += 1;

}

MessageEnvelope messageEnvelope(uptime, handler, message);

mMessageEnvelopes.insertAt(messageEnvelope, i, 1);

// mSendingMessage和Java层中的那个mBlocked一样，是一个小小的优化措施

if(mSendingMessage) {

return;

}

// 唤醒epoll_wait。让它处理消息

if (i ==0) {

wake();

}

2.3.4 MessageQueue总结

想不到，一个小小的MessageQueue居然有如此多的内容。

在后面分析Android输入系统时。会再次在Native层和MessageQueue碰面。这里仅是为后面的相会打下一定的基础。

如今将站在一个比具体代码更高的层次来认识一下MessageQueue和它的伙伴们。

1. 消息处理的大家族合照

MessageQueue仅仅是消息处理大家族的一员。该家族的成员合照如图2-5所看到的。

图 2 - 5 消息处理的家族合照

结合前述内容可从图2-5中得到：

· Java层提供了Looper类和MessageQueue类，当中Looper类提供循环处理消息的机制。MessageQueue类提供一个消息队列。以及插入、删除和提取消息的函数接口。

另外。Handler也是在Java层经常使用的与消息处理相关的类。

· MessageQueue内部通过mPtr变量保存一个Native层的NativeMessageQueue对象，mMessages保存来自Java层的Message消息。

· NativeMessageQueue保存一个native的Looper对象，该Looper从ALooper派生，提供pollOnce和addFd等函数。

· Java层有Message类和Handler类。而Native层相应也有Message类和MessageHandler抽象类。在编码时，一般使用的是MessageHandler的派生类WeakMessageHandler类。

注意在include/media/stagfright/foundation文件夹下也定义了一个ALooper类。它是供stagefright使用的相似Java消息循环的一套基础类。这样的同名类的产生，预计是两个事先未做交流的Group的人写的。

2. MessageQueue处理流程总结

· MessageQueue核心逻辑下移到Native层后，极大地拓展了消息处理的范围，总结一下有以下几点：

· MessageQueue继续支持来自Java层的Message消息。也就是早期的Message加Handler的处理方式。

· MessageQueue在Native层的代表NativeMessageQueue支持来自Native层的Message，是通过Native的Message和MessageHandler来处理的。

· NativeMessageQueue还处理通过addFd加入的Request。在后面分析输入系统时，还会大量碰到这样的方式。

· 从处理逻辑上看，先是Native的Message。然后是Native的Request，最后才是Java的Message。

2.4 本章小结

本章先对Java层的Binder架构做了一次较为深入的分析。

Java层的Binder架构和Native层Binder架构相似。可是Java的Binder在通信上还是依赖Native层的Binder。建议想进一步了解Native Binder工作原理的读者。阅读卷I第6章“深入理解Binder”。另外，本章还对MessageQueue进行了较为深入的分析。Android 2.2中那个功能简单的MessageQueue如今变得复杂了，原因是该类的核心逻辑下移到Native层。导致如今的MessageQueue除了支持Java层的Message派发外。还新增了支持Native Message派发以及处理来自所监控的文件句柄的事件。

《深入理解Android 卷III》第二章 深入理解Java Binder和MessageQueue

第2章 深入理解Java Binder和MessageQueue

2.1 概述

2.2 Java层中的Binder分析

2.2.1 Binder架构总览

2.2.2 初始化Java层Binder框架

1. Binder类的初始化

2. BinderInternal类的初始化

3. BinderProxy类的初始化

2.2.3 窥一斑，可见全豹乎

1. 向ServiceManager注冊服务

（1）创建ServiceManagerProxy

（2）addService函数分析

（3）三人行之Binder、JavaBBinderHolder和JavaBBinder

2. ActivityManagerService响应请求

2.2.4 理解AIDL

2.2.5 Java层Binder架构总结

2.3 心系两界的MessageQueue

2.3.1 MessageQueue的创建

2.3.2 提取消息

1. 在Java层投递Message

2. nativeWake函数分析

2.3.3 nativePollOnce函数分析

1. epoll基础知识介绍

2. pollOnce()函数分析

3. 加入监控请求

4. 处理监控请求

5. Native的sendMessage

2.3.4 MessageQueue总结

1. 消息处理的大家族合照

2. MessageQueue处理流程总结

2.4 本章小结

《深入理解Android 卷III》第二章深入理解Java Binder和MessageQueue

第2章深入理解Java Binder和MessageQueue