Android Handler 机制（二）：Handler 机制深入探究问题梳理

一、‘非UI线程更新UI’问题探究

Android开发的时候非UI线程不能更新UI，这个是大家都知道的开发常识。但是当问到为什么？可能我们就会有些含糊了。

本文我们就针对这个问题进行探讨并进行一定的思维发散，来加深我们对Android界面刷新机制的理解。

1. UI线程的工作机制

主线程的工作机制可以概况为 生产者 - 消费者 - 队列 模型。

2. 为什么UI线程不设计成线程安全的

总所周知，如果设计成线程安全的，那性能肯定是大打折扣的，而UI更新的要求有如下特性：

UI是具有可变性的，甚至是高频可变。
UI对响应时间很敏感，这就要求UI操作必须要高效。
UI组件必须批量绘制来保证效率。

所以为了保证渲染性能，UI线程不能设计成线程安全的。Android设计了Handler机制来更新UI是避免多个子线程更新UI导致的UI错乱的问题，也避免了通过加锁机制设计成线程安全的，因为那样会导致性能下降的很厉害。

3. 子线程能创建Handler吗？

能。但是需要先调用Looper.prepare()方法，否则会抛出运行时异常[Can't create handler inside thread that has not call Looper.prepared()]。

4. 子线程的Looper和主线程的Looper有什么区别

子线程的Looper可以退出的，主线程的Looper时不能退出的。

5. 非UI线程一定不能更新UI吗？

答：不一定。

说明：我们知道在Android提供的SurfaceView、GLSurfaceView里面是都能在非UI线程更新UI的。

子线程更新一般的View在某些场景下是能更新成功的。

例如下面的代码会运行成功：

import android.app.Activity;
import android.os.Bundle;
import android.widget.Button;
 
public class TestActivity extends Activity {

    Button btn = null;

    public void onCreate(Bundle savedInstanceState) {
       super.onCreate(savedInstanceState);
       setContentView(R.layout.main);
       btn = (Button) findViewById(R.id.Button01);
       new TestThread(btn).start();
    }
 

    class TestThread extends Thread {

       Button btn = null;

       public TestThread(Button btn) {
           this.btn = btn;
       }

       @Override
       public void run() {
           btn.setText("TestThread.run");
       }
    }
}

是否能正常运行的关键在于ViewRoot的建立时间，它是在ActivityThread.java的final void handleResumeActivity(IBinder token, boolean clearHide, boolean isForward)里创建的。这是因为在Activity.onResume前，ViewRoot实例没有建立，所以没有ViewRoot.checkThread检查机制。而btn.setText时设定的文本却保留了下来，所以当ViewRoot真正去刷新界面时，就把"TestThread.run"显示了出来。

其实我们还是应该遵循google的建议，更新UI始终在UI线程里去做，这里只是列举一个特例并加以说明而已。

拓展：

明白了上述问题的同学去阅读以下鸿洋大神在公众号推送到一篇文章《我感觉我学了一个假的Android...》地址：https://mp.weixin.qq.com/s/tg96p50alrqAtRih8a3AhA，相信会对UI线程的理解更加深刻。

这里着重翻译一句异常语句做为总结：

Only the original thread that created a view hierarchy can touch its views.

↓↓↓↓↓↓↓↓↓↓↓↓

只有创建视图层次结构的原始线程才能触摸其视图。即ViewRootImpl在哪个线程创建的，你后续的UI更新就需要在哪个线程执行，跟是不是UI线程毫无关系。

二、Handler发送消息的delay设置是否可靠？

答案是：不可靠。

原因：当Handler所属的线程（UI线程）要处理的内容非常多，当Looper出现事件积压的时候会使得delay不可靠。如ANR的出现就是一个最极端的代表例子。

为了理解为何在事件挤压的时候，handler会出现delay的不可靠，这里我们就加入一些核心逻辑的分析，来帮助我们进行此问题的探究。

三、Handler机制下消息队列MessageQueue的优化

一般情况下，可以考虑从以下几个方面进行优化

对消息队列中重复消息的过滤，用于控制一些操作的频率，既保证用户体验又保证性能（使用Handler Api）。
对消息队列中的互斥消息进行取消，用于类似开关之类的操作（使用Handler Api）。
消息池复用，减少创建Message实例的开销（Handler机制自带消息池）。
IdleHandler的合理使用，利用空闲的时机进行一些业务逻辑的处理（视业务而定）。

四、主线程的Looper为什么不会导致ANR

1. ANR的产生条件

输入超时：5秒（最常见）
服务超时：前台服务20s、后台服务200s。
广播队列超时：前台广播10秒、后台广播60秒。
ContentProvider超时：10秒

其实最终就是最终由系统的Api发送的Message，告知相关组件发生了ANR。

这里我们使用Service举例，当Service超时的时候，发送的Message.what就是ActivityManagerService.SHOW_NOT_RESPONDING_UI_MSG。

ANR也算是Android系统提醒开发者程序编写有问题的一个机制。

补充： WatchDog、BlockCanary、AndroidGodEye 都是比较不错的卡顿异常检测工具。

BlockCanary ：https://github.com/markzhai/AndroidPerformanceMonitor（将近4年未更新维护，不推荐使用，但可以通过阅读其代码，来加深理解）

ANR-WatchDog：https://github.com/SalomonBrys/ANR-WatchDog

AndroidGodEye：https://github.com/Kyson/AndroidGodEye

2.Looper不会导致应用ANR的本质原因是什么？

当我们熟悉了Looper的工作机制，我们就会知道主线程执行的操作就是执行Loop.loop()不断的处理消息。Looper是进程上的一个概念，ANR是程序执行到某一个环节对开发者占用主线程耗时的一个监控机制，是应用没有在规定时间内完成AMS指定的任务导致的。ANR产生的根本原因是不是因为主线程Looper循环，而是因为主线程中有耗时任务。

3.Looper为什么不会导致CPU占用率高？（延伸）

这是因为使用了Linux底层的pipe管道机制和epoll机制，在主线程的MessageQueue没有消息时，便阻塞在loop的queue.next()中的nativePollOnce() 方法里，在没有消息时阻塞线程并进入休眠释放cpu资源，有消息时唤醒线线程，这样不会导致CPU占用率高。

总结：Android的应用层通过Message.java实现队列，利用管道和epoll机制实现线程状态的管理，配合起来实现了Android主线程的消息队列模型。

拓展学习：

Linux 下 Epoll 机制概述：https://www.cnblogs.com/renhui/articles/12868221.html

Android中的Looper与epoll：https://www.jianshu.com/p/7bc2b86c4d89