LLVM编译器

LLVM

1. 说说 LLVM（Low Level Virtual Machine）到底是什么吧

先说编译器：编译器是把程序员的代码翻译成机器可以理解的语言的工具；
再谈 LLVM：一个模块化和可重用的编译器和工具链技术的集合，Clang 是 LLVM 的子项目，是 C，C++ 和 Objective-C 编译器，因为多模块的复用，所以提供了惊人的快速编译，比 GCC 快3倍。

2. LLVM 是一开始就作为一个完整的编译工具来使用的吗？还是有什么其他故事

LLVM 当时是为了解决一个小问题而开发的：当使用OpenGL 函数库的时候（Mac OS 10.4 和 10.5环境下），比如你要调用这个函数，glVertex3f()，编译器必须将其转化为特定的GPU可以理解的数据。但是这带来一个问题：市面上有海量的GPU，每个GPU的性能和参数也不尽相同，所要求的数据格式也不同。这时 LLVM 可以产生很小的一部分代码去解决这个问题，这是 LLVM 诞生的初衷。

3. LLVM 的 bytecode 和 Apple 现在的 bitcode 有什么不同？

这是历史遗留问题。一开始 LLVM 是开源的，所有代码在转成二进制时就叫做 bytecode -- 因为 java 当年就是这么叫的。当时这一部分有很多问题：比如不能扩展，无法兼容，非常脆弱

然后就到了 LLVM 2.0，当时我重新设计了架构，采用的就是 Bitcode 机制。LLVM 2.0 将所有代码以比特流(bit stream)而不是字节流(byte stream)的形式来编码。这就是 bitcode 这一术语的由来。

主要的工作流程就是现将代码转成比特流，然后相应处理。处理完后再将编码传到其他地方去。

4. Bitcode 这个机制比直接传输二进制有什么好处

好处那是多了去了。首先编译器工作起来会越来越好。因为通过Bitcode机制，它可以通过编译不同代码来存储各种优化方法，这样下次碰到类似代码，它就会自动启动相关优化机制，使得效率提升。还有个好处是 LLVM 可以让芯片的兼容性变得很好。因为 Apple 每年都在芯片上推陈出新，它们转化为二进制的规则都不尽相同，LLVM 只要每次重新编码并传输成比特流就好了。

当然 Bitcode 也不是万能的。比如它不能解决 32位的 APP 在64位机器上的兼容问题。这个问题其实应该依靠代码逻辑。

补充

补充：LLVM的三层结构

第一层：Clang 编译器，负责编译各种语言
第二层：代码优化器，通过模块化操作优化代码，是 Bitcode 逻辑的主要部分
第三层：代码翻译器，针对不同平台和 GPU 将代码翻译成机器语言

补充：LLDB，llbc++，compile rt

LLDB: 一个有着 REPL 的特性和 C++ ,Python 插件的开源调试器。LLDB 绑定在 Xcode 内部，存在于主窗口底部的控制台中；
libc++，libc++ ABI: 高性能 C++ 标准库实现，支持 C++ 11
compiler-rt：为 LLVM 和 Clang 设计的编译器扩展函数库。针对 __fixunsdfdi 和其他目标机器上没有一个核心 IR (intermediate representation) 对应的短原生指令序列时，提供高度调优过的底层代码生成支持。

ABI 是什么？

Application Binary Interface，中文名：应用二进制接口。是 APP 和操作系统、其他应用之间的二进制接口。它包括以下细节：
数据类型的大小、布局和对齐;
调用约定（控制着函数的参数如何传送以及如何接受返回值），例如，是所有的参数都通过栈传递，还是部分参数通过寄存器传递；哪个寄存器用于哪个函数参数；通过栈传递的第一个函数参数是最先push到栈上还是最后；
系统调用的编码和一个应用如何向操作系统进行系统调用；
以及在一个完整的操作系统ABI中，目标文件的二进制格式、程序库等等。