论编译器优化

昨天看到王垠的一篇旧文，自称找到了一个编译器的Bug。

内容是这样的，考虑如下代码：

void foo(int *p)
{
    int x = *p;
    
    if (p == NULL)
        ...
    
    puts("Hello!");
}

王垠说，编译器会把它优化成这样（我猜多半是-O3）

void foo(int *p)
{
    puts("Hello!");
}

并指出：这样不对啊！if里面的错误处理都被去掉了！

实际上编译器是对的。

int x = *p;

这一句里面，如果p非法，那就产生一个未定义行为（UB，Undefined Behaviour）。

UB是什么意思呢？未定义就是未定义！你的电脑爆炸都有可能！

所以，编译器把你后面的语句优化掉，不也是【未定义】吗？

解释完了，下面来说一下编译器的优化逻辑。

void foo(int *p)
{
    int x = *p;
    
    if (p == NULL)
        ...
    
    puts("Hello!");
}

首先，编译器看到人写了第一句

int x = *p;

所以编译器假定：p指向合法

既然p合法，所以就把if (p == NULL)优化掉，因为这个不可能发生

然后代码变成了

void foo(int *p)
{
    int x = *p;
        
    puts("Hello!");
}

接着，编译器注意到x没有用到，所以把这一行也优化掉，然后就变成了如上这样子。

void foo(int *p)
{
    puts("Hello!");
}

这能怪编译器吗？

举一个极端的例子，我们写宏的时候会用 do ... while (0)，自然是希望编译器把这个判断while (0)给优化掉的。

但是，如果人运行时用指针把code段的这个0修改掉了呢？呵呵，那编译器不就优化错了！