论编译器优化

昨天看到王垠的一篇旧文,自称找到了一个编译器的Bug。

内容是这样的,考虑如下代码:

void foo(int *p)
{
    int x = *p;
    
    if (p == NULL)
        ...
    
    puts("Hello!");
}

王垠说,编译器会把它优化成这样(我猜多半是-O3)

void foo(int *p)
{
    puts("Hello!");
}

并指出:这样不对啊!if里面的错误处理都被去掉了!

实际上编译器是对的。

int x = *p;

这一句里面,如果p非法,那就产生一个未定义行为(UB,Undefined Behaviour)。

UB是什么意思呢?未定义就是未定义!你的电脑爆炸都有可能!

所以,编译器把你后面的语句优化掉,不也是【未定义】吗?

解释完了,下面来说一下编译器的优化逻辑。

void foo(int *p)
{
    int x = *p;
    
    if (p == NULL)
        ...
    
    puts("Hello!");
}

首先,编译器看到人写了第一句

int x = *p;

所以编译器假定:p指向合法

既然p合法,所以就把if (p == NULL)优化掉,因为这个不可能发生

然后代码变成了

void foo(int *p)
{
    int x = *p;
        
    puts("Hello!");
}

接着,编译器注意到x没有用到,所以把这一行也优化掉,然后就变成了如上这样子。

void foo(int *p)
{
    puts("Hello!");
}

这能怪编译器吗?

举一个极端的例子,我们写宏的时候会用 do ... while (0),自然是希望编译器把这个判断while (0)给优化掉的。

但是,如果人运行时用指针把code段的这个0修改掉了呢?呵呵,那编译器不就优化错了!

原文地址:https://www.cnblogs.com/ageane/p/o3.html