读书笔记深度探索C++对象模型Chapter2

Chapter 2 构造函数语义学

关于C++，最常听到的一个抱怨就是：编译器背着程序员干了太多的事情。

默认构造函数 default constructor

如果没有程序员定义的构造函数，则会有一个default constructor被隐式(implicity)声明出来。一个被隐式声明的default ctor有时候会是一个trivial的ctor（完全什么也不做，连成员变量也不初始化，等于没有这个ctor，只是概念上有而已）。在以下四种情况下，这个隐式声明的default ctor会是nontrivial ctor。

情况1：这个类含有带有default ctor的成员。

例如：

classFoo {public: Foo(),Foo(int);...};

classBar {public: Foofoo; charstr;};

void foo_bar(){

Bar bar; //Bar::foo应在此处被初始化

if(str){...}

}

被合成的Bar default ctor内含必要的代码，能够调用class Foo的default ctor来处理member object Bar::foo，但并不处理Bar::str。即被合成的default ctor只是为了满足编译器的需要（编译器需要有个地方来初始化Bar::Foo，因为它有自己的default ctor），而不是程序的需要（初始化Bar::str是程序员的动作）。

如果程序员在ctor只显式初始化了Bar::str，则一些代码会被插入到这个ctor中。例如

Bar::Bar(){ str=0; }

会被编译器扩展为

Bar::Bar(){ foo.Foo::Foo(); //附加上的编译器代码

str=0;//显式的程序员代码

}

情况2：这个类派生自一个带有default ctor的Base Class。

同样的道理，这个类既然派生自一个带有default ctor的Base Class，则它需要一个地方来调用Base Class的default ctor。

情况3：这个类带有Virtual Function。

这种情况包括两个更细的情况：

1．这个类自己声明（或者继承）了Virtual Function。

2．这个类继承自一个继承串链，其中有virtual base class。

这种情况下，编译时，要做如下工作：

1.编译器需要生成一个virtual function table(vtbl)并填充。

2.在class object中，一个额外的pointer member(就是vptr，指向vtbl)会被编译器合成出来。此外虚拟调用会被替换（w.vf() => w.vprt[1]）。

为了支持这种功能，编译器必须为每个w对象设置它的vptr（这是成员变量，此时需要指向合适的vtbl），因此编译器需要在default ctor中安插一些代码来完成这种工作。

情况4：这个类带有Virtual Base Class。

考虑这样的代码：

classX { public: inti; };

classA : publicvirtualX { public: intj; };

classB : publicvirtualX { public: doubled; };

classC : publicA, publicB { public: intk; };

//无法在编译期间解析出 pa->i 的位置（给一个pa无法确定i的地址）。

void foo( constA* pa ) { pa->i = 1024; }

main() {

foo( new A );

foo( new C );

// ...

}

由于pa的真正类型不确定，所以某些编译器会记录一个指针例（如 __vbcX）来记录X，然后通过这个指针来定位pa指向的i。上述

void foo( constA* pa ) { pa->i = 1024; }

变成了：

void foo( constA* pa ) { pa-> __vbcX ->i = 1024; }

因此，__vbcX这个指针需要在object构造期间设置好。于是编译器需要一个default ctor来完成这个工作。

复制构造函数Copy ctor的构造

何时用到copy ctor：显式用t1初始化t2；传参；返回一个类对象。

如果程序员显式定义了copy ctor，则调用它。

如果没有，其内部是通过 default memberwise initialization的手法完成的（将源对象的所有member复制给目的对象，对于member class object，会递归执行memberwise initialization）。

这些操作是如何构造的：

概念上讲，这些操作是被一个copy ctor实现的。

上述强调“概念上讲”，是因为有时候copy ctor是trivial的。

copy ctor何时是nontrivial：简单的答案为当class没有展现bitwise copy semantics时，copy ctor是nontrivial的。

那么什么时候class没有展现bitwise copy semantics：答案为有四种情况。

情况1：这个类的某个member object有copy ctor。（编译器要在这个类的copy ctor来调用其member object的copy ctor）。

情况2：这个类继承自某个有copy ctor的base class。（编译器要在这个类的copy ctor来调用其base class的copy ctor）。

情况3：这个类声明了若干个virtual function。

如下代码

void draw(const ZooAnimal& zoey) {zoey.draw();}

void foo() {

ZooAnimal franny = yogi;

draw (yogi); //调用 Bear::draw()

draw (franny); //调用 ZooAnimal::draw()

}

如果ZooAnimal按照bitwise copy进行复制（ZooAnimal franny = yogi;），则会出现franny的vptr设置成了yogi的vptr，于是draw (franny);调用的会是Bear的draw。（事实上不是，因为franny是一个实例，不是指针也不是引用）。

因此ZooAnimal的复制构造函数需要显式设定vptr（使之指向ZooAnimal的vtbl），这个设置动作需要在合成的copy ctor中完成。

情况4：这个类派生自的继承链中有virtual base class。

同构造函数的情况4。 __vbcXXX需要显式重设，这个设置动作需要在合成的copy ctor中完成。

Raccoon和RedPanda中含有指向virtual base class subobject的指针（设为__vbcZooAnml），则当用RedPanda初始化Raccoon时( Raccoon rc=rp;)，将Raccoon-> __vbcZooAnml 设置为RedPanda->__vbcZooAnml是不对的。因此需要重新设置__vbcZooAnml，这个动作需要在copy ctor中完成。

总结以上4种情况，bitwise copy semantics的意思可以理解为：类的某些成员变量（包括程序员定义的成员变量和编译器所需要的变量如vptr、__vbc等）不能按位复制时，需要调用成员变量的copy ctor或者重设vptr等编译器所需类的成员变量，这些动作都需要在发生对象复制的时候完成，因此编译器会合成一个copy ctor（入股没有的话）。

程序转化语义学 Program Transformation Semantics

显式的初始化操作 Explicit Initialization

X x0;

void foo_bar(){

X x1(x0); //定义了x1

X x2 = x0; //定义了x2

X x3 = X(x0); //定义了x3

}

转化的两个动作：重写每一个定义，其初始化部分被剥除；用copy ctor初始化。

即变成了

void foo_bar(){

X x1; //定义被重写，初始化操作被剥除

X x2; //定义被重写，初始化操作被剥除

X x3; //定义被重写，初始化操作被剥除

//编译器安插X copy ctor。

x1.X::X( x0 );

x2.X::X( x0 );

x3.X::X( x0 );

}

其中x1.X::X( x0 );会表现为对copy ctor（即 X::X( constX& xx);）的调用。

参数初始化 Argument Initialization

如下代码的变化

void foo(X x0);

...

X xx;

foo(xx)

变成了

void foo(X& x0);

...

X __tmp;

__tmp.X::X( XX );

foo(__tmp);

其中X声明了destructor，它在foo调用完成后销毁__tmp。

另一种变化是拷贝构建（copy construct），将实际参数直接建在其应该在的位置上。

返回值的初始化 Return Value Initialization

X bar(){

X xx;

...

return xx;

}

变成了

void bar(X& _result){

X xx;

...

_result.X::X(xx);

return;

}

对函数的调用

X xx=bar();

变为：

X xx;

bar(xx);

对函数的调用

bar().memfunc();

变为：

X _tmp;

(bar(_tmp),_tmp).memfunc();

在使用者层面做优化 Optimization at the User Level

在编译器层面做优化 Optimization at the Compiler Level

针对这种转化：

X bar(){

X xx;

...

return xx;

}

变成

void bar(X& _result){

X xx;

...

_result.X::X(xx);

return;

}

这一转换的一个优化为：转变成如下代码

void bar(X& _result){

_result.X::X(xx);

//原来处理xx，现在变为处理_result。

return;

}

这一优化称之为NRV（Named Return Value）。

虽如此，NRV饱受批评。主因有二：编译器实现程度不一致（有些编译器）。函数变得复杂时，优化难以实施。

成员初始化列表 Member Initialization List