C++ template —— 表达式模板（十）

表达式模板解决的问题是：
对于一个数值数组类，它需要为基于整个数组对象的数值操作提供支持，如对数组求和或放大：

Array<double> x(1000), y(1000);
...
x = 1.2 * x + x * y;

对效率要求苛刻的数值计算器，会要求上面的表达式以最高效的方式进行求值。想既高效又以这种比较紧凑的运算符写法来实现，表达式模板可以帮助我们实现这种需求。

谈到表达式模板，自然联想到前面的template metaprogramming。一方面：表达式模板有时依赖于深层的嵌套模板实例化，而这种实例化又和我们在template metaprogramming中遇到的递归实例化非常相似；另一方面：最初开发这两种实例化技术都是为了支持高性能的数组操作，而这又从另一个侧面说明了metaprogramming和表达式模板是息息相关的。当然，这两种技术还是互补的。例如，metaprogramming主要用于小的，大小固定的数组，而表达式模板则适用于能够在运行期确定大小、中等大小的数组。

18.1 临时变量和分割循环
书中本节讲解了使用普通的运算符重载方法，临时变量的构造和多次的读写操作带来的低效，以及使用包含计算的赋值运算符（如+=，*=等），即便可以避免过多的临时变量构造，却依旧进行了多次读写以致并没有带来明显的效率提高，同时引入并不雅观的代码。
有兴趣详见书籍；

18.2 在模板实参中编码表达式
前面的问题中，我们注意到：直到看到了整个表达式的时候（在我们的例子中，即在调用赋值运算符的时候），才对表达式的各个部分进行求值。下面我们要做的，就是把表达式：

1.2*x + x*y;

转化为一个具有如下类型的对象：

A_Add< A_Mult<A_Scalar<double>, Array<double> >,
             A_Mult<Array<double>, Array<double> > >

18.2.1 表达式模板的操作数
首先我们来实现A_Add和A_Mult，A_Scalar类：
---------------------- 标识1 ------------------------

// exprtmpl/exprops1.hpp

#include <stddef.h>
#include <cassert>
// 包含了一个辅助class trait template, 从而可以根据不同的情况，判断究竟是以“传值”的方式还是以“传引用”的方式来引用对应的“表达式模板节点”：
#include "exprops1a.hpp"

// 表示两个操作数之和的对象的所属类
template <typename T, typename OP1, typename OP2>
class A_Add
{
    private:
        // 这里使用辅助类A_Traits的原因参见 “标识4”
        typename A_Traits<OP1>::ExprRef op1;        // 第1个操作数
        typename A_Traits<OP2>::ExprRef op2;        // 第2个操作数
    
    public:
        // 构造函数，用于初始化指向操作数的引用
        A_Add(OP1 const& a, OP2 const& b) : op1(a), op2(b) { }            
        
        // 在求值的时候计算和
        // 但最外层的变量调用[]运算符的时候，会一层一层调用到最原始类型的[]运算符
        T operator[] (size_t idx) const
        {
            return op1[idx] + op2[idx];
        }

        // size代表最大的容量（大小）
        size_t size() const 
        {
            assert (op1.size() == 0 || op2.size() == 0 || op1.size() == op2.size() );
            return op1.size() != 0 ? op1.size() : op2.size();
        }
};

// 表示两个操作数之积的对象的所属类
template <typename T, typename OP1, typename OP2>
class A_Mult
{
    private:
        typename A_Traits<OP1>::ExprRef op1;        // 第1个操作数
        typename A_Traits<OP2>::ExprRef op2;        // 第2个操作数
    
    public:
        // 构造函数，用于初始化对象指向操作数的引用
        A_Mult(OP1 const& a, OP2 const& b) : op1(a), op2(b) { }            
        
        // 在求值的时候计算乘积
        // 但最外层的变量调用[]运算符的时候，会一层一层调用到最原始类型的[]运算符
        T operator[] (size_t idx) const
        {
            return op1[idx] * op2[idx];
        }

        // size代表最大的容量（大小）
        size_t size() const 
        {
            assert (op1.size() == 0 || op2.size() == 0 || op1.size() == op2.size() );
            return op1.size() != 0 ? op1.size() : op2.size();
        }
};

exprtmpl/exprscalar.hpp
// 用于表示放到倍数的对象的所属类
template <typename T>
class A_Scalar
{
    private:
        T const& s;      // scalar的值
    public:
        // 构造函数，用于初始值
        A_Scalar (T const& v) : s(v) { }

        // 对于索引（下标）操作而言，每个元素的值都等于scalar（放大倍数）的值
        T operator[] (size_t) const {
            return s
        }
        
        // scalar 的大小（即元素个数）为0
        size_t size() const{
            return 0;
        }
};

18.2.2 Array 类型
---------------------- 标识2 ------------------------
既然能够使用轻量级的表达式模板来对表达式进行编码，下面我们创建一个Array:它既能够针对占用实际内存的数组，同时也适用于表达式模板。

// Rep类型要么是SArray,但前提是Array必须是一个占用实际存储空间的数组；要么是一个用于编码表达式的嵌套template-id,如A_Add和A_Mult。
// exprtmpl/exprarray.hpp
#include <stddef.h>
#include <cassert>
#include "sarray1.hpp"

template <typename T, typename Rep = SArray<T> >
class Array
{
    private:
        Rep expr_rep;       // (访问)数组的数据
    
    public:
        // 创建具有初始化大小的数组
        explicit Array (size_t s) : expr_rep(s) { }
        
        // 根据其他可能的表示来创建数组
        Array (Rep const& rb) ; expr_rep(rb) { }
        
        // 针对相同类型的赋值运算符
        Array& operator = (Array const& b) {
            assert (size() == b.size() );
            for (size_t idx = 0; idx < b.size(); ++idx)
            {
                expr_rep[idx] = b[idx];
            }
            return *this;
        }

        // 针对不同类型的赋值运算符
        template <typename T2, typename Rep2>
        Array& operator = (Array<T2, Rep2> const& b) {
            assert (size() == b.size() );
            for (size_t idx = 0; idx < b.size(); ++idx)
            {
                expr_rep[idx] = b[idx];
            }
            return *this;
        }

        // size 是所表示数据的大小
        size_t size() const{
            return expr_rep.size();
        }

        // 分别针对常量和变量的索引（下标）运算符
        T operator[] (size_t idx) const {
            assert(idx < size() );
            return expr_rep[idx];
        }

        T& operator[] (size_t idx) const {
            assert(idx < size() );
            return expr_rep[idx];
        }

        // 返回数组现在所表示的对象
        Rep const& rep() const {
            return expr_rep;
        }
    
        Rep& rep(){
            return expr_rep;
        }
};

18.2.3 运算符
---------------------- 标识3 ------------------------
到目前为止，我们只是实现了用于代表运算符的、针对数值Array模板的运算符操作（诸如A_Add），但仍然没有实现运算符本身（诸如+）。下面我们来做这件事：

// exprtmpl/exprops2.hpp
// 两个数组相加
template <typename T, typename R1, typename R2>
Array<T, A_Add<T, R1, R2> >
operator + (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Add<T, R1, R2> >(A_Add<T, R1, R2>(a.rep(), b.rep() ));
}

// 两个数组相乘
template <typename T, typename R1, typename R2>
Array<T, A_Mult<T, R1, R2> >
operator * (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Mult<T, R1, R2> >(A_Mult<T, R1, R2>(a.rep(), b.rep() ));
}

// scalar 和 数组相乘
template <typename T, typename R2>
Array<T, A_Mult<T, A_Scalar<T>, R2> >
operator * (T const& s, Array<T, R2> const& b){
    return Array<T, A_Mult<T, A_Scalar<T>, R2> >(A_Mult<T, A_Scalar<T>, R2>(A_Scalar<T>(s), b.rep() ));
}

// 数组和scalar相乘
// scalar和数组相加
// 数组和scalar相加
...

18.2.4 总结
针对前面的例子代码，我们来进行一个自顶向下的回顾：

int main()
{
    Array<double> x(1000), y(1000);
    ...
    x = 1.2*x + x*y;
}

（1）首先，编译器解析最左边的*运算符,它是一个scalar-array运算符：

template <typename T, typename R2>
Array<T, A_Mult<T, A_Scalar<T>, R2> >      // 返回类型
operator * (T const& s, Array<T, R2> const& b){
    return Array<T, A_Mult<T, A_Scalar<T>, R2> >            // 类型转换
            (A_Mult<T, A_Scalar<T>, R2>        // 模板参数
            (A_Scalar<T>(s), b.rep() ));        // 构造函数参数
}

其中操作数的类型是double和Array<double, SArray<double> >。因此，实际的结果类型是：

Array<double, A_Mult<double, A_Scalar<double>, SArray<double> > >

而结果值是一个构造自double值1.2的A_Scalar<double>对象，和一个表示对象x的SArray<double>对象。

（2）接下来，将会对第2个乘法进行求值：x*y是一个array-array操作：

template <typename T, typename R1, typename R2>
Array<T, A_Mult<T, R1, R2> >
operator * (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Mult<T, R1, R2> >
            (A_Mult<T, R1, R2>(a.rep(), b.rep() ));
}

而两个操作数的类型都是Array<double, SArray<double> >, 因此结果类型为：

Array<double, A_Mult<double, SArray<double>, SArray<double> > >

这一次，A_Mult所封装的两个参数对象都引用了一个SArray<double>表示：即一个用于表示x对象，另一个用于表示y对象。

（3）最后，才对+运算符进行求值。这次还是array-array操作：

template <typename T, typename R1, typename R2>
Array<T, A_Add<T, R1, R2> >
operator * (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Add<T, R1, R2> >
            (A_Add<T, R1, R2>(a.rep(), b.rep() ));
}

其中用double来替换T,R1则用：

A_Mult<double, A_Scalar<double>, SArray<double> >

进行替换，而R2则替换为：

A_Mult<double, SArray<double>, SArray<double> >

因此，赋值运算符右边的表达式最终的类型为：

Array<double,
            A_Add<double,
                    A_Mult<double, A_Scalar<double>, SArray<double> >,
                    A_Mult<double, SArray<double>, SArray<double> > > >

这个类型将与Array模板的赋值运算符模板进行匹配：

template <typename T, typename Rep = SArray<T> >
class Array
{
    public:
        ...
        
        // 针对相同类型的赋值运算符
        Array& operator = (Array const& b) {
            assert (size() == b.size() );
            for (size_t idx = 0; idx < b.size(); ++idx)
            {
                expr_rep[idx] = b[idx];
            }
            return *this;
        }

        ...
};

其中赋值运算符将会运用右边Array（即b）的下标运算符来计算目标数组x的每一个元素，其中右边Array的实际类型为：

A_Add<double,
                    A_Mult<double, A_Scalar<double>, SArray<double> >,
                    A_Mult<double, SArray<double>, SArray<double> > >

如果我们仔细跟踪这个下标操作，那么对于一个给定的下标x，将会得到：

b[idx]实际展开成：(1.2*x[idx]) + (x[idx]*y[idx])

也即： x = 1.2*x + x*y;

表达式首先根据"标识3"规则进行展开，然后，再进一步根据"标识1"进行展开，在"标识1"中，针对每一个原始类型执行实际的数值操作（包括下标运算符操作）。

---------------------- 标识4 ------------------------
标识1中的运算符类使用了一个辅助类A_Traits，来定义操作数成员，是必要的：

 typename A_Traits<OP1>::ExprRef op1;        // 第1个操作数
  typename A_Traits<OP2>::ExprRef op2;        // 第2个操作数

原因在于：通常而言，我们可以把这些操作数声明为引用类型，因为大多数局部节点是在顶层表达式进行绑定的，因此它们的生命周期能够延续到完整表达式的求值。但是，唯一的例外是A_Scalar节点，它是在运算符函数内部进行绑定的，所以并不能一直存在到完整表达式的求值。因此，为了使放到倍数的成员能够一直存在到完整表达式求值，我们需求对scalar操作数进行“传值拷贝”，而不是“传引用拷贝”。也即：

（1）通常情况下是常数引用：

OP1 const& op1;     // 指向第1个操作数的引用
OP2 const& op2;     // 指向第2个操作数的引用

（2）对于scalar值，则是普通值：

OP1 op1;        // 以传值拷贝的方式引用第1个操作数
OP2 op2;        // 以传值拷贝的方式引用第2个操作数

故而，trait class 定义如下：它定义了一个针对大多数常数引用的基本模板，但同时定义了一个针对scalar的特化：

// exprtmpl/expropsla.hpp

/* 用于选择如何引用“表达式模板节点”的辅助trait class
*    - 通常情况下：传引用
*  - 对于scalar：传值
*/

template <typename T> class A_Scalar;

// 基本模板
template <typename T>
class A_Traits
{
    public:
        typedef T cosnt& ExprRef;      // 所引用的类型typedef成一个常量引用
};

// 针对scalar的局部特化
template <typename T>
class A_Traits<A_Scalar<T> >
{
    public:
        typedef A_Scalar<T> ExprRef;            // 所引用的类型实际是一个普通值
};