C++ template —— 表达式模板(十)

表达式模板解决的问题是:
对于一个数值数组类,它需要为基于整个数组对象的数值操作提供支持,如对数组求和或放大:

Array<double> x(1000), y(1000);
...
x = 1.2 * x + x * y;

对效率要求苛刻的数值计算器,会要求上面的表达式以最高效的方式进行求值。想既高效又以这种比较紧凑的运算符写法来实现,表达式模板可以帮助我们实现这种需求。

谈到表达式模板,自然联想到前面的template metaprogramming。一方面:表达式模板有时依赖于深层的嵌套模板实例化,而这种实例化又和我们在template metaprogramming中遇到的递归实例化非常相似;另一方面:最初开发这两种实例化技术都是为了支持高性能的数组操作,而这又从另一个侧面说明了metaprogramming和表达式模板是息息相关的。当然,这两种技术还是互补的。例如,metaprogramming主要用于小的,大小固定的数组,而表达式模板则适用于能够在运行期确定大小、中等大小的数组。

18.1 临时变量和分割循环
书中本节讲解了使用普通的运算符重载方法,临时变量的构造和多次的读写操作带来的低效,以及使用包含计算的赋值运算符(如+=,*=等),即便可以避免过多的临时变量构造,却依旧进行了多次读写以致并没有带来明显的效率提高,同时引入并不雅观的代码。
有兴趣详见书籍;

18.2 在模板实参中编码表达式
前面的问题中,我们注意到:直到看到了整个表达式的时候(在我们的例子中,即在调用赋值运算符的时候),才对表达式的各个部分进行求值。下面我们要做的,就是把表达式:

1.2*x + x*y;

转化为一个具有如下类型的对象:

A_Add< A_Mult<A_Scalar<double>, Array<double> >,
             A_Mult<Array<double>, Array<double> > >

18.2.1 表达式模板的操作数
首先我们来实现A_Add和A_Mult,A_Scalar类:
---------------------- 标识1 ------------------------

// exprtmpl/exprops1.hpp

#include <stddef.h>
#include <cassert>
// 包含了一个辅助class trait template, 从而可以根据不同的情况,判断究竟是以“传值”的方式还是以“传引用”的方式来引用对应的“表达式模板节点”:
#include "exprops1a.hpp"

// 表示两个操作数之和的对象的所属类
template <typename T, typename OP1, typename OP2>
class A_Add
{
    private:
        // 这里使用辅助类A_Traits的原因参见 “标识4”
        typename A_Traits<OP1>::ExprRef op1;        // 第1个操作数
        typename A_Traits<OP2>::ExprRef op2;        // 第2个操作数
    
    public:
        // 构造函数,用于初始化指向操作数的引用
        A_Add(OP1 const& a, OP2 const& b) : op1(a), op2(b) { }            
        
        // 在求值的时候计算和
        // 但最外层的变量调用[]运算符的时候,会一层一层调用到最原始类型的[]运算符
        T operator[] (size_t idx) const
        {
            return op1[idx] + op2[idx];
        }

        // size代表最大的容量(大小)
        size_t size() const 
        {
            assert (op1.size() == 0 || op2.size() == 0 || op1.size() == op2.size() );
            return op1.size() != 0 ? op1.size() : op2.size();
        }
};

// 表示两个操作数之积的对象的所属类
template <typename T, typename OP1, typename OP2>
class A_Mult
{
    private:
        typename A_Traits<OP1>::ExprRef op1;        // 第1个操作数
        typename A_Traits<OP2>::ExprRef op2;        // 第2个操作数
    
    public:
        // 构造函数,用于初始化对象指向操作数的引用
        A_Mult(OP1 const& a, OP2 const& b) : op1(a), op2(b) { }            
        
        // 在求值的时候计算乘积
        // 但最外层的变量调用[]运算符的时候,会一层一层调用到最原始类型的[]运算符
        T operator[] (size_t idx) const
        {
            return op1[idx] * op2[idx];
        }

        // size代表最大的容量(大小)
        size_t size() const 
        {
            assert (op1.size() == 0 || op2.size() == 0 || op1.size() == op2.size() );
            return op1.size() != 0 ? op1.size() : op2.size();
        }
};

exprtmpl/exprscalar.hpp
// 用于表示放到倍数的对象的所属类
template <typename T>
class A_Scalar
{
    private:
        T const& s;      // scalar的值
    public:
        // 构造函数,用于初始值
        A_Scalar (T const& v) : s(v) { }

        // 对于索引(下标)操作而言,每个元素的值都等于scalar(放大倍数)的值
        T operator[] (size_t) const {
            return s
        }
        
        // scalar 的大小(即元素个数)为0
        size_t size() const{
            return 0;
        }
};

18.2.2 Array 类型
---------------------- 标识2 ------------------------
既然能够使用轻量级的表达式模板来对表达式进行编码,下面我们创建一个Array:它既能够针对占用实际内存的数组,同时也适用于表达式模板。

// Rep类型要么是SArray,但前提是Array必须是一个占用实际存储空间的数组;要么是一个用于编码表达式的嵌套template-id,如A_Add和A_Mult。
// exprtmpl/exprarray.hpp
#include <stddef.h>
#include <cassert>
#include "sarray1.hpp"

template <typename T, typename Rep = SArray<T> >
class Array
{
    private:
        Rep expr_rep;       // (访问)数组的数据
    
    public:
        // 创建具有初始化大小的数组
        explicit Array (size_t s) : expr_rep(s) { }
        
        // 根据其他可能的表示来创建数组
        Array (Rep const& rb) ; expr_rep(rb) { }
        
        // 针对相同类型的赋值运算符
        Array& operator = (Array const& b) {
            assert (size() == b.size() );
            for (size_t idx = 0; idx < b.size(); ++idx)
            {
                expr_rep[idx] = b[idx];
            }
            return *this;
        }

        // 针对不同类型的赋值运算符
        template <typename T2, typename Rep2>
        Array& operator = (Array<T2, Rep2> const& b) {
            assert (size() == b.size() );
            for (size_t idx = 0; idx < b.size(); ++idx)
            {
                expr_rep[idx] = b[idx];
            }
            return *this;
        }

        // size 是所表示数据的大小
        size_t size() const{
            return expr_rep.size();
        }

        // 分别针对常量和变量的索引(下标)运算符
        T operator[] (size_t idx) const {
            assert(idx < size() );
            return expr_rep[idx];
        }

        T& operator[] (size_t idx) const {
            assert(idx < size() );
            return expr_rep[idx];
        }

        // 返回数组现在所表示的对象
        Rep const& rep() const {
            return expr_rep;
        }
    
        Rep& rep(){
            return expr_rep;
        }
};

18.2.3 运算符
---------------------- 标识3 ------------------------
到目前为止,我们只是实现了用于代表运算符的、针对数值Array模板的运算符操作(诸如A_Add),但仍然没有实现运算符本身(诸如+)。下面我们来做这件事:

// exprtmpl/exprops2.hpp
// 两个数组相加
template <typename T, typename R1, typename R2>
Array<T, A_Add<T, R1, R2> >
operator + (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Add<T, R1, R2> >(A_Add<T, R1, R2>(a.rep(), b.rep() ));
}

// 两个数组相乘
template <typename T, typename R1, typename R2>
Array<T, A_Mult<T, R1, R2> >
operator * (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Mult<T, R1, R2> >(A_Mult<T, R1, R2>(a.rep(), b.rep() ));
}

// scalar 和 数组相乘
template <typename T, typename R2>
Array<T, A_Mult<T, A_Scalar<T>, R2> >
operator * (T const& s, Array<T, R2> const& b){
    return Array<T, A_Mult<T, A_Scalar<T>, R2> >(A_Mult<T, A_Scalar<T>, R2>(A_Scalar<T>(s), b.rep() ));
}

// 数组和scalar相乘
// scalar和数组相加
// 数组和scalar相加
...

18.2.4 总结
针对前面的例子代码,我们来进行一个自顶向下的回顾:

int main()
{
    Array<double> x(1000), y(1000);
    ...
    x = 1.2*x + x*y;
}

(1)首先,编译器解析最左边的*运算符,它是一个scalar-array运算符:

template <typename T, typename R2>
Array<T, A_Mult<T, A_Scalar<T>, R2> >      // 返回类型
operator * (T const& s, Array<T, R2> const& b){
    return Array<T, A_Mult<T, A_Scalar<T>, R2> >            // 类型转换
            (A_Mult<T, A_Scalar<T>, R2>        // 模板参数
            (A_Scalar<T>(s), b.rep() ));        // 构造函数参数
}

其中操作数的类型是double和Array<double, SArray<double> >。因此,实际的结果类型是:

Array<double, A_Mult<double, A_Scalar<double>, SArray<double> > >

而结果值是一个构造自double值1.2的A_Scalar<double>对象,和一个表示对象x的SArray<double>对象。

(2)接下来,将会对第2个乘法进行求值:x*y是一个array-array操作:

template <typename T, typename R1, typename R2>
Array<T, A_Mult<T, R1, R2> >
operator * (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Mult<T, R1, R2> >
            (A_Mult<T, R1, R2>(a.rep(), b.rep() ));
}

而两个操作数的类型都是Array<double, SArray<double> >, 因此结果类型为:

Array<double, A_Mult<double, SArray<double>, SArray<double> > >

这一次,A_Mult所封装的两个参数对象都引用了一个SArray<double>表示:即一个用于表示x对象,另一个用于表示y对象。

(3)最后,才对+运算符进行求值。这次还是array-array操作:

template <typename T, typename R1, typename R2>
Array<T, A_Add<T, R1, R2> >
operator * (Array<T, R1> const& a, Array<T, R2> const& b){
    return Array<T, A_Add<T, R1, R2> >
            (A_Add<T, R1, R2>(a.rep(), b.rep() ));
}

其中用double来替换T,R1则用:

A_Mult<double, A_Scalar<double>, SArray<double> >

进行替换,而R2则替换为:

A_Mult<double, SArray<double>, SArray<double> >

因此,赋值运算符右边的表达式最终的类型为:

Array<double,
            A_Add<double,
                    A_Mult<double, A_Scalar<double>, SArray<double> >,
                    A_Mult<double, SArray<double>, SArray<double> > > >

这个类型将与Array模板的赋值运算符模板进行匹配:

template <typename T, typename Rep = SArray<T> >
class Array
{
    public:
        ...
        
        // 针对相同类型的赋值运算符
        Array& operator = (Array const& b) {
            assert (size() == b.size() );
            for (size_t idx = 0; idx < b.size(); ++idx)
            {
                expr_rep[idx] = b[idx];
            }
            return *this;
        }

        ...
};

其中赋值运算符将会运用右边Array(即b)的下标运算符来计算目标数组x的每一个元素,其中右边Array的实际类型为:

A_Add<double,
                    A_Mult<double, A_Scalar<double>, SArray<double> >,
                    A_Mult<double, SArray<double>, SArray<double> > >

如果我们仔细跟踪这个下标操作,那么对于一个给定的下标x,将会得到:

b[idx]实际展开成:(1.2*x[idx]) + (x[idx]*y[idx])

也即: x = 1.2*x + x*y;

表达式首先根据"标识3"规则进行展开,然后,再进一步根据"标识1"进行展开,在"标识1"中,针对每一个原始类型执行实际的数值操作(包括下标运算符操作)。

---------------------- 标识4 ------------------------
标识1中的运算符类使用了一个辅助类A_Traits,来定义操作数成员,是必要的:

 typename A_Traits<OP1>::ExprRef op1;        // 第1个操作数
  typename A_Traits<OP2>::ExprRef op2;        // 第2个操作数

原因在于:通常而言,我们可以把这些操作数声明为引用类型,因为大多数局部节点是在顶层表达式进行绑定的,因此它们的生命周期能够延续到完整表达式的求值。但是,唯一的例外是A_Scalar节点,它是在运算符函数内部进行绑定的,所以并不能一直存在到完整表达式的求值。因此,为了使放到倍数的成员能够一直存在到完整表达式求值,我们需求对scalar操作数进行“传值拷贝”,而不是“传引用拷贝”。也即:

(1)通常情况下是常数引用:

OP1 const& op1;     // 指向第1个操作数的引用
OP2 const& op2;     // 指向第2个操作数的引用

(2)对于scalar值,则是普通值:

OP1 op1;        // 以传值拷贝的方式引用第1个操作数
OP2 op2;        // 以传值拷贝的方式引用第2个操作数

故而,trait class 定义如下:它定义了一个针对大多数常数引用的基本模板,但同时定义了一个针对scalar的特化:

// exprtmpl/expropsla.hpp

/* 用于选择如何引用“表达式模板节点”的辅助trait class
*    - 通常情况下:传引用
*  - 对于scalar:传值
*/

template <typename T> class A_Scalar;

// 基本模板
template <typename T>
class A_Traits
{
    public:
        typedef T cosnt& ExprRef;      // 所引用的类型typedef成一个常量引用
};

// 针对scalar的局部特化
template <typename T>
class A_Traits<A_Scalar<T> >
{
    public:
        typedef A_Scalar<T> ExprRef;            // 所引用的类型实际是一个普通值
};
原文地址:https://www.cnblogs.com/yyxt/p/5207354.html