(转载)表驱动法

表驱动法

前注:希望我的读书笔记能带你快速翻过20页的书,欢迎讨论http://www.cnblogs.com/jerry19880126

这里谈谈一些学习方法吧,看了二十多年的书的,发现不同的书,有不同的看法:小说类的读起来最轻松,只要跟着作者走就行了,会写书的作者应该能呈现 一些剧情的细节,读者脑海中会形成相应的影像;散文类的读起来最值得细细品味,比如读者里面的散文,不是很长,但读起来会有一种小资情调;技术类的读起来 最吃力了,但这也是自己谋生的必经之路,所以再觉得难,也要啃下去,但技术这个东西,只要肯下功夫,学通之后,就会有一种难以名状的成就感,这种快乐得到 的越多,你的成长就越大。

千万不要像读小说或读散文一样看技术书,技术书是需要思考的,更重要的是需要实践,读多了也就发现虽然内容各不相同,但写作的规律总是大差不差的。给定一种技术,你觉得作者会怎样介绍?我觉得分成三步:第一步说“是什么”,第二步说“为什么”,第三步说“怎么做”。就以本章“表驱动法”为例,《代码大全》作者先是回答了“什么是表驱动”

表驱动法是一种编程模式,从表里面查询信息而不使用逻辑语句(如if或switch)

然后举了一个不使用表驱动的反例,说明不这样做会使代码可读性大大下降,这就回答了第二步。至于第三步,作者花了大量篇幅去介绍,你所看到的大部分内容实际上是第三步。

读书笔记也打算用三步去介绍这个表驱动法。第一步是定义,前面已经抄了书上的一句话,已经说的很明白了,就是用查表来代替if语句或switch语 句。第二步是原因,可以举个例子,如果有这样一个函数int getTotalDayInMonth(int month),它输入一个月份,然后返回这个月份的总天数(不考虑润年,二月以28天计),比如输入5,返回的是31,因为5月里共有31天。

一种写法是这样的:

// 获得某一月中的总天数,monthIndex从 1 开始
int getTotalDayInMonth(int month)
{ 
    int totalDay = 0;
    if(month == 2)
    {
        totalDay = 28;
    }
    else if(month == 4 || month == 6 || month == 9 || month == 11)
    {
        totalDay = 30;
    }
    else
    {
        totalDay = 31;
    }
    return totalDay;
}

在这种写法里使用了逻辑if判断,里面有很多凭空出现的数字,比如2,4,11等,这些称为magic number的数字出现在程序里是很不好的,因为不好修改与扩充,比如说上面的代码适合与地球上的计算,现在要你去改一个火星上的情况(火星公转时长不同 于地球,所以每个月划分的天数也会不同),你可能就要去改这些magic number了,更复杂的,你可能要因为更多的天数可能性(假定火星7月只有17天,而9月有21天),而添加更多的if分支。但如果像下面这样使用一个 表,就使程序简单多了:

const int totalDayTable[12] =
{
    31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31
};

// 获得某一月中的总天数,monthIndex从 1 开始
int getTotalDayInMonthFromTable(int month)
{
    return totalDayTable[month - 1];
}

怎么样,把用表与不用表的代码对比一下,是不是要简化许多呢?更有意义的是,如果某个天数变了,可以直接修改或扩充totalDayTable就行了,至于函数则分毫不用修改。

好吧,写到这里,应该已经解决了第二步了,就是使用表驱动可以提高源程序的可读性,使之更简洁而且更容易修改与扩充。

下面走到第三步,也是本章中花篇幅最大的一步了——如何去用表驱动来解决问题。

书上说查表方法可以细分为三种:

(1)     直接访问

(2)     索引访问

(3)     阶梯访问

直接访问是最简单的,查表本质其实就是去索引“键”来获得“值”,有点像获得数组值一样,给定下标index,然后matrix[index]就获 得数组在相应下标处的数值,再如前面的return totalDayTable[month - 1]就是直接用month-1来作为键的,而值可以直接通过查表来获得。

现在有个问题,万一“键”是不能直接用的呢?比如我想设计一个幼儿学习动物的软件,若小孩想查找牛的信息,这时屏幕上会打印出牛的特性,而若小孩想 查找狗的信息,则屏幕上会打印出狗的信息。显然,这里的键是动物名,而值是相应的描述。下标必须是整数,但动物名是string,怎么办呢?数据结构中的 hash表当然可以了,它就是计算string的hash值,通过hash值来索引表格的,但在这里我们不打算用hash值,而是由程序员自行设计 string到int的映射,怎么做呢?很简单啊,自己做个菜单呗,让用户只能选择相应的数字,这样“键”就成int了哈。

代码如下:

class Animal
{
public:
    virtual void print() = 0;
};

class Dog: public Animal
{
public:
    void print()
    {
        cout << "This is Dog..." << endl;
    }
};

class Cat: public Animal
{
public:
    void print()
    {
        cout << "This is Cat..." << endl;
    }
};

class Cow: public Animal
{
public:
    void print()
    {
        cout << "This is Cow..." << endl;
    }
};

Animal* animalTable[] = {
    new Dog, new Cat, new Cow
};

int main()
{
    cout << "想知道哪种动物的描述?" << endl;
    cout << "1. 狗" << endl << "2. 猫" << endl << "3. 奶牛" << endl << endl;
    int choiceIndex; 
    cout << "我选择:";
    cin >> choiceIndex;
    assert(choiceIndex >= 1 && choiceIndex <= 3);
    animalTable[choiceIndex - 1]->print();
}

运行结果为:

这里用了C++的多态性,根据不同的实体对象能调用相应的print函数,但我更想表达的是表驱动法的应用,请把目光放在表animalTable 上吧,这样的排序,就是将Dog映射成数字1,Cat映射成数字2了。这是人为的映射,但用途更广的是hash映射,不知道的同学去看看数据结构 吧,hash表可以快查找的利器,面试中常常被问到。

第二种表驱动法是索引访问表,它适用于这样的情况,假设你经营一家商店,有100种商品,每种商品都有一个ID号,但很多商品的描述都差不多,所以 只有30条不同的描述,现在的问题是建立商品与商品描述的表,如何建立?还是同上面做法来一一对应吗?那样描述会扩充到100的,会有70个描述是重复 的!如何解决这个问题呢?方法是建立一个100长的索引,然后这些索引指向相应的描述,注意不同的索引可以指向相同的描述,这样就解决了表数据冗余的问题 啦。

第三种表驱动法是阶梯访问表,它适用于数据不是一个固定的值,而是一个范围的问题,比如将百分制成绩转成五级分制(我们用的优、良、中、合格、不合 格,西方用的A、B、C、D和F),假定转换关系是当成绩在90-100区间,判为A,成绩在80-90区间,判为B,成绩在70-80区间,判为C,成 绩在60-70区间,判为D,成绩在60以下,判为F(failure)。现在的问题是,怎么用表格对付这个范围问题?一种笨笨的方法是申请一个100长 的表,然后在这个表中填充相应的等级就行了,但这样太浪费空间了,有没有更好的方法?

在《代码大全》上是用表格记录范围上限的,但其实用下限也是可以的,我就尝试用下限做了下(A级的下限是90,B级的下限是80…):

//阶梯访问表,顺序查找
const char gradeTable[] = {
    'A', 'B', 'C', 'D', 'F'
};

const int downLimit[] = {
    90, 80, 70, 60
};

int main()
{
    int score = 87;
    int gradeLevel = 0;
    while(gradeTable[gradeLevel] != 'F')
    {
        if(score < downLimit[gradeLevel])
        {
            ++ gradeLevel;
        }
        else
        {
            break;
        }
    }
    cout << "等级为 " << gradeTable[gradeLevel] << endl;
    return 0;
}

运行结果如下:

gradeLevel相当于表指针,在程序中就是通过调整这个表指针来使之指向正确的位置的。

程序还有优化的地方,注意到这些下限是有顺序(降序),那可以用二分查找啊,程序如下:

//阶梯访问表,二分查找
const char gradeTable[] = {
    'A', 'B', 'C', 'D', 'F'
};

const int DONWLIMIT_LENGTH = 4;

const int downLimit[] = {
    90, 80, 70, 60
};


int BinarySearch(int score)
{
    int low = 0;
    int high = DONWLIMIT_LENGTH - 1; //downLimit的最大的Index
    while(low <= high)
    {
        int mid = (low + high) / 2;
        if(score < downLimit[mid])
        {
            low = mid + 1;
        }
        else if(score > downLimit[mid])
        {
            high = mid - 1;
        }
        else
        {
            return mid;
        }
    }
    return low;
}

int main()
{
    int score = 87;
    int gradeLevel = BinarySearch(score);
    cout << "等级为 " << gradeTable[gradeLevel] << endl;
    return 0;
}

怎么样,用表驱动法不仅避免了大量的if或switch分支,还应用上了二分查找法,使得查找复杂度由O(N)下降到了O(logN)!

原文地址:https://www.cnblogs.com/dongerlei/p/5250786.html