20200917-3 白名单

此作业的要求参见[https://edu.cnblogs.com/campus/nenu/2020Fall/homework/11207]
白名单 SPEC
老杨因为留作业太多被学生投诉下岗了,去面试,刚好你是公司的面试官。出了道题,题目要求如下(别忙着答题,现在是背景,作业的要求还在后面)。
1) 程序名brute,按照下面的要求读入两个文件。文件 whitelist,包含1列整数10个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。文件 q,包含1列整数1000个,随机生成(也要求老杨自己想办法),通过控制台读入。
2) 在文件q中查找所有不在whitelist中的整数,定向输出到一个文件中。(读到此处,你见老杨面露困惑,出于多年,不,一年,不,半年的师生情谊,你补充道,“杨老师,您就当这是从交易记录q中查找不符合白名单whitelist的非法交易。”老杨感激地点点头。)
3) 写一份如何部署运行代码的readme。

作业0(5分)

修改create.cpp文件,改成由命令行参数确定生成的数据的数据量。修改readme.md的对应部分。(要求贴出修改之后的代码和read.md。)
修改后代码如下:

#include <iostream>
#include <stdlib.h>
#include <time.h>

using namespace std;

int main(int argc, char* argv[])
{
    srand((unsigned)time(NULL));
    int a;
    sscanf(argv[1],"%d",&a);
    for(int i=0; i<a;i++)
    {
         cout << rand() << "
";
    }
    cout << endl;

    return 0;
}

修改readme.md文件

作业1(10分)

对上面两段老杨写的代码任选其一进行profile,观察现象(要求有截图记录)。

我选择的是第一个代码进行profile,使用的是vs2019,
截图如下:


由图可以看出,外部代码执行的最慢,因为运行时他站的百分比最大。

你是一个好人,为了让老杨知道为什么要对代码进行profile,于是你在原来的题目的基础上做出了修改,修改之后的题要求如下:

1) 读入两个文件,一个用控制台,一个用命令行参数指出文件名。

文件 biggerwhitelist,包含1列整数1M个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。

文件 biggerq,包含1列整数10M个,随机生成(也要求老杨自己想办法),通过控制台读入。

2) 在文件biggerq中查找所有不在biggerwhitelist中的整数,重定向输出到一个文件中。

3) 写一份如何部署运行代码的readme。

作业2(10分)

以biggerwhitelist和biggerq作为输入,对作业1中选择的代码再次进行profile,找到代码执行最“慢”的地方,截图为证并文字说明。

由图可以看出,红色的代码块即为执行慢的地方,颜色越深,代表执行的越慢。所以说是is_match()函数效率比较低,所以要对is_match()函数进行优化。

老杨再次profile之后发现了代码最慢的地方在哪儿。这时候你说:“既然找到了最慢的地方,那就开始对你的代码进行优化吧。”对于这次引导的结果,你很得意。

作业3(10分)

根据作业2找到的最慢的地方,优化作业1中你选择的代码,在保证输出结果正确的前提下,减少老杨程序运行的时间。(优化后的代码需要你提交到git上,作为教师的判断依据。优化后的程序的名字应该是better.cpp或者better.cs。)
代码:

#include <algorithm>
#include <fstream>
#include <iostream>
#include <cstring>
#include <cstdio>
using namespace std;

const int w_1m = 1000000;
int w[w_1m];

int binarySearch(int t, int low, int high)
{
    //对排序后的有序数据进行二分查找
    while (low <= high)
    {
        int mid = low + (high - low) / 2;
        if (t < w[mid])high = mid - 1;
        else if (t > w[mid])low = mid + 1;
        else return mid;
    }
    return -1;
}

// brute -w whitelist < T
int main(int argc, char* argv[])
{
    if (argc != 3 || strcmp(argv[1], "-w"))
    {
        return 1;
    }

    // init w
    ////    for(int i=0;i<w_1m)
    ////    {
    ////        w[i]=-1; //填充非法数据
    ////    }
    ifstream infile;
    infile.open(argv[2]);
    int i = 0;
    cout << argv[2] << endl;
    while (infile >> w[i++])
    {
    }
    int w_length = i - 1;
    cout << w_length << endl;
    // check t
    int t = 0;

    sort(w, w + w_length);
    //对w中的数据进行排序
    while (cin >> t)
    {
        if (binarySearch(t, 0, w_length) != -1)
        {
            printf("%d", t);
        }
    }
}

git地址:https://github.com/hhwwxx11/better

老杨在优化了代码之后,发现果然代码运行“快”了很多,很是得意。这时候你想“好人”做到底,顺水推舟一把。你说:“对优化后的代码再profile一下吧。”老杨与你意见一致。

作业4(5分)

对作业3优化后的代码进行profile,结果与作业2的结果做对比。画表格并文字说明。
优化后的执行效果截图:

很明显可以看出,优化之后颜色变浅了,运行时间也缩短了。

最后,老杨发现了他原本代码的不足,并且对于你的引导表达了谢意。

但是,你还是犹豫要不要录用老杨。因为你觉得老杨的文档(readme),注释和代码风格有很大的问题,并且给老杨指了出来。

作业5(5分)

你觉得老杨的文档(readme),注释和代码风格又哪些问题,该如何改进?
(1)代码注释比较混乱,有的是//,有的是////。
(2)每一个函数都应标明各自的作用,这样会让读者对程序有更好的理解。
(3)应该把没用的代码删除
(4)注释尽量用中文来说明

面试结束了,你和老杨握手,对他说出了面试的结果。你说的内容,不是今天的作业题,也许是若干年以后你想对当年教你的教师说的,也许是你希望未来的面试官对你说的。你想说的是什么呢?
以后还是要注意一下优化问题,会节省很多运行时间,继续加油!

原文地址:https://www.cnblogs.com/houwx744/p/13715664.html