[笔记]一道C语言面试题:IPv4字符串转为UInt整数

题目:输入一个IPv4字符串,如“1.2.3.4”,输出对应的无符号整数,如本例输出为 0x01020304。

来源:某500强企业面试题目

思路:从尾部扫描到头部,一旦发现无法转换,立即返回,减少无谓操作。

#include "stdio.h"
#include "stdlib.h"
#include "string.h"

bool ConvertIPv4ToUInt(const char *strIP, unsigned int *ip)
{
    if (!strIP) {
        return false;
    }

    int Len = strlen(strIP);

    // min len is 7, e.g. 1.2.3.4; max len is 15, e.g. 123.234.121.254
    if ((Len < 7) || (Len > 15)) {
        return false;
    }

    int num[4] = { 0 };     // 4 parts of number
    int partNum = 0;        // 1 part of number 
    int base = 1;           // 10^base
    int dotCount = 0;       // dot count

    // from right to left
    for (int i = Len - 1; i >= 0; --i) {
        char ch = strIP[i];
        if (ch == '.') {
            // if the first char of last char is ".", e.g. ".1.2.3.4" or "1.2.", exit
            if ((i == 0) || (i == Len - 1)){
                return false;
            }
            dotCount++;

            // if more than 3 dot found, e.g. "1.2.3.4.5", exit
            if (dotCount > 3) {
                return false;
            }

            // save partNum to num[]
            num[dotCount - 1] = partNum;
            partNum = 0;
            base = 1;
        }
        else if ((ch < '0') || (ch > '9')) {
            // if illeagal char inside, exit
            return false;
        }
        else {
            // handle digit char
            partNum += (ch - '0') * base;
            base *= 10;

            if (partNum > 255) {
                return false;
            }

            // handle first part num
            if (i == 0) {
                // if count of "." is not enough, exit
                if (dotCount != 3) {
                    return false;
                }
                num[dotCount] = partNum;
            }
        }
    }

    // output ip
    *ip = 0;
    for (int i = 0; i < 4; ++i) {
        *ip += num[i] << (i * 8);
    }

    return true;
}

int main(int argc, char* argv[])
{
    char* strIP[] = {
        "1",
        "1.2",
        "1.2.3",
        "111.222.113", 
        "1.2.3.",
        ".1.2.3",
        "256.1.2.3",
        "1.2.3.4",
        "1.2.3.4.5",
        "12.234.45.6",
        "12.2345.45.6",
        "1.a.2.3",
        "1.2.3.4 ",
        "1.2. 3.4",
        "1,2,3,4",
    };

    for (int i = 0; i < sizeof(strIP) / sizeof(char *); ++i){
        unsigned int ip = 0;
        if (ConvertIPv4ToUInt(strIP[i], &ip)){
            printf("%s -> %08X
", strIP[i], ip);
        }
        else {
            printf("%s is not valid
", strIP[i]);
        }
    }

    getchar();
    return 0;
}

输出结果为:

1 is not valid
1.2 is not valid
1.2.3 is not valid
111.222.113 is not valid
1.2.3. is not valid
.1.2.3 is not valid
256.1.2.3 is not valid
1.2.3.4 -> 01020304
1.2.3.4.5 is not valid
12.234.45.6 -> 0CEA2D06
12.2345.45.6 is not valid
1.a.2.3 is not valid
1.2.3.4  is not valid
1.2. 3.4 is not valid
1,2,3,4 is not valid

从工程化角度考虑,有几点需要注意:

1、输入的字符串是否有效?
    不但要判断输入字符串是否为空,还要在处理过程中随时检查中间结果值,快速返回。
    需要考虑“.”的非法位置,如开头和结尾不能有“.”。
    需要考虑某段数字过长(超过255)。
    需要考虑“.”的个数,必须有且只有3个。

2、快速识别错误并退出
    发现有问题就快速退出,不需要进行无谓的多余计算。

3、考虑到转换失败的情况,所以返回值设定为bool,通过参数指针来返回转换结果。
    如果设定UInt为返回值,则无法通过返回值判断转换是否成功。
    需要的话,可以将bool的返回值改为enum,从而返回各种错误类型供调用者使用。

从编程角度考虑,有几点需要注意:

1、从后向前扫描字符串时,需要注意处理顺序
    先判断字符是否为“.”,然后判断是否为非数字,剩下的就是数字了。
    这样的顺序逻辑清晰,便于在发现问题时快速退出。

2、对于类似问题,可以将测试集先列出来,写代码时候就可以有的放矢的进行容错处理了。

原文地址:https://www.cnblogs.com/journeyonmyway/p/3871546.html