8-字符串转换整数 (atoi)

题目:

请你来实现一个 atoi 函数,使其能将字符串转换成整数。

首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:

--如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
--假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
--该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0 。

提示:

本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−2^31,  2^31 − 1]。如果数值超过这个范围,请返回  INT_MAX (2^31 − 1) 或 INT_MIN (−2^31) 。
 

示例 1:

输入: "42"
输出: 42
示例 2:

输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
  我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:

输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:

输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:

输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
  因此返回 INT_MIN (−2^31) 。

解答:

解答一:状态机

class Automation2
{
public:
    int getInt(string str)
    {
        for (char c: str)
        {
            int val = getChar(c);
             state = table[state][val];
            if (state == "signed")
                sign = (c == '+') ? 1 : -1;
            else if (state == "number")
            {
                result = result * 10 + c - '0';
                if (sign == 1)
                {
                    if (result > (long long)INT_MAX)
                        return INT_MAX;
                }

                //如果符号为-1
                if (result*sign < INT_MIN)
                    return INT_MIN;
            }
            else if (state == "end")
                break;
        }

        if (sign == 1)
        {
            if (result > (long long)INT_MAX)
                return INT_MAX;
            return result;
        }

        //如果符号为-1
        if (result*sign < INT_MIN)
            return INT_MIN;
        return (result*sign);
    }
private:
    //0-空格(去掉第一个非空字符之前的空格)
    //1-正负号
    //2-数字
    //3-其他
    unordered_map< string, vector<string>> table = 
    {
            { "start", { "start", "signed", "number", "end" } },
            { "signed", { "end", "end", "number", "end" } },
            { "number", { "end", "end", "number", "end" } },
            { "end", { "end", "end", "end", "end" } }
        };
    string state = "start";
    int sign = 1;    //+1 -1,注意设置初始值,不然为随机数;
    long long result = 0;

    //功能:根据输入字符,获取对应的标志;
    int getChar(char c)
    {
        if (isspace(c))
            return 0;
        else if (c == '+' || c == '-')
            return 1;
        else if (isdigit(c))
            return 2;
        return 3;
    }
};

class Solution {
public:
    int myAtoi(string s) {
        Automation2 au;
        return au.getInt(s);
    }
};

解答二:C风格

int myAtoi2(string str)
{
    int index = 0;
    int sign = 1;
    long long result = 0;
    
    while(str[index] == ' ')    //去掉开头的空格
        index++;

    if (str[index] == '+' || str[index] == '-')//判断符号
    {
        if (str[index] == '-')
            sign = -1;
        index++;
    }

    while (isdigit(str[index]))
    {
        result = result * 10 + str[index] - '0';
        if (sign == 1)
        {
            if (result > INT_MAX)
            {
                return INT_MAX;
            }
        }
        else
        {
            if (-1 * result < INT_MIN)
            {
                return INT_MIN;
            }
        }
        index++;
    }
    return sign*result;
}

然后发现与速度排在前面的代码差不多,但是排名有差距,看了代码发现有一些改进的地方:

1.没有判断第一个字符是否是有效的,即数字、+、-,如果不是直接返回:

 修改后,还是有差距,

2.没有判断输入字符串s是否有效,如果为空则直接返回0:

 最后代码:

int myAtoi2(string str)
{
    if (str.empty())
        return 0;

    int index = 0;
    int sign = 1;
    long long result = 0;
    
    while(str[index] == ' ')    //去掉开头的空格
        index++;

    //判断是否是非法的,是的话直接返回
    if (isdigit(str[index]) == false && (str[index] != '+') && (str[index] != '-'))
        return 0;

    if (str[index] == '+' || str[index] == '-')//判断符号
    {
        if (str[index] == '-')
            sign = -1;
        index++;
    }

    while (isdigit(str[index]))
    {
        result = result * 10 + str[index] - '0';
        if (sign == 1)
        {
            if (result > INT_MAX)
            {
                return INT_MAX;
            }
        }
        else
        {
            if (-1 * result < INT_MIN)
            {
                return INT_MIN;
            }
        }
        index++;
    }
    return sign*result;
}

溢出判断:

 while (i < s.length() && (s[i] <= '9' && s[i] >= '0'))//获取数字
        {
            if (flag == 0 && res >= INT_MAX / 10) //溢出判定
            {
                if (res == INT_MAX / 10 && (s[i] == '8' || s[i] == '9'))
                    return INT_MAX;
                if (res > INT_MAX / 10) return INT_MAX;
            }
            if (flag == 1 && res >= INT_MAX / 10) 
            {
                if (res == INT_MAX / 10 && (s[i] == '8' || s[i] == '9'))
                    return INT_MIN;
                if(res > INT_MAX / 10) return INT_MIN;
            }
            res = res * 10 + (s[i] - '0');
            i++;

        }

可以不使用long long来简化代码,判断result*10之前有无大于INT_MAX,这样可以减少内存使用。

总结:

1.fsm不会用!多看下;

2.使用C风格时,注意一些条件的判断,以减少没必要的代码执行;

原文地址:https://www.cnblogs.com/zyk1113/p/13950126.html