经典研读 JDK

经典研读 JDK

1. String

String 是一个final类,不可被继承。String类中主要维护了一个private final char value[],在一个String类被构造后这一数组的值就不会再改变。这也是为什么StringtoLowerCasereplaceAll等方法只会返回一个新对象而不会对原对象作出修改。

方法 说明 关注
public boolean equals(Object anObject) 重写了equals方法 判断相等的条件是什么; 什么地方体现了“低耦合”思想; instanceof 的用法。
public int compareTo(String anotherString) 比较两个字符串的序关系 判断序关系的标准是什么;为什么要申明c1c2
public String toLowerCase(Locale locale) 将字符串转换为小写 什么是LocalString如何支持多国语言。

public boolean equals(Object anObject)

public boolean equals(Object anObject) { //传入的是一个Object引用,可传入的对象集合较大,“低耦合”
    if (this == anObject) {//判断传入引用是否引用了本对象
        return true;//引用相同返回真
    }
    if (anObject instanceof String) { //判断引用的对象类型是否为String
        String anotherString = (String)anObject; //强制转换为String类型引用
        int n = value.length;
        if (n == anotherString.value.length) {
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            while (n-- != 0) {//从头开始逐字符比对
                if (v1[i] != v2[i])
                    return false;
                i++;//疑问
            }
            return true;
        }
    }
    //顺带处理了anObject为null的情况
    return false;
}
  • 疑问
    为什么不用while(i < n) 或者直接将n当作循环变量从尾开始比对呢?

public int compareTo(String anotherString)

这一方法主要是为了实现Comparable接口。

public int compareTo(String anotherString) {
    int len1 = value.length;
    int len2 = anotherString.value.length;
    int lim = Math.min(len1, len2);
    char v1[] = value;
    char v2[] = anotherString.value;

    int k = 0;
    while (k < lim) {
        char c1 = v1[k];
        char c2 = v2[k];
        //对比equals方法,这里多申明了c1和c2
        //原因:在业务逻辑上必须使用这两个元素进行计算两次,
        //如果第二次计算重新通过数组偏移量得到值会使效率降低
        //TODO:实验验证
        if (c1 != c2) {//使用1
            return c1 - c2;//使用2
            //判断序关系的标准2:Unicode编码大小关系
        }
        k++;
    }
    return len1 - len2;
    //判断序关系的标准1:字符串长度关系
}
  • 可以预见的bug
    不同语言中有形状相似的语素,但是Unicode编码的序关系就并非是“看上去”那样了。

public String toLowerCase(Locale locale)

这一部分的源代码较为冗长,这里不进行引用。
通过源码可以发现,String依靠Local对象来判断不同的语言环境,并进行特殊化处理。其中某些语言的大小写转换会使字符串长度发生改变
Java的一个char类型和C语言不同,一个char占两个字节,并且按Unicode编码,支持多国语言。语言的处理总是繁杂的,但是这个方法中的代码却没有很多。主要原因是将语言的复杂处理包装到另一个类ConditionalSpecialCasing中,从而在这个方法里凸显出“字符串转换为小写”的业务逻辑,而不太关心具体某个字符应该如何被转换为小写(如果这一转换不会改变字符串长度的话)。

2. Integer

Integer类型是基础类型int包装类。查看源代码可以得知Integer的最大值。

方法 说明 关注
public static int parseInt(String s, int radix) String转换为Integer类型 什么地方体现了“低耦合”思想;声明为类的静态方法有什么好处;为何使用“负增长”的方式;如何使用thow
private static class IntegerCache 缓冲小数据以节省内存开销 这样的处理方式有什么好处;将导致什么(考虑==

public static int parseInt(String s, int radix)

public static int parseInt(String s, int radix) //明确声明为静态类方法,严格限制方法自身不会访问运行时对象。
                throws NumberFormatException
    {
        /*
         * WARNING: This method may be invoked early during VM initialization
         * before IntegerCache is initialized. Care must be taken to not use
         * the valueOf method.
         */

        if (s == null) { //引用有可能为空,使用前做判断(“低耦合”)
            throw new NumberFormatException("null");
        }

        if (radix < Character.MIN_RADIX) {
            throw new NumberFormatException("radix " + radix +
                                            " less than Character.MIN_RADIX");
        }//直接在产生异常的代码段编写提示信息,然后抛出

        if (radix > Character.MAX_RADIX) {
            throw new NumberFormatException("radix " + radix +
                                            " greater than Character.MAX_RADIX");
        }//同上

        int result = 0;
        boolean negative = false;
        int i = 0, len = s.length();
        int limit = -Integer.MAX_VALUE;
        int multmin;
        int digit;

        if (len > 0) {
            char firstChar = s.charAt(0);
            if (firstChar < '0') { // Possible leading "+" or "-"
                if (firstChar == '-') {
                    negative = true;
                    limit = Integer.MIN_VALUE;
                } else if (firstChar != '+')
                    throw NumberFormatException.forInputString(s);

                if (len == 1) // Cannot have lone "+" or "-"
                    throw NumberFormatException.forInputString(s);
                i++;
            }
            multmin = limit / radix;
            while (i < len) { //常规操作
                // Accumulating negatively avoids surprises near MAX_VALUE
                //翻译一下:
                //Java中int类型还是使用了补码的概念
                //最小值(负数)的绝对值比最大值(正数)的绝对值大1
                //正增长的方式需要做特判来保证最小值(负数)可以被解析到
                digit = Character.digit(s.charAt(i++),radix);   //调用了Character的转换方法(层次化构建思想)
                if (digit < 0) {////逐渐
                    throw NumberFormatException.forInputString(s);
                }
                if (result < multmin) {////让圈复杂度
                    throw NumberFormatException.forInputString(s);
                }
                result *= radix;
                if (result < limit + digit) {//移项判断,防止溢出////超过10了
                  //负方向溢出
                    throw NumberFormatException.forInputString(s);
                }
                result -= digit;
            }
        } else {
            throw NumberFormatException.forInputString(s);
        }
        return negative ? result : -result;
    }

在阅读JDK后我尝试用相似的套路构建一个parseRequest方法,结果所构建出的方法圈复杂度也超过了10,不过总体逻辑清晰,不太容易有bug。我认为在实践中也不必渴求压缩圈复杂度,可以有所取舍。
未完待续

原文地址:https://www.cnblogs.com/neolinsu/p/8714417.html