Java 基础:string中的compareTo方法

前言:

今天看了一篇gitchat的文章,标题是 聊聊 Java String 源码的排序算法,从中有所感悟和思考,因此打算总结下自己看的过程中的收获

一,java.lang.Comparable 接口

Comparable 接口强制了实现类对象列表的排序。其排序称为自然顺序,其 compareTo 方法,称为自然比较法

public interface Comparable<T> {
    public int compareTo(T o);
}

如果用this代表当前调用该compareTo方法的对象,obj是方法传入参数

则:

    this  <  obj   ---- 返回负数
    this  =  obj   ---- 返回 0
    this  >  obj   ---- 返回正数

Comparable接口的compareTo是一种内比较,即支持跟当前对象比较

二,java.util.Comparator 接口

Comparator可以认为是是一个外比较器,一个对象不支持自己和自己比较(没有实现Comparable接口),但是又想对两个对象进行比较

public interface Comparator<T> {
    int compare(T o1, T o2);
    //省略...........
}

比较逻辑:

    o1  <  o2   ---- 返回负数
    o1  =  o2   ---- 返回 0
    o1  >  o2   ---- 返回正数

三,聊聊string中的compareTo方法

String中实现的是Comparable接口来为String对象作出比较逻辑

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence{
        //........
    }

先看一段示例:

/**
 * 字符串比较案例
 */
public class StringComparisonDemo {

    public static void main(String[] args) {
        String foo = "ABC";

        // 前面和后面每个字符完全一样,返回 0
        String bar01 = "ABC";
        System.out.println(foo.compareTo(bar01));

        // 前面每个字符完全一样,返回:后面就是字符串长度差
        String bar02 = "ABCD";
        String bar03 = "ABCDE";
        System.out.println(foo.compareTo(bar02)); // -1 (前面相等,foo 长度小 1)
        System.out.println(foo.compareTo(bar03)); // -2 (前面相等,foo 长度小 2)

        // 前面每个字符不完全一样,返回:出现不一样的字符 ASCII 差
        String bar04 = "ABD";
        String bar05 = "aABCD";
        System.out.println(foo.compareTo(bar04)); // -1  (foo 的 'C' 字符 ASCII 码值为 67,bar04 的 'D' 字符 ASCII 码值为 68。返回 67 - 68 = -1)
        System.out.println(foo.compareTo(bar05)); // -32 (foo 的 'A' 字符 ASCII 码值为 65,bar04 的 'a' 字符 ASCII 码值为 97。返回 65 - 97 = -32)

        String bysocket01 = "泥瓦匠";
        String bysocket02 = "瓦匠";
        System.out.println(bysocket01.compareTo(bysocket02));// -2049 (泥 和 瓦的 Unicode 差值)
    }
}

结果:

0
-1
-2
-1
-32
-2049

再结合上边示例看看String中对compareTo方法的实现

 

   public int compareTo(String anotherString) {
        //len1:当前字符串长度
        int len1 = value.length;
        //len2:参数字符串长度
        int len2 = anotherString.value.length;
        //len1和len2两者最小值
        int lim = Math.min(len1, len2);
        //分别转为字符数组
        char v1[] = value;
        char v2[] = anotherString.value;

        int k = 0;
        //比较逻辑
        while (k < lim) {
            char c1 = v1[k];
            char c2 = v2[k];
            //字符不同,则返回两字符的ASCII 码的差值
            if (c1 != c2) {
                return c1 - c2;
            }
            k++;
        }
        //相同则返回两字符长度差值
        return len1 - len2;
    }

所以从上面的源码中可以看到,string中的compareTo逻辑大概可以整理为

字符串前面部分的每个字符完全一样,返回:后面两个字符串长度差;

字符串前面部分的每个字符存在不一样,返回:出现不一样的字符 ASCII 码的差值。

字符串的每个字符完全一样,返回 0;

在String内部还有个静态内部类CaseInsensitiveComparator也实现了该接口

private static class CaseInsensitiveComparator
            implements Comparator<String>, java.io.Serializable{
                //.................
            }

该重写的接口方法是String对象的大小写不敏感比较方法

        public int compare(String s1, String s2) {
            int n1 = s1.length();
            int n2 = s2.length();
            int min = Math.min(n1, n2);
            for (int i = 0; i < min; i++) {
                char c1 = s1.charAt(i);
                char c2 = s2.charAt(i);
                //转大写
                if (c1 != c2) {
                    c1 = Character.toUpperCase(c1);
                    c2 = Character.toUpperCase(c2);
                    //还不一样则转小写
                    if (c1 != c2) {
                        c1 = Character.toLowerCase(c1);
                        c2 = Character.toLowerCase(c2);
                        //还不一样则:返回不一样字符的ASCII 码的差值。
                        if (c1 != c2) {
                            // No overflow because of numeric promotion
                            return c1 - c2;
                        }
                    }
                }
            }
            return n1 - n2;
        }