Java数据结构和算法(八)--红黑树与2-3树

红黑树规则:

  1、每个节点要么是红色,要么是黑色

  2、根节点都是黑色节点

  3、每个叶节点是黑色节点

  3、每个红色节点的两个子节点都是黑色节点,反之,不做要求,换句话说就是不能有连续两个红色节点

  4、从任意节点到所有叶子节点上的黑色节点数量是相同的

  一般对红黑树的讲述都是先给出这样的定义,这样想对不太容易理解的,而在算法4一书中,直接跳过这些规则,而讲述了红黑树与2-3树的等价性。如果我们先了解2-3树,理解了红黑树与2-3树之间的关系,再来看这些规则,就容易理解了

2-3树:

Java数据结构和算法(八)--红黑树与2-3树

2-3树满足二分搜索树的基本性质,但是不是二叉树

2-3树节点可以存放一个元素或两个元素,每个节点有两个(2节点)或三个子节点(3节点),这就是2-3树

2-3树是一个绝对平衡的树

2-3树的绝对平衡性:

1、2-3树新插入的节点一定不能插到空节点的位置

2、如果一个新节点插入到2节点,就会形成3节点

Java数据结构和算法(八)--红黑树与2-3树

3、如果一个新节点插入到3节点,临时形成4节点,然后进行变形

Java数据结构和算法(八)--红黑树与2-3树

如果这个节点是根节点,这样就处理完了,如果插入的节点是叶子节点

1).父节点为2-节点

Java数据结构和算法(八)--红黑树与2-3树

2).父节点为3-节点

Java数据结构和算法(八)--红黑树与2-3树

通过上面的规则,实现了2-3树的绝对平衡

红黑树和2-3树的等价性:

将2节点与3节点类比到红黑树

Java数据结构和算法(八)--红黑树与2-3树

通过上面的过程,我们得到红黑树,所有红色节点都是左倾斜

实践:

  所以此时我们很容易就能把2-3树转换为红黑树

Java数据结构和算法(八)--红黑树与2-3树

原来的2-3树有三个3-节点,所以红黑树中就有三个红色节点

通过2-3树理解红黑树的几个特征

特征:

1、每个节点要么是红色,要么是黑色

2、根节点是黑色节点

  根节点肯定是黑色的,因为在2-3树中,根节点要么是2节点,要么是3节点,对应红黑树根节点肯定是黑色的

3、每个叶子节点(最后的空节点,而不是左右子树都为空的节点)是黑色节点

  这里叶子节点是指这个节点为空,不是左右子树都为空的节点,包含空树的情况

  if(node == null)
    return BLACK;

4、每个红色节点的两个子节点都是黑色节点,反之,不做要求,换句话说就是不能有连续两个红色节点

  红色节点对应2-3树中的3节点,红节点的两个子节点对应3节点的左子节点和中间节点,这两个节点无论是2节点还是3节点,首先连接的肯定是黑色的,例如这里的17节点

Java数据结构和算法(八)--红黑树与2-3树

  这里也可以看出来,黑色节点的右子节点肯定是黑色的,这个算是延伸内容

5、从任意节点到所有叶子节点上的黑色节点数量是相同的

  这里类比到2-3树中,任意一个节点到叶子节点的经过的节点都是相同的,因为2-3是绝对平衡的树

  从2-3树类比过来,任意一个节点到叶子节点经过的节点,无论是2节点还是3节点,肯定包含一个黑色的节点,但是红色不一定的,所以才有了第五条规则/特性

  我们解释完了这五条特性,通过2-3树去理解,相比直接去死记硬背,简单很多

PS:红黑树是保持"黑色平衡"的二叉树,严格来说,不是平衡二叉树,最大高度:2logn,O(logn)

如果只是查询,AVL树的效率更高,如果删除和修改,红黑树更适合

Node定义:新添加节点默认红色

public class RBTree<K extends Comparable<K>, V> {

    private static final boolean RED = true;
    private static final boolean BLACK = false;

    private class Node {
        public K key;
        public V value;
        public Node left, right;
        public boolean color;

        public Node(K key, V value) {
            this.key = key;
            this.value = value;
            left = null;
            right = null;
            //这里默认添加节点为红色,因为在2-3树新增加一个节点总是要和叶子节点融合的,这里不论后序操作,
            //对应红黑树中一个红色节点和黑色节点
            color = RED;
        }
    }
}

左旋:

//   node                     x
//  /        左旋转         /  
// T1   x   --------->   node   T3
//     /               /   
//    T2 T3            T1   T2
private Node leftRotate(Node node){

	Node x = node.right;

	// 左旋转
	node.right = x.left;
	x.left = node;

	x.color = node.color;
	node.color = RED;

	return x;
}

  红黑树的左旋和前面讲的AVL树左旋是相同的,只是有关于颜色的变化,想象2-3树添加场景,一个新节点添加到2节点,变成3节点

PS:这里不维护颜色的正确,只是左旋,颜色的维护在add()

颜色反转:往3节点添加一个更大的值,66添加到37-42

Java数据结构和算法(八)--红黑树与2-3树

现在把节点66添加进来,对于二叉搜索树来说,会形成上面的结构

这样对于2-3树的场景:往3节点添加元素

Java数据结构和算法(八)--红黑树与2-3树

这时候,节点42需要向上融合,所以42应该是红色的,所以需要把节点42设置为红色

Java数据结构和算法(八)--红黑树与2-3树

而红黑树的规则是:节点为红色,其两个子节点肯定是黑色的,所以有了上面的转变,也叫做颜色翻转,flipColors

//颜色翻转
private Node flipColors(Node node) {
	node.color = RED;
	node.left.color = BLACK;
	node.right.color = BLACK;
	return node;
}

右旋:往3节点添加一个更小的值,26添加到37-42

Java数据结构和算法(八)--红黑树与2-3树

  这种情况,自行对比2-3树场景,从(3)右旋,37的颜色要等于之前42的颜色为黑色,为了表示他们三个之前是一个4节点,所以42节点要变成

红色,右旋结束,然后进行颜色反转

//     node                   x
//    /        右旋转       /  
//   x    T2   ------->   y   node
//  /                        /  
// y  T1                     T1  T2
private Node rightRotate(Node node){

	Node x = node.left;

	// 右旋转
	node.left = x.right;
	x.right = node;

	x.color = node.color;
	node.color = RED;   //因为这种情况相当于形成4节点,所以需要设置为红色

	return x;
}

我们上面讲述了左旋、右旋、颜色反转,分别对应着2-3树中:2节点添加、3节点添加更大的数据,3节点添加更小的值

如果往3节点添加一个中间值:例如40添加到37-42

Java数据结构和算法(八)--红黑树与2-3树

这种情况相当于:左旋+右旋+颜色反转,是最复杂的添加场景

可以包含上面讲的所有场景了,参考虚线描述,只是省略部分步骤,同样适用添加到2节点

红黑树添加元素:

// 向以node为根的红黑树中插入元素(key, value),递归算法
// 返回插入新节点后红黑树的根
private Node add(Node node, K key, V value){

	if(node == null){
		size ++;
		return new Node(key, value); // 默认插入红色节点
	}

	if(key.compareTo(node.key) < 0)
		node.left = add(node.left, key, value);
	else if(key.compareTo(node.key) > 0)
		node.right = add(node.right, key, value);
	else // key.compareTo(node.key) == 0
		node.value = value;

	if (isRed(node.right) && !isRed(node.left))  //右子节点为红色,左子节点为黑色
		node = leftRotate(node);

	if (isRed(node.left) && isRed(node.left.left))  //左子节点为红色,左子节点的左子节点为红色
		node = rightRotate(node);

	if (isRed(node.left) && isRed(node.right))  //左右子节点都是红色,惊醒颜色反转
		flipColors(node);

	return node;
}

左旋、右旋、颜色反转,这个顺序对应着上面的图

完整的RBTree.java代码:

public class RBTree<K extends Comparable<K>, V> {

    private static final boolean RED = true;
    private static final boolean BLACK = false;

    private class Node{
        public K key;
        public V value;
        public Node left, right;
        public boolean color;

        public Node(K key, V value){
            this.key = key;
            this.value = value;
            left = null;
            right = null;
            color = RED;
        }
    }

    private Node root;
    private int size;

    public RBTree(){
        root = null;
        size = 0;
    }

    public int getSize(){
        return size;
    }

    public boolean isEmpty(){
        return size == 0;
    }

    // 判断节点node的颜色
    private boolean isRed(Node node){
        if(node == null)
            return BLACK;
        return node.color;
    }

    //   node                     x
    //  /        左旋转         /  
    // T1   x   --------->   node   T3
    //     /               /   
    //    T2 T3            T1   T2
    private Node leftRotate(Node node){

        Node x = node.right;

        // 左旋转
        node.right = x.left;
        x.left = node;

        x.color = node.color;
        node.color = RED;

        return x;
    }

    //     node                   x
    //    /        右旋转       /  
    //   x    T2   ------->   y   node
    //  /                        /  
    // y  T1                     T1  T2
    private Node rightRotate(Node node){

        Node x = node.left;

        // 右旋转
        node.left = x.right;
        x.right = node;

        x.color = node.color;
        node.color = RED;

        return x;
    }

    // 颜色翻转
    private void flipColors(Node node){

        node.color = RED;
        node.left.color = BLACK;
        node.right.color = BLACK;
    }

    // 向红黑树中添加新的元素(key, value)
    public void add(K key, V value){
        root = add(root, key, value);
        root.color = BLACK; // 最终根节点为黑色节点
    }

    // 向以node为根的红黑树中插入元素(key, value),递归算法
    // 返回插入新节点后红黑树的根
    private Node add(Node node, K key, V value){

        if(node == null){
            size ++;
            return new Node(key, value); // 默认插入红色节点
        }

        if(key.compareTo(node.key) < 0)
            node.left = add(node.left, key, value);
        else if(key.compareTo(node.key) > 0)
            node.right = add(node.right, key, value);
        else // key.compareTo(node.key) == 0
            node.value = value;

        if (isRed(node.right) && !isRed(node.left))
            node = leftRotate(node);

        if (isRed(node.left) && isRed(node.left.left))
            node = rightRotate(node);

        if (isRed(node.left) && isRed(node.right))
            flipColors(node);

        return node;
    }

    // 返回以node为根节点的二分搜索树中,key所在的节点
    private Node getNode(Node node, K key){

        if(node == null)
            return null;

        if(key.equals(node.key))
            return node;
        else if(key.compareTo(node.key) < 0)
            return getNode(node.left, key);
        else // if(key.compareTo(node.key) > 0)
            return getNode(node.right, key);
    }

    public boolean contains(K key){
        return getNode(root, key) != null;
    }

    public V get(K key){

        Node node = getNode(root, key);
        return node == null ? null : node.value;
    }

    public void set(K key, V newValue){
        Node node = getNode(root, key);
        if(node == null)
            throw new IllegalArgumentException(key + " doesn't exist!");

        node.value = newValue;
    }

    // 返回以node为根的二分搜索树的最小值所在的节点
    private Node minimum(Node node){
        if(node.left == null)
            return node;
        return minimum(node.left);
    }

}

红黑树、AVL树、二分搜索树对比:

一共有三个测试:测试二分搜索树、 AVL树、红黑树的效率

Main.java:具体代码在上面GitHub地址

把英文版傲慢与偏见写入list,测试

for (String word : words) {
	if (bst.contains(word))
		bst.set(word, bst.get(word) + 1);
	else
		bst.add(word, 1);
}

for(String word: words)
	bst.contains(word);
输出结果:
BST: 0.130161098 s
AVL: 0.124234987 s
rbTree: 0.11852221 s

BST: 0.137865554 s
AVL: 0.120124769 s
rbTree: 0.13707878 s

BST: 0.143397424 s
AVL: 0.153158411 s
rbTree: 0.146772639 s

测试代码运行三次,我们看到三者差距并不大

1、在数据量不大的情况下,并不是时间复杂度更低的数据结构,效率一定更高

2、set()、contains()、get()几乎都是查询,红黑树的优势在于添加和查询

Main2.java:

int n = 20000000;

Random random = new Random(n);
ArrayList<Integer> testData = new ArrayList<>(n);
for(int i = 0 ; i < n ; i ++)
	testData.add(random.nextInt(Integer.MAX_VALUE));

BST<Integer, Integer> bst = new BST<>();
for (Integer x: testData)
	bst.add(x, null);

生成两千万个随机数,添加到list,然后分别添加到二分搜索树、AVL树、红黑树

输出结果:
BST: 53.912429302 s
AVL: 52.037609212 s
RBTree: 50.485452955 s

这里可以看到RBTree想对来说添加效率想对更高一点,但是由于测试时间太长,就测试一次,可能准确性可能不够,大家可以自行测试一下

Main3.java:

int n = 20000000;

ArrayList<Integer> testData = new ArrayList<>(n);
for(int i = 0 ; i < n ; i ++)
	testData.add(i);

这里和第二个测试区别就是添加有序数据,我们知道二分搜索树对于有序、倒序插入,就会退化为链表,所以这里只测试AVL树和红黑树

输出结果:
AVL: 8.990460311 s
RBTree: 6.297460938 s

AVL: 8.462381117 s
RBTree: 8.074237092 s

AVL: 10.381852688 s
RBTree: 6.812257725 s

总结:

  1、对于随机数据,二分搜索树很好用,但是有序数据,会退化成链表,处于高度不平衡状态

  2、AVL树是完全平衡的,适合查询的场景,例如get()、set()、contains()

  3、红黑树不是平衡二叉树,统计性能更优(综合CURD操作),适合add()、del()