红黑树
从二叉平衡树到红黑树
如果在一棵普通的二叉树上查找搜索某个元素结点,每一个节点都需要遍历,需要 O(n) 的时间复杂度。
为了提高搜素效率,可以在二叉树的左子节点,根节点,右子节点这三个节点中,维护他们的关系,于是有了二叉搜索树(BST)。
二叉搜索树的性质如下:
若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值
若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值
它的左、右子树也分别为二叉排序树
BST 搜索的时间复杂度为 $O(\log n)$,但是构造 BST 时如果不加约束,容易退化为链表,查询效率变为 $O(n)$。
BST 插入节点时直接根据叶子节点的大小对比,找到合适的位置,加入即可。
一棵对查询友好的二叉树,应该是一个平衡或者接近平衡的二叉树,平衡二叉搜索树(Balanced BST)的核心目标是通过约束树的结构,保证操作(查找、插入、删除)的时间复杂度稳定在 $O(\log n)$。
常见的平衡搜索树,如 AVL 树,引入自平衡机制,保证每个节点的左右子树高度差(平衡因子)绝对值不超过1。但该平衡过程需要额外 $O(\log n)$ 时间维护平衡。
另一种平衡搜索树,红黑树,通过旋转+颜色调整维护平衡,比 AVL 树旋转次数更少,维护成本稍低。树的高度至多为 $2log(n+1)$,查询效率略逊于 AVL 树,但更新更快。
红黑树
RB 树通过颜色标记(红/黑)和规则约束,保证树的高度近似平衡,具有以下特性:
每个节点或者是黑色,或者是红色
根节点和叶子节点都是黑色(这里的叶子节点指为空(NULL)的叶子节点)
红色节点的父节点是黑色节点(说明红色节点的父节点,左子节点,右子节点都只能是黑色节点,红色与红色不能直接相连,而黑色节点不管红黑节点都可以直接相连)
从一个节点到该节点的子孙节点的所有简单路径上包含相同数目的黑节点(也称为黑平衡)
由性质 3 和 4 共同决定了:最长的路径的节点总数量不会超过最短的路径的两倍,因此可以让红黑树不至于严重失衡。
红黑树平衡
红黑树是搜索二叉树,因此插入的时候,会先找到适合的位置先挂上,然后再调整,调整过程也称为平衡过程。
平衡过程有两点:
旋转:左旋和右旋
变色:黑变红,或红变黑
变色本身简单,需要结合旋转过程来看,变色是为了符合红黑树的几个特性,旋转如下图:

旋转后,其实二叉搜索树的左子节点小于根节点,根节点小于右子节点这个特性其实没有变,变化的是两个子树的高度。
右旋过程: X 是主角,X 右旋,具体为:X 旋转为其左子节点 Y 的右节点,这个时候 Y 有两个右子节点,之前的右子节点 b 需要送给 X 作为左节点。( X 之前的左节点是 Y)
Java 的 TreeMap 就是用红黑树实现的,可以看到右旋的代码:
左旋过程: Y 是主角,Y 左旋,具体为:Y 旋转为其右子节点 X 的左节点,这个时候 X 有两个左子节点,之前的左子节点 b 需要送给 Y 作为右节点。(Y 之前的左节点是 X)
左旋的代码也类似:
可以发现高度变化:
右旋:左子树高度 -1,右子树高度 +1
左旋:右子树高度 -1,左子树高度 +1
插入操作
红黑树的插入相较于二叉搜索树,多了平衡动作,包括旋转和变色。
新插入的节点,都使用红色,因为使用黑色,可能破坏性质 4,即改变路径黑节点数,破坏平衡,调整代价大,而使用红色,黑色节点数没变,只有在父节点是红色时才需要进一步调整,情况更可控。
假设插入的新节点是 C,当前平衡节点也是 C,假设它的父节点为 P,祖父节点为 GP,父节点的兄弟节点为叔叔节点 U。将 C 初始化为红色,插入的情况大致分为以下几种:
C 是根节点,要涂为黑色
C 的父节点是黑色,性质 3 和 4 都满足,不需要操作。
C 的父节点是红色,叔叔节点是红色的,将 C 的父节点 P 和 叔叔节点 U 涂成黑色,保证当前节点和上一层不是红色和红色相连,但是再往上到祖父节点需要作为新的平衡节点 C,递归处理。
C 的父节点是红色,C 的叔叔节点是黑色:
父节点和 C 是同一边:
父节点和当前节点 C 都是左子节点:以 GP 为主角右旋,将原来节点 P 涂黑,原来的 GP 涂成红色
父节点和当前节点 C 都是右子节点:以 GP 为主角左旋,将原来节点 P 涂黑,原来的 GP 涂成红色
父节点和 C 不是同一边:
父节点是左子节点,但是 C 是右子节点: 以 P 为主角左旋,左旋之后变成了 4.1.1 的情况,父节点和 C 都在左子节点,按照 4.1.1 情况继续处理。
父节点是右子节点,但是 C 是左子节点: 以 P 为主角右旋,右旋之后变成了 4.1.2 的情况,父节点和 C 都在右子节点,按照 4.1.2 情况继续处理。
代码可以参考 TreeMap 中的插入后平衡代码:
删除操作
二叉搜索树的删除
先看二叉搜素树的删除操作,根据节点的子节点情况分三种情况处理:
被删除节点是叶子节点:直接删除该节点,父节点对应指针置空。
被删除节点有一个子节点:将父节点指向被删除节点的子节点。
被删除节点有两个子节点:
找到右子树的最小节点,即后继节点(或左子树的最大节点,即前驱节点)
用该节点的值替换被删除节点的值
删除原最小/最大节点(该节点必为叶子或只有一个子节点,转化为前两种情况)
红黑树的删除
对于红黑树的删除,也是类似,先删除,再调整。对于那几个特性:
如果删除的是红色节点,没有影响
如果删除的是黑色节点,需要调整满足特性。
先看 Java 中 TreeMap 的删除过程:
删除节点时,分为三种情况:
该节点有两个子节点,需要找到后继节点(s),将其值复制到当前节点,并指向后继节点(此时当前节点 p 最多只有一个子树,即变成第二种情况)
该节点只有有一个子节点,直接将该子节点(即 replacement)替换到当前节点位置
该节点没有子节点,直接删除该节点
可以看出,删除的过程,主要涉及到三个节点:
待删除节点:需要删掉,但不是真的删掉,而是用顶替节点的值直接赋值
顶替节点:顶替节点用来顶替待删除节点,值被写到待删除节点的位置,但是它原来的位置需要删掉(只有左右子树都存在时才需要顶替节点)
顶替节点的候选节点:是顶替节点的左/右子节点,因为顶替节点的值被放到待删除节点中,因此,顶替节点需要被删除,需要候选节点顶上去。
其中寻找后继节点,即顶替节点的方法 successor(),后继节点是大于当前节点 t 的最小节点,也就是中序遍历中 t 的下一个节点。分为两种情况:
t 有右子树,后继一定是右子树中最左的节点(根据标准 BST 查找方式)。
t 没有右子树,要向上走找后继,因为当前节点 t 是某条路径中最右边的节点,后继不在它的右边了,只能在它祖先里比它大的那个。
代码解析如下:
可以看到,红黑树中找替代节点是使用的后继节点,没有使用前驱节点(predecessor),无论选择 successor 还是 predecessor 来替代待删除的节点,都能保持 BST 的有序性,这里红黑树实现偏向使用 successor。(可能因为后继节点最多一个右子节点,即无左子节点,处理逻辑简单)
还可以注意到,删除思路是不删除目标数据,而是找到目标数据的后继节点,然后把数据拷贝一份到目标数据进行覆盖。然后转而去删除后继,删除后再去修补平衡。
删除节点的时候,只有删除黑色节点才需要调整平衡,调整的思路是引入“双重黑”基本情况,通过旋转和重新着色,将双重黑节点逐步上移或消除。假设删除的后继节点是 x,x 是黑色节点,存在以下几种情况:
x 的兄弟 sib 是红色的
x 的兄弟 sib 是黑色的,且 sib 的两个子节点都是黑色
x 的兄弟 sib 是黑色的,sib 的左子节点是红色,右子节点是黑色(x 是其父节点的左子)
x 的兄弟 sib 是黑色的,且 sib 的右子节点是红色(x 是其父节点的左子)
另外还有情况 5/6,是当 x 是其父节点的右子时情况 3/4 的镜像对称。结合调整方法 fixAfterDeletion() 分析:
由于删除了一个黑色节点,树中某个路径“少了一个黑”,所以需要想办法把这个“黑色”通过借、旋、传递的方式补回来:
兄弟红色:先旋转结构(变成黑色情况);
兄弟黑色但无红子:传递黑色给父节点;
兄弟黑色,子结构不理想:先旋转变理想;
兄弟黑色,有红子:一次旋转彻底修复。
Last updated