树和二叉树#

所有的测试代码都在博客首页中的 java-study-demo 中找到。

1
root(树形结构)
2
    二叉树
3
        概念
4
            定义
5
            存储结构
6
        操作
7
            三种遍历
8
            线索二叉树
9
        应用
10
            并查集
11
            哈夫曼树
12
    树和森林
13
        概念
14
            定义
15
            存储结构
16
        操作
17
            与二叉树的转换
18
            遍历
19
        应用
20
            并查集

树的基本概念#

树是 n(n >= 0) 个结点的有限集。当 n = 0 的时候，称为空树，在任何一个非空树中应该满足：

有且只有一个特定的称为根的结点。
当 n > 1 时，其余结点可以分为 m(m > 0) 个互不相交的有限集 T1,T2,T3,……,Tm，其中每个结合本身又是一棵树，并成为根的子树。

显然，树的定义是递归的，即在树的定义中又用到了其自身，树作为一种逻辑结构，同时也是一种分层结构，具有两个特点

树的根结点没有前驱，根结点外的所有结点有且只有一个前驱。
树中的所有所有结点都可以有零个或多个前驱。

因为树中的某个节点（除根结点外）最多只和上一层的一个结点有直接关系，根结点没有直接上层结点，所有n个结点的树有 n - 1 条边，而且每个结点与其下一层的零个或多个结点（即子女结点）都有直接关系。

基本术语#

树的树形表示

首先观察结点K，根A到K的唯一路径到的任意点，称为结点K的祖先，即A、B、E都是K的祖先。而E是路径上最接近K的祖先，所以称E为K的双亲，而K是E的孩子。
有相同双亲结点称为兄弟，如K和L都有共同的双亲E，即K和L为兄弟结点。
树中一个结点的孩子总数称为该结点的度，树中结点最大的度称为树的度，如结点B的度为2，D的度为3，树的度为3.
度大于0的结点称为分支结点（又称非终端结点），度为0的结点为叶子结点（又称终端结点）。
结点的层次从根结点开始，根结点为第一层，它的子结点为第二层，以此类推。双亲在同一层的结点互为堂兄弟，如G和E、F、H、I、J互为堂兄弟。
结点的深度是从根结点开始自顶向下逐层累加，结点的高度从叶子结点开始自底向上逐层累加。树的高度或深度是树中结点的最大深度。
有序树和无序树。树中的结点从左到右是有次序的，不能互换被称为有序树。否则称为无序树。
路径和路径长度。树中的两个结点之间的路径是由这两个结点之间所经过的的结点序列构成的，而路径长度是路径上所经过的边的个数。
树的分支是有向的，从双亲结点指向子结点。
森林。森林是m（m>=0）颗互不相交的树的集合。森里只要把所有树的根结点去除就成了森林，相反，只要给m颗树独立的树添加一个根结点，森林就成了树。

基本性质#

树中的结点数等于所有结点的度之和加一。
度为m的树第i层上至多有m^i-1^个结点（i>=1）。
高度为h的m叉树至多有 (m^h^-1)/(m-1)个结点。
具有n个结点的m叉树的最小高度为⌈logm(n(m-1)+1)⌉。

二叉树#

二叉树是一种特殊的树形结构，其特点就是每个结点至多只有两颗子树，即不存在度大于2的结点，而且二叉树是有序树，左右结点次序不能随意颠倒。二叉树的递归定义是或为空二叉树，或为一个根结点和两个互不相交的被称为根的左子树和右子树组成，左子树和右子树分别又是一颗二叉树。

二叉树是特殊的度为二的有序树，度为2的有序树至少有三个结点，而二叉树可以为空。度为二的有序树左右次序是对于另一个孩子而言的，若某个节点只有一个孩子，则这个孩子就无需区分其左右次序，而二叉树无论孩子个数是否为2，均需要确定其左右次序。

几种特殊的二叉树#

完全二叉树和满二叉树

完全二叉树：高度为h，有n个结点的二叉树，当且仅当每个结点都与高度为h的满二叉树中编号为1～n的结点一一对应称为完全二叉树。
- 若 i <= ⌊n/2⌋，则i为分支结点，否则为叶子结点。
- 叶子结点只可能在层数最大的两层出现，并且最大层出现的叶子结点应该依次排列在该层的最左边的位置。
- 若有度为1的结点，则只可能有一个，且该结点，且该结点只有左孩子。
- 按照层序编号后，一旦出现结点为叶子结点或者只有左孩子，则编号大于i的结点均为叶子结点。
- 若n为奇数，则每个分支结点都有左右孩子，若n为偶数，则编号n/2的结点只有左孩子。
满二叉树：一个高度为h，且含有2^h^-1个结点的二叉树称为满二叉树，即每层都是最多的结点。按照层序排序后，对于编号为i的结点，若有双亲则双亲为⌊i/2⌋，若有左孩子，则左孩子为 2i，若有右孩子，有孩子为 2i+1。
二叉排序树：左子树上所有的结点的关键字均小于更结点的关键字；右子树上的所有结点句大于根结点的关键字，左右子树分别又各是一颗二叉排序树。
平衡二叉树：树上任意一个结点的左子树和右子树的深度之差不超过1。

二叉树的性质#

非空二叉树的叶子结点数等于度为2的结点树加一，即 n0=n2 + 1。
非空二叉树上第k层上至多有 2~~k-1~~ 个结点。
高度为h的二叉树至多有 2^k^-1 个结点，h >= 1.
结点所在的深度为 ⌊log2n⌋ + 1。
具有n个（n>0）结点的完全二叉树的高度为 ⌈log2(n + 1)⌉ 或 ⌊log2n⌋ + 1。

二叉树的存储#

顺序存储#

二叉树的顺序存储是指用一组地址连续的存储单元依次自上而下、自左至右完全存储二叉树的所有结点元素。根据二叉树的性质，完全二叉树和满二叉树采用顺序结构比较合适，树中结点的序号可以唯一的反应结点之间的逻辑结构，这样既能最大可能的节省存储空间，又能利用数组元素的下标确定结点的位置以及结点的关系。如果是一般的二叉树为了让数组下标反应二叉树中结点之间的逻辑关系，只能添加一些并不存在空结点，让其每个结点与完全二叉树的结点相对照，如果最坏的情况高度为h且之后h个结点的单枝树却要占据 2^h^ - 1 个单元。

需要注意的是，顺序存储需要从数组下标1开始存储树中的结点，否则一些性质则无法满足。

链式存储#

由于顺序存储的空间利用率较低，因此二叉树一般都是采用链式存储，在二叉树中结点通常包含数据域和指针域，二叉链表就必须包含数据域 data、左指针域 lchild 和右指针域 rchild。

1
import lombok.Getter;
2
import lombok.Setter;
3

4
/**
5
 * @description 二叉树的链式存储
6
 */
7
@Getter
8
@Setter
9
public class BiTree<E> {
10

11
    /**
12
     * 数据域
13
     */
14
    E data;
15
    /**
16
     * 左孩子指针
17
     */
18
    BiTree<E> leftChild;
19
    /**
20
     * 右孩子指针
21
     */
22
    BiTree<E> rightChild;
23

24
    /**
25
     * 初始化方法
26
     * @param data 数据域
27
     */
28
    public BiTree(E data) {
29
        this.data = data;
30
    }
31

32
}

二叉树的遍历#

二叉树中的遍历是指按某条搜索路径访问树中的每个结点，使得每个结点均被访问一次，而且仅被访问一次，而且仅被访问一次。由于二叉树是一种非线性结构，每个结点都可以能有两个子树，因而需要寻找一种规律以便使二叉树的结点能排列在一个线性队列上，方便遍历。我们根据二叉树的定义，遍历一颗二叉树要决定对根和左右结点的访问顺序，常见的遍历次序是先序、中序和后序三种，其中的序是指根结点在何时被访问。

二叉树的三种遍历顺序

::: normal-demo Java 利用递归实现二叉树三种遍历

1
package com.sbc.structure.tree;
2

3
import org.junit.jupiter.api.BeforeEach;
4
import org.junit.jupiter.api.Test;
5

6
/**
7
 * @author songbaicheng
8
 * @description 二叉树遍历类测试
9
 * @date 2023/8/15 20:14
10
 */
11
class BiTreeTest {
12

13
    BiTree<Integer> root = new BiTree<>(1);
14

15
    @BeforeEach
16
    void setUp() {
17

18
        // 初始化二叉树
19
        final BiTree<Integer> l7 = new BiTree<>(7);
20
        final BiTree<Integer> r3 = new BiTree<>(3);
21
        final BiTree<Integer> l4 = new BiTree<>(4);
22
        final BiTree<Integer> l9 = new BiTree<>(9);
23
        final BiTree<Integer> r6 = new BiTree<>(6);
24
        final BiTree<Integer> l8 = new BiTree<>(8);
25

26
        l4.setRightChild(l8);
27
        l7.setLeftChild(l4);
28
        l7.setRightChild(l9);
29
        r3.setLeftChild(r6);
30
        root.setLeftChild(l7);
31
        root.setRightChild(r3);
32
    }
33

34
    /**
35
     * 前序遍历：
36
     * 1,7,4,8,9,3,6,
37
     * 中序遍历：
38
     * 4,8,7,9,1,6,3,
39
     * 后序遍历
40
     * 8,4,9,7,6,3,1,
41
     */
42
    @Test
43
    void test() {
44
        System.out.println("前序遍历：");
45
        preOrder(root);
46
        System.out.println("\n中序遍历：");
47
        inOrder(root);
48
        System.out.println("\n后序遍历");
49
        postOrder(root);
50
        System.out.println();
51
    }
52

53
    /**
54
     * 前序遍历
55
     * @param tree 遍历二叉树
56
     */
57
    private void preOrder(BiTree<Integer> tree) {
58
        if (tree != null) {
59
            System.out.print(tree.data + ",");
60
            preOrder(tree.leftChild);
61
            preOrder(tree.rightChild);
62
        }
63
    }
64

65
    /**
66
     * 中序遍历
67
     * @param tree 遍历二叉树
68
     */
69
    private void inOrder(BiTree<Integer> tree) {
70
        if (tree != null) {
71
            inOrder(tree.leftChild);
72
            System.out.print(tree.data + ",");
73
            inOrder(tree.rightChild);
74
        }
75
    }
76

77
    /**
78
     * 后序遍历
79
     * @param tree 遍历二叉树
80
     */
81
    private void postOrder(BiTree<Integer> tree) {
82
        if (tree != null) {
83
            postOrder(tree.leftChild);
84
            postOrder(tree.rightChild);
85
            System.out.print(tree.data + ",");
86
        }
87
    }
88

89
}

:::

递归的巧妙确实让我们省略了很多代码，可是在我们享受这种便利的时候，同样也徒增了很多次计算的消耗，每次扫描叶子结点的时候总会将其父母结点重新计算一次，在一些特殊情况中非常浪费性能，尤其是递归中经典的斐波那契数列中，如果追求更高的时间复杂度，我们会采取非递归的方式新增一个标记记录每一次计算出的值来减少多次计算的消耗，所以这里也借助栈来实现二叉树的中序遍历：

::: normal-demo 非递归实现中序遍历

1
/**
2
* 非递归中序遍历
3
*
4
* @param tree 遍历二叉树
5
*/
6
private void inOrderByStack(BiTree<Integer> tree) {
7

8
    final LinkedStack<BiTree<Integer>> stack = new LinkedStack<>();
9
    BiTree<Integer> root = tree;
10

11
    while (root != null || !stack.empty()) {
12
        if (root != null) {
13
            // 一路向左
14
            stack.push(root);
15
            root = root.leftChild;
16
        } else {
17
            // 出栈并开始转向出栈的右子树
18
            root = stack.pop();
19
            System.out.print(root.data + ",");
20
            root = root.rightChild;
21
        }
22
    }
23
}

:::

由遍历序列构造二叉树#

我们先由二叉树的先序序列和中序序列来唯一确定一颗二叉树，在先序遍历序列中，第一个结点一定是二叉树的根结点，而在中序遍历中，根结点一定在讲中序序列分割为两个子序列，根据这两个子序列在先序序列中根据同样的规律找到左右子树的根结点，依次递归下去就能唯一确定这颗二叉树，同理，二叉树的后序序例和中序序列也可以诶唯一确定二叉树、层序遍历和中序序列也可以唯一确定二叉树，但是先序序列和后续序列不能确定。

线索二叉树#

遍历二叉树是以一定的规则将二叉树中的结点排列成一个线性序列，只能体现一种父子关系，不能直接得到结点在遍历中的前驱和后继。如果我们把二叉树中的空指针结点存放指向其前驱或者后继的指针，可以像遍历单链表那样方便的遍历二叉树，加快了查找结点前驱和后继的速度，这也就是二叉排序树，规定每个结点若无左子树，令lchild指向其前驱结点，若无右子树，令rchild指向其后继结点，并且需要增加两个标识域标识指针域，以指向左右孩子或者前驱后继，标识为0则表示为左右孩子，如果是1则代表是前驱或者后继。

树、森林#

树的存储结构#

树的存储结构有很多，即可采用顺序存储结构，又可采用链式存储结构，但无论采用何种存储方式，都要求能唯一的反应树中各个节点之间的逻辑关系，下面是三种常见的存储结构。

双亲表示法#

采用一组连续空间来存储每个结点，同时在每个结点中增设一个伪指针，指示双亲结点在数组中的位置，根结点下标为0，其尾指针域为-1.

双亲表示法

孩子表示法#

将每个结点的孩子结点都用单链表链接起来形成一个线性结构，此时 n 个结点就有 n 个孩子链表（叶子结点的孩子链表为空表）。

孩子表示法

孩子兄弟表示法#

即以二叉链表作为树的存储结构，使每个结点包括三部分内容：结点值、指向结点第一个孩子结点的指针，以及指向结点在一个兄弟结点的指针。

孩子兄弟表示法

树、森林与二叉树的转换#

树转换为二叉树的规则：每个结点左指针指向它的第一个孩子，右指针指向它在树中的相临右兄弟，这个规矩也叫左孩子右兄弟，其规则也正如上面的孩子兄弟表示法图所示。

森林转换成二叉树的规则：把下一棵树转化为上一棵树的右兄弟，其他和树转化二叉树的规则相同。

树和森林的遍历#

树的遍历是指用某种方式访问树的每个结点，且仅访问一次，主要有先根遍历和后根遍历两种方式：

先根遍历：先访问根结点，再依次遍历根结点的每棵子树，遍历子树时仍遵循先根后子树的规则。
后根遍历：先依次遍历根结点的每棵子树，再访问根结点，遍历子树时仍遵循先子树后根的规则。

森林的两种遍历方式：

先序遍历森林
1. 访问森心的第一棵树的根结点
2. 先序遍历第一棵树中根结点的子树森林。
3. 先序遍历除去第一棵树之后剩余树构成的森林。
中序遍历森林
1. 中序遍历森里中第一棵子树的根结点的子树森林。
2. 访问第一棵树的根结点。
3. 中序遍历去除第一棵树之后剩余树构成的森林。