从MySQL开始聊聊“树”结构 (上)

从MySQL开始聊聊“树”结构 (上)

前言

嗨喽,大家好,我是CrazyCodes, 近一年写的文章,都是一些广度方面的思考,新的一年,在技术深度上也需要有更多的探索,感谢各位的持续支持!

MySQL

从MySQL开始聊聊“树”结构 (上)

先聊聊大家熟知的MySQL,我们使用MySQL肯定是有数据存储的需求。

我们从基础开始看,首先我们创建一张用户表

CREATE TABLE `user` (
  `id` int unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(32) COLLATE utf8mb4_general_ci DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

这是一张简单的用户表,包含id和name两个字段,id为主键自增,name上没有索引。想必大家对索引都有一定的认识,索引是一种数据结构,即本篇的核心议题“树”结构,索引可以达到快速命中某条记录,“快速”一词代表着在时间和空间相结合的最优解,当然也并不代表索引越多,数据表设计越合理,要根据实际业务去选择。

我们随机向表中插入几条记录

INSERT INTO `user` VALUES(1,"Join");
INSERT INTO `user` VALUES(2,"Tom");
INSERT INTO `user` VALUES(3,"Jeein");

按照预期,数据库内出现三条对应的记录,这里我使用语句

SELECT * FROM `user`;

对数据进行查询

从MySQL开始聊聊“树”结构 (上)


看到这里,你可能说了,这是在讲什么,增删改查都是常识,有什么好讲的,那我们现在就正式进入正题,首先从插入记录开始说起,MySQL会使用B+树来存储数据记录,B+树是B树的延伸,而B树又是平衡二叉树的延伸,除了平衡二叉树还有二叉查找树,依次基于其概念延伸的排序,大概是如下这样

B+树 -> B树 -> 平衡二叉树 -> 二叉查找树 -> 二叉树 -> 树

当然也不仅仅是所有跟树有关的数据结构,这里为了提高学习树这种数据结构的兴趣,所以以MySQL讲起,纠其根源,再结合MySQL的数据记录将这一串知识链接起来,那我们把这个顺序倒过来依次讲起

树 -> 二叉树 -> 二叉查找树 -> 平衡二叉树 -> B树 -> B+树

我尽量不把这些数据结构讲成教科书的样子。

树🌲

从MySQL开始聊聊“树”结构 (上)


你要不知道树是什么玩意,就别继续看下去了😂,就是大街上我们看到的树,大街的树也就是我们常识认知的树,是通过“树根”、“树枝”和“树叶”组成,缺一样,这树也不是一颗完整的树。

那么数据结构中的树指的什么,你可以把手机或者电脑倒过来看上图,数据结构中的树,就是一个倒过来的树,并不是他非要倒过来才能说,而是根据人类正常的视觉与思维,就例如你看书总不能从最后一页的最后一个字开始从后往前读把,倒过来只是便于理解和阅读它罢了。

在数据结构中倒过来的树大概是张下面这个样子

倒树

从MySQL开始聊聊“树”结构 (上)

正树

从MySQL开始聊聊“树”结构 (上)

正树、倒树,都贴出来了,你可以尝试对比这两张图,看看那张图更容易理解,接下来的案例只会以倒树展示。

树是其他树型数据结构的基础,这里你必须要熟记一些基本概念

  • 树根,树的根节点
  • 子节点,树枝一、二、三是树根的子节点
  • 兄弟节点,树枝一、二、三互为兄弟节点
  • 父节点,树根是树枝一的父节点,树枝一是树枝1-1的父节点

相信根据上图多看几遍,这很容易理解

那我们生搬硬套,把MySQL的数据放到这个最简单的树中

从MySQL开始聊聊“树”结构 (上)


这是我随意摆放的,当然你想怎么摆就怎么摆,例如

从MySQL开始聊聊“树”结构 (上)


这看起来像跟棍,或者

从MySQL开始聊聊“树”结构 (上)


无论怎样,我们创建了一个树,那根据SQL语句

SELECT * FROM `user`;

我们需要查到根节点,这很简单,然后去判断根节点的左子节点是否有值,有的话取出来,右子节点也是一样的道理,这就是所谓的树的遍历。那么我们现在在SQL上加些条件

SELECT * FROM `user` WHERE `id` = 1;
从MySQL开始聊聊“树”结构 (上)

那这个条件,在树结构中如何查呢,到这里,你会发现一个问题

无论条件是什么,我们都需要遍历整棵树,遍历树的深度,完全取决于要查询的数据所在的位置,位置靠前,就少遍历些,位置靠后就多遍历下。

这里讲一个更基础的知识,时间复杂度,时间复杂度用于表示某个算法所计算的时间长度,那我们根据上面这个例子,可以分析出其平均时间复杂度为 O(n) , 当然最好的情况是 O(1) , 这种情况就是根节点就是我们要找的数据。

数据的不断增加,才使得我们无法继续使用最原始的数据结构,哎,都是数据逼得呀。

假设我们不仅仅有3条记录,而是在3000万条查找Join,恰巧还是第3000万条,那么如果使用最基本的树结构去查询的话,那么我们将要进行3000万去查询才可以获得最终结果。是不是感觉不切实际了?

其实这样的话,是不是树结构都不重要了,他可以是一个数组、链表或者队列等等,可以用任意数据结构去存储,当然每种数据结构的出现都有其存在的原因。那么我们使用原始树的结构感觉不靠谱,那么跟随我的文字来到二叉树的世界!

二叉树

从MySQL开始聊聊“树”结构 (上)

二叉树,顾名思义是只有两个叉的树,每个节点只有两个叉,这是它的特性,这时候你就疑问了,为啥不能是三叉树,四叉树,N叉树呢?当然可以有,那么我们举一个例子,我们再往user表内插几行数据

INSERT INTO `user` VALUES(4,"Jorr");
INSERT INTO `user` VALUES(5,"Queie");
INSERT INTO `user` VALUES(6,"Kioa");

现在我们库里有6条记录

从MySQL开始聊聊“树”结构 (上)


我们拿三叉树举例

从MySQL开始聊聊“树”结构 (上)


我把每个节点需要查询的次数列个表,这里我使用前序遍历树的方式,让你简单的清楚树有几叉意味着什么

tips :树有三种遍历方式,分别为 前序、中序、后序 ,根据具体需求使用不同的遍历方式

节点次数
1,join1
3,jeein2
5,queie3
6,kioa4
2,tom5
4,jorr6

如果是二叉树呢?

从MySQL开始聊聊“树”结构 (上)
节点次数
1,join1
3,jeein2
5,queie3
6,kioa4
2,tom5
4,jorr6

有没有很奇怪?无论几叉,查询4,jorr数据都需要6次,感觉用哪个都一样是不?并不是这样,你可以这样考虑一个问题,在使用程序去遍历这两棵树时,二叉树需要判断左右子节点,而三叉树则需要判断左中右三个节点,他们所在的内存空间不同,专业点说,他们的空间复杂度不同。

解答了你的一点点小疑惑后,我们回到正题,还是聊聊二叉树的事。

二叉树分为完全二叉树和不完全二叉树

  • 完全二叉树代表每个节点都有2个树枝(就是不缺胳膊少腿)
  • 不完全二叉树反之就是(缺胳膊少腿),某个树叉上可能只有左子树,没有右子树

上述展示了MySQL的数据生搬硬套放到二叉树中玩法,但你发现没?我们依旧无法避免树被全部遍历的问题。

思考

我将在下一篇文章讲述剩余的“几颗树”,这里我给你留一道思考题。

问题一:树和二叉树(N叉树)都无法避免遍历整棵树,那下一篇要讲的平衡二叉树为什么可以做到只需要遍历“半棵树”?

问题二:时间复杂度的表示方式 O(1) O(n) O(log2^n) 分别代表什么?

致谢

感谢你看到这里,2021 我会在思否发布自己电商设计的录播课,也是我首个录播课。

希望本篇文章可以帮助到你,谢谢。

原创文章,作者:CrazyCodes,如若转载,请注明出处:https://blog.fastrun.cn/2021/05/14/1-105/

(1)
上一篇 2021年5月3日 下午4:32
下一篇 2021年12月26日 下午8:56

相关推荐

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(2条)

  • uye
    uye 2021年10月25日 上午10:49

    高性能服务

  • 行星带
    行星带 2021年11月23日 下午2:22

    期待下一篇