请分析表空间数据页和跨数据页的索引排列方式

请分析表空间数据页和跨数据页的索引排列方式
包括页内索引和跨页索引B+

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
谐云谐云官方账号 2023-10-31 14:55
关注
一个页内部的索引，通常是一个链表结构，一个元素指向下一个元素，单调递增。其中单个页中包含

● infimum：代表索引最小的值，即链表头

● supremum: 代表索引最大的值，即链表尾

如果一个 page 中一共有 n 的索引，那么为了找到一个索引，只是通过链表的结构从infimum 到supremum，最大的时间复杂度就需要 O(n)，为了提高单个 page 中的索引的查询数据。引入了一个叫 page directory 的数据结构，有一块专门的物理区域存放，也可以叫做页目录。

这个算法的原理是这样的：

首先对索引进行分组，每一组叫数据槽 slots，其中 owned 为组中的索引数量，记录在该组的最后一个索引中，并且page directory 中记录的地址也是最后一个索引的地址。

如下图中 infimum 为第一组，索引数 1；中间每组索引数为 4；最后一组 supremum 索引数为 5；一共有 7 个 slot.

然后就可以通过对 page directory 二分法定位索引，时间复杂度为O(logN)

先定位到中间的 slot 末尾索引地址，对比索引值大小

如果需要查询的索引值大于它，则从当前 slot 和最后一个 slots 取中间 slot 的索引进行对比

如果需要查询的索引值小于它，则从当前 slot 和第一个 slots 取中间 slot 的索引进行对比

直到上下界限的 slot 相等，然后从末尾索引开始往前定位，直到找到相等的索引

可以通过page-directory-summary 查看当前索引页的 page-directory 信息，可以看出infimum 索引数固定为 1，中间 slot 索引数为 4，最后的supremum 为 4~7 之间，这里为 7.

0 99 infimum 1 1 210 conventional 4 () 2 112 supremum 7

跨页索引-B+树

页外就是我们常见的 B+树模型了，一个页只有 16k，存储的数据有限，当我们插入大量的数据时，会发生什么事情呢？

尝试不断往测试表中插入数据，当前已经插入 1897 条记录。

mysql> select count(*) from test.user; +----------+ | count(*) | +----------+ | 1897 | +----------+ 1 row in set (0.00 sec)

此时观察索引页数量，已经由原来的 1 个变成了6 个，这代表树开始进行分裂。

[root@sky data]# innodb_space -f test/user.ibd space-summary page type prev next lsn 0 FSP_HDR 0 0 12511818 1 IBUF_BITMAP 0 0 12218171 2 INODE 0 0 12511818 3 INDEX 0 0 12511818 4 INDEX 0 5 12400985 5 INDEX 4 6 12455415 6 INDEX 5 7 12511818 7 INDEX 6 8 12511818 8 INDEX 7 0 12515126 9 ALLOCATED 0 0 0

通过index-digraphdigraph 命令打印出当前的索引结构。从以下打印出的内容中，可以当前 b+树已经分裂成 8 个树。

其中根节点是 page_3，其他 5 个节点是叶子树，这是一个二级的 B+树。

[root@sky data]# innodb_space -s ./ibdata1 -T test/user -I PRIMARY index-digraph digraph btree { rankdir = LR; ranksep = 2.0; page_3 [ shape = 'record'; label = '<page>Page 3|(5 records)|<dir_4>(#<struct Innodb::Page::Index::FieldDescriptor name="id", type="INT UNSIGNED", value=1, extern=nil>)|...]; page_3:dir_4 → page_4:page:nw; page_4 [ shape = 'record'; label = '<page>Page 4|(267 records)'; ]; page_3:dir_5 → page_5:page:nw; page_5 [ shape = 'record'; label = '<page>Page 5|(534 records)'; ]; page_3:dir_6 → page_6:page:nw; page_6 [ shape = 'record'; label = '<page>Page 6|(534 records)'; ]; page_3:dir_7 → page_7:page:nw; page_7 [ shape = 'record'; label = '<page>Page 7|(534 records)'; ]; page_3:dir_8 → page_8:page:nw; page_8 [ shape = 'record'; label = '<page>Page 8|(28 records)'; ]; }

通过page-records 命令查看每一页的数据(由于记录太多, 我这边只记录关键的一些输出,

root@sky data]# innodb_space -s ./ibdata1 -T test/user -p 3 page-records Record 125: (id=1) → #4 Record 138: (id=268) → #5 Record 151: (id=802) → #6 Record 164: (id=1336) → #7 Record 177: (id=1870) → #8 [root@sky data]# innodb_space -s ./ibdata1 -T test/user -p 4 page-records Record 126: (id=1) → (name="1", create_time="2023-07-23 14:07:16") ... Record 7574: (id=267) → (name="1", create_time="2023-07-26 12:57:35") [root@sky data]# innodb_space -s ./ibdata1 -T test/user -p 4 page-records Record 126: (id=268) → (name="1", create_time="2023-07-26 12:57:35") ... Record 15050: (id=801) → (name="1", create_time="2023-07-26 12:57:58") ...

通过上面的命令可以判断出当前的 B+树模型为下图所示。

那么当我们需要通过索引寻找数据时

首先从根索引开始查找，当然页内部会通过 page directory 机制进行查找

当发现索引位于某 2 个索引区间，获取起始区间的索引中记录的下一个子树的地址，并且开始查找下一个子树

子树内部依然通过page directory 机制进行查找，这里由于只有二级，所以就能直接找到索引，如果有更多级，则继续迭代往子树查找。

MYSQL 常规的 B+树模型分布可以参考下图。

● infimum 和 supremun 记录每页中的最小记录和最大记录

● 非叶子节点中的索引记录的是下一个页的地址，叶子节点的行记录直接跟在索引后面(聚簇索引)

● 定位索引需要从一级一级往下进行定位
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

数据的存储结构不仅有顺序存储结构和链式存储结构，还有索引结构与散列结构数据结构算法链表
2023-02-17 08:27

回答 2 已采纳数据的四种基本存储结构是顺序存储结构和链式存储结构，还有索引结构与散列结构。文字游戏而已，这几种数据结构是基本和主要的存储结构。还有些其他的数据结构，如图存储结构等。望采纳
c语言数据结构词索引表出了点问题，谁能帮忙看看呀数据结构
2017-11-29 11:55

回答 3 已采纳用代码插入功能啊，指出哪一个函数有问题
MySql数据表查询不走索引 mysql 数据库有问必答
2021-11-24 10:05

回答 2 已采纳因为你是sql语句有like，只要有like可能不会走索引查询，like语句要使索引生效，like后不能以%开始，也就是说 (like %字段名%) 、(like %字段名)这类语句会使索引失效，而(
计算机大数据分析与云计算网络技术研究.docx
2022-11-04 10:08

大数据的基本特征是大量数据的处理和分析，包含结构化数据和非结构化数据，已经到了常规数据统计分析软件不能对其进行有效整理、分析和管理的程度，是各类数据信息的集合。 云计算技术是计算机软件技术发展到一定...
请问用pandas将时间设为索引后，绘图该如何获取数据？ python 数据分析
2021-12-19 16:31

回答 1 已采纳 df.index()
数据分析的话，sql需要学习到什么程度啊 mysql 数据分析数据库
2022-10-25 09:44

回答 3 已采纳增删改查，聚合函数，分组，递归，连表，集合，存储引擎，优化，索引这些应该是都用得到的
索引和索引组织表的理解
2018-02-06 08:35

回答 4 已采纳 https://wenku.baidu.com/view/cb5c8dc39fc3d5bbfd0a79563c1ec5da50e2d60f.html
4.Python数据分析—数据分析入门知识图谱&索引(知识体系下篇)
2024-03-28 10:23

以山河作礼。的博客监督学习的核心在于使用带有标签的训练数据来训练模型，以便模型能够学习输入到输出之间的映射关系。在这个过程中，算法会尝试找到一个最优的模型，使得对于新的输入数据，能够预测出正确的输出。监督学习的应用...
请问如何将第一行dataframe数据设置为列索引？而不使用默认索引 python 数据挖掘
2020-04-07 15:55

回答 1 已采纳 data.columns=data.iloc[0].values data=data.drop(0) data=data.reset_index(drop=True)
python数据分析与挖掘实战第三章箱线图绘制像素超出范围 python 数据分析有问必答
2021-12-22 21:36

回答 1 已采纳这个应该matplotlib版本导致的，你看看书本的matplotlib版本和你版本是不是一样，然后将matplotlib版本降到你书本版本试试
MySQL索引调优及数据表维护 mysql
2023-03-14 17:02

回答 2 已采纳每个字段都有有效字段 - 是否是每个字段不为空的意思？如果是的话建议赋初始值，保证 insert or update 操作不报错，如果对数据非常敏感，不建议赋初始值；每个字段长度 - 建议根据实际业务
云计算和大数据处理
2024-05-22 21:01

有请小发菜的博客 云计算提供了一种通过互联网访问计算资源（如服务器、存储、数据库、网络、软件等）的模式，这些资源可以迅速提供和释放，通常按使用量计费。大数据处理是指收集、存储、管理和分析大量复杂数据集的过程。
求教,数据库数据往solr索引中添加数据问题 solr 数据库
2017-04-24 06:23

回答 1 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201704/24/1493014764_166044.png)报的这种错
索引存储结构是在存储数据（称为主数据表）的同时，还建立附加的索引表
2022-02-28 23:52

Bol5261的博客在数据库中，索引是一种数据结构，用于加速对数据的检索操作。当我们在一个表（主数据表）中存储数据时，通过建立索引，可以更快地查找、排序和过滤数据。
关于空间索引的一个ppt
2011-05-06 16:56

总的来说，空间索引是GIS系统中不可或缺的一部分，它解决了在大规模空间数据中进行高效查询和分析的挑战，为地理空间数据的管理和应用提供了强大支持。随着大数据和云计算的发展，空间索引技术也在不断演进，以适应...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月31日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

请分析表空间数据页和跨数据页的索引排列方式

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新