概述
本質(zhì):數(shù)據(jù)庫維護(hù)某種數(shù)據(jù)結(jié)構(gòu)以某種方式引用(指向)數(shù)據(jù)
索引取舍原則:索引的結(jié)構(gòu)組織要盡量減少查找過程中磁盤I/O的存取次數(shù)
B樹
滿足的條件
d為大于1的一個(gè)正整數(shù),稱為B-Tree的度
h為一個(gè)正整數(shù),稱為B-Tree的高度
每個(gè)非葉子節(jié)點(diǎn)由n-1個(gè)key和n個(gè)指針組成,其中d《=n《=2d
每個(gè)葉子節(jié)點(diǎn)最少包含一個(gè)key和兩個(gè)指針,最多包含2d-1個(gè)key和2d個(gè)指針,葉節(jié)點(diǎn)的指針均為null
所有葉節(jié)點(diǎn)具有相同的深度,等于樹高h(yuǎn)
key和指針互相間隔,節(jié)點(diǎn)兩端是指針
一個(gè)節(jié)點(diǎn)中的key從左到右非遞減排列
所有節(jié)點(diǎn)組成樹結(jié)構(gòu)
每個(gè)指針要么為null,要么指向另外一個(gè)節(jié)點(diǎn)
一個(gè)度為d的B-Tree,設(shè)其索引N個(gè)key,則其樹高h(yuǎn)的上限為logd((N+1)/2),檢索一個(gè)key查找節(jié)點(diǎn)的個(gè)數(shù)的漸進(jìn)復(fù)雜度為logd(N)
更新后的操作
插入刪除新的數(shù)據(jù)記錄會破壞B-Tree的性質(zhì),因此在插入刪除時(shí),需要對樹進(jìn)行一個(gè)分裂、合并、轉(zhuǎn)移等操作以保持B-Tree性質(zhì)
B+樹
每個(gè)節(jié)點(diǎn)的指針上限為2d而不是2d+1
內(nèi)節(jié)點(diǎn)不存儲data,只存儲key
葉子節(jié)點(diǎn)不存儲指針
在經(jīng)典B+樹的基礎(chǔ)上,增加了順序訪問指針--》提高區(qū)間訪問的性能
為什么使用B/B+樹?
主存讀取
當(dāng)系統(tǒng)需要讀取主存時(shí),則將地址信號放到地址總線上傳給主存
主存讀到地址信號后,解析信號并定位到指定存儲單元,然后將此存儲單元數(shù)據(jù)放到數(shù)據(jù)總線上,供其它部件讀取
主存存取的時(shí)間僅與存取次數(shù)呈線性關(guān)系,因?yàn)椴淮嬖?a target="_blank">機(jī)械操作,兩次存取的數(shù)據(jù)的“距離”不會對時(shí)間有任何影響
磁盤存取原理
磁盤轉(zhuǎn)動,每個(gè)磁頭不動,負(fù)責(zé)讀取內(nèi)容
不過已經(jīng)有了多磁頭獨(dú)立技術(shù)
局部性原理
磁盤預(yù)讀:長度一般以頁的整數(shù)倍為單位
MyISAM索引實(shí)現(xiàn)
使用B+樹作為索引結(jié)構(gòu),data存放數(shù)據(jù)記錄的地址
索引文件與數(shù)據(jù)文件分離
主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別,只是主索引要求key是唯一的,而輔助索引的key可以重復(fù)
非聚集:MyISAM中索引檢索的算法為首先按照B+Tree搜索算法搜索索引,如果指定的Key存在,則取出其data域的值,然后以data域的值為地址,讀取相應(yīng)數(shù)據(jù)記錄
.MYI文件的組成
整個(gè)索引文件的基本信息state
各索引的限制信息base
各索引的定義信息keydef
各索引記錄的概要信息recinfo
讀取索引的流程
query請求,直接讀取key cache中的cache block,有就返回
沒有就到.MYI文件中以file block方式讀取數(shù)據(jù)
再以相同的格式存取key cache
再將key cache中的數(shù)據(jù)返回
InnoDB索引實(shí)現(xiàn)
也是使用B+樹
第一個(gè)與MyISAM的不同點(diǎn)
第一個(gè)重大區(qū)別是InnoDB的數(shù)據(jù)文件本身就是索引文件,表數(shù)據(jù)文件本身就是按B+Tree組織的一個(gè)索引結(jié)構(gòu)
InnoDB的數(shù)據(jù)文件本身要按主鍵聚集
所以InnoDB要求表必須有主鍵(MyISAM可以沒有)
沒有顯式指定,自動選擇唯一標(biāo)識列
不存在的話,生成6個(gè)字節(jié)長整型的隱含字段
第二個(gè)與MyISAM的不同點(diǎn)
InnoDB的輔助索引data域存儲相應(yīng)記錄主鍵的值而不是地址
換句話說,InnoDB的所有輔助索引都引用主鍵作為data域
輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然后用主鍵到主索引中檢索獲得記錄
得出的優(yōu)化點(diǎn)
不建議使用過長的字段作為主鍵,因?yàn)樗休o助索引都引用主索引,過長的主索引會令輔助索引變得過大
用非單調(diào)的字段作為主鍵在InnoDB中也不好,因?yàn)镮nnoDB數(shù)據(jù)文件本身是一顆B+Tree,非單調(diào)的主鍵會造成在插入新記錄時(shí)數(shù)據(jù)文件為了維持B+Tree的特性而頻繁的分裂調(diào)整,十分低效,而使用自增字段作為主鍵就很不錯(cuò)了
聚簇索引鍵被更新造成的成本除了索引數(shù)據(jù)可能會移動,相關(guān)的所有記錄數(shù)據(jù)也要移動
索引使用策略及優(yōu)化
全列匹配
按照索引中所有列進(jìn)行精確匹配(這里精確匹配指“=”或“IN”匹配)時(shí),索引可以被用到
理論上索引對順序是敏感的,但是由于MySQL的查詢優(yōu)化器會自動調(diào)整where子句的條件順序以使用適合的索引
最左前綴匹配
當(dāng)查詢條件精確匹配索引的左邊連續(xù)一個(gè)或幾個(gè)列時(shí),索引可以被用到
查詢條件用到了索引中列的精確匹配,但是中間某個(gè)條件未提供
只能用到索引中,從中間斷開前的列
應(yīng)對
可以增加輔助索引
當(dāng)中間條件選項(xiàng)較少時(shí),用隔離列的方式,使用IN包含
看情況,比較建立
查詢條件沒有指定索引第一列
不滿足使用索引的條件
匹配某列的前綴字符串
可以使用索引
如果通配符%不出現(xiàn)在開頭,則可以用到索引,但根據(jù)具體情況不同可能只會用其中一個(gè)前綴
范圍查詢
范圍列可以用到索引(必須是最左前綴),但是范圍列后面的列無法用到索引
同時(shí),索引最多用于一個(gè)范圍列,因此如果查詢條件中有兩個(gè)范圍列則無法全用到索引
僅用explain可能無法區(qū)分范圍索引和多值匹配
查詢條件中含有函數(shù)/表達(dá)式
一般不使用哦
手工算好再代入
索引選擇性與前綴索引
MyISAM與InnoDB基數(shù)統(tǒng)計(jì)方式
MyisAM索引的基數(shù)值(Cardinality,show index 命令可以看見)是精確的,InnoDB則是估計(jì)值
MyisAM統(tǒng)計(jì)信息是保存磁盤中,在alter表或Analyze table操作更新此信息
而InnoDB則是在表第一次打開的時(shí)候估計(jì)值保存在緩存區(qū)內(nèi)
不建議建立索引的情況
表記錄比較少
索引的選擇性低:不重復(fù)的索引值(也叫基數(shù),Cardinality)與表記錄數(shù)(#T)的比值
前綴索引
用列的前綴代替整個(gè)列作為索引key,當(dāng)前綴長度合適時(shí),可以做到既使得前綴索引的選擇性接近全列索引,同時(shí)因?yàn)樗饕齥ey變短而減少了索引文件的大小和維護(hù)開銷
缺點(diǎn)
不能用于ORDER BY和GROUP BY操作
也不能用于Covering index(即當(dāng)索引本身包含查詢所需全部數(shù)據(jù)時(shí),不再訪問數(shù)據(jù)文件本身)
InnoDB主鍵選擇與插入優(yōu)化
如果沒有特別的需要,請永遠(yuǎn)使用一個(gè)與業(yè)務(wù)無關(guān)的自增字段作為主鍵
InnoDB使用聚集索引,數(shù)據(jù)記錄本身被存于主索引(一顆B+Tree)的葉子節(jié)點(diǎn)上
這就要求同一個(gè)葉子節(jié)點(diǎn)內(nèi)(大小為一個(gè)內(nèi)存頁或磁盤頁)的各條數(shù)據(jù)記錄按主鍵順序存放,因此每當(dāng)有一條新的記錄插入時(shí),MySQL會根據(jù)其主鍵將其插入適當(dāng)?shù)墓?jié)點(diǎn)和位置,如果頁面達(dá)到裝載因子(InnoDB默認(rèn)為15/16),則開辟一個(gè)新的頁(節(jié)點(diǎn))
如果使用非自增主鍵,每次插入近似隨機(jī),容易引起數(shù)據(jù)的移動,重新讀目標(biāo)頁面,碎片也多了,雖然也可以用OPTIMIZE TABLE重建優(yōu)化,但麻煩啊
參考資料
圖片來源網(wǎng)絡(luò)
《高性能MySQL》
作者:AnnsShadoW
https://www.cnblogs.com/annsshadow/p/5355090.html
編輯:jq
-
磁盤
+關(guān)注
關(guān)注
1文章
388瀏覽量
25638 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3900瀏覽量
65738 -
MySQL
+關(guān)注
關(guān)注
1文章
849瀏覽量
27500
原文標(biāo)題:對 B+ 樹與索引在 MySQL 中的認(rèn)識
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
北大教授領(lǐng)銜,無錫一傳感器公司完成B+輪數(shù)千萬元融資
宏誠創(chuàng)新獲B+輪融資追加投資
宇樹科技在物聯(lián)網(wǎng)方面
使用插件將Excel連接到MySQL/MariaDB

創(chuàng)建唯一索引的SQL命令和技巧
云服務(wù)器 Flexus X 實(shí)例 MySQL 應(yīng)用加速測試

阿里國際推出全球首個(gè)B2B AI搜索引擎Accio
香港云服務(wù)器怎么部署MySQL數(shù)據(jù)庫?
MySQL編碼機(jī)制原理
MATLAB中的矩陣索引

人工智能大模型公司卓世科技完成億元B+輪融資
壹沓科技完成B+輪融資,加速大供應(yīng)鏈超自動化進(jìn)程
地芯科技完成近億元B+輪融,加速高端模擬射頻芯片發(fā)展
一文了解MySQL索引機(jī)制

評論