在數(shù)據(jù)庫中,對性能影響最大的包括數(shù)據(jù)庫的鎖策略、緩存策略、索引策略、存儲策略、執(zhí)行計劃優(yōu)化策略。
索引策略決定數(shù)據(jù)庫快速定位數(shù)據(jù)的效率,存儲策略決定數(shù)據(jù)持久化的效率。
1.索引不存儲null值。
更準確的說,單列索引不存儲null值,復(fù)合索引不存儲全為null的值。索引不能存儲Null,所以對這列采用is null條件時,因為索引上根本
沒Null值,不能利用到索引,只能全表掃描。
為什么索引列不能存Null值?
將索引列值進行建樹,其中必然涉及到諸多的比較操作。Null值的特殊性就在于參與的運算大多取值為null。這樣的話,null值實際上是不能
參與進建索引的過程。也就是說,null值不會像其他取值一樣出現(xiàn)在索引樹的葉子節(jié)點上。
2.不適合鍵值較少的列(重復(fù)數(shù)據(jù)較多的列)。
假如索引列TYPE有5個鍵值,如果有1萬條數(shù)據(jù),那么 WHERE TYPE = 1將訪問表中的2000個數(shù)據(jù)塊。
再加上訪問索引塊,一共要訪問大于200個的數(shù)據(jù)塊。
如果全表掃描,假設(shè)10條數(shù)據(jù)一個數(shù)據(jù)塊,那么只需訪問1000個數(shù)據(jù)塊,既然全表掃描訪問的數(shù)據(jù)塊
少一些,肯定就不會利用索引了。
3.前導(dǎo)模糊查詢不能利用索引(like '%XX'或者like '%XX%')
假如有這樣一列code的值為'AAA','AAB','BAA','BAB' ,如果where code like '%AB'條件,由于前面是
模糊的,所以不能利用索引的順序,必須一個個去找,看是否滿足條件。這樣會導(dǎo)致全索引掃描或者全表掃
描。如果是這樣的條件where code like 'A % ',就可以查找CODE中A開頭的CODE的位置,當碰到B開頭的
數(shù)據(jù)時,就可以停止查找了,因為后面的數(shù)據(jù)一定不滿足要求。這樣就可以利用索引了。
4.MySQL主要提供2種方式的索引:B-Tree索引,Hash索引。
B樹索引具有范圍查找和前綴查找的能力,對于有N節(jié)點的B樹,檢索一條記錄的復(fù)雜度為O(LogN)。相當于二分查找。
哈希索引只能做等于查找,但是無論多大的Hash表,查找復(fù)雜度都是O(1)。
顯然,如果值的差異性大,并且以等值查找(=、 <、>、in)為主,Hash索引是更高效的選擇,它有O(1)的查找復(fù)雜度。
如果值的差異性相對較差,并且以范圍查找為主,B樹是更好的選擇,它支持范圍查找。
MySQL中兩大主要存儲引擎MyISAM和InnoDB采用了不同的索引和存儲策略,本文將分析它們的異同和性能。
更多信息請查看IT技術(shù)專欄