MySQL数据库-初识MySQL数据库索引

索引是存储引擎用于快速找到记录的一种数据结构。

索引的存储类型:

(1)B-Tree索引 

B-Tree对索引列是顺序组织存储的,所以很适合查找范围数据。索引对多个值进行排序的依据是CREATE TABLE语句中定义索引时列的顺序。

限制:

如果不是按照索引的最左列开始查找,则无法使用索引。

如果查询中有某个列的范围查询(like),则其右边的所有列都无法使用索引优化查找。

(2)Hash索引

基于哈希表实现,只有精确匹配索引所有列的查询才有效。因为索引自身只需存储索引列的哈希值,所以索引的结构十分紧凑,这也让哈希索引查找的速度非常快。

限制:

无法用于排序

扫描二维码关注公众号,回复: 127675 查看本文章

不支持部分索引列匹配查找

不支持范围查询 例如where price > 100

(3)另外还有R-Tree、全文索引、分形树索引、Patricia tries等。

索引的优点

  • 第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
  • 第二,可以大大加快数据的检索速度,这也是创建索引的最主要的原因。
  • 第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。
  • 第四,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
  • 第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。

索引的缺点

  • 第一,创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。
  • 第二,索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。
  • 第三,当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。

哪些情况需要加索引?

  • 在经常需要搜索的列上,可以加快搜索的速度;
  • 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
  • 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
  • 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
  • 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
  • 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

哪些情况不需要加索引?

  • 第一,对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
  • 第二,对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。
  • 第三,对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。 
    第四,当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。

索引策略:

1、单列索引:普通索引index,唯一索引unique index,主键索引

2、组合索引:一个索引包含多列

3、前缀索引:

有时候需要索引很长很长的字符列,这会让索引变得大且慢,一个策略是使用模拟哈希索引,即计算每一列的hash值并持久化,并把该列当做索引列。除此之外,可以索引开始的部分字符,这样可以大大节约索引空间。创建前缀索引:

ALTER TABLE table_name ADD KEY (column_name(prefix_length))

不过,myql无法使用前缀索引做ORDER BY和GROUP BY。

适用场景:

对于非常小的表,大部分情况下简单的全表扫描更高效。

对于中到大型的表,索引就非常有效。在值比较多的列,在where 以及order by涉及的列上建立索引比较有效。

对于特大型的表,建立和使用索引的代价将随之增长,对于TB级别的数据,定位单条记录的意义不大,所以经常使用块级别元数据技术来替代索引。

索引的使用,以B-Tree索引为例:

1、创建索引三种方式:

CREATE INDEX index_name ON table_name(column_name1,column_name2...)
ALTER table tableName ADD INDEX index_name(column_name1,column_name2...)
CREATE TABLE mytable(  
 
ID INT NOT NULL,   
 
username VARCHAR(16) NOT NULL,  
 
INDEX [indexName] (username(length))  
 
); 

2、删除索引:

ALTER TABLE table_name DROP INDEX index_name

索引优化技巧:

1、尽量避免在where子句中队字段进行Null值判断,否则将导致引擎放弃使用索引而进行全表扫描。

  建议使用not null约束和默认值

2、负向条件查询不能使用索引:select * from order where status !=0;可以优化为in 子句。

3、前导模糊查询不能使用索引:select * from stu where name like '%xx',非前导可以like 'xx%'

4、数据区分度不大的字段不宜使用索引,如性别列。一般来说能过滤80%的数据时就可以使用索引。

5、尽量避免在where子句中使用or连接,这样会引发额外的索引合并操作,性能还不如全表扫描,建议使用union all语句。

6、单条查询hash索引性能更好。

7、如果明确知道只有一条结果返回,limit 1能够提高效率

select * from user where login_name =? limit 1,可以让数据库主动停止游标移动。

8、尽量使用数字型字段,只包含数字的字符串尽量使用数字类型存储,因为引擎在处理查询和连接时会逐个比较字符串中的每一个字符,而对于数字型而言只需要比较一次就够了。

9、使用“EXPLAIN + 查询语句”可以看到索引的使用情况,type项为索引的类型,如果type为"index_merge",则说明有索引合并。

10、如何选择合适的索引列顺序?

将选择性较高的列放在左边,选择性的计算方法: COUNT(DISTINCT column_name)/COUNT(*),即内容比较丰富的列放在左边。




猜你喜欢

转载自blog.csdn.net/sinat_27143551/article/details/80166114