Mysql教程

7.1索引简介

索引由数据库表中一列或多列组合而成,其作用是提高对表中数据的查询速度。本节 将详细讲解索引的含义、作用、分类和设计索引的原则。

7.1.1索引的含义和特点

索引是创建在表上的,是对数据库表中一列或多列的值进行排序的一种结构。索引可 以提高查询的速度。本小节将详细讲解索引的含义、作用和优缺点。通过索引,查询数据时可以不必读完记录的所有信息,而只是查询索引列。否则,数 据库系统将读取每条记录的所有信息进行匹配。例如,索引相当于新华字典的音序表。如 果要查“库”字,如果不使用音序,需要从字典的400页中逐页来找。但是,如果提取拼 音出来,构成音序表,就只需要从10多页的音序表中直接查找。这样就可以大大节省时间。 因此,使用索引可以很大程度上提高数据库的查询速度。这样有效的提髙了数据库系统的 性能。

不同的存储引擎定义了每个表的最大索引数和最大索引长度。所有存储引擎对每个表 至少支持16个索引,总索引长度至少为256字节。有些存储引擎支持更多的索引数和更大 的索引长度。索引有两种存储类型,包括8型树(BTREE)索引和哈希(HASH)索引。 lnnoDB和MyISAM存储引擎支持BTREE索引,MEMORY存储引擎支持HASH索引和 8丁虹£索引,默认为前者。

索引有其明显的优势,也有其不可避免的缺点。

索引的优点是可以提高检索数据的速度,这是创建索引的最主要的原因;对于有 依赖关系的子表和父表之间的联合査询时,可以提高查询速度;使用分组和排序 子句进行数据查询时,同样可以显著节省查询中分组和排序的时间。

索引的缺点是创建和维护索引需要耗费时间,耗费时间的数量随着数据量的增加 而增加;索引需要占用物理空间,每一个索引要占一定的物理空间;增加、删除 和修改数据时,要动态的维护索引,造成数据的维护速度降低了。因此,选择使用索引时,需要综合考虑索引的优点和缺点。

技巧:索引可以提高查询的速度,但是会影响插入记录的速度。因为,向有索引的表中 插入记录时,数据库系统会按照索引进行排序。这样就降低了插入记录的速度, 插入大量记录时的速度影响更加明显。这种情况下,最好的办法是先删除表中的 索引,然后插入数据。插入完成后,再创建索引。

7.1.2索引的分类

MySQL的索引包括普通索引、唯一性索引、全文索引、单列索引、多列索引和空间 索引等。本小节将详细讲解这几种索引的含义和特点。

1.普通索引

在创建普通索引时,不附加任何限制条件。这类索引可以创建在任何数据类型中,其 值是否唯一和非空由字段本身的完整性约束条件决定。建立索引以后,査询时可以通过索 引进行查询。例如,student表stu_id字段上建立一个普通索引。查询记录时,就可以 根据该索引进行查询。

2.唯一性索引

使用UNIQUE参数可以设置索引为唯一性索引。在创建唯一性索引时,限制该索引的 值必须是唯一的。例如,在student表的stu_name字段中创建唯一性索引,那么stu_name字段的值就必需是唯一的。通过唯一性索引,可以更快速地确定某条记录。主键就是一种 特殊唯一性索引。

3.全文索引

使用FULLTEXT参数可以设置索引为全文索引。全文索引只能创建在CHAR、 VARCHAR或TEXT类型的字段上。查询数据量较大的字符串类型的字段时,使用全文索引可以提尚查询速度。例如,student表的infomation字段是TEXT类型,该字段包含了很多的文字信息。在information字段上建立全文索引后,可以提高查询information字段的速度。MySQL数据库从3.23.23版开始支持全文索引,但只有MyISAM存储引擎支持全文检索。在默认情况下,全文索引的搜索执行方式不区分大小写。但索引的列使用二进制排序后,可以执行区分大小写的全文索引。

4.单列索引

在表中的单个字段上创建索引。单列索引只根据该字段进行索引。单列索引可以是 普通索引,也可以是唯一性索引,还可以是全文索引。只要保证该索引只对应一个字段 即可。

5.多列索引

多列索引是在表的多个字段上创建一个索引。该索引指向创建时对应的多个字段,可 以通过这几个字段进行查询。但是,只有查询条件中使用了这些字段中第一个字段时,索引才会被使用。例如,在表中的id、name和sex字段上建立一个多列索引,那么,只有查询条件使用了id字段时该索引才会被使用。

6.空间索引

使用SPATITLE参数可以设置索引为空间索引。空间索引只能建立在空间数据类型上, 这样可以提高系统获取空间数据的效率。MySQL中的空间数据类型包括GEOMETRY和 POINT、LINESTRING和POLYGON等。目前只有MyISAM存储引擎支持空间检索,而且索引的字段不能为空值。对于初学者来说,这类索引很少会用到。

7.1.3索引的设计原则

为了使索引的使用效率更高,在创建索引时,必须考虑在哪些字段上创建索引和创建 什么类型的索引。本小节将向读者介绍一些索引的设计原则。

1.选择唯一性索引

唯一性索引的值是唯一的,可以更快速的通过该索引来确定某条记录。例如,学生表 中学号是具有唯一性的字段。为该字段建立唯一性索引可以很快的确定某个学生的信息。如果使用姓名的话,可能存在同名现象,从而降低查询速度。

2.为经常需要排序、分组和联合操作的字段建立索引

经常需要ORDER BY、GROUP BY、 DISTINCT和UNION等操作的字段,排序操作会浪费很多时间。如果为其建立索引,可以有效地避免排序操作。

3.为常作为査询条件的字段建立索引

如果某个字段经常用来做查询条件,那么该字段的查询速度会影响整个表的査询速 度。因此,为这样的字段建立索引,可以提高整个表的查询速度。

4.限制索引的数目

索引的数目不是越多越好。每个索引都需要占用磁盘空间,索引越多,需要的磁盘空 间就越大。修改表时,对索引的重构和更新很麻烦。越多的索引,会使更新表变得很浪费时间。

5.尽量使用数据量少的索引

如果索引的值很长,那么查询的速度会受到影响。例如,对一个CHAR(100)类型的字段进行全文检索需要的时间肯定要比对CHAR(10)类型的字段需要的时间要多。

7.尽量使用前缀来索引

如果索引字段的值很长,最好使用值的前缀来索引。例如TEXT和BIOG类型的字段,进行全文检索会很浪费时间。如果只检索字段的前面的若干个字符,这样可以提高检索速度。

8.删除不再使用或者很少使用的索引

表中的数据被大量更新,或者数据的使用方式被改变后,原有的一些索引可能不再需 要。数据库管理员应当定期找出这些索引,将它们删除,从而减少索引对更新操作的影响。

注意:选择索引的最终目的是为了使查询的速度变快。上面给出的原则是最基本的准则, 但不能拘泥于上面的准则。读者要在以后的学习和工作中进行不断的实践。根据 应用的实际情况进行分析和判断,选择最合适的索引方式。


关注微信获取最新动态