MYSQL通过索引优化数据库的查询
#转载请联系
- 索引是什么?
索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的位置信息。
更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度。
- 为什么需要索引
一般的应用系统对比数据库的读写比例在10:1左右(即有10次查询操作时有1次写的操作),而且插入操作和更新操作很少出现性能问题,遇到最多、最容易出问题还是一些复杂的查询操作,所以查询语句的优化显然是重中之重。当数据库中数据量很大时,查找数据会变得很慢,我们就可以使用索引来提高数据库的查询效率。
- 索引原理
数据库应该选择怎么样的方式来应对所有的问题呢?我们回想字典的例子,能不能把数据分成段,然后分段查询呢?最简单的如果1000条数据,1到100分成第一段,101到200分成第二段,201到300分成第三段……这样查第250条数据,只要找第三段就可以了,一下子去除了90%的无效数据。
mysql默认的存储引擎是InnoDB,InnoDB引擎的索引默认用B+Tree算法。
有关于B+Tree算法可以自行搜索下。
- 查看表中已有索引
show index from 表名;
mysql> show index from student; +---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+ | Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment | +---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+ | student | 0 | PRIMARY | 1 | id | A | 6 | NULL | NULL | | BTREE | | | | student | 0 | id | 1 | id | A | 6 | NULL | NULL | | BTREE | | | +---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
我并没有给专门给student表添加过索引,但是由于student表的主键是id,主键默认添加索引,所以id字段也是索引。
- 创建索引
create index 索引名称 on 表名(字段名称(长度)) # 如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致 # 字段类型如果不是字符串,可以不填写长度部分
- 删除索引
drop index 索引名称 on 表名;
- 验证索引是否能提升查找性能
1.创建一个表
mysql> create table t_news(name varchar(10));
2.用python写个程序往表里插入10万条数据
import pymysql def main(): conn = pymysql.connect(host='localhost',port=3306, user='root',password='xxx', database='text',charset='utf8') cur = conn.cursor() sql = 'insert into t_news value (%s)' for i in range(1,100001): cur.execute(sql,['新闻%d' % i]) conn.commit() cur.close() conn.close() if __name__ == '__main__': main()
结果(部分):
| 新闻99994 | | 新闻99995 | | 新闻99996 | | 新闻99997 | | 新闻99998 | | 新闻99999 | | 新闻100000 | +--------------+ 100000 rows in set (0.04 sec)
3.测试有无索引情况下查询的时间
mysql> set profiling=1; # 开启时间监测 mysql> select * from t_news where name='新闻480916'; mysql> create index name_index on t_news(name(10)); mysql> select * from t_news where name='新闻480916'; mysql> show profiles; # 查看时间监测结果 +----------+------------+------------------------------------------------+ | Query_ID | Duration | Query | +----------+------------+------------------------------------------------+ | 1 | 0.04325925 | select * from t_news where name='新闻480916' | | 2 | 1.64268400 | create index name_index on t_news(name(10)) | | 3 | 0.00065225 | select * from t_news where name='新闻480916' | | 4 | 0.00004275 | show profiling | +----------+------------+------------------------------------------------+ # 对比第1和第3。可知结果快了很多倍!查询性能得到了优化!!!
- 说在后面
索引虽然可以明显提高某些字段的查询效率。但是不要滥用,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的where字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。索引也会占用磁盘空间(财大气粗的可以忽略不计)
end~~~