English
购物车图片 购物车 ( )
专业的品牌服务,为您创造更高的价值
总体概述 客户评价

【干货分享】达梦SQL优化——基础篇


在数据库的使用中,书写正确的SQL语句只是完成了万里长征的第一步。事实上,在DBA的日常的工作中,SQL优化占据了很大的一部分的内容,本文就将给大家介绍一些SQL优化有关的基础知识。

 

1.基本概念

在理解如何优化SQL语句之前,我们首先要了解几个基本概念


1.1执行计划

执行计划是SQL语句的执行方式,由查询优化器为语句设计的执行方式,交给执行器去执行。在SQL命令行使用EXPLAIN可以打印出语句的执行计划。


1.2操作符

操作符是SQL执行的基本单元,所有的SQL语句最终都是转换成一连串的操作符最后在服务器上执行,得到需要的结果,

操作符也是读懂执行计划的基础,这里列举一下经常出现的操作符

CSCN SSCN SSEK CSEK BLKUP

这些操作符是SQL查询数据的原始来源,SQL里面出现的基表,都会出现在这些操作符的描述中,通过这些操作符来确定对应的表在执行计划中在何时以什么样的方式进入。

下面列出操作符的具体含义

CSCN :基础全表扫描(a),从头到尾,全部扫描

SSCN :二级索引扫描(b), 从头到尾,全部扫描

SSEK :二级索引范围扫描(b) ,通过键值精准定位到范围或者单值

CSEK :聚簇索引范围扫描(c) ,通过键值精准定位到范围或者单值

BLKUP :根据二级索引的ROWID 回原表中取出全部数据(b + a)

更多的操作符解释,可以参见DM7系统管理员手册附录4《执行计划操作符》

 

2.搭建实验环境

创建表T1并录入数据,相关SQL语句如下

SQL> CREATE TABLE T1(C1 INT,C2 INT);

SQL> insert into t1 select level,level from dualconnect by level < 10000;

 

3.检验执行计划

--SEL1

SQL> explain select * from t1 where c1 = 5;

 

1   #NSET2: [1, 249, 16]

2     #PRJT2: [1, 249, 16]; exp_num(3),is_atom(FALSE)

3       #SLCT2: [1, 249, 16]; T1.C1 =5

4         #CSCN2: [1, 9999, 16];INDEX33555446(T1)

 

我们创建了一个普通表,没有任何索引,过滤,从T1中取出数据只能走全表扫描CSCN

 

下面我们创建一条索引

SQL> create index i_test1 on t1(c1);

 

再看下面这个语句的计划

--SEL2

SQL> explain select c1 from t1;

 

1   #NSET2: [1, 9999, 12]

2     #PRJT2: [1, 9999, 12]; exp_num(2),is_atom(FALSE)

3       #SSCN: [1, 9999, 12];I_TEST1(T1)


--SEL3

SQL> explain select c2 from t1;

 

1   #NSET2: [1, 9999, 12]

2     #PRJT2: [1, 9999, 12]; exp_num(2),is_atom(FALSE)

3       #CSCN2: [1, 9999, 12]; INDEX33555446(T1)

 

这个时候T1存在两个入口,CSCN T1基表,或者SSCN 二级索引I_TEST1,SEL2中,只要求获取C1,二级索引上存在C1,且数据长度比基础表要少(多出一个C2),索引选择SSCN

对于SEL3,依然没有更好的入口,还是选择CSCN全表

##一般来说,我们认为CSCN和SSCN的耗时是差不多了,SSCN和CSCN的区别在于,SSCN 扫描出来的数据是按索引列排序的,这一点在一些情况下可以利用

 

现在看SSEK的情况

--SEL4

SQL> explain select * from t1 where c1 = 5;

 

1   #NSET2: [0, 249, 16]

2     #PRJT2: [0, 249, 16]; exp_num(3),is_atom(FALSE)

3       #BLKUP2: [0, 249, 16];I_TEST1(T1)

4         #SSEK2: [0, 249, 16];scan_type(ASC), I_TEST1(T1), scan_range[5,5]

 

查询条件C1 = 多少,存在C1索引,需要注意的是操作符后面的描述scan_range[5,5],表示精准定位到5,无疑,多数情况下这样是比较有效率的。


另外一点,SSEK 上面出现了BLKUP操作符,由于I_TEST1上没有C2的数据,而查询需要SELECT *,索引需要BLKUP回原表查找整行数据

 

很容易的,我们可以想到如果只查询C1,那么BLKUP操作符应该不存在,验证一下

--SEL5

SQL> explain select c1 from t1 where c1 = 5;

 

1   #NSET2: [0, 249, 12]

2     #PRJT2: [0, 249, 12]; exp_num(2),is_atom(FALSE)

3       #SSEK2: [0, 249, 12];scan_type(ASC), I_TEST1(T1), scan_range[5,5]

确实如此

 

聚簇索引是比较特殊的索引(对应操作符CSEK),在DM7上,同一张表的聚簇索引只允许存在一个,默认建表时(不建堆表的情况下),基表就是一个ROWID聚簇索引,可以预见到对ROWID的精准定位应该会走CSEK

--SEL6

SQL> explain select c1 from t1 where rowid = 6;

 

1   #NSET2: [0, 1, 12]

2     #PRJT2: [0, 1, 12]; exp_num(2),is_atom(FALSE)

3       #CSEK2: [0, 1, 12];scan_type(ASC), INDEX33555446(T1), scan_range[exp_cast(6),exp_cast(6)]

 

如果我们创建了一个自定义聚簇索引

SQL> create cluster index i_index2 on t1(c2);

那么ROWID这个聚簇索引就不存在了,取而代指的是按C2为顺序的聚簇索引

--SEL7

SQL> explain select c1 from t1 where rowid = 6;

 

1   #NSET2: [1, 249, 12]

2     #PRJT2: [1, 249, 12]; exp_num(1),is_atom(FALSE)

3       #SLCT2: [1, 249, 12];T1.ROWID = var1

4         #SSCN: [1, 9999, 12];I_TEST1(T1)

 

##这里查询中需要C1以及ROWID,而普通二级索引I_TEST1上正好都有,且比聚簇索引的长度要短,所以选择SSCN I_TEST1

 

--SEL8

SQL> explain select c1 from t1 where c2 = 6;

 

1   #NSET2: [0, 249, 8]

2     #PRJT2: [0, 249, 8]; exp_num(1),is_atom(FALSE)

3       #CSEK2: [0, 249, 8]; scan_type(ASC),I_INDEX2(T1), scan_range[6,6]

 

我们可以看到,对ROWID的精准定位不再走精准定位的CSEK,而是全索引扫描I_TEST1,对C2的精准过滤走的CSEK,且不存在BLKUP


客户资料:
年缴保费:
客户需求:


在数据库的使用中,书写正确的SQL语句只是完成了万里长征的第一步。事实上,在DBA的日常的工作中,SQL优化占据了很大的一部分的内容,本文就将给大家介绍一些SQL优化有关的基础知识。

 

1.基本概念

在理解如何优化SQL语句之前,我们首先要了解几个基本概念


1.1执行计划

执行计划是SQL语句的执行方式,由查询优化器为语句设计的执行方式,交给执行器去执行。在SQL命令行使用EXPLAIN可以打印出语句的执行计划。


1.2操作符

操作符是SQL执行的基本单元,所有的SQL语句最终都是转换成一连串的操作符最后在服务器上执行,得到需要的结果,

操作符也是读懂执行计划的基础,这里列举一下经常出现的操作符

CSCN SSCN SSEK CSEK BLKUP

这些操作符是SQL查询数据的原始来源,SQL里面出现的基表,都会出现在这些操作符的描述中,通过这些操作符来确定对应的表在执行计划中在何时以什么样的方式进入。

下面列出操作符的具体含义

CSCN :基础全表扫描(a),从头到尾,全部扫描

SSCN :二级索引扫描(b), 从头到尾,全部扫描

SSEK :二级索引范围扫描(b) ,通过键值精准定位到范围或者单值

CSEK :聚簇索引范围扫描(c) ,通过键值精准定位到范围或者单值

BLKUP :根据二级索引的ROWID 回原表中取出全部数据(b + a)

更多的操作符解释,可以参见DM7系统管理员手册附录4《执行计划操作符》

 

2.搭建实验环境

创建表T1并录入数据,相关SQL语句如下

SQL> CREATE TABLE T1(C1 INT,C2 INT);

SQL> insert into t1 select level,level from dualconnect by level < 10000;

 

3.检验执行计划

--SEL1

SQL> explain select * from t1 where c1 = 5;

 

1   #NSET2: [1, 249, 16]

2     #PRJT2: [1, 249, 16]; exp_num(3),is_atom(FALSE)

3       #SLCT2: [1, 249, 16]; T1.C1 =5

4         #CSCN2: [1, 9999, 16];INDEX33555446(T1)

 

我们创建了一个普通表,没有任何索引,过滤,从T1中取出数据只能走全表扫描CSCN

 

下面我们创建一条索引

SQL> create index i_test1 on t1(c1);

 

再看下面这个语句的计划

--SEL2

SQL> explain select c1 from t1;

 

1   #NSET2: [1, 9999, 12]

2     #PRJT2: [1, 9999, 12]; exp_num(2),is_atom(FALSE)

3       #SSCN: [1, 9999, 12];I_TEST1(T1)


--SEL3

SQL> explain select c2 from t1;

 

1   #NSET2: [1, 9999, 12]

2     #PRJT2: [1, 9999, 12]; exp_num(2),is_atom(FALSE)

3       #CSCN2: [1, 9999, 12]; INDEX33555446(T1)

 

这个时候T1存在两个入口,CSCN T1基表,或者SSCN 二级索引I_TEST1,SEL2中,只要求获取C1,二级索引上存在C1,且数据长度比基础表要少(多出一个C2),索引选择SSCN

对于SEL3,依然没有更好的入口,还是选择CSCN全表

##一般来说,我们认为CSCN和SSCN的耗时是差不多了,SSCN和CSCN的区别在于,SSCN 扫描出来的数据是按索引列排序的,这一点在一些情况下可以利用

 

现在看SSEK的情况

--SEL4

SQL> explain select * from t1 where c1 = 5;

 

1   #NSET2: [0, 249, 16]

2     #PRJT2: [0, 249, 16]; exp_num(3),is_atom(FALSE)

3       #BLKUP2: [0, 249, 16];I_TEST1(T1)

4         #SSEK2: [0, 249, 16];scan_type(ASC), I_TEST1(T1), scan_range[5,5]

 

查询条件C1 = 多少,存在C1索引,需要注意的是操作符后面的描述scan_range[5,5],表示精准定位到5,无疑,多数情况下这样是比较有效率的。


另外一点,SSEK 上面出现了BLKUP操作符,由于I_TEST1上没有C2的数据,而查询需要SELECT *,索引需要BLKUP回原表查找整行数据

 

很容易的,我们可以想到如果只查询C1,那么BLKUP操作符应该不存在,验证一下

--SEL5

SQL> explain select c1 from t1 where c1 = 5;

 

1   #NSET2: [0, 249, 12]

2     #PRJT2: [0, 249, 12]; exp_num(2),is_atom(FALSE)

3       #SSEK2: [0, 249, 12];scan_type(ASC), I_TEST1(T1), scan_range[5,5]

确实如此

 

聚簇索引是比较特殊的索引(对应操作符CSEK),在DM7上,同一张表的聚簇索引只允许存在一个,默认建表时(不建堆表的情况下),基表就是一个ROWID聚簇索引,可以预见到对ROWID的精准定位应该会走CSEK

--SEL6

SQL> explain select c1 from t1 where rowid = 6;

 

1   #NSET2: [0, 1, 12]

2     #PRJT2: [0, 1, 12]; exp_num(2),is_atom(FALSE)

3       #CSEK2: [0, 1, 12];scan_type(ASC), INDEX33555446(T1), scan_range[exp_cast(6),exp_cast(6)]

 

如果我们创建了一个自定义聚簇索引

SQL> create cluster index i_index2 on t1(c2);

那么ROWID这个聚簇索引就不存在了,取而代指的是按C2为顺序的聚簇索引

--SEL7

SQL> explain select c1 from t1 where rowid = 6;

 

1   #NSET2: [1, 249, 12]

2     #PRJT2: [1, 249, 12]; exp_num(1),is_atom(FALSE)

3       #SLCT2: [1, 249, 12];T1.ROWID = var1

4         #SSCN: [1, 9999, 12];I_TEST1(T1)

 

##这里查询中需要C1以及ROWID,而普通二级索引I_TEST1上正好都有,且比聚簇索引的长度要短,所以选择SSCN I_TEST1

 

--SEL8

SQL> explain select c1 from t1 where c2 = 6;

 

1   #NSET2: [0, 249, 8]

2     #PRJT2: [0, 249, 8]; exp_num(1),is_atom(FALSE)

3       #CSEK2: [0, 249, 8]; scan_type(ASC),I_INDEX2(T1), scan_range[6,6]

 

我们可以看到,对ROWID的精准定位不再走精准定位的CSEK,而是全索引扫描I_TEST1,对C2的精准过滤走的CSEK,且不存在BLKUP


相关案例
2020 - 06 - 19
点击次数: 0
DM8介绍DM8作为达梦公司新一代自研数据库,融合了分布式、弹性计算与云计算的优势,对灵活性、易用性、可靠性、高安全性等方面进行了大规模改进,多样化架构充分满足不同场景需求,支持超大规模并发事务处理和事务-分析混合型业务处理,动态分配计算资源,实现更精细化的资源利用、更低成本的投入。一个数据库,满足用户多种需求,让用户能更加专注于业务发展。自DM8产品上线以来,广受应用,达梦大学已于2020年6月...
2020 - 06 - 18
点击次数: 0
学员们,大家好呀!一年一度的618电商大促又来啦大家都准备买些什么?零食、书籍、水果.....还是手机、笔电、游戏机?不趁着活动囤一波,对得起手机里的APP啵?来,一起喊口号:钱包可能干扁,购物欲望不会减!花呗可能超出,拼单付款不会输!月光可能不停,优惠算法我会赢!加购可能太多,购完手也不会剁!优惠券、专属红包、叠蛋糕、组团助力.....在优惠的套路里,哪有人能逃脱它的魔咒?!只怪,为什么身边没个...
2020 - 06 - 10
点击次数: 0
DM8介绍DM8作为达梦公司新一代自研数据库,融合了分布式、弹性计算与云计算的优势,对灵活性、易用性、可靠性、高安全性等方面进行了大规模改进,多样化架构充分满足不同场景需求,支持超大规模并发事务处理和事务-分析混合型业务处理,动态分配计算资源,实现更精细化的资源利用、更低成本的投入。一个数据库,满足用户多种需求,让用户能更加专注于业务发展。自DM8产品上线以来,广受应用,达梦大学已于2020年6月...
2020 - 05 - 20
点击次数: 0
似水季节,石榴花开520如期而至空气中弥漫着甜蜜的气味又到一年一度爱意涌动的季节2020年注定是特殊的一年,疫情阴霾之下,涌现出无数英雄事迹,体现出中华民族坚韧不拔、同舟共济的精神。多难兴邦,相信阳光总在风雨后!尽管没有亲密聚会,没有握手,但人类迎难而上的精神相互碰撞出各种火花——云植树、云吸猫、云招聘、云婚礼...通过网络,人们互相激励、共勉互进!♥♥♥ 520网络情人节疫情可以隔离社...
官网微信公众号官方微信公众号
官方技术咨询一群官方技术咨询一群
官方技术咨询二群官方技术咨询二群
官网培训咨询QQ官网培训咨询QQ
支持:dmtech@dameng.com
地址:中国·武汉·东湖新技术开发区高新大道999号未来科技大厦C3栋16-19层
咨询热线:400 991 6599
传真:+86 0755-2788 8009
友情链接:
鄂Copyright ©2017 - 2019 武汉达梦数据库有限公司
犀牛云提供企业云服务
X
3

电话号码

4

阿里旺旺设置

1

在线咨询

等待加载动态数据...

等待加载动态数据...

5

电话号码管理

6

二维码管理

  • 微信二维码

    微信二维码

等待加载动态数据...

等待加载动态数据...

展开