`

提高SQL效率

 
阅读更多

 

下面就某些SQL 语句的 where 子句编写中需要注意的问题作详细介绍。在这些 where 子句中,即使某些列存在索引,但是由于编写了劣质的 SQL ,系统在运行该 SQL 语句时也不能使用该索引,而同样使用全表扫描,这就造成了响应速度的极大降低。 

1. IS NULL 与  IS NOT NULL 

不能用null 作索引,任何包含 null 值的列都将不会被包含在索引中。即使索引有多列这样的情况下,只要这些列中有一列含有 null ,该列就会从索引中排除。也就是说如果某列存在空值,即使对该列建索引也不会提高性能。 

任何在where 子句中使用 is null is not null 的语句优化器是不允许使用索引的。 

2. 联接列 

对于有联接的列,即使最后的联接值为一个静态值,优化器是不会使用索引的。我们一起来看一个例子,假定有一个职工表(employee ),对于一个职工的姓和名分成两列存放( FIRST_NAME LAST_NAME ),现在要查询一个叫比尔 . 克林顿( Bill Cliton )的职工。 

下面是一个采用联接查询的SQL 语句, 

select * from employss 
where 
first_name||'||last_name ='Beill Cliton' 

上面这条语句完全可以查询出是否有Bill Cliton 这个员工,但是这里需要注意,系统优化器对基于 last_name 创建的索引没有使用。 

当采用下面这种SQL 语句的编写, Oracle 系统就可以采用基于 last_name 创建的索引。 

Select * from employee 

where 

first_name ='Beill' and last_name ='Cliton' 

遇到下面这种情况又如何处理呢?如果一个变量(name )中存放着 Bill Cliton 这个员工的姓名,对于这种情况我们又如何避免全程遍历,使用索引呢?可以使用一个函数,将变量 name 中的姓和名分开就可以了,但是有一点需要注意,这个函数是不能作用在索引列上。下面是 SQL 查询脚本: 

select * from employee 

where 

first_name = SUBSTR('&&name',1,INSTR('&&name',' ')-1) 

and 

last_name = SUBSTR('&&name',INSTR('&&name’,' ')+1) 

3. 带通配符( % )的 like 语句 

同样以上面的例子来看这种情况。目前的需求是这样的,要求在职工表中查询名字中包含cliton 的人。可以采用如下的查询 SQL 语句: 

select * from employee where last_name like '%cliton%' 

这里由于通配符(% )在搜寻词首出现,所以 Oracle 系统不使用 last_name 的索引。在很多情况下可能无法避免这种情况,但是一定要心中有底,通配符如此使用会降低查询速度。然而当通配符出现在字符串其他位置时,优化器就能利用索引。在下面的查询中索引得到了使用: 

select * from employee where last_name like 'c%' 

4. Order by语句  

ORDER BY语句决定了 Oracle 如何将返回的查询结果排序。 Order by 语句对要排序的列没有什么特别的限制,也可以将函数加入列中(象联接或者附加等)。任何在 Order by 语句的非索引项或者有计算表达式都将降低查询速度。 

仔细检查order by 语句以找出非索引项或者表达式,它们会降低性能。解决这个问题的办法就是重写 order by 语句以使用索引,也可以为所使用的列建立另外一个索引,同时应绝对避免在 order by 子句中使用表达式。 

5. NOT 

我们在查询时经常在where 子句使用一些逻辑表达式,如大于、小于、等于以及不等于等等,也可以使用 and (与)、 or (或)以及 not (非)。 NOT 可用来对任何逻辑运算符号取反。下面是一个 NOT 子句的例子: 

... where not (status ='VALID') 

如果要使用NOT ,则应在取反的短语前面加上括号,并在短语前面加上 NOT 运算符。 NOT 运算符包含在另外一个逻辑运算符中,这就是不等于( <>; )运算符。换句话说,即使不在查询 where 子句中显式地加入 NOT 词, NOT 仍在运算符中,见下例: 

... where status <>;'INVALID' 

再看下面这个例子: 

select * from employee where salary<>;3000; 

对这个查询,可以改写为不使用NOT : 

select * from employee where salary<3000 or salary>;3000; 

虽然这两种查询的结果一样,但是 第二种查询方案会比第一种查询方案更快些 。第二种查询允许Oracle salary 列使用索引,而第一种查询则不能使用索引。 

6. IN EXISTS 

有时候会将一列和一系列值相比较。最简单的办法就是在where 子句中使用子查询。在 where 子句中可以使用两种格式的子查询。 

第一种格式是使用IN 操作符: 

... where column in(select * from ... where ...); 

第二种格式是使用EXIST 操作符: 

... where exists (select 'X' from ...where ...); 

我相信绝大多数人会使用第一种格式,因为它比较容易编写,而实际上第二种格式要远比第一种格式的效率高。在Oracle 中可以几乎将所有的 IN 操作符子查询改写为使用 EXISTS 的子查询。 

第二种格式中,子查询以‘select 'X' 开始。运用 EXISTS 子句不管子查询从表中抽取什么数据它只查看 where 子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作(这里假定在 where 语句中使用的列存在索引)。相对于 IN 子句来说, EXISTS 使用相连子查询,构造起来要比 IN 子查询困难一些。 

通过使用EXIST Oracle 系统会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。 Oracle 系统在执行 IN 子查询时,首先执行子查询,并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用 EXISTS 比使用 IN 通常查询速度快的原因。 

同时应尽可能使用NOT EXISTS 来代替 NOT IN ,尽管二者都使用了 NOT (不能使用索引而降低速度), NOT EXISTS 要比 NOT IN 查询效率更高。

 

 

 

 

==============================另外的一篇文章===============================================

基本的Sql编写注意事项

  • 尽量少用IN操作符,基本上所有的IN操作符都可以用EXISTS代替。
  • 不用NOT IN操作符,可以用NOT EXISTS或者外连接+替代。
  • Oracle在执行IN子查询时,首先执行子查询,将查询结果放入临时表再执行主查询。而EXIST则是首先检查主查询,然后运行子查询直到找到第一个匹配项。NOT EXISTS比NOT IN效率稍高。但具体在选择IN或EXIST操作时,要根据主子表数据量大小来具体考虑。
  • 不用“<>”或者“!=”操作符。对不等于操作符的处理会造成全表扫描,可以用“<” or “>”代替。
  • Where子句中出现IS NULL或者IS NOT NULL时,Oracle会停止使用索引而执行全表扫描。可以考虑在设计表时,对索引列设置为NOT NULL。这样就可以用其他操作来取代判断NULL的操作。
  •  

  • 当通配符“%”或者“_”作为查询字符串的第一个字符时,索引不会被使用。
  • 对于有连接的列“||”,最后一个连接列索引会无效。尽量避免连接,可以分开连接或者使用不作用在列上的函数替代。
  • 如果索引不是基于函数的,那么当在Where子句中对索引列使用函数时,索引不再起作用。
  • Where子句中避免在索引列上使用计算,否则将导致索引失效而进行全表扫描。
  • 对数据类型不同的列进行比较时,会使索引失效。
  • 用“>=”替代“>”。
  • UNION操作符会对结果进行筛选,消除重复,数据量大的情况下可能会引起磁盘排序。如果不需要删除重复记录,应该使用UNION ALL。
  • Oracle从下到上处理Where子句中多个查询条件,所以表连接语句应写在其他Where条件前,可以过滤掉最大数量记录的条件必须写在Where子句的末尾。
  • Oracle从右到左处理From子句中的表名,所以在From子句中包含多个表的情况下,将记录最少的表放在最后。(只在采用RBO优化时有效,下文详述)
  • Order By语句中的非索引列会降低性能,可以通过添加索引的方式处理。严格控制在Order By语句中使用表达式。
  • 不同区域出现的相同的Sql语句,要保证查询字符完全相同,以利用SGA共享池,防止相同的Sql语句被多次分析。
  • 多利用内部函数提高Sql效率。
  • 当在Sql语句中连接多个表时,使用表的别名,并将之作为每列的前缀。这样可以减少解析时间。

需要注意的是,随着Oracle的升级,查询优化器会自动对Sql语句进行优化,某些限制可能在新版本的Oracle下不再是问题。尤其是采用CBO(Cost-Based Optimization,基于代价的优化方式)时。

我们可以总结一下可能引起全表扫描的操作:

  • 在索引列上使用NOT或者“<>”;
  • 对索引列使用函数或者计算;
  • NOT IN操作;
  • 通配符位于查询字符串的第一个字符;
  • IS NULL或者IS NOT NULL;
  • 多列索引,但它的第一个列并没有被Where子句引用;

Oracle优化器

Oracle优化器(Optimizer)是Oracle在执行SQL之前分析语句的工具。
Oracle的优化器有两种优化方式:基于规则的(RBO)和基于代价的(CBO)。

  • RBO: 优化器遵循Oracle内部预定的规则。
  • CBO: 依据语句执行的代价,主要指对CPU和内存的占用。优化器在判断是否使用CBO时,要参照表和索引的统计信息。统计信息要在对表做analyze后才会有。Oracle8及以后版本,推荐用CBO方式。

Oracle优化器的优化模式主要有四种:

  • Rule:基于规则;
  • Choose:默认模式。根据表或索引的统计信息,如果有统计信息,则使用CBO方式;如果没有统计信息,相应列有索引,则使用RBO方式。
  • First rows:与Choose类似。不同的是如果表有统计信息,它将以最快的方式返回查询的前几行,以获得最佳响应时间。
  • All rows:即完全基于Cost的模式。当一个表有统计信息时,以最快方式返回表所有行,以获得最大吞吐量。没有统计信息则使用RBO方式。

设定优化模式的方式

  • Instance级别:在init<SID>.ora文件中设定OPTIMIZER_MODE;
  • Session级别:通过SQL> ALTER SESSION SET OPTIMIZER_MODE=;来设定。
  • 语句级别:通过SQL> SELECT /*+ALL+_ROWS*/ ……;来设定。可用的HINT包括/*+ALL_ROWS*/、/*+FIRST_ROWS*/、/*+CHOOSE*/、/*+RULE*/ 等。

要注意的是,如果表有统计信息,则可能造成语句不走索引的结果。可以用SQL>ANALYZE TABLE table_name DELETE STATISTICS; 删除索引。
对列和索引更新统计信息的SQL:
SQL> ANALYZE TABLE table_name COMPUTE STATISTICS;
SQL> ANALYZE INDEX index_name ESTIMATE STATISTICS;

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics