Todos conocemos la sentencia Order By de TSQL (Transact SQL), de hecho si necesitamos garantizar un orden el uso del Order By es la única forma de hacerlo.
Ahora bien, en este post nos dedicaremos a mostrar los impactos en la performance si es que no se tienen las cosas de forma adecuada , como así también haremos un best practica del Order By.
El primer paso será mostrar como funciona y sus efectos, para ello crearemos una tabla temporal la cual llenaremos con datos de la tabla “Sales.SalesOrderHeader” de nuestra base de ejemplos Adventureworks
use AdventureWorks2008
go
create table #t1 (id int)
insert into #t1 values
(0),(1),(2),(3),(4),
(5),(6),(7),(8),(9)
select *
into #tablaorder
from
Sales.SalesOrderHeader
cross join
#t1
Aquí tenemos una nueva tabla (sin ningún tipo de índices) la cual tiene los registros de Sales.SalesOrderHeader por 10 (para ello hicimos un Cross Join contra una tabla auxiliar)
Bien, ahora lo que haremos es crearle un índice Clúster
create clustered index cl1 on #tablaorder(Salesorderid)
go
Ahora ya tenemos nuestra tabla con un solo índice por numero de orden y que a su vez es Clúster.
Que haremos ahora, pues algo simple, empezaremos a ejecutar consultas contra nuestra tabla, la primera que haremos será sin Ordenamiento y la segunda será con Ordenamiento sobre la columna del índice Clúster, en ambas Querys mostrare el plan de ejecución
select t1.salesorderid from #tablaorder t1
where t1.salesorderid > = 60000
select t1.salesorderid from #tablaorder t1
where t1.salesorderid > = 60000
order by t1.salesorderid
Como podemos observar en ambos casos el plan de ejecución es el mismo, o sea, aplicar un Order By sobre una columna que tiene un índice no genero mas trabajo.
Ahora lo que haremos es justamente ejecutar una query con un Order By sobre una columna sin índice (por ejemplo OrderDate)
select t1.salesorderid,t1.orderdate
from #tablaorder t1
where t1.salesorderid > = 60000
order by t1.orderdate
Ya aquí podemos observar que se agrego una nueva operación (Sort) la cual representa el 60% de todo el Query Plan, si hacemos la comparativa entre los dos Query Plan (sin Order By y con Order By sobre OrderDate) vamos a encontrarnos con lo siguiente
Aquí podemos observar que del total del tiempo (ambas querys) la segunda y la que contiene el Order By se lleva el 76% lo cual indica que es mucho mas lenta que la primera que no tiene un Order By.
Esto porque se da? pues como vimos estamos ordenando por una columna sin índices, ahora lo que haremos es crearle un índice por OrderDate a la tabla y volver a correr las Querys
create index cl2 on #tablaorder(orderdate)
select t1.salesorderid,t1.orderdate
from #tablaorder t1
where t1.salesorderid > = 60000
select t1.salesorderid,t1.orderdate
from #tablaorder t1
where t1.salesorderid > = 60000
order by t1.orderdate
Ahora podemos ver que ambas querys tardan lo mismo y que la operación de Sort ha desaparecido gracias al índice que
hemos creado.
Conclusiones:
El Order By es una sentencia muy útil pero tenemos que tener nuestros cuidados, y aquí viene la parte para reflexionar:
Cuando usamos Order By existe la posibilidad que el usuario cambie el Orden luego? o es importante el Orden en lo que
estamos retornando? pensemos que cada vez que ponemos un Order By podemos estar penalizando el rendimiento si no
tenemos los índices adecuados y muchas veces los Order By que usamos no tienen sentido ya que se pueden hacer
desde el reporte o la aplicación, entonces no le demos una sobrecarga el motor (vimos que hasta un 60% represento)
si es que no tiene sentido, es mas les cuento que en mi experiencia he resuelto algunos temas de performance en querys
simplemente por eliminar un Order By innecesario, recordemos que los Order By los podemos hacer muchas veces en
la grilla de nuestra aplicación sin castigar al motor de base de datos que es un recurso mas critico, imaginemos una query
con Order By innecesario que la usan cientos de usuarios por día
Aquí le dejo el código script para que hagan sus pruebas