> Tech > DISTINCT et UNION

DISTINCT et UNION

Tech - Par Renaud ROSSET - Publié le 24 juin 2010

La clause DISTINCT permet d'éliminer les doublons à l'intérieur d'une colonne. A l'instar de la clause GROUP BY, les versions de SQL Server antérieures à la version 7.0 trient toujours les données de manière à supprimer les doublons. Mais l'optimiseur de SQL Server 7.0 peut, selon le coût de l'option

retenue, utiliser
le tri ou le hachage pour éliminer les doublons.
Voici quelques exemples illustrant la manière dont l’optimiseur de requêtes traite
la clause DISTINCT dans différentes conditions. En premier lieu, il faut exécuter
le code de configuration présenté dans le listing 1 /Files/09/8612/Listing_01.txt
pour créer l’exemple de table de commandes utilisé à travers le reste de cet article.
Notre table de commandes est identique à celle de Northwind, à une exception près
: nous avons augmenté la taille de la table à 100.000 enregistrements pour simuler
un environnement de production pour les tests de performances et d’optimisation.
Nous pouvons à présent exécuter la requête suivante, qui classe les enregistrements
de la table en fonction de la clause DISTINCT de l’instruction SELECT et d’un
index non clusterisé dans la colonne orderid. (Assurez-vous d’activer l’option
Show Execution Plan dans le menu Query de l’analyseur de requêtes afin de visualiser
le plan de l’optimiseur) :

Use Northwind
select distinct orderid
from orders
where customerid = ‘WHITC’

L’écran 1 montre que l’optimiseur utilise le tri pour traiter la requête. Si on
n’utilise pas l’index sur orderid, la même requête utilise le hachage à la place
du tri pour générer ses résultats. Si par exemple on exécute la requête sans la
clause WHERE, l’optimiseur utilisera un plan d’exécution similaire à celui illustré
par l’écran 2.

L’opérateur UNION fusionne deux tables en un seul ensemble de résultats contenant
tous les enregistrements apparaissant dans l’une des tables ou dans les deux.
Le traitement UNION est différent selon que l’on utilise ou non l’option ALL.
Si on spécifie ALL, l’optimiseur affiche tous les enregistrements résultants,
y compris les doublons. Si on ne spécifie pas ALL, l’optimiseur traite l’opérateur
UNION de la même manière que la clause DISTINCT, et supprime tous les enregistrements
en doublon.

      Listing 1 Code utilisé pour configurer des tables triées

create table orders (orderid int not null,
                     customerid char(5) not null,
                     orderdate datetime default getdate() null,
                     shippeddate datetime null,
                     freight money null,
                     shipname varchar(40) null,
                     shipaddress varchar(60) null)
go
declare @i int , @order_id integer
declare @customer_id char(5)
declare @shipped_date datetime
declare @freight money

set @i = 1
set @customer_id = 'ALKHE'
set @shipped_date = getdate()
set @freight = 100.00
while @i < 100001
begin
insert into orders (orderid, customerid, shippeddate, freight)
   values( @i, @customer_id, @shipped_date, @freight)
set @i = @i+1
end 
go
update orders set customerid= 'WHITC'
  where orderid % 1000 = 213
go

Téléchargez cette ressource

État des lieux de la sécurité cloud-native

L’État des lieux de la sécurité cloud-native vous offre une analyse complète des problématiques, des tendances et des priorités qui sous-tendent les pratiques de sécurité cloud-native dans le monde entier. Une lecture indispensable pour renforcer votre stratégie de sécurité dans le cloud. Une mine d’infos exclusives pour élaborer votre stratégie de sécurité cloud-native.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010

Découvrir tous les articles de la chaîne Tech

Les articles les plus consultés

A travers cette chaîne

A travers ITPro

Les plus consultés sur iTPro.fr

A lire aussi sur le site

Le Club EBIOS, une communauté dédiée à la gestion des risques autour de la méthode EBIOS

Avez-vous déjà entendu parler du Club EBIOS ? Olivier Ligneul, Président du Club EBIOS, Directeur cybersécurité du Groupe EDF et expert judiciaire, a accepté de nous éclairer sur le sujet.