"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > À l'intérieur des jointures SQL

À l'intérieur des jointures SQL

Publié le 2024-11-07
Parcourir:159

Inside SQL Joins

Les jointures SQL sont fondamentales pour interroger les bases de données, permettant aux utilisateurs de combiner les données de plusieurs tables en fonction de conditions spécifiées. Les jointures sont classées en deux types principaux : les jointures logiques et les jointures physiques. Les jointures logiques représentent la manière conceptuelle dont les données des tables sont combinées, tandis que les jointures physiques font référence à la mise en œuvre réelle de ces jointures dans des systèmes de bases de données tels que RDS (Relational Database Service) ou d'autres serveurs SQL. Dans l'article de blog d'aujourd'hui, nous allons percer les mystères des jointures SQL.

Allons-y !

Jointure logique

Il existe différents types de jointures logiques dans SQL. Les deux plus courantes sont la jointure interne et la jointure externe. Nous utilisons ces jointures lorsque nous devons récupérer des données à partir de tables.

Rejoindre physique

Les jointures physiques sont implémentées dans RDS. L'utilisateur écrit la requête à l'aide d'une jointure logique et RDS utilise une jointure physique pour effectuer les opérations de jointure. Il existe différents types de jointures physiques comme
1. Jointure de boucle imbriquée
2. Rejoindre par hachage
3. Fusionner, rejoindre et ainsi de suite

Jointure par boucle imbriquée

Il s'agit d'un type de jointure dans lequel une table plus petite avec moins d'enregistrements est sélectionnée et parcourue en boucle dans l'autre table jusqu'à ce qu'une correspondance soit trouvée. Ce type de jointure est disponible sur les serveurs MySQL, Postgres et même SQL. Cependant, ce n’est pas une option évolutive pour les grandes tables. Il est principalement utilisé dans les cas où l'opérateur de jointure n'utilise pas l'égalité.

Par exemple, requêtes géospatiales : lorsque vous traitez des données géographiques, vous souhaiterez peut-être rechercher des points situés à une certaine distance des autres points. Cela pourrait impliquer de comparer la distance entre chaque combinaison de points, ce qui pourrait être réalisé avec une jointure de boucle imbriquée.

SELECT *
FROM cities
JOIN landmarks ON distance(cities.location, landmarks.location) 



Rejoindre par hachage

La jointure par hachage est une méthode d'exécution d'une jointure à l'aide de la table de hachage pour trouver un enregistrement de correspondance. Une table de hachage est créée en mémoire. S'il y a une grande quantité de données et qu'il n'y a pas assez de mémoire pour les stocker, elles sont alors écrites sur le disque. La jointure par hachage est plus efficace que la jointure par Nested Loop. Pendant l'exécution, RDS crée la table de hachage en mémoire où les lignes de la table de jointure sont stockées en utilisant l'attribut de jointure comme clé. Après l'exécution, le serveur commence à lire les lignes de l'autre table et trouve la ligne correspondante de la table de hachage. Cette méthode est couramment utilisée lorsque l'opérateur de jointure utilise l'égalité.

Supposons que vous ayez une table « Employé » avec des détails sur l'employé tels que l'ID, le nom et l'ID du service, et une table « Département » avec des détails sur le service comme l'ID et le nom. Vous souhaitez rejoindre ces tables pour obtenir le service auquel appartient chaque employé

SELECT *
FROM Employee
JOIN Department ON Employee.department_id = Department.department_id;

Dans cet exemple, la condition de jointure est basée sur l'égalité entre les colonnes, ce qui la rend adaptée à une jointure par hachage. Cette méthode est efficace, en particulier lorsqu'il s'agit de grands ensembles de données, car elle peut rapidement faire correspondre des enregistrements à l'aide de la table de hachage. Cependant, comme pour toute méthode de jointure, il est important de prendre en compte la taille des ensembles de données et la mémoire disponible pour garantir des performances optimales.

Fusionner Rejoindre

Merge Join est une méthode utilisée dans l'exécution de requêtes SQL lorsque la condition de jointure utilise un opérateur d'égalité et que les deux côtés de la jointure sont grands. Cette technique repose sur des entrées de données triées. S'il existe un index sur les expressions utilisées dans la colonne de jointure, il peut être utilisé pour obtenir efficacement les données triées. Toutefois, si le serveur doit trier explicitement les données, il est crucial d'analyser les index et d'envisager de les optimiser pour améliorer les performances.

Exemple:
Prenons un scénario impliquant une table « Ventes » avec les transactions de vente, y compris l'ID de vente, l'ID client et le montant de la vente, et une table « Clients » contenant les détails du client tels que l'ID client, le nom et l'emplacement.

SELECT *
FROM Sales
JOIN Customers ON Sales.customer_id = Customers.customer_id;

Dans ce cas, les tables "Ventes" et "Clients" sont toutes deux substantielles et la condition de jointure repose sur l'égalité de la colonne "customer_id". Pour une jointure de fusion efficace, les deux tables d'entrée doivent être triées par colonne de jointure ("customer_id"). S'il n'existe aucun index dans la colonne "customer_id", le serveur devra peut-être effectuer des opérations de tri supplémentaires, ce qui pourrait avoir un impact sur les performances.

Pour optimiser la jointure de fusion, il est conseillé de créer ou de modifier des index sur la colonne "customer_id" dans les deux tables. Assurer une maintenance et une optimisation appropriées de ces index peut conduire à des améliorations significatives des performances des requêtes, en particulier pour les requêtes impliquant fréquemment des jointures basées sur la colonne « customer_id ».

En exploitant efficacement les index et en garantissant des entrées de données triées, les jointures de fusion peuvent gérer efficacement les jointures entre de grandes tables avec des conditions de jointure basées sur l'égalité, contribuant ainsi à améliorer les performances des requêtes et l'efficacité globale du système.

Aspect Jointure par boucle imbriquée Jointure par hachage Fusionner la jointure
Condition de jointure Non-égalité Égalité Égalité
Taille des données d'entrée Petit à Moyen Moyen à Grand Grand
Tri des données Non requis Non requis Requis
Utilisation de la mémoire Faible Modéré à élevé Modéré à élevé
Utilisation de l'index Pas une préoccupation majeure Avantageux S'appuie sur des index
Performances (grands ensembles de données) Ralentissez Efficace Efficace
Évolutivité Moins évolutif Évolutif Évolutif
Cas d'utilisation typiques Tables de petite et moyenne taille Grandes tables avec jointures d'égalité Grandes tables avec jointures d'égalité
Déclaration de sortie Cet article est reproduit sur : https://dev.to/balajisasi/inside-sql-joins-5h6b?1 En cas de violation, veuillez contacter [email protected] pour le supprimer.
Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3