À l'intérieur des jointures SQL

Page de garde > La programmation > À l'intérieur des jointures SQL

À l'intérieur des jointures SQL

Publié le 2024-11-07

Parcourir:725

Inside SQL Joins

Les jointures SQL sont fondamentales pour interroger les bases de données, permettant aux utilisateurs de combiner les données de plusieurs tables en fonction de conditions spécifiées. Les jointures sont classées en deux types principaux : les jointures logiques et les jointures physiques. Les jointures logiques représentent la manière conceptuelle dont les données des tables sont combinées, tandis que les jointures physiques font référence à la mise en œuvre réelle de ces jointures dans des systèmes de bases de données tels que RDS (Relational Database Service) ou d'autres serveurs SQL. Dans l'article de blog d'aujourd'hui, nous allons percer les mystères des jointures SQL.

Allons-y !

Jointure logique

Il existe différents types de jointures logiques dans SQL. Les deux plus courantes sont la jointure interne et la jointure externe. Nous utilisons ces jointures lorsque nous devons récupérer des données à partir de tables.

Rejoindre physique

Les jointures physiques sont implémentées dans RDS. L'utilisateur écrit la requête à l'aide d'une jointure logique et RDS utilise une jointure physique pour effectuer les opérations de jointure. Il existe différents types de jointures physiques comme
1. Jointure de boucle imbriquée
2. Rejoindre par hachage
3. Fusionner, rejoindre et ainsi de suite

Jointure par boucle imbriquée

Il s'agit d'un type de jointure dans lequel une table plus petite avec moins d'enregistrements est sélectionnée et parcourue en boucle dans l'autre table jusqu'à ce qu'une correspondance soit trouvée. Ce type de jointure est disponible sur les serveurs MySQL, Postgres et même SQL. Cependant, ce n’est pas une option évolutive pour les grandes tables. Il est principalement utilisé dans les cas où l'opérateur de jointure n'utilise pas l'égalité.

Par exemple, requêtes géospatiales : lorsque vous traitez des données géographiques, vous souhaiterez peut-être rechercher des points situés à une certaine distance des autres points. Cela pourrait impliquer de comparer la distance entre chaque combinaison de points, ce qui pourrait être réalisé avec une jointure de boucle imbriquée.

SELECT * FROM cities JOIN landmarks ON distance(cities.location, landmarks.location)

Rejoindre par hachage

La jointure par hachage est une méthode d'exécution d'une jointure à l'aide de la table de hachage pour trouver un enregistrement de correspondance. Une table de hachage est créée en mémoire. S'il y a une grande quantité de données et qu'il n'y a pas assez de mémoire pour les stocker, elles sont alors écrites sur le disque. La jointure par hachage est plus efficace que la jointure par Nested Loop. Pendant l'exécution, RDS crée la table de hachage en mémoire où les lignes de la table de jointure sont stockées en utilisant l'attribut de jointure comme clé. Après l'exécution, le serveur commence à lire les lignes de l'autre table et trouve la ligne correspondante de la table de hachage. Cette méthode est couramment utilisée lorsque l'opérateur de jointure utilise l'égalité.

Supposons que vous ayez une table « Employé » avec des détails sur l'employé tels que l'ID, le nom et l'ID du service, et une table « Département » avec des détails sur le service comme l'ID et le nom. Vous souhaitez rejoindre ces tables pour obtenir le service auquel appartient chaque employé

SELECT *
FROM Employee
JOIN Department ON Employee.department_id = Department.department_id;

Dans cet exemple, la condition de jointure est basée sur l'égalité entre les colonnes, ce qui la rend adaptée à une jointure par hachage. Cette méthode est efficace, en particulier lorsqu'il s'agit de grands ensembles de données, car elle peut rapidement faire correspondre des enregistrements à l'aide de la table de hachage. Cependant, comme pour toute méthode de jointure, il est important de prendre en compte la taille des ensembles de données et la mémoire disponible pour garantir des performances optimales.

Fusionner Rejoindre

Merge Join est une méthode utilisée dans l'exécution de requêtes SQL lorsque la condition de jointure utilise un opérateur d'égalité et que les deux côtés de la jointure sont grands. Cette technique repose sur des entrées de données triées. S'il existe un index sur les expressions utilisées dans la colonne de jointure, il peut être utilisé pour obtenir efficacement les données triées. Toutefois, si le serveur doit trier explicitement les données, il est crucial d'analyser les index et d'envisager de les optimiser pour améliorer les performances.

Exemple:
Prenons un scénario impliquant une table « Ventes » avec les transactions de vente, y compris l'ID de vente, l'ID client et le montant de la vente, et une table « Clients » contenant les détails du client tels que l'ID client, le nom et l'emplacement.

SELECT *
FROM Sales
JOIN Customers ON Sales.customer_id = Customers.customer_id;

Dans ce cas, les tables "Ventes" et "Clients" sont toutes deux substantielles et la condition de jointure repose sur l'égalité de la colonne "customer_id". Pour une jointure de fusion efficace, les deux tables d'entrée doivent être triées par colonne de jointure ("customer_id"). S'il n'existe aucun index dans la colonne "customer_id", le serveur devra peut-être effectuer des opérations de tri supplémentaires, ce qui pourrait avoir un impact sur les performances.

Pour optimiser la jointure de fusion, il est conseillé de créer ou de modifier des index sur la colonne "customer_id" dans les deux tables. Assurer une maintenance et une optimisation appropriées de ces index peut conduire à des améliorations significatives des performances des requêtes, en particulier pour les requêtes impliquant fréquemment des jointures basées sur la colonne « customer_id ».

En exploitant efficacement les index et en garantissant des entrées de données triées, les jointures de fusion peuvent gérer efficacement les jointures entre de grandes tables avec des conditions de jointure basées sur l'égalité, contribuant ainsi à améliorer les performances des requêtes et l'efficacité globale du système.

Aspect	Jointure par boucle imbriquée	Jointure par hachage	Fusionner la jointure
Condition de jointure	Non-égalité	Égalité	Égalité
Taille des données d'entrée	Petit à Moyen	Moyen à Grand	Grand
Tri des données	Non requis	Non requis	Requis
Utilisation de la mémoire	Faible	Modéré à élevé	Modéré à élevé
Utilisation de l'index	Pas une préoccupation majeure	Avantageux	S'appuie sur des index
Performances (grands ensembles de données)	Ralentissez	Efficace	Efficace
Évolutivité	Moins évolutif	Évolutif	Évolutif
Cas d'utilisation typiques	Tables de petite et moyenne taille	Grandes tables avec jointures d'égalité	Grandes tables avec jointures d'égalité

Déclaration de sortie Cet article est reproduit sur : https://dev.to/balajisasi/inside-sql-joins-5h6b?1 En cas de violation, veuillez contacter [email protected] pour le supprimer.

Dernier tutoriel Plus>

Dois-je supprimer explicitement les allocations de tas en C ++ avant la sortie du programme?
Délétion explicite en C malgré la sortie du programme Lorsque vous travaillez avec l'allocation de mémoire dynamique en C, les développeur...

La programmation Publié le 2025-07-21
Comment créer une animation CSS à gauche à gauche en douceur pour une div dans son conteneur?
Animation CSS générique pour le mouvement gauche-droit Dans cet article, nous explorerons la création d'une animation CSS générique pour d...

La programmation Publié le 2025-07-21
Comment contourner les blocs de site Web avec les demandes de Python et les faux agents utilisateur?
Comment simuler le comportement du navigateur avec les demandes de Python et les faux agents utilisateur Les demandes de Python sont un outil ...

La programmation Publié le 2025-07-21
Spark DataFrame Conseils pour ajouter des colonnes constantes
Création d'une colonne constante dans une étincelle DataFrame L'ajout d'une colonne constante à une étincelle DataFrame avec une v...

La programmation Publié le 2025-07-21
Java autorise-t-il plusieurs types de retour: un regard plus approfondi sur les méthodes génériques?
Plusieurs types de retour en java: une idée fausse dévoilée dans le domaine de la programmation java, une signature de méthode particulière pe...

La programmation Publié le 2025-07-21
Pourquoi les images ont-elles encore des frontières en chrome? `Border: Aucun;` solution non valide
Suppression de la bordure d'image en chrome Un problème fréquent rencontré lorsque vous travaillez avec des images dans Chrome et IE9 est ...

La programmation Publié le 2025-07-21
Pourquoi HTML ne peut pas imprimer les numéros de page et les solutions
Imprimez des numéros de page sur les pages html? Description du problème: malgré les recherches approfondies, les numéros de page parviennen...

La programmation Publié le 2025-07-21
Analyse du langage fortement tapé CSS
L'une des façons de classer un langage de programmation est de la force ou de la manière faible. Ici, «tapé» signifie si les variables sont connu...

La programmation Publié le 2025-07-21
Comment puis-je gérer les noms de fichiers UTF-8 dans les fonctions du système de fichiers de PHP?
Gestion des noms de fichiers UTF-8 dans les fonctions de fichiers de Php Lors de la création de dossiers contenant des caractères UTF-8 à l...

La programmation Publié le 2025-07-21
Pourquoi les expressions de lambda nécessitent-elles des variables "finales" ou "finales" valides "en Java?
Lambda Les expressions exigent des variables "finales" ou "efficacement finales" Le message d'erreur "variable ut...

La programmation Publié le 2025-07-21
Méthode PHP simplexml Analyse XML avec un colon d'espace de noms
Analyse xml avec des colons d'espace de noms dans php simplexml Rencontre des difficultés lors de l'analyse des balises contenant des ...

La programmation Publié le 2025-07-21
Python Metaclass Principe de travail et création et personnalisation de classe
Que sont les métaclasses dans python? Les métaclasses sont responsables de la création d'objets de classe dans Python. Tout comme les classe...

La programmation Publié le 2025-07-21
Comment supprimer proprement les gestionnaires d'événements JavaScript anonymes?
supprimer les auditeurs d'événements anonymes Ajouter des auditeurs d'événements anonymes aux éléments offre une flexibilité et une simp...

La programmation Publié le 2025-07-21
CSS peut-il localiser les éléments HTML basés sur une valeur d'attribut?
ciblant les éléments html avec n'importe quelle valeur d'attribut dans CSS Dans CSS, il est possible de cibler les éléments basés sur ...

La programmation Publié le 2025-07-21
Comment télécharger des fichiers avec des paramètres supplémentaires à l'aide de java.net.urlconnection et de codage multipart / formulaire de formulaire?
Téléchargement des fichiers avec des demandes http pour télécharger des fichiers sur un serveur http tout en soumettant des paramètres supplém...

La programmation Publié le 2025-07-21

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article