Comment trouver les lignes présentes dans une trame de données mais pas dans une autre (en comparant df1 et df2) ?

Page de garde > La programmation > Comment trouver les lignes présentes dans une trame de données mais pas dans une autre (en comparant df1 et df2) ?

Comment trouver les lignes présentes dans une trame de données mais pas dans une autre (en comparant df1 et df2) ?

Publié le 2024-11-08

Parcourir:288

How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

Comparer des trames de données : rechercher des lignes présentes dans l'une mais pas dans l'autre

Comparer des trames de données pour identifier les différences est crucial pour l'assurance qualité et la fusion des données opérations. Dans ce cas, nous avons deux dataframes (df1 et df2) avec une structure spécifique et devons déterminer les lignes présentes dans df2 mais pas dans df1.

Initialement, les tentatives de comparaison des dataframes en utilisant df1 != df2 ont abouti à une erreur. Cette approche ne fonctionne que pour les dataframes avec des lignes et des colonnes identiques. Pour trouver des différences symétriques, nous avons besoin d'une approche différente.

Une méthode consiste à concaténer les trames de données :

df = pd.concat([df1, df2])
df = df.reset_index(drop=True)

Ensuite, regroupez le dataframe concaténé par toutes les colonnes :

df_gpby = df.groupby(list(df.columns))

Ensuite, nous identifions les enregistrements uniques en obtenant les valeurs d'index là où une seule ligne existe :

idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]

En utilisant ces indices, nous pouvons filtrer la trame de données pour obtenir le résultat souhaité :

df.reindex(idx)

Cette approche fournit les lignes présentes dans df2 mais absentes dans df1 sur la base de la comparaison de l'index Date et du Fruit colonne.

Déclaration de sortie Cet article est reproduit le: 1729343178 S'il y a une contrefaçon, veuillez contacter [email protected] pour le supprimer.

Dernier tutoriel Plus>

Comment convertir une colonne Pandas DataFrame au format DateTime et filtrer par date?
Transformer la colonne Pandas DataFrame au format DateTime Scénario: Données dans un Pandas DataFrame existait souvent sous divers formats, ...

La programmation Publié le 2025-05-12
Comment définir dynamiquement les touches dans les objets JavaScript?
Comment créer une clé dynamique pour une variable d'objet JavaScript lorsque vous essayez de créer une clé dynamique pour un objet JavaScrip...

La programmation Publié le 2025-05-12
Comment insérer correctement les blobs (images) dans MySQL à l'aide de PHP?
Insérez des blobs dans les bases de données MySQL avec PHP Lorsque vous essayez de stocker une image dans une base de données MySQL, vous pou...

La programmation Publié le 2025-05-12
Pourquoi une grille avec des colonnes 100% grid-template s'étend-elle au-delà du corps lors de l'utilisation du positionnement fixe?
La grille dépasse le corps avec 100% grid-template-columns Pourquoi une grille d'affichage avec 100% dans les colonnes de la grille s'...

La programmation Publié le 2025-05-12
Pourquoi Java ne peut-il pas créer des tableaux génériques?
Erreur de création de table ArrayList [2]; Java rapporte une erreur "création de tableau générique". Pourquoi cela n'est-il pas ...

La programmation Publié le 2025-05-12
Comment résoudre l'erreur "Impossible de deviner le type de fichier, utiliser l'application / l'octet-stream ..." dans Applexinement?
Appangement static File mime type override Dans Appengine, les gestionnaires de fichiers statiques peuvent parfois remplacer le type de mime c...

La programmation Publié le 2025-05-12
Eval () vs.st.literal_eval (): Quelle fonction Python est plus sûre pour la saisie de l'utilisateur?
pesant eval () et ast.literal_eval () dans Python Security Lors de la gestion de l'entrée de l'utilisateur, il est impératif de priori...

La programmation Publié le 2025-05-12
Python Efficace Way de supprimer les balises HTML du texte
Déroup des balises HTML en python pour une représentation textuelle vierge manipulant les réponses HTML à extraire le contenu de texte pertine...

La programmation Publié le 2025-05-12
Comment puis-je générer efficacement des limaces adaptées à l'URL des chaînes Unicode en PHP?
Créant une fonction pour la génération efficace des limaces Création de limaces, des représentations simplifiées des chaînes Unicode utilisées...

La programmation Publié le 2025-05-12
La méthode de la base de données MySQL n'est pas nécessaire pour vider la même instance
Copie d'une base de données mysql sur la même instance sans vider copie une base de données sur la même instance mysql peut être faite san...

La programmation Publié le 2025-05-12
Pourquoi les images ont-elles encore des frontières en chrome? `Border: Aucun;` solution non valide
Suppression de la bordure d'image en chrome Un problème fréquent rencontré lorsque vous travaillez avec des images dans Chrome et IE9 est ...

La programmation Publié le 2025-05-12
Quelle est la différence entre les fonctions imbriquées et les fermetures en python
fonctions imbriquées par rapport aux fermetures en python Bien que les fonctions imbriquées dans Python ressemblent superficiellement Non-Clos...

La programmation Publié le 2025-05-12
Spark DataFrame Conseils pour ajouter des colonnes constantes
Création d'une colonne constante dans une étincelle DataFrame L'ajout d'une colonne constante à une étincelle DataFrame avec une v...

La programmation Publié le 2025-05-12
Pourquoi les expressions de lambda nécessitent-elles des variables "finales" ou "finales" valides "en Java?
Lambda Les expressions exigent des variables "finales" ou "efficacement finales" Le message d'erreur "variable ut...

La programmation Publié le 2025-05-12
Pourquoi HTML ne peut pas imprimer les numéros de page et les solutions
Imprimez des numéros de page sur les pages html? Description du problème: malgré les recherches approfondies, les numéros de page parviennen...

La programmation Publié le 2025-05-12

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article