Das Zählen eindeutiger Werte, die nach einer bestimmten Spalte gruppiert sind, ist eine häufige Aufgabe bei der Datenanalyse. Pandas bietet verschiedene Methoden, um dies zu erreichen.
In Ihrem Fall haben Sie einen DataFrame mit den Spalten „ID“ und „Domäne“ und müssen eindeutige „ID“-Werte für jede „Domäne“ zählen.
Using df.groupby['domain', 'ID'].count()':
Diese Methode gibt einen DataFrame mit Anzahlen für beide zurück Gruppen „ID“ und „Domäne“. Es zählt jedoch die Anzahl der Zeilen in jeder Gruppe, nicht nur die eindeutigen „ID“-Werte.
Lösung mit „nunique()“:
df.groupby ('domain')['ID'].nunique() berechnet die eindeutige 'ID'-Anzahl für jede 'Domain'-Gruppe. Der resultierende DataFrame hat die Spalte „Domäne“ als Index und die Anzahl als neue Spalte.
Einfache Anführungszeichen entfernen:
Wenn Ihre Spalte „Domäne“ enthält Einfache Anführungszeichen, verwenden Sie df.domain.str.strip("'"), um sie vor dem Gruppieren zu entfernen.
Spalte beibehalten Name:
Um den Spaltennamen „ID“ im Ergebnis beizubehalten, verwenden Sie df.groupby(by='domain', as_index=False).agg({'ID': pd.Series. nunique}). Dadurch wird ein DataFrame mit den Spalten „Domäne“ und „ID“ (eindeutige Anzahl) erstellt.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3