」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 如何使用 Pandas 計算按列分組的唯一值?

如何使用 Pandas 計算按列分組的唯一值?

發佈於2024-11-03
瀏覽:546

How to Count Unique Values Grouped by a Column with Pandas?

使用 Pandas 計算每個組的唯一值

計算按特定列分組的唯一值是資料分析中的一個常見任務。 Pandas 提供了多種方法來實現此目的。

在您的情況下,您有一個包含“ID”和“域”列的 DataFrame,需要計算每個“域”的唯一“ID”值。

使用df.groupby['domain', 'ID'].count()':

此方法傳回一個包含'ID' 和'domain' 群組計數的DataFrame 。但是,它計算每個組中的行數,而不僅僅是唯一的“ID”值。

使用「nunique()」的解:

df.groupby ('domain')['ID'].nunique() 計算每個「domain ”組的唯一“ID”計數。產生的 DataFrame 將以 'domain' 欄位作為索引,並將計數作為新欄位。

剝離單引號:

如果您的'domain' 列包含單引號,在分組之前使用df.domain.str.strip("'") 將其刪除。

保留列名:

保留'ID'結果中的列名,使用df.groupby(by='domain', as_index=False).agg( {'ID': pd.Series.nunique})。這將建立一個包含“domain”和“ID”(唯一計數)列的 DataFrame。

版本聲明 本文轉載於:1729237577如有侵犯,請洽[email protected]刪除
最新教學 更多>

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3