「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > Pandas で列ごとにグループ化された一意の値を数える方法

Pandas で列ごとにグループ化された一意の値を数える方法

2024 年 11 月 3 日に公開
ブラウズ:607

How to Count Unique Values Grouped by a Column with Pandas?

Pandas を使用してグループごとに一意の値をカウントする

特定の列でグループ化された一意の値をカウントすることは、データ分析の一般的なタスクです。 Pandas は、これを実現するためのさまざまなメソッドを提供します。

あなたの場合、「ID」列と「ドメイン」列を持つ DataFrame があり、「ドメイン」ごとに一意の「ID」値をカウントする必要があります。

df.groupby['domain', 'ID'].count()':

を使用すると、このメソッドは次の結果を返します「ID」グループと「ドメイン」グループの両方のカウントを含むデータフレーム。ただし、一意の 'ID' 値だけでなく、各グループの行数もカウントします。

`nunique()' による解決策:

df.groupby ('domain')['ID'].nunique() は、各「ドメイン」グループの一意の「ID」数を計算します。結果のデータフレームには、インデックスとして「ドメイン」列が含まれ、新しい列としてカウントが含まれます。

一重引用符の削除:

「ドメイン」列に一重引用符は、グループ化する前に df.domain.str.strip("'") を使用して削除します。

列を保持名前:

結果に「ID」列名を保持するには、df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.ユニークな})。これにより、「domain」列と「ID」(一意の数)列を持つ DataFrame が作成されます。

リリースステートメント この記事は次の場所に転載されています: 1729237577 侵害がある場合は、[email protected] に連絡して削除してください。
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3