特定の列でグループ化された一意の値をカウントすることは、データ分析の一般的なタスクです。 Pandas は、これを実現するためのさまざまなメソッドを提供します。
あなたの場合、「ID」列と「ドメイン」列を持つ DataFrame があり、「ドメイン」ごとに一意の「ID」値をカウントする必要があります。
df.groupby['domain', 'ID'].count()':
を使用すると、このメソッドは次の結果を返します「ID」グループと「ドメイン」グループの両方のカウントを含むデータフレーム。ただし、一意の 'ID' 値だけでなく、各グループの行数もカウントします。
`nunique()' による解決策:
df.groupby ('domain')['ID'].nunique() は、各「ドメイン」グループの一意の「ID」数を計算します。結果のデータフレームには、インデックスとして「ドメイン」列が含まれ、新しい列としてカウントが含まれます。
一重引用符の削除:
「ドメイン」列に一重引用符は、グループ化する前に df.domain.str.strip("'") を使用して削除します。
列を保持名前:
結果に「ID」列名を保持するには、df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.ユニークな})。これにより、「domain」列と「ID」(一意の数)列を持つ DataFrame が作成されます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3