Contar valores únicos agrupados por uma coluna específica é uma tarefa comum na análise de dados. O Pandas fornece vários métodos para conseguir isso.
No seu caso, você tem um DataFrame com colunas 'ID' e 'domínio' e precisa contar valores de 'ID' exclusivos para cada 'domínio'.
Usando df.groupby['domain', 'ID'].count()':
Este método retorna um DataFrame com contagens para grupos de 'ID' e 'domínio' . No entanto, ele conta o número de linhas em cada grupo, não apenas os valores exclusivos de 'ID'.
Solution with `nunique()':
df.groupby ('domain')['ID'].nunique() calcula a contagem exclusiva de 'ID' para cada grupo de 'domínio'. O DataFrame resultante terá a coluna 'domínio' como índice e a contagem como uma nova coluna. aspas simples, use df.domain.str.strip("'") para removê-las antes do agrupamento.
Preservar nome da coluna:
Para manter o 'ID' nome da coluna no resultado, use df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique}). Isso criará um DataFrame com as colunas 'domínio' e 'ID' (contagem exclusiva).
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3