특정 열로 그룹화된 고유 값을 계산하는 것은 데이터 분석에서 일반적인 작업입니다. Pandas는 이를 달성하기 위한 다양한 방법을 제공합니다.
귀하의 경우 'ID' 및 '도메인' 열이 있는 DataFrame이 있고 각 '도메인'에 대해 고유한 'ID' 값을 계산해야 합니다.
df.groupby['domain', 'ID'].count()':
사용 이 메서드는 'ID' 및 '도메인' 그룹 모두에 대한 개수가 포함된 DataFrame을 반환합니다. . 그러나 고유한 'ID' 값뿐만 아니라 각 그룹의 행 수를 계산합니다.
`nunique()'를 사용한 솔루션:
df.groupby ('domain')['ID'].nunique()는 각 '도메인' 그룹에 대한 고유한 'ID' 개수를 계산합니다. 결과 DataFrame은 '도메인' 열을 인덱스로 갖고 해당 개수를 새 열로 갖게 됩니다.
작은따옴표 제거:
'도메인' 열에 다음이 포함된 경우 작은따옴표의 경우 df.domain.str.strip("'")을 사용하여 그룹화하기 전에 제거하십시오.
열 이름 유지:
'ID'를 유지하려면 결과의 열 이름을 보려면 df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})를 사용하세요. 그러면 '도메인' 및 'ID'(고유 개수) 열이 있는 DataFrame이 생성됩니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3