"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > NumPy 배열에서 고유 값을 효율적으로 계산하는 방법은 무엇입니까?

NumPy 배열에서 고유 값을 효율적으로 계산하는 방법은 무엇입니까?

2024년 11월 11일에 게시됨
검색:940

How to Efficiently Count Unique Values in a NumPy Array?

NumPy 배열에서 고유 값의 빈도 수를 효율적으로 결정

이 문서에서는 NumPy 배열 내에서 고유 값의 빈도 수를 계산하는 효율적인 방법을 살펴봅니다.

return_counts=True인 numpy.unique 사용(예: NumPy 버전 1.9 이상)을 사용하면 고유한 값과 해당 개수를 효율적으로 계산할 수 있습니다. 예시:

import numpy as np

x = np.array([1,1,1,2,2,2,5,25,1,1])
unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)

이 접근 방식은 성능 벤치마크에서 볼 수 있듯이 실행 속도 측면에서 scipy.stats.itemfreq 함수보다 훨씬 뛰어납니다.

In [4]: x = np.random.random_integers(0,100,1e6)

In [5]: %timeit unique, counts = np.unique(x, return_counts=True)
10 loops, best of 3: 31.5 ms per loop

In [6]: %timeit scipy.stats.itemfreq(x)
10 loops, best of 3: 170 ms per loop
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3