[numpy] unique

About_work·2024년 2월 6일

numpy

목록 보기

2/8

np.unique 함수
- 넘파이(Numpy) 배열에서 모든 고유한 요소를 찾아서 정렬된 형태로 반환
- 이 함수는 데이터 분석에서 중복 값을 제거하고, 데이터의 고유한 값을 파악할 때 유용

기본 사용법:

numpy.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)

ar: 입력 배열입니다.
return_index (False): True로 설정하면, 각 고유 값이 처음 나타나는 위치의 인덱스를 추가로 반환
return_inverse (False): True로 설정하면, 원래 배열을 재구성할 때 사용할 수 있는 고유 값의 인덱스를 반환
return_counts (False): True로 설정하면, 각 고유 값이 배열에 나타나는 횟수를 추가로 반환
axis (None): 고유 값을 찾을 축입니다. 기본값은 None으로, 이 경우 입력 배열이 평탄화되어 처리

반환 값과 데이터 타입, 차원:

고유한 값(unique_values)

입력 배열 ar에서 발견된 고유한 값들의 정렬된 배열
반환 배열의 데이터 타입은 입력 배열 ar의 데이터 타입과 일치
반환 배열의 차원은 기본적으로 1차원

인덱스(indices):

return_index=True로 설정할 경우, 각 unique_values이 input 배열 ar에서 처음 나타나는 위치의 인덱스를 포함하는 array을 반환
이 array은 정수 타입이며, 차원은 1차원

역 인덱스(inverse_indices):

return_inverse=True로 설정할 경우, 원본 배열 ar을 재구성할 때 사용할 수 있는 고유 값의 인덱스를 포함하는 배열을 반환
이 배열은 원본 배열과 같은 길이를 가지며, 데이터 타입은 정수
차원은 원본 배열 ar과 동일

카운트(counts):

return_counts=True로 설정할 경우,
- 각 unique_values이 입력 배열 ar에 나타나는 횟수를 포함하는 배열을 반환
이 배열은 정수 타입이며, 차원은 1차원

예시: [매우 중요]

import numpy as np

# 입력 배열
arr = np.array([4, 2, 2, 1, 5, 5, 5, 3])

# 고유한 값, 인덱스, 역 인덱스, 카운트 반환
unique_values, indices, inverse_indices, counts = np.unique(arr,
                                                            return_index=True,
                                                            return_inverse=True,
                                                            return_counts=True)

print("고유한 값:", unique_values)  # [1 2 3 4 5]
# 각 고유 값이 처음 나타나는 위치
print("인덱스:", indices)  # [3 1 7 0 4]
# 원본 배열을 재구성할 수 있는 인덱스 배열
print("역 인덱스:", inverse_indices)  # [3 1 1 0 4 4 4 2]
# 각 고유 값의 출현 횟수
print("카운트:", counts)  # [1 2 1 1 3]

About_work

새로운 것이 들어오면 이미 있는 것과 충돌을 시도하라.

이전 포스트

[numpy] np.where , np.argsort

다음 포스트

[numpy] unique

numpy

기본 사용법:

반환 값과 데이터 타입, 차원:

예시: [매우 중요]

[numpy] np.where , np.argsort

numpy type annotation

0개의 댓글