취준을 하다보면 가끔 closed book으로 데이터 분석 테스트를 요구하는 회사들이 있다.
그런 테스트를 대비하기 위한 주요 패키지들의 빈출 함수 및 메서드에 대한 치팅시트를 만들어 보았다.
물론 직접 만들지는 않았고, ChatGPT-o1이 만들어줬으니 사용하실 분들은 얼마든지 사용하시길!
NumPy 치트 시트: 데이터 분석 테스트를 위한 필수 기능
import numpy as np
# 리스트로부터 배열 생성
arr = np.array([1, 2, 3])
# 0으로 초기화된 배열 생성
zeros = np.zeros((행, 열))
# 1로 초기화된 배열 생성
ones = np.ones((행, 열))
# 특정 값으로 초기화된 배열 생성
full = np.full((행, 열), 값)
# 단위 행렬 생성
eye = np.eye(크기)
# 랜덤 값으로 배열 생성
rand = np.random.random((행, 열))
# 연속된 숫자로 배열 생성
seq = np.arange(시작, 끝, 간격)
# 균등 간격으로 배열 생성
lin = np.linspace(시작, 끝, 요소수)
# 배열 형태 확인
arr.shape
# 배열 형태 변경
arr_reshaped = arr.reshape(새로운_행, 새로운_열)
# 배열 평탄화
flat = arr.flatten()
# 배열 전치
transposed = arr.T
# 배열 타입 확인
arr.dtype
# 배열 타입 변경
arr = arr.astype('타입')
# 특정 요소 접근
element = arr[인덱스]
# 다차원 배열에서 요소 접근
element = arr[행인덱스, 열인덱스]
# 슬라이싱
slice = arr[시작:끝]
# 조건부 인덱싱
cond = arr[arr > 값]
# 요소별 연산
sum_arr = arr1 + arr2
diff_arr = arr1 - arr2
prod_arr = arr1 * arr2
div_arr = arr1 / arr2
# 스칼라 연산
scaled_arr = arr * 값
# 행렬 곱셈
dot_product = np.dot(arr1, arr2)
# 합계
total = np.sum(arr)
# 평균
mean = np.mean(arr)
# 중앙값
median = np.median(arr)
# 표준편차
std_dev = np.std(arr)
# 분산
variance = np.var(arr)
# 최소값
min_val = np.min(arr)
# 최대값
max_val = np.max(arr)
# 누적 합계
cumsum = np.cumsum(arr)
# 누적 곱
cumprod = np.cumprod(arr)
# 배열 결합
concatenated = np.concatenate((arr1, arr2), axis=0)
# 배열 분할
split_arr = np.split(arr, 분할수)
# 고유 값 찾기
unique_vals = np.unique(arr)
# 배열 정렬
sorted_arr = np.sort(arr)
# 조건에 따른 요소 선택
where_arr = np.where(arr > 값, 참일_때, 거짓일_때)
# 배열 복사
arr_copy = arr.copy()
# 균등 분포 난수 생성
rand_arr = np.random.rand(행, 열)
# 정규 분포 난수 생성
randn_arr = np.random.randn(행, 열)
# 정수 난수 생성
randint_arr = np.random.randint(최소값, 최대값, 크기)
# 행렬 내적
dot_product = np.dot(arr1, arr2)
# 행렬식 계산
determinant = np.linalg.det(arr)
# 역행렬 계산
inverse = np.linalg.inv(arr)
# 고유값과 고유벡터
eigenvalues, eigenvectors = np.linalg.eig(arr)
# 선형 방정식 풀기
solution = np.linalg.solve(coeff_matrix, dep_vector)
# NaN 체크
nan_mask = np.isnan(arr)
# 무한대 체크
inf_mask = np.isinf(arr)
# NaN을 특정 값으로 대체
arr[np.isnan(arr)] = 대체값
# 무한대를 특정 값으로 대체
arr[np.isinf(arr)] = 대체값
# 텍스트 파일 저장
np.savetxt('파일명.txt', arr, delimiter=',')
# 텍스트 파일 로드
arr = np.loadtxt('파일명.txt', delimiter=',')
# 바이너리 파일 저장
np.save('파일명.npy', arr)
# 바이너리 파일 로드
arr = np.load('파일명.npy')
이 치트 시트는 데이터 분석 테스트에서 자주 사용되는 NumPy의 핵심 기능들을 요약한 것입니다. 배열 연산과 수학적 계산에서 이 코드를 참고하여 효율적으로 문제를 해결하세요. 성공을 기원합니다! 🚀