데이터분석 테스트를 위한 Numpy 치팅시트

TrainToGPB·2024년 10월 5일
0

Cheat Sheet

목록 보기
2/4
post-thumbnail

취준을 하다보면 가끔 closed book으로 데이터 분석 테스트를 요구하는 회사들이 있다.
그런 테스트를 대비하기 위한 주요 패키지들의 빈출 함수 및 메서드에 대한 치팅시트를 만들어 보았다.
물론 직접 만들지는 않았고, ChatGPT-o1이 만들어줬으니 사용하실 분들은 얼마든지 사용하시길!


NumPy 치트 시트: 데이터 분석 테스트를 위한 필수 기능


📥 배열 생성 및 초기화

import numpy as np

# 리스트로부터 배열 생성
arr = np.array([1, 2, 3])

# 0으로 초기화된 배열 생성
zeros = np.zeros((,))

# 1로 초기화된 배열 생성
ones = np.ones((,))

# 특정 값으로 초기화된 배열 생성
full = np.full((,),)

# 단위 행렬 생성
eye = np.eye(크기)

# 랜덤 값으로 배열 생성
rand = np.random.random((,))

# 연속된 숫자로 배열 생성
seq = np.arange(시작,, 간격)

# 균등 간격으로 배열 생성
lin = np.linspace(시작,, 요소수)

🔄 배열 형태 및 타입 조작

# 배열 형태 확인
arr.shape

# 배열 형태 변경
arr_reshaped = arr.reshape(새로운_행, 새로운_열)

# 배열 평탄화
flat = arr.flatten()

# 배열 전치
transposed = arr.T

# 배열 타입 확인
arr.dtype

# 배열 타입 변경
arr = arr.astype('타입')

🎯 인덱싱 및 슬라이싱

# 특정 요소 접근
element = arr[인덱스]

# 다차원 배열에서 요소 접근
element = arr[행인덱스, 열인덱스]

# 슬라이싱
slice = arr[시작:]

# 조건부 인덱싱
cond = arr[arr >]

➕ 배열 연산

# 요소별 연산
sum_arr = arr1 + arr2
diff_arr = arr1 - arr2
prod_arr = arr1 * arr2
div_arr = arr1 / arr2

# 스칼라 연산
scaled_arr = arr *# 행렬 곱셈
dot_product = np.dot(arr1, arr2)

📊 통계 함수

# 합계
total = np.sum(arr)

# 평균
mean = np.mean(arr)

# 중앙값
median = np.median(arr)

# 표준편차
std_dev = np.std(arr)

# 분산
variance = np.var(arr)

# 최소값
min_val = np.min(arr)

# 최대값
max_val = np.max(arr)

# 누적 합계
cumsum = np.cumsum(arr)

# 누적 곱
cumprod = np.cumprod(arr)

🛠 유용한 함수

# 배열 결합
concatenated = np.concatenate((arr1, arr2), axis=0)

# 배열 분할
split_arr = np.split(arr, 분할수)

# 고유 값 찾기
unique_vals = np.unique(arr)

# 배열 정렬
sorted_arr = np.sort(arr)

# 조건에 따른 요소 선택
where_arr = np.where(arr >, 참일_때, 거짓일_때)

# 배열 복사
arr_copy = arr.copy()

🔢 난수 생성

# 균등 분포 난수 생성
rand_arr = np.random.rand(,)

# 정규 분포 난수 생성
randn_arr = np.random.randn(,)

# 정수 난수 생성
randint_arr = np.random.randint(최소값, 최대값, 크기)

🧮 선형대수

# 행렬 내적
dot_product = np.dot(arr1, arr2)

# 행렬식 계산
determinant = np.linalg.det(arr)

# 역행렬 계산
inverse = np.linalg.inv(arr)

# 고유값과 고유벡터
eigenvalues, eigenvectors = np.linalg.eig(arr)

# 선형 방정식 풀기
solution = np.linalg.solve(coeff_matrix, dep_vector)

🧰 배열 조건 처리

# NaN 체크
nan_mask = np.isnan(arr)

# 무한대 체크
inf_mask = np.isinf(arr)

# NaN을 특정 값으로 대체
arr[np.isnan(arr)] = 대체값

# 무한대를 특정 값으로 대체
arr[np.isinf(arr)] = 대체값

💾 파일 입출력

# 텍스트 파일 저장
np.savetxt('파일명.txt', arr, delimiter=',')

# 텍스트 파일 로드
arr = np.loadtxt('파일명.txt', delimiter=',')

# 바이너리 파일 저장
np.save('파일명.npy', arr)

# 바이너리 파일 로드
arr = np.load('파일명.npy')

이 치트 시트는 데이터 분석 테스트에서 자주 사용되는 NumPy의 핵심 기능들을 요약한 것입니다. 배열 연산과 수학적 계산에서 이 코드를 참고하여 효율적으로 문제를 해결하세요. 성공을 기원합니다! 🚀

profile
J의 틀에 몸을 녹여 맞추는 P

0개의 댓글