취준을 하다보면 가끔 closed book으로 데이터 분석 테스트를 요구하는 회사들이 있다.
그런 테스트를 대비하기 위한 주요 패키지들의 빈출 함수 및 메서드에 대한 치팅시트를 만들어 보았다.
물론 직접 만들지는 않았고, ChatGPT-o1이 만들어줬으니 사용하실 분들은 얼마든지 사용하시길!
Matplotlib과 Seaborn 치트 시트: 데이터 시각화를 위한 필수 기능
import matplotlib.pyplot as plt
# 선 그래프
plt.plot(x, y)
plt.show()
# 산점도
plt.scatter(x, y)
plt.show()
# 막대 그래프
plt.bar(x, y)
plt.show()
# 히스토그램
plt.hist(data, bins=10)
plt.show()
# 제목 및 레이블 추가
plt.title('그래프 제목')
plt.xlabel('X축 레이블')
plt.ylabel('Y축 레이블')
# 선 스타일 변경
plt.plot(x, y, color='red', linestyle='--', marker='o')
# 범례 추가
plt.legend(['레이블1', '레이블2'])
# 축 범위 설정
plt.xlim(최소값, 최대값)
plt.ylim(최소값, 최대값)
plt.plot(x1, y1, label='데이터1')
plt.plot(x2, y2, label='데이터2')
plt.legend()
plt.show()
# 2행 1열의 서브플롯 생성
plt.subplot(2, 1, 1)
plt.plot(x1, y1)
plt.title('첫 번째 그래프')
plt.subplot(2, 1, 2)
plt.plot(x2, y2)
plt.title('두 번째 그래프')
plt.tight_layout()
plt.show()
# 색상 변경
plt.plot(x, y, color='green')
# 마커 스타일 변경
plt.plot(x, y, marker='^')
# 선 두께 변경
plt.plot(x, y, linewidth=2)
# 스타일 지정자 사용
plt.plot(x, y, 'ro--') # 빨간색 원 마커와 점선
plt.savefig('그래프.png', dpi=300, bbox_inches='tight')
import seaborn as sns
import matplotlib.pyplot as plt
# 데이터셋 로드 (예: 타이타닉 데이터셋)
df = sns.load_dataset('titanic')
# 히스토그램
sns.histplot(data=df, x='age', bins=20)
plt.show()
# 커널 밀도 그래프
sns.kdeplot(data=df, x='age', shade=True)
plt.show()
sns.barplot(data=df, x='sex', y='survived')
plt.show()
sns.boxplot(data=df, x='class', y='age')
plt.show()
sns.violinplot(data=df, x='class', y='age', hue='sex', split=True)
plt.show()
sns.scatterplot(data=df, x='age', y='fare', hue='sex')
plt.show()
sns.lmplot(data=df, x='age', y='fare', hue='sex')
plt.show()
sns.pairplot(df[['age', 'fare', 'pclass']])
plt.show()
corr = df.corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.show()
sns.set_style('whitegrid') # 다른 옵션: darkgrid, white, dark, ticks
sns.set_palette('pastel') # 다른 옵션: deep, muted, bright, dark, colorblind
plt.figure(figsize=(10, 6))
# 축 레이블 및 제목 추가
plt.title('그래프 제목')
plt.xlabel('X축 레이블')
plt.ylabel('Y축 레이블')
# 축 범위 설정
plt.xlim(최소값, 최대값)
plt.ylim(최소값, 최대값)
g = sns.FacetGrid(df, col='sex', row='survived')
g.map(plt.hist, 'age')
plt.show()
sns.jointplot(data=df, x='age', y='fare', kind='scatter')
plt.show()
sns.barplot(data=df, x='sex', y='survived')
plt.title('성별에 따른 생존율')
plt.xlabel('성별')
plt.ylabel('생존율')
plt.show()
plt.rcParams
를 사용하여 전역적인 설정을 변경할 수 있습니다.# 한글 폰트 설정 예시
plt.rcParams['font.family'] = 'Malgun Gothic' # Windows의 경우
plt.rcParams['font.family'] = 'AppleGothic' # macOS의 경우
plt.rcParams['axes.unicode_minus'] = False # 마이너스 기호 깨짐 방지
import warnings
warnings.filterwarnings('ignore')
이 치트 시트는 데이터 시각화에서 자주 사용되는 Matplotlib과 Seaborn의 핵심 기능들을 요약한 것입니다. 효과적인 시각화를 통해 데이터의 인사이트를 도출하세요. 성공을 기원합니다! 🚀