본 자료는 심민경 코치님의 자료를 사용하여 정리하였습니다.
import pandas as pd
변수 = pd.DataFrame({'열1':list1, ...})
변수 = pd.read_csv(파일경로)
.iloc
으로 숫자를 이용해 값에 접근 가능.append
로 데이터프레임 위아래로 결합할 수 있다..concat
도 가능하다..isnull()
로 결측치 확인이 가능하다.True/False
로 매핑된다..dropna
로 결측치 제거가 가능하다..sort_values
로 정렬 가능하다.ascending
으로 오름차순/내림차순 선택이 가능하다.df[열] = 값
True/False
로 나온다.df[(df[열] == 값) & (df[열] > 값)]
df.replace({대체될 값:대체할 값, ...}, inplace = True)
df.apply(함수)
df.groupby(열).sum()
.max()
, .min()
, .mean()
가능df[열1, 열2].groupby(열).aggregate({열1: 'min', 열2: 'mean'})
df[열1, 열2].groupby(열).get_group(값)
df[열1, 열2].groupby(열).apply(lambda x: x.mean() - x.min())
df[열1, 열2].groupby(열).filter(함수)
df.pivot_table(index = '행', column = '열', values = '요약할 컬럼')
aggfunc = ['min', 'mean', 'max']
도 넣을 수 있다.변수 = np.array([원소1, ...])
변수 = np.array(리스트객체)
변수[number]
변수[start:end]
변수[:: step_num]
변수.dtype
변수 = np.arange(시작값, 마지막값 + 1, step)
변수 = np.random.random(생성할 난수 갯수)
변수 = np.random.random(생성할 난수 갯수, size = (행, 열))
변수 = np.random.randint(생성할 정수시작, 끝, size = (행, 열))
변수 = np.reshape((행, 열))
변수 = np.concatenate([배열1, 배열2])
변수 = np.concatenate([배열1, 배열2], axis = 0)
- 위/아래로 붙이기변수 = np.concatenate([배열1, 배열2], axis = 1)
- 양옆으로 붙이기변수1, 변수2 = np.split(변수, [위에 둘 행 개수], axis = 0)
- 위/아래 나누기
변수1, 변수2 = np.split(변수, [왼쪽에 둘 행 개수], axis = 1)
- 양옆 나누기
+
, -
, *
, /
가능변수 + 숫자
+
, -
, *
, /
가능변수 + 숫자
, 변수 + 변수
np.sum(변수)
np.mean(변수)
np.max(변수)
np.min(변수)
np.sum(변수)
: 모든 원소np.mean(변수)
np.max(변수, axis = 0)
: 열기준np.min(변수, axis = 1)
: 행기준변수 < 숫자
: True/False
로 매핑된다.변수1[변수1 < 숫자]
: 해당되는 값만 나온다.import matplotlib.pyplot as plt # 라이브러리 호출
fig, ax = plt.subplot()
plt.plot(x, y, options...) # 라인 그래프
plt.scatter(x, y, options...) # 산점도 그래프
color = '색상'
: 색상, 0 ~ 1
사이의 숫자, RGB 값 사용가능linestyle = 'solid'
: solid
, dashed
, dashdot
, dotted
등 사용가능label = '라벨'
: 선 이름 지정