Pandas 란?
- Python Data Analysis Library
- Expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive
1. Series.ipynb
temp = pd.Series([-20, -10, 10, 20], index = ['Jan', 'Feb', 'Mar', 'Apr'])
temp
2. DataFrame.ipynb
df = pd.DataFrame(data)
3. Index.ipynb
4. 파일 저장 및 열기.ipynb
- DataFrame 객체를 excel, csv, txt 등 형태의 파일로 저장 및 열기
5. 데이터 확인.ipynb
- 계산 가능한 데이터에 대해 Column 별로 데이터의 갯수, 평균, 표준편차, 최소/최댓값 등의 정보를 보여줌.
df.descibe()
df.head(5)
df.tail()
df[label].min()
df[label].unique()
6 ~ 9. 데이터 선택 (기본, loc, iloc, 조건).ipynb
- loc : 이름을 이용해서 원하는 row에서 원하는 col 선택
df.loc['1번', '국어']
df.loc['1번':'5번','국어':'사회']
- iloc: 위치를 이용하여 원하는 row에서 원하는 col 선택
df.iloc[0]
df.iloc[[0, 1], 2]
- 조건: &(그리고), |(또는), str함수(startswith(), contains(), etc) 등
10. 결측치.ipynb
df.fillna('')
df.dropna(inplace=True)
11. 데이터 정렬.ipynb
df.sort_values('키', ascending=False)
df.sort_index()
12. 데이터 수정.ipynb
df['학교'].replace({'북산고':'상북고'}, inplace=True)
df['SW특기'].str.lower()
df['SW특기'] = df['SW특기'].str.upper()
df.loc[df['총합'] > 400, '결과'] = 'Pass'
df
df.drop(columns=['총합'])
df.loc['9번'] = ['이정환', '해남고등학교', 184, 90, 90, 90, 90, 90, 'Kotlin', 450, 'Pass']
df
filt = df['수학'] < 80
df[filt]
13. 함수 적용.ipynb
14. 그룹화 .ipynb
- 동일한 값을 가진 것들끼리 합쳐서 통계 또는 평균 등의 값을 계산하기 위해 사용
- df.groupby() 응용