쓸 때마다 쓰기 싫고 사용법 익히자마자 잊어버리는 pandas다. 까먹지 않게 정리해둔다.
tabular 데이터를 다루기 위한 라이브러리. R의 체계를 많이 따왔다고 한다. numpy와 통합되면서 성능도 향상됐다고 한다.
ojb = Series(data=data, index=index)
ojb.index # -> index list
ojb.values # -> only list of values
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
pd.read_csv(data, sep='\s+\, header=None)
상위 n개의 데이터만 불러온다.
리스트 형태이고 column들의 이름을 지정할 수 있다.
df_data.columns = ['a', 'b']
pandas를 numpy 형태로 반환한다.
loc는 column 명을 접근하는 방식을 지원한다.
iloc는 numpy처럼 접근 가능하게 해준다. 난 iloc가 편한다..