pandas 는 데이터를 편리하게 다룰 수 있도록 도와주는 파이썬 라이브러리 입니다.
성능(연산 속도)는 떨어질 지 몰라도, 데이터를 처음 접했을 때 빠르게 데이터를 이해하는 데 좋습니다.
하지만 pandas 를 사용하다 보면, 자꾸 같은 내용을 검색하느라 시간을 많이 소요합니다.
자주 사용하는 기능을 하나의 글로 정리하여 사용성을 높이고자 합니다.
a = [1, 2, 3]
b = ['a', 'b', 'c']
c = [True, False, True]
cols = ['A', 'B', 'C']
df_row = pd.DataFrame([a, b, c], columns=cols)
df_col = pd.DataFrame(list(zip(a, b, c)), columns=cols)
data = {
'A': [1, 2, 3],
'B': ['a', 'b', 'c'],
'C': [True, False, True]
}
df_col = pd.DataFrame.from_dict(data)
cols = ['X', 'Y', 'Z']
df_row = pd.DataFrame.from_dict(data, orient='index', columns=cols)
References
https://pandas.pydata.org
https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf