Numpy
1-1. import numpy as np
1-2. np.array(리스트) : 배열 생성
1-3. 배열.ndim : 배열 차원 확인
1-4. 배열.shape : 형태 확인
1-5. 배열.dtype : 요소 자료형 형식 확인
1-6. 배열.reshape(차원) : 차원 변환
1-7. 행, 열 조회
ex) a[[0,1,2],[0,1,0]] = (0,0)(1,1)(2,0)
1-8. 배열[조건] : 조건 조회
1-9. 배열 연산
1-10. np.where(조건문, 참일때 값, 거짓일때 값)
Pandas
Series (1차원)
2-1. import pandas as pd
Dataframe (2차원)
2-1-1. read_csv()
2-1-2. head(), tail()
2-1-3. info()
2-1-4. describe()
2-1-5. sort_values()
2-1-6. value_counts()
2-1-7. max(),mean(),median()
조회
2-2-1. df.loc[행조건, 열조건]
행조건
-> (조건1)&(조건2), isin(리스트),between(,)
-> 2:8 = 2부터 8까지
열조건
->'열' = series, ['열'] = df
* 집계
-> df.groupby(by='col',as_index= )['col2'].집계함수 = col별 col2의 집계함수로 집계
추가적인 유용한 것
2-3-1. data.drop([열],axis=1, inplace=True) # inplace=True는 적용하라는 의미
2-3-2. map()
ex) titanic['Male'].map({'male':1,'female':0})
2-3-3. cut() : 크기를 기준으로 범위를 나눠 등급 지정
ex) data['M_Income_Group2'] = pd.cut(data['M_Income'], bins=bin, labels=['a', 'b', 'c'])