본 내용은 인프런 강의 <데이터 분석을 위한 판다스>를 수강하며 중요한 점을 정리한 글입니다.
판다스 튜토리얼
https://pandas.pydata.org/pandas-docs/stable/getting_started/intro_tutorials/index.html
: 값이 없는 것
titanic['Age'].notna()
titanic['Age'].isna()
titanic.isna()
titanic.sum()
titanic.isna().sum()
->
PassengerId 0
Survived 0
Pclass 0
Name 0
Sex 0
Age 177
SibSp 0
Parch 0
Ticket 0
Fare 0
Cabin 687
Embarked 2
dtype: int64
titanic[titanic['Age'].notna()]
titanic.fillna(0) #null 자리에 0을 대신 넣어줌
NULL과 다른 숫자간 산술연산을 할 경우, 답이 모두 NULL로 출력된다.
집계함수는 NULL값을 연산에 넣지 않는다. 그래서 주의해야 한다. 예를 들어 평균낼 때, NULL데이터는 분모로 안 들어가서 평균 잘못 연산될 수 있다.