인프런 - 데이터 분석을 위한 판다스 - 섹션 2 - (더 알아보기) Null

르네·2023년 10월 3일
0

Python

목록 보기
28/45

본 내용은 인프런 강의 <데이터 분석을 위한 판다스>를 수강하며 중요한 점을 정리한 글입니다.

판다스 튜토리얼

https://pandas.pydata.org/pandas-docs/stable/getting_started/intro_tutorials/index.html

NULL이란 무엇인가?

: 값이 없는 것

NULL 확인하기

  • Age 컬럼 안에 NULL이 아니면 True, NULL이면 False
titanic['Age'].notna()
  • 그 반대
titanic['Age'].isna()

titanic.isna()
  • 각 컬럼 값을 다 더해줌
titanic.sum()
  • 각각의 컬럼에 NULL이 몇개 있는지
titanic.isna().sum()
->
PassengerId      0
Survived         0
Pclass           0
Name             0
Sex              0
Age            177
SibSp            0
Parch            0
Ticket           0
Fare             0
Cabin          687
Embarked         2
dtype: int64
  • Age 컬럼에서 NULL이 없는 데이터들만 보고싶을 때
titanic[titanic['Age'].notna()]

NULL 채우기

  • titanic.fillna()
    : null값 대신에 특정값을 채워넣음
titanic.fillna(0) #null 자리에 0을 대신 넣어줌

NULL 제거하기

  • titanic.dropna()
    : 한 행에 null값이 하나라도 있으면, 그 행을 다 제거함

이 외에 NULL 관련 이슈

  • NULL과 다른 숫자간 산술연산을 할 경우, 답이 모두 NULL로 출력된다.

  • 집계함수는 NULL값을 연산에 넣지 않는다. 그래서 주의해야 한다. 예를 들어 평균낼 때, NULL데이터는 분모로 안 들어가서 평균 잘못 연산될 수 있다.

profile
데이터분석 공부로그

0개의 댓글