# nunique

[230130] 멋쟁이사자처럼 AI SCHOOL 8기 '서울시 코로나 현황 데이터 EDA_박조은강사님' 복습
📝Today I learned 🚀 TIL 목차 🚀 > - 라이브러리 로드 파일 불러오기 EDA 1) 기본사항 확인 2) 일부 데이터 확인 3) 요약, 기술통계값 확인 4) 결측치 확인 5) 중복값 제거 6) 인덱스 값 설정 7) 날짜 타입으로 변경 8) 파생변수 생성 9) 하나의 변수에 대한 빈도수 구하기 10) 결측값 0으로 변경 11) 누적값 구하기 12) 시각화 서울시 코로나 현황 데이터 EDA 1. 라이브러리 로드 . 2. 파일 불러오기 👉 파일을 불러올 때, 파일 이름이 길거나 특수문자 등이 포함되었을 때 직접 타이핑해서 한 글자라도 틀리면 오류가 난다. 이때 glob을 통해 파일 목록을 리스트 형태로 가지고
python pandas dataframe 데이터 문자열 다루기
데이터 null 찾기 dataframe에 null인 항목이 있는지 찾기 어느 column인지 찾기 리뷰가 적혀있는 document 열에서 Null 값을 가진 샘플이 총 1개가 존재 해당 데이터 row 확인 출력 결과는 위와 같습니다. Null 값을 가진 샘플을 제거하겠습니다. traindata = traindata.dropna(how = 'any') # Null 값이 존재하는 행 제거 print(train_data.isnull().values.any()) # Null 값이 존재하는지 확인 False 데이터 소문자로 바꾸기 lower()는 문자열의 모든 문자를 소문자로 바꾼다. 예를 들어 “Ups AND Downs”.lower()는 ‘ups and downs’로 계산된다. • upper()는 문자열의 모든 문자를 대문자로 바꾼다. 예를 들어 “Ups AND Downs”.upper()는 ‘UPS AND DOWNS’로 계산된다.