# nunique

2개의 포스트
post-thumbnail

[230130] 멋쟁이사자처럼 AI SCHOOL 8기 '서울시 코로나 현황 데이터 EDA_박조은강사님' 복습

📝Today I learned 🚀 TIL 목차 🚀 > - 라이브러리 로드 파일 불러오기 EDA 1) 기본사항 확인 2) 일부 데이터 확인 3) 요약, 기술통계값 확인 4) 결측치 확인 5) 중복값 제거 6) 인덱스 값 설정 7) 날짜 타입으로 변경 8) 파생변수 생성 9) 하나의 변수에 대한 빈도수 구하기 10) 결측값 0으로 변경 11) 누적값 구하기 12) 시각화 서울시 코로나 현황 데이터 EDA 1. 라이브러리 로드 . 2. 파일 불러오기 👉 파일을 불러올 때, 파일 이름이 길거나 특수문자 등이 포함되었을 때 직접 타이핑해서 한 글자라도 틀리면 오류가 난다. 이때 glob을 통해 파일 목록을 리스트 형태로 가지고

2023년 1월 30일
·
0개의 댓글
·

python pandas dataframe 데이터 문자열 다루기

데이터 null 찾기 dataframe에 null인 항목이 있는지 찾기 어느 column인지 찾기 리뷰가 적혀있는 document 열에서 Null 값을 가진 샘플이 총 1개가 존재 해당 데이터 row 확인 출력 결과는 위와 같습니다. Null 값을 가진 샘플을 제거하겠습니다. traindata = traindata.dropna(how = 'any') # Null 값이 존재하는 행 제거 print(train_data.isnull().values.any()) # Null 값이 존재하는지 확인 False 데이터 소문자로 바꾸기 lower()는 문자열의 모든 문자를 소문자로 바꾼다. 예를 들어 “Ups AND Downs”.lower()는 ‘ups and downs’로 계산된다. • upper()는 문자열의 모든 문자를 대문자로 바꾼다. 예를 들어 “Ups AND Downs”.upper()는 ‘UPS AND DOWNS’로 계산된다.

2021년 8월 12일
·
0개의 댓글
·