pandas encoding 에러

BS_Lee·2024년 11월 10일
0

Pandas를 사용하던 중에 cp949와 utf-8을 사용했는데도 불구하고 아래와 같은 에러를 뱉어냈다...
UnicodeDecodeError: 'cp949' codec can't decode byte 0x98 in position 42650: illegal multibyte sequence

pd.read_csv('home_price.csv', encoding='cp949', encoding_errors='ignore')
pd.read_csv('home_price.csv', encoding='cp949', encoding_errors='replace')

encoding_errors='ignore'일 경우에는 잘못된 문자가 있을시에 무시함.
encoding_errors='replace' 다른 문제로 대체됨.

나는 pd.read_csv('home_price.csv', encoding='cp949', encoding_errors='ignore')를 사용하여 잘못된 형식의 데이터 타입은 제거했다.

profile
설명이 가능할 때까지 공부하기.

0개의 댓글