Pandas를 사용하던 중에 cp949와 utf-8을 사용했는데도 불구하고 아래와 같은 에러를 뱉어냈다...
UnicodeDecodeError: 'cp949' codec can't decode byte 0x98 in position 42650: illegal multibyte sequence
pd.read_csv('home_price.csv', encoding='cp949', encoding_errors='ignore')
pd.read_csv('home_price.csv', encoding='cp949', encoding_errors='replace')
encoding_errors='ignore'일 경우에는 잘못된 문자가 있을시에 무시함.
encoding_errors='replace' 다른 문제로 대체됨.
나는 pd.read_csv('home_price.csv', encoding='cp949', encoding_errors='ignore')를 사용하여 잘못된 형식의 데이터 타입은 제거했다.