# CP949

5개의 포스트
post-thumbnail

Encoding

네트워크 공부를 하다보니, 인코딩이라는 것에 대해 제대로 이해할 필요가 있다고 생각했다. 왜 필요한지, 어떻게 사용하는지에 대해서 이해해보는 포스팅이다.

2022년 1월 31일
·
0개의 댓글
·
post-thumbnail

[Data Crawling] re ('cp949 codec can't encode character ... ') issue

요즘에 캡스톤 관련 작업으로 데이터 크롤링을 진행중인데, 크롤링 된 데이터를 csv파일로 쓰던 도중 아래와 같은 오류가 생겼다.인코딩에 문제가 있는데...찾아본 결과, Python3 부터는 ANSI 기준으로 작성된 파일만 핸들링 할 수 있다고 한다.그리하여, 기존의 코

2021년 4월 2일
·
0개의 댓글
·

5-3.(1) FileEncoding

InputStreame객체는 파일의 인코딩 방시글 지정 가능형식) new InputStreamReader(바이트기반 스트림 객체, 인코딩 방식);한글 인코딩 방식은 크게 UTF-8 & EUC-KR 두가지원래 한글 윈도우는 CP949방식 사용윈도우 개발한 마이크로소프트에

2020년 9월 26일
·
0개의 댓글
·

EUC-KR(CP949)

EUC-KR은 한국 산업 표준으로 지정된 한국어 문자 집합으로 문자 하나를 표현하기 위해 2바이트를 사용합니다. 단, 아스키 코드 문자를 표현할 때는 1바이트를 사용하기 때문에 아스키 코드와 호환됩니다.EUC-KR은 모든 글자가 완성된 형태로만 존재하는 '완성형'코드입

2020년 9월 9일
·
0개의 댓글
·