2진법을 사용하는 컴퓨터가 인간의 언어를 일정한 규칙에 따라 2진수로 변환하는 방식
이러한 규칙 중 어느 것을 적용하는지에 따라 글자가 올바르게 보일 수도, 글자가 깨져보일 수도 있다.
왜 글자가 깨져 보일까?
컴퓨터가 처음 등장했을 때 모든 프로그램은 영어와 일부 특수 문자만을 지원했다.
그러나 여러 국가에서 컴퓨터를 사용하기 위해 국가별로 사용하는 언어를 표현하고자 독자적인 규칙을 만들기 시작했다.
모든 언어를 같은 규칙으로 표현할 수 있는 유니코드 방식이 등장하기 전까지.
그러나 모든 개발 환경이 유니코드를 동일하게 처리하지 않아, 개발자는 서로 호환되지 않는 유니코드 문자열 인코딩 방식(UTF-8, UTF-16, UTF-32) 중 하나를 택해야 한다.
심지어 우리나라는 유니코드가 등장하기 전에 만든 독자적인 인코딩 방(EUC-KR)을 쓰는 오래된 시스템도 남아 있다.
문자열 인코딩을 알고 있다면, 실무에서 위와 같은 인코딩 관련 문제가 발생했을 때 쉽고 빠르게 해결할 수 있다.