문자열 인코딩이란?

BANGJH·2020년 9월 5일
0

2진법을 사용하는 컴퓨터가 인간의 언어를 일정한 규칙에 따라 2진수로 변환하는 방식

  • 규칙 종류
    • 아스키코드
    • EUC-KR
    • UTF-8
    • UTF-16
    • UTF-32

이러한 규칙 중 어느 것을 적용하는지에 따라 글자가 올바르게 보일 수도, 글자가 깨져보일 수도 있다.

왜 글자가 깨져 보일까?

컴퓨터가 처음 등장했을 때 모든 프로그램은 영어와 일부 특수 문자만을 지원했다.
그러나 여러 국가에서 컴퓨터를 사용하기 위해 국가별로 사용하는 언어를 표현하고자 독자적인 규칙을 만들기 시작했다.
모든 언어를 같은 규칙으로 표현할 수 있는 유니코드 방식이 등장하기 전까지.

그러나 모든 개발 환경이 유니코드를 동일하게 처리하지 않아, 개발자는 서로 호환되지 않는 유니코드 문자열 인코딩 방식(UTF-8, UTF-16, UTF-32) 중 하나를 택해야 한다.

심지어 우리나라는 유니코드가 등장하기 전에 만든 독자적인 인코딩 방(EUC-KR)을 쓰는 오래된 시스템도 남아 있다.

문자열 인코딩을 알고 있다면, 실무에서 위와 같은 인코딩 관련 문제가 발생했을 때 쉽고 빠르게 해결할 수 있다.

profile
안녕하세요 신입 웹개발자입니다.

0개의 댓글