[CS] 멀티바이트, 와이드바이트?

윤동환·2023년 3월 20일
0

Computer Science

목록 보기
3/10

문자 집합

문자집합에는 2가지가 있다.
1. 멀티 바이트
2. 와이드 바이트(유니코드)

멀티 바이트

하나 이상의 바이트로 표현되는 방식

char exString[15] = "abcd한글";

이러한경우 abcd는 1바이트씩, 한글은 2바이트씩 사용된다.
이처럼 상황에 따라 문자를 표현하는 바이트를 조절하는 것을 멀티 바이트라고 한다.

문제점

  1. 문자열의 길이 확인이 어렵다. "abcd한글"의 글자수는 한글이 2바이트씩 계산되어 8글자로 확인이 된다.

와이드 바이트(유니코드)

항상 2바이트 (16비트) 크기로 문자를 표현하는 방식이다.
와이드 바이트는 표현할 때 char가 아닌 wchar_t로 표현한다.

wchar_t exString[15] = L"abcd한글";

""로 표현하는 문자열 앞에 L을 붙여주어 2바이트로 표현한다고 나타내준다.

profile
모르면 공부하고 알게되면 공유하는 개발자

0개의 댓글