[CS] 문자열과 그래픽

홍인열·2021년 11월 25일
0
post-thumbnail

문자열

컴퓨터 프로그래밍과 형식 언어 이론에서 문자열은 기호의 순차 수열로서, 스트링(String)이라고도 한다. 이러한 기호는 미리 정의된 집합이나 음소문자에 선택한다.
음소문자: 하나하나의 문자가 원칙적으로 하나의 자음 또는 모음의 음소를 나타내는 문자체계를 말한다.

유니코드

유니코드 협회가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 이 표준에는 ISO 10646 문자집합, 문자 인코딩, 문자 정보 데이터베이스, 문자를 다루기 위한 알고리즘 등을 포함하고 있다.

유니코드의 목적
현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하는 것이다.

출현 배경
기존의 인코딩들은 그 규모나 범위면에서 한정되어, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다.
유니코드가 다양한 문자 집합들을 통합하는데 성공하면서 유니코드는 컴퓨터 소프트웨어의 국제화와 지역화에 널리 사용되게 되었으며, 비교적 최근의 기술인 XML, 자바, 그리고 최신 운영 체제 등에서도 지원한다.

인코딩(encoding)이란?

부호화 라고도하며, 컴퓨터를 이용해 영사, 이미지, 소리데이터등을 생성할 때 데이터의 양을 줄이기 위해 데이터를 코드화하고 압축하는 것을 말한다. 즉, 정보의 형태나 형식을 표준화, 보안, 처리 속도 향상, 저장 공간 절약 등을 위해서 다른 형태나 형식으로 변환 하고, 컴퓨터가 이용할 수 있는 신호로 만드는 것이다.
인코딩(encoding, 부호화)의 반대 개념은 디코딩(decoding, 복호화)으로, 인코딩과 디코딩 기준을 문자열 세트 또는 문자셋(charset)이라고한다. 유니코드는 문자셋의 국제 표준이다.

ASCII

미국정보교환표준부호(American Standard Code for Information Interchange), 줄여서 ASCII(아스키)는 영문 알파벳을 사용하는 대표적인 문자 인코딩이다. 대부분의 문자 인코딩은 아스키에 기초를 두고 있다.
출력가능한 문자는 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수문자, 그리고 하나의 공백 문자이다.
유니코드는 아스키를 확장한 형태이다.

UTF-8

유니코드를 위한 가변 길이 문자 인코딩 방식중 하나로 Universal Coded Character Set + Transformation Format - 8-bit의 약자이다.
UTF-8 인코딩은 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지를 사용한다. ASCII 문자들은 UTF-8에서 1바이트만으로 표시된다.
네트워크를 통해 전송되는 텍스트는 주로 UTF-8로 인코딩된다. 사용된 문자에 따라 더 작은 크기의 문자열로 표현할 수 있기때문이다. 아스키 코드의 경우 1byte, 크게 영어 외 글자는 2byte, 3byte, 보조글자는 4byte를 차지하며 이모지는 보조글자로 4byte를 필요로 한다.

UTF-16

이름그대로 유니코드 대부분을 16 bits로 표현한다. 대부분에 속하지 않는 기타문자는 32bits(4byte)로 표현하므로 UTF-16도 가변 길이라고 할 수 있으며, 대부분 2byte로 표현한다.
UTF-8에서 한글은 3바이트, UTF-16에서는 2바이트를 차지한다.

그래픽

비트맵과 벡터

비트맵벡터
기반 기술픽셀기반수학적으로 계산된 Shape기반
특징사실적인 표현, 특수 효과, 풍부한 색감 표현에 적합, 경계과 뚜렷하지 않음.로고, 일러스트와 같이 선명한 표현이나등이 필요한 제품에 적용되는 이미지에 적합, 뚜렷한 경계를 가짐
확대확대에 적합하지 않음(계단현상), 보다 큰 사이즈의 이미지가 필요할 때 사용하려는 크기 이상으로 생성하거나 스캔해야 함품질 저하 없이 모든 크기로 확대 가능하며 해상도의 영향을 받지 않음
파일용량큰 크기의 이미지는, 큰 파일 사이즈를 가짐큰 크기의 벡터 그래픽은 작은 파일 사이즈를 유지할 수 있음
상호 변환이미지의 복잡도에 따라 벡터로 변환하는 것에 오랜 시간이 걸림쉽게 비트맵 이미지로 변환 가능
파일 포맷jpg, gif, png, bmp, psd 등svg, ai 등
웹 사용성jpg, gif, png 등이 널리 쓰임svg 포맷은 현대의 브라우저에서 대부분 지원
프로그램포토샵, 페인터등일러스트레이터, 플래시등


비트맵(Bitmap)은 픽스맵(Pixmap)이나 레스터(Raster) 이미지로도 불린다.

profile
함께 일하고싶은 개발자

0개의 댓글