[딥다이브] 6장 | 데이터 타입

예도리·2021년 9월 7일
0

데이터 타입: 값의 종류

JS의 모든 값은 데이터 타입을 갖는다.

데이터 타입의 종류

원시 타입

→ 원시 타입이란?

타입설명
number숫자. 정수/ 실수 구분 없음
string문자열
boolean논리적 true와 false
undefinedvar 키워드로 선언된 변수에 암묵적으로 할당되는 값
null값이 없다는 것을 의도적으로 명시할 때 사용하는 값
symbolES6에서 추가된 타입

객체 타입

→ 객체 타입이란?

객체, 함수, 배열 등

타입별로 확보해야할 메모리 공간의 크기도 다르고 메모리에 저장되는 2진수도 다르며 읽어 들여 해석하는 방식도 다르다.

→ 각 타입별 차지하는 메로리 공간 크기는?

숫자 타입

ECMAScript 사양에 따르면 숫자 타입의 값은 배정밀도 64비트 부동소수점 형식을 따른다. 모든 수를 실수로 처리하며 정수만을 위한 데이터 타입이 존재하지 않는다.

→ 배정밀도 64비트 부동소수점 형식이란?

2진수, 8진수, 18진수를 표현하기 위한 데이터 타입이 없기 때문에 값을 참조했을 때 모두 10진수로 해석된다.

var binary = 0b01000001; // 2진수 
var octal = 0o101; // 8진수 
var hex = 0x41; // 16진수
// 표기법만 다를 뿐 모두 같은 값이다.
console.log(binary); // 65
console.log(octal); // 65
console.log(hex); // 65
console.log(binary === octal); 
// true console . log(octal === hex);

모든 수를 실수로 처리하기 때문에 정수로 표시된다고 해도 사실은 실수이다. 정수로 표시되는 수끼리 나누더라도 실수가 나올 수 있다.

// 숫자 타입은 모두 실수로 처리된다.
console.log(1 === 1 . 0); // true
console.log(3 / 2) // 1.5

→ C언어와 차이점. C언어는 int끼리 나눗셈을 했을 때?

세 가지 특별한 값을 표현할 수 있다.

  • Infinity: 양의 무한대
  • -Infinity: 음의 무한대
  • NaN: 산술 연산 불가 (not-a-number). JS는 case-sensitive이므로 꼭 NaN이라고 작성해야한다!

문자열 타입

문자열은 0개 이상의 16비트 유니코드 문자(UTF-16)의 집합이다.

→ UTF-16이란? UTF-8과 차이점.

문자열은 작은따옴표(''), 큰따옴표(""), 백틱(``)으로 텍스트를 감싼다. 일반적인 표기법은 작은따옴표를 사용하는 것이다. 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다. 따옴표로 감싸지 않으면 JS 엔진은 키워드나 식별자 같은 토큰으로 인식한다.

→ 세 개의 차이점

JS의 문자열은 원시타입으로 불변한 값이다.

템플릿과 리터럴

ES6부터 도입된 새로운 문자열 표기법이다.

멀티라인 문자열, 표현식 삽입, 태그트 템플릿 등 편리한 문자열 처리 기능을 제공한다.

런타임에 일반 문자열로 변환되어 처리된다.

일반 문자열과는 달리 백틱(``)만을 사용해서 표현한다.

멀티라인 문자열

일반 문자열 내에서는 줄바꿈이 허용되지 않는다. 일반 문자열 내에서는 줄바꿈 등의 공백을 표현하려면 이스케이프 시퀀스를 사용해야 한다.

JS에서 \r(캐리지 리턴), \n(라인 피드) 둘 다 개행을 의미하지만 일반적으로 \n을 사용해 개행한다.

→ 이스케이프 시퀀스의 종류

반면, 템플릿 리터럴 내에서는 이스케이프 시퀀스를 사용하지 않고도 줄바꿈이 허용되고, 모든 공백이 그대로 적용된다.

// 이스케이프 시퀀스를 사용한 일반 문자열
var template1 = '<ul>\n\t<li><a href="#">Home</a></li>\n</ul>';
// 템플릿 리터럴
var template2 = `<ul>
	<li><a href="#">Home</a></li>
</ul>`;
// 두 개의 결과는 같다
// <ul>
// 	 <li><a href="#">Home</a></li> 
// </ul>
표현식 삽입

문자열은 + 연산자를 사용해 연결할 수 있다. +는 피연산자 중 하나 이상이 문자열이면 문자열 연결 연산자로 동작한다. 그 외에는 산술 연산자인 덧셈 연산자로 동작한다.

→ JS의 자동 형변환

템플릿 리터럴 내에서는 표현식 삽입을 통해 문자열을 삽입할 수 있다. +를 사용한 것보다 가독성이 좋고 간편하다.

표현식을 삽입하려면 ${ }로 표현식을 감싼다. 표현식의 평가 결과가 문자열이 아니어도 문자열로 강제로 타입이 변환되어 삽입된다.

var first = 'Ye-im';
var last = 'Kim';

console.log(`제 이름은 ${last} ${first}입니다.`); // 제 이름은 Kim Ye-im입니다.
console.log(`1 + 2 = ${1 + 2}`); // 1 + 2 = 3

불리언 타입

값은 true, false 두 개뿐이다.

undefined 타입

값은 undefined가 유일하다. var 키워드로 선언한 변수는 암묵적으로 undefined로 초기화된다. 변수 선언에 의해 메모리 공간이 확보될 때 값이 할당되기 전까지 빈 상태로 내버려두지 않고 JS 엔진이 undefined로 초기화한다. 변수 선언 이후 값을 할당하지 않은 변수를 참조하면 undefined가 반환된다. 즉, 변수를 참조했는데 undefined가 반환된다면 참조한 변수가 선언 이후 값이 할당된 적이 없는, 초기화되지 않은 변수라는 것을 알 수 있다.

→ garbage value란?

→ 변수 선언 과정

undefined는 JS 엔진이 변수를 초기화하는데 사용하는 것이므로 개발자가 의도적으로 변수에 undefined를 할당하는 것은 본래 취지와 어긋나고, 혼란을 줄 수 있으므로 권장되지 않는다. 변수에 값이 없다는 것을 명시하고 싶을 때는 null을 할당해야한다.

null 타입

값은 null이 유일하다.

위에서 말했듯이, null은 변수에 값이 없다는 것을 의도적으로 명시할 때 사용한다.

변수에 null을 할당하는 것은 더 이상 원래 참조하던 값을 참조하지 않겠다는 의미다. 즉, 이전에 참조하던 값에 대한 참조를 명시적으로 제거하는 것을 의미하며, 만약 그 값을 아무도 참조하지 않는다면 JS 엔진은 해당 메모리 공간에 대해 가비지 컬렉션을 수행한다.

→ 가비지 컬렉션

함수가 유효한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 한다. 예를 들어 document.querySelector 메서드는 조건에 부합하는 HTML 요소를 검색할 수 없는 경우 null을 반환한다.

심벌 타입

ES6부터 도입된 7번째 원시 타입이다.

리터럴로 생성하는 다른 원시 타입과 다르게 심벌은 함수를 호출해 생성한다. 생성된 심벌 값은 외부에 노출되지 않고, 다른 값과 절대 중복되지 않는 유일한 값이다. 따라서 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다.

// 심벌 값 생성
var key = Symbol('key');
console . log(typeof key); // symbol
// 객체 생성
var obj = {};
// 이름이 충돌할 위험이 없는 유일무이한 값인 심벌을 프로퍼티 키로 사용한다.
obj[key] = 'value';
console . log(obj[key]); // value

객체 타입

JS는 객체 기반의 언어이며, JS를 이루고 있는 거의 모든 것이 객체다. 앞서 말한 6가지 원시 타입을 제외한 모든 값은 객체 타입이다.

데이터 타입의 필요성

데이터 타입에 의한 메모리 공간의 확보와 참조

메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 결정해야 한다. 데이터 크기에 맞는 적절한 메모리 공간을 사용해야 낭비와 손실 없이 값을 저장할 수 있다.

JS 엔진은 데이터 타입에 따라 정해진 크기의 메모리 공간을 확보한다.

예를 들어, 변수에 숫자 값을 할당하면 JS 엔진은 리터럴을 숫자 타입의 값으로 해석하고 숫자 타입의 값을 저장하기 위해 8 바이트의 메모리 공간을 확보한다. 그리고 숫자 값을 2진수로 저장한다.

→ JS 데이터 타입에 따라 확보되는 메모리 공간의 크기는?

→ JS는 little endian, big endian?

변수는 숫자 값이 저장되어 있는 메모리 공간의 선두 메모리 셀의 주소를 참조한다.

값을 참조할 때 차지하고 있는 메모리 공간의 크기만큼 읽어 들이지 않으면 값이 훼손된다. 변수에 숫자 타입의 값이 할당되어있기 때문에 JS 엔진은 변수를 숫자 타입으로 인식하고, 숫자 타입은 8바이트 단위로 저장되므로 변수를 참조하면 8바이트 단위로 메모리 공간에 저장된 값을 읽어 들인다. 변수가 참조하는 선두 메모리 셀의 주소부터 8바이트만큼을 읽어 들이는 것이다.

데이터 타입에 의한 값의 해석

모든 값은 데이터 타입을 가지며, 메모리에 2진수로 저장된다. 메모리에 저장된 값은 데이터 타입에 따라 다르게 해석될 수 있다.

앞에서 말한 예시에서 변수에 할당된 값은 숫자 타입의 값이기 때문에 변수를 참조하면 메모리 공간의 주소에서 읽어 들인 2진수를 숫자로 해석한다.

정리

데이터 타입이 필요한 이유는 다음과 같다.

  • 값을 저장할 때 확보해야 하는 메모리 공간의 크기를 결정하기 위해
  • 값을 참조할 때 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정하기 위해
  • 메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정하기 위해

동적 타이핑

동적 타입 언어와 정적 타입 언어

  • 정적 타입 언어 : 변수를 선언할 때 변수에 할당할 수 있는 데이터 타입을 사전에 선언(명시적 타입 선언)해야 한다.
    • 변수의 타입을 변경할 수 없다.
    • 변수에 선언한 타입에 맞는 값만 할당할 수 있다.
    • 컴파일 시점에 타입 체크를 수행한다. 타입 체크를 통과하지 못하면 에러가 발생하고 프로그램의 실행 자체를 막는다.
    • 타입의 일관성을 강제함으로써 안정적인 코드 구현을 통해 런타임에 발생하는 에러를 줄인다.
    • ex. C, C++, Java, Kotlin, Go 등
  • 동적 타입 언어 : 변수를 선언할 때 타입을 선언하지 않는다.
    • 어떠한 데이터 타입의 값도 자유롭게 할당할 수 있다.
    • 변수의 타입이 재할당에 의해 언제든지 동적으로 변할 수 있다.
    • 선언이 아닌 할당에 의해 타입이 결정(타입 추론)된다.
    • ex. JS, Python, PHP, Ruby 등

주의할 점! 변수는 타입을 갖지 않는다. 값은 타입을 갖는다. 즉, 변수에 할당되어 있는 값이 타입을 갖는다. 변수에 할당되어 있는 값에 의해 변수의 타입이 동적으로 결정되는 것이다.

→ 타입 추론이란?

동적 타입 언어와 변수

동적 타입 언어에는 구조적인 단점이 있다.

변수 값이 언제든지 변경될 수 있고, 때문에 복잡한 프로그램에서는 변화하는 변수 값을 추적하기 어려울 수 있다. 값의 변경에 의해 타입도 언제든지 변경될 수 있기 때문에 값을 확인하기 전에는 타입을 확신할 수 없다. 게다가 JS 엔진에 의해 암묵적으로 타입이 자동으로 변환되기도 한다.

동적 타입 언어는 유연성은 높지만 신뢰성은 떨어진다.

변수를 사용할 때 주의할 사항은 다음과 같다.

  • 변수는 꼭 필요한 경우에 한해 제한적으로 사용
  • 변수의 유효 범위(스코프)를 최대한 좁게 만들기.
  • 전역 변수 최대한 사용하지 않기.
    • 전역 변수는 어디서든 참조, 변경이 가능해서 의도치 않게 오염될 가능성이 높고 다른 코드에 영향을 줄 가능성도 높다.
    • 프로그램의 복잡성을 증가시키고, 처리 흐름을 추적하기 어렵게 만들고, 오류의 원인을 특정하기 어렵게 만든다.
  • 변수보다는 상수를 사용해 값을 억제하기
  • 변수 이름은 변수의 목적이나 의미를 파악할 수 있도록 짓기
    • 명확한 네이밍은 코드를 이해하기 쉽게 만들고, 협업과 생산성 향상에 도움을 준다.

→ 타입스크립트의 특징, 장점은?

0개의 댓글