타입과 추상화

HeeSeong·2022년 6월 20일
0
post-thumbnail

1. 추상화를 통한 복잡성 극복


현실에 존재하는 다양한 현상 및 사물과 상호작용하기 위해서는 우선 현실을 이해해야 한다.
따라서 사람들은 본능적으로 이해하기 쉽고 예측 가능한 수준으로 현실을 분해하고 단순화하는 전략을 따른다.

지하철 노선도는 불필요한 지형 정보를 제거함으로써 단순함을 달성한 추상화의 훌륭한 예이다. 지하철 노선도의 추상화는 지형 정보를 제거하고 역 사이의 연결성을 강조함으로써 지하철 노선도를 이용하는 승객들의 목적에 맞게 현실을 단순화했다. 역의 위치가 중요한 것이 아니라 역과 역 사이의 연결 관계가 중요했던 것이다.

따라서 진정한 의미에서 추상화란 현실에서 출발하되 불필요한 부분을 도려내가면서 사물의 놀라운 본질을 드러나게 하는 과정이라고 할 수 있다. 추상화는 복잡한 현실을 단순화하기 위해 사용하는 인간의 가장 기본적인 인지 수단이라고 할 수 있다.

객체지향 패러다임은 객체라는 추상화를 통해 현실의 복잡성을 극복한다. 그리고 객체지향 패러다임을 이용해 유용하고 아름다운 애플리케이션을 개발하기 위한 첫걸음은 추상화의 두 차원을 올바르게 이해하고 적용하는 것이다.


2. 객체지향과 추상화


모두 트럼프일 뿐

아름다운 정원에 들어선 앨리스는 정원 입구에서 커다란 장미 나무에 피어 있는 
하얀 장미 꽃을 붉게 칠하고 있는 세 명의 정원사들과 마주쳤다. 
정원사들은 트럼프처럼 생겼고 몸에는 스페이드 무늬가 그려져 있었다.

정원사들은 불안에 떨며 장미 나무 대신 하얀색 장미 나무를 잘못 심었기 때문에 
들킬 경우 여왕이 자신들의 목을 자를 게 뻔하다고 말했다.

그때 하트 여왕의 행렬이 정원에 들어섰다. 동시에 세 명의 정원사는 땅바닥에 
얼굴이 닿을 정도로 납작 엎드렸다. 행렬의 맨 앞에서 클로버를 든 열 명의 변사들이 행진해 들어왔다. 

그들은 정원사들처럼 몸이 납작했고 네모난 몸 모서리에 팔다리가 달려 있었다. 
그 뒤로 온몸을 반짝거리는 다이아몬드로 치장한 신하들이 열을 지어 들어왔다. 
열 명의 왕자와 공주들이 두 명씩 손을 잡고 깡총거리며 따라 들어왔고, 
손님들과 그 속에 하얀 토끼도 섞여 있었다. 손님들 뒤로 빨간 비단 방석을 든 하트 잭이 걸어 왔다. 
그리고 행렬의 마지막에 마침내 하트 왕과 하트 여왕이 그 모습을 드러냈다.

앨리스와 하트 여왕이 마주치는 이 장면에는 수많은 객체들이 등장한다.
주인공인 앨리스와 3명의 정원사, 클로버 병사들, 신하들, 공주와 왕자, 왕과 왕비, 토끼 모두 객체이다.

이 장면에 등장하는 객체는 제각기 독특한 모습을 하고 있으며, 독특한 행동 양식을 지니고 있다.
하지만 앨리스는 마지막 대사에서 알 수 있는 것처럼 이 객체들 대부분을 하나로 아울러 생각하고 있다.

'기껏해야 트럼프에 불과해'

앨리스는 객체들 중에서 토끼를 제외한 모든 객체를 '트럼프'라는 하나의 개념으로 단순화해서 바라보고 있는 것이다. 차이점은 과감하게 무시한 채 공통점만을 취해 단순화한 것이다.


그룹으로 나누어 단순화하기

왜 우리는 이 다양한 인물들을 '트럼프'라는 한 단어로 줄여 지칭할 수 있을까? 그 이유는 정원에 있는 인물들이 공통적으로 '트럼프'라고 했을 때 떠오르는 일반적인 외형과 행동 방식을 지니고 있기 때문이다.

결과적으로 앨리스는 정원에 있는 인물들을 두 개의 그룹으로 나눴다. 하나는 트럼프 그룹이고 또 다른 하나는 토끼의 그룹이다. '트럼프'와 '토끼'라는 두 개의 렌즈를 통해 정원을 바라보는 것은 정원에 내재된 복잡성을 효과적으로 감소시킨다.


개념

앨리스가 인물들의 차이점을 무시하고 공통점만을 취해 트럼프라는 개념으로 단순화한 것은 추상화의 일종이다.

객체지향 패러다임의 중심에는 구체적이고 실제적인 객체가 존재하지만 수많은 개체들을 개별적인 단위로 취급하기에는 인간이 지닌 인지능력은 턱없이 부족하다. 따라서 사람들은 본능적으로 공통적인 특성을 기준으로 객체를 여러 그룹으로 묶어 동시에 다뤄야 하는 가짓수를 줄임으로써 상황을 단순화하려고 노력한다.

이처럼 공통점을 기반으로 객체들을 묶기 위한 그릇을 개념이라고한다.

앨리스는 객체들 중에서 몸이 납작하고 두 손과 두 발이 네모난 몸 모서리에 달려 있는 객체만을 트럼프라는 개념으로 추상화했다. 여기서 트럼프는 이 같은 공통점을 가진 객체들을 포괄할 수 있는 개념이다.

개념을 이용하면 객체를 여러 그룹으로 분류할 수 있다.

각 객체는 특정한 개념을 표현하는 그룹의 일원으로 포함된다. 객체에 어떤 개념을 적용하는 것이 가능해서 개념 그룹의 일원이 될 때 객체를 그 개념의 인스턴스라고 한다. 개념은 객체를 분류할 수 있는 틀을 제공한다.

객체란 특정한 개념을 적용할 수 있는 구체적인 사물을 의미한다.
개념이 객체에 적용됐을 때 객체를 개념의 인스턴스라고 한다.


개념의 세 가지 관점

개념은 특정한 객체가 어떤 그룹에 속할 것인지를 결정한다.
일반적으로 객체의 분류 장치로서 개념을 이야기할 때는 아래의 세 가지 관점을 함께 언급한다.

  • 심볼(symbol) : 개념을 가리키는 간략한 이름이나 명칭

  • 내연(intension) : 개념의 완전한 정의를 나타내며 의미를 이용해 객체가 개념에 속하는지 여부를 확인 할 수 있다.

  • 외연(extension) : 개념에 속하는 모든 객체의 집합


'심볼'이란 개념을 가리키는 이름이다. 앨리스 이야기에서 개념을 지칭하는 데 사용하는 '트럼프'라는 이름은 개념의 심볼이 된다.

'내연'이란 개념의 의미를 나타낸다. 몸이 납작하고 두 손과 두 발이 네모난 몸 모서리에 달려 있다는 트럼프에 대한 설명이 바로 내연이다. 내연은 개념을 객체에게 적용할 수 있는지 여부를 판단하기 위한 조건이다.

'외연'은 개념에 속하는 객체들, 즉 개념의 인스턴스들이 모여 이뤄진 집합을 가리킨다. 정원사, 병사, 신하, 왕자와 공주, 왕과 왕비들 등은 모두 트럼프의 외연을 구성하는 객체 집합에 속한다.

개념을 구성하는 심볼, 내연, 외연은 객체의 분류 방식에 대한 지침을 제공한다.


객체를 분류하기 위한 틀

외연의 관점에서 어떤 객체에 어떤 개념을 적용할 수 있다는 것은 동일한 개념으로 구성된 객체 집합에 해당 객체를 포함시킨다는 것을 의미한다.

어떤 객체와 마주했을 때 객체에게 적용할 개념을 결정하는 것은 결국 해당 객체를 개념이 적용된 객체 집합의 일원으로 맞아들인다는 것을 의미한다. 객체에 어떤 개념을 적용할 것인지를 결정하는 것은 결국 객체들을 개념에 따라 분류하는 것과 동일하다. 따라서 분류란 특정한 객체를 특정한 개념의 객체 집합에 포함시키거나 포함시키지 않는 작업을 의미한다.

분류는 객체지향의 가장 중요한 개념 중 하나다. 어떤 객체를 어떤 개념으로 분류할지가 객체지향의 품질을 결정한다. 객체를 적절한 개념에 따라 분류하지 못한 애플리케이션은 유지보수가 어렵고 변화에 쉽게 대처하지 못한다.

적절한 분류 체계는 애플리케이션을 다루는 개발자의 머릿속에 객체를 쉽게 찾고 조작할 수 있는 정신적인 지도를 제공한다는 것이다.


분류는 추상화를 위한 도구다

추상화의 첫 번째 차원은 구체적인 사물 간의 공통점은 취하고 차이점은 버리는 일반화를 통해 단순화하는 것이다. 추상화의 두 번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거해 단순화하는 것이다.
개념을 통해 객체를 분류하는 과정은 추상화의 두 가지 차원을 모두 사용한다.

정원사, 병사, 왕 등을 트럼프라는 개념으로 묶은 것은 개별 객체 간의 차이점은 무시하고 공통점을 취한 결과다. 따라서 개념은 추상화의 첫 번째 차원인 일반화를 적용한 결과다.

트럼프에 속하는 객체들의 공통점 중에서도 중요하다고 생각하는 특징은 몸이 납작하고 두 손, 발이 네모난 몸 모서리에 달려 있다는 것 뿐이다. 그 외의 사항들은 전적으로 무시하고 있다. 추상화의 두 번째 차원에 따라 불필요한 세부 사항을 제거했다고 볼 수 있다.


3. 타입


데이터 타입

타입의 정의는 개념의 정의와 완전히 동일하다. 타입은 공통점을 기반으로 객체들을 묶기 위한 틀이다.

타입이 없는 체계 안에서 모든 데이터는 일련의 비트열로 구성된다. 메모리 내부의 비트열을 직접 들여다 보면서 메모리 안에 들어 있는 값이 어떤 의미인지 말할 수 있는 사람은 아무도 없다. 어떤 메모리 조각에 들어 있는 값의 의미는 그 값을 가져다 자신의 용도에 맞게 사용하는 외부의 해석가에 의해 결정된다.

사람들은 메모리 안의 데이터에 특정한 의미를 부여하기 시작했다. 어떤 데이터에 다른 데이터를 더하거나 뺄 수 있으면 숫자형, 문자로 구성되어 있고 다른 문자와 연결될 수 있다면 문자열형, 참/거짓을 이야기할 수 있다면 논리형으로 분류했다.

타입 시스템의 목적은 메모리 안의 모든 데이터가 비트열로 보임으로써 야기되는 혼란을 방지하는 것이다. 타입 시스템은 메모리 안에 저장된 0과 1에 대해 수행 가능한 작업과 불가능한 작업을 구분함으로써 데이터가 잘못 사용되는 것을 방지한다. 데이터가 잘못 사용되지 않도록 제약사항을 부과하는 것이다.


타입에 관련된 두 가지 중요한 사실을 알 수 있다.

첫째, 타입은 데이터가 어떻게 사용되느냐에 관한 것이다.

데이터가 어떤 타입에 속하는지를 결정하는 것은 데이터에 적용할 수 있는 작업이다. 데이터를 이용해 수행할 수 있는 작업을 연산자라고 한다. 여기서 중요한 것은 어떤 데이터의 어떤 연산자를 적용할 수 있느냐가 그 데이터 타입을 결정한다는 것이다.

둘째, 타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다.

데이터 타입의 표현은 연산 작업을 수행하기에 가장 효과적인 형태가 선택되며, 개발자는 해당 데이터 타입의 표현 방식을 몰라도 데이터를 사용하는 데 지장이 없다.

데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다. 데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.


객체와 타입

전통적인 데이터 타입에서 이야기하는 타입과 객체지향 타입 사이에 깊은 연관성이 있기 때문이다.
실제로 객체지향 프로그램을 작성할 때 우리는 객체를 일종의 데이터처럼 사용한다.

그렇다면 객체는 데이터인가? 그렇지 않다. 객체에서 중요한 것은 객체의 행동이다. 상태는 행동의 결과로 초래된 부수효과를 쉽게 표현하기 위해 도입한 추상적인 개념일 뿐이다.

  • 객체가 어떤 타입에 속하는지를 결정하는 것은 객체가 수행하는 행동이다.
    어떤 객체들이 동일한 행동을 수행할 수 있다면 그 객체들은 동일한 타입으로 분류될 수 있다.
  • 객체의 내부적인 표현은 외부로부터 철저하게 감춰진다.
    객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.

행동이 우선이다

객체가 어떤 행동을 하느냐에 따라 객체의 타입이 결정된다. 객체의 타입은 객체의 내부 표현과는 아무런 상관이 없다. 객체의 내부 표현 방식이 다르더라도 어떤 객체들이 동일하게 행동한다면 그 객체들은 동일한 타입에 속한다. 결과적으로 동일한 책임을 수행하는 일련의 객체는 동일한 타입에 속한다고 말할 수 있다.

결론적으로 객체의 타입을 결정하는 것은 객체의 행동뿐이다. 객체가 어떤 데이터를 보유하고 있는지는 타입을 결정하는 데 아무런 영향도 미치지 않는다.

타입이 데이터가 아니라 행동에 의해 결정된다는 사실은 객체지향 패러다임을 특정 짓는 중요한 몇 가지 원리와 원칙에 의미를 부여한다.

같은 타입에 속한 객체는 행동만 동일하다면 서로 다른 데이터를 가질 수 있다. 동일한 행동이란 동일한 책임을 의미하며, 동일한 책임이란 동일한 메세지 수신을 의미한다.

동일한 타입에 속한 객체는 내부의 데이터 표현 방식이 다르더라도 동일한 메세지를 수신하고 처리할 수 있다. 다만 내부의 표현 방식이 다르기 때문에 동일한 메세지를 처리하는 방식은 서로 다를 수 밖에 없다. 이것은 다형성에 의미를 부여한다.

행동에 따라 객체를 분류하기 위해서는 객체가 내부적으로 관리해야 하는 데이터가 아니라 객체가 외부에 제공해야 하는 행동을 먼저 생각해야 한다. 이를 위해서는 객체가 외부에 제공해야 하는 책임을 먼저 결정하고, 그 책임을 수행하는 데 적합한 데이터를 나중에 결정한 후, 데이터를 책임을 수행하는 데 필요한 외부 인터페이스 뒤로 캡슐화해야 한다.

객체를 결정하는 것은 행동이다. 데이터는 단지 행동을 따를 뿐이다. 이것이 객체를 객체답게 만드는 가장 핵심적인 원칙이다.


4. 타입의 계층


트럼프 계층

앞에 나왔던 정원사, 병사 등은 정말로 트럼프인가? 그렇지 않다. 단지 트럼프와 몇 가지 특징을 공유하기 때문에 트럼프라고 불렀을 뿐이다. 정확하게 말하면 등장인물들을 트럼프가 아니라 '트럼프 인간'으로 봤던 것이다.

등장인물들의 외양은 트럼프와 유사하지만 행동 자체는 트럼프와 완벽하게 동일하지 않다.
트럼프 타입을 정의할 때, 즉 내연을 납작 엎드릴 수 있고 뒤집어질 수도 있으며 걸을 때마다 몸이 종이처럼 좌우로 펄럭이는 존재로 정의했다. 일반적으로 트럼프 카드는 납작 엎으릴 수 있고 뒤집어질 수는 있지만 걸어다닐 수는 없다.

트럼프 인간 타입의 객체는 트럼프 타입의 객체가 할 수 있는 모든 행동을 할 수 있을뿐만 아니라 추가적으로 걸어다니는 행동을 더 할 수 있다.

외연이라는 객체 집합의 관점에서 트럼프와 트럼프 인간 타입을 살펴보자. 트럼프 인간은 트럼프다. 따라서 모든 트럼프 인간은 동시에 트럼프이기도 하다. 이것은 트럼프 인간 타입에 속한 객체는 트럼프 타입의 객체에도 함께 속해야 한다는 것을 의미한다.

트럼프는 트럼프 인간을 포괄하는 좀 더 일반적인 개념이다. 트럼프 인간은 트럼프보다 좀 더 특화된 행동을 하는 특수한 개념이다. 이 두 개념 사이의 관계를 일반화/특수화(generalization/specialization) 관계라고 한다.


일반화/특수화 관계

객체지향에서 일반화/특수화 관계를 결정하는 것은 객체의 상태를 표현하는 데이터가 아니라 행동이라는 것이다. 어떤 객체가 다른 객체보다 더 일반적인 상태를 표현하거나 더 특수한 상태를 표현한다고 해서 두 객체가 속하는 타입 간에 일반화/특수화 관계가 성립하는 것은 아니다. 두 타입 간에 일반화/특수화 관계가 성립하려면 한 타입이 다른 타입보다 더 특수하게 행동해야 하고 반대로 한 타입은 다른 타입보다 더 일반적으로 행동해야 한다.

행동의 관점에서 일반적인 타입이란 특수한 타입이 가지는 모든 행동들 중에서 일부 행동만을 가지는 타입을 가리킨다. 특수한 타입이란 일반적인 타입이 가진 모든 타입을 포함하지만 거기에 더해 자신만의 행동을 추가하는 타입을 가리킨다. 따라서 일반적인 타입은 특수한 타입보다 더 적은 수의 행동을 가지고 특수한 타입은 일반적인 타입보다 더 많은 수의 행동을 가진다.

여기서 주의해야 할 점은 타입의 내연을 의미하는 행동의 가짓수와 외연을 의미하는 집합의 크기는 서로 반대라는 사실이다. 일반화/특수화 관계에서 일반적인 타입은 특수한 타입보다 더 적은 수의 행동을 가지지만 더 큰 크기의 외연 집합을 가진다.


4. 슈퍼타입과 서브타입

더 일반적인 타입을 슈퍼타입(SuperType)이라고 하고 좀 더 특수한 타입을 서브타입(SubType)이라고 한다. 어떤 타입이 다른 타입의 서브타입이 되기 위해서는 행위적 호환성을 만족시켜야 한다. 일반적으로 서브타입은 슈퍼타입의 행위와 호환되기 때문에 서브타입은 슈퍼타입을 대체할 수 있다.

일반화/특수화 관계는 그림과 같이 좀 더 일반적인 타입인 슈퍼타입을 상단에, 좀 더 특수한 타입인 서브타입을 하단에 위치시키고 속이 빈 삼각형으로 연결해서 표현한다. 서브타입에서는 슈퍼타입과 중복된 행위를 생략할 수 있다. 서브타입은 슈퍼타입의 행위에 추가적으로 특수한 자신만의 행동을 추가하는 것이므로 슈퍼타입의 행동은 서브타입에 자동으로 상속된다.


일반화는 추상화를 위한 도구다

추상화의 두 번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거시켜 단순하게 만드는 것이다. 일반화/특수화 계층은 객체지향 패러다임에서 추상화의 두번째 차원을 적절하게 활용하는 대표적인 예이다.

정원에 있던 등장인물들의 차이점은 배제하고 공통점만을 강조함으로써 이들의 공통의 타입인 트럼프 인간으로 분류했다는 것과 트럼프 인간을 좀 더 단순한 관점에서 바라보기 위해 불필요한 특성을 배제하고 좀 더 포괄적인 의미를 지닌 트럼프로 일반화했다는 것을 보면 객체지향 패러다임을 통해 세상을 바라보는 대부분의 경우에 분류와 일반화/특수화 기법을 동시에 적용하게 된다.


5. 정적 모델


타입의 목적

타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하기가 너무 어렵기 때문이다.

타입은 시간에 따라 동적으로 변하는 앨리스의 상태를 시간과 무관한 정적인 모습으로 다룰 수 있게 해준다.


그래서 결국 타입은 추상화다

어떤 시점에 앨리스에 관해 생각할 때 불필요한 시간이라는 요소와 상태 변화라는 요소를 제거하고 철저하게 정적인 관점에서 앨리스의 모습을 묘사하는 것을 가능하게 해준다.

앨리스가 어떻게 변할 수 있는지 다양한 가능성을 고려할 때는 구체적으로 키가 얼마인가보다는 단순히 키가 변할 수 있다는 가능성에 집중하는 것이 더 간단하다.

타입은 추상화다. 타입을 이용하면 객체의 동적인 특성을 추상화할 수 있다. 타입은 시간에 따른 객체의 상태 변경이라는 복잡성을 단수화할 수 있는 효과적인 방법인 것이다.


동적 모델과 정적 모델

객체를 생각할 때 우리는 두 가지 모델을 동시에 고려한다.

하나는 객체가 특정 시점에 구체적으로 어떤 상태를 가지느냐다. 이를 객체의 스냅샷이라고 한다. UML에서 스냅샷은 객체 다이어그램이라고도 불린다. 스냅샷처럼 실제로 객체가 살아 움직이는 동안 상태가 어떻게 변하고 어떻게 행동하는지를 포착하는 것은 동적 모델(dynamic model)이라고 한다.

다른 하나는 객체가 가질 수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것이다. 이런 모델을 타입 모델(type model)이라고 한다. 이 모델은 동적으로 변하는 객체의 상태가 아니라 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델(static model)이라고도 한다.

객체지향 애플리케이션을 설계하고 구현하기 위해서는 객체 관점의 동적 모델과 객체를 추상화한 타입 관점의 정적 모델을 적절히 혼용해야 한다.


클래스

객체지향 프로그래밍 언어에서 정적인 모델은 클래스를 이용해 구현된다. 따라서 타입을 구현하는 가장 보편적인 관점은 클래스를 이용하는 것이다. 클래스와 타입은 동일한 것이 아니다. 타입은 객체를 분류하기 위해서 사용하는 개념이다. 반면 클래스는 단지 타입을 구현할 수 있는 여러 구현 매커니즘 중 하나일 뿐이다.

profile
끊임없이 성장하고 싶은 개발자

0개의 댓글