[SQL] 데이터 모델링의 이해

junghan·2023년 3월 16일
0

SQL

목록 보기
1/5
post-thumbnail

SQLD 자격시험을 준비하면서 학습한 내용을 정리하려합니다. 이전에 프로젝트를 진행하면서 데이터 베이스 설계에 대한 고민이 많았었는데, 프로젝트 전, 이 내용을 심도있게 학습했더라면 조금 더 짜임새있게 DB를 구성할 수 있지 않았을까하는 아쉬움이 남습니다.

데이터 모델의 이해

데이터 모델링의 중요성 및 유의점

  • 중복 : 같은 시간, 같은 데이터를 제공하는 것.

  • 비유연성 : 사소한 업무변화에 데이터 모델이 수시로 변경되면 안됩니다.
    데이터 정의를 사용프로세스와 분리해야합니다.

  • 비일관성 : 데이터 간 상호 연관관계에 대해 명확하게 정의해야 합니다.

데이터 모델링

  • 개념적 모델링: 추상화 수준이 높고 업무중심적이고 포괄적인 수준의 모델링 진행.
    전사적 데이터 모델링, EA수립 시 많이 이용합니다.

  • 논리적 모델링: 시스템으로 구축하고자 하는 업무에 대해 KEY, 속성, 관계 등을 정확하게 표현합니다. 재사용성이 높습니다. 정규화, M:M 관계해소 등 작업

  • 물리적 모델링: 실제로 데이터 베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계합니다.

데이터 독립성 요소

  • 외부 스키마: 개개 사용자가 보는 개인적 DB 스키마입니다. View 단계 여러 사용자 관점으로 구성되어 있습니다. 응용프로그래머가 접근하는 DB의 정의입니다.

  • 개념 스키마: 모든 사용자 관점을 통합한 전체 DB 스키마입니다. DB에 저장되는 데이터와 그들간의 관계를 표현하는 스키마입니다.

  • 내부 스키마: 물리적 장치에서 데이터가 실제적으로 저장되는 DB 스키마입니다.

  • 데이터 독립성

    • 논리적 독립성: 개념스키마 변경, 외부스키마에 영향없음.
    • 물리적 독립성: 내부스키마 변경, 외부/개념 스키마에 영향 없음.
  • Mapping(사상): 상호 독립적인 개념을 연결시켜주는 다리

    • 논리적 사상: 외부 스키마 - 개념 스키마
    • 물리적 사상: 개념 스키마 - 내부 스키마

데이터 모델 표기법

1976년 피터첸이 Entity Relationship Model 개발

  • Baker, IE 기법이 많이 쓰임

  • 엔터티, 관계, 속성으로 이뤄짐

ERD 작업순서

  1. 엔터티 그린다.
  2. 엔터티를 적적하게 배치한다.
  3. 엔터티 관계를 설정한다.
  4. 관계명을 기술한다.
  5. 관계의 참여도 기술한다.
  6. 관계 필수여부를 기술한다.

좋은 데이터 모델 요소

  • 완전성: 업무에 필요한 모든 데이터가 모델에 정의되어 있어야한다.
  • 중복 배제: 하나의 DB내 동일한 사실은 한번만 정의되어야 한다.
  • 업무규칙: 많은 규칙을 사용자가 공유하도록 제공해야한다.
  • 데이터 재사용: 데이터가 독립적으로 설계되어야 한다.
  • 의사소통: 업무 규칙은 엔터티, 서브타입, 속성, 관계 등의 형태로 최대한 자세하게 표현되어 있어야한다.
  • 통합성: 동일한 데이터는 한번만 정의하고 공유 데이터에 대한 구조를 여러 업무 영역에서 공동으로 사용하기 용이하게 정의할 수 있어야 한다.

엔터티

엔터티란?

업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합적인 것(Things), 보이지 않는 개념 포함

엔터티의 특징

  • 반드시 해당 업무에서 필요하고 관리하고자 함
  • 유일한 식별자에 의해 식별 가능
  • 두 개 이상의 인스턴스의 집합
  • 업무 프로세스에 의해 이용되어야 함
  • 반드시 속성이 있어야 함
  • 다른 엔터티와 최소 1개 이상의 관계가 있어야 함
    -> 통계성/코드성 엔터티는 관계 생략 가능

엔터티의 분류

  • 유무형에 따른 분류 : 유형, 개념, 사건 엔터티
    • 유형 : 물리적 형태 ex) 사원, 물품, 강사
    • 개념 : 개념적 정보 ex) 조직, 보험상품
    • 사건 : 업무 수행시 발생 ex) 주문, 미납

  • 발생시점에 따른 분류 : 기본/키, 중심, 행위 엔터티
    • 기본 : 그 업무에 원래 존재하는 정보, 타 엔터티의 부모 역할, 자신의 고유한 주식별자 가짐 ex) 사원, 부서
    • 중심 : 기본 엔터티로부터 발생, 다른 엔터티와의 관계로 많은 행위 엔터티 생성 ex) 계약, 사고, 주문
    • 행위 : 2개 이상의 부모 엔터티로부터 발생, 자주 바뀌거나 양이 증가 ex) 주문목록, 사원변경이력

엔터티의 명명

현업업무에서 사용하는 용어 사용, 약어 사용금지, 단수명사 사용, 고유한 이름 사용, 생성의미대로 부여


속성

속성이란?

업무에서 필요로 하는 인스턴스로 관리하고자 하는 의미상 분리되지 않는 최소의 데이터 단위

  • 한 개의 엔터티는 2개 이상의 인스턴스 집합
  • 한 개의 엔터티는 2개 이상의 속성을 가짐
  • 한 개의 속성은 1개의 속성값을 가짐

속성의 분류

  • 기본 : 업무로부터 추출한 모든 일반적인 속성입니다.

  • 설계 : 업무를 규칙화하기 위해 새로 만들거나 변형, 정의하는 속성입니다. ex) 일련번호

  • 파생 : 다른 속성에 영향을 받아 발생하는 속성입니다. 빠른 성능을 낼 수 있도록 원래 속성의 값을 계산, 가급적 파생속성을 적게 정의하는 것이 좋습니다. ex) 합

도메인

속성에 대한 데이터타입, 크기, 제약사항 지정

속성의 명명

  • 해당업무에서 사용하는 이름 부여
  • 서술식 속성명은 사용 금지
  • 약어 사용 금지
  • 구체적으로 명명하여 데이터 모델에서 유일성 확보

관계

관계란?

엔터티의 인스턴스 사이의 논리적인 연관성으로서 존재의 형태로서나 행위로서 서로에게 연관성이 부여된 상태를 말합니다. ex) 강사 - 가르친다(관계) - 수강생

페어링이란?

엔터티 안에 인스턴스가 개별적으로 관계를 가지는 것을 말합니다.
관계 = 페어링의 집합

UML(통합모델링언어)에서의 관계

  • 연관관계(실선) : 항상 이용하는 관계 ex) 소속된다.
  • 의존관계(점선) : 상대 행위에 의해 발생하는 관계 ex) 주문한다.

관계의 표기법 관계명

  • 관계의 이름
  • 관계차수 : 1:1, 1:M, M:N
  • 관계선택성(관계선택사양) : 필수관계, 선택관계

관계 체크사항

  • 2개의 엔터티 사이에 관심있는 연관 규칙이 있는지
  • 2개의 엔터티 사이에 정보의 조합 발생하는지
  • 업무기술서, 장표에 관계연결에 대한 규칙 서술하는지
  • 업무기술서, 장표에 관계연결을 가능케 하는 동사(verb)가 있는지?

식별자

식별자란?

하나의 엔터티에 구성되어 있는 여러개의 속성 중에 엔터티를 대표할 수 있는 속성을 의미합니다. 하나의 엔터티는 반드시 하나의 유일한 식별자가 존재해야합니다.

엔터티 내에서 인스턴스를 구분하는 구분자 식별자는 논리적, Key는 물리적 데이터 모델링 단계에 사용합니다.

식별자의 특징

  • 유일성 : 주식별자에 의해 모든 인스턴스들이 유일 하게 구분됩니다.

  • 최소성 : 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 합니다.

  • 불변성 : 지정된 주식별자의 값은 자주 변하지 않아 야 함. 변하면 이전 기록 말소됩니다.

  • 존재성 : 주식별자가 지정되면 반드시 값이 들어와 야 합니다. (not null)

식별자 분류

  • 대표성여부
    • 주 식별자 : 엔터티 내에서 각 필드를 구분할 수 있는 구분자, 타 엔터티와 참조관계를 연결할 수 있는 식별자 입니다.
    • 보조 식별자 : 엔터티 내에서 각 필드를 구분할 수 있는 구분자이나 대표성이 없고, 참조관계 연결할 수 없습니다.

  • 스스로생성여부
    • 내부식별자 : 스스로 생성되는 식별자
    • 외부식별자 : 타 엔터티로부터 받아오는 식별자

  • 속성의 수
    • 단일 : 하나의 속성으로 구성
    • 복합 : 2개 이상의 속성으로 구성

  • 대체 여부
    • 본질 : 업무에 의해 만들어지는 식별자
    • 인조 : 인위적으로 만든 식별자

주식별자 도출기준

  • 해당 업무에서 자주 이용되는 속성입니다.
  • 명칭, 내역 등과 같이 이름으로 기술되는 것들은 가능하명 주식별자로 지정하지 않습니다.
  • 복합으로 주식별자로 구성할 경우 너무 많은 속성이 포함되지 않도록 합니다.
    -> 너무 많으면 인조식별자 생성한다.

식별자 관계

  • 식별자 : 자식의 주식별자로 부모의 주식별자 상속

    • 부모로부터 받은 식별자를 자식엔터티의 주식별자 로 이용하는 경우
    • 강한 연결관계 표현, 실선 표기
    • 식별자 관계로만 설정 시 주식별자 증가로 쿼리문이 복잡해진다
  • 비식별자 : 부모 속성을 자식의 일반 속성으로 사용

    • 부모 없는 자식이 생성될 수 있는 경우
    • 부모와 자식의 생명주기가 다른 경우 (별도로 소멸)
    • 여러개의 엔터티가 하나의 엔터티로 통합되어 표현 되었는데 각각의 엔터티가 별도의 관계를 가진 경우
    • 자식엔터티에 별도의 주식별자를 생성하는 것이 더 유리한 경우
    • SQL 문장이 길어져 복잡성 증가되는 것 방지
      • 약한 연결관계 표현, 점선 표기
      • 비식별자 관계로만 설정 시 부모 엔터티와 조인하여 성능 저하




출처 : SQL 전문가 가이드 서적

profile
42seoul, blockchain, web 3.0

0개의 댓글