Normalization (정규화)

이유석·2022년 3월 30일
1

CS - Data Base

목록 보기
6/11
post-thumbnail

Normalization (정규화)

목적

  • 테이블 간 중복된 데이터를 허용하지 않는 것이다.
  • 불필요한 데이터를 최소화
  • 무결성을 지키고, 이상 현상(Anomaly)을 방지한다.
  • 테이블 구성을 논리적이고 직관적으로 할 수 있다.
  • 데이터베이스 구조가 확장에 용이해진다.

단계

  • 1NF (제 1 정규화)
  • 2NF (제 2 정규화)
  • 3NF (제 3 정규화)
  • BCNF

1NF (제 1 정규화)

정의

  • 테이블 컬럼이 원자값(하나의 값)을 갖도록 테이블을 분리시키는 것을 말한다.

만족해야 할 조건

  • 어떤 릴레이션에 속한 모든 도메인이 원자값만으로 되어 있어야 한다.
  • 모든 속성에 반복되는 그룹이 나타나지 않는다.
  • 기본키를 사용하여 관련 데이터의 각 집합을 고유하게 식별할 수 있어야 한다.

예시
예를 들어 아래와 같은 고객 취미 테이블이 존재한다고 하자.

위의 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제 1 정규형을 만족하지 못하고 있다.
그렇기 때문에 이를 제 1 정규화하여 분해할 수 있다.

제 1 정규화를 진행한 테이블안 아래와 같다.

2NF (제 2 정규화)

정의

  • 제 1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만들도록 테이블을 분리시키는 것을 말한다.

    완전 함수 종속 : 기본키의 부분집합이 결정자가 되어서는 안된다는 것

예시
예를 들어 아래와 같은 수강 강좌 테이블이 존재한다고 하자.

이 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키이다.

  • (학생번호, 강좌이름)인 기본키는 성적을 결정하고 있다.
  • 기본키의 부분집합인 (강좌이름)에 의해 강의실이 결정될 수 있다.

즉 기본키(학생번호, 강좌이름)의 부분집합인 (강좌이름)이 결정자이기 때문에 제 2 정규형을 만족하지 못하고 있다.
그렇기 때문에 기존의 테이블에서 (강좌이름, 강의실)을 분리하여 별도의 테이블로 관리하여 제 2 정규형을 만족시킬 수 있다.

제 2 정규화를 진행한 테이블은 아래와 같다.

3NF (제 3 정규화)

정의

  • 제 2 정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분리시키는 것을 말한다.

    이행적 종속 : A → B, B → C 이면 A → C가 성립되는 것을 의미한다.

예시
예를 들어 아래와 같은 계절학기 테이블이 존재한다고 하자.

이 테이블에서

  • 학생 번호는 강좌 이름을 결정한다. (학생 번호 → 강좌 이름)
  • 강좌 이름은 수강료를 결정한다. (강좌 이름 → 수강료)

즉 학생번호는 수강료를 결정하게 된다. (학생 번호 → 수강료)
그렇기 때문에 기존의 테이블을 (학생 번호, 강좌 이름) 테이블과 (강좌 이름, 수강료) 테이블로 분리하여 제 3 정규형을 만족시킬 수 있다.

제 3 정규화를 진행한 테이블은 아래와 같다.

BCNF

정의

  • 제 3 정규화를 진행한 테이블에 대해 모든 결정자가 후보키가 되도록 테이블을 분리시키는 것을 말한다.

예시
예를 들어 아래와 같은 특강 수강 테이블이 존재한다고 하자.

이 테이블에서 기본키는 (학생 번호, 특강 이름) 이다.

  • 기본키 (학생 번호, 특강 이름)는 교수를 결정하고 있다.
  • (교수)는 특강 이름을 결정하고 있다.

문제는 교수가 특강이름을 결정하는 결정자 이지만, 후보키가 아니라는 점이다.
그렇기 때문에 특강신청 테이블 (학생번호, 교수) 과 특강교수 테이블 (특강이름, 교수) 로 분리하여 BCNF 정규형을 만족시킬 수 있다.

BCNF 정규화를 진행한 테이블은 아래와 같다.

profile
https://github.com/yuseogi0218

0개의 댓글