정규화 (1~3단계)

박지성 학부생·2023년 2월 4일
0

BackEnd Develop log

목록 보기
17/27
post-thumbnail

SQL normalization(정규화)란?

  • 정규화 (normalization)
    • 데이터를 중복으로 저장하면 일관되지 않은 데이터, 비정상적인 삽입 갱신 삭제 처리, 디스크 공간 낭비 등 많은 문제를 일으킨다. 정규화는 중복 데이터를 저장하면서 일으키는 문제점을 없애기위해 정보를 주제별로 분할하는 프로그램을 의미한다.
    • 규칙없이 테이블 구성하고 순서없이 데이터를 넣으면 추후 관리가 어려워질 수 있으니 중복 데이터를 최소화 하는 등 여러 사항을 고려해 규칙에 맞게 설계하여 예상되는 문제들을 방지한다.

규칙의 목표는 테이블 간에 중복된 데이터를 허용하지 않는다는 것이다. 중복된 데이터를 허용하지 않음으로써 무결성(Integrity)를 유지할 수 있으며, DB의 저장 용량 역시 줄일 수 있다. 이러한 테이블을 분해하는 정규화 단계가 정의되어 있는데, 여기서 테이블을 어떻게 분해되는지에 따라 정규화 단계가 달라진다.


정규화의 종류, 정규화의 단계

(보통, 3NF 정규화까지만 해도 충분하다고 함.)

  • <제1 정규화>

    • 제1 정규화란 테이블의 컬럼이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것.

    • 아래 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제1 정규형을 만족하지 못하고 있다.

    • 그렇기 때문에 이를 제1 정규화하여 분해할 수 있다.

    • 제1 정규화를 진행한 테이블(한 컬럼에는 하나의 값만)

  • <제2 정규화>

    • 제2 정규화란 제1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것이다.

    • 아래 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키를 갖고있고, (학생번호, 강좌이름)인 기본키는 강의실을 결정하고 있다.

      • (학생번호, 강좌이름) --> (강의실)

    • 하지만 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있다.
      (강좌이름) --> (강의실)

    • 그렇기 때문에 위의 테이블의 경우 아래와 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제2 정규형을 만족시킬 수 있다.

  • <제3 정규화>

    • 제3 정규화란 제2정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것이다.

      • 이행적 종속이란 A -> B, B -> C가 성립할 때 A -> C가 성립되는 것을 의미한다.
    • 기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있다.

    • 따라서 이를 (학생 번호, 강좌 이름) 테이블(강좌 이름, 수강료) 테이블분해해야 한다.

    • 이행적 종속을 제거하는 이유

      • ex) 501번 학생이 수강하는 강좌가 스포츠경영학으로 변경되었다고 하자. 이행적 종속이 존재한다면 501번의 학생은 스포츠경영학이라는 수업을 20000원이라는 수강료로 듣게 된다. 물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제3 정규화를 하는 것이다.
      • 즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 아래 그림과 같다.

profile
참 되게 살자

0개의 댓글