중복성을 최소화하고 일관성 등을 보장하여 데이터베이스의 품질을 보장하고 성능을 향상시킴
함수적 종속성 등의 종속성 이론을 이용함
잘못 설계된 관계형 스키마를 쪼개어 바람직한 스키마로 만듦
하나의 종속성이 하나의 릴레이션에 표현될 수 있도록 분해해가는 과정
논리적 설계 단계에서 수행
논리적 처리 및 품질에 큰 영향을 미침
정규화된 데이터 모델은 일관성, 정확성, 단순성, 비중복성, 안정성 보장
제1정규형, 제2정규형, 제3정규형, BCNF형, 제4정규형, 제5정규형 (차수가 높아질수록 만족시켜야할 제약조건이 늘어남)
수준이 높아질수록 유연한 데이터 구축이 가능하고 데이터의 정확성이 높아지지만 물리적 접근이 복잡하고 너무 많은 조인으로 조회 성능 저하됨
정규화를 거치지 않으면 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상 발생하는 것
삽입 이상(Insertion Anomaly)
삭제 이상(Deletion Anomaly)
갱신 이상(Update Anomaly)
모든 도메인(Domain)이 원자값(Atomic Value)만으로 되어있는 정규형
릴레이션 R이 1NF이고, 기본키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속 만족하는 정규형
릴레이션 R이 2NF이고, 기본케가 아닌 모든 속성이 기본키에 대해 이행적 종속을 만족하지 않는 정규형
릴레이션 R에서 결정자가 모두 후보키(Candidate Key)인 정규형
다중값 종속(MVD;Multi Valued Dependency)이 존재할 경우 R의 모든 속성이 A에 함수적 종속 관계를 만족하는 정규형
조인할 때 원래 데이터로 돌아가야하는데 세개로 쪼갤 수 밖에 없을 때는 안됨
조인종속성을 갖는 속성들이 후보키가 아닐 때 문제가 생김
테이블 R의 모든 조인 종속이 R의 후보키를 통해서만 성립되는 정규형