DAsP 3. 데이터 표준화

SOOYEON·2022년 11월 16일
0

DAsP

목록 보기
3/3

데이터 표준화 개요

데이터 명칭

  • 유일성 : 하나의 개념에 대해 사용자가 모두 통일된 용어를 사용할 수 있도록 하나의 명칭만 허용해야 함
  • 업무적 관점의 보편성 : 업무적 관점에서 보면 보편적으로 인지되어야 함
  • 의미 전달의 충분성 : 데이터 명칭 이름만으로 데이터의 의미 및 범위가 파악될 수 있어야 함



데이터 규칙 (업무 규칙)

: 발생 가능 데이터를 사전 정의해 입력 오류와 통제 위험 최소화 (정합성/완전성 향상)

  • 기본값 : 입력 생략 시 자동으로 입력되는 값
  • 허용값 : 입력이 가능한 데이터 값을 제한 (코드 값을 사전에 정의하는 경우)
  • 허용 범위 : 입력 가능한 값을 범위로 제한 (ex 1~5)



데이터 표준화 구성요소

  • 표준 용어 : 업무적 용어와 기술적 용어(테이블명, 컬럼명)
  • 표준 단어 : 동일한 개념을 의미하는 용어의 생성을 예방

※ 표준 단어는 영문명의 작성 기준이 됨. 테이블 및 컬럼의 한결명만 작성하면 영문명은 표준 단어에 의해 자동으로 결정됨

  • 표준 도메인 : 컬럼에 대한 성질을 그룹화 한 개념, 데이터 타입 및 길이를 일관되게 정의할 수 있음
  • 표준 코드 : 도메인의 한 유형으로서 특정 도메인 값이 이미 정의되어 있는 도메인이며 코드 값까지 미리 정의해야 함



데이터 관리자 세부 역할

전사 데이터 관리자

  • 데이터 표준화에 대한 정책 결정
  • 검토된 데이터 표준 제안에 대한 승인

업무 데이터 관리자 (Owenership)

  • 담당 업무 기능의 데이터 요구 사항 반영을 위해 필요한 데이터 표준 정의
  • 업무 관련 데이터 표준 변경 제안에 대한 합동 검토

업무 시스템 데이터 관리자 (Stewardship)

  • 시스템 관리 목적의 데이터 요구사항을 위해 필요한 데이터 표준 정의
  • 업무 관련 데이터 표준 변경 제안에 대한 합동 검토
  • 데이터 모델에 대한 데이터 표준 적용 및 준수 여부 체크
  • Owenership : 데이터의 생성, 변경, 삭제 권한의 관리주체로, 주로 해당 시스템을 사용하여 시스템 사용 목적으로 달성하고자 하는 부서나 담당자를 의미
  • Stewardship : 데이터 오너쉽을 갖는 주체로부터 데이터에 대한 입력, 수정, 삭제 등의 권한을 위임받은 정보화 담당자 또는 담당 부서를 의미



데이터 관리자 / 데이터베이스 관리자 역할 비교

구분데이터 관리자 DA데이터베이스 관리자 DBA
관리 대상데이터 요구 사항을 반영한 데이터 모델 및 각종 표준데이터 모델을 특정 데이터베이스 제품의 특성에 맞추어 구축한 데이터베이스
주업무업무에 필요한 데이터의 메타 데이터를 정의하고 신규 또는 변경된 요구 사항을 신속하게 데이터 모델에 반영요구되는 성능 수준을 발휘하면서 안정적으로 운영되도록 데이터베이스를 관리
품질 수준 확보데이터 표준의 관리 및 적용을 통해 품질 수준을 확보데이터의 정합성 관리를 통해 데이터 품질 수준을 확보
전문 기술담당 업무 분야에 대한 업무 지식데이터 모델링에 대한 전문성이 필요데이터 모델에 대한 해독 능력 및 특정 데이터 베이스 제품에 대한 전문지식이 필요



데이터 표준화 절차

현황조사현황 데이터 사전 생성표준화 지침서 초안 수립데이터 표준 사전 생성
코드 표준 사전 생성데이터 표준 검증데이터 표준 관리체계 수립메타 데이터 관리 시스템 적용표준 데이터 시스템 운영



데이터 표준 관리 도구

  • 데이터 표준 관리 도구
  • 데이터 구조 관리 도구 : 논리 및 물리 데이터 모델을 생성 및 등록 수행
  • 데이터 품질 진단 도구 : 현재 시스템에 등록된 데이터에 대한 값의 오류나 표준화 수준을 진단
  • 데이터 흐름관리 도구 : 데이터 베이스와 어플리케이션의 상호 영향도 분석을 수행



데이터 표준 관리 도구 도입 시 고려 사항

  • 확장성
  • 유연성
  • 편의성

데이터 표준 수립

데이터 표준 대상별 명명 규칙

사용문자

알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용 조건을 규정

영문 대소문자

알파벳을 사용할 경우 대소문자 사용과 관련한 규칙을 규정

한글명과 영문명 동시 정의 여부

DBMS에 반영되는 객체들은 대부분 알파벳으로 정의하도록 되어 있는 경우가 있기 때문에 이와 관련된 데이터 표준 정의 대상에 대해서 한글명과 영문명의 정의가 필요함 일반적으로 표준 단어, 표준 용어가 이에 해당

명칭의 구조

명칭에 대한 단어 표준 조합 구조를 명시

명칭에 대한 허용 길이

표준 용어를 사용하는 테이블명 및 컬럼명의 경우 DBMS의 물리적 특성으로 길이의 제약을 받기 때문에 표준 용어의 허용 길이를 명시해야 함

명칭 표준화에 대한 기준

유사한 개념의 단어/용어가 복수 개 존재할 경우 어떤 기준으로 표준 단어/ 표준 용어로 선택할 것인가를 결정하는 기준을 정의

명칭에 대한 예

기준을 준수하여 작성된 샘플을 몇 가지 명시

주요 데이터 표준 대상별 지침의 일반적인 구성

표준 단어

  • 한글명 및 영문명에 대한 알파벳, 한글, 숫자, 특수 문자 등의 허용 여부 또는 사용 조건
  • 대소문자 사용 규칙, 한글/영문명 허용 길이, 합성어 정의에 대한 지침
  • 접두사 처리 방안, 동음이의어/이음동의어 허용 여부 및 처리 방안

표준 용어

  • 데이터 명칭에 대한 구조 체계, 한글/영문명 허용 길이
  • 용어 테이블이나 컬럼명으로 사용 시 준수할 특이한 명명 규칙
  • 용어를 테이블이나 컬럼명으로 사용 시 준수할 특이한 명명 규칙
  • 용어를 컬럼명으로 사용 시 데이터 형식 표준화에 대한 기준 및 표준 도메인 적용 여부

표준 도메인

  • 데이터 형식 표준화에 대한 기준

표준 코드

  • 데이터 명칭에 대한 구조 체계 및 명명에 대한 기준
  • 데이터 형식 표준화에 대한 기준, 코드 번호 체계 정의에 대한 규칙

표준 단어 사전

  • 업무상 사용하며 일정한 의미를 갖는 최소 단위의 단어를 정의한 사전
  • 정의된 단어는 궁극적으로 속성에 사용된다
  • 단어 정의시 이음동의어에 주의해야 함
    • 사원과 직원이 동일할 경우, 사원 : 표준어, 직원 : 유사어 또는 금지어로 관리
  • 동일한 단어를 사용하지만 의미가 다른 동음이의어도 사용하지 않는 것이 바람직하다
    • EX) 이전, BEFORE : 바로 전, 이전 TRANSFER : 옮기다
  • 표준화의 핵심은 동일한 의미의 속성명을 통일시키는 것

표준 단어 관리 기준

  • 표준성 : 일반적 업무에서 사용하는 단어 가운데 추출하며, 지나치게 업무적인 (전문적인) 용어는 최소화해야 한다.
  • 일반성: 일반적인 사전적 의미와 크게 다르지 않아 일반인도 의미를 이해할 수 있어야 한다.
  • 대표성 : 비슷한 의미로 동의어들을 대표할 수 있어야 한다.

표준 단어의 정의

  1. 현행 용어 수집 : 기업 내 모든 데이터 모델 또는 정의서에서 현행 용어에 대한 한글/영문명을 수집하며, 현행 용어를 통해 영문 약어명을 도출하는 것이 목적이므로 한글명이 존재하지 않는 모델은 수집 대상에서 제외한다.
  2. 단어 분할 : 최소 단위의 단어로 분할, 단독으로 분할되는 숫자는 표준화 대상 단어에서 제외한다.
  3. 단어 정련 : 최종적으로 한글명과 영문명이 모두 유일해야 한다.
    4, 표준 단어 사전 정의 : 표준으로 선택한 단어의 한글명, 영문명을 등록한다.

표준 도메인 사전 정의

  • 표준화 수행시 중요한 요소
    도메인은 데이터 타입과 길이, 포맷 등이 같은 값의 집합이다.
  • 하나의 속성에는 허용된 유효한 값의 형태가 같아야 하므로 도메인은 하나만 사용해야 한다.

표준 코드 정의

코드 정보 누락 방지 방법

  • 코드 데이터값 수집
  • 코드성 컬럼 파악
  • 수집된 코드에 대한 사용처 파악

표준 코드 정의

  • 통합 대상이 없는 코드는 현행 코드 인스턴스를 그대로 유지한다
  • 통합 대상이 존재하고 통합 대상 코드의 코드 번호가 서로 상이할 경우 새로운 코드를 부여한다.

표준 코드 관리 기준

  • 재사용성 : 표준화 기구, 정부 등에서 정의한 코드 재사용이 더 효과적이다
  • 일관성 : 업무 범위 내에서 가능한 한 유일하게 정의
  • 정보 분석성 : 가능한 범위의 데이터는 모두 코드화해 관리

표준 코드 정의 시 고려 사항

  • 향후 확장성을 고려하여 정의해야 하며 여러 업무에서 사용하도록 통합된 코드로서의 일관성을 유지해야한다.
  • 시스템 운영 중 변경되는 경우 해당 코드 사용한 기존 데이터를 위해 삭제하지 말고 중지 상태로 관리하고 새로운 코드값을 신규로 정의한다
  • 현행 코드간의 변환 매칭 정보를 별도로 기록하여 향후 신규 정보시스템으로의 이행시 참고한다.

표준 용어 정의

표준 용어 사전

용어업무에서 자주 사용하는 단어의 조합을 의미 하며 전사적으로 사용하는 엔터티와 속성을 대상으로 표준 단어 사전에 정의된 단어를 조합하여 정의한다.

표준 용어 관리 기준

  • 표준성: 전사차원의 혼란 방지
  • 일반성: 지나치게 업무 관점에서 정의되면 안됨
  • 업무 지향성 : 기업의 업무 범위 내에서 약어나 별도의 정의해서 사용할 수 있다.

표준 용어 작성 형식

용어사전은 엔터티 용어사전과 속성 용어사전을 구분하여 정의 관리하며 논리명(한글명)과 물리명(영문명)을 각각 가지며 용어 범위 및 자격 형식 등이 설명되어야 한다.

데이터 표준 확정

데이터 표준 검증 기준

  • 유일성
  • 완전성
  • 정확성
  • 범용성

데이터 표준화 관리

데이터 표준 관리 프로세스 유형

  • 개발/운영 과정에서 데이터 표준의 신규 요건이 발생하는 경우 이를 처리하기 위한 프로세스
  • 표준이 변경/삭제 될 경우 영향도 분석을 할 수 있는 절차와 이를 처리하기 위한 프로세스
  • 표준을 준수하는지 체크하는 프로세스

데이터 표준 관리 프로세스

데이터 표준 관리 프로세스 구성 요소

프로세스, 태스크, 역할, 담당 업무가 명확하게 정의 되어야 함

역할과 담당 업무

업무 담당자

  • 데이터 관리자에게 표준 신규 및 변경 요청
  • 데이터 관리자로부터 지시받은 변경 내용 적용

데이터베이스 관리자

  • 데이터 관리자로부터 변경 표준 사항에 대한 변경 영향 파악 협조 및 평가서 작성
  • 데이터 관리자로부터 지시받은 변경 내용 적용
  • 테스트 및 검증
  • 사용자 반영 결과 통보

데이터 관리자

  • 업무 담당자로부터 요청받은 신규 및 변경사항 검토표준 준수 여부 체크
  • 변경 영향도 분석 및 보고 후 변경 계획 수립
  • 준수 여부 체크 후 변경 계획 수립
  • 메타 DB에 등록 완료 후 신규 및 변경 표준 배포
  • 업무담당자 및 데이터베이스 관리자에게 변경작업 지시 후 변경작업 수행결과 확인

전사 데이터 관리자

  • 전사 관점에서의 표준 가이드 지문 및 제시

0개의 댓글