데이터 전환이란, 기존 정보시스템에 축적되어 있는 데이터를 추출 하여 새로 개발할 정보 시스템에서 운영할 수 있도록 변환 후, 적재 하는 일련의 과정을 뜻함
데이터 전환 계획서란, 데이터 전환이 필요한 대상을 분석하여 데이터 전환 작업에 필요한 모든 계획을 기록하는 문서
ex) 데이터 전환 개요, 대상 및 범위, 전환 환경 구성, 조직 및 역할, 일정..
데이터 검증이란 원천 시스템의 데이터를 목적 시스템의 데이터로 전환하는 과정이 정상적으로 수행되었는지 여부를 확인하는 과정
검증방법 | 내용 |
---|---|
로그 검증 | 데이터 전환 과정에서 작성하는 추출, 전환 ,적재 로그를 검증함 |
기본 항목 검증 | 로그 검증 외에 별도로 요청한 검증 항목에 대해 검증함 |
응용 프로그램 검증 | 응용 프로그램을 통한 데이터 전환의 정합성 검증 |
응용 데이터 검증 | 사전에 정의한 업무 규칙으로 데이터 전환의 정합성을 검증함 |
값 검증 | 숫자 항목의 합계 검증, 코드 데이터의 범위 검증, 속성 변경에 따른 값 변경 검증 |
검증 단계 | 목적 | 검증 방법 |
---|---|---|
추출 | 원천 시스템 데이터에 대한 정합성 확인 | 로그 검증 |
전환 | 매핑정의서에 정의된 내용이 정확히 반영되었는지 확인 매핑 정의서 오류 확인 | 로그 인증 |
DB 적재 | SAM 파일을 적재하는 과정에서 발생 할 수 있는 오류나 데이터 누락 여부 등 확인 | 로그 검증 |
DB 적재 후 | 적재 완료 후 정합성 확인 | 기본 항목 검증 |
전환 완료 후 | 데이터 전환 완료 후 추가 검증 과정을 통해 데이터 전환의 정합성 확인 | 응용프로그램 검증 응용 데이터 검증 |
오류상태 | 내용 |
---|---|
Open | 오류가 보고만 되고 분석되지 않은 상태 |
Assigned | 오류의 영향 분석 및 수정을 위해 개발자에게 오류를 전달 한 상태 |
Fixed | 개발자가 오류를 수정한 상태 |
Closed | 수정된 오류에 대해 테스트를 다시 했을 때 오류가 발견되지 않은 상태 |
Deferred | 오류 수정을 연기한 상태 |
Clarified/ Classified | 보고된 오류를 관련자들이 확인했을 때 오류가 아니라고 확인된 상태 |
데이터 정제 요청서란 데이터 정제와 관련된 전반적인 내용을 문서로 작성한 것
데이터 정제 보고서란 정제된 원천 데이터가 정상적으로 정제되었는지 확인한 결과를 문서로 작성한 것
데이터 저장소란 데이터를을 논리적인 구조로 조직화 하거나, 물리적인 공간에 구축 한 것을 의미. 논리 데이터 저장소와 물리 데이터 저장소로 구분할 수 있다.
데이터 베이스는 공동으로 사용될 데이터를 중복을 배제하여 통합하고, 쉽게 접근하여 처리할 수 있도록 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터이다.
데이터 베이스는 다음과 같이 구분 가능
DBMS란 사용자의 요구에 따라 정보를 생성해주고, 데이터베이스를 관리해주는 소프트웨어
DBMS 의 필수기능 3가지 -> DMC
기능 | 정의 |
---|---|
정의(Definition) | 데이터의 형과 구조에 대한 정의, 이용방식, 제약 조건등을 명시하는 기능 |
조작(Manipulation) | 데이터 검색, 갱신, 삽입, 삭제 등을 위해 인터페이스 수단을 제공하는 기능 |
제어(Control) | 데이터 무결성, 보안, 권한 검사, 병행 제어를 제공하는 기능 |
스키마란 데이터베이스의 구조와 제약조건에 대한 전반적인 명세를 기술한 것
종류 | 내용 |
---|---|
외부 스키마 | 사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것 |
개념 스키마 | 데이터베이스의 전체적인 논리적 구조 조직 전체의 데이터베이스로, 하나만 존재함 |
내부 스키마 | 물리적 저장장치 입장에서 본 데이터베이스 구조 |
항목 | 내용 |
---|---|
무결성 | 삽입,삭제,갱신 등의 연산 후에도 db 에 저장된 데이터가 정해진 제약조건을 항상 만족해야한다 |
일관성 | DB에 저장된 데이터들 사이나, 특정 질의에 대한 응답이 처음부터 끝까지 변함없이 일정해야함 |
회복 | 시스템 장애 발생 시 직전 상태 복구 가능해야함 |
보안 | 불법적인 데이터 노출, 변경, 손실로부터 보하 가능해야함 |
호율성 | 응답 시간의 단축, 생산성, 저장 공간 최적화가 가능해야함 |
데이터베이스 확장 | db 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야함 |
분석 -> 설계(3가지) -> 구현의 순서
현실 세계의 정보들을 컴퓨터에 표현하기 위해서 단순화, 추상화하여 체계적으로 표현한 개념적 모형
개체는 DB에 표현하려는 것으로 사람이 생각하는 개념이나 정보 단위같은 현실 세계의 대상체
DB를 구성하는 가장 작은 논리적 단위
개체와 개체 사이의 논리적인 연결을 의미
❗ n:n이 아니라 N:M
종류 | 내용 |
---|---|
종속 | 주종관계/ 식별과 비식별 존재 |
중복 | 두 개체 상이에 2번이상의 종속 관계 발생 |
재귀 | 개체가 자기 자신과 관계(= 순환 관계) |
배타 | 개체의 속성이나 구분자를 기준으로 개체의 특성을 분할하는 관계, 배타AND와 배타OR로 구분 |
하나의 개체 내에서 각각의 인스턴스를 유일하게 구분할 수 있는 구분자이다.
모든 개체는 한 개 이상의 식별자를 반드시 가져야 한다.
개체에서 각 인스턴스를 유일하게 식별할 수 있는 속성 또는 속성 집합
개체와 개체 간의 관계를 기본요소로 이용하여 현실 세계의 데이터를 개념적으로 표현하는 방법
개념적 데이터 모델의 가장 대표격