물리 데이터 저장소 설계

BaeBae·2022년 3월 6일

정보처리기사

0

정보처리기사

목록 보기

7/21

< DB 기본 용어 >

DDL

데이터 정의어
create(생성), alter(변경), drop(오브젝트 삭제), rename, truncate(오브젝트 내용 삭제)

DML

데이터 조작어
select, insert, update, delete

DCL

데이터 제어어
grant, revoke

TCL

트랜잭션 제어어
commit rollback, savepoint

CRUD

Create, Read, Update, Delete의 앞글자
데이터베이스 기본 연산

클러스터

대상이 되는 범위의 요소를 몇 개 모은 단위체

< 뷰 속성 >

REPLACE: 뷰가 이미 존재하는 경우 재생성
FORCE: 본 테이블 존재 여부 상관 없이 뷰 생성
NOFORCE: 기본 테이블이 존재할 때 뷰 생성
WITH CHECK OPTION: 서브 쿼리 내의 조건 만족하는 행만 변경
WITH READ ONLY: DML 작업 불가

< 파티션 종류 >

레인지 파티셔닝

연속적인 숫자나 날짜를 기준
손쉬운 관리 기법 제공
관리 시간 단축 가능

해시 파티셔닝

파티션 키의 해시 함수 값에 의한 파티셔닝 기법
균등한 테이블 분할 가능
질의 성능이 향상

리스트 파티셔닝

특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능
분포도 비슷 and 데이터 많은데 컬럼 조건이 많이 들어오면 유용

컴포지트 파티셔닝

위 3가지 중 2개 이상 결합

< 파티션 장점 >

성능 향상

데이터 엑세스 범위 줄임

가용성 향상

전체 데이터의 훼손 가능성 감소 및 데이터 가용성 향상

백업 가능

분할 영역을 독립적으로 백업하고 복구 가능

경합 감소

디스크 스트라이핑으로 입출력 성능 향상
디스크 컨트롤러에 대한 경합의 감소

< DBMS 유형 = NoSQL의 유형 >

키-값(Key-Value) DBMS

키 기반 get, put, delete 제공

컬럼 기반 데이터 저장 (Column Family Data Store)

Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 가짐

문서 저장(Document Store) DBMS

값의 데이터 타입이 문서라는 타입을 사용

그래프(Graph) DBMS

시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현

< 데이터 마이닝 >

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

< 데이터 마이닝 주요 기법 >

분류 규칙(Classification)

과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로
새로운 레코드의 값을 예측하는 방법

연관 규칙(Association)

데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법

연속 규칙(Sequence)

연관 규칙에 시간 관련 정보가 포함된 형태의 기법

데이터 군집화(Clustering)

대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업

Data가 좋은 Web 개발자

이전 포스트

논리 데이터 저장소 확인

다음 포스트

내외부 연계 모듈 구현

0개의 댓글