
< DB 기본 용어 >
- DDL
- 데이터 정의어
- create(생성), alter(변경), drop(오브젝트 삭제), rename, truncate(오브젝트 내용 삭제)
- DML
- 데이터 조작어
- select, insert, update, delete
- DCL
- TCL
- 트랜잭션 제어어
- commit rollback, savepoint
- CRUD
- Create, Read, Update, Delete의 앞글자
- 데이터베이스 기본 연산
- 클러스터
- 대상이 되는 범위의 요소를 몇 개 모은 단위체
< 뷰 속성 >
- REPLACE: 뷰가 이미 존재하는 경우 재생성
- FORCE: 본 테이블 존재 여부 상관 없이 뷰 생성
- NOFORCE: 기본 테이블이 존재할 때 뷰 생성
- WITH CHECK OPTION: 서브 쿼리 내의 조건 만족하는 행만 변경
- WITH READ ONLY: DML 작업 불가
< 파티션 종류 >
- 레인지 파티셔닝
- 연속적인 숫자나 날짜를 기준
- 손쉬운 관리 기법 제공
- 관리 시간 단축 가능
- 해시 파티셔닝
- 파티션 키의 해시 함수 값에 의한 파티셔닝 기법
- 균등한 테이블 분할 가능
- 질의 성능이 향상
- 리스트 파티셔닝
- 특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능
- 분포도 비슷 and 데이터 많은데 컬럼 조건이 많이 들어오면 유용
- 컴포지트 파티셔닝
< 파티션 장점 >
- 성능 향상
- 가용성 향상
- 전체 데이터의 훼손 가능성 감소 및 데이터 가용성 향상
- 백업 가능
- 경합 감소
- 디스크 스트라이핑으로 입출력 성능 향상
- 디스크 컨트롤러에 대한 경합의 감소
< DBMS 유형 = NoSQL의 유형 >
- 키-값(Key-Value) DBMS
- 컬럼 기반 데이터 저장 (Column Family Data Store)
- Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 가짐
- 문서 저장(Document Store) DBMS
- 그래프(Graph) DBMS
- 시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현
< 데이터 마이닝 >
- 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
< 데이터 마이닝 주요 기법 >
- 분류 규칙(Classification)
- 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로
- 새로운 레코드의 값을 예측하는 방법
- 연관 규칙(Association)
- 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
- 연속 규칙(Sequence)
- 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
- 데이터 군집화(Clustering)
- 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업