데이터베이스 기본 개념

JEREGIM·2023년 3월 29일
0

데이터베이스

목록 보기
1/6

📌DB, DBMS, DB System

DB(database)

: 전자적으로 저장되고 사용되는 관련있는 데이터들의 조직화된 집합

  • 같은 목적이나 같은 출처를 가진 데이터, 같은 서비스 아래에 있는 데이터들을 관련있는 데이터라고 한다.
  • 조직화된 집합이란 데이터들을 체계적으로 정리하여 검색 및 조회를 빠르게 하고 데이터의 중복 또는 불일치를 막을 수 있음을 의미한다.

DBMS

: database management systmes의 약자. 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템

  • MySQL, ORACLE, SQL Server 등이 대표적인 프로그램이다.

metadata : DB를 정의하기 위한 부가적인 데이터

  • metadata는 database를 정의하거나 기술하는 data로써 catalog 라고도 부른다.

  • catalogmetadata가 저장되어 있는 장소로 불리기도 한다.

  • metadata로는 데이터 유형, 구조, 제약 조건, 보안, 인덱스, 사용자 그룹 등이 있다.

  • metadata 또한 DBMS를 통해 저장/관리 된다.

DB System

: database + DBMS + 연관된 applications
줄여서 database라고도 부르기 때문에 문맥에 따라 순수한 데이터의 집합으로써의 database를 의미하는 것인지 아니면 DB System을 의미하는 것인지 잘 파악해야한다.


-간단한 DB System 동작 구조

📌data models

: DB의 구조(structure)를 기술하는데 사용되는 개념들이 모인 집합

  • DB 구조를 추상화해서 표현할 수 있는 수단을 제공한다.
    • DB 구조 : 데이터 유형, 데이터 관계(relationship), 제약 사항(constraints) 등
  • data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작(operations)들도 포함한다.

data models 분류

conceptual(high-level) data models

  • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델

  • 추상화 수준이 가장 높음

  • 비즈니스 요구 사항을 추상화하여 기술할 때 사용

  • ERD(entitiy-relationship diagram)가 대표적인 예이다.

logical(representational) data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화할 수 있는 개념들을 제공

  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함

  • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델

  • relational data model에 대표적인 예이고 백엔드 개발자들이 가장 많이 사용하는 모델이다.

physical(low-level) data models

  • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되느지를 기술할 수 있는 수단을 제공

  • data format, data orderings, access path 등

    • access path : 데이터 검색을 빠르게 하기 위한 구조체(ex) index)

📌schema & state

schema(스키마)

  • data model을 바탕으로 database의 구조를 기술한 것

  • schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않는다.

  • database schema의 예시

  • student, book 데이터와 그 속성 등을 기술한 것으로 이를 통해 database의 구조를 알 수 있다.

state

  • database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.

  • database에 있는 현재 instances의 집합이라고도 한다.

  • 시간이 지나면서 데이터가 삭제, 수정 등의 변화가 일어난다. 이때 특정 시점의 데이터를 database state 혹은 snapshot이라고 한다.

three-schema architecture

  • database system을 구축하는 architecture 중 하나

  • user application으로부터 물리적인 database를 분리시키는 목적

    • 물리적인 database는 조금씩 변경될 수 있다. 이럴때에도 database를 직접 사용하는 user application은 변경에 영향을 주지 않기 위함이다.
  • 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.

internal schema at internal level

  • database와 가장 가까이 있는 스키마

  • 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현된다.

  • datga storage, data structure, access path 등 실체가 있는 내용을 기술한다.

external(or user views) schema at external(or view) level

  • 실제 사용자가 바라보는 스키마기 때문에 user views 라고도 불린다.

  • 특정 유저들이 필요로 하는 데이터만 표현하고 그 외 알려줄 필요가 없는 데이터는 숨긴다.

  • logical data model을 통해 표현된다.

conceptual schema at conceptual level

  • 처음 database 설계 시에는 위의 2개 스키마밖에 없었다. 이에 따라 유저마다 다른 요구를 하게 되면 internal schema에 중복되는 데이터가 쌓이게 되고 관리가 힘들어지게 되었다.
    이를 해결하기 위해 나온 것이 conceptual schema 이다.

  • internal schema를 한번 추상화시킨 스키마라고 할 수 있으며 따라서 물리적인 저장 구조에 관한 내용은 숨긴다.

  • 대신 논리적으로 전체 database에 대한 구조를 기술한다. entities, data types, relationships, constraints(제약사항) 등에 집중해서 논리적으로 표현한 것이 conceptual schema 이다.

  • logical data model을 통해 표현된다.

결론

  • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함이다.
    -> 가령 internal schema의 내용이 변경되어도 conceptual schema를 수정할 필요가 없고 이 둘 사이의 매핑만 변경해주면 된다.

  • 다만, 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않는다.

  • 각각의 스키마는 database의 구조를 표현하는 것이고 실제 데이터가 존재하는 곳은 internal level이다.


📌database language

아래의 명령어들을 통합한 relational database language를 SQL이라고 한다.

DDL, SDL, VDL

DDL : Data Definition Language. conceptual schema를 정의하기 위해 사용되는 명령어

  • 테이블과 같은 데이터 구조를 정의하는데 사용되는 명령어들로 (생성, 변경, 삭제, 이름변경) 데이터 구조와 관련된 명령어들을 말한다.

SDL : Storage Definition Language. internal schema를 정의하는 위해 사용되는 명령어

  • 하지만 요즘 relational DBMS에서는 SDL은 거의 사용하지 않고 파라미터 등의 설정으로 대체되었다.

VDL : View Definition Language. external schema를 정의하기 위해 사용되는 명령어

  • 하지만 대부분의 DBMS에서는 DDL이 VDL의 역할까지 수행한다.

결국 definition language는 대부분 DDL로만 작성한다.

DML

: Data Manipulation Language. database에 있는 실제 data를 활용하기 위한 명령어

  • data 추가, 삭제, 수정, 검색 등의 기능을 제공한다.

DCL

: Data Control Language. database에 접근하고 객체들을 사용하도록 권한을 주고 회수하는 명령어

TCL

Transaction Control Language. 논리적인 작업의 단위를 묶어서 DML에 의해 조작된 결과를 작업단위(트랜잭션) 별로 제어하는 명령어

명령어 종류명령어
데이터 조작어(DML)SELECT, INSERT, UPDATE, DELETE
데이터 정의어(DDL)CREATE, ALTER, DROP, RENAME, TRUNCATE
데이터 제어어(DCL)GRANT, REVOKE
트랜잭션 제어어(TCL)COMMIT, ROLLBACK, SAVEPOINT

0개의 댓글