DB & DBMS & DB System
database (DB)
✨ 정의 : 전자적으로 저장되고 사용되는 관련있는(related)데이터들의 조직화된 집합(organized collection)
- 관련있는 데이터 : 같은 출처, 같은 목적, 같은 서비스 안에서 생성되는 데이터들
- 조직화된 집합 : 데이터의 불일치, 중복방지. 데이터 서치 쉬워짐
- 전자적으로 저장되고 사용 : 위와같은 데이터를 컴퓨터와 같은 기계를 사용하는 것
DBMS (database management systems)
✨ 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템
예시) PostgreSQL, MySQL, ORACLE, MariaDB, SQL Server ...
✨ Metadata
- DB를 정의하다 보면 발생하는 부가적인 데이터
- database를 정의하거나 기술하는 data e.g) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹 등등..
- metadata 또한 DMBS를 통해 저장/관리 된다.
database system
✨ database + DBMS + 연관된 applications => 줄여서 database라고도 부름

데이터 베이스 시스템의 동작 방식
data models
data model 이란?
✨ 정의
- DB의 구조(structure)*를 기술하는데 사용될 수 있는 개념들이 모인 집합
- DB 구조*를 추상화해서 표현할 수 있는 수단을 제공한다
- data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다르다
- DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함한다
DB 구조 : 데이터 유형, 데이터 관계(relationship), 제약 사항(constraints) 등등
✨ data models 분류
- conceptual (or high-level) data models
- logical (or representational) data models
- physical (or low-level) data models
conceptual data models
- 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델
- 추상화 수준이 가장 높음
-비즈니스 요구 사항을 추상화하여 기술할 때 사용

logical data models
- 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
- 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
- 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델
구독
📌 relational data model (가장 많이 사용 됨)
📌 object data model
📌 object-relational data model 외에도 다른 종류들이 있음
relational data model의 예

physical data models
- 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
- data format, data orderings, access path 등등
- access path : 데이터 검색을 빠르게 하기 위한 구조체 e.g.) index
Schema & state
database schema
✨ 정의
- data model을 바탕으로 database의 구조를 기술(description)한 것
- schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않는다
구독

STUDENT , BOOK 과 같은 Entity
student id, 이름, 전공, 학년, book id, 저자, 제목, 가격(원)은 Attribute(속성)
💡 위의 것들이 모여서 데이터베이스의 스키마라 할 수 있다.
database state
✨ 정의
- database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다
- 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다
- 혹은 database에 있는 현재 instances의 집합이라고도 한다
three-schema architecture
✨ 정의
- database system을 구축하는 architecture 중의 하나
- user application으로 부터 물리적인(physical) database를 분리시키는 목적
- 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다
✨ 종류
- external schemas (or user views) at external (or view) level
- conceptual schemas at conceptual level
- internal schemas at internal level
✨ 사용 이유
-
각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
-
스키마에 변경이 생긴다면 그 사이의 Mapping만 바꿔주면 된다.
-
대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음
-
실제 데이터가 존재하는 곳은 internal level
three-schema architecture의 구조

internal schema
- 실제 데이터베이스 저장장치와 가까이 위치.
- 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
- data storage, data structure, access path 등등 실체가 있는 내용 기술
external schema
- external views, user views 라고도 불림
- 특정 유저들이 필요로 하는 데이터만 표현
- 그외 알려줄 필요가 없는 데이터는 숨김
- logical data model을 통해 표현
conceptual schema
- 전체 database에 대한 구조를 기술
- internal schema를 한번 추상화 시켜서 표현한 스키마
- 물리적인 저장 구조에 관한 내용은 숨김
- entities, data types, relationships, user operations, constraints에 집중
- logical data model을 통해 표현
database language
data definition language(DDL)
- conceptual schema를 정의하기 위해 사용되는 언어
- internal schema까지 정의할 수 있는 경우도 있음
(언어를 가지고 정의한다기 보다 파라미터로 정의한다)
storage definition language(SDL)
- internal schema를 정의하는 용도로 사용되는 언어
- 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨
- 중요도 x
view definition language(VDL)
- external schemas를 정의하기 위해 사용되는 언어
- 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
- 중요도 x
data manipulation language (DML)
- database에 있는 data를 활용하기 위한 언어
- data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어
결론
✨ 통합된 언어
- 오늘날의 DBMS는 DML, VDL DDL이 따로 존재하기 보다는 통합된 언어로 존재
- 대표적인 예가 relational database language : SQL