[SQL]데이터베이스 개론

차보경·2022년 11월 3일
0

SQL

목록 보기
2/14
post-thumbnail

※ 본 내용은 Youtube 데이터베스 기본개념을 정리한 내용입니다.

내용

  1. DB & DBMS & DB system 개념
  2. data models 개념과 종류
  3. schema & state 개념
  4. three-schema architecture 소개
  5. database language 종류

1. DB & DBMS & DB system

DATABASE(DB)

  • 전자적으로 저장되고 사용되는 관련있는 데이터들의 조직화된 집합
    • 관련있는 데이터?
      같은 출처, 목적, 서비스 안에서 생성되는 데이터들
    • 조직화된 집합
      잘정리되어 있으면 찾는 것도 신속하며 중복, 놓치는 데이터 없이 관리할 수 있음

DBMS(database management systems)

  • 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 SW system
  • 대표적 : PostgreSQL, MySQL, ORACLE DATABASE, SQL Server 등이 있음
  • DB를 정의하다보면 부가적인 데이터가 발생함 → metadata

metadata (data about data)

  • database를 정의하거나 기술하는(descriptive) data
  • catalog 라고도 부름
  • e.g) 데이터 유형, 구조, 제약조건, 보안, 저장, 인덱스, 사용자 그룹 등등 (사진을 찍으면 날짜, 포맷, 용량 등등)
  • metadata 또한 DBMS를 통해 저장/관리됨

database system

  • database + DBMS + 연관된 applications
  • 줄여서 database 라고 부르기도 함 (문맥파악 필요)

시스템 설명

  • 프로그램을 만들면, DB에 접근하는 쿼리가 있음
    (Query = DB 접근해서 데이터를 가져오거나 수정하는 요청)
  • 쿼리를 날리면 DBMS가 요청을 받아서 파악하고 처리하는데, 요청된 데이터가 어떤 데이터로 되어있는지를 알아야 가져올수 있음
  • 그 정보를 meta-data로 파악함
  • 그리고 database에서 실제 요청받은 정보를 가져와서 application으로 돌려줌

2. data models

  • DB의 구조(structure)를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • 개념들을 바탕으로 DB구조(데이터 유형, 관계, 제약사항 등)를 추상화해서 표현할 수 있는 수단을 제공
  • data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다름
  • DB에서 읽고 쓰기위한 기본적인 동작들(operations)도 포함

data model 분류

conceptual (or high-level) data models

  • 일반사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델
  • 추상화 수준이 가장 높음
  • 비즈니스 요구사항을 추상화하여 기술할 때 사용
  • DB개념을 쉽게 추상화하여 누가봐도 이해할 수 있도록 만듦

logical (or representational) data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함(아주 자세히 나타내는건 또 아님)
  • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델

    거의 이런 relational data model사용. 테이블을 relation이라고 생각.
  • logical data models 종류 : relational data model, object data model, object-relational data model, 등등

    PostgreSQL은 object-relational data model이나, reltational이 사용되는 건 같음

physical (or low-level) data models

  • 컴퓨터에 데이터가 어떻게 파일형태로 저장되는지를 기술할 수 있는 수단을 제공(가장 컴퓨터 저장 형태와 비슷함)
  • data format, data orderings, dccess path등
  • access path : 데이터 검색을 빠르게 하기 위한 구조체 (index,..)

3. schema & state

database schema

  • data model을 바탕으로 database의 구조를 기술한 것
  • schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않음

database state

  • database에 있는 실제 데이터는 꽤 자주 바뀔 수 있음
  • 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 함
  • 혹은 database에 있는 현재 instances의 집합이라고도 함

4. three-schema architecture

  • database system을 구축하는 architecture 중의 하나 (대부분 이를 따라감)
  • user application으로부터 물리적인 database를 분리시키는 목적
    (물리적 database의 구조가 바뀔 수 있는데, 그때에도 db사용 user의 application에는 영향을 끼치지 않도록 하기 위함)
  • 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있음

각 schema 설명

  • external schemas (or user views) at external (or view) level
  • conceptual schemas at conceptual level
  • internal schemas at internal level

internal schema**

  • 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현(물리적 데이터베이스와 가장 가까움)
  • data storage, data structure, access path 등 실체가 있는 내용 기술

external schema

  • external views, user views 라고도 불림 (실제 사용자가 바라보는 부분이기 때문)
  • 특정 유저들이 필요로 하는 데이터만 표현
  • 그 외 알려줄 필요가 없는 데이터는 숨김
  • logical data model을 통해 표현
  • 초창기에는 internal schema, external schema 둘만 사용했었음 -> 각 유저마다 필요로하는 레벨이 다르니 internal에서 중복 데이터가 생김 -> 관리 어렵고 데이터 불일치가 생김

conceptual schemas

  • 전체 database에 대한 구조를 기술 (internal 은 한번 추상화한 느낌)
  • 물리적인 저장구조에 대한 내용은 숨김
  • entities, data types, relationships, user operations, constraints에 집중
  • logical data model을 통해 표현

three-schema architecture

  • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함 (각 레벨사이의 map 정보만 바꿔줌)
  • 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누진 않음 (conceptual schemas를 변경하는데 external을 수정하지 않는건 어렵다)
  • 데이터가 존재하는 곳은 internal level

5. database language

data definition language(DDL)

  • conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의할 수 있는 경우도 있음

storage definition language (SDL)

  • internal schema를 정의하는 용도로 사용되는 언어
  • 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체

view definition language (VDL)

  • external schema를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할 까지 수행 (-> definition language는 거의 DDL이 사용)

data manipulation language (DML)

  • database에 있는 data를 활용하기 위한 언어
  • data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어

통합된 언어

  • 오늘날의 DBMS는 DML, VDL, DDL이 통합된 언어로 존재
  • 대표적인 예가 relational database language : SQL
profile
차보의 Data Engineer 도전기♥ (근데 기록을 곁들인)

0개의 댓글