[Data Base] DB 기초

mokyoungg·2020년 5월 16일
0

내용의 모든 출처는 부트캠프 위코드입니다.
https://wecode.co.kr/


DataBase 기초 이해 및 설치

  • 데이터를 저장 및 보존하는 시스템
  • Application에서는 데이터가 메모리 상에서 존재한다.
    그리고 메모리에 존재하는 데이터는 보존이 되지 않는다.(휘발성)
  • 해당 애플리케이션이 종료되면 메모리에 있던 데이터들은 다시 읽어들일 수 없다.
  • 그럼으로 데이터를 장기 기간동안 저장 및 보존하기 위해서 데이터 베이스를 사용하는 것.
  • 일반적으로 Database에는 크게 관계형 데이터베이스(RDBMS)와 NoSQL 로 명칭되는
    비관계형 데이터베이스가 있다.


관계형 데이터베이스(RDBMS)

  • 이름 그대로, 관계형 데이터 모델에 기초를 둔 데이터 베이스 시스템.

  • 관계형 데이터란 데이터를 서로 상호관련성을 가진 형태로 표현한 데이터.

  • 모든 데이터들은 2차원 테이블들로 표현된다.

  • 각각의 테이블은 컬럼(행)과 로우(열)로 구성된다.
    -컬럼은 테이블의 각 항목을 말한다.
    -로우는 각 항목들의 실제 값들을 말한다. 행이다.
    -각 로우는 저만의 고유 키(Primary Key)가 있다.
    -주로 고유키를 통해서 해당 로우를 찾거나 인용한다.

  • 각각의 테이블들은 서로 상호관련성을 가지고 서로 연결될 수 있다.
    -테이블끼리의 연결에는 크게 3가지 종류가 있다.
    one to one
    one to many
    many to many

  • 대표적인 관계형 데이터베이스에는 MySQL 과 PostgreSQL(줄여서 Postgres)가 있다.

RDBMS 테이블 연결 방식

One to One

테이블 A의 로우와 테이블 B의 로우가 정확히 일대일 매칭이 되는 관계

One To Many

테이블 A의 로우가 테이블 B의 여러 로우와 연결되는 관계를 one to many 관계라고 함
각 고객은 여러 제품을 구매할 수 있지만 구매된 제품의 주인은 오직 한 사람

Many To Many

테이블 A의 여러 로우가 테이블 B의 여러 로우와 연결이 되는 관계
책은 여러 작가에 의해 쓰일 수 이고, 작가들은 여러 책을 쓸 수 있다.



어떻게 테이블과 테이블을 연결하는가
Foregin key(외부키)라는 개념을 사용해서 주로 연결

왜 테이블들을 연결하는가?

  • 왜 정보를 여러 테이블에 나누어서 저장하는가?

  • 하나의 테이블에 정보 모두를 저장하면 안 되는가?

  • 하나의 테이블에 모든 정보를 다 넣으면 동일한 정보들이 불필요하게 중복되어 저장된다.
    -더 많은 디스크를 사용하게 되고
    -잘못된 데이터가 저장 될 가능성이 높아진다.
    -예를 들어, 고객의 아이디는 동일한데, 이름이 틀린 로우들이 있다면 > 어떤 이름이 정확한가?

  • 여러 테이블에 나눠서 저장한 후 필요한 테이블끼리 연결시키면 위의 문제가 사라진다.
    -중복된 데이터를 저장하지 않음으로 디스크를 더 효율적으로 쓰고
    -서로 같은 데이터지만 부분적으로 틀린 데이터가 생기는 문제가 없어진다.
    -이것을 normalization 이라고 한다.



트랜잭션(Transaction)

  • 트랜잭션은 일련의 작업들이 마치 하나의 작업처럼 취급되어, 모두 다 성공하거나 모두 실패하는 걸 이야기한다.(commit & rollback)
  • ACID를 제공함으로, 트랜잭션(일련의 작업들을 한번에 하나의 unit으로 실행하는것) 기능을 제공한다.

ACID : 원자성, 일관성, 고립성, 지속성

원자성

트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력
(중간 단계까지 실행되고 실패하는 일이 없도록 하는 것)

일관성

트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것

고립성

트랜재션 수행시, 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것을 의미.
트랜잭션밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미한다.
트랜잭션 실행내역은 연속적이어야 함을 의미한다.

지속성

성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미.
시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 함을 의미한다.



NoSQL 데이터베이스

  • 비관계형 타입의 데이터를 저장할 때 주로 사용되는 데이터베이스 시스템
  • 관계형 데이터베이스와 다르게 비관계형이기 때문에, 데이터들을 저장하기 전에 정의 할 필요가 없다.
    -관계형 데이터베이스는 데이터들을 저장하기 전에 어디에 어떻게 저장할 것인지를 정의.
    -즉, 테이블을 정의해야한다.(테이블 이름, 테이블과 다른 테이블의 고나계, 각 컬럼의 타입 등등)
  • MongoDB, Redis, Cassandra 등


SQL VS NoSQL

SQL

SQL 장점

  • 관계형 데이터베이스는 데이터를 더 효율적으로 그리고 체계적으로 저장할 수 있고 관리할 수 있다.
  • 미리 저장하는 데이터들의 구조(테이블 스키마)를 정의함으로 데이터의 완전성이 보장된다.
  • 트랜잭션

SOL 단점

  • 테이블을 미리 정의해야 함으로 테이블 구조 변화 등에 덜 유연하다
  • 확장성이 쉽지 않다
    -테이블 구조가 미리 정의되어 있다보니 단순히 서버를 늘리는 것만으로 확장하기가 쉽지
    않고 서버의 성능 자체도 높여야 한다.
    -서버를 늘려서 분산 저장 하는 것도 쉽지 않다.
    -Scale up(서버의 성능을 높이는 것)으로 확장성이 됨.

정형화된 데이터들 그리고 데이터의 완전성이 중요한 데이터들을 저장하는데 유리하다.
(전자상거래 정보, 은행계좌 정보, 거래 정보 등등)

NoSQL

NoSQL 장점

  • 데이터 구조를 미리 정의하지 않아도 됨으로 저장하는 데이터의 구조 변화에 유연하다.
  • 확장하기가 비교적 쉽다. 그냥 서버 수를 늘리면 됨(scale out)
  • 확장하기가 쉽고 데이터의 구조도 유연하다 보니 방대한 양의 데이터를 저장하는데 유리하다.

NoSQL 단점

  • 데이터의 완전성이 덜 보장된다.
  • 트랜잭션이 안되거나 비교적 불안정하다.
  • 주로 비정형화 데이터 그리고 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리하다.
    (로그 데이터)


정리

  1. RDBMS 란?
    관계형 데이터 베이스
    데이터를 서로 상호 관련성을 가진 형태로 표현한 데이터.
  1. Talbe이란? Column 과 Row 그리고 Primary key란?
    관계형 데이터는 테이이블로 표현된다.
    컬럼이란 테이블의 항목, 로우는 실제 값이다.
    각 로우(값)은 저만의 Primary Key가 있다. 이를 통해 해당 로우를 찾거나 이용한다.

  2. 테이블의 간계, OTO / OTM / MTM
    One To One : 테이블 a의 로우와 테이블 b의 로우가 정확히 1:1 매칭이 되는 것
    One To Many : 테이블 a의 로우가 테이블 b의 여러 로우와 연결이 되는것.(각 고객은 여러 제품을 사지만, 제품의 주인은 오직 그 고객)
    Many To Many : 테이블 a의 여러 로우가 테이블 b의 여러 로우와 연결이 되는 관계(책은 여러작가에 의해 쓰일 수 있고, 작가들은 여러 책을 쓸 수 있다)

  3. 왜 관계형 데이터를 쓰는가?
    데이터를 더 효율적으로 그리고 체계적으로 저장할 수 있고 관리할 수 있다.
    미리 저장하는 데이터들의 구조(테이블 스키마)를 정의함으로 데이터의 완전성이 보장.
    트랜잭션

  4. 트랜잭션이란? ACID는 무엇인가?
    일련의 작업들을 한 번에 하나의 unit으로 실행하는 것.
    일련의 작업들이 마치 하나의 작업처럼 취급되어서 모두 다 성공하거나 모두 다 실패하거나
    (실패시, rollback. 성공시, commit) 친구한테 계좌로 돈을 주는데, 돈을 나갔지만 친구가 돈을 못 받는 상황은 있으면 안된다.

    ACID 원자성, 일관성, 고립성, 지속성
    원자성 : 부분적으로 실행되다가 중단되지 않는다.
    일관성 : 트랜잭션이 성공하면, 일관성있는 데이터 베이스 상태로 유지한다.
    고립성 : 트랜잭션 수행시, 다른 트랜잭션의 연산 작업이 끼어들지 못하게 한다.
    지속성 : 성공적으로 수행된 트랜잭션은 영원히 반영되어야 한다.

  5. 관계형 데이터베이스와 비관계형 데이터베이스의 차이는?
    데이터 구조의 정의. 관계형은 미리 정의하지만 비관계형은 정의하지 않는다.
    이런 이유로, 비관계형은 관계형에 비해 데이터 구조 변화에 유연하다. 그러나 정보의 완전성 측면에서 관계형이 더 우수하다. 그리고 서버 확장의 측면에서는 비관계형이 비교적 더 쉽다. 서버 수를 늘리면 됨

profile
생경하다.

0개의 댓글