[개발자 대화를 위한 넓고 얕은 CS 지식] 트랜잭션과 무결성

Joosi_Cool·2023년 5월 29일
3
post-thumbnail

이번 블로깅에 대해선 트랜잭션과 무결성 에 대해 넓고 얕게 알아보자.

트랜잭션이란?

우선, 트랜잭션이 무엇인지에 대해 알아보자. 트랜잭션은 데이터베이스에서의 하나의 논리적 기능을 수행하기 위한 작업의 단위를 말한다. 데이터베이스에 접근하는 방법은 쿼리 이므로, 즉 여러 개의 쿼리들을 하나로 묶는 단위를 말한다.

이에 대한 특징이 존재하는데 원자성, 일관성, 독립성, 지속성이 있다.
이를 한꺼번에 ACID 특징 이라고 한다.
이 특징에 대해 하나씩 무엇인지 알아보자.

원자성

원자성은 트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징이다. -> all or nothing

예를 들어, 트랜잭션을 커밋했는데, 문제가 발생하여 롤백하는 경우 그 이후에 보장되지 않음을 보장하는 것을 말한다.

말이 어렵다.. 예시를 들어보자.

만약 1000만원을 가진 홍철이가 0원을 가진 규영이에게 500만원을 이체한다고 해보자. 그렇다면 홍철: 500만원, 규영: 500만원을 가지게 될 것이다.
다음 과정을 거칠 것이다.
1. 홍철 잔고 조회
2. 홍철 잔고에서 500만원을 뺀다.
3. 규영이에게 500만원을 넣는다.


만약 중간에 이 작업을 취소한다면?
2번까지의 operation이 작동하여, 홍철:500만원, 규영:0원이 되는 상황이 발생할 수 있다.
이렇게 되지 않는 것을 의미하는 것이 원자성이다. 그래서 아예 모두 진행하거나 아예 진행하지 않는다는 뜻으로 all or nothing 인 것이다.


커밋과 롤백

커밋은 여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어이다. 트랜잭션 단위로 수행되며 변경된 내용이 모두 영구적으로 저장되는 것을 말한다.

커밋이 수행되었다. == 하나의 트랜잭션이 성공적으로 수행되었다.

이는 update, insert, delete의 쿼리가 하나의 트랜잭션 으로 수행되고 이후에 데이터베이스에 영구히 저장된다.

하지만 만약, 중간에 에러가 터진다면? 어떻게 이전 것으로 돌린 것인가?
이때 사용하는 것이 롤백 이다.

  • 롤백이란

    트랜잭션으로 처리한 하나의 묶음 과정을 일어나기 전으로 돌리지는 일을 말한다.

위에 롤백 덕분에 데이터의 무결성 보장된다.

트랜잭션과 전파

트랜잭션 전파 란, 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것을 말한다.



일관성

일관성은 허용된 방식 으로 데이터를 변경하는 것을 말한다. 데이터베이스의 값들을 여러가지 조건, 규칙에 따라 유효함을 가져야 한다.
이를 위한 것이 일관성이다.

예시를 들어보면 잔고가 0원인 사람이 다른 사람한테, 돈을 보내줄 수 있을까?
이러한 규칙을 정해서 데이터의 유효함을 가지게 하는 것을 말한다.



격리성

격리성은 트랜잭션 수행 시 서로 끼어들지 못하게 하는 것을 말한다. 복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 하고, 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 한다.

이를 지키기 위해 순차적으로 한다면 규칙을 지킬 수 있겠지만, 당연히 느릴 것이다. 이를 위해 여러개의 격리 수준을 나누어서 이를 지킨다.

격리 수준은 위와 같이 4가지로 나뉘는데, 위로 올라갈수록 동시성은 강해지지만, 격리성은 약해진다. 그리고 각 단계마다 나타나는 현상들이 있다.

  1. REPEATABLE_READ => 팬텀 리드
  2. READ_COMMITTED => 팬텀 리드, 반복 가능하지 않은 조회
  3. READ_UNCOMMITTED => 팬텀 리드, 반복 가능하지 않은 조회, 더티 리드

그렇다면 각각의 현상이 무엇일까?

격리 수준에 따라 발생하는 현상

  • 팬텀 리드
    이는 한 트랙잭션 내에서 동일한 쿼리를 보냈을 때, 해당 조회 결과가 다른 경우를 말한다.

  • 반복 가능하지 않은 조회
    이는 한 트랙잭션 내의 같은 행에 두번 이상 조회가 발생했는데, 그 값이 다른 경우를 가리킨다.
    위의 팬텀리드랑 같은거 아니야..?? 할수도 있을 것 같다.
    두개의 차이를 설명하자면, 반복 가능하지 않은 조회는 행 값이 달라질 수도 있는데, 팬텀 리드는 다른 행이 선택될 수도 있다.

  • 더티 리드
    이는 반복 가능하지 않은 조회와 유사하며 한 트랙잭션이 실행 중일 때 다른 트랙잭션에 의해 수정되었지만 아직 커밋되지 않은 행의 데이터를 읽을 수 있을 때 발생한다.

격리 수준

그렇다면 이런 현상이 발생하는 격리 수준은 뭘까? 여기에 대해 각각 알아보자.

  • SERIALIZABLE
    이는 말 그대로 트랙잭션을 순차적으로 진행시키는 것을 말한다. 이 수준은 매우 엄격한 수준으로 해당 행에 대해 격리시키고, 이후 트랙잭션이 이 행에 대해 일어난다면 기다려야 한다. 그렇기 때문에 교착 상태가 일어날 확률이 높고, 가장 성능이 떨어진다.

  • REPEATABLE_READ
    이는 하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만, 새로운 행을 추가하는 것은 막지 않는다. 따라서 이후에 추가된 행이 발견될 수 있다.

  • READ_COMMITTED
    이는 가장 많이 사용되는 격리 수준이다. 위와 달리 다른 트랜잭션이 커밋하지 않은 정보를 읽을 수 없다. 즉 커밋 완료된 데이터에 대해서만 조회가 허용된다.
    -> 하지만 이는 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있다. 예를 들어 트랜잭션 A가 수정한 행을 트랜잭션 B가 수정할 수도 있다. 이 때문에 트랜잭션 A가 같은 행을 다시 읽을 때 다른 내용이 발견될 수 있다.

  • READ_UNCOMMITTED
    이는 가장 낮은 격리 수준으로, 하나의 트랜잭션이 커밋되기 이전에 다른 트랜잭션에 노출되는 문제는 있지만 가장 빠르다. 이는 데이터 무결성을 위해 되도록이면 사용되지 않는 것이 이상적이나, 몇몇 행이 제대로 조회되지 않더라도 괜챃은 거대한 양의 데이터를 어림잡아 집계하는 등 이러한 특정 상황에서 쓰면 좋다.



지속성

지속성은 성공적으로 수행된 트랜잭션이 영원히 반영되어야 하는 것을 말한다.
이는 데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복기능이 있어한다는 것을 의미하며, 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공한다.

  • 체크섬

    중복 검사의 한 형태로, 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순한 방법

  • 저널링

    파일 시스템 또는 데이터베이스 시스템에 변경 사항을 반영하기 전에 로깅하는 것, 트랜잭션 등 변경 사항에 대한 로그를 남기는 것




무결성


무결성의 의미

위에서 트랜잭션에 대해 알아보았고, 이제는 무결성에 대해 알아보자.
무결성이란, 데이터의 정확성, 일관성, 유효성을 유지하는 것을 말하며, 무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는 지에 대한 신뢰가 생긴다.

무결성의 종류는 다음과 같다.

무결성의 종류

  • 개체 무결성

    기본키로 선택된 필드는 빈 값을 허용하지 않는다.

  • 참조 무결성

    서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 한다.

  • 고유 무결성

    특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가진다.

  • NULL 무결성

    특정 속성 값에 NULL이 올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건이다.





마무리

이번 블로깅에선 트랜잭션과 무결성에 대해 알아보았다. 이 블로깅의 목적은 깊게 배우는 것이 아니라 개발자 대회에 낄 정도의 넒고 얕은 지식을 목표로 하고 있다. 이 블로깅을 통해서 전체적인 트랜잭션과 무결성 에 대해 잡았으면 좋겠다. 그리고 감을 잡았고 좀 더 깊게 배우고 싶다면 이 블로깅의 키워드를 길로 잡아서 하나씩 공부해 나간다면 매우 도움이 될 것이라고 생각한다.

profile
집돌이 FE개발자의 노트

0개의 댓글