auto_increment 속성이 설정된 관계형 데이터베이스의 기본 키는 분산환경에서 사용하기에 적합하지 않다.
분산 시스템에서 유일성
이 보장되는 ID를 만드는 방법
다중 마스터 복제는 데이터베이스의 auto_increment 기능을 활용한다.
현재 사용 중인 데이터베이스 서버의 수를 k라고 하자.
다음 ID 값을 구할 때 이전 키에서 k만큼 더해주는 방법이다.
서버마다 시작하는 숫자를 달리하면 다음에 생성되는 키들도 전부 유니크해질 것이다.
서버를 추가하거나 삭제할 때도 잘 동작하도록 만들기 어렵다.
128비트
짜리 수예시 : f2195bf4-4eb1-11ed-bdc3-0242ac120002
규모 확장이 쉽다.
이 방법은 auto_increment 기능을 갖춘 데이터베이스 서버를 티켓서버로 하고, 중앙 집중형으로 하나만 사용하는 것이다.
단일장애지점
(SPOF, Single-Point-of-Failure)이 된다. 결국 이 이슈를 해결하기 위해 티켓 서버를 여러 대 준비하게 되는데, 그렇게 하면 데이터 동기화같은 새로운 문제가 발생한다.지금까지 얘기했던 방법들 모두 문제의 요구사항을 만족하지 못했다.
트위터에서 사용하는 스노플레이크라는 ID 생성 기법은 이번 문제의 요구사항을 만족할 수 있다.
이 방법은 divide and conquer 전략을 사용한다.
생성해야하는 ID를 여러 섹션으로 분할
하는 것이다.
snowflake는 ID를 5개의 섹션으로 구분한다.
문제의 요구사항을 만족시키기 위해 트위터의 snowflake 기법을 사용해서 상세 설계를 진행해보자.
시스템이 시작될 때 결정
되고, 일반적으로 시스템 운영 중에는 바뀌지 않는다.
ID 생성기로 '생성'하는 섹션은 타임스탬프와 일련번호가 되겠다.
앞서 살펴본 ID 구조에서 가장 중요한 41비트를 차지하고 있다. 타임스탬프는 시간이 흐름에 따라 점점 큰 값을 갖게 되므로, 결국 아이디는 시간순으로 정렬 가능하게 된다.
이진 표현 형태로부터 UTC 시각을 추출하는 예제
41비트로 표현할 수 있는 타임스탬프의 최댓값은 2^41−1=2199023255551 밀리초이다. (약 69년)
기원시각을 현재랑 가깝게 맞추면 오버플로가 발생하는 시점을 늦춰 놓는 것이 된다.
69년이 지나면 기원 시각을 바꾸거나 ID 체계를 다른 것으로 이전
해야한다.
일련번호는 12비트 이므로 2^12 = 4096개의 값을 가질 수 있다. 어떤 서버가 같은 밀리초 동안 하나 이상의 ID를 만들어 낸 경우에만 0보다 큰 값을 갖게 된다.
→ 두 개 이상의 일련번호가 동일한 시간에 생성된 경우 0보다 큰 값을 가진다.
ID 생성기 구현에 쓰일 수 있는 4가지 전략을 살펴보았다.
그리고 이번 문제의 요구사항에 적합한 snowflke를 선택했다.
설계 이후에 추가로 논의할 수 있는 주제들은 다음과 같다.
서버들이 전부 같은 시계를 사용
한다고 가정하였다. 하지만 이런 가정은 하나의 서버가 여러 코어에서 실행될 경우 유효하지 않을 수 있다. 여러 서버가 물리적으로 독립된 여러 장비에서 실행되는 경우에도 마찬가지다. NTP(Network Time Protocol)는 이 문제를 해결하는 가장 보편적 수단.동시성이 낮고 수명이 긴 애플리케이션
이라면 일련번호 절의 길이를 줄이고 타임스탬프 절의 길이를 늘리는 것이 효과적
일 수 있다.가용성을 제공
해야 할 것이다.
이번에 저도 이 책을 읽고 제 나름대로 필요 내용들을 정의하여 ID 생성기를 아래와 같이 구현해보고 아래와 같이 정리해보았어요! 좋은 내용인 것 같습니다 ㅎㅎ
https://velog.io/@rivkode/Id-%EC%83%9D%EC%84%B1%EA%B8%B0-%EA%B5%AC%ED%98%84