Multi process/ thread 환경의 동기화 문제

YJS·2023년 10월 3일
0

🤓오늘의 공부 주제: Multi process/ thread 환경의 동기화 문제🤓

Q. multi process환경에서 process간에 데이터를 어떻게 주고 받는가?

A. 원칙적으로 process는 독립적인 주소 공간을 갖기 때문에, 다른 process의 주소 공간을 참조할 수 없다. 하지만 경우에 따라 운영체제는 process 간의 자원 접근을 위한 매커니즘인 프로세스 간 통신(IPC, Inter Process Communication)를 제공한다. 프로세스간 통신 방법으로는 파이프, 파일, 소켓, 공유메모리 등을 이용한 방법이 있다.

여기서 잠깐!💡 공유메모리란?
공유 메모리 방식에서는 process들이 주소 공간의 일부를 공유. 공유한 메모리 영역에 읽기/쓰기를 통해서 통신을 수행. process가 공유 메모리 할당을 kernel에 요청하면 kernel은 해당 process에 메모리 공간을 할당. 공유 메모리 영역이 구축된 이후에는 더이상 kernel의 도움없이 각 process들이 해당 메모리 영역에 접근. 따라서 커널의 관여 없이 데이터를 통신할 수 있기 때문에 IPC속도가 빠르다.

공유 메모리 방식은 process간의 통신을 수월하게 만들지만 동시에 같은 메모리 위치에 접근하게 되면 일관성 문제가 발생할 수 있다.

여기서 잠깐!💡 메세지 전달이란?
메시지 전달 방법은 통상 system call을 사용하여 구현된다. kernel을 통해 send(message)와 receive(message)라는 두 가지 연산을 제공받는다.메모리 공유보다는 속도가 느리지만, 충돌을 회피할 필요가 없기 때문에 적은양의 데이터를 교환하는 데 유용하며 구현하기가 쉽다는 장점이 있다.

대표적인 예시로는 pipe, socket, message queue등

Q. Multi process/thread 환경에서 동기화 문제를 어떻게 해결하는가?

A.동기화문제를 해결하기 위해 mutex, semaphore 기법 등을 사용.

Mutex란 1개의 스레드만이 공유 자원에 접근할 수 있도록 하여, 경쟁 상황(race condition)를 방지하는 기법. 공유 자원을 점유하는 thread가 lock을 걸면, 다른 thread는 unlock 상태가 될 때까지 해당 자원에 접근할 수 없다.

Semaphore란 S개의 thread만이 공유 자원에 접근할 수 있도록 제어하는 동기화 기법으로 정수형 변수 S(세마포) 값을 가용한 자원의 수로 초기화하고, 자원에 접근할 때는 S-- 연산을 수행하여 세마포 값을 감소시키고 자원을 방출할 때는 S++ 연산을 수행하여 세마포 값을 증가시켜 세마포 값이 0이 되면 모든 자원이 사용 중임을 의미하고, 이후 자원을 사용하려는 프로세스는 세마포 값이 0보다 커질 때까지 block 된다.

여기서 잠깐!💡 동기화 문제란?
서로 다른 스레드가 메모리 영역을 공유하기 때문에 여러 스레드가 동일한 자원에 동시에 접근하여 엉뚱한 값을 읽거나 수정하는 문제를 말한다.
둘 이상의 스렉드가 동일한 자원에 접근하여 조작하고 그 실행 결과가 접근이 발생한 순서에 따라 달라지는 경쟁상황에 의해서 동기화 문제가 발생할 수 있다.

임계영역(critical section)

둘 이상의 프로세스/스레드가 동시에 동일한 자원에 접근하도록 하는 프로그램 코드 부분을 뜻한다. 하나의 프로세스 혹은 스레드가 자신의 임계구역에서 수행하는 동안 다른 프로세스나 스레드는 그들의 임계 구역에 들어갈 수 없다. 임계 영역 내의 코드는 원자적으로 실행되어야한다. 이를 위해서 각각의 프로세스나 스레드는 자신의 임계 구역으로 진입하려면 진입 허가 요청을 해야한다. 이 부분을 entry section이라고 하고 진입이 허가되면 임계 영역을 실행하고 끝나고 나면 exit section으로 퇴출한다.

Q. Mutex란 무엇인가?

A.동기화 방법중 하나로 mutual exclusion의 축약어

공유자원에 접근할 수 있는 process/thread의 수를 1개로 제한한다. 임계영역을 보호하고, 경쟁상황을 방지하기 위해 mutex lock을 사용한다. 즉 process/thread는 임계영역에 들어가기 전에 반드시 lock을 획득해야 하고, 임계구역을 빠져나올 때 lock을 반환해야 한다.

acquire()함수가 lock을 획득하고 release()함수가 lock을 반환.

Q. Semaphore란 무엇인가?

A.동기화 방법중 하나로, mutex와 가장 큰 차이점은 공유 자원에 접근할 수 있는 process/thread의 개수가 2개 이상이 될 수 있다는 것

semaphore 변수 S(세마포)에 동시에 접근 가능한 process/thread의 갯수를 저장한다. S가 0보다 크면 임계영역으로 들어갈 수 있고, 임계영역에 들어가면 S값을 1 감소시킨다. S값이 0이 되면 다른 process/thread는 임계영역으로 접근할 수 없다. 임계영역에서의 작업이 끝나고 임계영역에서 exit하면서 S값을 1 증가시킨다.

Q. 교착상태(Deadlock)란 무엇인가?

A.둘 이상의 스레드가 각기 다른 스레드가 점유하고 있는 자원을 서로 기다릴때, 무한 대기에 빠지는 상황을 뜻한다.
데드락이 발생하는 조건은 상호배제, 점유대기, 비선점, 순환대기이며 이 4가지 조건이 동시에 성립할때 발생한다. 이를 해결하기 위해서는 무시, 예방, 회피, 탐지-회복의 4자기 방법이 있다.

여기서 잠깐!💡 Deadlock 발생 조건이란?

  1. 상호 배제(mutual exclusion)
    • 동시에 한 thread만 자원을 점유할 수 있는 상황.
    • 다른 thread가 자원을 사용하려면 자원이 방출될 때까지 기다려야 한다.
  2. 점유 대기(hold-and-wait)
    • thread가 자원을 보유한 상태에서 다른 thread가 보유한 자원을 추가로 기다리는 상황.
  3. 비선점(no preemption)
    • 다른 thread가 사용 중인 자원을 강제로 선점할 수 없는 상황.
    • 자원을 점유하고 있는 thread에 의해서만 자원이 방출.
  4. 순환 대기(circular wait)
    • 대기 중인 thread들이 순환 형태로 자원을 대기하고 있는 상황.

Deadlock 해결 방법
1. 무시: deadlock 발생 확률이 낮은 시스템에서 아무런 조치도 취하지 않고 deadlock을 무시하는 방법. 시스템 성능 저하가 없다는 장점. 현대 시스템에서는 발생 가능성이 낮고 해결 비용이 크기 때문에 무시 방법이 많이 사용됨.
2. 예방: 교착 상태의 4가지 발생 조건중 하나가 성립하지 않게 하는 방법. 순환대기 조건이 성립하지 않도록 예방. 자원 사용의 효율성이 떨어지고 비요이 큼.
3. 회피: thread가 앞으로 자원을 어떻게 요청할지에 대한 정보를 통해 순환 대기 상태가 발생하지 않도록 자원을 할당. 자원 할당 그래프 알고리즘, 은행원 알고리즘 등을 사용하여 자원을 할당하여 deadlock을 회피.
4. 탐지-회복: 시스템 검사를 통해 deadlock 발생을 탐지하고, 이를 회복시키는 방법. 자원 사용의 효율성이 떨어지고 비용이 큼.

출처 : 인프런 - 기출로 대비하는 개발자 전공면접 [CS 완전정복]

profile
우당탕탕 개발 일기

0개의 댓글