프로세스와 스레드의 차이점
프로세스는 프로그램을 메모리에 올려 실행한 상태로 운영체제로부터 독립된 메모리 영역(Code, Data, Stack, Heap)과 CPU 자원을 할당받을 수 있다. 스레드는 이런 프로세스 내의 실행 단위로 프로세스의 자원을 공유(Code, Data, Heap)하면서 프로세스를 실행하는 흐름으로, 독립적인 실행이 가능할 수 있도록 Stack, PC 레지스터를 독립적으로 할당받는다.
실행 중인 프로그램
프로세스와 프로그램의 차이점
프로그램은 작업의 절차를 실행할 수 있는 정적 파일, 프로세스는 프로그램을 메모리에 올린 동적인 상태(프로그램을 실행하면 프로세스 인스턴스가 생성된다고 생각)
3가지 영역은 컴파일 시점에 크기가 결정되기 때문에 무한대로 할당할 수는 없다. stack 영역은 최대 할당 크기는 컴파일 시점에 결정되지만 동적으로 크기가 변한다. 만약 스택이 넘치면 stack overflow가 발생한다.
Heap 영역은 런타임(프로그램 동작) 시에 크기가 결정된다.
프로세스가 할당받은 자원을 공유하여 이용하는 실행 흐름의 단위
스택을 스레드마다 독립적으로 할당하는 이유
스택은 함수 호출 시 전달되는 인자, 되돌아갈 주소값 및 함수 내에서 선언하는 변수 등을 저장하기 위해 사용되는 메모리 공간이므로 스택 메모리 공간이 독립적이라는 것은 독립적인 함수 호출이 가능하다는 뜻이고 이는 독립적인 실행 흐름이 추가되는 것이다. 따라서 스레드의 정의에 따라 독립적인 실행 흐름을 추가하기 위한 최소 조건으로 독립된 스택을 할당한다.
PC Register를 스레드마다 독립적으로 할당하는 이유
PC 값은 스레드가 수행한 명령어의 위치를 기억한다. 스레드는 CPU를 할당받았다가 스케줄러에 의해 다시 대기상태가 되기도 한다. 그렇기 때문에 명령어가 연속적으로 수행되지 못하고 어느 부분까지 수행했는지 기억할 필요가 있다. 따라서 PC Register를 독립적으로 할당한다.
멀티 프로세스 방식
- 하나의 프로세스가 죽더라도 다른 프로세스에는 영향을 끼치지 않고 정상적으로 수행된다
- 멀티 스레드보다 많은 메모리 공간과 CPU 시간을 차지
멀티 스레드 방식
이 두 가지 방식은 동시에 여러 작업을 수행한다는 점에서 같지만 적용해야 하는 시스템에 따라 적합/부적합이 구분된다. 따라서 대상 시스템의 특징에 따라 적합한 방식을 선택해야 한다.
하나의 응용 프로그램을 여러 개의 프로세스로 구성하여 각 프로세스가 하나의 작업을 처리하는 것
독립적으로 메모리를 사용하기 때문에 스케줄링에 의해 다른 프로세스가 CPU를 할당 받게 되면 CPU 내 레지스터 값인 이전 프로세스 데이터를 따로 저장한 후에 현재 프로세스의 데이터를 레지스터에 저장해야 하는데 이 과정에서 시스템에 많은 부하가 생긴다.
IPC(Inter Process Communication)
커널 영역에 존재하며, 프로세스 간 통신을 위해서는 공유하는 메모리 공간이 필요하기 때문에 이러한 공유 공간 제공
하나의 응용 프로그램을 여러 개의 스레드로 구성하여 각 스레드가 하나의 작업을 처리하도록 하는 것
출처
어떤 프로세스에게 자원을 할당할지 결정하는 운영체제 커널의 모듈
어떤 프로세스에 메모리를 할당하여 ready queue로 보낼지 결정하는 역할
Ready Queue 에 존재하는 프로세스(Ready 상태) 중 어떤 프로세스를 running(CPU 할당) 시킬지 결정
swapping(swap in/swap out): 여유 공간 마련을 위해 프로세스를 통째로 메모리에서 디스크로 쫓아내는 역할
정리
장기 스케줄러: 메모리-디스크 스케줄링 / New-Ready
중기 스케줄러: CPU-메모리 스케줄링 / Ready-Running-Waiting-Ready
단기 스케줄러: 메모리-디스크 스케줄링 / Ready-Suspended (Swapping)
비선점형(Non-Preemptive) 스케줄링 방식
먼저 도착한 프로세스가 CPU를 먼저 할당받음
큐를 이용해 쉽게 구현 가능
Convoy effect(콘보이 현상) 발생 가능
콘보이 현상(Convoy effect)
소요시간이 긴 프로세스가 먼저 도달하여 효율성을 낮추는 현상 발생
(CPU를 매우 오래 사용하는 프로세스가 도착하게 되면, 다른 프로세스가 CPU를 사용하는데 기다리는 대기 시간이 매우 커지는 현상)
선점형(Preemptive) 스케줄링 방식
더 높은 우선순위 프로세스가 도착하면 실행중인 프로세스를 멈추고 CPU를 선점
비선점형(Non-Preemptive) 스케줄링 방식
더 높은 우선순위의 프로세스가 도착하면 Ready Queue의 Head에 넣는다
우선순위가 가장 높은 프로세스에게 CPU를 할당하는 스케줄링 방법
starvation과 무기한 봉쇄(Indefinite Blocking) 문제 발생
Indefinite Blocking, 무기한 봉쇄
CPU가 실행 준비는 되어있으나 CPU를 사용하지 못하는 프로세스를 계속해서 기다리는 상태
무기한 봉쇄 해결방법: aging
아무리 우선순위가 낮은 프로세스라도 오래 기다리면 우선순위를 높여주자!
출처
데이터의 요청과 결과가 한 자리에서 동시에 일어남
데이터의 요청과 결과가 동시에 일어나지 않음
👀 동시란?
요청에 대한 응답을 받기 전가지 blocking 상태
동일한 자원을 동시에 접근하는 작업(e.g. 공유하는 변수 사용, 동일 파일을 사용하는 등)을 실행하는 코드 영역
임계 구역으로 지정되어야 할 코드 영역이 임계 구역으로 지정되지 않았을 때 발생할 수 있는 문제
상호 배제(Mutual Exclusion): 임계 영역에는 하나의 프로세스만 진입 가능
프로세스 P1이 Critical Section에 진입해있는 상태라면 다른 프로세스들은 Critical Section에 접근할 수 없음
진행(Progress)
임계 영역에 들어간 프로세스가 없는 상태에서 진입을 시도하는 프로세스가 여러 개라면 어느 프로세스가 진입할지 결정되어야 함
한정 대기(Bounded Waiting): 대기 시간이 유한
다른 프로세스의 Starvation(기아, 오랜 시간동안 CPU 할당받지 못한 상태)을 방지하기 위해 임계 영역에 진입했던 프로세스는 다음 진입 시도에서 제한
임계 영역에 진입하는 프로세스는 lock를 획득하고 임계 영역을 빠져나올 때 lock을 반납하는 방식으로, lock을 획득한 프로세스만 임계 영역에 진입할 수 있도록 한다.
Binary semaphore(이진 세마포어)
Counting semaphore(카운팅 세마포어)
출처
여기부터 다시 공부!
각각의 프로세스 는 독립된 메모리 공간을 갖고, 운영체제 혹은 다른 프로세스의 메모리 공간에 접근할 수 없는 제한이 걸려있다. 단지, 운영체제 만이 운영체제 메모리 영역과 사용자 메모리 영역의 접근에 제약을 받지 않는다.
메모리의 관리를 위해 사용되는 기법
표준 Swapping 방식으로는 round-robin 과 같은 스케줄링의 다중 프로그래밍 환경에서 CPU 할당 시간이 끝난 프로세스의 메모리를 보조 기억장치(e.g. 하드디스크)로 내보내고 다른 프로세스의 메모리를 불러 들일 수 있다.
프로세스들이 메모리에 적재되고 제거되는 일이 반복되다보면, 프로세스들이 차지하는 메모리 틈 사이에 사용하지 못할 만큼의 작은 자유공간 증가
외부 단편화를 해소하기 위해 프로세스가 사용하는 공간들을 한쪽으로 몰아, 자유공간을 확보하는 방법
하나의 프로세스가 사용하는 메모리 공간이 연속적이어야 한다는 제약을 없애는 메모리 관리 방법
외부 단편화와 압축 작업을 해소 하기 위해 생긴 방법
물리 메모리는 Frame 이라는 고정 크기로 분리되어 있고, 논리 메모리(프로세스가 점유하는)는 페이지라 불리는 고정 크기의 블록으로 분리됨.(페이지 교체 알고리즘에 들어가는 페이지)
장점: 페이징 기법을 사용함으로써 논리 메모리는 물리 메모리에 저장될 때, 연속되어 저장될 필요가 없고 물리 메모리의 남는 프레임에 적절히 배치됨으로 외부 단편화를 해결 가능
단점 : 내부 단편화 문제의 비중이 늘어나게 됨
예를들어 페이지 크기가 1,024B 이고 프로세스 A 가 3,172B 의 메모리를 요구한다면 3 개의 페이지 프레임(1,024 * 3 = 3,072) 하고도 100B 가 남기때문에 총 4 개의 페이지 프레임이 필요한 것이다. 결론적으로 4 번째 페이지 프레임에는 924B(1,024 - 100)의 여유 공간이 남게 되는 내부 단편화 문제가 발생하는 것이다.
페이징에서처럼 논리 메모리와 물리 메모리를 같은 크기의 블록이 아닌, 서로 다른 크기의 논리적 단위인 세그먼트(Segment)로 분할 사용자가 두 개의 주소로 지정(세그먼트 번호 + 변위) 세그먼트 테이블에는 각 세그먼트의 기준(세그먼트의 시작 물리 주소)과 한계(세그먼트의 길이)를 저장
다중 프로그래밍을 실현하기 위해서는 많은 프로세스들을 동시에 메모리에 올려두어야 한다. 가상메모리는 프로세스 전체가 메모리 내에 올라오지 않더라도 실행이 가능하도록 하는 기법 이며, 프로그램이 물리 메모리보다 커도 된다는 주요 장점이 있다.
실행되는 코드의 전부를 물리 메모리에 존재시켜야 했고, 메모리 용량보다 큰 프로그램은 실행시킬 수 없었다. 또한, 여러 프로그램을 동시에 메모리에 올리기에는 용량의 한계와, 페이지 교체등의 성능 이슈가 발생하게 된다. 또한, 가끔만 사용되는 코드가 차지하는 메모리들을 확인할 수 있다는 점에서, 불필요하게 전체의 프로그램이 메모리에 올라와 있어야 하는게 아니라는 것을 알 수 있다.
가상 메모리는 실제의 물리 메모리 개념과 사용자의 논리 메모리 개념을 분리한 것으로 정리할 수 있다. 이로써 작은 메모리를 가지고도 얼마든지 큰 가상 주소 공간을 프로그래머에게 제공할 수 있다.
한 프로세스가 메모리에 저장되는 논리적인 모습을 가상메모리에 구현한 공간이다. 프로세스가 요구하는 메모리 공간을 가상메모리에서 제공함으로써 현재 직접적으로 필요치 않은 메모리 공간은 실제 물리 메모리에 올리지 않는 것으로 물리 메모리를 절약할 수 있다.
예를 들어, 한 프로그램이 실행되며 논리 메모리로 100KB 가 요구되었다고 하자. 하지만 실행까지에 필요한 메모리 공간(Heap영역, Stack 영역, 코드, 데이터)의 합이 40KB 라면, 실제 물리 메모리에는 40KB 만 올라가 있고, 나머지 60KB 만큼은 필요시에 물리메모리에 요구한다고 이해할 수 있겠다.
프로그램 실행 시작 시에 프로그램 전체를 디스크에서 물리 메모리에 적재하는 대신, 초기에 필요한 것들만 적재하는 전략을 요구 페이징이라 하며, 가상 메모리 시스템에서 많이 사용된다. 그리고 가상 메모리는 대개 페이지로 관리된다. 요구 페이징을 사용하는 가상 메모리에서는 실행과정에서 필요해질 때 페이지들이 적재된다. 한 번도 접근되지 않은 페이지는 물리 메모리에 적재되지 않는다.
프로세스 내의 개별 페이지들은 페이저(pager)에 의해 관리된다. 페이저는 프로세스 실행에 실제 필요한 페이지들만 메모리로 읽어 옮으로써, 사용되지 않을 페이지를 가져오는 시간낭비와 메모리 낭비를 줄일 수 있다.
요구 페이징 에서 언급된대로 프로그램 실행시에 모든 항목이 물리 메모리에 올라오지 않기 때문에, 프로세스의 동작에 필요한 페이지를 요청하는 과정에서 page fault(페이지 부재)가 발생하게 되면, 원하는 페이지를 보조저장장치에서 가져오게 된다. 하지만, 만약 물리 메모리가 모두 사용중인 상황이라면, 페이지 교체가 이뤄져야 한다.(또는, 운영체제가 프로세스를 강제 종료하는 방법이 있다.)
물리 메모리가 모두 사용중인 상황에서의 메모리 교체 흐름이다.
가장 간단한 페이지 교체 알고리즘으로 FIFO(first-in first-out)의 흐름을 가진다. 즉, 먼저 물리 메모리에 들어온 페이지 순서대로 페이지 교체 시점에 먼저 나가게 된다는 것이다.
Belady의 모순: 페이지를 저장할 수 있는 페이지 프레임의 갯수를 늘려도 되려 페이지 부재가 더 많이 발생하는 모순이 존재한다.
Belady의 모순을 확인한 이후 최적 교체 알고리즘에 대한 탐구가 진행되었고, 모든 알고리즘보다 낮은 페이지 부재율을 보이며 Belady의 모순이 발생하지 않는다. 이 알고리즘의 핵심은 앞으로 가장 오랫동안 사용되지 않을 페이지를 찾아 교체하는 것이다. 주로 비교 연구 목적을 위해 사용한다.
LRU: Least-Recently-Used
최적 알고리즘의 근사 알고리즘으로, 가장 오랫동안 사용되지 않은 페이지를 선택하여 교체한다.
LFU: Least Frequently Used
참조 횟수가 가장 적은 페이지를 교체하는 방법이다. 활발하게 사용되는 페이지는 참조 횟수가 많아질 거라는 가정에서 만들어진 알고리즘이다.
MFU: Most Frequently Used
참조 회수가 가장 작은 페이지가 최근에 메모리에 올라왔고, 앞으로 계속 사용될 것이라는 가정에 기반한다.