1. 캐시 메모리
속도가 빠른 장치와 느린 장치에서 속도 차이에 따른 병목 현상을 줄이기 위한 메모리이다.
예시
ㅁ CPU 코어와 메모리 사이의 병목 현상 완화
ㅁ 웹 브라우저 캐시 파일은 하드디스크와 웹 페이지 사이의 병목 현상 완화
CPU가 주기억장치에 저장된 데이터를 읽어올 때, 자주 사용하는 데이터를 캐시 메모리에 저장한 뒤, 다음에 이용할 때에는 캐시 메모리에서 가져오면서 속도를 향상시킨다.
용량이 적으며 비용이 비싼 단점이 있다.
CPU에는 캐시 메모리가 2~3개 정도 사용된다.(L1, L2, L3 캐시 메모리, 속도와 크기에 따라 분류)
일반적으로 L1 캐시부터 먼저 사용된다.(여기서 데이터 찾지 못하면 L2를 사용해 찾는다.)
ㅁ L1 : CPU 내부에 존재
ㅁ L2 : CPU와 RAM 사이에 존재
ㅁ L3 : 보통 메인보드에 존재
듀얼 코어 프로세서의 캐시 메모리 : 각 코어마다 독립된 L1 캐시 메모리를 가지고, 두 코어가 공유하는 L2 캐시 메모리가 내장되어 있다.
디스크 캐시 : 주기억장치와 보조기억장치 사이에 존재하는 캐시
2. 캐시 메모리 원리
시간 지역성 : for, while 같은 반복문에 사용하는 조건 변수처럼 한 번 참조된 데이터는 잠시 후 참조될 가능성이 높다.
공간 지역성 : A[0], A[1]과 같은 연속 접근 시, 참조된 데이터 근처에 있는 데이터가 잠시 후 다시 사용될 가능성이 높다.
캐시에 데이터를 저장할 때는, 이러한 참조 지역성을 최대한 활용하기 위해 해당 데이터뿐만 아니라, 옆 주소의 데이터도 같이 가져와 미래에 쓰일 것을 대비한다.
Cache Hit : CPU가 요청한 데이터가 캐시에 있는 경우
Cache Miss : 캐시에 없어서 DRAM에서 가져올 경우
3. Cache Miss 3가지 경우
Cold miss
-> 해당 메모리 주소를 처음 불러서 나는 미스
Conflict miss
-> 캐시 메모리에 A, B 데이터를 저장해야 하는데 A와 B가 같은 캐시 메모리 주소에 할당되어 있어서 생기는 미스(direct mapped cache에서 많이 발생한다.)
Capacity miss
-> 캐시 메모리의 공간이 부족해서 나는 미스
4. 구조 및 작동 방식(1) - Direct Mapped Cache
가장 기본적인 구조로, 여러 주소가 캐시 메모리의 한 주소에 대응되는 다대일 방식
그림에서는 메모리 공간이 32(00000~11111)개, 캐시 메모리 공간은 8개(000~111)이다.
이 때, 000이 인덱스 필드, 인덱스 필드를 제외한 앞의 나머지(00,01,10,11)을 태그 필드라 한다.
캐시 메모리는 인덱스 필드 + 태그 필드 + 데이터 필드로 구성된다.
장점 : 간단하고 빠르다.
단점 : Conflict Miss가 발생한다. 위의 그림에서 같은 색깔의 데이터를 동시에 사용해야 할 때 발생한다.
5. 구조 및 작동 방식(2) - Fully Associative Cache
비어있는 캐시 메모리가 있으면 마음대로 주소를 사용하는 방식이다.
저장할 때는 간단하지만 찾을 때 문제가 발생한다.
조건이나 규칙이 없어서 특정 캐시 Set 안의 모든 블럭을 한 번에 찾아 원하는 데이터가 있는지 검색해야 한다.
CAM이라는 특수한 메모리 구조를 사용하고 가격이 매우 비싸다.
6. 구조 및 작동 방식(3) - Set Associative Cache
Direct + Fully 방식이다.(위의 2개 합)
특정 행을 지정하고 그 행 안의 어떤 열이든 비어있을 때 저장하는 방식이다.
Direct에 비해 검색 속도는 느리지만 저장이 빠르다.
Fully에 비해 저장이 느리지만 검색이 빠르다.