캐시 기본 동작
캐시가 없을 때
첫 번째 요청


두 번째 요청


- 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운받아야 한다.
- 인터넷 네트워크는 매우 느리고 비싸다.
- 브라우저 로딩 속도가 느리다.
캐시 적용
첫 번째 요청


두 번째 요청


- 캐시 덕분에 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다.
- 비싼 네트워크 사용량을 줄일 수 있다.
- 브라우저 로딩 속도가 매우 빠르다.
세 번째 요청 - 캐시 시간 초과



- 캐시 유효 시간이 초과하면, 서버를 통해 데이터를 다시 조회하고, 캐시를 갱신한다.
- 이때 다시 네트워크 다운로드가 발생한다.
그런데 이 과정을 거칠때 어차피 같은 이미지를 다운하는 건데 전체를 다시 다운한다는 행동이 조금 낭비가 보인다.
즉, 클라이언트에 있는 캐시의 만료된 데이터와 받아야 할 데이터가 똑같다면 굳이 새로 받아야할까?
검증 헤더와 조건부 요청1
캐시 시간 초과
- 캐시 유효시간이 초과해서 서버에 다시 요청하면 다음 두 가지 상황이 나타난다.
- 서버에서 기존 데이터를 변경함 (노란색 -> 초록색)
- 서버에서 기존 데이터를 변경하지 않음 (노란색 -> 노란색)
그러므로
- 캐시 만료후에도 서버에서 데이터를 변경하지 않음
- 생각해보면 데이터를 전송하는 대신에 저장해 두었던 캐시를 재사용 할 수 있다.
- 단 클라이언트의 데이터와 서버의 데이터가 같다는 사실을 확인할 수 있는 방법이 필요하다.
검증 헤더 추가
첫 번째 요청


두 번째 요청 - 캐시 시간 초과







- 캐시 유효 시간이 초과해도, 서버의 데이터가 갱신되지 않으면
- 304 Not Modified + 헤더 메타 정보만 응답(바디X)
- 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
- 클라이언트는 캐시에 저장되어 있는 데이터 재활용
- 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드
검증 헤더와 조건부 요청2
검증헤더란?
캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
Last-Modified, ETag
조건부 요청 헤더
- 검증 헤더로 조건에 따른 분기
- If-Modified-Since: Last-Modified 사용
- If-None-Match: ETag 사용
- 조건이 만족하면 200 OK
- 조건이 만족하지 않으면 304 Not Modified
만약 데이터가 수정되지 않았으면?
- 캐시: 2020년 11월 10일 10:00:00 vs 서버: 2020년 11월 10일 10:00:00
- 304 Not Modified, 헤더 데이터만 전송(BODY 미포함)
- 전송 용량 0.1M (헤더 0.1M, 바디 1.0M)
데이터가 변경되었으면?
- 캐시: 2020년 11월 10일 10:00:00 vs 서버: 2020년 11월 10일 11:00:00
- 200 OK, 모든 데이터 전송(BODY 포함)
- 전송 용량 1.1M (헤더 0.1M, 바디 1.0M)
Last-Modified, If-Modified-Since 단점
- 1초 미만(0.x초) 단위로 캐시 조정 안댐
- 날짜 기반의 정해진 로직을 사용한다.
- 데이터가 다른 데이터인데 날짜를 같게 만들면 수정 안되게 할 수도 있고 먼가 조작이 일단 가능해버린다.
- 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
ETag, If-None-Match
- Etag(Entity Tag)
- 캐시용 데이터에 임의의 고유한 버전 이름을 달아둠
- 예) ETag: "v1.0", ETag: "a2jiodwjekjl3"
- 데이터가 변경되면 이 이름을 바꾸어서 변경함(Hash를 다시 생성)
- 예) Etag: "aaaaa" -> Etag: "bbbbb"
- 진짜 단순하게 ETag만 보내서 같으면 유지, 다르면 다시 받기
첫 번째 요청


두 번째 요청 - 캐시 시간 초과







정리
- ETag만 서버에 보내서 같으면 유지, 다르면 다시 받기
- 캐시 제어 로직을 서버에서 완전히 관리
캐시와 조건부 요청 헤더
캐시 제어 헤더
- Cache-Control
- Pragma
- Expires
Cache-Control
- Cache-Control: max-age - 캐시 유효 시간, 초단위
- Cache-Control : no-cahce - 데이터는 캐시해도 되지만, 항상 원(origin) 서버에서 검증하고 사용하라는 뜻
- Cache-Control: no-store - 데이터에 민감한 정보가 있으므로 저장하면 안됨
Expires
- expires: Mon, 01 Jan 1990 00:00:00 GMT
- 캐시 만료일을 정확한 날짜로 결정
- HTTP 1.0부터 사용
- 지금은 더 유연한 Cache-Control: max-age 권장
- Cache-Control: max-age와 함께 사용하면 Expires는 무시
검증 헤더
- ETag: "v1.0", ETag: "asid93jkrh2l"
- Last-Modified: Thu, 04 Jun 2020 07:19:24 GMT
조건부 요청 헤더
- If-Match, If-None-Match: ETag 값 사용
- If-Modified-Since, If-Unmodified-Since: Last-Modified 값 사용
프록시 캐시
원 서버 직접 접근
origin 서버

첫 번째 요청


Cache-Control
Cache-Control: public
Cache-Control:private
- 응답이 해당 사용자만을 위한 것임, private 캐시에 저장해야 함
Cache-Control: s-maxage
Age: 60 (HTTP 헤더)
- 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)
우리는 별로 안중요함
캐시 무효화
Cache-Control
확실한 캐시 무효화 응답
캐시가 되면 안되는 페이지가 있다면
- Cache-Control: no-cache, no-store, must-revalidate
- Progma: no-cache
통장 잔고 같은건 계속 업데이트가 되야 하므로 절대 캐시가 되면 안된다.
Cache-Control: no-cache
- 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용
Cache-Control: no-sotre
- 데이터에 민감한 정보가 있으므로 저장하면 안됨 . 메모리에서 사용하고 최대한 빨리 삭제)
Cache-Control: must-revalidate
- 만약 서버의 오류가 생기면 504 에러를 보낸다.
- 밑에 그림 설명
Pragma: no-cache
no-cahce vs must-revalidate
no-cache 기본 동작

프록시 캐시 서버에 no-cache가 오면 원 서버로 요청을 한다. 그 후에 원 서버에서 검증을 한 후에 다시 응답을 해준다.


그런데 중간에 순간 네트워크가 단절되어 오류가 나올 수 있는데 이 부분에서 설정을 통해 오류가 나더라도 과거의 데이터를 보여주면서 200 OK가 나오도록 서버에서 설정할 수 있다.
하지만, 통장 잔고의 경우 위와 같이 과거의 데이터를 보여주면 안되는 경우가 발생한다.
그런 경우에는 must-revalidate를 사용한다.
must-revalidate

must-revalidate의 경우 네트워크가 단절되었을때 무조건 504오류를 보낸다.