캐시 시간 초과
- 캐시 유효 시간이 초과해서 서버에 다시 요청하면 두 가지 상황이 나타난다.
- 서버에서 기존 데이터를 변경했거나
- 서버에서 기존 데이터를 변경하지 않았거나
캐시 만료 후에도 서버에서 데이터를 변경하지 않음
생각해보면 데이터를 전송하는 대신, 저장해 두었던 캐시를 재사용 할 수 있다.
단, 클라이언트의 데이터와 서버의 데이터가 같다는 사실을 확인할 수 있는 방법이 필요하다.
바로, 검증 헤더와 조건부 요청
-
서버 -> 웹 브라우저
최초에 서버의 응답에 Last-modified(데이터 최종 수정일)을 같이 보낸다.
-
웹 브라우저 -> 서버
if-modified-since : 웹 브라우저 캐시가 가지고 있는, 데이터 최종 수정일, 웹 브라우저가 서버에 요청할 때 보낸다. (캐시 유효 시간이 초과했거나, 새로고침을 한 경우)
-
서버 -> 웹 브라우저
그럼, 서버에선 if-modified-since 이것을 통해서 검증이 가능해진다. 서버는 이를 보고나서, 데이터의 최종 수정일과 비교하여 새로 보낼 필요가 없다고 판단하게 되면, 서버에서는 304 Not Modified 라고 내보낸다. 그리고 동시에, HTTP Body 없이 용량을 확 줄여서 클라이언트에게 응답한다.
그리고, 웹 브라우저가 다시 그 응답을 받았을 때, cache-control , last-modified 의 메타 정보를 이용해서 다시 캐시를 세팅한다. 클라이언트는 캐시에 저장되어 있는 데이터를 재활용 할 수 있다. 결과적으로 매우 용량을 줄인 실용적인 해결책이 된다.
정리
검증 헤더
- 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
- Last-Modified , ETag
조건부 요청 헤더
- 검증 헤더로 조건에 따른 분기
- If-Modified-Since : Last-Modified 일 때 사용.
- If-None-Match : ETag 일 때 사용.
- 조건이 만족하면 200 응답
- 만족하지 않으면 304 응답
- 예시
- If-Modified-Since : 이 값 이후에 데이터가 수정이 되었나요?
- 캐시 == 서버 -> 수정이 안됨. 조건과 다름 => 304 Not Modified
- 캐시 != 서버 -> 수정이 되었음. 조건과 일치 => 200 OK
단점
- 1초 미만 단위로는 캐시 조정이 불가능 ( 이렇게 까지 할 일이 있을까.. ?)
- 날짜 기반의 로직 사용
- 데이터를 수정해서 날짜가 다르지만, 데이터 자체는 똑같다.(A->B->A) 다시 A로 수정을 했다면 서버입장에선 파일의 날짜만 갱신되고 실제 내용은 갱신이 안되어있을 수도 있다.
- 서버에서 별도로 캐시 로직을 관리하고 싶은 경우(날짜만 보는게 아니라 별도로)
- 스페이스, 주석 이런거는 신경안쓰고 싶다.
- 이럴 때, 사용하는 게 ETag
ETag
- Entity Tag (서버에서 응답할 때 내려주고, 웹 브라우저는 ETag 값을 저장한다.)
- 캐시용 데이터에 임의의 고유한 버전 이름을 달아둔다.
- ETag: "v1.0", ETag: "a2jiodwjekjl3"
- 데이터가 변경되면 이 이름을 바꾸어서 변경하여 다시 hash 를 생성한다.
- 진짜 단순하게 ETag 만 보내서 같으면 유지, 다르면 다시 받는다.(해시 코드 비교)
- 캐시 제어 로직을 서버에서 완전히 관리한다. 클라이언트는 완전히 블랙박스임. 클라이언트는 서버의 아무 매커니즘을 모름
- 예(있을법한)
- 애플리케이션 배포 주기에 맞추어 ETag 모두 갱신.
캐시와 조건부 관련 헤더 정리
캐시 제어 헤더
-
Cache-Control : 캐시 제어 (이게 제일 중요하다.)
- 값 : max-age / 캐시가 얼마나 유효한지 , 초 단위로 입력한다.
- 값 : no-cache / 항상 캐시를 사용하기 전에 원(origin) 서버한테 검증을 하고 써라는 뜻 , 데이터는 캐시해도 됨.
- 값 : no-store / 데이터에 민감한 정보가 있으므로 저장하면 안됨. 메모리에서 사용하고 최대한 빨리 삭제 해야 한다. no-cache 와 헷갈리지 말자.
-
Pragma : HTTP 1.0 하위 호환이라 거의 사용안함.
-
Expires : 캐시 만료일 지정(하위 호환)
- 캐시 만료일을 정확한 날짜로 지정할 수 있음.
- 지금은 Cache-Control: max-age 를 권장, cache-control 이랑 같이 쓰면 cache-control 로만 사용되게 됨.
검증 헤더와 조건부 요청 헤더
- 검증 헤더
- 조건부 요청 헤더
- If-Match , If-None-Match : ETag 값을 사용
- If-Modified-Since , If-Unmodified-Since : Last-Modified 값 사용
프록시 캐시
웹 브라우저가 원 서버까지 500ms 가 걸린다고 하면, 사람들은 항상 500ms 를 기다려야 할 것이다.
그래서 도입된 것이 프록시 캐시 서버 이다. CDN 서비스 라고 해서 하고있음.
요청이 오면 프록시 캐시 서버를 거쳐서 오도록 되어있다. 웹 브라우저의 요청을 프록시 캐시 서버로 처리하도록 한다. 우리가 유튜브를 빨리 볼 수 있는 것.
보통, 첫 번째 유저는 느리고, 두 번째부터는 빨리 할 수도 있음. 로컬의 웹 브라우저에 저장되는 것을 private 캐시, 프록시 캐시에 저장되는 것을 public 캐시라고 한다.
캐시 지시어(이런게 있다 정도만 알고 넘어가면 될 듯)
- Cache-Control : public
- 응답이 public 캐시에 저장되어도 된다는 뜻
- Cache-Control : private(이게 default 이다, public 이 아니라)
- 응답이 해당 사용자를 위한 것임, 중간에 프록시 캐시 서버에 저장되면 안된다는 뜻,
- Cache-Control : s-maxage
- Age: 60(HTTP 헤더)
- 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간
캐시 무효화
확실한 캐시 무효화 응답을 하는 방법에 대한 설명
-
웹 브라우저는 임의로 캐시 처리를 해버릴 수 있다.
-
진짜로 절대 캐시 되게 하기 싫다면 이렇게 해줘야한다.
Cache-Control: no-cache, no-store, must-revalidate
Pragma: no-cache (HTTP 1.0 하위 호환)
-
Cache-Control: no-cache
- 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용해야 한다.(이름에 주의하자)
- 원 서버 접근 실패시 성공 으로 보낼 수도 있음.
-
no-store : 데이터에 민감한 정보가 있으므로 저장하면 안됨, 빨리 삭제해야함.
-
must-revalidate
- 캐시 만료후 최초 조회시 원 서버에 검증해야 한다.
- 원 서버 접근 실패시 반드시 오류가 발생해야함 - 504(Gateway Timeout)
no-cache 와의 차이!