HTTP 완벽 가이드 - 1장

Life is ninanino·2023년 7월 31일
1

리뷰

목록 보기
4/4
post-thumbnail

공부할 거리

  • 얼마나 많은 클라이언트와 서버가 통신하는지
  • 리소스(웹 콘텐츠)가 어디서 오는지
  • 웹 트랜젝션이 어떻게 동작하는지
  • HTTP 통신을 위해 사용하는 메세지의 형식
  • HTTP 기저의 TCP 네트워크 전송
  • 여러 종류의 HTTP 프로토콜
  • 인터넷 곳곳에 설치된 다양한 HTTP 구성 요소

1.1 HTTP

HTTP는 신뢰성 있는 데이터 전송 프로토콜을 사용하기 때문에, 데이터가 지구 반대편에서 오더라도 손상되지 않음을 보장한다.

1.2 웹 클라이언트와 서버

웹 콘텐츠는 웹 서버에 존재한다. 웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불린다. 웹 서버는 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다
예를 들어 "http://www.naver.com/index.html" 페이지를 열어볼 때 웹 브라우저는 HTTP요청을 www.naver.com 서버로 보낸다. 서버는 요청 받은 객체("/index.html")을 찾고, 성공했다면 그것의 타입, 길이 등의 정보와 함께 HTTP 응답에 실어서 클라이언트에게 보낸다

1.3 리소스

웹 서버는 웹 리소스를 관리하고 제공한다. 웹 리소스는 웹 콘텐츠의 원천이다. 가장 단순한 웹 리소스는 웹 서버 파일 시스템의 정적 파일이다. 정적 파일은 텍스트 파일, HTML 파일, 이미지, 동영상 파일 등 모든 종류의 파일을 포함한다. 리소스는 반드시 정적 파일이어야 할 필요는 없다. 리소스는 요청에 따라 콘텐츠를 생산하는 프로그램이 될 수도 있다. 어떤 종류의 콘텐츠 소스도 리소스가 될 수 있다. 탐색하는 웹 게이트웨이, 인터넷 검색엔진 역시 리소스다

1.3.1 미디어 타입

HTTP는 웹에서 전송되는 객체 각각에 MIME 타입이라는 데이터 포멧 라벨을 붙인다. MIME(Multipurpose Internet Mail Extensions, 다목적 인터넷 메일 확장)은 원래 각기 다른 전자메일 시스템 사이에서 메세지가 오갈 때 겪는 문제점을 해결하기 위해 설계되었다. 웹 서버는 모든 HTTP 객체 데이터에 MIME 타입을 붙인다. 웹 브라우저는 서버로부터 객체를 돌려 받을 때, 다룰 수 있는 객체인지, MIME 타입을 통해 확인한다.

Content-type: image/jpeg
              ----- -> MIME 타입

1.3.2 URI

웹 서버 리소스는 각자 이름을 가지고 있다. 서버 리소스 이름은 통합 자원 식별자(uniform resource identifier), 혹은 URI로 불린다. URI에는 URL과 URN이 있다.

1.3.3 URL

통합 자원 지시자(unifonn resource locator, URL)는 리소스 식별자의 가장 흔한 형태다. URL은 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다. 오늘날 대부분의 URI는 URL이다.

http://www.naver.com/index.html
-----  ------------- ----------
scheme / 서버의 인터넷 주소 / 웹 서버의 리소스

1.3.4 URN

유니폼 리소스 이름(uniform resource name, URN). URN은 콘텐츠를 이루는 한 리소스에 대해, 그 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할을 한다. 리소스 이름이 변하지 않고 유지하는 한, 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제 없다. 아직 널리 채택되지 않았다.

1.4 트랜잭션

HTTP 트랜잭션은 요청 명령(클라이언트 -> 서버)과 응답 결과(서버 -> 클라이언트)로 구성되어 있다. 이 상호작용은 HTTP 메세지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다

1.4.1 메서드

GET - 서버에서 클라이언트로 지정한 리소스를 보내라
PUT - 클라이언트에서 서버로 보낸 데이터를 지정한 의름의 리소스로 저장하라
DELETE - 지정한 리소스를 서버에서 삭제하라
POST - 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라
HEAD - 지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 보내라

1.4.2 상태 코드

200 - OK
302 - 다시 보내라. 다른 곳에 가서 리소스를 가져가라
404 - NOT FOUND. 리소스를 찾을 수 없다
HTTP는 각 숫자 상태 코드에 텍스트로 된 사유 구절도 함께 보낸다.

1.4.3 웹페이지는 여러 객체로 이루어질 수 있다

애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.

1.5 메시지

HTTP 메시지는 단순한 줄 단위의 문자열이다. 일반 텍스트. 웹 클라이언트에서 웹 서버로 보낸 HTTP 메시지를 요청 메시지라고 부른다. 서버에서 클라이언트로 가는 메시지는 응답 메시지라고 부르낟. 그 외 다른 종류의 HTTP 메시지는 없다. HTTP 메시지는 세 부분으로 이루어진다.

  1. 시작줄 : 요청 - 무엇을 해야하는지 / 응답 - 무슨 일이 일어났는지
  2. 헤더 : 0개 이상의 헤더 필드. 쌍점(:)으로 구분되어 있는 하나의 이름과 하나의 값으로 구성된다. 헤더 필드를 추가하려면 한줄을 더하기만 하면 된다. 헤더는 빈 줄로 끝난다
  3. 본문 : 빈 줄 다음에는 어떤 종류의 데이터든 들어갈 수 있는 메시지 본문이 필요에 따라 올 수 있다. 요청 - 웹 서버로 데이터를 실어보냄 / 응답 - 클라이언트로 데이터를 반환. 본문은 임의의 이진 데이터를 포함할 수 있다. (이미지, 오디오, 비디오 등)

1.5.1 간단한 메시지의 예

응답 본문의 길이는 응답 헤더 Content-Length, 문서의 MIME 타입은 응답 헤더 Content-Type

1.6 TCP 커넥션

TCP(Transmission Control Protocol, 전송 제어 프로토콜)

1.6.1 TCP/IP

HTTP는 애플리케이션 계층 프로토콜이다. TCP와 IP가 층을 이루는, 패킷 교환 네트워크 프로토콜의 집합. HTTP는 네트워크 통신의 핵심적인 세부사항에 대해 신경쓰지 않고, 대신 대중적으로 신뢰성 있는 인터넷 전송 프로토콜인 TCP/IP에게 맡긴다

TCP

  • 오류 없는 데이터 전송
  • 순서에 맞는 전달(데이터는 언제나 보낸 순서대로 도착한다)
  • 조각나지 않는 데이터 스트림(언제든 어떤 크기로든 보낼 수 있다)

1.6.2 접속, IP 주소 그리고 포트번호

HTTP 클라이언트가 서버에 메시지를 전송할 수 있게 되기 전에, 인터넷 프로토콜(IP)주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다. TCP에서는 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행중인 프로그램이 사용중인 포트번호가 필요하다. HTTP 서버의 IP 주소와 포트번호를 어떻게 알아낼까? URL을 이용하면 된다. URL이란 리소스에 대한 주소이다.

1.7 프로토콜 버전

HTTP/1.1은 현재의 HTTP 버전이다

1.8

프락시

클라이언트와 서버 사이에 위치한 HTTP 중개자

캐시

많이 찾는 웹페이지를 클라이언트 가까이에 보관하는 HTTP ckdrh

게이트웨이

다른 애플리케이션과 연결된 특별한 웹 서버

터널

단순히 HTTP 통신을 전달하기만 하는 특별한 프락시

에이전트

자동화된 HTTP 요청을 만드는 준지능적 웹 클라이언트

1.8.1 프락시

웹 보안, 애플리케이션 통합, 성능 최적화를 위한 중요한 구성요소
클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다(대개 요청을 수정한 뒤에), 이 애플리케이션은 사용자를 위한 프락시로 동작하며 사용자를 대신해서 서버에 접근한다. 프락시는 주로 보안을 위해 사용한다. 또한 요청과 응답을 필터링한다

1.8.2 캐시

웹 캐시와 캐시 프락시는 자신을 거쳐 가는 문서들 중 자주 찾는 것의 사본을 저장해 두는, 특별한 종류의 HTTP 프락시 서버이다. 클라이언트가 같은 문서를 요청하면 그 캐시가 가지고 있는 사본을 받을 수 있다. HTTP는 캐시를 효율적으로 동작하게 하고 캐시된 콘텐츠를 최신 버전으로 유지하면서 동시에 프라이버시도 보호하기 위한 많은 기능을 정의한다

1.8.3 게이트웨이

게이트웨이는 다른 서버들의 중개자로 동작하는 특별한 서버다. 게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다. 게이트웨이는 항상 스스로가 리소스를 가지고 있는 진짜 서버인것 처럼 요청을 다루기 때문에 클라이언트는 자신이 게이트웨이와 통신하고 있음을 알지 못한다.

1.8.4 터널

터널은 두 커넥션 사이에서 raw 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션이다. HTTP 터널은 주로 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

1.8.5 에이전트

사용자 에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다. 웹 요청을 만드는 애플맄이션은 뭐든 HTTP 에이전트이다.

profile
백엔드 프로그래밍을 공부하고 있습니다. AWS, 클라우드 환경에 대해 관심이 많습니다.

0개의 댓글