[HTTP 완벽가이드] 1장 HTTP 개관

:D ·2023년 4월 24일
0

HTTP 완벽가이드

목록 보기
1/2
post-thumbnail

요새 컴퓨터 네트워크에 대해 HTTP, TCP 쪽을 공부하다가 더 깊게 공부해보고 싶다는 생각이들어서 조금씩 읽고 작성해보려고 한다앗.

1.1 HTTP: 인터넷의 멀티미디어 배달부

HTTP는 전 세계의 웹 서버로부터 대량의 정보들을 빠르고, 간편하고, 정확하게 사람들의 웹 브라우저로 옮겨준다.
HTTP는 신뢰성 있는 데이터 전송 프로토콜을 사용하기 때문에, 전송중 손상이되거나 꼬이지 않음을 보장한다.

1.2 웹 클라이언트와 서버

아래의 그림대로, 클라이언트는 서버에게 HTTP 요청을 보내고 서버는 요청된 데이터를 HTTP 응답으로 돌려준다.
여기서, 클라이언트는 익스플로러나 크롬 같은 웹브라우저이고, 웹브라우저는 서버에게 HTTP 객체를 요청하고 사용자의 화면에 보여준다.

1.3 리소스

웹 서버는 웹 리소스를 관리하고 제공한다. 가장 흔한 웹 리소스는 텍스트 파일, HTML 파일, 이미지 파일등 정적파일 이다. 그러나 리소스는 반드시 정적 파일일 필요는 없고, 리소스는 요청에 따라 콘텐츠를 생산하는 프로그램이 될 수도 있다. 동적 콘텐츠 리소스들은 사용자가 누구인지, 어떤 정보를 요청했는지에 따라 다른 콘텐츠를 생성한다.
즉, 어떤 종류의 콘텐츠 소스도 리소스가 될 수 있다.

1.3.1 미디어 타입

인터넷은 수천 가지 데이터 타입을 다루기 때문에, 웹 서버는 모든 HTTP 객체 데이터에 MIME 타입을 붙인다.
MIME 타입의 예를들면 다음과 같다.

  • HTML로 작성된 텍스트 문서는 text/html 라벨이 붙는다.
  • JPEG 이미지는 image/plain 라벨이 붙는다.

1.3.2 URI

웹 서버 리소스는 이름을 갖고 있는데, 서버 리소스 이름은 URI라 불린다. URI는 인터넷의 우편물 주소 같은 것으로, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.
URI에는 URL과 URN이라는 것이 있다.

🐿️ URL

URL은 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다.
URL은 세 부분으로 이루어진 표준 포맷을 따른다.
1. 첫 번째 부분은 스킴이라 부르고, 리소스에 접근하기 위해 사용되는 프로토콜을 서술한다. 예) http://
2. 두 번째 부분은 서버의 인터넷 주소를 제공한다. 예) www.naver.com
3. 세 번째 부분은 웹 서버의 리소스를 가리킨다. 예) /books/http.gif

오늘날 대부분의 URI는 URL이다.

🐿️ URN

URN은 리소스의 위치에 영향을 받지 않는 유일무이한 이름 역할을 한다. URN은 리소스를 여기저기로 옮기더라도 문제없이 동작한다. 리솟가 그 이름을 변하지 않게 유지하는 한, 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제없다.
URN은 실험 중이고, 아직 널리 채택되지 않았다.

정리해보면 URL은 리소스에 대한 위치를 서술한 URI이고, URN은 위치에 영향을 받지 않는 이름 역할을 하는 URI이다.

1.4 트랜잭션

클라이언트가 웹 서버와 리소스를 주고받기 위해 HTTP를 어떻게 사용하는지 더 자세히 알아보면, HTTP 요청과 응답을 할 때 HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다.

1.4.1 메서드

HTTP는 HTTP 메서드라고 불리는 여러가지 종류의 요청 명령을 지원한다.
모든 HTTP 요청 메시지는 한 개의 메서드를 갖는다. 메서드는 서버에게 어떤 동작이 취해져야 하는지 말해준다.

  • GET : 서버에서 클라이언트로 지정한 리소스를 전송
  • PUT : 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장
  • DELETE : 지정한 리소스를 서버에서 삭제
  • POST : 클라이언트 데이터를 서버 케이트웨이 애플리케이션으로 전송
  • HEAD : 지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 전송

1.4.2 상태 코드

모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다. 상태 코드는 클라이언트에게 요청이 성공했는지 아니면 추가 조치가 필요한지 알려주는 세 자리 숫자이다.

1.4.3 웹페이지는 여러 객체로 이루어질 수 있다

웹페이지는 보통 하나의 리소스가 아닌 리소스의 모음이다. HTML를 가져오는 트랜잭션을 수행한 후, 첨부된 이미지나 그래픽 조각들을 가져오기 위해 추가로 HTTP 트랜잭션들을 수행한다.

1.5 메시지

HTTP 메시지는 단순한 줄 단위 문자열이다. 이진 형식이 아닌 일반 텍스트이기 때문에 사람이 읽고 쓰기 쉽다. 웹 클라이언트에서 웹 서버로 보낸 HTTP 메시지를 요청 메시지라 부르고, 서버에서 클라이언트로 가는 메시지를 응답 메시지라 부른다.

HTTP 메시지는 다음의 세 부분으로 이루어진다.

요청 메시지 예시

시작줄 GET : /test/hello.txt HTTP 1.1
헤더 Accept: text/*
    Accpt-Language: en, fr
응답 메시지 예시

시작줄 HTTP/1.0 200 OK
헤더 Content-type: text/plain
    Content-length: 19
본문 Hi! Zzi~
  • 시작 : 요청이라면 무엇을 해야하는지, 응답이라면 무슨일이 일어났는지 나타냄
  • 헤더 : 0개 이상의 헤더 필드로 구성, 각 헤더 필드는 쌍점(:)으로 구분되어 있는 하나의 이름과 하나의 값으로 구성
  • 본문 : 요청의 본문은 웹 서버로 데이터를 실어보내며, 응답의 본문은 클라이언트로 데이터를 반환한다. 본문은 이진 데이터를 포함할 수 있다.

1.6 TCP 커넥션

1.6.1 TCP/IP

HTTP는 애플리케이션 계층 프로토콜이다. HTTP는 네트워크 통신의 핵심적인 세부사항에 대해 신경쓰지않고, 신뢰성있는 인터넷 전송 프로토콜인 TCP/IP에게 맡긴다.

TCP는 오류 없는 데이터 전송, 순서에 맞는 전달, 조각나지 않는 데이터 스트림을 제공한다.
일단 TCP 커넥션이 이루어지면 클라이언트와 서버 컴퓨터 간에 교환되는 메시지가 없어지거나, 손상되거나, 순서가 뒤바꾸어 수신되는 일은 없다.

1.6.2 접속, IP 주소 그리고 포트번호

HTTP 클라이언트가 서버에 메시지를 전송할 수 있게 되기 전에, 인터넷 프로토콜 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야한다.
TCP 커넥션을 하려면 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행중인 프로그램이 사용중인 포트번호가 필요하다.

URL이 숫자로 된 IP 주소가 없다면 DNS에서 IP 주소로 변환하고, 포트 번호가 없다면 기본값 80이라고 가정하면 된다.

IP 주소와 포트번호를 이용해 클라이언트는 TCP/IP로 쉽게 통신할 수 있다.
(1) 웹브라우저는 서버의 URL에서 호스트명을 추출한다.
(2) 웹브라우저는 서버의 호스트 명을 IP로 변환한다.
(3) 웹브라우저는 URL에서 포트번호를 추출한다.
(4) 웹브라우저는 웹 서버와 TCP 커넥션을 맺는다.
(5) 웹브라우저는 서버에 HTTP 요청을 보낸다.
(6) 서버는 웹브라우저에 HTTP 응답을 돌려준다.
(7) 커넥션이 닫히면, 웹 브라우저는 문서를 보여준다.

1.7 프로토콜 버전

HTTP/0.9
GET 메서드만 지원, 멀티미디어 콘텐츠에 대한 MIME 타입이나, HTTP 헤더, 버전 번호를 지원하지 않는다.

HTTP/1.0
HTTP/1.0에서는 버전 번호, HTTP 헤더, 추가 메서드, 멀티미디어 객체 처리를 추가했다.

HTTP/1.0+
keep-alive 커넥션, 가상 호스팅 지원, 프락시 연결 지원이 추가되었다.

HTTP/1.1
HTTP 설계의 구조적 결함 교정, 두드러진 성능 최적화, 잘못된 기능 제거에 집중했다.

HTTP/2.0
HTTP 1.1 성능 문제를 개선하기 위해 ... 자세한 것은 10장

1.8 웹의 구성요소

1.8.1 프락시

프락시는 클라이언트와 서버 사이에 위치하며, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다. 프록시는 주로 보안을 위해 사용된다. 예를 들면, 애플리케이션 바이러스를 검출하거나 초등학생들에게서 성인 콘텐츠를 차단한다.

1.8.2 캐시

웹캐시와 캐시 프록시는 자신을 거쳐가는 문서들 중 자주 찾는 것의 사본을 저장해두는 프락시 서버이다. 클라이언트는 멀리 떨어진 웹 서버보다는 근처의 캐시에서 훨씬 더 빨리 문서를 다운 받을 수 있다.

1.8.3 게이트웨이

게이트웨이는 다른 서버들의 중개자로 동작하는 특별한 서버이다. 게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다.

1.8.4 터널

터널은 두 커넥션 사이에서 raw 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션이다. 예를 들면, 암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시키는 것이 있다.

1.8.5 에이전트

에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다.

profile
강지영입니...🐿️

0개의 댓글