[HTTP] 1.웹의 기초

Beani._.i·2023년 1월 13일
2

네트워크

목록 보기
1/2
post-thumbnail

전 세계 웹브라우저, 서버, 웹 애플리케이션은 모두 HTTP(Hypertext Transfer Protocol)를 통해 대화한다.

1.1 HTTP: 인터넷의 멀티미디어 배달부

HTTP는 전세계의 웹 서버로부터 많은 정보를 빠르고, 간편하고 정확하게 사람들의 PC에 설치된 웹브라우저로 옮겨준다.

1.2 웹 클라이언트와 서버

웹 콘텐츠는 웹 서버에 존재한다.

웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불린다.

이들 웹 서버는 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다.

HTTP 클라이언트와 HTTP 서버는 월드 와이드 웹의 기본 요소다.

1.3 리소스

웹 서버는 웹 리소스를 관리하고 제공한다.

웹 리소스는 웹 콘텐츠의 원천이다.

가장 단순한 웹 리소스는 웹 서버파일 시스템의 정적 파일이다.

  • 텍스트 파일
  • HTML 파일
  • 마이크로소프트 파일
  • 어도비 아크로뱃 파일
  • JPEG 이미지
  • 그 외 모든 종류의 파일을 포함한다.

리소스는 반드시 정적 파일이어야 할 필요는 없다. 리소스는 요청에 따라 콘텐츠를 생산하는 프로그램이 될 수 도 있다.

이들 동적 콘텐츠 리소스는 사용자가 누구인지, 어떤 정보를 요청했는지에 따라 다른 콘텐츠를 생성한다.

어떤 종류의 콘텐츠 소스도 리소스가 될수 있다.

Ex) 인터넷 검색엔진 , 지역 공공 도서관의 서가를 탐색하는 웹 게이트웨이

1.3.1 미디어 타입

MIME(Multipurpose Internet Mail Extension, 다목적 인터넷 메일 확장)
HTTP는 웹에서 전송되는 객체 각각에 MIME타입이라는 데이터 포맷 라벨을 붙인다.

MIME은 이메일에서 워낙 잘 동작했기 때문에, HTTP에서도 멀티미디어 콘텐츠를 기술하고 라벨을 붙이기 위해 채택되었다.

웹서버는 모든 HTTP 객체 데이터에 MIME타입을 붙인다.

웹브라우저는 서버로부터 객체를 돌려받을 때, 다룰수 있는 객체인지 MIME 타입을 통해 확인한다.

Content-type: image/jpeg
Content-length: 12984

MIME 타입은 사선( / )으로 구분된 주 타입과 부 타입으로 이루어진 문자열 라벨이다.

HTML 텍스트 문서text/html
plain ASCII 텍스트 문서text/plain
JPEG 이미지image/jped
GIF 이미지image/gif
애플 퀵타임 동영상video/qicktime
마이크로소프트 파워포인트application/vnd.ms-powerpoint

1.3.2 URI

웹 서버 리소스는 각자 이름을 갖고 있기 때문에, 클라이언트는 관심 있는 리소스를 지목할 수 있다.

서버 리소스 이름을 통합 자원 식별자(uniform resource identifier), URI로 불린다.

URI는 인터넷의 우편물 주소 같은 것으로, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.

1-http://2-www.joes-hardware.com3-/specials/saw-blade.gif

  1. HTTP 프로토콜을 사용해라
  2. www.joes-hardware.com으로 이동하라
  3. /specials/saw-blade.gif라고 불리우는 리소스를 가져와라

1.3.3 URL

URL: 통합 자원 지시자 (Uniform Resource Locator)

특정 서버의 리소스에 대한 구체적 위치 설명

오늘날 대부분 URI == URL

표현 형식 : 스킴(HTTP 프로토콜) + 서버의 인터넷 주소 + 웹 서버의 리소스

1.3.4 URN

URN: 유니폼 리소스 이름 (Uniform Resource Name)

리소스의 위치에 영향을 받지 않는 유일무이한 이름 역활

1.4 트랜잭션

HTTP 트랜잭션은 요청명령과 응답 결과로 구성되어 있다.

이 상호작용은 HTTP메시지를 통해 이루어진다.

1.4.1 메서드

모든 HTTP요처 메시지는 한 개의 메서드만 갖는다.

서버에서 어떤 동작이 취해져야 하는지 말해준다. (웹페이지 가져오기, 게이트웨이 프로그램 실행하기 등)

HTTP 메서드설명
GET서버에서 클라이언트로 지정한 리소스를 보내라
PUT클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라
DELETE지정한 리소스를 서버에서 삭제하라
POST클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라
HEAD지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 보내라

1.4.2 상태 코드

모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다.

클라이언트의 요청의 성공 여부 등을 알려주는 세가지 숫자다.

HTTP 상태코드설명
200성공, 문서가 바르게 반환됨
302다시 보내라, 다른곳에 가서 리소스를 가져와라
404리소스를 찾을 수 없음

1.4.3 웹페이지는 여러 객체로 이루어질 수 있다.

애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.

‘웹 페이지’는 보통 하나의 리소스가 아닌 리소스의 모음이다.

1.5 메시지

HTTP 메시지는 단순한 줄 단위의 문자열이다.

종류: 요청 메시지(클라이언트 → 서버), 응답 메시지(서버 → 클라이언트)

시작줄

  • 요청 및 응답에 대한 내용
  • 임의의 이진데이터 포함 불가

헤더

  • 0개 이상의 헤더 필드로 구성
  • 쌍점(:)으로 구분되어 있는 하나의 이름과 하나의 값으로 구성된다.
  • 헤더는 빈 줄로 끝난다
  • 임의의 이진데이터 포함 불가

본문

  • 어떤 종류의 데이터든 들어갈 수 있는 메시지 본문
  • 요청 본문: 웹 서버로 데이터를 실어보냄, 본문이 없을수 있음
  • 응답 본문: 클라이언트로 데이터 반환
  • 임의의 이진 데이터 포함 가능(이미지, 비디오, 오디오, 텍스트 등)

1.5.1 간단한 메시지의 예

content-type 헤더에 문서의 MIME 타입이 적혀있다.

1.6 TCP 커넥션

HTTP 메시지가 TCP 커넥션을 통해 한곳에서 다른 곳으로 옮겨가는지 알아보자

1.6.1 TCP/IP

TCP (Transmission Control Protocol, 전송 제어 프로토콜)

역활

  • 오류 없는 데이터 전송
  • 순서에 맞게 전달(언제나 보낸 순서대로 도착)
  • 조각나지 않는 데이터 스트림(언제나 어떤 크기로든 전송 가능)

TCP/IP

패킷 교환 네트워크 프로토콜의 집합니다.

각 네트워크와 하드웨어의 특성을 숨기고, 어떤 종류의 컴퓨터나 네트워크든 서로 신뢰성 있는 의사소통을 하게 한다.

일단 TCP 커넥션이 맺어지면, 클라이언트와 서버 컴퓨터 간에 교환되는 메시지가 없어지거나, 손상되거나, 순서가 뒤바뀌어 수신되는 일은 결코 없다.

1.6.2 접속, IP 주소 그리고 포트번호

HTTP 메시지를 전송하려면 인터넷 프로토콜(Internet protocol, IP) 주소포트번호를 사용해 클라이언트와 서버 사이에 TCP/OP 커넥션을 맺어야 한다.

HTTP서버의 IP주소와 포트번호를 어떻게 알아낼 수 있을까? URL을 이용하면 된다.

http://207.200.83.29:80/index.html
http://www.naver.com:80/index.html
http://www.naver.com/index.html

  • 기본적으로 IP 주소는 숫자로 구성되어 있으나, IP 주소의 별명과도 같은 도메인 이름, 호스트명으로 표현되어 있어도 도메인 이름 서비스(Domain Name Service, DNS)라 불리는 장치를 통해 쉽게 IP 주소로 다시 변환이 가능하다.
  • 포트번호가 주소에 보이지 않는다면 기본 80라고 생각하면 된다.
  • 클라이언트 - 서버 사이의 통신 순서
    1. 웹브라우저는 서버의 URL에서 호스트 명을 추출
    2. 서버의 호스트 명을 IP로 변환 및 포트번호 추출
    3. 웹 서버와 TCP 커넥션 맺음
    4. 서버에 HTTP 요청을 보냄
    5. 서버는 웹브라우저에 HTTP 응답을 돌려줌
    6. 커넥션이 닫히면 웹브라우저는 문서(응답)를 보여줌

1.7 프로토콜 버전

HTTP/1.0 - 처음으로 널리 쓰이기 시작한 HTTP 버전

HTTP/1.1 - HTTP 설계의 구조적 결함 교정, 성능 최적화, 잘못된 기능 제거에 집중한 현재의 HTTP 버전

1.8 웹의 구성 요소

프락시,프록시

HTTP 중개자

웹 보안, 애플리케이션 통합, 성능 최적화를 위한 중요한 구성요소이다.

프락시는 클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다.

이 애플리케이션은 사용자를 위한 프락시로 동작하며 사용자를 대신해서 서버에 접근한다.

프락시는 주로 보안을 위해 사용된다.

프락시는 요청과 응답을 필터링 한다.

EX) 다운로드 받을때 애플리케이션 바이러스 검출, 초등학교 성인 콘텐츠 차단

캐시

많이 찾는 웹페이지를 클라이언트 가까이에 보관하는 HTTP 창고

게이트웨이

다른 애플리케이션과 연결된 특별한 웹 서버

주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다.

터널

HTTP 통신을 전달하는 특별한 프록시

EX

암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시키는 것

에이전트

자동화된 HTTP 요청을 만드는 준지능적 웹 클라이언트

EX

스파이더- 웹을 돌아다니며 검색엔진의 데이터베이스로 유용한 웹콘텐츠 보관소를 만든다.

웹로봇

profile
어제보다 하나라도 더 알았으면 괜찮다!!!

0개의 댓글