전 세계 웹브라우저, 서버, 웹 애플리케이션은 모두 HTTP(Hypertext Transfer Protocol)를 통해 대화한다.
HTTP는 전세계의 웹 서버로부터 많은 정보를 빠르고, 간편하고 정확하게 사람들의 PC에 설치된 웹브라우저로 옮겨준다.
웹 콘텐츠는 웹 서버에 존재한다.
웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불린다.
이들 웹 서버는 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다.
HTTP 클라이언트와 HTTP 서버는 월드 와이드 웹의 기본 요소다.
웹 서버는 웹 리소스를 관리하고 제공한다.
웹 리소스는 웹 콘텐츠의 원천이다.
가장 단순한 웹 리소스는 웹 서버파일 시스템의 정적 파일이다.
리소스는 반드시 정적 파일이어야 할 필요는 없다. 리소스는 요청에 따라 콘텐츠를 생산하는 프로그램이 될 수 도 있다.
이들 동적 콘텐츠 리소스는 사용자가 누구인지, 어떤 정보를 요청했는지에 따라 다른 콘텐츠를 생성한다.
어떤 종류의 콘텐츠 소스도 리소스가 될수 있다.
Ex) 인터넷 검색엔진 , 지역 공공 도서관의 서가를 탐색하는 웹 게이트웨이
MIME(Multipurpose Internet Mail Extension, 다목적 인터넷 메일 확장)
HTTP는 웹에서 전송되는 객체 각각에 MIME타입이라는 데이터 포맷 라벨을 붙인다.
MIME은 이메일에서 워낙 잘 동작했기 때문에, HTTP에서도 멀티미디어 콘텐츠를 기술하고 라벨을 붙이기 위해 채택되었다.
웹서버는 모든 HTTP 객체 데이터에 MIME타입을 붙인다.
웹브라우저는 서버로부터 객체를 돌려받을 때, 다룰수 있는 객체인지 MIME 타입을 통해 확인한다.
Content-type: image/jpeg
Content-length: 12984
MIME 타입은 사선( / )으로 구분된 주 타입과 부 타입으로 이루어진 문자열 라벨이다.
HTML 텍스트 문서 | text/html |
---|---|
plain ASCII 텍스트 문서 | text/plain |
JPEG 이미지 | image/jped |
GIF 이미지 | image/gif |
애플 퀵타임 동영상 | video/qicktime |
마이크로소프트 파워포인트 | application/vnd.ms-powerpoint |
웹 서버 리소스는 각자 이름을 갖고 있기 때문에, 클라이언트는 관심 있는 리소스를 지목할 수 있다.
서버 리소스 이름을 통합 자원 식별자(uniform resource identifier), URI로 불린다.
URI는 인터넷의 우편물 주소 같은 것으로, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.
URL: 통합 자원 지시자 (Uniform Resource Locator)
특정 서버의 리소스에 대한 구체적 위치 설명
오늘날 대부분 URI == URL
표현 형식 : 스킴(HTTP 프로토콜) + 서버의 인터넷 주소 + 웹 서버의 리소스
URN: 유니폼 리소스 이름 (Uniform Resource Name)
리소스의 위치에 영향을 받지 않는 유일무이한 이름 역활
HTTP 트랜잭션은 요청명령과 응답 결과로 구성되어 있다.
이 상호작용은 HTTP메시지를 통해 이루어진다.
모든 HTTP요처 메시지는 한 개의 메서드만 갖는다.
서버에서 어떤 동작이 취해져야 하는지 말해준다. (웹페이지 가져오기, 게이트웨이 프로그램 실행하기 등)
HTTP 메서드 | 설명 |
---|---|
GET | 서버에서 클라이언트로 지정한 리소스를 보내라 |
PUT | 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라 |
DELETE | 지정한 리소스를 서버에서 삭제하라 |
POST | 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라 |
HEAD | 지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 보내라 |
모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다.
클라이언트의 요청의 성공 여부 등을 알려주는 세가지 숫자다.
HTTP 상태코드 | 설명 |
---|---|
200 | 성공, 문서가 바르게 반환됨 |
302 | 다시 보내라, 다른곳에 가서 리소스를 가져와라 |
404 | 리소스를 찾을 수 없음 |
애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.
‘웹 페이지’는 보통 하나의 리소스가 아닌 리소스의 모음이다.
HTTP 메시지는 단순한 줄 단위의 문자열이다.
종류: 요청 메시지(클라이언트 → 서버), 응답 메시지(서버 → 클라이언트)
시작줄
헤더
본문
content-type 헤더에 문서의 MIME 타입이 적혀있다.
HTTP 메시지가 TCP 커넥션을 통해 한곳에서 다른 곳으로 옮겨가는지 알아보자
TCP (Transmission Control Protocol, 전송 제어 프로토콜)
역활
TCP/IP
패킷 교환 네트워크 프로토콜의 집합니다.
각 네트워크와 하드웨어의 특성을 숨기고, 어떤 종류의 컴퓨터나 네트워크든 서로 신뢰성 있는 의사소통을 하게 한다.
일단 TCP 커넥션이 맺어지면, 클라이언트와 서버 컴퓨터 간에 교환되는 메시지가 없어지거나, 손상되거나, 순서가 뒤바뀌어 수신되는 일은 결코 없다.
HTTP 메시지를 전송하려면 인터넷 프로토콜(Internet protocol, IP) 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/OP 커넥션을 맺어야 한다.
HTTP서버의 IP주소와 포트번호를 어떻게 알아낼 수 있을까? URL을 이용하면 된다.
http://207.200.83.29:80/index.html
http://www.naver.com:80/index.html
http://www.naver.com/index.html
HTTP/1.0 - 처음으로 널리 쓰이기 시작한 HTTP 버전
HTTP/1.1 - HTTP 설계의 구조적 결함 교정, 성능 최적화, 잘못된 기능 제거에 집중한 현재의 HTTP 버전
HTTP 중개자
웹 보안, 애플리케이션 통합, 성능 최적화를 위한 중요한 구성요소이다.
프락시는 클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다.
이 애플리케이션은 사용자를 위한 프락시로 동작하며 사용자를 대신해서 서버에 접근한다.
프락시는 주로 보안을 위해 사용된다.
프락시는 요청과 응답을 필터링 한다.
EX) 다운로드 받을때 애플리케이션 바이러스 검출, 초등학교 성인 콘텐츠 차단
많이 찾는 웹페이지를 클라이언트 가까이에 보관하는 HTTP 창고
다른 애플리케이션과 연결된 특별한 웹 서버
주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다.
HTTP 통신을 전달하는 특별한 프록시
EX
암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시키는 것
자동화된 HTTP 요청을 만드는 준지능적 웹 클라이언트
EX
스파이더- 웹을 돌아다니며 검색엔진의 데이터베이스로 유용한 웹콘텐츠 보관소를 만든다.
웹로봇