그림으로 배우는 Http&Network Basic을 읽고 정리한 내용
인터넷과 관련된 프로토콜들을 모은 것을 TCP/IP라고 함. TCP와 IP 프로토콜을 가리켜 TCP/IP라고 부르기도 하지만, IP프로토콜을 사용한 통신에서 사용되고 있는 프로토콜을 총칭해서 TCP/IP라는 이름이 사용되고 있다.
tcp/ip는 응용계층, 전송, 네트워크, 데이터링크 계층으로 나뉨. 각 계층이 자신의 기능만 충실히 하도록 하여 독립성을 보장하기 위함. (계층을 나눔으로써 계층 중 하나의 사양이 변경되면 해당 계층만 변경하면 되고, 각 계층에서는 자신이 담당하는 부분을 고려하고 다른 계층들이 담당하고 있는 부분은 고려하지 않아도 된다는 장점이 있다.)
애플리케이션 계층
유저에게 제공되는 애플리케이션에서 사용하는 통신의 움직임을 결정한다. HTTP도 이 계층에 포함된다.
ex) FTP, DNS
전송계층
애플리케이션 계층에 네트워크로 접속되어 있는 2대의 컴퓨터 사이의 데이터 흐름을 제공한다. 이 계층에는 TCP, UDP 두가지 프로토콜이 있다.
네트워크
네트워크 상에서 패킷의 이동을 다룬다. (패킷이란 전송하는 데이터의 최소 단위)
ex) IP(Internet Protocol)
데이터링크 계층
네트워크에 접속하는 하드위어적인 면을 다룸. 인터넷 계층에서 형성된 패킷을 전기신호 또는 광신호로 바꾸어 전달하는 역할
TCP/IP 환경에서 데이터는 패킷 이라는 단위로 교환된다. 이 패킷을 교환하는 방식에 축적교환방식(Store and Forward)을 사용하는데 송수신 상호간에 직접적인 접속경로를 만들지 않고 통신 정보를 중간 노드(스위치, 라우터 등) 등의 기억 매체를 활영하여 경유하게 된다. 이에 따라 중계 루트가 처음부터 정해지지 않고 구간별로 중계 루트가 변하는 형태로 상대방에게 전송 된다.
이때 IP는 호스트 간의 통신만을 담당한다. 즉, 개개의 패킷을 상대방에게 전달하는 역할을 한다. 이때 IP 주소와 MAC(Media Access Control Address) 주소가 중요한 요소이다. (IP주소는 각 노드에 부여된 주소이고, MAC 주소는 각 네트워크 카드에 할당된 고유의 주소)
IP 통신은 MAC 주소에 의존해서 통신을 한다. 통신 중에 라우팅을 할 때, ARP(Address Resolution Protocol)를 사용해 다음으로 가야할 곳의 MAC 주소를 사용해 목적지를 찾아간다. ARP는 네트워크 상에서 IP 주소를 물리적 네트워크 주소 즉 MAC주소와 매칭시키기 위해 사용되는 프로토콜이다.
택배로 비유하자면 내용물의 상태나 그 주소에 수취인이 있는지 등은 고려하지 않고 일단은 배송 요청이 오면 내용물을 받기로 되어있는 주소로 보내는 것과 같다.
즉, IP는 신뢰성과 연결성 두가지 다 보장하지 않음.(비 신뢰성, 비연결성) 이는 TCP에서 보장..
신뢰성 있는 바이트 스트림 서비스를 제공한다. 바이트 스트림 서비스란 용량이 큰 데이터를 보내기 쉽게 TCP 세그먼트라고 불리는 단위 패킷으로 작게 분해하여 관리하는 것을 말한다.
Three way handshaking 을 사용하여 연결성을 보장한다. 즉, 패킷이 수신지까지 제대로 전송되는지 확인하는 과정. 여기에서는 'SYN' 와 'ACK' 라는 TCP 플래그를 사용한다. TCP는 이 외에도 통신의 신뢰성을 보증하기 위해 다양한 시스템을 갖추고 있다.
3-way handshake 는 TCP 연결을 성립(establish)할때 사용한다면, 4-way handshake 는 세션을 종료하기 위해 수행되는 절차.
이때, 서버에서 FIN을 전송하기 전에 보낸 패킷이 라우팅 지연이나 패킷 유실로 인한 재전송 등으로 인해 FIN 패킷보다 늦게 도착하는 상황이 발생한다면, 이 패킷은 Drop 되고 데이터는 유실될 수 있다. 이러한 현상을 대비해 클라이언트는 서버로부터 FIN을 수신하더라도 일정시간(디폴트 240초) 동안 세션을 남겨놓고 잉여 패킷을 기다리는 과정을 거치게 되는데 이 과정을 'TIME_WAIT'이라고 한다. 일정 시간이 지나면, 세션을 만료하고 연결을 종료시키며 'CLOSE' 상태가 된다.
IP주소와 도메인 이름을 매칭하는 시스템
인터넷상에서 데이터를 주고받기 위한 서버/클라이언트 모델을 따르는 통신 프로토콜이다. 응용 계층의 전송 프로토콜로 TCP/IP위에서 작동한다. 80번 포트를 사용하고 있음.
클라이언트에서 요청(request)를 보내면 서버는 요청을 처리해서 응답(response) 한다.
클라이언트는 URI를 이용해서 서버에 접속하고, 데이터를 요청할 수 있다.
http는 어떤 종류의 데이터든지 전송할 수 있도록 설계되어 있다. (http로 보낼 수 있는 데이터는 html문서, 이미지, 동영상, 오디오, 텍스트 문서 등 여러 종류가 있다. )
http는 Connectionless 방식으로 작동한다. => stateless
서버에 연결하고, 요청해서 응답을 받으면 연결을 끊어버린다.
기본적으로 자원 하나에 대해서 하나의 연결을 만든다.
장점: 불특정 다수를 대상으로 하는 서비스에 적합한 방식이다. 수십만명이 웹서비스를 사용하더라도 접속유지는 최소한으로 할 수 있기 때문에, 더 많은 유저의 요청을 처리할 수 있다.
단점: 연결을 끊어버리기 때문에, 클라이언트의 이전 상태를 알 수가 없다. 이러한 http의 특징을 stateless라고 하는데, connectionless로부터 파생되는 특징이라고 할 수 있다. 이로 인한 문제의 예로, 클라이언트가 과거에 로그인을 성공하더라도 로그 정보를 유지할 수가 없다.
HTTP는 cookie를 이용해서 이 문제를 해결하고 있다.
로그인을 예로 들자면, 클라이언트가 로그인에 성공하면,
서버는 로그인 정보를 자신의 데이터베이스에 저장하고 동일한 값을 cookie형태로 클라이언트에 보낸다.
첫 요청 시 :
클라이언트 로그인 성공 then 서버 로그인정보를 자신의 DB에 저장
(서버는 cookie를 키로하는 값을 데이터베이스에 저장하는 방식으로 "세션"을 유지한다)
and then return 쿠키 to 클라이언트
클라이언트는 다음 번 요청때 cookie를 서버에 보내는데,
서버는 cookie 값으로 자신의 데이터베이스를 조회해서 로그인 여부를 확인할 수 있다.
두번쨰 요청 시 :
클라이언트 request(cookie) to server then 서버는 자신의 DB 조회 and then 로그인여부 확인
HTTP 통신을 하는 소켓 부분을 SSL 이나 TLS 이라는 프로토콜로 대체한 것.
보통 HTTP는 직접 TCP와 통신하지만 SSL을 사용한 경우에는 HTTP는 SSL과 통신하고 SSL이 TCP와 통신하게 된다. SSL을 사용함으로써 HTTP는 HTTPS로서 암호화와 인증, 완전성 보호를 이용할 수 있게 된다. 즉, HTTPS는 HTTP에 데이터 암호화가 추가된 프로토콜로, 공개키 암호화를 사용한다.
공통키(대칭키) 암호
암호화와 복호화에 하나의 키를 같이 사용하는 방식. 이 방식은 상대방에게 키를 넘겨주지 않으면 안되는데, 네트워크를 사용해서 키를 넘겨줄 때 키를 빼앗기게 되면 암호화의 의미가 없게 되어 버린다.
공개키 암호
공개키 암호에는 서로 다른 두개의 키 페어(쌍)을 사용한다.
공개키와 개인키로 암호화하면 다음과 같은 효과를 얻을 수 있다.
HTTPS는 공통키 암호화 공개키 암호를 모두 사용하는 하이브리드 암호 시스템이다. 공개키 암호는 처리 속도가 늦기 때문에, 공통키를 교환하는 과정에서 공개키 암호를 사용하고, 그 후의 통신에서 메시지를 교환하는 과정에는 공통키 암호를 사용한다.
공개키가 정확한지 증명하는 증명서
공개키가 진짜 서버의 공개키인지, 도중에 공격자가 바꿔치기한 공개키인지 증명하기 위해 인증된 기관(Certificate Authority)과 그 기관이 발행하는 공개키 증명서가 이용되고 있다. (인증된 기관이란 클라이언트와 서버가 모두 신뢰하는 제 3자 기관) 그 과정은 다음과 같다.
A 기업은 HTTP 기반의 애플리케이션에 HTTPS를 적용하기 위해 공개키/개인키를 발급함
CA 기업에게 돈을 지불하고, 공개키를 저장하는 인증서의 발급을 요청함.
CA 기업은 CA기업의 이름, 서버의 공개키, 서버의 정보 등을 기반으로 인증서를 생성하고, CA 기업의 개인키로 암호화하여 A기업에게 이를 제공함
A기업은 클라이언트에게 암호화된 인증서를 제공함
클라이언트(브라우저)는 CA기업의 공개키를 미리 다운받아 갖고 있어, 암호화된 인증서를 복호화함(많은 브라우저는 주요 인증기관의 공개키를 사전에 내장한 상태)
암호화된 인증서를 복호화하여 얻은 A기업의 공개키로 데이터를 암호화하여 요청을 전송함
호환된 인증서는 CA의 개인키로 암호화되었기 때문에 신뢰성을 확보할 수 있고, 클라이언트는 A 기업의 공개키로 데이터를 암호화하였기 때문에 A기업만 복호화하여 데이터를 얻을 수 있다.
HTTP 프로토콜은 비상태성이 있어, 사용자의 요청마다 새로운 사용자로 인식하는 단점이 있음. 이를 보완하기 위함.
쿠키: 클라이언트(브라우저)에 저장. 변질되거나 스나이핑 당할 우려가 있어 보안에 취약. 비교적 빠름. 자동 로그인, 오늘 더 이상 이 창을 보지 않음, 장바구니에 사용
세션: 서버에 저장. 쿠키를 이용하여 session id만 저장하기 때문에 비교적 보안성이 높음. 비교적 느린 속도. 로그인 정보 유지에 사용.
쿠키:
세션:
둘 다 자원을 수정하는 용도
서버에서 보내는 응답(Response) 정보. 다음은 주요 상태 코드들
200번대의 상태 코드는 대부분 성공을 의미
300번대의 상태 코드는 요청을 완료하기 위해서 추가 동작이 필요한 경우입니다. 이는 대부분 클라이언트가 이전 주소로 데이터를 요청하여 서버에서 새 URL로 리다이렉트를 유도하는 경우입니다.
400번대 상태 코드는 대부분 클라이언트의 코드가 잘못된 경우입니다. 유효하지 않은 자원을 요청했거나 요청이나 권한이 잘못된 경우 발생합니다.
500번대 상태 코드는 서버 쪽에서 오류가 난 경우입니다.