'인터넷 프로토콜 스위트(internet protocol suite)'는 인터넷에서 컴퓨터들이 서로 정보를 주고받는 데 쓰이는 프로토콜의 집합이다. 그리고 이를 'TCP/IP 4계층 모델'로 설명하거나 'OSI 7계층 모델'로 설명하기도 한다.
TCP/IP 4계층 모델은 네트워크에서 사용되는 통신 프로토콜의 집합으로, 계층들은 프로토콜의 네트워킹 범위에 따라 네 개의 추상화 계층으로 구성된다.
계층구조
TCP/IP 계층은 4개의 계층을 가지고 있고, OSI 7계층과 비교를 많이 하곤 한다.
TCP/IP 계층
1) 애플리케이션 계층
2) 전송 계층
3) 인터넷 계층
4) 링크 계층
OSI 7계층
1) 애플리케이션 계층
2) 프레젠테이션 계층
3) 세션 계층
4) 전송 계층
5) 네트워크 계층
6) 데이터 링크 계층
7) 물리 계층
OSI계층은 애플리케이션 계층을 3개로 쪼개고, 링크 계층을 데이터 링크 계층, 물리 계층으로 나눠서 표현하고, 인터넷 계층을 네트워크 계층으로 부르는게 다르다.
위 계층들은 '특정 계층이 변경되었을 때, 다른 계층이 영향을 바디 않도록 설계' 된다.
만약, 전송 계층에서 TCP를 UDP로 변경했다고 해서 인터넷 웹 브라우저를 다시 설치하지 않아도 되듯, 유연하게 설계되었다.
각 계층을 대표하는 스택은 아래와 같다.
애플리케이션(application) 계층은 FTP, HTTP, SSH, SMTP, DNS 등 응용 프로그램이 사용되는 프로토콜 계층이며, 웹 서비스, 이메일 등 서비스를 실질적으로 사람들에게 제공하는 층이다.
FTP
: 장치와 장치 간의 파일을 전송하는 데 사용되는 표준 통신 프로토콜
SSH
: 보안되지 않은 네트워크에서 네트워크 서비스를 안전하게 운영하기 위한 암호화 네트워크 프로토콜
HTTP
: World Wide Web을 위한 데이터 통신의 기초이자 웹 사이트를 이용하는 데 쓰는 프로토콜
SMTP
: 전자 메일 전송을 위한 인터넷 표준 통신 프로토콜
DNS
: 도메인 이름과 IP 주소를 매핑해주는 서버
-> 예를들어 www.velog.com에 DNS 쿼리가 오면 [Root DNS] -> [.com DNS] -> [.velog DNS] -> [.www DNS] 과정을 거쳐 오나벽한 주소를 찾아 IP주소를 매핑하기에 IP 주소가 바뀌어도 사용자들에게 똑같은 도메인 주소로 서비스할 수 있게 된다.
'전송(transprot)계층'은 송신자와 수신자를 연결하는 통신 서비스를 제공하며, 연결 지향 데이터 스트림 지원, 신뢰성, 흐름 제어를 제공할 수 있으며, 애플리케이션과 인터넷 계층 사이의 데이터가 전달될 때 중계 역할을 한다. 대표적으로 TCP와 UDP가 있다.
TCP는, 패킷 사이의 순서를 보장하고 연결지향 프로토콜을 사용해서 연결을 하여 신뢰성을 구축해서 수신 여부를 확인하며 '가상회선 패킷 교환 방식'을 사용한다.
UDP는 순서를 보장하지 않고 수신 여부를 확인하지 않으며 단순히 데이터만 주는 '데이터그램 패킷 교환 방식'을 사용한다.
가상회선 패킷 교환 방식
: 가상회선 패킷 교환 방식은, 각 패킷에는 가상회선 식별자가 포함되며, 모든 패킷을 전송하면 가상회선이 해제되고 패킷들은 전송된 '순서대로' 도착하는 방식을 말한다.
데이터그램 패킷 교환 방식
: 데이터그램 패킷 교환 방식은, 패킷이 독립적으로 이동하며 최적의 경로를 선택하여 가는데, 하나의 메시지에서 분할된 여러 패킷은 서로 다른 경로로 전송될 수 있으며, '도착한 순서가 다를 수 있는 방식'이다.
TCP는 신뢰성을 확보할 때 '3-웨이 핸드셰이크(3-way handshake)'라는 작업을 진행한다.
3-웨이 핸드셰이크를 그림으로 표현하면 아래와 같다.
위 그림에서도 나와있듯, 클라이언트와 서버가 통신할 때는 3단계를 거치게 된다.
SYN 단계 : 클라이언트는 서버에 클라이언트의 ISN을 담어 SYN을 보낸다. ISN은 새로운 TCP 연결의 첫 번째 패킷에 할당된 임의의 시퀀스 번호를 의미하고, 이는 장치마다 다를 수 있다.
SYN + ACK 단계 : 서버는 클라이언트의 SYN을 수신하고 서버의 ISN을 보내며 승인번호로 클라이언트의 ISN+1을 보낸다.
ACK 단계 : 클라이언트는 서버의 ISN+1한 값인 승인번호를 담아서 ACK를 서버에 보낸다.
이렇듯, 3-웨이 핸드셰이크 과정 이후 신뢰성이 구축되고 데이터 전송을 시작한다.
TCP는 위 과정이 있기에 신뢰성이 있는 계층이라고 하고, UDP는 위 과정이 없어 신뢰성이 없는 계층이라 한다.
TCP가 연결을 해제할 때는 '4-웨이 핸드셰이크' 과정이 발생한다.
과정을 그림으로 표현하면 아래와 같다.
1번 : 먼저, 클라이언트가 연결을 닫으려고 할 때 FIN으로 설정된 세그먼트를 보낸다. 그리고 클라이언트는 FIN_WAIT_1 상태로 들어가고 서버의 응답을 기다린다.
2번 : 서버는 클라이언트로 ACK라는 승인 세그먼트를 보낸다. 그리고 CLOSE_WAIT 상태에 들어간다. 클라이언트가 세그먼트를 받으면 FIN_WAIT_2 상태로 들어간다.
3번 : 서버는 ACK를 보내고 일정 시간 이후에 클라이언트에 FIN이라는 세그먼트를 보낸다.
4번 : 클라이언트는 TIME_WAIT 상태가 되고 다시 서버로 ACK를 보내서 서버는 CLOSED 상태가 된다. 이후 클라이언트는 어느 정도의 시간을 대기한 후 연결이 닫히고 클라이언트와 서버의 모든 자원의 연결이 해제된다.
위 과정에서 의문이 생길 것이다. 바로 TIME_WAIT 부분에서 말이다.
그냥 연결을 닫으면 되지 왜 굳이 일정 시간 뒤에 닫을까?
지연 패킷이 발생할 경우를 대비하기 위해서이다. 패킷이 뒤늦게 도달하고 이를 처리하지 못하면 데이터 무결성 문제가 발생한다. 만약 예를들어, 전체 데이터가 100인데 일부 데이터인 50만 들어오는 현상이 발생할 수도 있다는 것이다.
두 장치가 연결이 닫혔는지 확인하기 위함이다. 만약 LAST_ACK 상태에서 닫히게 되면, 다시 새로운 연결을 하려고 할 때, 장치는 LAST_ACK로 되어 있기 때문에 접속 오류가 나게 될 것이다.
위와 같은 2가지 이유로 TIME_WAIT이라는 잠시 기다릴 시간이 필요한 것이다.
'인터넷(internet) 계층'은, 장치로부터 받은 네트워크 패킷을 IP 주소로 지정된 목적지로 전송하기 위해 사용되는 계층이다. IP, ARP, ICMP 등이 있고, 패킷을 수신해야 할 상대의 주소를 지정하여 데이터를 전달한다. 상대방이 제대로 받았는지에 대해 보장하지 않는 '비연결형적인 특징'을 가지고 있다.
'링크 계층'은, 전선, 광섬유, 무선 등으로 실질적으로 데이터를 전달하며 장치 간에 신호를 주고받는 '규칙'을 정하는 계층이다. '네트워크 접근 계층' 이라고도 한다.
'물리 계층'과 '데이터 링크 계층'으로 나누기도 하는데, '물리 계층'은 무선 LAN과 유선 LAN을 통해 0과 1로 이루어진 데이터를 보내는 계층을 말한다. '데이터 링크 계층'은 '이더넷 프레임'을 통해 에러 확인, 흐름 제어, 접근 제어를 담당하는 계층을 말한다.
유선LAN을 이루는 '이더넷'은 IEEE082.3이라는 프로토콜을 따르며 '전이중화 통신'을 쓴다.
전이중화 통신
: '전이중화(full duplex) 통신'은, 양쪽 장치가 동시에 송수신할 수 있는 방식을 말한다. '송신로'와 '수신로'로 나눠서 데이터를 주고받으며, 현대의 고속 이더넷은 이 방식을 기반으로 통신한다.
CSMA/CD
: 참고로 이전에는 유선LAN에 '반이중화 통신' 중 하나인 CSMA/CD 방식을 쓰기도 했다. 이 방식은, 데이터를 '보낸 이후' 충돌이 발생한다면 일정 시간 이후 재전송하는 방식을 말한다. 수신로와 손신로를 따로 두는 것이 아닌, 한 경로를 기반으로 데이터를 보내기 때문에 데이터를 보낼 때 충돌에 대해 대비해야 했기 때문이다.
유선LAN을 이루는 케이블로, TP케이블이라고 하는 '트위스트 페어 케이블'과 '광섬유 케이블'이 대표적이다.
'트위스트 페어 케이블(twisted pair cable)'은, 하나의 케이블처럼 보이지만 실제로는 8개의 구리선을 두 개씩 꼬아 묶은 케이블을 말한다.
또한, 케이블은 구리선을 실드 처리하지 않고 덮은 UTP케이블과, 실드 처리하고 덮은 STP로 나눠진다. 우리가 많이 볼 수 잇는 케이블은 UTP케이블로, 흔히 LAN케이블이라고 한다.
그리고 LAN케이블을 꽂을 수 잇는 커넥터를 RJ-45커넥터라고 한다.
'광섬유 케이블'은 광섬유로 만든 케이블이다. 레이저를 이용해서 통신하기 때문에 구리선과는 비교할 수 없을 만큼 장거리 및 고속 통신이 가능하다. 보통 100Gbps의 데이터를 전송하며 광섬유 내부와 외부를 다른 밀도를 가지는 유리나 플라스틱 섬유로 제작해, 한 번 들어간 빛이 내부에서 계속 반사하며 전진해 반대편 끝까지 가는 원리를 이용한 것이다.
빛의 굴절률이 높은 부분을 '코어(core)', 낮은 부분을 '클래딩(cladding)'이라 한다.
무선LAN장치는 수신과 송신에 같은 채널을 사용하기 때문에 '반이중화 통신'을 사용한다.
'반이중화 통신(half duplex)'은 양쪽 장치는 서로 통신할 수 있지만, 동시 통신은 할 수 없으며, 한 번에 한 방향만 통신할 수 있는 방식을 말한다.
일반적으로 장치가 신호를 수신하기 시작하면 응답하기 전에 전송이 완료될 때까지 기다려야 한다. 또한, 둘 이상의 장치가 동시에 전송하면 충돌이 발생하여 메시지가 손실되거나 왜곡될 수 있기 대문에 '충돌 방지 시스템이 필요'하다.
CSMA/CA는 반이중화 통신 중 하나로, 장치에서 데이터를 보내기 전에 캐리어 감지 등으로 사전에 가능한 충돌을 방지하는 방식을 사용한다. 과정은 아래와 같다.
참고로 이와 반대되는 전이중화 통신은 양방향 통신이 가능해 충돌 가능성이 없기 때문에 충돌을 감지하거나 방지하는 메커니즘이 필요하지 않다.
무선LAN(WLAN, Wireless Local Area Network)은 무선 신호 전달 방식을 이용하여 2대 이상의 장치를 연결하는 기술이다.
비유도 매체인 공기에 주파수를 쏴 무선 통신망을 구축하는데, 주파수 대역은 2.4GHz 대역 or 5GHz 대역 중 하나를 써서 구축한다. 2.4GHz는 장애물에 강한 특성을 가지지만, 전자레인지, 무선 등 전파 간섭이 일어나는 경우가 많다. 5GHz 대역은 사용할 수 있는 채널 수도 많고, 동시에 사용할 수 있기 때문에 상대적으로 깨끗한 전파 환경을 구축할 수 있다. 그렇기에 보통 5GHz대역을 사용하는 것이 좋다.
'와이파이(wifi)'는 전자기기들이 무선LAN 신호에 연결할 수 있게 하는 기술로, 이를 사용하려면 '무선 접속 장치(AP, Access Point)'가 있어야 한다. 이를 흔히 공유기라고 한다. 이를 통해 유선LAN에 흐르는 신호를 무선LAN신호로 바꿔 신호가 닿는 범위 내에서 무선 인터넷을 사용할 수 있게 한다. 참고로 무선LAN을 이용한 기술로는 지그비, 블루투스 등도 있다.
'BSS(Basic Service Set)'는 '기본 서비스 집합'을 의미하며, 단순 공유기를 통해 네트워크에 접속하는 것이 아닌, 동일 BSS 내에 있는 AP들과 장치들이 서로통신이 가능한 구조를 말한다. 근거리 무선 통신을 제공하고, 하나의 AP만을 기반으로 구축되어 사용자가 한 곳에서다른 곳으로 자유롭게 이동하며 네트워크에 접속하는 것은 불가능하다.
'ESS(Extended Service Set)'은 하나 이상의 연결된 BSS 그룹이다. 장거리 무선 통신을 제공하며 BSS보다 더 많은 가용성과 이동성을 지원한다. 즉, 사용자는 한 장소에서 다른 장소로 이동하며 중단 없이 네트워크에 계속 연결할 수 있게 된다.
'데이터 링크 계층'은 이더넷 프레임을 통해 전달받은 데이터의 에러를 검출하고 캡슐화하고, 아래와 같은 구조를 가진다.
※ MAC주소
: 컴퓨터나 노트북 각 장치에는 네트워크에 연결하기 위한 장치(LAN카드)가 있는데, 이를 구별하기 위한 식별번호를 말한다. 6바이트(48비트)로 구성된다.
만약 컴퓨터를 통해 다른 컴퓨터로 데이터를 요청한다면? 예를 들어, HTTP를 통해 웹 서버에 있는 데이터를 요청한다면?
애플리케이션 계층에서 전송 계층으로 클라이언트가 보내는 요청(request)값들이 캡슐화 과정을 거쳐 전달되고, 다시 링크 계층을 통해 해당 서버와 통신을 하고, 해당 서버의 링크 계층으로부터 애플리케이션까지 비캡슐화 과정을 거쳐 데이터가 전송될 것이다.
'캡슐화 과정'은 사우이 계층의 헤더와 데이터를 하위 계층의 데이터 부분에 포함시키고, 해당 계층의 헤더를 삽입하는 과정을 말한다.
애플리케이션 계층의 데이터가 전송 계층으로 전달되면서 '세그먼트' 또는 '데이터그램화' 되며 TCP(L4) 헤더가 붙여지게 된다. 그리고 이후 인터넷 계층으로 가면서 IP(L3) 헤더가 붙여지게 되며 '패킷화'가 되고, 이후 링크 계층으로 전달되면서 프레임 헤더와 프레임 트레일러가 붙어 '프레임화'가 된다.
'비캡슐화 과정'은 하위 계층에서 상위 계층으로 가며 각 계층의 헤더 부분을 제거하는 과정을 말한다. 위 그림에서 화살표를 아래 위로 바꾼 것이라 생각하면 된다.
캡슐화된 데이터를 받게 되면, 링크 계층에서부터 타고 올라가면서 프레임화된 데이터는 다시 패킷화를 거쳐 세그먼트, 데이터그램화를 거쳐 '메시지화'가 되는 비캡슐화 과정이 일어나는 것이다. 그 이후 최종적으로 사용자에게 애플리케이션의 PDU인 메시지로 전달된다.
PDU(Protocol Data Unit)
네트워크의 어떠한 계층에서 계층으로 데이터가 전달될 때, 한 덩어리의 단위를 PDU(Protocol Data Unit)이라 한다.
PDU는 제어 관련 정보들이 포함된 '헤더', 데이터를 의미하는 '페이로드'로 구성되어 있고, 계층마다 부르는 명칭이 다르다.
예를 들어, 애플리케이션 계층은 '메시지'를 기반으로 데이터를 전달하는데, HTTP의 헤더가 문자열인 것을 예로 들 수 있을 것이다.
※ PDU 중, 아래 계층인 비트로 송수신하는 것이 모든 PDU 중 가장 빠르고 효율성이 높다. 하지만 애플리케이션 계층에서는 문자열을 기반으로 송수신을 하는데, 그 이유는 헤더에 authorization 값 등 다른 값들을 넣는 확장이 쉽기 때문이다.