SSL패킷 ?

Pink Chun·2022년 11월 12일
2
post-thumbnail

1. 들어가기 전

패킷(packet)은 네트워크를 통해 전송하기 쉽도록 자른 데이터의 전송 단위이다. 본래는 소포를 뜻하는 용어로, 소화물을 뜻하는 패키지(package)와 덩어리를 뜻하는 버킷(bucket)의 합성어이다.

HTTP는 네트워크 패킷이 도청 가능하다고 하다. 그렇다면 네트워크 상의 패킷을 특정 규칙(?)으로 암호화 하면 안되나?

송신자는 데이터를 암호화하고 수신자는 그 데이터를 복화하 하는 방법을 알고 있다면 누군가가 도중에 가로채로 그 데이터를 복화화할 수 있는 방법을 모르기 때문에 안전해 보인다.

하지만, 만약 누군가가 복호화 방법을 어떻게 알아낸다면 어떻게 될까? 또 데이터를 복호화하는 방법은 송신자는 수신자에게 어떻게 안전하게 전달할까? 해커가 복호화 하는 방법에 대해 알고 있거나 그 방법을 도중에 가로챈다면 암호화를 하는 이유가 없을 뿐더러 도중에 데이터를 조작한다면 수신자는 그 데이터가 "진짜" 데이터인지 정확히 알 방법이 없다.

그렇다면 만약 서버와 클라이언트 사이에서 암호화된 데이터가 100% 안전하다는 것을 보증해줄 수 있는 A라는 사람이 나타나면 어떻게 될까?
A는 절대 거짓말을 하지 않으며 A를 거쳐가는 데이터는 모두 안전하다는 것이 보장되는 상황이라면 어떻게 될까?

이런 경우라면 클라이언트와 서버는 패킷의 신뢰성을 걱정하지 않고 네트워크 통신을 할 수 있을 것 같다.

위의 예시로 HTTPS를 대략적으로 설명하였으며 HTTPS를 이해하는 것은 곧 SSL, TSL, 대칭키, 공개키, CA 등을 이해하는 것이다. 각 개념들은 모두 톱니바퀴처럼 어울려 하나의 HTTP 라는 개념을 설명하고 있기 때문에 한번에 이해하기 어려울 수 있다. 하나씩 차근하게 이해해가다 보면 HTTPS가 어떤 것이고 어떤 식으로 동작하는지 이해할 수 있을 것이다.


2. HTTPS와 SSL

SSL을 이해하는 것이 HTTPS를 이해하는 것이라고 생각한다.
HTTPS와 SSL을 같은 의미로 이해하고 있는 경우가 많다. 이것은 맞기도 하고 틀리기도 하다. 이것은 마치 인터넷과 웹을 같은 의미로 이해하는 것과 같다. 결론적으로 말하면 웹이 인터넷 위에서 돌아가는 서비스 중의 하나인 것처럼 HTTPS도 SSL 프로토콜 위에서 돌아가는 프로토콜이다.

1) SSL ?

SSL(Secure Socket Layer)은 HTTPS의 마지막 S를 의미하며 HTTP에서 SSL을 추가하여 HTTP의 보안이 더 강화되었다. 엄밀히 말하면 HTTPS는 SSL위에서 동작하는 프로토콜 이다.

SSL은 Netscape사에서 웹 서버와 브라우저 사이의 보안을 위해 만들었다. SSL이 점차 폭넓게 사용되다 표준화 기구인 IETF의 관리로 변경되면서 TLS라는 이름으로 바뀌었으며 TLS 1.0은 SSL 3.0을 계승한다. 하지만 TLS라는 이름 보다는 SSL이름이 훨씬 많이 사용되고 있다.

대칭키, 공개키, CA, SSL 인증서를 이해하는 것이 SSL을 이해하는 것이며 SSL을 이해하는 것이 HTTPS를 이해하는 것이다.

2) 대칭키

대칭키는 동일한 키로 데이터를 암호/복화화를 할 수 있는 암호화 기법이다. 예를 들어 "Q#*%D"라는 A키로 데이터를 암호 하였다면 복화화 할 때 똑같은 비밀번호로 복호화를 해야 한다.

3) 공개키
대칭키 방식은 단점이 있다. 암호를 주고 받는 사람들 사이에 대칭키를 전달하는 것이 어렵다는 점이다. 대칭키가 유출되면 키를 획득한 공격자는 암호의 내용을 복호화 할 수 있기 때문에 암호가 무용지물이 되기 때문이다. 이런 배경에서 나온 암호화 방식이 공개키방식이다.

공개키 방식은 두개의 키를 가지는데 A라는 키로 암호화 했으면 B키로 복호화가 가능하며, B라는 키로 암호화를 했으면 A라는 키로 복호화가 가능하다. 여기서 하나의 키를 비공개키(private key, 비밀키) 나머지 키를 공개키(public key)라고 한다.

비공개키는 자신만이 가지고 있고 공개키를 타인에게 제공한다. 공개키를 제공 받은 타인은 공개키를 이용해서 정보를 암호화 한다. 암호화한 정보를 비공개키를 가지고 있는 사람에게 전송하면 비공개키의 소유자는 이 키를 이용해서 암호호된 정보를 복호화 한다. 이 과정에서 공개키가 유출된다고 해도 비공개키를 모르면 정보를 복호화할 수 없기 때문에 안전하다. 공개키로는 암호화는 할 수 있지만 복호화는 할 수 없기 때문이다.

이 방식은 다른 방식으로 응용할 수 있는데, 비공개키의 소유자는 비공개키를 이용해서 정보를 암호화 한 후에 공개키와 함께 암호화된 정보를 전송한다. 정보와 공개키를 획득한 사람은 공개키를 이용해서 암호화된 정보를 복호화 한다. 이 과정에서 공개키가 유출된다면 의도하지 않는 공격자에 의해서 데이터가 복호화될 위험이 있다.

하지만 이런 위험에도 불구하고 비공개키를 이용해서 암호화하는 이유는 무엇일까?

그 이유는 데이터를 보호하는 것이 목적이 아니기 때문이다. 암호화된 데이터를 공개키를 가지고 복호화할 수 있다는 것은 그 데이터가 공개키와 쌍을 이루는 비공개키로 암호화 되었다는 것을 의미한다. 즉 공개키가 데이터를 제공한 사람의 신원을 보장해주게 되는 것이며 이러한 것을 전자 서명이라고 부른다.

4) SSL 인증서
클라이언트가 어떻게 내가 암호화된 데이터를 보내고/받는 서버를 100% 신뢰할 수 있을까?

예를 들어 내가 소유하고 있는 www.mydomain.com에 접속하여 서버와 네트워크 통신을 한다면 전혀 의심할 필요가 없다. 내것이기 때문에 의심할 필요가 없기 때문이다.

하지만 다른 도메인에 접근한다면, 즉 다른 서버와 네트워크 통신을 한다면 서버를 100% 믿을 수 없다.

여기서 SSL 인증서는 서버의 신뢰성을 확인하는데 사용하며 "저(서버)는 안전합니다 클라이언트님!" 라고 말하는 인증서 이다. 클라이언트가 서버에 접속한 직후에 서버는 클라이언트에게 이 인증서 정보를 전달한다. 클라이언트는 이 인증서 정보가 신뢰할 수 있는 것인지를 검증 한 후에 다음 절차를 수행하게 된다.

인증서의 크게 다음 두가지 역할을 합니다.

1. 클라이언트가 접속한 서버가 신뢰할 수 있는 서버임을 보장함

2. SSL 통신에 사용할 공개키를 클라이언트에게 제공함(여기서 공개키는 대칭키를 의미)

5) CA
위에서 SSL 인증서에 대해 공부했는데, 이는 클라이언트가 접속한 서버가 클라이언트가 진짜 의도한 서버, 통신하고 싶어하는 서버가 맞는지 보장하는 역할을 한다.

이 역할을 하는 민간기업들이 있는데 이런 기업들을 CA(Certificate Authority) 혹은 Root Certificate라고 합니다. CA는 아무 기업이나 할 수 있는 것이 아니고 신뢰성이 엄격하게 공인된 기업들만이 참여할 수 있다.

기업(서버)는 자신의 서버가 아무런 문제가 없고, 어떠한 불법적인 일을 저지르지 않는 다는것을 증명할 수 있는 서류와 함께 자신이 생성한 공개키를 CA에게 보내고 CA는 아무런 문제가 없음을 확인하면 해당 기업(서버는) SSL 인증서를 사용할 수 있다.

이렇게 CA로 부터 승인받은 SSL 인증서는 클라이언트가 서버에 접근하면 "나는 믿을만한 서버야!" 라는 의미로 SSL 인증서를 클라이언트로 보낸다. 이후 클라이언트는 신뢰성을 검사하고 이후의 네트워크 통신을 한다고 생각하면 된다.

아래는 몇가지 CA 기업을 나열했습니다.

티스토리 도메인의 CA는 DigiCert이다. 이는 "DigiCert"라는 회사가 tistory는 믿을만한 회사(서버)야!" 라고 말해주고 있는것과 같다.

6) SSL 인증서의 내용
SSL 인증서에는 다음과 같은 정보가 포함되어 있다.

1.서비스의 정보 : 인증서를 발급한 CA, 서비스의 도메인 등등
2. 서버 측 공개키 : 공개키의 내용, 공개키의 암호화 방법

1번은 클라이언트가 접속한 서버가 클라이언트가 의도한 서버가 맞는지에 대한 내용을 담고 있고,

2번은 서버와 통신을할 때 사용할 공개키와 그 공캐기의 암호환 방법들의 정보를 담고 있다.

여기서 HTTPS가 적용된 서버에 접속하게 되면 내부적으로 클라이언트에세 SSL인증서를 보내주게 된다.

서비스의 도메인 공개키와 같은 정보는 서비스가 CA로부터 인증서를 구입할 때 제출해야 한다. 위와 같은 내용은 CA에 의해서 암호화 된다. 이때 사용하는 암호화 기법이 공개키 방식이다.

CA는 자신의 CA 비공개키를 이용해서 서버가 제출한 인증서를 암호화하는 것이다. CA의 비공개키는 절대로 유출되어서는 안된다. 이것이 노출되는 바람에 어떤 회사는 파산된 사례도 있다.

7) CA를 브라우저는 이미 알고 있다
브라우저는 CA를 이미 알고 있다. 브라우저를 개발할 때, 개발회사의 정책에 따라 CA의 리스트를 파악하고 이를 브라우저의 소스코드안에 미리 넣어 놓았다. 이러한 리스트는 브라우저가 업데이트 될때마다 내부 정책에 따라 수정 되며 브라우저가 미리 파악하고 있는 CA의 리스트에 포함되어야만 공인된 CA가 될 수 있다. 그리고 CA의 리스트와 함께 CA의 공개키 또한 브라우저는 이미 알고 있다.

8) SSL 인증서가 서비스를 보증하는 방법

 a) 브라우저가 서버에 접속할 때 서버는 제일 먼저 인증서를 제공한다.

 b) 브라우저는 이 인증서를 발급한 CA가 자신이 가지고있는 CA 리스트에 있는지 확인한다.

 c) 확인 결과 브라우저의 CA 리스트에 포함되어 있다면 해당 CA의 공개키(인증서 내부에 포함되어 있음)를 이용해서 인증서를 복호화 한다.

 d) CA의 공개키를 이용해서 인증서를 복호화할 수 있다는 것은 이 인증서가 CA의 비공개키에 의해서 암호화 된 것을 의미한다.

 e) 해당 CA의 비공개 키를 가지고 있는 CA는 해당 CA 밖에는 없기 때문에 서버가 제공한 인증서가 CA에 의해서 발급된 것이라는 것을 의미한다.

 f) CA에 의해서 발급된 인증서라는 것은 접속한 사이트가 CA에 의해서 검토되었다는 것을 의미한다.

 g) CA의 검토를 통과했다는 것은 해당 서비스가 신뢰할 수 있다는 것을 의미한다.

 h) 이것이 CA와 브라우저가 특성 서버를 인증하는 과정이다.

3. SSL의 동작 방법

앞서 배운 내용들은 모두 해당 챕터를 공부하기 위한 사전 공부였다. 지금껏 배운 공개키, 대칭키, SSL 인증서, CA 모두 SSL의 동작 원리를 이해하기 위해 공부하였으며 이러한 내용 모두 얽혀 SSL을 설명할 수 있기 때문이다.

먼저 클라이언트와 서버가 통신하는 가장 이상적인 방법은 공개키 방식으로 통신하는 것이다. 서버는 클라이언트에게, 클라이언트는 서버에게 공개키를 제공하고 데이터를 공개키로 암호화 한다. 나중에 복호화 할때는 비밀키로만 복호화 할 수 있기 때문에 통신 도중에 패킷을 도청했다 하더라도 비밀키를 소유자를 제외하고는 해당 패킷을 복호화할 수 없다는 장점이 있다.

하지만 이러한 공개키 방식은 컴퓨팅 파워를 많이 사용하기 때문에 실제로 사용하고 있지는 않다.

대신에 대칭키와 공개키 방식을 혼합하여 사용하고 있다. 실제 데이터는 대칭키 방식으로 암호화 한다. 여기서 대칭키는 각 서버/클라이언트에서 같은 키를 사용하여 대칭키를 공유하는데 사용하는 암호화 기법으로 공개키를 사용힌다.

◾ 실제 데이터 : 대칭키 방식
◾ 대칭키의 키 : 공개키 방식

컴퓨터와 컴퓨터 사이의 네트워크는 아래의 3단계 과정을 거칩니다.

" 악수 ㅡ> 데이터 전송 ㅡ> 세션종료 "

1) 악수(handshake)
서버와 네트워크는 서로 데이터를 주고 받기 전에 서로의 상태에 대한 공유 작업을 하는데 이를 handshake라고 한다. SSL 방식을 이용해서 통신을 하는 브라우저와 서버 역시 핸드쉐이크를 하는데, 이 때 SSL 인증서를 주고 받는다.

a) 클라이언트가 서버에 접속하며 이 단계를 client hello라고 한다.
◾ 클라이언트 측에서 생성한 랜덤 데이터를 서버로 전송
◾ 클라이언트가 지원하는 암호화 방식을 서버로 전송 : 클라이언트와 서버가 지원하는 암호화 방식이 서로 다를 수 있기 때문에 상호간에 어떤 암호화 방식을 사용할 것인지에 대한 협상을 해야 한다. 이 협상을 위해서 클라이언트 측에서는 자신이 사용할 수 있는 암호화 방식을 전송한다.
◾ 세션 아이디 : 이미 SSL 핸드쉐이킹을 했다면 비용과 시간을 절약하기 위해서 기존의 세션을 재활용하게 되는데 이 때 사용할 연결에 대한 식별자를 서버 측으로 전송한다.

b) 서버는 Client Hello에 대한 응답으로 Server Hello를 하게 된다.
◾ 서버 측에서 생성한 랜덤 데이터을 클라이언트로 전송
◾ 서버가 선택한 클라이언트의 암호화 방식을 클라이언트로 전송 : 클라이언트가 전달한 암호화 방식 중에서 서버 쪽에서도 사용할 수 있는 암호화 방식을 선택해서 클라이언트로 전달한다. 이로써 암호화 방식에 대한 협상이 종료되고 서버와 클라이언트는 이 암호화 방식을 이용해서 정보를 교환하게 된다.
◾ 인증서 전송

c) 클라이언트는 서버로부터 받은 SSL 인증서로 해당 SSL인증서가 어떤 CA가 발급한 인증서인 지 확인하고 해당 CA가 브라우저의 리스트에 포함된 CA인지 검사한다.
◾ 만약 CA가 리스트에 있다면 해당 CA의 공개키로(이미 브라우저에는 해당 CA의 공개키를 가지고 있음) SSL 인증서를 복호화 한다. SSL 인증서가 공개키로 복호화가 된다면 이것은 SSL 인증서가 해당 CA로 부터 발급된 인증서라는 것을 알 수 있고, 자신이 접속한 서버가 CA에 의해 보장되어 있음을 확신할 수 있다. 또한 이 단계에서 클라이언트는 SSL 인증서 내부의 공개키(서버로 부터 생산된)를 가지게 된다.

[ 클라이언트 랜덤 데이터 / 서버 랜덤 데이터 ]
◾ 서버/클라이언트 측에서 생성된 랜덤 데이터를 사용하여 클라이언트는 pre master secret를 만들게 된다.
◾ 그러면 클라이언트는 어떻게 pre master secret를 서버에 전송할까? 바로 공개키 방식을 사용하는데,
◾ 클라이언트는 pre master secret를 서버로부터 받은 SSL 인증서내의 공개키로 암호화 하게 된다. 그리고 이렇게 암호화된
◾ pre master secret를 서버에게 전송하면 서버는 자신이 가지고 있는 비밀키를 사용하여 pre master secret를 복호화 한다. 공개키 방식을 사용했기 때문에 도중에 pre master secret를 가로채도 비밀키가 없으면 복호화하 수 없게 된다.
◾ 이후 클라이언트와 서버는 모두 pre master secret를 소유하게 되며,
◾ 각 일련의 과정을 거쳐 pre master secret를 master secret값으로 만들며 이 값은 session secret가 된다.
◾ 이후 실제 데이터를 전송하는 단계에서 클라이언트와 서버는 데이터를 session secret를 암호화/복호화 하는데 사용하며 이는 곧 대칭키 방식이 된다.

2) 데이터 전송

이 단계에서 핵심은 정보를 상대방에서 전송하기 전에 session secret 값을 이용해서 대칭키 방식으로 암호화하 한다는 점이다. 암호화된 정보는 상대방에서 전송될 것이고, 상대방도 세션키 값을 알고 있기 때문에 암호를 복호화할 수 있다.

위에서도 언급 하였지만 그냥 공개키를 사용하면 될 것을 굳이 대칭키와 공개키를 조합해서 사용하는 이유는 무엇인가?

그것은 공개키 방식이 많은 컴퓨팅 파워를 사용하기 때문이다. 만약 공개키를 그대로 사용하면 많은 접속이 몰리는 서버는 매우 큰 비용을 지불해야 할 것이다. 반대로 대칭키는 암호를 푸는 열쇠인 대칭키를 상대방에서 전송해야 하는데, 암호화가 되지 않은 인터넷을 통해서 키를 전송하는 것을 위험하기 때문이다. 그래서 속도는 느리지만 데이터를 안전하게 주고 받을 수 있는 공개키 방식으로 대칭키를 암호화 한다.

3) 세션종료

데이터 전송이 끝나면 SSL 통신이 끝났음을 서로에게 알려주며 이때 통신에서 사용한 대칭키인 session key를 폐기한다.

profile
최룰루의 개발일지(코린이)

0개의 댓글