[책 리뷰] 만들면서 배우는 생성 AI

Yejin Kim·2023년 10월 28일

나는 리뷰어다

목록 보기

3/3

들어가며

생성 AI는 최근 AI 필드에서 가장 뜨거운 감자가 아닐까 생각합니다. 오픈AI가 2018년 6월 발표한 GPT는 발전의 발전을 거듭하였고, 최근에는 GPT-4까지 출시되었습니다. GPT-4는 현재 유료 구독 서비스 체제로 운영하면서 본격적으로 AI의 상업화를 알렸습니다. 자연어처리 뿐만 아니라 이미지를 생성할 수 있는 오픈AI의 DALL﹒E 2, 구글 브레인의 Imagen, Stability AI의 Stable diffusion와 같은 모델들이 출시되었습니다. 이러한 생성 모델들은 대중들의 예상을 뛰어넘는 성능을 보여주며 관심을 받고 있습니다.

특히나 생성 AI가 주목을 받으면서 실제로 AI가 인간을 대체할 수 있는가에 대한 논의도 대두되고 있습니다. AI가 이전까지는 소수의 엔지니어들의 전유물이었다고 생각할 수 있지만, 계속해서 우리의 생활에 밀접해지고 있기 때문에 우리들도 이를 공부할 필요가 있습니다. 앞으로 점점 AI 기술들이 상용화된다면 기술의 자세한 부분까지는 모르더라도 어떤 모델이 어떤 역할을 하는지, 그 기술을 어떻게 활용할 수 있을지를 고민해야 한다는 것입니다.

책에 관하여

이 책에서는 우리의 삶에 한 발짝 가까워진 생성 AI에 대해서 소개합니다. 생성 AI를 공부하기 전, 기본적인 AI 및 딥러닝에 대한 지식이 필요로 됩니다.
하지만 걱정하지 마세요! 이 책에서는 Part 1을 통해 '생성 모델이 무엇인지', '생성 모델이 기존의 AI 기술과 어떻게 다른지', '생성 모델을 공부하기 위해 필요한 수학적 개념에는 어떤 것들이 있는지'부터 딥러닝을 이해하기 위한 개념들을 정리하고 있습니다. Data type, Multi-Layer Perceptron (MLP), Model, Loss function, Optimizer, Training, Evaluation, CNN, Normalization 등 중요한 deep learning 개념들을 소개하고 있기 때문에 Part 1을 잘 숙지한다면 생성 AI를 이해하기 위한 준비는 충분히 될 것입니다.

Part 2에서는 본격적으로 생성 모델링에 대해 설명합니다. 이 책에서는 총 6가지 생성 모델 - 변이형 오토인코더 (Variational AutoEncoder; VAE), 생성적 적대 신경망 (Generative Adversarial Network; GAN), 자기회귀 모델 (Autogressive model), 노멀라이징 플로 모델 (Normalizing flow model), 에너지 기반 모델(Energy-based model), 확산 모델 (Diffusion model) - 을 소개하고 있습니다.

각각의 파트는 어떤 아이디어에서부터 뻗어나와 모델이 디자인되었는지부터, 모델의 알고리즘을 표현한 수식, 모델의 한계점과 이를 극복하기 위한 모델들은 어떤 것들이 있는지까지 상세하게 설명되어 있습니다. 제 경우에는 딥러닝 지식을 어느정도 보유하고 있는데도, 책에서 심화적인 내용까지 다루고 있어 생성 분야를 예상보다 더 깊이 알아볼 수 있었습니다. 심화적인 내용을 다루기는 하지만 기본적인 모델부터 설명을 시작하여 '이 모델의 한계점이 무엇이고, 이 한계점을 어떤 방식으로 극복한 것이 다음 단계의 모델이다'로 책이 전개되고 있기 때문에 이해를 하는데는 큰 어려움이 없었습니다.

Part 3에서 이러한 모델들이 실제로 어떻게 응용되고 있는지 그 예시와 사용된 기술들, 그 한계점에 대해서 설명합니다. 그리고 생생 AI의 앞으로의 방향성에 대한 부분으로 책이 마무리되면서, 독자들도 이에 대해 다시 생각해볼 수 있도록 합니다. 실제로 생성 AI로 인한 딥페이크, 저작권 등의 문제가 많이 논의되고 있는 것으로 알고 있습니다. 이러한 부분 또한 AI가 우리의 삶에 접목됨에 있어서 굉장히 중요한 부분이 될 것이라고 생각합니다. 생성 AI가 일상생활에 어떻게 새로운 영향을 미칠 수 있을지, 그 과정에서 발생할 수 있는 윤리적 문제는 어떤 것들이 있을지 같이 고민해 보면 좋을 것 같습니다.

마무리하며

제가 앞으로 공부해 나갈 분야는 생성 분야가 아닌 AI의 다른 분야이지만, 이 책을 읽으면서 새로운 시각의 생각을 해볼 수 있어 좋았습니다.
예를 들어, 책에서 GAN의 손실함수에 대해 "생성자는 현재 판별자에 의해서만 평가되고 판별자는 계속 향상되기 때문에 훈련 과정의 다른 지점에서 평가된 손실을 비교할 수 없습니다. 시간이 갈수록 이미지 품질은 확실히 향상되는데도 생성자의 손실 함수는 증가합니다. 생성자의 손실과 이미지 품질 사이의 연관성 부족은 이따금 GAN 훈련 과정을 모니터링하기 어렵게 합니다." 라고 이야기 한 부분은 Loss function에 대한 개념을 다시 한 번 일깨워주는 문장이었습니다. Loss function은 우리가 원하는 만큼 모델이 결과를 잘 내고 있는지를 평가하는 지표가 되어야 하는데, 경쟁적으로 학습을 하는 GAN의 경우 결과를 잘 내더라도 오히려 Loss function의 값은 증가한다는 것은 Loss function의 의미를 퇴색시킨다고 볼 수 있다는 것입니다. 이처럼 책을 통해 생각지 못했던 방향으로 제가 지식을 다시 되짚어 볼 수 있었습니다.
또한 현재 연구하고 있는 분야에서 에너지 함수를 다루는데, Part 2의 Ch.7 에너지 기반 모델에서 생성 AI에서는 이 함수를 어떻게 활용하고 있는지를 살펴볼 수 있어 도움이 되었습니다.
생성 모델이 현재도 활발하게 연구가 되고 있는 분야이니만큼 과거의 연구 분야들과 지식들이 총 집합되어 있어, AI에 관심이 있는 사람이라면 저처럼 이 책으로부터 배경 지식을 얻어갈 수 있을 것이라 생각합니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

Yejin Kim

The World Is My Oyster 🌏

이전 포스트

[책 리뷰] 만들면서 배우는 생성 AI

나는 리뷰어다

들어가며

책에 관하여

마무리하며

[책 리뷰] 트랜스포머를 활용한 자연어 처리

0개의 댓글