AI-comics

최민호·2023년 3월 16일
1
post-thumbnail
변환 전변환 후

프로젝트 개요

적대적 생성 신경망을 통해 이미지를 원하는 화풍으로 리스타일 하고 내 주변 환경과 사람들을 웹툰으로 제작해 내 결과물을 웹 서버로 공유할 수 있는 하이브리드 앱을 개발한다.
공유된 결과물로 서로 소통하며 메타버스를 위한 개인의 특성을 나타내는 아바타를 생성하고 GPT-3 챗봇 캐릭터로 활용하는 웹 페이지를 개발한다.

프로젝트 기획

SNS, 크리에이터 등이 인기있는 요즘, 자신의 사진과 작품을 공유하고 공감 하기를 원하는 사용자들을 위해 누구나 쉽게 자신의 사진으로 만화 작품을 그려낼 수 있는 AI 컨텐츠를 구상하고 사용자의 접근성과 원활한 서비스를 위해 flutter 앱 개발 환경과 함께 AWS서버를 활용한다.

모델선정-GAN

기존에 없던 가짜 이미지 생성을 위해 '적대적 생성 신경망'인 GAN 모델을 사용하기로 하고 중요 개념을 간단하게 정리하고 숙지 해본다.

▶ 쿨백-라이블러 발산(KL 발산)

  • 두 확률 분포 간의 유사도(similarity)를 알아내는 방법이다.
  • 확률 분포 p가 기대 확률 분포q 와 어떻게 다른지를 측정한다.
  • '유사도'란 '가짜'가 '진짜'와 유사한 정도이다.
  • KL 발산이 0이면 두 분포가 동일하다는 것을 의미하지만, 두 분포가 유사하다는 것을 보장하지는 않는다.
  • 두 개의 분포가 서로 다른 변수를 나타낼 때, KL 발산은 0이 되지만 이러한 분포들은 서로 완전히 다르다.

▶ 옌센-섀넌 발산(JS 발산)

  • 유사도를 측정하는 또 다른 기준이다.
  • KL 발산과 달리 JS 발산은 본질적으로 대칭이다.

▶ 내시 균형

  • 비유 하자면 경쟁자들이 서로 경쟁할 때 상대의 결정을 바탕으로 자신들의 최고 전략을 선택하게 되는 지점이며 전략을 바꿔도 더 이상 이익을 얻지 못하게 되는 상태이다.
  • 생성기(generator)와 판별기(discriminator)가 서로 경쟁하며 모델이 최적화되는 지점이며 더 이상 개선할 수 없는 상태를 의미한다.

▶ 목적함수

  • 목적 함수(Objective function)란 모델 학습에서 최적화할 대상이 되는 함수를 의미한다.
  • GAN 모델에서 생성기가 만들어낸 이미지와 실제 이미지 간의 차이를 측정하는 지표이다.
  • G, D 는 각기 자체 목적 함수를 가진다.
  • G는 총 출력을 최소화,텍스트 D는 최대화를 바라고 경쟁하며 내시 균형 상태에 도달한다.

▶ 인셉션 점수

▶ 프레셰 인셉션 거리

- 선정기준

초기 목표인 "AI를 활용해 손쉬운 만화제작" 을 구현하기 위한 GAN 모델들의 논문을 살펴보고 특성을 탐구한다

pix2pix

DCGAN
CycleGAN
pixel2style2pixel

0개의 댓글