2021년 2학기부터 2022년 1학기까지 약 1년간 진행했던 졸업프로젝트가 드디어 막을 내렸다.
학기중이건 방학이건 쉴틈없이 달려와서 그런지 막상 끝나니까 시원섭섭하다.
일년간 내가 겪었던 모든 문제 해결의 경험과 감정들을 다 기록해두지 않아서 잘 기억이 안 나지만 최대한 복기해보고자 한다.
Why - 졸업 프로젝트!
What - 소멸위기에 처한 사투리 보전을 위한 제주어 오디오북
Who - 콩쥐와 두꺼비팀(김민주, 이채은, 정수진, 진정현)
How - 기계학습과 음성합성을 통해 사투리 발화 모듈을 만든 뒤, 이를 서버와 연결함
When - 대략 1년 (2021년 09월 ~ 2022년 6월)
코소롱은 사용자로부터 표준어 텍스트를 입력 받고 이를 제주어 오디오북으로 변환하는 웹 서비스이다.
언어학적으로 중요한 의미를 지니는 제주어를 보전할 필요성을 알리고 제주어에 대한 흥미를 고취시키는 것을 목적으로 한다.
이화여자대학교 컴퓨터공학전공 2022학년도 1학기 졸업프로젝트 우수상
내가 맡은 부분은 음성합성과 백엔드이다.
제주어의 억양을 살려 발화하는 음성합성 모델
학습 데이터셋으로 kaggle에 공개되어있는 제주어 단일 화자의 발화 음성 오디오 1만개 문장을 사용했다.
이 13시간 47분 분량의 데이터를 Glow-TTS에 학습시켜 제주어의 억양을 살려 발화할 수 있도록 했다.
Flask를 사용한 딥러닝 서버
기계학습 모델과 음성합성 모델을 Flask 서버에 올리고, 모델의 inference 결과를 API 서버(Django)에 넘겨주는 기능을 구현했다.
해결되지 않는 문제를 포기하지 않고 끝까지 파고들었다.
뭐든지 할 수 있다는 마음가짐 장착!
2주마다 보고서를 작성했다.
기계번역과 음성합성 모델을 딥러닝 서버에 어떻게 올리는거지?
거대한 딥러닝 서버를 배포할 수 있을까?
기계번역과 음성합성 모델을 딥러닝 서버에 올리기
거대한 딥러닝 서버를 배포하기
딥러닝 서버를 배포하고 API 서버에서 정상적으로 리스폰스를 받았을 때 플젝실에서 다같이 소리질렀던 기억이 잊히질 않는다.
낯선 기술과 도메인 속에서 좌절을 기본값으로 개발했었지만, 내 결과물의 작동이 성공했을 때의 짜릿함(?)으로 모든 노력이 다 보상받는 기분이었다.
이 맛에 삽질하는 것 같다.
또 신기했던 기억은 프로젝트 포스터를 만들면서 교수님과 면담했을 때의 일이다.
우리 팀은 모두 개발자로 이루어져있어서인지 포스터 내용이 90프로는 내부 구현에 관련된 내용이었다.
하지만 교수님께서 이런 포스터 세션이나 발표를 할 때에는 개발한 제품을 사용하고싶게 만드는 것이 우선이고, 그 다음이 기술에 대한 설명이라고 피드백해주셨다.
그저 제품을 만들어내는 과정에 몰두하다보니 정작 내가 만들어낸 제품의 목적성을 간과한 것이었다.
이 피드백을 계기로 서비스에 있어서 기획, 마케팅의 중요성을 깨닫게 되었고, 내가 개발하는 기능이 실제 제품에서 어떠한 목적을 가지고 작동하는지를 생각하면서 작업을 하게되었다.
이번 기수 졸업프로젝트는 팀이 거의 40개로 많아서 수상을 기대하지는 않았지만 우수상이라는 좋은 성과를 얻어서 더욱 뿌듯했다!
수고했다 나 자신!