저 모델을 사용하기 전에 먼저 학습시킬 데이터들을 준비해야 한다.나는 이쪽에서 참고를 했는데 이 게시글의 말에 따르면 학습시킬 모델들은 반주와 화음이 없는 노래음성, 잡음과 배경음이 없는 말하기 음성이 있어야 한다고 한다.그리고 음성 데이터 파일의 크기는 3 ~ 15초
추진 이유 유튜브를 보다가 어떤 영상을 보게 되었다. !youtube[NxQSxM0OkkY] 이미 돌아가신 故김광석님의 목소리로 김범수의 '보고싶다'를 부르는 장면이다. 이걸 보면서 생각했다. > 그럼, 목소리를 학습시키면 내가 원하는 가수의 목소리로 원하는 곡을