이번 시간에는 음성 인식(STT, Speech-to-Text)과 음성 합성(TTS, Text-to-Speech)을 이용하여 음성을 텍스트로 변환하고, 텍스트를 다시 음성으로 합성하는 프로그램을 만들어봅니다.
stt.py 파일은 음성을 텍스트로 변환하는 프로그램입니다.
speech_recognition
라이브러리를 import합니다.Recognizer
객체를 생성하고 변수 r
에 할당합니다. 이 객체를 사용하여 음성 녹음과 음성을 텍스트로 변환합니다.Microphone
객체를 이용하여 마이크를 오디오 소스로 사용합니다.r.recognize_google()
함수를 사용하여 오디오 데이터를 한국어 텍스트로 변환합니다.try-except
문을 사용하여 코드 실행 시 발생하는 에러를 처리합니다.tts.py 파일은 텍스트를 음성으로 합성하는 프로그램입니다.
speech_recognition
와 playsound
라이브러리를 import합니다.text
변수에 오디오로 변환할 텍스트를 저장합니다.speech
변수에 생성된 오디오 데이터를 저장할 파일 이름을 저장합니다.gTTS
객체를 생성하여 텍스트를 오디오로 변환합니다. 한글을 인식하도록 설정합니다.tts.save()
함수를 사용하여 오디오 데이터를 파일에 저장합니다.이제 stt.py
파일을 실행하면 음성을 텍스트로 변환하는 기능을, tts.py
파일을 실행하면 텍스트를 음성으로 합성하는 기능을 테스트할 수 있습니다. 음성 인식과 음성 합성을 통해 음성 데이터와 텍스트 데이터 간의 변환을 체험해보세요!
유익한 글 잘 봤습니다, 감사합니다.