30차시 [Advanced] 음성 인식, 음성 합성 프로그램 만들기

leeda06·2023년 7월 20일

AIFriendsSchool

목록 보기

30/32

이번 시간에는 음성 인식(STT, Speech-to-Text)과 음성 합성(TTS, Text-to-Speech)을 이용하여 음성을 텍스트로 변환하고, 텍스트를 다시 음성으로 합성하는 프로그램을 만들어봅니다.

음성 인식(STT) - stt.py

stt.py 파일은 음성을 텍스트로 변환하는 프로그램입니다.

speech_recognition 라이브러리를 import합니다.
Recognizer 객체를 생성하고 변수 r에 할당합니다. 이 객체를 사용하여 음성 녹음과 음성을 텍스트로 변환합니다.
Microphone 객체를 이용하여 마이크를 오디오 소스로 사용합니다.
r.recognize_google() 함수를 사용하여 오디오 데이터를 한국어 텍스트로 변환합니다.
try-except 문을 사용하여 코드 실행 시 발생하는 에러를 처리합니다.

음성 합성(TTS) - tts.py

tts.py 파일은 텍스트를 음성으로 합성하는 프로그램입니다.

speech_recognition와 playsound 라이브러리를 import합니다.
text 변수에 오디오로 변환할 텍스트를 저장합니다.
speech 변수에 생성된 오디오 데이터를 저장할 파일 이름을 저장합니다.
gTTS 객체를 생성하여 텍스트를 오디오로 변환합니다. 한글을 인식하도록 설정합니다.
tts.save() 함수를 사용하여 오디오 데이터를 파일에 저장합니다.
저장한 오디오 데이터를 불러와 실행하여 음성을 들을 수 있습니다.

이제 stt.py 파일을 실행하면 음성을 텍스트로 변환하는 기능을, tts.py 파일을 실행하면 텍스트를 음성으로 합성하는 기능을 테스트할 수 있습니다. 음성 인식과 음성 합성을 통해 음성 데이터와 텍스트 데이터 간의 변환을 체험해보세요!

웹솔루션과

이전 포스트

[Advanced] 음성/자연어 처리를 위한 Python 개발환경 구축

다음 포스트

31차시 - [Advanced] 나의 말을 따라 하는 프로그램 만들기

1개의 댓글

2023년 7월 20일

유익한 글 잘 봤습니다, 감사합니다.

답글 달기