이번 시간에는 음성으로 질문하면 음성으로 대답하는 인공지능 스피커를 만들어 보겠습니다. 이번 수업은 윈도우 10 운영체제의 PC 또는 노트북을 기준으로 설명합니다. 소리를 녹음할 수 있는 내장 또는 외장 마이크가 필요합니다.
진행 과정
-
AI 스피커를 위한 인공지능 생성
- 먼저 머신러닝 프리킥 페이지에 접속합니다.
- "시작해 봅시다" 버튼을 클릭하여 새 프로젝트를 만듭니다.
- 프로젝트 이름을 "AI 스피커"로 설정하고, 인식에서 "텍스트"를 선택합니다.
- 언어를 "코리안"으로 설정한 후 "만들기" 버튼을 클릭하여 머신러닝 프로젝트를 생성합니다.
-
AI 스피커 훈련
- AI 스피커 프로젝트로 들어가 "훈련" 버튼을 클릭합니다.
- 새로운 레이블을 추가하고, 레이블마다 5개 이상의 질문 데이터를 입력합니다. (Hello, time, weather, mill, exit)
- "새로운 머신러닝 모델을 훈련시켜보세요" 버튼을 클릭하여 훈련을 시작합니다.
-
프로그래밍 환경 설정
- VS Code를 실행하고 "AI 스피커.py"라는 새 파일을 생성합니다.
- 필요한 라이브러리를 임포트합니다. (gtts, playsound, requests, datetime 등)
- 머신러닝 프리킥 페이지에서 얻은 API 키를 코드에 입력합니다.
-
음성 인식 및 음성 합성 프로그램 작성
- 녹음을 시작하고 오디오 데이터를 텍스트로 변환하여 출력합니다.
- 변환된 텍스트를 AI 스피커에 보내 답변을 받습니다.
- 받은 답변을 음성으로 변환하여 저장하고 재생합니다.
- 사용자가 "종료해 줘"라고 말하기 전까지 반복하여 질문 및 응답을 진행합니다.
실행 방법
- VS Code에서 "Ctrl + F5"를 눌러 파이썬 파일을 실행합니다.
- 터미널 창이 열리면서 "녹음 시작"이 출력됩니다.
- 음성으로 질문을 하고, 녹음이 끝나면 음성 인식 결과가 출력됩니다.
- AI 스피커가 음성으로 답변하고, 해당 답변이 음성으로 재생됩니다.
- 사용자가 "종료해 줘"라고 말하기 전까지 계속해서 질문 및 응답이 반복됩니다.
아주 유용한 정보네요!