23차시 자연어 처리 기술 발전과 종류 및 사례

leeda06·2023년 7월 20일
0

AIFriendsSchool

목록 보기
23/32

자연어 처리와 소리 처리

자연어 처리

자연어 처리는 주로 자연어 이해와 자연어 생성으로 나뉩니다. 또한, 자연어는 문자 언어와 음성 언어로 나누어지며, 시각과 청각이라는 서로 다른 감각을 사용하는 표상체계입니다.

자연어 이해(Natural Language Understanding)

자연어 이해는 사람의 언어인 자연어를 컴퓨터가 이해하고 처리할 수 있도록 하는 기술을 의미합니다. 이 과정에는 형태소 분석, 구문 분석, 의미 분석, 화용 분석 등의 작업이 포함됩니다. 자연어 이해를 통해 컴퓨터는 사용자의 의도를 파악하고 명령을 이해할 수 있습니다.

자연어 생성(Natural Language Generation)

자연어 생성은 컴퓨터가 사람처럼 말하고 쓸 수 있도록 하는 기술을 의미합니다. 이 과정에서 컴퓨터는 사용자의 명령이나 요청에 맞게 문장을 생성합니다. 하지만 자연어 생성에는 성능적 한계가 있으며, 문맥에 따라 자연스러운 문장을 생성하는 것이 어려운 경우가 있습니다.

소리 처리

소리는 waveform 형태로 표현됩니다. Waveform은 x축이 시간을, y축이 진폭을 나타내는 그래프입니다. 소리 파동은 주기적으로 반복되며, 주기는 한 번 진동하는데 걸리는 시간을 의미합니다. 주파수는 단위 시간 1초에 진동하는 횟수로 표현되며, Hz라는 단위를 사용합니다.

소리를 숫자로 표현해 컴퓨터에 입력하려면 소리 파동의 높이를 일정한 간격에 따른 좌표 값으로 저장해야 합니다. 이 과정을 샘플링이라고 합니다. 샘플링을 통해 아날로그인 소리를 디지털 형태로 변환하여 컴퓨터가 처리할 수 있게 됩니다.

스펙트럼은 소리를 시간 영역이 아닌 주파수 영역으로 바라본 것을 의미합니다. 스펙트럼은 x축이 주파수, y축이 진폭인 그래프로 표현됩니다. 멜 스펙트로그램은 주파수 특성이 시간에 따라 달라지는 특징을 추출해내는 과정으로, 음성 처리에서 많이 사용됩니다. 멜 스펙트로그램을 이용하면 음성의 특징을 효과적으로 분석하고 처리할 수 있습니다.

profile
웹솔루션과

1개의 댓글

comment-user-thumbnail
2023년 7월 20일

글 잘 봤습니다, 감사합니다.

답글 달기