-
jitter(주파수 변동률): 진동의 주기가 얼마나 일정한지 보여주는 수치.
-
shimmer(진폭 변동률): 진동의 진폭이 얼마나 일정한지 보여주는 수치, 불규칙할수록 값이 커진다.
-
HNR(배음대소음비): 70~4,500Hz 사이에 존재하는 배음과 1,500~4,500Hz사이에 존재하는 비정상 배음 간의 비율 평균치, 값이 클수록 소음의 비율이 높다.
-
측정대상: 해당 모음
-
측정 범위:
- 장모음 발성 구간의 시작, 중간, 끝 3군데에서 측정 (신유정 2017)
- 모음의 안정 구간 2초 측정 (한지은, 성철재 2012)
- 처음과 마지막 25ms 제외하구 안정된 3초 구간을 분석(김선우 외 2010, kent et al 2003)
-
해당 feature는 장모음을 일정한 길이만큼 발화하여 그 값의 변화량을 비교하는 것이므로 길이 정보가 중요할 것으로 예상됩니다. 따라서 추출하려는 모음의 길이를 일정하게 맞추는 것이 중요한 것으로 보입니다. 그리고 측정값이 변화를 보일만큼의 길이가 있어야 되는 것으로 보아 1.5초 정도가 적당해 보입니다.(심상용 외 2010)
-
대부분 언어 병리학, 딥러닝 관련 연구에서 음성 feature를 추출할 때 MDVP(가격이 비싸고, 병원이나 연구소에서 주로 사용됨)라는 프로그램을 사용하여 자동으로 추출했다고만 나오고 어떤 기준으로 추출했는지는 나와있지 않다.
reference
- 신유정(2017), 모음연장 음성 샘플의 분석구간에 따른 음향학적 파라미터 비교,한국산학기술학회논문지 18-7, 한국산학기술학회.
- 한지은,성철재(2018), 성대접촉이완훈련이 성대결절아동의 음성개선에 미치는 효과, 말소리와 음성과학 4-4, 한국음성학회.
- 심상용 외(2014), 성대결절 음성 중증도에 따른 MDVP와 Praat 프로그램 별 파라미터 차이, 말소리와 음성과학 6-2, 한국음성학회.
- 김선우 외(2010), 노령화에 따른 건강한 정상 성인의 음향음성학적 특성 비교, 말소리와 음성과학 2-4, 한국음성학회.
- Kent et al.(2003). Voice dysfunction in dysarthria: application of the Multi-Dimensional Voice Program™. Journal of Communication Disorders, 36(4), 281–306