ADSV와 MDVP 음성 파라미터 간의 상관연구
초록
Multi-Dimensional Voice Program (MDVP)과 Analysis of Dysphonia in Speech and Voice (ADSV)를 사용한 정상인과 음성장애인의 성별에 따른 규준 데이터가 부족한 편이다. 본 연구는 MDVP와 ADSV를 통해 정상 20대 남녀의 음향학적 파라미터 평균값을 알아보고, 파라미터 값의 성별 간 차이와 MDVP와 ADSV 측정치 간의 상관을 알아보고자 하였다.
정상청력을 가지고 있고 성대 질환이 없는 20대 성인 남녀 각 50명씩 100명의 대상자들의 음성샘플을 분석하였다. 발화 과제는 모음발성과 문장읽기를 실시하였다. ADSV에서는 Cepstral Peak Prominence (CPP), Cepstral Peak Prominence Fundamental Frequency (CPPF0), Low/High spectral ratio (L/H ratio), Cepstral/spectral index of dysphonia (CSID)를, MDVP에서는 Jitter, Shimmer, NHR, F0를 측정하였다.
MDVP에서 주파수변동률(Jitter), 소음대배음비(NHR)는 남녀 간에 유의한 차이가 있었으나, 진폭변동률(Shimmer)은 두 집단 간에 유의한 차이가 없었다. ADSV에서 모음발성, 읽기 과제에서 CPP, CSID, L/H ratio 모두 남녀 간 유의한 차이를 보였다. 또한 두 읽기 과제 간에 CPP, CSID, L/H ratio에서 강한 상관관계가 나타났으며, 연결발화 과제의 CSID-CPP, CSID-L/H ratio 간 강한 상관관계가 나타났다.
MDVP와 ADSV의 파라미터에서 남녀 간의 차이가 나타났다. 따라서 성별에 따른 음질의 기준값을 설정할 필요가 있다. 그리고 MDVP와 ADSV 간에 강한 상관이 있다는 점에서 볼 때, 기기 간 측정치를 어느 정도 예측함으로써 임상에서 기기 측정치를 유용하게 사용할 수 있을 것이다.
Abstract
A lack of normative data based on gender of normal- and voice-disordered persons in MDVP and ADSV exists. This study was designed to derive average values for men and women in their 20s through MDVP and ADSV, and to determine whether a statistic difference exists between each parameter and gender and the correlation between MDVP and ADSV measurements.
One hundred subjects (50 males, 50 females) with normal hearing and voice participated in this study. We analyzed prolongation of /a/ and ‘Walk' and ‘Fall' passages voice samples. The ADSV measured CPP, L/H ratio and CSID, and the MDVP measured jitter, shimmer, NHR.
In MDVP, jitter and NHR were significantly different between men and women, but shimmer was not significantly different between the two groups. In ADSV, CPP, CSID, and L/H ratio were significantly different between males and females in vowel and connective utterance (Gaeul, Sanchaek) tasks. In addition, there was a strong correlation between CPP, CSID, and L/H ratio between 'Autumn' and 'Walking' paragraphs. There was a strong correlation between CSID-CPP and CSID-L/H ratio in the connection ignition task.
The parameters of MDVP and ADSV show differences between men and women. Therefore, it is necessary to establish a normative value according to gender that could be used clinically by estimating measurements between devices based on strong correlation between MDVP and ADSV.
Keywords:
ADSV, MDVP, Cepstral, CPP키워드:
ADSV, MDVP, 캡스트럼, CPPⅠ. 서 론
현재 임상에서 가장 많이 사용되고 있는 음향학적 평가 도구인 Computerized Speech Lab(CSL, KayPENTAX)의 Multi-Dimensional Voice Program (MDVP)는 음성분석에서 대표적으로 사용되는 프로그램으로 기본주파수(F0), 주파수 변동 관련 측정치 지터(Jitter), 진폭 변동과 관련된 쉬머(Shimmer), 소음과 조화음의 연관성을 보는 소음대 배음비(Noise to Harmonics Ratio; NHR) 등으로 목소리를 좀 더 세밀하고 객관적으로 측정하고 평가한다(유재연 등, 2003). 또한 MDVP는 기본주파수 기반으로 분석이 이루어지기 때문에 경미한 음성장애에게 매우 유용한 도구이다(Kim et al., 2015). 그러나 MDVP는 기본주파수와 성대진동양상의 가변성으로 인해 변동률 측정이 난해한 연결발화를 분석하기에 상당한 제약이 있으며, 기본주파수가 검출이 안 될 정도로 심각한 음질의 경우에는 배음구조가 명확하지 않아 검사의 신뢰도가 떨어질 수 있다(Yu et al., 2017).
캡스트럼 분석(cepstral analysis)은 스펙트럼에 로그 함수를 취한 로그 스펙트럼을 역푸리에 변환한 결과물로 신호의 주기성에 대한 정보를 분석하는데 용이하다(Kim et al., 2017). Quefrency 영역에서 음성의 조화음과 공명주파수를 분리하므로 신호의 주기성에 대한 신뢰도가 높으며, 정확한 기본주파수 추출을 요하지 않아 중증도가 심한 음성뿐 아니라 매우 비주기적인 음성 신호, 모음, 연결발화 분석 시 타당한 결과를 제공한다(Choi & Choi, 2016). Cepstral Peak Prominence(CPP)는 전체 캡스트럼의 회귀선과 캡스트럼 정점 간 강도의 차이를 말하며, 비주기적 신호보다는 주기적 신호에서 peak가 더 두드러지는데 즉, CPP는 배음 성분이 잘 나타나는 정상음성에서 높은 값을 나타내지만 반대로 음성문제가 심각한 경우에는 낮은 값을 나타낸다(Awan& Roy, 2006; Awan & Roy, 2009; Park et al., 2013; Yu et al., 2017). Low/High spectral ratio(L/H ratio)는 스펙트럼 상에서 4KHz 주파수 영역을 기준으로 위아래의 평균 에너지의 비율을 나타낸다. 일반적인 말소리의 주파수 영역은 1,000~4,000Hz에 속하여 기준 이상의 주파수 영역을 소음으로 구분한다. 정상 음성에서는 저주파수 영역의 에너지가 고주파수 영역의 에너지보다 많아지므로 저주파수대고주파수비가 높은 값을 보이고 병리적으로 기식적인 음성일수록 낮은 값을 나타낸다(Choi & Choi, 2016; Yu et al., 2017). 음성의 장애 정도를 수치화한 캡스트럼-스펙트럼 발성장애지수(Cepstral/Spectral Index of Dysphonia, CSID)는 CPP, L/H ratio, 성별 정보를 다중회귀방식으로 가중치를 주어 산출되며, 음성 장애 중증도가 높을수록 수치가 증가한다. 선행연구에서 CSID가 청지각적 평가 간 높은 상관이 있을 뿐 아니라 음성장애 선별과 중재효과에서 높은 예측력을 보인다고 보고되었다(Awan et al., 2016; Shim et al., 2016).
이러한 CPP값은 발성 내용과 발성 방식의 영향을 받는데, 연장발성과 문장읽기, 자발발화 등 과업에 따라 차이가 나타나며, 기식음 인식 정도 사이에도 유의한 상관관계가 있다. 문장 내 무성음 구간의 유무에 따라서도 달라지지만, 유성음과 무성음의 구분에 대한 신뢰도가 높지 않기 때문에 문장 전체에 대해 CPP를 구하는 방법을 주로 사용한다(Hillenbrand & Houde, 1996).
임상에서 음향학적 음성평가 시 일반적으로 모음발성을 통해 음성장애 선별과 비정상적인 정도를 평가하는데 이는 바쁜 임상 현장에서 개인의 발화패턴과 말 속도 등에 대해서 비교적 간단하고 객관적인 정보를 수집할 수 있다는 장점이 있기 때문이다(Kim et al., 2015). 하지만 모음발성만으로는 음성장애를 감별하고 중증도를 결정하는데 한계가 있다. 모음발성은 일상생활에서의 발화 패턴을 반영하는데 있어서 충분하지 않고, 연결발화보다 기식성 음성을 분석하는데 민감도가 떨어지므로 음성장애 정도를 평가하는데 한계가 있다. 반면에 연결발화는 환자의 일상생활의 발화 패턴과 음질이 잘 반영되므로 그 중요성이 강조되고 있다(Choi & Choi, 2016).
최근 연구에서는 스펙트럼(spectrum)과 캡스트(cepstrum) 분석이 가지고 있는 유용성에 대해 보고되고 있는데 기존의 주파수 기반의 변동률 분석에 비해 스펙트럼과 캡스트럼 분석은 청지각적 평가 간 높은 상관성이 있을 뿐 아니라 음성장애의 감별과 중재효과에 대한 예측에서 높은 정확도를 가진다고 보고되어왔다(Awan & Roy, 2006; Awan & Roy, 2009; Shim et al., 2016).
국내연구에서는 스펙트럼과 캡스트럼 연구가 활발히 이루어지고 있으나 성별에 따른 규준 데이터가 부족한 편이다. Shim 등(2014)의 연구에서 후두적출술을 받은 식도발성 환자와 노인화자를 대상으로 모음발성으로 캡스트럼 분석을 실시하였으며, 모두 남성이었다. Choi와 Choi(2016)의 연구에서 만 20~30대 정상 성인 51명만을 대상으로 하였다. Pyo 등(2002), Lee & Kim(2006), Kim(2009)의 연구와 같이 음향학적 측정치 중 대표적으로 사용되는 Jitter, Shimmer, NHR의 정상 기준치에 대한 국내 연구들에서도 성별에 따른 데이터 연구가 활발하게 이루어지고 있지만 캡스트럼 연구에서는 성별에 따른 데이터가 부족한 실정이다. 따라서 본 연구는 스펙트럼과 캡스트럼 연구의 중요성을 강조하고, 20대 정상성인 남녀의 음성 데이터를 제공함으로써 향후 스펙트럼과 캡스트럼 분석의 규준데이터에 대한 후속연구 시 참고자료로 활용되어 도움을 주고자 하였다. 또한 MDVP와 ADSV(Analysis of Dysphonia in Speech and Voice)의 각 측정치와 집단 간 차이를 분석하고, 동일한 음성에서 구어과제에 따라 음성 파라미터 값이 어떻게 산출되는 지와 음성 매개변수들 간의 상관관계를 알아봄으로써 특정 기기에서 얻어진 값이 다른 기기에서 얻을 수 있는 측정치를 어느 정도 추측 가능한 지와 구어과제(모음, 가을, 산책 문단) 간의 측정값이 서로 신뢰할 수 있는지를 알아보고자 한다. 또한 이를 통해 임상 현장에서의 활용성을 살펴보고자 한다.
Ⅱ. 연구 방법
1. 연구 대상
본 연구는 20대 정상 성인 남녀 각 50명씩 총 100명을 대상으로 연구윤리동의서를 작성하고 실시하였다. 대상자의 연령 분포는 20~29세로, 남성의 평균연령은 22.16세, 여성의 평균연령은 22.78세로, 남성과 여성의 평균연령은 통계적으로 유의한 차이가 없었다. 이들은 면담을 통해 음성을 전문적으로 사용하지 않고, 정상 청력을 지녔으며, 최근 3개월 동안 후두질환, 호흡기질환 및 신경계질환의 병력이 없고, 조음기관의 구조적·기능적 이상이 없으며, 1급 언어재활사 자격증을 소지한 음성치료사 1명이 자발화를 통해 GRBAS 척도에서 G 척도가 0으로 음질의 문제가 없는 사람을 대상으로 하였다.
2. 검사도구
20대 정상 성인 남녀 100명의 모음발성과 연결발화시 음질 파라미터 값을 산출하기 위해 Computerized Speech Lab(CSL, KayPENTAX, MODEL 4150B) 중 Analysis of Dysphonia in Speech and Voice 4150B(ADSV)를 이용하여 캡스트럼 분석을 실시하였다.
연결발화 과제에서 ‘가을’ 문단(김향희, 2005)의 ‘우리나라의 가을은 참으로 아름답다. 무엇보다도 산에 오를 땐 더욱 더 그 빼어난 아름다움이 느껴진다.’(41음절)과 ‘산책’ 문단(정옥란, 1994)의 ‘높은 산에 올라가 맑은 공기를 마시며 소리를 지르면 가슴이 활짝 열리는 듯하다.’(32음절) 문장을 사용하였다.
20대 정상 성인 남녀 100명의 모음발성과 시 음질 파라미터 값을 산출하기 위해 Computerized Speech Lab(CSL, KayPENTAX, MODEL 4150B) 중 Multi-Dimensional Voice Program 4150B(MDVP)를 이용하여 변동률 분석을 실시하였다.
3. 실험방법
모든 음성데이터는 소음이 통제된 음성분석실에서 수집하였으며, DYNAMIC LO Z, SHURE SM48 마이크를 스탠드에 고정하여 입과 마이크 거리가 10cm 정도를 유지한 상태에서 대상자가 일상 발화 음도와 강도로 편안하게 발성하도록 하였다. 또한 대상자가 긴장하지 않도록 자동구어를 1~2차례 연습을 시행한 후 발성하게 하였다. 녹음 프로그램은 Computerized Speech Lab(CSL, KayPENTAX, Model 4150B) 중을 사용하였으며 44,100 Hz 표본추출률, 16 bit 양자화하여 음성을 녹음하였다.
MDVP를 사용하여 대상자는 편안한 상태에서 3초 이상 모음 발성과 ‘가을’ 문단의 41음절과 ‘산책’ 문단의 32음절 읽기를 수행하였으며 과제읽기 순서는 무작위 형식으로 실시하였다.
CSL의 MDVP에서 수집된 모음발성 자료는 MDVP에서 시작과 종료 부분 각 1초를 제외한 안정된 1.5초 구간을 편집하여 저장하였다. MDVP를 이용하여 변동률 분석을 하였고, ADSV를 이용하여 캡스트럼 분석을 실시하였다.
편집된 모음발성 자료를 통해 MDVP에서 jitter, shimmer, NHR, F0 등을 측정하였고, ADSV에서 CPP, CPPF0, L/H ratio, CSID 등을 측정하였다.
연결발화 분석은 MDVP에서는 분석이 불가능하여 ADSV에서 캡스트럼 분석만 실시하였다. 연결발화의 모든 구간을 분석하되 앞에 묵음구간이 분석 결과에 영향을 미칠 수 있어 제외하였다.
20대 정상 성인의 음성 파라미터의 값과 상관성을 알아보기 위해 통계 프로그램 SPSS version 25.0(IBM Co., New York, NY, USA)을 사용하였다. MDVP와 ADSV 측정치의 평균 및 표준편차를 알아보기 위하여 기술통계를 사용하였고, 남녀 간 음성파라미터 차이를 살펴보기 위하여 독립표본 t-test를 실시하였다. 마지막으로 MDVP와 ADSV 파라미터 간의 상관성을 살펴보기 위하여 Pearson 상관분석을 실시하였고 유의수준은 .05수준으로 하였다.
Ⅲ. 연구 결과
1. MDVP
MDVP를 사용하여 20대 성인 100명의 /a/ 연장발성 시 음질 파라미터 값과 집단 간 유의한 차이는 표 1과 같았다.
남녀 각 50명을 대상으로 MDVP의 jitter, shimmer, NHR를 측정한 결과 jitter에서 남성 0.56(±0.34), 여성 0.92(±0.71), shimmer에서 남성 2.95(±1.34), 여성 3.38(±1.25), NHR에서 남성 0.13(±0.01), 여성 0.12(±0.01)로 나타났다.
성별 간 Jitter, Shimmer, NHR에서 통계적으로 차이가 있는지 알아본 결과, Jitter, NHR에서 남녀 간의 유의한 차이가 있었다. 반면 Shimmer에서 두 집단 간에 유의한 차이는 없었다.
2. ADSV
ADSV를 사용하여 20대 성인 100명의 모음발성과 연결발화(가을, 산책 문단) 시 음질파라미터 값과 집단 간 유의한 차이는 표 2와 같았다.
ADSV의 CPP, L/H ratio, CSID를 측정한 결과 ‘가을’과제에서 CPP는 여성 6.93(±0.93), 남성 8.05(±0.84)으로 나타났으며, CPPF0에서 여성 211.63(±16.43), 남성 134.04(±12.06)으로 나타났고, CSID에서 여성 0.33(±11.62), 남성 –17.14(±10.22)로 나타났으며, L/H ratio에서 여성 29.16(±2.74), 남성 32.37(±2.68)로 나타났다. ‘산책’과제에서 CPP는 여성 6.80(±0.88), 남성 8.15(±1.02)로 나타났으며, CPPF0에서 여성 248.04(±245.87), 남성 128.42(±12.22)으로 나타났고, CSID에서 여성 –3.67(±10.95), 남성 –18.59(±10.13)으로 나타났으며, L/H ratio에서 여성 28.58(±2.66), 남성 32.18(±2.52)으로 나타났다. /a/ 연장발성과제에서 CPP는 여성 11.82(±1.42), 남성 15.05(±1.70)으로 나타났으며, CPPF0에서 여성 225.76(±23.61), 남성 122.89(±16.33)으로 나타났고, CSID에서 여성 -.03(±8.27), 남성 –4.93(±9.90)로 나타났고, L/H ratio에서 여성 29.24(±4.69), 남성 32.64(±4.21)으로 나타났다.
성별 간 CPP, L/H ratio, CSID에서 통계적으로 유의한 차이를 알아본 결과, ‘가을’과제 CPP, CSID, L/H ratio에서 남녀 간 유의한 차이가 있었다(p<.01). ‘산책’과제에서 CSID를 제외한 CPP, L/H ratio에서 유의한 차이가 있었다(p<.01). 모음발성과제에서 CPP, CSID, L/H ratio에 남녀 간 유의한 차이가 있었다(p<.01).
3. MDVP와 ADSV 파라미터 간 상관관계
20대 성인 남녀 100명의 MDVP와 ADSV 측정치 간의 상관관계을 알아본 결과 표 3과 같았다.
구어과제(모음발성, 연결발화)에 따른 MDVP의 변동률 측정치(Jitter, Shimmer, NHR, F0)와 ADSV의 캡스트럼 측정치(CPP, CPPF0, CSID, L/H ratio)의 상관관계를 분석한 결과, Jitter는 모든 과제(모음발성, 연결발화)에서의 CPP와 부적 상관관계를 보였고(p<.01), CSID와 정적 상관관계를 보였다(p<.05, p<.01). Shimmer는 ‘가을’과제의 CPP와 부적 상관관계을 보였고(p<.05), 모음발성과제의 CPP와도 부적 상관관계를 보였으며(p<.01), ‘가을’과 모음발성과제의 CSID와 정적 상관관계를 보였다. NHR은‘산책’과제의 CPP(p<.01)와 모음발성과제에서 CSID에서 정적 상관관계를 보였으며(p<.05), 모든 과제의 CPPF0와 부적 상관관계를 보였다(p<.01).
음성 파라미터 간의 상관성을 살펴본 결과, 통계적으로‘가을’과 ‘산책’과제 간에 CPP와 L/H ratio, CSID에서 강한 상관관계가 있는 것으로 나타났다. 또한 연결발화 과제에서 CSID-CPP, CSID-L/H ratio 간 강한 상관관계를 보였다.
Ⅳ. 논의 및 결론
본 연구는 20대 성인 남녀 각 50명씩 총 100명을 대상으로 모음발성과 연결발화(‘가을’, ‘산책’) 과제를 통해 MDVP와 ADSV 음성 파라미터 값의 평균 및 표준편차, 성별 간 차이, 파라미터 간 상관관계를 살펴보았다.
MDVP에서 각 파라미터의 성별 간 차이를 살펴본 결과, Jitter, NHR에서 유의한 차이가 있었지만, Shimmer에서 두 집단 간에 유의한 차이는 없었다. 또한 주파수 변동과 관련된 Jitter에서 여성이 남성보다 더 높게 나타났으며, 잡음과 관련된 NHR에서는 남성이 더 높게 나타났다. 이는 Jitter의 경우 대체로 남성이 여성보다 낮은 수치를 보였고, NHR에서는 남성이 여성보다 높은 수치를 나타낸다고 보고한 이효진, 김수진(2006), 표화영 등(2002)의 연구 결과와 일치하였다. 또한 단기간 동안의 기본주파수 변이는 여성이 더 높게 나타나며, 전반적인 잡음과 진전이 일반적으로 여성보다 남성이 더 높으며 고주파수에 존재하는 배음 에너지의 비율이 저주파수에 존재하는 배음 에너지보다 낮다고 한 김재옥(2009)의 연구 결과와 일치하였다.
MDVP의 Jitter는 모든 과제에서의 CPP와 부적 상관성을 보였으며, CSID에서 정적 상관성을 보였다. Shimmer는 ‘가을’, 모음발성과제에서 CPP와 부적 상관성을 보였으며, ‘가을’과 모음발성과제에서 CSID와 정적 상관성을 보였다. NHR은‘산책’과제의 CPP와 모음발성과제의 CSID에서 정적 상관성을 보였으며, CPPF0와 부적 상관성을 보였다. 문단 읽기 과제에서 CPP와 Jitter, Shimmer 사이에 부적 상관성이 있다고 보고한 유미옥 등(2017), 이승진 등(2018)의 연구결과와 일치하였다.
ADSV에서 각 파라미터의 성별 간 차이를 살펴본 결과, 모든 과제에서의 CPP, CPPF0, L/H ratio와 ‘가을’, 모음발성과제에서의 CSID에서 유의미한 차이가 있었지만, ‘산책’과제의 CSID에서 유의미한 차이가 없는 것으로 나타났다. CSID는 CPP와 L/H ratio, 성별에 대한 정보를 회기식에 자동화하여 산출되는 지수로, 음성의 비정상정도를 나타낸다. 본 연구에서는 ‘가을’과 모음발성과제에서 여성이 남성보다 더 높은 값을 나타냈지만, 남녀 모두 CSID값이 1이하의 낮은 수치로 비교하기에는 제한점이 있다. 본 연구에서는 모든 과제에서 상대적으로 남성이 여성보다 높은 CPP값을 나타내었는데 일반적으로 여성이 남성에 비해 기식성 음질의 특성을 보여주므로 남성이 여성보다 높은 CPP값을 나타낸다고 한 Biever & Bless(1989), 이승진 등(2017), 최성희, 최철희(2016), 강영애, 성철재(2012), 이승진 등(2018)의 연구 결과와 일치하였다. 또한 모든 과제에서 L/H ratio값이 여성보다 남성이 더 높게 나왔는데 이는 L/H ratio가 CPP와 더불어 고주파수 영역에서 높은 소음성 에너지를 갖는 기식성과 관련이 있을 것으로 생각된다(Biever & Bless, 1989; Lee et al., 2018; 최성희, 최철희, 2016; 신희백 등, 2018),
손기옥 등(2018)의 연구에서는 남성이 여성보다 CPP, L/H ratio이 높게 나타났으며, ‘가을’과제의 CSID는 낮게 나타났지만, 모음발성과제의 CSID는 높게 나타났다. 이는 본 연구결과와 부분적으로 일치하였다. 또한 60대 여성의 모음발성과제의 CPP값은 11.72(±1.57), 70대 여성은 11.21(±1.37), 80대 여성은 10.86(±2.05)로 본 연구의 20대 여성의 모음발성과제 CPP값은 11.82(±1.42)로 제일 높았으며, 60대 남성의 모음발성과제의 CPP값은 12.16(±2.00), 70대 남성은 12.20(±1.40), 80대 남성은 10.66(±2.54)으로 본 연구의 20대 남성의 모음발성과제 CPP값은 15.05(±1.70)로 제일 높았다. CPP는 연령이 증가함에 따라 모음발성과제의 CPP값이 점차 감소하는 양상을 보이는데 이는 연령이 증가함에 따라 음성의 주기성과 배음구조에 일부 영향을 주기 때문으로 해석된다(Lowell et al., 2012; 손기옥, 2018). Infusino(2015)의 연구에서는 4~17세의 남녀를 대상으로 CPP를 살펴보았는데, 성장이 진행되고 있는 단계에서는 연령이 높아질수록 음성조절이 더 잘 되어 CPP가 높다고 하였다. 그러나 어린 여성과 20대 여성의 CPP값을 비교한 Ryan(2016)은 CPP값이 연령에 따라 유의한 차이를 보이지 않는다고 보고하였다. 또한 Garrett(2013)의 연구에서는 40~50대 정상성인의 CPP 값을 살펴보았을 때, 연령이 증가함에 따라 그 값이 감소하는 양상을 보였다고 하였다. 이는 성장하는 단계에서 음성조절 능력이 증가함에 따라 CPP값이 높아지지만, 음성 노화가 시작되는 단계에서는 CPP값이 감소할 것으로 예측할 수 있다.
Hillenbrand, Houde(1996)는 CPP가 연장발성, 연결발화 과제에서 기식음 인식 정도 사이에 유의미한 상관관계가 있다고 보고하였다. 본 연구에서도 구어과제에 따른 CPP값의 차이를 살펴본 결과, 모음발성과제의 CPP가 연결발화의 CPP보다 상대적으로 높은 값을 나타내었다. 이 결과는 연결발화에 비해 모음발성과제에서 더욱 많은 유성 구간이 포함되어 있으며 문단 읽기 시 쉼 구간의 영향으로 인한 것이라는 김근효 등(2016, 2017), 이승진 등(2018)의 연구 결과와 일치하였으며, 연결발화가 모음발성에 비해 성대진동이 되지 않는 분절음 부분이 많으며 파열음, 마찰음, 파찰음과 같은 음소로 구성되어 있기 때문이라고 보고한 최성희, 최철희(2016)의 연구결과와도 일치하였으며, 모음발성과제보다 연결발화과제에서 기식음성을 더 잘 변별할 수 있다는 김태환 등(2015)의 연구 결과와도 일치하였다.
MDVP와 ADSV의 변수들 간 상관관계를 확인한 결과, CPP는 Jitter와 Shimmer에서 부적 상관관계를 나타냈는데, 이는 CPP가 조화음의 구조가 잘 나타나는 정상음성에서 높은 값을 나타내지만 반대로 음성문제가 심각한 경우에는 낮은 값을 나타낸다는 유미옥 등(2017), 이승진 등(2018)의 연구결과와 일치하였다. 또한 CSID가 CPP, L/H ratio와 강한 부적 상관성을 보이는 것에서 CSID가 기식성과 같은 음질의 비정상정도와 높은 상관관계가 있다고 한 서인효, 이옥분(2015)의 연구결과와 연결할 수 있다.
본 연구 결과에서 통계적으로‘가을’과 ‘산책’과제 간에 강한 상관관계가 있는 것으로 나타났으며, 연결발화 과제에서 CPP와 CSID, L/H ratio와 CSID 간에 강한 상관관계를 나타내었다. 이는 음성 중증도가 심할수록 CPP는 감소하고 CSID는 증가하는 양상을 보인다는 선행연구들과도 연결할 수 있다(Awan et al., 2010; 서인효, 이옥분, 2015; 심희정 등, 2016). 또한 연장발성과 연결발화 과제 간 측정치들의 상관관계가 0.5 수준으로 관찰되었다. 이는 국내 선행연구와는 일치하지 않는 부분도 있지만 상관성이 매우 높지 않다는 점에서 다양한 과제를 통한 음향학적 평가의 필요성을 시사할 수 있다고 본다(최성희, 최철희, 2016; 이승진 등, 2018).
일반적으로 ADSV에서 음질 평가에 많이 활용되는 대표적인 파라미터는 CPP값이다. 이 연구를 통해 ‘가을’과‘산책’문단의 CPP값은 아주 강한 상관이 있는 것으로 나타났다. 그리고 나머지 파라미터에서도 어느 정도의 강한 상관이 있는 것으로 나타났는데, 임상적으로 음질을 분석하는데 많이 사용되는 CPP값의 활용도적인 측면에서 고려해본다면 ‘가을’문단과 ‘산책’문단의 강한 상관관계를 토대로 이 값들을 해석하는데 있어 참고가 될 수 있다. 즉, ‘산책’문단을 사용하거나 ‘가을’문단을 사용할 때 그 CPP값은 서로 신뢰할 수 있다고 볼 수 있다.
본 연구에서는 각 평가도구 간의 소음 관련 파라미터의 값(NHR, CPP, L/H ratio)의 상관계수가 낮게 나타났다. 반면 CPP값은 전반적으로 Jitter, Shmmer와 유의한 상관이 있는 것으로 나타났다. 이는 CPP, L/H ratio가 NHR보다는 Jitter와 Shimmer와 유의한 상관이 있다는 것을 나타내고 있는데, 이는 CPP와 L/H ratio의 소음 수준보다는 주파수 및 진폭 변동과 더 관련성이 높다는 것을 의미한다. Madill 등(2019)의 연구에서 CPP와 HNR 간의 유의한 상관이 없으며, CPP가 noise 관련 수치와는 상관이 낮다고 보고하였는데, 이는 본 연구결과와 일치하였다. 또한 파라미터의 알고리듬에서 본다면, Jitter, Shimmer의 수치보다 상대적으로 NHR 수치가 작고 음질변화에 따라 NHR의 수치가 Jitter와 Shimmer에 비해 작은 폭으로 변한다는 측면에서 NHR이 CPP값과 유의한 상관이 없거나 Jitter와 Shimmer에 비해 상관이 약한 것으로 추측된다. 따라서 본 연구는 정상 음성만을 분석했음으로 차후 연구에서는 기식성의 병리적 음성을 분석하여 NHR값의 변화에 따른 CPP와 NHR의 상관을 좀 더 면밀하게 알아볼 필요가 있을 것이다.
본 연구결과에서 캡스트럼 변수 CPP, L/H ratio 모두 남성이 여성보다 높게 나타났음에도 불구하고 주파수기반 변수 NHR에서 또한 높게 나타났다. 이는 Jannetts & Lowit(2014), 김재옥(2009), 최성희, 최철희(2016), 이승진 등(2018)의 연구들과도 일치하였는데, 연령대를 막론하고 정상여성의 성문 틈에 기인한 다소간의 기식성이 변수들에 영향을 준 것으로 생각된다(이승진, 2018).
본 연구는 성별 간의 음성 파라미터 측정치를 비교하였지만 어느 성별의 음질이 더 좋고 나쁘다고 단정하는 것은 성급할 수 있다고 생각된다. 앞으로 후속연구에서 숙련된 전문가의 청지각적 평가와 CPP, CPPF0, CSID, L/H ratio 이외에도 CPP sd, L/H ratio sd, CSID sd 등 다양한 변수 간의 상관관계를 살펴본다면 더욱더 음향학적 분석에 따른 성별 차에 대한 심층적이고 정밀한 연구가 될 수 있을 것으로 보인다.
본 연구에서는 남녀 100명의 피험자를 대상으로 하여 MDVP와 ADSV 파라미터 값의 성별 간 차이를 알아보았다. 선행 연구에서 캡스트럼 분석은 음성장애 중증도 예측과 음성치료 전후 변화 지표에 민감하다고 하였으나(Awan, Roy, 2006, 2009), 기존의 변동률 분석같이 표준화된 규준치를 제공하지 못하고 있다. 본 연구는 20대 남녀의 대표적인 음성을 분석하는 것에는 다소 표집 수가 적었는데 후속연구에서는 더 많은 대상자와 연령대의 피험자를 대상으로 하는 연구가 필요할 것으로 사료된다. 캡스트럼의 표준화된 객관적 수치를 제공한다면 임상현장에서 병리적인 음성을 평가하는데 유용할 것이며 음성 치료 전후를 비교함으로써 효과를 증명하는데도 유용한 지표로 쓰일 것으로 사료된다. 또한 본 연구는 연결발화 과제에서 ‘산책’과 ‘가을’문단 간 음절수를 맞추지 못하였는데 문단 내의 음절수와 음소구성의 차이로 인해 CPP값이 변할 수 있다. 차후 연구에서는 문장 내 음절수와 CPP에 영향을 줄 수 있는 변수들을 통제할 필요성이 있을 것이다. 본 연구는 정상음성으로 MDVP와 ADSV의 여러 파라미터 값을 측정하고 파라미터 간의 상관을 알아보았다. 차후 연구에서는 경미한 음성장애 뿐만 아니라 중도의 음성에서는 파라미터 간에 어떤 상관성이 있는지를 살펴볼 필요가 있을 것이다.
Acknowledgments
This paper was based on the presented study at the 20th Conference on Korean Speech-Language & Hearing Association.
이 논문은 제20회 한국언어치료학회 학술대회에서 발표한 논문을 수정보완하였음.
References
- Awan, S. N., & Roy, N. (2006). Toward the development of an objective index of dysphonia severity: A four‐factor acoustic model. Clinical Linguistics & Phonetics, 20(1), 35-49. [https://doi.org/10.1080/02699200400008353]
- Awan, S. N., Roy, N., Zhang, D., & Cohen, S. M. (2016). Validation of the cepstral spectral index of dysphonia (CSID) as a screening tool for voice disorders: Development of clinical cutoff scores. Journal of Voice, 30(2), 130-144. [https://doi.org/10.1016/j.jvoice.2015.04.009]
- Awan, S. N., & Roy, N. (2009). Outcomes measurement in voice disorders: Application of an acoustic index of dysphonia severity. Journal of Speech, Language, and Hearing Research, 52(2), 482-499. [https://doi.org/10.1044/1092-4388(2008/08-0034)]
- Awan, S. N., Roy, N., Jetté, M. E., Meltzner, G. S., & Hillman, R. E. (2010). Quantifying dysphonia severity using a spectral/cepstral-based acoustic index: Comparisons with auditory-perceptual judgements from the CAPE-V. Clinical Linguistics & Phonetics, 24(9), 742-758. [https://doi.org/10.3109/02699206.2010.492446]
- Biever, D. M., & Bless, D. M. (1989). Vibratory characteristics of the vocal folds in young adult and geriatric women. Journal of Voice, 3(2), 120-131. [https://doi.org/10.1016/S0892-1997(89)80138-9]
-
Choi, S. H., & Choi, C. H. (2016). The effect of gender and speech task on cepstral-and spectral-measures of Korean normal speakers. Audiology and Speech Research, 12(3), 157-163.
최성희, 최철희 (2016). 한국 정상 화자의 캡스트럼과 스펙트럼 측정치의 성별과 발화 과제 효과. Audiol Speech Res, 12(3), 157-163. [ https://doi.org/10.21848/asr.2016.12.3.157 ] - Garrett, R. (2013). Cepstral-and spectral-based acoustic measures of normal voices (Master's thesis). University of Wisconsin-Milwaukee, Wisconsin,
- Hillenbrand, J., & Houde, R. A. (1996). Acoustic correlates of breathy vocal quality: Dysphonic voices and continuous speech. Journal of Speech, Language, and Hearing Research, 39(2), 311-321. [https://doi.org/10.1044/jshr.3902.311]
- Jannetts, S., & Lowit, A. (2014). Cepstral analysis of hypokinetic and ataxic voices: Correlations with perceptual and other acoustic measures. Journal of Voice, 28(6), 673-680. [https://doi.org/10.1016/j.jvoice.2014.01.013]
-
Kim, J. O. (2009). Acoustic characteristics of the voices of Korean normal adults by gender on MDVP. Phonetics and Speech Sciences, 1(4), 147-157.
김재옥 (2009). 성별에 따른 한국 정상 성인 음성의 음향학적 평가 기준치. 말소리와 음성과학, 1(4), 147-157. -
Kang, Y. E., & Seong, C. J. (2012). A cepstral analysis of breathy voice with vocal fold paralysis. Phonetics and Speech Sciences, 4(2), 89-94.
강영애, 성철재 (2012). 성대마비로 인한 기식 음성에 대한 Cepstral 분석. 말소리와 음성과학, 4(2), 89-94. [ https://doi.org/10.13064/KSSS.2012.4.2.089 ] -
Kim, T. H., Choi, J. I., Lee, S. H., & Jin, S. M. (2015). Comparison of vowel and text-based cepstral analysis in dysphonia evaluation. Journal of The Korean Society of Laryngology, Phoniatrics and Logopedics, 26(2), 117-121.
김태환, 최정임, 이상혁, 진성민 (2015). 발성장애 평가시/a/모음연장발성및 문장검사의 켑스트럼 분석 비교. 대한후두음성언어의학회지, 26(2), 117-121. [ https://doi.org/10.22469/jkslp.2015.26.2.117 ] -
Kim, G. H., Lee, Y. W., Bae, I. H., Park, H. J., Lee, J. S., Wang, S. G., & Kwon, S. B. (2016). A cepstral analysis of voices with glottic cancer and laryngeal leukoplakia: Sustained vowels and continuous speech. Journal of Speech-Language & Hearing Disorders, 25(3), 135-145.
김근효, 이연우, 배인호, 박희준, 이재석, 왕수건, 권순복 (2016). 성문암과 후두백반증 음성의 켑스트럼 분석 및 청지각적 평가: 연장모음과 연속발화. 언어치료연구, 25(3), 135-145. [ https://doi.org/10.15724/jslhd.2016.25.3.010 ] -
Kim, G. H., Lee, Y. W., Park, H. J., Bae, I. H., & Kwon, S. B. (2017). A study of cepstral peak prominence characteristics in ADSV, speechtool and praat. Journal of Speech-Language & Hearing Disorders, 26(3), 99-111.
김근효, 이연우, 박희준, 배인호, 권순복 (2017). ADSV, SpeechTool, Praat 간의 CPP 특성 연구. 언어치료연구, 26(3), 99-111. [ https://doi.org/10.15724/jslhd.2017.26.3.009 ] - Lowell, S. Y., Kelley, R. T., Awan, S. N., Colton, R. H., & Chan, N. H. (2012). Spectral-and cepstral-based acoustic features of dysphonic, strained voice quality. Annals of Otology, Rhinology & Laryngology, 121(8), 539-548. [https://doi.org/10.1177/000348941212100808]
-
Lee, H. J., & Kim, S. J. (2006). Age and sex differences in acoustic parameter of middle age and elderly adult voice. Malsori, 60, 13-28.
이효진, 김수진 (2006). 장·노년기 성인 음성의 성별과 연령에 따른 음향음성학적 특성 비교. 말소리, 60, 13-28. -
Lee, S. J., Lim, S. E., & Choi, H. S. (2017). A comparison of cepstral and spectral measures according to measurement position in a reading passage. Communication Sciences & Disorders, 22(4), 818-826.
이승진, 임성은, 최홍식 (2017). 문단 내 위치에 따른 켑스트럼 및 스펙트럼 측정치 비교. Communication Sciences & Disorders, 22(4), 818-826. [ https://doi.org/10.12963/csd.17433 ] -
Lee, S. J., Pyo, H. Y., & Choi, H. S. (2018). Normative Data of cepstral and spectral measures in korean adult using vowel phonation and passage reading tasks. Communication Sciences Disorders, 23(1), 208-217.
이승진, 표화영, 최홍식 (2018). 모음 발성 및 문단 읽기 과제 시 한국 성인의 켑스트럼 및 스펙트럼 측정치 정상 규준 연구. Communication Sciences & Disorders, 23(1), 208-217. [ https://doi.org/10.12963/csd.18474 ] - Madill, C., Nguyen, D. D., Yick‐Ning Cham, K., Novakovic, D., & McCabe, P. (2019). The impact of nasalance on cepstral peak prominence and harmonics‐to‐noise ratio. The Laryngoscope, 129(8), E299-E304. [https://doi.org/10.1002/lary.27685]
-
Pyo, H. Y., Shim, H. S., Song, Y. K., Yoon, Y. S., Lee, E. K., Lim, S. E., Hah, H. R. & Choi, H. S. (2002). The acoustic study on the voice of Korean normal adults. Speech Sciences, 9(2), 179-192.
표화영, 심현섭, 송윤경, 윤영선, 이은경, 임성은, 하현령, 최홍식 (2002). 한국 성인의 정상 음성에 관한 기본 음성 측정치 연구. Speech Sciences, 9(2), 179-192. -
Park, M. C., Mun, M. K., Lee, S. H., & Jin, S. M. (2013). Clinical usefulness of cepstral analysis in dysphonia evaluation. Korean Journal of Otorhinolaryngology-Head and Neck Surgery, 56(9), 574-578.
박민철, 문명기, 이상혁, 진성민 (2013). 음성장애 평가에서 켑스트럼 분석의 임상적 유용성. 대한이비인후과학회지-두경부외과학, 56(9), 574-578. [ https://doi.org/10.3342/kjorl-hns.2013.56.9.574 ] - Ryan, E. (2016). The Effect of Age on cepstral measures of phonation in female speakers., Texas Christian University. Retrieved from https://repository.tcu.edu/handle/116099117/10430
- Infusino, S. A., Diercks, G. R., Rogers, D. J., Garcia, J., Ojha, S., Maurer, R., & Hartnick, C. J. (2015). Establishment of a normative cepstral pediatric acoustic database. JAMA Otolaryngology–Head & Neck Surgery, 141(4), 358-363. [https://doi.org/10.1001/jamaoto.2014.3545]
-
Shim, H. J., Jang, H. R., Shin, H. B., & Ko, D. H. (2014). Spectral and cepstral analyses of esophageal speakers. Phonetics and Speech Sciences, 6(2), 47-54.
심희정, 장효령, 신희백, 고도홍 (2014). 식도발성화자 음성의 spectral & cepstrum 분석, 말소리와 음성과학, 6(2), 47-54. [ https://doi.org/10.13064/KSSS.2014.6.2.047 ] -
Seo, I. H., & Lee, O. B. (2015). Cepstral and spectral analysis of whispery voice by healthy adults: Preliminary study. Journal of Speech-Language & Hearing Disorders, 24(4), 259-266.
서인효, 이옥분 (2015). 정상성인 화자의 속삭임성에 대한 켑스트럼 및 스펙트럼 분석: 예비연구. 언어치료연구, 24(4), 259-266. [ https://doi.org/10.15724/jslhd.2015.24.4.024 ] -
Shim, H. J., Jung, H., Lee, S. A., Choi, B. H., Heo, J. H., & Ko, D. H. (2016). Cepstral and spectral analysis of Voice with adductor spasmodic dysphonia. Phonetics and Speech Sciences, 8(2), 73-80.
심희정, 정훈, 최병흔, 허정화, 고도흥 (2016). 내전형연축성 발성장애 음성에 대한 켑스트럼과 스펙트럼 분석. 말소리와 음성과학, 8(2), 73-80. [ https://doi.org/10.13064/KSSS.2016.8.2.073 ] -
Shin, H. B., Sim, H. J., Jung, H., & Ko, D. H. (2018). Characteristics of voice quality on clear versus casual speech in individuals with Parkinson’s disease. Phonetics and Speech Sciences, 10(2), 77-84.
신희백, 심희정, 정훈, 고도흥 (2018). 명료발화와 보통발화에서 파킨슨병환자 음성의 켑스트럼 및 스펙트럼 분석. 말소리와 음성과학, 10(2), 77-84. [ https://doi.org/10.13064/KSSS.2018.10.2.077 ] -
Son, K. O., Shin, H. J., & Ko, D. H. (2018). The effect of gender and Age on cepstral·spectral measures of vocal function in the elderly. Journal of Speech-Language & Hearing Disorders, 27(2), 23-32.
손기옥, 심희정, 고도흥 (2018). 성별과 연령에 따른 노인 음성의 캡스트럼·스펙트럼 분석. 언어치료연구, 27(2), 23-32. [ https://doi.org/10.15724/jslhd.2018.27.2.003 ] -
Yoo, J. Y., Jeong, O. R., Jang, T. Y., & Ko, D. H. (2003). A correlation study among acoustic parameters of MDVP, Praat, and Dr. Speech. Speech Sciences, 10(3), 29-36.
유재연, 정옥란, 장태염, 고도홍 (2003). MDVP와 Praat, Dr. Speech 간의 음향학적 측정치에 관한 상관연구. 음성과학, 10(3), 29-36. -
Yu, M. O., Choi, S. H., Choi, C. H., & Lee, K. J. (2017). Usefulness of cepstral acoustic index for estimating objective dysphonia severity. Communication Sciences & Disorders, 22(3), 587-596.
유미옥, 최성희, 최철희, 이경재 (2017). 객관적인 음성장애 중증도측정을 위한 캡스트럼 음향 지표의 유용성. Communication Sciences & Disorders, 22(3), 587-596. [ https://doi.org/10.12963/csd.17411 ]