Korean Speech-Language & Hearing Association(KSHA)
[ ORIGINAL ARTICLE ]
Journal of Speech-Language & Hearing Disorders - Vol. 30, No. 1, pp.31-39
ISSN: 1226-587X (Print) 2671-7158 (Online)
Print publication date 31 Jan 2021
Received 16 Dec 2020 Revised 06 Jan 2021 Accepted 29 Jan 2021
DOI: https://doi.org/10.15724/jslhd.2021.30.1.031

마비말장애 화자의 포먼트 전이와 모음공간에 대한 음향학적 특성

남현욱1 ; 박희준2, *
1춘해보건대학교 언어치료과 교수
2부산가톨릭대학교 언어청각치료학과 교수
Acoustic Characteristics of Formant Transition and Vowel Space of Dysarthric Speakers
Hyun Wook Nam1 ; Hee June Park2, *
1Dept. of Speech and Language Therapy, Choonhae College of Health Sciences, Professor
2Dept. of Speech and Hearing Therapy, Catholic University of Pusan, Professor

Correspondence to: Hee June Park, PhD E-mail : june@cup.ac.kr

Copyright 2021 ⓒ Korean Speech-Language & Hearing Association.
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

목적:

마비말장애의 구어 명료도 분석을 위한 객관적인 음향학적 평가로 모음공간(vowel space) 분석이 유용하게 사용되고 있다. 하지만 모음공간 분석의 경우 사용자가 특정화된 수식을 이용하여 계산해야하는 수작업 측정 방식(hand-corrected measurement)으로 임상적 유용성이 낮은 단점이 있다. 이에 본 연구의 목적은 자동화 측정방식인 포먼트 전이 분석을 통해 경직형 마비말장애의 구어 명료도 측정에 대한 유용성과 모음공간 분석과의 상관관계를 알아보는 것이다.

방법:

본 연구에서는 경직형 마비말장애(n=15)와 정상 집단(n=15)을 대상으로 모음공간과 포먼트 전이 변수를 측정하였다. 모음공간은 /a/, /i/, /u/를 녹음하여 VAI, FCR, F2/iu/ ratio를 분석하였다. 포먼트 전이는 /iu/를 빠르게 반복 시켜 F2magn, F2rate, F2reg를 분석하였다.

결과:

모음공간 분석에서 마비말장애가 정상군에 비해 VAI는 낮았고, FCR은 높았으며 F2/iu/ ratio는 통계적으로 유의하게 낮았다(p<.05). 포먼트 전이 분석에서는 마비말장애에가 정상군에 비해 F2magn, F2rate, F2reg 모두 통계적으로 유의하게 낮게 나타났다(p<.05). 모음공간과 포먼트 전이 간의 상관관계 분석을 실시한 결과 두 파라미터들 간의 높은 상관관계(r>.8)가 있었다. 이는 포먼트 전이 특성인 F2magn, F2rate, F2reg는 VAI와 FCR과 높은 상관관계가 있으며 모음의 중앙화 현상으로 혀의 움직임이 저하되어 구어 명료도가 떨어짐을 알 수 있었다.

결론:

모음공간 관련 파라미터와 포먼트 전이 관련 파라미터의 객관적인 데이터를 사용하여 경직형 마비말장애의 구어 명료도 객관적으로 측정할 수 있었다. 또한 자동화된 프로그램을 사용한 포먼트 전이 분석의 경우 모음공간 분석과 높은 상관관계가 있음이 확인되어 임상에서 유용하게 사용할 수 있을 것으로 기대한다.

Abstract

Purpose:

Vowel space is useful as an objective acoustic evaluation for the analysis of speech intelligibility of dysarthric speakers. However, vowel space has the disadvantage of low clinical usefulness because it is a hand-corrected measurement method that the user must calculate using a specific formula. The purpose of this study is to determine the correlation between vowel space and the usefulness of measuring speech intelligibility of spastic dysarthria through formant transition, an automated measurement method.

Methods:

Vowel space and formant transition parameters were measured in spastic dysarthria (n=15) and control group (n=15). For vowel space, /a/, /i/, and /u/ were recorded to analyze VAI, FCR, and F2/iu/ ratio. Formant transition was rapidly repeated /iu/ to analyze F2magn, F2rate, and F2reg.

Results:

In the analysis of vowel space, the VAI was lower, the FCR was higher, and the F2/iu/ ratio was significantly lower (p<.05) than in the control group. In the analysis of formant transition, F2magn, F2rate, and F2reg were significantly lower in paralysis compared to the control group (p<.05). As a result of performing correlation analysis between vowel space and formant transition, there was a high correlation (r>.8). It was found that the formant transition, F2magn, F2rate, and F2reg, were highly correlated with VAI and FCR, and tongue movement was reduced due to the centralization of vowels, resulting in poor speech intelligibility.

Conclusions:

Using objective data of vowel space and formant transition parameters, the speech intelligibility of spastic dysarthria could be objectively measured. In addition, formant transition using an automated program has been confirmed to have a high correlation with vowel space, and is expected to be useful in clinical practice.

Keywords:

Vowel space, formant transition, dysarthria, speech intelligibility

키워드:

모음공간, 포먼트 전이, 마비말장애, 구어 명료도

Ⅰ. 서 론

뇌졸중은 최근 높은 유병률, 발생률 및 사망률로 인해 장애와 사망의 주요 원인 중 하나로 손꼽히고 있다(Feigin et al., 2015; Murray et al., 2012). 이러한 뇌졸중은 운동 기능의 장애뿐만 아니라 의사소통에 심각한 영향을 미치는 마비말장애와도 높은 관련성이 있음이 보고되었다(Brady et al., 2011). 많은 뇌졸중 환자들이 약 25~42% 마비말장애를 동반하는 것으로 나타났다(Flowers et al., 2013).

마비말장애는 7개의 하위 유형으로 분류할 수 있으며 그 중 경직형 마비말장애는 상부 운동 신경원(upper motor neuron) 손상으로 기인하며 혼합형 마비말장애와 함께 가장 많은 출현율을 보이는 유형이다(Duffy, 2013). 경직형 마비말장애는 능동적인 조음기관인 입술, 혀, 턱 및 연인두 운동능력 협응의 어려움 때문에 구어 명료도(speech intelligibility)가 떨어지는 임상적 특징을 보인다(Yunusova et al., 2008).

마비말장애의 구어 명료도를 평가하는 방법으로 말 산출의 심한정도에 대해 모음 발성, 조음교대운동, 읽기과제 등을 사용하여 평가하고 있으며 그 중 모음의 음향학적 정보는 간단하게 측정할 수 있으면서 혀의 움직임에 대한 다양한 정보를 주기 때문에 유용하게 사용되어 진다(Chen et al., 2013; Kang et al., 2009). 마비말장애의 구어 명료도를 객관적으로 평가하는 방법으로 포먼트 측정을 통한 모음공간 분석에 대한 연구가 보고되고 있다. 특히 제 1 포먼트(first formant: F1)는 혀의 높이에 영향을 받고 제 2 포먼트(second formant: F2)는 혀의 전후 움직임에 영향을 받기 때문에 이 수치의 변화에 따라 마비말장애의 구어 명료도의 심한 정도를 객관적으로 측정할 수 있다(Eom & Shin, 2018). 정상인의 연구에서도 F1과 F2의 범위는 전체 문장 명료도와 유의한 상관관계가 있는 것으로 나타났다(Bradlow et al., 1996). 이러한 F1과 F2의 정보를 이용한 음향학적 분석 파라미터들로 모음공간 면적(vowel space area: VSA)이 있으며, 마비말장애의 병리적 발화의 경우 불안정성으로 인한 분석의 둔감화를 보완하기 위해 모음 조음 지수(vowel articulation index: VAI), 모음 중앙화 비율(formant centralization ratio: FCR), F2/iu/ ratio 등이 사용되고 있다(Skodda et al., 2011). VSA는 모음 사각도 또는 삼각도에서 가장 모서리에 위치하는 중설 저모음 /a/, 전설 고모음 /i/, 후설 고모음 /u/로 구성된 코너 모음(corner vowel)으로 조음기관의 움직임과 범위를 나타낸다(Kent & Kim, 2003). 감소된 VSA의 값은 모음 산출이 중앙에 집중화 되어 구어 명료도를 감소시키는 경향이 있음을 나타낸다. VSA에 대한 선행 연구를 살펴보면 뇌졸중 후 마비말장애 화자를 대상으로 VSA를 측정한 결과 정상 대조군 보다 면적이 작게 나타났으며 면적이 작을수록 명료도는 더욱 떨어진다고 보고하였다(Liu et al., 2005; Mou et al., 2018; Weismer et al., 2001). 마비말장애의 유형별 연구를 살펴보면 경직형의 경우 VSA, VAI, FCR의 측정값이 정상보다 유의하게 차이가 나타났으며(Ge et al., 2020; Kim et al., 2014), 과소운동형의 경우에도 모음공간 파라미터들이 장애의 심한 정도를 측정하는 좋은 마커 역할을 한다고 보고하였다(Rusz et al., 2013; Skodda et al., 2010).

선행연구에서 제시한 바와 같이 모음공간과 관련된 다양한 파라미터들은 마비말장애의 구어 명료도를 객관적으로 측정하고 치료 예후를 예측하는데 좋은 평가 도구로 사용되어 지고 있다. 하지만 모음공간 파라미터들을 분석하기 위해서는 음향분석 소프트웨어를 통해 F1, F2 값을 측정한 뒤 연구자가 그 값을 특정화된 수식을 이용하여 계산해야하는 수작업 측정 방식(hand-corrected measurement)을 사용하기 때문에 복잡한 절차와 많은 시간 소요로 인한 임상 적용의 제한점이 지적되고 있다(Luan et al., 2014; Sandoval et al., 2013).

포먼트 정보를 이용한 자동화된 분석 방법으로 F2 전이 구간을 측정하는 방법이 있다. F2 전이 측정은 빠르고 규칙적으로 /i/와 /u/ 모음을 조합하는 능력을 측정함으로써 대상자의 혀의 전후 위치와 입술의 원순성 및 평순성을 측정할 수 있다. 정상 화자일수록 F2 전이 속도가 빠르고 규칙적이며 마비말장애의 경우 모음의 중립화로 인해 포먼트 전이 구간이 완만하고 반복 속도도 불규칙한 것으로 나타났다. Lindblom 등(2009)은 마비말장애 화자에게 CV 음절 발화 시 F2 전이 상태를 관찰한 결과 정상보다 전이 기울기가 완만하고 속도도 느린 것으로 보고하였다. Cummins 등(2014)의 연구에서도 발화 중 포먼트 전이 특성이 실조형 마비말장애와 과소운동형 마비말장애를 감별하는데 쉽고 빠른 과제임을 보고하였다. 이러한 기기적 평가방법으로 Kay Elemetrics Corporation의 Motor Speech Profile(MSP) 프로그램이 많이 사용되고 있으며 정상 기준치에 대한 국내 연구도 보고된 바 있다(Kim et al., 2015). 하지만 마비말장애를 대상으로 한 MSP의 연구는 보고된 바가 없어 본 연구에서 경직형 마비말장애를 대상으로 MSP 분석을 실시하고자 하였다.

따라서 본 연구에서는 자동화된 방법인 포먼트 전이 구간 분석(F2magn, F2rate, F2reg)이 반자동화 방식인 모음공간 측정 변수 VAI, FCR, F2/iu/ ratio 파라미터들 간의 상관관계를 알아보고 마비말장애 평가에 임상적으로 유용한 파라미터들은 어떠한지 알아보고자 하였다.


Ⅱ. 연구 방법

1. 연구 대상

본 연구의 대상은 뇌졸중 후 재활의학과 전문의와 언어재활사에 의해 Duffy(2013)의 기준(Appendix 1)에 따라 경직형 마비말장애로 판정받은 15명과 정상인 15명을 대상으로 하였다. 대상자들은 모두 남성으로 경직형 마비말장애 집단의 평균 연령은 61.7(SD=9.6)세었고, 정상 집단의 평균 연령은 59.9(SD=7.3)세였다. 두 집단 간 평균 연령에는 통계적으로 유의한 차이는 없었으며(t=.599, p=.554) 대상자 모두 부산지역에 거주하고 있었다.

경직형 마비말장애 집단과 정상 집단은 한국판 간이 정신 상태 검사(Korean-Mini Mental State Examination: K-MMSE, Kang et al., 1997)에서 정상 범위에 해당하는 경우로 인지 기능이 과업 수행에 영향을 주지 않는 대상자로 선정하였다. 뇌졸중 환자의 경우 실어증 여부를 알아보기 위해 실어증-신경언어장애 선별검사(Screening Test for Aphasia and Neurologic-Communication Disorders: STAND, Kim et al., 2009a)를 실시하였으며 실어증이 동반하지 않은 경우를 대상자로 선정하였다. 두 집단 모두 과업에 영향을 미칠 수 있는 청각장애, 시각장애, 말실행증이 없는 대상자를 선정하였다. 경직형 마비말장애의 구어 명료도의 수준은 Kim 등(2004)의 기준에 따라 10년 이상의 마비말장애 평가 및 재활의 경험이 있는 1급 언어재활사 3명이 대화과제와 그림설명하기 과제를 듣고 중등도를 평가한 후 경도(66~95%)에 해당하는 자로 선정하였으며 구체적인 대상자의 정보는 Table 1과 같다.

Participants' information

2. 연구 절차

VAI, FCR, F2/iu/ ratio을 측정하기 위해 Praat(version 6.1.36)이 설치된 노트북과 Logitech USB 콘덴서 마이크를 연결하여 음성을 수집하였다. 모음공간 분석을 위해 대상자들은 편안한 상태에서 모음 /a/, /i/, /u/를 3회 2~3초 발성하도록 하여 안정된 모음 자료를 분석에 사용하였다. F2 전이 구간을 측정하기 위해 같은 환경에서 최대한 숨을 들이 쉰 후 빠르고 정확하게 /i/, /u/를 5초 이상 반복하게 하였으며 총 3회에 걸쳐 녹음을 하였다. 녹음 시 마이크와 약 10~15cm 떨어진 곳에서 녹음하였다.

3. 자료 분석

1) 모음공간

모음공간 측정을 위해 녹음된 /a/, /i/, /u/ 모음 자료를 Praat를 이용하여 안정적인 포먼트가 관찰되는 지점을 분석하였다. 성별에 따라 분석 값이 달라질 수 있음으로 대상자가 남성임을 고려하여 포먼트 분석 상한 값을 5,000 Hz로 고정하였다(Escudero et al., 2009). 측정된 F1과 F2 값을 바탕으로 VAI, FCR, F2/iu/ ratio 값을 아래와 같은 공식으로 산출하였다(Neel, 2008).

VAI = (F2/i/ + F1/a/) / (F1/i/ + F1/u/ + F2/u/ + F2/a/)
FCR = (F1/i/ + F1/u/ + F2/u/ + F2/a/) / (F2/i/ + F1/a/)
F2/iu/ ratio = F2/i/ / F2/u/

VAI, FCR, F2/iu/ ratio는 모음공간 면적과 F2의 기울기 특성을 반영한 파라미터들이다. VAI는 VSA 측정시 장애음성의 불안정성을 보완하는 방법이며, FCR은 VAI와 역수 관계로 민감도를 유지하면서 개인 간 변수를 줄여 표준 점수화 한 값이다(Sapir et al., 2010). F2/iu/ ratio는 모음 /i/와 /u/를 반복하여 입술의 원순성과 평순성의 대립 및 혀의 전후 움직임을 수치화 할 수 있는 파라미터이다. 분자의 포먼트 주파수가 감소하면 모음의 중앙화(vowel centralization)가 되어 FCR 수치가 증가하고 VAI 수치는 감소한다, 즉, 마비말장애의 경우 혀의 움직임이 제한적임으로 FCR 값은 크고, VAI 값은 낮게 나타나는 경향이 있다. F2/i//F2/u/ 공식인 F2/iu/ ratio 파라미터는 조음이 부정확(articulation undershoot)할 때 감소하고, 반대로 조음 움직임이 개선될 때 증가하는 것으로 해석한다(Kang et al., 2009; Sapir et al., 2010).

2) 포먼트 전이

F2 전이는 CSL의 Motor Speech Profile(MSP, KayPentax, model 5141)을 이용하여 분석하였다. 녹음된 /i/, /u/ 음성파일을 이용하여 F2 전이 프로토콜을 사용하여 F2 전이 정도를 의미하는 F2magn(Hz), F2 전이 속도를 의미하는 F2rate(s), F2 전이의 규칙성을 의미하는 F2reg(%)를 분석하였다. 분석된 F2 전이 관련 파라미터의 자세한 내용은 Table 2와 같으며 실제 분석 화면은 Figure 1과 같다. 마비말장애의 경우 심한 정도에 따라 음형대의 주파수가 이탈 될 수 있기 때문에 경도의 대상자로 선정하였으며 반복 발화한 파형 중 안정구간 3~5초 사이를 지정하여 분석하였다.

Parameter of F2 transition

Figure 1.

Formant transition analysis screen using MSP

4. 결과 처리

자료의 통계처리는 경직형 마비말장애 화자와 정상인의 모음공간 파라미터(VAI, FCR, F2/iu/ ratio)와 F2 전이 파라미터(F2magn, F2rate, F2reg)를 비교하기 위해 독립표본 t-검정을 실시하였으며, 유의수준을 .05 이하로 검정하였다. 모음공간 파라미터와 F2 전이 파라미터의 상관관계를 알아보기 위해 피어슨 적률 상관 분석을 실시하였다. 통계 프로그램은 Jamovi 1.6을 사용하였다(Jamovi project, 2020).


Ⅲ. 연구 결과

1. 경직형 마비말장애군과 정상군간의 모음공간 특성 비교

경직형 마비말장애군과 정상군의 간의 모음공간 파라미터에 대한 기술통계 및 독립표본 t-검정 결과는 Table 3과 같다. VAI, FCR, F2/iu/ ratio 파라미터에서 두 집단 간 유의한 차이를 보였으며(p<.05) 모음공간 파라미터 간의 집단 간 차이를 시각화하여 Figure 2에 제시하였다.

Results of vowel space parameters between groups

Figure 2.

Results of vowel space parameters between groups

2. 경직형 마비말장애군과 정상군 간의 F2 전이 특성 비교

경직형 마비말장애군과 정상군 간의 F2 전이 특성을 나타내는 F2magn, F2rate, F2reg 파라미터들에 대한 기술통계 및 독립표본 t-검정 결과는 Table 4와 같다. 통계 분석 결과 F2magn, F2rate, F2reg 파라미터 값에서 경직형 마비말장애와 정상군 간 통계적으로 유의한 차이가 나타났다(p<.05). F2magn 경우 경직형 마비말장애군이 정상군 보다 F2 전이 구간이 짧은 것으로 나타났으며 F2rate의 경우 마비말장애군이 전이 속도가 늦은 것으로 나타났으며, 마지막으로 F2 전이의 규칙성인 F2reg 분석 결과 마비말장애군이 불규칙한 수행을 보였다. F2 전이 파라미터 간의 집단 간 차이를 시각화하여 Figure 3에 제시하였다.

Results of F2 transition parameters between groups

Figure 3.

Results of F2 transition parameters between groups

3. 모음공간과 포먼트 전이의 상관관계

경직형 마비말장애의 모음공간 파라미터(VAI, FCR, F2/iu/ ratio)와 F2 전이 파라미터(F2magn, F2rate, F2reg)와의 상관관계를 비교한 결과는 Table 5와 같다. VAI 경우 F2magn, F2rate, F2reg와 높은 양의 상관관계를 나타내었으며, FCR은 F2magn, F2rate, F2reg와 높은 음의 상관관계를 나타내었다. F2/iu/ ratio는 F2rate와 높은 양의 상관관계가 나타났다.

Correlation of F2 formant transition parameters and vowel space


Ⅳ. 논의 및 결론

마비말장애의 구어 특성을 알아보기 위해 간단한 모음 산출 과제를 이용하여 F1과 F2의 특성을 보는 연구가 많이 보고되고 있다. 이에 본 연구에서는 모음공간 특성을 반영하는 파라미터와 F2 전이 특성을 반영하는 파라미터들을 측정하여 경직형 마비말장애군과 정상군간 차이를 알아보고자 하였으며, 또한 F2 전이 특성이 모음공간 특성과 상관관계가 있는지 알아보고자 하였다.

모음공간 특성비교를 위해 VAI, FCR, F2/iu/ ratio 측정값의 집단 간 차이를 분석하였다. 마비말장애군의 경우 정상군보다 VAI, F2/iu/ ratio의 값이 작았으며 FCR 값은 높게 나타났다. 이는 모음공간 면적 특성이 마비말장애 군에서 F1과 F2 값의 차이를 나타내며 이는 혀의 전후 움직임과 상하 움직임의 범위가 정상군 보다 낮다는 선행 연구와 일치한다(Lansford & Liss, 2014; Lee et al., 2017). 또한 경직형 마비말장애의 모음공간 특성 비교에서 정상군 보다 FCR 값은 증가하고, VAI, F2/iu/ ratio 감소한다는 결과와 일치하는 것으로 나타났다(Kim et al., 2014; Kim & Seong, 2016). Park 등(2004)의 경직형 마비말장애 F2-F1 차이연구에서 정상군보다 낮은 값을 통해 발화시 전설 모음 산출 시 혀를 후방화 하여 전반적으로 모음의 중앙화 경향이 나타난다고 하였으며 이는 본 연구의 결과와 일치하였다. 경직형의 이러한 결과는 모음공간 특성을 반영하는 파라미터들의 값이 마비말장애의 조음기관 움직임의 특성을 반영한다고 할 수 있으며 측정값들의 수치는 치료 전과 치료 후의 진전이나 마비말장애 심한 정도를 객관적으로 분석할 수 있는 기준으로 사용할 수 있음을 시사한다.

F2 전이 파라미터 값을 측정하기 위해 MSP를 이용하여 분석한 결과 F2magn, F2rate, F2reg의 값이 정상군보다 마비말장애군에서 모두 낮게 나타나는 것을 발견할 수 있었다. MSP를 이용하여 포먼트를 비교한 연구를 살펴보면 40대와 60대의 F2 전이 분석에서 60대가 F2 전이 구간이 감소하고 속도도 느려졌으며 규칙성도 감소하는 연구와 유사한 결과를 나타내었다(Kim et al., 2015). 이러한 결과는 노화가 진행됨에 따라 조음기관 근육의 약화(Neel et al., 2015)로 인해 혀의 움직임이 감소하여 F2 전이 측정값이 저하되는 것으로 해석할 수 있다. F2magn는 포먼트 전이 정도를 평가하는 것으로 선행연구에서 F2 기울기(F2 slope) 값과 유사한 원리로 마비말장애의 경우 F2 기울기가 감소한다는 선행연구(Kim et al., 2009b)와 일치한다고 볼 수 있다. Rong 등(2012)Yunusova 등(2012)의 연구에서 경직형 뇌성마비를 대상으로 한 연구에서도 F2 전이 기울기가 완만하고 느릴수록 모음공간이 작고 명료도가 낮아진다는 결과를 보고하였는데 본 연구와 일치된 결과라 할 수 있다.

모음공간과 관련된 파라미터들과 F2 전이와 관련된 파라미터들의 상관관계를 분석할 때 두 파라미터들 간 높은 상관관계가 나타났다. 두 파라미터들을 비교한 선행연구가 없어 객관적 비교가 어렵긴 하지만 자동으로 분석 할 수 있는 F2 전이를 이용한다면 수동으로 하는 모음공간 분석의 파라미터이 심한 정도를 간단하고 짧은 시간에 확인할 수 있음을 알 수 있었다. MSP로 측정한 포먼트 전이 정도인 F2magn는 모음공간 측정 변수에서 VAI와 FCR과 높은 상관관계를 나타내고 있으며 이는 F2magn 값이 감소할수록 모음의 중앙화 값인 VAI는 감소하고 FCR 값은 증가함을 알 수 있다. 임상적으로 F2magn 값이 낮게 측정될 경우 혀의 전후 움직임이 부족하다는 것을 시사한다. 포먼트 전이 속도인 F2rate의 경우 VAI, FCR, F2/iu/ ratio와 높은 상관관계가 있으며 F2rate가 감소할수록 모음의 중앙화 현상과 혀의 움직임의 정확도가 떨어짐을 알 수 있다. 포먼트 전이의 규칙성을 나타내는 F2reg는 VAI와 FCR과 높은 상관관계가 있으며 이는 모음의 중앙화 현상으로 구어 명료도가 떨어짐을 알 수 있다. 이상의 상관관계를 요약하면 MSP로 측정한 포먼트 전이 값의 변화는 모음공간 파라미터들의 변화와 관련성이 높으며 모음의 중앙화와 혀의 움직임의 정확도를 변화를 알아보는데 임상적 유용성이 있다고 볼 수 있다.

모음공간 분석의 많은 장점에도 불구하고 이를 시행하기 위해서는 Praat와 같은 음향분석 도구를 이용하여 스펙트로그램 분석 후 F1과 F2 값을 측정하여 사람의 손으로(hand segmentation) VAI, FCR, F2/iu/ ratio 등을 구해야 한다는 단점이 있다(Sandoval, 2013; Scherer et al., 2015). 또한 이러한 단점을 개선하기 위해 특정한 알고리즘을 개발하여 사용하는 경우도 있으나 일반적인 임상에서 사용하기에는 어려움이 있다. 사람의 손을 거치는 반자동(semi-automatic) 방법이 아닌 음성자료를 입력했을 때 자동(automatic)으로 결과값을 출력해주는 방법은 측정값을 객관적이면서도 빠른 시간에 얻을 수 있어 임상에 유용하게 사용될 수 있다. 본 연구에서는 MSP의 F2 전이 프로토콜을 통해 빠른 시간과 객관적인 수치를 제공받을 수 있고 임상에서 쉽게 활용될 수 있도록 시각화 하여 치료 전후를 비교할 수 있다는 것을 알 수 있었다. 이 연구 결과를 바탕으로 향후 많은 연구자와 임상가들이 모음공간에 대한 파라미터와 F2 전이 파라미터들을 사용하여 다양한 의사소통장애군의 구어 명료도 측정에 활용되길 기대한다.

마지막으로 본 연구에서는 포먼트 전이를 자동으로 분석할 수 있는 프로그램을 사용하여 반자동으로 수행하는 모음공간 분석과의 상관관계를 본 점에서 의의가 있었다. 다만 MSP를 이용한 마비말장애의 포먼트 전이 분석이 없어 객관적인 비교가 어려운 점이 있어 마비말장애 유형, 심한정도에 따른 MSP 데이터를 지속적으로 수집하여 비교할 필요성이 있다. 또한 MSP의 경우 고가라는 단점으로 일반 임상현장에서 접근하기에는 어려운 점이 있어 Praat와 같은 공개 소프트웨어 개발이 필요할 것으로 판단된다.

Acknowledgments

This research was supported by research funds of Choonhae College of Health Sciences (2019).

이 논문은 2019년도 춘해보건대학교 학술연구비 지원에 의한 것임.

Reference

  • Bradlow, A. R., Torretta, G. M., & Pisoni, D. B. (1996). Intelligibility of normal speech I: Global and fine-grained acoustic-phonetic talker characteristics. Speech Communication, 20(3), 255. [https://doi.org/10.1016/S0167-6393(96)00063-5]
  • Brady, M. C., Clark, A. M., Dickson, S., Paton, G., & Barbour, R. S. (2011). The impact of stroke-related dysarthria on social participation and implications for rehabilitation. Disability and Rehabilitation, 33(3), 178-186. [https://doi.org/10.3109/09638288.2010.517897]
  • Chen, F., Wong, L. L., & Wong, E. Y. (2013). Assessing the perceptual contributions of vowels and consonants to Mandarin sentence intelligibility. The Journal of the Acoustical Society of America, 134(2), EL178-EL184. [https://doi.org/10.1121/1.4812820]
  • Cummins, F., Lowit, A., & Van Brenk, F. (2014). Quantitative assessment of interutterance stability: Application to dysarthria. Journal of Speech, Language, and Hearing Research, 57(1), 81-89. [https://doi.org/10.1044/1092-4388(2013/12-0374)]
  • Eom, S. H., & Shin, H. J. (2018). A study on vowel space area and speech intelligibility in children with articulation disorder. Journal of Speech-Language and Hearing Disorders, 27(1), 115-126. [https://doi.org/10.15724/jslhd.2018.27.1.009]
  • Escudero, P., Boersma, P., Rauber, A. S., & Bion, R. A. (2009). A cross-dialect acoustic description of vowels: Brazilian and European Portuguese. The Journal of the Acoustical Society of America, 126(3), 1379-1393. [https://doi.org/10.1121/1.3180321]
  • Duffy, J. R. (2013). Motor speech disorders: Substrates, differential diagnosis, and management (3rd ed.). St. Louis: Elsevier Mosby.
  • Feigin, V. L., Krishnamurthi, R. V., Parmar, P., Norrving, B., Mensah, G. A., Bennett, D. A., ... & Davis, S. (2015). Update on the global burden of ischemic and hemorrhagic stroke in 1990-2013: The GBD 2013 study. Neuroepidemiology, 45(3), 161-176. [https://doi.org/10.1159/000441085]
  • Flowers, H. L., Silver, F. L., Fang, J., Rochon, E., & Martino, R. (2013). The incidence, co-occurrence, and predictors of dysphagia, dysarthria, and aphasia after first-ever acute ischemic stroke. Journal of Communication Disorders, 46(3), 238-248. [https://doi.org/10.1016/j.jcomdis.2013.04.001]
  • Ge, S., Wan, Q., Yin, M., Wang, Y., & Huang, Z. (2020). Quantitative acoustic metrics of vowel production in mandarin-speakers with post-stroke spastic dysarthria. Clinical Linguistics & Phonetics, 1-14. [https://doi.org/10.1080/02699206.2020.1827295]
  • Jamovi project. (2020). Jamovi (version 1.6) [Computer Software]. Retrieved from https://www.jamovi.org, .
  • Kang, Y. A., Park, S. H., & Seong, C. J. (2009). Articulation characteristics of patients with idiopathic Parkinson’s disease and normal-aging group: Articulatory rate and acoustic vowel space. Journal of Speech-Language and Hearing Disorders, 18(3), 115-135. [https://doi.org/10.15724/jslhd.2009.18.3.008]
  • Kang, Y. W., Na, D. L., & Hahn, S. H. (1997). A validity study on the Korean Mini-Mental State Examination (K-MMSE) in dementia patients. Journal of the Korean Neurological Association, 15(2), 300-308.
  • Kent, R. D., & Kim, Y. J. (2003). Toward an acoustic typology of motor speech disorders. Clinical Linguistics and Phonetics, 17(6), 427–445. [https://doi.org/10.1080/0269920031000086248]
  • Kim, G. H., Park, H. J., Bae, I. H., Lee, Y. W., Wang, S. G., & Kwon, S. B. (2015). An analysis of speech performance characteristics of normal Korean speakers using a Motor Speech Profile: A survey in Busan and Gyeongnam. Journal of Speech-Language and Hearing Disorders, 24(2), 1-17. [https://doi.org/10.15724/jslhd.2015.24.2.001]
  • Kim, H. H., Heo, J. H., Kim, D. Y., & Kim, J. W. (2009a). Screening Test for Aphasia and Neurologic-Communication Disorders (STAND). Seoul: Hakjisa.
  • Kim, H. H., Lee, M. S., Kim S. W., Choi, S. H., & Lee, W. Y. (2004). An auditory-perceptual rating scale of dysarthric speech of patients with Parkinsonism. Speech Science, 11(2), 39-49.
  • Kim, J. Y., & Seong, C. J. (2016). The change of vowel characteristics for the dysarthric speech along with speaking style. Phonetics and Speech Sciences, 8(3), 51-59. [https://doi.org/10.13064/KSSS.2016.8.3.051]
  • Kim, S. Y., Kim, J. H., & Ko, D. H. (2014). Characteristics of vowel space and speech intelligibility in patients with spastic dysarthria. Communication Sciences & Disorders, 19(3), 352-360. [https://doi.org/10.12963/csd.14150]
  • Kim, Y., Weismer, G., Kent, R. D., & Duffy, J. R. (2009b). Statistical models of F2 slope in relation to severity of dysarthria. Folia Phoniatrica et Logopaedica, 61(6), 329-335. [https://doi.org/10.1159/000252849]
  • Lansford, K. L., & Liss, J. M. (2014). Vowel acoustics in dysarthria: Speech disorder diagnosis and classification. Journal of Speech, Language, and Hearing Research, 57(1), 57-67. [https://doi.org/10.1044/1092-4388(2013/12-0262)]
  • Lee, J., Littlejohn, M. A., & Simmons, Z. (2017). Acoustic and tongue kinematic vowel space in speakers with and without dysarthria. International Journal of Speech-Language Pathology, 19(2), 195-204. [https://doi.org/10.1080/17549507.2016.1193899]
  • Lindblom, B., Krull, D., Hartelius, L., & Schalling, E. (2009). Formant transitions in normal and disordered speech: An acoustic measure of articulatory dynamics. Proceedings of FONETIK 2009, 18-23.
  • Liu, H. M., Tsao, F. M., & Kuhl, P. K. (2005). The effect of reduced vowel working space on speech intelligibility in Mandarin-speaking young adults with cerebral palsy. The Journal of the Acoustical Society of America, 117(6), 3879-3889. [https://doi.org/10.1121/1.1898623]
  • Luan, Y., Wright, R., Ostendorf, M., & Levow, G. A. (2014). Relating automatic vowel space estimates to talker intelligibility. Fifteenth Annual Conference of the International Speech Communication Association, 2238-2242.
  • Mou, Z., Chen, Z., Yang, J., & Xu, L. (2018). Acoustic properties of vowel production in Mandarin-speaking patients with post-stroke dysarthria. Scientific Reports, 8(1), 1-12. [https://doi.org/10.1038/s41598-018-32429-8]
  • Murray, C. J., Vos, T., Lozano, R., Naghavi, M., Flaxman, A. D., Michaud, C., ... & Aboyans, V. (2012). Disability-adjusted life years (DALYs) for 291 diseases and injuries in 21 regions, 1990–2010: A systematic analysis for the Global Burden of Disease Study 2010. The lancet, 380(9859), 2197-2223. [https://doi.org/10.1016/S0140-6736(12)61689-4]
  • Neel, A. T. (2008). Vowel space characteristics and vowel identification accuracy. Journal of Speech, Language, and Hearing Research, 51(3), 574–585. [https://doi.org/10.1044/1092-4388(2008/041)]
  • Neel, A. T., Palmer, P. M., Sprouls, G., & Morrison, L. (2015). Muscle weakness and speech in oculopharyngeal muscular dystrophy. Journal of Speech, Language, and Hearing Research, 58(1), 1-12. [https://doi.org/10.1044/2014_JSLHR-S-13-0172]
  • Park, H. J., Shin, H. J., Jeong, O. R., & Seok, D. I. (2004). Voice characteristics of spastic dysarthria. Speech Science, 11(4), 185-195.
  • Rong, P., Loucks, T., Kim, H., & Hasegawa-Johnson, M. (2012). Relationship between kinematics, F2 slope and speech intelligibility in dysarthria due to cerebral palsy. Clinical Linguistics & Phonetics, 26(9), 806-822. [https://doi.org/10.3109/02699206.2012.706686]
  • Rusz, J., Cmejla, R., Tykalova, T., Ruzickova, H., Klempir, J., Majerova, V., ... & Ruzicka, E. (2013). Imprecise vowel articulation as a potential early marker of Parkinson's disease: Effect of speaking task. The Journal of the Acoustical Society of America, 134(3), 2171-2181. [https://doi.org/10.1121/1.4816541]
  • Sandoval, S., Berisha, V., Utianski, R. L., Liss, J. M., & Spanias, A. (2013). Automatic assessment of vowel space area. The Journal of the Acoustical Society of America, 134(5), EL477-EL483. [https://doi.org/10.1121/1.4826150]
  • Sapir, S., Ramig, L. O., Spielman, J. L., & Fox, C. (2010). Formant centralization ratio: A proposal for a new acoustic measure of dysarthric speech. Journal of Speech, Language, and Hearing Research, 53(1), 114–125. [https://doi.org/10.1044/1092-4388(2009/08-0184)]
  • Scherer, S., Morency, L. P., Gratch, J., & Pestian, J. (2015). Reduced vowel space is a robust indicator of psychological distress: A cross-corpus analysis. Paper presented at 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 4789-4793. [https://doi.org/10.1109/ICASSP.2015.7178880]
  • Skodda, S., Visser, W., & Schlegel, U. (2010). Short-and long-term dopaminergic effects on dysarthria in early Parkinson’s disease. Journal of Neural Transmission, 117(2), 197-205. [https://doi.org/10.1007/s00702-009-0351-5]
  • Skodda, S., Visser, W., & Schlegel, U. (2011). Vowel articulation in Parkinson's disease. Journal of Voice, 25(4), 467-472. [https://doi.org/10.1016/j.jvoice.2010.01.009]
  • Weismer, G., Jeng, J. Y., Laures, J. S., Kent, R. D., & Kent, J. F. (2001). Acoustic and intelligibility characteristics of sentence production in neurogenic speech disorders. Folia Phoniatrica et Logopaedica, 53(1), 1-18. [https://doi.org/10.1159/000052649]
  • Yunusova, Y., Green, J. R., Greenwood, L., Wang, J., Pattee, G. L., & Zinman, L. (2012). Tongue movements and their acoustic consequences in amyotrophic lateral sclerosis. Folia Phoniatrica et Logopaedica, 64(2), 94-102. [https://doi.org/10.1159/000336890]
  • Yunusova, Y., Weismer, G., Westbury, J. R., & Lindstrom, M. J. (2008). Articulatory movements during vowels in speakers with dysarthria and healthy controls. Journal of Speech, Language, and Hearing Research, 51(3), 596-611. [https://doi.org/10.1044/1092-4388(2008/043)]

참 고 문 헌

  • 강영애, 박상희, 성철재 (2009). 파킨슨병 환자와 정상 노인의 조음 특성 연구: 조음 속도와 모음 음향 공간. 언어치료연구, 18(3), 115-135.
  • 강연욱, 나덕렬, 한승혜 (1997). 치매환자들을 대상으로 한 K-MMSE의 타당도 연구. 대한신경과학회지, 15(2), 300-308.
  • 김근효, 박희준, 배인호, 이연우, 왕수건, 권순복 (2015). Motor Speech Profile을 통한 한국 정상화자의 말수행력 특성 분석: 부산, 경남지역 중심으로. 언어치료연구, 24(2), 1-17.
  • 김성윤, 김정환, 고도흥 (2014). 경직형 마비말장애의 말 명료도와 모음공간 특성. Communication Sciences & Disorders, 19(3), 352-360.
  • 김지연, 성철재 (2016). 경도 마비말장애 환자의 발화 유형에 따른 모음 특성 비교. 말소리와 음성과학, 8(3), 51-59.
  • 김향희, 이미숙, 김선우, 최성희, 이원용 (2004). 파킨슨증으로 인한 마비말장애에 대한 청지각적 평가척도. 음성과학, 11(2), 39-49.
  • 김향희, 허지회, 김덕용, 김정완 (2009). 실어증-신경언어장애 선별검사. 서울: 학지사.
  • 박희정, 신혜정, 정옥란, 석동일 (2004). 경직형 마비성 구어장애자의 장애 정도별 음성 특성. 음성과학, 11(4), 185-195.
  • 엄선화, 신혜정 (2018). 조음장애아동의 모음공간면적과 말명료도 연구. 언어치료연구, 27(1), 115-126.

Appendix

Distinguishing perceptual characteristics and physiologic findings by dysarthria type (Duffy, 2013)

Figure 1.

Figure 1.
Formant transition analysis screen using MSP

Figure 2.

Figure 2.
Results of vowel space parameters between groups

Figure 3.

Figure 3.
Results of F2 transition parameters between groups

Table 1.

Participants' information

No. Age Diagnosis Lesion sites Severity Type
Note. CC=corpus callosum; CN=caudate nucleus; CS=centrum semiovale; FL=forntal lobe; LV=lateral ventricle; THA=thalamus; TL=temporal lobe; SD=spastic dysarthria.
 1 48 Cerebral infarction FL Mild SD
 2 60 Cerebral infarction LV Mild SD
 3 69 Cerebral infarction LV Mild SD
 4 57 Cerebral hemorrhage CS Mild SD
 5 59 Cerebral hemorrhage CN Mild SD
 6 63 Cerebral infarction CC Mild SD
 7 59 Cerebral infarction LV Mild SD
 8 74 Cerebral hemorrhage LV, CS Mild SD
 9 71 Cerebral hemorrhage THA, LV Mild SD
10 53 Hemorrhagic infarction THA Mild SD
11 81 Cerebral infarction FL, TL Mild SD
12 69 Cerebral infarction FL Mild SD
13 53 Cerebral infarction CC Mild SD
14 62 Cerebral infarction CC Mild SD
15 48 Hemorrhagic infarction THA Mild SD

Table 2.

Parameter of F2 transition

Parameter Unit Described
Note. F2magn=magnitude of F2 variations; F2rate=rate of F2 Variations; F2reg=regularity of F2 variations.
F2magn Hz This is the magnitude of the variations of the second formant of the client during this vocalization. If the vocalization has neutralized vowels, reflecting reduced motility of the articulators, the F2 magnitude is reduced.
F2rate s This is the rate of the variations of the second formant of the client during this vocalization. This assesses the rate in which the speaker can change to the different positions of the vowels. Reduced motility of the articulators can be reflected in a reduced rate of variations.
F2reg % This is the regularity of the variations of the second formant of the client during this vocalization. This assesses the degree in which the speaker can maintain a regular periodic transition between the different positions of the vowels. A regular vocalization show a higher number while an irregular vocalization shows lower regularity.

Table 3.

Results of vowel space parameters between groups

Parameter Dysarthria Normal t
Note. Values are presented as mean (SD). VAI=vowel articulation index; FCR=formant centralization ratio.
*p<.05
VAI  .848 ( .108) 1.048( .134) -4.45*
FCR 1.146 ( .151)  .926( .077) 5.01*
F2/iu/ ratio 2.298 ( .537) 3.013( .444) -3.97*

Table 4.

Results of F2 transition parameters between groups

Parameter Dysarthria Normal t
*p<.05
F2magn 429.82 (33.22) 493.71 (28.90) -5.62*
F2rate   1.67 (  .28)   2.93 (  .24) -7.04*
F2reg  78.81 ( 6.36)  91.10 ( 4.77) -5.99*

Table 5.

Correlation of F2 formant transition parameters and vowel space

VAI FCR F2/iu/ ratio
Note. VAI=vowel articulation index; FCR=formant centralization ratio.
*p<.05, **p<.01
F2magn .794** -.708* .356
F2rate .756** -.768**  .719**
F2reg .825** -.714** .365

Appendix 1.

Distinguishing perceptual characteristics and physiologic findings by dysarthria type (Duffy, 2013)

Dysarthria type Locus of pathophysiology Perceptual speech characteristics Physical characteristics
Spastic lower motor neuron system and/or muscle - slow rate
- strained or harsh voice quality
- pitch breaks
- slow and regular alternating motion rates AMRs
- pathologic oral reflexes (sucking reflex; snout reflex; jaw jerk reflex)
- lability of affect
- hypertonia
- hyperactive gag reflex
Flaccid upper motor neuron system - continuous breathiness
- diplophonia
- audible inspiration or stridor
- nasal emission
- short phrases
- hypernasality
- rapid deterioration and recovery with rest
- imprecise AMRs
- weakness
- flaccidity
- atrophy
- fasciculations
- hypoactive gag reflex
- facial myokymia
- rapid deterioration and recovery with rest
- synkesis
- nasal backflow while swallowing
Ataxic cerebellar control circuit - irregular articulatory breakdowns
- excess and equal stress
- distorted vowels
- excessive loudness variation
- irregular AMRs
- dysmetric jaw, face, and tongue AMRs
- head tremor
Hypokinetic basal ganglia control circuit - monopitch
- monoloudness
- reduced loudness and stress
- tendency for rapid or accelerated rate
- inappropriate silences
- rapidly repeated phonemes
- palilalia
- rapid, "blurred" AMRs
- masked facial expression
- tremulous jaw, lips, tongue
- reduced range of motion on AMR tasks
- resting tremor
- rigidity
Hyperkinetic basal ganglia control circuit - prolonged intervals
- sudden forced inspiration/expiration
- transient breathiness
- transient vocal strain or harshness
- voice stoppages/arrests
- voice tremor
- myoclonic vowel prolongation
- intermittent hypernasality
- marked deterioration with increased rate
- inappropriate vocal noises
- intermittent breathy/aphonic segments
- distorted vowels
- excessive loudness variation
- slow and irregular AMRs
- involuntary head, jaw, face, tongue, velar, laryngeal, and respiratory movements
- relatively sustained deviation of head position
- multiple motor tics
- myoclonus of palate, pharynx, larynx, lips, nares, tongue, or respiratory muscles
- jaw, lip, tongue, pharyngeal, or palatal tremor
- facial grimacing during speech
Unilateral upper motor neuron unilateral disorders of the upper motor neuron system - slow rate
- imprecise articulation
- irregular articulatory breakdowns
- strained voice quality
- reduced loudness
- unilateral lower face weakness
- unilateral lingual weakness without atrophy/fasciculations
- nonverbal oral apraxia