透過您的圖書館登入
IP:3.21.233.41
  • 學位論文

在不同迴響條件下中文單音節語音清晰度與語音倒頻譜分析之關聯性研究

Relationship between speech intelligibility and cepstrum analysis of Chinese monosyllable under different reverberant conditions

指導教授 : 陳炯堯
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


台灣目前測定廳堂之語音清晰度品質的優劣評價,多是以英語發音為基礎的語音快速傳輸指標(rapid speech transmission index,RASTI)來作為聲場評價之依據。陳炯堯、詹旻憲(2005)在研究中發現語音自函數最小有效遲延(τe)min值可有效對應於單一廳堂中各單音節語音之語音正答率(articulation score),但無法整理出對於所有聲場一致性的關係。 Miyoshi and et al,(2004)以及曾毓敏、吳鎮揚(2007)提出利用倒頻譜解析方法,可有效描述出聲音訊號時時刻刻的變化情形,倒頻譜分析語音可以使語音分析的訊號更為清晰,可有效去除或減小噪音對於語音訊號的干擾。洪志偉等(2009)當受到雜訊干擾時,其辨識效能通常會明顯下降,而要如何改善此問題,利用語音倒頻譜計算技術,來降低背景雜訊的影響,以提升語音辨識的效能。因此本研究將深入探討語音倒頻譜技術,試圖找出各廳堂測點之單音節語音的倒頻譜能量變化與心理語音正答率(articulation score)之對應關係。 本研究樣本延續陳炯堯、詹旻獻(2005)所錄製之6個聲場的空間樣本進行語音倒頻譜分析,發現在76個測點比較分析中,就同一單音節語音而言,語音倒頻譜(cepsturm)之能量與全部廳堂間之心理語音正答率(articulation score)有非常良好的對應關係(R2≧0.5)。

並列摘要


So far, English-based rapid speech transmission index (RASTI) is the most common method in Taiwan on evaluating sound fields to test for speech intelligibility in halls. Chen and Chan (2005) found that the minimum value of the effective duration of running autocorrelation function, (τe)min, is correlated with the articulation scores on single-syllable words collected in a hall, but not with the sound field uniformity. Miyoshi and et al. (2004), Zeng and Wu (2007) use cepstrum analysis to effectively determine the variations within speech signals, where the interference of noise is adequately reduced or filtered out, resulting in clearer speech signals.Hung et al. (2009) found that performance on recognition tasks decreases when there is interference of noise, To solve this problem, one can use cepstrum calculation and substract background noise, improving speech recognition performance.Therefore, this study will delve into the cepstral analysis of speech, and study the correlations between cepstral capacities of single syllables and articulation scores in each survey points of a hall. This study continues to analyze the samples of 6 sound fields recorded by Chen et al (2005). Results from the comparative study of 76 survey points showed significant correlation between the cepstral energy of one-syllable words and articulation scores collected in all halls (R2≧0.5).

並列關鍵字

cepsturm monosyllabic speech RASTI

參考文獻


4.陳炯堯 林葳,2001,"台灣地區華語之聲場語音清晰度評價測定法",朝陽科技大學建築及都市設計研究所碩士論文。
6.陳炯堯、王泉普,1999,"室內聲場清晰度與第一反射遲延之相關性-以朝陽科技大學禮堂與演講廳為例",《中華民國音響學會第十二屆學術會議論文集》,p.212-219。
7.陳炯堯、王泉普、石佳玉,2002,"室內聲場清晰度與第一反射遲延之相關性–以朝陽科技大學禮堂及演講廳為例",《中華民國建築學會建築學報》,第三十九期,p.63-69。
9.陳炯堯、林葳、陳麗雪,2003,"台灣地區華語之聲場語音清晰度評價測定法研究",《中華民國建築學會建築學報》,第四十三期,p.27-36。
10.陳炯堯 詹旻憲,2005,"廳堂之中文語音清晰度與訊號自相關函數之關聯性研究─以台灣地區華語為主",朝陽科技大學建築及都市設計研究所碩士論文。

被引用紀錄


吳銘書(2017)。空間語音收聽難懂度與語音自函數之關聯性研究〔碩士論文,朝陽科技大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0078-2712201714434615

延伸閱讀