透過您的圖書館登入
IP:18.217.203.172
  • 學位論文

基於連續頻譜濾波與其改進技術之語音增強

Speech Enhancement Based on Running Spectrum Filtering and Its Improved Techniques

指導教授 : 王小川

摘要


語音辨認技術在實際應用時,常會受雜訊干擾,使得辨認效果不夠理想,尤其語音辨認技術的應用,例如手持行動設備、車用導航系統等,大多數是在噪音干擾嚴重的環境下,如何提升在噪音干擾下的語音辨認效能,即為本論文研究的重點。 有許多方法可用來改善辨認效能,方法之一就是在辨認系統前端先去除噪音的成分,屬於頻譜刪減 (Spectrum Subtraction, SS) 這一類的方法通常被認為是簡單又有效的,也常被採用,但是隨著背景噪音更加複雜,此類方法效能依然會大幅減弱。此外,需要先預估環境的雜訊才能做刪減,也是此類方法的一大缺陷,這在即時性的辨識系統是不太適當的,因為背景噪音可能不斷改變。 為了能進一步改善語音辨認的效能,本論文提出調變頻率空間與再經一次傅利葉轉換後的空間做噪音抑制的方法。連續頻譜濾波 (Running Spectrum Filtering, RSF) 便是在調變頻率空間相當有效的方法,此方法透過對調變頻譜做濾波處理,即可有效消除大部分的噪音,除了不需先做雜訊預估的優點外,還可大幅提升在低訊噪比情況時的辨認率。本論文更進一步提出改良式的RSF方法,採用多頻帶的帶通範圍選擇,不僅可以增加整體辨認效能,也可提升在不同噪音環境下的辨認強健性。 此外,本論文還提出在第三層傅利葉轉換空間的噪音抑制方法,連續調變頻譜濾波 (Running Modulation spectrum Filtering, RMF),透過將調變頻譜再做一次傅利葉轉換,可有效在此空間濾除背景噪音,顯著提升辨認效能。連續語音的平均辦認正確率更可從RSF的74.93%提升到RMF的83.35%。

參考文獻


[1] S.F. Boll, “Suppression of acoustic noise in speech using spectral subtraction,” IEEE Trans. Acoust., Speech, Signal Process., vol.27, pp. 113-120, Apr. 1979.
[3] K. Fujioka, and Y. Miyanaga, “A new noise reduction method of speech signal with running spectrum filtering,” Proc. ISPACS 2004., pp. 173-176, 18-19 Nov. 2004.
[4] Q. Zhu, N. Ohtsuki, Y. Miyanaga, and N. Yoshida, “Robust speech analysis in noisy environment using running spectrum filtering,” Proc. ISCIT 2004., vol.2, pp. 995 - 1000, 26-29 Oct. 2004.
[5] Q. Zhu, N. Ohtsuki, Y. Miyanaga, and N. Yoshida, “Noise-Robust Speech Analysis Using Running Spectrum Filtering,” IEICE Trans. Fundamentals, Vol.E88-A No.2 pp.541-548, Feb. 2005
[6] N. Wada, N. Hayasaka, S. Yoshizawa, and Y. Miyanaga, “Robust speech recognition with feature extraction using combined method of RSF and DRA,” Proc. ISCIT 2004., vol.2, pp. 1001 – 1004, 26-29 Oct. 2004.

被引用紀錄


陳宥安(2015)。羽球線在持續拍擊下之拍擊力量分析〔碩士論文,長榮大學〕。華藝線上圖書館。https://doi.org/10.6833/CJCU.2015.00051
韓洪敏(2010)。不同球線、穿線磅數對羽球拍 拍擊力量影響之研究〔碩士論文,長榮大學〕。華藝線上圖書館。https://doi.org/10.6833/CJCU.2010.00059

延伸閱讀