透過您的圖書館登入
IP:18.116.43.130
  • 學位論文

利用共振峰特徵參數與距離正規化之進一步語者確認技術

Improved Speaker Verification with Formant-specific Features and Distance Normalization

指導教授 : 李琳山

摘要


本論文以改進傳統的以高斯混合模型為基礎的語者辨識系統為目標,提出了一組新的特徵參數以及一種新的分數正規化方法。 本論文所提出的新的特徵參數稱為共振峰特徵參數(Formant-specific Feature),此特徵參數由人聲頻譜中的共振峰所求得,將每個共振峰形狀用一個三角形趨近,並以三個參數描述。實驗結果顯示使用此共振峰特徵參數與梅爾頻率倒頻譜係數(Mel Frequency Cepstral Coefficient, MFCC)在分數階段整合時,可以獲得相當顯著的進步。 其次為本論文所提出的分數正規化方法,稱為距離正規化(Distance Normalization)。距離正規化法首先將高斯混合模型(Gaussian Mixture Model, GMM)的機率分數轉到固定值域範圍,再將分數除以模型距離,以減低共通門檻值(Global Threshold)的影響,並和測試正規劃(Test Normalization)結合,可以得到更佳的效果。實驗結果顯示距離正規化在低錯誤接受率(False Acceptance)時表現良好,在與測試正規化結合後效果更加理想。 最後本論文所提出的共振峰特徵參數與分數正規化二者加以整合,與傳統的梅爾頻率倒頻譜係數以及測試正規化的系統相比,發現兩種新方法的效果幾乎完全可以加成,得到了本論文中最佳的實驗結果。

並列摘要


無資料

並列關鍵字

formant normalization Gaussian Mixture Model

參考文獻


[1] D. A. Reynolds, “Robust Text-Independent Speaker Identification Using Gaussian Mixture Speaker Models,” IEEE Trans. On Speech and Audio Processing, Vol.3, No.1 , Jan. 1995, pp.72-83
[2] D. A. Reynolds, et al., “Speaker Verification Using Adapted Gaussian Mixture Models,” Digital Signal Processing 10,2000, pp.19-41
[3] S. Furui, “Cepstral analysis technique for automatic speaker verification,” IEEE Trans. On Acoustic Speech and Signal Processing, vol. ASSP-29, no.2, pp. 254-272,1981.
[5] L. Ferrer, et al., “SRI’s 2004 NIST Speaker Recognition Evaluation System,” in Proc. ICASSP 2005, Philadelphia, pp.173-176,March 2005
[6] V. Wan, et al., “SVMSVM: Support Vector Machine Speaker Verification Methodology,” in Proc. ICASSP 2003, Hong-Kong, 2003.

延伸閱讀