透過您的圖書館登入
IP:3.15.218.254
  • 學位論文

國語語音訊號中 發音偏誤類型之自動偵測

Automatic Detection of Pronunciation Error Patterns from Speech Signals in Mandarin Chinese

指導教授 : 李琳山

摘要


由語音訊號中自動判斷發音正確性是一件相當不容易的事。本論文著力於如何利用電腦,自動分析國語語音訊號,偵測其中發音是否有所偏誤,及可能的偏誤類型。 本論文先定義出一組新的語音訊號特徵,並從語音訊號中抽取此特徵。用該特徵訓練分類器,以取代常被使用的聲音特徵組,亦即梅爾刻度倒頻譜係數。之後再使用分類與回歸決策樹做為分類器,可以依據此特徵組的各個參數,評估學習者的發音正確性。我們期望此種架構近似於一般專業人士評估發音正確性的思維。 偵測發音偏誤類型的最大困難之一,即是由專業人士標記的偏誤資料不易取得。針對此種標記資料稀少,未標記資料眾多的狀況,本論文引進機器學習領域中的半督導式學習法。此法除了使用標記資料的知識外,大量未標記資料的分佈狀況也將併入此學習法的分類考量。本論文嘗試利用此法擷取高可信度的偏誤音框,增加決策樹的訓練資料量。

並列摘要


參考文獻


【2】 Khiet Truong et al. “Automatic detection of frequent pronunciation errors made by L2-learners,” INTERSPEECH 2005.
【3】 Kim, Y., Franco, H. and Neumeyer, L. “Automatic pronunciation scoring of specific phone segments for language instruction,” Proc. Eurospeech, Rhodes, Greece, 645-648, 1997.
【4】 Weigelt, L.F., Sadoff, S.J. and Miller, J.D., “The plosive/fricative distinction: The voiceless case,” Journal of the Acoustical Society of America 87, 2729-2737, 1990.
【5】 Xiaojin Zhu, “Semi-Supervised Learning with Graphs,” Ph.D. thesis, Carnegie Mellon University, 2005.
【6】 Simon Haykin, “Neural Networks. A Comprehensive Foundation,” McMatster University.

被引用紀錄


周建宇(2009)。基於機器學習之中文語句分段〔碩士論文,國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2009.00568
李易(2008)。自發性國語語音中自動偵測填充式停頓之初步研究〔碩士論文,國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2008.02446

延伸閱讀