國語語音訊號中 發音偏誤類型之自動偵測

由語音訊號中自動判斷發音正確性是一件相當不容易的事。本論文著力於如何利用電腦，自動分析國語語音訊號，偵測其中發音是否有所偏誤，及可能的偏誤類型。本論文先定義出一組新的語音訊號特徵，並從語音訊號中抽取此特徵。用該特徵訓練分類器，以取代常被使用的聲音特徵組，亦即梅爾刻度倒頻譜係數。之後再使用分類與回歸決策樹做為分類器，可以依據此特徵組的各個參數，評估學習者的發音正確性。我們期望此種架構近似於一般專業人士評估發音正確性的思維。偵測發音偏誤類型的最大困難之一，即是由專業人士標記的偏誤資料不易取得。針對此種標記資料稀少，未標記資料眾多的狀況，本論文引進機器學習領域中的半督導式學習法。此法除了使用標記資料的知識外，大量未標記資料的分佈狀況也將併入此學習法的分類考量。本論文嘗試利用此法擷取高可信度的偏誤音框，增加決策樹的訓練資料量。

關鍵字

語音訊號；發音偏誤；決策樹；半督導式學習法

並列摘要

無資料

並列關鍵字

speech signal ； pronunciation error pattern ； decision tree ； semi-supervised learning

參考文獻

【2】 Khiet Truong et al. “Automatic detection of frequent pronunciation errors made by L2-learners,” INTERSPEECH 2005.

【3】 Kim, Y., Franco, H. and Neumeyer, L. “Automatic pronunciation scoring of specific phone segments for language instruction,” Proc. Eurospeech, Rhodes, Greece, 645-648, 1997.

【4】 Weigelt, L.F., Sadoff, S.J. and Miller, J.D., “The plosive/fricative distinction: The voiceless case,” Journal of the Acoustical Society of America 87, 2729-2737, 1990.

【5】 Xiaojin Zhu, “Semi-Supervised Learning with Graphs,” Ph.D. thesis, Carnegie Mellon University, 2005.

【6】 Simon Haykin, “Neural Networks. A Comprehensive Foundation,” McMatster University.

被引用紀錄

周建宇（2009）。基於機器學習之中文語句分段〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2009.00568

李易（2008）。自發性國語語音中自動偵測填充式停頓之初步研究〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2008.02446

國際替代計量

國語語音訊號中發音偏誤類型之自動偵測

全文下載

主題瀏覽