本篇論文的研究主旨是對於多音節之英語詞彙進行重音辨識。主要使用兩種辨識方法,「一維特徵參數的辨識方法」以及「兩步驟分類的辨識方法」。兩個方法所需要的輸入資料為單一個多音節詞彙的語音資料,經由強制對位產生子音與母音音素,再對各因素取得音高、音量向量以及持續時間。其中母音音素的資訊可以代表一個音節。最終需要得到的結果即一個詞彙只能有一個母音被標記為重音。 第一種方法是對一個詞彙的母音音素(亦代表音節)取出音高向量(pitch vector)和音量向量(volume vector),再使用不同的計算方法,分別為中位數、平均值、最大值、導函數取最大值(maximum of derivative)、導函數取中位數、第一四分位數和第三四分位數,將音高及音量向量轉換成數值;因此,每種計算方法均會產生一個特徵參數值。最後,直接使用單一特徵值(如:各母音的音高中位數)來辨識一個詞彙的重音。 第二種方法分為兩個步驟,第一步驟是使用高斯混合模型(Gaussian Mixture Model, GMM)對各個母音音素(亦代表音節)的特徵參數做分類,分出重音與非重音兩類。因為一個詞彙只能有一個主要的重音音節,因此第二步驟主要對n個音節詞彙進行n類的分類問題來決定重音音節位於第幾個音節,例如2個音節詞彙可分為第一個音節為重音以及第二個音節為重音2類。而第二步的特徵是使用第一步驟所產生的各詞彙重音與非重音之log likelihood。 在本論文的實驗中,第一種辨識方法進行了8組實驗,而最佳辨識率為82.58%,使用的單一特徵為對音高向量取中位數。第二種辨識方法進行了11組實驗,第二步驟對2、3、4個音節詞彙進行分類,最佳辨識率分別為90.36%、86.85%、85.65%。比第一種方法提高約3~7%。本實驗結果顯示,我們提出的方法,可以有效地使用音高、音量和持續時間,成功辨識出口說英語重音。