音高(Pitch) 代表聲音頻率的高低,是音訊處理上一個相當重要的特徵,也是人判斷聲音種類、內容的依據之一。一段穩定的聲音,其音訊的波形通常會有週期性,即存在一個基本週期。而一般使用聲音的基本頻率(Fundamental Frequency)來類比,即基本週期(Fundamental Period)的倒數。而如何以電腦自動抓取一段音訊的音高,其過程便稱為音高追蹤(Pitch Tracking)。 本論文將簡要敘述九種不同音高追蹤方法之內容:HPS、SHS、SHR、Cepstrum、ACF、AMDF、SWIPE’、Dressler’s algorithm、UPDUDP,列出其分析音訊求取音高的步驟。在實驗一中,以八種音高追蹤方法:HPS、SHS、Cepstrum、ACF、AMDF、SWIPE’、Dressler’s algorithm、UPDUDP,分別對所蒐集的錄音檔進行音高追蹤求出音高,並與人工標示之音高進行比對,計算出辨識率。接著在實驗二中,本論文以LS及兩種DTW方法來進行旋律辨識,比較此八種音高追蹤方法得到之音高資訊與人工標示音高進行旋律辨識結果之差異。 根據實驗結果,音高追蹤結果以UPDUDP的辨識率為最高。而旋律辨識結果以UPDUDP進行音高追蹤,以LS進行旋律辨識之辨識率為最高,與人工標示音高之辨識結果相比只差了2.16%。 最後,本論文將針對各音高追蹤方法之辨識結果進行分析,並比較其優缺點。