哼唱檢索的辨識方法改進及探討

哼唱式音樂檢索是以哼唱的方式，從大量資料庫中找出正確的歌曲。以往使用動態時間伸縮(dynamic time warping，DTW)進行辨識的結果，雖然計算時間較慢但是回傳結果較有參考價值。另一種方法是線性縮放(linear-scaling，LS)，辨識速度非常的快，但是對哼唱歌曲的錯誤容忍度不如DTW來的佳，無論是音高不準確或是音長不穩定都會造成不小的影響，在哼唱正確的前提下才有較好的辨識效果。為了改進LS的辨識效果，本篇論文提出兩種LS的變型：一種是分段式的線性縮放(segmented linear-scaling，SLS)，另一種是以音符為基礎的線性縮放(note-based linear-scaling，NBLS)，試圖解決使用者哼唱速度不一的問題。前者將旋律切成數段依序使用LS辨識；後者則是用音符長度為伸縮單位來進行LS，並且由此加以衍生，提出兩種方法分別稱為NBLS1和NBLS2。本篇論文在實驗的部分觀察每種方法的辨識效果，討論他們的優點與缺點；並嘗試將DTW與其他方法進行結合，取彼此的長處，希望能夠提升只使用單一方法時的辨識率，並觀察兩者間是否存在某種關係，找出最佳的組合。除此之外，使用"人工標音"和"音高追蹤器所產生的音高"這兩種不同的測試資料進行實驗，觀察音高追蹤(pitch tracking)對辨識率的影響。依據實驗的數據顯示，本文所提出的NBLS2確實改善了LS的缺點，有效的解決哼唱速度不一時容易辨識失敗的問題，雖然NBLS2的辨識效果沒有DTW來的優異，但是NBLS2運算所花的時間只有DTW的0.2倍，可說是損失些微辨識率卻大幅提升了辨識的效能。最後我們將針對錯誤分析的結果提出我們改進的看法，並對本篇論文做一個結論。

關鍵字

旋律辨識

並列摘要

Dynamic time warping (DTW) is a very effective method for query by singing/humming (QBSH), but it requires a lot of computation. On the other hand, linear scaling (LS) requires much less time on computation, but it is not as effective as DTW. As a result, in this thesis, our goal is to find new methods that can combine the advantages of DTW and LS for efficient and effective music retrieval in QBSH systems. Specifically, we have proposed two methods in this thesis, segmented linear scaling (SLS) and note-based linear scaling (NBLS). We have performed extensive experiments to demonstrate that the proposed methods can indeed combine the effectiveness of DTW and efficiency of LS to construct a more practical QBSH system. Conclusions and future work are also addressed in the thesis.

並列關鍵字

無資料

參考文獻

Dik Hermes, "Measurement of pitch by sub-harmonics summation", Journal of Acoustics of Society of America, Am 83(1), Jan.. 1988, pp. 257-264

Xiao Wu, Ming Li, Jian Liu, Jun Yang, and Yonghong Yan,

[1]

Google Scholar

Li, M., W.Y.Y.T.: High efficient pitch tracking method for tonal feature extraction. In: Proc of International Conference of Chinese Computing. (2001)

Google Scholar

[2]

Google Scholar

被引用紀錄

凃昱銘（2012）。基於快速音高序列比對之哼唱式歌曲檢索〔碩士論文，國立臺北科技大學〕。華藝線上圖書館。https://doi.org/10.6841/NTUT.2012.00103

楊宇翔（2014）。哼唱式音樂檢索系統之容錯能力提升〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2014.02812

鄒銘軒（2008）。合併分類器用於哼唱選歌的研究〔碩士論文，國立清華大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0016-1410200814312898

楊佩綸（2012）。知識問答節目閱聽人的學習風格與收視動機、行為及滿足感之研究：以《百萬小學堂》為例〔碩士論文，國立臺灣師範大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0021-1610201315272141

國際替代計量

哼唱檢索的辨識方法改進及探討

全文下載

主題瀏覽