基於位置特定事後機率詞圖及潛藏語意分析之語音文件檢索

結合多種影音效果的多媒體文件，隨著網路世界的流通，正逐漸成為身處數位時代中的人們，吸取新資訊的重要來源。而這些多媒體文件所帶有的語音訊息，更常常扮演著其中最為關鍵的角色。但是瀏覽以語音資訊為主的文件，並沒有辦法像瀏覽文字文件一樣地方便，因此以快速而準確地從眾多語音文件中，找到使用者想要知道的資訊為目標的語音文件檢索相關技術，自然也就日漸受到大家的注目了。比起文字文件檢索，語音文件檢索尚須面對在自動語音辨識過程中，由於環境雜訊或是語者說話型態等因素，而可能會產生的高辨識錯誤率，使得檢索的難度更加上升。因此，如何為語音文件建立起良好的索引方式，來盡可能保存有助於語音文件檢索工作進行的資訊，便是本論文的第一項主題。以詞為單位之位置特定事後詞圖，充分使用候選詞於詞圖上的位置資訊，在過去的研究中展現出在語音文件檢索工作上的優勢。本論文則是更進一步，思考以字元或是音節等次詞單元作為建立位置特定事後機率詞圖的基本單位，不但順利地解決了原先以詞為單位之位置特定事後機率詞圖所無法處理的詞典外詞彙問題，而同時也能達到更好的檢索效果。文件檢索系統於實際應用時，常常有不少與查詢指令高度相關的文件，因為沒有包含查詢詞，而無法被基於字面比對的檢索系統所檢索出來。本論文的第二項主題便是以此為出發點，引入機率式潛藏語意分析模型，利用詞彙在潛藏觀念上的機率分佈，建立有效的詞彙相關度量測方法。接著我們再將其應用至以潛藏語意為基礎的檢索模式上，適度解決了字面比對無法處理的查詢詞與檢索目標文件無法匹配的問題。

關鍵字

語音文件檢索；機率式潛藏語意分析模型；位置特定事後機率詞圖

並列摘要

無資料

並列關鍵字

Spoken Document Retrieval ； Probabilistic Latent Semantic Analysis ； Position Specific Posterior Lattices

參考文獻

[4] John S. Garofolo, Cedric G. P. Auzanne, Ellen M. Voorhees, “The TREC Spoken Document Retrieval Track: A Success Story”, 2000

[6] NII Test Collection for Information Retrieval, http://research.nii.ac.jp/ntcir/

[7] ACM Special Interest Group on Information Retrieval, http://www.sigir.org/

[15] Sean Colbath, Francis Kubala, “Rough'n'Ready: a meeting recorder and browser”, ACM Computing Surveys(CSUR), 1999

[17] Stanley Boykin, Andrew Merlino, “Improving Broadcast News Segmentation Processing”, Multimedia Computing Media, 1999

被引用紀錄

杞俊賢（2010）。語音查詢檢索語音文件之初步研究〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2010.01954

延伸閱讀

曾韋榮（2006）。結合潛在語意檢索及資訊粒化於資料探勘〔碩士論文，國立臺北科技大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0006-0407200616461900
涂謹瀅（2014）。利用關聯規則與潛在語意分析以運用相關回饋資訊於文件分類的方法〔碩士論文，國立中央大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0031-0412201511584782
Kong, S. Y. (2010). 用潛藏主題參數進行語音文件之非督導式語意分析及組織 [doctoral dissertation, National Taiwan University]. Airiti Library. https://doi.org/10.6342/NTU.2010.02787
周宥宇（2013）。Spoken Document Summarization : with Structural Support Vector Machine，Domain Adaptation and Abstractive Summarization〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2013.02266
YI, D., ZHANG, Y., & WEI, B. (2016). Query Subtopic Mining via Subtractive Initialization of Non-negative Sparse Latent Semantic Analysis. Journal of Information Science and Engineering, 32(5), 1161-1181. https://www.airitilibrary.com/Article/Detail?DocID=10162364-201609-201703280016-201703280016-1161-1181

國際替代計量

基於位置特定事後機率詞圖及潛藏語意分析之語音文件檢索

全文下載

主題瀏覽