透過您的圖書館登入
IP:18.117.183.172
  • 學位論文

基於位置特定事後機率詞圖及潛藏語意分析之語音文件檢索

Spoken Document Retrieval Based on Position Specific Posterior Lattices and Latent Semantic Analysis

指導教授 : 李琳山

摘要


結合多種影音效果的多媒體文件,隨著網路世界的流通,正逐漸成為身處數位時代中的人們,吸取新資訊的重要來源。而這些多媒體文件所帶有的語音訊息,更常常扮演著其中最為關鍵的角色。但是瀏覽以語音資訊為主的文件,並沒有辦法像瀏覽文字文件一樣地方便,因此以快速而準確地從眾多語音文件中,找到使用者想要知道的資訊為目標的語音文件檢索相關技術,自然也就日漸受到大家的注目了。 比起文字文件檢索,語音文件檢索尚須面對在自動語音辨識過程中,由於環境雜訊或是語者說話型態等因素,而可能會產生的高辨識錯誤率,使得檢索的難度更加上升。因此,如何為語音文件建立起良好的索引方式,來盡可能保存有助於語音文件檢索工作進行的資訊,便是本論文的第一項主題。以詞為單位之位置特定事後詞圖,充分使用候選詞於詞圖上的位置資訊,在過去的研究中展現出在語音文件檢索工作上的優勢。本論文則是更進一步,思考以字元或是音節等次詞單元作為建立位置特定事後機率詞圖的基本單位,不但順利地解決了原先以詞為單位之位置特定事後機率詞圖所無法處理的詞典外詞彙問題,而同時也能達到更好的檢索效果。 文件檢索系統於實際應用時,常常有不少與查詢指令高度相關的文件,因為沒有包含查詢詞,而無法被基於字面比對的檢索系統所檢索出來。本論文的第二項主題便是以此為出發點,引入機率式潛藏語意分析模型,利用詞彙在潛藏觀念上的機率分佈,建立有效的詞彙相關度量測方法。接著我們再將其應用至以潛藏語意為基礎的檢索模式上,適度解決了字面比對無法處理的查詢詞與檢索目標文件無法匹配的問題。

參考文獻


[4] John S. Garofolo, Cedric G. P. Auzanne, Ellen M. Voorhees, “The TREC Spoken Document Retrieval Track: A Success Story”, 2000
[6] NII Test Collection for Information Retrieval, http://research.nii.ac.jp/ntcir/
[7] ACM Special Interest Group on Information Retrieval, http://www.sigir.org/
[15] Sean Colbath, Francis Kubala, “Rough'n'Ready: a meeting recorder and browser”, ACM Computing Surveys(CSUR), 1999
[17] Stanley Boykin, Andrew Merlino, “Improving Broadcast News Segmentation Processing”, Multimedia Computing Media, 1999

被引用紀錄


杞俊賢(2010)。語音查詢檢索語音文件之初步研究〔碩士論文,國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2010.01954

延伸閱讀