透過您的圖書館登入
IP:216.73.216.100
  • 學位論文

以多重評分自動產生語音文件標題之進一步研究

Improved Automatic Generation of Titles for Spoken Documents Using Various Scoring Techniques

指導教授 : 李琳山

摘要


隨著科技的發展,生活中所能獲得的資訊愈來愈多,不只限於文字,包含著語音資訊的多媒體文件也愈來愈普遍,很有可能成為網路世界中最廣為流通的資料形式。雖然多媒體的資訊不易瀏覽,但大部分的多媒體資訊都包含了語音訊息,因此由語音文件來自動產生標題將會對於多媒體資訊的檢索與瀏覽有很大的幫助。 在本論文中提出了一套為語音文件自動產生標題的方法,結合了建造式標題產生法與適應性最近鄰居法,能夠自動為一篇語音文件產生通順且可讀的標題。其中,適應性最近鄰居法為改良最近鄰居法而來,在有相匹配的訓練語料的情形下,可以得到很好的結果。但是,在沒有相匹配的訓練語料時,產生的結果標題就會很不理想。在本論文中提出的建造式標題產生法則運用各種語音與語言處理方法,以及統計與評分技術來產生標題,可以相當程度解決訓練語料不匹配的問題。 由於適應性最近鄰居法充分運用人所撰寫的標題,使產生的標題能夠非常通順流暢,這個想法很值得保留下來使用。因此本論文將適應性最近鄰居法與本論文所提出的建造式標題產生法整合起來,一面保留適應性最近鄰居法的想法,一面配合運用建造式標題產生法,使產生標題的結果更理想。 其作法是先使用適應性最近鄰居法得到可能的候選標題,然後判斷這個候選標題是否與測試文件內容吻合。若是,則直接將該候選標題作為最後的標題;反之,若候選標題中的類專有名詞與關鍵用語都與測試文件內容不符,則改用建造式標題產生法來為測試文件產生標題。這種整合兩種方法的標題產生法,能夠保留兩個方法的概念與優點,確實使產生的標題可以普遍有更高可讀性與相關性。

並列摘要


It is about automatic generation of titles for spoken documents using various scoring techniques.

並列關鍵字

ASR PLSA title generation topic entropy viterbi beam search

參考文獻


[2] Stephen Wan, Mark Dras, Cecile Paris and Robert Dale, “Using Thematic Information in Statistical Headline Generation,” Proc. ACL, 2003.
[3] Michele Banko, Vibhu Mittal and Michael Witbrock, “Headline Generation Based on Statistical Translation,“ Proc. ACL, 2000.
[4] Rong Jin and Alex G. Hauptmann, “Title Generation for Spoken Broadcast News Using a Training Corpus,” Proc. ICSLP, 2000.
[7] Shun-Chuan Chen and Lin-Shan Lee, “Automatic Title Generation for Chinese Spoken Documents Using an Adaptive K Nearest-Neighbor approach, ”Proc. EUROSPEECH, 2003.
[8] Rong Jin and Alex G. Hauptmann, “A New Probabilistic Model for Title Generation,” Proc. COLING, 2002.

被引用紀錄


郭克儉(2007)。中文語音文件自動標題設定之進一步研究〔碩士論文,國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2007.10403

延伸閱讀