透過您的圖書館登入
IP:18.191.18.87
  • 學位論文

課程語料之主題切割及其應用

Topic segmentation on lecture corpus and its application

指導教授 : 李琳山

摘要


隨著資訊爆炸的時代來臨,網路所帶來的便利漸漸改變我們的生活,包含語音訊息的多媒體文件成為資訊瀏覽的熱門媒介,網路課程學習正是藉由網路來降低學習的障礙,整合了影音、文字、圖形等資源來傳遞知識。為了提供使用者快速便捷的課程內容,若以人工的方式來分析與整理課程語料是一件非常耗時費工的事情,如何能以自動化方式來達到這些目標便成為一個主要的課題。 本論文中針對具有高度自發性及雙語性質的課程語料,依據課程本身的架構,提出了以課程投影片為基準的主題切割與校準。我們將主題切割的過程分為兩個步驟,分別利用動態規劃切割以及隱藏式馬可夫模型校準,自動的為語音辨識過後的文件找出各段落所隸屬的主題,並以實驗顯示該方法能夠克服語料中語言的落差以及辨識錯誤。此外,本論文也依據每一主題所包含的資訊做群集與索引,將各階段的結果整合至一視覺化的瀏覽介面中,提供使用者一個結構化的課程學習方式。

關鍵字

語音 課程 主題切割

並列摘要


無資料

並列關鍵字

speech lecture topic segmentation

參考文獻


[22]Martin Franz, Bhuvana Ramabhadran, Todd Ward, and Michael Picheny, “Automated Transcription and Topic Segmentation of Large Spoken Archives,” Proc. Eurospeech, 2003
[21]Matthew J. Beal and Zoubin Ghahramani Gatsby, ” The Variational Bayesian EM Algorithm for Incomplete Data: with Application to Scoring Graphical Model Structures,” Oxford University Press, 2003
[3] A. Park, T. Hazen, and J. Glass, “Automatic Processing of Audio Lectures for Information Retrieval: Vocabulary Selection and Language Modeling,” Proc. ICASSP, Philadelphia, March 2005
[5] Sugata Mukhopadhyay and Brian Smith, “Passive Capture and Structuring of Lectures,” international conference on Multimedia, 1999.
[6] Doug Beeferman, Adam Berger and John Lafferty, “Statistical Models for Text Segmentation,” Machine Learning, 1999

延伸閱讀