透過您的圖書館登入
IP:18.217.116.183
  • 學位論文

課程語料之主題切割及其應用

Topic segmentation on lecture corpus and its application

指導教授 : 李琳山

摘要


隨著資訊爆炸的時代來臨,網路所帶來的便利漸漸改變我們的生活,包含語音訊息的多媒體文件成為資訊瀏覽的熱門媒介,網路課程學習正是藉由網路來降低學習的障礙,整合了影音、文字、圖形等資源來傳遞知識。為了提供使用者快速便捷的課程內容,若以人工的方式來分析與整理課程語料是一件非常耗時費工的事情,如何能以自動化方式來達到這些目標便成為一個主要的課題。 本論文中針對具有高度自發性及雙語性質的課程語料,依據課程本身的架構,提出了以課程投影片為基準的主題切割與校準。我們將主題切割的過程分為兩個步驟,分別利用動態規劃切割以及隱藏式馬可夫模型校準,自動的為語音辨識過後的文件找出各段落所隸屬的主題,並以實驗顯示該方法能夠克服語料中語言的落差以及辨識錯誤。此外,本論文也依據每一主題所包含的資訊做群集與索引,將各階段的結果整合至一視覺化的瀏覽介面中,提供使用者一個結構化的課程學習方式。

關鍵字

語音 課程 主題切割

並列摘要


無資料

並列關鍵字

speech lecture topic segmentation

參考文獻


[3] A. Park, T. Hazen, and J. Glass, “Automatic Processing of Audio Lectures for Information Retrieval: Vocabulary Selection and Language Modeling,” Proc. ICASSP, Philadelphia, March 2005
[5] Sugata Mukhopadhyay and Brian Smith, “Passive Capture and Structuring of Lectures,” international conference on Multimedia, 1999.
[6] Doug Beeferman, Adam Berger and John Lafferty, “Statistical Models for Text Segmentation,” Machine Learning, 1999
[7] Jeffrey C. Reynar, “Statistical Models for Topic Segmentation,” ACL, 1999
[8] Xiang Ji Hongyuan Zha, “Domain­independent Text Segmentation Using Anisotropic Diffusion and Dynamic Programming,” ACM SIGIR, 2003

延伸閱讀