透過您的圖書館登入
IP:3.15.6.77
  • 學位論文

語音文件摘要與語音問答系統之新技術

Advanced Technologies for Spoken Document Summarization and Spoken Question Answering

指導教授 : 李琳山

摘要


本論論文研究主題涵蓋語音技術應用之兩兩大前瞻性方向:語音文件摘要(Spoken Document Summarization)和語音問答系統(Spoken Question Answering),實驗語料料 以中文為主,包含語音訊號以及語音辨識識轉寫(Transcription)。 語音文件摘要以中文的課程錄錄音為應用領領域,首先使用含有隱藏變數數 (Hidden Variable)之結構式支撐向量量機(Structured Support Vector Machine)。結構式 支撐向量量機使得整篇文件的資訊可以一同考慮,因此可以加入重複性 (Redundancy)的考量量,使得有長度度限制的摘要能包含更更多資訊。此外透過連連續句句 子叢集的隱藏變數數,可以考慮到更更細微的文件結構,更更貼近人工選擇之摘要。 此外,由於督導式的結構式支撐向量量機需要訓練練資料料,並不不易易在一般的課程 系統中使用,因此本論論文另外使用非督導式的雙層隨機漫步(Two-layer Random Walk),除了了使用課程錄錄音轉寫的句句子外,另外輔以課程投影片的資訊,因此可 以不不使用需要大量量人工的訓練練資料料,大大地降降低了了抽取摘要的前置作業與時間。 最後,本論論文就語音問答系統作了了初步的研究,主要針對以檢索索為基礎 (Information Retrieval Based)之模擬陳述問答(Factoid Question Answering),語音 問句句使得本論論文考慮的問題與一般的純文字問答系統不不同。論論文中使用問句句之前 N 最佳辨識識轉寫(N-best Transcription),透過樹狀狀條件隨機域(Tree-Structured Conditional Ransom Fields)搭配剖析樹(Parse tree)進行行關鍵詞抽取當作查詢指令令, 再透過搜尋引擎得到相關的網頁。然而,由於語音辨識識含有許多辨識識錯誤,本論論 文再利利用雙層隨機漫步,對於各個前 N 辨識識轉寫之查詢指令令所對應的網頁進行行 重排序(Re-ranking),讓越有可能含有正確答案的網頁排序提前。最後本論論文實 作初步的答案生成(Answer Generation),針對固定的答案類類別,利利用網頁內資訊 以及網頁排序為參參數數對每個可能的答案進行行評分,對將來來語音問答系統的研究提 供了了良良好的起點。

參考文獻


International Speech Communication Association, 2007.
[3] Jingjing Liu, Scott Cyphers, Panupong Pasupat, Ian Mcgraw, and Jim Glass, “A
Conversational Movie Search System Based on Conditional Random Fields,”
Interspeech, 2012.
[4] Ani Nenkova, “A survey of text summarization techniques,” in Multimedia,

延伸閱讀