語音文件摘要與語音問答系統之新技術

本論論文研究主題涵蓋語音技術應用之兩兩大前瞻性方向:語音文件摘要(Spoken Document Summarization)和語音問答系統(Spoken Question Answering),實驗語料料以中文為主,包含語音訊號以及語音辨識識轉寫(Transcription)。語音文件摘要以中文的課程錄錄音為應用領領域,首先使用含有隱藏變數數 (Hidden Variable)之結構式支撐向量量機(Structured Support Vector Machine)。結構式支撐向量量機使得整篇文件的資訊可以一同考慮,因此可以加入重複性 (Redundancy)的考量量,使得有長度度限制的摘要能包含更更多資訊。此外透過連連續句句子叢集的隱藏變數數,可以考慮到更更細微的文件結構,更更貼近人工選擇之摘要。此外,由於督導式的結構式支撐向量量機需要訓練練資料料,並不不易易在一般的課程系統中使用,因此本論論文另外使用非督導式的雙層隨機漫步(Two-layer Random Walk),除了了使用課程錄錄音轉寫的句句子外,另外輔以課程投影片的資訊,因此可以不不使用需要大量量人工的訓練練資料料,大大地降降低了了抽取摘要的前置作業與時間。最後,本論論文就語音問答系統作了了初步的研究,主要針對以檢索索為基礎 (Information Retrieval Based)之模擬陳述問答(Factoid Question Answering),語音問句句使得本論論文考慮的問題與一般的純文字問答系統不不同。論論文中使用問句句之前 N 最佳辨識識轉寫(N-best Transcription),透過樹狀狀條件隨機域(Tree-Structured Conditional Ransom Fields)搭配剖析樹(Parse tree)進行行關鍵詞抽取當作查詢指令令, 再透過搜尋引擎得到相關的網頁。然而,由於語音辨識識含有許多辨識識錯誤,本論論文再利利用雙層隨機漫步,對於各個前 N 辨識識轉寫之查詢指令令所對應的網頁進行行重排序(Re-ranking),讓越有可能含有正確答案的網頁排序提前。最後本論論文實作初步的答案生成(Answer Generation),針對固定的答案類類別,利利用網頁內資訊以及網頁排序為參參數數對每個可能的答案進行行評分,對將來來語音問答系統的研究提供了了良良好的起點。

關鍵字

語音文件；摘要；問答；結構式支撐向量機；隨機漫步；雙層隨機漫步；條件隨機域

並列摘要

無資料

並列關鍵字

Spoken Document ； Summarization ； Question Answering ； Structured Support Vector Machine ； Two-layer Random Walk ； Conditional Random Fields

參考文獻

International Speech Communication Association, 2007.

[3] Jingjing Liu, Scott Cyphers, Panupong Pasupat, Ian Mcgraw, and Jim Glass, “A

Conversational Movie Search System Based on Conditional Random Fields,”

Interspeech, 2012.

[4] Ani Nenkova, “A survey of text summarization techniques,” in Multimedia,

國際替代計量

語音文件摘要與語音問答系統之新技術

全文下載

主題瀏覽