透過您的圖書館登入
IP:216.73.216.100
  • 學位論文

多語問答系統之研究

A Study on Multilingual Question Answering Systems

指導教授 : 陳信希

摘要


本論文研究多語問答,擬將單語問答系統擴展到處理更多語言,也就是某一種語言的問題,不再限於根據同一語言的文件,去找出問題的答案,而是可以跨語言問答。舉例來說,給定中文問句,以及英文文件,希望找出英文文件中此問題的答案,回傳給使用者。這樣一來,可以利用到的資源較多,也能讓使用者獲得更多相關的答案。 本文將翻譯的問題,放在問句的部分,也就是去作「問句翻譯」,除了基本的查字典翻譯,我們還利用網路資源來擷取未知詞的翻譯,並從答對數、答對平均排名和查詢時間,三個方面來作效能評估。而「答案整合」的部分,則是要將多語問答系統在不同語言的文件中,找到的相同答案合併,並且重新排序輸出。 最後,我們使用NTCIR-5的CLQA task的CE -Subtasks的問題集和文件集,來作中英問答實驗,測試多語問答系統的效能。實驗結果正確率為15.33%,MRR為0.06236,相對於英文單語問答,效能減低大約三分之一。

並列摘要


無資料

參考文獻


Fellbaum, Christiane (Ed.) (1998) WordNet: An Electronic Lexical Database, the MIT Press.
Katz, Boris and Jimmy Lin and Sue Felshin (2001), “Gathering Knowledge for a Question Answering System from Heterogeneous Information Sources,” Proceedings of ACL Workshop on Human Language Technology and Knowledge Management, pp. 71-78.
Lin, Chuan-Jie (2004), A Study on Chinese Open-Domain Question Answering Systems, Ph.D. Thesis, National Taiwan University
Oard, D. (1998), “A comparative study of query and document translation for cross-language information retrieval.” Third Conference of the Association for Machine Translation in the Americas (AMTA), pp. 472-483, 1998.
Pu-Jen Cheng, Jei-Wen Teng, Ruei-Cheng Chen, Jenq-Haur Wang, Wen-Hsiang Lu, Lee-Feng Chien: Translating unknown queries with web corpora for cross-language information retrieval. In Proc. of the 27th ACM-SIGIR International Conference on Research and Development in Information Retrieval (SIGIR), pp. 146-153, 2004.

延伸閱讀


國際替代計量