透過您的圖書館登入
IP:3.147.73.35
  • 學位論文

事件與意見摘要方法之研究

A Study of Event and Opinion Summarization

指導教授 : 陳信希

摘要


隨著網際網路的蓬勃發展,文字資訊逐漸電子化,在大量的資料下,如何有效率的瀏覽感到興趣的資訊變得越來越重要。在過去的相關研究中,為了可以有效率的瀏覽資訊,而提出多文件摘要。 然而,傳統的多文件摘要著重於文件重要內容的整理分析,但是,若使用者有興趣的資訊是社會大眾對某個事件的看法,而不僅僅是事件內容的話,這樣的多文件摘要並不能滿足使用者的需求。根據觀察,使用者有興趣的資訊愈來愈傾向含有意見的資訊,而不再單單是事件本身。 本篇論文著重在簡短的摘要,跟傳統採用壓縮比的方式不同,我們所產生的摘要約在400字的大小。現在資料的取得越來越容易,要取得大量的文件不是困難的事情,但要在短時間內知道大量文件中的內容是很困難的,如果採用傳統壓縮比的方式去產生摘要,資料量很大時還是要花不少時間去閱讀摘要,所以我們想在短短400字摘要裡面盡量包含文件的重要內容,讓讀者可以在短時間內了解到文件中所要表達的事情。 本篇論文提出,用事件摘要跟意見摘要經過適當組合產生綜合摘要,事件摘要用事件詞分類,來將討論到相似事件的句子放在同一群,以避免選到內容相似的句子,再用事件分數去挑出代表各群的句子。為了產生意見摘要,我們找出一群對意見有鑑別力的詞性來判斷句子是否為意見句,利用這些詞性來算出句子的意見分數,並根據意見分數選出具有比較強烈的意見的句子。最後將產生的事件跟意見摘要,經過最適當的組合產生最後的綜合摘要。

關鍵字

摘要

並列摘要


無資料

並列關鍵字

Summarization

參考文獻


[1] 李俐瑩,意見摘要方法之研究,碩士論文,2005
[2] Brunn, M., Chali, Y., & Pinchak, C.J. (2001). Text summarization using lexical chains. In Proceedings of First Document Understanding Conference, New Orleans, LA.
[3] Edmundson, H.P. (1964). Problems in automatic extracting. Communications of the ACM, 7, pp.59–263.
[6] Kuo, J.-J. and Chen H.-H. Cross-document event clustering using knowledge mining from co-reference chains, IP&M, 2007
[12] Knight, K. & Marcu, D. (2000). Statistics-based summarization – step one: Sentence compression. In Proceedings of AAAI-2000, Austin, TX.

延伸閱讀