隨著網際網路的蓬勃發展,文字資訊逐漸電子化,在大量的資料下,如何有效率的瀏覽感到興趣的資訊變得越來越重要。在過去的相關研究中,為了可以有效率的瀏覽資訊,而提出多文件摘要。 然而,傳統的多文件摘要著重於文件重要內容的整理分析,但是,若使用者有興趣的資訊是社會大眾對某個事件的看法,而不僅僅是事件內容的話,這樣的多文件摘要並不能滿足使用者的需求。根據觀察,使用者有興趣的資訊愈來愈傾向含有意見的資訊,而不再單單是事件本身。 本篇論文著重在簡短的摘要,跟傳統採用壓縮比的方式不同,我們所產生的摘要約在400字的大小。現在資料的取得越來越容易,要取得大量的文件不是困難的事情,但要在短時間內知道大量文件中的內容是很困難的,如果採用傳統壓縮比的方式去產生摘要,資料量很大時還是要花不少時間去閱讀摘要,所以我們想在短短400字摘要裡面盡量包含文件的重要內容,讓讀者可以在短時間內了解到文件中所要表達的事情。 本篇論文提出,用事件摘要跟意見摘要經過適當組合產生綜合摘要,事件摘要用事件詞分類,來將討論到相似事件的句子放在同一群,以避免選到內容相似的句子,再用事件分數去挑出代表各群的句子。為了產生意見摘要,我們找出一群對意見有鑑別力的詞性來判斷句子是否為意見句,利用這些詞性來算出句子的意見分數,並根據意見分數選出具有比較強烈的意見的句子。最後將產生的事件跟意見摘要,經過最適當的組合產生最後的綜合摘要。