透過您的圖書館登入
IP:3.17.154.171
  • 學位論文

基於不同主題的中文情感分析比較

Comparisons of Sentiment Analysis Techniques based on Different Topics

指導教授 : 陳景祥

摘要


在現今社會中,越來越多人會透過網路分享自己對某些事件的看法,分析評論情感傾向的技術,稱為情感分析(Sentiment Analysis)。因此,如何在網路資訊累積速度越來越快時,即時且精確地分析網路評論的情感傾向,是情感分析重要的研究方向。 在網路評論中,部份詞彙具有其對應的情緒,可能為正向、也可能為負向,一般來說稱之為詞彙極性。在情感分析領域中,對於詞彙極性之標注採用人工的方式最為準確,但也最花費時間與成本。本論文會先提出一個利用基於語意PMI概念的非監督式方法,期望建立屬於該主題的情緒詞庫;進一步地我們結合監督式與半監督式的優點,提出一個半監督式方法,結合我們所提出來的非監督式方法與監督式方法中的支持向量機(Support Vector Machine,SVM),期望能更近一步提升我們的分類準確率。   對於不同的主題,我們採用了不同的情感分析技術去比較,最後我們實際應用在報紙的文章、隨機選取數百篇文章驗證本論文的方法。結果顯示我們的方法比單純非監督式技術預測精確度更高。

關鍵字

文字探勘 情感分析 點互信息 SVM

並列摘要


In the era of internet, more and more people share their opinions on the web and sentiment analysis is the technique used to analyze the emotions of these opinions. While network opinions are accumulated in increasing speed, improvement of accuracy and correctness of classification of emotional tendencies in sentiment analysis become important research directions. In the online opinions, terms or words may be positive or negative., generally referred to as lexical polarity. So far, manual tagging is the most accurate way to judge the semantic orientations in sentiment analysis, with the disadvantage of higher cost. In this paper, we presents an unsupervised sentiment analysis approach that uses a semantic-based PMI technique to build the emotional dictionaries for different topics. Our method is a combination of our proposed unsupervised methods and Support Vector Machine (SVM) classification algorithm. The goal is to improve classification accuracy and reduction of supervising costs in sentiment analysis. Real-world online reviews and randomly selected news data are used for evaluation and comparisons of different algorithms. The results show that our method is relatively effective with the consideration of balance between classification accuracy and supervising costs.

並列關鍵字

Text mining Sentiment analysis PMI SVM

參考文獻


2.吳泳慶(2007),「中文垃圾郵件客製化過濾系統之研究」,淡江大學統計學系碩士班學位論文。
3.陳立(2010),「中文情感語意自動分類之研究」,臺灣師範大學資訊工程研究所學位論文。
4.陳昱年(2013),「電影評論中情緒詞彙之極性分析」,臺灣師範大學資訊工程研究所學位論文。
6.陳昱年(2013),「電影評論中情緒詞彙之極性分析」,臺灣師範大學資訊工程研究所學位論文。
7.劉炅函(2017),「中文情感分析應用於PTT之研究」,淡江大學統計學系碩士班學位論文。

延伸閱讀