透過您的圖書館登入
IP:18.217.144.32

摘要


隨著網路的蓬勃發展,電子商務興起,以及web2.0技術的廣泛應用,愈來愈多人在網路上表達個人對於產品與服務之使用意見。然而網路的評論通常會混合著正面與負面意見,若以人工處理方式去從中取得具有參考價值之訊息,勢必要花費許多精力與時間。在文字探勘領域中,文件分群能夠將文件加以歸類,即可以解決現今網路文件雜亂無序的問題。當在運用文字探勘時,文件會經過前置處理將文件分解成許多能代表文件的關鍵詞,再將這些關鍵詞轉換成數值來呈現。一般呈現的方式是運用向量空間模型,將每個關鍵詞依向量來表示之,之後再以群集運算法將文件歸類整理。不過,在使用向量空間模型時,通常會伴隨著過多的雜訊,使得最後文件群集的成效被影響。本研究針對特徵表示法的部分進行改良,利用feature-opinion pairs來代表向量空間模型之特徵,使特徵表示法能包含更多的語意訊息,再藉由產生的向量空間模型導入分類器對產品評論進行分類。而實驗獲得的分類結果得知這樣的特徵表示法成功將五等級的文件分類成效提高,並在以root作為擷取的Token feature的擷取規則下平均分類成效優於先前的研究,在各等級的分類成效中都有顯著的提升。

延伸閱讀