應用資料探勘於手機評論文章分類之研究

目的評估使用不同的分類及特徵選取法，應用在預測手機評論文章對產品之評價時，其精確度的好壞，以做為建立自動化評論分類機制的參考。設計／方法／門徑本研究從網路上搜集使用者發表之已標記評價（1~5顆星）的手機評論做為訓練資料，進行前處理、特徵選取、權重計算等過程，將文章轉換成分類演算法可處理的數值資料，並使用不同的學習法訓練出用來預測某篇評論對產品之評價的模型。最後再使用訓練出的模型，對未標記評價數的評論進行分類，若分類器對測試文章判斷的評價和評論原作者真正的評價一致，則表示分類器有著高度的精確性。發現本研究在實驗的過程中，記錄不同的資料處理及學習方式，包括不同的特徵選取數，分類演算法及一些細部的參數調整對於分類結果的影響，並整理出精確度最高的方式。研究限制／影響由於網路上對手機這項產品的評論文章數目過多，在蒐集資料時無法涵蓋所有的資料來源（網站），故本文以亞馬遜網站上的手機評論文章為限，做為分類的訓練及測試資料。實用的影響本文之研究結果可作為建立自動化分類機制的參考。使用者欲從網路上取得他人的使用經驗或產品相關資訊時，可藉由這樣的判斷機制，自動判斷出文章所評的產品好壞，而無須花費大量的時間和心思去閱讀完整份文章，來判斷產品的好壞。創新／價值在資料來源及實驗對象方面，至今尚未有人以亞馬遜網站之手機評論文章，做為訓練分類器及評估其效能的資料。而就分類法學習法的評估方面，本研究著重於非監督式及監督式學習法的比較，這兩類的學習方式及時間成本的需求上有所不同，提供一個選擇學習法的參考。

關鍵字

資料探勘；機器學習；自動化文件分類

國際替代計量

應用資料探勘於手機評論文章分類之研究

全文下載

主題瀏覽

應用資料探勘於手機評論文章分類之研究

摘要

關鍵字

延伸閱讀

國際替代計量

本網站使用Cookies