Title

應用資料探勘於手機評論文章分類之研究

DOI

10.29709/ecmanagement.201005.0294

Authors

劉力華

Key Words

資料探勘 ; 機器學習 ; 自動化文件分類

PublicationName

電子化企業經營管理理論暨實務研討會

Volume or Term/Year and Month of Publication

第11屆(2010 / 05 / 29)

Page #

294 - 303

Content Language

繁體中文

Chinese Abstract

目的 評估使用不同的分類及特徵選取法,應用在預測手機評論文章對產品之評價時,其精確度的好壞,以做為建立自動化評論分類機制的參考。 設計/方法/門徑 本研究從網路上搜集使用者發表之已標記評價(1~5顆星)的手機評論做為訓練資料,進行前處理、特徵選取、權重計算等過程,將文章轉換成分類演算法可處理的數值資料,並使用不同的學習法訓練出用來預測某篇評論對產品之評價的模型。 最後再使用訓練出的模型,對未標記評價數的評論進行分類,若分類器對測試文章判斷的評價和評論原作者真正的評價一致,則表示分類器有著高度的精確性。 發現 本研究在實驗的過程中,記錄不同的資料處理及學習方式,包括不同的特徵選取數,分類演算法及一些細部的參數調整對於分類結果的影響,並整理出精確度最高的方式。 研究限制/影響 由於網路上對手機這項產品的評論文章數目過多,在蒐集資料時無法涵蓋所有的資料來源(網站),故本文以亞馬遜網站上的手機評論文章為限,做為分類的訓練及測試資料。 實用的影響 本文之研究結果可作為建立自動化分類機制的參考。使用者欲從網路上取得他人的使用經驗或產品相關資訊時,可藉由這樣的判斷機制,自動判斷出文章所評的產品好壞,而無須花費大量的時間和心思去閱讀完整份文章,來判斷產品的好壞。 創新/價值 在資料來源及實驗對象方面,至今尚未有人以亞馬遜網站之手機評論文章,做為訓練分類器及評估其效能的資料。 而就分類法學習法的評估方面,本研究著重於非監督式及監督式學習法的比較,這兩類的學習方式及時間成本的需求上有所不同,提供一個選擇學習法的參考。

Topic Category 社會科學 > 管理學