透過您的圖書館登入
IP:18.117.76.7
  • 學位論文

中文專業文件之自動叢集處理

The Automatic Clustering of Domain-Specific Chinese Documents

指導教授 : 林志麟

摘要


在知識管理的領域中,企業在建構文件管理系統之初,對於作者所提供的文件,常常無法有效的予以分類,導致系統在大量文件的充斥下讓使用者無法有效率的搜尋及使用,許多研究顯示關鍵詞可以幫助使用者決定文件是否有用,而將一堆堆的文件依其相似度來叢集,則可以提供使用者更有效率的檢索文件。 因此,本論文採用全國博碩士論文網以彩色濾光片(color filter)及液晶顯示器等光電領域相關的中文專業文件。採用改良式的Kea演算法,擷取中文文件的關鍵詞。此外,藉由凝聚式階層叢集演算法所得之叢集結果分析,作為輔助管理員針對企業組織之文件提供適合之分類方式評估。

並列摘要


In the domain of the knowledge management, enterprises are at the beginning of building and constructing document management system, the documents authors offer are not classified very effectively. This fact let user unable searching and using in effect under a large number of documents. A lot of research reveals keywords can help users to decide whether the document is useful. And gather together piles and piles of documents in accordance with its similarity, can offer a more efficient way of searching documents to users. For this reason the experiments using the Electronic Theses and Dissertations System searches the photonics documents about color filter or Liquid Crystal Display-LCD domain. We improve Kea, an algorithm for automatically extracting keyphrases from Chinese texts. Besides by analyzing the results of using Hierarchical Clustering Algorithms can assist administrators to assess the suitable ways of the categorized documents.

參考文獻


[2.] 楊和炳,「知識文件管理」,品質月刊,40卷2期,64~65頁,2004年2月。
[3.] 鍾明璇,「應用關聯規則技術有效輔助以向量空間模型為基礎之文件群集法」,中原大學,碩士論文,民國91年。
[8.] 王美淳,「利用共生詞彙特性發展一個二階段文件群集法」,中原大學資訊管理學系,碩士論文,民國92年。
[22.] 李駿翔,「應用資料探勘分類技術於專利分析之研究」,中原大學資訊管理研究所,碩士論文,民國91年。
[1.] Desouza, K. C. ,”Facilitating Tacit Knowledge Exchange”, In Communication of the ACM, Volume 46 , Issue 6 , pp.85-88, 2003.

延伸閱讀