透過您的圖書館登入
IP:3.129.19.251
  • 期刊

資料探勘中集群模式與分類模式之建構-模糊自適應共振理論綱路、分類迴歸樹與類神經綱路之整合與應用

Construction of Clustering and Classification Models by Integrating Fuzzy Art, Cart and Neural Network Approaches

摘要


隨著資訊科技的進步,企業越來越容易蒐集到所需的資料,但也由於資料成長的過份快速,促使企業本身累積了龐大的資料。通常,在這些囤積的龐大資料庫中,往往存在著許多重要的資訊,企業若能有效的利用這些資訊,對於其經營或行銷策略的制定上,應有莫大的助益。換言之,如何針對大量資料進行有效率且正確的處理,並進一步選用適當的演算法以求得所需的資訊,是現今企業急需面對的重要的議題之一。截至目前爲止企業本身在進行資料分析時,大多採用傳統的線性分析技術,因此在資料進行分析前,分析者通常會假設資料符合各種相關之假設與條件。但由於累積資料的龐大與多樣性,大部分資料的屬性均存在著非線性關係的型態,因此若直接使用傳統方法進行資料分析,不僅會受到方法本身的限制,所建構出模式本身的凖確度也將無法達到理想的標凖。在本研究中,我們嘗試提出一完整的資料分析技術。在整合分析的過程中,我們先使用模糊自適應共振理論綱路來進行區隔分析模型的建構,並將其分群結果用來發展整合類神經綱路與分類迴歸樹的分類預測模式,以進行完整的資料探勘流程。由於從實際生活中所蒐集的資料,其資料散佈狀態均不爲線性形態,因此在第一階段中,主要研究重點乃希望透過所建構的非線性區隔模式,更凖確地劃分出資料的區隔型態,並進一步應用區隔分析結果來建構分類預測模式。而在第二階段中,主要的研究目的則是希望先經由分類迴歸樹進行分析,再將其辨別之結果當作類神經綱路的額外輸入資訊,以提供類神經綱路一個良好的起始原點,再透過類神經綱路的學習、辨識能力,來發展一個更爲精確的分類系統。

並列摘要


With the help of advanced information technology, it is no longer a difficult task in collecting relevant data sets of customers. However, the data sets growth too fast, it is not easy to identify the complicate relationship in the huge data sets. Moreover, the traditional management information systems can only conduct basic descriptive statistics with respect to the collected data and therefore unable to dig out important and latent information inside the data. Data mining is a fast growing application area in business. With data mining techniques, it allows the possibility of computer-driven exploration of the data, and we don't need to assume some hypothesis for the data. The purpose of this research is to provide a complete data analysis process, and there are two main stages included. In the first stage, we used Fuzzy ART to identify an appropriate number of clusters for the data. In the second stage, we integrated neural networks and classification and regression tree (CART) to solve the classification problems. To demonstrate the efficiency of the proposal approaches, classification tasks are performed on two data sets, the Zoo data (adapted from UCI Machine Learning Repository) and one simulated data. As the results reveal, the proposed integrated approach provides a better initial solution than the conventional neural networks. Besides, comparing with the pure neural network approach, the classification accuracies increase for both cases in the proposed methodology.

並列關鍵字

fuzzy ART neural networks CART data mining

參考文獻


李紹綸(1998)。知識發掘在信用卡之應用。私立淡江大學資訊工程學系。
鄭春生、郭仲倫、陳信嘉(1997)。Fuzzy ART類神經網路於工作分族及機器分群上之應用:演算法之修正及效益評估。工業工程學刊。181-193。
Arciniegas, J. I.,A. H. Eltimsahy,K. J. Cios(1997).Neural-networks-based adaptive control of flexible robotic arms.Neurocomputing.17,141-157.
Breiman, L.,J. H. Freidman,R. A. Olshen,C. J. Stone(1984).Classification and Regression Trees.Wadsworth.
Burke, L.,S. Kamal(1995).Neural networks and the part family/machine group formation problem in cellular manufacturing: a framework using Fuzzy ART.Journal of Manufacturing Systems.14,148-159.

被引用紀錄


許珉豪(2014)。運用資料探勘技術於航安風險因素分析〔碩士論文,淡江大學〕。華藝線上圖書館。https://doi.org/10.6846/TKU.2014.01029
黃昶華(2009)。構型管理於工業電腦產業之應用〔碩士論文,國立臺北科技大學〕。華藝線上圖書館。https://doi.org/10.6841/NTUT.2009.00570
陳宏如(2014)。運用資料探勘分析貨運駕駛適任因素與任用決策〔碩士論文,中原大學〕。華藝線上圖書館。https://doi.org/10.6840/cycu201400889
簡名芝(2010)。運用CART建構競合策略決策支援模式-以LED產業為例〔碩士論文,中原大學〕。華藝線上圖書館。https://doi.org/10.6840/cycu201000597
俞依良(2011)。應用決策樹演算法與邏輯式迴歸模式探討傷害就醫之相關因子〔碩士論文,元智大學〕。華藝線上圖書館。https://doi.org/10.6838/YZU.2011.00279

延伸閱讀