透過您的圖書館登入
IP:18.218.199.14
  • 學位論文

建構於雲端運算之文字探勘服務系統

A Design of Text Mining Service based on Cloud Computing

指導教授 : 胡念祖
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


本研究主要目的在建置一個以雲端運算為基礎之非結構化文字資料之探勘服務;讓使用者得以透過網頁來進行登入、執行、監控與瀏覽的服務平台。本研究在單一主機上使用VMware ESXi軟體架設雲端架構中的Infrastructure as a service (IaaS) 環境,以安裝多個虛擬化作業系統;並運用Apache Hadoop開放原始碼軟體建置雲端中的Platform as a service (PaaS) 平台,可在多台實體電腦上建置小型雲端叢集。並透過Web service來驗證帳戶的權限與使用雲端叢集的探勘方法。 本研究嘗試在雲端系統上實作關聯規則;實驗結果顯示,在虛擬平台上建置叢集化雲端系統,較傳統單機環境更可大幅地有效利用系統資源,使得執行效能可以更加顯著。並且發現在Hadoop雲端叢集中的系統環境之設定,例如node的數量、task的個數及檔案的大小與數目,對於系統的執行效能上,皆有不同程度之影響。

並列摘要


This study tried to construct a mining service for unstructured text data based on cloud computing. Users can execute, monitor and browse the service through the web interface. Proposed system was developed in “Infrastructure as a service” environment embedded on VMware ESXi, that could provide many of virtual operation systems. In addition, we also adopted Apache Hadoop to design a “Platform as a service” platform. User identification could be verified via web service. The association rules were implemented on cloud computing. The test results demonstrated that cloud computing developed on virtual platform could take advantage of system resources notably compared with computing on a single computer. We also discovered that the configuration of Hadoop (the number of nodes and tasks, the size and number of files) would affect the computational performance.

參考文獻


[1] 2008產業資訊應用現況與需求調查-企業資訊應用與連網發展現況,http://www.find.org.tw/find/home.aspx?page=many&id=218
[2] 淺談服務導向架構SOA,http://oasis.csie.ntu.edu.tw/2008_fall_network/slides/39
[3] 台灣產業資訊應用需求與商機調查合作, http://www.find.org.tw/find/home.aspx?page=board&id=1038
[4] Gartner定義2009年10大策略技術與趨勢, http://www.find.org.tw/find/home.aspx?page=news&id=5379
[5] U. M. Fayyad, G. P. Shapi, P. Smyth and R. Uthursamy, Advances in Knowledge Discovery and Data Mining, AAAI Press/ The MIT Press, CA, 1996.

被引用紀錄


李嘉振(2010)。運用雲端運算與語意網建置新聞查詢系統〔碩士論文,國立虎尾科技大學〕。華藝線上圖書館。https://doi.org/10.6827/NFU.2010.00095
陳奕宏(2010)。Lotus Notes之資料探勘模組設計-應用Web services技術〔碩士論文,國立虎尾科技大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0028-2607201014294800

延伸閱讀