透過您的圖書館登入
IP:13.58.150.59
  • 學位論文

基於Cassandra資料庫之雲端資料建模:從SQL到NoSQL

Data Modeling in Cloud with Cassandra: From SQL to NoSQL

指導教授 : 郭斯彥

摘要


隨著雲端運算的快速發展,以及社群網站(例如:Facebook、Twitter)的興盛,越來越多的資料儲存在「雲」上。傳統上對於資料儲存及管理的問題主要是透過關聯式資料庫(例如:MySQL)來解決,但是當伺服器的資源不足以應付過於龐大的資料時,我們就必須利用「垂直拓展」來克服,也就是升級伺服器的運算能力,或是加大硬碟儲存空間。垂直拓展的最大問題就是成本昂貴,在雲端運算的時代,資料增加的速度非常驚人,因此伺服器很可能沒過多久就必須再次升級。而「水平拓展」是比較好的方式,在運算叢集中增加伺服器數量,來取代單一機器的升級。可惜的是,傳統的關聯式資料庫由於資料模型的限制,對於水平拓展的支援能力並不好,因此「非關聯式」的資料庫應運而生。 非關聯式資料庫(例如:Cassandra)的特色是分散式以及資料模型的自由度,也因此通常都具備了高可得性、高延展性、高效能、以及不會發生單點故障的問題。有越來越多的企業考慮將傳統的資料庫轉換成非關聯式,但轉換的過程卻不是那麼的容易。第一個問題是資料模型的重建,在關聯式的模型設計時,往往是從資料的實體(entity)以及各個實體間的關聯(relation)著手,但在非關聯式的世界,我們卻應該先思考這個系統要提供哪些查詢功能(query),再進一步設計資料模型來最佳化查詢的速度。第二個問題是資料的轉移,企業在轉移之前,往往已經累積了數以萬計的資料,這些資料要以什麼樣的方式轉移到新的資料庫中,也是個相當值得研究的問題,但非關聯式資料庫的研究尚嫌不足,文獻資料非常缺乏,也提高了實作的難度。 本論文以一個業界的實際案例作為出發點,針對以上兩個問題提出詳細的探討,並對於如何將MySQL資料庫上的資料轉移到Cassandra資料庫,以實作配合效能評估來作為理論的佐證,希望能做為未來在非關聯式資料庫研究人員的參考。

並列摘要


參考文獻


[1] D. Abadi. Data management in the cloud: Limitations and opportunities. IEEE Data Engineering Bulletin, 32(1):3–12, 2009.
[2] D. Agrawal, A. El Abbadi, S. Antony, and S. Das. Data management challenges in cloud computing infrastructures. Databases in Networked Information Systems, pages 1–10, 2010.
[6] E. Brewer. Cap twelve years later: How the” rules” have changed. Computer IEEE Computer Magazine, 45(2):23, 2012.
[10] E. F. Codd. A relational model of data for large shared data banks. Commun.ACM, 13(6):377–387, June 1970.
[14] A. Davies. High Availability MySQL Cookbook. Packt Pub., 2010.

被引用紀錄


許聿慎(2014)。應用混合切割進行分散式資料庫配置〔碩士論文,國立臺北科技大學〕。華藝線上圖書館。https://doi.org/10.6841/NTUT.2014.00729

延伸閱讀