概述數(shù)據(jù)虛擬化是一種轉(zhuǎn)化異構(gòu)數(shù)據(jù)庫(kù)集合和文件的技術(shù),這種技術(shù)使得這些數(shù)據(jù)看起來像一種集成的數(shù)據(jù)。在用于商務(wù)智能系統(tǒng)時(shí),它可以使數(shù)據(jù)架構(gòu)更簡(jiǎn)單、更便宜,最重要的是更敏捷。新的報(bào)告和分析需求可以更快實(shí)施,現(xiàn)有系統(tǒng)可以更容易改變。這就需要增加敏捷性:一方面,商務(wù)用戶需要其系統(tǒng)提供更多的敏捷性,因?yàn)樗麄兊氖澜缫呀?jīng)開始改變;另一方面,商務(wù)智能的新形式,如運(yùn)營(yíng)報(bào)告、大數(shù)據(jù)分析在IT行業(yè),我們已經(jīng)進(jìn)入了虛擬化時(shí)代。似乎這一行業(yè)中的任何東西都可以虛擬化,包括內(nèi)存、外存、網(wǎng)絡(luò)和數(shù)據(jù)中心。虛擬化技術(shù)很熱門,比如云技術(shù)的普及也可以歸類為虛擬化技術(shù)。虛擬化技術(shù)就是熱點(diǎn),并且在一段時(shí)間內(nèi)都將是技術(shù)的焦點(diǎn)。
所有虛擬化技術(shù)和概念的共同點(diǎn)是它們封裝了某個(gè)資源。任何虛擬化解決方案都隱藏了可用資源的數(shù)量、資源的位置以及獲取資源所需的API等。但不要將虛擬化與一些電腦游戲所提供的虛擬世界混淆。這些游戲提供了一些虛擬的東西,但它們并沒有封裝特定的資源。
本書將解釋一種特定形式的虛擬化:數(shù)據(jù)虛擬化。簡(jiǎn)而言之,數(shù)據(jù)虛擬化意味著將數(shù)據(jù)以集成的方式提供給應(yīng)用程序,而不管所有數(shù)據(jù)是否分布在多個(gè)數(shù)據(jù)庫(kù)中,是否以不同格式存儲(chǔ),是否可通過不同的數(shù)據(jù)庫(kù)語言進(jìn)行訪問。數(shù)據(jù)虛擬化技術(shù)將這些不同的數(shù)據(jù)存儲(chǔ)作為一個(gè)邏輯數(shù)據(jù)庫(kù)呈現(xiàn)給應(yīng)用程序。雖然數(shù)據(jù)虛擬化產(chǎn)品和技術(shù)已經(jīng)存在了一段時(shí)間,但是大約在2009年,它才逐步得到了應(yīng)有的關(guān)注。因?yàn)樗鼘?duì)解決方案的影響—增加的敏捷性,所以越來越多的組織正在采用虛擬化技術(shù),似乎可以認(rèn)為21世紀(jì)的第二個(gè)十年將成為數(shù)據(jù)虛擬化的十年。
數(shù)據(jù)虛擬化可以部署在需要檢索和操作數(shù)據(jù)的所有類型的信息系統(tǒng)中,例如經(jīng)典數(shù)據(jù)輸入系統(tǒng)、基于因特網(wǎng)的系統(tǒng)、面向服務(wù)的系統(tǒng)、主數(shù)據(jù)管理系統(tǒng)和商務(wù)智能系統(tǒng)。本書的重點(diǎn)是商務(wù)智能系統(tǒng)。數(shù)據(jù)虛擬化可用于整合來自各種數(shù)據(jù)源的數(shù)據(jù),包括數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市和生產(chǎn)型數(shù)據(jù)庫(kù)。它有潛力改變我們開發(fā)商務(wù)智能系統(tǒng)的方式。數(shù)據(jù)虛擬化將成為大多數(shù)這類系統(tǒng)的心臟。
簡(jiǎn)而言之,數(shù)據(jù)虛擬化允許我們使用更簡(jiǎn)單和更靈活的架構(gòu)構(gòu)建商務(wù)智能系統(tǒng)。如果你想知道怎么做和為什么,本書就是為你而寫的!本書將詳細(xì)描述數(shù)據(jù)虛擬化產(chǎn)品的工作原理、技術(shù)應(yīng)用、應(yīng)該做什么和不做什么,以及在商務(wù)智能系統(tǒng)中應(yīng)用它的好處。
誰應(yīng)該閱讀這本書?本書適合以下人群:
負(fù)責(zé)開發(fā)和管理數(shù)據(jù)倉(cāng)庫(kù)和商務(wù)智能環(huán)境的商務(wù)智能專家,以及那些想知道如何通過應(yīng)用數(shù)據(jù)虛擬化技術(shù)來簡(jiǎn)化系統(tǒng)或?qū)崿F(xiàn)更靈活的商務(wù)智能系統(tǒng)的人。
信息管理專家,想知道數(shù)據(jù)虛擬化對(duì)其職業(yè)的影響,以及數(shù)據(jù)虛擬化將如何影響信息管理、數(shù)據(jù)管理、數(shù)據(jù)庫(kù)設(shè)計(jì)、數(shù)據(jù)清洗和數(shù)據(jù)分析等活動(dòng)。
主數(shù)據(jù)管理專家,負(fù)責(zé)創(chuàng)建主數(shù)據(jù)管理系統(tǒng),并希望了解如何從部署數(shù)據(jù)虛擬化中受益。
數(shù)據(jù)架構(gòu)師,負(fù)責(zé)設(shè)計(jì)數(shù)據(jù)的整體系統(tǒng)架構(gòu),用來向特定組織的任何機(jī)構(gòu)提供所需要的數(shù)據(jù)。
數(shù)據(jù)庫(kù)管理員,必須了解數(shù)據(jù)虛擬化服務(wù)器的特性和限制,用于確定如何以及在何處可以有效且高效地應(yīng)用此技術(shù)。
設(shè)計(jì)師、分析師和顧問,必須直接或間接處理數(shù)據(jù)虛擬化,以及想知道數(shù)據(jù)虛擬化所能做的和不能做的。
學(xué)生,想要學(xué)習(xí)數(shù)據(jù)虛擬化技術(shù),以及理解數(shù)據(jù)虛擬化技術(shù)與其他數(shù)據(jù)處理相關(guān)技術(shù)的區(qū)別。
預(yù)備知識(shí)關(guān)于數(shù)據(jù)倉(cāng)庫(kù)、商務(wù)智能和數(shù)據(jù)庫(kù)技術(shù)的一般性知識(shí)是必需的。
術(shù)語和定義遺憾的是,數(shù)據(jù)虛擬化和數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域中使用的所有術(shù)語并非都是明確定義的,這一點(diǎn)在本書中講得很清楚。為了避免混淆,我們?cè)噲D清晰地定義大多數(shù)術(shù)語。但是,我們不能保證本書中的定義與你的定義一致。
造成這種混亂的原因很多。第一個(gè)原因是,供應(yīng)商純粹為了區(qū)分自己的產(chǎn)品和競(jìng)爭(zhēng)對(duì)手的產(chǎn)品而經(jīng)常提出新的術(shù)語,但營(yíng)銷人員不定義術(shù)語,他們只使用這些術(shù)語并用一般術(shù)語來描述產(chǎn)品。在大家意識(shí)到這一點(diǎn)之前,我們都在使用那些定義不明確或根本沒有定義的術(shù)語。第二個(gè)原因是,這個(gè)領(lǐng)域發(fā)展非常迅速,在較短的時(shí)間內(nèi)就可能要為新思維創(chuàng)造某種術(shù)語,并提出權(quán)衡性定義。結(jié)果,我們可能會(huì)匆忙地選擇一個(gè)術(shù)語,而經(jīng)過仔細(xì)檢查后才發(fā)現(xiàn)它并不合適。
寫在最后……對(duì)我來說,寫一本書的感覺像是獨(dú)自一人完成項(xiàng)目:坐在辦公室里幾個(gè)小時(shí)、幾天、幾個(gè)月,喝一杯茶,聽最喜歡的音樂。但這不是一個(gè)獨(dú)奏項(xiàng)目,一本書通常需要很多人合作而成,本書當(dāng)然也是如此。因此,我要感謝很多人對(duì)我的幫助,感謝他們?yōu)楸緯龀龅呢暙I(xiàn),提出的想法和意見,以及對(duì)我的支持和耐心。
感謝Jim Bean和Richard Hackathorn的技術(shù)審查。他們的意見可能比他們意識(shí)到的更有價(jià)值。在我還在寫作本書的時(shí)候就得到了他們的反饋意見,這使得整個(gè)項(xiàng)目相當(dāng)鼓舞人心。要是我以前的所有圖書都有像他們一樣好的技術(shù)審校者該多好。
Rick F. van der Lans,是商務(wù)智能、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)技術(shù)、SQL領(lǐng)域的一位獨(dú)立咨詢師、作者以及講師。他是R20/Consultancy的管理經(jīng)理。他還受雇于許多世界 級(jí)大公司并為其定制數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)。他是歐洲商務(wù)智能和數(shù)據(jù)倉(cāng)庫(kù)年會(huì)的主席,并為幾個(gè)雜志撰寫專欄。他曾經(jīng)擔(dān)任荷蘭ISO委員會(huì)負(fù)責(zé)ISO SQL標(biāo)準(zhǔn)的成員達(dá)7年之久。他是經(jīng)典圖書《Introduction to SQL》的作者,該書是數(shù)據(jù)庫(kù)開發(fā)者20多年采所信賴的SQL指南,已經(jīng)被翻譯成各種語言,銷量超過十萬冊(cè)。