近年來,大數(shù)據(jù)成為學(xué)術(shù)界和工業(yè)界的熱點,其本質(zhì)就是海量數(shù)據(jù)分析。海量數(shù)據(jù)的來源包括互聯(lián)網(wǎng)、傳感器、生產(chǎn)生活、科學(xué)觀測、科學(xué)實驗等。海量數(shù)據(jù)分析不僅可以幫助人們?nèi)〉眯碌目茖W(xué)發(fā)現(xiàn),也可以推動技術(shù)的適應(yīng)性、個性化和健壯性方面的進(jìn)步。海量數(shù)據(jù)分析是一個跨學(xué)科的研究領(lǐng)域,理解本書的內(nèi)容需要具備計算機(jī)科學(xué)、統(tǒng)計學(xué)和優(yōu)化理論的基礎(chǔ)知識。本書從計算和推理的角度分析了與海量數(shù)據(jù)分析相關(guān)的前沿問題,重點介紹海量數(shù)據(jù)挖掘分析以及流數(shù)據(jù)挖掘的進(jìn)展,討論了并行和分布式系統(tǒng)架構(gòu)方面的最新發(fā)展,具體內(nèi)容包括數(shù)據(jù)建模、任務(wù)建模、計算復(fù)雜性問題分析、數(shù)據(jù)采樣以及人工參與的數(shù)據(jù)分析方法等。