數(shù)字時代,數(shù)據(jù)被列為關(guān)鍵生產(chǎn)要素,人們普遍意識到數(shù)據(jù)的影響力開始從數(shù)字空間走向?qū)嶓w空間,已然和政治、經(jīng)濟(jì)、社會、文化與人們的日常生活各方面發(fā)生交融,產(chǎn)生深遠(yuǎn)的影響,本書圍繞這一核心要義分為三個部分展開論述。第一部分 數(shù)權(quán)世界(第1章~第4章):從數(shù)權(quán)世界的角度出發(fā),探討了解放數(shù)據(jù)生產(chǎn)力、數(shù)據(jù)權(quán)利與數(shù)據(jù)權(quán)力、數(shù)據(jù)戰(zhàn)略與國際博弈、數(shù)據(jù)主權(quán)與國家主權(quán)、數(shù)據(jù)開放與國家治理、數(shù)據(jù)跨境流動與外交、數(shù)據(jù)安全與國家安全等方面的內(nèi)容。第二部分 數(shù)據(jù)、經(jīng)濟(jì)與生活(第5章~第8章):首先,從數(shù)據(jù)和經(jīng)濟(jì)的關(guān)系出
本書基于Python 3.10版本,以項目實戰(zhàn)的方式系統(tǒng)地介紹了Python網(wǎng)絡(luò)爬蟲開發(fā)的相關(guān)知識,主要內(nèi)容包括Python基礎(chǔ)實戰(zhàn)、網(wǎng)頁數(shù)據(jù)采集實戰(zhàn)、網(wǎng)頁數(shù)據(jù)解析實戰(zhàn)、并發(fā)技術(shù)實戰(zhàn)、動態(tài)內(nèi)容采集實戰(zhàn)、爬蟲數(shù)據(jù)存儲實戰(zhàn)、Scrapy爬蟲框架實戰(zhàn)等,通過多個實戰(zhàn)任務(wù)的練習(xí),讓讀者能最大限度地掌握Python網(wǎng)絡(luò)爬蟲的核心技術(shù)。為了方便讀者學(xué)習(xí),本書附有配套源代碼、教學(xué)PPT、題庫、教學(xué)視頻、教學(xué)設(shè)計等資源。本書可作為高等院校計算機(jī)相關(guān)專業(yè)程序設(shè)計課程教材,也可供從事計算機(jī)爬蟲應(yīng)用開發(fā)的相關(guān)人員使用
本書較完整地講解了數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的基本概念、基本算法原理和應(yīng)用技術(shù)。本書用通俗的語言和實例解釋了抽象的概念,并將抽象概念融合到具體的案例中,以便于讀者理解和掌握。本書在編寫過程中力求做到語言精練、概念清晰、取材合理、深入淺出、突出應(yīng)用,為讀者進(jìn)一步從事數(shù)據(jù)分析、應(yīng)用、開發(fā)和研究奠定堅實的基礎(chǔ)。本書既可作為高等院校信息類和管理類專業(yè)的數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)課程的教材,也可作為科研人員、工程師和數(shù)據(jù)分析愛好者的參考書。
本書完整、全面地講述數(shù)據(jù)挖掘的概念、方法、技術(shù)和近期新研究的進(jìn)展,重點論述數(shù)據(jù)預(yù)處理、頻繁模式挖掘、分類和聚類等內(nèi)容,還全面講述OLAP和數(shù)據(jù)挖掘常用算法,并研討數(shù)據(jù)挖掘體系結(jié)構(gòu)及其重要的應(yīng)用領(lǐng)域。 本書共7章: 第1章是數(shù)據(jù)挖掘概述; 第2章對數(shù)據(jù)挖掘進(jìn)行歷史回顧并介紹目前的研究現(xiàn)狀; 第3章著重討論數(shù)據(jù)挖掘的常用算法和工具; 第4章分析數(shù)據(jù)挖掘的體系結(jié)構(gòu); 第5章介紹數(shù)據(jù)挖掘技術(shù)在相關(guān)領(lǐng)域的應(yīng)用情況; 第6章分析數(shù)據(jù)挖掘的研究方向和發(fā)展趨勢; 第7章介紹Python數(shù)據(jù)挖掘的
本書以數(shù)據(jù)要素化治理的理論方法與工程實踐為主線,內(nèi)容按照概念篇、原理篇和工程篇依次展開。概念篇在對數(shù)據(jù)、數(shù)據(jù)要素相關(guān)概念及其演進(jìn)過程進(jìn)行系統(tǒng)梳理的基礎(chǔ)上,首次對“數(shù)據(jù)要素”“數(shù)據(jù)要素化”進(jìn)行了明確定義,并基于傳統(tǒng)生產(chǎn)要素市場化配置規(guī)律,提出數(shù)據(jù)要素化治理的基本思路。在原理篇,定義了數(shù)據(jù)元件作為連接數(shù)據(jù)供需兩端的“中間態(tài)”和數(shù)據(jù)要素交易流通的標(biāo)的物,進(jìn)而構(gòu)建基于數(shù)據(jù)元件的數(shù)據(jù)要素流通模型、數(shù)據(jù)要素化安全模型以及數(shù)據(jù)要素化治理系統(tǒng)模型。在工程篇,詳細(xì)闡述了制度體系、技術(shù)體系和市場體系“三位一體”的解
數(shù)據(jù)科學(xué)的關(guān)鍵技術(shù)包括數(shù)據(jù)存儲計算、數(shù)據(jù)治理、結(jié)構(gòu)化數(shù)據(jù)分析、語音分析、視覺分析、文本分析和知識圖譜等方面。本書的重點是詳細(xì)介紹文本分析和知識圖譜方面的技術(shù)。文本分析技術(shù)主要包括文本預(yù)訓(xùn)練模型、多語種文本分析、文本情感分析、文本機(jī)器翻譯、文本智能糾錯、NL2SQL問答以及ChatGPT大語言模型等。知識圖譜技術(shù)主要包括知識圖譜構(gòu)建和知識圖譜問答等。本書將理論介紹和實踐相結(jié)合,詳細(xì)闡述各個技術(shù)主題的實現(xiàn)路線,并對應(yīng)用于業(yè)界算法大賽中的技術(shù)方案和技巧進(jìn)行源代碼解讀,幫助讀者深入理解技術(shù)原理。最后,本
本書分為10章。前兩章循序漸進(jìn)地介紹了時空大數(shù)據(jù)系統(tǒng)產(chǎn)生的背景、時空大數(shù)據(jù)系統(tǒng)相關(guān)的基礎(chǔ)知識,包括專業(yè)概念、基礎(chǔ)技術(shù)組件,以及基礎(chǔ)的數(shù)據(jù)處理工具。接下來的五章是本書的核心內(nèi)容,從底向上分別介紹了時空數(shù)據(jù)系統(tǒng)總體結(jié)構(gòu)中的各個層次,包括數(shù)據(jù)的感知與接入、數(shù)據(jù)的存儲與索引、數(shù)據(jù)的分析與挖掘、數(shù)據(jù)的服務(wù)與共享、數(shù)據(jù)的可視化。
本書系統(tǒng)介紹了 Hadoop 生態(tài)系統(tǒng)主要組件的基本概念、特點、主要組成、運(yùn)行機(jī)制及存在的問題等內(nèi)容。全書共 11 章,內(nèi)容包含大數(shù)據(jù)基本概念、大數(shù)據(jù)處理平臺 Hadoop、分布式文件系統(tǒng) HDFS、HDFS 2.0新特性、分布式計算框架 MapReduce、數(shù)據(jù)倉庫 Hive、分布式數(shù)據(jù)庫 HBase、數(shù)據(jù)遷移工具 Sqoop、日志采集系統(tǒng) Flume、NoSQL 數(shù)據(jù)庫及數(shù)據(jù)可視化等內(nèi)容。每一部分都有相應(yīng)的實驗指導(dǎo),以便讀者更好地學(xué)習(xí)和掌握 Hadoop 核心
本書包含伺服控制系統(tǒng)應(yīng)用技術(shù)和變頻器應(yīng)用技術(shù)兩部分內(nèi)容,共6個項目,18個任務(wù),每一個任務(wù)都由淺入深地安排了任務(wù)描述、基礎(chǔ)知識、任務(wù)實施、拓展知識等教學(xué)環(huán)節(jié)。伺服控制系統(tǒng)應(yīng)用部分介紹了機(jī)電設(shè)備常用的直流、交流等伺服控制技術(shù),并以西門子系列交流伺服驅(qū)動為載體,對伺服電動機(jī)的控制操作做詳細(xì)介紹,通過實踐進(jìn)一步加深對伺服理論的理解。變頻器應(yīng)用部分重點圍繞西門子G120變頻器進(jìn)行介紹,通過具體的任務(wù)設(shè)計講述變頻器的組成原理、變頻調(diào)速的特點、變頻器的基本操作、速度控制等。最后是綜合應(yīng)用部分,精選工程實際案
本書全面介紹了最新的因果推斷方法,并以實踐應(yīng)用為輔,方便讀者理解。本書化繁為簡,層層深入地引導(dǎo)讀者了解因果推斷方法發(fā)展的歷程和現(xiàn)狀。通過本書,讀者可以獲得關(guān)于因果推斷方法的全局視角。本書共5章,以遞進(jìn)的方式展開對因果推斷方法的介紹。第1章從廣泛熟悉的相關(guān)關(guān)系出發(fā),通過介紹相關(guān)關(guān)系與因果關(guān)系的聯(lián)系與區(qū)別過渡到對因果關(guān)系的探索。在明確因果關(guān)系概念的基礎(chǔ)上,第2章主要介紹洞察因果關(guān)系的金標(biāo)準(zhǔn):隨機(jī)對照試驗。基于隨機(jī)對照試驗的原理和不同的應(yīng)用場景,本書將因果推斷方法分為3類:基于設(shè)計思想的因果推斷方法、