本書基于Python 3.10版本,以項目實戰的方式系統地介紹了Python網絡爬蟲開發的相關知識,主要內容包括Python基礎實戰、網頁數據采集實戰、網頁數據解析實戰、并發技術實戰、動態內容采集實戰、爬蟲數據存儲實戰、Scrapy爬蟲框架實戰等,通過多個實戰任務的練習,讓讀者能最大限度地掌握Python網絡爬蟲的核心技術。為了方便讀者學習,本書附有配套源代碼、教學PPT、題庫、教學視頻、教學設計等資源。本書可作為高等院校計算機相關專業程序設計課程教材,也可供從事計算機爬蟲應用開發的相關人員使用
本書較完整地講解了數據挖掘和機器學習的基本概念、基本算法原理和應用技術。本書用通俗的語言和實例解釋了抽象的概念,并將抽象概念融合到具體的案例中,以便于讀者理解和掌握。本書在編寫過程中力求做到語言精練、概念清晰、取材合理、深入淺出、突出應用,為讀者進一步從事數據分析、應用、開發和研究奠定堅實的基礎。本書既可作為高等院校信息類和管理類專業的數據挖掘或機器學習課程的教材,也可作為科研人員、工程師和數據分析愛好者的參考書。
本書完整、全面地講述數據挖掘的概念、方法、技術和近期新研究的進展,重點論述數據預處理、頻繁模式挖掘、分類和聚類等內容,還全面講述OLAP和數據挖掘常用算法,并研討數據挖掘體系結構及其重要的應用領域。 本書共7章: 第1章是數據挖掘概述; 第2章對數據挖掘進行歷史回顧并介紹目前的研究現狀; 第3章著重討論數據挖掘的常用算法和工具; 第4章分析數據挖掘的體系結構; 第5章介紹數據挖掘技術在相關領域的應用情況; 第6章分析數據挖掘的研究方向和發展趨勢; 第7章介紹Python數據挖掘的
本書以數據要素化治理的理論方法與工程實踐為主線,內容按照概念篇、原理篇和工程篇依次展開。概念篇在對數據、數據要素相關概念及其演進過程進行系統梳理的基礎上,首次對“數據要素”“數據要素化”進行了明確定義,并基于傳統生產要素市場化配置規律,提出數據要素化治理的基本思路。在原理篇,定義了數據元件作為連接數據供需兩端的“中間態”和數據要素交易流通的標的物,進而構建基于數據元件的數據要素流通模型、數據要素化安全模型以及數據要素化治理系統模型。在工程篇,詳細闡述了制度體系、技術體系和市場體系“三位一體”的解
數據科學的關鍵技術包括數據存儲計算、數據治理、結構化數據分析、語音分析、視覺分析、文本分析和知識圖譜等方面。本書的重點是詳細介紹文本分析和知識圖譜方面的技術。文本分析技術主要包括文本預訓練模型、多語種文本分析、文本情感分析、文本機器翻譯、文本智能糾錯、NL2SQL問答以及ChatGPT大語言模型等。知識圖譜技術主要包括知識圖譜構建和知識圖譜問答等。本書將理論介紹和實踐相結合,詳細闡述各個技術主題的實現路線,并對應用于業界算法大賽中的技術方案和技巧進行源代碼解讀,幫助讀者深入理解技術原理。最后,本
本書分為10章。前兩章循序漸進地介紹了時空大數據系統產生的背景、時空大數據系統相關的基礎知識,包括專業概念、基礎技術組件,以及基礎的數據處理工具。接下來的五章是本書的核心內容,從底向上分別介紹了時空數據系統總體結構中的各個層次,包括數據的感知與接入、數據的存儲與索引、數據的分析與挖掘、數據的服務與共享、數據的可視化。
本書系統介紹了 Hadoop 生態系統主要組件的基本概念、特點、主要組成、運行機制及存在的問題等內容。全書共 11 章,內容包含大數據基本概念、大數據處理平臺 Hadoop、分布式文件系統 HDFS、HDFS 2.0新特性、分布式計算框架 MapReduce、數據倉庫 Hive、分布式數據庫 HBase、數據遷移工具 Sqoop、日志采集系統 Flume、NoSQL 數據庫及數據可視化等內容。每一部分都有相應的實驗指導,以便讀者更好地學習和掌握 Hadoop 核心
本書包含伺服控制系統應用技術和變頻器應用技術兩部分內容,共6個項目,18個任務,每一個任務都由淺入深地安排了任務描述、基礎知識、任務實施、拓展知識等教學環節。伺服控制系統應用部分介紹了機電設備常用的直流、交流等伺服控制技術,并以西門子系列交流伺服驅動為載體,對伺服電動機的控制操作做詳細介紹,通過實踐進一步加深對伺服理論的理解。變頻器應用部分重點圍繞西門子G120變頻器進行介紹,通過具體的任務設計講述變頻器的組成原理、變頻調速的特點、變頻器的基本操作、速度控制等。最后是綜合應用部分,精選工程實際案
本書全面介紹了最新的因果推斷方法,并以實踐應用為輔,方便讀者理解。本書化繁為簡,層層深入地引導讀者了解因果推斷方法發展的歷程和現狀。通過本書,讀者可以獲得關于因果推斷方法的全局視角。本書共5章,以遞進的方式展開對因果推斷方法的介紹。第1章從廣泛熟悉的相關關系出發,通過介紹相關關系與因果關系的聯系與區別過渡到對因果關系的探索。在明確因果關系概念的基礎上,第2章主要介紹洞察因果關系的金標準:隨機對照試驗。基于隨機對照試驗的原理和不同的應用場景,本書將因果推斷方法分為3類:基于設計思想的因果推斷方法、
本書面向不確定環境下離散制造企業的生產調度問題,系統闡述了不同類型魯棒機器調度的概念、模型及其求解算法。書中用盡量通俗簡潔的文字對大量概念給出了作者理解的定義,以方便讀者快速了解相關領域。