人工智能超入門叢書--數據科學:機器學習如何數據掘金 ChatGPT聊天機器人入門
定 價:¥69.8
中 教 價:¥41.18 (5.90折)促銷
庫 存 數: 5
叢 書 名:人工智能超入門叢書
人工智能超入門叢書致力于面向人工智能各技術方向零基礎的讀者,內容涉及數據思維、數據科學、視覺感知、情感分析、搜索算法、強化學習、知識圖譜、專家系統等方向,體系完整、內容簡潔、文字通俗,綜合介紹人工智能相關知識,并輔以程序代碼解決問題,使得零基礎的讀者快速入門。本書是人工智能超入門叢書的一個分冊,以機器學習為主線,介紹如何利用機器學習進行數據分析。全書內容共分7章,主要包括機器學習基本概念、數據分析相關基礎知識、機器學習解決四類問題(回歸問題、分類問題、聚類問題、降維問題)的算法、神經網絡相關知識,并在附錄中對Python編程基礎知識、數據相關數學知識以及Python實驗室Jupyter Lab的使用進行了介紹。本書面向在人工智能方向零基礎的讀者,內容全面系統,語言通俗易懂,配合典型程序操作練習,簡單易上手,能夠幫助讀者輕松認識和理解人工智能核心技術。本書可以作為大學生以及想要走向人工智能工作崗位的技術人員的入門讀物,也可作為青少年人工智能相關技術方向的課程教材,同時也可作為技術普及讀物供對人工智能技術感興趣的讀者閱讀。
本書面向在人工智能方向零基礎的讀者,內容定位于專業知識入門和普及層面,全面系統,通俗易懂,讓讀者真正了解和理解人工智能的相關技術方向,而不僅僅是編程技術。
新一代人工智能的崛起深刻影響著國際競爭格局,人工智能已經成為推動國家與人類社會發展的重大引擎。2017年,國務院發布《新一代人工智能發展規劃》,其中明確指出:支持開展形式多樣的人工智能科普活動,鼓勵廣大科技工作者投身人工智能的科普與推廣,全面提高全社會對人工智能的整體認知和應用水平。實施全民智能教育項目,在中小學階段設置人工智能相關課程,逐步推廣編程教育,鼓勵社會力量參與寓教于樂的編程教學軟件、游戲的開發和推廣。 為了貫徹落實《新一代人工智能發展規劃》,國家有關部委相繼頒布出臺了一系列政策。截至2022年2月,全國共有440所高校設置了人工智能本科專業、387所普通高等學校高等職業教育(?疲┰O置人工智能技術服務專業,一些高校甚至已經在積極探索人工智能跨學科的建設。在高中階段,人工智能初步已經成為信息技術課程的選擇性必修內容之一。在2022年實現從0到1突破的義務教育階段信息科技課程標準中,明確要求在79年級需要學習人工智能與智慧社會相關內容。實際上,16年級階段的不少內容也與人工智能關系密切,是學習人工智能的基礎。 人工智能是一門具有高度交叉屬性的學科,筆者認為其交叉性至少體現在三個方面:行業交叉、學科交叉、學派交叉。在大數據、算法、算力三駕馬車的推動下,新一代人工智能已經逐步開始賦能各個行業,現在幾乎沒有哪一個行業不涉及人工智能有關元素。人工智能也在助力各學科的研究。近幾年,Nature等頂級刊物不斷刊發人工智能賦能學科的文章,如人工智能數學、化學、生物、考古、設計、音樂以及美術等的結合。人工智能內部的學派也在不斷交叉融合,像知名的AlphaGo,就是集三大主流學派優勢制作,并且現在這種不同學派間取長補短的研究開展得如火如荼?傊,未來的學習、工作與生活中,人工智能賦能的身影將無處不在,因此掌握一定的人工智能知識與技能將大有裨益。 根據筆者長期從事人工智能教學、研究經驗來看,一些人對人工智能還存在一定的誤區。比如將編程與人工智能直接畫上了等號,又或是認為人工智能就只有深度學習等。實際上,人工智能的知識體系十分龐大,內容涵蓋相當廣泛,不但有邏輯推理、知識工程、搜索算法等相關內容,還涉及機器學習、深度學習以及強化學習等算法模型。當然,了解人工智能的起源與發展、人工智能的道德倫理,對正確認識人工智能和樹立正確的價值觀也是十分必要的。 通過對人工智能及其相關知識的系統學習,可以培養數學思維(Mathematical Thinking)、邏輯思維(Reasoning Thinking)、計算思維(Computational Thinking)、藝術思維(Artistic Thinking)、創新思維(Innovative Thinking)與數據思維(Data Thinking),即MRCAID。然而遺憾的是,目前市場上既能較綜合介紹人工智能相關知識,又能輔以程序代碼解決問題,同時還能迅速入門的圖書并不多見,因此筆者策劃了本系列圖書,以期實現體系內容較全、配合程序操練及上手簡單方便等特點。 本書以傳統的機器學習為主線,按照如下內容進行組織:第1章介紹機器學習的基本概念;第2章介紹掌握機器學習時必須要了解的一些關于數據分析的基礎知識;第3章~第6章分別介紹機器學習解決四類問題的算法,即回歸問題、分類問題、聚類問題以及降維問題,第3章在討論什么是回歸問題的基礎上介紹了一元線性回歸與多元線性回歸,在第4章中,首先對分類問題進行了界定,并介紹了利用k近鄰算法與決策樹兩種不同的分類算法,第5章介紹了聚類問題以及兩種不同方式的聚類算法K均值聚類與系統聚類等內容,第6章介紹了降維問題、主成分分析以及奇異值分解等內容;第7章對神經網絡的相關知識展開系統介紹。本書的附錄部分回顧了Python的基礎知識,介紹了關于導數與代數等數學基礎知識,同時還介紹了Python室驗室Jupyter Lab的使用。 本書的出版要感謝提供熱情指導與幫助的院士、教授、中小學教師等專家學者,也要感謝與筆者一起并肩參與寫作的其他作者。在本書的出版過程中,未來基因(北京)人工智能研究院、騰訊教育、阿里云、科大訊飛等機構提供了大力支持,在此一并表示感謝。 由于水平有限,書中內容不可避免地存在疏漏與不足,歡迎廣大讀者批評指正并提出寶貴的意見。 龔超 2022年9月于清華大學
無
第1章 機器學習 001 1.1 數據科學、人工智能與機器學習 002 1.1.1 數據科學與機器學習 002 1.1.2 人工智能機器學習深度學習 005 1.2 機器學習概述 011 1.2.1 機器學習是什么 011 1.2.2 機器學習學什么 018 1.3 數據素養 021 1.3.1 何為數據素養 021 1.3.2 數據素養的維度劃分 023 第2章 數據基礎 025 2.1 先利其器 026 2.2 科學計算 029 2.2.1 向量與矩陣生成 029 2.2.2 向量與矩陣運算 035 2.3 數據分析 040 2.3.1 Series與DataFrame 040 2.3.2 文件的導入與處理 044 2.4 數據可視 047 2.4.1 基本圖形 047 2.4.2 畫圖點睛 052 第3章 回歸問題 057 3.1 什么是回歸問題 058 3.1.1 回歸分析概述 058 3.1.2 最小二乘法 060 3.2 線性回歸 061 3.2.1 一元線性回歸 061 3.2.2 多元線性回歸 069 3.3 進階:可視化 075 第4章 分類問題 078 4.1 什么是分類問題 079 4.2 近朱者赤近墨者黑的k近鄰 079 4.2.1 k近鄰算法基本原理 079 4.2.2 k近鄰算法實踐 085 4.3 通過熵解決分類的決策樹 087 4.3.1 決策樹與信息熵 087 4.3.2 決策樹案例與實踐 090 4.4 進階:距離 098 第5章 聚類問題 100 5.1 什么是聚類 101 5.2 K均值聚類 103 5.2.1 K均值聚類原理 103 5.2.2 K均值聚類實踐 109 5.3 系統聚類 113 5.3.1 系統聚類原理 113 5.3.2 系統聚類實踐 118 5.4 進階:再談距離 120 第6章 降維問題 122 6.1 什么是降維問題 123 6.2 主成分分析 124 6.2.1 主成分分析原理 124 6.2.2 主成分分析實踐 126 6.3 奇異值分解 131 6.3.1 奇異值分解原理 131 6.3.2 奇異值分解實踐 133 6.4 進階:特征值與特征向量 136 第7章 神經網絡 141 7.1 從神經元到感知機 142 7.1.1 從生物神經元到人工神經元 142 7.1.2 從單層感知機到多層感知機 146 7.2 神經網絡的運行原理 150 7.2.1 結構概述 150 7.2.2 前向傳播 151 7.2.3 反向傳播 155 7.3 神經網絡的參數說明與實踐 156 7.3.1 參數與超參數 156 7.3.2 解決分類與回歸問題 158 7.4 進階:反向傳播推導 163 附錄A Python基礎 166 A.1 運算符 167 A.1.1 基本算術運算符與數值型 167 A.1.2 關系運算符、邏輯運算符與布爾型 168 A.2 字符串與數據結構 170 A.2.1 字符串 170 A.2.2 列表 171 A.2.3 元組 172 A.2.4 字典 173 A.3 控制結構 174 A.3.1 if語句 174 A.3.2 while語句 175 A.3.3 for語句 176 A.3.4 多重循環 177 A.4 定義函數 178 附錄B 導數與代數基礎 179 B.1 導數 180 B.2 向量 183 B.3 矩陣 189 附錄C 騰訊扣叮Python實驗室:Jupyter Lab使用說明 196