本書(shū)一開(kāi)始就立足于軟件編寫(xiě)、算法測(cè)試的實(shí)踐指導(dǎo),為讀者理解示例代碼、動(dòng)手編寫(xiě)自己的程序做必要的鋪墊。
然后,作者才開(kāi)始簡(jiǎn)明扼要地介紹機(jī)器學(xué)習(xí)算法的定義,以及讀者必須知道的算法類(lèi)別、這些算法又各自有何神通,并輕輕點(diǎn)出:每個(gè)算法也有它的死穴。
第三章到第九章,作者深入詳實(shí)地講解了幾種有代表性的機(jī)器學(xué)習(xí)算法:K-最近鄰,樸素貝葉斯分類(lèi),決策樹(shù)和隨機(jī)森林,隱馬爾可夫模型,支持向量機(jī),神經(jīng)網(wǎng)絡(luò),以及聚類(lèi)。在這些章節(jié)中,不但講解了算法核心部分的數(shù)學(xué)表達(dá),也用機(jī)智、形象的語(yǔ)言描述了算法如何在實(shí)際生活中解決問(wèn)題,并給出了關(guān)鍵的Python代碼示例和算法訓(xùn)練、測(cè)試過(guò)程。
前言 1
第1章 5
可能近似正確的軟件 5
正確地編寫(xiě)軟件 6
編寫(xiě)正確的軟件 10
本書(shū)計(jì)劃 16
第2章 快速介紹機(jī)器學(xué)習(xí) 18
什么是機(jī)器學(xué)習(xí) 18
有監(jiān)督學(xué)習(xí) 18
無(wú)監(jiān)督學(xué)習(xí) 19
強(qiáng)化學(xué)習(xí) 20
機(jī)器學(xué)習(xí)能完成什么 20
本書(shū)中使用的數(shù)學(xué)符號(hào) 21
結(jié)論 22
第3章 K最近鄰算法 23
如何確定是否想購(gòu)買(mǎi)一棟房子 23
房子的價(jià)格究竟幾何 24
愉悅回歸 24
什么是鄰域 25
K最近鄰算法簡(jiǎn)介 26
K先生最近的鄰居 26
距離 27
維度災(zāi)難 33
如何選擇K 34
給西雅圖的房子估價(jià) 37
結(jié)論 43
第4章 樸素貝葉斯分類(lèi) 44
通過(guò)貝葉斯定理來(lái)發(fā)現(xiàn)欺詐訂單 44
條件概率 45
概率符號(hào) 45
反向條件概率(又名貝葉斯定理) 47
樸素貝葉斯分類(lèi)器 47
貝葉斯推理之樸素 48
偽計(jì)數(shù) 49
垃圾郵件過(guò)濾器 50
標(biāo)記化和上下文 55
結(jié)論 67
第5章 決策樹(shù)和隨機(jī)森林 68
蘑菇的細(xì)微差別 69
使用民間定理實(shí)現(xiàn)蘑菇分類(lèi) 70
找到最佳切換點(diǎn) 71
修剪樹(shù) 74
結(jié)論 83
第6章 隱馬爾可夫模型 84
使用狀態(tài)機(jī)來(lái)跟蹤用戶行為 84
輸出/觀測(cè)隱含狀態(tài) 86
使用馬爾可夫假設(shè)化簡(jiǎn) 87
隱馬爾可夫模型 88
評(píng)估: 前向-后向算法 89
通過(guò)維特比算法解碼 93
學(xué)習(xí)問(wèn)題 94
詞性標(biāo)注與布朗語(yǔ)庫(kù) 94
結(jié)論 105
第7章 支持向量機(jī) 106
客戶滿意度作為語(yǔ)言的函數(shù) 107
SVM背后的理論 108
情緒分析器 113
聚合情緒 124
將情緒映射到底線 126
結(jié)論 127
第8章 神經(jīng)網(wǎng)絡(luò) 128
什么是神經(jīng)網(wǎng)絡(luò) 129
神經(jīng)網(wǎng)絡(luò)史 129
布爾邏輯 129
感知器 130
如何構(gòu)建前饋神經(jīng)網(wǎng)絡(luò) 130
構(gòu)建神經(jīng)網(wǎng)絡(luò) 144
使用神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)語(yǔ)言分類(lèi) 145
結(jié)論 154
第9章 聚類(lèi) 155
無(wú)任何偏差的研究數(shù)據(jù) 155
用戶群組 156
測(cè)試群集映射 157
K均值聚類(lèi) 159
最大期望(EM)聚類(lèi) 161
不可能性定理 163
案例:音樂(lè)歸類(lèi) 164
結(jié)論 174
第10章 模型改進(jìn)與數(shù)據(jù)提取 175
辯論俱樂(lè)部 175
選擇更好的數(shù)據(jù) 176
最小冗余最大相關(guān)性的特征選擇 181
特征變換與矩陣分解 183
結(jié)論 189
第11章 將這些方法融合在一起:結(jié)論 191
機(jī)器學(xué)習(xí)算法回顧 191
如何使用這些信息來(lái)解決問(wèn)題 193
下一步做什么 193