本書以爬蟲逆向方向的相關(guān)技術(shù)和崗位要求進(jìn)行撰寫, 總結(jié)了爬蟲的架構(gòu)體系、主流框架和未來發(fā)展。書中包括各種自動化工具、抓包工具、逆向工具的使用。核心內(nèi)容以WebJs逆向、安卓逆向、小程序逆向為主, 結(jié)合三十多個實戰(zhàn)案例進(jìn)行分析, 內(nèi)容從易到難, 循序漸進(jìn)。另外還對主流的反爬蟲技術(shù)進(jìn)行了講解, 包括傳輸協(xié)議、驗證碼體系、字符集映射、行為和指紋等。
李璽, 就職于中科大數(shù)據(jù)研究院, 深耕爬蟲逆向方向, 擁有豐富的經(jīng)驗和精湛的技巧。
前言
第1章網(wǎng)絡(luò)爬蟲架構(gòu)/
1.1爬蟲發(fā)展史/
1.2爬蟲基本架構(gòu)/
1.3分布式爬蟲架構(gòu)/
1.3.1主從分布式/
1.3.2對等分布式/
1.4網(wǎng)絡(luò)爬蟲遍歷策略/
1.4.1廣度優(yōu)先策略/
1.4.2深度優(yōu)先策略/
1.4.3優(yōu)先策略/
1.5智能采集系統(tǒng)架構(gòu)/
1.5.1采集需求分類/