本書以爬蟲逆向方向的相關技術和崗位要求進行撰寫, 總結了爬蟲的架構體系、主流框架和未來發展。書中包括各種自動化工具、抓包工具、逆向工具的使用。核心內容以WebJs逆向、安卓逆向、小程序逆向為主, 結合三十多個實戰案例進行分析, 內容從易到難, 循序漸進。另外還對主流的反爬蟲技術進行了講解, 包括傳輸協議、驗證碼體系、字符集映射、行為和指紋等。
李璽, 就職于中科大數據研究院, 深耕爬蟲逆向方向, 擁有豐富的經驗和精湛的技巧。
前言
第1章網絡爬蟲架構/
1.1爬蟲發展史/
1.2爬蟲基本架構/
1.3分布式爬蟲架構/
1.3.1主從分布式/
1.3.2對等分布式/
1.4網絡爬蟲遍歷策略/
1.4.1廣度優先策略/
1.4.2深度優先策略/
1.4.3優先策略/
1.5智能采集系統架構/
1.5.1采集需求分類/