Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用
定 價(jià):¥69.8
中 教 價(jià):¥41.18 (5.90折)促銷
庫(kù) 存 數(shù): 0
網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的重點(diǎn)之一是網(wǎng)絡(luò)爬蟲(chóng)框架,因此《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》結(jié)合網(wǎng)絡(luò)爬蟲(chóng)框架的相關(guān)案例重點(diǎn)介紹網(wǎng)絡(luò)爬蟲(chóng)的常見(jiàn)框架,包括PySpider網(wǎng)絡(luò)爬蟲(chóng)框架的安裝和使用,Scrapy網(wǎng)絡(luò)爬蟲(chóng)框架的安裝和使用,以及Scrapy網(wǎng)絡(luò)爬蟲(chóng)管理與部署。另外,《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》對(duì)Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)需要的reguests庫(kù)、Scrapy解析庫(kù)、存儲(chǔ)庫(kù)、XPath進(jìn)行了介紹,并介紹了requests庫(kù)、正則表達(dá)式、XPath等的使用方法,還重點(diǎn)講解了這些庫(kù)的實(shí)際應(yīng)用。 《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》以Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)為主線,兼顧理論與實(shí)戰(zhàn),全面介紹可操作的Python環(huán)境與系統(tǒng)開(kāi)發(fā)相關(guān)知識(shí),以及大數(shù)據(jù)算法、大數(shù)據(jù)分析、大數(shù)據(jù)系統(tǒng)互補(bǔ)的作用。另外,《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》還贈(zèng)送課程大綱、教學(xué)課件PPT、實(shí)驗(yàn)手冊(cè)、各章習(xí)題及答案、期末試卷及答案、教學(xué)和實(shí)驗(yàn)視頻,方便教師授課。 《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》可作為高等院校大數(shù)據(jù)、計(jì)算機(jī)、電子信息、軟件技術(shù)相關(guān)專業(yè)研究生和高年級(jí)本科生的教材,也可作為大數(shù)據(jù)及編程愛(ài)好者的參考用書(shū)。
讀者對(duì)象《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》可作為高等院校大數(shù)據(jù)、計(jì)算機(jī)、電子信息、軟件技術(shù)相關(guān)專業(yè)研究生和高年級(jí)本科生的教材,也可作為大數(shù)據(jù)及編程愛(ài)好者的參考用書(shū)。
本書(shū)特色★★以Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)為主線,兼顧理論與實(shí)戰(zhàn)。★★贈(zèng)送課程大綱、教學(xué)課件PPT、實(shí)驗(yàn)手冊(cè)、各章習(xí)題及答案、期末試卷及答案、教學(xué)和實(shí)驗(yàn)視頻,方便教師授課。
網(wǎng)絡(luò)爬蟲(chóng),也被稱為網(wǎng)絡(luò)機(jī)器人,能夠幫助并取代在互聯(lián)網(wǎng)上自動(dòng)收集和組織數(shù)據(jù)的人。在大數(shù)據(jù)時(shí)代,信息收集是一項(xiàng)重要的任務(wù),例如在搜索引擎中抓取和收集網(wǎng)站,在數(shù)據(jù)分析和挖掘中收集數(shù)據(jù),在財(cái)務(wù)分析中收集財(cái)務(wù)數(shù)據(jù)。如果僅僅依靠人力資源來(lái)收集信息,不僅效率低下、操作煩瑣,還會(huì)增加信息收集的成本。此時(shí),可以使用網(wǎng)絡(luò)爬蟲(chóng)來(lái)自動(dòng)收集數(shù)據(jù)和信息。此外,Web爬蟲(chóng)還可以應(yīng)用于輿情監(jiān)測(cè)與分析、目標(biāo)客戶數(shù)據(jù)收集等領(lǐng)域。使用Python是爬蟲(chóng)的最佳方式,因?yàn)樗鼘?duì)初學(xué)者更友好,且原理簡(jiǎn)單,通過(guò)幾行代碼就可以實(shí)現(xiàn)基本的爬蟲(chóng),其學(xué)習(xí)過(guò)程更流暢,能讓學(xué)習(xí)者感受到更大的成就感。在掌握基本的爬蟲(chóng)程序之后,學(xué)生將更加熟悉Python數(shù)據(jù)分析、Web開(kāi)發(fā),甚至機(jī)器學(xué)習(xí)。在此過(guò)程中,學(xué)生將熟悉基本的Python語(yǔ)法、庫(kù)的使用以及如何查找文檔。《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》內(nèi)容《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》全面系統(tǒng)地講解Python網(wǎng)絡(luò)爬蟲(chóng)的體系應(yīng)用,由淺入深地介紹網(wǎng)絡(luò)爬蟲(chóng)方面的技術(shù)知識(shí),對(duì)基于Python網(wǎng)絡(luò)爬蟲(chóng)領(lǐng)域的技術(shù)做全面的介紹。原理部分,主要突出網(wǎng)絡(luò)爬蟲(chóng)的理論基礎(chǔ),原生態(tài)網(wǎng)絡(luò)爬蟲(chóng)中正則表達(dá)式與requests庫(kù)的使用,HTML內(nèi)容解析模擬瀏覽器模擬登錄模擬驗(yàn)證的應(yīng)用,Python與數(shù)據(jù)庫(kù)的連接與使用,網(wǎng)絡(luò)爬蟲(chóng)框架的介紹與實(shí)際應(yīng)用等。系統(tǒng)開(kāi)發(fā)環(huán)境配置與搭建部分,通過(guò)實(shí)例系統(tǒng)講解Python環(huán)境的安裝、部署、環(huán)境搭建、配置、應(yīng)用程序部署等一系列過(guò)程,幫助學(xué)生搭建Python開(kāi)發(fā)環(huán)境。網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的重點(diǎn)之一是網(wǎng)絡(luò)爬蟲(chóng)框架,因此《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》首先重點(diǎn)介紹網(wǎng)絡(luò)爬蟲(chóng)的常見(jiàn)框架,再結(jié)合網(wǎng)絡(luò)爬蟲(chóng)框架的相關(guān)案例介紹PySpider網(wǎng)絡(luò)爬蟲(chóng)框架的安裝和使用,Scrapy網(wǎng)絡(luò)爬蟲(chóng)框架的安裝和使用,以及Scrapy網(wǎng)絡(luò)爬蟲(chóng)管理與部署。另外,因?yàn)镻ython網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)需要reguests庫(kù)、Scrapy解析庫(kù)、存儲(chǔ)庫(kù)、XPath的配合,《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》還介紹了requests庫(kù)、正則表達(dá)式、XPath等的使用方法,重點(diǎn)講解這些庫(kù)的實(shí)際應(yīng)用。《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》共分為7章,鄧維負(fù)責(zé)全書(shū)的統(tǒng)稿工作,第1~4章由李貝編寫,第5章到第6章由湯小洋編寫,第7章由康毅斌、林海玉、劉燕秋、林建雄、劉慶勝、鐘曉穎統(tǒng)一編寫。在Python網(wǎng)絡(luò)爬蟲(chóng)的體系應(yīng)用中,Scrapy與PySpide是非常重要的Python網(wǎng)絡(luò)爬蟲(chóng)框架,讀者通過(guò)學(xué)習(xí),可以掌握Scrapy和PySpider的安裝、配置和使用,以及實(shí)現(xiàn)基本的案例。《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》以Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)為主線,兼顧理論與實(shí)戰(zhàn),全面介紹可操作的Python環(huán)境與系統(tǒng)開(kāi)發(fā)相關(guān)知識(shí),以及大數(shù)據(jù)算法、大數(shù)據(jù)分析、大數(shù)據(jù)系統(tǒng)互補(bǔ)的作用,可以互相參考。《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》使用對(duì)象計(jì)算機(jī)編程愛(ài)好者。適合掌握Python、網(wǎng)絡(luò)爬蟲(chóng)等技術(shù)的讀者,按照書(shū)中的流程,一步步從環(huán)境的準(zhǔn)備到基本庫(kù)、常見(jiàn)框架的開(kāi)發(fā)和部署,直到案例開(kāi)發(fā)的完成。開(kāi)設(shè)有Python相關(guān)課程的高校教師和學(xué)生。如今,國(guó)內(nèi)很多高校計(jì)算機(jī)、自動(dòng)化、電子信息、大數(shù)據(jù)等專業(yè)均開(kāi)設(shè)了大數(shù)據(jù)相關(guān)課程,但是絕大部分均以理論介紹為主,單純的理論教學(xué)過(guò)于抽象,學(xué)生理解起來(lái)比較困難,教學(xué)效果不理想。《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》所介紹的內(nèi)容以實(shí)踐為主、理論為輔,注重學(xué)生操作跟實(shí)際接軌,使學(xué)生對(duì)所學(xué)知識(shí)更感興趣、更容易接受。《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》贈(zèng)送資源《Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)與應(yīng)用》贈(zèng)送課程大綱、教學(xué)課件PPT、實(shí)驗(yàn)手冊(cè)、各章習(xí)題及答案、期末試卷及答案、教學(xué)和實(shí)驗(yàn)視頻,讀者可分別掃描下方二維碼獲取。
課程大綱 教學(xué)課件PPT 實(shí)驗(yàn)手冊(cè)
習(xí)題及答案 期末試卷及答案 教學(xué)和實(shí)驗(yàn)視頻(上) 教學(xué)和實(shí)驗(yàn)視頻(下)
第1章 網(wǎng)絡(luò)爬蟲(chóng)概述1.1 網(wǎng)絡(luò)爬蟲(chóng)簡(jiǎn)介1.1.1 網(wǎng)絡(luò)爬蟲(chóng)的概念與類別1.1.2 網(wǎng)絡(luò)爬蟲(chóng)的流程1.1.3 網(wǎng)絡(luò)爬蟲(chóng)的抓取1.2 網(wǎng)絡(luò)爬蟲(chóng)的攻防戰(zhàn)1.3 反網(wǎng)絡(luò)爬蟲(chóng)技術(shù)及解決方案1.4 本章習(xí)題第2章 Python基本知識(shí)介紹2.1 Python編程2.1.1 Python的安裝與環(huán)境配置2.1.2 PyCharm的安裝與使用2.2 HTML基本原理2.2.1 HTML簡(jiǎn)介2.2.2 HTML的基本原理2.3 基本庫(kù)的使用2.3.1 urllib庫(kù)2.3.2 requests庫(kù)2.3.3 re庫(kù)2.4 實(shí)戰(zhàn)案例:百度新聞的抓取2.5 本章習(xí)題第3章 原生態(tài)網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)3.1 requests庫(kù)詳解3.1.1 requests語(yǔ)法3.1.2 requests庫(kù)的使用3.2 正則表達(dá)式3.2.1 正則表達(dá)式詳解與使用3.2.2 Python與Excel3.3 實(shí)戰(zhàn)案例:環(huán)球新聞的抓取3.4 本章習(xí)題第4章 解析HTML內(nèi)容4.1 XPath的介紹與使用4.1.1 XPath的介紹4.1.2 XPath的使用4.2 lxml庫(kù)的安裝與使用4.2.1 lxml庫(kù)的安裝4.2.2 lxml庫(kù)的常見(jiàn)方法使用4.3 Chrome瀏覽器分析網(wǎng)站4.4 BeautifulSoup的安裝與使用4.5 實(shí)戰(zhàn)案例:BeautifulSoup的使用4.6 頁(yè)面請(qǐng)求與JSON4.6.1 JSON的介紹與應(yīng)用4.6.2 GET請(qǐng)求和POST請(qǐng)求4.7 模擬瀏覽器4.7.1 Selenium的介紹與安裝4.7.2 模擬點(diǎn)擊4.7.3 Ajax結(jié)果提取4.8 實(shí)戰(zhàn)案例:小說(shuō)網(wǎng)站的抓取4.9 模擬登錄與驗(yàn)證4.9.1 復(fù)雜的頁(yè)面請(qǐng)求4.9.2 代理IP4.9.3 Cookie的使用與證書(shū)4.9.4 使用Selenium進(jìn)行模擬登錄4.10 驗(yàn)證碼4.10.1 手動(dòng)打碼4.10.2 自動(dòng)打碼4.11 實(shí)戰(zhàn)案例:模擬登錄及驗(yàn)證4.11.1 基本思路與方法4.11.2 使用Cookie4.12 本章習(xí)題第5章 Python與數(shù)據(jù)庫(kù)5.1 MySQL數(shù)據(jù)庫(kù)的安裝與應(yīng)用5.1.1 MySQL數(shù)據(jù)庫(kù)的安裝5.1.2 MySQL數(shù)據(jù)庫(kù)的應(yīng)用5.2 MongoDB的安裝與使用5.2.1 MongoDB的安裝5.2.2 MongoDB的使用5.2.3 MongoDB的可視化工具RockMongo5.3 Python庫(kù)pymongo5.4 本章習(xí)題第6章 Python網(wǎng)絡(luò)爬蟲(chóng)框架6.1 Python網(wǎng)絡(luò)爬蟲(chóng)的常見(jiàn)框架6.2 PySpider網(wǎng)絡(luò)爬蟲(chóng)框架簡(jiǎn)介6.3 Scrapy網(wǎng)絡(luò)爬蟲(chóng)框架簡(jiǎn)介6.4 PySpider與Scrapy的區(qū)別6.5 PySpider網(wǎng)絡(luò)爬蟲(chóng)框架的安裝和使用6.5.1 PySpider的安裝與部署6.5.2 PySpider的界面介紹6.5.3 PySpider的多線程網(wǎng)絡(luò)爬蟲(chóng)6.5.4 使用Phantomjs渲染6.5.5 PySpider網(wǎng)絡(luò)爬蟲(chóng)時(shí)間控制6.5.6 RabbitMQ隊(duì)伍去重6.5.7 在Linux系統(tǒng)下安裝部署PySpider6.5.8 實(shí)戰(zhàn)案例:使用PySpider抓取題庫(kù)6.6 Scrapy網(wǎng)絡(luò)爬蟲(chóng)框架的安裝和使用6.6.1 Scrapy的簡(jiǎn)介與安裝6.6.2 Scrapy的項(xiàng)目文件介紹6.6.3 Scrapy的使用6.6.4 Scrapy中使用XPath6.6.5 Scrapy與MongoDB6.6.6 Scrapy_Redis的安裝與使用6.6.7 使用Redis緩存網(wǎng)頁(yè)并自動(dòng)去重6.6.8 實(shí)戰(zhàn)案例:抓取豆瓣Top2506.7 Scrapy網(wǎng)絡(luò)爬蟲(chóng)管理與部署6.7.1 Scrapyd管理網(wǎng)絡(luò)爬蟲(chóng)6.7.2 使用SpiderKeeper進(jìn)行任務(wù)監(jiān)控與定時(shí)抓取6.7.3 Supervisor網(wǎng)絡(luò)爬蟲(chóng)進(jìn)程管理6.7.4 Scrapy項(xiàng)目設(shè)計(jì)思路6.7.5 實(shí)戰(zhàn)案例6.8 本章習(xí)題第7章 綜合性實(shí)戰(zhàn)案例7.1 實(shí)戰(zhàn)案例1:瀑布流抓取7.2 實(shí)戰(zhàn)案例2:網(wǎng)絡(luò)爬蟲(chóng)攻防戰(zhàn)7.2.1 網(wǎng)絡(luò)爬蟲(chóng)攻防技術(shù)認(rèn)識(shí)7.2.2 代理IP地址網(wǎng)站7.2.3 抓取新浪微博內(nèi)容7.2.4 獲得微博內(nèi)容信息并保存到文本中7.3 實(shí)戰(zhàn)案例3:分布式抓取7.3.1 背景/案例知識(shí)介紹7.3.2 某研究中心的數(shù)據(jù)抓取7.3.3 查看效果7.4 實(shí)戰(zhàn)案例4:微信公眾號(hào)文章點(diǎn)贊閱讀數(shù)抓取7.4.1 所運(yùn)用的內(nèi)容講解7.4.2 抓取微信公眾號(hào)文章的評(píng)論數(shù)據(jù)7.4.3 效果展示本章習(xí)題參考文獻(xiàn)