国产91青青成人a在线/在线视频成人/aaa成人永久在线观看视频/深夜草莓视频app

關于我們
新書資訊
新書推薦

網(wǎng)絡爬蟲全解析——技術、原理與實踐

網(wǎng)絡爬蟲全解析——技術、原理與實踐

定     價:¥79

中 教 價:¥63.20  (8.00折)

庫 存 數(shù): 0

  • 作者:羅剛
  • 出版時間:2017/3/1
  • ISBN:9787121310713
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:444
  • 紙張:膠紙版
  • 版次:1
  • 開本:16K
  • 商品庫位:
9
7
3
8
1
7
0
1
7
2
1
1
3
購買數(shù)量:
本書介紹了如何開發(fā)網(wǎng)絡爬蟲。內(nèi)容主要包括開發(fā)網(wǎng)絡爬蟲所需要的Java語法基礎和網(wǎng)絡爬蟲的工作原理,如何使用開源組件HttpClient和爬蟲框架Crawler4j抓取網(wǎng)頁信息,以及針對抓取到的文本進行有效信息的提取。為了擴展抓取能力,本書介紹了實現(xiàn)分布式網(wǎng)絡爬蟲的關鍵技術。


本書介紹了如何開發(fā)網(wǎng)絡爬蟲。內(nèi)容主要包括開發(fā)網(wǎng)絡爬蟲所需要的Java語法基礎和網(wǎng)絡爬蟲的工作原理,如何使用開源組件HttpClient和爬蟲框架Crawler4j抓取網(wǎng)頁信息,以及針對抓另外,本書介紹了從圖像和語音等多媒體格式文件中提取文本信息,以及如何使用大數(shù)據(jù)技術存儲抓取到的信息。


最后,以實戰(zhàn)為例,介紹了如何抓取微信和微博,以及在電商、醫(yī)藥、金融等領域的案例應用。其中,電商領域的應用介紹了使用網(wǎng)絡爬蟲抓取商品信息入庫到網(wǎng)上商店的數(shù)據(jù)庫表。醫(yī)藥領域的案例介紹了抓取PubMed醫(yī)藥論文庫。金融領域的案例介紹了抓取股票信息,以及從年報PDF文檔中提取表格等。本書適用于對開發(fā)信息采集軟件感興趣的自學者。也可以供有Java或程序設計基礎的開發(fā)人員參考。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容