書中將自然語言處理技術和統計處理技術視為工具,不會涉及到其繁瑣的原理、數學定理等。書中利用操作簡便的Python程序包來處理文本數據,探索文本挖掘可以幫我們做到的事情,而非用尖端的技術進行程序設計。書中用簡單明快的例子演示應用效果,并配有視頻展示,下載資料包即可獲取視頻和案例二維碼!
本書通過5個章節介紹相關知識,第1章介紹文本挖掘的整體印象;在第2章中概括介紹了本書后面用到的Python的必要知識;第3章中介紹文本處理相關的基本概念和觀點;第4章中利用Python學習作為基礎處理的頻率分析方法和其能得到的結果;最后,在第5章中介紹文本挖掘需要用到的各種具體方法以及在Python中的處理步驟。
一個以大數據與人工智能技術為核心的新的工業革命時代已經來臨,大數據在企業決策中扮演著越來越重要的角色,數據經過高效的智能數據分析與挖掘等人工智能技術處理后,可以產生巨大價值,創造智能,方便生活。現在“統計分析和數據挖掘”已躋身最受歡迎的求職技能行列,數據分析師的薪酬待遇也遠遠超過平均薪資水平。這本書是寫給此方向的初學者,書中用簡單明快的例子演示應用效果,并配有視頻展示,下載資料包即可獲取視頻和二維碼,不會讓你感覺枯燥摸不到頭腦。
1975年畢業于東京大學工學部電子工學專業。1977年完成工學專業課程碩士課程。1978年進入斯坦福大學電氣工學專業,1984年退出博士課程,進入日本艾比·艾姆東京基礎研究所工作。2000年加入到東邦大學理學部情報科學科,任東邦大學理學部情報科學科教授。