本書通過大型旅游數據分析項目的開發案例,全面展示了使用Python進行旅游數據分析的過程和實踐。全書共9章。第1章介紹了大數據的概念、發展及主要技術,第2章介紹了Python的基礎知識,第3章介紹了網絡公開數據的采集方法,第4章介紹了數據解析方法,第5章介紹了數據存取方法,第6章介紹了數據處理與分析方法,第7章介紹了數據可視化方法,第8章設計了兩個旅游大數據綜合案例,第9章總結了本書的相關研究。 本書以Windows和PyCharm為平臺,完整地對數據分析過程進行系統論述,并介紹各個模塊所需要的基本技術及應用。書中所有知識點均給出了實例代碼,并全部通過了程序驗證。 本書可作為智慧旅游專業及相關專業的教學用書,也可作為感興趣讀者的自學讀物,還可供使用Python進行旅游大數據分析的旅游從業者參考。
黨的二十大報告指出:教育、科技、人才是全面建設社會主義現代化國家的基礎性、戰略性支撐。必須堅持科技是第一生產力、人才是第一資源、創新是第一動力,深入實施科教興國戰略、人才強國戰略、創新驅動發展戰略,這三大戰略共同服務于創新型國家的建設。高等教育與經濟社會發展緊密相連,對促進就業創業、助力經濟社會發展、增進人民福祉具有重要意義。
在當今大數據時代,數字經濟的快速發展使得各行各業處于數字化轉型的快速發展時期,數字信息更是以大量高速的狀態不斷增長。旅游產業作為一個對社會信息變化高度敏感的行業,對高質量數據分析的需求也逐漸增多。
2023年,全國文化和旅游產業發展工作會議指出,當前我國人民群眾對文化和旅游產品供給提出了更高的要求,要認真研判產業發展面臨的新形勢、新變化,準確把握產業發展重點工作方向,進一步發揮文化和旅游消費在穩增長、擴內需中的重要作用。
旅游大數據分析可以幫助旅游部門分析相關數據,在此基礎上做好公共管理服務,提升旅游業管理決策能力; 可以幫助旅游景區進行游客分析、數據挖掘,有效指導景區的運營發展; 能幫助旅游企業查找不足,為游客定制個性化的旅游服務,提高旅游服務質量; 能幫助旅游企業進行市場分析、客戶需求分析,更新營銷策略并做好旅游經營策略管理,提高旅游市場判斷力,從而推動整個旅游產業的發展。由此可見,旅游大數據分析對旅游業的發展至關重要。
Python是一門輕量級的數據分析語言,它靈活、輕便,可以與各行各業相結合,從而極大地提高人們的工作效率。將Python應用在旅游大數據分析中,即對旅游數據進行合法抓取并存儲,結合實際需求對數據進行分析,再以可視化的角度進行呈現。 Python旅游大數據分析是一門新的交叉學科應用領域,迫切需要對此進行系統論述。
本書以Windows和PyCharm為平臺,完整地對網絡數據采集數據解析數據存取數據處理分析數據可視化的數據分析過程進行系統論述,并介紹各個板塊所需要的基本技術; 以旅游數據分析為案例進行實踐開發,以兩個大型旅游數據分析項目的開發為例,完整展示了Python旅游數據分析的過程和實踐。
全書共9章。第1章介紹了大數據的概念、發展及主要技術,第2章介紹了Python的基礎知識,第3章介紹了網絡公開數據的采集方法,第4章介紹了數據解析方法,第5章介紹了數據存取方法,第6章介紹了數據處理與分析方法,第7章介紹了數據可視化方法,第8章設計了兩個旅游大數據綜合案例,第9章總結了本書的相關研究。
本書對攜程網、12306、去哪兒網等進行數據采集,僅用于學習交流,不作為商業用途,不宜頻繁采集,以免影響網站運行。書中所有實驗均通過測試,但仍然可能會出現網站結構升級導致程序不能正常運行的情況,請讀者知悉。
為便于學習和理解,本書提供軟件安裝包、程序源碼等資源,可在目錄上方的資源下載二維碼中獲取。
本書的出版基于以下項目的研究成果: 重慶旅游職業學院2022年校級課題(xj2223)、重慶旅游職業學院2023年教學質量與教學改革工程建設項目(YJKG2023001)、重慶市2023年科學技術研究計劃項目(KJQN202304604)。
由于作者水平有限,書中錯漏在所難免,敬請讀者批評指正。
作者2023年7月