商務智能與數據挖掘是近年來企業信息化的熱點研究內容。本書共分為9章,包括商務智能概述、商務智能中的核心技術、數據挖掘概述、分類分析、關聯分析、聚類分析、深度學習、Web挖掘技術、數據挖掘在電子商務中的應用等內容,它匯集了統計學、機器學習、數據庫、人工智能等學科,具有多學科交叉以及技術與管理融合等特點。
本書內容全面,案例豐富,適合作為計算機應用、軟件工程、信息管理、電子商務和管理科學等相關專業的本科生和研究生教材,也可作為企事業單位、政府部門、研究機構等從事商務智能理論研究工作的相關人員的參考資料。
《商務智能與數據挖掘(第2版)》介紹了商務智能的基本概念、產生與發展、主要研究內容、主流商務智能產品以及商務智能的未來發展趨勢,使讀者對商務智能有一個概要的認識;論述了數據倉庫和在線分析處理、數據可視化和數據挖掘等核心技術;詳細介紹了數據挖掘的具體方法,即分類分析、關聯分析、聚類分析和深度學習。在此基礎上,討論了商務智能與數據挖掘在Web數據挖掘和電子商務領域中的應用。
目錄
第1章商務智能概述
1.1商務智能的概念
1.1.1數據、信息與知識
1.1.2商務智能的定義
1.1.3商務智能的特點
1.1.4商務智能的過程
1.2商務智能的產生與發展
1.2.1商務智能的產生和發展過程
1.2.2商務智能與其他系統的關系
1.3商務智能的研究內容
1.4商務智能系統的支撐技術
1.5商務智能系統框架及數據流程
1.5.1商務智能系統框架
1.5.2商務智能系統的數據流程
1.6主流商務智能產品
1.6.1主流商務智能產品簡介
1.6.2商務智能的抉擇
1.7商務智能的未來發展趨勢
1.8商務智能的應用
小結
習題
第2章商務智能中的核心技術
2.1數據倉庫
2.1.1數據倉庫的產生與發展
2.1.2數據倉庫的概念與特征
2.1.3ETL
2.1.4數據集市
2.1.5數據倉庫的數據組織
2.1.6數據倉庫的體系結構
2.1.7數據倉庫的開發步驟
2.2在線分析處理
2.2.1OLAP簡介
2.2.2OLAP的定義和相關概念
2.2.3OLAP與OLTP的區別
2.2.4OLAP的分類
2.2.5OLAP多維數據分析
2.3數據可視化
2.3.1什么是數據可視化
2.3.2數據可視化的優勢
2.3.3數據可視化工具
小結
習題
第3章數據挖掘概述
3.1數據挖掘的起源與發展
3.1.1數據挖掘的起源
3.1.2數據挖掘的發展
3.2數據挖掘所要解決的問題
3.3數據挖掘的定義
3.4數據挖掘的過程
3.5數據挖掘系統
3.5.1數據挖掘系統的分類
3.5.2數據挖掘系統的發展
3.6數據挖掘的功能和方法
3.6.1數據挖掘的功能
3.6.2數據挖掘的方法
3.7數據挖掘的典型應用領域
3.8數據挖掘的發展趨勢
小結
習題
第4章分類分析
4.1預備知識
4.2解決分類問題的一般方法
4.3分類算法
4.3.1貝葉斯分類器
4.3.2貝葉斯信念網絡
4.3.3決策樹
4.3.4支持向量機
4.3.5粗糙集
4.3.6其他分類算法
4.4評估分類器的性能
4.4.1保持方法
4.4.2隨機二次抽樣
4.4.3交叉驗證
4.4.4自助法
小結
習題
第5章關聯分析
5.1引言
5.2基本概念
5.3關聯規則的種類
5.4關聯規則的研究現狀
5.5關聯規則挖掘算法
5.5.1Apriori算法
5.5.2Apriori改進算法
5.5.3FP增長算法
5.6改善關聯規則挖掘質量問題
5.6.1用戶主觀層面
5.6.2系統客觀層面
5.7約束數據挖掘問題
小結
習題
第6章聚類分析
6.1聚類的概念
6.1.1聚類概念及應用
6.1.2聚類算法要求
6.1.3聚類技術類型劃分
6.2聚類分析的統計量
6.2.1模型定義
6.2.2相似性度量
6.3常用聚類算法
6.3.1k均值算法
6.3.2kmedoids算法
6.3.3凝聚層次聚類算法
6.3.4DBSCAN算法
6.3.5STING算法
6.3.6CLIQUE算法
6.4簇評估
6.4.1概述
6.4.2非監督簇評估:使用凝聚度和分離度
6.4.3非監督簇評估:使用鄰近度矩陣
6.4.4層次聚類的非監督評估
6.4.5確定正確的簇個數
6.4.6聚類趨勢
6.4.7簇有效性的監督度量
6.5聚類與分類比較
小結
習題
第7章深度學習
7.1深度學習的由來
7.1.1深度學習的神經學啟示
7.1.2淺層結構函數表示能力的局限性
7.1.3特征提取的需要
7.2深度學習的經典方法
7.2.1深度學習表示模型和網絡結構
7.2.2自動編碼器
7.2.3受限玻爾茲曼機
7.2.4卷積神經網絡
7.3深度學習的應用
7.3.1深度學習在語音識別、合成及機器翻譯中的應用
7.3.2深度學習在圖像分類及識別中的應用
7.3.3深度學習在視頻分類及行為識別中的應用
7.4深度學習的研究近況及未來研究方向
7.4.1研究近況
7.4.2未來研究方向
小結
習題
第8章Web挖掘技術
8.1Web數據挖掘概述
8.1.1Web數據挖掘的概念
8.1.2Web數據挖掘的特點
8.1.3Web數據挖掘的處理流程
8.1.4Web數據挖掘與信息檢索、信息抽取的區別
8.2Web數據挖掘分類
8.2.1Web內容挖掘概述
8.2.2Web結構挖掘概述
8.2.3Web使用挖掘概述
8.3Web內容挖掘
8.3.1特征提取和特征表示
8.3.2自動摘要
8.3.3文本分類
8.3.4文本聚類
8.4Web結構挖掘
8.4.1超鏈和頁面內容的關系
8.4.2不同挖掘階段的分析
8.4.3PageRank
8.4.4HITS
8.4.5兩種算法的比較
8.4.6Web結構挖掘應用
8.5Web使用挖掘
8.5.1Web使用挖掘數據預處理
8.5.2Web使用挖掘模式發現
8.5.3Web使用挖掘模式分析
8.5.4Web使用挖掘模式應用
小結
習題
第9章數據挖掘在電子商務中的應用
9.1網站結構優化
9.2智能搜索引擎
9.2.1網絡機器人
9.2.2文本分析
9.2.3搜索條件的獲取和分析
9.2.4信息的搜索和排序
9.3移動商務智能
9.4客戶關系管理
9.4.1營銷
9.4.2銷售
9.4.3客戶服務
9.4.4客戶保持
9.4.5風險評估和欺詐識別
9.5客戶分類
9.5.1傳統的客戶分類理論
9.5.2基于客戶行為的客戶分類
9.5.3基于客戶生命周期的客戶分類
9.5.4基于客戶生命周期價值的客戶分類
小結
習題
參考文獻
第5章關聯分析“數據海量,信息缺乏”是很多行業在數據爆炸過程中普遍面對的尷尬,如今對信息的獲取能力,決定了在前所未有的激烈競爭環境中的決策能力。如何挖掘出數據中存在的各種有用的信息,即對這些數據進行分析,發現其數據模式及特征,然后可能發現某個客戶、消費群體或組織的金融和商業興趣,并可以觀察金融市場的變化趨勢,有效地獲取信息,是每個人、每個組織的難題。信息是現代企業的生命線,如果一個“結點”既不提供信息也不使用信息,也就失去了存在的價值。關聯分析(Association Analysis)用于發現隱藏在大型數據集中的令人感興趣的關聯關系,描述數據之間的密切度。5.1引言
引例1——購物籃分析1993年美國學者Rakesh Agrawa發表的一篇論文,即Mining Association Rules between Sets of Items in Large Databases,是目前關于關聯分析方面被引用最多的一篇文獻,提出通過分析購物籃中的商品集合,從而找出商品之間關聯關系的關聯算法,并根據商品之間的關系,找出客戶的購買行為。世界著名商業零售企業沃爾瑪擁有世界上最大的數據倉庫系統,集中了其各門店原始的詳細交易數據,為了能夠準確地了解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行了購物籃分析。想知道顧客經常一起購買的商品有哪些,數據挖掘技術的先鋒NCR Teradata公司幫助沃爾瑪創造了這一傳奇。NCR利用數據挖掘工具對這些數據進行分析和挖掘,意外發現“跟尿布一起被購買最多的商品竟是啤酒”。這是沃爾瑪最為經典的商品陳列故事,該規則表明尿布和啤酒的銷售之間存在著很強的聯系,因為許多購買尿布的顧客也購買啤酒。既然尿布與啤酒在一起被購買的機會會增多,于是沃爾瑪就在其一個個門店里,將尿布和啤酒赫然擺在一起出售,并且這個奇特的舉措使兩者的銷售都大為增加。
引例2——網頁挖掘
當人們瀏覽網頁的時候,經?吹讲簧夙撁妫 “瀏覽本頁面的網友還喜歡”“我們猜測你還喜歡以下頁面”等這樣的功能。網站通過收集每個用戶的歷史瀏覽數據,可以得出瀏覽過當前頁面的所有用戶以及這些用戶瀏覽了哪些其他頁面,然后將這些頁面合并,就得出了一個同時被瀏覽頁面列表的排序,然后根據一定的策略,排除一些頁面,保留一些高關聯性的頁面。上述案例的關聯規則就是: “購買某類商品的顧客,還會同時購買何種商品”“瀏覽過該頁面的用戶,還瀏覽過哪些頁面”。這中間最重要的兩個步驟,就是“找到關聯內容和去除低關聯內容”,而判斷關聯程度高低的最常用的度量分別是支持度(Support)和置信度(Confidence)。關聯規則可以發現交易數據庫中不同商品之間的聯系,這些規則找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。發現這樣的規則可以應用于指導商家科學地安排進貨、管理庫存、布置貨架、制定營銷策略以及根據購買模式對用戶進行分類。關聯規則可以發現大型事務或關系型數據庫中項之間有趣的聯系。隨著大量數據不斷地收集和存儲,許多業界人士對于從數據庫中挖掘這種模式越來越感興趣。從大量商務事務記錄中發現有趣的相關聯系,可以幫助分析顧客的購買行為模式,從而幫助許多商務決策制定,如分類設計、交叉銷售、營銷規劃和顧客購買習慣分析。