熟練使用Oracle R Enterprise大數據功能
《精通Oracle R Enterprise大數據 在Oracle數據庫中充分利
用R的強大功能》指導你高效管理企業(yè)大數據,順暢運行復雜流
程。本書簡明實用,分步講解如何創(chuàng)建和執(zhí)行大規(guī)模預測性分析
并保持卓越性能。通過本書的學習,你將能分析和準備數據、準
確建立業(yè)務流程模型、生成精密圖形、編寫和部署功能強大的腳
本,并能將Oracle R Enterprise功能有效地運用于APEX應用程序、
OBIEE儀表板以及Apache Hadoop系統(tǒng)。
主要內容
● 安裝、配置和管理Oracle R Enterprise
● 建立連接并將數據移到數據庫
● 創(chuàng)建Oracle R Enterprise包和函數
● 使用R語言處理Oracle Database中的數據
● 使用ODM、ORE和其他算法構建模型
● 開發(fā)和部署R腳本以及使用R腳本庫
● 執(zhí)行嵌入式R腳本,使用ORE SQL API函數
● 使用Oracle R Advanced Analytics for Hadoop映射和操縱數據
● 在Oracle Data Miner、OBIEE和其他應用程序中使用ORE
Brendan Tierney是Oracle ACE總監(jiān),是都柏林理工學院的數據科學、數據庫和大數據講師,也是一位獨立咨詢師(Oralytics)。Brendan曾在愛爾蘭、英國、比利時、荷蘭、挪威、西班牙、加拿大和美國等多個國家的項目中工作,在數據挖掘、數據科學、大數據和數據倉庫領域擁有逾24年的工作經驗,是公認的數據科學和大數據專家。Brendan是Oracle User Group社區(qū)的活躍分子,是OUG在愛爾蘭的領導者之一。Brendan是UKOUG Oracle Scene雜志的編輯,定期在全球技術會議上發(fā)表演講;也是一位活躍的博客寫手,曾為OTN、Oracle Scene、IOUG SELECT Journal、ODTUG Technical Journal和ToadWorld撰寫文章。他還是位于愛爾蘭的DAMA的董事會成員。Brendan已撰寫Predictive Analytics Using Oracle Data Miner和 Real World SQL and PL/SQL: Advice from the Experts兩本書籍。
Web和blog: www.oralytics.comTwitter: @brendantierney
目 錄
第1章
Oracle R Enterprise簡介 1
1.1 本書的目標 3
1.2 Oracle Advanced Analytics
選件 4
1.3 Oracle R Enterprise(Oracle R
企業(yè)版) 5
1.4 利用Oracle R Enterprise易于
部署R 7
1.5 Oracle的R技術 9
1.6 客戶如何使用Oracle R
Enterprise和Oracle Advanced
Analytics 10
1.7 小結 11
第2章
安裝Oracle R Enterprise 13
2.1 安裝的先決條件 13
2.2 設置Oracle Database 14
2.3 安裝Oracle R Enterprise 15
2.3.1 Oracle R Enterprise的
軟件包 15
2.3.2 安裝前的要求 16
2.3.3 在Oracle
Database Server
上的安裝 17
2.3.4 安裝客戶端 22
2.4 驗證ORE的安裝 25
2.5 安裝RStudio 26
2.6 使用Oracle的預制應用 27
2.6.1 預制應用Oracle
Database
Developer
27
2.6.2 預制應用Oracle
OBIEE
Sample
App 28
2.6.3 預制應用Oracle
Big Data
Lite
29
2.7 小結 29
第3章
Oracle R Enterprise入門 31
3.1 創(chuàng)建和管理到數據庫的ORE
連接 31
3.1.1 使用ore.connect創(chuàng)建ORE
連接 32
3.1.2 使用ore.sync同步數據 33
3.1.3 使用ore.attach將對象加入
搜索空間 35
3.2 執(zhí)行SQL命令 36
3.3 在Oracle Database中處理
數據 36
3.4 在數據庫中存儲數據 40
3.4.1 使用ore.creat函數建表 40
3.4.2 使用ore.drop函數刪除表 40
3.4.3 ore.create函數和ore.drop
函數組合使用的示例 41
3.5 在數據庫自帶的R Datastore中
存儲ORE對象 41
3.6 斷開與數據庫的連接 46
3.7 小結 46
第4章
透明層
47
4.1 透明層概述 47
4.2 探尋ORE透明層背后的
真相 50
4.3 小結 53
第5章
Oracle R Enterprise程序包 55
5.1 Oracle R Enterprise程序包 55
5.2 探索ORE包函數和程序包
版本 57
5.3 ORE設置和選項 59
5.4 獲得ORE的幫助 61
5.5 ORE演示腳本 62
5.6 小結 66
第6章
探索數據 67
6.1 探索性數據分析(EDA) 68
6.2 數據抽樣 73
6.3 數據聚合 78
6.4 數據轉換 80
6.4.1 派生屬性 80
6.4.2 分塊屬性 81
6.4.3 組合數據 82
6.5 數據排序 82
6.6 小結 83
第7章
使用ODM算法建立模型 85
7.1 Oracle Data Mining(Oracle
數據挖掘)
86
7.1.1 ORE中可用的ODM算法 87
7.1.2 利用OREdm軟件包在Oracle
中進行自動數據準備 87
7.2 使用OREdm軟件包建立模型
和對數據進行評分 88
7.2.1 屬性重要性 88
7.2.2 關聯(lián)規(guī)則分析 89
7.2.3 決策樹 92
7.2.4 支持向量機 94
7.2.5 樸素貝葉斯 98
7.2.6 廣義線性模型 99
7.2.7 聚類
100
7.3 保存數據挖掘模型 101
7.4 小結 103
第8章
利用ORE和其他算法建立
模型 105
8.1 什么算法是可用的? 106
8.2 為建模而準備數據 106
8.3 使用ORE算法建立模型 107
8.3.1 廣義線性模型 108
8.3.2 線性和逐步回歸模型 109
8.3.3 神經網絡 111
8.3.4 隨機森林 112
8.4 使用R軟件包和算法構建
模型 113
8.5 使用ore.predict優(yōu)化數據庫自
帶的評分過程 115
8.6 小結 117
第9章
在用戶定義的R腳本庫中
生成R腳本 119
9.1 使用R腳本庫 120
9.2 創(chuàng)建和刪除R腳本
120
9.3 授予和撤消用戶定義的R
腳本的特權 122
9.4 管理R Script Repository 123
9.5 使用SQL API創(chuàng)建腳本 123
9.5.1 創(chuàng)建一個R腳本 124
9.5.2 刪除一個腳本 126
9.5.3 授予和撤消訪問權限 126
9.5.4 用戶定義的R腳本的數據
字典視圖 127
9.6 小結 127
第10章
嵌入式R執(zhí)行 129
10.1 通過R接口使用嵌入式R
執(zhí)行 129
10.1.1 如何使用ore.doEval
函數 130
10.1.2 如何使用ore.tableApply
函數 132
10.1.3 如何使用ore.groupApply
函數 134
10.1.4 如何使用ore.rowApply
函數 135
10.1.5 如何使用ore.indexApply
函數 136
10.1.6 并行執(zhí)行嵌入式R
函數 137
10.2 通過SQL接口使用嵌入式
R執(zhí)行 138
10.2.1 如何使用rqEval
SQL
函數 138
10.2.2 如何使用SQL
函數rqTableEval
140
10.2.3 如何使用SQL
函數rqGroupEval
144
10.2.4 如何使用SQL函數
rqRowEval
146
10.3 小結 147
第11章
針對Hadoop的Oracle R
Advanced Analytics 149
11.1 連接到Apache Hive上并處理
數據 152
11.2 使用ORCH管理Map-Reduce
作業(yè) 155
11.3 通過ORAAH使用Spark 157
11.4 小結 158
第12章
通過Oracle Data Mining
使用ORE 159
12.1 Oracle Data Mining 160
12.2 Oracle Data Miner 164
12.3 通過SQL Node來包含R
腳本 165
12.4 使用R節(jié)點 167
12.5 小結 168
第13章
在APEX和OBIEE中使用
ORE 171
13.1 Oracle APEX 171
13.1.1 在APEX應用程序中
包含ORE腳本 173
13.1.2 向APEX應用程序中
添加R圖形 175
13.2 Oracle
Business Intelligence 177
13.2.1 設置OBIEE以便能
使用ORE
178
13.2.2 在OBIEE
RPD中使用
R腳本 180
13.2.3 在儀表板上呈現由R
腳本產生的結果 180
13.3 小結 182
第14章
針對Oracle DBA的
ORE 183
14.1 在數據庫中創(chuàng)建一個新的
ORE模式 183
14.2 在Oracle R Enterprise中
安裝新的R軟件包 184
14.2.1 在數據庫服務器上安裝新
的R軟件包 185
14.2.2 在客戶機上安裝新
軟件包 186
14.3 ORE的全局變量和選項 187
14.4 使用ore.parallel特性 189
14.5 卸載Oracle R Enterprise 189
14.5.1 從Oracle
Database服務
器中卸載Oracle
R
Enterprise
190
14.5.2 從客戶端卸載Oracle
R Enterprise 191
14.6 小結 192