機器學習一直是人工智能研究領(lǐng)域的重要方向,而在大數(shù)據(jù)時代,來自Web 的數(shù)據(jù)采集、挖掘、應(yīng)用技術(shù)又越來越受到矚目,并創(chuàng)造著巨大的價值。本書是有關(guān)Web數(shù)據(jù)挖掘和機器學習技術(shù)的一本知名的著作,第2 版進一步加入了本領(lǐng)域全新的研究內(nèi)容和應(yīng)用案例,介紹了統(tǒng)計學、結(jié)構(gòu)建模、推薦系統(tǒng)、數(shù)據(jù)分類、點擊預(yù)測、深度學習、效果評估、數(shù)據(jù)采集等眾多方面的內(nèi)容。《智能Web算法(第2版)》內(nèi)容翔實、案例生動,有很高的閱讀價值。
《智能Web算法(第2版)》適合對算法感興趣的工程師與學生閱讀,對希望從業(yè)務(wù)角度更好地理解機器學習技術(shù)的產(chǎn)品經(jīng)理和管理層來說,亦有很好的參考價值。
《智能Web算法(第2版)》深入講解了如何建立機器學習系統(tǒng)來對采集的用戶、Web應(yīng)用、網(wǎng)站日志等數(shù)據(jù)進行深入分析和挖掘。經(jīng)過這一版全面的修訂,讀者可以看到智能算法是怎樣從數(shù)據(jù)中抽取出真實有價值的信息的,核心的機器學習概念也通過scikit-learn的Python代碼示例進行了講解。《智能Web算法(第2版)》指導(dǎo)讀者對來自Web的源源不斷的數(shù)據(jù)流進行采集、存儲、建模,并掌握開發(fā)推薦引擎、統(tǒng)計分類算法、神經(jīng)網(wǎng)絡(luò)和深度學習等技術(shù)。
譯者序
人工智能和機器學習技術(shù)近年來得到了飛速的發(fā)展,并成為計算機界乃至全社會炙手可熱的話題。這些優(yōu)秀的技術(shù)讓每個人的生活越來越方便和智能,這讓從業(yè)者感到非常欣喜。智能算法是人工智能的核心技術(shù),不論是我當前創(chuàng)辦的達觀數(shù)據(jù),還是之前在騰訊、盛大、百度等互聯(lián)網(wǎng)企業(yè)的工作,都是圍繞智能算法展開的,我對此有深厚的熱情。因此當電子工業(yè)出版社計算機出版分社的張春雨編輯邀請我翻譯這本《智能 Web算法(第 2版)》的時候,雖然深知翻譯和審校要付出大量的時間和精力,但還是很愉快地接受了邀請并完成了翻譯工作,希望本書中文版的面世,能幫助廣大愛好者建立起對 Web數(shù)據(jù)挖掘和機器學習技術(shù)全面且直觀的了解。
在眾多有關(guān)機器學習和數(shù)據(jù)挖掘的書籍里,本書是頗為經(jīng)典的一本。其特點之一是內(nèi)容覆蓋面很廣,有關(guān)網(wǎng)絡(luò)數(shù)據(jù)挖掘的方方面面都涵蓋到了,從數(shù)據(jù)采集、存儲,到降維運算和結(jié)構(gòu)抽取,以及涉及模式識別的聚類和分類、統(tǒng)計機器學習理論等,還有面向互聯(lián)網(wǎng)應(yīng)用的推薦系統(tǒng)、搜索引擎、廣告點擊預(yù)測等,配套的效果評估機制也有專門的章節(jié)進行講解,讀者閱讀本書后可以形成較為全面的學習體系。特點之二是本書較好地在算法思想、數(shù)學原理、應(yīng)用案例之間找到了平衡點。每個章節(jié)作者都由淺入深地講解了算法的思想,并通過列舉一些非常生動的案例來讓讀者更好地理解算法的原理。例如,列舉的 Iris數(shù)據(jù)集結(jié)構(gòu)的抽取、在線電影推薦系統(tǒng)、金融欺詐檢測、廣告點擊預(yù)測等實踐案例的講解都非常清晰易懂。書中對數(shù)學公式的使用點到為止,力求簡潔。這樣既不像很多教科書那樣堆砌數(shù)學公式,讓很多讀者望而生畏,又不像很多書籍那樣只是羅列程序代碼而不講解背后的算法思想。這和作者既有工程實踐經(jīng)驗,又有學術(shù)研究背景密不可分的。
與通常的再版書籍只是做些局部修訂不同,本書第 2版對第 1版圖書的內(nèi)容進行了全面徹底的升級改寫,全書有超過 80%的篇幅與第 1版不同,可以說是脫胎換骨的變化。這些變化具體體現(xiàn)在以下三個方面:首先,增加了近年來數(shù)據(jù)挖掘領(lǐng)域最新的一些研究成果,例如當下炙手可熱的深度學習等,同時刪減了一些較為陳舊的內(nèi)容;其次,調(diào)整了全書的組織結(jié)構(gòu),章節(jié)的劃分更為合理,每章內(nèi)容更加豐富,列舉的案例也更貼近實戰(zhàn)。第三,全書的示例代碼不再使用第 1版的小眾開發(fā)語言 BeanShell,而是改為機器學習界更為常用的 Python,并配合機器學習界知名的開源軟件包 scikit-learn,讓本書的代碼閱讀起來更友好,也大大增強了示例代碼的實用性。
本書由于篇幅所限,雖然涉及的面很寬廣,但是每個章節(jié)的內(nèi)容都沒有進一步深入展開。我在翻譯過程中,覺得本書有些內(nèi)容講得略偏淺顯,在所提及的領(lǐng)域都屬于入門級的深度,讀起來有些意猶未盡。事實上如果深究起來,本書每個章節(jié)的內(nèi)容都足夠擴充成一本獨立的書籍。好在本書作者提供了很多參考資料,并在相應(yīng)章節(jié)的腳注里細心地進行了標識,對更深入的內(nèi)容感興趣的讀者,不妨按圖索驥,下載相應(yīng)的論文和著作來一窺究竟。
本書的翻譯工作,要深深感謝電子工業(yè)出版社的張春雨、劉舫和編輯朋友們給予的大力幫助和耐心指點。同時要感謝我所在的公司——達觀數(shù)據(jù)的各位親密戰(zhàn)友,依靠大家分工協(xié)作、共同努力,才順利完成了全書各個章節(jié)的翻譯工作,這些同事是于敬、文輝、紀達麒、紀傳俊、江永青、馮仁杰、桂洪冠、高翔、王文廣、張健、范雄雄、蹇智華、孟禮斌。團結(jié)才有力量,大家共同的辛勤工作和智慧結(jié)晶,讓本書翻譯工作順利完成。
限于譯者水平所限,在理解和翻譯本書的過程中,一些知識的專遞未必到位,所使用的語言也未免生澀,我們力求做到“信、達、雅”,一些不好把握的字句也反復(fù)查閱過資料,希望能較為忠實地還原作者的意圖,讓廣大讀者能享受通暢的閱讀體驗。如有疏漏之處,希望讀者朋友閱讀時多多包涵,并不吝提出各種意見和建議。
人工智能和機器學習技術(shù)正在得到越來越多的人的關(guān)注,并正在發(fā)揮著越來越大的價值。身為其中的一員,我非常榮幸自己能夠生于這一歷史上最火熱的發(fā)展時代里,我創(chuàng)辦的達觀數(shù)據(jù),也正在運用本書里所介紹的各種技術(shù),來幫助中國的企
譯者序VII
業(yè)更好地挖掘數(shù)據(jù)背后的規(guī)律,自動完成很多原本需要大量人力才能實現(xiàn)的功能。創(chuàng)業(yè)維艱,本書的很多翻譯和校對工作是在出差途中和深夜完成的,感謝家人對我的理解和關(guān)懷。期望達觀數(shù)據(jù)的技術(shù)服務(wù)能讓很多企業(yè)提升運行效率、降低成本,從原先的粗放型增長轉(zhuǎn)變?yōu)榧夹g(shù)驅(qū)動型的精細化增長。
眼下全球技術(shù)競爭愈演愈烈,數(shù)據(jù)作為人工智能時代的原油,對其進行提煉和挖掘的技術(shù)至關(guān)重要。我希望包括本書在內(nèi)的一系列國外優(yōu)秀書籍被翻譯引入后,能夠幫助中國的技術(shù)人才、工程師、學生乃至企業(yè)管理者拓展視野、啟發(fā)思維,把握業(yè)界的技術(shù)發(fā)展脈搏,成為大數(shù)據(jù)時代浪尖的弄潮兒。
陳運文達觀數(shù)據(jù)創(chuàng)始人兼 CEO
序言
萬維網(wǎng)( World Wide Web)是互聯(lián)網(wǎng)信息社會里的最根本的基礎(chǔ)設(shè)施,數(shù)以億計的人們把它作為主要的交互聯(lián)系工具。互聯(lián)網(wǎng)上信息服務(wù)的發(fā)展也帶動了工業(yè)的進步。今天,隨著云計算和無線通信技術(shù)的成熟, Web不僅成為人們發(fā)布和獲取信息的平臺,而且成為為數(shù)億人隨時隨地提供信息服務(wù)開發(fā)、部署和應(yīng)用的平臺。大數(shù)據(jù)為構(gòu)建多樣性的服務(wù)提供了豐富的內(nèi)容,也為智能化的服務(wù)創(chuàng)造了價值,讓 Web上服務(wù)的用戶體驗逐步提升。智能服務(wù)的 Web正在改變?nèi)藗兊娜粘I睿核鼛椭覀儗ふ液线m的酒店、安排完美的假期旅行,讓我們購買到幾乎任何商品,以及建立起豐富多彩的社群,而這些智能來自對 Web內(nèi)容和用戶間交互所產(chǎn)生的數(shù)據(jù)的深度分析。因此建立 Web智能是當今數(shù)據(jù)科學發(fā)展領(lǐng)域里的核心技術(shù)。
非常榮幸能由我來為大家介紹這本精彩的《智能 Web算法(第 2版)》,本書由一位年輕但經(jīng)驗豐富的數(shù)據(jù)科學家 Douglas McIlwraith博士修訂,目的是為大家揭示智能 Web應(yīng)用的精髓:實現(xiàn)智能所依賴的各種算法。這是一個宏偉的目標,但是 Doug博士用樸實無華的語言,在不到 250頁的篇幅里成功將豐富的知識通俗易懂地呈現(xiàn)了出來。
本書涵蓋了豐富的應(yīng)用場景和常見的流行算法,并通過嚴謹?shù)臄?shù)學推導(dǎo)和簡潔的 Python代碼對這些算法進行了清晰的介紹。我非常順暢地通讀了本書,也希望能與你一起分享閱讀的樂趣。更為重要的是,我希望當你閱讀完本書后,發(fā)現(xiàn)自己可以用學會的很多知識和技能,打造出更智能的 Web!
Yike Guo教授 &總監(jiān)數(shù)據(jù)科學研究所倫敦帝國理工
前言
非常榮幸我們能投身于當今時代最令人激動的一個技術(shù)領(lǐng)域。在短短數(shù)十年間,稚嫩的互聯(lián)網(wǎng)就蓬勃發(fā)展成如今連接全世界的萬維網(wǎng),讓每個身在其中的人隨時隨地進行通信交流,讓大家擁有了瞬間就能得到幾乎任何問題答案的能力。
智能算法的研發(fā)充分運用了信息的價值,在塑造我們新的生活方式上扮演了重要角色。反過來我們也越來越依賴智能算法來引領(lǐng)我們線上和線下的生活,這也促使我們將更寬的視野和更多的數(shù)據(jù)用于算法的訓練和測試。若干年前神經(jīng)網(wǎng)絡(luò)算法還是被學術(shù)界所擯棄的方法,但是如今隨著大規(guī)模高可用的數(shù)據(jù)技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)技術(shù)再次大放異彩。
我們剛剛進入一個新紀元,在這里我們能與手機對話,讓它預(yù)測我們的需求、預(yù)訂我們的約會、建立我們的通信連接。在不久的將來,我們也許能看到無人駕駛汽車和虛擬現(xiàn)實技術(shù)的曾及,所有這些應(yīng)用都牢牢地扎根于計算機科學技術(shù)對真實世界問題的回應(yīng),智能算法是其中的重要部分,也是本書的核心。
不幸的是,進入機器學習和數(shù)據(jù)科學的世界看上去令人生畏,這里充滿了數(shù)學和統(tǒng)計學,你的直覺有時也會誤導(dǎo)你!通過修訂本書,我們希望介紹第一版面世以來該領(lǐng)域的最新發(fā)展,也為新入行的朋友們提供指引。在本書中我們提供了通俗易懂的實例、真實問題的解決方案,以及相應(yīng)的代碼片段。我們盡可能地越過繁復(fù)的
數(shù)學公式來重點闡述技術(shù)的核心思想,希望我們對此拿捏得足夠好。
在本書中你將看到,我們把內(nèi)容劃分為 8個章節(jié),每個章節(jié)涵蓋智能 Web的一個重要的算法領(lǐng)域。本書最后的附錄部分講解了智能 Web應(yīng)用中的數(shù)據(jù)處理流程,我們希望通過這部分內(nèi)容,來為實踐者展示在系統(tǒng)中將快速變化的數(shù)據(jù)有效地運轉(zhuǎn)起來是多么重要且困難。
致謝
感謝在本書撰寫過程中參與的各位伙伴:編輯 Marjan Bace以及出版發(fā)行團隊的所有成員,包括 Janet Vail, Kevin Sullivan, Tiffany Taylor, Dottie Marsico, Linda Recktenwald,以及幕后的很多工作人員。
也感謝參與本書各階段校對的人員: Nii A-Okine, Tobias Bürger, Marius Butuc, Carlton Gibson, John Guthrie, Pieter Gyselinck, PeterJohn Hampton, Dike Kalu, Seth Liddy, Radha Ranjan Madhav, Kostas Passadis, Peter Rabinovitch, Srdjan Santic, Dennis Sellinger, Dr. Joseph Wang, Michael Williams。感謝你們反復(fù)閱讀,認真進行校對,你們提供的寶貴意見在本書中得到了充分體現(xiàn)。
本書中引用的很多系統(tǒng)、函數(shù)庫、程序包并非作者原創(chuàng),而是來自本領(lǐng)域的眾多社區(qū)開發(fā)者、數(shù)據(jù)科學家、機器學習專家,在此對以上所有人表示感謝。
回想起最初討論修訂《智能 Web算法》時的情形,記得我當時心里想“嘿,這本書的第一版已經(jīng)寫得很好了,修訂的工作量不會很大吧?”但最后結(jié)果是,很大。該領(lǐng)域的變化很快,有太多有趣的工作我想拿來與人分享,因此我不得不仔細地選擇哪些該舍棄、哪些該刪減、哪些該修訂、哪些該增加。因此本書花費了比我預(yù)料更多的時間,但我很幸運獲得了很多優(yōu)秀的人們的支持、鼓勵和忍耐。
首先也是最重要的,我想感謝我的未婚妻, Elly。你的愛心、忍耐、鼓勵,是我生命中永恒的存在。如果沒有你,本書是難以完成的。我愛你。
其次,我想感謝我的父母和家人,在我遇到挫折時永遠呵護和支持我,希望你們能喜歡本書,你們的養(yǎng)育之恩我永遠銘記。
第三,感謝我的眾多朋友和同事,和杰出的你們在一起工作是一件非常幸運的事,你們讓我每一天都過得很開心,謝謝你們!
我還想感謝我的兩位編輯 Jeff Bleiel和 Jennifer Stout,你們的指導(dǎo)幫助本書最終完成。Jennifer,你的樂觀和熱情給了我堅持的動力,謝謝你!
Douglas McIlwraith
我想感謝我的父母 Eva和 Alexander,他們無微不至的關(guān)心,讓我在夜以繼日的寫作和研究中,始終保持著好奇心和熱情。這是我畢生難忘的恩情。
我衷心感謝我珍愛的妻子 Aurora和我的三個孩子: Nikos, Lukas和 Albert—你們是我人生的驕傲和樂趣。我永遠感激你們給予的愛心、耐心和理解。孩子們無盡的好奇心不斷地激發(fā)我學習的靈感。非常感謝我的岳父母 Cuchi和 Jose,我的姐妹 Maria和 Katerina,以及我最好的朋友 Michael和 Antonio,感謝你們持續(xù)的鼓勵和無條件的支持。
一定不能遺忘的是感謝 Amilcar Avenda.o博士和 Maria Balerdi博士給予的眾多幫助,讓我學會了很多心臟學的知識,并打下了我早期的學習基礎(chǔ)。感謝 Leon Cooper教授以及布朗大學的眾多杰出朋友,你們不僅揭示了很多大腦運行的規(guī)律,還鼓勵我開展智能應(yīng)用的工作。
鼓勵和支持我進行各種智能相關(guān)的積極工作的過去和現(xiàn)在的同事: Ajay Bhadari, Kavita Kantkar, Alexander Petrov, Kishore Kirdat,等等,雖然這里只能寫下寥寥數(shù)語,但是我對你們的感激之情溢于言表。
Haralambos Marmanis
首先也是最重要的,我想感謝我親愛的妻子 Elena。
我還想謝謝我過去和現(xiàn)在的同事: Konstandin Bobovich, Paul A. Dennis, Keith Lawless和 Kevin Bedell,你們伴隨了我的職業(yè)生涯,是我的靈感源泉。
Dmitry Babenko
收起全部↑
Douglas McIlwraith博士,在劍橋大學計算機科學系獲得了學士學位,而后在帝國理工大學獲得了博士學位。他是一位機器學習專家,目前他在位于倫敦的一家廣告網(wǎng)絡(luò)公司擔任數(shù)據(jù)科學家職位。他在分布式系統(tǒng)、普適計算、通用感知、機器人以及安全監(jiān)控方面都貢獻了研究成果,他為讓技術(shù)更好地服務(wù)人們的生活而無比激動。Haralambos Marmanis博士是將機器學習技術(shù)引入工業(yè)解決方案的先驅(qū),在專業(yè)軟件研發(fā)方面擁有 25年經(jīng)驗。
Dmitry Babenko,為銀行、保險、供應(yīng)鏈管理、商業(yè)智能企業(yè)等設(shè)計和開發(fā)了豐富的應(yīng)用和系統(tǒng)架構(gòu)。他擁有白俄羅斯國立信息和無線電大學計算機碩士學位。
陳運文,計算機博士,達觀數(shù)據(jù) CEO,ACM和 IEEE會員,中國計算機學會高級會員;在大數(shù)據(jù)架構(gòu)設(shè)計、搜索和推薦引擎、文本數(shù)據(jù)挖掘等領(lǐng)域有豐富的研發(fā)經(jīng)驗;曾經(jīng)擔任盛大文學首席數(shù)據(jù)官、騰訊文學數(shù)據(jù)中心高級總監(jiān)、百度核心算法工程師等工作,申請有 30余項國家發(fā)明專利,多次參加國際 ACM數(shù)據(jù)算法競賽并獲得冠亞軍榮譽。
第1章 為智能Web建立應(yīng)用1
1.1 智能算法的實踐運用:Google Now 3
1.2 智能算法的生命周期5
1.3 智能算法的更多示例6
1.4 不屬于智能應(yīng)用的內(nèi)容 7
1.4.1 智能算法并不是萬能的思考機器 7
1.4.2 智能算法并不能成為完全代替人類的工具8
1.4.3 智能算法的發(fā)展并非一蹴而就 8
1.5 智能算法的類別體系9
1.5.1 人工智能 9
1.5.2 機器學習10
1.5.3 預(yù)測分析 11
1.6 評估智能算法的效果 13
1.6.1 評估智能化的程度 13
1.6.2 評估預(yù)測14
1.7 智能算法的重點歸納 16
1.7.1 你的數(shù)據(jù)未必可靠 16
1.7.2 計算難以瞬間完成 17
1.7.3 數(shù)據(jù)規(guī)模非常重要 17
1.7.4 不同的算法具有不同的擴展能力 18
1.7.5 并不存在萬能的方法 18
1.7.6 數(shù)據(jù)并不是萬能的 18
1.7.7 模型訓練時間差異很大18
1.7.8 泛化能力是目標19
1.7.9 人類的直覺未必準確 19
1.7.10 要考慮融入更多新特征 19
1.7.11 要學習各種不同的模型 19
1.7.12 相關(guān)關(guān)系不等同于因果關(guān)系 20
1.8 本章小結(jié)20
第2章 從數(shù)據(jù)中提取結(jié)構(gòu):聚類和數(shù)據(jù)變換21
2.1 數(shù)據(jù)、結(jié)構(gòu)、偏見和噪聲 23
2.2 維度詛咒26
2.3 k-means算法27
2.3.1 實踐運用 k-means31
2.4 高斯混合模型 34
2.4.1 什么是高斯分布34
2.4.2 期望最大與高斯分布 37
2.4.3 高斯混合模型 37
2.4.4 高斯混合模型的學習實例 38
2.5 k-means和GMM的關(guān)系41
2.6 數(shù)據(jù)坐標軸的變換 42
2.6.1 特征向量和特征值 43
2.6.2 主成分分析 43
2.6.3 主成分分析的示例 45
2.7 本章小結(jié)47
第3章 推薦系統(tǒng)的相關(guān)內(nèi)容48
3.1 場景設(shè)置:在線電影商店 49
3.2 距離和相似度 50
3.2.1 距離和相似度的剖析 54
3.2.2 最好的相似度公式是什么 56
3.3 推薦引擎是如何工作的57
3.4 基于用戶的協(xié)同過濾 59
3.5 奇異值分解用于基于模型的推薦 64
3.5.1 奇異值分解 64
3.5.2 使用奇異值分解進行推薦:為用戶挑選電影66
3.5.3 使用奇異值分解進行推薦:幫電影找到用戶71
3.6 Net.ix競賽74
3.7 評估推薦系統(tǒng) 76
3.8 本章小結(jié)78
第4章 分類:將物品歸類到所屬的地方79
4.1 對分類的需求 80
4.2 分類算法概覽 83
4.2.1 結(jié)構(gòu)性分類算法84
4.2.2 統(tǒng)計性分類算法86
4.2.3 分類器的生命周期 87
4.3 基于邏輯回歸的欺詐檢測 88
4.3.1 線性回歸簡介 89
4.3.2 從線性回歸到邏輯回歸91
4.3.3 欺詐檢測的應(yīng)用94
4.4 你的結(jié)果可信嗎 102
4.5 大型數(shù)據(jù)集的分類技術(shù) 106
4.6 本章小結(jié) 108
第5章 在線廣告點擊預(yù)測.109
5.1 歷史與背景 110
5.2 廣告交易平臺 112
5.2.1 cookie 匹配 113
5.2.2 競價(bid) 113
5.2.3 競價成功(或失敗)的通知 114
5.2.4 廣告展示位 114
5.2.5 廣告監(jiān)測 115
5.3 什么是bidder 115
5.3.1 bidder的需求 116
5.4 何為決策引擎 117
5.4.1 用戶信息 117
5.4.2 廣告展示位信息 117
5.4.3 上下文信息 117
5.4.4 數(shù)據(jù)準備 118
5.4.5 決策引擎模型 118
5.4.6 將點擊率預(yù)測值映射為競價價格 118
5.4.7 特征工程 119
5.4.8 模型訓練 119
5.5 使用Vowpal Wabbit進行點擊預(yù)測 120
5.5.1 Vowpal Wabbit的數(shù)據(jù)格式 120
5.5.2 準備數(shù)據(jù)集123
5.5.3 測試模型 128
5.5.4 模型修正 131
5.6 構(gòu)建決策引擎的復(fù)雜問題132
5.7 實時預(yù)測系統(tǒng)的前景 133
5.8 本章小結(jié) 134
第6章 深度學習和神經(jīng)網(wǎng)絡(luò).135
6.1 深度學習的直觀方法 136
6.2 神經(jīng)網(wǎng)絡(luò) 137
6.3 感知機 139
6.3.1 模型訓練 141
6.3.2 用 scikit-learn訓練感知機142
6.3.3 兩個輸入值的感知機的幾何解釋144
6.4 多層感知機146
6.4.1 用反向傳播訓練 150
6.4.2 激活函數(shù) 150
6.4.3 反向傳播背后的直觀理解152
6.4.4 反向傳播理論 153
6.4.5 scikit-learn中的多層神經(jīng)網(wǎng)絡(luò) 155
6.4.6 訓練出來的多層感知機 158
6.5 更深層:從多層神經(jīng)網(wǎng)絡(luò)到深度學習 159
6.5.1 受限玻耳茲曼機 160
6.5.2 伯努利受限玻耳茲曼機 160
6.5.3 受限玻耳茲曼機實戰(zhàn) 164
6.6 本章小結(jié) 167
第7章 做出正確的選擇168
7.1 A/B測試 170
7.1.1 相關(guān)的理論170
7.1.2 評估代碼 173
7.1.3 A/B測試的適用性174
7.2 多臂賭博機175
7.2.1 多臂賭博機策略 176
7.3 實踐中的貝葉斯賭博機策略 180
7.4 A/B測試與貝葉斯賭博機的對比 191
7.5 擴展到多臂賭博機192
7.5.1 上下文賭博機 193
7.5.2 對抗賭博機193
7.6 本章小結(jié) 194
第8章 智能Web的未來196
8.1 智能Web的未來應(yīng)用197
8.1.1 物聯(lián)網(wǎng) 197
8.1.2 家庭健康護理 198
8.1.3 自動駕駛汽車 198
8.1.4 個性化的線下廣告199
8.1.5 語義網(wǎng) 199
8.2 智能Web的社會影響200
附錄A 抓取網(wǎng)絡(luò)上的數(shù)據(jù).201