機(jī)器學(xué)習(xí)的研究不僅是人工智能領(lǐng)域的核心問題,而且已成為近年來計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域中最活躍的研究分支之一。
本書主要圍繞基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和進(jìn)化學(xué)習(xí)三個(gè)方面闡述機(jī)器學(xué)習(xí)理論、方法及其應(yīng)用,共三部分13章。第一部分是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)及其在復(fù)雜非線性系統(tǒng)中的控制,包括基于時(shí)間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)控制,基于徑向基函數(shù)網(wǎng)絡(luò)的機(jī)械手迭代學(xué)習(xí)控制,自適應(yīng)T_S型模糊徑向基函數(shù)網(wǎng)絡(luò)等。第二部分是強(qiáng)化學(xué)習(xí)的大規(guī)模或連續(xù)空間表示問題,包括基于強(qiáng)化學(xué)習(xí)的白適應(yīng)PID控制,基于動(dòng)態(tài)回歸網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)控制,基于自適應(yīng)模糊徑向基函數(shù)網(wǎng)絡(luò)、支持向量機(jī)和高斯過程的連續(xù)空間強(qiáng)化學(xué)習(xí),基于圖上測(cè)地高斯基函數(shù)的策略迭代強(qiáng)化學(xué)習(xí)等。第三部分則是對(duì)分布估計(jì)優(yōu)化算法進(jìn)行研究,包括多目標(biāo)優(yōu)化問題的差分進(jìn)化一分布估計(jì)算法,基于細(xì)菌覓食行為的分布估計(jì)算法在預(yù)測(cè)控制中的應(yīng)用,一種多樣性保持的分布估計(jì)算法及其在支持向量機(jī)參數(shù)選擇問題中的應(yīng)用等。為便于應(yīng)用本書闡述的算法,書后附有部分機(jī)器學(xué)習(xí)算法MATLAB源程序。
本書可供理工科高等院校計(jì)算機(jī)科學(xué)、信息科學(xué)、人工智能和自動(dòng)化技術(shù)及相關(guān)專業(yè)的教師及研究生閱讀,也可供自然科學(xué)和工程技術(shù)領(lǐng)域中的研究人員參考。
本書全面、系統(tǒng)地介紹了機(jī)器學(xué)習(xí)的基本概念、發(fā)展歷史、分類及部分機(jī)器學(xué)習(xí)的主要策略等,并重點(diǎn)圍繞當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的熱點(diǎn)問題展開討論,包括:神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)及其在復(fù)雜非線性系統(tǒng)控制中的應(yīng)用、大規(guī)模或連續(xù)空間下的強(qiáng)化學(xué)習(xí)以及分布估計(jì)優(yōu)化算法等。此外,為理論聯(lián)系實(shí)際和便于讀者理解算法思想,書中還介紹了機(jī)器學(xué)習(xí)方法的若干典型應(yīng)用,如機(jī)械手軌跡跟蹤控制、小車爬山最短時(shí)間控制、倒立擺平衡控制、小船過河控制、機(jī)器人迷宮行走以及復(fù)雜數(shù)值函數(shù)優(yōu)化問題等。
《智能科學(xué)技術(shù)著作叢書》序
序
前言
第1章 機(jī)器學(xué)習(xí)概述
1.1 機(jī)器學(xué)習(xí)的概念
1.2 機(jī)器學(xué)習(xí)的發(fā)展歷史
1.3 機(jī)器學(xué)習(xí)的分類
1.3.1 基于學(xué)習(xí)策略的分類
1.3.2 基于學(xué)習(xí)方法的分類
1.3.3 基于學(xué)習(xí)方式的分類
1.3.4 基于數(shù)據(jù)形式的分類
1.3.5 基于學(xué)習(xí)目標(biāo)的分類
1.4 機(jī)器學(xué)習(xí)的主要策略
1.4.1 基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
1.4.2 進(jìn)化學(xué)習(xí)
第2章 基于時(shí)間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)控制
預(yù)測(cè)控制是20世紀(jì)70年代中后期在歐美工業(yè)領(lǐng)域內(nèi)出現(xiàn)的,它是在新型計(jì)算機(jī)控制算法基礎(chǔ)上發(fā)展起來的,是一種基于模型的先進(jìn)控制技術(shù),亦稱為模型預(yù)測(cè)控制(model predictive control,MPC)。預(yù)測(cè)控制技術(shù)的產(chǎn)生有著深刻的實(shí)際背景,這主要是由于被控對(duì)象日益復(fù)雜,一般的控制理論對(duì)信息描述的要求和優(yōu)化模式都難以滿足復(fù)雜工業(yè)過程的要求,而預(yù)測(cè)控制對(duì)模型的要求低,能兼顧被控對(duì)象的非線性、時(shí)變性因素及干擾的影響,不但跟蹤性能好,而且對(duì)模型失配有較強(qiáng)的魯棒性。因此,預(yù)測(cè)控制作為一種面向復(fù)雜系統(tǒng)的控制策略,一開始就受到國內(nèi)外控制界眾多學(xué)者的重視,并在理論研究和實(shí)際應(yīng)用方面取得了不少成果。在過去的幾十年里,非線性預(yù)測(cè)控制已經(jīng)被成功地應(yīng)用于石油、化工以及電力等工業(yè)過程控制中,這些過程具有較強(qiáng)的非線性,用一般線性控制模型和方法難以得到良好的控制品質(zhì)。
預(yù)測(cè)控制的基本思想是充分利用過去時(shí)刻的輸入、輸出信息建立預(yù)測(cè)模型,然后利用預(yù)測(cè)模型對(duì)系統(tǒng)未來的輸出做出預(yù)測(cè),從而通過長時(shí)域的優(yōu)化獲得最優(yōu)的控制量,實(shí)現(xiàn)對(duì)被控對(duì)象的有效控制。它的主要特點(diǎn)是:預(yù)測(cè)模型的多樣性,滾動(dòng)優(yōu)化的時(shí)序性,在線校正的適應(yīng)性以及工業(yè)過程的實(shí)用性。目前,預(yù)測(cè)控制對(duì)于控制變化比較緩慢的生產(chǎn)過程或?qū)ο螅话憔苋〉煤芎玫男Ч牵瑢?duì)于機(jī)電類快變過程的快速跟蹤控制問題,如機(jī)器人、火炮或雷達(dá)的目標(biāo)跟蹤和冶金軋制過程等,由于控制算法過于復(fù)雜,運(yùn)算量大,往往難以在線實(shí)時(shí)控制。因此,有必要尋找一種算法簡(jiǎn)單、控制迅速有效的預(yù)測(cè)控制方法。
……