一致性問題是多智能體網絡協調控制的根本問題,也是分布式計算理論的基礎。《分布式多智能體網絡一致性協調控制理論》系統介紹作者近年來在分布式多智能網絡一致性協調控制領域的研究成果,其集中體現該領域**的研究理論與研究進展。具體內容包括一階、二階線性多智能體網絡在時滯影響下的一致性以及分組一致性問題、二階非線性多智能網絡的局部以及全局一致性問題、基于預測機制的離散、連續時間多智能體網絡的加速收斂等。
《分布式多智能體網絡一致性協調控制理論》適合高等院校計算機、自動化、人工智能及應用數學等專業的教師和研究生閱讀,也可作為相關學科領域研究人員及工程技術人員的參考書。
目錄
前言
第1章多智能體網絡一致性問題概述1
1.1引言1
1.2多智能體網絡2
1.3多智能體網絡的一致性問題及其應用3
1.3.1多智能體網絡的一致性問題3
1.3.2一致性問題的主要應用3
1.4一致性問題研究現狀4
1.5本章小結9
參考文獻9
第2章時滯多智能體網絡的一致性15
2.1引言15
2.2預備知識17
2.3問題描述與收斂性分析17
2.3.1具有不同時滯的一階連續多智能體網絡的一致性17
2.3.2具有不同時滯的一階離散多智能體網絡的一致性22
2.3.3具有不同時滯的二階連續多智能體網絡的一致性24
2.4例子與數值仿真26
2.5本章小結31
參考文獻32
第3章線性耦合多智能體網絡的分組一致性35
3.1引言35
3.2預備知識37
3.3問題描述與收斂性分析38
3.3.1一階線性耦合多智能體網絡的分組一致性38
3.3.2二階線性耦合多智能體網絡的分組一致性42
3.4例子與數值仿真44
3.5本章小結49
參考文獻49
第4章時滯多智能體網絡的分組一致性52
4.1引言52
4.2預備知識53
4.3問題描述與收斂性分析54
4.3.1拓撲結構為連通二分圖的一階時滯系統的分組一致性54
4.3.2拓撲結構為無向連通圖的一階時滯系統的分組一致性56
4.4例子與數值仿真57
4.5本章小結60
參考文獻61
5.1引言63
5.2預備知識64
5.3問題描述與收斂性分析65
5.3.1基于M矩陣的一階連續多智能體網絡的牽制一致性65
5.3.2一階離散多智能體網絡的牽制一致性67
5.3.3牽制策略69
5.4例子與數值仿真70
5.5本章小結75
參考文獻75
第6章多智能體網絡的牽制分組一致性77
6.1引言77
6.2預備知識78
6.3問題描述與收斂性分析79
6.4例子與數值仿真83
6.5本章小結87
參考文獻87
第7章基于廣義線性交互協議的二階非線性多智能體網絡的一致性89
7.1引言89
7.2預備知識90
7.3問題描述與收斂性分析91
7.4例子與數值仿真98
7.5本章小結104
參考文獻104
第8章有領航者的二階非線性多智能體網絡的魯棒一致性106
8.1引言106
8.2預備知識108
8.3問題描述與收斂性分析109
8.4例子與數值仿真115
8.5本章小結119
參考文獻119
第9章二階非線性多智能體隨機動態網絡的局部一致性122
9.1引言122
9.2預備知識124
9.3問題描述與收斂性分析126
9.3.1非時滯耦合情形131
9.3.2時滯耦合情形134
9.4例子與數值仿真139
9.5本章小結142
參考文獻143
第10章二階非線性多智能體隨機動態網絡的全局一致性145
10.1引言145
10.2預備知識145
10.3問題描述與收斂性分析147
10.4例子與數值仿真156
10.5本章小結160
參考文獻161
第11章任意快速切換的二階非線性多智能體網絡的局部一致性162
11.1引言162
11.2預備知識162
11.3問題描述與收斂性分析163
11.4例子與數值仿真170
11.5本章小結173
參考文獻173
第12章時滯與非時滯二階非線性多智能體網絡的全局一致性175
12.1引言175
12.2預備知識175
12.3問題描述與收斂性分析176
12.4例子與數值仿真184
12.5本章小結187
參考文獻188
第13章基于Gossip算法的分布式多智能體網絡的平均一致性189
13.1引言189
13.2預備知識190
13.3問題描述與收斂性分析191
13.3.1基于廣播的隨機多Gossip對算法192
13.3.2基于廣播的多Gossip對算法的收斂分析195
13.3.3基于廣播的多Gossip對算法的性能分析202
13.4例子與數值仿真205
13.5本章小結207
參考文獻208
第14章基于預測機制的離散時間多智能體網絡的加速收斂211
14.1引言211
14.2預備知識212
14.3問題描述與收斂性分析213
14.3.1有向網絡的收斂性分析213
14.3.2無向網絡的收斂性分析216
14.3.3加速預測機制簡介216
14.3.4基于加速預測機制的一致性分析219
14.4例子與數值仿真223
14.5本章小結225
參考文獻225
第15章基于預測機制的連續時間多智能體網絡的加速收斂228
15.1引言228
15.2預備知識229
15.3問題描述與收斂性分析232
15.3.1預測協議對于通信時滯的魯棒性分析236
15.3.2預測協議的收斂速率性能分析238
15.3.3基于預測機制的一致性協議的性能分析242
15.4例子與數值仿真243
15.5本章小結247
參考文獻247
第1章 多智能體網絡一致性問題概述
1.1引言
自然界中廣泛存在著許多有趣的生物群集現象,如蟻群的聚集、鳥類的蜂擁、螢火蟲閃光的同步以及魚類的群游等,在諸如此類的群集運動中,各個生物體究竟是如何相互協調、分工與合作的吸引著眾多的學者。為了從本質上揭示群集現象的內在規律,眾多領域的研究者從生物學、數學、人工智能以及計算機科學等多個角度對此展開了全面的理論研究,并希望將這種生物群體的內在協作機制引入自己的研究領域中[1,2]。其中,生物學家希望能夠揭示出生物群體中個體通過內部協調來合作實現群體行為的內在規律[3,4]。物理學家則希望能夠系統地使用各種數學模型來模擬仿真并認識、解釋生物的這些行為[5,6]。而系統控制領域的研究者則希望借助生物群體行為的自然規律來設計并實現真實的智能體系統以便完成復雜的預定功能[7]。
受群集現象的啟發,研究者提出了多智能體系統(multi|agent systems)的概念。一般來說,多智能體系統是由大量分布配置的自治或半自治的子系統(智能體)通過網絡互聯所構成的復雜的大規模系統,它是“系統的系統”(system of systems)[8]。近年來,智能體在許多領域中都得到了不同程度的發展,且不同領域的研究者對智能體的含義也賦予了不同的理解,因此,迄今為止對智能體還沒有一個比較合適的普遍定義。在通常情況下,智能體是一個物理或者抽象的實體,它可以通過感應器來感知周圍的環境并通過效應器作用于自身,且還能與其他智能體進行通信。從計算機的角度,多智能體系統是“試圖在復雜的動態環境下實現一組目標的計算機系統”。它能夠通過傳感器感知環境,并通過執行器對環境進行相應的作用。由于基于多智能體系統的方法具有自治性、適應性、穩健性且容易被實現,其對于那些結構性能不好和定義不明確的任務具有很大的優勢[9]。因此,多智能體系統已發展成為一門新興的復雜系統科學,并已成為研究復雜性科學與復雜系統的有力工具。同時,群體通過局部協作而獲得群體優勢的特點也刺激了多智能體系統在眾多領域的廣泛應用。在針對多智能體系統各方面的眾多研究中,由于多智能體系統的協調控制是一個前沿與基礎性的工作,它正滲透到自然科學、社會科學等眾多領域,并已成為當前學術界一個重要的研究熱點和富有挑戰性的研究課題。
1.2多智能體網絡
近年來,各領域的學者一直致力于用網絡的觀點來研究各種復雜系統的問題。網絡是一個包含大量相互作用個體的復雜系統。通常,人們習慣于把這些個體稱為網絡的節點,把個體彼此間的相互作用看做網絡中節點與節點之間的連接關系。因此,由大量的智能體以及智能體間的連接所構成的多智能體復雜系統,可稱為多智能體網絡[2]。
智能體以及智能體間的連接關系是多智能體網絡中*基本、*重要的兩個元素。節點代表網絡系統中的智能體,邊則代表智能體間的相互作用關系。在現實生活中,復雜多智能體網絡隨處可見,如互聯網、交通網、智能電網、社交網絡、生態網絡、經濟網絡、移動機器人網絡、無線傳感器網絡等都是比較典型的多智能體網絡。隨著所研究網絡對象的不同,網絡中節點以及邊所代表的含義也隨之不同。例如,在互聯網中,節點可以表示路由器或者子網絡,而邊則可以表示各節點之間的無線或者有線的連接關系;在萬維網中,節點與邊可分別表示網頁以及網頁相互之間的超級鏈接;在多個移動智能體所組成的復雜網絡系統中,節點表示單個的智能體,而邊可以表示各智能體之間的通信、感應關系等;在社交網絡中,節點可以代表個人、組織甚至國家,邊則代表它們之間的社會關系[2]。在復雜多智能體網絡中,每一個智能體均表示一個動力學系統,若它們的動力學行為是一致的,則稱該網絡為同質網絡,否則,稱為異質網絡[10]。網絡中的智能體只能與其鄰居智能體之間進行局部、有限的通信與信息交互,交換的信息可以是位置、速度或者單個智能體自身檢測到的其他信息等[11]。
研究多智能體網絡,就是研究其群集或聚集的內在演化規律。在多智能體網絡系統中,由于信息與資源是局部的、分散的,每個智能體不具備獲取全部信息以及完成整個任務的能力,同時,系統中也不存在全局的控制策略,因此所有的智能體彼此之間需通過協商或者競爭的方式來協調各自的目標與行為,從而達到共同完成一項復雜任務的目的。這也是多智能體網絡系統分布式協調控制的基本特點。協調控制是通過設計分布式控制協議,使得自治的多智能體之間在僅利用有限的局部通信與信息交換的前提下來實現一個共同的全局目標。不同于傳統的集中式控制,分布式協調控制具有許多優點,例如,不要求每個智能體都訪問其他所有智能體的信息,這樣大大減少了通信量,因而能有效節省能源;同時分布式協調控制還具有魯棒性、靈活性和可標度性等優點。智能體的分布式協調控制是多智能體網絡研究的基礎,是發揮多智能體系統優勢的關鍵所在,也是整個系統智能性的集中體現。因此,多智能體網絡的協調控制已成為復雜網絡控制理論方面的一個重要研究領域,同時在軍事、商業、交通等領域都有著廣泛的應用前景。
1.3多智能體網絡的一致性問題及其應用
1.3.1多智能體網絡的一致性問題
多智能體網絡的一致性問題(consensus problem)是復雜動力學系統中非常有意義的理論問題。所謂一致性是指在一個多智能體系統中,隨著時間的推移,系統中所有智能體的狀態*終能夠趨于一個相同的值。多智能體系統達到一致是實現對其協調控制的首要條件。一致性協議(算法)是指復雜系統中智能體之間相互作用的規則,它描述了各智能體與其鄰居節點間信息交互的過程。
根據系統中各智能體的初始狀態以及*終收斂一致狀態值的不同,多智能體系統的一致性通常可分為漸近一致、平均一致、**一致、*小一致以及分組一致等。近年來,隨著對多智能體系統協調控制問題研究的不斷深入以及多智能網絡系統的廣泛應用,一致性問題的研究已成為當前的一個研究熱點與前沿問題,并在理論研究與實際應用等方面都取得了豐碩的研究成果。
1.3.2一致性問題的主要應用
一致性問題作為協調控制的基礎,已廣泛應用于編隊控制、蜂擁控制、聚集問題、同步以及協調決策等問題的研究中[8]。接下來,分別對多智能體系統一致性問題的主要應用作簡要介紹。
(1)耦合振子的同步。耦合振子同步問題的早期開創性工作源于Winfree,他假設每個振子與周圍的振子之間存在強力作用,那么振子的振幅變化可以忽略,從而將同步問題簡化為相位變化問題[12]。在此基礎上,Kuramoto指出一個具有有限個恒等振子的耦合系統,無論振子內部耦合強度多么微弱,它的動力學特性都可以用一個簡單的相位方程來表示[13]。 此后,耦合系統的同步問題便吸引了來自物理、生物、神經科學和數學等眾多領域科學家的關注[14,15]。
(2)蜂擁控制。群體蜂擁行為,即一群運動自主的個體能夠形成并保持以團隊的形式向某一目標邁進,它能幫助生物躲避天敵,增加尋覓到食物的概率等。這類現象所提取的抽象系統一般都由大量數目的個體組成,但是個體本身卻很簡單,它們沒有中央控制器,只具備檢測局部信息的能力,信息的交換和分享也只是在部分個體間進行,正是基于這些簡單的局部信息的作用規則卻能產生一些期望的宏觀行為。十幾年來,生物學、物理學、計算機和控制等領域的學者對自然界的蜂擁行為產生了濃厚的興趣[16|22],他們正努力地從相應領域的角度探索蜂擁行為的涌現機制。在蜂擁控制中,一致性協議主要用于實現智能體之間的速度匹配并有效避免碰撞。
(3)分布式編隊控制。編隊控制要求系統中所有個體共同保持一個預先設定的幾何隊形,且每一個個體都知曉*終編隊的隊形信息,但是個體間需要相互通信并協調各自的位置信息以實現預期的編隊控制。在編隊控制中,個體間可以依據一致性協議來獲取預期隊形的中心位置信息。所以,編隊控制是一種特殊的一致性問題,其在無人機飛行、地面無人小車的駕駛、自組織水下艦隊以及衛星群編隊等方面有著廣泛、深入的應用。
(4)聚集問題。聚集是一類特殊的一致性問題。其主要研究多智能體系統中所有的個體在一致性協議的控制下,實現在同一時間和地點的聚集。它屬于無約束一致性問題。
(5)同步。在日常生活中,同步的現象隨處可見。例如,蟋蟀的同時發聲、螢火蟲的同時閃光以及掌聲從凌亂到相同節奏的演化等。同步問題是動態的一致性問題,其可以看做一致性問題的非線性擴展。
(6)其他應用。一致性問題除了上述典型應用外,在其他方面也有著廣泛的應用。例如,在協調決策中,相比于集中決策的方式,分布式決策由于不需要每個決策者了解其他所有決策者的信息而更具優勢。近年來,隨著傳感器網絡的興起,分布式估計與跟蹤等傳感器間的信息融合問題都可以看做多智能體一致性問題的應用。此外,一致性問題在異步分布式算法、**合作控制以及貝葉斯網絡中都有著廣泛、深入的應用。
1.4一致性問題研究現狀
一致性問題是多智能體網絡協調控制的根本性問題,它是分布式計算理論的基礎。早在20世紀30年代末,德國行為生理學家Holst就開始用實驗的方法研究生物的個體行為和群集行為。奧地利著名學者、諾貝爾獎獲得者Lorenz在其著作On Aggression中記述了Holst的一個實驗:為了不受其他鰱魚運動的影響,將一條切除了前腦的普通鰷魚放入魚群中進行觀察。結果發現整個魚群都會跟隨這個沒有前腦的魚游走。Holst問題是一個典型的領航者(leadering)跟隨群集問題。那就是存在著一條行為不受魚群中其他個體影響的頭魚,普通鰷魚與相鄰個體運動狀態保持一致的行為使得整個魚群*終趨于與頭魚同步的運動狀態[23]。一致性問題的開創性研究工作起始于20世紀70年代中期,DeGroot在管理科學與統計學領域首次提出了一致性的問題[24],開創了一致性問題研究的先河,也促使一致性問題成為學術界的熱門話題而被廣泛研究。隨后,Borkar等對漸近同步一致性問題開展了比較系統的研究[25]。1987年,生態學家Reynolds按照自然界中鳥群、魚群等群體行為進行了計算機仿真,并提出了著名的Boid模型[26]。該模型要求一群多智能體的行為滿足如下三個基本規則。①避免碰撞原則(collision avoidance):所有個體與鄰近個體保持適當間距,以免碰撞。②中心匯聚原則(flocking center):所有個體試圖靠近鄰近個體。③速度匹配原則(velocity matching):所有個體試圖與鄰近個體的速度保持一致。這些規則描述了每個個體與系統中其他鄰近個體交互作用的動態行為。1992年,Benediktsson等首次將統計學中一致性的概念推廣、應用到傳感器網絡的信息融合中[27]。在Boid模型的基礎上,Vicsek等在1995年從統計力學的角度提出了一個經典的離散時間模型來模擬粒子涌現出一致性行為的現象。研究發現,當粒子的密度較大且系統的噪聲較小時,初始運動方向不同的粒子在經過局部信息交互后*終能實現運動方向的一致[28]。這種現象引起了數學、控制科學以及計算機科學等眾多領域研究者的興趣,他們試圖對這一現象給出嚴格的理論解釋。2003年,Jadbabaie等[29]運用代數圖論的知識,針對無噪聲干擾的Vicsek簡化模型,首次給出了一致性問題的嚴格理論分析,證明了當系統的拓撲結構為無向連通圖時,所有智能體的運動方向將*終趨于一致。與此同時,Jadbabaie等還考慮了具有領航者的多智能體系統的一致性問題,并分別針對連續時間、離散時間的模型分析給出了系統相應的收斂結果。在此基礎上,Moreau[30]針對有向網絡討論了多智能體系統的一致性問題,基于圖論、系統理論以及凸理論等相關知識給出了相應的收斂性分析。其研究結果表明,即使相對簡單的模型,當智能體間存在更多的通信時,不一定能取得更快的系統收斂速度,相反還有可能影響系統的收斂性。在Fax等的工作基礎上[31],Olfati|Saber等[32]系統地提出了多智能體網絡一致性問題的理論框架,具體如式(1.1)和式(1.2)所示:
x i(t)=∑j∈Nia