多自主體系統是當前系統控制界研究的熱點問題 . 在實際中, 自主體系統通常并不是在理想的環境下執行任務, 而是面臨多源頭、多層次和多變化的各類不確定性因素的影響 . 它們通過在微觀層面上影響各自主體決策的正確性 , 從而在宏觀層面上對多自主體系統的整體行為產生顯著影響 . 不確定性因素和多自主體系統的分布式信息架構交互耦合 , 給系統的設計與分析帶來本質性困難. 《多自主體系統的分布式估計與控制》圍繞分布式估計與分布式控制問題 , 研究在隨機通信噪聲、數據丟失、量化效應和系統未知結構參數等不確定因素影響下 , 如何為各自主體設計更加魯棒、更加有效的分布式估計算法及分布式控制律 , 以實現全局估計與控制目標.
第1章緒論
多自主體系統是目前系統控制界的熱點研究,在生物系統、經濟系統、社會系統中有大量應用實例和許多亟待解決的問題.本章首先介紹多自主體系統的研究背景,對多自主體系統及其研究特點進行總結;然后針對與本書研究密切相關分布式估計、分布式控制和分布式自適應控制領域中的熱點問題,對多自主體系統的分析與綜合等方面的研究現狀進行概括;*后,簡要介紹本書的研究工作和主要成果.
1.1研究背景及意義
近年來,由于計算機、通信、微電子等技術的飛速發展以及多學科交叉研究的不斷深入,多自主體系統吸引了來自生物學、物理學、經濟學、計算機科學和系統控制科學等領域的眾多學者,掀起了理論研究與實際應用的熱潮.例如,在生物學領域,鳥群、魚群、蟻群、企鵝等生物通過自發的個體行為集聚成宏觀有序的集體行為,表現出單一個體所不具備的群體智能,保證了個體在覓食、交配、逃避天敵等活動中獲得單獨行動時無法取得的收益,從而實現群體利益**化[1.5].在社會經濟學領域,專家學者采用多自主體系統建模方式對群體自組織現象進行解釋,如人群的恐慌性逃跑、交通擁堵、股票市場漲跌、選民投票等[6.8].在控制科學與工程領域,由于多自主體系統能夠通過通信與協作完成單個體系統無法完成的任務而被廣泛應用,如多機器人災場營救、衛星簇編隊、傳感器信息融合等[9.11].在計算機科學與工程領域,分布式計算在提高網絡服務質量、網絡資源利用率等方面發揮了巨大作用[12,13].
什么是多自主體系統?事實上,多自主體系統至今未有統一的、嚴格的定義[14].一般來講,多自主體系統是由一個個相互間或與環境進行交互作用的自主體構成,而每個自主體是具有感知能力并可以作出反應的實體.它可以是人、機器人、小衛星、計算機程序,抑或是生命組織.從不同領域學者的研究可以看出,多自主體系統一般具有如下特點[15,16]:①自主性,即每個自主體具有一定的自主決策能力,能夠通過自身有限的感知、計算和通信能力實現自身目的;②自理性,即每個自主體具有各自行動目標和利益準則,并基于利益**化的準則進行行動;③分布性,與集中性相對,是指系統中不存在統一的中央控制器收集各自主體信息,每個自主體僅能利用自身及鄰居自主體的局部通信信息來調整自己的行為.
多自主體系統為何受青睞?除了其重要的應用前景之外,更重要的在于該課題的研究為人們提供了一個認識各種信息處理和控制系統的全新視角[17].在傳統的控制理論中,系統由單一的傳感、控制單元以及被動接受控制信號控制的被控對象組成,而在多自主體系統理論中,系統由處于不同層次的自主體構成.在同一個層次中,不同自主體間的地位是平等的,一個自主體是作為控制器還是作為被控對象依看待問題的角度而定.自主體甲對自主體乙的信息傳輸,在甲看來是對乙的某種控制信號,而在乙看來則是甲的某種信息反饋.任何一個自主體在控制其他自主體的同時,實際上也接受了其他自主體的控制,前向的控制過程和后向的反饋過程都只是不同自主體間通信過程的一個有機組成部分,這里,控制系統和通信系統完全融合為一體,不同自主體間的控制和協作過程就是彼此的通信過程.
綜合來看,多自主體系統建模具有如下優點[18]:①一些領域建模的需求.多自主體系統是對由“行為”實體構成的系統的*自然描述,特別是行為個體具有不同(可能沖突)的行為目標和專有信息的情形②并行性.多自主體系統可以將一個任務分解,并行進行多個較容易完成的任務,從而可以提高任務完成的速度③魯棒性.多自主體系統通過將控制任務充分地分配給多個個體,提高了系統對差錯的容忍度,使得個別自主體的差錯不會令整個系統崩潰④可擴展性.多自主體系統模塊化的建模方式使新個體可以靈活進出,從而擴展了系統處理任務的能力.在某些具體領域的研究中,多自主體系統也發揮著極其重要的作用.社會科學和生命科學領域認為智能不可避免地與交互作用聯系在一起,而多自主體系統對闡明這一基本問題有重要意義[19].多機器人系統利用地理分布性從多位置同時進行觀測和行動,相對單機器人具有更好的性能/成本比[20].
1.2研究現狀
通過研究分析社會經濟學、系統控制、生物學等領域眾多案例,我們可以歸納出多自主體系統領域的重要研究課題之一,即如何通過各自主體間的微觀、局部行為實現多自主體系統的宏觀、整體行為.目前,多自主體系統的理論研究主要涉及兩方面:一是系統分析,即研究宏觀層面的群體行為是通過怎樣的局部相互作用導致的;二是系統綜合,即研究如何設計分布式控制律和分布式估計算法影響個體的行為模式與相互作用方式,進而實現群體宏觀目標.從理論分析的角度來講,多自主體系統綜合的出發點在于它擴展了任務處理的維度,不僅可以利用時間域上系統動態的演化或迭代,還可以利用空間域上自主體間的協作信息來有效提高系統性能.下面我們從多自主體系統的分布式估計、分布式趨同控制和分布式自適應控制三條主線出發,系統梳理本書涉及的相關熱點問題的研究現狀與進展.
1.2.1分布式估計
分布式估計問題研究的重要驅動力之一來自于傳感器網絡廣泛應用的現實需求.傳感器網絡是由大量空間上分散分布的,具有一定傳感、計算、通信能力的電子器件組成.隨著微型傳感技術、微機電系統技術和現代通信技術的飛速發展,傳感器網絡機動性強、容錯性好、精度高、成本低及易布置等優點促使其實際中得到了廣泛應用,如森林火災監控、機器人災區救援、飛機軍事偵察等[21.25].
分布式參數/狀態估計是傳感器網絡研究面臨的一個基本理論問題,它是基于如下的實際應用需求提出的.一方面,由于傳感器網絡中各傳感器的傳感能力有限,僅能感知、觀測到未知參數的部分信息,若只利用自身局部信息進行參數估計,往往不足以保證對未知參數全部信息的可觀測性;另一方面,考慮到每個傳感器具有有限的通信能力,它與其鄰居傳感器可進行局部通信.因此,自然的想法是,能否基于各傳感器獲取的局部觀測信息,以及傳感器間的局部信息交換,設計可擴展性強的分布式估計算法,通過傳感器間的協作完成對未知參數的估計.與傳統的基于信息融合中心的集中式參數估計算法相比,分布式估計算法通過傳感器間的協作提高了整體的可觀測能力,極大降低了傳感器的通信和計算成本,并且對單個傳感器的失效更具魯棒性,提高了傳感器網絡的整體存活時間.因此,分布式估計理論研究得到人們越來越多的研究,尤其是當外界環境存在各種不確定性時,設計魯棒性好、精度高的分布式參數估計算法成為傳感器網絡應用的迫切需要.
趨同型分布式估計算法是近來研究較多的一類算法.雖然形式各異,但都包含了一個體現傳感器間相互協作的趨同機制,以期達到如下的目標:趨同機制的分布式協同性使算法對通信噪聲、觀測噪聲、通信失效等不確定性因素更具魯棒性,提高參數估計的可靠性.趨同機制對傳感器網絡信息的“凸平均化”,對于提高算法收斂速度和抑制噪聲能力具有積極的作用.文獻[26]、[27]考慮了由N個傳感器節點組成的傳感器網絡,每個傳感器對未知參數向量θ的局部觀測由回歸模型描述:
通過設計如下隨機逼近–趨同型分布式估計算法:
可以保證各傳感器的參數估計θ.i(t)均方收斂到參數真值,其中P=[Pij]1.i,j.N為隨機矩陣,即滿足P1N=1N.式(1.2.1a)采用通常的梯度型隨機逼近算法進行局部預估計,得到局部預估值θ.i(t).與文獻[28]、[29]通過對預估值在時間域上進行平均化來提高隨機逼近算法性能不同,式(1.2.1b)采用趨同算法在空間域上對各節點預估值進行“凸平均化”,以提高算法對付各類不確定性的能力以及算法收斂速度.文中考慮了獨立隨機通信噪聲、通信拓撲獨立隨機切換等不確定性因素對算法收斂性的影響.
文獻[30]、[31]提出了增量型分布式參數估計算法,這類分布式算法具有良好的收斂速度及穩態估計誤差,但估計信號在傳感器間的順序傳輸要求通信拓撲中含有Hamiltonian環,致使此類算法機制不適合大規模傳感器網絡.為避免這一問題,并改善算法的可擴展性,文獻[32]、[33]提出了基于擴散策略的算法,但為此付出了較大的通信成本.文獻[34]~[36]通過定義“橋”傳感器子集合,將全局凸優化問題轉化為便于分布式應用的約束等價形式,并采用分布式優化方法[37],分別得到了分布式*小二乘算法[34],以及分布式*小均方算法[35].在無環境噪聲的條件下,證明了算法以指數速度依概率1收斂到未知真實參數,但若存在觀測和通信噪聲時,所設計的算法僅能保證參數估計誤差的大多數軌道在一有界區域,即弱隨機有界性.文獻[38]分別針對線性和非線性觀測模型,在量化誤差及隨機信號丟失等不可靠通信因素影響下,設計了隨機逼近型分布式估計算法,分析了算法的漸近無偏性、強一致性(幾乎處處收斂性)以及漸近正態性.文中,為使量化誤差具有良好的統計性質,在待傳輸信號量化前加入了隨機激勵信號;此外還要求隨機通信拓撲圖的Laplacian矩陣序列是獨立同分布的,這蘊含著要求通信信道的隨機失效在時間域上是獨立的.
關于分布式Kalman濾波算法的設計與分析可參見文獻[39]~[42],此時要求每個傳感器的狀態模型和觀測模型都已知.
1.2.2分布式趨同控制
分布式趨同控制問題是分布式控制領域的一個基本問題,研究如何為各自主體設計基于局部信息的分布式網絡協議,使得自主體的狀態趨于某個共同值.趨同控制已在很多領域中得到廣泛應用,如前一節中的分布式估計,以及聚集[43]、隊形控制[44,45]、分布式計算[13]、傳感器信息融合[46,10]等.趨同性問題的研究可追溯到20世紀七八十年代的統計科學和計算機科學領域[47.49].系統控制界對趨同性問題的研究主要是源于對多自主體系統的集體行為以及分布式協作任務的研究Vicsek等通過研究非平衡系統中的聚類、相變以及群體動物的聚集等行為,于1995年提出著名的Vicsek模型[50].具體來說,每個個體以相同的速率在平面內運動,而每時刻的運動方向θi則根據如下的“*近鄰居規則”進行更新:其中Ni(k)為k時刻第i個個體的鄰居集合,wi(k)為k時刻對個體i的噪聲干擾.仿真表明所有個體的前進方向*終趨于一致,驗證了基于簡單的規則可以產生復雜的集體行為.
2003年,Jadbabaie等對Vicsek模型進行了線性近似,給出了個體速度方向實現趨同的一個充分條件,即網絡拓撲的聯合連通性[51].Olfati-Saber和Murray在有向拓撲下,針對一階積分型離散時間模型
和一階積分型連續時間模型
設計了基于局部信息的加權平均趨同協議
給出了多自主體系統實現平均趨同的充分必要條件[52].文中也分析了網絡拓撲時變和通信時延對系統性能的影響.
自此之后,系統控制理論界掀起了對分布式趨同問題研究的熱潮,涌現出眾多研究成果.總的來說,主要圍繞以下幾個方面展開研究:①自主體系統動態結構的復雜程度,即自主體系統是由一階模型,還是高階模型描述[53,54];是由線性模型描述,還是非線性模型描述[55,56];各自主體是同質的,還是異質的[57,58].②通信網絡受到不確定性因素的影響,如隨機通信噪聲[59.62]、異步采樣[63]、數據丟失[64]、量化[65.67]、時延[68]以及網絡拓撲時變[69.71]等,這些不可靠因素大大降低了自主體間通信信息流的傳輸質量和準確度,進而對自主體系統的整體行為產生重要影響③趨同目標的差異.當趨同值是所有自主體初始狀態{x1(0),???,xN(0)}的N元函數值χ(x1(0),???,xN(0))時,稱為χ-趨同[72,75].當趨同值不再是常數,而是隨時間變化的量時稱為動態趨同,如跟蹤控制[73.76]、領導者–跟隨者型趨同[77,78]、牽引(pinning)控制[79]均屬于這一范疇④對趨同算法性能的分析,如關于通信拓撲和信道權重的收斂速度估計[80,52,81],以及實現**收斂速度時的通信拓撲和信道權重設計問題[82,83]等.
此外,在對分布式趨同問題的討論中,通信
……