基于多代理理論的微電網分布式優化控制方法分析_第1頁
基于多代理理論的微電網分布式優化控制方法分析_第2頁
基于多代理理論的微電網分布式優化控制方法分析_第3頁
基于多代理理論的微電網分布式優化控制方法分析_第4頁
基于多代理理論的微電網分布式優化控制方法分析_第5頁
已閱讀5頁,還剩123頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中文中文要IIPAGEPAGEVI摘 要微電網作為分布式發電的有效管理形式,對于推進清潔能源的發展,增加新能源在配電網中的滲透率,提高配電網的穩定性、可靠性具有重要的意義。但是由于微電網內部分布式電源的間歇性和波動性以及微電網分布式接入配電網的方式,導致微電網本身以及微電網與配電網之間的優化控制問題難以解決。研究微電網的優化控制方法,多微電網之間的協調控制策略對于保證微電網的可靠經濟運具有重要的意義,為推進智能配電網的建設提供理論指導。于模同問束異全運收的優無模還計都任復的題基代的方求式有勢此文代控了混框構微行從系統到個體設計了相應的優化控制算法和策略。首先針對含多微電網的配電網系了化網布制中以解網網了算電集中式控制,保持集中控制對小規模系統快速求解優勢,最后結合微電網內不同的G的制的究點:(1)結合多Ant理論,建立了完整的微電網混合式優化控制結構,研究基于多Ant分布式理論的分布式優化控制算法,將分布式優化控制問題視為分布式約束優化問(DCOP,以勢博弈理論為基礎,提出了符合多代(MAS分布式理論的DCOP求解算法ihtedRgrtMonitoringDistributdSimulatdAnnlin(WRMDSA。算法以局部優化為基礎,通過Agnt之間的通信交流以及優化控制規則進行全局優化。測試結果表明所提出的分布式優化算法結構上滿足分布式設計要求,并且能夠保證算法幾乎處處收斂到全局最優納什均衡,較集中式有更好的復雜網絡分布式求解能力。(2以EEE39節點系統為基礎,通過微電網優化配置建立了含多微電網的配電網系統。按照DCOP理論將微電網優化控制模型轉化成為適合分布式求解的分布式約束優化問題,設定微電網中每一個Ant的優化目標函數,同時考慮局部優化約束和全局優化約束的關系,采用所提出的勢博弈分布式優化算法WRMDSAN進行求解,考慮分析Ant環狀和網狀控制結構對優化控制結果的影響,證實了微電網分布式優化控制的可行性,通過結果對比表明,系統在優化后獲得了更好的整體效益,且網狀控制結構具有更好的故障容忍能力。重慶學士位文(3)針對小規模微電網的動態集中優化控制方法,提出了基于粒子群算法理論的nformationExchangeParticleSwarmOptimization(EPS)集中式優化控制算法,建立了微電網動態集中優化控制模型,包括G優化配置,風電以及負載的波模型,集中優化控制的數學模型。考慮G以及負載變化的情況下,制定微電網儲能的控制策略,分析了不同儲能貢獻率對優化運行的影響,結果表明動態儲能貢獻率具有更好的協調效果。(4)建立了包括風電,小水電和儲能底層執行G的控制模型,并按照CERTS規范建立了電網仿真平臺,對組網后微電網進行仿真,同時研究并搭建了微電網在Matlb/simulink環境下微電網的數字仿真平臺,為后續微電網的研究提供實驗環境。關鍵詞:微電網,分式優化控制,分布式約束優化,多代理,勢博弈,粒子群英文英文重慶重慶學士位文IIIIIIPAGEPAGEIVABSTRACTAsnfetivemanarfordistributdnrtion,miroridplasnimportntroleinlenngydvelopmnt,stabilityndrliabilityoffutuedistributionntwor,ndnlsoimpovethepntrtionofrnwbleng.Hov,Dsinmiroridrehartrizdbyflutuationndintrmittntndmiroridsredistributdmbedddintodistributonntwor,whihledtotheicoridndmirogidsindistributionntworkisdifiulttoontrol.Thersrhofoptimiztionontrolmethodformiroridndoordinationontrolstrtegybtwnmiroridsouldpovidevluablerefrnsforrliblendonomicoprtionofmiroridnddvlopmntofsmatdistributionnetwok.Gnrll,diferntontrollblelevlofmiroridhsdifrntoprtionmode,whretheloclonstrintsforoptimztionontrolrevridndsometimethelobalinfomationisnotavilble.orthsecomplxdistributiontworswithmultimirorid,thentrlizdoptimiztiononrolmethodisnotsuitblefordlingwiththeontrolpoblembuseofmodelbuildingndomputingcost,butitissugstedthatmultiaentbsddistributdontrolmethodshouldbeoodtsolvingsuchpoblems.Threfor,ahbidmirogidoptimizionontrolfrmewokisbuildinthisthsisbsdonmultintontroltheor,ndtheorspondingoptimztionontrolloithmsndstrteiesfomtoptobottomstrutureredsinedfordiferntoprtingnvironmet.irst,adistributdonstrinedoptimiztionloithmwhihisusdtodistributdopmiztionontrolforicogridispoposdontetopontrollevlofmultimirorid;Sond,inodrtomintinarpidontroldvntaeofntrlizdmethodforsmallsstem,antrlizdoptimiztionloithmispsntedinthemiddleontrollevlforsinlemicrorid;inall,diferntxcutionontrolpprohsfordifrntDGtthebottomcontollevlinmirogidarebuild.Themainrsarhontntsofthisthesisreshownsfollows:sdonmultintthor,theoptimiztinontrolsstmofmirogidisstablishedfistinthisthesis,whrethedistributdontrolpoblemisrgrddsadistributdonstrintptimizionpoblem(COP).omettherquirmentofpotentialgmetheor,thedistributedoptimiztonontrolloithmWRMDSANispoposd.nthisloithm,lobaloptimiztionhtisbsdonloclsrhingnbexutedduetotheommunitionbtwnAentsndoptimiztiononrolruls.strsultsshowthatthepoposddistributdoptimizionloithmanstisfytherquirmentofdistributddsinstruturendthelorithmnonveetolobaloptimalNshquilibriumlmostvrwhre.tispovdthatdistributdoptimztinloithmismoresuitableforsolvingomplexsstempoblemsinontrstwithntrlizdloithms.DistributionntworkwithmiroridsisbuidbsdontheEEE39sstm.AodingtoDCOPtheor,theoptimiztionontrolmodelofmicroridisonsidrdsndistributdonstraintoptimztionpoblem.tilityfuntionforhAgntinmirogidrefomultedwiththelocloptimitiononstrints.Andpotentialmedistributdoptimztionloithm,WRMDSAN,ispplidtoslvethsdistributdonstrintoptimiztionproblms.Undrtheringndmeshontrolstrutur,theoptimalontrolrsultsrenlzd,nditisindictdthatdistributdoptimiztinontrolmethodisviableformultimirorid.Atroptimiztion,itissytofindthatthemeshontrolstruturehsbetterfulttolrncebilit.irstl,antrlizdoptimztionontrolloithmEPSOisdsignedfordnmiccntrlizdontrolofsmallmiroridsstem.Thnadnmicntrlizdoptimiztionontrolmolofmirogidisstablished,includingDGplacmentmodel,windpowrndloadflutuationmodelndntrlizdoptimiztionontrolmathmaticlmodel.ConsidringthehngeofloadndD,ngystoraeontrolstrtegyofmirogidisfomulted,ndtheftsofdiferntDGontributionrteontheoptimaloprtionrenlzd.RsultsinditethatthednmicDGontributionrtecnprvidedmoreefetiveoordintionontrol.MiroridsimulationplatfrmisbuiltundrthestandrdofCETSwithwindpow,smllhdrondnegystoraemodl.Controlpromaneofmiroridissimulatdundrislndoprtionmode.inall,thediitlsimulationplatfrmofmirogidisbuiltinMatb/simulinkforfutuersrhofmiroridontrol.ywods:Mirorid,Distributdoptimztionontrol,Distributdonstrintoptimiztion,Multint,Potentialme,PSO目錄目錄重慶重慶學士位文PAGEPAGEVIIPAGEPAGEVI目 錄文摘要I英文摘要1 緒 論11.1選題背景和研究意義11.2微電網分布式優化制究現狀31.2.1微電的本行制41.2.2微電的化行制61.3本文目的和研究內容82 基于S理論的微電網優化控制方法 2.1引言2.2MS理論與微電網優化制結構設計 2.2.1MAS的本論結構 2.2.2基于S微網合化控結設計 152.3基于AS理論的分布優化控制方法實現 172.3.1分布約優問題172.3.2勢博理論202.3.3分布優控問轉化232.4本章小結253 基于勢博弈的S分布式優化算法設計及分析 273.1引言273.2基于勢博弈的分布優算法結構273.2.1策略估293.2.2決策則313.2.3調整制323.3基于勢博弈的分布優算法設計333.3.1WRMDN法述 333.3.2納什衡斂證明373.4基于勢博弈的分布優算法分析403.5本章小結454 含多微電網的配電網分布式優化控制474.1引言474.2配電網優化模型474.2.1配電的電配優化484.2.2配網gent494.3基于CP理論的配電分布式控制模型 504.3.1配電分式化制學模型504.3.2分布優控結構524.4基于勢博弈優化算的電網分布式優化控制534.4.1分布優控結對分析544.4.2分布優控結容結果析594.5本章小結625 微電網的集中式動態優化控制635.1引言635.2基于粒子群算法的ESO優化算法 635.2.1EPO法述 645.2.2算法能析675.3微電網配置及集中優控制模型685.3.1微網G配優化 685.3.2風電負波模型705.3.3優化制型715.4含儲能的微電網優控結果分析725.4.1靜態能獻下優結果析735.4.2動態能獻下優結果析765.5本章小結786 微電網G組網控制與仿真平臺建設 796.1引言796.2單DG的控制 796.2.1永磁驅力電統796.2.2小水系統846.2.3電池能統876.3微電網運行仿真及合制平臺916.3.1微電孤仿真916.3.2微電仿系平臺946.4本章小結977 總結和展望997.1論文內容結論997.2今后工作展望100致 謝103參考文獻105附 錄17A.作者在攻讀博士學間發表的論文目錄 17B.作者在攻讀博士學位間參加的科研項目 17VVIIIPAGEPAGE131 1 緒 論重慶重慶學士位文1 緒 論1.1選題背景和研究意義電能作為目前國民經濟發展中最為方便和清潔的能源,為國家經濟的可持續發展提供著有力的支撐。隨著用電需求的不斷增加,電網規模不斷的擴大,結構也越來越復雜,現行的超大規模集中式發電系統的弊端也逐漸顯現,主要體現在運行成本高,調度難度大,供電方式單一,互聯結構一體,一旦出現故障可能會造成大面積停電事故。此外在電力系統中,火力發電所占比例仍然較高,煤炭、石油、天然氣等化石燃料的過度使用造成的環境和能源壓力也日益增加[1]。在發展環境友好型能源以及提高電網利用率的多重需求下,分布式發電,DistributdGnrtion技術逐漸受到世界各國關注。分布式發電是指利用各種有利用價值的可再生清潔能源,包括風能、太陽能、小水電、燃氣輪機等進行分散獨立發電的小規模發電系統,一般規模在數千瓦至數十兆瓦之間,采用負荷就近原則分布安裝[5]。分布式發電由于安裝分散靈活,能夠很好的滿足用戶多樣化需求,且一般分布在負荷段附近,能夠有效的減少電能在線路上的傳輸距離,降低線路損耗以及終端用戶費用,提高能源利用率。當G接入大電網后,尤其是在系統薄弱環節,G既可以作為電網的備用電源,也可以對電網進行電壓功率支撐,提高了電網的供電可靠性和靈活性。此外,G一般投資成本較小,但是能獲得較大的環境效益,是今后綠色電網發展的主要方向[80]。盡管分布式發電具有諸多優點,但是G入網帶來的挑戰也不容忽視1,]。一方面G本身易受到環境的影響輸出功率波動頻繁,無法達到直接入網的要求,需要通過電力電子裝置接口進行電能轉換后入網,增加了系統的復雜性,且對于電網來說G是一個不控制電源,由于環境的變化,G不能確保恒功率輸出,而這無疑增加了電網運行不穩定的風險;另一方面由于G電壓等級低,一般接入配電網中,而G的接入改變了原有配電網的供電結構,配電網的潮流也隨之重新分布,這樣會使得原本配電網中繼電保護以及無功補償裝置運行受到影響,引發運行穩定與電能質量問題[11]。為了減小對大電網運行的影響,整合管理分布式電源,各國研究者提出了微電網(Mirorid)的概念。微電網可以認為是由一系列分布式電源組成的小型低壓自治型電網,微電網中的分布式電源主要包括風力發電、光伏發電、微型燃氣輪機以及小水電等。通常通過電力電子接口與配電網連接,能夠實現自我控制、保護和管理的局部發配電系統,既可以以并網形式運行,也可以孤島運行,并能根據運行需要實現靈活切換[5,]。微電網通過對負荷、G以及儲能裝置的有效PAGEPAGE10PAGEPAGE3整合,既有效的利用了清潔能源,又可以通過對G進行控制管理,形成小型可控制單元,經過PCC接入配電網與配電網形成相互支撐。當微電網接入配電后,微電網作為配電網的可控電源或者可控制負荷,服從配電網的調度控制,滿足系統的功率需求,通過合理調度還可適時向配電網提供電能支撐,降低配電網損耗,提高配電網運行的可靠性。而對于微電網用戶來說,一旦配電網出現故障,微電網從配電網斷開進入孤島模式運行,微電網G可繼續向內部負荷供電,增強局部供電的可靠性,同時通過向用戶電熱聯供,提高能源利用效率。微電網在充分發揮分布式電源的各項優勢同時,通過控制整合解決大規模分布式電源的配電網接入問題。總體來說,微電網與大電網的結合適應當今電力行業的發展方向和需求,并且具有非常廣闊的發展前景,必將成為未來供電的發展方向[71]。然而,含可再生能源(例如風力發電、光伏發電等)的微電網系統受氣候條件和外界環境的影響較大,具有較強的隨機性和不確定性。當其容量達到一定的等級,需要采用適當的控制策略對系統的潮流進行監控和管理,以提高系統運行的穩定性和經濟性。微電網通過電力電子器件接入系統,缺少傳統電網的所具有的慣性,當微電網從主網脫離時,僅靠分布式電源無法立刻承擔起負荷的供電,因此,微電網系統中必須加入儲能元件,如飛輪、超級電容器、蓄電池等來保證功率平衡[203],這些儲能元件此時將作為電源輸出功率,以保持電壓和頻率的穩定,但同時也為微電網引入了更多的控制單元,增加了微電網控制的復雜性。當小規模微電網運行時,協調微電網內部發電單元、儲能單元、負荷和電網之間的潮流,實現關鍵負荷優先的可靠供電、發電單元和儲能單元的配合運行、系統運行的經濟效益最大化。當微電網并入配電網后,控制微電網為本地負載提供一定的功率支撐,維持本地電能質量,協調微電網與微電網、微電網與配電網之間的功率分配與調度,實現“削峰填谷”,參與維持配電網穩定、提高配電網經濟運行能力等。這些問題的解決都需要一定的協調管理策略進行潮流的最優控制,保障系統穩定、可靠、經濟運行。從網絡層面來看,微電網的優化控制,主要通過優化控制算法求解微電網的優化模型,所得到的結果即作為元件層面執行單元控制參考值。在小規模微電網運行,集中式優化控制具有在兼顧全局信息時能快速準確的對微電源提供控制參考的優勢,但是對于含多微電網的配電網,由于微電網運行模式多樣、可控程度不同(不可控,半可控,全可控),尤其是當所接入的微電網數量眾多,受控量復雜的情況下,在建模方面很難像傳統電網一樣,建立一個中心控制對整個系統做出快速反應,并進行相應的控制;再者,不同的微電網局部約束問題不一樣,若采用集中控制會由于局部約束問題使得全局優化求解所花費的計算量巨大而難以實現;最后,一般情況下,系統并不能完全掌握各電源的運行信息,此時無法滿足傳統集中式優化控制方法所需要的計算條件,也無法進行集中式能量管理。非集中式優化控制則可有效的解決上述問題,并且在區域求解時可更全面的考慮局部約束問題而不用擔心計算成本問題,避免全局信息收集造成的通信成本[]。式約束優化問題求解機制中,不存在集中式的全局控制,而采用多求解器的分布策需SAtSt分布式約束優化問題求解機制的大部分特征,因此被認為是一種有前景的解決方法局和。綜上所述,發展微電網技術,可有效的對分布式發電進行管理,進而推進清潔能源的發展,促進節能減排,增加新能源的滲透率,同時改善網絡構架增加系統的穩定性可靠性,但同時也會導致網絡結構復雜化,集中式優化控制難以展開的問題。開展基于MAS理論的微電網分布式優化控制方法的研究,一方面真正意義上將MAS分布式理論運用到微電網優化控制中,實現大規模系統分布式優化控制,小規模系統集中優化控制的混合分布式優化控制方法,另一方面建立既可以滿足大規模復雜微電網運行控制的分布式特點,以分布式優化求解方法解決大規模微電網系統難以集中求解難題,也能在面對無需進行分布式優化控制的在小型微電網保持集中優化控制全局快速優化特點的微電網優化控制體系。本課題的研究對于保證微電網的安全、穩定、經濟運行,電網的智能化建設和可再生能源發電的推廣應用都具有十分重要的意義。1.2微電網分布式優化控制研究現狀微電網是一種由負荷和G共同組成的系統,它可同時提供電能和熱能,G通過電力電子裝置進行能量轉換,需要進行相應的控制。微電網相對外部大電網表現為單一的可控單元,同時滿足用戶對電能質量和供電可靠性、安全性的要求。為了增強微電網與配電網的協調能力,微電網內部G的功率最優分配,提高清潔能源滲透率、電網運行的經濟性和可靠性,微電網的優化控制問題研究顯得尤為重要,但由于微電網的研究剛剛起步,國內外學者關于微電網的分布式優化控制策略以及方法還沒有比較成熟的方案[3,3],結合本文研究的內容以及方法,在相關領域內各國學者所做的相關工作包括微電網的基本運行控制和微電網的優化運行控制。1.21微電網基運行控制從系統層面來看,微電網的基本運行控制主要是為了保證系統運行穩定而針對系統的電壓頻率等控制量而進行的綜合控制,根據目前的研究情況,微電網的基本控制方法包括:①集中控制[53]采用集中控制時,微電網內所有發電單元以及儲能的控制由一個中央控制單元統一完成。微電網內各單元將各自的運行信息傳送至主控端單元,在保證系統穩定的前提下,兼顧經濟運行,主控單元將控制信號通過高速的通信網絡傳送至微電網內部的各個單元。這種控制方案簡單高效,且調節效果迅速,便于全局網絡調控。但是由于系統的所有信息都要進行集中處理,因此需要有一個高效的中心控制器來處理龐大的數據和在網絡中傳輸全局信息,這樣就主要依賴于中心控制器,一旦出現單點故障,控制就會失效。此外,控制以及運行信息完全依賴于高速的通信網絡,受到通信距離和成本限制,通信系統的故障則會引起整個微電網癱瘓,降低了系統可靠性。另外,一旦控制框架確定后,網絡的結構就不能變動了。當有新的電源或負載接入微電網中時,就需要重新更改控制結構。因此該方法僅適合網架結構比較固定,結構簡單的小型微電網系統,對于結構復雜,負荷增長需求較大的微電網則會出現信息災難而無能為力。在實際微電網示平臺中,采用集中控制的微電網有美國NPS的MadRiver微電網以及日本NEO機構參與的八戶、京都、愛知3個微電網示范工程[]。文獻[3]中,為了保證微電網運行負載需求平衡,建立集中式負載控制單元,集中式控制器與負載進行通信,并且在負載上安裝了包括控制電路、通信節點、功率測量裝置以及控制開關的控制節點。中央控制器通過微電網的運行情況,控制負載節點開關的開合,實現對微電網供電可靠性的自動管理;文獻[36]提出采用集中控制的方法解決微電網孤島運行時諧波電壓抑制的問題,通過將集中選擇諧波補償裝置運用到局部逆變器接口的自動非線性負載共享環中,減小由于諧波電導與饋線特性阻抗之間的不匹配而出現的諧波電壓失真;文獻[37]采用集中控制方法來協調微電網中的不同G的逆變器運行,并且針對逆變器控制設計了一種新的模型預測控制算法,在解決大型電力系統穩態和瞬態控制問題時計算速度更快;在文獻[38]中設計了一種用于多變換器直流微電網的集中式穩定器,集中式穩定器負責直流微電網的變換器電力電子接口的穩定性控制,減少由于電力電子裝置帶來的潛在負增量電阻影響,提高系統穩定性邊界。②主從控制[04]采用主從控制時,系統中將選出一個電源作為主控電源,其他的電源作為從屬電源主電源采用/f控制使系統的電壓頻率穩定在額定值為其他從屬電源提供電壓頻率支撐由于在并網運行時系統的電壓頻率支撐主要由大電網提供,因此這種控制方式多用于孤島運行模式。這種控制方案簡單易行,但缺點在于過度依賴于主控單元,對其容量和性能要求較高,投資大而且不便擴容且僅用于孤島運行模式下。采用這種用控制方式的微電網有希臘的Kthnos島微電網,在該微電網中,主控單元為10kW的儲能單,從屬地位的微電網G為1kW光伏和5kW柴油發電機;在德國的MVV居民區微電網示范工程中,微電源加儲能單元共同作為主控單元;在葡萄牙的EPD微電網項目中,主控單元為80kW微型燃氣輪[]。文獻[40]提出了一種的主從控制方法用于微電網在孤島與并網運行之間的無縫轉換。在進行主從控制時,主控制G根據運行狀態不同而采用不同的控制方法,從屬G一直采用功率/電流控制方法。文獻[41]討論了微電網在不同運行模式下的運行控制仿真,在并網運行時,所有的微電源都運行在預先設定的PQ控制模式下,在孤島運行時,電池作為主控DG提供整個微電網的電壓和頻率運行參考,其他G采用從屬控制。文獻[42]研了風電互補的單相直流微電網系統的運行控制策略。在孤島運行時,同樣采用電池作為主控G為整個微電網運行提供電壓和頻率參考,并在此基礎上提出了使G吸納率盡可能大的并網控制策略。文[43]中,建了包含多種,儲能以及柴油發電機微電網實驗室系統,并在孤島運行時采用主從控制策略,其中儲能作為主控G采用/f控制,其他G采用Q控制的控制方法,以保證微電網在并網模式與孤島模式之間進行無縫轉換并在EEE1547標準下對微電網的控制,保護等進行了仿真。③下垂控制[44]在下垂控制中,主要根據系統的電壓和無功功率,頻率和有功功率的下垂特進行控制。由于控制最終的輸出為微電源的有功功率和無功功率,在對G進行控制時需要通過變換器內環控制將其轉化為電力電子控制器的參考電壓或電流。然而,采用對等控制時,由于微電網微源容量與線路差異等原因,將影響無功均流性能進而影響下垂控制效果4]。此外,下垂控制雖然在進行功率均分時不需要進行通信,但這是以犧牲輸出電壓和頻率的精度為代價的,一旦微電網無電壓頻率支撐,在長時間運行時電能質量則無法保證。在著名的CETSAEP微電網測試平臺中,其控制方法即為對等下垂控制。該微電網中安裝了3臺容量均為60kW微型燃氣輪機,用對等下垂控制實現負荷分配[5,]。為了解決微電網中傳統下垂控制帶來的功率不均分的問題,文獻[44]通過引入虛擬阻抗來消除由于變換器輸出阻抗和線路阻抗造成的功率不均分問題,并在此基礎上結合虛擬阻抗提出來虛擬阻抗補償下垂控制,改善下垂控制的功率均分特性文獻[45]中分了傳統有功功率頻率f,無功功率電壓V的下垂控制的不足,并且針對電壓微電網提出了基于多反饋環控制策略新型的解耦下垂控制,保證微電網電能質量。文獻[46]研究了自治微電網的功率分配問題,提出在傳統高增益角下垂控制的基礎上為G變換器增加輔助環的新的改進下垂控制,來解決高增益角下垂控制功率均分的不足。而文獻[47]研究了在下垂控制方法下,微電網從孤島向并網運行模式無縫轉化的控制策略。該策略包括基本下垂控制和頻率相位同步控制,可有效的避免頻率相位震蕩以及對功率分配帶來不利影響。1.22 微電網優化控制微電網的優化控制是微電網基本運行控制的進一步發展,優化控制在考慮系統基本運行的基礎之上,開始注重系統的運行性能優化,目前就控制級別來分,主要包括兩類,元器件層面的優化控制以及系統層面的優化控制。元器件層面的優化控制,顧名思義主要是指在對微電網進行控制時,由于控制元器件含有直接影響微電網控制性能的參數,在調節時通過各類優化算法對參數的取值進行優化而取得比較滿意的控制參數,這類優化控制并不是本文的關注重點。系統層面的優化控制主要側重于微電網的優化控制的整體性,主要包括:①集中式優化控制[85]集中優化控制屬于微電網的能量優化管理范疇,通過綜合考慮微電網內的熱電聯供需求情況、環境因素、電網運行經濟性與成本因素,電能質量與用戶需求,微電網與上層配電網的管理要求等情況做出決策,在保證微電網基本運行穩定的情況下,通過對微電網運行成本與運行效率、系統環境效益與經濟效益等目標制定的微電網優化控制的目標函數和約束條件進行優化,為微電網以及微電網分布式電源提供功率電壓控制參考值。在集中式優化控制方法中,根據優化控制的需要建立相應的單目標或多目標優化函數,收集微電網的優化信息建立全局約束條件,采用優化算法進行求解。在求解算法中,包括傳統的規劃方法以及人工智能算法中模擬退火算法、遺傳算法,蟻行算法等[]。在小規模微電網運行,集中式優化控制具有在兼顧全局信息時能快速準確的對微電源提供控制參考的優勢,但是無論是微電網本身,還是多微電網接入配電網,由于忽視了微電源的分布特性,在采用集中式優化控制時,約束條件為全局性約束條件,而不同的微電源約束性不同。采用一致約束時為了滿足所有的微電源必然會放寬約束條件,使得某些變量的搜索空間變大,進而造成計算量會進一步增大,可能會出現計算時間不能滿足要求或者完全不能計算的問題;此外,隨著微電網系統的增加,全局信息的獲取顯得不太可能實現,這樣也就無從建立優化模型。文獻[49]研究了并網運行微電網的集中優化控制模型,通過建立可控負荷側競價選項,在不同的市場運行政策以及假設實際的現貨市場價格和DG的出價都能真實的反應到運營成本上的情況下,將提出的優化算法運用到微電網中,以最大化微電網的運行效益。文獻[50]提出了微電網的集中優化控制優化調度模型,建立了最大限度減少操作或者折舊成本以及最大化環境綜合成本的目標函數,并且在不同的控制策略、目標函數以及電價的情況下對集中優化模型進行了驗證。在文獻[51]中通過采用神經網絡的優化方法對集中控制器進行優化,以經濟效益作為評估指標管理微電網發電機以及相應負載對工業和商業用戶的功率分配。集中優化控制器接收發電機報價,負載以及天氣預測信息進而決策發電機的功率調度以減少微電網的發電成本,增加經濟效益。文獻[52]提出了一種微電網能量管理優化算法,用來協調不同G在聯網以及孤島運行情況下的功率分配。通過對儲能系統的控制,以補充在孤島運行模式下高峰負荷期間的功率缺額。②分層優化控制[35]網著G更將S電用S數用S。在分層控制時,微電網的控制結構通常設計成基于MAS的分層控制結構,在該類型系統結構中,代理被分為不同的代理層,通常分為三層,上層配電網代理,中層微電網中心控制代理,底層G控制代理。在同一層上的代理彼此不能夠直接進行通信,而需要經過其上一層代理來完成。上一層代理負責其下一層代理的決策和控制。下層的每個控制器都有自身獨立的控制策略。對于分布式儲能或功率恒定的分布式發電,如蓄電池,其控制器往往具有定功率控制和電壓/頻率控制等多種控制策略。該結構中代理不需要保存系統內所有的代理信息,只需要保存下一層代理的相關信息和知識,結構層次分明,管理方便,綜合控制策略使得微電網的信息更容易獲取,系統穩定性更容易分析,控制器更容易設計。處在微電網每一層的微電網Ant按照預先規定的協議,結合自身所掌握的資源和信息,針對所制定的微電網控制目標,進行任務分配,通過系統間Ant信息的交流協調各自的行為活動,共享微電網運行信息以及各自的控制信息,協作完成共同的任務以達到整個微電網的目標。在該類系統中,以微電源以及儲能為主的各代理在結構和功能上彼此獨立,都以同樣的方式通過網絡通信相互發生關系,即使通信系統出現故障,微電網也能安全穩定運行。微電網的分層控制在一定程度上解決了集中優化控制中的局部約束和全局約束之間的約束矛盾,以及通過分層也緩解了計算花費問題,但是在全局信息的獲取方面仍然存在不足。文獻[53]中提出了一通用的基于MAS不的Ant控制和行為分層控制結構,根據不同控制層設定不同的系統功能,進而提出微電網的控制的整體方案。文獻[54]立MAS層結構,針對微電網的MAS分層,在微網分層的情況下改進協調控制策略進行了研究,并且在微電網孤島與并網運行條件下進行了仿真運行。文獻[55]中采用通用的三層控制結構,以微電網綜合運行成本為優化控制的目標函數,在關鍵狀態變量變化率的基礎上定義了不同G以及負載類型Agnt的動態分層結構的強化學習規則,進而采用改進強化學習算法對微電網運行進行優化控制。文[56]據MAS理論建立了中下三層微電網優化控制結構,定義了不同層次的功能,同時制定了包括維持系統電壓穩定,最大化經濟和環境效益的微電網優化控制目標,通過三層微電網Agent進行優化控制。③分布式優化控制[7,]在MAS理論中,分布式優化控制也屬于MAS控制理論的一種,只是目前采用分布式優化控制對微電網進行控制的研究很少,大多數研究僅停留在理論探討上。在該理論中,認為Ant個體之間通信對等,信息局部化,這一點很好的解決了大規模復雜微電網優化控制的所面臨的難題。在目的研究中,微電網的分布式優化作為基于MAS分層優化控制的進一步發展,借助分層理論,在控制策略上,開始從分布式方法著手設計Ant的功能以及控制策略和算法。文獻[57]中將MAS理論不僅僅應用于微電網分層控制結構設計,也用于微電網分布式優化控制算法設計中,通過建立三層微電網的控制結構以及可控負載根據自身利益決定所執行動作的控制模型,重點研究了微電網的能量市場下整體收益。單從分布式控制來看,文獻[58]實際上采用分層集中的微電網控制結構,但是采用分布式控制的方法設計了各Ant的優化目標函數以及功能,并且在JAE平臺上以分布式方法設計Ant之間的交流通信,理論上更接近MAS的分布式控制理論,優化上需要進一步研究。在理論研究以上,為了方便MAS這一分布式優化理論在優化算法中的實現,通常將優化問題視為分布式約束優化問題,將MAS的分布式優化控制問題轉化為MAS的DCP問題在眾多的分布式求解DCOP算法上,一類基勢博弈的局部搜索算法,無論是在算法求解過程還是局部信息處理上都符合MAS分布式優化求解的要求,這類算法包括分布式隨機算(Distributdstohsticloithm,DSA分布式模擬退火算法(DistributdsimulatdAnnlin,DSAN),最大和通信算法(Maximuminmssain,WRM)等596。1.3本文目的和研究內容模G結的G另局對從G微環電層G層GS的:(1)研究基于MAS分布式理論的微電網控制框架和分布式優化控制算法。結合MAS混合式控制結構,根據微電網不同運行環境,建立從頂層到底層的混合控制結構,根據不同的控制結構提出相應的優化控制策略和算法。在多微電網優化控制系統中,由于計算復雜度高、全局信息難以收集,集中式優化方法已很難勝任。考慮到G的分布式特性,將MAS分布式理論引入到分布式優化求解問題中來,設計基于局部信息的分布式優化控制算法。從算法設計角度出發,將分布式優化控制問題視為DCOP問題,考慮DCOP與MAS之間的關系,以勢博弈理論設計符合MAS分布式理論的DCOP分布式優化控制求解算法。算法中每一控制變量設計成一個有獨立效用函數的Agnt,每一個Agnt只掌握自身的控制信息以及與自己有連接關系鄰居Ant的信息,以局部優化為基礎,通過Ant之間的通信交流以及優化控制規則,最終分布式的優化求解實現全局優化控制的目標。(2研究含多微電網的配電網優化目標以及分布式約束優化問題,構建微電網分布式的運行控制體系架構。以EEE39節點系統為基礎,建立含多微電網的配電網系統。為了方便運用分布式優化算法對微電網分布式優化控制問題的求解,微電網中每一個Ant都需要制定優化目標函數,同時考慮局部優化約束和全局優化約束的關系,將微電網優化控制模型轉化成為適合分布式求解的分布式約束優化問題,以勢博弈分布式優化算法進行求解。在分布式優化控制中,Agt之間的連接關系不同,必然形成不同的控制網絡,這樣控制效果是不同的。因此需要在不同的控制結構下研究微電網的優化控制結果,確保在滿足計算精度的同時保證分布式優化控制的計算速度。(3研究小規模微電網的動態集中優化控制方法,實現微電網儲能之間的協調優化控制。不同于大規模微電網系統,小規模微電網系統作為其子系統,在G數量上遠少于多微電網系統,因此采用集中優化控制方法能起到更加快速準的進行控制的作用。通過群集智能理論,提出基于PSO理論的EPSO集中式優化控制算法,建立基于MAS的集中優化控制算法和微電網動態優化控制模型,考慮G以及負載變化的情況下,制定微電網儲能的控制策略,保證微電網動態優化控制效果,實現微電網儲能之間的協調優化控制。4研究不同的分布式電源的自主控制方法,構建微電網數字仿真平臺。在構建微電網時,分布式電源(主要以風電,小水電以及電池儲能為主)應該以標準電源形勢接入微電網中,要求各個G的頻率/電壓符合接入電網的要求,有功/無功能直接或間接可控,但是由于G受到自然環境的影響,輸出功率隨機波動比較大,不能直接接入微電網,需要通過電力電子接口接入。通過研究不同的自主控制方法,有效的控制電力電子接口,滿足G接入微電網的要求。在建立不同G各自控制方法的基礎上,按照CETS規范建立微電網仿真平臺,對組網后微電網進行仿真,同時研究微電網在Matlb/simulink環境下電網的數字仿真平臺建設。2 2 于AS理的網優控方法重慶重慶學士位文2 基于MAS理論的微電網優化控制方法2.1引言本章主要分析了微電網采用的MAS思想進行分布式優化控制的方法,首先分析了Agnt的概念及MAS的基本思想、性質以及控制結構,從理論上對分布式優化控制的核心思想進行了闡述,并且基于MAS理論設計了微電網的優化控制混合結構,并且針對不同層級微電網制定了相應控制策略;其次研究了分布式約束優化問題的基本概念和性質,將MAS分布式思想以分布式約束優化問題及求解算法形式體現;介紹了勢博弈的相關概念和性質,從勢博弈的角度來設計分布式約束優化問題及求解算法,確保算法能收斂到納什均衡,將分布式優化求解問題轉化為以勢博弈方法求解DCOP問題。2.2MS理論與微電網優化控制結構設計2.21 MS的基本論結構Agnt研究源于分布式人工智能,到目前為止還沒有一個比較統一的概念,一般大家普遍認為Aent是一個具有一定的感知周圍環境以及自主執行特定任務的能力,能與其他個體進行信息共享交流的硬件或軟件的智能個體。Agnt概念已經廣泛應用于各種領域,在不同的研究領域,研究者根據自己學科特點提出了不同Ant概念,這些概念歸納起來,認為Ant除了具備自主性,反應性,主動性和社交能力外,從人工智能方面講,Ant還具備一定的擬人態,即具備人所特有的信念、知識、意圖、承諾等情感心智狀態。整體而言,Ant就是一個小智能體,具備各種人為添加的智能能力以滿足人們求解問題的需求[36]。MAS指的是由多個在軟件上或者物理位置上的功能獨立、具有通信能力和邏輯推理能力的Ant組成的相互作用、相互聯系系統[6,6]。系統部的Ant通過網絡連接,信息共享,相互協作完成共同的任務。在協作情況下,系統的整體求解問題的能力超過個體單獨求解問題總和。在求解問題時,單獨Ant通過交流只與有連接關系的Ant之間進行信息共享,且個體Ant能根據自身的周圍環境以及目自主做出決策,而不受其他Agnt的限制。Agnt與Ant之間存在競爭和合作關系,通過自身協調來解決目標與行為之間的沖突。一般認為MS具有以下特[87]:①每個Agnt都具有自治性。系統內的Agent能夠通過感知周圍的環境,在沒有中心控制器的情況下,根據獲得的信息以及所擁有的資源,按照自身目標獨立解決問題域中的子問題。這種能力是自發的,在局部信息下,Aent通過推理在滿足局部約束的情況下做出決策。②系統內部的交互性。每個Agnt的感知能力有限,但Agnt之間可通過通信與其他Ant進行互動交流。這種交互性,一方面使得Ant不必知曉系統全局信息,只需要通過信息交流網絡即可實現局部信息的共享,另一方面在求解大規模問題時,通過合作來完成系統的整體任務能提高其求解能力和求解的效率。MAS系統的連接結構是指各Agnt之間的通信和控制構建,一般來說,不同的連接結構,通信的傳播方式以效率、控制結果都不同。在采用MAS控制方式進行控制時,控制結構通常借鑒Ant之間的相對關系來構建,通常所采用的結構包括[3,]:①分布式結構在這類結構中,各Aent之間成通信對等,呈現信息局部化的分布式結構,Agnt之間無主次之分,所有Ant都處于平等地位,如圖2.1所示。網絡中的Agnt以自身的資源以及能力對系統的求解問題進行獨自評判,然后按照事先制定的規則以及策略進行通信協商,在協商中不斷的協調各Ant的行為決策以及資源分布,最終以既合作又競爭的方式完成系統的整體任務。該結構中的Ant類似于群體智能中個體,每個個體都能自發的進行目標探索而不受其他個體的控制,個體之間通過自由的信息交流能夠使得整體呈現一種集體智能的行為。圖2.1分式構g.2.1Dsbueducue這種結構中,Ant按照通信聯絡結構進行信息決策通信,除此之外,各代理在結構和功能上彼此獨立,結構靈活穩定,因此使系統具有很好的容錯性和擴展性,即使某個Agnt出現了問題,系統也能夠避開該Ant,尋找新的通信路徑。恰恰也正是因為這種分布式特性,使得Ant受限于局部和不完整的信息,在任務評價上難以實現全局判定。②分層結構在該類型系統結構中,根據實現的功能以及對象的結構不同,代理被分為不同的層次,有連接關系的上層Ant負責收集底層Ant的信息,通過自身獨立的控制策略計算推理后對下層代理進行控制以及任務的下達,最底層的Ant只負責信息收集和任務執行。Agnt之間信息交換只能在層與層之間有聯系的Agnt之間進行上下傳遞,處在同一層的Agnt不能進行信息交換。圖2.2分結構g.2.2Heachcalsucue這種結構屬于上層Aent對下層Ant進行集中控制,屬于分散的部分集中控制。該結構層次分明,不同的層次負責不同的任務;通信路徑明了,以上下級為載體進行信息共享;任務分配清晰,上層Aent作為任務分配和仲裁的主體協調下層Ant的行為。但是下層Ant過分依賴上層Ant,一旦上層Agnt失效,就會帶來系統控制的無法執行的問題。③混合型結構這種結構一般混合了分層結構和分布式結構,既具有分層控制的小集中控制,有兼顧了分布式控制的對等控制。在結構中,系統內部按照控制任務將Agnt劃分成不同的小系統,小系統內部的底層Ant功能與分層結構的底層Agnt類似,上層Ant負責該小系統內部任務管理分配以及不同小系統之間的通信、任務和沖突的協調。不同小系統之間的上層Agnt關系與分布式結構Ant之間的關系類似,都處于對等結構,它們能根據任務需求以及環境資源做出自由決策。此種結構結合了MAS分層式和分布式兩種結構的優點大規模系統采用分布式結構,小規模采用集中式結構,具有較高的靈活性和易擴展性,適合用于大型復雜多代理系統。適應分布式MAS復雜、開放的特性,該結構也是目前MAS普遍采用的系統結構。圖2.3混型構g.2.3Hbdsucue在MAS系統中運行過程中,由于存在著時間約束和資源約束,在有限時間與有限資源下,系統內Agnt之間由于利己目標存在,必然會存在競爭。與此同時,為了配合其他Agent完成系統的整體任務,Agnt之間需要進行協調合作。因此,MAS中Ant之間的競爭與合作是MAS研究的核心問題之一。通過競爭協調來合理安排Ant之間的目標資源,調整克制Ant各自的行為,最大程度的實現各自的目標。通過Ant合作,使得Ant保持行為目標一致,在共同完成系統目標的同時為各Agnt帶來更大的利益。①多代理競爭[5,]在MAS中每個Agnt具有自治性,在完成共同任務時,會按照自身的資源以及目標進行活動,在做出決策前,Ant會采取使自身利益最大化的行動。這樣,一旦Agnt之間競爭出現,在Agnt自主性和靈活性影響下,Agnt之間會由于利益分配問題造成沖突。如果沒有合理的沖突協調機制,系統任務可能就無法繼續進。目前,在MAS中協調沖突的主要方法包括協商法和規劃法等[77]。其中協商技術主要指的是用來促進系統協調的信息通信機制是Ant為就某一任務最終能達成相互可接受的通信過程。協商技術包括基于博弈論和基于對策論的方法。基于博弈論的方法主張從博弈方面來研究Agnt之間的信息交互機制并且在協商成功率、收益、穩定性等方面取得了良好的表現。而基于對策論的協商方法,主要研究假Agnt具有完備的全局知識能根據最大化效用的原則選擇自己應采取的行為但是在際上Agnt的并不具有完備知識而且Agnt由于個人隱私關系而不共享其效用信息。為了能更加準確的模擬現實世界中的問題,通常會引入社會規則來解決沖突,但是由于系統的動態變化使得制定的社會規則由于失去適用性而妨礙MAS的動態性。②多代理的合作[88]Agnt之間的合作是指具備不同個體目標的Ant,對自身行為進行改變以合理安排資源和目標,通過共同行為在滿足整體任務的情況下,同時也最大程度的實現各自目標。一般來說,當Ant通過通信交流發現有跡象表明合作能帶來更大的利益時Ant就會采取合作行為。對于具有共同目標的多代理系統,Ant的行為策略不僅要考慮自己的行為,而必須將自身的行為策略看作是對其它代理聯合行為策略的最優反應。從這個角度來看,Agnt不僅僅具有個體理性,而且具有集體理,從而使整個系統達到動態穩定和優化。Agnt的合作主要以協商的形式體現,即Agent通過通信進行各自目標交換,直到最終目標達成一致或無法達成協議為止。現有的協商方法主要有合同協議法,在合同協議中,nt被分成管理者和合作者,其中管理者并不固定,任何Agnt一旦發布任務需求則變成管理者,其他合作者對當前任務進行競爭,爭取能參與到項目中去,管理者擇優選擇。同時一旦合作者無法獨立完成任務時,可以繼續向下任務分解,變成下級管理者。一旦任務確定,就會建立相應的合同進行行為約束。2.22基于MS的微電混合優控制設計微電網由于其自身的運行特性,既可以孤島運行,也可以并網運行。隨著對新能源發展的需求越來越大,并網運行的微電網數量也會隨之增加。在數量眾多的微電網并入配電網運行時,優化控制的主要目標在于優化配電網內部電源和微電網的功率協調。為了有效的配合配電網的優化調度控制,并入配電網的單個微電網一方面要服從上級電網的調控命令,另一方面也要對自身的運行控制進行優化,有效的管理微電網內部各G的最優潮流分布。因此微電網的優化運行,不僅需要對微電網本身以及包含的G進行優化控制,也需要對微電網與微電網、微電網與配電網之間進行能量管理。面對多微電網的配電網運行環境,針對如此眾多的控制源進行統一直接的調度管理無論是從調度靈活性還是控制實時性準確都難以完成。在MAS的控制結構中,混合控制結構采用個體Ant集中控制,Agnt之間分布式控制的方法,該控制結構特別適合大規模系統,區域集中,區域間分布,容易建立任務明確結構分明的控制系統。從控制結構上,MAS理論的混合控制形式為多微電網系統的優化控制問題提供了合理的解決方案:系統中每一個可控源作為一個有自主能力的Agnt對DGAgnt采取集中控制形式組建微電網Agnt,而對微電網Ant之間采用分布式控制方法,解決大規模分散系統模型建立和信息收集難題造成的集中控制無法實施的難題。為此本文依據微電網的Ant關系設計了圖2.4所示的微電網優化控制結構。微電網運行環境 控制方法含多微電網的配電網優化控制微電網優 小規模單微電網的優化控制化控制微電網內部D控制

分布式優化控制方法集中式優化控制方法D運行控制方法圖2.4微網優控結構g.2.4Theopzaonconolsucueofcogd整個控制結構針對微電網的運行環境,自多微電網系統到系統中的單個小規模微電網再到微電網內部執行G的控制,從系統到個體分別設計了相應的控制方法策略:①含多微電網的配電網優化控制采用分布式優化控制的方法從系統層面來看,配電網中的微電網Ant之間地位對等,在滿足自身的優化運行的情況下,也要服從配電網的優化調度。但是在數目眾多的微電網Ant系統中,由于微電網Ant的控制方式不同,可控制程度各異,優化的局部約束與全局約束差異等造成建立集中式優化控制模型難以實現;同時,微電網G的運行具有波動性和間歇性Ant的信息具有個體隱私性會使得收集集中控制信息難以實施這樣無論是在計算模型還是在計算成本上,集中式控制方法都不能勝任含多微電網的配電網優化控制以局部信息局部處理為基礎的MAS分布式優化控制方法則從理論上為多微電網系統的分布式提供了解決途徑。在MAS分布式優化控制中,個體Agnt按照自身的局部信息從自身利益出發確定自己的行為通過與自身有連接關系的Agnt進行通信交流,最終以合作競爭的方式達成整體優化一致。②小規模單微電網的優化控制采用集中式優化控制方法。個體微電網Ant既要滿足微電網間的協調控制也要確保自身作為配電網“好公民在個體微電網Agnt收到調控命令時,優化調控微電網內部DGAnt的出力,解決可控,半可控DG和不可控G在微電網內部對微電網運行波動性的影響。由于微電網一般規模較小,需要優化的控制變量較少,在G波動的同時需要快速的進行優化控制動作。集中式優化控制方法在求解小規模系統時具有集中統籌,快速準確的特定,非常適合小規模單微電網系統的優化控制問題。③微電網內部G控制采用基本運行控制方法。微電網內部的DGAgent作為整個控制系統的最底層執行Agnt主要負責執行上層Agnt優化計算所提供的優化控制參考同時DGAnt也需要保證自身的穩定控制運行因此針對不同類型的G采用不同的運行控制方法,如矢量控制、Q控制、/f控制等,確保微電網的穩定運行。2.3基于MS理論的分布式優化控制方法實現分布式優化控制方法為多微電網系統的優化控制提供有效的解決方案。分布式優化控制問題歸根結底還是優化問題,如何將分布式優化思想實現仍然是需要研究的關鍵問題,首先需要解決優化模型建立問題,建立適合分布式優化求解模型其次提出符合MAS分布式理論的分布式優化控制算法在現有的理論中分布式約束優化問題和博弈論方法為上述問題的解決帶來了潛在可能。2.31分布式束優題隨著研究的深入,DCOP被認為是在MAS框架下進行問題的求解、協調和推理且能以算法實現的一種有效方法。DCOP是分布式約束滿足問題(DistributdConstrintStisftionProblm,DCSP)的一步擴展,而本身DCSP為傳統約束優化問題的擴展[28]。一個典型的約束優化問題由變量集,約束條件和全局效用函數組成,記(,C,),其中:①變量集D1, ,n,每一變量包含一定取值范圍,ajAj,即A為變量V的定義域;②約束集C1,2, ;③全局效用函數或者目標函數,u,用來評判系統中變量組合的優劣;約束c

c,c

被定義為變量集合cV與變量c的二元數,其中cjc束涉及變量定義域卡迪爾乘積的子集,vVAjjcDCSP問題于1974年Montnri在圖像處理中首先提出,隨后在人工智能以及計算機科學領域得到廣泛應用。與約束優化問題類似,DCSP由變量、變量值域以及變量之間的約束關系組成,問題的求解目標是為這些變量找到一組或多組滿足所有約束關系的解空間[]。其數學定義為:DCSP問題可以描述三元組(,,C),其中:①變量集V=1, ,n;②變量定義域集合D1, ,n,i為變量vi的取值空間,i

n,ii;③變量之間的約束關系集合CC1,C2, ,Cm,其中k是一個變量V的子集1, ,i,每個約束關系Ck是一組指定變量k所涉及到值域的卡迪爾乘積,Ck

iV

i。DCSP的解S為變量集中的變量在定義域內找到的滿足約束一組或多組取值,即存在有序集合S滿足S1, ,n,S為真,j,m。

ni1

i,且S

*SS*

CRj隨著硬件和計算技術的發展,分布式計算方法廣泛用到各個領域中,特別是人工智能中關系到協調Ant的分布式問題中。在MAS中,Ant之間往往存在各種約束,傳統方法直接將其處理成全局約束。但是由于Ant所處的環境不同,約束的范圍也不同,若按統一的約束來處理,會來帶來額外的計算開銷。現在已經逐漸開始將Agnt之間尋找滿足它們之間約束的動作組合的問題看作是DCSP問題。這樣,DSP問題就可以轉化為變量以及變量間的約束都分布在不同自治Agnt中的約束滿足問題,每一個變量由一個Agnt控制,通過滿足Agnt之間的分布式約束來尋找變量的值[6,]。從At布式約束滿足中,1,2,,m代表n個At,1,2,,m為變量;變量定義域為1,2,,mC個At區域At有At束及At私過Ant決到At值djDj量vj系cj。分布式約束優化問題DCOP是分布式約束滿足的進一步擴展,在分布式約束滿足的基礎上增加了一個目標函數。其求解過程為,在所有變量滿足約束關系的情況下,問題的解為變量使得目標函數最優的取值。分布式約束優化問題屬于復雜大規模動態網絡環境優化問題,它既具有傳統優化問題的計算復雜性、非線性等特點外,還具有信息局部性、求解網絡動態性、求解過程隨機性、網絡狀態異步更新等特點,這些都大大增加了分布式約束優化問題的求解難度[。DCOP有各種不同的含義,一般認為:一個分布式約束優化問題由含有n個節點m個約束的三元組組成[19],

V,,U,其中:①V1,2, ,n為變量集合,每一個變量被分配給單一的Agent;②D1,d2, ,dn為有限變量定義域;③U1,2, ,m為效用函數集合,每一個函數為涉及到變量取值組合所定義的效用,通常目標函數為效用函數之和:UXji,xji,xj

2.1)其中x1,2, ,nDDCOP求解目標就是求得某一變量組使得目標函數滿足:

D*g nUD

2.2)DCOP問題的求解實際上就是想找一組由Agent控制的變量賦值,通過Ant之間的通信,相互協調使全局目標函數最優。由于目標函數定義在全局的一組約束集合上,而每一個Agnt僅知道與自身變量相關的局部約束,因此,對于DCOP求解算法而言,需要具備[0,]:①分布性。由于分布式約束問題本身的分布性,在求解時Ant僅依靠自身所掌握的局部信息,利用通信交流進行求解,而不是按照傳統的方法將所有信息直接與所有Agnt共享;②同步性或異步性。算法在計算時,Agnt就可以采用時鐘步調進行同步計算,也可以在計算時各Ant不需要相互等待,采用異步通信,提高效率,加快求解速度;③收斂性與完備性。無論采用什么計算方法,算法都必須能保證最終能收斂到某一個穩定解,且能夠保證解釋最優解,或者為滿足要求的近似解。A1di,di,djji,x)001012102110A3 A4圖2.5分式束化題實例g.2.5Anxapeofdsibuedconanedopzaionpobem4圖2.5是一個DCOP的示例[],例子中給出4個Ant,每一個Agnt都只控制一個取值為0或1的變量,Agnt之間的約束關系如圖中的實線所示,約束取值問題的目標函數就是找到一組Agnt賦值,使得4然當所有Agnt都取1時函數值最小為0。DCOP求解算法既可以是完備的也可以是近似算法,主要采用搜索以及動態規劃方法。完備搜索算法主要由分布式約束滿足算法求解機制上改進而來。求解算法的主要思想為:以分布式約束滿足算法來求解滿足約束的變量取值,然后以目標函數為評價指標進行評判,以找到能使目標函數最優的解。關于DCOP其他分布式算法將會在第三章中進行詳細討論。2.32 勢博弈論博弈論被認為是分析決策制定的有力工具,在博弈論中決策者所扮演的角色類似于MAS中Ant,參與個體具有一定的理性,在制定決策的時候以一定的期望目標為基礎。博弈論可以分成合作博弈和非合作博弈,前者強調的是集體主義,團體理性,是研究個體達成合作時如何分配合作得到的收益,即收益分配問題;而后者是強調的是個體在利益相互影響的局勢中如何選擇決策使自己的收益最大,即策略選擇問題[]。非合作博弈這種既可以探討個體內部決策過程也可以研究個體間影響的優勢使得其非常適合用來分析MAS問題。合作博弈基本上沒有考慮個體問題,著重強調的群體利益,總體收益9]。因此,基于上述分析,本文主要考慮非合作博弈,在非合作博弈理論下來求解DCOP問題。在策略集合中,非合作博弈可以描述為數組=

N,(i,i)N

,包含參與人集N={1,….,n};策略集或者動作集i;效用函數i:A ,其中,iN.非合作博弈的聯合行動組合A是所有個體策略集Ai卡迪爾乘積[]:AiN

2.3)為了方便表述,這里將一些符號進行統一定義。稱a1,nA為典型的聯合行動組合,即為博弈的一種結果,在描述參與人i的策略選擇時也將其表述為ai,i},其中i為參與人i在其對手采用ai策略時所采用的策略。效用函數用來評估參與者的收益,當參與者偏向采用策略a而不是策略a時,有僅有iia。在非合作博弈中,一般認為個體Ant根據對手的選擇來確定自己的行為使得自身收益的最大化。最優反應可以定義為: iii:igxii,i

2.4) ii 如果無論參與人的對手采用何種策略,該參與人的最優反應是唯一的,則ii可以被稱為占優策略。當不管其他對手采用什么策略,參與人采取他的某個策略給他帶來的收益僅僅是不低于他選擇其他策略,換句話說,對于參與人來說,不存在某種策略,使得在不管其他對手采用什么策略的情況下,參與人采用該策略獲得的收益比采用其他策略獲得的收益要高。這樣,即可以得到博弈論中解的最簡單定義,占優策略均衡:ii,aiii,i0

i,

i,i

2.5)其中策略組合i為占優策略均衡。這一定義表明在占優策略均衡中,每一個參與者的選擇與其他參與者的選擇策略無關。實際上,大部分博弈都沒有占優策略解,否則博弈過程將十分繁瑣。然而,對于所有的有限博弈過程策略組合來說,都滿足納什均衡和相關均衡。納什均衡是一個弱應用解概念,同時也是博弈論中的一個比較重要的概念。iiiiii,aiii,ai0

i,i

2.6) 在納什均衡中每一個參與者都采取最佳響應,即對于所有的i∈ iii。因此,在一個參與者可以獨立選擇自身策略的博弈中,納什均衡是該博弈的一個穩定點,即任何一個參與人都無法獨立改變其所采用的策略。將(2.6)式中的不等式改成嚴格不等式即可得到嚴格納什均衡:ii,aiii,i0

ii,i

2.7) 嚴格納什均衡是博弈論收斂證明的必要組成部分,表明參與人任何單獨偏離不會得到改善。在式子2.7)中,納什均衡也是純策略納什均衡,因為在該均衡中,每一個參與者選擇某策略是確定的或者說選取的概率為1。一般假設參與具有一定的偏好,該偏好是關于純策略的一個概率分布集合i。定義在混合純策略上的概率分布為iii,也稱為混合策略。在混合策略下,參與者i的收益變成期望收益: ii,ijaji

2.8)AN 其中NN。據此,最佳響應也相應的擴展到混合策略中來,ii。混合納什均衡包含任意的純策略納什均衡,混合策略聯合組合納什均衡相應的改為混合策略納什均衡:u*,*u,*0

,i

2.9)或者:

i i i i i

i i *a

ua

*a

aua0

,i

2.10)AN

j ji

SN\i

j j

i i i i勢博弈的概念最早由Monder和Shpley于1996年提出,勢博弈是策略博弈的一個子集,每個勢博弈都服從一個勢函數,以指定參與者的共同偏好的結果[8,9]。勢博弈函數是聯合策略空間的實值函數,在勢函數中參與者效用的單方面改變量與勢函數變化量相等。勢函數的自然意義代表了參與者擁有從任意策略組合中逃逸出來以改善性能的機會。因為勢博弈包含所有參與者的策略概率,勢博弈函數的局部優化即為博弈的納什均衡1]。勢博弈理論因其良好的分布式優化性能,目前已經在很多學科得到應用,例如無線傳感器網絡能量控制,車輛運行調度以網絡擁塞控制等11]。對于勢博弈來說,假設存在函數P:A ,為博弈的序勢,如果有:Pi,iP,i0ii,ii,i0i,i,ii,iN

2.1)權 普重 通精確勢博弈 勢 勢博 博弈 弈圖2.6各勢弈間關系g.2.6Thereaonshpbeeendeentpoenalgaes普通勢函數是行動組合的函數,因此,勢函數改變量的符號與Ant收益單方面改變量相同。對于帶權重的勢博弈來說,如果有:ii,ii,iiPi,iP,ii,i,ii,iN

2.12)其中,i

為權重向量,在帶權重的勢博弈中參與者i的收益變化量等N于帶權重i勢函數的變化量。特別的有:Pi,iP,iii,ii,ii,i,ii,iN

2.13)滿足式子2.13)的勢博弈被稱為精確勢博弈,即其中1。各種勢博弈之間的關系如圖26所示。對于博弈來說,勢博弈函數表明博弈解的聯合偏好序列,這恰好確保了勢博弈兩個非常重要的特性:①每個有限的勢博弈中,至少存在一個純策略納什均衡[7,46]。假定P為博弈Γ的勢函數,則Γ的均衡集相應的為P的局部最大值,若a為Γ的均衡點,有且僅有對于任意的i∈,有:pap,i

i

2.14)相應的,如果P承認A中有最大值,則P在一個純策略納什均衡。純策略納什均衡是基于Ant分布式系統的特別需要的結果,因為純策略納什均衡代表的是一個穩定的結果,即保證了勢博弈問題至少有一個穩定的最優解。其次,混合策略均衡則代表的是概率穩定,是一種隨機變化的均衡策略組合。但是,更有可能的是不僅僅只存在一個納什均衡,而這些納什均衡可能也是次最優。勢博弈的第二個特性涉及到其性能改善循環次數。在博弈中,每一步代表參與者策略的一次改變,而勢博弈的一次改善步代

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論