在作為人工智能核心技術(shù)的機(jī)器學(xué)習(xí)領(lǐng)域, 強(qiáng)化學(xué)習(xí)是一類(lèi)強(qiáng)調(diào)機(jī)器在與環(huán)境的交互過(guò)程中進(jìn)行學(xué)習(xí)的方法, 其重要分支之一的自適應(yīng)評(píng)判技術(shù)與動(dòng)態(tài)規(guī)劃及最優(yōu)化設(shè)計(jì)密切相關(guān). 為了有效地求解復(fù)雜動(dòng)態(tài)系統(tǒng)的優(yōu)化控制問(wèn)題, 結(jié)合自適應(yīng)評(píng)判, 動(dòng)態(tài)規(guī)劃和人工神經(jīng)網(wǎng)絡(luò)產(chǎn)生的自適應(yīng)動(dòng)態(tài)規(guī)劃方法已經(jīng)得到廣泛關(guān)注, 特別在考慮不確定因素和外部擾動(dòng)時(shí)的魯棒自適應(yīng)評(píng)判控制方面取得了很大進(jìn)展, 并被認(rèn)為是構(gòu)建智能學(xué)習(xí)系統(tǒng)和實(shí)現(xiàn)真正類(lèi)腦智能的必要途徑. 本文對(duì)基于智能學(xué)習(xí)的魯棒自適應(yīng)評(píng)判控制理論與主要方法進(jìn)行梳理, 包括自學(xué)習(xí)魯棒鎮(zhèn)定, 自適應(yīng)軌跡跟蹤, 事件驅(qū)動(dòng)魯棒控制, 以及自適應(yīng)H-infinity控制設(shè)計(jì)等,并涵蓋關(guān)于自適應(yīng)評(píng)判系統(tǒng)穩(wěn)定性, 收斂性, 最優(yōu)性以及魯棒性的分析. 同時(shí), 結(jié)合人工智能, 大數(shù)據(jù), 深度學(xué)習(xí)和知識(shí)自動(dòng)化等新技術(shù), 也對(duì)魯棒自適應(yīng)評(píng)判控制的發(fā)展前景進(jìn)行探討.
利用自適應(yīng)動(dòng)態(tài)規(guī)劃方法進(jìn)行智能優(yōu)化決策的基礎(chǔ)是最優(yōu)控制設(shè)計(jì). 關(guān)于線(xiàn)性系統(tǒng)的最優(yōu)調(diào)節(jié)器設(shè)計(jì), 在控制理論和控制工程界已經(jīng)有很多成熟的方法. 然而, 對(duì)于一般的非線(xiàn)性系統(tǒng), 獲得Hamilton-Jacobi-Bellman方程的解析解并不是一件容易的事情. 此類(lèi)系統(tǒng)的最優(yōu)控制設(shè)計(jì)相當(dāng)困難, 但是卻相當(dāng)重要, 因此引起了人們的廣泛重視. 簡(jiǎn)單來(lái)說(shuō), 自適應(yīng)動(dòng)態(tài)規(guī)劃是一種基于智能學(xué)習(xí)思想的新興方法, 可以為復(fù)雜動(dòng)態(tài)系統(tǒng)提供有效的優(yōu)化控制解決方案. 在過(guò)去的二十年中, 自適應(yīng)動(dòng)態(tài)規(guī)劃在求解離散時(shí)間和連續(xù)時(shí)間系統(tǒng)的自適應(yīng)最優(yōu)控制問(wèn)題中得到了廣泛的應(yīng)用.
但是, 由于實(shí)際中的控制系統(tǒng)總是受著模型不確定性, 外界擾動(dòng)或其他變化的影響. 我們?cè)?a target="_blank">控制器設(shè)計(jì)過(guò)程中必須考慮這些因素, 以避免閉環(huán)系統(tǒng)性能的惡化, 提高被控系統(tǒng)的魯棒性能. 關(guān)于不確定系統(tǒng)的魯棒控制問(wèn)題, 控制學(xué)者們已經(jīng)取得了很多研究成果, 近幾年來(lái), 利用自適應(yīng)評(píng)判思想進(jìn)行魯棒控制設(shè)計(jì)逐漸成為自適應(yīng)動(dòng)態(tài)規(guī)劃領(lǐng)域的研究熱點(diǎn)之一, 有很多方法陸續(xù)被提出, 這里將它們統(tǒng)稱(chēng)為魯棒自適應(yīng)評(píng)判控制. 本文主要給出魯棒自適應(yīng)評(píng)判控制的最新研究進(jìn)展.
越來(lái)越多的證據(jù)表明, 最優(yōu)性在理解大腦智能的研究中具有重要作用. 考慮以在線(xiàn)方式實(shí)現(xiàn)對(duì)具有不確定性和未知?jiǎng)討B(tài)的復(fù)雜系統(tǒng)進(jìn)行最優(yōu)決策和智能控制這一宗旨, 自適應(yīng)動(dòng)態(tài)規(guī)劃可以為智能系統(tǒng)和類(lèi)腦智能研究做出相當(dāng)大的貢獻(xiàn). 正如其創(chuàng)始人Werbos博士指出的, 自適應(yīng)動(dòng)態(tài)規(guī)劃很可能是實(shí)現(xiàn)真正意義類(lèi)腦智能的關(guān)鍵方法. 因此, 為降低計(jì)算量和通信負(fù)擔(dān)的近似動(dòng)態(tài)規(guī)劃解決方案, 包括保證穩(wěn)定性, 收斂性, 最優(yōu)性和魯棒性的研究仍然需要大批學(xué)者的努力, 其中, 基于智能學(xué)習(xí)的魯棒自適應(yīng)評(píng)判控制設(shè)計(jì)也一定能夠取得更大的進(jìn)展.
-
人工智能
+關(guān)注
關(guān)注
1804文章
48677瀏覽量
246255 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8490瀏覽量
134031 -
魯棒
+關(guān)注
關(guān)注
0文章
45瀏覽量
11873
發(fā)布評(píng)論請(qǐng)先 登錄
永磁同步電機(jī)自適應(yīng)高階滑模Type-2模糊控制
自動(dòng)駕駛中常提的魯棒性是個(gè)啥?

自適應(yīng)電流焊接控制器:精準(zhǔn)調(diào)控,高效焊接
魯棒性原理在控制系統(tǒng)中的應(yīng)用
深度學(xué)習(xí)模型的魯棒性?xún)?yōu)化
魯棒性算法在數(shù)據(jù)處理中的應(yīng)用
魯棒性分析方法及其應(yīng)用
魯棒性在機(jī)器學(xué)習(xí)中的重要性
如何提高系統(tǒng)的魯棒性
步進(jìn)電機(jī)如何自適應(yīng)控制?步進(jìn)電機(jī)如何細(xì)分驅(qū)動(dòng)控制?
醫(yī)療機(jī)器人的發(fā)展前景
光伏能源發(fā)展前景怎樣
工商業(yè)儲(chǔ)能發(fā)展前景及配套電表選型探討

評(píng)論