迭代學習控制(iterative learning control,簡稱ILC)由Arimoto等人于1984年正式提出,它是指不斷重復一個同樣軌跡的控制嘗試,并以此修正控制律,以得到非常好的控制效果的控制方法。迭代學習控制是學習控制的一個重要分支,是一種新型學習控制策略。它通過反復應用先前試驗得到的信息來獲得能夠產生期望輸出軌跡的控制輸入,以改善控制質量。與傳統的控制方法不同的是,迭代學習控制能以非常簡單的方式處理不確定度相當高的動態系統,且僅需較少的先驗知識和計算量,同時適應性強,易于實現;更主要的是,它不依賴于動態系統的精確數學模型,是一種以迭代產生優化輸入信號,使系統輸出盡可能逼近理想值的算法。它的研究對那些有著非線性、復雜性、難以建模以及高精度軌跡控制問題有著非常重要的意義。
前饋式學習控制結構
針對設計部分依賴、不完全依賴和不依賴受控系統數學模型的控制系統,國內外控制理論界做了多年的努力,發展了許多理論和方法。例如專家系統、模糊控制[1]、神經網絡、多模型方法等。最近無模型自適應控制理論得到了廣泛的應用,該控制器的設計和分析不需要已知系統的任何知識,僅依賴于系統的輸入輸出數據,與模型結構、系統階數均無關。
迭代學習控制(ILC)可利用以前操作的信息修正當前控制行為,提高控制性能,可以實現有限時間區間上的完全跟蹤任務,近十幾年來得到了廣泛的研究[。池榮虎將非參數自適應控制(NP-AC)的基本思想和分析手段引入到學習過程中,提出了一種新的無模型自適應迭代學習控制方案(MF-AILC)??紤]如下一般非線性離散時間SISO系統:
這種控制方案只需系統的輸入輸出數據,與系統的模型結構、系統階數無關。
神經網絡是借鑒于生物神經網絡而發展起來的新型智能信息處理系統,可作為一般的函數估計器,有較強的自學習、自組織與自適應性,能夠用數理方法從信息處理的角度對人腦神經網絡進行抽象,并建立某種簡化模型。模糊神經網絡將神經網絡與模糊邏輯[5]相結合,這種結合給智能系統提供了一個新的研究方向[6]。
根據系統的運行狀態,調整控制器的參數-擬偽偏導數θ(k,t),以達到某種性能指標的最優化,使輸出層的輸出對應于擬偽偏導數θ(k,t),通過神經網絡的自身學習、加權系數調整,使其穩定狀態對應于某種最優控制律下的無模型自適應控制器的參數。利用模糊控制的魯棒性和非線性控制作用,對神經網絡NN的輸入進行預處理,避免了當神經網絡用Sigmoid函數或雙曲正切函數時,由于輸入過大易導致輸出趨于飽和使得對輸入不再敏感。
2 算法實現
BP算法是學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。正向傳播時,輸入樣本從輸入層傳人,經各隱層逐層處理后,傳向輸出層。若輸出層的實際輸出與期望的輸出(教師信號)不符,則轉入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權值的依據。這種信號正向傳播與誤差反向傳播的各層權值調整過程,是周而復始地進行的。權值不斷調整的過程,也就是網絡的學習訓練過程。此過程一直進行到網絡輸出的誤差減少到可接受的程度,或進行到預先設定的學習次數為止。
2.1 BP神經網絡
三層BP神經網絡,有M個輸入節點、Q個隱層節點、一個輸出節點,輸出節點對應無模型自適應迭代學習控制器的逆為偏導數θ(k,t),輸出層和隱層的神經元的激勵函數可取正負對稱的Sigmoid函數。
BP網絡的前向計算和加權系數修正迭代算法如下:
輸入節點對應經模糊量化處理后的系統狀態變量:
將BP神經網絡、模糊理論及無模型自適應迭代學習相結合,構造出了一種基于BP神經網絡的模糊無模型自適應迭代學習控制器。該控制器綜合了三者的優點,利用有著較強的非線性逼近性的BP神經網絡學習逆偽偏導數。迭代學習控制適用于具有重復運動性質的被控系統,它的目標是實現有線區間上的完全跟蹤任務。它通過對被控系統進行控制嘗試,以輸出信號與給定目標的偏差修正不理想的控制信號,使得系統的跟蹤性能得以提高。迭代學習控制的研究對具有較強的非線性耦合、較高的位置重復精度、難以建模和高精度軌跡跟蹤控制要求的動力學系統有著非常重要的意義。
-
控制器
+關注
關注
114文章
16959瀏覽量
182857 -
神經網絡
+關注
關注
42文章
4806瀏覽量
102734 -
處理系統
+關注
關注
0文章
93瀏覽量
16878
發布評論請先 登錄
基于BP神經網絡控制+Simulink雙閉環直流調速系統仿真設計
基于BP神經網絡的PID控制
一種改進的自適應遺傳算法優化BP神經網絡

基于擴展反向傳播神經網絡的自適應控制方法
如何使用S函數實現BP神經網絡PID控制器及Simulink仿真的資料說明

評論