1. 緒論
模型預測控制(MPC)是一種強大的進階控制策略,以其處理多變數約束系統的能力而聞名。然而,其依賴於在每個時間步線上求解最佳化問題,帶來了顯著的計算負擔。對於計算資源受限的系統,例如嵌入式系統、無人機或邊緣運算裝置,此限制尤其嚴重。傳統的緩解方法(例如縮短預測時域)通常會犧牲穩態收斂等效能保證。作為解決方案引入的穩態感知 MPC 框架,確保了輸出追蹤並收斂至期望的平衡點,而無需額外的線上計算。然而,其關鍵缺陷在於缺乏對外部擾動的穩健性,而這在實際部署中是不可妥協的要求。本文透過將基於管道的穩健控制技術整合到穩態感知 MPC 框架中,直接解決了這一缺口,創造出一種兼具計算效率與擾動韌性的方法。
2. 預備知識與問題陳述
本文考慮受有界加性擾動以及狀態/輸入約束的離散時間線性時不變(LTI)系統。核心問題是設計一個 MPC 法則,該法則:1) 使用短且固定的預測時域運作,以限制線上計算量。2) 始終保證滿足約束。3) 確保收斂至期望的穩態。4) 對持續、有界的外部擾動具有穩健性。系統建模為:$x_{k+1} = Ax_k + Bu_k + w_k$,其中 $x_k \in \mathbb{R}^n$,$u_k \in \mathbb{R}^m$,而 $w_k \in \mathbb{W} \subset \mathbb{R}^n$ 為有界擾動。集合 $\mathbb{X}$ 和 $\mathbb{U}$ 分別定義了狀態和輸入約束。
3. 提出的穩健穩態感知模型預測控制
3.1 核心公式
所提出的控制器建立在標稱穩態感知 MPC 之上。關鍵在於參數化預測的狀態軌跡,使其能從本質上驅動系統趨向一個可行的穩態 $(x_s, u_s)$。線上最佳化問題的公式化旨在最小化短時域內的成本函數,同時施加終端約束,將最終預測狀態與此穩態連結起來,從而確保即使在短預測視窗下,仍具有長時域收斂的特性。
3.2 基於管道的擾動處理
為了引入穩健性,作者採用了基於管道的 MPC 策略。核心思想是將控制策略分解為兩個部分:一個是透過求解無擾動模型的穩態感知 MPC 計算出的標稱輸入;另一個是離線設計的輔助回饋律,旨在將實際受擾動的狀態保持在標稱軌跡周圍的有界「管道」內。這個管道通常定義為一個穩健正不變(RPI)集合,它保證了如果標稱狀態滿足收緊後的約束,則實際狀態在擾動下仍將滿足原始約束。這種優雅的解耦意味著複雜的穩健約束處理是在離線完成的,從而保留了標稱控制器線上計算的簡潔性。
4. 理論分析
4.1 遞迴可行性
本文提供了嚴格的證明:如果最佳化問題在初始時間步是可行的,那麼在所提出的控制法則作用下,並且存在有界擾動的情況下,該問題在未來所有時間步都保持可行。這是任何實用 MPC 實現的基本要求。
4.2 閉迴路穩定性
作者利用李亞普諾夫穩定性理論,證明了閉迴路系統對於擾動是輸入至狀態穩定(ISS)的。這意味著系統的狀態最終將收斂到期望穩態周圍的一個有界區域,該區域的大小與擾動的界成正比。
5. 模擬結果
在基準系統(例如雙積分器)上進行了數值模擬,以驗證控制器的效能。關鍵指標包括:約束違反(未觀察到)、收斂誤差(在理論管道內有界)以及每個控制步的計算時間(顯著低於長時域穩健 MPC)。結果直觀地展示了即使在持續擾動下,實際狀態軌跡如何保持在計算出的標稱軌跡管道內。
6. 於 Parrot Bebop 2 上的實驗驗證
所提出方法的實用性在 Parrot Bebop 2 四軸飛行器無人機上進行了測試,這是一個機載處理能力有限的平台。控制目標是在存在模擬陣風(建模為擾動)的情況下進行軌跡追蹤(例如八字形路徑)。實驗數據顯示,穩健穩態感知 MPC 成功將無人機維持在期望路徑附近,偏差極小,同時機載電腦的 CPU 使用率保持在可接受的範圍內,證實了該方法的計算效率和實際穩健性。
7. 結論
本文成功地提出了一種新穎的穩健 MPC 框架,它融合了穩態感知設計的計算優勢與基於管道的 MPC 的穩健性保證。正如理論分析和硬體實驗所證明的那樣,它為在不確定環境中運行的資源受限系統實現高效能、具約束感知的控制提供了一個可行的解決方案。
8. 原創分析與專家評論
9. 技術細節與數學框架
在時間 $k$ 的線上最佳化問題為: $$ \begin{aligned} \min_{\mathbf{u}_k, x_s, u_s} &\quad \sum_{i=0}^{N-1} \ell(\bar{x}_{i|k} - x_s, \bar{u}_{i|k} - u_s) + V_f(\bar{x}_{N|k} - x_s) \\ \text{s.t.} &\quad \bar{x}_{0|k} = \hat{x}_k, \\ &\quad \bar{x}_{i+1|k} = A \bar{x}_{i|k} + B \bar{u}_{i|k}, \\ &\quad \bar{x}_{i|k} \in \bar{\mathbb{X}} \subseteq \mathbb{X} \ominus \mathcal{Z}, \\ &\quad \bar{u}_{i|k} \in \bar{\mathbb{U}} \subseteq \mathbb{U} \ominus K\mathcal{Z}, \\ &\quad \bar{x}_{N|k} \in x_s \oplus \mathcal{X}_f, \\ &\quad (x_s, u_s) \in \mathcal{Z}_{ss}. \end{aligned} $$ 這裡,$\bar{x}, \bar{u}$ 是標稱狀態/輸入,$N$ 是短時域,$\ell$ 和 $V_f$ 是階段成本和終端成本。關鍵要素是收緊的約束集合 $\bar{\mathbb{X}}, \bar{\mathbb{U}}$(原始集合透過龐特里亞金差 $\ominus$ 被 RPI 集合 $\mathcal{Z}$ 縮小),以及輔助律 $u_k = \bar{u}_{0|k}^* + K(x_k - \bar{x}_{0|k}^*)$,其中 $K$ 是一個穩定化增益。集合 $\mathcal{Z}_{ss}$ 定義了可行的穩態。
10. 分析框架:概念性案例研究
情境: 在城市峽谷中導航的自動送貨無人機(資源受限的電腦,風擾動)。
步驟 1 – 離線設計:
- 模型與擾動集合: 識別懸停狀態附近的線性化動態。將陣風特徵化為一個有界集合 $\mathbb{W}$(例如,水平面內 ±2 m/s)。
- 計算 RPI 管道: 設計回饋增益 $K$(例如,LQR)並為 $e_{k+1} = (A+BK)e_k + w_k$ 計算最小 RPI 集合 $\mathcal{Z}$。這定義了「誤差管道」。
- 收緊約束: 將無人機的飛行走廊(狀態約束)和馬達推力限制(輸入約束)分別縮小 $\mathcal{Z}$ 和 $K\mathcal{Z}$,得到 $\bar{\mathbb{X}}, \bar{\mathbb{U}}$。
- 定義穩態集合: $\mathcal{Z}_{ss}$ 包含收緊後走廊內的所有靜止懸停點。
- 量測狀態: 從感測器獲取當前無人機位置/速度 $x_k$。
- 求解標稱 MPC: 求解小型 QP(使用 $\bar{\mathbb{X}}, \bar{\mathbb{U}}, \mathcal{Z}_{ss}$)以獲得標稱計劃 $\bar{u}^*$ 和目標穩態。
- 應用複合控制: $u_k = \bar{u}^*_{0|k} + K(x_k - \bar{x}^*_{0|k})$。第一項指導任務,第二項主動抑制陣風以將無人機保持在管道內。
11. 未來應用與研究方向
- 邊緣人工智慧與物聯網: 在智慧感測器、穿戴式裝置和微型機器人上部署進階控制,用於製造和醫療保健領域的精密任務。
- 自主集群: 為大型群組的廉價、簡單無人機或機器人提供可擴展的控制,其中每個個體都有嚴格的計算限制。
- 下一代研究:
- 學習管道: 使用即時資料自適應地估計擾動集合 $\mathbb{W}$ 並縮小管道,減少保守性。這與自適應 MPC 和基於學習的控制範式相結合。
- 非線性擴展: 將此理念應用於非線性系統,使用非線性管道 MPC 或微分平坦度的概念,這對於無人機的劇烈機動至關重要。
- 硬體-軟體協同設計: 創建專門的嵌入式晶片(FPGA、ASIC),針對以超低功耗求解此框架特定的小型 QP 進行最佳化。
12. 參考文獻
- Jafari Ozoumchelooei, H., & Hosseinzadeh, M. (2023). Robust Steady-State-Aware Model Predictive Control for Systems with Limited Computational Resources and External Disturbances. [期刊名稱].
- Mayne, D. Q., Seron, M. M., & Raković, S. V. (2005). Robust model predictive control of constrained linear systems with bounded disturbances. Automatica, 41(2), 219-224.
- Rawlings, J. B., Mayne, D. Q., & Diehl, M. M. (2017). Model Predictive Control: Theory, Computation, and Design (2nd ed.). Nob Hill Publishing.
- ETH Zurich, Automatic Control Laboratory. (n.d.). Lecture Notes on Model Predictive Control. Retrieved from [研究所網站].
- Hewing, L., Wabersich, K. P., Menner, M., & Zeilinger, M. N. (2020). Learning-based model predictive control: Toward safe learning in control. Annual Review of Control, Robotics, and Autonomous Systems, 3, 269-296.
核心洞見: 這篇論文不僅僅是對 MPC 的又一次漸進式調整;它是一次以精準外科手術般執行的策略性工程折衷。作者為嵌入式系統找到了計算可處理性與穩健效能之間的精確權衡點。他們接受了短預測時域的限制——這是一個重大讓步——但透過巧妙的離線設計(管道集合、穩態參數化),巧妙地挽回了失去的保證(穩態收斂、穩健性)。這就是將控制工程視為資源管理。
邏輯流程: 論證引人注目且線性。從一個未解決的問題(高效能 MPC 中的穩健性缺口)出發,選擇一個理論上可靠的工具(管道 MPC),該工具以解耦複雜性而聞名,並將其無縫整合到現有的高效能框架(穩態感知 MPC)中。驗證從理論(證明)到模擬(概念)再到實驗(無人機上的現實),邏輯上逐步升級,遵循了由 Mayne 等人(2005)在《Automatica》上發表的原始管道 MPC 論文等開創性工作所體現的黃金標準。
優點與缺陷: 主要優點是實用性。透過利用基於管道的方法,該方法避免了需要複雜的線上最小-最大最佳化,這些最佳化在計算上是難以負擔的。使用無人機進行驗證非常出色——它是一個相關且資源受限的平台。然而,缺陷在於管道 MPC 固有的保守性。RPI 集合的離線計算以及隨後的約束收緊可能會顯著縮小控制器的可行區域,從而可能限制其靈活性。這是穩健控制中眾所周知的權衡,正如蘇黎世聯邦理工學院《自動控制實驗室》關於約束控制的講義等資源中所討論的那樣。本文本可以更明確地量化這種效能損失,與(計算昂貴的)理想穩健 MPC 進行對比。
可操作的見解: 對於實務工作者:這是在邊緣裝置上實現穩健 MPC 的現成藍圖。重點在於高效能計算 RPI 集合——考慮使用多面體或橢球近似來平衡複雜性和保守性。對於研究人員:下一個前沿是自適應或基於學習的管道。神經網路(類似於基於模型的強化學習或受《基於學習的模型預測控制》(IEEE CDC 教程)等作品啟發)能否在線上學習更緊密的擾動集合,在保持穩健性的同時減少保守性?這將是這項工作的邏輯演進。