1. مقدمه
کنترل پیشبین مدل (MPC) یک استراتژی کنترل پیشرفته قدرتمند است که به دلیل توانایی آن در مدیریت سیستمهای چندمتغیره با قیود شناخته شده است. با این حال، اتکای آن به حل یک مسئله بهینهسازی برخط در هر گام زمانی، بار محاسباتی قابل توجهی ایجاد میکند. این محدودیت به ویژه برای سیستمهای دارای منابع محاسباتی محدود، مانند سیستمهای نهفته، پهپادها یا دستگاههای محاسبات لبه، حاد است. رویکردهای سنتی برای کاهش این بار—مانند کوتاه کردن افق پیشبینی—اغلب تضمینهای عملکردی مانند همگرایی به حالت ماندگار را به خطر میاندازند. چارچوب MPC آگاه از حالت ماندگار، که به عنوان راهحلی معرفی شده، ردیابی خروجی و همگرایی به یک نقطه تعادل مطلوب را بدون محاسبات اضافی برخط تضمین میکند. با این حال، نقص بحرانی آن، عدم مقاومت در برابر اغتشاشات خارجی است که یک الزام غیرقابل مذاکره برای استقرار در دنیای واقعی است. این مقاله مستقیماً به این شکاف میپردازد و تکنیکهای کنترل قوی مبتنی بر لوله را در چارچوب MPC آگاه از حالت ماندگار ادغام میکند و روشی ایجاد میکند که هم از نظر محاسباتی کارآمد و هم در برابر اغتشاش مقاوم است.
2. پیشنیازها و بیان مسئله
مقاله سیستمهای خطی تغییرناپذیر با زمان (LTI) گسستهزمانی را در نظر میگیرد که تحت تأثیر اغتشاشات جمعی کراندار و قیود حالت/ورودی قرار دارند. مسئله اصلی طراحی یک قانون MPC است که: 1) با یک افق پیشبینی کوتاه و ثابت برای محدود کردن محاسبات برخط عمل کند. 2) رعایت قیود را در همه زمانها تضمین کند. 3) همگرایی به یک حالت ماندگار مطلوب را تضمین کند. 4) در برابر اغتشاشات خارجی پایدار و کراندار مقاوم باشد. سیستم به صورت زیر مدل میشود: $x_{k+1} = Ax_k + Bu_k + w_k$، که در آن $x_k \in \mathbb{R}^n$، $u_k \in \mathbb{R}^m$، و $w_k \in \mathbb{W} \subset \mathbb{R}^n$ یک اغتشاش کراندار است. مجموعههای $\mathbb{X}$ و $\mathbb{U}$ به ترتیب قیود حالت و ورودی را تعریف میکنند.
3. کنترل پیشبین مدل قوی آگاه از حالت ماندگار پیشنهادی
3.1 فرمولبندی هسته
کنترلکننده پیشنهادی بر پایه MPC اسمی آگاه از حالت ماندگار بنا شده است. کلید کار، پارامترسازی مسیر پیشبینی شده حالت است تا ذاتاً سیستم را به سمت یک حالت ماندگار امکانپذیر $(x_s, u_s)$ هدایت کند. مسئله بهینهسازی برخط به گونهای فرمولبندی شده است که یک تابع هزینه را در افق کوتاه کمینه کند، در حالی که قیود پایانی را اعمال میکند که حالت پیشبینی شده نهایی را به این حالت ماندگار مرتبط میسازد و ویژگیهای همگرایی افق بلند را علیرغم پنجره پیشبینی کوتاه تضمین میکند.
3.2 مدیریت اغتشاش بر پایه لوله
برای معرفی مقاومت، نویسندگان از یک استراتژی MPC مبتنی بر لوله استفاده میکنند. ایده مرکزی، تجزیه سیاست کنترل به دو مؤلفه است: یک ورودی اسمی که با حل MPC آگاه از حالت ماندگار برای یک مدل بدون اغتشاش محاسبه میشود، و یک قانون فیدبک کمکی که به صورت برونخط طراحی شده است تا حالت واقعی و مختل شده را درون یک «لوله» کراندار حول مسیر اسمی نگه دارد. این لوله، که اغلب به عنوان یک مجموعه ناوردای مثبت قوی (RPI) تعریف میشود، تضمین میکند که اگر حالت اسمی قیود سفتشده را ارضا کند، حالت واقعی علیرغم اغتشاشات، قیود اصلی را ارضا خواهد کرد. این جداسازی ظریف به این معنی است که مدیریت پیچیده قیود قوی به صورت برونخط انجام میشود و سادگی محاسباتی برخط کنترلکننده اسمی را حفظ میکند.
4. تحلیل نظری
4.1 امکانپذیری بازگشتی
مقاله یک اثبات دقیق ارائه میدهد که اگر مسئله بهینهسازی در گام زمانی اولیه امکانپذیر باشد، تحت عمل قانون کنترل پیشنهادی و در حضور اغتشاشات کراندار، برای تمام گامهای زمانی آینده نیز امکانپذیر باقی میماند. این یک نیاز اساسی برای هر پیادهسازی عملی MPC است.
4.2 پایداری حلقه بسته
نویسندگان با استفاده از تئوری پایداری لیاپانوف نشان میدهند که سیستم حلقه بسته با توجه به اغتشاش، پایدار ورودی به حالت (ISS) است. این بدان معناست که حالت سیستم در نهایت به یک ناحیه کراندار حول حالت ماندگار مطلوب همگرا میشود، که اندازه این ناحیه متناسب با کران اغتشاشات است.
5. نتایج شبیهسازی
شبیهسازیهای عددی روی یک سیستم معیار (مانند یک انتگرالگیر دوگانه) برای اعتبارسنجی عملکرد کنترلکننده استفاده شده است. معیارهای کلیدی شامل موارد زیر است: نقض قیود (هیچ موردی مشاهده نشد)، خطای همگرایی (کراندار درون لوله نظری)، و زمان محاسبه در هر گام کنترلی (به طور قابل توجهی کمتر از یک MPC قوی با افق بلند). نتایج به صورت بصری نشان میدهند که چگونه مسیر حالت واقعی درون لوله محاسبهشده حول مسیر اسمی باقی میماند، حتی تحت اغتشاشات پایدار.
6. اعتبارسنجی تجربی روی پهپاد Parrot Bebop 2
کاربرد عملی روش پیشنهادی روی یک پهپاد چهارپره Parrot Bebop 2، که پلتفرمی با توان پردازشی محدود رویبرد است، آزمایش شده است. هدف کنترلی، ردیابی مسیر (مانند یک الگوی هشتشکل) در حضور وزشهای باد شبیهسازیشده (مدلشده به عنوان اغتشاش) است. دادههای تجربی نشان میدهند که MPC قوی آگاه از حالت ماندگار با موفقیت پهپاد را با حداقل انحراف نزدیک به مسیر مطلوب نگه میدارد، در حالی که استفاده از CPU کامپیوتر رویبرد در محدوده قابل قبولی باقی میماند که کارایی محاسباتی و مقاومت روش در دنیای واقعی را تأیید میکند.
7. نتیجهگیری
مقاله با موفقیت یک چارچوب نوین MPC قوی ارائه میدهد که مزایای محاسباتی طراحی آگاه از حالت ماندگار را با تضمینهای مقاومت MPC مبتنی بر لوله ادغام میکند. این مقاله یک راهحل عملی برای پیادهسازی کنترل با عملکرد بالا و آگاه از قیود روی سیستمهای با منابع محدود که در محیطهای نامطمئن عمل میکنند، ارائه میدهد، همانطور که توسط تحلیل نظری و آزمایشهای سختافزاری اثبات شده است.
8. تحلیل اصیل و تفسیر کارشناسی
9. جزئیات فنی و چارچوب ریاضی
مسئله بهینهسازی برخط در زمان $k$ به صورت زیر است: $$ \begin{aligned} \min_{\mathbf{u}_k, x_s, u_s} &\quad \sum_{i=0}^{N-1} \ell(\bar{x}_{i|k} - x_s, \bar{u}_{i|k} - u_s) + V_f(\bar{x}_{N|k} - x_s) \\ \text{s.t.} &\quad \bar{x}_{0|k} = \hat{x}_k, \\ &\quad \bar{x}_{i+1|k} = A \bar{x}_{i|k} + B \bar{u}_{i|k}, \\ &\quad \bar{x}_{i|k} \in \bar{\mathbb{X}} \subseteq \mathbb{X} \ominus \mathcal{Z}, \\ &\quad \bar{u}_{i|k} \in \bar{\mathbb{U}} \subseteq \mathbb{U} \ominus K\mathcal{Z}, \\ &\quad \bar{x}_{N|k} \in x_s \oplus \mathcal{X}_f, \\ &\quad (x_s, u_s) \in \mathcal{Z}_{ss}. \end{aligned} $$ در اینجا، $\bar{x}, \bar{u}$ حالتها/ورودیهای اسمی هستند، $N$ افق کوتاه است، $\ell$ و $V_f$ به ترتیب هزینههای مرحلهای و پایانی هستند. عناصر بحرانی، مجموعههای قید سفتشده $\bar{\mathbb{X}}, \bar{\mathbb{U}}$ (مجموعههای اصلی منقبض شده توسط مجموعه RPI $\mathcal{Z}$ از طریق تفاضل پونتریاگین $\ominus$) و قانون کمکی $u_k = \bar{u}_{0|k}^* + K(x_k - \bar{x}_{0|k}^*)$ هستند، که در آن $K$ یک بهره پایدارکننده است. مجموعه $\mathcal{Z}_{ss}$ حالتهای ماندگار امکانپذیر را تعریف میکند.
10. چارچوب تحلیل: یک مطالعه موردی مفهومی
سناریو: پهپاد تحویل خودران که در یک دره شهری در حال ناوبری است (کامپیوتر با منابع محدود، اغتشاشات باد).
گام 1 – طراحی برونخط:
- مدل و مجموعه اغتشاش: شناسایی دینامیک خطیشده حول حالت شناور. مشخصسازی وزشهای باد به عنوان یک مجموعه کراندار $\mathbb{W}$ (مثلاً ±۲ متر بر ثانیه در صفحه افقی).
- محاسبه لوله RPI: طراحی بهره فیدبک $K$ (مثلاً LQR) و محاسبه مجموعه RPI مینیمال $\mathcal{Z}$ برای $e_{k+1} = (A+BK)e_k + w_k$. این «لوله خطا» را تعریف میکند.
- سفتسازی قیود: کوچک کردن دالان پرواز پهپاد (قیود حالت) و محدودیتهای رانش موتور (قیود ورودی) به اندازه $\mathcal{Z}$ و $K\mathcal{Z}$ برای به دست آوردن $\bar{\mathbb{X}}, \bar{\mathbb{U}}$.
- تعریف مجموعه حالت ماندگار: $\mathcal{Z}_{ss}$ شامل تمام نقاط شناور ثابت درون دالان سفتشده است.
- اندازهگیری حالت: دریافت موقعیت/سرعت فعلی پهپاد $x_k$ از حسگرها.
- حل MPC اسمی: حل QP کوچک (با استفاده از $\bar{\mathbb{X}}, \bar{\mathbb{U}}, \mathcal{Z}_{ss}$) برای به دست آوردن برنامه اسمی $\bar{u}^*$ و حالت ماندگار هدف.
- اعمال کنترل ترکیبی: $u_k = \bar{u}^*_{0|k} + K(x_k - \bar{x}^*_{0|k})$. عبارت اول مأموریت را هدایت میکند، عبارت دوم به طور فعال وزشهای باد را دفع میکند تا پهپاد را درون لوله نگه دارد.
11. کاربردهای آینده و جهتهای پژوهشی
- هوش مصنوعی لبه و اینترنت اشیاء: استقرار کنترل پیشرفته روی حسگرهای هوشمند، دستگاههای پوشیدنی و ریزرباتها برای انجام وظایف دقیق در ساختوساز و مراقبتهای بهداشتی.
- ازدحامهای خودران: کنترل مقیاسپذیر برای گروههای بزرگ پهپادها یا رباتهای ارزان و ساده که هر عامل محدودیت محاسباتی شدیدی دارد.
- پژوهش نسل بعدی:
- یادگیری لوله: استفاده از دادههای زمان واقعی برای تخمین سازگارشونده مجموعه اغتشاش $\mathbb{W}$ و کوچک کردن لوله، کاهش محافظهکاری. این با پارادایمهای MPC سازگارشونده و کنترل مبتنی بر یادگیری ادغام میشود.
- تعمیمهای غیرخطی: اعمال فلسفه به سیستمهای غیرخطی با استفاده از مفاهیم MPC لولهای غیرخطی یا تخت بودن دیفرانسیلی، که برای مانورهای تهاجمی پهپاد حیاتی است.
- همطراحی سختافزار-نرمافزار: ایجاد تراشههای نهفته تخصصی (FPGAها، ASICها) که برای حل QP خاص و کوچک این چارچوب با توان فوقالعاده پایین بهینهسازی شدهاند.
12. مراجع
- جعفری اوزومچلویی، ح.، و حسینزاده، م. (۱۴۰۲). کنترل پیشبین مدل قوی آگاه از حالت ماندگار برای سیستمهای با منابع محاسباتی محدود و اغتشاشات خارجی. [نام مجله].
- Mayne, D. Q., Seron, M. M., & Raković, S. V. (2005). Robust model predictive control of constrained linear systems with bounded disturbances. Automatica, 41(2), 219-224.
- Rawlings, J. B., Mayne, D. Q., & Diehl, M. M. (2017). Model Predictive Control: Theory, Computation, and Design (2nd ed.). Nob Hill Publishing.
- ETH Zurich, Automatic Control Laboratory. (بدون تاریخ). Lecture Notes on Model Predictive Control. بازیابی شده از [وبسایت مؤسسه].
- Hewing, L., Wabersich, K. P., Menner, M., & Zeilinger, M. N. (2020). Learning-based model predictive control: Toward safe learning in control. Annual Review of Control, Robotics, and Autonomous Systems, 3, 269-296.
بینش هستهای: این مقاله فقط یک تغییر جزئی دیگر در MPC نیست؛ بلکه یک مصالحه استراتژیک مهندسی است که با دقت جراحی اجرا شده است. نویسندگان نقطه دقیق مبادله بین قابلیت محاسباتی و عملکرد مقاوم برای سیستمهای نهفته را شناسایی کردهاند. آنها محدودیت افق پیشبینی کوتاه—یک امتیازدهی بزرگ—را میپذیرند، اما هوشمندانه تضمینهای از دست رفته (همگرایی حالت ماندگار، مقاومت) را از طریق طراحی هوشمندانه برونخط (مجموعههای لوله، پارامترسازی حالت ماندگار) بازمییابند. این، مهندسی کنترل به عنوان مدیریت منابع است.
جریان منطقی: استدلال قانعکننده و خطی است. با یک مسئله حلنشده (شکاف مقاومت در MPC کارآمد) شروع کنید، یک ابزار نظری مستحکم (MPC لولهای) را که به دلیل جداسازی پیچیدگی شناخته شده است انتخاب کنید، و آن را به طور یکپارچه در یک چارچوب کارآمد موجود (MPC آگاه از حالت ماندگار) ادغام کنید. اعتبارسنجی به طور منطقی از نظریه (اثباتها) به شبیهسازی (مفاهیم) و سپس به آزمایش (واقعیت روی یک پهپاد) ارتقا مییابد و از استاندارد طلایی مشابه آثار seminal مانند مقاله اصلی MPC لولهای توسط Mayne و همکاران (2005) در Automatica پیروی میکند.
نقاط قوت و ضعف: نقطه قوت اصلی کاربرد عملی است. با بهرهگیری از روشهای مبتنی بر لوله، این رویکرد نیاز به بهینهسازیهای مین-ماکس پیچیده برخط را دور میزند که از نظر محاسباتی مانعدار هستند. استفاده از پهپاد برای اعتبارسنجی عالی است—این یک پلتفرم مرتبط و با منابع محدود است. با این حال، ضعف در محافظهکاری ذاتی MPC لولهای نهفته است. محاسبه برونخط مجموعه RPI و سفتسازی متعاقب قیود میتواند به طور قابل توجهی ناحیه امکانپذیر کنترلکننده را کوچک کند و به طور بالقوده چابکی آن را محدود کند. این یک مبادله شناخته شده در کنترل قوی است، همانطور که در منابعی مانند جزوات درس آزمایشگاه کنترل خودکار دانشگاه ETH زوریخ در مورد کنترل مقید بحث شده است. مقاله میتوانست این افت عملکرد را به طور صریحتری در مقایسه با یک MPC قوی ایدهآل (با هزینه محاسباتی بالا) کمّی میکرد.
بینشهای قابل اجرا: برای متخصصان عملی: این یک نقشه راه آماده برای پیادهسازی MPC قوی روی دستگاههای لبه است. بر محاسبه کارآمد مجموعه RPI تمرکز کنید—استفاده از تقریبهای چندوجهی یا بیضوی را برای تعادل پیچیدگی و محافظهکاری در نظر بگیرید. برای پژوهشگران: مرز بعدی، لولههای سازگارشونده یا مبتنی بر یادگیری است. آیا شبکههای عصبی، مشابه آنهایی که در RL مبتنی بر مدل استفاده میشوند یا الهامگرفته از آثاری مانند کنترل پیشبین مدل مبتنی بر یادگیری (آموزشهای IEEE CDC)، میتوانند مجموعههای اغتشاش تنگتری را به صورت برخط یاد بگیرند و محافظهکاری را کاهش دهند در حالی که مقاومت حفظ میشود؟ این تکامل منطقی این کار خواهد بود.