انتخاب زبان

کنترل پیش‌بین مدل قوی آگاه از حالت ماندگار برای سیستم‌های با منابع محاسباتی محدود و اغتشاشات

یک چارچوب نوین کنترل پیش‌بین مدل قوی که آگاهی از حالت ماندگار را با طراحی لوله‌ای برای سیستم‌های دارای منابع محاسباتی محدود و اغتشاشات خارجی ترکیب می‌کند.
computepowercoin.com | PDF Size: 0.9 MB
امتیاز: 4.5/5
امتیاز شما
شما قبلاً به این سند امتیاز داده اید
جلد سند PDF - کنترل پیش‌بین مدل قوی آگاه از حالت ماندگار برای سیستم‌های با منابع محاسباتی محدود و اغتشاشات

1. مقدمه

کنترل پیش‌بین مدل (MPC) یک استراتژی کنترل پیشرفته قدرتمند است که به دلیل توانایی آن در مدیریت سیستم‌های چندمتغیره با قیود شناخته شده است. با این حال، اتکای آن به حل یک مسئله بهینه‌سازی برخط در هر گام زمانی، بار محاسباتی قابل توجهی ایجاد می‌کند. این محدودیت به ویژه برای سیستم‌های دارای منابع محاسباتی محدود، مانند سیستم‌های نهفته، پهپادها یا دستگاه‌های محاسبات لبه، حاد است. رویکردهای سنتی برای کاهش این بار—مانند کوتاه کردن افق پیش‌بینی—اغلب تضمین‌های عملکردی مانند همگرایی به حالت ماندگار را به خطر می‌اندازند. چارچوب MPC آگاه از حالت ماندگار، که به عنوان راه‌حلی معرفی شده، ردیابی خروجی و همگرایی به یک نقطه تعادل مطلوب را بدون محاسبات اضافی برخط تضمین می‌کند. با این حال، نقص بحرانی آن، عدم مقاومت در برابر اغتشاشات خارجی است که یک الزام غیرقابل مذاکره برای استقرار در دنیای واقعی است. این مقاله مستقیماً به این شکاف می‌پردازد و تکنیک‌های کنترل قوی مبتنی بر لوله را در چارچوب MPC آگاه از حالت ماندگار ادغام می‌کند و روشی ایجاد می‌کند که هم از نظر محاسباتی کارآمد و هم در برابر اغتشاش مقاوم است.

2. پیش‌نیازها و بیان مسئله

مقاله سیستم‌های خطی تغییرناپذیر با زمان (LTI) گسسته‌زمانی را در نظر می‌گیرد که تحت تأثیر اغتشاشات جمعی کران‌دار و قیود حالت/ورودی قرار دارند. مسئله اصلی طراحی یک قانون MPC است که: 1) با یک افق پیش‌بینی کوتاه و ثابت برای محدود کردن محاسبات برخط عمل کند. 2) رعایت قیود را در همه زمان‌ها تضمین کند. 3) همگرایی به یک حالت ماندگار مطلوب را تضمین کند. 4) در برابر اغتشاشات خارجی پایدار و کران‌دار مقاوم باشد. سیستم به صورت زیر مدل می‌شود: $x_{k+1} = Ax_k + Bu_k + w_k$، که در آن $x_k \in \mathbb{R}^n$، $u_k \in \mathbb{R}^m$، و $w_k \in \mathbb{W} \subset \mathbb{R}^n$ یک اغتشاش کران‌دار است. مجموعه‌های $\mathbb{X}$ و $\mathbb{U}$ به ترتیب قیود حالت و ورودی را تعریف می‌کنند.

3. کنترل پیش‌بین مدل قوی آگاه از حالت ماندگار پیشنهادی

3.1 فرمول‌بندی هسته

کنترل‌کننده پیشنهادی بر پایه MPC اسمی آگاه از حالت ماندگار بنا شده است. کلید کار، پارامترسازی مسیر پیش‌بینی شده حالت است تا ذاتاً سیستم را به سمت یک حالت ماندگار امکان‌پذیر $(x_s, u_s)$ هدایت کند. مسئله بهینه‌سازی برخط به گونه‌ای فرمول‌بندی شده است که یک تابع هزینه را در افق کوتاه کمینه کند، در حالی که قیود پایانی را اعمال می‌کند که حالت پیش‌بینی شده نهایی را به این حالت ماندگار مرتبط می‌سازد و ویژگی‌های همگرایی افق بلند را علیرغم پنجره پیش‌بینی کوتاه تضمین می‌کند.

3.2 مدیریت اغتشاش بر پایه لوله

برای معرفی مقاومت، نویسندگان از یک استراتژی MPC مبتنی بر لوله استفاده می‌کنند. ایده مرکزی، تجزیه سیاست کنترل به دو مؤلفه است: یک ورودی اسمی که با حل MPC آگاه از حالت ماندگار برای یک مدل بدون اغتشاش محاسبه می‌شود، و یک قانون فیدبک کمکی که به صورت برون‌خط طراحی شده است تا حالت واقعی و مختل شده را درون یک «لوله» کران‌دار حول مسیر اسمی نگه دارد. این لوله، که اغلب به عنوان یک مجموعه ناوردای مثبت قوی (RPI) تعریف می‌شود، تضمین می‌کند که اگر حالت اسمی قیود سفت‌شده را ارضا کند، حالت واقعی علیرغم اغتشاشات، قیود اصلی را ارضا خواهد کرد. این جداسازی ظریف به این معنی است که مدیریت پیچیده قیود قوی به صورت برون‌خط انجام می‌شود و سادگی محاسباتی برخط کنترل‌کننده اسمی را حفظ می‌کند.

4. تحلیل نظری

4.1 امکان‌پذیری بازگشتی

مقاله یک اثبات دقیق ارائه می‌دهد که اگر مسئله بهینه‌سازی در گام زمانی اولیه امکان‌پذیر باشد، تحت عمل قانون کنترل پیشنهادی و در حضور اغتشاشات کران‌دار، برای تمام گام‌های زمانی آینده نیز امکان‌پذیر باقی می‌ماند. این یک نیاز اساسی برای هر پیاده‌سازی عملی MPC است.

4.2 پایداری حلقه بسته

نویسندگان با استفاده از تئوری پایداری لیاپانوف نشان می‌دهند که سیستم حلقه بسته با توجه به اغتشاش، پایدار ورودی به حالت (ISS) است. این بدان معناست که حالت سیستم در نهایت به یک ناحیه کران‌دار حول حالت ماندگار مطلوب همگرا می‌شود، که اندازه این ناحیه متناسب با کران اغتشاشات است.

5. نتایج شبیه‌سازی

شبیه‌سازی‌های عددی روی یک سیستم معیار (مانند یک انتگرال‌گیر دوگانه) برای اعتبارسنجی عملکرد کنترل‌کننده استفاده شده است. معیارهای کلیدی شامل موارد زیر است: نقض قیود (هیچ موردی مشاهده نشد)، خطای همگرایی (کران‌دار درون لوله نظری)، و زمان محاسبه در هر گام کنترلی (به طور قابل توجهی کمتر از یک MPC قوی با افق بلند). نتایج به صورت بصری نشان می‌دهند که چگونه مسیر حالت واقعی درون لوله محاسبه‌شده حول مسیر اسمی باقی می‌ماند، حتی تحت اغتشاشات پایدار.

6. اعتبارسنجی تجربی روی پهپاد Parrot Bebop 2

کاربرد عملی روش پیشنهادی روی یک پهپاد چهارپره Parrot Bebop 2، که پلتفرمی با توان پردازشی محدود روی‌برد است، آزمایش شده است. هدف کنترلی، ردیابی مسیر (مانند یک الگوی هشت‌شکل) در حضور وزش‌های باد شبیه‌سازی‌شده (مدل‌شده به عنوان اغتشاش) است. داده‌های تجربی نشان می‌دهند که MPC قوی آگاه از حالت ماندگار با موفقیت پهپاد را با حداقل انحراف نزدیک به مسیر مطلوب نگه می‌دارد، در حالی که استفاده از CPU کامپیوتر روی‌برد در محدوده قابل قبولی باقی می‌ماند که کارایی محاسباتی و مقاومت روش در دنیای واقعی را تأیید می‌کند.

7. نتیجه‌گیری

مقاله با موفقیت یک چارچوب نوین MPC قوی ارائه می‌دهد که مزایای محاسباتی طراحی آگاه از حالت ماندگار را با تضمین‌های مقاومت MPC مبتنی بر لوله ادغام می‌کند. این مقاله یک راه‌حل عملی برای پیاده‌سازی کنترل با عملکرد بالا و آگاه از قیود روی سیستم‌های با منابع محدود که در محیط‌های نامطمئن عمل می‌کنند، ارائه می‌دهد، همان‌طور که توسط تحلیل نظری و آزمایش‌های سخت‌افزاری اثبات شده است.

8. تحلیل اصیل و تفسیر کارشناسی

بینش هسته‌ای: این مقاله فقط یک تغییر جزئی دیگر در MPC نیست؛ بلکه یک مصالحه استراتژیک مهندسی است که با دقت جراحی اجرا شده است. نویسندگان نقطه دقیق مبادله بین قابلیت محاسباتی و عملکرد مقاوم برای سیستم‌های نهفته را شناسایی کرده‌اند. آنها محدودیت افق پیش‌بینی کوتاه—یک امتیازدهی بزرگ—را می‌پذیرند، اما هوشمندانه تضمین‌های از دست رفته (همگرایی حالت ماندگار، مقاومت) را از طریق طراحی هوشمندانه برون‌خط (مجموعه‌های لوله، پارامترسازی حالت ماندگار) بازمی‌یابند. این، مهندسی کنترل به عنوان مدیریت منابع است.

جریان منطقی: استدلال قانع‌کننده و خطی است. با یک مسئله حل‌نشده (شکاف مقاومت در MPC کارآمد) شروع کنید، یک ابزار نظری مستحکم (MPC لوله‌ای) را که به دلیل جداسازی پیچیدگی شناخته شده است انتخاب کنید، و آن را به طور یکپارچه در یک چارچوب کارآمد موجود (MPC آگاه از حالت ماندگار) ادغام کنید. اعتبارسنجی به طور منطقی از نظریه (اثبات‌ها) به شبیه‌سازی (مفاهیم) و سپس به آزمایش (واقعیت روی یک پهپاد) ارتقا می‌یابد و از استاندارد طلایی مشابه آثار seminal مانند مقاله اصلی MPC لوله‌ای توسط Mayne و همکاران (2005) در Automatica پیروی می‌کند.

نقاط قوت و ضعف: نقطه قوت اصلی کاربرد عملی است. با بهره‌گیری از روش‌های مبتنی بر لوله، این رویکرد نیاز به بهینه‌سازی‌های مین-ماکس پیچیده برخط را دور می‌زند که از نظر محاسباتی مانع‌دار هستند. استفاده از پهپاد برای اعتبارسنجی عالی است—این یک پلتفرم مرتبط و با منابع محدود است. با این حال، ضعف در محافظه‌کاری ذاتی MPC لوله‌ای نهفته است. محاسبه برون‌خط مجموعه RPI و سفت‌سازی متعاقب قیود می‌تواند به طور قابل توجهی ناحیه امکان‌پذیر کنترل‌کننده را کوچک کند و به طور بالقوده چابکی آن را محدود کند. این یک مبادله شناخته شده در کنترل قوی است، همان‌طور که در منابعی مانند جزوات درس آزمایشگاه کنترل خودکار دانشگاه ETH زوریخ در مورد کنترل مقید بحث شده است. مقاله می‌توانست این افت عملکرد را به طور صریح‌تری در مقایسه با یک MPC قوی ایده‌آل (با هزینه محاسباتی بالا) کمّی می‌کرد.

بینش‌های قابل اجرا: برای متخصصان عملی: این یک نقشه راه آماده برای پیاده‌سازی MPC قوی روی دستگاه‌های لبه است. بر محاسبه کارآمد مجموعه RPI تمرکز کنید—استفاده از تقریب‌های چندوجهی یا بیضوی را برای تعادل پیچیدگی و محافظه‌کاری در نظر بگیرید. برای پژوهشگران: مرز بعدی، لوله‌های سازگارشونده یا مبتنی بر یادگیری است. آیا شبکه‌های عصبی، مشابه آن‌هایی که در RL مبتنی بر مدل استفاده می‌شوند یا الهام‌گرفته از آثاری مانند کنترل پیش‌بین مدل مبتنی بر یادگیری (آموزش‌های IEEE CDC)، می‌توانند مجموعه‌های اغتشاش تنگ‌تری را به صورت برخط یاد بگیرند و محافظه‌کاری را کاهش دهند در حالی که مقاومت حفظ می‌شود؟ این تکامل منطقی این کار خواهد بود.

9. جزئیات فنی و چارچوب ریاضی

مسئله بهینه‌سازی برخط در زمان $k$ به صورت زیر است: $$ \begin{aligned} \min_{\mathbf{u}_k, x_s, u_s} &\quad \sum_{i=0}^{N-1} \ell(\bar{x}_{i|k} - x_s, \bar{u}_{i|k} - u_s) + V_f(\bar{x}_{N|k} - x_s) \\ \text{s.t.} &\quad \bar{x}_{0|k} = \hat{x}_k, \\ &\quad \bar{x}_{i+1|k} = A \bar{x}_{i|k} + B \bar{u}_{i|k}, \\ &\quad \bar{x}_{i|k} \in \bar{\mathbb{X}} \subseteq \mathbb{X} \ominus \mathcal{Z}, \\ &\quad \bar{u}_{i|k} \in \bar{\mathbb{U}} \subseteq \mathbb{U} \ominus K\mathcal{Z}, \\ &\quad \bar{x}_{N|k} \in x_s \oplus \mathcal{X}_f, \\ &\quad (x_s, u_s) \in \mathcal{Z}_{ss}. \end{aligned} $$ در اینجا، $\bar{x}, \bar{u}$ حالت‌ها/ورودی‌های اسمی هستند، $N$ افق کوتاه است، $\ell$ و $V_f$ به ترتیب هزینه‌های مرحله‌ای و پایانی هستند. عناصر بحرانی، مجموعه‌های قید سفت‌شده $\bar{\mathbb{X}}, \bar{\mathbb{U}}$ (مجموعه‌های اصلی منقبض شده توسط مجموعه RPI $\mathcal{Z}$ از طریق تفاضل پونتریاگین $\ominus$) و قانون کمکی $u_k = \bar{u}_{0|k}^* + K(x_k - \bar{x}_{0|k}^*)$ هستند، که در آن $K$ یک بهره پایدارکننده است. مجموعه $\mathcal{Z}_{ss}$ حالت‌های ماندگار امکان‌پذیر را تعریف می‌کند.

10. چارچوب تحلیل: یک مطالعه موردی مفهومی

سناریو: پهپاد تحویل خودران که در یک دره شهری در حال ناوبری است (کامپیوتر با منابع محدود، اغتشاشات باد).
گام 1 – طراحی برون‌خط:

  1. مدل و مجموعه اغتشاش: شناسایی دینامیک خطی‌شده حول حالت شناور. مشخص‌سازی وزش‌های باد به عنوان یک مجموعه کران‌دار $\mathbb{W}$ (مثلاً ±۲ متر بر ثانیه در صفحه افقی).
  2. محاسبه لوله RPI: طراحی بهره فیدبک $K$ (مثلاً LQR) و محاسبه مجموعه RPI مینیمال $\mathcal{Z}$ برای $e_{k+1} = (A+BK)e_k + w_k$. این «لوله خطا» را تعریف می‌کند.
  3. سفت‌سازی قیود: کوچک کردن دالان پرواز پهپاد (قیود حالت) و محدودیت‌های رانش موتور (قیود ورودی) به اندازه $\mathcal{Z}$ و $K\mathcal{Z}$ برای به دست آوردن $\bar{\mathbb{X}}, \bar{\mathbb{U}}$.
  4. تعریف مجموعه حالت ماندگار: $\mathcal{Z}_{ss}$ شامل تمام نقاط شناور ثابت درون دالان سفت‌شده است.
گام 2 – عملکرد برخط: در هر چرخه کنترلی ۱۰ میلی‌ثانیه:
  1. اندازه‌گیری حالت: دریافت موقعیت/سرعت فعلی پهپاد $x_k$ از حسگرها.
  2. حل MPC اسمی: حل QP کوچک (با استفاده از $\bar{\mathbb{X}}, \bar{\mathbb{U}}, \mathcal{Z}_{ss}$) برای به دست آوردن برنامه اسمی $\bar{u}^*$ و حالت ماندگار هدف.
  3. اعمال کنترل ترکیبی: $u_k = \bar{u}^*_{0|k} + K(x_k - \bar{x}^*_{0|k})$. عبارت اول مأموریت را هدایت می‌کند، عبارت دوم به طور فعال وزش‌های باد را دفع می‌کند تا پهپاد را درون لوله نگه دارد.
این چارچوب با استفاده تنها از محاسبات سبک برخط، پرواز ایمن (رضایت قیود) و تکمیل مأموریت (همگرایی به حالت ماندگار) را علیرغم بادها تضمین می‌کند.

11. کاربردهای آینده و جهت‌های پژوهشی

  • هوش مصنوعی لبه و اینترنت اشیاء: استقرار کنترل پیشرفته روی حسگرهای هوشمند، دستگاه‌های پوشیدنی و ریزربات‌ها برای انجام وظایف دقیق در ساخت‌وساز و مراقبت‌های بهداشتی.
  • ازدحام‌های خودران: کنترل مقیاس‌پذیر برای گروه‌های بزرگ پهپادها یا ربات‌های ارزان و ساده که هر عامل محدودیت محاسباتی شدیدی دارد.
  • پژوهش نسل بعدی:
    • یادگیری لوله: استفاده از داده‌های زمان واقعی برای تخمین سازگارشونده مجموعه اغتشاش $\mathbb{W}$ و کوچک کردن لوله، کاهش محافظه‌کاری. این با پارادایم‌های MPC سازگارشونده و کنترل مبتنی بر یادگیری ادغام می‌شود.
    • تعمیم‌های غیرخطی: اعمال فلسفه به سیستم‌های غیرخطی با استفاده از مفاهیم MPC لوله‌ای غیرخطی یا تخت بودن دیفرانسیلی، که برای مانورهای تهاجمی پهپاد حیاتی است.
    • هم‌طراحی سخت‌افزار-نرم‌افزار: ایجاد تراشه‌های نهفته تخصصی (FPGAها، ASICها) که برای حل QP خاص و کوچک این چارچوب با توان فوق‌العاده پایین بهینه‌سازی شده‌اند.

12. مراجع

  1. جعفری اوزومچلویی، ح.، و حسین‌زاده، م. (۱۴۰۲). کنترل پیش‌بین مدل قوی آگاه از حالت ماندگار برای سیستم‌های با منابع محاسباتی محدود و اغتشاشات خارجی. [نام مجله].
  2. Mayne, D. Q., Seron, M. M., & Raković, S. V. (2005). Robust model predictive control of constrained linear systems with bounded disturbances. Automatica, 41(2), 219-224.
  3. Rawlings, J. B., Mayne, D. Q., & Diehl, M. M. (2017). Model Predictive Control: Theory, Computation, and Design (2nd ed.). Nob Hill Publishing.
  4. ETH Zurich, Automatic Control Laboratory. (بدون تاریخ). Lecture Notes on Model Predictive Control. بازیابی شده از [وب‌سایت مؤسسه].
  5. Hewing, L., Wabersich, K. P., Menner, M., & Zeilinger, M. N. (2020). Learning-based model predictive control: Toward safe learning in control. Annual Review of Control, Robotics, and Autonomous Systems, 3, 269-296.