اختر اللغة

تحكم تنبؤي بالنموذج قوي وواعٍ بحالة الثبات للأنظمة محدودة الموارد مع وجود اضطرابات

إطار تحكم تنبؤي بالنموذج جديد يجمع بين الوعي بحالة الثبات والتصميم القائم على الأنابيب للأنظمة ذات الموارد الحسابية المحدودة والاضطرابات الخارجية.
computepowercoin.com | PDF Size: 0.9 MB
التقييم: 4.5/5
تقييمك
لقد قيمت هذا المستند مسبقاً
غلاف مستند PDF - تحكم تنبؤي بالنموذج قوي وواعٍ بحالة الثبات للأنظمة محدودة الموارد مع وجود اضطرابات

1. المقدمة

التحكم التنبؤي بالنموذج (MPC) هو استراتيجية تحكم متقدمة قوية تشتهر بقدرتها على التعامل مع الأنظمة متعددة المتغيرات ذات القيود. ومع ذلك، فإن اعتماده على حل مشكلة تحسين عبر الإنترنت في كل خطوة زمنية يخلق عبئًا حسابيًا كبيرًا. هذا القيد حاد بشكل خاص للأنظمة ذات الموارد الحسابية المحدودة، مثل الأنظمة المدمجة والطائرات المسيرة أو أجهزة الحوسبة الطرفية. غالبًا ما تتنازل الأساليب التقليدية للتخفيف من هذا - مثل تقصير أفق التنبؤ - عن ضمانات الأداء مثل التقارب إلى حالة الثبات. يضمن إطار التحكم التنبؤي بالنموذج الواعي بحالة الثبات، الذي تم تقديمه كحل، تتبع المخرجات والتقارب إلى حالة توازن مرغوبة دون حسابات إضافية عبر الإنترنت. ومع ذلك، فإن عيبه الحرج هو عدم وجود متانة ضد الاضطرابات الخارجية، وهو شرط لا يمكن التفاوض عليه للنشر في العالم الحقيقي. تعالج هذه الورقة البحثية هذه الفجوة مباشرة من خلال دمج تقنيات التحكم القوي القائمة على الأنابيب في إطار التحكم التنبؤي بالنموذج الواعي بحالة الثبات، مما يخلق طريقة فعالة حسابيًا ومقاومة للاضطرابات في آن واحد.

2. الأساسيات وبيان المشكلة

تتناول الورقة البحثية الأنظمة الخطية الثابتة زمنيًا في الزمن المنفصل (LTI) المعرضة لاضطرابات إضافية محدودة وقيود على الحالة/المدخلات. المشكلة الأساسية هي تصميم قانون تحكم تنبؤي بالنموذج يقوم بما يلي: 1) يعمل بأفق تنبؤ قصير وثابت للحد من الحساب عبر الإنترنت. 2) يضمن الالتزام بالقيود في جميع الأوقات. 3) يضمن التقارب إلى حالة ثبات مرغوبة. 4) يكون قويًا ضد الاضطرابات الخارجية المستمرة والمحدودة. يتم نمذجة النظام على النحو التالي: $x_{k+1} = Ax_k + Bu_k + w_k$، حيث $x_k \in \mathbb{R}^n$، $u_k \in \mathbb{R}^m$، و $w_k \in \mathbb{W} \subset \mathbb{R}^n$ هو اضطراب محدود. تحدد المجموعتان $\mathbb{X}$ و $\mathbb{U}$ قيود الحالة والمدخلات على التوالي.

3. التحكم التنبؤي بالنموذج المقترح القوي والواعي بحالة الثبات

3.1 الصياغة الأساسية

يبني وحدة التحكم المقترحة على التحكم التنبؤي بالنموذج الاسمي الواعي بحالة الثبات. المفتاح هو تحديد معلمات مسار الحالة المتوقع لدفع النظام بشكل أساسي نحو حالة ثبات قابلة للتحقيق $(x_s, u_s)$. تمت صياغة مشكلة التحسين عبر الإنترنت لتقليل دالة تكلفة على الأفق القصير مع فرض قيود نهائية تربط حالة التنبؤ النهائية بحالة الثبات هذه، مما يضمن خصائص التقارب ذات الأفق الطويل على الرغم من نافذة التنبؤ القصيرة.

3.2 التعامل مع الاضطرابات القائم على الأنابيب

لإدخال المتانة، يستخدم المؤلفون استراتيجية تحكم تنبؤي بالنموذج قائمة على الأنابيب. الفكرة المركزية هي تحليل سياسة التحكم إلى مكونين: مدخلات اسمية يتم حسابها عن طريق حل التحكم التنبؤي بالنموذج الواعي بحالة الثبات لنموذج خالٍ من الاضطرابات، وقانون تغذية راجعة مساعد مصمم دون اتصال بالإنترنت للحفاظ على الحالة الفعلية المضطربة ضمن "أنبوب" محدود حول المسار الاسمي. يضمن هذا الأنبوب، الذي يُعرَّف غالبًا على أنه مجموعة موجبة ثابتة قوية (RPI)، أنه إذا كانت الحالة الاسمية تلبي القيود المشددة، فإن الحالة الفعلية ستلبي القيود الأصلية على الرغم من الاضطرابات. يعني هذا الفصل الرائع أن التعامل المعقد مع القيود القوية يتم دون اتصال بالإنترنت، مما يحافظ على البساطة الحسابية عبر الإنترنت لوحدة التحكم الاسمية.

4. التحليل النظري

4.1 إمكانية التنفيذ العودية

تقدم الورقة البحثية برهانًا صارمًا على أنه إذا كانت مشكلة التحسين قابلة للتنفيذ في الخطوة الزمنية الأولية، فإنها تظل قابلة للتنفيذ لجميع الخطوات الزمنية المستقبلية تحت تأثير قانون التحكم المقترح وفي وجود اضطرابات محدودة. هذا هو شرط أساسي لأي تنفيذ عملي للتحكم التنبؤي بالنموذج.

4.2 استقرار الحلقة المغلقة

باستخدام نظرية استقرار ليابونوف، يوضح المؤلفون أن النظام ذو الحلقة المغلقة مستقر من المدخلات إلى الحالة (ISS) فيما يتعلق بالاضطراب. هذا يعني أن حالة النظام ستتقارب في النهاية إلى منطقة محدودة حول حالة الثبات المرغوبة، مع أن حجم هذه المنطقة يتناسب مع الحد الأعلى للاضطرابات.

5. نتائج المحاكاة

تم استخدام المحاكاة العددية على نظام قياسي (مثل مكامل مزدوج) للتحقق من أداء وحدة التحكم. تشمل المقاييس الرئيسية: انتهاك القيود (لم يُلاحظ أي انتهاك)، خطأ التقارب (محدود ضمن الأنبوب النظري)، ووقت الحساب لكل خطوة تحكم (أقل بكثير من التحكم التنبؤي بالنموذج القوي ذي الأفق الطويل). تُظهر النتائج بصريًا كيف يظل مسار الحالة الفعلي ضمن الأنبوب المحسوب حول المسار الاسمي، حتى في ظل اضطرابات مستمرة.

6. التحقق التجريبي على طائرة Parrot Bebop 2

تم اختبار الجانب العملي للطريقة المقترحة على طائرة Parrot Bebop 2 الرباعية المراوح، وهي منصة ذات قدرة معالجة محدودة على متنها. هدف التحكم هو تتبع المسار (مثل نمط الرقم ثمانية) في وجود هبات رياح محاكاة (تم نمذجتها كاضطرابات). تُظهر البيانات التجريبية أن التحكم التنبؤي بالنموذج القوي والواعي بحالة الثبات يحافظ بنجاح على الطائرة المسيرة قريبة من المسار المطلوب مع حد أدنى من الانحراف، بينما يظل استخدام وحدة المعالجة المركزية للكمبيوتر الموجود على متن الطائرة ضمن الحدود المقبولة، مما يؤكد كفاءة الطريقة الحسابية ومتانتها في العالم الحقيقي.

7. الخاتمة

تقدم الورقة البحثية بنجاح إطار تحكم تنبؤي بالنموذج قويًا جديدًا يدمج المزايا الحسابية للتصميم الواعي بحالة الثبات مع ضمانات المتانة للتحكم التنبؤي بالنموذج القائم على الأنابيب. إنه يوفر حلاً عمليًا لتنفيذ تحكم عالي الأداء وواعٍ بالقيود على الأنظمة محدودة الموارد التي تعمل في بيئات غير مؤكدة، كما تم إثباته من خلال التحليل النظري والتجارب على الأجهزة.

8. التحليل الأصلي والتعليقات الخبيرة

الفكرة الأساسية: هذه الورقة البحثية ليست مجرد تعديل طفيف آخر على التحكم التنبؤي بالنموذج؛ بل هي حل وسط استراتيجي في الهندسة تم تنفيذه بدقة جراحية. حدد المؤلفون نقطة المفاضلة الدقيقة بين قابلية المعالجة الحسابية والأداء القوي للأنظمة المدمجة. يقبلون قيد أفق التنبؤ القصير - وهو تنازل كبير - لكنهم يستعيدون ببراعة الضمانات المفقودة (تقارب حالة الثبات، المتانة) من خلال تصميم ذكي دون اتصال بالإنترنت (مجموعات الأنابيب، تحديد معلمات حالة الثبات). هذا هو هندسة التحكم كإدارة للموارد.

التسلسل المنطقي: الحجة مقنعة وخطية. ابدأ بمشكلة غير محلولة (فجوة المتانة في التحكم التنبؤي بالنموذج الفعال)، اختر أداة سليمة نظريًا (التحكم التنبؤي بالنموذج القائم على الأنابيب) المعروفة بفصل التعقيد، وادمجها بسلاسة في إطار عمل فعال موجود (التحكم التنبؤي بالنموذج الواعي بحالة الثبات). يتصاعد التحقق منطقيًا من النظرية (البراهين) إلى المحاكاة (المفاهيم) إلى التجربة (الواقع على طائرة مسيرة)، متبعًا المعيار الذهبي الذي تمثله الأعمال المؤثرة مثل ورقة التحكم التنبؤي بالنموذج القائم على الأنابيب الأصلية لماين وآخرون (2005) في مجلة Automatica.

نقاط القوة والضعف: القوة الأساسية هي الجانب العملي. من خلال الاستفادة من الأساليب القائمة على الأنابيب، تتجنب الطريقة الحاجة إلى تحسينات معقدة عبر الإنترنت من النوع min-max، والتي تكون مكلفة حسابيًا. استخدام طائرة مسيرة للتحقق ممتاز - فهي منصة محدودة الموارد ويمكن فهمها. ومع ذلك، يكمن العيب في التحفظ المتأصل في التحكم التنبؤي بالنموذج القائم على الأنابيب. يمكن أن يؤدي الحساب دون اتصال بالإنترنت لمجموعة RPI وتشديد القيود اللاحق إلى تقليص منطقة التنفيذ لوحدة التحكم بشكل كبير، مما قد يحد من مرونتها. هذه مفاضلة معروفة في التحكم القوي، كما تمت مناقشته في مصادر مثل محاضرات مختبر التحكم الآلي في ETH Zurich حول التحكم المقيد. كان من الممكن أن تقوم الورقة البحثية بتحديد هذا الفقدان في الأداء بشكل أكثر وضوحًا مقارنةً بالتحكم التنبؤي بالنموذج القوي المثالي (المكلف حسابيًا).

رؤى قابلة للتنفيذ: للممارسين: هذا مخطط جاهز للاستخدام لتنفيذ التحكم التنبؤي بالنموذج القوي على الأجهزة الطرفية. ركز على حساب مجموعة RPI بكفاءة - فكر في استخدام تقريبات متعددة السطوح أو إهليلجية لتحقيق التوازن بين التعقيد والتحفظ. للباحثين: الجبهة التالية هي الأنابيب التكيفية أو القائمة على التعلم. هل يمكن للشبكات العصبية، المشابهة لتلك المستخدمة في التعلم المعزز القائم على النموذج أو المستوحاة من أعمال مثل التحكم التنبؤي بالنموذج القائم على التعلم (دروس IEEE CDC)، أن تتعلم مجموعات اضطرابات أضيق عبر الإنترنت، مما يقلل من التحفظ مع الحفاظ على المتانة؟ سيكون هذا هو التطور المنطقي لهذا العمل.

9. التفاصيل التقنية والإطار الرياضي

مشكلة التحسين عبر الإنترنت في الوقت $k$ هي: $$ \begin{aligned} \min_{\mathbf{u}_k, x_s, u_s} &\quad \sum_{i=0}^{N-1} \ell(\bar{x}_{i|k} - x_s, \bar{u}_{i|k} - u_s) + V_f(\bar{x}_{N|k} - x_s) \\ \text{s.t.} &\quad \bar{x}_{0|k} = \hat{x}_k, \\ &\quad \bar{x}_{i+1|k} = A \bar{x}_{i|k} + B \bar{u}_{i|k}, \\ &\quad \bar{x}_{i|k} \in \bar{\mathbb{X}} \subseteq \mathbb{X} \ominus \mathcal{Z}, \\ &\quad \bar{u}_{i|k} \in \bar{\mathbb{U}} \subseteq \mathbb{U} \ominus K\mathcal{Z}, \\ &\quad \bar{x}_{N|k} \in x_s \oplus \mathcal{X}_f, \\ &\quad (x_s, u_s) \in \mathcal{Z}_{ss}. \end{aligned} $$ هنا، $\bar{x}, \bar{u}$ هما الحالات/المدخلات الاسمية، $N$ هو الأفق القصير، $\ell$ و $V_f$ هما تكلفة المرحلة والتكلفة النهائية. العناصر الحرجة هي مجموعات القيود المشددة $\bar{\mathbb{X}}, \bar{\mathbb{U}}$ (المجموعات الأصلية تم تقليصها بواسطة مجموعة RPI $\mathcal{Z}$ عبر الفرق البونتراجيني $\ominus$)، والقانون المساعد $u_k = \bar{u}_{0|k}^* + K(x_k - \bar{x}_{0|k}^*)$، حيث $K$ هو كسب استقرار. تحدد المجموعة $\mathcal{Z}_{ss}$ حالات الثبات القابلة للتحقيق.

10. إطار التحليل: دراسة حالة مفاهيمية

السيناريو: طائرة مسيرة ذاتية القيادة لتوصيل الطرود تتحرك في وادٍ حضري (كمبيوتر ذو موارد محدودة، اضطرابات رياح).
الخطوة 1 – التصميم دون اتصال بالإنترنت:

  1. النموذج ومجموعة الاضطرابات: تحديد الديناميكيات الخطية حول حالة التحليق. توصيف هبات الرياح كمجموعة محدودة $\mathbb{W}$ (مثل ±2 م/ث في المستوى الأفقي).
  2. حساب أنبوب RPI: تصميم كسب تغذية راجعة $K$ (مثل LQR) وحساب مجموعة RPI الدنيا $\mathcal{Z}$ لـ $e_{k+1} = (A+BK)e_k + w_k$. هذا يحدد "أنبوب الخطأ".
  3. تشديد القيود: تقليص ممر طيران الطائرة المسيرة (قيود الحالة) وحدود دفع المحركات (قيود المدخلات) بواسطة $\mathcal{Z}$ و $K\mathcal{Z}$ للحصول على $\bar{\mathbb{X}}, \bar{\mathbb{U}}$.
  4. تحديد مجموعة حالة الثبات: تحتوي $\mathcal{Z}_{ss}$ على جميع نقاط التحليق الثابتة داخل الممر المشدد.
الخطوة 2 – التشغيل عبر الإنترنت: في كل دورة تحكم مدتها 10 مللي ثانية:
  1. قياس الحالة: الحصول على موقع/سرعة الطائرة المسيرة الحالية $x_k$ من أجهزة الاستشعار.
  2. حل التحكم التنبؤي بالنموذج الاسمي: حل مشكلة QP الصغيرة (باستخدام $\bar{\mathbb{X}}, \bar{\mathbb{U}}, \mathcal{Z}_{ss}$) للحصول على الخطة الاسمية $\bar{u}^*$ وحالة الثبات المستهدفة.
  3. تطبيق التحكم المركب: $u_k = \bar{u}^*_{0|k} + K(x_k - \bar{x}^*_{0|k})$. يوجه المصطلح الأول المهمة، بينما يرفض المصطلح الثاني هبات الرياح بنشاط للحفاظ على الطائرة المسيرة داخل الأنبوب.
يضمن هذا الإطار الطيران الآمن (الالتزام بالقيود) وإكمال المهمة (تقارب حالة الثبات) على الرغم من الرياح، باستخدام حسابات خفيفة الوزن عبر الإنترنت فقط.

11. التطبيقات المستقبلية واتجاهات البحث

  • الذكاء الاصطناعي الطرفي وإنترنت الأشياء: نشر تحكم متقدم على أجهزة استشعار ذكية وأجهزة قابلة للارتداء وروبوتات دقيقة لمهام دقيقة في التصنيع والرعاية الصحية.
  • الأسراب ذاتية القيادة: تحكم قابل للتطوير لمجموعات كبيرة من الطائرات المسيرة أو الروبوتات الرخيصة والبسيطة حيث يكون لكل وكيل حدود حسابية صارمة.
  • بحث الجيل التالي:
    • تعلم الأنبوب: استخدام البيانات في الوقت الفعلي لتقدير مجموعة الاضطرابات $\mathbb{W}$ بشكل تكيفي وتقليص الأنبوب، مما يقلل من التحفظ. يندمج هذا مع التحكم التنبؤي بالنموذج التكيفي ونماذج التحكم القائمة على التعلم.
    • امتدادات غير خطية: تطبيق الفلسفة على الأنظمة غير الخطية باستخدام مفاهيم من التحكم التنبؤي بالنموذج القائم على الأنابيب غير الخطي أو التسطيح التفاضلي، وهو أمر بالغ الأهمية لمناورات الطائرات المسيرة العدوانية.
    • التصميم المشترك للأجهزة والبرمجيات: إنشاء رقاقات مدمجة متخصصة (FPGAs, ASICs) مُحسَّنة لحل مشكلة QP الصغيرة المحددة لهذا الإطار بأقل استهلاك للطاقة.

12. المراجع

  1. Jafari Ozoumchelooei, H., & Hosseinzadeh, M. (2023). Robust Steady-State-Aware Model Predictive Control for Systems with Limited Computational Resources and External Disturbances. [Journal Name].
  2. Mayne, D. Q., Seron, M. M., & Raković, S. V. (2005). Robust model predictive control of constrained linear systems with bounded disturbances. Automatica, 41(2), 219-224.
  3. Rawlings, J. B., Mayne, D. Q., & Diehl, M. M. (2017). Model Predictive Control: Theory, Computation, and Design (2nd ed.). Nob Hill Publishing.
  4. ETH Zurich, Automatic Control Laboratory. (n.d.). Lecture Notes on Model Predictive Control. Retrieved from [Institute Website].
  5. Hewing, L., Wabersich, K. P., Menner, M., & Zeilinger, M. N. (2020). Learning-based model predictive control: Toward safe learning in control. Annual Review of Control, Robotics, and Autonomous Systems, 3, 269-296.