Udhibiti wa Utabiri wa Mfano (MPC) Imara Yenye Ufahamu wa Hali Thabiti kwa Mifumo Yenye Vizuizi vya Rasilimali na Misukumo ya Nje

1. Utangulizi

Udhibiti wa Utabiri wa Mfano (MPC) ni mkakati wa hali ya juu wenye nguvu unaojulikana kwa uwezo wake wa kushughulikia mifumo yenye vigezo vingi pamoja na vizuizi. Hata hivyo, kutegemea kwake kutatua tatizo la uboreshaji mtandaoni kwa kila hatua ya wakati husababisha mzigo mkubwa wa hesabu. Kizuizi hiki ni hasa kikali kwa mifumo yenye rasilimali duni za hesabu, kama vile mifumo iliyojumuishwa, droni, au vifaa vya kompyuta kwenye ukingo. Njia za jadi za kupunguza hili—kama kufupisha upeo wa utabiri—mara nyingi hukandamiza dhamana ya utendaji kama vile muunganiko wa hali thabiti. Mfumo wa MPC yenye ufahamu wa hali thabiti, ulioanzishwa kama suluhisho, unahakikisha ufuatiliaji wa matokeo na muunganiko kwenye usawa unaotakikana bila hesabu za ziada mtandaoni. Hata hivyo, dosari yake kubwa ni ukosefu wa uthabiti dhidi ya misukumo ya nje, hitaji lisiloweza kubadilishwa kwa utumiaji wa ulimwengu halisi. Karatasi hii inashughulikia moja kwa moja pengo hili kwa kuunganisha mbinu za udhibiti imara kulingana na mabomba ndani ya mfumo wa MPC yenye ufahamu wa hali thabiti, na kuunda njia ambayo ni ya ufanisi wa hesabu na yenye ustahimilivu wa misukumo.

2. Utangulizi wa Msingi & Taarifa ya Tatizo

Karatasi hii inazingatia mifumo ya mstari isiyobadilika kwa wakati (LTI) ya wakati tofauti inayokabiliwa na misukumo ya nyongeza iliyofungwa na vizuizi vya hali/ingizo. Tatizo kuu ni kubuni sheria ya MPC ambayo: 1) Inafanya kazi kwa upeo mfupi, uliowekwa wa utabiri ili kudhibiti hesabu mtandaoni. 2) Inahakikisha kuridhika kwa vizuizi wakati wote. 3) Inahakikisha muunganiko kwenye hali thabiti inayotakiwa. 4) Ni imara dhidi ya misukumo ya nje endelevu, iliyofungwa. Mfumo unatengenezwa kama: $x_{k+1} = Ax_k + Bu_k + w_k$, ambapo $x_k \in \mathbb{R}^n$, $u_k \in \mathbb{R}^m$, na $w_k \in \mathbb{W} \subset \mathbb{R}^n$ ni msukumo uliowekwa mipaka. Seti za $\mathbb{X}$ na $\mathbb{U}$ zinafafanua vizuizi vya hali na ingizo, mtawaliwa.

3. Udhibiti wa Utabiri wa Mfano (MPC) Imara Yenye Ufahamu wa Hali Thabiti Unaopendekezwa

3.1 Uundaji Msingi

Kidhibiti kinachopendekezwa kinajengwa juu ya MPC ya kawaida yenye ufahamu wa hali thabiti. Ufunguo ni kuweka vigezo vya njia ya hali iliyotabiriwa ili kwa asili kuongoza mfumo kuelekea hali thabiti inayowezekana $(x_s, u_s)$. Tatizo la uboreshaji mtandaoni linaundwa ili kupunguza utendakazi wa gharama kwenye upeo mfupi huku likilazimisha vizuizi vya mwisho vinavyounganisha hali ya mwisho iliyotabiriwa na hali hii thabiti, na kuhakikisha sifa za muunganiko wa upeo mrefu licha ya dirisha fupi la utabiri.

3.2 Ushughulikiaji wa Misukumo Kulingana na Mabomba

Ili kuanzisha uthabiti, waandishi hutumia mkakati wa MPC kulingana na mabomba. Wazo kuu ni kugawanya sera ya udhibiti katika vipengele viwili: ingizo la kawaida linalokokotolewa kwa kutatua MPC yenye ufahamu wa hali thabiti kwa mfumo usio na misukumo, na sheria ya nyongeza ya maoni iliyobuniwa nje ya mtandao ili kuweka hali halisi, iliyosukumwa, ndani ya "bomba" lililowekwa mipaka karibu na njia ya kawaida. Bomba hili, mara nyingi hufafanuliwa kama seti ya Kudumu Chanya yenye Uthabiti (RPI), linahakikisha kwamba ikiwa hali ya kawaida inakidhi vizuizi vilivyokazwa, hali halisi itakidhi vizuizi vya asili licha ya misukumo. Mgawanyiko mzuri huu unamaanisha kuwa ushughulikiaji ngumu wa vizuizi imara unafanywa nje ya mtandao, na kuhifadhi urahisi wa hesabu mtandaoni wa kidhibiti cha kawaida.

4. Uchambuzi wa Kinadharia

4.1 Uwezekano wa Kurudia

Karatasi hii inatoa uthibitisho mkali kwamba ikiwa tatizo la uboreshaji linawezekana wakati wa hatua ya kwanza ya wakati, linabaki kuwa linawezekana kwa hatua zote za wakati ujao chini ya utendakazi wa sheria ya udhibiti iliyopendekezwa na kuwepo kwa misukumo iliyowekwa mipaka. Hii ni hitaji la msingi kwa utekelezaji wowote wa vitendo wa MPC.

4.2 Uthabiti wa Mfumo Uliyofungwa

Kwa kutumia nadharia ya uthabiti ya Lyapunov, waandishi wanaonyesha kwamba mfumo uliofungwa ni Thabiti-kutoka-Ingizo-kwa-Hali (ISS) kuhusiana na msukumo. Hii inamaanisha hali ya mfumo hatimaye itaungana kwenye eneo lililowekwa mipaka karibu na hali thabiti inayotakiwa, na ukubwa wa eneo hili ukiwa sawia na kikomo cha misukumo.

5. Matokeo ya Uigaji

Uigaji wa nambari kwenye mfumo wa kiwango (k.m., kiunganishi maradufu) unatumika kuthibitisha utendaji wa kidhibiti. Vipimo muhimu vinajumuisha: ukiukaji wa kizuizi (hakuna kilichoonwa), hitilafu ya muunganiko (iliyowekwa mipaka ndani ya bomba la kinadharia), na wakati wa hesabu kwa kila hatua ya udhibiti (chini sana kuliko MPC imara yenye upeo mrefu). Matokeo yanaonyesha kwa macho jinsi njia ya hali halisi inavyobaki ndani ya bomba lililokokotolewa karibu na njia ya kawaida, hata chini ya misukumo endelevu.

6. Uthibitishaji wa Majaribio kwenye Parrot Bebop 2

Utendaji wa njia iliyopendekezwa unajaribiwa kwenye droni ya quadrotor ya Parrot Bebop 2, jukwaa lenye uwezo mdogo wa usindikaji ndani yake. Lengo la udhibiti ni kufuatilia njia (k.m., muundo wa nane) kuwepo kwa dhoruba za upepo zilizosimuliwa (zilizotengenezwa kama misukumo). Data ya majaribio inaonyesha kwamba MPC imara yenye ufahamu wa hali thabiti imefanikiwa kuweka droni karibu na njia inayotakiwa kwa kupotoka kidogo, huku matumizi ya CPU ya kompyuta iliyoko ndani yakibaki ndani ya mipaka inayokubalika, na kuthibitisha ufanisi wa hesabu na uthabiti wa ulimwengu halisi wa njia hiyo.

7. Hitimisho

Karatasi hii imewasilisha kwa mafanikio mfumo mpya wa MPC imara unaounganisha faida za hesabu za muundo wenye ufahamu wa hali thabiti na dhamana za uthabiti za MPC kulingana na mabomba. Inatoa suluhisho linalowezekana la kutekeleza udhibiti wa hali ya juu, wenye ufahamu wa vizuizi kwenye mifumo yenye vizuizi vya rasilimali inayofanya kazi katika mazingira yasiyo na hakika, kama ilivyothibitishwa na uchambuzi wa kinadharia na majaribio ya vifaa.

8. Uchambuzi wa Asili & Uchambuzi wa Mtaalamu

Ufahamu Msingi: Karatasi hii sio tu marekebisho mengine ya MPC; ni maelewano ya kiufundi ya kimkakati yaliyotekelezwa kwa usahihi wa upasuaji. Waandishi wametambua hasa mahali pa maelewano kati ya uwezekano wa hesabu na utendaji imara kwa mifumo iliyojumuishwa. Wanakubali kizuizi cha upeo mfupi wa utabiri—kikubali kikubwa—lakini kwa ustadi wanarejesha dhamana zilizopotea (muunganiko wa hali thabiti, uthabiti) kupitia muundo mzuri nje ya mtandao (seti za mabomba, uwekaji vigezo vya hali thabiti). Hii ni uhandisi wa udhibiti kama usimamizi wa rasilimali.

Mtiririko wa Kimantiki: Hoja ni ya kulazimisha na ya mstari. Anza na tatizo lisilosuluhishwa (pengo la uthabiti katika MPC yenye ufanisi), chagua zana yenye msingi wa kinadharia (MPC ya bomba) inayojulikana kwa kugawanya utata, na uiunganishe kwa usawa ndani ya mfumo uliopo wenye ufanisi (MPC yenye ufahamu wa hali thabiti). Uthibitishaji unaongezeka kwa mantiki kutoka kwa nadharia (uthibitisho) hadi uigaji (dhana) hadi jaribio (ukweli kwenye droni), kufuatia kiwango cha dhahabu kilichoonyeshwa na kazi za msingi kama karatasi ya asili ya Tube MPC na Mayne et al. (2005) katika Automatica.

Nguvu & Kasoro: Nguvu kuu ni utendaji wa vitendo. Kwa kutumia mbinu kulingana na mabomba, njia hii inaepuka hitaji la uboreshaji tata mtandaoni wa min-max, ambao ni ghali sana kwa hesabu. Matumizi ya droni kwa uthibitishaji ni bora—ni jukwaa linaloeleweka, lenye vizuizi vya rasilimali. Hata hivyo, kasoro iko katika uhafidhina ulio asilia kwa MPC ya bomba. Hesabu nje ya mtandao ya seti ya RPI na ukazaji unaofuata wa vizuizi unaweza kupunguza kwa kiasi kikubwa eneo linalowezekana la kidhibiti, na kwa uwezekano kudhibiti uwezo wake wa kusonga kwa haraka. Hii ni maelewano yanayojulikana sana katika udhibiti imara, kama ilivyojadiliwa katika rasilimali kama vile Automatic Control Laboratory ya ETH Zurich maelezo ya mihadhara juu ya udhibiti wenye vizuizi. Karatasi ingeweza kupima hasara hii ya utendaji kwa uwazi zaidi dhidi ya MPC imara bora (yenye gharama kubwa ya hesabu).

Ufahamu Unaotekelezeka: Kwa watendaji: Hii ni mchoro tayari wa kutekeleza MPC imara kwenye vifaa vya ukingo. Lenga kukokotoa kwa ufanisi seti ya RPI—zingatia kutumia makadirio ya polytopic au ellipsoidal ili kusawazisha utata na uhafidhina. Kwa watafiti: mpaka ujao ni mabomba ya kukabiliana au kulingana na kujifunza. Je, mitandao ya neva, kama ile inayotumika katika RL yenye mfano au iliyochochewa na kazi kama Udhibiti wa Utabiri wa Mfano Kulingana na Kujifunza (mafunzo ya IEEE CDC), inaweza kujifunza seti za misukumo zenye mipaka kali zaidi mtandaoni, na kupunguza uhafidhina huku ikihifadhi uthabiti? Hii itakuwa mageuzi ya kimantiki ya kazi hii.

9. Maelezo ya Kiufundi & Mfumo wa Hisabati

Tatizo la uboreshaji mtandaoni kwa wakati $k$ ni: $$ \begin{aligned} \min_{\mathbf{u}_k, x_s, u_s} &\quad \sum_{i=0}^{N-1} \ell(\bar{x}_{i|k} - x_s, \bar{u}_{i|k} - u_s) + V_f(\bar{x}_{N|k} - x_s) \\ \text{s.t.} &\quad \bar{x}_{0|k} = \hat{x}_k, \\ &\quad \bar{x}_{i+1|k} = A \bar{x}_{i|k} + B \bar{u}_{i|k}, \\ &\quad \bar{x}_{i|k} \in \bar{\mathbb{X}} \subseteq \mathbb{X} \ominus \mathcal{Z}, \\ &\quad \bar{u}_{i|k} \in \bar{\mathbb{U}} \subseteq \mathbb{U} \ominus K\mathcal{Z}, \\ &\quad \bar{x}_{N|k} \in x_s \oplus \mathcal{X}_f, \\ &\quad (x_s, u_s) \in \mathcal{Z}_{ss}. \end{aligned} $$ Hapa, $\bar{x}, \bar{u}$ ni hali/ingizo za kawaida, $N$ ni upeo mfupi, $\ell$ na $V_f$ ni gharama za hatua na mwisho. Vipengele muhimu ni seti za vizuizi vilivyokazwa $\bar{\mathbb{X}}, \bar{\mathbb{U}}$ (seti za asili zilizopunguzwa na seti ya RPI $\mathcal{Z}$ kupitia tofauti ya Pontryagin $\ominus$), na sheria ya nyongeza $u_k = \bar{u}_{0|k}^* + K(x_k - \bar{x}_{0|k}^*)$, ambapo $K$ ni faida ya kuthibitisha. Seti $\mathcal{Z}_{ss}$ inafafanua hali thabiti zinazowezekana.

10. Mfumo wa Uchambuzi: Mfano wa Kufikiria

Hali: Droni ya usafirishaji inayojiongoza wenyewe inapita kwenye bonde la mijini (kompyuta yenye vizuizi vya rasilimali, misukumo ya upepo).
Hatua ya 1 – Muundo Nje ya Mtandao:

Mfano & Seti ya Misukumo: Tambua mienendo iliyosanifishwa karibu na kuelea. Bainisha dhoruba za upepo kama seti iliyowekwa mipaka $\mathbb{W}$ (k.m., ±2 m/s kwenye ndege ya usawa).

Kokotoa Bomba la RPI: Buni faida ya maoni $K$ (k.m., LQR) na kokotoa seti ndogo zaidi ya RPI $\mathcal{Z}$ kwa $e_{k+1} = (A+BK)e_k + w_k$. Hii inafafanua "bomba la hitilafu."

Kaza Vizuizi: Punguza njia ya kuruka ya droni (vizuizi vya hali) na mipaka ya nguvu ya injini (vizuizi vya ingizo) kwa $\mathcal{Z}$ na $K\mathcal{Z}$ ili kupata $\bar{\mathbb{X}}, \bar{\mathbb{U}}$.

Fafanua Seti ya Hali Thabiti: $\mathcal{Z}_{ss}$ ina alama zote za kuelea tuli ndani ya njia iliyokazwa.

Hatua ya 2 – Uendeshaji Mtandaoni: Kwa kila mzunguko wa udhibiti wa 10ms:

Pima Hali: Pata nafasi/kasi ya sasa ya droni $x_k$ kutoka kwa sensorer.

Tatua MPC ya Kawaida: Tatua QP ndogo (kwa kutumia $\bar{\mathbb{X}}, \bar{\mathbb{U}}, \mathcal{Z}_{ss}$) ili kupata mpango wa kawaida $\bar{u}^*$ na hali thabiti lengwa.

Tumia Udhibiti Mchanganyiko: $u_k = \bar{u}^*_{0|k} + K(x_k - \bar{x}^*_{0|k})$. Neno la kwanza linaongoza misheni, neno la pili linakataa kwa bidii dhoruba za upepo ili kuweka droni ndani ya bomba.

Mfumo huu unahakikisha ndege salama (kuridhika kwa kizuizi) na ukamilifu wa misheni (muunganiko wa hali thabiti) licha ya upepo, kwa kutumia hesabu nyepesi tu mtandaoni.

11. Matumizi ya Baadaye & Mwelekeo wa Utafiti

Akili ya Ukingo & IoT: Kutekeleza udhibiti wa hali ya juu kwenye sensorer smart, vifaa vya kubebea, na roboti ndogo kwa kazi za usahihi katika utengenezaji na afya.

Mkusanyiko wa Droni zinazojiongoza wenyewe: Udhibiti unaoweza kupanuka kwa makundi makubwa ya droni au roboti rahisi, ambapo kila kifaa kina mipaka kali ya hesabu.

Utafiti wa Kizazi Kijacho:

Kujifunza Bomba: Kutumia data ya wakati halisi kukadiria kikabiliana seti ya misukumo $\mathbb{W}$ na kupunguza bomba, na kupunguza uhafidhina. Hii inaungana na MPC inayokabiliana na mifumo ya udhibiti kulingana na kujifunza.

Panuko zisizo za mstari: Kutumia falsafa hii kwa mifumo isiyo ya mstari kwa kutumia dhana kutoka kwa MPC ya bomba isiyo ya mstari au umbali tofauti, muhimu kwa manevra ya droni yenye nguvu.

Muundo wa Pamoja wa Vifaa na Programu: Kuunda chips maalum zilizojumuishwa (FPGAs, ASICs) zilizoboreshwa kutatua QP maalum, ndogo ya mfumo huu kwa nguvu ndogo sana.

12. Marejeo

Jafari Ozoumchelooei, H., & Hosseinzadeh, M. (2023). Udhibiti wa Utabiri wa Mfano Imara Yenye Ufahamu wa Hali Thabiti kwa Mifumo Yenye Rasilimali Duni za Hesabu na Misukumo ya Nje. [Jina la Jarida].

Mayne, D. Q., Seron, M. M., & Raković, S. V. (2005). Udhibiti wa utabiri wa mfano imara wa mifumo ya mstari iliyowekwa vizuizi na misukumo iliyowekwa mipaka. Automatica, 41(2), 219-224.

Rawlings, J. B., Mayne, D. Q., & Diehl, M. M. (2017). Udhibiti wa Utabiri wa Mfano: Nadharia, Hesabu, na Muundo (Toleo la 2). Nob Hill Publishing.

ETH Zurich, Automatic Control Laboratory. (n.d.). Maelezo ya Mihadhara juu ya Udhibiti wa Utabiri wa Mfano. Imepatikana kutoka [Tovuti ya Taasisi].

Hewing, L., Wabersich, K. P., Menner, M., & Zeilinger, M. N. (2020). Udhibiti wa utabiri wa mfano kulingana na kujifunza: Kuelekea kujifunza salama katika udhibiti. Ukaguzi wa Mwaka wa Udhibiti, Roboti, na Mifumo ya Kujiongoza wenyewe, 3, 269-296.