منابع و ماخذ پایان نامه همزمان سازی، دینامیکی، مدل دینامیکی

بود . خطای همزمان سازی پیشنهاد شده در رابطه (٤-9) از روشی که سو (٢٠٠٦ ) برای همزمان سازی روبات های موازی ارائه کرده است، متفاوت است. در مقاله سو (٢٠٠٦ ) مسأله تنظیم نقطه به نقطه مورد بررسی قرار می گیرد، بنابراین ضرایب مرکب بودن 1⁄(q_i^d ) ثابت می باشند، در حالی که در مسأله کنترل مسیر، این ضرایب 1⁄(q_i^d (t)) متغیر با زمان می باشند. در یک پژوهش دیگر (سان ٢٠٠٦)، خطای همزمان سازی، تنها رابطه سینماتیکی بین دو مفصل فعال همسایه را مورد بررسی قرار می دهد، در حالی که در این پایان نامه خطای همزمان سازی رابطه سینماتیکی هر مفصل فعال با دو مفصل فعال مجاور آن می باشد. بنابراین خطای همزمان سازی از روش پیشنهادی سان (٢٠٠٦ ) کاراتر می باشد .
به منظور طراحی کنترلری که همگرایی خطای موقعیت e وخطای همزمان سازی ε را در زمان محدود تضمین کند، خطای موقعیت مرکب زیر تعریف شده است .
E=e+γε (٤-١0)
که در آن E∈R^(n×n) خطای موقعیت مرکب و γ∈R^(n×n) یک ماتریس قطری مثبت اکید است. هر چقدر بهره γ بیشتر باشد، کنترل همزمان بیشتری بر روی سیستم اعمال می- شود. با جایگذاری رابطه (٤-9) در رابطه (٤-10) نتیجه می شود.
E=(I+γS) e (٤-١1)
که در آنI∈R^(n×n) ماتریس واحد می باشد. با انتخاب مناسب ماتریس γ و مسیر مطلوب، ماتریس (I+γS) غیرتکین خواهد بود. کاملاً آشکار است که از E=0 نتیجه می شود e=0 و ε=0.
خطای موقعیت مرکب پیشنهادی تنها روش موجود نیست. در مقاله سان (٢٠٠٦)، خطای موقعیت و خطای همزمان سازی به صورت خطی در خطای موقعیت مرکب ترکیب نشده اند. بلکه از انتگرال خطای همزمان سازی ∫▒〖ε dt〗 استفاده شده است. در نتیجه، همگرایی خطای موقعیت مرکب به صفر به همگرایی خطای موقعیت و خطای همزمان سازی نمی انجامد. در مقاله لو (٢٠٠٦) خطای موقعیت مرکب بر اساس مدل دینامیکی تعریف می شود که به محاسبات درون خطی بسیاری می انجامد. در مجموع، خطای موقعیت مرکب پیشنهادی ترکیب خطی از خطای موقعیت و خطای همزمان سازی است و می تواند باعث همگرایی هر دو خطا به صفر در زمان محدود و به صورت همزمان شود.
فصل پنجم
کنترل روبات هگزا و اثبات پایداری آن
کنترل روبات هگزا و اثبات پایداری آن
پس از تحلیل دینامیکی یک سیستم نوبت به طراحی کنترلر مناسب برای آن می رسد. کنترل پایدار یک سیستم اهمیت بسیاری دارد. یک کنترلر مناسب با توجه به حسگرهای موجود در بازار، قیمت وپیچیدگی آن ها و همچنین خواسته کنترلی طراحان آن انتخاب می- شود. در ادامه، با مفهوم پایداری سیستم های غیر خطی آشنا خواهیم شد و سپس به تشریح کنترلر پیشنهادی برای روبات هگزا خواهیم پرداخت. بدین منظور، پس از آشنایی مقدماتی با کنترلر های مختلف روبات هگزا، به اثبات پایداری آن خواهیم پرداخت.
٥-١- تئوری پایداری لیاپانوف
در فرآیند طراحی یک سیستم کنترلی، اولین و مهم ترین نکته ای که باید مد نظر قرار گیرد، پایداری رفتار آن سیستم است. از لحاظ کیفی به سیستمی پایدار گفته می شود که در آن همه پاسخ هایی که از نقاط نزدیک به نقطه کاری مطلوب آغاز شوند، در همسایگی محدودی از آن باقی بمانند. یکی از رایج ترین روش ها برای مطالعه پایداری سیستم های کنترل غیر خطی، تئوری لیاپانوف است که در اواخر قرن نوزدهم میلادی به وسیله الکساندر میخایلویچ لیاپانوف ارائه شد. تئوری لیاپانوف، به نام مسأله عمومی پایداری حرکت، شامل دو روش متفاوت زیر برای تحلیل پایداری سیستم ها است.
– روش خطی سازی١: در این روش، در صورتی سیستم غیر خطی حول نقطه تعادلش پایدار است که تخمین خطی آن نیز حول آن نقطه پایدار باشد.
—————
١ Linearization
– روش مستقیم١: روش مستقیم لیاپانوف به حرکت محلی محدود نیست و خواص پایداری یک سیستم غیر خطی را با در نظر گرفتن یک تابع اسکالر انرژی مانند مثبت برای سیستم و مطالعه مشتقات زمانی آن بررسی می کنند.
تئوری لیاپانوف تا کنون بسیار توسعه داده شده و اصلاح شده است. امروزه، روش خطی- سازی لیاپانوف، کاربرد زیادی در کنترل خطی دارد و روش مستقیم لیاپانوف به ابزار قدرتمندی در طراحی و تحلیل سیستم های کنترل غیر خطی تبدیل شده است. قضایای پایداری لیاپانوف، بیانگر شروط کافی برای پایداری، پایداری مجانبی و پایداری سراسری هستند و نه شرایط لازم برای آن. مشکل اصلی در استفاده از تئوری پایداری لیاپانوف برای اثبات پایداری سیستم های غیر خطی، خود تابع لیاپانوف می باشد که یافت آن برای برخی سیستم ها کار بسیار مشکلی می باشد و نیاز به تجربه، درک شهودی و خلاقیت دارد. در اینجا برخی تعاریف و لم های مورد نیاز در تئوری لیاپانوف به همراه خود قضایا و قضیه معکوس لیاپانوف بدون اثبات بیان می- شوند.
R^+ نمایانگر اعداد حقیقی مثبت وR^n فضای برداری n بعدی روی Rبا نرم اقلیدسی ‖x‖=(∑_(i=1)^n▒|x_i | ^2 )^(1⁄2) می باشد. در سیستم دینامیکی غیر خطی زیر fتابع برداری غیر خطی و x〖∈R〗^n بردار حالت است.
x ̇=f(x,t) (٥-١)
تعریف (٥-١) سیستم های نامتغیر با زمان٢: سیستم غیر خطی را نامتغیر با زمان میگویند، اگر تابع f صریحاً به زمان بستگی نداشته باشد، یعنی
x ̇=f(x) (٥-٢)
در غیر این صورت سیستم را متغیر با زمان٣ گویند.
—————
١ Direct method
٢ Autonomous
٣ Nonautonomous
تعریف (٥-٢) تعادل: حالتx^* را نقطه تعادل می گویند، اگر .f(x^* )=0
تعریف (٥-٣) پایداری: نقطه تعادلx^*=0 را پایدار گویند، اگر به ازای هرρ0، وجود داشته باشد r0 به طوری که اگر ‖x(0)‖0 وجود داشته باشد به طوری که اگر‖x(0)‖0 (٥-٣)
تعریف های فوق مربوط به خواص محلی سیستم حول نقطه تعادل است. مفاهیم پایداری فوق اگر شرایط مربوط برای هر حالت اولیه ای صادق باشند، سراسری خواهند شد.
٥-١-١- روش مستقیم لیاپانوف
تعریف (٥-٧) تابع معین مثبت و منفی محلی: تابع اسکالر پیوسته V(x) را معین مثبت (منفی) محلی می گویند، اگر V(0)=0و برای x≠0، V(x)0 (V(x)<0) باشد. اگر با شرایط بالا V(x)≥0باشد، آنگاه V(x) نیمه معین مثبت محلی و اگر V(x)≤0 باشد، V(x) نیمه معین منفی گفته می شود. تعریف (٥-٨) تابع لیاپانوف: V(x) را یک تابع لیاپانوف برای سیستم (٥-٢) می نامیم، اگر در یک کرهB در فضای R^n، V(x)معین مثبت و دارای مشتقات جزئی پیوسته باشد، و نیز مشتق آن در راستای مسیر طی شده توسط سیستم (٥-٢) نیمه معین منفی باشد، یعنی V ̇(x)=(∂V/∂x)f(x)≤0 (٥-٤) قضیه (٥-٣) پایداری محلی: نقطه تعادل 0 برای سیستم (٥-٢) در یک کرهB (مجانباً) پایدار است، اگر یک تابع اسکالر V(x) با مشتقات پیوسته وجود داشته باشد، به طوری که V(x)معین مثبت (نیمه معین مثبت) وV ̇(x) معین منفی (نیمه معین منفی) باشد (در کره B). قضیه (٥-٤) پایداری سراسری: نقطه تعادل سیستم (٥-٢) پایدار مجانبی سراسری است اگر تابع اسکالر V(x) با مشتقات مرتبه اول پیوسته وجود داشته باشد، به طوری که V(x)مثبت معین وV ̇(x) منفی معین باشد، و اگر ‖x‖→∞ آنگاهV(x)→∞ . ٥-٢- قضایای معکوس لیاپانوف در این قسمت تنها به یک قضیه مهم که بیانگر شرایط وجود داشتن یک تابع لیاپانوف برای یک سیستم کنترلی است، اشاره می کنیم. قضیه (٥-٥): اگر نقطه تعادل x=0 برای سیستم پایدار (پایدار مجانبی یکنواخت) باشد، آنگاه یک تابع معین مثبت (کاهنده)V(x,t) با مشتق تعریف شده نامثبت (منفی) برای این سیستم وجود دارد. ٥-٣- کنترل تطبیقی ایده کنترل تطبیقی در جهت به حداقل رساندن محاسبات عملی برای جستجوی پارامترها و یا حدود آن ها به وجود آمد. در این دسته از کنترلرها میزان اطلاعات لازم از مدل دینامیکی سیستم به حداقل می رسد و میزان آن ها در یک روند به روز رسانی، که باید به سرعت انجام شود، تخمین زده می شود. گرچه نخستین بار در دهه ٧٠ میلادی ایده کنترلرهای تطبیقی مطرح شد، اما به دلیل سرعت پایین رایانه های آن روزگار استفاده عملی از آن ها تا اواسط دهه ٩٠ به تعویق افتاد. در این دهه با پیشرفت برق آسای فناوری های رایانه ای و الکترونیکی توجه مجدد پژوهشگران به سوی کاربردی کردن این کنترلر جلب شد. از کنترل تطبیقی در سیستم های پیچیده ای که تغییرات پارامتریک غیر قابل پیش بینی و یا عدم قطعیت١ دارند، استفاده می کنیم. کنترل تطبیقی در مواجهه با سیستم هایی که عدم قطعیت در پارامترهای ثابت یا با نرخ تغییرات کم دارد، نسبت به کنترل مقاوم٢ ارجحیت دارد. در حالی که کنترل مقاوم برای کنترل سیستم هایی که دارای اغتشاشات٣، پارامترهای با نرخ تغییرات سریع و دینامیک مدل نشده می باشند، مفیدتر است. تفاوت دیگر کنترل تطبیقی و مقاوم در این است که در کنترل مقاوم به اطلاعات اولیه٤ در باره محدوده پارامترهای متغیر و یا عدم قطعیت ها نیاز داریم؛ کنترل مقاوم تضمین می کند که اگر تغییرات در بازه مورد نظر باشد، دستور کنترلی نیازی به تغییر ندارد، در حالی که در کنترل تطبیقی، دستور کنترلی خود بر اساس یک قانون به روز رسانی٥ تغییر می کند. تخمین پارامترها، اساس کنترل تطبیقی است. روش های گرادیان کاهش یافته٦ و حداقل مربعات بازگشتی٧ متداول ترین روش های تخمین پارامترها می باشند. با استفاده از هر کدام از این روش ها می توان قوانین به روز رسانی را برای اصلاح تخمین ها در زمان حقیقی (هنگامی که سیستم در حال اجراست) ارائه داد. از قضایای پایداری لیاپانوف می توان برای به دست آوردن این قوانین به روز رسانی و بررسی شرایط همگرایی استفاده کرد. --------------- ١ Uncertainty ٢ Robust control ٣ Disturbances ٤ Prior knowledge ٥ Adaptation law ٦ Gradient descent ٧ Recursive least square ٥-٣- ١- دسته بندی تکنیک های کنترل تطبیقی روش های مختلف کنترل تطبیقی را می توانیم به دو دسته عمده زیر تقسیم بندی کرد. ١- کنترل تطبیقی پسخوردی1 ٢- کنترل تطبیقی پیشخوردی2 در یک دسته بندی دیگر می توانیم آن ها را به دو دسته روش های مستقیم و غیر مستقیم تقسیم کرد. در روش غیر مستقیم، ابتدا پارامترهای دستگاه را تخمین زده و با استفاده از آن ها به محاسبه پارامترهای کنترلر می پردازیم. این روش بر همگرایی مقادیر تخمین زده شده به مقادیر واقعی نا شناخته آن ها استوار است. در روش مستقیم تنها به تخمین پارامترهای (بهره- های) کنترلی می پردازیم و نیازی به تخمین پارامترهای دستگاه نیست. یکی از رایج ترین روش های کنترلی مورد استفاده در کنترل تطبیقی پسخوردی، کنترلر های خود تنظیم کننده3 هستند. در این نوع از کنترلرها از یک کنترلر و یک تخمین گر پارامتر به طور همزمان استفاده می شود. یکی از اصول بنیادین این نوع کنترلرها، اصل قطعیت معادل4 می باشد؛ بدین معنی که پارامترهای کنترلر از تخمین پارامترهای دستگاه و با فرض حقیقی بودن آن ها به دست می آیند. کنترلرهای تطبیقی پسخوردی یا پیشخوردی را می توان با استفاده از روش های مستقیم یا غیر مستقیم طراحی کرد. شکل (٥-١) ساختار یک کنترلر خود تنظیم کننده مستقیم را نشان می دهد که در طراحی کنترلر روبات هگزا از آن استفاده شده است. در این طرح، r بردار ورودی، y بردار خروجی و θ بردار پارامترهای تخمین زده شده است. --------------- 1 Feedback adaptive control 2 Feedforward adaptive control 3 Self- tuning controllers 4 Certainty equivalence شکل ٥-١- ساختار یک کنترلر خود تنظیم کننده مستقیم ٥-٤- کنترل مد لغزشی١ ٥-٤-١- مقدمه روش کنترل مد لغزشی (SMC) به عنوان ابزاری کارا جهت طراحی کنترلرهای مقاوم برای سیستم های غیرخطی پیچیده مرتبه بالا که تحت شرایط عدم قطعیت کار می کنند، شناخته می شود. تحقیقات اولیه در این زمینه در حدود ٥٠ سال پیش در روسیه شروع شد و از آن زمان تا کنون کنترل مد لغزشی توجه جامعه جهانی کنترل را به خود جلب کرده است. مزیت اصلی کنترل مد لغزشی حساسیت کم نسبت به تغییرات پارامترهای دستگاه و اغتشاشات می باشد که ضرورت مدل سازی دقیق را از بین می برد. همچنین با استفاده از این روش می توانیم با تجزیه یک سیستم به زیر سیستم هایی مستقل با درجه پایین تر درجه سیستم را کاهش داده و از پیچیدگی طراحی کنترلر بکاهیم. کنترلر مد لغزشی در گستره وسیعی از مسائل روباتیک، ژنراتورها و محرک های الکتریکی، کنترل فرآیند و کنترل حرکت و خودروها کاربرد عملی دارد. کنترل مد لغزشی باید با دقت بیشتری نسبت به دیگر کنترل های غیر خطی که رفتار معتدل تری دارند، استفاده شود. به ویژه، از آنجا که محرک های صنعتی دارای تأخیر و دیگر نقایص می باشند، کنترل مد لغزشی با بهره های بزرگ می تواند منجر به آشوب٢، هدر رفتن انرژی، تخریب دستگاه و یا تحریک دینامیک های مدل نشده شود. --------------- ١ Sliding mode control ٢ Chaos ٥-٤-٢- تعریف مد لغزشی و سطح لغزشی از نظر ساختاری کنترل مد لغزشی یک کننترل غیر خطی است که دینامیک سیستم غیرخطی را با استفاده از یک سیگنال کنترلی گسسته که حالات سیستم را محدود به حرکت در طول یک سطح لغزشی می کند، تغییر می دهد. قانون کنترلی پسخورد حالت١، یک تابع پیوسته از زمان نیست، بلکه می تواند با توجه به موقعیت کنونی در فضای حالت از یک ساختار پیوسته به دیگری تغییر کند. بنابراین، کنترل مد لغزشی یک کنترل ساختار متغیر می باشد. به این دلیل از ساختارهای کنترلی متعدد استفاده می شود تا مسیر ها همواره به سمت یک ناحیه مجاور با ساختار کنترلی متفاوت حرکت کنند و همچنین مسیر نهایی هیچ گاه از یک ساختار کنترلی خارج نشود، بلکه همیشه در طول مرز این ساختارهای کنترلی بلغزد. به حرکت سیستم هنگامی که در طول این مرزها حرکت می کند، مد لغزشی گفته می شود ومکان هندسی تشکیل دهنده این مرزها را سطح یا منیفولد لغزشی٢ می گویند. از نقطه نظر تئوری کنترل مدرن، هر سیستم ساختار متغیر مانند سیستمی که تحت کنترل مد لغزشی عمل می کند، به عنوان یک نمونه خاص از سیستم های دینامیکی هیبرید٣ در نظر گرفته می شود، زیرا سیستم هم در فضای حالت پیوسته حرکت می کند و هم از مدهای کنترلی مجزای متفاوت عبور می- کند. شکل (٥-٢) نشان دهنده مسیر یک سیستم تحت کنترل مد لغزشی است. سطح لغزشی توسط s=x_1+x_2=0 تعریف شده است و پس از زمان محدودی (t_r=t_1-t_0) که مسیر سیستم به سطح لغزشی برسد، مد لغزشی در طول این سطح آغاز می شود. نقطه قوت کنترل مد لغزشی مقاوم بودن آن است، زیرا دستور کنترلی را می توانیم تغییر بین دو حالت در نظر بگیریم (مثلاً "روشن"/"خاموش" و یا "مستقیم"/"معکوس"). همچنین نیازی نیست که این دستور کنترلی دقیق باشد و در نتیجه سیستم به تغییر پارامتر ها حساس نیست. به علاوه از آنجا که دستور کنترلی یک تابع پیوسته نسیت، می توان آن در زمان محدود --------------- ١ State feedback control law ٢ Sliding surface ٣ Hybrid dynamical systems به سطح لغزشی رسید. ٥-٤-٣- طرح کنترلی سیستم غیر خطی زیر را در نظر بگیرید x ̇(t)=f(x,t)+B(x,t)u(x(t)) (٥-٥) که در آن x(t)≜[x_1 (t),…,x_n (t)] ^T∈R^n یک بردار n بعدی حالت و u(t)≜[u_1 (t),…,u_m (t)] ^T∈R^m یک بردار m بعدی ورودی است که به عنوان پسخورد حالت استفاده می شود. فرض می کنیم توابع f〖:R〗^n×R→R^n و B:R^n×R〖→R〗^(n×m) پیوسته و به اندازه کافی هموار باشد تا بر اساس تئوری پیکارد-لیندولف وجود و یکتا بودن جواب x(t) معادله (٥-٥) را تضمین کند. هدف طراحی قانون کنترلی پسخورد حالت u(x,t) (یک نگاشت ازحالت کنونی x(t) در زمان t به ورودی u) به منظور پایدار کردن سیستم دینامیکی در معادله (٥-٥) حول مبدأ x=[0,…,0]می باشد. در کنترل مد لغزشی، طراح می داند که سیستم درصورتی که مقید به یک زیر فضا از فضای موقعیت باشد، رفتار مطلوب دارد (سیستم نقطه تعادل پایدار دارد). کنترل مد لغزشی مسیر های سیستم را مجبور به حرکت به سمت این زیر فضا می کند و سپس آنها را در امتداد این زیر فضا می لغزاند. این زیر فضای کاهش مرتبه یافته را سطح لغزشی می گویند و هنگامی که پسخورد حلقه بسته مسیر های سیستم را مجبور به حرکت در امتداد آن می کند، آنرا مد لغزشی سیستم حلقه بسته گویند. طراحی کنترل مد لغزشی شامل موارد زیر می شود ١- انتخاب یک سطح یا منیفولد ( لغزشی ) به گونه ای که مسیر های سیستم هر گاه محدود به این سطح باشند، رفتار مطلوب از خود نشان دهند. ٢- پیدا کردن بهره های پسخوردی به گونه ای که مسیر های سیستم با این سطح برخورد و روی آن باقی بماند. طراح کنترل مد لغزشی یک تابع تغییر کننده σ:R^n→R^m انتخاب می کند که به گونه ای نشان دهنده فاصله حالت x از سطح لغزشی می باشد. (هر گاه حالت x روی سطح باشد، σ(x)=0 و در غیر این صورت σ(x)≠0). سطح لغزشیn×m بعدی می باشد که در آن n تعداد حالت های x و m تعداد سیگنال های ورودی در u است. برای هر اندیس ماتریس u، 1≤k≤m یک سطح لغزشی n×1 بعدی وجود دارد که توسط رابطه زیر داده می شود. {x∈R^n:σ_k (x)=0} (٥-٦) بخش مهمی از طراحی کنترل مد لغزشی انتخاب قانون کنترلی به گونه ای است که سطح داده شده توسط σ(x)=0 وجود داشته و مسیرهای سیستم توانایی رسیدن به آن را داشته باشند. بنا براین چنانچه بخواهیم اهداف کنترلی را در قالب σ(x) بیان کنیم، کنترلر مد لغزشی باید دو شرط زیر را داشته باشد. ١- تضمین اینکه مسیر های سیستم از هر شرط اولیه ای قابلیت رسیدن به σ(x)=0 را دارند. ٢- پس از رسیدن به σ(x)=0 دستور کنترلی می تواند سیستم را در σ(x)=0 نگه دارد. ٥-٤-٣-١- مبانی تئوریک در ادامه، به بیان تئوری های بنیادین کنترل ساختار متغیر می پردازیم. تئوری (٥-١): وجود مد لغزشی تابع لیاپانوف زیر را در نظر بگیرید (٥-٧) V(σ(x))=1/2 σ^T (x)σ(x)=1/2 ‖σ(x)‖ _2^2 که در آن ‖.‖ نرم اقلیدسی می باشد. (بدین معنی که ‖σ(x)‖ _2 فاصله از منیفولد لغزشی σ(x)=0 می باشد. برای سیستم داده شده توسط معادله (٥-٥) و سطح لغزشی داده شده توسط معادله (٥-٦)، یک شرط کافی برای وجود سطح لغزشی، برقراری رابطه زیر در یک همسایگی سطح σ(x)=0 می باشد. (٥-٨) dV/dt=∂V/∂σ dσ/dt= σ^T σ ̇<0 در حالت خاص و برای کنترل اسکالر (١m=)، برای تحقق σ^T σ ̇<0، قانون کنترلی پسخورد u(x) باید به گونه ای انتخاب شود σ و( σ) ̇ علامت مختلف داشته باشند. بدین معنی که u(x)، σ ̇(x) رامنفی (مثبت) می سازد، هرگاه σ(x) مثبت (منفی) باشد. توجه داشته باشید که (٥-٩) σ ̇=∂σ/∂x x ̇=∂σ/∂x (f(x,t)+B(x,t)u) بنابراین قانون کنترلی پسخورد u(x) تأثیر مستقیمی روی σ ̇ دارد. تئوری (٥-٢) قابلیت دسترسی: توانایی رسیدن به منیفولد لغزشی در زمان محدود پیش از اینکه قابلیت رسیدن مسیر های سیستم به منیفولد لغزشی در زمان محدود را بررسی کنیم، نیاز داریم تا با لم مقایسه در معادلات دیفرانسیل آشنا شویم. لم (٥-١) لم مقایسه در معادلات دیفرانسیل: فرض کنید توابعf وg در دامنه D پیوسته باشند. D={(x,y):|x-x_0 |g(x,y)باشد، آنگاه به ازای xx_0، y(x)z(x) و به ازای x0 و 0α≤1.
این شرط تضمین می کند که در یک همسایگی مد لغزشی که در آن V∈[0,1] می- باشد
(٥-١١)
dV/dt≤-μ(√V)^α≤-μ(√V)
بنابراین برای V∈[0,1]
(٥-١٢)
1/√V dV/dt≤-μ
با تعریف W=2√V و با استفاده از قانون مشتق گیری زنجیره ای داریم.
(٥-١٣)
dW/dt=∂W/∂V dV/dt≤-μ
در نتیجه با استفاده از لم (٥-١) و مقایسه با منحنی z(t)=z_0-μt که توسط معادله دیفرانسیل z ̇(t)=μ با شرط اولیه z(0)=z_0 به دست می آید، نتیجه می گیریم 2√(V(t))≤V_0-μt برای t∈R. به علاوه، از آنجا که √(V(t)) ≥0 ،√(V(t)) باید در زمان محدود به √V=0 برسد، به عبارتی دیگر سیستم در زمان محدود به σ=0 می- رسد. ( √V با تابع تغییر کننده ‖σ‖_2 متناسب است ).
شرط (٥-١٠) در زمینه کنترل مد لغزشی اینگونه تعبیر می شود
(٥-١٤)
dV/dt=∂V/∂σ dσ/dt= σ^T σ ̇≤-μ(√V)^α=-μ(‖σ‖_2 )^α
برای حالتی که تابع تغییر کننده σ تابعی اسکالر باشد، شرط کافی این گونه خواهد بود
σ^T σ ̇≤-μ|σ|^α (٥-١٥)
با فرض α=1، شرط اسکالر کافی را خواهیم داشت
sgn(σ)σ ̇≤-μ (٥-١٦)
که با توجه به مثبت بودن μ، با شرط زیر معادل است
sgn(σ)≠sgn(σ ̇ ) و |σ ̇ |≥μ0 (٥-١٧)
بدین معنی که سیستم همیشه باید به سمت سطح لغزشی σ=0 در حال حرکت باشد و سرعت |σ ̇ | به سمت سطح لغزشی باید از حد پایین غیر صفر بزرگتر باشد. بنابراین، حتی هنگامی که x به اندازه کافی به سطح σ(x)=0 نزدیک می شود، σ ̇ باید همیشه از صفر دور باشد. برای تضمین این شرط، کنترلرهای مد لغزشی باید روی منیفولد σ(x)=0 گسسته باشند.
٥-٤-٤- کنترل مد لغزشی زمان محدود
ایده اصلی کنترل مد لغزشی زمان محدود (TSMC) از کار های ابتدایی زاک در زمینه جذب کننده های زمان محدود به وجود آمد که همگرایی حالت های سیستم در زمان محدود را تضمین می کرد. در کنترل مد لغزشی، حالت های سیستم در راستای منیفولد لغزشی خطی به مبدأ به صورت مجانبی همگرا می شوند. در مد لغزشی زمان محدود، از یک ترم غیر خطی در طراحی سطح لغزشی استفاده می شود که در نتیجه آن منیفولد را به یک جذب کننده زمان محدود تبدیل می کند.
مفهوم مد لغزشی زمان محدود را می توانیم توسط دینامیک درجه اول زیر نشان دهیم.
(٥-١٨)
s=x ̇+β|x|^(q/p) sgn(x)=0
که در آن x∈R^1 یک متغیر اسکالر می باشد، β0 و p,q(pq ) اعداد صحیح مثبت فرد هستند. توجه داشته باشید که در معادله (٥-١٨) تنها جواب های حقیقی |x|^(q⁄p) را در نظر می گیریم. آن گاه از معادله (٥-١٨) نتیجه می گیریم
x ̇=-β|x|^(q/p) sgn(x) (٥-١٩)
با در نظر گرفتن شرایط اولیهx(0)≠0 ، دینامیک (٥-١٨) در زمان محدود به x=0 می رسد. زمان سپری شده از حالت اولیه x(0) تا 0، t^s، با حل معادله دیفرانسیل (٥-١٩) به دست می آید.
(٥-٢٠)
∫_x(0)^0▒〖dx/(-β|x|^(q/p) sgn(x) )=∫_0^(t^s)▒dt〗⟹t^s=□(p/β(p-q) |x(0)|^(((p-q))/p) )
با توجه به رابطه (٥-٢٠)، زمان رسیدن به سطح لغزشی زمان محدود،t^s، به پارامترهای β,p,q و مقدار اولیه x(0) بستگی دارد. با توجه به اینکه x(0) مقداری ثابت یا در محدوده ثابت شناخته شده ای قرار دارد، می توانیم با انتخاب پارامتر β زمان t^s را بسیار کاهش دهیم.
همچنین می توان اثبات کرد که نقطه تعادل 0 یک جذب کننده است، بدین معنی که هر گاه حالتx به 0 می رسد، برای همیشه در صفر باقی می ماند. این مطلب را می توانیم با در نظر گرفتن تابع لیاپانوف V=1/2 x^2 نشان دهیم. مشتق زمانی V در طول (٥-١٨) برابر خواهد بود با
V ̇=xx ̇=-βx|x|^(q/p) sgn(x)=-β|x|^(((q+p))/p) (٥-٢١)
در نتیجه V ̇ منفی معین خواهد بود و x=0 پایدار خواهد بود.
قابل ذکر است که هرگاه q=p باشد، آنگاه
s=x ̇+βx=0 β0 (٥-٢٢)
که یک دینامیک خطی است. قرار دادن ترم غیر خطی|x|^(q/p) sgn(x) همگرایی به مبدأ را بهبود می بخشد و هر چقدرx به نقطه تعادل (مبدأ) نزدیکتر باشد، آنگاه سرعت همگرایی بیشتر خواهد بود که به همگرایی در زمان محدود منجر خواهد شد. از طرفی هر گاه x از نقطه تعادل دور باشد، مد لغزشی زمان محدود (٥-١٨) بر همتای خطی خود (q=p )فائق نخواهد شد، زیرا ترم |x|^(q⁄p) sgn(x) مقدار همگرایی به نقطه تعادل را در این شرایط کاهش می- دهد. یک راه حل آنی برای رفع این مشکل، معرفی مدل TSMجدید زیر است.
s=x ̇+γx+β|x|^(q/p) sgn(x)=0 (٥-٢٣)
که در آنx∈R^1 ،α, β0 .
با انجام چنین کاری، خواهیم داشت
x ̇=-γx-β|x|^(q/p) sgn(x)

دیدگاهتان را بنویسید