SDRE، (‏3، کنترل¬کننده، خطی¬سازی، می¬کنیم.، مشتق، رابطه¬ی، میل، باشد؛، کنترل¬کننده¬ی، می¬باشد.، دینامیک

ی به حالات سیستم به رویت¬گرها نیاز می¬باشد. در طراحی تخمین¬گر بهینه باید آن¬ها را به صورت دوگان کنترل¬کننده¬های بهینه در نظر بگیریم [31]. سپس، همانند روش خطی، آن را با کنترل¬کننده ترکیب می¬کنیم. تابعی را به صورت ز یر در نظر می¬گیریم:

‏3 39

حال دوگان آن چه را که برای ورودی بهینه ا نجام دادیم، تکرار می¬کنیم. تنها به تر تیب به جای A، B و K از AT ، CT و LT استفاده می¬کنیم. بنابراین معادلات SDRE با وجود اغتشاش چنین خواهد شد:

‏3 40

‏3 41

معادله¬ی دوگان رابطه¬ی (‏3 37)، چنین می¬شود:

‏3 42

توجه داشته باشید که برای طراحی رویتگر SDRE باید سیستم به صورت نقطه به نقطه رویت¬پذیر باشد. این به¬معنای رتبه¬ی کامل بودن جفت ماتریس¬های به صورت نقطه به نقطه می¬باشد. هم¬چنین برای افزایش درجه¬ی آزادی، ماتریس¬های وزنی U و V وابسته به حالات نیز می¬توانند باشند. به علاوه برای این که عملکرد رویتگر از کنترل¬کننده سریع¬تر باشد، تا خطای تخمین هر چه سریعتر صفر بشود، ماتریس وزنی U را 4 تا 10 برابر بزرگتر از Q باید در نظر گرفت.
به منظور استفاده از الگوریتم تکرار [26]، برای طراحی هم¬زمان کنترل¬کننده و تخمین¬گر SDRE ابتدا به صورت خارج از خط و با در نظر گرفتن سیستم بدون ورودی حالات را بدست می¬آوریم. سپس، با توجه به حالات به دست آمده ماتریس سیستم وابسته به حالت و ماتریس ورودی را خواهیم داشت. در نتیجه با توجه به اصل جداپذیری معادلات SDRE مربوط به کنترل¬کننده (رابطه¬ها¬ی¬ (‏3 35) و (‏3 36)) را حل کرده و ضریب کنترل¬کننده را بدست می¬آوریم. در مرحله¬ی بعد با استفاده از حل معادله¬ی SDRE رویت¬گر ضریب L را بدست می¬آوریم. سپس با استفاده از L و K ، حالت¬های تخمین¬زده شده را به صورت زیر به¬روز می¬کنیم:

‏3 43

دقت کنید که در رابطه¬ی بالا مقدار اولیه¬ی حالات تخمینی را به صورت دلخواه حدس می¬زنیم و سپس با ترتیب رابطه¬ی بالا آن را به روز می¬کنیم. برای تکرارهای بعدی رابطه¬ی(‏3 43) را، بعد از حل معادلات SDRE رویت¬¬گر و کنترل¬کننده در هر تکرار، را تکرار می¬کنیم. حال برای یک مثال ارایه شده در [26] کنترل¬کننده و رویت¬گر SDRE را طراحی می¬کنیم. معادله¬ی حالات این سیستم غیرخطی در زیر آمده است:

‏3 44

ماتریس سیستم وابسته به حالت آن پس از اعمال خطی¬سازی توسعه یافته به شکل زیر می¬شود:

‏3 45

ماتریس B و C برابر خواهد بود با:

‏3 46

سپس کنترل¬پذیری آن را به صورت نقطه به نقطه چک می¬کنیم:

‏3 47

مشاهده می¬شود که ماتریس کنترل¬پذیری برای تمام رتبه کامل می¬باشد و لذا سیستم کنترل¬پذیر خواهد بود. به همین ترتیب همانطور که در زیر ملاحظه می¬کنید ماتریس رویت¬پذیری نیز برای تمام رتبه¬ی کامل و در نتیجه سیستم رویت-پذیر می¬باشد.

‏3 48

به منظور طراحی کنترل¬کننده، ماتریس¬های وزنی زیر را در تابعی مربوط به آن (‏3 16)، استفاده می¬کنیم:

‏3 49

هم¬چنین شرایط اولیه سیستم به صورت زیر خواهد بود:

‏3 50

در این شبیه¬سازی تمامی حالات سیستم را تخمین زده و تمامی حالت در شرایط اولیه¬ی تخمین را صفر فرض می¬کنیم و ماتریس-های وزنی مربوط به رابطه¬ی (‏3 35) را به صورت زیر در نظر می¬گیریم:

‏3 51

دقت کنید که در بالا برای سریعتر صفر شدن خطای تخمین مقدار ماتریس وزنی U را هشت برابر Q در نظر می¬گیریم.
در شکل(‏3 1) پاسخ سیستم را باشرایط اولیه ذکر شده و اعمال اغتشاش d=2 ، مشاهده می¬کنید و با سه بار تکرار الگوریتم [26] نمودارهای حالت و ورودی کنترلی را در شکل¬های (‏3 2) و (‏3 3) برای تکرار اول و سوم ملاحظه می¬کنید. در شکل(‏3 2) مشاهده می¬کنید که حالت اول با یک نوسان شدیدتر به سمت صفر میل می¬کند و کمی انحراف دارد. همانطور که در شکل (‏3 3) مشاهده می¬کنید؛ این ایراد با افزایش تکرار الگوریتم برطرف شده است.

شکل‏3 1: پاسخ سیستم بدون ورودی کنترلی در حضور اغتشاش

شکل ‏3 2: پاسخ سیستم و ورودی کنترلی پس از تکرار اول الگوریتم

شکل ‏3 3: پاسخ سیستم و ورودی کنترلی پس از تکرار سوم الگوریتم

در واقع این بهبود عملکرد کنترل¬کننده با افزایش تکرار الگوریتم را از لحاظ پیاده¬سازی می¬توان این گونه تعبیر کرد که در تکرار اول سیستم به صورت در خط عمل کرده و عملکرد آن کمی خطا دارد. با افزایش تعداد تکرار حرکت مشابه سیستم، رفتار سیستم بهتر می¬شود . در کنترل جرثقیل¬های حامل کانتینر این مسئله خود را بهتر نشان می¬دهد. زیرا با توجه به وزن تقریباً یکسان کانتینرها وطول طناب برابر در حالت عبور بار و تکرار مشابه مسیر جابه¬جایی بار از لحاظ مکان و سرعت حرکت ارابه؛ این طور می¬توان تعبیر کرد که هر حرکت بار از کشتی به بندر و بالعکس ر ا باید بصورت یک تکرار الگوریتم [26] در نظر بگیریم. در نتیجه با افزایش تعداد جابه¬جایی¬ها عملکرد سیستم بهتر می¬شود. در واقع می¬توان گفت که این الگوریتم در چنین مسایلی قادر به آموزش کنترل¬کننده می¬باشد. به علاوه، با افزایش مقدار جابه¬جایی¬های بار عملکرد مقاوم¬تری نسبت به نامعینی¬ها نشان خواهد داد.

طراحی کنترل¬کننده در صورت عدم فراهم شدن شرایط لازم برای کنترل

برای طراحی کنترل¬کننده¬ی SDRE در مدل افاین، باید شرایط زیر فراهم بشود[34]:
f(x) باید یک تابع پیوسته¬ی مشتق¬پذیر بر حسب x در زیر مجموعه¬ی اعداد حقیقی باشد. به علاوه B(x) نیز باید تابعی پیوسته باشد.
اغلب x=0 نقطه تعادل سیستم در حالت u=0 بوده و همواره در این حالت f(0)=0 و نیز باید تابعی پیوسته باشد.
در صورتی که ماترس¬های وزنی Q و R وابسته به x باشند؛ پیوسته خواهند بود. به علاوه باید و باشند.
پس از انجام خطی¬سازی توسعه یافته باید به ترتیب جفت¬های و پایدارپذیر و آشکارپذیر باشند.
شرایط 1و 2 برای انجام عمل خطی¬سازی توسعه¬یافته لازمند و شرط¬های 3و 4 برای این¬که معادله¬ی SDRE پاسخی مثبت معین و منحصر به فرد داشته باشد مورد نیازند. با این وجود، بسیاری از سیستم¬ها هستند که بعضی از شرایط ذکر شده را احراز نکرده و در نتیجه کنترل¬کننده¬ی SDRE برای آن¬ها قابل طراحی نخواهد بود. در ادامه به معرفی راه¬کارهای ارایه شده برای چند مورد از عدم فراهم¬شدن شرایط می¬پردازیم.

دینامیک مشتق ناپذیر

بعضی از سیستم ها ممکن است که شرط اول را احراز نکنند و در نتیجه ماتریس سیستم وابسته به حالت آنها پس از اعمال خطی¬سازی توسعه یافته پیوسته نخواهد شد. این خود موجب می شود که پایداری سیستم تضمین نشود. در این حالت باید تابع f(x) را به شکل یک تابع مشتق پذیر تقریب زد. به عنوان مثال در [33]، پیشنهاد شده است که برای f(x)=sgn(x) که تابع علامت می-باشد و در نزدیکی مبدا مشتق ناپذیر است؛ از تابع زیر استفاده کنیم:

‏3 52

با این کار آن خط راست مبرا که باعث عدم مشتق پذیری تابع f(x)=sig(x) شده است را به صورت یک منحنی نزدیک به خط راست در بازه¬ای بسیار کوچک حول مبدا تقریب می¬زنیم. در واقع عملکرد تابع بسیار نزدیک به تابع علامت خواهد بود ولی مشتق پذیر شده و همان طور که در [33] نشان داده شده است کنترل¬کننده¬ی SDRE در آن قابل طراحی می¬شود.
تابع مورد استفاده دیگری که بسیار کاربرد دارد و شبیه همین تابع اشاره است تابع پله می باشد که می توان آن را به صورت زیر با تقریب بسیار بالایی معرفی نمود:

‏3 53

در این تابع هر چه که مقدار بیشتر باشد (حداقل 15)، دقت بالاتر خواهد بود. همچنین مقدار t0 برابر زمانی است که پله در آن رخ می¬دهد. در این کار از این تابع استفاده شده است.

وجود عوامل تاثیر گذاری که به حالات سیستم وابسته نیستند

اگر درمدل، عاملی که به حالت سیستم وابسته نباشد وجود داشته باشد؛ در نتیجه شرط دوم (f(0)=0) نقض می¬شود. این مساله امکان اعمال خطی¬سازی توسعه یافته به مدل را از ما میگیرد. سه راه¬کار برای حل این مشکل ارایه شده است [36]: (عامل تاثیر گذار مستقل از حالت را با b(t) نشان می¬دهیم.)
اگر عامل تاثیرگذار ثابت و یا کند تغییر کند، آن را به عنوان یکی از حالات سیستم به مدل اضافه می¬کنیم. در این حالت دینامیک این عامل را به شکل پایدار زیر در نظر می¬گیریم:

‏3 54

به طوریکه در آن مقدار مثبت کوچکی اختیار بشود.

عامل تاثیرگذار را میتوان در حالات و یا ترکیبی از حالات که حتماً به صفر میل نمی¬کنند ضرب و تقسیم نمود. بطور مثال در یک مسئله¬های که مربوط به کنترل حرارت باشد؛ ممکن است دما بر حسب کلوین به عنوان یک متغیر حالت باشد. از آن جایی که هیچ وقت در فیزیک به صفر کلوین نمی¬رسیم؛ از عدم میل نمودن این متغیر حالت به صفر مطمئن خواهیم بود و می¬توانیم آن را در عامل تاثیر گذار ضرب و تقسیم کنیم. ( ) به عنوان مثالی دیگر مسئله¬ی کنترل موشک را در نظر بگیرید. در این مساله هریک از بردارهای سرعت ممکن است که به صفر میل کنند ولی هیچ وقت مقدار سرعت موشک صفر نخواهد شد. در این حالت عامل تاثیر گذار، که ممکن است نیروی جاذبه باشد، را می توان در مربع سرعت موشک ضرب و تقسیم نمود. ( )

راه کار سوم افزودن یک متغیر حالت پایدار z به سیستم می¬باشد . این متغیر حالت دارای دینامیک باید باشد. دقت شود که مقدار باید بزرگتر از صفر باشد. سپس عامل تاثیرگذار را می¬توان در این متغیر حالت ضرب و تقسیم نمود. ( )

– وجود عامل وابسته به حالتی که شرط دوم را نقض میکند

ممکن است عامل وابسته به حالتی در سیستم وجود داشته باشد که با صفر شدن متغیرهای حالت مانع از صفر شدن f(x) بشود. این باعث عدم احراز شرط دوم و در نتیجه عدم امکان اعمال خطی¬سازی توسعه یافته خواهد شد. در واقع این عوامل، همانند عوامل قبلی برای طراحی کنترل¬کننده¬ی SDRE مشکل¬ساز می¬شوند. لذا می¬توان از راهکارهای دوم و سوم مورد قبلی برای رفع این مشکل استفاده نمود. اما ممکن است که به منظور رسیدن به کنترل¬پذیری و یا بهینگی بخواهیم از خطی¬سازی توسعه¬یافته، که همان افزایش درجه¬ی آزادی طراحی است، استفاده کنیم. بدین منظور میتوان با در نظر گرفتن ماتریس سیستم بصورت ، وابستگی به حالت این عامل را در ماتریس سیستم قرار داد. بطور مثال اگر این عامل در سیستمی بصورت وجود داشته باشد؛ خطی¬سازی توسعه¬یافته روی آن را می¬توان با انتقال آن به مبدا اعمال کرد. این کار با کم و اضافه کردن مقدار یک به آن صورت می¬گیرد. ( ) بدین شکل قسمت داخل کروشه با صفر شدن متغیر حالت به مبدا رفته و می¬توان عمل خطی¬سازی توسعه یافته را روی آن انجام داد. ( ) در آخر، باید با عدد یک باقی مانده به شکل یک عامل تاثیرگذار مستقل از حالت و استفاده از راهکارهای ارایه شده در قسمت قبلی برخورد کرد.
گاهی ممکن است که چنین عاملی در یک عامل وابسته به حالتی که با صفر شدن متغیرهای حالت صفر می¬شود ضرب بشود و در نتیجه کل رابطه به صفر میل بکند. باز هم با توجه به رابطه¬ی (‏3 10) می¬توان درجه¬ی آزادی طراحی کنترل¬کننده¬ی SDRE را افزایش داد. بدین صورت که اثر عامل دور شونده از صفر را هم در ماتریس سیستم قرار داد. بطور مثال اگر سیستمی به صورت ( ) باشد؛ با صفر شدن ضریب x3 کل رابطه صفر می¬شود. در نتیجه یک فرم ساده برای درایه¬های ماتریس سیستم می¬تواند به صورت و باشد. با این حال برای افزایش کنترل¬پذیری و یا بهینگی میتوان اثر x1 را هم در سیسـتـم قـرار داد. ایـن کـار را بـا کـم و اضـافـه کـردن مقـدار یـک انجـام مـی¬دهیم.

‏3 55

بنابراین، درایه¬های ماتریس برابر با و خواهند شد.

متغیرهای حالت ناپایدار و کنترل¬ناپذیر و در عین حال کراندار

در صورت ناپایدار بودن و کنترل¬ناپذیر بودن متغیرهای حالت سیستم، جفت پایدار¬ناپذیر شده و شرط چهارم احراز نخواهد شد. این مشکل را می¬توان با افزودن یک عامل پایدارساز به دینامیک ناپایدار سیستم برطرف نمود [33 و 35]. اگر بر فرض متغیر حالت x1 ناپایدار باشد؛ با افزودن به طوری¬که باشد، به دینامیک آن، می¬توان آن را پایدارساز نمود.

غیرخطی¬گری در ورودی

در این حالت دیگر سیستم به شکل افاین نخواهد بود و به صورت رابطه¬ی (‏3 2) می¬باشد. در [25]، دو راه کار در خط و خارج از خط برای حل معادلات SDRE حاصل از این دسته از مدل¬ها ارایه شده است. علاوه بر این روش¬ها، با استفاده از کنترل ارزان نیز میتوان مدل را به شکل افاین تبدیل نمود[25 و 35]؛ و از روش تکرار، ارایه شده در [26]، برای طراحی کنترل¬کننده استفاده کرد.
شیوه¬ی کار بدین گونه است که ما ورودی سیستم را به عنوان یک متغیر جدید، در یک سیستم جدید معرفی می¬کنیم. سپس از مشتق ورودی سیستم اصلی به عنوان ورودی کنترلی جدید استفاده می¬کنیم. سیستم جدید چنین خواهد شد:

‏3 56

با نگاهی به سطر دوم این سیستم، به صحت استفاده از مشتق ورودی اصلی به عنوان ورودی جدید درآن پی خواهید برد. حال تابعی سیستم جدید چنین خواهد شد:

‏3 57

در این¬جا ماتریس وزنی Q جید برابربا و ماتریس وزنی R جدید برابر با می¬باشد. ورودی جدید اضافی می-باشد که باید در تابعی بی¬اثر باشد. لذا باید مقدار را به حد کافی به صفر نزدیک نمود. اگر چه برابر صفر قرار دادن آن ایده-آل به نظر می¬رسد، ولی استفاده از در پیاده¬سازی رابطه¬ی (‏3 37) منجر به نامعین شدن آن می¬شود