Doğrusal Olmayan Sistemler Ders Notları

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Nelineárnı́ systémy Doc. Ing. Miroslav Razı́m, CSc. Prof. Ing. Jan Štecha, CSc. 1997 Edičnı́ středisko ČVUT, Praha 6, Zikova 4 Předmluva Skriptum Nelineárnı́ systémy je určeno předevšı́m pro studenty oboru Technická kybernetika, ale vzhledem k obecnějšı́mu pojetı́ probı́rané látky může sloužit jako základnı́ text i pro studenty jiných oborů, kteřı́ se zajı́majı́ o nelineárnı́ dynamické systémy a jejich řı́zenı́. Převážná část skripta je věnována analýze nelineárnı́ch systémů. Kromě klasických metod, k nimž patřı́ předevšı́m Ljapunovova teorie stability, Popovovo a kruhové kritérium a metoda ekvivalentnı́ch přenosů, jsou do skripta zařazeny i některé modernı́ partie, např. stabilita vstup-výstup, teorie bifurkacı́ rovnovážných stavů a periodických řešenı́, teorie katastrof a základnı́ poznatky o chaotickém chovánı́ systémů. Syntéze řı́zenı́ nelineárnı́ch systémů jsou věnovány kapitoly 14 a 15. Podrobněji jsou uvedeny předevšı́m metody exaktnı́ch linearizacı́, které představujı́ dnes hlavnı́ směr výzkumu nelineárnı́ho řı́zenı́. Závěrečná kapitola obsahuje některé vybrané metody identifikace nelineárnı́ch systémů. Snahou autorů bylo podat ve zhuštěné formě základnı́ přehled problematiky nelineárnı́ch systémů a jejich řı́zenı́. Probı́raná témata jsou proto ilustrována jen malým počtem jednoduchých přı́kladů, složitějšı́ přı́klady, aplikace a počı́tačové programy jsou náplnı́ seminárnı́ch a laboratornı́ch cvičenı́. Kapitoly 1 až 15 skripta zpracoval doc. Ing. Miroslav Razı́m, CSc., kapitolu 16 prof. Ing. Jan Štecha, CSc. Autoři děkujı́ recenzentovi skripta Ing. Antonı́nu Vaněčkovi, DrSc. za velmi pečlivé pročtenı́ rukopisu a za řadu podnětů, které přispěly k definitivnı́ úpravě textu. Autoři budou vděčni uživatelům skripta za připomı́nky, které přispějı́ ke zkvalitněnı́ textu při eventuálnı́m dalšı́m vydánı́. Praha, červen 1997. Autoři Obsah 1 Úvod 1 1.1 Nelineárnı́ prvky a jejich charakteristiky . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Nelineárnı́ dynamické systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.1 Rozdělenı́ nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.2 Matematický popis nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . 5 Sestavovánı́ rovnic nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 2 Základnı́ vlastnosti nelineárnı́ch systémů 10 2.1 Základnı́ pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2 Metody řešenı́ přechodných jevů nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . 13 2.2.1 Analytické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2.2 Metody malého parametru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.3 Grafické a graficko-analytické metody . . . . . . . . . . . . . . . . . . . . . . . 16 2.2.4 Numerické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2.5 Simulace nelineárnı́ch systémů na počı́tačı́ch . . . . . . . . . . . . . . . . . . . . 18 Ustálené stavy nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.1 Autonomnı́ nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.2 Neautonomnı́ nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3 3 Stabilita - základnı́ pojmy a definice 24 3.1 Stabilita rovnovážného stavu volného systému . . . . . . . . . . . . . . . . . . . . . . . 24 3.2 Stabilita pohybu volného systému . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.3 Jiné typy stability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4 Ljapunovova metoda linearizace 4.1 4.2 4.3 29 Lineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.1.1 Lineárnı́ autonomnı́ systémy 29 4.1.2 Lineárnı́ časově variantnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Prvnı́ Ljapunovova metoda pro nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . 36 4.2.1 Lokálnı́ stabilita rovnovážných stavů autonomnı́ch systémů . . . . . . . . . . . 36 4.2.2 Lokálnı́ stabilita rovnovážných stavů neautonomnı́ch systémů . . . . . . . . . . 39 Strukturálnı́ stabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 I 4.4 4.5 Centrálnı́ varieta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.4.1 Výpočet centrálnı́ variety a určovánı́ stability meznı́ho přı́padu . . . . . . . . . 43 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5 Přı́má Ljapunovova metoda 46 5.1 Ljapunovovy funkce pro autonomnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . 46 5.2 Ljapunovovy funkce pro lineárnı́ autonomnı́ systémy . . . . . . . . . . . . . . . . . . . 49 5.3 Ljapunovovy funkce pro nelineárnı́ autonomnı́ systémy . . . . . . . . . . . . . . . . . . 49 5.3.1 Volba Ljapunovovy funkce na základě fyzikálnı́ analogie . . . . . . . . . . . . . 50 5.3.2 Volba Ljapunovovy funkce pro nelineárnı́ systém podle analogie s linearizovaným systémem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Metoda variabilnı́ho gradientu . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3.3 5.4 Ljapunovovy funkce pro neautonomnı́ systémy . . . . . . . . . . . . . . . . . . . . . . 54 5.5 Věty o nestabilitě . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.6 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 6 Speciálnı́ systémy 58 6.1 Gradientnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.2 Pasivnı́ a disipativnı́ dynamické systémy . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.2.1 Pozitivně reálné lineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.2.2 Obecná teorie disipativnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . 63 7 Absolutnı́ stabilita 7.1 7.2 66 Popovovo kritérium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 7.1.1 Odvozenı́ Popovova kritéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.1.2 Popovovo kritérium a Ajzermanova hypotéza . . . . . . . . . . . . . . . . . . . 72 7.1.3 Transformace pólů a nul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 7.1.4 Rozšı́řenı́ Popovova kritéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Kruhové kritérium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 8 Stabilita vstup-výstup 78 8.1 Lebesgueovy prostory a jejich rozšı́řenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.2 Definice stability vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.3 Stabilita zpětnovazebnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 8.3.1 Stabilita při malém zesı́lenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 8.3.2 Přı́stup pomocı́ pasivity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 9 Nelineárnı́ diskrétnı́ systémy 86 9.1 Definice stability autonomnı́ho diskrétnı́ho systému . . . . . . . . . . . . . . . . . . . . 87 9.2 Vyšetřenı́ stability pevných bodů metodou linearizace . . . . . . . . . . . . . . . . . . 87 9.3 Vyšetřenı́ stability pomocı́ přı́mé Ljapunovovy metody . . . . . . . . . . . . . . . . . . 89 10 Periodická řešenı́ a jejich stabilita 90 II 10.1 Analytické metody studia periodických řešenı́ . . . . . . . . . . . . . . . . . . . . . . . 90 10.2 Odhady periodických řešenı́ u systémů druhého řádu . . . . . . . . . . . . . . . . . . . 91 10.3 Poincaréovo zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 10.4 Rovnice ve variacı́ch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 10.5 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 11 Bifurkace rovnovážných stavů a periodických řešenı́ 97 11.1 Bifurkace rovnovážných stavů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 11.2 Bifurkace periodických řešenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 11.3 Teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 11.3.1 Elementárnı́ teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 11.3.2 Aplikace teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 12 Chaos 105 12.1 Chaos v diskrétnı́ch systémech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 12.1.1 Kvadratická diferenčnı́ rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 12.1.2 Po částech lineárnı́ zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 12.1.3 Hénonovo zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 12.2 Chaos u diferenciálnı́ch rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 12.2.1 Lorenzův model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 12.2.2 Jiné modely . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 12.3 Vlastnosti chaotických atraktorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 12.3.1 Ljapunovovy exponenty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 12.3.2 Dimenze atraktorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 13 Metoda ekvivalentnı́ch přenosů 117 13.1 Princip metody ekvivalentnı́ch přenosů pro jeden vstup . . . . . . . . . . . . . . . . . 117 13.2 Ekvivalentnı́ přenosy pro frekvenčně nezávislé nelinearity . . . . . . . . . . . . . . . . 119 13.3 Ekvivalentnı́ přenosy pro frekvenčně závislé nelinearity . . . . . . . . . . . . . . . . . . 123 13.4 Periodická řešenı́ autonomnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . 124 13.5 Nelineárnı́ systémy s většı́m počtem nelinearit . . . . . . . . . . . . . . . . . . . . . . . 126 13.6 Nelineárnı́ systémy s nesymetrickými vlastnı́mi kmity . . . . . . . . . . . . . . . . . . 127 13.7 Ekvivalentnı́ přenos nelinearity se dvěma vstupy . . . . . . . . . . . . . . . . . . . . . 132 14 Metody syntézy nelineárnı́ch řı́dı́cı́ch systémů 134 14.1 Linearizace nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 14.1.1 Linearizace v pracovnı́m bodě . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 14.1.2 Linearizace ve vı́ce pracovnı́ch bodech . . . . . . . . . . . . . . . . . . . . . . . 135 14.1.3 Exaktnı́ linearizace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 14.2 Základnı́ metody syntézy řı́zenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 14.2.1 Lineárnı́ nebo linearizovaná soustava s nelineárnı́m řı́zenı́m . . . . . . . . . . . 136 14.2.2 Nelineárnı́ soustava s lineárnı́m nebo nelineárnı́m řı́zenı́m . . . . . . . . . . . . 137 III 15 Exaktnı́ linearizace 140 15.1 Intuitivnı́ přı́stup k linearizaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 15.1.1 Transformace stavových proměnných . . . . . . . . . . . . . . . . . . . . . . . . 141 15.1.2 Linearizace vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 15.2 Matematické prostředky pro zpětnovazebnı́ linearizace . . . . . . . . . . . . . . . . . . 145 15.3 Linearizace vstup-stav . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 15.4 Linearizace vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 15.4.1 Relativnı́ stupeň r < n. Normálnı́ formy. . . . . . . . . . . . . . . . . . . . . . . 153 15.4.2 Vnitřnı́ a nulová dynamika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 15.4.3 Návrh řı́zenı́ při stabilizaci a sledovánı́ . . . . . . . . . . . . . . . . . . . . . . . 156 15.4.4 Systémy s vı́ce vstupy a výstupy . . . . . . . . . . . . . . . . . . . . . . . . . . 157 16 Identifikace nelineárnı́ch systémů 159 16.1 Obecné úvahy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 16.2 Deterministické modely a jejich identifikace . . . . . . . . . . . . . . . . . . . . . . . . 162 16.2.1 Deterministické metody identifikace nelineárnı́ch systémů . . . . . . . . . . . . 162 16.3 Stochastické modely nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . 164 16.4 Stochastické metody identifikace nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . 175 16.4.1 Bayesovské metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 16.4.2 Rozšı́řený Kalmanův filtr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 16.4.3 Stochastické metody interpolace . . . . . . . . . . . . . . . . . . . . . . . . . . 188 16.4.4 Klasifikace systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 Literatura 197 IV Kapitola 1 Úvod V teorii lineárnı́ch systémů byly studovány fyzikálnı́ a jiné soustavy, které lze popsat lineárnı́mi diferenciálnı́mi rovnicemi. Tento způsob popisu umožňuje relativně jednoduché řešenı́, ale ve skutečnosti je jen určitou aproximacı́ skutečnosti, protože fyzikálnı́, biologické, ekonomické nebo jiné systémy jsou většinou ve své podstatě nelineárnı́. Mnohdy je možno některé nelineárnı́ systémy vyšetřovat s dostatečnou přesnostı́ jako lineárnı́, jestliže se jejich chovánı́ přı́liš neodlišuje od lineárnı́ aproximace, zejména při pohybu v blı́zkosti pracovnı́ch nebo rovnovážných stavů. Proto je znalost modernı́ lineárnı́ teorie nezbytná i pro studium nelineárnı́ch systémů. Často se však vyskytujı́ situace, kdy je linearizovaný model neadekvátnı́ nebo kdy je linearizace nepřı́pustná. Linearizace nám také neumožnı́ studovat speciálnı́ chovánı́, které se objevuje jen u nelineárnı́ch systémů a které nelze lineárnı́ teoriı́ vysvětlit. Jak uvidı́me v dalšı́ch kapitolách, jsou to např. různé typy ustálených oscilacı́, které nejsou vybuzeny vnějšı́m periodickým signálem, dále různé subharmonické a ultraharmonické kmity, skokové rezonance, chaotické jevy apod. Mnohé z těchto jevů jsou nežádoucı́ a jsou vyvolány parazitnı́mi nelinearitami v regulátorech a regulovaných soustavách, např. třenı́m, nasycenı́m, vůlı́ v převodech apod., jiné jevy jsou naopak žádoucı́ a do obvodu často vhodné nelinearity úmyslně zavádı́me. Existuje mnoho rozdı́lů mezi lineárnı́mi a nelineárnı́mi systémy. Řešenı́ lineárnı́ch systémů je velmi často možné zı́skat v uzavřeném tvaru, který umožňuje činit obecné závěry o chovánı́ systému. To v nelineárnı́m přı́padě nenı́ většinou možné a úlohu je třeba bud’ řešit numerickými metodami nebo provádět pouze kvalitativnı́ analýzu, která však často poskytne mnoho informacı́ o chovánı́ nelineárnı́ho systému. Je třeba si také uvědomit, že pro obtı́žnost řešenı́ se u nelineárnı́ch systémů použı́vá mnohem širšı́ paleta metod než u systémů lineárnı́ch, protože neexistuje univerzálnı́ metoda řešenı́. Nelineárnı́ systémy vyžadujı́ také znalost složitějšı́ch matematických disciplı́n jako je např. funkcionálnı́ analýza, diferenciálnı́ geometrie, teorie vektorových polı́ aj. Studium nelineárnı́ch systémů a jejich vlastnostı́ zvyšuje podstatně možnosti pracovat účinně s praktickými problémy a přispı́vá k hlubšı́mu pochopenı́ reálného světa, který je ve své podstatě nelineárnı́. Uvidı́me dále, že jedině pomocı́ nelineárnı́ch teoriı́ lze vysvětlit složité chovánı́ fyzikálnı́ch, biologických, ekonomických a jiných systémů. Např. evoluce v biologii, diferenciace buněk a tkánı́, vznik různých živočišných druhů, chovánı́ jedinců i populacı́, to vše je dáno složitými nelineárnı́mi interakcemi. Ale také řı́zenı́ složitých technických systémů, např. rychlých a přesných robotů, letadel apod. vyžaduje podrobnou znalost nelineárnı́ho chovánı́. Uved’me stručně některé důvody, které nás nutı́ k využitı́ nelineárnı́ho řı́zenı́. Pohyb ve velkých pracovnı́ch rozsazı́ch, kdy už neplatı́ podmı́nky linearizace kolem pracovnı́ho bodu. Lineárnı́ řı́zenı́ má pak často velmi špatné vlastnosti, nelze dosáhnout žádané přesnosti regulace a vyhovujı́cı́ kvality regulačnı́ho pochodu. Kompenzace nelinearit řı́zeného systému nebo vhodný návrh nelineárnı́ho regulátoru mohou vlastnosti celého systému podstatně zlepšit. 1 KAPITOLA 1. ÚVOD 2 Řı́zenı́ systémů s nelinearitami, které nelze linearizovat. V soustavách i regulátorech existuje v praxi mnoho nelinearit, které nedovolujı́ lineárnı́ aproximaci. Jsou to např. třenı́, nasycenı́, hystereze apod., které vyvolávajı́ nežádoucı́ jevy, např. různé typy oscilacı́, velké ustálené regulačnı́ odchylky aj. Jejich vliv je proto třeba predikovat a kompenzovat vhodným návrhem nelineárnı́ho řı́zenı́. Jednoduchost některých nelineárnı́ch systémů. Mnohé regulované soustavy lze velmi dobře řı́dit jednoduchými a často i lacinými prostředky, které přitom plně uspokojı́ požadavky na kvalitu regulace. Jako přı́klad mohou sloužit nespojité regulace teploty, tlaku, průtoku a jiných veličin, kde se v regulátorech často použı́vajı́ jednoduché prvky s charakteristikami reléového typu. Robustnı́ návrh s ohledem na změny parametrů. V mnoha praktických problémech je třeba uvažovat nejistoty v hodnotách parametrů modelu. Jedná se bud’ o pomalé změny parametrů v čase, např. vlivem stárnutı́ prvků, změnami v okolı́ systému apod., nebo o náhlé změny, např. při uchopenı́ zátěže u manipulátorů. Lineárnı́ řı́zenı́ může v těchto přı́padech vést na zhoršené regulačnı́ pochody nebo může dojı́t i k nestabilnı́mu chovánı́. Podstatně lépe se s těmito změnami vyrovná nelineárnı́ řı́zenı́, např. nelineárnı́ robustnı́ nebo adaptivnı́ řı́zenı́. V minulosti byla aplikace metod nelineárnı́ho řı́zenı́ obtı́žná, rychlá výpočetnı́ technika však dnes umožňuje jejich praktické využitı́. To vyvolalo také velký zájem o nelineárnı́ problémy, jejich výzkum a aplikaci. Vzhledem k velmi rozsáhlé problematice nelineárnı́ch systémů se můžeme v omezeném rozsahu skripta zabývat jen základnı́mi metodami analýzy dynamických systémů a některými vybranými metodami, které umožňujı́ syntézu nelineárnı́ch řı́dı́cı́ch systémů. V prvnı́ části skripta budeme předpokládat, že nelineárnı́ systém je popsán matematickými vztahy a budeme provádět analýzu jeho chovánı́, vyšetřovat přechodné jevy, ustálené stavy a jejich stabilitu při změnách počátečnı́ch podmı́nek a parametrů, možnost vzniku chaotického chovánı́, apod. V kapitolách 14 a 15 uvedeme některé metody syntézy vhodného řı́zenı́ dané nelineárnı́ regulované soustavy. Všimneme si jednoduchých možnostı́ řı́zenı́ pomocı́ lineárnı́ch a nelineárnı́ch spojitých i nespojitých regulátorů. Většı́ pozornost budeme věnovat metodám tzv. zpětnovazebnı́ linearizace, která na rozdı́l od jednoduché linearizace kolem pracovnı́ho bodu se snažı́ linearizovat daný nelineárnı́ systém ve většı́m pracovnı́m rozsahu, nebo dokonce i globálně. Tento přı́stup k syntéze řı́zenı́ nám pak umožnı́ návrh regulátoru pomocı́ velmi dobře propracovaných metod řı́zenı́ lineárnı́ch systémů. Poslednı́ kapitola skript je věnována některým problémům identifikace nelineárnı́ch systémů. 1.1 Nelineárnı́ prvky a jejich charakteristiky Nelineárnı́ systémy jsou složeny obvykle z různých lineárnı́ch a nelineárnı́ch členů. Tyto členy mohou být popsány bud’ algebraickými rovnicemi (tzv. statické členy) nebo diferenciálnı́mi rovnicemi (dynamické členy). V matematických modelech fyzikálnı́ch, biologických a jiných objektů se vyskytuje množstvı́ nejrůznějšı́ch typů nelineárnı́ch členů. Z důvodů omezeného prostoru si všimneme pouze typických nelinearit, které se nejčastěji vyskytujı́ v řı́dı́cı́ technice. Mnohé dalšı́ nelinearity uvidı́me v některých konkrétnı́ch přı́kladech v různých částech skripta. Statické prvky jsou takové, u nichž výstup závisı́ jen na okamžitých vstupnı́ch hodnotách a nikoliv na jejich derivacı́ch nebo integrálech. Takové prvky mohou být popsány a) statickou charakteristikou b) tabulkou hodnot (pro numerické zpracovánı́) c) analytickým výrazem y = φ(x). Pro účely analytického vyjádřenı́ nelineárnı́ch charakteristik se použı́vajı́ jednoduché aproximace nelinearity v pracovnı́ oblasti (odst.2.2.1). KAPITOLA 1. ÚVOD 3 V regulačnı́ technice se vyskytujı́ velmi často členy s těmito typy nelineárnı́ch charakteristik: a) Charakteristika typu nasycenı́ (obr.1.1a) se vyskytuje u různých snı́mačů a zesilovačů, jako nasycenı́ se projevujı́ dorazy u mechanických systémů, omezenı́ rychlosti u servomotorů apod. Pro výpočetnı́ účely se skutečný průběh křivky často nahrazuje lomenou charakteristikou (obr.1.1b). b) Charakteristika s pásmem necitlivosti (obr.1.1c). Tuto charakteristiku majı́ např. snı́mače, které majı́ nulový výstup při malých vstupnı́ch signálech (např. vlivem třenı́), hydraulické zesilovače s překrytı́m v rozvodu, některé systémy s vůlı́ v mechanických členech, servomotory při nı́zkém vstupnı́m napětı́ apod. Obr.1.1. Základnı́ typy nelineárnı́ch charakteristik. c) Hystereznı́ charakteristika se vyskytuje u regulačnı́ch členů se železem (servomotory). Podobnou charakteristiku majı́ za určitých podmı́nek také členy se suchým třenı́m nebo s vůlı́ v převodech (obr.1.1d). d) Charakteristika třenı́ (obr.1.1e). Sı́la nebo moment třenı́ závisı́ na rychlosti pohybu. U dynamického rotačnı́ho systému s třenı́m rozlišujeme klidové třenı́ M0 (tzv. statické třenı́, přilnavost) a třenı́ za pohybu, tzv. suché nebo Coulombovo třenı́ Mc . Má-li dynamický systém ještě lineárnı́ viskóznı́ tlumenı́, které také závisı́ na rychlosti, je výsledný tlumı́cı́ moment MT L kombinacı́ vlivu lineárnı́ho tlumenı́ a nelineárnı́ho třenı́ (obr.1.1f). e) Charakteristiky reléového typu jsou nespojité funkce, u nichž se výstup měnı́ skokem při určité hodnotě spojitě se měnı́cı́ho vstupu. Charakteristiky jsou bud’ dvoupolohové bez hystereze nebo s hysterezı́ (obr.1.1g) nebo trojpolohové (s pásmem necitlivosti) bez hystereze nebo s hysterezı́ (obr.1.1h). Zakreslené charakteristiky jsou symetrické, často však mohou být nesymetrické vzhledem k jedné nebo oběma osám. Výjı́mečně se vyskytujı́ také charakteristiky vı́cepolohové. f) Charakteristiky s obecným průběhem majı́ např. různé elektronické prvky (diody, tranzis- KAPITOLA 1. ÚVOD 4 tory, varistory, tyristory, doutnavky, nelineárnı́ kondenzátory a cı́vky aj.), které byly probı́rány v teorii obvodů. Obecné průběhy charakteristik majı́ také mnohé snı́mače fyzikálnı́ch veličin (teplot, průtoků aj.), akčnı́ členy (ventily) apod. Převážná část uvedených nelinearit se vyskytuje v regulačnı́m obvodu u regulátorů (snı́mače, zesilovače, servomotory, ventily), kde jsou obvykle snadno měřitelné a dajı́ se často vyjádřit statickou charakteristikou. Velké množstvı́ nelinearit se ovšem vyskytuje v regulovaných soustavách, při regulaci teplot, hladin, průtoků, tlaku, koncentrace, polohy aj. Fyzikálnı́, chemické, biologické a jiné systémy obsahujı́ mnoho nelinearit a jejich identifikace a matematický popis jsou mnohdy velmi obtı́žné. Nelineárnı́ prvky se v regulačnı́ technice dělı́ také někdy zhruba do dvou velkých skupin. Jsou to jednak přirozené nelinearity, které se někdy také nazývajı́ parazitnı́ a nelinearity úmyslně zaváděné. Prvnı́ z nich jsou v obvodech mnohdy nežádoucı́ a snažı́me se je vyloučit vylepšenou konstrukcı́ nebo kompenzovat vhodným návrhem regulátoru. Druhé do obvodů úmyslně zavádı́me, abychom vytvořili bud’ jednoduché a levné řı́zené systémy (např. pomocı́ dvoupolohových nebo trojpolohových prvků) nebo kompenzovali jiné nelinearity nebo realizovali různé optimálnı́ a suboptimálnı́ systémy. Mnohé nelinearity nemůžeme ovšem jednoznačně zařadit do určité skupiny. Např. nasycenı́ bude nevýhodné, jestliže snı́žı́ rychlost odezvy systému, jindy ho však úmyslně zavedeme pro zlepšenı́ stupně stability obvodu apod. 1.2 Nelineárnı́ dynamické systémy Nelineárnı́ systémy, které jsou složeny pouze ze statických prvků, jsou podrobně probı́rány v teorii obvodů a nebudeme se jimi v tomto textu zabývat. Dále budeme uvažovat pouze dynamické nelineárnı́ systémy, které obsahujı́ obvykle různé lineárnı́ členy a jednu nebo většı́ počet nelinearit. V nelineárnı́ch systémech může vzniknout velké množstvı́ různých jevů, které se nevyskytujı́ v systémech lineárnı́ch. Připomeňme si proto nejprve stručně vlastnosti lineárnı́ch systémů. Nebuzený lineárnı́ systém ẋ = Ax s regulárnı́ maticı́ A má jeden rovnovážný stav v počátku souřadnic, který je stabilnı́, majı́-li všechna vlastnı́ čı́sla matice A zápornou reálnou část. Tato stabilita nezávisı́ na počátečnı́ch podmı́nkách. Přechodný jev lineárnı́ho systému je složen z přirozených módů systému a obecné řešenı́ lze zı́skat analyticky. Buzený systém ẋ = Ax + Bu má při ohraničeném vstupu ohraničený výstup, jestliže nebuzený systém je asymptoticky stabilnı́. Připojı́me-li na vstup vnějšı́ harmonický signál, bude v ustáleném stavu na výstupu rovněž harmonický signál o stejné frekvenci. Protože u lineárnı́ch systémů platı́ princip superpozice, můžeme k popisu použı́t operátorového a frekvenčnı́ho přenosu, frekvenčnı́ charakteristiky nebo odezvy na specifický či obecný vstupnı́ signál. Chovánı́ nelineárnı́ho systému je mnohem komplikovanějšı́. Protože zde neplatı́ princip superpozice, nemůžeme využı́t operátorových a frekvenčnı́ch metod. Rovněž popis systému odezvou na specifický nebo obecný vstupnı́ signál je nevýhodný, protože chovánı́ závisı́ na typu signálu a jeho parametrech. Nebuzený nelineárnı́ systém může mı́t libovolný počet rovnovážných stavů, mohou v něm vzniknout ustálené kmity, které se nazývajı́ samovolně buzené kmity nebo autooscilace.Ty nejsou vybuzeny vnějšı́m periodickým signálem, ale jsou dány jen vlastnostmi nebuzeného systému. V některých nelineárnı́ch systémech mohou vzniknout kvaziperiodické kmity nebo chaotické chovánı́. V čl.1.3 si ukážeme některé tyto jevy na přı́kladu. Definice a podrobné rozbory uvedených jevů budou náplnı́ dalšı́ch kapitol. KAPITOLA 1. ÚVOD 1.2.1 5 Rozdělenı́ nelineárnı́ch systémů Nelineárnı́ systémy můžeme dělit podle různých kritériı́. 1. Podle vazby k okolı́ se rozlišujı́ tři druhy systémů: a) izolovaný systém, u něhož nedocházı́ k výměně energie a hmoty s okolı́m. Izolovaný systém dosahuje časově nezávislého ustáleného stavu, který se nazývá rovnovážný. V něm všechny makroskopické procesy ustanou a všechny makroskopické veličiny zůstávajı́ konstantnı́; b) uzavřený systém, který umožňuje pouze výměnu energie s okolı́m, k výměně hmoty nedocházı́; c) otevřený systém, který vyměňuje s okolı́m energii i hmotu. Uzavřené a otevřené systémy mohou za určitých podmı́nek dosáhnout časově nezávislého ustáleného stavu, v němž makroskopické veličiny zůstávajı́ konstantnı́, ale procesy přı́jmu a výdeje energie nebo i hmoty probı́hajı́. Takový ustálený stav se nazývá stacionárnı́. (V literatuře se tento pojem použı́vá často i pro stav rovnovážný). 2. Podle přı́tomnosti paměti v systému rozlišujeme systémy statické (bez paměti), u nichž všechny vnitřnı́ veličiny jsou jednoznačně určeny okamžitými hodnotami vstupnı́ch veličin a systémy dynamické (s pamětı́), u nichž okamžitá hodnota vnitřnı́ch veličin závisı́ na okamžitých i minulých hodnotách vstupů. 3. Podle závislosti na čase dělı́me systémy na autonomnı́, které nezávisı́ explicitně na čase (např. systémy nebuzené a časově invariantnı́) a systémy neautonomnı́, které jsou bud’ buzené nebo časově variantnı́ nebo obojı́. 4. Podle dalšı́ch kritériı́ můžeme dělit nelineárnı́ systémy např. na deterministické nebo stochastické, se soustředěnými parametry nebo s rozloženými (rozdělenými) parametry, se spojitým časem nebo s diskrétnı́m časem, nebuzené nebo buzené, neřı́zené nebo řı́zené, konzervativnı́ nebo disipativnı́, neadaptivnı́ nebo adaptivnı́, bez učenı́ nebo s učenı́m aj. 1.2.2 Matematický popis nelineárnı́ch systémů 1. Nelineárnı́ systémy se spojitým časem a) Obyčejné nelineárnı́ diferenciálnı́ rovnice popisujı́ systémy se soustředěnými parametry a spojitým časem. Použı́vá se nejčastěji zápis ve formě soustavy diferenciálnı́ch rovnic 1.řádu ẋ = f (x) - autonomnı́ systém (nebuzený, časově invariantnı́) ẋ = f (t, x) - neautonomnı́ systém (nebuzený, časově variantnı́). ẋ = f (x, u) - neautonomnı́ systém (buzený, časově invariantnı́) ẋ = f (t, x, u) - neautonomnı́ systém (buzený, časově variantnı́). Buzený nelineárnı́ systém v obecném tvaru ẋ = f (t, x, u) je obtı́žně řešitelný v uzavřeném tvaru, v praxi se však většinou setkáváme s jednoduššı́m typem systému, který nezávisı́ explicitně na čase ẋ = f (x) + g(x)u. Je to tzv. affinnı́ systém (systém lineárnı́ v řı́zenı́), který budeme použı́vat zejména při syntéze řı́zenı́ v kap.15. Speciálnı́ tvar má také bilineárnı́ systém ẋ = Ax + m X B j xuj , j=1 kde A, B j jsou matice rozměru (n × n). Např. bilineárnı́ systém pro dvě stavové a jednu vstupnı́ KAPITOLA 1. ÚVOD 6 proměnnou má tvar x˙1 = a11 x1 + a12 x2 + (b11 x1 + b12 x2 )u x˙2 = a21 x1 + a22 x2 + (b21 x1 + b22 x2 )u V dalšı́ch kapitolách se setkáme ještě s jinými typy systémů, které majı́ speciálnı́ vlastnosti. Jsou to např. gradientnı́ konzervativnı́, disipativnı́, symetrické a jiné systémy, které budou podrobněji popsány v kap.6. Poznámka: Rozdělenı́ systémů na buzené a nebuzené nenı́ přı́liš přesné. Jestliže v systému ẋ = f (t, x, u) je vstup u specifikován, přejde rovnice na tvar ẋ = f (t, x), který může tedy popisovat dva přı́pady: a) nenı́ vnějšı́ vstup do systému nebo b) je vnějšı́ vstup, ale je udržován na pevné hodnotě během studia chovánı́ systému. b) Parciálnı́ nelineárnı́ diferenciálnı́ rovnice popisujı́ systémy s rozloženými parametry. Jsou to např. rovnice přenosu tepla a hmoty, Navierovy-Stokesovy rovnice v hydrodynamice, rovnice difúze, absorpce, rovnice popisujı́cı́ populačnı́ systémy v biologii a ekologii aj. Nelineárnı́mi systémy, které vedou na parciálnı́ diferenciálnı́ rovnice, se pro omezený rozsah skripta nebudeme zabývat. 2. Nelineárnı́ systémy s diskrétnı́m časem jsou popsány diferenčnı́mi rovnicemi, obecně nelineárnı́ soustavou rovnic prvnı́ho řádu x(k + 1) = f [k, x(k), u(k)] y(k) = g[k, x(k), u(k)]. Nelineárnı́ diskrétnı́ systémy budou uvedeny v kap.9. 1.3 Sestavovánı́ rovnic nelineárnı́ch systémů Chceme-li provádět analýzu nebo syntézu složitých nelineárnı́ch systémů, je výhodné rozdělit systém na jednotlivé a co nejjednoduššı́ prvky a ty pak popisovat algebraickými nebo diferenciálnı́mi rovnicemi. Rovnice sestavujeme na základě známých zákonů, jako jsou např. zákony o zachovánı́ hmoty a energie, Newtonovy zákony, d’Alembertův princip, Kirchhoffovy zákony apod. Výhodné je také použı́t metodu vazebnı́ch grafů, která je podrobně rozpracována a doložena mnoha přı́klady v [3]. Zı́skané rovnice převádı́me na soustavu nelineárnı́ch diferenciálnı́ch rovnic 1.řádu. Obsahuje-li nelineárnı́ systém velký počet nelinearit, snažı́me se obvykle v prvnı́m přiblı́ženı́ některé nelinearity linearizovat. V obvodech pak zůstanou jen podstatné nelinearity, které linearizovat nelze, např. prvky s nespojitými charakteristikami reléového typu apod. V základnı́ch kurzech teorie automatického řı́zenı́ byly probı́rány různé mechanické a elektrické regulované soustavy a odvozovány jejich matematické modely. Uved’me zde proto jiný přı́klad na sestavenı́ rovnic, a to tepelně-chemický systém, který je současně velmi vhodný pro studium různých jevů vznikajı́cı́ch ve složitém nelineárnı́m systému. Podrobný rozbor vlastnostı́ tohoto systému je např. v [2]. Přı́klad 1.1. Průtočné reaktory jsou nádoby, do nichž se kontinuálně přivádějı́ výchozı́ látky, v reaktoru probı́hajı́ chemické reakce, a na výstupu se kontinuálně odebı́rá směs produktů. Předpokládejme, že do mı́chaného průtočného reaktoru (obr. 1.2) přicházı́ jen jedna vstupnı́ látka A s koncentraci cA1 [kg m−3 ]. Tato látka se v reaktoru rozkládá podle chemické reakce prvnı́ho řádu a na výstupu reaktoru odcházı́ s koncentracı́ cA . Látka A vstupuje do reaktoru při teplotě T1 [K], přı́toku F [m3 s−1 ], konstantnı́ hustotě ρ [kg m−3 ] a konstantnı́m měrném teple cp [J kg−1 ]. Dále budeme předpokládat, že v reaktoru probı́há jediná exotermická chemická reakce, směs v reaktoru je dokonale promı́chávána a reakčnı́ objem V [m3 ] je konstantnı́. Koncentrace reakčnı́ složky v reaktoru i na jeho výstupu je cA [kg m−3 ], teplota v reaktoru i na výstupu je T [K], teplota chladiva Tc [K], jeho průtok Fc [m3 s−1 ]. KAPITOLA 1. ÚVOD 7 ')(+*, -*,/.0,'21 3 !#"%$& ')(4, -5, .0,'61 3 ,- 7 /8 /!7# !#" $& Obr. 1.2. Mı́chaný průtočný reaktor. Uvažujme dále počátečnı́ podmı́nky cA (0) a T (0) pro t = 0. Budeme předpokládat, že v reaktoru probı́há reakce 1.řádu s reakčnı́ rychlostı́ r = kcA . Rychlostnı́ konstanta k je funkcı́ teploty v reaktoru podle Arrheniova vztahu E k = k∞ exp(− ), (1.1) RT kde E je aktivačnı́ energie a R univerzálnı́ plynová konstanta. Při vytvářenı́ matematického modelu reaktoru se uvažuje látková a entalpická (energetická) bilance. Látková bilance se sestavuje pro zvolenou složku reakčnı́ směsi, která je v našem přı́padě jediná. Bilanci této složky A lze vyjádřit obecně ve tvaru: akumulace = přı́vod - spotřeba nebo rozepsaně: (změna množstvı́ A v reaktoru za časovou jednotku) = (množstvı́ A přivedené do reaktoru za čas.jednotku) - (množstvı́ A odvedené z reaktoru za čas.jednotku) - (množstvı́ A spotřebované při reakci za čas.jednotku). Látkovou bilanci lze pak popsat diferenciálnı́ rovnicı́ V dcA E = F (cA1 − cA ) − k∞ cA V exp(− ), dt RT (1.2) uvažujeme-li reakci 1.řádu a závislost rychlostnı́ konstanty na teplotě podle Arrheniova vztahu (1.1). Entalpická bilance (pro izobarický proces) je vyjádřena obecně zase ve tvaru: akumulace = přı́vod - spotřeba. Jestliže se tepelná energie při reakci uvolňuje nebo spotřebovává a k přenosu tepla docházı́ pouze vedenı́m a prouděnı́m, lze sestavit bilanci: (časová změna tepla v reaktoru) = (teplo přivedené za jednotku času) - (teplo odvedené výstupnı́m proudem za jednotku času) - (teplo vyměněné stěnou reaktoru za jednotku času) + (teplo uvolněné při chemické přeměně za jednotku času). Pro konstantnı́ reakčnı́ objem V a konstantnı́ hustotu ρ lze psát entalpickou bilanci (při splněnı́ některých dalšı́ch podmı́nek, podrobnosti viz [2]) ρV cp dT E = ρF cp (T1 − T ) − kS(T − Tc ) + (−∆Hr )k∞ cA V exp(− ), dt RT (1.3) kde T1 je teplota na vstupu do reaktoru, T teplota v reaktoru a na jeho výstupu, Tc teplota chladiva, cp měrné teplo při konstantnı́m tlaku, k součinitel přestupu tepla, S plocha přestupu a ∆Hr reakčnı́ entalpie. KAPITOLA 1. ÚVOD 8 Rovnice (1.2) a (1.3) představujı́ soustavu dvou nelineárnı́ch diferenciálnı́ch rovnic pro stavové proměnné cA a T . Proved’me nynı́ rozbor vlastnostı́ tohoto systému pro různé přı́pady. 1. Izotermický systém. Teplotu v reaktoru uvažujeme konstantnı́. Lze to provést řı́zenı́m teploty reaktoru pomocı́ chladı́cı́ho systému. Jestliže T = konst., zůstává pouze rovnice (1.2) pro látkovou bilanci, rovnice (1.3) pro entalpickou bilanci odpadá. a) Lineárnı́ buzený systém s konstantnı́mi parametry dcA F = (cA1 − cA ) − k1 cA dt V (1.4) může mı́t řı́zenı́ cA1 bud’ konstantnı́ nebo časově proměnné. Pro cA1 = konst. je stacionárnı́ stav (dcA /dt = 0) F cA1 cA = F + k1 V Řešenı́ rovnice (1.4) pro různé počátečnı́ podmı́nky cA (0) je na obr. 1.3. Zvolme cA1 =konst., F = konst. a označme střednı́ dobu prodlenı́ τ = V /F . Pak lineárnı́ rovnice (1.4) má řešenı́     t cA1 cA (0) −(1 + k1 τ )  τ . 1 − 1 − (1 + k1 τ ) e cA (t) =  1 + k1 τ  cA1   (1.5) Pro t → ∞ se řešenı́ blı́žı́ stacionárnı́mu řešenı́ cA = cA1 /(1 + k1 τ ). Na obr.1.4 je znázorněna závislost stacionárnı́ho řešenı́ na střednı́ době prodlenı́ τ (diagram řešenı́). U lineárnı́ho systému je pro každou hodnotu parametru τ řešenı́ jediné. Bude-li vstupnı́ koncentrace do reaktoru časově proměnná, např. ve tvaru periodické funkce cA1 (t) = A sin ωt, bude stavová veličina cA také sinovou funkcı́ času s jinou amplitudou a fázovým posuvem. Obr.1.3. Závislost koncentrace na čase. 0br.1.4. Závislost na době prodlenı́. b) Lineárnı́ systém s časově proměnnými parametry vznikne např. při pozvolné deaktivaci katalyzátoru, kdy klesá rychlostnı́ konstanta k1 podle vztahu k1 (t) = k10 (1 − αt), kde α je velmi malé kladné čı́slo. Pak (1.4) přejde na F dcA = (cA1 − cA ) − k1 (t)cA . dt V (1.6) c) Nelineárnı́ buzený systém vznikne např. tehdy, jestliže vstupnı́ koncentrace cA1 bude konstantnı́ a reakce bude řı́zena změnou průtoku F . Aby vynikl vztah mezi obecným značenı́m uvedeným KAPITOLA 1. ÚVOD 9 v čl. 1.2.2 a použitými symboly v přı́kladu, označme řı́zenı́ F ≡ u a cA ≡ x. Pak můžeme rovnici (1.4) psát ve tvaru 1 (1.7) ẋ = −k1 x + (cA1 − x)u. V Systém je nynı́ v nelineárnı́m afinnı́m tvaru ẋ = f (x) + g(x)u. 2. Neizotermický systém. Nebude-li v reaktoru udržována konstantnı́ teplota během reakce, vznikne neizotermický systém a musı́me uvažovat i rovnici (1.3) pro entalpickou bilanci. Systém má nynı́ dvě stavové proměnné cA a T a je popsán dvěma nelineárnı́mi diferenciálnı́mi rovnicemi 1. řádu. Simulacı́ systému zı́skáme tyto výsledky: Vstupnı́ koncentrace cA1 = konst. V závislosti na hodnotách parametrů rovnic mohou nastat tyto tři přı́pady: a) v reaktoru existuje jeden nestabilnı́ stacionárnı́ stav (cA , T ), od kterého se řešenı́ vzdaluje a po ustálenı́ vznikajı́ trvalé oscilace koncentrace i teploty; b) v reaktoru existujı́ tři stacionárnı́ stavy, jeden nestabilnı́ a dva stabilnı́. V závislosti na počátečnı́ch podmı́nkách směřuje řešenı́ do jednoho ze stabilnı́ch stavů; c) v reaktoru existujı́ tři stacionárnı́ stavy (jeden stabilnı́ a dva nestabilnı́) a jedno stabilnı́ periodické řešenı́. Vstupnı́ koncentrace je časově proměnná. Bude-li vstupnı́ koncentrace cA1 periodicky proměnná, pak mohou vzniknout tři odlišné typy výstupnı́ch průběhů cA a T . Výstup může být periodický, kvaziperiodický (časový průběh vykazuje např. dvě periodicity) nebo chaotický, kdy výstup se zcela nepravidelně měnı́. Z uvedeného přı́kladu je patrno, že i u relativně jednoduchého dvourozměrného nelineárnı́ho systému se setkáváme s celou řadou jevů, které nemohou v lineárnı́ch systémech nastat. V dalšı́ch kapitolách se jimi budeme zabývat podrobněji. Kapitola 2 Základnı́ vlastnosti nelineárnı́ch systémů 2.1 Základnı́ pojmy 1. Autonomnı́ systémy Velké množstvı́ fyzikálnı́ch, chemických, biologických a jiných systémů lze popsat soustavou homogennı́ch obyčejných diferenciálnı́ch rovnic 1. řádu ẋ1 = f1 (x1 , ..., xn ) ẋ2 = f2 (x1 , ..., xn ) ... ẋn = fn (x1 , ..., xn ), (2.1) ve vektorovém zápisu ẋ = f (x), kde fi , i = 1, ..., n jsou reálné funkce n reálných proměnných. Vektor x(t) = (x1 (t), ..., xn (t)) ∈ Rn a f : Rn → Rn je zobrazenı́ třı́dy C r , r ≥ 1. Soustavu (2.1) můžeme interpretovat jako matematický model reálného dynamického systému a pak x(t) je stav tohoto systému. Prostor Rn se nazývá stavový nebo fázový prostor systému (2.1) a zobrazenı́ f lze chápat jako vektorové pole na Rn . Každému bodu x ∈ Rn je přiřazen vektor f (x), který z bodu vycházı́. Tento vektor udává rychlost změny stavu ẋ = dx/dt (fázová rychlost). Mnoho praktických problémů vede na autonomnı́ systém ẋ = f (x), kde f : M → Rn je zobrazenı́ definované na podmnožině M ⊆ Rn . Touto podmnožinou může být nějaká křivka nebo plocha v Rn , obecně diferencovatelná varieta. Některé přı́klady na tyto variety budou uvedeny v dalšı́m textu. Zatı́m můžeme pro jednoduchost předpokládat, že vektorové pole f je definováno v celém prostoru Rn . Řešenı́ diferenciálnı́ rovnice ẋ = f (x) je diferencovatelné zobrazenı́ ϕ : I → Rn intervalu I = {t ∈ R, a < t < b} do stavového prostoru Rn , které pro všechna t ∈ I vyhovuje soustavě d [ϕ(t)] = f (ϕ(t)). dt Pro jednoduchost budeme dále předpokládat, že řešenı́ je definováno pro všechny časy t ∈ R. Protože vektorové pole f nezávisı́ na čase (je invariantnı́ vzhledem k posunutı́ času), můžeme počátečnı́ čas uvažovat vždy rovný nule. Počátečnı́ podmı́nka je pak x(0) = x0 . Zobrazenı́ ϕ(t) ∀t se také nazývá pohyb bodu a jeho znázorněnı́ ve stavovém (fázovém) prostoru je stavová (fázová) trajektorie (fázová křivka, orbita). Součin R × Rn je rozšı́řený stavový prostor, graf řešenı́ v R × Rn je tzv. integrálnı́ křivka. Řešenı́ diferenciálnı́ rovnice s počátečnı́ podmı́nkou x0 vyžaduje tedy nalezenı́ funkce ϕ(t) takové, že křivka x = ϕ(t) ležı́cı́ v Rn a parametrizovaná časem t, procházı́ bodem x0 a má v každém svém bodě x právě f (x) jako tečný vektor. Množina těchto tečných vektorů se nazývá směrové pole. Podobně i integrálnı́ křivka jako graf zobrazenı́ x = ϕ(t) v R × Rn má v každém bodě (t, ϕ(t)) tečnu, jejı́ž sklony vůči osám t, x jsou (1, f (x)). 10 KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 11 Poznámka: V dalšı́m budeme mı́sto obecného označenı́ ϕ(t) psát zjednodušeně x(t) nebo x(t, x0 ). Jsou-li splněny podmı́nky existence a jednoznačnosti, má rovnice ẋ = f (x) jediné řešenı́ vyhovujı́cı́ zadané počátečnı́ podmı́nce x0 . Každým regulárnı́m bodem stavového prostoru procházı́ tedy pouze jedna trajektorie, trajektorie se zde nemohou protı́nat ani se vzájemně dotýkat. Soubor všech řešenı́ x(t) pro všechny možné počátečnı́ podmı́nky lze vyjádřit souhrnným pojmem (fázový) tok Φ vektorového pole f , resp. tok diferenciálnı́ rovnice ẋ = f (x). Tok je zobrazenı́, které přiřazuje danému x0 a danému času t hodnotu řešenı́ x(t), které má jako počátečnı́ stav x0 , tj. Φ(t, x0 ) = x(t) nebo zkráceně Φt = x(t). Pro tok platı́ Φt2 (Φt1 (x0 )) = Φt1 +t2 (x0 ). Známe-li tedy řešenı́ x(t1 ) s počátečnı́m stavem x(t0 ) = x0 , pak řešenı́ x(t2 ) s počátečnı́m stavem x(t1 ) je totožné s řešenı́m x(t1 + t2 ) s počátečnı́m stavem x(t0 ). Trajektorie generované tokem Φ se nikde neprotı́najı́. Diferenciálnı́ rovnice, které majı́ globálnı́ tok, jsou vždy reverzibilnı́ v čase. Objasněme si pojem toku nejprve na jednoduchém lineárnı́m autonomnı́m systému. Systém 1. řádu ẋ = −kx, k > 0, x(0) = x0 , má řešenı́ x(t) = e−kt x0 . Zobrazenı́ Φt : R → R převede stav x0 na stav x(t) v čase t Φt x0 = e−kt x0 ⇒ Φt = e−kt Fázový tok odpovı́dajı́cı́ rovnici ẋ = −kx je tedy e−kt . Podobně u vektorové lineárnı́ rovnice ẋ = Ax je fázový tok Φt = eAt . Z přı́kladů je patrno, že je-li znám tok soustavy, pak jsou známa všechna řešenı́ soustavy x(t) = Φt x0 . U nelineárnı́ch systémů je analytické vyjádřenı́ toku obtı́žné, proto nebudeme otázky existence a určenı́ toku pro danou nelineárnı́ rovnici zkoumat a budeme pouze předpokládat, že jejı́ tok existuje. Při kvalitativnı́ analýze nelineárnı́ch systémů nás zajı́majı́ předevšı́m ustálené stavy, jejich typy a stabilita. U autonomnı́ch systémů mohou být ustálené stavy rovnovážné, periodické nebo kvaziperiodické. Některé nelineárnı́ systémy vykazujı́ chaotické chovánı́. Podrobnějšı́ výklad těchto přı́padů bude podán v čl.2.3 a v některých dalšı́ch kapitolách. Zde si pro ilustraci provedeme jen některé základnı́ úvahy. Problémy reálných dynamických systémů lze formulovat v různé terminologii. Můžeme zůstat u terminologie klasického pojetı́ diferenciálnı́ch rovnic nebo můžeme formulovat problém pomocı́ vektorových polı́ nebo také pomocı́ toků. Jak uvidı́me v dalšı́ch kapitolách lze některé problémy teorie nelineárnı́ch systémů výhodně formulovat v pojmech klasické teorie diferenciálnı́ch rovnic, jindy je výhodnějšı́ využı́t terminologie toků. Mnohé problémy lze zase velmi názorně řešit a zobrazovat pomocı́ vektorových polı́. Analýza nelineárnı́ch dynamických systémů začı́ná nejčastěji určovánı́m rovnovážných stavů a proto si jako přı́klad různých formulacı́ uved’me definici těchto stavů. Definice 2.1. Mějme soustavu diferenciálnı́ch rovnic ẋ = f (x) a necht’ Φt je jejı́ tok. Pak a) bod x ∈ Rn , pro který platı́ f (x) = 0 je singulárnı́ bod soustavy diferenciálnı́ch rovnic (také stacionárnı́ bod nebo stacionárnı́ řešenı́); b) bod x je nulový bod funkce f neboli rovnovážný stav vektorového pole f (x), resp. rovnovážný (klidový) stav dynamického systému popsaného rovnicı́ ẋ = f (x); c) bod x ∈ Rn , pro který platı́ Φt x = x ∀t ∈ R, se nazývá pevný bod toku. Pojmy singulárnı́ bod, stacionárnı́ bod, rovnovážný stav nebo pevný bod se proto často vzájemně zaměňujı́. Kromě rovnovážných stavů mohou u autonomnı́ch systémů od 2. řádu výše existovat uzavřené trajektorie (periodické orbity). Definice 2.2. Periodická orbita γ se základnı́ periodou T > 0 je řešenı́, pro které platı́ x(t) = KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 12 x(t + T ), tj. x(T ) = x(0) a x(t) 6= x(0) pro 0 < t < T . Řešenı́ s počátečnı́ podmı́nkou x(0) ∈ γ je periodické řešenı́ s periodou T . Speciálnı́ přı́pad periodických trajektoriı́ představujı́ homoklinické a heteroklinické trajektorie. Homoklinická trajektorie přı́slušná k rovnovážnému bodu x je trajektorie, která se asymptoticky blı́žı́ k x v čase t → ∞. Je to uzavřená křivka, která z bodu x vycházı́ a zase se do něho vracı́. Čas, který potřebuje fázový bod k oběhu homoklinické trajektorie, je nekonečně velký, rychlost pohybu se v blı́zkosti x blı́žı́ k nule. Homoklinickou orbitu lze chápat jako periodickou trajektorii s nekonečně velkou periodou. Heteroklinická trajektorie mezi dvěma stacionárnı́mi body x1 , x2 je trajektorie, která vycházı́ z jednoho bodu a končı́ ve druhém. Existujı́-li dvě heteroklinické orbity, z bodu x1 do x2 a z x2 do x1 , pak se vytvořı́ smyčka, která zase představuje periodickou orbitu s nekonečně velkou periodou. Obecné trajektorie toku mohou mı́t velmi složité vlastnosti, které budeme podrobněji rozebı́rat v dalšı́ch kapitolách. Zde si uvedeme pouze dva pojmy, které budeme později potřebovat. Definice 2.3. Necht’ Φ je tok soustavy (2.1) a γ je trajektorie procházejı́cı́ bodem x0 . a) Bod y ∈ Rn je ω-limitnı́ bod trajektorie γ, jestliže existuje taková posloupnost reálných čı́sel {tk }∞ k=1 , limk→∞ tk = +∞, že limk→∞ Φ(tk , x0 ) = y. Množina ω(γ) všech ω-limitnı́ch bodů dané trajektorie γ se nazývá ω-limitnı́ množina trajektorie γ. b) Bod z ∈ Rn je α-limitnı́ bod trajektorie γ, jestliže existuje taková posloupnost reálných čı́sel {tk }∞ k=1 , limk→∞ tk = −∞, že limk→∞ Φ(tk , x0 ) = z. Množina α(γ) všech α-limitnı́ch bodů dané trajektorie γ se nazývá α-limitnı́ množina trajektorie γ. Přı́klady: Trajektorie γ, která limituje do rovnovážného bodu x, má množinu svých ω-limitnı́ch bodů jednobodovou, tj. ω(γ) = x. Trajektorie γ, která limituje k uzavřenému meznı́mu cyklu γ, má ω(γ(x0 )) = γ. Každý bod y ∈ γ je ω-limitnı́m bodem trajektorie γ(x0 ). Systém (2.1) se po zadánı́ počátečnı́ podmı́nky bude pohybovat po určité trajektorii k rovnovážnému bodu nebo k periodické orbitě (pokud jsou stabilnı́) nebo k nějakému složitějšı́mu limitnı́mu objektu. Po uplynutı́ dostatečně dlouhého času se fázový bod dostane do blı́zkého okolı́ limitnı́ množiny. Přechodné jevy ztrácejı́ proto svou důležitost ve srovnánı́ s limitnı́ množinou. Proto nás bude zajı́mat předevšı́m asymptotické chovánı́ na těchto limitnı́ch množinách a v jejich blı́zkém okolı́. Limitnı́ objekty majı́ výhodnou vlastnost, kterou je invariantnost vzhledem k toku. Definice 2.4. Invariantnı́ množina S toku Φt je množina S ⊂ Rn , pro kterou platı́ implikace x ∈ S ⇒ Φt (x) ∈ S pro všechna t ∈ R. (Formálně lze také psát Φt (S) = S). Je-li S invariantnı́ množina systému (2.1), pak každá trajektorie, která procházı́ bodem x ∈ S, ležı́ celá v S. Např. rovnovážný stav je jednobodová invariantnı́ množina, každá individuálnı́ trajektorie (tedy i uzavřená trajektorie) je invariantnı́ množina. Invariantnı́ množiny mohou být i vı́cedimenzionálnı́, obecně mohou mı́t i tutéž dimenzi jako stavový prostor. Některé dalšı́ přı́klady budou uvedeny v kap.4. Důležitý typ limitnı́ množiny je atraktor. V literatuře existuje vı́ce definic atraktoru, protože atraktor může být velice komplikovanou množinou. Pro naše účely bude stačit tato definice: Definice 2.5. Uzavřená invariantnı́ množina A ⊂ Rn se nazývá atraktor, existuje-li takové okolı́ U ⊃ A, že pro všechna x ∈ U a pro Φt (x) ∈ U , t ≥ 0 limituje Φt (x) → A pro t → ∞. Množina U se nazývá oblast přitažlivosti atraktoru A. Poznámky: a) Vzhledem k velké složitosti některých atraktorů vyžaduje přesnějšı́ definice, aby v atraktoru exis- KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 13 tovala trajektorie, která jej hustě vyplnı́. Podrobnosti jsou např. v [32]. b) Přı́kladem nejjednoduššı́ch atraktorů jsou stabilnı́ rovnovážné stavy a stabilnı́ uzavřené trajektorie. Složitějšı́ atraktory (např. vı́cerozměrný torus, chaotický atraktor a jiné typy) budou uvedeny v dalšı́ch kapitolách. c) Objem atraktoru ve fázovém prostoru disipativnı́ch systémů je nulový. d) U konzervativnı́ch systémů neexistujı́ atraktory a oblasti přitažlivosti, fázový bod na trajektorii s danou počátečnı́ podmı́nkou se opakovaně navracı́ k původnı́ počátečnı́ podmı́nce. e) Repelor je množina, která má všechny vlastnosti s atraktorem shodné, ale trajektorie na rozdı́l od atraktoru odpuzuje. Při změně orientace času tj. při substituci t = −t se ve stavovém prostoru daného nelineárnı́ho dynamického systému změnı́ všechny atraktory na repelory a naopak. 2. Časově variantnı́ nebuzené systémy jsou popsány rovnicı́ ẋ = f (t, x) x(t0 ) = x0 . (2.2) Chovánı́ těchto systémů závisı́ na počátečnı́m čase t0 , který nemůžeme pokládat vždy za nulový. Základnı́ pojmy uvedené pro autonomnı́ systémy jsou platné i pro (2.2). Rovnovážný stav nastane, jestliže f (t, x) = 0 pro všechna t ≥ t0 . Definice invariantnı́ množiny je stejná jako pro autonomnı́ systémy, na rozdı́l od nich však trajektorie systému (2.2) nenı́ obecně invariantnı́ množinou. Existence a jednoznačnost řešenı́ Než přistoupı́me k vlastnı́mu řešenı́ nelineárnı́ch rovnic typu (2.1) nebo (2.2), je třeba zkoumat otázky existence a jednoznačnosti řešenı́. Rovnice mohou mı́t a) nejméně jedno řešenı́ (problém existence řešenı́); b) právě jedno řešenı́ pro všechny dostatečně malé hodnoty t (lokálnı́ existence a jednoznačnost řešenı́); c) právě jedno řešenı́ pro všechna t v intervalu [0, ∞) (globálnı́ existence a jednoznačnost řešenı́); d) právě jedno řešenı́ pro všechna t v intervalu [0, ∞) a toto řešenı́ závisı́ spojitě na počátečnı́ podmı́nce x0 . Pro praxi je nejvýhodnějšı́ čtvrtý přı́pad, je však známo, že bez určitých omezenı́ na funkci f nenı́ zaručena ani sama existence řešenı́. Z teorie diferenciálnı́ch rovnic jsou známy některé věty o jednoznačnosti a existenci řešenı́, jako je např. Cauchyova existenčnı́ věta, Lipschitzovy podmı́nky apod. Podrobný rozbor lze nalézt např. v [55]. Pro naše dalšı́ účely budeme předpokládat, že funkce f je dostatečně hladká k zajištěnı́ podmı́nek existence a jednoznačnosti řešenı́. 2.2 Metody řešenı́ přechodných jevů nelineárnı́ch systémů Viděli jsme již, že přechodné jevy u nelineárnı́ch systémů se mohou podstatně lišit od přechodných jevů lineárnı́ch systémů a mohou vést ke kvalitativně zcela novým typům chovánı́. Z mnoha metod, které byly vyvinuty pro řešenı́ nelineárnı́ch dynamických systémů uvedeme stručně jen ty, které se použı́vajı́ předevšı́m v regulačnı́ technice. Metody můžeme zhruba rozdělit na analytické, grafické, numerické a metody využı́vajı́cı́ simulace na počı́tačı́ch. 2.2.1 Analytické metody Podstatou analytických metod je integrace diferenciálnı́ rovnice systému. Hlavnı́ význam spočı́vá v tom, že zı́skáme obecné vztahy platné pro všechna řešenı́. a) Aproximace nelineárnı́ charakteristiky tečnou nebo sečnou v pracovnı́m bodě KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 14 Tato metoda nedává pro řešenı́ nelineárnı́ch systémů žádné kvalitativně nové výsledky, protože se jedná o běžnou linearizaci. Aproximace sečnou v určité pracovnı́ oblasti jen někdy lépe nahrazuje skutečnou nelineárnı́ charakteristiku než tečna v určitém pracovnı́m bodě. Linearizace nelineárnı́ch charakteristik se použı́vá nejčastěji tehdy, je-li v systému vı́ce nelinearit, z nichž některé jsou nepodstatné (např. se málo lišı́ od lineárnı́ charakteristiky). Ty je pak vhodné linearizovat a vytvořit pro prvnı́ aproximativnı́ řešenı́ systém s menšı́m počtem nelinearit. b) Aproximace nelineárnı́ charakteristiky přı́mkovými úseky Tato aproximace umožňuje nahradit nelineárnı́ rovnici systému několika lineárnı́mi diferenciálnı́mi rovnicemi, z nichž každá popisuje přechodný jev systému v určitém časovém intervalu, ve kterém se systém nacházı́ na přı́slušném linearizovaném úseku nelineárnı́ charakteristiky. Pro charakteristiky složené z přı́mek (např. reléové charakteristiky) je metoda přesná a proto se někdy jejı́ pomocı́ řešı́ přechodné jevy v jednoduššı́ch nespojitých nelineárnı́ch systémech. U této metody je však mnohdy obtı́žné určenı́ okamžiku přechodu z jedné lineárnı́ diferenciálnı́ rovnice na druhou a stanovenı́ nových počátečnı́ch podmı́nek při přechodu. Analytické řešenı́ okamžiků přepnutı́ vede často na složité transcendentnı́ rovnice, které je nutno řešit na počı́tači. c) Aproximace nelineárnı́ charakteristiky analytickým výrazem Nelinearita v systému je bud’ dána analytickou funkcı́ nebo se vhodnou funkcı́ aproximuje tak, aby vzniklá nelineárnı́ rovnice byla co nejjednoduššı́ a byla analyticky řešitelná. Z teorie diferenciálnı́ch rovnic je ovšem známo, že analyticky lze řešit jen málo typů nelineárnı́ch rovnic. Jsou to některé speciálnı́ typy rovnic 1.řádu např. rovnice Riccatiova, Lagrangeova, Clairautova nebo rovnice, které umožňujı́ řešenı́ metodou separace proměnných [6,18]. V regulačnı́ technice se této možnosti využije jen zřı́dka, častěji lze nelineárnı́ rovnice analyticky řešit v jednoduchých chemických, fyzikálnı́ch nebo biologických systémech. Analytické metody se častěji použı́vajı́ např. v radiotechnice pro teoretické řešenı́ modulace, detekce apod., a v teorii elektrických obvodů. Je-li nelineárnı́ funkce spojitá a má potřebný počet spojitých derivacı́, můžeme ji v okolı́ pracovnı́ho bodu vyjádřit MacLaurinovou nebo Taylorovou řadou, ze které vezmeme vhodný počet členů. Jedná se tedy o náhradu nelineárnı́ funkce y = f (x) mnohočlenem y = a0 + a1 x + a2 x2 + ... + an xn . Velmi často se použı́vá náhrada kvadratickou funkcı́ y = a0 + a1 x + a2 x2 nebo kubickou parabolou, např. ve tvaru y = a0 + a1 x − a3 x3 pro vyjádřenı́ charakteristik typu nasycenı́. Elektronické i mechanické prvky se často charakterizujı́ i jinými funkcemi, např. exponenciálnı́mi, goniometrickými apod. Přı́klad 2.1. Při modelovánı́ jednoduchých chemických reakcı́ dostáváme nelineárnı́ diferenciálnı́ rovnice, přičemž některé z nich lze řešit analyticky. Např. jednoduchá reakce druhého řádu k A + B −→ C spočı́vá v tom, že smı́šenı́m látek A a B dojde k jednosměrné reakci, při nı́ž vzniká výsledná látka C. Tento přı́pad lze modelovat jednoduchou nelineárnı́ diferenciálnı́ rovnicı́, která je analyticky řešitelná. Označme okamžité hodnoty koncentracı́ látek malými pı́smeny a, b, c. Uvažujme počátečnı́ hodnoty koncentracı́ a0 , b0 , c0 a látkovou bilanci a + c = a0 + c0 , b + c = b0 + c0 . Reakci lze popsat rovnicemi da db = = −kab dt dt dc = kab dt (2.3) KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 15 Obr.2.1. Průběh koncentracı́ u reakce 2.řádu. Zvolı́me-li pro jednoduchost např. c0 = 0, pak dc = kab = k(a0 − c)(b0 − c) dt Rozložı́me na částečné zlomky a integrujeme Z Z Z 1 dc dc − = kdt a0 − b0 b0 − c a0 − c (2.4) (2.5) Po integraci dostaneme kt = 1 b0 (a0 − c) ln a0 − b0 a0 (b0 − c) (2.6) Pro hledanou závislost koncentrace c na čase upravı́me na tvar c= a0 b0 (1 − e−(a0 − b0 )kt ) a − b e−(a0 − b0 )kt 0 (2.7) 0 Volı́me-li např. počátečnı́ hodnoty a0 = 1; b0 = 0, 5; c0 = 0 a k = 1, dostaneme vztah c= 0.5(1 − e−0.5t ) 1 − 0.5e−0.5t (2.8) Z látkové bilance lze zı́skat průběhy koncentracı́ a(t) a b(t). Všechny průběhy jsou zakresleny na obr. 2.1. 2.2.2 Metody malého parametru Jsou to přibližné analytické metody, které jsou rozšı́řeny zejména ve fyzice a radiotechnice. Použı́vajı́ se pro systémy, ve kterých se nelineárnı́ charakteristika nějakého prvku přı́liš nelišı́ od lineárnı́. Takový systém je blı́zký lineárnı́mu a někdy se nazývá kvazilineárnı́. Řešenı́ se hledá tak, že systém se nejprve řešı́ jako lineárnı́ a zı́skaný výsledek se zpřesňuje pomocı́ korekčnı́ch členů ve tvaru mocninných řad. Např. u nelineárnı́ diferenciálnı́ rovnice typu ẍ + ω02 x + µf (x, ẋ) = 0, kde µ < 1 je malý parametr, KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 16 hledáme řešenı́ ve tvaru x(t) = x0 (t) + µx1 (t) + µ2 x2 (t) + ... Člen x0 (t) je řešenı́m lineárnı́ rovnice ẍ + ω02 x = 0. Metody malého parametru lze použı́t i pro systémy s časově proměnnými parametry, jsou-li změny pomalé, nelze však jimi řešit systémy, u nichž se nelineárnı́ charakteristiky značně lišı́ od lineárnı́ch průběhů nebo kdy charakteristiky jsou nespojité. Z metod malého parametru jsou nejznámějšı́: a) metoda amplitudy s pomalou změnou (Van der Polova metoda) b) metoda perturbacı́ (Poincaréova metoda) Protože metody malého parametru jsou velmi pracné a nejsou rozšı́řeny v regulačnı́ technice, nebudeme se jimi podrobněji zabývat. 2.2.3 Grafické a graficko-analytické metody Před rozvojem počı́tačového modelovánı́ se použı́valo pro řešenı́ nelineárnı́ch diferenciálnı́ch rovnic mnoho grafických metod a metod použı́vajı́cı́ch nomogramy. Všechny tyto metody ztratily svůj význam a nebudeme je podrobněji rozvádět. Grafické znázorněnı́ trajektoriı́ ve stavovém (fázovém) prostoru se ovšem využı́vá velmi často, zejména u systémů druhého a třetı́ho řádu. Zakreslenı́ celého pole trajektoriı́ dává velmi rychlý názor na chovánı́ nelineárnı́ho systému při různých počátečnı́ch podmı́nkách. To je výhodné zejména u systémů druhého řádu, kdy pole trajektoriı́ ležı́ ve fázové rovině. Protože na diferenciálnı́ rovnice 2. řádu vede mnoho praktických aplikacı́, je znalost fázových portrétů velmi důležitá. Fázové trajektorie u 2. řádu lze nakreslit poměrně jednoduchou grafickou konstrukcı́, dnes se to však již neprovádı́, protože pole trajektoriı́ rychle a přesně generuje a zakreslı́ počı́tač při použitı́ vhodné simulačnı́ metody. Je však stále ještě užitečné seznámit se s jednoduchou grafickou metodou vhodnou pro zakreslenı́ fázové trajektorie, jednak pro rychlou orientačnı́ kontrolu výsledku z počı́tače a jednak pro zı́skánı́ určitého názoru na závislosti jednotlivých proměnných a času, kterým je parametrizována fázová trajektorie. Jednou z několika metod použitelných pro grafické zakreslenı́ fázové trajektorie je metoda tečen. Jejı́ princip si můžeme ukázat na jednoduché, ale často se v aplikacı́ch vyskytujı́cı́ diferenciálnı́ rovnici 2. řádu typu ẍ + g(ẋ) + f (x) = 0. Substitucı́ x = x1 , ẋ = x2 převedeme uvedenou rovnici na soustavu dvou rovnic 1. řádu ẋ1 = x2 ẋ2 = −g(x2 ) − f (x1 ). (2.9) Dělı́me-li druhou rovnici prvnı́ rovnicı́, zı́skáme popis systému ve tvaru dx2 −g(x2 ) − f (x1 ) = dx1 x2 (2.10) Tato rovnice vyjadřuje vztah pro směrnici tečny fázové trajektorie v rovině (x1 , x2 ). Velikost směrnice je dána pravou stranou, která musı́ být splněna v každém bodě fázové trajektorie. Grafická konstrukce spočı́vá tedy v tom, že v každém bodě fázové roviny sestrojujeme graficky tečnu podle vztahu (2.10). V rovině (x1 , x2 ) vyneseme ve stejném měřı́tku křivky x1 = −g(x2 ) a x2 = f (x1 ) (obr. 2.2). Element tečny v libovolně zvoleném bodě A zı́skáme takto: sestrojı́me rovnoběžky s osami, hodnotu funkce f (x1 ) pro x1 bodu A (úsečka a) naneseme na rovnoběžku s osou x1 tak, aby konec této úsečky padl na vertikálnı́ osu. Zı́skáme bod 1. Hodnota x1 v bodě A je záporná, hodnota f (x1 ) je rovněž záporná, podle vztahu (2.10) je tedy −f (x1 ) kladná úsečka 1-4. Od nı́ odečteme hodnotu −g(x2 ), která je na obrázku reprezentována úsečkou b. Zı́skáme bod 2. Úsečka 1-2 tedy představuje grafický rozdı́l −f (x1 ) − g(x2 ). Spustı́me-li z bodu 2 kolmici na vodorovnou osu, zı́skáme trojúhelnı́k 1-2-3, jehož jedna odvěsna představuje čitatel a druhá jmenovatel KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 17 Obrázek 2.1: Metoda tečen pravé strany vztahu (2.10). Kolmice na přeponu tohoto trojúhelnı́ka udává směr tečny v bodě A (sestrojı́me element tečny v bodě 1 a rovnoběžně posuneme do bodu A). Při praktické konstrukci nahrazujeme element tečny krátkým obloučkem ∆s opsaným kružı́tkem z bodu 3’. Abychom dosáhli vyhovujı́cı́ přesnosti metody, volı́me délku obloučku dostatečně malou (při středovém úhlu ∆ε asi 0,1 až 0,2 rad). Na elementu tečny zvolı́me dalšı́ bod B a konstrukci opakujeme. Tak je možno velmi rychle zakreslit část fázové trajektorie vycházejı́cı́ ze zvoleného počátečnı́ho stavu A. Tato trajektorie nenı́ ovšem ještě ocejchována časem, který je parametrem na trajektorii. Existujı́ však jednoduché vztahy mezi časem a elementem oblouku fázové trajektorie [7]. Čas odpovı́dajı́cı́ jednotlivým polohám zastupujı́cı́ho bodu je možno určit různými způsoby. Pro praktickou potřebu však stačı́ vztah udávajı́cı́ závislost mezi délkou oblouku fázové trajektorie a přı́růstkem času na tomto oblouku. Lze odvodit, že ∆ε = k∆t, kde ∆t je přı́růstek času na elementu trajektorie opsaném při středovém úhlu ∆ε a konstanta k rozměru s−1 je rovna jedné, jsou-li na obou osách fázové roviny zvolena stejná měřı́tka. Pro určité zvolené ∆t můžeme tedy při vynášenı́ fázové trajektorie provádět současně jejı́ kótovánı́ časem pomocı́ zvoleného úhlu ∆ε. 2.2.4 Numerické metody Složité nelineárnı́ systémy nelze řešit ani analyticky ani graficky a je třeba použı́t vhodné numerické metody. Běžné jsou klasické numerické metody, z nichž se nejčastěji použı́vajı́ metody Runge-Kutta a jejich modifikace. Programy těchto metod jsou běžným vybavenı́m čı́slicových počı́tačů. Kromě klasických metod byly vyvinuty také speciálnı́ metody, které použı́vajı́ různých odlišných způsobů numerické integrace, např. metody časových řad, metody odvozené ze Z-transformace a jiné. V regulačnı́ technice se prakticky nepoužı́vajı́. Podrobný rozbor numerických metod nepatřı́ do této přehledné publikace a lze ho nalézt ve speciálnı́ch monografiı́ch. KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 2.2.5 18 Simulace nelineárnı́ch systémů na počı́tačı́ch Složité nelineárnı́ systémy je výhodné modelovat na analogových, čı́slicových nebo hybridnı́ch počı́tačı́ch a to zejména v tom přı́padě, jestliže je třeba ověřovat chovánı́ systému při různých počátečnı́ch podmı́nkách, při různých hodnotách parametrů, při změně struktury systému nebo při návrhu vhodného řı́zenı́ nelineárnı́ho systému. V současnosti se modelovánı́ a simulace provádı́ nejčastěji na čı́slicovém počı́tači s využitı́m speciálnı́ch programů. Ze simulátorů blokových diagramů snad nejznámějšı́ a předevšı́m v akademické oblasti nejvı́ce využı́vaný je systém SIMULINK. Je to speciálnı́ programový balı́k pro simulaci dynamických lineárnı́ch i nelineárnı́ch systémů se soustředěnými parametry, který rozšiřuje známý počı́tačový software MATLAB. Z méně často použı́vaných programů lze uvést např. systém PSI (simulačnı́ program university v holandském Delftu) nebo systém SIMNON (simulačnı́ program švédského Technologického institutu v Lundu). Hojně použı́vaný je také System Build (Integrated Systems Inc.). Ten některými svými vlastnostmi převyšuje SIMULINK a je výhodný zejména při modelovánı́ složitých systémů se spojitými i diskrétnı́mi prvky. Má také samostatný editor pro práci s logickými obvody. Je využı́ván spı́še v průmyslových aplikacı́ch. Simulačnı́ jazyky pro širšı́ využitı́ jak ve výzkumu tak i v průmyslu jsou např. ACSL a Desire. Objektově orientované jazyky pro modelovánı́ jsou např. Omola nebo Dymola, které použı́vajı́ algoritmy pro manipulaci se symbolickými formulemi. Základnı́ přehled o různých simulačnı́ch jazycı́ch i o programech pro návrh regulačnı́ch systémů lze nalézt v [44]. Řešenı́ složitých nelineárnı́ch systémů umožňuje pouze simulace na počı́tačı́ch, která má ovšem kromě velkých výhod také značnou nevýhodu v tom, že většinou neposkytuje obecná řešenı́. Před simulacı́ je proto třeba určit hodnoty rovnovážných stavů, zjistit možnosti existence periodických řešenı́, různých typů bifurkacı́ apod. S těmito předchozı́mi znalostmi je pak simulace na počı́tačı́ch mnohem jednoduššı́, protože již vı́me, co asi můžeme od systému očekávat a jaké oblasti parametrů a počátečnı́ch podmı́nek máme volit. Metody simulacı́ a praktická práce s programovými soubory MATLAB a SIMULINK jsou náplnı́ cvičenı́ k tomuto předmětu. 2.3 2.3.1 Ustálené stavy nelineárnı́ch systémů Autonomnı́ nelineárnı́ systémy U autonomnı́ch nelineárnı́ch systémů mohou být ustálené stavy rovnovážné, periodické nebo kvaziperiodické. 1. Rovnovážné stavy se nazývajı́ také klidové stavy nebo v jiné terminologii stacionárnı́ stavy vektorového pole f , singulárnı́ body diferenciálnı́ rovnice ẋ = f (x) nebo pevné body toku. Systém může mı́t libovolný počet rovnovážných stavů a každý z nich může být stabilnı́ nebo nestabilnı́ (vyšetřovánı́ jejich stability bude provedeno v dalšı́ch kapitolách). Rovnovážný stav je reprezentován bodem ve stavovém prostoru a budeme jej označovat symbolem x (jinak se v literatuře použı́vá také označenı́ xe , xeq , x0 , x0 apod.). V rovnovážném stavu jsou všechny derivace ẋ nulové, vektorové pole vymizı́, takže rovnovážný stav určı́me, položı́me-li ẋ = 0. Tı́m zı́skáme soustavu algebraických nebo transcendentnı́ch rovnic f (x) = 0 a reálná řešenı́ této soustavy určı́ existujı́cı́ rovnovážné stavy. Toto řešenı́ je však mnohdy složité a často je třeba využı́t počı́tače. a) Analytické řešenı́ je možné v jednoduchých přı́padech při malém počtu rovnic. Přı́klad 2.2. Je zadán systém ẋ1 = −x2 − x31 ẋ2 = x1 − x32 . KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 19 Položı́me-li derivace rovny nule, pak z prvnı́ rovnice x2 √ = −x31 . Dosazenı́m do druhé pravé strany dostaneme x1 (1 + x81 ) = 0. Kořeny této rovnice jsou x1 = 0 a x1 = 8 −1. Dosazenı́m do Moivreova vztahu √ n a= p n ρejϕ = √ n ρ (cos ϕ + 2kπ ϕ + 2kπ + j sin ) n n zjistı́me, že všechny kořeny rovnice 1 + x81 = 0 jsou komplexnı́. Zadaný systém má tedy jen jeden rovnovážný stav pro x1 = 0 a x2 = 0. b) Grafické řešenı́ je někdy výhodné, zejména u systémů 2. řádu. Viděli jsme v předchozı́m přı́kladu, že bylo třeba řešit rovnici 1 + x81 = 0 pomocı́ složitého Moivreova vzorce. Nakreslı́me-li grafy funkcı́ x31 = −x2 a x32 = x1 (stačı́ odhad z několika bodů), vidı́me, že se protı́najı́ pouze v počátku souřadnic, tedy v jediném rovnovážném stavu (0,0). Přı́klad 2.3. Ukažte, že systém ẋ1 = a1 x1 − b1 x31 + c1 x2 ẋ2 = a2 x2 − b2 x32 + c2 x1 má v závislosti na velikosti parametrů a, b, c jeden, tři, pět nebo devět rovnovážných stavů. c) Numerické řešenı́ je nezbytné při složitějšı́ch algebraických nebo transcendentnı́ch rovnicı́ch nebo při simultánnı́m řešenı́ většı́ho počtu rovnic. V literatuře jsou k dispozici různé numerické metody, výhodné je použı́t metod v programech MAPLE, Mathematica nebo MATLAB. V posledně jmenovaném jsou např. programyfsolve a fsolve2 (v toolboxu OPTIM), které řešı́ nelineárnı́ algebraické rovnice a soustavy těchto rovnic metodou nejmenšı́ch čtverců, nebo program fzero (v toolboxu MATLAB/ FUNFUN), který hledá nuly funkce jedné proměnné. 2. Periodická řešenı́ nebo periodické ustálené stavy se u nelineárnı́ch autonomnı́ch systémů nazývajı́ samobuzené kmity nebo autooscilace a mohou být stabilnı́ nebo nestabilnı́. Ve stavovém prostoru jsou reprezentovány izolovanými uzavřenými trajektoriemi, kterým řı́káme limitnı́ nebo meznı́ cykly. Systém může mı́t jeden nebo vı́ce periodických ustálených stavů a zjišt’ovánı́ jejich existence a stability je již značně obtı́žné. Těmito problémy se budeme zabývat v kap. 10. Na obr. 2.3 jsou pro ilustraci zakresleny limitnı́ cykly pro systém 2.řádu. U stabilnı́ho cyklu (obr.2.3a) směřujı́ trajektorie z blı́zkého okolı́ k tomuto cyklu, u nestabilnı́ho (obr.2.3b) se na obou stranách od cyklu vzdalujı́. U polostabilnı́ho cyklu (obr.2.3c) se trajektorie z jedné strany přibližujı́ a z druhé vzdalujı́. Tento cyklus je pouze teoretickou hranicı́ při splynutı́ dvou cyklů (stabilnı́ho a nestabilnı́ho), kdy periodické řešenı́ systému bud’ vzniká nebo zaniká. Řešenı́ x(t) je periodické, platı́-li x(t) = x(t + T ) pro všechna t a nějakou minimálnı́ periodu T > 0. Periodické řešenı́ lze rozložit do Fourierovy řady, která má základnı́ složku s frekvencı́ 1/T a vyššı́ harmonické s frekvencemi k/T, k = 2, 3, ... Amplituda některých těchto spektrálnı́ch složek může být nulová (nebo velmi malá), protože nelineárnı́ systém může podstatně filtrovat některé harmonické. Přı́klad 2.4. Van der Polův oscilátor, velmi často použı́vaný pro demonstraci nelineárnı́ch problémů, je popsán rovnicemi ẋ1 = x2 ẋ2 = ε(1 − x21 )x2 − x1 (2.11) Namodelovánı́m na počı́tači zjistı́me, že systém má jeden rovnovážný stav v počátku a jedno stabilnı́ periodické řešenı́, jehož tvar závisı́ na parametru ε (obr. 2.4). 3. Kvaziperiodická řešenı́ vznikajı́ u autonomnı́ch obvodů pouze vzácně a proto si jejich vlastnosti ukážeme až u systémů neautonomnı́ch. 4. Chaotické chovánı́ . Některé nelineárnı́ systémy nedosáhnou v čase t → ∞ ustáleného chovánı́, ale trvale měnı́ nepravidelným způsobem (chaoticky) svoje stavové proměnné. Chovánı́ je podobné náhodnému, ale systém je popsán striktně deterministicky a neuvažuje se nejistota ani ve vstupu ani v modelu systému. Proto se tento typ chovánı́ nazývá deterministický chaos. Chaotické chovánı́ je ohraničené, nenı́ periodické, podobá se náhodnému. Je vysoce citlivé na změnu počátečnı́ch podmı́nek, KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 20 Obrázek 2.2: Typy limitnı́ch cyklů: a) stabilnı́, b) nestabilnı́, c) polostabilnı́ i při nepatrné změně se odezvy po určité době značně lišı́. Dlouhodobé chovánı́ nelze tedy spolehlivě predikovat. U autonomnı́ch systémů se spojitým časem může chaos nastat od 3. řádu výše (u neautonomnı́ch již od 2.řádu). Chaotické chovánı́ bylo pozorováno u nejrůznějšı́ch systémů, např. v hydrodynamice (turbulence), v atmosférické dynamice, ve vázaných chemických soustavách, v biologických systémech (v populačnı́ dynamice, neurobiologii), v elektrických obvodech a také v regulačnı́ technice. Podrobnějšı́ vlastnosti chaosu a přı́klady systémů s chaotickým chovánı́m budou uvedeny v samostatné kapitole 12. 2.3.2 Neautonomnı́ nelineárnı́ systémy Neautonomnı́ systémy mohou být nebuzené t-variantnı́ ẋ = f (t, x) nebo buzené t-invariantnı́ ẋ = f (x, u) nebo buzené t-variantnı́ ẋ = f (t, x, u). 1. Rovnovážné stavy mohou nastat u časově variantnı́ho systému ẋ = f (t, x), platı́-li f (t, x) = 0 ∀t ≥ t0 . Např. systém ẋ1 = x1 − x2 + x21 + x22 sin t ẋ2 = x1 + x2 − 2x1 x2 e−t má rovnovážný stav (0, 0). Klidové stavy buzených systémů ẋ = f (x, u) při konstantnı́m vstupu nazýváme stacionárnı́ stavy. Z obecnějšı́ho pohledu jsou buzené systémy uzavřené (nikoliv již izolované) systémy, které umožňujı́ výměnu energie s okolı́m. Jako přı́klad může sloužit kyvadlo, na jehož osu působı́ konstantnı́ vnějšı́ moment M a jehož dynamika je popsána systémem ẋ1 = x2 ẋ2 = −k1 x2 − k2 sin x1 + M, kde x1 je úhel vychýlenı́ kyvadla od vertikálnı́ osy a x2 jeho úhlová rychlost. Stacionárnı́ stav je pak dán vztahem k2 sin x1 = M . 2. Periodická řešenı́ mohou být u buzených nelineárnı́ch obvodů velmi rozmanitá. Budı́me-li nelineárnı́ systém např. harmonickým signálem s periodou T , bude na výstupu signál, který může obsahovat různé vyššı́ harmonické (ultraharmonické kmity). Často se však na výstupu objevujı́ také tzv. subharmonické kmity, kdy perioda výstupu je násobkem budı́cı́ periody T . Tyto jevy nemohou nastat u lineárnı́ch systémů. KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 21 Jako přı́klad může sloužit třeba Duffingova rovnice ẋ2 = x1 − x1 3 − ax2 + b cos ωt. ẋ1 = x2 (2.12) Např. pro a = 0, 15; b = 0, 3; ω = 1 (T = 6, 28) je na výstupu periodická funkce, jejı́ž prvnı́ harmonická má úhlovou frekvenci ω = 1 a existujı́ liché vyššı́ harmonické, jejichž amplituda rychle klesá. Pro a = 0, 22 naskočı́ 3. subharmonická s periodou T = 3.6, 28. Neautonomnı́ systém n-tého řádu ẋ = f (t, x) s periodickým ustáleným řešenı́m s periodou T můžeme vždy transformovat na autonomnı́ systém řádu (n+1), zavedeme-li dalšı́ stavovou proměnnou xn+1 = 2π t = ωt. T (2.13) Autonomnı́ systém je pak dán rovnicemi ẋ = f (x, xn+1 T ) 2π x(0) = x0 x ∈ Rn (2.14) 2π 2π =ω xn+1 (0) = t0 = ωt0 . (2.15) T T Perioda nové stavové proměnné xn+1 je 2π. Vzhledem k tomuto periodickému chovánı́ můžeme řešenı́ xn+1 omezit na interval 0 ≤ xn+1 < 2π. Stavový prostor Rn+1 lze pak transformovat na válcový stavový prostor Rn × S, kde S je kružnice. Použitı́m transformace (2.13) můžeme tedy výsledky studia autonomnı́ho systému aplikovat na časově periodický neautonomnı́ systém. ẋn+1 = Poznámka: Neperiodický neautonomnı́ systém může být také převeden na autonomnı́ systém pomocı́ transformace (2.13) s nějakou zvolenou periodou T > 0 (můžeme zvolit např. xn+1 = t). Řešenı́ bude však nutně neohraničené (xn+1 → ∞ pro t → ∞) a mnoho výsledků pro asymptotické chovánı́ autonomnı́ch systémů nelze pak použı́t. 3. Kvaziperiodická řešenı́ mohou vzniknout, když dvě nebo vı́ce periodických funkcı́ interagujı́ nelineárně. Jako přı́klad můžeme použı́t opět Van der Polův oscilátor, který v nebuzeném přı́padě vykazuje autooscilace s periodou T1 (obr 2.4). Přidáme-li nynı́ vnějšı́ harmonický budı́cı́ signál, dostaneme systém ẋ1 = x2 ẋ2 = ε(1 − x21 )x2 − x1 + A cos (2πt/T2 ). (2.16) Řešenı́ buzeného systému může být synchronizováno s nějakým násobkem vstupnı́ periody T2 a vznikne subharmonické kmitánı́, tj. periodický ustálený stav. Při konfliktu mezi T1 a T2 nemusı́ však také žádná perioda zvı́tězit a vzniknou kvaziperiodické kmity. Na obr. 2.5 je zakresleno kvaziperiodické kmitánı́ Van der Polova oscilátoru ve fázové rovině (x = x1 , y = x2 )[24]. Trajektorie jsou rovnoměrně distribuovány v prstencové (anulárnı́) oblasti, kterou hustě vyplňujı́. Kvaziperiodické řešenı́ x(t) lze vyjádřit součtem periodických řešenı́ x(t) = X hi (t), (2.17) i kde každé hi (t) lze rozložit ve Fourierovu řadu s prvnı́ harmonickou o frekvenci fi a s periodou Ti = 1/fi . Dále existuje množina základnı́ch frekvencı́ {fˆ1 , ..., fˆp } s těmito vlastnostmi: a) množina je lineárně nezávislá, tj. neexistuje nenulová množina konstant taková, aby platilo ˆ k1 f1 + ... + kp fˆp = 0, b) pro každé i platı́ fi = k1 fˆ1 + ... + kp fˆp pro nějaké konstanty {k1 , ..., kp }. KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ Obrázek 2.3: Nebuzený Van der Polův oscilátor 22 Obrázek 2.4: Buzený Van der Polův oscilátor Kvaziperiodické kmitánı́ je tedy tvořeno součtem periodických kmitů, jejichž frekvence je dána různými součty nebo rozdı́ly konečné množiny základnı́ch frekvencı́. Kvaziperiodické kmitánı́ s počtem p základnı́ch frekvencı́ se nazývá p-periodické. Nejjednoduššı́ přı́pad je dvouperiodické kmitánı́ x(t) = h1 (t) + h2 (t), kde periody T1 a T2 jsou nesoudělné, jejich podı́l je tedy iracionálnı́. Spektrum takového kmitánı́ se skládá ze dvou množin harmonických se základnı́mi frekvencemi k/T1 a k/T2 , k = 1, 2, ... Přı́kladem dvouperiodických kmitů jsou amplitudová a fázová modulace, kde dvě periodické funkce spolu interagujı́ nelineárně. Přı́kladem dynamického systému s kvaziperiodickým chovánı́m je výše uvedený Van der Polův oscilátor. Z obr. 2.5 je patrno, že dvouperiodická trajektorie ležı́ na množině, která je difeomorfnı́m zobrazenı́m dvourozměrného toru v trojrozměrném prostoru (obr. 2.6). Protože trajektorie je křivka a dvojrozměrný torus je plocha, neležı́ každý bod toru na trajektorii. Lze ale ukázat, že při dlouhodobém řešenı́ procházı́ trajektorie body, které ležı́ libovolně blı́zko od každého bodu na toru. Torus tedy představuje limitnı́ množinu kvaziperiodického chovánı́ a je prvnı́m přı́kladem limitnı́ množiny, která nenı́ jednoduchou křivkou. U dynamických systémů vyššı́ho řádu mohou také vzniknou kvaziperiodická řešenı́ vyššı́ch řádů, a jejich trajektorie vyplňujı́ množiny, které jsou difeomorfnı́ k vı́cerozměrnému toru (K-torus). Obrázek 2.5: Torus v trojrozměrném prostoru Obrázek 2.6: Chaos u Duffingova oscilátoru 4. Chaotické chovánı́ se může objevovat u neautonomnı́ch systémů se spojitým časem již od KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 23 druhého řádu. Např. u parametricky buzeného oscilátoru ẍ + aẋ + b(1 + c cos ωt) sin x = 0 působı́ na kyvadlo periodická vnějšı́ sı́la, např. periodicky se pohybuje závěs kyvadla. Při určitých hodnotách parametrů systému vzniká chaotické chovánı́. Podobně např. u Duffingova oscilátoru, popsaného rovnicı́ (2.12), vzniká při vhodných podmı́nkách chaos (obr.2.7). Dalšı́ přı́klady budou uvedeny v kap. 12. Kapitola 3 Stabilita - základnı́ pojmy a definice Stabilita nelineárnı́ch systémů je velmi komplexnı́ pojem, který se zcela odlišuje od běžného pojetı́ stability u lineárnı́ch systémů. Stabilita lineárnı́ho systému je dána strukturou systému a nezávisı́ ani na jeho okamžitém stavu ani na vstupnı́ch signálech. Autonomnı́ lineárnı́ systém ẋ = Ax s regulárnı́ maticı́ A má jeden rovnovážný stav, který je stabilnı́ nebo nestabilnı́. Pro nelineárnı́ systémy existuje velké množstvı́ definic stability. Je to dáno tı́m, že nelineárnı́ systém má různé typy ustálených stavů a velkou variabilitu v chovánı́. Mnohé definice stability jsou proto speciálnı́ a majı́ omezené použitı́. Všimneme si tedy pouze některých nejdůležitějšı́ch definic, předevšı́m těch, které se týkajı́ ljapunovské a asymptotické stability. 3.1 Stabilita rovnovážného stavu volného systému V tomto článku budeme uvažovat volný časově variantnı́ nelineárnı́ systém ẋ = f (t, x), (3.1) kde f : R+ × Rn → Rn je spojitá funkce. Předpokládejme, že (3.1) má jednoznačné řešenı́ při každé počátečnı́ podmı́nce x(t0 ) = x0 . To bude např. tehdy, jestliže f splňuje globálnı́ Lipschitzovu podmı́nku. Dále budeme předpokládat, že systém (3.1) má stacionárnı́ řešenı́ x, pro které platı́ f (t, x) = 0 pro všechna t ≥ t0 . Promı́tneme-li graf řešenı́ z rozšı́řeného prostoru R+ ×Rn do stavového prostoru Rn , odpovı́dá stacionárnı́ řešenı́ jednobodové trajektorii x, tj. rovnovážnému stavu systému (3.1) a graf každého řešenı́ se promı́tne na trajektorii ve stavovém prostoru. Vyšetřovánı́ stability řešenı́ můžeme tedy převést na vyšetřovánı́ stability rovnovážného stavu x v prostoru Rn . Definice 3.1. Rovnovážný stav x systému (3.1) je (ljapunovsky ) stabilnı́, jestliže pro každé ε > 0 a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna řešenı́ s počátečnı́ podmı́nkou x0 vyhovujı́cı́ vztahu ||x0 − x|| < δ a pro všechna t ≥ t0 platı́ ||x(t; t0 , x0 − x|| < ε. (3.2) Poznámka: Za normu ||.|| volı́me obvykle euklidovskou normu, definovanou např. pro ||x|| předpisem ||x|| = q (x21 + x22 + ... + x2n ) Pak ||x|| < ε představuje sférickou oblast (vnitřek n-rozměrné hyperkoule), kterou budeme stručně označovat také Bε (podobně Bδ ). Definice 3.1 řı́ká, že rovnovážný stav je stabilnı́, jestliže po malém vychýlenı́ z tohoto stavu zůstane trajektorie systému v ε okolı́ rovnovážného stavu. Geometrická interpretace je znázorněna na obr. 24 KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 25 3.1. Definice 3.1 se týká jen chovánı́ v blı́zkém okolı́ rovnovážného stavu (tzv. stabilita v malém, mı́stnı́ (lokálnı́) stabilita), protože nevı́me předem, jak velké δ bude odpovı́dat zvolenému ε. Podle této definice nemusı́ trajektorie systému v čase t → ∞ konvergovat do rovnovážného stavu, ale může setrvávat libovolně blı́zko. Netlumený lineárnı́ systém druhého řádu popsaný rovnicı́ ẍ + ω02 x = 0 je proto také stabilnı́ ve smyslu této definice. Obr.3.1 Abychom v dalšı́m zjednodušili různé definice stability, budeme předpokládat, že rovnovážný stav systému je v počátku. Pokud má systém izolovaný rovnovážný stav jinde, je vždy možno lineárnı́ transformacı́ souřadnic tento stav do počátku posunout. Bez ztráty obecnosti budeme tedy předpokládat, že f (t, 0) = 0, ∀t ≥ t0 . Definici 3.1 můžeme pak přeformulovat na tvar: Definice 3.2. Rovnovážný stav 0 soustavy (3.1) je (ljapunovsky) stabilnı́, jestliže pro každé ε > 0 a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna řešenı́ s počátečnı́ podmı́nkou x0 vyhovujı́cı́ vztahu ||x0 || < δ a pro všechna t ≥ t0 platı́ ||x(t; t0 , x0 || < ε. (3.3) Rovnovážný stav je nestabilnı́, jestliže nenı́ stabilnı́ ve smyslu uvedené definice. Definice 3.3. Rovnovážný stav 0 je kvaziasymptoticky stabilnı́ (nebo také atrahujı́cı́ či konvergentnı́), jestliže pro jakékoliv t0 ∈ R+ existuje takové čı́slo δ1 (t0 ) > 0, že každé řešenı́ systému (3.1) vyhovujı́cı́ podmı́nce ||x0 || < δ1 konverguje k počátku pro t → ∞, tj. lim x(t; t0 , x0 ) = 0. t→∞ Pro kvaziasymptotickou stabilitu je nutné, aby rovnovážný stav byl izolovaný, to znamená, aby existovalo takové jeho okolı́, které neobsahuje žádné jiné rovnovážné stavy. To je v kontrastu s pojetı́m ljapunovské stability, které lze aplikovat i na rovnovážné stavy, které nejsou izolované. Definice 3.4. Rovnovážný stav 0 je asymptoticky stabilnı́, jestliže je ljapunovsky stabilnı́ a zároveň kvaziasymptoticky stabilnı́. Definice 3.5. Rovnovážný stav je neutrálně stabilnı́, je-li stabilnı́ dle definice 3.2 a nenı́ asymptoticky stabilnı́. V mnoha technických aplikacı́ch je asymptotická stabilita ještě nepostačujı́cı́ a je třeba vědět, jak rychle se řešenı́ blı́žı́ k rovnovážnému stavu. K tomuto účelu lze použı́t pojmu exponenciálnı́ stabilita. Definice 3.6. Rovnovážný stav 0 je exponenciálně stabilnı́, jestliže existujı́ takové konstanty r, α, λ > 0 nezávislé na volbě řešenı́, že ||x(t; t0 , x0 )|| ≤ α||x0 || exp −λt ∀ t ≥ t0 , t0 ≥ 0 (3.4) KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 26 pro všechna ||x0 || < r. Definice 3.6 řı́ká, že stavový vektor u exponenciálně stabilnı́ho rovnovážného stavu konverguje k počátku rychleji než nějaká exponenciálnı́ funkce. Kladné čı́slo λ se často nazývá rychlost exponenciálnı́ konvergence. Přı́klad 3.1. Systém ẋ = −(1 + sin2 t)x konverguje exponenciálně k hodnotě x = 0 s rychlostı́ λ = 1. Řešenı́ systému je Z t 2 x(t) = x(0)exp − [1 + sin τ ]dτ 0 a proto |x(t)| ≤ |x(0)|e . Pro libovolné t je plocha pod funkcı́ (1 + sin2 t) většı́ než t a proto e−t klesá pomaleji. −t Exponenciálnı́ stabilita je současně asymptotickou stabilitou, opačně to však neplatı́. Např. systém ẋ = −x2 , x(0) = 1 má řešenı́ x = 1/(1 + t) a tato funkce klesá pomaleji než jakákoliv exponenciálnı́ funkce e−λt pro λ > 0. Stejnoměrná stabilita Předchozı́ definice ljapunovské a asymptotické stability neautonomnı́ch systémů ukazujı́ na závažný vliv volby počátečnı́ho času. V praxi je obvykle žádoucı́, aby systém měl určitou stejnoměrnost ve svém chovánı́ bez ohledu na volbu počátečnı́ho času. To je podnětem k zavedenı́ pojmu stejnoměrná stabilita a stejnoměrná asymptotická stabilita. Definice 3.7. Rovnovážný stav 0 je stejnoměrně (ljapunovsky) stabilnı́, jestliže je ljapunovsky stabilnı́ podle definice 3.2 a čı́slo δ nezávisı́ na volbě počátečnı́ho okamžiku t0 . Rovnovážný stav je stejnoměrně kvaziasymptoticky stabilnı́, jestliže δ1 v definici 3.3 nezávisı́ na t0 a všechna řešenı́ se blı́žı́ k počátku stejnoměrně. Poznámka: Stejnoměrná konvergence nastává, jestliže pro každé ε > 0 existuje takové čı́slo T (ε), že ||x0 || < δ1 , ∀t0 ∈ R+ ⇒ ||x(t; t0 , x0 )|| < ε, ∀t > t0 + T (ε). Rovnovážný stav je stejnoměrně asymptoticky stabilnı́, jestliže je stejnoměrně stabilnı́ a stejnoměrně kvaziasymptoticky stabilnı́. Jestliže je rovnovážný stav stejnoměrně asymptoticky stabilnı́, je i asymptoticky stabilnı́. Opak však obecně neplatı́, jak je patrno z tohoto přı́kladu. Systém 1.řádu ẋ = −x/(1 + t) má obecné řešenı́ x(t) = 1 + t0 x(t0 ). 1+t Toto řešenı́ konverguje asymptoticky k nule, ale konvergence nenı́ stejnoměrná, protože při zvětšujı́cı́m se t0 potřebuje řešenı́ stále delšı́ čas k dosaženı́ stejné vzdálenosti od počátku. Globálnı́ stabilita. Všechny dosud uvedené definice charakterizujı́ lokálnı́ chovánı́ systému při malých výchylkách počátečnı́ho stavu od rovnováhy. Určenı́ skutečné oblasti stability je velmi obtı́žné a budeme se tı́mto problémem zabývat v kap.5. Pro praxi je nejvýhodnějšı́ zjištěnı́, že rovnovážný stav je globálně stabilnı́, tj. stabilnı́ při všech počátečnı́ch podmı́nkách. To ovšem předpokládá, že systém má pouze jeden rovnovážný stav. Definice 3.8. Je-li rovnovážný stav asymptoticky nebo exponenciálně stabilnı́ při všech počátečnı́ch podmı́nkách x0 ∈ Rn , je globálně asymptoticky nebo exponenciálně stabilnı́. U časově invariantnı́ho volného systému (tj. autonomnı́ho systému) ẋ = f (x) nezávisı́ chovánı́ na volbě počátečnı́ho času. Všechny předchozı́ definice zůstávajı́ v platnosti s tı́m, že čı́slo δ nezávisı́ na volbě počátečnı́ho okamžiku t0 a je pouze funkcı́ ε. Je-li tedy rovnovážný stav 0 autonomnı́ho systému ljapunovsky stabilnı́, je současně stejnoměrně ljapunovsky stabilnı́ apod. Důkaz těchto tvrzenı́ lze nalézt např. v [55]. KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 27 V uvedených definicı́ch stability jsme definovali stabilitu stavů systému. Podobným způsobem bychom mohli definovat i stabilitu výstupu systému. Může nastat situace, že nestabilnı́ složky stavu se na výstupu neprojevı́. Potom je systém na výstupu stabilnı́, i když nenı́ žádný stabilnı́ rovnovážný stav. Je-li systém pozorovatelný, pak každá složka stavu se projevı́ na výstupu a stabilita stavu a výstupu splývá. Těmito problémy se budeme zabývat při návrhu exaktnı́ch linearizacı́ v kap. 15. 3.2 Stabilita pohybu volného systému Tento typ stability se týká vzájemné polohy dvou řešenı́, z nichž jedno je nominálnı́ řešenı́ zkoumané z hlediska stability a druhé je perturbované řešenı́ se změněnou počátečnı́ podmı́nkou x(0) = x1 . Nominálnı́ řešenı́ bude zřejmě stabilnı́, jestliže při malé změně počátečnı́ podmı́nky zůstane perturbované řešenı́ dostatečně blı́zko k řešenı́ nominálnı́mu. Tuto intuitivnı́ představu stability libovolného řešenı́ budeme nynı́ formulovat přesněji. Definice 3.9. Řešenı́ x(t; t0 , x0 ) soustavy ẋ = f (t, x) je stabilnı́, jestliže pro každé ε > 0 a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna t ≥ t0 a pro ||x0 − x1 || < δ je ||x(t; t0 , x0 ) − x(t; t0 , x1 || < ε. (3.5) Vidı́me, že definice je velmi podobná definici 3.1 pro stabilitu rovnovážného stavu. Proto lze snadno transformovat i ostatnı́ definice z čl. 3.1 na stabilitu pohybu. Tyto nové definice však nenı́ ani třeba vytvářet, protože problém stability pohybu lze vždy redukovat přı́mo na ekvivalentnı́ problém stability rovnovážného stavu jiného dynamického systému. Předpokládejme, že chceme vyšetřovat stabilitu řešenı́ y(t) soustavy ẏ = g(t, y) při počátečnı́ podmı́nce y 0 . Proved’me perturbaci řešenı́ volbou blı́zké počátečnı́ podmı́nky v 0 = y 0 + x0 . Řešenı́ odpovı́dajı́cı́ této nové počátečnı́ podmı́nce v0 je v(t) a platı́ rovnice v̇ = g(t, v). Odchylka od původnı́ho řešenı́ je x(t) = v(t) − y(t), dynamické chovánı́ této odchylky je dáno neautonomnı́ diferenciálnı́ rovnicı́ ẋ(t) = v̇(t) − ẏ(t) = g(t, v) − g(t, y) = g(t, y + x) − g(t, y). (3.6) Označı́me-li f (t, x) = g(t, y + x) − g(t, y), dostaneme z původnı́ soustavy rovnice pro odchylku ẋ = f (t, x) f (t, 0) = 0. (3.7) Tato soustava má triviálnı́ (tj. nulové) řešenı́ a jeho vlastnosti můžeme vyšetřovat na základě definic uvedených v čl. 3.1. Závěry o stabilitě můžeme pak přenést pomocı́ zavedené transformace y = v − x na řešenı́ y(t) zadané soustavy. Perturbačnı́ dynamika (3.7) je neautonomnı́ a to i v přı́padě, že původnı́ vyšetřovaný systém je autonomnı́ ẏ = g(y), protože na pravé straně (3.7) se vyskytuje nominálnı́ trajektorie. Každé dı́lčı́ nominálnı́ trajektorii autonomnı́ho systému tedy odpovı́dá ekvivalentnı́ neautonomnı́ systém. Stabilita limitnı́ch cyklů autonomnı́ch systémů. Často se vyšetřuje stabilita pohybu podél uzavřené trajektorie systému, např. stabilita limitnı́ho cyklu autonomnı́ho systému. K tomu účelu můžeme použı́t definice 3.9, kterou upravı́me pro autonomnı́ systém. Zavedeme poruchovou trajektorii γ1 , která je blı́zká k limitnı́mu cyklu γ (obr. 3.2) a vyšetřı́me, zda bod P1 zůstává při pohybu trvale ve zvolené oblasti Bε , která obsahuje oblast Bδ . Bod P obı́há po limitnı́m cyklu a současně se pohybuje bod P1 po poruchové trajektorii γ1 . S oběma body se pohybujı́ i obě oblasti. Zůstane-li pro t > t0 bod P1 stále v oblasti Bε , je meznı́ cyklus ljapunovsky stabilnı́. Podle definice 3.9 je tedy třeba, aby nejen poruchová trajektorie γ1 zůstávala v blı́zkém okolı́ γ, ale aby také pohyb zastupujı́cı́ch bodů na γ a γ1 měl stejnou periodu. Např. perioda kmitů matematického KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 28 kyvadla závisı́ na amplitudě kmitánı́. Takový systém je v podstatě stabilnı́, ale nenı́ stabilnı́ podle definice 3.9. Podobně je tomu u družice pohybujı́cı́ se v kruhové dráze kolem Země. Při malé poruše bude obı́hat např. po dráze velmi blı́zké, ale s jinou periodou. Pro praktické určenı́ stability je v těchto přı́padech definice 3.9 přı́liš přı́sná a pro stabilitu limitnı́ch cyklů je vhodná definice tzv. orbitálnı́ stability. Obr.3.2. Stabilita limitnı́ho cyklu Definice 3.10. Orbitálnı́ stabilita. Limitnı́ cyklus γ je orbitálně stabilnı́, jestliže pro libovolné ε > 0 existuje δ(ε) > 0 takové, že každá trajektorie vycházejı́cı́ v čase t0 z bodu vzdáleného méně než δ(ε) od γ zůstává ve vzdálenosti menšı́ než ε od γ. Každý limitnı́ cyklus, který je stabilnı́ ve smyslu Ljapunova, je také orbitálně stabilnı́, opačně to však již obecně neplatı́. Pro limitnı́ cyklus můžeme definovat také asymptotickou orbitálnı́ stabilitu, při nı́ž γ1 → γ pro t → ∞. Stabilitou periodických řešenı́ se budeme podrobněji zabývat v kap. 10. 3.3 Jiné typy stability Doposud jsme se zabývali pouze definicemi stability rovnovážného stavu a stability pohybu nebuzeného systému. Důležité je ovšem také určit, zda stav systému bude stabilnı́, jestliže přivedeme na vstup nějaký signál. Dále nás bude z praktického hlediska zajı́mat, zda při ohraničeném vstupnı́m signálu bude také ohraničený výstup systému. K řešenı́ těchto problémů musı́me definovat tzv. stabilitu vstup-výstup, kterou se budeme podrobněji zabývat v kap. 8. Všechny dosud uvedené definice stability se týkaly dynamických systémů zadaných diferenciálnı́mi rovnicemi s pevně určenými parametry. Důležité je ovšem také studovat stabilitu z hlediska změny těchto parametrů. Uvidı́me později, že při malých změnách hodnot parametrů docházı́ často k velmi odlišnému chovánı́ systému, měnı́ se počet rovnovážných stavů a jejich stabilita, vznikajı́ nebo zanikajı́ periodická řešenı́ apod. K postiženı́ těchto jevů budeme v kap.4 definovat tzv. strukturálnı́ stabilitu. Existuje ještě mnoho jiných definic různých typů stability, s některými se setkáme při řešenı́ speciálnı́ch problémů v dalšı́ch kapitolách. Kapitola 4 Ljapunovova metoda linearizace V předchozı́ kapitole jsme uvedli různé definice stability nelineárnı́ch systémů, ty však nejsou obvykle přı́liš vhodné pro praktické výpočty. Budeme proto potřebovat metody, které by umožnily rychlé určenı́ stability. V této kapitole se budeme zabývat řešenı́m lokálnı́ stability rovnovážných stavů nelineárnı́ch systémů pomocı́ linearizace systému v blı́zkém okolı́ těchto rovnovážných stavů. Tento způsob řešenı́ vypracoval A.M. Ljapunov a nazývá se prvnı́ Ljapunovova metoda. Je to formalizace intuitivnı́ představy, že za určitých předpokladů se bude nelineárnı́ systém při malých odchylkách od rovnovážného stavu chovat podobně jako jeho lineárnı́ aproximace. Výsledkem linearizace jsou soustavy lineárnı́ch diferenciálnı́ch rovnic, pomocı́ jejichž vlastnostı́ pak posuzujeme vlastnosti vyšetřovaného nelineárnı́ho systému. Proto si v dalšı́m článku shrneme nejprve základnı́ výsledky řešenı́ lineárnı́ch diferenciálnı́ch rovnic s důrazem na geometrické představy daných řešenı́. 4.1 4.1.1 Lineárnı́ systémy Lineárnı́ autonomnı́ systémy Budeme uvažovat lineárnı́ autonomnı́ systém ẋ = Ax, x(0) = x0 . (4.1) Tento systém má jeden rovnovážný stav v nule, je-li A regulárnı́ a nekonečně mnoho rovnovážných stavů, jestliže A je singulárnı́. Obecné řešenı́, které je dostatečně známo z teorie diferenciálnı́ch rovnic a z teorie lineárnı́ch řı́dı́cı́ch systémů, má tvar x(t) = eAt x0 , (4.2) kde fundamentálnı́ matice eAt se nazývá také tokem vektorového pole Ax. Pro exaktnı́ analytické řešenı́ je třeba znát vlastnı́ čı́sla matice A. Ta se určı́ z charakteristické rovnice det(A − λI) = a11 − λ a12 a21 a22 − λ ... ... an1 an2 ... a1n ... a2n ... ... ... ann − λ = 0. (4.3) Úpravou dostaneme algebraickou rovnici n-tého stupně an λn + an−1 λn−1 + ... + a1 λ + a0 = 0. (4.4) Kořeny této charakteristické rovnice jsou vlastnı́ čı́sla matice A. Ta mohou být reálná nebo komplexnı́ a jednonásobná nebo vı́cenásobná. 29 KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 30 a) reálná, jednonásobná vlastnı́ čı́sla Necht’ všechna vlastnı́ čı́sla λ1 , ..., λn jsou reálná a různá. Označme r 1 , ..., r n pravé vlastnı́ vektory matice A (sloupcové vektory) a q 1 , ..., q n levé vlastnı́ vektory (řádkové vektory). Jsou-li vlastnı́ čı́sla matice A různá, jsou levé a pravé vlastnı́ vektory navzájem ortogonálnı́. Vlastnı́ vektory vypočteme ze vztahů Ar i = λi r i q i A = q i λi i = 1, ..., n. (4.5) Obecné řešenı́ systému (4.1) je x(t) = n X ki r i eλi t , (4.6) i=1 kde ki jsou konstanty závislé na počátečnı́ch podmı́nkách. Členy r i eλi t se nazývajı́ módy dynamického systému. Směr módu je ve stavovém prostoru určen vlastnı́m vektorem r i , časový průběh módu je dán vlastnı́m čı́slem λi . Vlastnı́ vektory odpovı́dajı́cı́ záporným vlastnı́m čı́slům vytvářejı́ stabilnı́ podprostor E s , jehož dimenze je dána počtem záporných vlastnı́ch čı́sel. Podobně počet kladných vlastnı́ch čı́sel udává dimenzi nestabilnı́ho podprostoru E u , je-li nulové vlastnı́ čı́slo, existuje centrálnı́ podprostor E c , jehož dimenze dim E c = 1. Při počátečnı́ podmı́nce na vlastnı́m vektoru probı́há řešenı́ na tomto vektoru, při počátečnı́ podmı́nce v rovině určené dvěma vlastnı́mi vektory zůstane řešenı́ v této rovině atd. Lineárnı́ transformace y = Q−1 x vede na ẏ = Q−1 ẋ = Q−1 Ax = Q−1 AQy = AJ y tj. ẏi = λi yi i = 1, ..., n. Zavedenı́m nových souřadnic dostáváme tedy řešenı́, které je zbaveno vzájemné vazby proměnných yi (t) = eλi t yi (0) i = 1, ..., n. (4.7) Transformačnı́ matice Q, transformujı́cı́ původnı́ stavové rovnice systému do Jordanova kanonického tvaru, je po sloupcı́ch tvořena vlastnı́mi pravými vektory matice A. Jordanova matice AJ je diagonálnı́ matice tvořená vlastnı́mi čı́sly původnı́ matice A a vlastnı́ vektory Jordanovy matice jsou navzájem ortogonálnı́. b) komplexnı́, jednonásobná vlastnı́ čı́sla Protože matice A je reálná, musı́ při komplexnı́m vlastnı́m čı́sle µ = α + jω být také komplexně sdružené vlastnı́ čı́slo µ∗ = α − jω. Vlastnı́ vektory r + js jsou také komplexnı́. Pro n = 2 a dvě komplexně sdružená vlastnı́ čı́sla je Jordanova matice −1 AJ = Q AQ = " α + jω 0 0 α − jω # také komplexnı́, ale lze ji převést na reálnou normálnı́ formu " α −ω ω α # Řešenı́ diferenciálnı́ rovnice lze pak psát ve tvaru x(t) = " x1 (t) x2 (t) # = eαt [(k1 r + k2 s) cos ωt + (k2 r − k1 s) sin ωt] , KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 31 kde k1 , k2 jsou konstanty závislé na počátečnı́ch podmı́nkách. Má-li matice A vı́ce dvojic komplexně sdružených vlastnı́ch čı́sel, lze Jordanovu matici převést na tvar, který má v diagonále bloky rozměru 2x2, z nichž každý odpovı́dá jednomu páru komplexně sdružených vlastnı́ch čı́sel. Původnı́ diferenciálnı́ rovnice je tak převedena na nezávislé dvoudimenzionálnı́ dı́lčı́ rovnice. Podobně bychom mohli řešit lineárnı́ systémy, které majı́ reálná násobná nebo komplexně sdružená násobná vlastnı́ čı́sla. Má-li vlastnı́ čı́slo násobnost p, pak jeho odpovı́dajı́cı́ blok v Jordanově matici je řádu p. Podrobný rozbor je např. v [26]. Z teorie lineárnı́ch systémů je známo, že: a) rovnovážný stav 0 systému (4.1) je asymptoticky stabilnı́ právě tehdy, když všechna vlastnı́ čı́sla matice A majı́ záporné reálné části; b) rovnovážný stav 0 je (neutrálně) stabilnı́ právě tehdy, když A nemá vlastnı́ čı́sla s kladnou reálnou částı́ a vlastnı́ čı́sla s nulovou reálnou částı́ odpovı́dajı́ Jordanovým blokům řádu jedna; c) rovnovážný stav 0 je nestabilnı́, jestliže A má bud’ alespoň jedno vlastnı́ čı́slo s kladnou reálnou částı́ nebo vlastnı́ čı́slo s nulovou reálnou částı́, které odpovı́dá Jordanovu bloku s řádem většı́m než jedna. Invariantnı́ podprostory. Z předchozı́ch odstavců je patrno, že vhodnou transformacı́ souřadnic lze matici A, která má nenásobná vlastnı́ čı́sla λ1 , ..., λr , µ1 , µ∗1 , ..., µm , µ∗m , r + 2m = n převést na Jordanův kanonický tvar s jednorozměrnými a dvourozměrnými bloky v diagonále. Prostor Rn můžeme pak rozložit na jednorozměrné podprostory (pro reálná vlastnı́ čı́sla) a dvourozměrné podprostory (pro komplexnı́ vlastnı́ čı́sla) Rn = E1 ⊕ ... ⊕ Er ⊕ F1 ⊕ ... ⊕ Fm , kde dim Ei = 1, i = 1, ..., r a dim Fj = 2, j = 1, ..., m a symbol ⊕ značı́ součet algebraických struktur. Prostor Rn je tedy přı́mým ortogonálnı́m součtem invariantnı́ch jedno- a dvoudimenzionálnı́ch podprostorů. Průběh trajektoriı́ lze pak v souřadnicı́ch odpovı́dajı́cı́ch Jordanovu tvaru zı́skat superpozicı́ jednodimenzionálnı́ch a dvoudimenzionálnı́ch pohybů. V přı́padě násobných vlastnı́ch čı́sel je nutno provést rozloženı́ Rn do invariantnı́ch podprostorů vyššı́ dimenze, která dosahuje maximálně hodnoty násobnosti reálných resp. dvojnásobné hodnoty násobnosti komplexnı́ch vlastnı́ch čı́sel. Podprostor, který je vytvořen všemi vlastnı́mi vektory odpovı́dajı́cı́mi vlastnı́m čı́slům se zápornou (kladnou, nulovou) reálnou částı́ se nazývá stabilnı́ invariantnı́ podprostor E s (nestabilnı́ E u , centrálnı́ E c ). Rozměr podprostorů je ns , nu , nc , součet jejich rozměrů je roven n. Řešenı́ v E s klesajı́ exponenciálně (monotonně nebo oscilačně) k nule, řešenı́ v E u exponenciálně rostou (monotonně nebo oscilačně), řešenı́ v E c zůstávajı́ konstantnı́ nebo oscilujı́. V dalšı́ch článcı́ch uvidı́me, že znalosti fázových portrétů lineárnı́ch diferenciálnı́ch rovnic 1., 2. a 3. řádu nám dávajı́ představu o fázových portrétech v blı́zkém okolı́ rovnovážných stavů nelineárnı́ch systémů. Protože fázové portréty systémů 1.řádu jsou velmi jednoduché, všimneme si jen lineárnı́ch systémů 2. a 3. řádu. Lineárnı́ systém 2. řádu lze zapsat např. ve tvaru ẍ + 2aω0 ẋ + ω02 x = 0 nebo po zavedenı́ nových proměnných x = x1 a ẋ = x2 ve tvaru ẋ1 = x2 ẋ2 = −2aω0 x2 − ω02 x1 , 2 kde a je poměrné tlumenı́ a ω0 vlastnı́ frekvence √ netlumeného systému. Charakteristická rovnice λ + 2 2 2aω0 λ + ω0 = 0 má kořeny λ1,2 = ω0 (−a ± a − 1). Rovnovážný stav je v bodě (0,0) a v závislosti KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 32 na hodnotách parametrů a, ω0 se nazývá střed, uzel (stabilnı́ nebo nestabilnı́), ohnisko (stabilnı́ nebo nestabilnı́) a sedlo (vždy nestabilnı́). Odpovı́dajı́cı́ rozloženı́ kořenů charakteristické rovnice pro tyto přı́pady a fázové portréty jsou uvedeny v tab. 4.1. Na obr. 4.1 je zakreslen diagram parametrů a oblasti stability. Stabilnı́ rovnovážné stavy ležı́ pouze v prvnı́m kvadrantu tohoto diagramu. Lineárnı́ systém 2. řádu v obecnějšı́m tvaru lze vyjádřit rovnicemi ẋ1 = a11 x1 + a12 x2 ẋ2 = a21 x1 + a22 x2 (4.8) Označı́me-li zápornou stopu −(a11 + a22 ) matice A pı́smenem σ a determinant (a11 a22 − a12 a21 ) symbolem ∆, pak kořeny charakteristické rovnice jsou λ1,2 σ =− ± 2 s σ2 − ∆. 4 Řešenı́ závisı́ opět jen na dvou parametrech σ a ∆, odpovı́dajı́cı́ diagram parametrů je zakreslen na obr. 4.2. Parabola oddělujı́cı́ ohniska a uzly má rovnici σ 2 = 4∆. Vertikálnı́ osa je hranicı́ mezi sedlem a uzlem a body této osy ∆ = 0 představujı́ tzv. vı́cenásobné singulárnı́ body (např. uzel - sedlo). Obrázek 4.1: Diagram parametrů pro systém 2.řádu Obrázek 4.2: Diagram pro systém (4.8) Lineárnı́ systém 3. řádu má charakteristickou rovnici Jejı́ diskriminant je λ3 + aλ2 + bλ + c = 0. (4.9) D = (9c − ab)2 − (6b − 2a2 )(6ac − 2b2 ). (4.10) Přı́pad 1: D < 0 , kořeny λ1 , λ2 , λ3 jsou reálné a) je-li c < 0 mohou nastat tyto dı́lčı́ přı́pady: λ1 , λ2 , λ3 > 0 singulárnı́ bod je nestabilnı́ uzel; λ1 > 0; λ2 , λ3 < 0 sedlo b) je-li c > 0, pak: λ1 , λ2 , λ3 > 0 stabilnı́ uzel; λ1 > 0; λ2 , λ3 < 0 sedlo c) je-li c = 0, pak: λ1 = 0; λ2 , λ3 6= 0 uzel nebo sedlo. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 33 Tab. 4.1. Lineárnı́ systém 2. řádu Přı́pad 2: D = 0, kořeny λ1 , λ2 , λ3 jsou reálné. Existuje jeden dvojnásobný kořen a vznikajı́ podobné typy singulárnı́ch bodů jako u přı́padu 1. Pro c = 0 se charakteristická rovnice (4.10) redukuje na tvar λ(λ2 + aλ + b) = 0 D = 3b2 (4b − a2 ) = 0. Jestliže b 6= 0 je 4b − a2 = 0. Kořeny jsou λ1 = 0; λ2 = λ3 = −a/2. Pro a > 0 je proto singulárnı́ bod stabilnı́, pro a < 0 nestabilnı́. Jestliže b = 0, a 6= 0, pak λ1 = λ2 = 0 a λ3 = −a. Singulárnı́ bod je stabilnı́ pro a > 0. Přı́pad 3: D > 0, jeden kořen λ1 je reálný, λ2 , λ3 jsou komplexně sdružené. Pro c < 0 musı́ být tedy λ1 > 0, pro c = 0λ1 = 0 a pro c > 0 je λ1 < 0. V každém z těchto třı́ přı́padů vznikajı́ ještě tři KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 34 dalšı́ možnosti: Re(λ2 , λ3 ) > 0 Re(λ2 , λ3 ) = 0 Re(λ2 , λ3 ) < 0. Jestliže Re(λ2 , λ3 ) = 0, singulárnı́ bod je střed (stabilnı́ nebo nestabilnı́ podle znaménka λ1 ). U systémů třetı́ho řádu vznikajı́ již komplikované tvary trajektoriı́ kolem singulárnı́ch bodů a typy singularit se označujı́ v některých přı́padech smı́šenými názvy, např. uzel-ohnisko, ohnisko-sedlo apod. 4.1.2 Lineárnı́ časově variantnı́ systémy Uvažujme volný časově variantnı́ systém ẋ = A(t)x, (4.11) kde maticová funkce A(t) je typu (n,n), časově závislá a spojitá pro všechna t ≥ 0. Základnı́ vlastnosti tohoto systému jsou známy z přednášek o teorii lineárnı́ch systémů. Rovnovážný stav systému je v nule a je izolovaný, jestliže A(t) je regulárnı́ pro t ≥ 0. Matice X(t, t0 ), složená po sloupcı́ch z n lineárně nezávislých řešenı́ systému (4.11) se nazývá fundamentálnı́ matice. Je regulárnı́ pro všechna t a splňuje maticovou rovnici Ẋ(t, t0 ) = A(t)X(t, t0 ). Každé řešenı́ systému (4.11) je lineárnı́ funkcı́ n nezávislých řešenı́. Jestliže X 1 (t, t0 ) a X 2 (t, t0 ) jsou dvě fundamentálnı́ matice systému (4.11), pak existuje regulárnı́ konstantnı́ matice M , pro kterou platı́ X 1 (t, t0 )M = X 2 (t, t0 ). Stavová matice přechodu Φ(t, t0 ) je normovaná fundamentálnı́ matice s počátečnı́ hodnotou Φ(t0 , t0 ) = I. Je definována vztahem Φ(t, t0 ) = X(t, t0 )X −1 (t0 , t0 ). (4.12) Řešenı́ systému (4.11) lze pomocı́ stavové matice přechodu vyjádřit ve tvaru x(t; t0 , x0 ) = Φ(t, t0 )x(t0 ) (4.13) Analytický výraz pro Φ lze zı́skat jen u některých typů rovnic. Věta 4.1. Nulové řešenı́ systému (4.11) je stabilnı́ právě tehdy, když existuje takové M (t0 ), že platı́ ||Φ(t, t0 )|| ≤ M (t0 ) ∀t ≥ t0 ≥ 0. (4.14) Podobně lze definovat stejnoměrnou a asymptotickou stabilitu. Jejich spojenı́m s větou 4.1 pak platı́ věta Věta 4.2. Nulové řešenı́ systému (4.11) je stejnoměrně asymptoticky stabilnı́ právě když a) existuje takové M < ∞, nezávislé na t0 , že ||Φ(t, t0 )|| ≤ M ∀t ≥ t0 ; b) je splněna podmı́nka lim ||Φ(t, t0 )|| = 0 t→∞ stejnoměrně v t0 . To znamená, že pro libovolné ε > 0 existuje takové T (ε) nezávislé na t0 , že ||Φ(t, t0 )|| < ε pro všechna t ≥ t0 + T a všechna t0 ≥ 0. (Důkazy vět jsou např. v [55]). Podmı́nky stability podle vět 4.1 a 4.2 vyžadujı́ znalost fundamentálnı́ matice a tı́m i úplné množiny nezávislých řešenı́. Uvedené věty majı́ proto jen omezený význam, protože fundamentálnı́ matici lze spočı́tat jen u jednoduššı́ch systémů. Někdy je však zadaný systém ve speciálnı́m tvaru, který umožňuje stabilitu snadněji určit. Je to např. systém uvedený v dalšı́ větě. Věta 4.3. Lineárnı́ systém ẋ = [A+B(t)]x se nazývá systém s asymptoticky konstantnı́mi koeficienty, jestliže limt→∞ ||B(t)|| = 0. Nulové řešenı́ tohoto systému je asymptoticky stabilnı́, jestliže matice A má pouze vlastnı́ čı́sla se zápornou reálnou částı́. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 35 Periodické systémy Uvažujme soustavu diferenciálnı́ch rovnic s periodickými koeficienty x ∈ Rn , ẋ = A(t)x (4.15) kde prvky matice A(t) jsou funkce spojité na intervalu (−∞, ∞) a periodické s periodou T > 0, takže platı́ A(t + T ) = A(t). Také pro stavovou matici přechodu platı́ Φ(t + T, t0 ) = Φ(t, t0 ). Definujme před dalšı́mi úvahami o vlastnostech periodických systémů dvě pomocné věty. Věta 4.4. (Floquetova věta). Fundamentálnı́ matici soustavy (4.15) lze vyjádřit ve tvaru X(t, 0) = P (t)eRt , (4.16) kde X(t, 0) je fundamentálnı́ matice normovaná pro t = 0, prvky matice P (t) jsou spojitě diferencovatelné funkce periodické s periodou T , matice P (t) je regulárnı́, P (0) = I a R je konstantnı́ matice [55]. Věta 4.5. Pro každou regulárnı́ matici B existuje taková matice R, že platı́ B = exp(R). Definujme matici C vztahem C = Φ−1 (t, 0)Φ(t + T, 0). (4.17) C je konstantnı́ matice a je regulárnı́, protože je součinem dvou regulárnı́ch matic. Podle věty 4.5 lze volit matici R tak, že platı́ C = exp(RT ). Definujme dále matici P (t) jako P (t) = Φ(t, 0)e−Rt . (4.18) P (t) je regulárnı́, protože je součinem dvou regulárnı́ch matic, a je periodická, nebot’ platı́ P (t + T ) = Φ(t + T, 0)e−Rt e−RT = Φ(t, 0)Ce−RT e−Rt = P (t). (4.19) Pro t = 0 je P (0) = I a z periodičnosti P (t) vyplývá, že P (kT ) = I. Řešenı́ x(t; 0, x0 ) soustavy (4.15) lze pomocı́ stavové matice přechodu zapsat ve tvaru x(t; 0, x0 ) = Φ(t, 0)x0 = P (t)eRt x0 . (4.20) x(T ; 0, x0 ) = Φ(T, 0)x0 = P (T )eRT x0 = eRT x0 . (4.21) C = eRT = Φ(T, 0) (4.22) Pro t = T je Matice se nazývá matice monodromie, vlastnı́ čı́sla matice monodromie jsou (charakteristické) multiplikátory ρi i = 1, ..., n soustavy (4.15). Vlastnı́ čı́sla matice R jsou tzv. charakteristické (nebo Floquetovy) exponenty µi soustavy (4.15). Z lineárnı́ teorie je známo, že det[Φ(t, t0 )] = exp Z t tr(A)dt , (4.23) t0 kde tr(A) je stopa matice A. Z rovnic (4.22) a (4.23) pak vyplývá, že n Y i=1 ρi = exp Z t t0 tr(A)dt . (4.24) KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 36 Matice P , C, R jsou definovány pomocı́ stavové matice přechodu a neexistuje obecná metoda jejich výpočtu. Mohou být ale zı́skány numerickou integracı́ systému (4.15) po dobu periody T . Pro stabilitu rovnovážného stavu 0 systému (4.15) pak platı́ tato věta [55]. Věta 4.6. Rovnovážný stav 0 systému (4.15) je stejnoměrně asymptoticky stabilnı́, platı́-li pro všechny multiplikátory |ρi | < 1. Rovnovážný stav je stejnoměrně stabilnı́, platı́-li pro všechny multiplikátory |ρi | ≤ 1 a jsou-li multiplikátory s hodnotou |ρi | = 1 jednoduché nuly minimálnı́ho polynomu matice monodromie. Věta 4.7. Systém (4.15) má periodické řešenı́ s periodou T právě tehdy, má-li matice monodromie vlastnı́ čı́slo +1. Přı́klad 4.1. [55] Je dán periodický systém (4.15), jehož matice A je A(t) = " −1 + a cos2 t 1 − a sin t cos t −1 − a sin t cos t −1 + a sin2 t # . Dosazenı́m do zadané rovnice lze ověřit, že Φ(t, 0) = " exp [(a − 1)t] cos t exp [−t] sin t − exp [(a − 1)t] sin t exp [−t] cos t # . Perioda T daného systému je 2π a matice monodromie je Φ(2π, 0) = " exp [2(a − 1)π] 0 0 exp [−2π] # . Vlastnı́ čı́sla této matice jsou exp [2(a − 1)π] a exp [−2π]. Jestliže a > 1, pak prvnı́ vlastnı́ čı́slo je většı́ než jedna, a rovnovážný stav 0 je podle věty 4.6 nestabilnı́. Z přı́kladu je patrno, že stabilita neautonomnı́ho obvodu nemůže být určena přı́mo z vlastnı́ch čı́sel matice A(t) pro každý pevný čas t. Vlastnı́ čı́sla matice A(t) jsou v našem přı́kladu nezávislá na t a lze je stanovit z charakteristické rovnice λ2 + (2 − a)λ + (2 − a) = 0. Z nı́ vyplývá, že A(t) by bylo stabilnı́ pro a < 2, což odporuje předchozı́mu výsledku. 4.2 Prvnı́ Ljapunovova metoda pro nelineárnı́ systémy 4.2.1 Lokálnı́ stabilita rovnovážných stavů autonomnı́ch systémů V tomto článku budeme pomocı́ Ljapunovovy metody linearizace určovat lokálnı́ stabilitu rovnovážných stavů (stabilitu v malém). Uvažujme nejprve autonomnı́ nelineárnı́ systém ẋ = f (x) a jeho libovolný rovnovážný stav x = (x̄1 , x̄2 , ..., x̄n ). Předpokládejme dále, že funkce f = (f1 , f2 , ..., fn ) je spojitá a spojitě diferencovatelná v bodě x. Rozvedeme f v Taylorovu řadu kolem x. Protože v rovnovážném stavu je f (x) = 0, dostaneme při zanedbánı́ členů vyššı́ho řádu vztahy d ∂f1 ∂f1 (x1 − x̄1 ) = (x1 − x̄1 ) + ... + (xn − x̄n ) dt ∂x1 x ∂xn x .. . d ∂fn ∂fn (xn − x̄n ) = (x1 − x̄1 ) + ... + (xn − x̄n ) dt ∂x1 x ∂xn x nebo v maticovém tvaru d (x − x) = A(x − x), dt (4.25) (4.26) KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE kde    ∂f A= = ∂x x   ∂f1 ∂x1 ... ∂fn ∂x1 ∂f1 ∂x2 ... ∂fn ∂x2 ... ... ... 37 ∂f1 ∂xn ... ∂fn ∂xn       (4.27) x je Jacobiova matice funkce f vyčı́slená v rovnovážném stavu x. Nazývá se také matice linearizace a označuje se často symboly J nebo Df . Zanedbánı́ členů vyššı́ho řádu je opodstatněno intuitivnı́ představou, že tyto členy nemajı́ v blı́zkosti rovnovážného stavu žádný podstatný vliv na strukturu trajektoriı́. Podrobný důkaz této oprávněné představy lze nalézt v učebnicı́ch matematiky. Zavedeme-li za odchylku x − x od rovnovážného stavu novou proměnnou z, je ż = Az (4.28) rovnice linearizace kolem rovnovážného stavu x. Stabilitu lze pak vyšetřit metodami použı́vanými pro řešenı́ stability lineárnı́ch systémů. Vlastnı́ čı́sla matice A určı́me z charakteristické rovnice systému (4.28) det [A − λI] = 0, kde I je jednotková matice a A konstantnı́ matice. Pak platı́ věta: Věta 4.8. Majı́-li všechna vlastnı́ čı́sla matice linearizace A záporné reálné části, je rovnovážný stav x systému ẋ = f (x) asymptoticky ljapunovsky stabilnı́. Má-li alespoň jedno vlastnı́ čı́slo kladnou reálnou část, je rovnovážný stav ljapunovsky nestabilnı́. V přı́padě, že jedno nebo vı́ce vlastnı́ch čı́sel matice A majı́ nulovou reálnou část, nenı́ možno podle lineárnı́ho přiblı́ženı́ stanovit stabilitu rovnovážného stavu vyšetřovaného nelineárnı́ho systému. Stabilita je určena vyššı́mi členy v Taylorově rozvoji, které byly při linearizaci zanedbány. V tomto přı́padě lze stabilitu určit pomocı́ tzv. centrálnı́ variety (čl. 4.4) nebo s využitı́m druhé Ljapunovovy metody (kap. 5). Je třeba znovu zdůraznit, že pomocı́ metody linearizace zı́skáme pouze lokálnı́ stabilitu, studiem globálnı́ stability se budeme zabývat v kap.5. Poznámka. U systémů 2. řádu (a částečně i 3.řádu) můžeme velmi často kromě zjištěnı́ stability rovnovážného stavu určit i pravděpodobné typy trajektoriı́ v jeho blı́zkém okolı́ na základě výsledků z čl. 4.1. Věta 4.12 v článku 4.3 to specifikuje podrobněji. I když asymptotická stabilita rovnovážného stavu nelineárnı́ho systému je dána asymptotickou stabilitou linearizovaného systému, nemusı́ klasifikace trajektoriı́ navzájem přesně odpovı́dat. Např. u nelineárnı́ho systému ẋ1 = −x1 − x2 q log x21 + x22 ẋ2 = −x1 + x1 q log x21 + x22 je rovnovážný stav (0,0) stabilnı́ ohnisko, u jeho linearizace však stabilnı́ uzel. Definice 4.1. Rovnovážný stav x se nazývá hyperbolický (také nedegenerovaný), jestliže všechna vlastnı́ čı́sla matice A majı́ nenulové reálné části. Přı́klad 4.2. Systémy 1.řádu. U systému ẋ = f (x), f : R → R vyšetřı́me stabilitu rovnovážného stavu x velmi jednoduše. Matice linearizace degeneruje na derivaci f 0 (x), takže platı́: a) f 0 (x) < 0 x je asymptoticky stabilnı́ b) f 0 (x) > 0 x je nestabilnı́ c) f 0 (x) = 0 z lineárnı́ aproximace nelze určit stabilitu. Protože Taylorův rozvoj u systémů 1. řádu je velmi jednoduchý, můžeme posoudit stabilitu přı́padu c) z členů vyššı́ho řádu. Je-li f 0 (x) = 0 a f 00 (x) 6= 0, je rovnovážný stav nestabilnı́. Jestliže pro f 0 (x) = 0 je f 00 (x) = 0, nelze opět stabilitu určit a je třeba posoudit třetı́ derivaci. Tyto závěry lze snadno odvodit z grafu funkce f (x). KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 38 Přı́klad 4.3. Systém 2.řádu. Je třeba určit rovnovážné stavy a typy trajektoriı́ v jejich okolı́ u nelineárnı́ho systému popsaného rovnicemi ẋ1 = x2 ẋ2 = bx1 − cx31 − ax2 (4.29) Položı́me-li pravé strany rovny nule, zı́skáme tři rovnovážné stavy r r b b (1) (2) (3) x = (0, 0) x = (+ ; 0) x = (− ; 0) c c Jacobiova matice pro danou soustavu rovnic má tvar   ∂f1 ∂f1 " 0  ∂x1 ∂x2   A=  ∂f2 ∂f2  = b − 3cx21 ∂x1 ∂x2 1 # . −a Dosadı́me-li do této matice čı́selnou hodnotu prvnı́ho rovnovážného stavu x1 = 0, x2 = 0, dostaneme charakteristickou rovnici det [A1 − λI] = λ2 + aλ − b = 0. p Jejı́ kořeny λ1,2 = −a/2 ± a2 /4 + b jsou reálné a opačných znamének, rovnovážný stav je tedy nestabilnı́. Protože pro 2. řád známe také průběh trajektoriı́ v blı́zkém okolı́ rovnovážného stavu, je z tab. 4.1 patrno, že rovnovážný stav je sedlo. Přı́mkové trajektorie sedla lze určit pomocı́ vlastnı́ch vektorů. Dosadı́me-li do Jacobiovy matice hodnoty druhého rovnovážného stavu, je charakteristická rovnice lineárnı́ho přiblı́ženı́ det[A2 − λI] = λ2 + aλ + 2b = 0. Typ rovnovážného stavu závisı́ na konkrétnı́ch hodnotách a, b. Pro a2 /4 < 2b jsou kořeny komplexně sdružené a rovnovážný stav je stabilnı́ ohnisko, pro a2 /4 > 2b jsou kořeny záporné reálné a rovnovážný stav je stabilnı́ uzel. Pro třetı́ rovnovážný stav dostáváme stejný výsledek. Pomocı́ metody linearizace zjistı́me tedy pro všechny rovnovážné stavy jejich stabilitu a tvary trajektoriı́ v blı́zkém okolı́ těchto rovnovážných stavů. Společně s dalšı́mi znalostmi o vektorovém poli (např. o nemožnosti existence uzavřených trajektoriı́ pro tento systém, viz čl. 10.2) si můžeme učinit dobrou představu i o globálnı́m průběhu trajektoriı́. Pro ilustraci chovánı́ systému i dále od rovnovážných stavů je na obr. 4.3 zakreslena celá sı́t’ fázových trajektoriı́. Je patrno, že systém se chová jako klopný obvod se dvěma stabilnı́mi rovnovážnými stavy. Každá trajektorie končı́ v jednom z obou stabilnı́ch rovnovážných stavů, s výjimkou té, která směřuje do sedla v bodě (0,0). Tato trajektorie se nazývá separatrix, protože odděluje oblasti přitažlivosti obou stabilnı́ch rovnovážných stavů. Závislost systému na parametrech. Budeme-li v rovnici 4.29 měnit hodnotu parametrů, např. snižovat velikost parametru b, budou se stabilnı́ rovnovážné stavy přibližovat k počátku a pro b = 0 bude mı́t systém jen jeden rovnovážný stav, jehož stabilitu nemůžeme nynı́ určit pomocı́ linearizace, protože Jacobiova matice bude singulárnı́ a jedno vlastnı́ čı́slo bude ležet na imaginárnı́ ose. Tento přı́pad vyšetřı́me později pomocı́ jiných metod (čl.4.4). Bude-li hodnota parametru b záporná, bude mı́t systém jeden stabilnı́ rovnovážný stav. Je patrno, že při kritické hodnotě parametru b = 0 nastává tzv. bifurkace, při nı́ž se kvalitativně měnı́ charakter fázového portrétu. Podrobnějšı́ rozbor bifurkačnı́ch problémů bude podán v kap. 11. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 39 Obr. 4.3. Pole trajektoriı́ systému 4.29 Řešenı́ lokálnı́ stability rovnovážných stavů nelineárnı́ho systému ẋ = f (x) lze provést také tak, že nejprve vhodnou transformacı́ posuneme vyšetřovaný rovnovážný stav do počátku. Pak x = 0, f (0) = 0 a Jacobiova matice A = [∂f /∂x] se vyhodnocuje pro x = 0. Taylorův rozvoj pravé strany lze při uvažovánı́ vyššı́ch členů zapsat ve tvaru f (x) = Ax + r(x), (4.30) kde r(x) reprezentuje všechny členy s druhými a vyššı́mi mocninami. Z toho vyplývá oprávněnost ljapunovské linearizace, protože ||r(x)|| lim = 0. (4.31) ||x||→0 ||x|| Lokálnı́ stabilitu rovnovážného stavu x = 0 posuzujeme zase podle vlastnı́ch čı́sel matice A a věty 4.8. Má-li pravá strana zadané nelineárnı́ diferenciálnı́ rovnice již tvar Ax + r(x) nebo ji na tuto formu můžeme snadno převést, je lokálnı́ stabilita rovnovážného stavu 0 dána přı́mo vlastnostmi matice A, platı́-li ovšem (4.31). Věta 4.9. Je dán systém ẋ = Ax + r(x) r(0) = 0, (4.32) n kde A je reálná konstantnı́ čtvercová matice a r je reálná vektorová funkce spojitá v oblasti Ω ⊂ R obsahujı́cı́ bod 0 a splňujı́cı́ podmı́nku (4.31). Pak platı́: a) majı́-li všechna vlastnı́ čı́sla matice A záporné reálné části, je x = 0 asymptoticky stabilnı́; b) má-li alespoň jedno vlastnı́ čı́slo matice A kladnou reálnou část, je x = 0 nestabilnı́. 4.2.2 Lokálnı́ stabilita rovnovážných stavů neautonomnı́ch systémů Ljapunovovu linearizačnı́ metodu lze použı́t také pro neautonomnı́ systémy. Uved’me nejprve obecnou větu, kterou dále využijeme pro lokálnı́ linearizaci neautonomnı́ho nelineárnı́ho systému. Věta 4.10. Řešenı́ x = 0 nelineárnı́ho časově variantnı́ho systému ẋ = A(t)x + r(t, x) r(t, 0) = 0 ∀t > 0 (4.33) KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 40 je stejnoměrně asymptoticky stabilnı́, jestliže a) lim ||x||→0 ||r(t, x)|| =0 ||x|| (4.34) a je splněna stejnoměrná konvergence lim ||x||→0 sup ||r(t, x)|| =0 ||x|| (4.35) b) A(t) je ohraničená pro všechna t c) nulové řešenı́ systému ẋ = A(t)x je stejnoměrně asymptoticky stabilnı́. Důkaz věty pomocı́ druhé Ljapunovovy metody lze nalézt např. v [55],s.212. Podmı́nky stability časově variantnı́ch lineárnı́ch systémů jsou známy z předmětu Teorie dynamických systémů. Poznámka: Podmı́nka stejnoměrnosti (4.35) znamená, že pro libovolné ε > 0 musı́ existovat takové δ > 0 nezávislé na t, že ||r(t, x)|| <ε ||x|| platı́ pro všechna t a všechna ||x|| < δ. Uvažujme nynı́ nebuzený časově variantnı́ systém ẋ = f (t, x) f (t, 0) = 0 ∀t ≥ 0 f ∈ Cr. (4.36) Taylorův rozvoj funkce f pro libovolný pevný čas t ≥ 0 vede na rovnici (4.33), kde A(t) = (∂f /∂x) pro x = 0. Z definice Jacobiovy matice A(t) vyplývá pro každé pevné t ≥ 0, že je splněna podmı́nka (4.34), nemusı́ být ovšem splněna stejnoměrná konvergence (4.35). Systém ẋ = A(t)x je však linearizacı́ neautonomnı́ho systému (4.36) kolem rovnovážného stavu 0 pouze tehdy , je-li splněna podmı́nka (4.35). Pak lze stabilitu nelineárnı́ho systému (4.36) řešit pomocı́ věty 4.10. Je třeba zdůraznit, že na rozdı́l od autonomnı́ch systémů neplatı́ u neautonomnı́ch systémů relace mezi nestabilitou linearizace ẋ = A(t)x a nestabilitou daného systému (4.36). U mnoha neautonomnı́ch systémů (4.36) je sice splněna podmı́nka (4.34), ale nikoliv (4.35). Pak nelze linearizačnı́ metodu použı́t. Přı́klad 4.4. Systém ẋ1 = −x1 + tx22 , ẋ2 = x1 − x2 má pro x = 0 matici A konstantnı́ a zbytek r(x) = [tx22 ; 0]T . Platı́ podmı́nka (4.34), ale ne stejnoměrnost (4.35), proto systém ẋ1 = −x1 , ẋ2 = x1 − x2 nenı́ linearizacı́ původnı́ho systému. Jacobiova matice A(t) neautonomnı́ho nelineárnı́ho systému je obecně t-variantnı́, pouze v některých speciálnı́ch přı́padech je konstantnı́. Např. systém ẋ = −x2 /t vede na linearizaci ẋ = −x. Podobně tomu bylo i v přı́kladu 4.4. Je-li matice linearizace konstantnı́, můžeme na rozdı́l od věty 4.10 posoudit i nestabilitu rovnovážného stavu. Věta 4.11. Jestliže Jacobiova matice A(t) = A je konstantnı́ pro všechna t ≥ 0 a jsou splněny podmı́nky (4.34) a (4.35), pak rovnovážný stav 0 nelineárnı́ho systému (4.36) je a) asymptoticky ljapunovsky stabilnı́, majı́-li všechna vlastnı́ čı́sla matice A záporné reálné části; b) nestabilnı́, jestliže jedno nebo vı́ce vlastnı́ch čı́sel matice A má kladnou reálnou část. Přı́klad 4.5. Pro určenı́ ljapunovské stability rovnovážného stavu 0 systému ẋ1 = x1 − x2 + x21 + x22 sin t ẋ2 = x1 + x2 − 2x1 x2 e−t lze použı́t věty 4.11, protože zadaný systém je již ve tvaru (4.33) s konstantnı́ maticı́ A a funkcı́ r(t, x), která splňuje podmı́nky (4.34) a (4.35) 2 1 −1 x1 + x22 sin t A= , r(t, x) = . 1 1 −2x1 x2 e−t Vlastnı́ čı́sla matice A jsou 1+j a 1−j a majı́ tedy kladnou reálnou část. Rovnovážný stav 0 je proto ljapunovsky nestabilnı́. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 4.3 41 Strukturálnı́ stabilita Reálné systémy, které popisujeme matematickými modely, např. ve formě autonomnı́ch diferenciálnı́ch rovnic ẋ = f (x), jsou neustále vystaveny různým poruchám (perturbacı́m). Vliv některých poruch se v modelu může projevit např. malými změnami vektorového pole f (x). Adekvátnost modelu je pak zajištěna tehdy, jestliže vektorové pole v(x), blı́zké v jistém smyslu vektorovému poli f (x), nevyvolá kvalitativnı́ změny v chovánı́ systému. Chceme proto, aby fázové portréty systémů ẋ = f (x) a ẋ = v(x) byly kvalitativně stejné, tj. aby systém ẋ = f (x) byl při malých poruchách strukturálně stabilnı́. Uved’me nynı́ přesnějšı́ formulace intuitivně zavedených pojmů. Uvažujme množinu všech vektorových polı́ třı́dy C r na Rn . Tuto množinu můžeme považovat za topologický prostor, jehož body jsou jednotlivá vektorová pole. Poznámka. Topologie je matematická disciplı́na studujı́cı́ topologické vlastnosti různých matematických objektů, tj. takové vlastnosti, které jsou invariantnı́ vzhledem k libovolnému homeomorfnı́mu zobrazenı́. Pro jednoduchost si můžeme představit topologický prostor jako metrický prostor. Základnı́ vlastnosti topologických prostorů jsou přehledně zpracovány v knize [13]. Homeomorfismus je zobrazenı́ h : Rn → Rm , které je prosté, spojité a jehož inverznı́ zobrazenı́ h−1 je rovněž spojité. Definice 4.2. Systémy ẋ = f (x) a ẋ = v(x) se nazývajı́ topologicky orbitálně ekvivalentnı́, jestliže existuje homeomorfismus h : Rn → Rn , který zobrazuje trajektorie jedné soustavy na trajektorie druhé soustavy při zachovánı́ směru jejich probı́hánı́. Fázové portréty takových systémů se pak nazývajı́ topologicky ekvivalentnı́ nebo kvalitativně stejné. Platı́-li to pro celý stavový prostor, jde o globálnı́ ekvivalenci. Např. fázové portréty stabilnı́ho uzlu u lineárnı́ho systému ẋ = Ax a stabilnı́ho ohniska u ẋ = Bx jsou globálně topologicky orbitálně ekvivalentnı́, protože trajektorie směřujı́cı́ do uzlu lze homeomorfně zobrazit na spirály směřujı́cı́ do ohniska. Pro nelineárnı́ systémy je globálnı́ verze obvykle přı́liš silná a je třeba uvažovat jen lokálnı́ verzi. Definice 4.3. Necht’ x je rovnovážný stav vektorového pole f na Rn a y rovnovážný stav pole v na Rn , U je okolı́ bodu x, V je okolı́ bodu y, a h : U → V je homeomorfismus, který zobrazuje U na V . Systémy ẋ = f (x) a ẋ = v(x) jsou lokálně topologicky orbitálně ekvivalentnı́ v bodech x, y, jsou-li topologicky orbitálně ekvivalentnı́ v jistých okolı́ch U, V bodů x, y. Definice 4.4. (Strukturálnı́ stabilita). Systém ẋ = f (x) je lokálně strukturálně stabilnı́ v bodě x, jestliže pro všechna vektorová pole v dostatečně blı́zká k poli f , je ẋ = v(x) v bodě y lokálně topologicky orbitálně ekvivalentnı́ se systémem ẋ = f (x) v bodě x. Věta 4.12. (Grobmanova-Hartmanova věta). Necht’ x je hyperbolický rovnovážný stav systému ẋ = f (x) a A = Df (x) je jeho matice linearizace. Pak soustavy ẋ = f (x) a ẋ = Ax jsou lokálně topologicky orbitálně ekvivalentnı́ v bodech x a 0, tj. fázový portrét soustavy ẋ = f (x) je v jistém okolı́ bodu x topologicky ekvivalentnı́ s fázovým portrétem lineárnı́ soustavy ẋ = Ax v okolı́ počátku. V okolı́ hyperbolických rovnovážných stavů se tedy fázový portrét kvalitativně neměnı́ a nedocházı́ proto k bifurkacı́m. Při studiu bifurkacı́ (kap. 11) se musı́me zabývat rovnovážnými stavy, které nejsou hyperbolické. Stabilitu těchto stavů však nelze určit pomocı́ linearizace, protože matice A tam má vlastnı́ čı́sla s nulovou reálnou částı́. Možnosti řešenı́ si ukážeme v dalšı́m článku o centrálnı́ varietě. 4.4 Centrálnı́ varieta V čl. 4.1 jsme ukázali, že u lineárnı́ho systému je možno v prostoru Rn najı́t lineárnı́ invariantnı́ podprostory E s , E u , E c , které jsou vytvořeny vlastnı́mi vektory přı́slušejı́cı́mi k vlastnı́m čı́slům se zápornými, kladnými a nulovými reálnými částmi. Také u nelineárnı́ch systémů existujı́ analogické podprostory, které jsou však již tvořeny nelineárnı́mi křivkami nebo plochami. Mluvı́me proto obecněji o varietách. (Varieta je souhrnný pojem pro křivky a plochy v n-rozměrném prostoru). Je-li x hyperbolický rovnovážný stav systému ẋ = f (x), má matice linearizace A = Df (x) jen vlastnı́ čı́sla s nenulovou reálnou částı́ a existuje lokálnı́ stabilnı́ a lokálnı́ nestabilnı́ varieta vektorového pole f v bodě KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 42 x. Tyto variety lze definovat např. vztahy: s Wloc (x) = {x ∈ U |Φt (x) → x pro t → ∞ a Φt (x) ∈ U ∀t ≥ 0} u Wloc (x) = {x ∈ U |Φt (x) → x pro t → −∞ a Φt (x) ∈ U ∀t ≤ 0}, s u kde U ⊂ Rn je otevřené okolı́ rovnovážného stavu x. Invariantnı́ variety Wloc a Wloc jsou nelineárnı́ analogiı́ s u stabilnı́ch a nestabilnı́ch invariantnı́ch podprostorů E a E u lineárnı́ch systémů (čl. 4.1) a majı́ podobný význam pro lokálnı́ topologickou klasifikaci vektorových polı́ jako invariantnı́ podprostory lineárnı́ch dynamických systémů pro jejich globálnı́ topologickou klasifikaci. Bude-li mı́t systém rovnovážný stav nehyperbolický, má matice linearizace A = Df (x) také jedno nebo vı́ce vlastnı́ch čı́sel s nulovou reálnou částı́ a tok v blı́zkosti rovnovážného stavu může být velmi komplikovaný. Docházı́ k bifurkacı́m a metoda linearizace již neumožňuje posoudit stabilitu rovnovážného stavu. V analogii s c lineárnı́m systémem zavedeme pak také pojem centrálnı́ variety Wloc . Protože rovnovážný stav x lze vždy vhodnou transformacı́ převést do počátku, budeme v dalšı́ch úvahách pro zjednodušenı́ předpokládat, že x = 0. Budeme tedy vyšetřovat fázový portrét systému ẋ = f (x) = Ax + r(x). (4.37) Linearizace systému v počátku je ẋ = Ax. Věta 4.13. Necht’ f (x) je C r vektorové pole na Rn , f (0) = 0, A = Df (0). Necht’ odpovı́dajı́cı́ invariantnı́ s podprostory matice A jsou E s , E u , E c . Potom existujı́ C r stabilnı́ a nestabilnı́ lokálnı́ invariantnı́ variety Wloc u s u r−1 c c a Wloc , které se dotýkajı́ v bodě 0 variet E a E a C centrálnı́ invariantnı́ varieta Wloc , k nı́ž E v nule je s u c tečné. Variety Wloc a Wloc jsou jednoznačné, Wloc však nemusı́ jednoznačná být (navı́c může ztratit hladkost). Důkaz věty je podán např. v [32]. s u c Na obr. 4.4 jsou pro ilustraci zakresleny lokálnı́ variety Wloc , Wloc , Wloc a invariantnı́ podprostory E s , u c E a E jejich linearizace v rovnovážném stavu 0. Na centrálnı́ varietě nemůžeme vyznačit směr toku bez specifických informacı́ o členech vyššı́ho řádu v blı́zkosti nuly. Průběhy lokálnı́ch variet se ovšem u konkrétnı́ho systému mohou lišit od průběhů na obr. 4.4. Abychom mohli určit rovnice centrálnı́ variety, je výhodné transformovat matici linearizace A do Jordanova kanonického tvaru. V něm jsou vlastnı́ vektory na sebe kolmé a to nám umožňuje pracovat s lokálnı́mi kartézskými souřadnicemi. Jordanova matice má tvar  0  A 0 0 AJ =  0 A − (4.38) 0 , + 0 0 A kde submatice A0 , A− , A+ majı́ vlastnı́ čı́sla s nulovou, zápornou a kladnou reálnou částı́. Soustava ẋ = Ax se rozpadla na tři nezávislé rovnice a lze ji zapsat ve tvaru ẋ0 = A0 x0 , ẋ− = A− x− , ẋ+ = A+ x+ , (4.39) kde x0 , x− , x+ jsou transformované proměnné původnı́ho systému. Abychom v dalšı́m nemuseli pracovat se složitým označenı́m podle rov. (4.39), použijme pı́smen x, y, z, kde pı́smenem x označı́me nynı́ jen proměnné odpovı́dajı́cı́ vlastnı́m čı́slům s nulovou reálnou částı́ x = x0 , y = x− , z = x+ . Dále položı́me A0 = B, A− = C, A+ = P . Původnı́ nelineárnı́ systém po transformaci lineárnı́ části do Jordanova tvaru a s použitı́m nového označenı́ proměnných lze nynı́ zapsat ve tvaru ẋ = Bx + F (x, y, z) ẏ = Cy + G(x, y, z) ż = P z + H(x, y, z) (4.40) Malou změnou parametrů matic C a P se kvalitativně neměnı́ fázové portréty druhé a třetı́ rovnice. Všechny kvalitativnı́ změny, které mohou nastat, jsou soustředěny do prvnı́ rovnice. Všechny závažné jevy KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 43 se tedy odehrávajı́ na centrálnı́ varietě. Tı́m se n-rozměrný bifurkačnı́ problém zredukuje na rozměr centrálnı́ variety, který je podstatně nižšı́ (nejčastěji jedno- nebo dvourozměrný). Vlivem nelineárnı́ch členů F , G, H se invariantnı́ podprostory lineárnı́ aproximace neničı́, pouze se deformujı́. Obr. 4.4. Lokálnı́ variety 4.4.1 Výpočet centrálnı́ variety a určovánı́ stability meznı́ho přı́padu Metoda linearizace neumožňuje určit stabilitu rovnovážného stavu v přı́padě, že matice linearizace má vlastnı́ čı́sla s nulovou reálnou částı́. Tento přı́pad lze však řešit pomocı́ centrálnı́ variety. Uvažujme pro zjednodušenı́, u že nenı́ nestabilnı́ varieta Wloc . Matice linearizace nemá tedy žádné vlastnı́ čı́slo s kladnou reálnou částı́, což je u reálného fyzikálnı́ho systému nejčastějšı́ přı́pad. Pak můžeme nelineárnı́ systém zapsat ve tvaru ẋ = Bx + F (x, y) ẏ = Cy + G(x, y), (4.41) kde x ∈ Rk , y ∈ Rn−k , B je matice rozměru k×k s vlastnı́mi čı́sly s nulovou reálnou částı́ a C je matice rozměru (n − k) × (n − k) s vlastnı́mi čı́sly se zápornou reálnou částı́. F , G jsou nelineárnı́ funkce všech proměnných a jsou spolu se svými prvnı́mi derivacemi v bodě (0,0) nulové. Protože centrálnı́ varieta ležı́ tečně k podprostoru E c a vlastnı́ vektory u Jordanova tvaru jsou na sebe c kolmé, můžeme pracovat s lokálnı́mi kartézskými souřadnicemi a Wloc vyjádřit ve tvaru c Wloc = {(x, y)|y = g(x), g(0) = g 0 (0) = 0}, (4.42) kde g(x) je vhodná funkce definovaná v okolı́ počátku U ⊂ Rk . Pohyb po centrálnı́ varietě je dán prvnı́ rovnicı́ soustavy (4.41), kterou můžeme nynı́ vyjádřit ve tvaru ẋ = Bx + F (x, g(x)). (4.43) K určenı́ g(x) diferencujme y(t) = g(x(t)) podle t a dosad’me z (4.43) ẏ = g 0 (x)ẋ = g 0 (x) [Bx + F (x, g(x))] = Cg(x) + G(x, g(x)) (4.44) Spolu s podmı́nkou g(0) = g 0 (0) = 0 je to nelineárnı́ diferenciálnı́ rovnice, kterou analyticky nelze obvykle vyřešit, ale kterou lze v mnoha přı́padech přibližně řešit v blı́zkosti x = 0 mocninnou řadou. Praktický postup si ukážeme na dvou jednoduchých přı́kladech. Přı́klad 4.6. Mějme systém dvou diferenciálnı́ch rovnic ẋ = −xy ẏ = −βy + x2 β > 0. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 44 Rovnovážný stav je v nule a matice linearizace v bodě nula má již Jordanův tvar 0 0 AJ (0, 0) = B = 0, C = −β F = −xy 0 −β G = x2 . Nulové vlastnı́ čı́slo neumožňuje určit stabilitu rovnovážného stavu podle prvnı́ Ljapunovovy metody. Určeme c funkci proto přibližný tvar centrálnı́ variety v blı́zkosti rovnovážného stavu. Volme např. jako aproximaci Wloc g(x) ve tvaru g(x) = ax2 + bx3 + cx4 + o(x5 ) a, b, c > 0 Podle vztahu (4.44) pak je g 0 (x)[−xg(x)] = −βg(x) + x2 . Po dosazenı́ −2a2 x4 + vyššı́ členy = (1 − βa)x2 − βbx3 − βcx4 . Aby se vyloučily členy do x4 , volme 1 − βa = 0 − 2a2 = −βc, − βb = 0 z čehož vyplývá a = 1/β Pak g(x) = b=0 c = 2/β 3 . 1 2 2 x + 3 x4 + o(x5 ). β β Protože ẋ = −xy = −xg(x), probı́há na centrálnı́ varietě přibližná dynamika 1 2 ẋ = − x3 − 3 x5 + o(x6 ). β β Protože jde o dynamiku prvnı́ho řádu, lze snadno určit, že bod (0,0) daného nelineárnı́ho systému je stabilnı́. Je také patrno, že pro určenı́ stability rovnovážného stavu (0,0) postačı́ prvnı́ člen ax2 v aproximaci centrálnı́ variety (nechceme-li určit přesněji jejı́ tvar v blı́zkém okolı́ bodu (0,0)). Přı́klad 4.7. Mějme systém u̇ = v v̇ = −v + αu2 + βuv. (4.45) Snadno se přesvědčı́me, že rovnovážný stav je v bodě (0,0) a Jacobiova matice v bodě (0,0) má vlastnı́ čı́sla 0 a -1 a nenı́ v Jordanově tvaru. Zadaný systém (4.45) nenı́ tedy v normálnı́ formě a je třeba ho na tuto formu převést. Vypočteme proto vlastnı́ vektory Jacobiovy matice A(0, 0), z nich určı́me transformačnı́ matici Q a stanovı́me závislost mezi danými proměnnými u, v a novými proměnnými normálnı́ formy, které označı́me x, y. 1 1 1 1 u x v1 = v2 = Q= =Q . 0 −1 0 −1 v y Mezi souřadnicemi je tedy vztah u = x + y, v = −y. Dosazenı́m do zadaných rovnic (4.45) a úpravou dostaneme normálnı́ formu ẋ = α(x + y)2 − β(xy + y 2 ) ẏ = −y − α(x + y)2 + β(xy + y 2 ), (4.46) kde lineárnı́ část je nynı́ v Jordanově tvaru. Porovnánı́m s rovnicemi (4.41) je patrno, že B = 0 a C = −1. Pro aproximaci centrálnı́ variety zvolme g(x) = ax2 , tj. aproximaci parabolou v okolı́ rovnovážného stavu. Dosazenı́m do vztahu (4.44) a porovnánı́m stran vyplývá, že a = −α, tj. g(x) = −αx2 . Dosazenı́m za y = g(x) = −αx2 do prvnı́ rovnice soustavy (4.46) dostaneme pro dynamiku na centrálnı́ varietě vztah ẋ = αx2 + α(β − 2α)x3 + o(x4 ), ze kterého snadno zjistı́me, že nulový rovnovážný stav je nestabilnı́. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 4.5 45 Úlohy 4.1. Určete rovnovážné stavy a stabilitu systému ẋ = xy + ax3 + bxy 2 ẏ = −y + cx2 + dx2 y pro různá znaménka a hodnoty konstant a, b, c, d. 4.2. Určete pomocı́ Ljapunovovy metody linearizace eventuelně pomocı́ centrálnı́ variety stabilitu nulového rovnovážného stavu u systémů a) ẋ = xy − αx ẏ = −βy + x2 pro různá znaménka a hodnoty parametrů α, β. 3 2 ẏ = −y + y 2 + x2 y − x3 a∈R b) ẋ = ax + x y c) ẋ = xy + ax3 + bxy 2 ẏ = −y + cx2 + dx2 y a, b, c, d ∈ R Kapitola 5 Přı́má Ljapunovova metoda Přı́má (nebo také druhá) Ljapunovova metoda umožňuje posoudit stabilitu nebo asymptotickou stabilitu v malém i ve velkém u lineárnı́ho i nelineárnı́ho autonomnı́ho i neautonomnı́ho systému. Metoda obcházı́ řešenı́ nelineárnı́ch diferenciálnı́ch rovnic hledánı́m tzv. ljapunovských funkcı́, které jsou matematickým zobecněnı́m základnı́ho fyzikálnı́ho principu, jı́mž je pokles celkové energie izolovaného disipativnı́ho systému při jeho pohybu. Je-li rovnovážný stav systému asymptoticky stabilnı́, pak při pohybu po trajektorii se akumulovaná energie systému s rostoucı́m časem zmenšuje a své minimálnı́ hodnoty dosáhne v rovnovážném stavu. Ljapunovova metoda spočı́vá v nalezenı́ vhodné funkce, kterou si lze zjednodušeně představit jako zobecněnou energii. Definitnost této funkce spolu s definitnostı́ jejı́ časové derivace podél řešenı́ stavové rovnice systému nám dá informaci o stabilitě systému. Principy této teorie si ukážeme nejprve na jednoduššı́ch systémech, kterými jsou autonomnı́ systémy. 5.1 Ljapunovovy funkce pro autonomnı́ systémy Uvažujme systém ẋ = f (x) f (0) = 0 (5.1) a zkoumejme stabilitu nulového řešenı́. Předpokládejme, že f je spojitá a spojitě diferencovatelná na Rn . Definice 5.1. Reálná funkce V (x), spojitá v oblasti Ω = {x ∈ Rn : ||x|| < B, B > 0} je pozitivně definitnı́ v Ω, jestliže V (0) = 0 a V (x) > 0 pro x 6= 0 v Ω. Jestliže uvedená vlastnost platı́ v celém stavovém prostoru, je V (x) globálně pozitivně definitnı́. Funkce je negativně definitnı́, jestliže −V (x) je pozitivně definitnı́. Funkce V (x) je pozitivně (resp. negativně) semidefinitnı́, je-li V (x) ≥ 0 (resp. V (x) ≤ 0) pro x 6= 0 a V (0) = 0. Velmi často použı́vanou Ljapunovovou funkcı́ je obecná kvadratická forma n proměnných V (x) = n X n X qij xi xj = xT Qx, (5.2) i=1 j=1 kde qij jsou reálné konstanty. Koeficienty u členů xi xj (i 6= j) jsou dány součtem qij + qji . Tyto koeficienty se nezměnı́, jestliže qij a qji položı́me rovny (qij + qji )/2. Kvadratickou formu lze pak psát ve tvaru (5.2), kde qij = qji , tj. Q je reálná symetrická matice. Tato forma je pozitivně definitnı́ právě tehdy, když všechny hlavnı́ minory determinantu matice Q jsou kladné (Sylvestrův teorém). Kvadratická forma je vhodnou Ljapunovovou funkcı́ pro lineárnı́ systémy, u nelineárnı́ch systémů však ve většině přı́padů nevyhovuje a je třeba hledat složitějšı́ typy funkcı́. U nich je však často velmi obtı́žné stanovit definitnost, která je základnı́m požadavkem u Ljapunovovy funkce, jak je patrno z následujı́cı́ definice. Definice 5.2. Ljapunovova funkce je taková reálná funkce V (x) definovaná na oblasti Ω = {x ∈ Rn : ||x|| < B}, která splňuje podmı́nky a) V (x) je spojitá a má spojité prvnı́ parciálnı́ derivace v oblasti Ω kolem počátku. b) V (x) je pozitivně definitnı́ v Ω. c) Časová derivace V̇ (x) podél řešenı́ daného systému (5.1) je negativně definitnı́ nebo negativně semidefinitnı́ v Ω. 46 KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 47 Derivace V̇ (x) podél řešenı́ daného systému je definována vztahem ∂V ∂V dV (x) = ẋ = f (x) dt ∂x ∂x (5.3) ∂V ∂V f1 (x) + ... + fn (x) = (grad V )T f (x) = (∇V )T f (x). ∂x1 ∂xn (5.4) V̇ = nebo v jiném zápisu V̇ = Věta 5.1. (Ljapunovovo kritérium). Existuje-li k danému systému (5.1) pozitivně definitnı́ Ljapunovova funkce v oblasti Ω a je-li tam V̇ (x) negativně semidefinitnı́ (resp. negativně definitnı́), je rovnovážný stav x = 0 ljapunovsky stabilnı́ (resp. asymptoticky stabilnı́) v Ω. Je-li V (x) pozitivně definitnı́ a V̇ (x) negativně definitnı́ v celém stavovém prostoru a V (x) → ∞ při ||x|| → ∞, je rovnovážný stav 0 globálně asymptoticky stabilnı́. Přı́klad 5.1. Dynamický systém ẋ1 = −x2 − x31 ẋ2 = x1 − x32 má jeden rovnovážný stav v počátku. Zvolme např. Ljapunovovu funkci ve tvaru kvadratické formy V = a1 x21 + a2 x22 . Derivace podél řešenı́ je V̇ = 2a1 x1 (−x2 − x31 ) + 2a2 x2 (x1 − x32 ) = −2a1 (x41 + x42 ), po volbě a2 = a1 . V̇ je negativně definitnı́, V je pozitivně definitnı́. Protože současně V (x) → ∞ pro ||x|| → ∞, je rovnovážný stav globálně asymptoticky stabilnı́. Volba Ljapunovovy funkce ve tvaru kvadratické formy zde vyhovı́ pouze proto, že zadaný systém má vhodný tvar. Při pozměněném tvaru rovnic již kvadratická forma nevyhovuje. Přı́klad 5.2. U dynamického systému ẋ1 = x1 (x21 + x22 − 1) − x2 ẋ2 = x1 + x2 (x21 + x22 − 1) s rovnovážným stavem v počátku můžeme rovněž volit Ljapunovovu funkci ve tvaru kvadratické formy V = x21 + x22 . Derivace podél řešenı́ daného systému je V̇ = 2(x21 + x22 )(x21 + x22 − 1). V oblasti Ω definované vztahem x21 + x22 < 1 (vnitřek jednotkového kruhu) je V̇ lokálně negativně definitnı́. Počátek je proto asymptoticky stabilnı́ v oblasti Ω. Geometrická interpretace Ljapunovovy věty. Ljapunovova věta o stabilitě má velmi názornou geometrickou interpretaci, která může sloužit i jako jednoduchý důkaz věty 5.1. Pro demonstraci zvolme např. lineárnı́ systém 2.řádu ẋ1 = x2 ẋ2 = −2aω0 x2 − ω0 2 x1 . (5.5) Ve fázové rovině zakreslı́me trajektorii tohoto systému např. pro a > 1, ω0 2 > 0 (obr.5.1). Jako Ljapunovovu funkci zvolı́me např. pozitivně definitnı́ funkci V = x21 + x22 . Průměty této funkce pro různé hodnoty V = konst. do roviny (x1 , x2 ) (vrstevnice) jsou rovněž zakresleny na obr. 5.1. Funkce V̇ (x) = (grad V )T ẋ představuje skalárnı́ součin gradientu ∇V a vektoru fázové rychlosti ẋ. Časová derivace V̇ (x) bude negativně definitnı́, jestliže vektor gradientu a vektor fázové rychlosti budou svı́rat v každém bodě trajektorie navzájem tupý úhel. Záporná definitnost funkce V̇ (x) bude tedy splněna, jestliže fázová trajektorie bude v každém bodě fázové roviny protı́nat vrstevnice ve směru klesajı́cı́ hodnoty V = konst. To je v našem přı́padě splněno a zvolená funkce V vyhovuje. Lze se snadno přesvědčit, že pro jiné hodnoty a, např. v intervalu 0 < a < 1 již Ljapunovova funkce V = x21 + x22 nevyhovı́ a musı́me zvolit obecnou kvadratickou formu (5.2). KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA Obrázek 5.1: Lineárnı́ systém 2.řádu 48 Obrázek 5.2: Vrstevnice Ljapunovovy funkce Při posuzovánı́ stability systému (5.1) postupujeme ovšem obráceně. Neznáme trajektorii pohybu ve stavovém prostoru, ale snažı́me se pouze najı́t takovou Ljapunovovu funkci, aby byly splněny podmı́nky věty 5.1. Poznámky: 1. Podmı́nka radiálnı́ neohraničenosti ||x|| → ∞ ve větě 5.1 zajišt’uje, že vrstevnice V (x) = Vα = konst. jsou uzavřené křivky (nebo plochy a hyperplochy u systémů 3. a vyššı́ho řádu). Kdyby nebyly uzavřené, mohly by se trajektorie vzdalovat od rovnovážného stavu a přitom stále protı́nat vrstevnice odpovı́dajı́cı́ klesajı́cı́m hodnotám Vα . Např. u pozitivně definitnı́ Ljapunovovy funkce V = [x21 /(1 + x21 )] + x22 jsou vrstevnice pro V > 1 neuzavřené. Fázová trajektorie se při určitých počátečnı́ch podmı́nkách může vzdalovat od počátku a přitom neustále protı́nat vrstevnice se snižujı́cı́ se hodnotou Vα (obr.5.2). 2. Ljapunovovy věty o stabilitě dávajı́ pouze postačujı́cı́ podmı́nky. Jestliže tedy při nějaké volbě Ljapunovovy funkce určı́me oblast stability Ω, je možné, že při jiné volbě určı́me oblast většı́. 3. Nemůžeme-li k danému systému najı́t vhodnou Ljapunovovu funkci, neznamená to, že systém je nestabilnı́. Lze jen konstatovat, že pokus o určenı́ stability se nezdařil. 4. Pro daný systém může existovat mnoho Ljapunovových funkcı́. Jestliže je V jeho Ljapunovova funkce, je takovou funkcı́ např.i V1 = ρV β , kde ρ > 0 a konstanta β > 1 (nemusı́ být celé čı́slo). 5. Pomocı́ Ljapunovovy teorie a některých jiných metod, které budou uvedeny v kap.7, lze často stanovit stabilitu pro celou třı́du nelineárnı́ch systémů. Stabilita takových systémů se nazývá absolutnı́ stabilita. 6. Kromě základnı́ch vět o stabilitě systému byly formulovány také různé věty o nestabilitě, které jsou užitečné v přı́padě, že se nepodařı́ nalézt vhodnou Ljapunovovu funkci podle věty 5.1. Tyto věty uvedeme až v čl.5.4 u neautonomnı́ch systémů. Pro praktické účely je důležitou vlastnostı́ asymptotická stabilita rovnovážného stavu, která existuje, jestliže V̇ (x) je negativně definitnı́. Zajistit tuto negativnı́ definitnost je však často velmi obtı́žné, a v mnoha přı́padech se podařı́ zajistit pouze negativnı́ semidefinitnost derivace Ljapunovovy funkce. Ale i v tomto přı́padě lze často učinit závěry o asymptotické stabilitě, jestliže využijeme následujı́cı́ věty. Věta 5.2. Uvažujme systém (5.1) a oblast Ω kolem počátku, ve které je V (x) pozitivně definitnı́ a V̇ (x) negativně semidefinitnı́. Jestliže množina definovaná vztahem V̇ (x) = 0 neobsahuje žádné trajektorie systému (5.1) kromě triviálnı́ trajektorie x = 0, pak rovnovážný stav 0 je asymptoticky KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 49 stabilnı́. Oblast Ω je oblast přitažlivosti rovnovážného stavu. Přı́klad na větu 5.2 bude uveden v čl. 5.3.1. Oblast Ω nemusı́ být ovšem úplnou oblastı́ přitažlivosti, protože může existovat vhodnějšı́ Ljapunovova funkce, která dá oblast většı́. Větu 5.2 lze zobecnit a formulovat tzv. věty o invariantnı́ch množinách, které dovolujı́ rozšı́řit pojetı́ Ljapunovovy funkce tak, aby popisovala i konvergenci obecnějšı́ho dynamického chovánı́, např. mı́sto k rovnovážnému stavu k limitnı́mu cyklu. [55]. 5.2 Ljapunovovy funkce pro lineárnı́ autonomnı́ systémy Ljapunovova teorie stability je obecnou metodou a můžeme tedy s jejı́ pomocı́ řešit i otázky stability lineárnı́ch systémů. Tento přı́stup nenı́ pro praktické řešenı́ stability konkrétnı́ho lineárnı́ho systému samozřejmě vhodný, protože známe jednoduchá kritéria, která vedou rychleji k cı́li. Ljapunovovo řešenı́ stability lineárnı́ch systémů je však základem pro řešenı́ stability systémů nelineárnı́ch. Dovoluje nám předevšı́m použı́vat pro lineárnı́ i nelineárnı́ systémy společnou metodiku a dále nám umožňuje vytvářet vhodné Ljapunovovy funkce i pro složité systémy vytvářené ze subsystémů. Jak uvidı́me dále, majı́ Ljapunovovy funkce aditivnı́ vlastnosti, podobně jako energie a proto Ljapunovovu funkci pro kombinace subsystémů můžeme odvodit z jednoduššı́ch funkcı́ pro jednotlivé subsystémy. Ljapunov dokázal, že pro stabilnı́ lineárnı́ autonomnı́ systém ẋ = Ax je vždy možno najı́t Ljapunovovu funkci ve tvaru pozitivně definitnı́ kvadratické formy, jejı́ž derivace podle času vzhledem k danému systému je negativně definitnı́. Uvažujme proto kvadratickou Ljapunovovu funkci V = xT P x, kde P je reálná symetrická matice. Časová derivace vzhledem k danému systému V̇ (x) = ẋT P x + xT P ẋ = xT AT P x + xT P Ax = xT (AT P + P A)x (5.6) AT P + P A = −Q, (5.7) Položı́me-li kde Q je symetrická matice, zı́skáme pro V̇ jinou kvadratickou formu V̇ = −xT Qx. Rovnice (5.7) se nazývá Ljapunovova maticová rovnice. Při vyšetřovánı́ stability můžeme tedy postupovat tak, že zvolı́me symetrickou pozitivně definitnı́ matici P , z Ljapunovovy rovnice (5.7) určı́me Q a zjistı́me, je-li pozitivně definitnı́. Nastane-li tento přı́pad, je počátek globálně asymptoticky stabilnı́. Pokud nenı́ Q pozitivně definitnı́, nelze stabilitu posoudit a je třeba vyzkoušet jinou volbu P . Abychom nemuseli náhodně zkoušet různé volby matice P , postupujeme výhodněji tak, že nejprve vybereme pozitivně definitnı́ matici Q, určı́me z Ljapunovovy rovnice P a stanovı́me jejı́ definitnost. Je-li P pozitivně definitnı́, je rovnovážný stav 0 globálně exponenciálně stabilnı́. Je-li Q pozitivně definitnı́ a P má alespoň jedno nekladné vlastnı́ čı́slo, je počátek nestabilnı́. Jestliže pro určitou volbu Q nemá rovnice (5.7) řešenı́ nebo nemá jednoznačné řešenı́ pro P , pak počátek nenı́ asymptoticky stabilnı́. Matici Q můžeme s výhodou zvolit jako jednotkovou matici nebo nějakou jinou diagonálnı́ matici. Podrobný rozbor problému lze nalézt např. v [55]. 5.3 Ljapunovovy funkce pro nelineárnı́ autonomnı́ systémy Úvodem je nutno zdůraznit, že zatı́m neexistuje jednoduchá a spolehlivá metoda, která by umožnila stanovit vhodnou Ljapunovovu funkci pro libovolný nelineárnı́ systém. Volba Ljapunovovy funkce ve tvaru kvadratické formy obecně selhává. Vyhovı́ jen v malém počtu speciálnı́ch přı́padů a proto ji pro praktické řešenı́ nelze použı́t. KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 50 Pro nelineárnı́ systémy bylo navrženo mnoho speciálnı́ch metod generovánı́ V (x) a některé metody obecné. V dalšı́ch článcı́ch si všimneme jen těch metod, kterých lze poměrně jednoduše využı́t pro praktická řešenı́. Velmi podrobný přehled většiny existujı́cı́ch metod lze nalézt v učebnici [9]. 5.3.1 Volba Ljapunovovy funkce na základě fyzikálnı́ analogie U nelineárnı́ch rovnic nižšı́ho řádu je možno najı́t jednoduchou fyzikálnı́ interpretaci Ljapunovovy teorie a podle nı́ navrhnout vhodnou funkci V (x). Této metody se často využı́vá v teoretické mechanice, v robotice apod., a je možno s jejı́ pomocı́ objasnit souvislosti mezi Ljapunovovou teoriı́ stability a a některými teoriemi optimálnı́ch systémů, zejména Pontrjaginovým principem maxima a dynamickým programovánı́m [9,10]. Uvažujme jednoduchý mechanický systém pružina, hmota, tlumič (obr. 5.3), v němž direktivnı́ sı́la f (x) a tlumı́cı́ sı́la g(ẋ) jsou nelineárnı́. Pro pohyb systému lze psát diferenciálnı́ rovnici ẍ + g(ẋ) + f (x) = 0 x(0) = x0 , ẋ(0) = ẋ0 . (5.8) U konzervativnı́ho systému je tlumenı́ g(ẋ) = 0 a celková energie je konstantnı́. Řešı́me-li konzervativnı́ systém ve fázové rovině se souřadnicemi x1 = x, x2 = ẋ, pak ẋ2 = −f (x1 ) ẋ1 = x2 (5.9) Pro f (x1 ) 6= 0 při x1 6= 0 a f (0) = 0 má systém jeden rovnovážný stav v počátku. Trajektorie jsou uzavřené křivky obklopujı́cı́ počátek a platı́ pro ně vztah dx2 f (x1 ) =− dx1 x2 (5.10) Integracı́ dostaneme rovnici trajektorie x22 + 2 Z x1 f (x1 )dx1 = konst. (5.11) 0 Prvnı́ člen představuje kinetickou energii a druhý potenciálnı́ energii, jejich součet je pak celková energie E(x1 , x2 ) pohybujı́cı́ho se systému. Trajektorie systému jsou tedy křivkami celkové energie tohoto konzervativnı́ho systému. Časová změna celkové energie je nulová dE(x1 , x2 ) = x2 ẋ2 + f (x1 )ẋ1 = x2 [ẋ2 + f (x1 )] = 0. dt (5.12) Disipativnı́ systém s tlumenı́m g(x2 ), kde g(x2 )x2 > 0 pro x2 6= 0 vede na rovnice ẋ1 = x2 , ẋ2 = −f (x1 ) − g(x2 ). Časová změna energie systému je nynı́ dE(x1 , x2 ) = x2 [ẋ2 + f (x1 )] = −g(x2 )x2 . dt (5.13) Protože g(x2 )x2 > 0 pro x2 6= 0, je patrno, že energie systému stále klesá s přibývajı́cı́m časem řešenı́, kromě bodů na ose x2 = 0. Zakreslı́me-li trajektorie systému do fázové roviny, v nı́ž jsou zaneseny také křivky konstantnı́ energie konzervativnı́ho systému (obr. 5.4), je vidět, že systém se pohybuje od jedné křivky reprezentujı́cı́ konstantnı́ energii ke druhé, která odpovı́dá energii nižšı́. Je-li tedy časová změna energie autonomnı́ho systému nekladná v každém bodě stavového prostoru, pak celková energie systému spojitě klesá až do absolutnı́ho minima, které nastane v rovnovážném stavu. U složitějšı́ch systémů je často velmi obtı́žné nalézt vztah pro celkovou energii systému, fyzikálně motivovaná ljapunovská funkce však může být určena u mnoha složitých mechanických systémů [52]. KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 51 Obrázek 5.3: Jednoduchý mechanický systém Obrázek systému 5.3.2 5.4: Trajektorie mechanického Volba Ljapunovovy funkce pro nelineárnı́ systém podle analogie s linearizovaným systémem Často se podařı́ sestrojit Ljapunovovu funkci na základě linearizovaného modelu. V nelineárnı́m systému zaměnı́me nejprve nelinearitu lineárnı́m členem, zvolı́me pro tento náhradnı́ lineárnı́ model vhodnou Ljapunovovu funkci ve tvaru kvadratické formy a pak změnı́me jejı́ tvar v tom výrazu, kde mı́sto lineárnı́ho členu je ve skutečnosti nelineárnı́ funkce. Této metody je možno často použı́t i na dosti složité systémy s většı́m počtem nelinearit. Způsob výpočtu ukáže nejlépe přı́klad. Přı́klad 5.3. Je třeba určit, pro jaké podmı́nky je stabilnı́ systém ẋ1 = f (x1 ) + βx2 ẋ2 = γx1 + δx2 f (0) = 0. (5.14) Nejprve nalezneme Ljapunovovu funkci pro linearizovaný model, ve kterém nahradı́me f (x1 ) výrazem αx1 . Podle čl. 5.2 zvolı́me obecnou kvadratickou formu, zderivujeme, zvolı́me nejjednoduššı́ tvar pro V̇ V̇ = −2(α + δ)(βγ − αδ)x21 (5.15) V = (δx1 − βx2 )2 + (αδ − βγ)x21 . (5.16) a spočteme V (x) Lineárnı́ model je stabilnı́ pro α + δ < 0, αδ − βγ > 0. Nynı́ vezmeme za základ funkci V podle (5.16) a sestrojı́me novou V (x) pro původnı́ systém (5.14), ve kterém je mı́sto αx1 nelineárnı́ funkce f (x1 ). Ve vztahu (5.16) je koeficient α u členu x21 . Člen αx21 můžeme zapsat ve tvaru Z x1 2 αx1 dx1 , 0 kde za αx1 dosadı́me f (x1 ). Jako Ljapunovovu funkci můžeme proto zvolit V = (δx1 − βx2 )2 + 2δ Z x1 f (x1 )dx1 − βγx21 (5.17) 0 Jejı́ derivace je f (x1 ) f (x1 ) + δ)(βγ − δ)x21 . x1 x1 Systém je globálně asymptoticky stabilnı́, platı́-li V̇ = −2( f (x1 ) δ − βγ > 0 x1 pro x1 6= 0 a f (x1 ) +δ <0 x1 (5.18) pro x1 6= 0 KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 52 x1 Z [f (x1 )δ − βγx1 ]dx1 → ∞ pro |x1 | → ∞. (5.19) 0 Protože systém (5.14) je stabilnı́ pro celou třı́du nelineárnı́ch funkcı́ f (x1 ), které vyhovujı́ podmı́nkám (5.19), je současně absolutně stabilnı́. 5.3.3 Metoda variabilnı́ho gradientu Pomocı́ této metody je možno navrhnout tvar Ljapunovovy funkce a nikoliv jen hledat koeficienty u nějakého tvaru předem zvoleného. Je to vlastně analytická metoda generovánı́ Ljapunovovy funkce, jejı́ž tvar zı́skáme vhodným výpočtem z daných rovnic systému. Ljapunovova věta o stabilitě předpokládá, že V (x) je spojitá a má spojité prvnı́ parciálnı́ derivace. Pak také existuje n-rozměrný vektor grad V (x) = ∇V se složkami (∇V )1 = ∂V ∂x1 (∇V )2 = ∂V ∂x2 ..., (∇V )n = ∂V ∂xn (5.20) Princip metody variabilnı́ho gradientu spočı́vá v tom, že mı́sto funkce V (x) zvolı́me nejprve obecně gradient ∇V a z něho teprve odvodı́me V (x) a V̇ (x) V̇ (x) = dV = (gradV )T ẋ = (∇V )T ẋ. dt (5.21) Provedeme-li analogii mezi potenciálnı́m vektorovým polem a uvedenými vztahy, je patrno, že ∇V tvořı́ vektorové pole a funkce V je jeho potenciál. Zobecnı́me-li vztahy, platné pro běžné trojrozměrné vektorové pole na n-rozměrný prostor, platı́, že potenciálnı́ funkci V můžeme určit z gradientu jako křivkový integrál Z x V = (∇V )T dx. (5.22) 0 Hornı́ mez x integrálu znamená, že integrujeme z počátku do libovolného bodu o souřadnicı́ch (x1 , x2 , ..., xn ) ve stavovém prostoru. V potenciálnı́m poli je křivkový integrál nezávislý na integračnı́ cestě. Nutnou a postačujı́cı́ podmı́nkou pro takové pole je vztah rot ∇V = 0, který má v kartézských souřadnicı́ch tvar ∂(∇V )j ∂(∇V )i = ∂xj ∂xi (i, j = 1, 2, ..., n). (5.23) Integraci ve vztahu (5.22) pak můžeme provést nejjednoduššeji ve směru os V = Z x 0 (∇V )T dx = Z x1 (∇V )1 (ξ1 , 0, 0, ..., 0)dξ1 + 0 + ... + Z x2 (∇V )2 (x1 , ξ2 , 0, ..., 0)dξ2 + 0 Z xn (∇V )n (x1 , x2 , ..., xn−1 , ξn )dξn , (5.24) 0 kde složka vektoru ∇V ve směru xi je (∇V )i = ∂V /∂xi . Věta 5.3. Rovnovážný stav x = 0 systému ẋ = f (x) je asymptoticky stabilnı́ v oblasti Ω, existuje-li taková reálná vektorová funkce ∇V , že platı́ a) vztahy (5.23); b) gradient ∇V nenı́ v oblasti Ω nikde roven nule kromě počátku; c) V̇ (x) je negativně definitnı́ nebo semidefinitnı́; d) množina definovaná vztahem V̇ (x) = 0 neobsahuje žádné trajektorie systému kromě počátku; e) V (x) je pozitivně definitnı́; KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 53 f) jedna z ploch V = konst. uzavı́rá oblast Ω. Shrnutı́ postupu při hledánı́ funkce V (x). Je dán systém ẋ = f (x), x = 0. 1) Volı́me ∇V ve tvaru α11 (x)x1 + α12 (x)x2 + ... + α1n (x)xn (∇V )1     .. . . ∇V =  , = . . αn1 (x)x1 + αn2 (x)x2 + ... + αnn (x)xn (∇V )n     kde αij má konstantnı́ a variabilnı́ část αij (x) = αijk + αijv (x1 , x2 , ..., xn−1 ), αii (x) = αiik + αiiv (xi ) αijk = αjik i 6= j αiik > 0 2) Vypočteme V̇ (x) = (∇V )T ẋ = (∇V )1 ẋ1 + ...(∇V )n ẋn , a za ẋi dosadı́me pravé strany daného nelineárnı́ho systému. 3) Zvolı́me V̇ (x) tak, aby bylo alespoň negativně semidefinitnı́ (tı́m určı́me část koeficientů αij ). 4) Z n(n − 1)/2 rovnic (5.23) určı́me zbylé koeficienty αij . 5) Určı́me funkci V podle vztahu (5.24) a stanovı́me jejı́ definitnost. Přı́klad 5.4. Určete stabilitu systému podle obr. 5.5 s obecnou nelineárnı́ funkcı́ f (σ), ležı́cı́ v 1. a 3. kvadrantu. Lineárnı́ část systému má přenos (s + 5)/s(s + 2) a podle obr. 5.5 pak můžeme zapsat lineárnı́ část systému ve tvaru ẋ1 = 5x2 + ẋ2 ẋ2 = −2x2 + f (σ) Dosadı́me-li z druhé rovnice do prvnı́ za ẋ2 a za f (σ) položı́me −f (x1 ), pak ẋ1 = 3x2 − f (x1 ) ẋ2 = −2x2 − f (x1 ). Obr.5.5. Stavové schema pro přı́klad 5.4 Pro účely výpočtu zavedeme formálně za funkci f (x1 ), která ležı́ v 1. a 3. kvadrantu součin g(x1 )x1 . Funkce g(x1 ) ležı́ pak v 1. a 2. kvadrantu a je tedy vždy kladná. Zvolme nynı́ gradient ve tvaru α11 x1 + α12 x2 ∇V = , α21 x1 + α22 x2 kde α jsou obecně funkcemi x. Pak V̇ = (α11 x1 + α12 x2 )[3x2 − g(x1 )x1 ] + (α21 x1 + α22 x2 )[−2x2 − g(x1 )x1 ] V̇ = −x21 [α11 g(x1 ) + α21 g(x1 )] − x22 [2α22 − 3α12 ]+ KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 54 +x1 x2 [3α11 − 2α21 − α12 g(x1 ) − α22 g(x1 )] Nejjednoduššı́ způsob volby V̇ (x) negativnı́, je α12 = α21 = 0 a pro eliminaci členu u x1 x2 α11 = α22 g(x1 ). 3 Volı́me-li např. α22 = 6, je α11 = 2g(x1 ) a V̇ = −α11 g(x1 )x21 − 2α22 x22 . Gradient jsme tedy zvolili ve tvaru ∇V = 2g(x1 )x1 6x2 = 2f (x1 ) 6x2 , kde jsme za g(x1 )x1 dosadili zase původnı́ funkci f (x1 ). Integracı́ gradientu podle vztahu (5.24) dostaneme Ljapunovovu funkci Z x1 Z x2 V = 2f (x1 )dx1 + 6x2 dx2 . 0 0 Druhý člen lze integrovat, takže výsledná Ljapunovova funkce je Z x1 V =2 f (x1 )dx1 + 3x22 . 0 Pokud f (x1 ) je kladné pro x1 kladné a f (x1 ) je záporné pro x1 záporné, pak integrál je vždy kladný a V (x) je pozitivně definitnı́. Konverguje-li integrál k nekonečnu pro |x1 | → ∞, pak vrstevnice V (x) jsou uzavřené křivky ve stavové rovině a systém je absolutně globálně asymptoticky stabilnı́. 5.4 Ljapunovovy funkce pro neautonomnı́ systémy Metody vyšetřovánı́ stability autonomnı́ch systémů nynı́ rozšı́řı́me pro neautonomnı́ systémy. Budeme uvažovat nebuzené, časově variantnı́ systémy ẋ = f (t, x) f (t, 0) = 0, (5.25) kde funkce f je spojitá vzhledem k t a spojitě diferencovatelná vzhledem ke stavu x v oblasti Ω = {(t, x) ∈ R×Rn |t ∈ (a, +∞), ||x|| < B, B > 0}. Rovnice (5.25) je jednoznačně řešitelná a má triviálnı́ řešenı́ (rovnovážný stav v nule) pro všechna t > a. Ljapunovova funkce pro neautonomnı́ systémy bude obecně záviset na čase. Uvažujme proto spojitou reálnou funkci V (t, x), V (t, 0) = 0 pro všechna t > a, definovanou v oblasti Ω a spojitě diferencovatelnou vzhledem k proměnným t a x na Ω. Definice 5.3. Funkce V (t, x) je a) pozitivně semidefinitnı́ (resp. negativně semidefinitnı́) v oblasti Ω právě tehdy, když V (t, x) ≥ 0 (resp. V (t, x) ≤ 0) pro všechna (t, x) ∈ Ω; b) pozitivně definitnı́ (resp. negativně definitnı́) na Ω právě tehdy, když existuje taková reálná funkce W (x), definovaná a spojitá v oblasti Ω0 = {x ∈ Rn | ||x|| < B}, že platı́ V (t, x) ≥ W (x) > 0 resp. V (t, x) ≤ −W (x) < 0 (5.26) pro (t, x) ∈ Ω, x 6= 0 a V (t, 0) = W (0) = 0; c) klesajı́cı́, jestliže existuje časově invariantnı́ pozitivně definitnı́ funkce W1 (x) taková, že W1 (x) ≥ V (t, x) pro všechna t ≥ t0 . KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 55 Přı́klad 5.5. a) Funkce V (t, x) = (1 + sin2 t)(x21 + x22 ) je pozitivně definitnı́, protože splňuje podmı́nku V (t, x) ≥ W (x) = x21 + x22 . Je také klesajı́cı́, protože W1 (x) = 2(x21 + x22 ) ≥ V (t, x). b) Funkce V (t, x) = (t + 1)(x21 + x22 ) je pozitivně definitnı́, protože V ≥ W (x) = x21 + x22 . Je také radiálně neohraničená, ale nenı́ klesajı́cı́, protože pro každé x 6= 0 je V jako funkce času neohraničená. c) Funkce V = x21 + x22 − 2bx1 x2 ebt je pozitivně definitnı́ pro −1 < b ≤ 0 a pozitivně semidefinitnı́ pro b = −1. Derivace funkce V podél řešenı́ soustavy (5.25) je V̇ (t, x) = ∂V ∂V ∂V + f1 (t, x) + ... + fn (t, x). ∂t ∂x1 ∂xn (5.27) Věta 5.4. (Ljapunovská stabilita). Existuje-li na oblasti Ω pozitivně definitnı́ spojitě diferencovatelná funkce V (t, x) a jejı́ derivace podél řešenı́ systému (5.25) je negativně semidefinitnı́, pak triviálnı́ řešenı́ je ljapunovsky stabilnı́ na Ω. Platı́-li uvedené podmı́nky a V je klesajı́cı́, je triviálnı́ řešenı́ stejnoměrně (ljapunovsky) stabilnı́. Věta 5.5. (Asymptotická stabilita). Existuje-li na oblasti Ω pozitivně definitnı́ spojitě diferencovatelná funkce V (t, x) a jejı́ derivace je negativně definitnı́, pak triviálnı́ řešenı́ je asymptoticky stabilnı́. Platı́-li uvedené podmı́nky a V je klesajı́cı́, je triviálnı́ řešenı́ stejnoměrně asymptoticky stabilnı́. Jsou-li dosud uvedené podmı́nky splněny v celém stavovém prostoru a V (t, x) je radiálně neohraničená, je triviálnı́ řešenı́ globálně stejnoměrně asymptoticky stabilnı́. Přı́klad 5.6. Uvažujme systém ẋ1 = −x1 − e−2t x2 ẋ2 = x1 − x2 Pro určenı́ stability rovnovážného bodu 0 zvolme Ljapunovovu funkci ve tvaru V (t, x) = x21 + (1 + e−2t )x22 . Tato funkce je pozitivně definitnı́, protože je většı́ než časově invariantnı́ pozitivnı́ funkce W (x) = x21 + x22 . Je také klesajı́cı́, protože je menšı́ než pozitivně definitnı́ funkce W1 (x) = x21 + 2x22 . Derivace V̇ je V̇ (t, x) = −2[x21 − x1 x2 + x22 (1 + 2e−2t )] a je patrno, že V̇ ≤ −2(x21 − x1 x2 + x22 ) = −(x1 − x2 )2 − x21 − x22 Funkce V je radiálně neohraničená, V̇ je negativně definitnı́, rovnovážný stav 0 je proto globálně asymptoticky stabilnı́. Přı́klad 5.7. Je dán systém druhého řádu s časově proměnným tlumenı́m ẍ + a(t)ẋ + bx = 0 tj. ẋ1 = x2 ẋ2 = −a(t)x2 − bx1 . Uvažujme pozitivně definitnı́ funkci V (t, x) = a volme β(t) = b − α2 + αa(t), α < √ 1 1 (αx1 + x2 )2 + β(t)x21 2 2 b. Derivace podél řešenı́ systému je α V̇ = [α − a(t)]x22 + [ȧ(t) − 2b]x21 2 V̇ je negativně definitnı́, jestliže a(t) > α > 0, ȧ(t) < 2b. Za předpokladu, že a(t) je shora ohraničené (V je klesajı́cı́), je rovnovážný stav 0 asymptoticky stabilnı́. KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 5.5 56 Věty o nestabilitě Kromě uvedených vět o stabilitě systému jsou v literatuře formulovány také různé věty o nestabilitě, které jsou užitečné předevšı́m tehdy, jestliže se nepodařı́ najı́t vhodnou Ljapunovovu funkci a určit stabilitu. Dvě základnı́ věty o nestabilitě podal již Ljapunov, v mnoha praktických přı́padech vede však snadněji k cı́li věta, kterou odvodil Četajev. Dále uvedených vět lze přı́mo použı́t pro neautonomnı́ systémy, u autonomnı́ch systémů lze podmı́nky snadno zjednodušit. Důkazy uvedených vět lze nalézt např. v [55]. Věta 5.6. (Prvnı́ věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná klesajı́cı́ skalárnı́ funkce V (t, x) taková, že pro čas t0 ≥ 0 platı́: 1) V (t, 0) = 0 pro všechna t ≥ t0 , 2) V (t0 , x) může nabývat kladných hodnot libovolně blı́zko počátku, 3) V̇ (t, x) je pozitivně definitnı́ v Ω. Věta 5.7. (Druhá věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná klesajı́cı́ skalárnı́ funkce V (t, x) a platı́: 1) V (t0 , 0) = 0, 2) V (t0 , x) může nabývat kladných hodnot libovolně blı́zko počátku, 3) V̇ (t, x) − λV (t, x) ≥ 0, ∀ t ≥ t0 ∀ x ∈ Ω, konstanta λ > 0. Věta 5.8. (Četajevova věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná skalárnı́ funkce V (t, x), existuje oblast Ω1 ⊆ Ω a platı́: 1) V (t, x) a V̇ (t, x) jsou pozitivně definitnı́ v Ω1 , 2) počátek je hraničnı́m bodem Ω1 , 3) v hraničnı́ch bodech oblasti Ω1 je V (t, x) = 0 pro všechna t ≥ t0 . Přı́klad 5.8. Systém je zadán rovnicemi ẋ1 = x2 + x1 (x21 + x42 ) ẋ2 = −x1 + x2 (x21 + x42 ). Linearizacı́ kolem rovnovážného stavu (0,0) dostaneme systém ẋ1 = x2 a ẋ2 = −x1 . Vlastnı́ čı́sla jsou ±j, takže nelze posoudit stabilitu podle prvnı́ Ljapunovovy metody. Zvolı́me-li Ljapunovovu funkci V = (x21 +x22 )/2, je jejı́ derivace V̇ = (x21 + x22 )(x21 + x42 ). Protože V i V̇ jsou pozitivně definitnı́, je podle věty 5.6 stav (0,0) nestabilnı́. Přı́klad 5.9. Systém je popsán rovnicemi ẋ1 = x1 + 2x2 + x1 x22 ẋ2 = 2x1 + x2 − x21 x2 . Zvolme funkci V (x) = x21 − x22 , která nenı́ pozitivně definitnı́, ale může nabývat kladných hodnot libovolně blı́zko počátku. Jejı́ derivace je V̇ = 2x21 − 2x22 + 4x21 x22 = 2V + 4x21 x22 . Druhá věta o nestabilitě ukazuje, že rovnovážný stav v počátku je nestabilnı́. 5.6 Úlohy 5.1. Vyšetřete podmı́nky stability rovnovážného stavu systémů a) ẋ1 = x2 ẋ2 = −a(x1 ) − b(x2 ); a(0) = b(0) = 0 b) ẋ1 = x2 ẋ2 = x3 ẋ3 = −cx3 − bx2 − a(x1 ); a(0) = 0 c) ẋ1 = x2 ẋ2 = x3 ẋ3 = −cx3 − b(x2 ) − a(x1 ); a(0) = b(0) = 0 d) ẋ1 = x2 ẋ2 = x3 ẋ3 = −c(x3 ) − b(x2 ) − a(x1 ); a(0) = b(0) = c(0) = 0 e) ẋ1 = x2 ẋ2 = x3 ẋ3 = −c(x1 , x2 ) − bx2 − ax1 ; f) ẋ1 = x2 ẋ2 = x3 ẋ3 = −c(x1 , x2 ) − b(x2 ) − a(x1 ); a(0) = b(0) = 0 g) ẋ1 = ax21 + bx1 x2 + cx22 ẋ2 = kx1 − x2 + mx21 + nx22 + px1 x2 h) ẋ = ayz ẏ = −bxz ż = cxy 5.2. Vyšetřete podmı́nky stability rovnovážného stavu pomocı́ metody variabilnı́ho gradientu pro systémy KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA a) ẋ1 = x2 ẋ2 = −x2 − x31 b) ẋ1 = x2 ẋ2 = −ax1 − 2b|x1 |x2 2 3 c) ẋ1 = ax1 + bx2 ẋ2 = −cx2 + dx31 57 Kapitola 6 Speciálnı́ systémy 6.1 Gradientnı́ systémy Definice 6.1. Dynamický systém ẋ = f (x), pro který existuje taková dvakrát spojitě diferencovatelná funkce V : Rn → R, že platı́ f = −grad V (x), se nazývá gradientnı́ systém. Jeho rovnice pohybu lze zı́skat z potenciálu V (x) ∂V dxi = fi (x) = − dt ∂xi Protože pro druhé parciálnı́ derivace platı́ i = 1, ..., n. (6.1) ∂2V ∂2V = ∂xi ∂xj ∂xj ∂xi (6.2) je ẋ = f (x) gradientnı́m systémem pouze tehdy, jestliže ∂fi ∂fj (x) = (x) ∂xj ∂xi i, j = 1, ..., n ∀x ∈ Rn (6.3) Vektorové pole f musı́ tedy být potenciálové, jeho rotace rot f = 0. Je-li systém ẋ = f (x) gradientnı́, je potenciálnı́ funkce V jeho Ljapunovovou funkcı́. Věta 6.1. Gradientnı́ systém ẋ = −grad V (x) má tyto vlastnosti: a) V regulárnı́ch bodech (grad V (x) 6= 0) protı́najı́ trajektorie systému ekvipotenciálnı́ plochy V (x) = konst. ortogonálně. b) Pevné body systému jsou kritické body funkce V , tj. body, v nichž grad V = 0. c) Ostrá minima funkce V jsou asymptoticky stabilnı́ pevné body. d) Hyperbolické pevné body jsou n-dimenzionálnı́ uzly nebo sedla. e) Uzavřené trajektorie nemohou vzniknout. Matice linearizace A s prvky Aij = (∂fi /∂xj )(x) pro i, j = 1, ..., n je vzhledem k platnosti (6.3) symetrická a má proto jen reálná a různá vlastnı́ čı́sla, která jsou nenulová, je-li A regulárnı́. Ostrá minima funkce V odpovı́dajı́ asymptoticky stabilnı́m uzlům, maxima V nestabilnı́m uzlům a sedlové body V jsou také sedlovými body diferenciálnı́ rovnice. Pohyb v gradientových systémech odpovı́dá přetlumenému pohybu mechanické částice ve vnějšı́m potenciálovém poli podél spádnic funkce V k nejbližšı́mu minimu nebo sedlu. Ekvipotenciálnı́ plocha je množina M = {x|V (x) = konst.} a má v regulárnı́m bodě x tečnou hyperrovinu dimenze n − 1. Normálový vektor ν = grad V (x) 6= 0 směřuje v opačném směru než vektor fázové rychlosti f (x) na trajektorii systému. Má-li funkce V v bodě x ostré minimum, je v učitém okolı́ U bodu x pozitivně definitnı́. Jejı́ derivace n n X X ∂V dV ∂V (x) = (x)fi (x) = − (x) dt ∂xi ∂xi i=1 i=1 58 2 ≤0 (6.4) KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 59 Protože složky gradientu jsou v minimu nulové, je x (lokálně) asymptoticky stabilnı́. Přı́klad 6.1. 1. Všechny systémy popsané diferenciálnı́ rovnicı́ 1. řádu ẋ = f (x) jsou gradientnı́. 2. Systém 2. řádu se stavovými proměnnými x, y 1 ẏ = −ay + (x2 − y 2 ) 2 ẋ = −ax + xy je gradientnı́ systém ∂V ẋ = − ∂x ∂V ẏ = − ∂y a 1 V (x, y) = (x2 + y 2 ) + 2 2 y3 − x2 y 3 ! √ Rovnovážné stavy jsou stabilnı́ uzel v bodě (0, 0) a sedla v bodech (0, −2a) a (± 3a, a). 6.2 Pasivnı́ a disipativnı́ dynamické systémy V této části se budeme zabývat různými speciálnı́mi systémy, které se nazývajı́ pasivnı́, disipativnı́, konzervativnı́, bezeztrátové, pozitivně reálné, striktně pozitivně reálné apod. Postupně podáme definice těchto systémů a budeme studovat jejich vlastnosti a vzájemné vztahy. V dalšı́ch kapitolách uvidı́me, že tyto speciálnı́ systémy jsou výhodné např. při určovánı́ stability složitých nelineárnı́ch systémů, při návrhu exaktnı́ch linearizacı́ pro syntézu nelineárnı́ch řı́dı́cı́ch systémů aj. Nejprve si všimneme některých základnı́ch vlastnostı́ autonomnı́ch disipativnı́ch systémů, obecnějšı́ úvahy budou předmětem odstavce 6.2.2. Autonomnı́ dynamický systém ẋ = f (x) je ve fázovém prostoru Rn definován vektorovým polem f (x), které můžeme interpretovat jako rychlostnı́ pole fázového toku Φt . Divergence vektorového pole f n X ∂fi (x) (6.5) divf = ∂xi i=1 určuje rychlost změny velikosti objemového elementu υ(t) v bodě x vlivem toku Φt . Podle Liouvilleovy věty známé z mechaniky, je rychlost změny objemového elementu v čase t dána vztahem dυ = dt Z divf (x) dx. (6.6) υ Je-li div f konstantnı́ (nezávislá na x), pak dυ/dt = υ(t)divf a po integraci υ(t) = υ(0)et divf . (6.7) Je-li div f záporná, objemový element pod vlivem fázového toku kontrahuje a dynamický systém je disipativnı́. Podmı́nka div f < 0 však nenı́ pro disipativnı́ systém nutná, protože stačı́, aby objemové elementy kontrahovaly v časové limitě lim υ(t) = 0, (6.8) t→∞ přičemž v některých časových intervalech může dojı́t i k expanzi objemového elementu. Např. Van der Polův oscilátor (odst. 2.3.2) ẋ1 = x2 ẋ2 = ε(1 − x21 )x2 − x1 je disipativnı́ systém, ale div f (x1 , x2 ) = ε(1 − x21 ) může být kladná i záporná. KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 60 V kap. 12 uvedeme přı́klady dynamických disipativnı́ch systémů, které vykazujı́ chaotické chovánı́. V čl. 12.3 odvodı́me tzv. Ljapunovovy exponenty a ukážeme, že dynamický systém je disipativnı́, když součet všech Ljapunovových exponentů je záporný. Neexistuje však žádné jednoduché kritérium, které by z dané diferenciálnı́ rovnice umožnilo stanovit, zda systém je disipativnı́. Většinou to ale lze poznat z vlastnostı́ reálného systému, který matematickým modelem popisujeme. Disipativnı́ jsou např. mechanické systémy s viskóznı́m tlumenı́m nebo třenı́m, elektrické obvody s odporovými prvky, tepelné systémy, chemické reakce a jiné ireverzibilnı́ procesy. Kontrakce objemu u disipativnı́ho systému je lokálnı́ vlastnost, kterou můžeme ověřit v každém bodě prostoru v libovolném čase. V důsledku této kontrakce se u disipativnı́ch systémů po uplynutı́ dostatečně dlouhé doby soustředı́ chovánı́ v okolı́ relativně malé podmnožiny fázového prostoru nebo přı́mo na množině, která se nazývá atraktor. Různé typy atraktorů jsme poznali v kap. 2. Jestliže u dynamického systému ẋ = f (x) je div f = 0, pak elementárnı́ objem v Rn zůstává v čase konstantnı́, objemový element může ovšem měnit svůj tvar. Dynamický systém se pak nazývá konzervativnı́ (bezeztrátový). Přı́kladem jsou hamiltonovské systémy klasické mechaniky. U konzervativnı́ch systémů neexistujı́ oblasti přitažlivosti ani atraktory. Nejjednoduššı́m atraktorem disipativnı́ho systému je rovnovážný stav. Jeho stabilitu jsme v kap. 5 vyšetřovali pomocı́ Ljapunovových funkcı́, které jsme volili jako celkovou energii systému nebo jako složitějšı́ funkci, která představuje jakousi ”zobecněnou” energii. U izolovaného disipativnı́ho systému, u něhož nenı́ zvnějšku dodávána ani energie ani hmota, se chovánı́ v čase asymptoticky blı́žı́ k rovnovážnému stavu, který představuje termodynamickou rovnováhu. Složitějšı́ situace nastává v přı́padě, kdy systém vyměňuje s okolı́m energii nebo i hmotu. Pak je třeba definovat vstupy a výstupy systému a zavést obecnějšı́ pojetı́ disipativnı́ho systému. To bude náplnı́ odstavce 6.2.2. Předtı́m však budeme ještě definovat tzv. pozitivně reálné lineárnı́ systémy. 6.2.1 Pozitivně reálné lineárnı́ systémy Při analýze a syntéze nelineárnı́ch systémů je často možno dekomponovat zadaný systém na lineárnı́ část a nelineárnı́ subsystém. Jestliže přenos lineárnı́ho subsystému je tzv. pozitivně reálný, má výhodné vlastnosti, které umožňujı́ např. podstatně jednoduššı́ řešenı́ stability složeného systému. Lineárnı́ systémy s pozitivně reálnými přenosy se nazývajı́ pozitivně reálné a majı́ velký význam pro analýzu i návrh mnoha složitých nelineárnı́ch systémů. Uvažujme přenos lineárnı́ho systému s jednı́m vstupem a jednı́m výstupem ve tvaru racionálnı́ lomené funkce bm sm + bm−1 sm−1 + ... + b0 G(s) = (6.9) sn + an−1 sn−1 + ... + a0 kde koeficienty jsou reálné a n ≥ m. Rozdı́l n − m mezi stupněm jmenovatele a čitatele se nazývá relativnı́ stupeň systému. Definice 6.2. Přenos G(s) je pozitivně reálný (PR), jestliže Re [G(s)] ≥ 0 ∀ Re (s) ≥ 0. (6.10) Přenos G(s) je striktně pozitivně reálný (SPR), jestliže G(s − ε) je pozitivně reálný pro nějaké ε > 0. Podmı́nka pozitivnı́ reálnosti (6.10) znamená, že G(s) má vždy kladnou nebo nulovou reálnou část, má-li s = σ + jω kladnou nebo nulovou reálnou část σ. Pro přenosy vyššı́ho stupně je často obtı́žné určit pozitivnı́ reálnost přı́mo z definice (6.2), protože je třeba testovat podmı́nku (6.10) v celé pravé polorovině. Lze však využı́t tuto větu: Věta 6.2.. Přenos G(s) je striktně pozitivně reálný tehdy a jen tehdy, jestliže KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 61 a) G(s) je striktně stabilnı́ (póly jsou jen v levé polorovině) b) reálná část G(s) je striktně pozitivnı́ podél osy jω, tj. Re G(jω) > 0 pro všechna ω ≥ 0. Z podmı́nky b) věty 6.2 vyplývá, že systém se striktně pozitivně reálným přenosem G(s) má frekvenčnı́ charakteristiku v pravé komplexnı́ polorovině, má relativnı́ stupeň 0 nebo 1 a je minimálně fázový (všechny jeho nuly jsou v levé polorovině). To vyplývá z vlastnostı́ Nyquistových křivek, které majı́ u neminimálně fázových systémů a u systémů s relativnı́m stupněm r > 1 fázové posuny většı́ než 90o při vyššı́ch frekvencı́ch. Věta 6.3. Přenos G(s) je pozitivně reálný tehdy a jen tehdy, jestliže a) G(s) má jen póly s nekladnou reálnou částı́, přičemž póly na imaginárnı́ ose jsou jednonásobné s reálnými nezápornými rezidui b) Re G(jω) ≥ 0 pro taková ω ≥ 0, pro která jω nenı́ pólem G(s). Pozitivně reálné přenosy mohou mı́t tedy póly i na imaginárnı́ ose, striktně pozitivně reálné nikoliv. Definice 6.3. Lineárnı́ systém ẋ = Ax + bu y = cT x, (6.11) jehož přenos G(s) = cT (sI − A)−1 b splňuje podmı́nky věty 6.2, se nazývá striktně pozitivně reálný systém. Jsou-li splněny podmı́nky věty 6.3, jedná se o pozitivně reálný systém. Definice PR a SPR přenosů lze rozšı́řit na přenosové matice pro systémy s většı́m počtem vstupů a výstupů. Definice 6.4. Přenosová matice G(s) rozměru m × m je striktně pozitivně reálná, jestliže všechny jejı́ prvky Gij (s) jsou striktně stabilnı́ a pro všechna ω ≥ 0 platı́ G(jω) + G? (jω) > 0, (6.12) kde matice G? (jω) = GT (−jω). Věta 6.4. Je dán exponenciálně stabilnı́ lineárnı́ časově invariantnı́ systém s vı́ce vstupy a výstupy v minimálnı́ realizaci ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t) (6.13) s přenosovou maticı́ G(s) = D + C(sI − A)−1 B, (6.14) kde x ∈ Rn , u, y ∈ Rm a matice majı́ odpovı́dajı́cı́ rozměry. Předpokládejme dále, že m < n a B má plnou hodnost. Daný systém je striktně pozitivně reálný, platı́-li pro všechna ω ≥ 0 vztah G(jω) + G? (jω) > 0 (6.15) Důkaz této věty lze nalézt např. v [52]. Je třeba poznamenat, že někteřı́ autoři definujı́ striktně pozitivnı́ reálnost odlišnými způsoby a existuje proto vı́ce přı́stupů k tomuto konceptu. Podrobné srovnánı́ různých definic lze nalézt v [95]. Kalmanovo-Jakubovičovo lemma Jednou z nejužitečnějšı́ch vlastnostı́ pozitivně reálných lineárnı́ch systémů je ekvivalence mezi stavovou reprezentacı́ systému v časové oblasti a pozitivně reálným přenosem ve frekvenčnı́ oblasti. Tyto vztahy odvodili v různých formách Kalman, Jakubovič, Popov a jinı́ a jsou dnes nejčastěji známy pod názvem Kalmanovo-Jakubovičovo lemma. Toto lemma má velký význam v teorii stability lineárnı́ch i nelineárnı́ch systémů, při analýze robustnosti, v adaptivnı́m řı́zenı́, v teorii obvodů a jinde. KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 62 Obecnou formulaci provedeme nejprve pro striktně pozitivně reálné lineárnı́ t-invariantnı́ systémy s vı́ce vstupy a výstupy. Lemma 6.1 (Kalman-Jakubovič). Uvažujme systém popsaný vztahy (6.13) a (6.14), kde x ∈ Rn a y, u ∈ Rm , m < n. Předpokládejme, že matice A je Hurwitzova, pár (A, B) je řiditelný, pár (C, A) je pozorovatelný a ∀ ω ≥ 0. (6.16) G(jω) + G? (jω) > 0 Za těchto podmı́nek existuje symetrická pozitivně definitnı́ matice P ∈ Rn×n , matice Q ∈ Rm×n , W ∈ Rm×m a ε > 0, že platı́ AT P + P A = −QT Q − εP BT P + W T Q = C W T W = D + DT (6.17) Přenosová matice G vyhovujı́cı́ podmı́nce (6.16) je striktně pozitivně reálná. Důkaz lze nalézt např. v [55,74]. Vyžaduje několik speciálnı́ch poznatků z teorie lineárnı́ch systémů a je náročný. Jednoduššı́ verzi uvedené věty je možno odvodit pro systémy s jednı́m vstupem a jednı́m výstupem. Nenı́-li navı́c přı́má vazba mezi vstupem a výstupem, pak platı́ toto lemma: Lemma 6.2. Časově invariantnı́ řiditelný lineárnı́ systém ẋ = Ax + bu y = cT x (6.18) má přenos G(s) = cT (sI − A)−1 b striktně pozitivně reálný tehdy a jen tehdy, existujı́-li takové pozitivně definitnı́ matice P a Q, že platı́ AT P + P A = −Q P b = c. (6.19) Důkaz je uveden např. v [52]. Lemma 6.2 lze snadno rozšı́řit na systémy pouze pozitivně reálné. U nich musı́ platit podmı́nky (6.19) za zjednodušeného předpokladu, že matice Q může být pouze pozitivně semidefinitnı́. Lemma lze pak použı́t i na přenosy obsahujı́cı́ ideálnı́ integrátor 1/s. V dalšı́ kapitole použijeme pro odvozenı́ Popovova kritéria ještě jinou verzi uvedeného lemmatu, kterou odvodil rovněž Kalman. Pasivita a disipativita lineárnı́ch systémů Doposud uvedené definice a věty se týkaly pouze pozitivně reálných a striktně pozitivně reálných matic a systémů. Nynı́ přejdeme k pojmům pasivita a disipativita. Definice 6.5. Lineárnı́ systém s jednı́m vstupem a jednı́m výstupem definovaný rovnicemi (6.11) je pasivnı́ tehdy a jen tehdy, je-li pozitivně reálný, tj. splňuje-li jeho přenos podmı́nky věty 6.3. Systém je disipativnı́ tehdy a jen tehdy, je-li striktně pozitivně reálný, tj. splňuje-li jeho přenos podmı́nky věty 6.2. Podobná definice platı́ i pro systém s vı́ce vstupy a výstupy. Je třeba zdůraznit, že se tyto pojmy nepoužı́vajı́ v literatuře jednotně. Pojetı́ pasivity vzniklo původně v teorii elektrických obvodů, kde jako pasivnı́ systém se označuje systém tvořený pouze z pasivnı́ch prvků, tedy z kondenzátorů, indukčnostı́ a odporů (rezistorů). Zvolı́me-li vhodně v takovém obvodu vstupnı́ a výstupnı́ veličinu, můžeme definovat přenos, který je pozitivně reálný podle definice 6.2. Pak je pasivnı́ systém pozitivně reálný (ve smyslu zvoleného vstupu a výstupu). Vybereme-li však vstupnı́ a výstupnı́ veličinu u daného obvodu nevhodně, nebude již přenos pozitivně reálný a obvod, složený ze stejných pasivnı́ch prvků, nebude vyhovovat podmı́nce pasivity podle definice 6.5. Jako pasivnı́ budeme tedy definovat jen takový systém, který je vzhledem ke zvolenému vstupu a výstupu pozitivně reálný. Např. systém hmota, pružina, tlumič popsaný rovnicı́ mẍ + bẋ + cx = u, KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 63 kde vstupem je sı́la u a výstupem rychlost ẋ, je pozitivně reálný. Zvolı́me-li však za výstupnı́ veličinu polohu x, nenı́ již systém pozitivně reálný, a nenı́ tedy ani pasivnı́ ve smyslu definice 6.5, i když je složen pouze z pasivnı́ch prvků. 6.2.2 Obecná teorie disipativnı́ch systémů Teorie disipativnı́ch systémů zobecňuje známé fyzikálnı́ principy přenosu a zachovánı́ energie. Dodáváli se disipativnı́mu systému energie, část této energie disipuje a část zůstane v systému akumulována. Podobně je tomu při výdeji energie systémem. Disipativnı́ systém může tedy dodat do výstupu jen část toho, co naakumuloval a může akumulovat jen část energie, která mu byla vstupem dodána. Tyto fyzikálnı́ úvahy lze rozšı́řit a formulovat teorii disipativnı́ch systémů pomocı́ zobecněných energiı́ a výkonů. Nejprve zavedeme některé základnı́ pojmy použı́vané v obecné teorii disipativnı́ch systémů. Jsou obsaženy předevšı́m v lit. [60,71], kde lze nalézt také důkazy dále uvedených vět. Vzhledem k dalšı́mu praktickému využitı́ v teorii nelineárnı́ch disipativnı́ch systémů, budeme mı́sto zcela obecného systému uvažovat v aplikacı́ch nejčastěji se vyskytujı́cı́ nelineárnı́ afinnı́ systém ẋ = f (x) + G(x)u y = h(x), (6.20) kde x ∈ X = Rn , množina vstupnı́ch hodnot U = Rm , množina výstupnı́ch hodnot Y = Rm , f a m sloupců matice G jsou hladká vektorová pole a h je hladké zobrazenı́. Množina přı́pustných vstupů U s hodnotami v U je tvořena po úsecı́ch spojitými funkcemi definovanými na R. Předpokládejme dále, že f má alespoň jeden rovnovážný stav, který můžeme bez ztráty obecnosti uvažovat v počátku, tedy f (0) = 0 a h(0) = 0. Necht’ w(t) = w(u(t), y(t)) je reálná funkce definovaná na U × Y , která představuje zobecněný výkon a kterou budeme nazývat zásobovacı́ tok (angl. supply rate). Předpokládejme, že pro každé u ∈ U a každé x0 ∈ X je výstup y(t) takový, že w(t) splňuje vztah Z 0 t |w(τ )|dτ < ∞ ∀ t ≥ 0, (6.21) tj. funkce w je lokálně integrovatelná. Definice 6.6. Dynamický systém (6.20) se zásobovacı́m tokem w je disipativnı́, jestliže existuje spojitá nezáporná funkce V : X → R taková, že pro všechna u ∈ U, x0 ∈ X, t ≥ 0 Z V (x) − V (x0 ) ≤ t w(τ )dτ, (6.22) 0 kde x = x(t; x0 , u). Funkce V se nazývá akumulačnı́ funkce (někdy také zásobnı́ funkce, angl. storage function). Nerovnost (6.22) je tzv. disipačnı́ nerovnost. Definice 6.7. Dostupná zásoba (nebo také výstupnı́ akumulačnı́ funkce, angl. available storage) Va dynamického systému s tokem w je funkce Va : X → R definovaná vztahem Va (x) = sup − Z t w(τ )dτ . (6.23) 0 Supremum se určı́ přes všechny pohyby začı́najı́cı́ ve stavu x0 v čase 0 a přes všechna u ∈ U. Dostupná zásoba je maximálnı́ množstvı́ zásoby, která může být v každém okamžiku extrahována z dynamického systému. Funkce Va (x) je nezáporná, protože je to supremum z množiny čı́sel, které obsahujı́ nulový prvek. Pojem dostupné zásoby je zobecněnı́m pojetı́ ”dostupné energie”. KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 64 Dostupná zásoba Va je základnı́ funkcı́ pro určenı́, zda systém je či nenı́ disipativnı́. To specifikuje následujı́cı́ věta. Věta 6.5. Jestliže systém se zásobovacı́m tokem w je disipativnı́, dostupná zásoba Va (x) je konečná pro každé x ∈ X a splňuje podmı́nku 0 ≤ Va (x) ≤ V (x). (6.24) pro každé x ∈ X. Jestliže Va je třı́dy C 0 , pak Va je sama možnou akumulačnı́ funkcı́ V (x). Obráceně platı́, že systém je disipativnı́, jestliže Va (x) je třı́dy C 0 a konečná pro každé x ∈ X. Podrobnějšı́m rozborem obecných vlastnostı́ výše uvedených funkcı́ lze ukázat, že funkce toku w může být vybrána různým způsobem. Zvláště důležité jsou volby: w = ||u||2 − ||y||2 , w = (u, y), w = (u + ay, u + by) a některé dalšı́. Z hlediska aplikacı́ budeme dále uvažovat w jako skalárnı́ součin (u, y), který budeme psát ve tvaru y T u. Pomocı́ této volby, která velmi úzce souvisı́ s fyzikálnı́ představou výkonu nebo zobecněného výkonu, můžeme definovat pasivitu a pozitivnı́ reálnost z odst. 6.2.1 i pro nelineárnı́ systémy. Definice 6.8. Nelineárnı́ systém (6.20) je pasivnı́, jestliže existuje taková C 0 nezáporná akumulačnı́ funkce V : X → R, V (0) = 0, která splňuje disipačnı́ nerovnost (6.22) pro funkci w(u, y) = y T u. Platı́ tedy Z t V (x) − V (x0 ) ≤ y T (τ )u(τ )dτ. (6.25) 0 Systém (6.20) je pozitivně reálný, jestliže pro x0 = 0, t ≥ 0 a všechna přı́pustná řı́zenı́ u ∈ U platı́ nerovnost Z t 0 y T (τ )u(τ )dτ ≥ 0. (6.26) Poznámky: 1) Jestliže V (0) = 0 a V (x) ≥ 0, pak z (6.25) vyplývá, že každý pasivnı́ systém je pozitivně reálný. 2) Definice 6.8 představuje rozšı́řenı́ pojmu pozitivnı́ reálnosti na nelineárnı́ systémy. Nelze tu ovšem jednoduše testovat pozitivnı́ reálnost pomocı́ frekvenčnı́ch charakteristik jako u lineárnı́ho systému. 3) Pro x0 6= 0 je V (x0 ) > 0. Položı́me-li v (6.25) u = 0, je patrno, že funkce V klesá podél jakékoliv trajektorie nebuzeného systému. Z toho vyplývá, že pasivnı́ systémy s pozitivně definitnı́ funkcı́ V jsou ljapunovsky stabilnı́. Funkce V je Ljapunovovou funkcı́ pro systém ẋ = f (x). Budeme-li naopak volit takové řı́zenı́ u, aby výstup y se udržoval na nulové hodnotě, vyplývá z nerovnosti (6.25), že V je rovněž klesajı́cı́ podél jakékoliv trajektorie, která vyhovuje omezujı́cı́ podmı́nce y = 0. V kap. 15 uvidı́me, že všechny takové trajektorie definujı́ tzv. nulovou dynamiku nelineárnı́ho systému (6.20), jejı́ž stabilita hraje důležitou roli při syntéze řı́zenı́ pomocı́ exaktnı́ linearizace. Stabilita nulové dynamiky se ale velmi obtı́žně vyšetřuje. Z nerovnice (6.25) však vyplývá, že pasivnı́ systémy s pozitivně definitnı́ funkcı́ V majı́ tuto nulovou dynamiku ljapunovsky stabilnı́. 4) Pasivnı́ systém je bezeztrátový, jestliže v definici (6.8) je V (x) − V (x0 ) = Z t y T (τ )u(τ )dτ. (6.27) 0 5) Pasivnı́ systém podle definice 6.8 je striktně pasivnı́, existuje-li taková pozitivně definitnı́ funkce S : X → R, že pro všechna u ∈ U, x0 ∈ X, t ≥ 0 je V (x) − V (x0 ) = Z 0 t y T (τ )u(τ )dτ − Z 0 t S(x(τ ))dτ. (6.28) KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 65 Funkce S představuje disipovaný výkon. Přı́klad 6.2. Mechanický systém, který tvořı́ hmota m, pružina s nelineárnı́ direktivnı́ silou a nelineárnı́ tlumič, je popsán např. rovnicı́ mẍ + x2 ẋ + x3 = u, kde vstupnı́ veličina u je vnějšı́ působı́cı́ sı́la F. Jestliže zvolı́me jako výstupnı́ veličinu rychlost ẋ, je systém pasivnı́ (vzhledem ke zvolenému vstupu a výstupu), protože ho můžeme zapsat ve tvaru (6.28) 1 1 mẋ2 + x4 = 2 4 Z 0 t ẋF dτ − Z t x2 ẋ2 dτ. (6.29) 0 Funkce V (x) je celková energie (kinetická a potenciálnı́) akumulovaná v systému a S = x2 ẋ2 je disipovaný výkon. Pasivnı́ dynamické systémy jsou výhodné při analýze složitých dynamických systémů, při studiu stability zpětnovazebnı́ch systémů (kap. 7 a 8), při návrhu exaktnı́ch linearizacı́ (kap. 15), v teorii elektrických obvodů aj. Paralelnı́ a zpětnovazebnı́ kombinace pasivnı́ch systémů vytvářejı́ opět pasivnı́ systémy a akumulačnı́ funkce V (Ljapunovovy funkce) a funkce S ve vztahu (6.28) majı́ aditivnı́ charakter X X V = Vi , S= Si . i i Podrobný rozbor lze nalézt např. v [52,71]. Teorie disipativnı́ch systémů je hluboce propracována v zobecněné termodynamice nevratných (ireverzibilnı́ch) procesů a disipativnı́ch struktur, které majı́ stěžejnı́ význam pro chemické a biologické systémy. Kapitola 7 Absolutnı́ stabilita V této kapitole se budeme zabývat určovánı́m stability nelineárnı́ch systémů, ve kterých lze oddělit dynamickou lineárnı́ část od nelineárnı́ch statických prvků (obr. 7.1). Tento typ úlohy se v literatuře nazývá také Lurjeho problém. Lineárnı́ část je obecně definována přenosovou maticı́ G(s) nebo stavovými rovnicemi ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t), (7.1) nelineárnı́ část obsahuje statické prvky z(t) = φ(t, y), které budou u jednotlivých úloh definovány podrobněji. Zpětnovazebnı́ spojenı́ mezi prvky je u(t) = −z(t). Dále budeme uvažovat jen systémy se stejným počtem vstupů a výstupů, kde x ∈ Rn , u, y, z ∈ Rm . V teorii stability se ukázalo výhodné zjišt’ovat stabilitu uzavřené smyčky z vlastnostı́ otevřené smyčky. Takovou metodou je u lineárnı́ch systémů předevšı́m velmi známé Nyquistovo kritérium, které je jednoduché a názorné, protože umožňuje využı́t pro určenı́ stability frekvenčnı́ charakteristiku systému. Snahou mnoha autorů proto bylo vytvořit podobná kritéria i pro nelineárnı́ systémy. 7.1 Popovovo kritérium V r. 1959 uveřejnil rumunský vědec V.M. Popov nové kritérium stability nelineárnı́ch systémů Lurjeho typu (obr. 7.1), které je velmi výhodné pro inženýrskou praxi, protože k vyšetřenı́ stability se použı́vá frekvenčnı́ch charakteristik lineárnı́ části obvodu. Kritérium bylo rozšı́řeno mnoha dalšı́mi autory a dnes jı́m lze vyšetřovat systémy se spojitými, nespojitými, hystereznı́mi i časově proměnnými nelineárnı́mi prvky, systémy s většı́m počtem nelinearit, diskrétnı́ nelineárnı́ systémy, fuzzy systémy, systémy s rozloženými parametry, adaptivnı́ systémy aj. Metoda umožňuje také posoudit stupeň stability nebo tlumenı́ systému a provádět některé jednoduché syntézy nelineárnı́ho systému. Ukázalo se také, že Popovovo kritérium je v úzkém vztahu k Ljapunovově teorii stability a jeho splněnı́ je nutnou a postačujı́cı́ podmı́nkou pro existenci Ljapunovovy funkce ve tvaru kvadratická forma plus integrál z nelinearity. Vyšetřovánı́ stability pomocı́ Popovova kritéria je výhodné při malém počtu nelinearit, přičemž řád lineárnı́ části může být vysoký. Tı́m představuje toto kritérium výhodný doplněk Ljapunovovy metody, která je naopak výhodná při vı́ce nelinearitách a nı́zkém řádu lineárnı́ části. Nejprve budeme uvažovat autonomnı́ nelineárnı́ systém podle obr. 7.1 s jednou nelinearitou ve zpětné vazbě a s lineárnı́m časově invariantnı́m subsystémem, který má jeden vstup a jeden výstup. Tato lineárnı́ část zahrnuje všechny lineárnı́ členy v obvodu. Uzavřený systém lze popsat rovnicemi ẋ = Ax + bu, y = cT x, 66 u = −φ(y), (7.2) KAPITOLA 7. ABSOLUTNÍ STABILITA 67 kde x ∈ Rn , u, y jsou skaláry. Přenos lineárnı́ části je G(s) = cT (sI − A)−1 b. (7.3) Dále budeme předpokládat, že v obvodu je jedna jednoznačná časově invariantnı́ nelinearita, která ležı́ v 1. a 3. kvadrantu v sektoru [0, k] a splňuje podmı́nky φ(0) = 0, 0≤ φ(y) ≤k y 0 ≤ k ≤ ∞, (7.4) kde k je sklon omezujı́cı́ přı́mky (obr.7.2). Zpětnovazebnı́ systém (7.2) má jeden rovnovážný stav x = 0. Obrázek 7.1: Schéma nelineárnı́ho systému Obrázek 7.2: Sektor nelineárnı́ charakteristiky Věta 7.1 (Popovovo kritérium). Uvažujme nelineárnı́ systém, u něhož a) všechna vlastnı́ čı́sla matice A majı́ záporné reálné části (G(s) má póly jen v levé polorovině) b) pár (A, b) je řiditelný, pár (c, A) je pozorovatelný c) statická charakteristika nelineárnı́ho prvku ležı́ v sektoru [0, k]. Za těchto podmı́nek je rovnovážný stav x = 0 systému (7.2) globálně absolutně asymptoticky stabilnı́ tehdy, existuje-li takové reálné čı́slo q > 0, že pro všechna ω ≥ 0 je splněna nerovnost Re[(1 + jωq)G(jω)] + 1 > 0. k (7.5) V přı́padě, že přenos lineárnı́ části má i pól v počátku, platı́ uvedené kritérium při omezenı́ nelineárnı́ho prvku na sektor (0, k], aby nevznikl jiný rovnovážný stav mimo počátek. Poznámky: a) Popovovo kritérium je pouze podmı́nkou postačujı́cı́. V určitých přı́padech může být systém stabilnı́ i pro většı́ zesı́lenı́ v obvodu než udá kritérium. Vyplývá to z toho, že se určuje stabilita pro celou třı́du nelinearit, z nichž některé mohou být pro stabilitu velmi nepřı́znivé, např. funkce s klesajı́cı́m úsekem charakteristiky. Toto obecnějšı́ pojetı́ má však i své výhody, protože v praxi může mı́t charakteristika velmi komplikovaný tvar nebo ji nelze dostatečně přesně určit. Charakteristiky se mohou také pomalu měnit, např. stárnutı́m prvku. b) Pro obecnou časově proměnnou nebo nejednoznačnou nelinearitu platı́ Popovovo kritérium s omezenı́m q=0 0 < k ≤ ∞. (7.6) Globálnı́ asymptotická stabilita je tedy splněna pouze tehdy, platı́-li Re G(jω) + 1 > 0. k (7.7) Frekvenčnı́ charakteristika G(jω) lineárnı́ části musı́ tedy ležet v komplexnı́ rovině vpravo od svislé přı́mky, procházejı́cı́ bodem −1/k. KAPITOLA 7. ABSOLUTNÍ STABILITA 68 Přı́klad 7.1. V systému podle obr. 7.1 má lineárnı́ část přenos G(s) = 10 s(2s + 1) a nelinearita ležı́ v sektoru (0, 1]. Pro určenı́ stability Popovovým kritériem můžeme zvolit např. q = 2. Pak podmı́nka Re[(1 + 2jω) 10 ]+1>0 jω(2jω + 1) je splněna pro všechna ω ≥ 0 a uzavřený systém má jeden rovnovážný stav v nule, který je absolutně asymptoticky stabilnı́ ve velkém. Grafické řešenı́ kritéria v komplexnı́ rovině. Pro určenı́ stability je tedy třeba v Popovově nerovnosti (7.5) zvolit určité q a zjistit, zda podmı́nka je splněna. Nenı́-li, musı́me volit jinou hodnotu q a postup opakovat, teoreticky pro všechna q > 0. Při složitějšı́ch přenosech G(jω) by to bylo neproveditelné, řešenı́ je však možno nalézt velmi jednoduše graficky v komplexnı́ rovině. Prvnı́ část nerovnosti (7.5) lze rozepsat ve tvaru Re [(1 + jωq)G(jω)] = Re {(1 + jωq)[Re G(jω) + jIm G(jω)]} = = Re [Re G(jω) + jωq Re G(jω) + jIm G(jω) − qω Im G(jω)] = = Re G(jω) − qω Im G(jω) = X − qY, (7.8) kde X = Re G(jω) Y = ω Im G(jω). (7.9) Nerovnost (7.5) lze tedy zapsat ve tvaru X − qY + 1 > 0. k (7.10) Rovnice 1 =0 (7.11) k je v souřadnicı́ch X, Y rovnicı́ tzv. Popovovy přı́mky, která procházı́ bodem −1/k na reálné ose a má sklon 1/q. Nerovnost (7.5) pak řı́ká, že všechny body se souřadnicemi X, Y musı́ být v oblasti definované podmı́nkou (7.5). Stabilitu pak vyšetřujeme tı́mto postupem: X − qY + Pro daný nelineárnı́ systém s lineárnı́ částı́ G(jω) nakreslı́me v komplexnı́ rovině tzv. modifikovanou frekvenčnı́ charakteristiku G? (jω) = X(ω) + jY (ω). (7.12) Reálná část této charakteristiky je stejná jako u G(jω), imaginárnı́ část je pro každý bod dána hodnotou imaginárnı́ částı́ G(jω) násobenou odpovı́dajı́cı́ hodnotou ω. Systém je stabilnı́, můžeme-li vést bodem (−1/k, j0) takovou přı́mku, která by ležela vlevo od modifikované charakteristiky, jestliže jı́ procházı́me ve směru od ω = 0 do ω = ∞. Připomeňme si, že při vyšetřovánı́ stability lineárnı́ch systémů pomocı́ Nyquistova kritéria nezáležı́ na tvaru celé frekvenčnı́ charakteristiky, ale pouze na jejı́ch průchodech reálnou osou. Popovovo kritérium pro nelineárnı́ systémy však bere v úvahu celý průběh modifikované frekvenčnı́ charakteristiky. KAPITOLA 7. ABSOLUTNÍ STABILITA 69 Přı́klad 7.2. Určete, zda systém se strukturou podle obr.7.1 a s lineárnı́ částı́ G(s) = 1 s(2s + 1)(s + 1)2 (0, 5s + 1) je stabilnı́ při jednoznačné časově invariantnı́ nelineárnı́ funkci, která ležı́ v 1. a 3. kvadrantu v sektoru (0; 0, 5]. Do komplexnı́ roviny vyneseme frekvenčnı́ charakteristiku lineárnı́ části obvodu (obr.7.3) a sestrojı́me k nı́ modifikovanou G? (jω). Je patrno, že bodem −1/k = −2 je možno vést libovolnou přı́mku tak, aby G? (jω) ležela pro všechny frekvence vpravo od této přı́mky. Systém je proto absolutně asymptoticky stabilnı́ ve velkém. Obr.7.3. Vyšetřenı́ stability systému z přı́kladu 7.2. Popovovo kritérium umožňuje zı́skat i obecnějšı́ závěry pro studium stability. Nahradı́me-li nelineárnı́ člen lineárnı́m, který má zesı́lenı́ k (sklon mezné přı́mky), je charakteristická rovnice výsledného uzavřeného lineárnı́ho obvodu kG(jω)+1 = 0. Na mezi stability bude obvod podle Nyquistova kritéria tehdy, nastane-li průsečı́k G(jω) se zápornou reálnou poloosou v bodě −1/k. V přı́kladu 7.2 je souřadnice tohoto průsečı́ku -1,86 tj. k = 0, 536. Z obr. 7.3 je patrno, že nelineárnı́ obvod s libovolnou nelinearitou v sektoru (0; 0, 536] bude rovněž stabilnı́. V bodě −1/k = −1, 86 je totiž možno vést meznı́ Popovovu přı́mku jako tečnu k modifikované charakteristice G? (jω). V tomto přı́padě platı́ tedy stejné podmı́nky stability pro daný nelineárnı́ systém z přı́kladu 7.2 i pro náhradnı́ lineárnı́ systém. Některé dalšı́ podobné přı́klady vedly k formulaci tzv. Ajzermanovy hypotézy, kterou můžeme stručně formulovat takto: Nahradı́me nelineárnı́ člen lineárnı́m prvkem se zesı́lenı́m k meznı́ přı́mky. Je-li výsledný lineárnı́ uzavřený obvod stabilnı́, je stabilnı́ také původnı́ obvod s nelinearitou ležı́cı́ v sektoru s hornı́ hranicı́ k. Pokud by tato hypotéza platila, bylo by možno nahradit vyšetřovánı́ stability nelineárnı́ho systému Lurjeho typu jednoduchými kritérii, které platı́ pro lineárnı́ systémy. Velmi brzy se však ukázalo, že Ajzermanova hypotéza platı́ pouze v některých přı́padech a nikoliv obecně, jak je ihned patrno z dalšı́ho přı́kladu. Přı́klad 7.3. Určete, zda je stabilnı́ obvod s nelineárnı́ charakteristikou ležı́cı́ v sektoru (0; 0, 7] a s lineárnı́m členem s přenosem 1 . (7.13) G(s) = s(s3 + s2 + 2s + 1) Vyneseme-li v komplexnı́ rovině (obr. 7.4) modifikovanou charakteristiku G? (jω), je patrno, že bodem −1/k = −1, 43 můžeme vést přı́mku tak, aby G? (jω) zůstala vpravo. Obvod je stabilnı́. Nahradı́me-li nelineárnı́ člen lineárnı́m se zesı́lenı́m k, pak z Nyquistova kritéria plyne, že náhradnı́ obvod je na mezi stability pro k = 1, nelineárnı́ obvod má však meznı́ zesı́lenı́ k = 0, 75. Vedeme-li totiž takovou meznı́ KAPITOLA 7. ABSOLUTNÍ STABILITA 70 Popovovu přı́mku, aby G? (jω) byla stále vpravo od nı́, je vidět, že tato přı́mka (zakreslená na obr. 7.3) protı́ná reálnou osu v bodě −1/k = −1, 33, tj. k = 0, 75. Ajzermanova hypotéza v tomto přı́padě neplatı́, tzv. Hurwitzův sektor (0, 1] je většı́ než Popovův (0; 0, 75]. Obr. 7.4. Modifikovaná frekvenčnı́ charakteristika 7.1.1 Odvozenı́ Popovova kritéria Důkaz Popovova kritéria je dosti náročný, zejména původnı́ postup, který podal Popov [83]. Jednodušeji lze odvodit toto kritérium pomocı́ Ljapunovovy funkce ve tvaru kvadratická forma plus integrál z nelinearity a pomocné věty předložené Kalmanem a Jakubovičem [74]. Odvozenı́ zároveň ukazuje, že Popovovo kritérium je nutnou a postačujı́cı́ podmı́nkou pro existenci Ljapunovovy funkce uvedeného typu. Odvozenı́ provedeme pouze pro přı́pad, kdy G(s) má póly jen v levé polorovině a v obvodu je časově invariantnı́ jednoznačná nelinearita. Ostatnı́ přı́pady lze odvodit analogicky nebo pomocı́ metody transformace pólů a nul (odst. 7.1.3). Zvolme pro nelineárnı́ systém (7.2) Ljapunovovu funkci V (x) = xT P x + Z y φ(y)dy, (7.14) 0 kde P je symetrická pozitivně definitnı́ matice. Protože φ(y) ležı́ v sektoru [0, k], je Funkce V je pozitivně definitnı́ a radiálně neohraničená. Jejı́ derivace Ry 0 φ(y)dy ≥ 0 ∀y. V̇ (x) = ẋT P x + xT P ẋ + φ(y)ẏ. (7.15) ẋ = Ax − bφ(y) (7.16) Z rovnic systému (7.2) vyplývá T T T T ẏ = c ẋ = c (Ax + bu) = c Ax − c bφ(y). (7.17) V̇ = xT AT P x + xT P Ax − bT P xφ(y) − xT P bφ(y) + cT Axφ(y) − cT bφ2 (y) (7.18) Dosazenı́m do (7.15) je KAPITOLA 7. ABSOLUTNÍ STABILITA 71 a po úpravě V̇ = xT (AT P + P A)x + (cT A − 2bT P )xφ(y) − cT bφ2 (y). (7.19) Přidejme do (7.19) výraz φ(y)[−gy + gcT x] + hφ2 (y) − hφ2 (y), (7.20) který nezměnı́ platnost rovnice (7.19). Výraz obsahuje dva volné parametry g, h, které můžeme volit tak, aby jejich poměr g/h udával směrnici přı́mky, pod kterou ležı́ nelineárnı́ charakteristika, tj. g/h = k. Pak V̇ = xT (AT P + P A)x + (cT A − 2bT P + gcT )xφ(y) − (h + cT b)φ2 (y) + (hφ(y) − gy)φ(y). (7.21) Aby systém (7.2) byl stabilnı́, je třeba, aby funkce V̇ byla negativně definitnı́. K určenı́ této definitnosti využijeme pomocné věty, kterou publikoval Kalman. Věta 7.2. Jsou dány dva reálné n-rozměrné vektory δ a b (b 6= 0), reálné čı́slo γ ≥ 0, symetrická pozitivně definitnı́ matice P a n × n matice A se zápornými reálnými vlastnı́mi čı́sly. Pak existuje reálný vektor s, že platı́ AT P + P A = −ssT √ δ − P b = − γs (7.22) (7.23) tehdy a jen tehdy, jestliže pro všechna reálná ω je 1 γ + Re[δ T (jωI − A)−1 b] ≥ 0. 2 (7.24) Zvolme nynı́ 1 δ = (A + gI)T c 2 Rovnice (7.23) bude mı́t pak tvar γ = h + cT b. (7.25) p 1 − P b + (A + gI)T c = − h + cT b s 2 (7.26) a jejı́ transpozice je − 2bT P T + cT A + cT g = −2sT p h + cT b. (7.27) Dosadı́me-li (7.27) a (7.22) do (7.21), pak pro P = P T je V̇ = −xT ssT x − 2sT p h + cT b xφ(y) − (h + cT b)φ2 (y) − hφ(y) V̇ = −[sT x + p h + cT b φ(y)]2 − hφ(y) g y − φ(y) . h g y − φ(y) h (7.28) (7.29) Protože g/h = k, ky − φ(y) ≥ 0, je druhý člen v (7.29) nekladný. Prvnı́ člen je záporný, existuje-li reálný vektor s, tj. platı́-li podmı́nka (7.24). Pak je V̇ negativně definitnı́ a systém (7.2) je globálně asymptoticky stabilnı́. Dosadı́me-li do nerovnosti (7.24) zvolené výrazy pro δ a γ z (7.25), dostaneme Popovovo kritérium v maticovém tvaru. Pak platı́ Věta 7.3. Systém (7.2) je globálně absolutně asymptoticky stabilnı́, existujı́-li takové dva parametry g, h > 0, že h + cT b ≥ 0 (7.30) KAPITOLA 7. ABSOLUTNÍ STABILITA 72 (h + cT b) + Re[cT (A + gI)(jωI − A)−1 b] ≥ 0. (7.31) Abychom dokázali, že podmı́nky (7.30) a (7.31) odpovı́dajı́ Popovovu kritériu podle věty 7.1, upravme (7.31) na tvar (7.5). Lineárnı́ část obvodu, která je dána vztahy y = cT x ẋ = Ax + bu (ẏ = cT ẋ), (7.32) převedeme do Laplaceovy transformace sX(s) = AX(s) + bU (s) (7.33) T (7.34) T sY (s) = c AX(s) + c bU (s) a přidáme do druhé rovnice výrazy −gY (s) + gcT X(s), které nezměnı́ jejı́ platnost. Z rovnice (7.33) vypočteme X(s) X(s) = (sI − A)−1 bU (s), (7.35) doplněná rovnice (7.34) vede na (s + g)Y (s) = cT (A + gI)X(s) + cT bU (s). (7.36) Dosazenı́m (7.35) do (7.36) zı́skáme přenos lineárnı́ části ve tvaru Y (s) 1 = G(s) = [cT (A + gI)(sI − A)−1 b + cT b] U (s) s+g (7.37) (jω + g)G(jω) = cT (A + gI)(jωI − A)−1 b + cT b. (7.38) a pro s = jω Srovnánı́m se vztahem (7.31) je patrno, že h + cT b + Re[cT (A + gI)(jωI − A)−1 b] = h + Re[cT (A + gI)(jωI − A)−1 b + cT b] = h + Re[(jω + g)G(jω)] = h 1 + Re[(1 + jω)G(jω)] ≥ 0. g g (7.39) Protože h/g = 1/k a 1/g je libovolný volitelný parametr q v Popovově definici, odpovı́dá (7.39) tvaru (7.5). 7.1.2 Popovovo kritérium a Ajzermanova hypotéza V předchozı́m odstavci jsme formulovali tzv. Ajzermanovu hypotézu, která pro nelineárnı́ systémy obecně neplatı́, existuje však mnoho jednoduchých systémů, které Ajzermanově domněnce vyhovujı́. Rozborem pomocı́ Popovova kritéria lze u jednoduššı́ch obvodů stanovit podmı́nky platnosti Ajzermanovy hypotézy. Uvažujme jako přı́klad nelineárnı́ systém s lineárnı́ částı́, která má přenos G(s) = s(a3 s3 1 . + a2 s2 + a1 s + 1) (7.40) Frekvenčnı́ charakteristika je pro určité hodnoty koeficientů znázorněna na obr. 7.5a, modifikovaná na obr. 7.5b. Kořeny polynomu v závorce jmenovatele přenosu (7.40) ležı́ v levé polorovině při a1 a2 −a3 > 0. KAPITOLA 7. ABSOLUTNÍ STABILITA 73 Obr. 7.5. Charakteristiky v komplexnı́ rovině a) frekvenčnı́ charakteristika b) modifikovaná frekvenčnı́ charakteristika Frekvenčnı́ přenos G(jω) vyjádřı́me ve tvaru G(jω) = −(a1 − a3 ω 2 )ω − j(1 − a2 ω 2 ) u = 2 2 2 2 2 ω[(1 − a2 ω ) + ω (a1 − a3 ω ) ] v (7.41) Imaginárnı́ část přenosu je rovna nule pro ω 2 = 1/a2 , reálná část přenosu pro tuto hodnotu ω má velikost a22 X1 = − (7.42) a1 a2 − a3 Modifikované frekvenčnı́ charakteristiky začı́najı́ v bodě (−a1 , −j) pro ω = 0. Směrnice tečny v průsečı́ku s osou X je a2 (7.43) tg α = a1 a2 − 2a3 Zı́skáme ji ze vztahů 2a2 ω 3 (a1 − a3 ω 2 )2 d[ω Im G(jω)] = (7.44) dω v2 d[Re G(jω)] 2a3 ω 3 (a1 − a3 ω 2 )2 + (a1 − a3 ω 2 )2a21 ω − 8a1 a3 ω 3 + 6a23 ω 5 = (7.45) dω v2 Společné body tečny a modifikované charakteristiky lze stanovit řešenı́m rovnice − 1 − a2 ω 2 = (1 − a2 ω 2 )2 + ω 2 (a1 − a3 ω 2 )2 " # a2 −(a1 − a3 ω 3 ) a22 = + , a1 a2 − 2a3 (1 − a2 ω 2 )2 + ω 2 (a1 − a3 ω 2 )2 a1 a2 − a3 (7.46) jejı́ž úpravou dostaneme kubickou rovnici v ω 2 a32 a23 ω 6 + a22 (a22 − 2a1 a3 )ω 4 + a2 (4a1 a2 a3 − 3a23 − 2a32 )ω 2 + + (a32 − 2a1 a2 a3 + 2a23 ) = 0. (7.47) Obtı́žné řešenı́ lze obejı́t, protože rovnice musı́ mı́t dva stejné kořeny, odpovı́dajı́cı́ bodu dotyku, pro který platı́ ω 2 = 1/a2 . Vydělı́me-li rovnici (7.47) součinem a22 (ω 2 − 1 2 ) = a22 ω 4 − 2a2 ω 2 + 1, a2 (7.48) KAPITOLA 7. ABSOLUTNÍ STABILITA 74 dostaneme vztah a2 a23 ω 2 + a32 − 2a1 a2 a3 + 2a23 = 0. (7.49) Kořeny rovnice (7.47) jsou tedy 2 ω1,2 = 1 a2 ω32 = 2a1 a2 a3 − a32 − 2a23 a2 a23 (7.50) Aby tečna v bodě (X1 , j0) neměla už žádný dalšı́ průsečı́k s modifikovanou frekvenčnı́ charakteristikou, musı́ platit 2a1 a2 a3 < 2a23 + a32 . (7.51) Z podmı́nky je patrno, že Ajzermanova hypotéza platı́ jen pro určité rozdělenı́ kořenů rovnice a3 s3 + a2 s2 + a1 s + 1 = 0. Dalšı́m rozborem lze ukázat, že pro všechny kořeny reálné záporné hypotéza platı́, při jednom reálném kořenu a dvou komplexně sdružených už Ajzermanova hypotéza obecně neplatı́ a je vázána podmı́nkou (7.51). V literatuře jsou odvozeny podmı́nky platnosti hypotézy pro různé typy systémů. Z rozborů je patrno, že nelineárnı́ systém má přı́snějšı́ podmı́nky stability než linearizovaný systém tehdy, má-li přenos lineárnı́ části komplexně sdružené póly s malou reálnou částı́ nebo s velkým modulem. Pak má nelineárnı́ systém většı́ sklon ke kmitánı́ a to zejména v přı́padech, kdy nelinearita má klesajı́cı́ části charakteristiky. Omezı́me-li se na nelinearity s neklesajı́cı́m průběhem, nejsou obvykle podmı́nky stability tak přı́sné. 7.1.3 Transformace pólů a nul Základnı́ Popovovu nerovnost (7.5) lze použı́t i pro systémy, které nesplňujı́ definované podmı́nky. Po zavedenı́ jednoduchých transformacı́ lze řešit např. obvody s nestabilnı́ lineárnı́ částı́, obvody s nelinearitami, které mohou zasahovat i do druhého a čtvrtého kvadrantu apod. Transformace posouvajı́cı́ póly přenosu lineárnı́ části Tuto transformaci můžeme např. použı́t, má-li zadaný systém nelinearitu v sektoru [a, b]. Systém podle obr.7.1 se nezměnı́, zavedeme-li vazby podle obr. 7.6. Výsledný obvod obsahuje novou nelineárnı́ funkci φa (y) = φ(y) − ay, ua = −φa (y). Přenos lineárnı́ části se změnı́ na Ua (s) G(s) = Ga (s) = Y (s) 1 + aG(s) Byla-li zadaná nelinearita v sektoru [a, b], je výsledná v sektoru [0, b − a]. Pokud Ga (s) vyhovuje podmı́nkám věty 7.5, lze Popovova kritéria použı́t pro tento upravený obvod. Je-li nový systém stabilnı́, je stabilnı́ i systém původně zadaný. Transformace tedy vyvolává posunutı́ pólů přenosu lineárnı́ části a změnu sektoru nelineárnı́ charakteristiky. Této techniky lze použı́t i pro vyšetřenı́ stability, je-li v zadaném systému lineárnı́ část nestabilnı́. Lze pomocı́ nı́ také podat důkaz Popovova kritéria pro přı́pad, že G(s) má póly na imaginárnı́ ose. Jestliže lineárnı́ část obvodu má dostatečně velký stupeň stability, můžeme v systému podle obr. 7.6 vytvořit i kladnou vazbu. Lze tak studovat stabilitu systémů, u nichž nelineárnı́ charakteristika zasahuje do 2. a 4. kvadrantu (obr. 7.7). KAPITOLA 7. ABSOLUTNÍ STABILITA 75 Obr. 7.6. Transformace pólů Obr.7.7. Nelinearita ve 2. a 4. kvadrantu Přı́klad 7.4. Pro nelineárnı́ systém s lineárnı́ částı́ G(s) = 1 (s − 1)(s + 2)(s + 3) je třeba stanovit sektor, v němž může ležet stacionárnı́ jednoznačná nelineárnı́ charakteristika, aby uzavřený obvod byl globálně asymptoticky stabilnı́. Protože přenos G(s) je nestabilnı́, použijeme metody transformace pólů. Ga (s) = G(s) 1 = 3 1 + G(s) s + 4s2 + s − 6 + a Pomocı́ Hurwitzova kritéria lze stanovit, že Ga (s) bude stabilnı́ pro 6 < a < 10 (Hurwitzův sektor). Zvolı́me-li a = 6, bude 1 Ga (s) = s(s2 + 4s + 1) na mezi stability. Nynı́ použijeme Popovova kritéria ke stanovenı́ sektoru (0, k], ve kterém může ležet nelinearita, aby systém s lineárnı́m přenosem Ga (s) byl stabilnı́. Zakreslı́me-li G?a (jω), zjistı́me, že k = 4. Zadaný systém s lineárnı́ částı́ G(s) bude tedy stabilnı́, bude-li nelinearita ležet v sektoru (6, 10). Hurwitzův sektor v tomto přı́padě souhlası́ s Popovovým sektorem a platı́ Ajzermanova hypotéza. Transformace posouvajı́cı́ nuly přenosu lineárnı́ části Úkolem této transformace je měnit sektor nelineárnı́ charakteristiky, aniž bychom změnili hodnoty pólů lineárnı́ho členu. V daném nelineárnı́m systému vytvořı́me zpětnou vazbu kolem nelineárnı́ho prvku (obr.7.8). Pak pro výsledný přenos lineárnı́ části Gc (s) a pro výslednou nelinearitu φc platı́ φc = φ(1 + cφ)−1 Gc (s) = G(s) − c Sektor [a, b] nelinearity se transformuje na sektor a b , , 1 + ac 1 + bc tedy např sektor [0, ∞) na [0, 1/c]. u = −φc (y) (7.52) KAPITOLA 7. ABSOLUTNÍ STABILITA 76 Obr. 7.8. Transformace nul 7.1.4 Rozšı́řenı́ Popovova kritéria Základnı́ verze Popovova kritéria byla rozšı́řena mnoha autory na různé složitějšı́ spojité i diskrétnı́ systémy. Již Popov rozpracoval svou metodu i pro obvody s většı́m počtem nelinearit. Kritérium je však vyjádřeno v maticové formě a jeho použitı́ je pracné. Jinı́ autoři uvažovali v nelineárnı́m systému pouze monotonnı́ nelinearity nebo nelinearity s omezenı́m lokálnı́ho sklonu. Jejich výsledky dávajı́ obvykle méně přı́sné podmı́nky stability než Popovovo kritérium, většinou však nelze použı́t jednoduchý grafický test jako u Popova. Pro omezený rozsah skripta nebudeme zde tato kritéria uvádět. Lze je nalézt v některých přehledných textech, např. v [48]. 7.2 Kruhové kritérium Jiný typ kritéria pro nelineárnı́ systém Lurjeho typu (obr.7.1) představuje tzv. kruhové kritérium, které umožňuje určit globálnı́ exponenciálnı́ stabilitu zpětnovazebnı́ch systémů s lineárnı́ částı́ G(s) a s časově variabilnı́mi a nejednoznačnými nelinearitami ležı́cı́mi v sektoru [a, b]. Dále uvedeme pouze jednoduššı́ verzi kritéria pro systém s lineárnı́ částı́ popsanou přenosem G(s) a s jednou zpětnovazebnı́ nelinearitou, která ležı́ v sektoru [a, b]. Symbolem D(a, b) označı́me kruh v komplexnı́ rovině, který má střed na reálné ose a jehož hraničnı́ kružnice procházı́ body −1/a a −1/b. Věta 7.4 (Kruhové kritérium). Uvažujme podle obr.7.1 systém ẋ = Ax + bu, y = cT x, u = −φ(y) při podmı́nkách a) (A, b, c) je minimálnı́ realizace přenosu G(s) b) nelinearita φ ležı́ v sektoru [a, b] a může být časově variantnı́ a nejednoznačná. Systém je globálně exponenciálně stabilnı́, platı́-li některá z těchto podmı́nek: 1) 0 < a < b: frekvenčnı́ charakteristika G(jω) musı́ ležet vně kruhu D(a, b) a musı́ ho obklı́čit ρ krát proti směru hodinových ručiček při ω stoupajı́cı́m od −∞ do ∞; ρ je počet vlastnı́ch čı́sel matice A s kladnou reálnou částı́. 2) 0 = a < b: matice A je Hurwitzova a Re G(jω) + 1/b > 0 pro všechna ω ≥ 0. 3) a < 0 < b: matice A je Hurwitzova, G(jω) ležı́ uvnitř disku D(a, b). 4) a < b ≤ 0: Posuzuje se jako v bodech 1) nebo 2), ale mı́sto G(jω) se uvažuje −G(jω), mı́sto a KAPITOLA 7. ABSOLUTNÍ STABILITA 77 bude −b a mı́sto b bude −a. Poznámka: Hurwitzova matice má všechna vlastnı́ čı́sla se zápornými reálnými částmi. Odvozenı́ kruhového kritéria a jeho rozšı́řenı́ na systémy s většı́m počtem nelinearit lze nalézt např. v [55]. Stejně jako Popovovo kritérium, představuje i kruhové kritérium pouze podmı́nku postačujı́cı́. Kruhové kritérium nahrazuje kritický bod −1/k Nyquistova kritéria kružnicı́, jejı́ž poloměr se zmenšuje, když se zužuje sektor, tj. když b se přibližuje k a. Pro a = b se kružnice změnı́ na kritický bod −1/a = −1/k Nyquistova kritéria. Přı́klad 7.5. Pro nelineárnı́ systém s přenosem lineárnı́ části G(s) = 1 (s − 1)(s + 3)(s + 4) chceme nalézt pomocı́ Popovova a kruhového kritéria sektor, ve kterém může ležet časově proměnná nejednoznačná nelinearita tak, aby uzavřený obvod byl globálně asymptoticky stabilnı́. 1) Pomocı́ transformace pólů zjistı́me, že Ga (s) bude stabilnı́ se zpětnou vazbou 12 < a < 42. Zvolı́me např. a = 12 a protože se jedná o časově proměnnou nelinearitu (q = 0), nakreslı́me frekvenčnı́ charakteristiku Ga (jω). Popovovu přı́mku pro q = 0 můžeme vést bodem (−1/4, 2; j0). Obecná nelinearita může tedy v transformovaném obvodu ležet v sektoru [0; 4, 2], v zadaném systému tedy v sektoru [12; 16, 2]. 2) U kruhového kritéria zakreslı́me přı́mo zadanou frekvenčnı́ charakteristiku G(jω). Ta musı́ ležet vně kružnic se středem na reálné ose. Takových kružnic je ovšem možno zakreslit nekonečně mnoho (obr.7.9). Každá kružnice odpovı́dá určitému sektoru, který závisı́ na dolnı́ hranici a. Např. pro a = 20 je sektor [20; 28, 5]. Je patrno, že každý sektor ležı́ uvnitř Hurwitzova sektoru [12, 42]. Kruhovým kritériem dostáváme tedy pro časově proměnnou nelinearitu obecnějšı́ výsledky než pomocı́ Popovova kritéria. Obr.7.9. Vyšetřenı́ oblastı́ stability pro přı́klad 7.5 Kapitola 8 Stabilita vstup-výstup Teorie stability ve smyslu vstup-výstup byla formulována teprve nedávno. Základnı́ výsledky byly publikovány po roce 1960 a od té doby byly rozvı́jeny v mnoha pracı́ch. Na rozdı́l od dobře známé ljapunovské teorie stability nenı́ však stabilita vstup-výstup zatı́m běžně použı́vána v inženýrské praxi. Je to dáno nejen krátkou dobou jejı́ho rozvoje, ale také tı́m, že tato teorie použı́vá některé relativně náročnějšı́ matematické disciplı́ny, předevšı́m funkcionálnı́ analýzu, která nenı́ pro inženýry zcela běžná. U Ljapunovovy teorie je základnı́m modelem systému soustava diferenciálnı́ch rovnic, které popisujı́ časový vývoj stavových proměnných systému. Ljapunovova teorie se týká ”vnitřnı́” stability systému, tj. chovánı́ stavu při zadané počátečnı́ podmı́nce a při nulovém vstupnı́m signálu. Při analýze stability vstup-výstup je systém zadán zobrazenı́m, které přiřazuje každému vstupu odpovı́dajı́cı́ výstup bez ohledu na počátečnı́ podmı́nky. Systém je tedy reprezentován nějakým operátorem nebo relacı́ a nenı́ třeba znát stavové diferenciálnı́ rovnice. Analýza vstup-výstup může být proto použita i v situacı́ch, kdy nenı́ definován stav systému, rovnovážný stav apod. Např. systémy s rozloženými parametry, dopravnı́m zpožděnı́m aj., se vyšetřujı́ na rozdı́l od Ljapunovovy teorie relativně stejně snadno jako systémy se soustředěnými parametry. U Ljapunovovy teorie se obvykle předpokládá, že systém má jediné řešenı́ při dané počátečnı́ podmı́nce a že toto řešenı́ závisı́ spojitě na počátečnı́m stavu a čase. Stabilita vstup-výstup takový předpoklad nevyžaduje. Představuje koncepci, která předvı́dá kvalitativnı́ chovánı́ zpětnovazebnı́ho systému jen z hrubé informace o prvcı́ch obvodu. Toto pojetı́ vede k robustnosti a motivovalo mnoho nových výzkumů v oblasti modernı́ teorie řı́zenı́. Aby teorie stability vstup-výstup mohla postihnout vliv nejrůznějšı́ch typů vstupnı́ch signálů, je třeba, aby tyto vstupnı́ a podobně i výstupnı́ signály byly definovány dostatečně obecně. To lze dosáhnout zavedenı́m měřitelných funkcı́ a rozšı́řených vektorových prostorů v Lebesgueově smyslu. Vzhledem k tomu, že malý rozsah skripta dovoluje jen stručný úvod do problematiky stability vstupvýstup, uvedeme jen některé základnı́ pojmy, definice stability a bez důkazů některá jednoduchá kritéria. Podrobnějšı́ rozbor problémů a důkazy uvedených vět lze nalézt např. v [53]. Dalšı́ část této kapitoly sleduje převážně výklad, který je uveden podrobně v knize [55]. 8.1 Lebesgueovy prostory a jejich rozšı́řenı́ Necht’ p je reálné čı́slo vyhovujı́cı́ podmı́nce 1 ≤ p < +∞. Označme symbolem Lp [0, ∞) = Lp množinu takových měřitelných funkcı́ f : R+ → R, pro které je Lebesgueův integrál konečný, tj. Z 0 ∞ |f (t)|p dt < ∞. (8.1) Množina L∞ [0, ∞) = L∞ je tvořena všemi měřitelnými funkcemi f , které jsou esenciálně ohraničené na intervalu [0, ∞) (tj. ohraničené skoro všude s výjimkou množiny mı́ry nula). 78 KAPITOLA 8. STABILITA VSTUP-VÝSTUP 79 Poznámka. Měřitelné funkce můžeme definovat samozřejmě na nějaké obecnějšı́ množině Ω, avšak vzhledem k tomu, že v našich aplikacı́ch budou funkce závislé na čase, uvažujeme již zjednodušenı́ na interval [0, ∞). Definujeme-li dále součet dvou funkcı́ f (t) a g(t) jako funkci h(t) = f (t) + g(t) a λ-násobek funkce f jako h(t) = λf (t), pak množina Lp je vektorovým prostorem a nazývá se Lebesgueův prostor Lp . Prostor Lp je prostor funkcı́ integrovatelných v p-té mocnině, zatı́mco L∞ je množina esenciálně ohraničených měřitelných funkcı́. Prostor L1 je prostor funkcı́ integrovatelných v Lebesgueově smyslu, prostor L2 je prostor funkcı́ integrovatelných s kvadrátem (kvadraticky integrovatelných). Přı́klad 8.1. Funkce f (t) = e−at , a > 0 patřı́ do Lp pro všechna p ∈ [1, ∞]. Funkce f (t) = 1/(t + 1) patřı́ do Lp pro všechna p > 1, ale ne do L1 . Lebesgueův prostor můžeme normovat zavedenı́m tzv. p-normy ||f ||p . Pro p ∈ [1, ∞) je norma ||f ||p : Lp → R+ definována vztahem ||f ||p = Z 0 ∞ p |f (t)| dt 1/p . (8.2) Podobně je definována norma ||f ||∞ : L∞ → R+ jako ||f ||∞ = ess.sup |f (t)|, (8.3) tj. supremum na definičnı́ množině kromě množiny mı́ry nula. Norma ||f ||∞ je užitečná, jsou-li u systému kladeny omezujı́cı́ podmı́nky na amplitudu signálů, 2-norma je zajı́mavá při omezenı́ na energii systému. Zavedenı́m normy pak tvořı́ pár (Lp , ||f ||p ) pro každé p ∈ [1, ∞] normovaný lineárnı́ prostor, který představuje přirozenou definici množiny všech ohraničených signálů. Pro dalšı́ úvahy nenı́ třeba podrobnějšı́ch znalostı́ z teorie mı́ry a měřitelnosti funkcı́ a můžeme pro zjednodušenı́ předpokládat, že dále použı́vané funkce budou většinou po úsecı́ch spojité. Podrobnějšı́ znalosti Lebesgueových prostorů jsou potřebné pro určovánı́ existence a jednoznačnosti řešenı́ a pro vedenı́ důkazů, které při omezeném rozsahu textu stejně nemůžeme uvádět. Praktické problémy stability vstup-výstup vyžadujı́ pracovat i s neohraničenými signály a proto budeme definovat rozšı́řené Lp -prostory pro tzv. ”zkrácené” funkce fT . Pro zadanou funkci f : R+ → R a pro každé T ∈ R+ je funkce fT : R+ → R definována vztahy fT (t) = ( f (t) 0 ≤ t ≤ T 0 t>T (8.4) Funkce fT představuje zkrácenı́ funkce f na interval [0, T ]. Rozšı́řený prostor Lpe obsahuje všechny měřitelné funkce f : R+ → R, pro které platı́ fT ∈ Lp pro všechna konečná T . Každá zkrácená funkce fT odpovı́dajı́cı́ původnı́ funkci f patřı́ tedy do Lp , ačkoliv sama funkce f může, ale nemusı́ patřit do Lp . Množina Lp je tedy podmnožinou Lpe . Množina Lp je normovaný prostor, Lpe nikoliv. Např. f (t) = t nepatřı́ do žádného prostoru Lp . Pro každé konečné T však funkce fT patřı́ do všech prostorů Lp pro p ∈ [1, ∞]. Proto f (t) = t patřı́ do prostoru Lpe pro každé p ∈ [1, ∞]. Kauzalita. Označme f vstupnı́ signál systému, reprezentovaného nějakým zobrazenı́m A a Af jeho výstup. Kauzálnı́ systém je takový systém, u něhož hodnota výstupu v čase t závisı́ pouze na hodnotách vstupu až do času t. Definice 8.1. Zobrazenı́ A se nazývá kauzálnı́, jestliže (Af )T = (AfT )T ∀T ≥0 ∀ f ∈ Lpe . (8.5) KAPITOLA 8. STABILITA VSTUP-VÝSTUP 80 U kauzálnı́ho systému hodnoty výstupu (Af )(t) na intervalu [0, T ] závisejı́ pouze na hodnotách f (t) na [0, T ]. Budou-li dvě vstupnı́ funkce stejné na intervalu [0, T ], budou odpovı́dajı́cı́ výstupy také stejné na [0, T ]. Zobecněné funkce Definice 8.2. Symbolem A označı́me množinu zobecněných funkcı́ (distribucı́) f (t), pro které je f (t) = 0 pro t < 0 a f (t) = ∞ X fi δ(t − ti ) + fa (t) pro t ≥ 0, 0 ≤ t0 < t1 < ..., (8.6) i=0 kde δ(t − ti ) označuje jednotkovou delta distribuci (Diracův impuls), a fa (t) je měřitelná funkce. Dále platı́ ∞ X |fi | < ∞ Z a ∞ 0 i=0 |fa (t)|dt < ∞. (8.7) Norma ||f ||A distribuce v A je definována vztahem ||f ||A = ∞ X |fi | + Z i=0 ∞ 0 |fa (t)|dt. (8.8) Množina A se tedy skládá z distribucı́, které jsou tvořeny součtem zpožděných impulsů, a měřitelné funkce, která je absolutně integrovatelná. Množinu A lze považovat za Lebesgueův prostor L1 [0, ∞) zvětšený o zpožděné impulsy. Předpokládejme, že f ∈ A. Pokud Re s ≥ 0, konverguje integrál F (s) = Z ∞ f (t)e−st dt = 0 ∞ X fi e−sti + Fa (s). (8.9) i=0 Na všechny prvky množiny A lze pak použı́t Laplaceovu transformaci a jejı́ oblast konvergence je uzavřená pravá komplexnı́ polorovina. Definice 8.3. Symbolem Â označı́me množinu všech funkcı́ F (s), které jsou Laplaceovou transformacı́ prvků množiny A. Věta 8.1. Necht’ F (s) je racionálnı́ lomená funkce proměnné s. Pak F (s) ∈ Â právě tehdy, když všechny póly F (s) majı́ záporné reálné části a F (s) je ryzı́, tj. stupeň polynomu v čitateli je menšı́ nebo rovný stupni polynomu ve jmenovateli přenosu. 8.2 Definice stability vstup-výstup U Ljapunovovy teorie stability se obvykle předpokládá, že soustava diferenciálnı́ch rovnic systému má jediné řešenı́ při dané počátečnı́ podmı́nce a že toto řešenı́ závisı́ spojitě na počátečnı́m stavu a čase. Stabilita vstup-výstup takový předpoklad nevyžaduje. Lze pracovat např. i s nejednoznačnými zobrazenı́mi, které k určitému vstupu x přiřazujı́ vı́ce hodnot y. Proto se stabilita vstup-výstup definuje obvykle obecněji pomocı́ relacı́, i když v praktických problémech stačı́ velmi často definice pomocı́ operátorů. Jestliže je např. H operátor z množiny X do Y , pak pro každé x ∈ X existuje jediné y ∈ Y takové, že y = Hx. Jestliže však H je relace nemusı́ tomu tak být. Např. binárnı́ relace R na nějaké množině X je podmnožina z X × X. Pro určité x ∈ X může existovat jediné y ∈ X při platnosti (x, y) ∈ R. V jiném přı́padě však pro x ∈ X nemusı́ existovat žádné takové y, že platı́ (x, y) ∈ R, nebo KAPITOLA 8. STABILITA VSTUP-VÝSTUP 81 může naopak existovat libovolně mnoho hodnot y ∈ X takových, že (x, y) ∈ R. Pojetı́ relace je tedy obecnějšı́. Definice 8.4. Předpokládejme, že relace R je binárnı́ relace na Lpe . Pak a) R je Lp -stabilnı́, jestliže (x, y) ∈ R, x ∈ Lp ⇒ y ∈ Lp . b) Relace R je Lp -stabilnı́ s konečným zesı́lenı́m, jestliže je Lp -stabilnı́ a existujı́ takové konstanty γp < ∞, bp < ∞, že platı́ (x, y) ∈ R, x ∈ Lp ⇒ ||y||p ≤ γp ||x||p + bp . (8.10) c) Relace R je Lp -stabilnı́ s konečným zesı́lenı́m a nulovým vychýlenı́m, jestliže je Lp -stabilnı́ a existuje taková konstanta γp < ∞, že platı́ (x, y) ∈ R, x ∈ Lp ⇒ ||y||p ≤ γp ||x||p . (8.11) Poznámka. V dále uvedených větách o stabilitě vstup-výstup budeme mluvit zjednodušeně jen o Lp stabilitě a pokud nebude uvedeno jinak, budeme mı́t na mysli typ Lp stability s konečným zesı́lenı́m a nulovým vychýlenı́m. Necht’ je např. x ≡ u vstup dynamického systému popsaného vztahem y = Gu, kde G je operátor nebo relace. Splňuje-li vstupně-výstupnı́ pár (u, y) vztah y = Gu a je-li vstup ohraničen ve smyslu nějaké Lp normy, je stejně ohraničen i výstup. Navı́c existuje ohraničený poměr výstupnı́ normy ke vstupnı́ normě. To je běžné pojetı́ stability ve smyslu ohraničený vstup-ohraničený výstup, rozšı́řený ovšem na obecnějšı́ normy vstupů a výstupů. Poznámka. V jednoduššı́m pojetı́ stability vstup-výstup, kdy se nepracuje s Lebesgueovými prostory a normami, můžeme definovat stabilitu ohraničený vstup-ohraničený výstup mnohem jednodušeji, nemůžeme ale uvažovat speciálnı́ vstupnı́ funkce a některé složité typy dynamických systémů. V tomto zjednodušeném pojetı́ se stabilita definuje obvykle takto: Definice 8.5. Dynamický systém ẋ = f (t, x, u), y = g(t, x, u) je stabilnı́ ve smyslu ohraničený vstupohraničený výstup, jestliže každý ohraničený vstup dává ohraničený výstup bez ohledu na počátečnı́ stav. To znamená, že pro ||u(t)|| < M a t ≥ t0 existuje takové kladné N , které může záviset na x0 a u, že ||g[t, x(t; t0 , x0 ), u(t)]|| < N pro t ≥ t0 . Stabilita vstup-výstup lineárnı́ho systému Uvažujme lineárnı́ systém definovaný rovnicemi ẋ = Ax + Bu y = Cx + Du, (8.12) kde A, B, C, D jsou konstantnı́ matice, x ∈ Rn , y ∈ Rm , u ∈ Rr . Věta 8.2. Předpokládejme, že systém (8.12) je řiditelný a pozorovatelný. Pak je L∞ -stabilnı́ právě tehdy, když přı́slušný nebuzený systém ẋ = Ax je asymptoticky stabilnı́. Každý lineárnı́ systém, který může být reprezentován racionálnı́ přenosovou funkcı́ G(s) je Lp stabilnı́ s konečným zesı́lenı́m právě tehdy, když všechny póly jeho přenosu majı́ záporné reálné části. Pro praxi je výhodná 2-norma, která souvisı́ podle Parsevalova teorému Z 0 ∞ |g(t)|2 dt = 1 2π Z ∞ −∞ |G(jω)|2 dω s energiı́ signálu. Systém s jednı́m vstupem a jednı́m výstupem, který je L2 -stabilnı́ s konečným zesı́lenı́m, má koeficient γ2 = supω |G(jω)|. Jestliže Nyquistova křivka stabilnı́ho přenosu ležı́ celá KAPITOLA 8. STABILITA VSTUP-VÝSTUP 82 uvnitř kružnice o poloměru γ2 se středem v počátku, pak zesı́lenı́ systému podle 2-normy je menšı́ nebo rovno γ2 . 8.3 Stabilita zpětnovazebnı́ch systémů V předchozı́m článku jsme uvedli definice stability dynamického systému popsaného operátorem nebo relacı́. Hlavnı́m objektem studia stability vstup-výstup jsou však propojené dynamické systémy, jako je např. zpětnovazebnı́ systém podle obr. 8.1. Ten lze popsat rovnicemi e1 = u1 − y2 e2 = u2 + y1 y1 = G1 e1 y2 = G2 e2 , (8.13) kde G1 a G2 jsou relace nebo operátory zobrazujı́cı́ vhodný vstupnı́ prostor na výstupnı́ prostor. Systém lze zapsat ve tvaru " e1 e2 # = " u1 u2 # − " 0 I −I 0 #" y1 y2 # " y1 y2 # = " G1 0 0 G2 #" e1 e2 # , (8.14) kde všechny veličiny ei , ui , yi mohou být skaláry (systémy s jednı́m vstupem a výstupem, SISO) nebo vektory (systémy s vı́ce vstupy a výstupy, MIMO). V literatuře byly studovány předevšı́m dva přı́stupy k problému stability zpětnovazebnı́ch systémů. Je to stabilita při malém zesı́lenı́, kdy lze určit Lp -stabilitu pro všechny hodnoty p ∈ [1, ∞], a stabilita založená na principu pasivity systémů, kdy lze určit L2 -stabilitu. Prvnı́ přı́stup vede na kruhové kritérium, druhý na Popovovo kritérium. Obr.8.1. Zpětnovazebnı́ systém 8.3.1 Stabilita při malém zesı́lenı́ Věta 8.3. Uvažujme zpětnovazebnı́ systém podle obr.8.1 a předpokládejme, že je specifikováno nějaké p ∈ [1, ∞], že G1 i G2 jsou kauzálnı́ a Lp -stabilnı́ ve smyslu definice 8.4, a γ1p = γp (G1 ), γ2p = γp (G2 ). Pak je systém dle obr. 8.1 Lp -stabilnı́, jestliže γ1p γ2p < 1. (8.15) Vztah (8.15) se nazývá podmı́nka malého zesı́lenı́. (Důkaz věty lze nalézt v [55]). Předpokládáme-li tedy podle obr. 8.1 dva individuálně Lp -stabilnı́ subsystémy, jejichž zesı́lenı́ jsou nejvýše rovna γ1p a γ2p , pak uzavřený obvod je Lp -stabilnı́, jestliže součin zesı́lenı́ je menšı́ než jedna. Uvedenou větu lze použı́t pro studium stability pro všechny hodnoty p ∈ [1, ∞]. Přı́klad 8.2. Uvažujme obvod dle obr. 8.1, kde v přı́mé větvi je lineárnı́ časově invariantnı́ systém KAPITOLA 8. STABILITA VSTUP-VÝSTUP 83 s jednı́m vstupem a jednı́m výstupem a s přenosem G(jω) ∈ Â. Zpětnovazebnı́ prvek je statická jednoznačná časově variantnı́ nelinearita φ(t, x), která ležı́ v sektoru [−k, k]. Srovnánı́m s větou 8.3 je G1 = G(jω), G2 = φ. Necht’ p = 2; pak G1 a G2 jsou kauzálnı́ a L2 -stabilnı́. Dále je γ1 (G1 ) = sup |G(jω)|, ω γ2 (G2 ) ≤ k. Uzavřený systém je L2 -stabilnı́, platı́-li sup |G(jω)| k < 1 ω Poznámka: Pomocı́ vhodné transformace lze značně rozšı́řit oblast použitı́ věty 8.3. Např. při transformaci, která je analogická transformaci pólů v odst. 7.1.3, zavedeme přı́davný Lp -stabilnı́ lineárnı́ operátor K, který přičteme ke G2 a současně odečteme. Blokovými manipulacemi pak dostaneme systém podle obr. 8.2. Operátor K nynı́ působı́ jako zpětná vazba kolem G1 a paralelnı́ vazba ke G2 . Prvnı́ vnějšı́ vstup se změnı́ z u1 na u1 − Ku2 . Pak platı́ věta: Obr. 8.2. Transformace pólú Věta 8.4. Uvažujme systém podle obr. 8.2 a předpokládejme, že je specifikováno p ∈ [1, ∞], G2 je kauzálnı́ a Lp -stabilnı́. Pak celý uzavřený systém je Lp -stabilnı́, existuje-li takový Lp -stabilnı́ kauzálnı́ lineárnı́ operátor K, že platı́ a) G1 (I + KG1 )−1 je kauzálnı́ a Lp -stabilnı́ b) γp [G1 (I + KG1 )−1 ] . γp (G2 − K) < 1. (Důkaz je uveden např. v [55], s. 341). Spojenı́m věty 8.4 s Nyquistovým kritériem stability zı́skáme kruhové kritérium známé z čl. 7.2, které je ovšem nynı́ použitelné pro určenı́ stability vstup-výstup a pro obecnějšı́ typy lineárnı́ části obvodu než byly uvažovány v čl. 7.2, např. pro distribuované systémy, systémy s dopravnı́m zpožděnı́m apod. Věta 8.5. (Kruhové kritérium). Uvažujme systém podle obr. 8.1, kde ve zpětné vazbě je jednoznačná, obecně časově variantnı́ nelinearita φ patřı́cı́ do sektoru [a, b] a v přı́mé větvi je lineárnı́ systém s přenosem G(s) = Ga (s) + Gr (s). Gr (s) je racionálnı́ a striktně ryzı́, Ga (s) ∈ Â a existuje takové T > 0, že ga (t) = ∞ X gi δ(t − iT ) + gm (t) gm ∈ L1 i=0 Ga (s) = ∞ X i=0 gi e−sti + Gm (s) ti = iT. (8.16) KAPITOLA 8. STABILITA VSTUP-VÝSTUP 84 Za těchto předpokladů je zpětnovazebnı́ systém L2 -stabilnı́, je-li splněna některá z těchto podmı́nek: 1) ab > 0: Frekvenčnı́ charakteristika G(jω) = Ga (jω) + Gr (jω) musı́ ležet vně kruhu D(a, b); (G(jω) je konformnı́ zobrazenı́ imaginárnı́ osy při pohybu ω od −∞ do ∞ s půlkruhovým oběhem všech čistě imaginárnı́ch pólů). Jestliže ρ je počet pólů G(s) s kladnou reálnou částı́, pak lim {Arg[G(j2πn/T ) − z] − Arg[G(−j2πn/T ) − z]} = 2πρ, n→∞ ∀z ∈ D(a, b). (8.17) 2) 0 = a < b: G(s) ∈ Â a inf ω∈R ReG(jω) + 1/b > 0. 3) a < 0 < b: G(s) ∈ Â a G(jω) ležı́ uvnitř kruhu D(a, b). Důkaz věty je v [55], s.345. Věta dává postačujı́cı́ podmı́nky pro L2 -stabilitu. Poznámka: Ve výrazu (8.16) předpokládáme, že impulsy gap (t) = ∞ i=0 gi δ(t − iT ) v distribučnı́ části funkce ga (t) jsou zpožděné o stejný časový interval ti = iT, T > 0. Jejich transformace P Gap (jω) = ∞ X gi e−jωT i i=0 je periodickou funkcı́ s periodou 2π/T . Obsahuje-li G(jω) tyto impulsy, nemusı́ mı́t fázový úhel specifickou limitu, jestliže ω → ∞. Proto je třeba fázový úhel vyhodnocovat podle vztahu (8.17) při speciálně vybraných frekvencı́ch 2πn/T = nω. (Podrobnosti viz [55]). Jestliže ve vztahu (8.16) pro ga (t) nejsou zpožděné impulsy, což je nejčastějšı́ přı́pad v praktických úlohách, pak podmı́nka (8.17) ve větě 8.5 se změnı́ na jednoduššı́ podmı́nku, která odpovı́dá podmı́nce 1) věty 7.4 o kruhovém kritériu. Frekvenčnı́ charakteristika G(jω) musı́ ležet vně kruhu D(a, b) a musı́ jej obklı́čit ρ krát proti směru hodinových ručiček při ω stoupajı́cı́m od −∞ do +∞. 8.3.2 Přı́stup pomocı́ pasivity Tı́mto přı́stupem lze odvodit rozšı́řené Popovovo kritérium pro stabilitu vstup-výstup. Na rozdı́l od stability při malém zesı́lenı́ (odst. 8.3.1), kdy lze určit Lp -stabilitu pro všechna p ∈ [1, ∞], umožňuje přı́stup pomocı́ pasivity analyzovat převážně jen L2 -stabilitu (některé práce analyzujı́ tı́mto přı́stupem také L∞ -stabilitu). Jestliže všechny Lp -prostory jsou Banachovy prostory, je prostor L2 Hilbertův prostor se skalárnı́m (vnitřnı́m) součinem dvou funkcı́ f, g ∈ L2 (f, g) = Z ∞ f (t)g(t)dt. (8.18) 0 Analogicky pro f, g ∈ L2e definujeme zkrácený skalárnı́ součin (f, g)T = Z T f (t)g(t)dt. (8.19) 0 Věta 8.6. Uvažujme systém podle obr. 8.1. Předpokládejme, že existujı́ takové konstanty εi , δi , i = 1, 2, že (x, Gi x) ≥ εi ||x||2T 2 + δi ||Gi x||2T 2 , ∀T ≥ 0, ∀x ∈ L2e , i = 1, 2. (8.20) Systém je L2 -stabilnı́, jestliže δ1 + ε2 > 0, δ2 + ε1 > 0. (8.21) Důkaz v [55], s.350. V kap. 6 jsme definovali různé pojmy týkajı́cı́ se pasivity a disipativity systémů. Rozšı́řı́me nynı́ tyto pojmy na Lebesgueovy prostory. KAPITOLA 8. STABILITA VSTUP-VÝSTUP 85 Definice 8.6. Operátor G : L2e → L2e je pasivnı́, jestliže (x, Gx)T ≥ 0 ∀ T ≥ 0, ∀ x ∈ L2e (8.22) a striktně pasivnı́, existuje-li taková konstanta ε > 0, že (x, Gx)T ≥ ε ||x||2T 2 , ∀ T ≥ 0, ∀ x ∈ L2e . (8.23) Věta 8.7. Systém podle obr. 8.1 je L2 -stabilnı́, jestliže G1 i G2 jsou striktně pasivnı́. Důkaz: V tomto přı́padě je podle (8.20) δ1 = δ2 = 0. Protože ε1 > 0, ε2 > 0, platı́ (8.21). Věta 8.8. Systém podle obr. 8.1 je L2 -stabilnı́, jestliže je bud’ G1 striktně pasivnı́ s konečným zesı́lenı́m a G2 je pasivnı́, nebo G2 je striktně pasivnı́ s konečným zesı́lenı́m a G1 je pasivnı́. (Důkaz v [55]). Dalšı́m rozvojem těchto úvah lze zı́skat rozšı́řenou verzi Popovova kritéria (čl. 7.1) platnou pro stabilitu vstup-výstup. Protože Popovovo kritérium se pro SISO systémy snadno ověřuje graficky i pro vysoký řád lineárnı́ části systému, představuje velmi užitečný nástroj pro praktické určenı́ stability vstup-výstup. Věta 8.9 (Popovovo kritérium). Uvažujme systém podle obr. 8.1, kde v přı́mé větvi je lineárnı́ člen, pro který platı́: g(t) má distribučnı́ derivaci a g(t), ġ(t) ∈ A. Ve zpětné vazbě obvodu je jednoznačná časově invariantnı́ spojitá nelinearita φ : R → R, která patřı́ do sektoru [0, b], kde b může být nekonečně velké. Předpokládejme, že existuje taková konstanta q ≥ 0, že inf Re[(1 + jωq)G(jω)] + ω∈R 1 > 0. b (8.24) Pak funkce e1 , e2 , y1 , y2 patřı́ do L2 , jestliže u1 , u2 , u̇2 patřı́ do L2 . Důkaz kritéria a podrobný rozbor lze nalézt v [55]. V této kapitole byly vzhledem k omezenému rozsahu skripta uvedeny jen základnı́ problémy stability vstup-výstup a některá jednoduchá kritéria vhodná k praktickému ověřovánı́ stability. Podrobný rozbor těchto problémů je uveden zejména v [53] a [55]. Rozšı́řenı́ na diskrétnı́ systémy lze nalézt v [55], použitı́ pro mnoharozměrové a složité systémy je souhrnně podáno v [47] a [53]. Využitı́ principů pasivity a disipativity lze nalézt v pracı́ch [47,55]. Kapitola 9 Nelineárnı́ diskrétnı́ systémy V předchozı́ch kapitolách jsme popisovali základnı́ vlastnosti nelineárnı́ch spojitých systémů a zabývali jsme se předevšı́m rovnovážnými stavy a jejich stabilitou. V této kapitole rozšı́řı́me dosavadnı́ úvahy na diskrétnı́ systémy, které jsou v regulačnı́ technice velmi důležité vzhledem k využitı́ čı́slicových počı́tačů pro řı́zenı́. Diskrétnı́ systémy (systémy s diskrétnı́m časem), jsou popsány diferenčnı́mi rovnicemi, obecně nelineárnı́ soustavou rovnic prvnı́ho řádu x(k + 1) = f [k, x(k), u(k)] (9.1) y(k) = g[k, x(k), u(k)], (9.2) kde x(k) je stavový vektor, u(k) vstupnı́ vektor, k = 0, 1, 2, ... (k ∈ N0 ), x ∈ Rn a f : Rn → Rn (častěji f : M ⊂ Rn → Rn ) je C 1 nelineárnı́ funkce. Poznámka: V dalšı́ch úvahách budeme použı́vat označenı́ N pro množinu všech kladných celých čı́sel, N0 pro množinu všech nezáporných celých čı́sel a Z pro množinu všech celých čı́sel. Diskrétnı́ systém (9.1) vzniká různým způsobem, např. a) modelovánı́m fyzikálnı́ch diskrétnı́ch systémů, např. impulsnı́ch a logických obvodů, modelovánı́m biologických systémů (např. sledovánı́m počtu individuı́ xk určité populace v k-té generaci) apod. b) vzorkovánı́m spojitých systémů ve vhodných časových okamžicı́ch tk , např. při řı́zenı́ pomocı́ čı́slicových počı́tačů; c) u ekonomických modelů popisem stavu systému v diskrétnı́ch časových intervalech (dnech, měsı́cı́ch, rocı́ch); d) sledovánı́m následných průchodů x0 , x1 , x2 , ... trajektorie periodického průběhu množinou o nižšı́ dimenzi (tzv. Poincaréovo zobrazenı́ - viz kap.10); e) při použitı́ diskrétnı́ch algoritmů u numerických metod apod. V dalšı́ch úvahách zavedeme pro jednoduchost zápisu mı́sto x(k), y(k), u(k) označenı́ xk , y k , uk . Nebudeme použı́vat výstupnı́ rovnici (9.2) a omezı́me se většinou na autonomnı́, tj. volné a časově invariantnı́ systémy xk+1 = f (xk ), k ∈ N0 x(0) = x0 . (9.3) Rekurzivnı́ vztah nám na rozdı́l od systémů se spojitým časem umožňuje u diskrétnı́ho systému hledat řešenı́ postupným aplikovánı́m funkce f . Zı́skáme tak diskrétnı́ množinu {xk }∞ 0 x0 , x1 = f (x0 ), x2 = f (x1 ) = f (f (x0 )) = f 2 (x0 ), ... s počátečnı́m stavem x0 . Trajektorie je tedy diskrétnı́ množina bodů ve fázovém prostoru Rn . Analogie toku Φt diferenciálnı́ch rovnic je dána složeným zobrazenı́m f k , kde f k = f ◦ f ◦ f ... ◦ f 86 (k - krát) KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY 87 je k-tá iterace zobrazenı́ f a platı́ f k = f ◦ f k−1 , f 0 = 1. Jestliže f je regulárnı́ zobrazenı́ třı́dy C r a existuje regulárnı́ inverznı́ zobrazenı́ f −1 rovněž třı́dy C r , pak f je C r -difeomorfismus. V matematických modelech reálných systémů však často f nemá inverzi (endomorfismus) a trajektorie je definována jen v kladném směru času. Řı́káme také, že dynamický systém je polodeterminován. Později uvidı́me, že neinvertovatelnost zobrazenı́ f je např. u jednorozměrného systému nutným předpokladem pro existenci chaotického chovánı́. V dalšı́ch úvahách této kapitoly budeme předpokládat, že zobrazenı́ f je difeomorfismus. Definice 9.1. Necht’ f : Rn → Rn a x0 ∈ Rn . Množina Of (x0 ) = {f k (x0 ), k ∈ Z} se nazývá orbita (trajektorie) difeomorfismu f , procházejı́cı́ bodem x0 . Množina Of+ (x0 ) = {f k (x0 ), k ∈ N } Of− (x0 ) = {f −k (x0 ), k ∈ N } resp. se nazývá kladná, resp. záporná orbita difeomorfismu f , procházejı́cı́ bodem x0 . Definice 9.2. Bod x ∈ Rn , pro který platı́ f (x) = x, se nazývá rovnovážný stav diskrétnı́ho systému (9.3) nebo pevný bod zobrazenı́ f . p Definice 9.3. Množina bodů {xk }p−1 k=0 se nazývá periodická orbita periody p, platı́-li f (x0 ) = x0 k a f (x0 ) 6= x0 pro k = 1, 2, ..., p − 1. Všechny body periodické orbity γ s periodou p jsou pevnými body složeného zobrazenı́ (difeomorfismu) f p , tj. f p (x) = x pro všechna x ∈ γ. Každý pevný bod f je periodickým bodem s periodou jedna. 9.1 Definice stability autonomnı́ho diskrétnı́ho systému Protože všechny dalšı́ úvahy jsou analogické jako u systémů se spojitým časem, uvedeme jen základnı́ definice stability pro autonomnı́ systémy (9.3). Všechny ostatnı́ definice z kap.3 lze snadno transformovat pro diskrétnı́ systém, nahradı́me-li časy t a t0 symboly k a k0 . Definice 9.4.. Rovnovážný stav x systému (9.3) je (ljapunovsky) stabilnı́, jestliže pro každé ε > 0 existuje δ = δ(ε) takové, že ||x0 − x|| < δ(ε) ⇒ ||xk − x|| < ε ∀k ∈ N. Stav x je asymptoticky stabilnı́, je-li ljapunovsky stabilnı́ a existuje takové okolı́ U , že pro všechna x0 ∈ U je lim ||xk − x|| = 0. k→∞ Definice 9.5. Periodická orbita γ periody p je stabilnı́ (resp. asymptoticky stabilnı́), když bod x ∈ γ je stabilnı́m (resp. asymptoticky stabilnı́m) pevným bodem zobrazenı́ f p . 9.2 Vyšetřenı́ stability pevných bodů metodou linearizace Věta 9.1. Necht’ x je pevný bod iteračnı́ho zobrazenı́ xk+1 = f (xk ), f : M ⊂ Rn → Rn je alespoň třı́dy C 1 a λ1 , ..., λn jsou vlastnı́ čı́sla Jacobiovy matice linearizace kolem pevného bodu ∂f A = Df (x) = ∂x x=x Pak platı́: KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY 88 a) jestliže |λi | < 1 ∀i = 1, ..., n, je x lokálně asymptoticky stabilnı́; b) jestliže |λi | > 1 alespoň pro jedno i ∈ {1, ..., n} , je x nestabilnı́; c) jestliže |λi | = 1, nelze stabilitu pomocı́ linearizace určit. Podmı́nky věty vyplývajı́ z podmı́nek stability lineárnı́ch diskrétnı́ch systémů, které byly odvozeny v teorii lineárnı́ch řı́dı́cı́ch systémů. Definice 9.6. Pevný bod x je hyperbolický, nemá-li matice linearizace vlastnı́ čı́sla |λi | = 1. Difeomorfismus je v okolı́ svého hyperbolického pevného bodu strukturálně stabilnı́. Poznámka: Stabilitu periodické orbity γ vyšetřı́me, určı́me-li stabilitu pevného bodu difeomorfismu f p . O stabilitě orbity γ rozhodujı́ tedy vlastnı́ čı́sla matice A = {∂fip /∂xj } pro libovolný bod orbity. Přı́klad 9.1. Nelineárnı́ systém 1. řádu. U jednodimenzionálnı́ho systému xk+1 = f (xk ) f :R→R (často f : M ⊂ R → R) je možno trajektorii snadno zkonstruovat graficky. Do souřadnic (x, f (x)) zakreslı́me danou funkci f (x) a přı́mku y = x (obr 9.1). K počátečnı́mu stavu x0 je grafem dána hodnota x1 , vodorovná přı́mka odtud vedená protne přı́mku y = x v bodě, který má prvnı́ souřadnici rovněž x1 , na svislici určı́me x2 atd. Pevné body x = f (x) jsou dány průsečı́ky přı́mky y = x s grafem funkce f . V našem přı́padě podle obr. 9.1 jsou dva pevné body x(1) = 0 a x(2) = a. Stabilitu udává u 1. řádu přı́mo derivace funkce f v pevném bodě. Pro x(1) = 0 je |f 0 (0)| > 1 a pevný bod je nestabilnı́. Pro x(2) = a může být |f 0 (a)| < 1 (pevný bod je stabilnı́) nebo |f 0 (a)| > 1 a pak je pevný bod nestabilnı́. Je-li přitom f 0 (x) > 0 je průběh řešenı́ monotonnı́, pro f 0 (x) < 0 je oscilačnı́ (dokažte !). Dalšı́ přı́klady diskrétnı́ch systémů 1. řádu budou uvedeny v kapitole o chaosu (kap. 12). Obr.9.1. Nelineárnı́ funkce jedné proměnné. Přı́klad 9.2. Lineárnı́ diskrétnı́ systém 2. řádu. Diskrétnı́ lineárnı́ systém xk+1 = xk + yk (mod 1) yk+1 = xk + 2yk (mod 1) je definován na polootevřeném jednotkovém čtverci M = [0, 1)2 . (Abychom nemuseli použı́vat dvojı́ indexovánı́, zavedli jsme pro proměnné označenı́ x, y). Pevný bod (x, y) = (0, 0). Charakteristická rovnice λ2 − 3λ + 1 = 0 má kořeny λ1 = 2, 62 > 1 a λ2 = 0, 38 < 1. Pevný bod je nestabilnı́ sedlo. Podobně jako u systémů se spojitým časem můžeme i u diskrétnı́ch systémů definovat invariantnı́ podprostory pro lineárnı́ systémy a invariantnı́ lokálnı́ a globálnı́ variety pro nelineárnı́ systémy. U lineárnı́ch diskrétnı́ch systémů je stabilnı́ podprostor E s (resp. nestabilnı́ podprostor E u , resp. centrálnı́ podprostor E c ) vytvořen vlastnı́mi vektory odpovı́dajı́cı́mi vlastnı́m čı́slům, jejichž modul je menšı́ než 1 (resp. většı́ než 1, resp. roven 1). Pro nelineárnı́ diskrétnı́ systémy platı́ podobná věta jako věta (4.13) pro systémy se spojitým časem. KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY 89 Věta 9.2. Necht’ f : Rn → Rn je C 1 -difeomorfismus s hyperbolickým pevným bodem x. Pak s (x) a lokálnı́ nestabilnı́ varieta W u (x), které se dotýkajı́ v bodě x existujı́ lokálnı́ stabilnı́ varieta Wloc loc s lineárnı́ch podprostorů E (x) a E u (x) matice linearizace Df a majı́ odpovı́dajı́cı́ dimenze a stejnou hladkost jako zobrazenı́ f . Podobně jako u spojitých systémů jsou definovány i u diskrétnı́ch systémů globálnı́ stabilnı́ a nestabilnı́ variety, které jsou vytvořeny sjednocenı́m lokálnı́ch variet. Na rozdı́l od dynamických systémů se spojitým časem, u nichž globálnı́ W s a W u jsou vytvořeny sjednocenı́m hladkých křivek, jsou u diskrétnı́ch systémů W s a W u dány sjednocenı́m různých diskrétnı́ch posloupnostı́ bodů xk , jejichž globálnı́ průnik může být velmi složitý. U nehyperbolických pevných bodů vzniká také centrálnı́ varieta W c , které lze využı́t (obdobně jako u systémů se spojitým časem) pro určenı́ stability x, má-li matice A vlastnı́ čı́sla na jednotkové kružnici. 9.3 Vyšetřenı́ stability pomocı́ přı́mé Ljapunovovy metody Ljapunovovy věty o stabilitě a nestabilitě z kap.5 lze upravit také pro diskrétnı́ systémy. Derivaci Ljapunovovy funkce podél řešenı́ systému (9.3) nahradı́me diferencı́ ∆V (xk ) = V (xk+1 ) − V (xk ) = V (f (xk )) − V (xk ) (9.4) Věta 9.3. Předpokládejme, že diskrétnı́ systém (9.3) má rovnovážný stav v bodě 0. Tento stav je asymptoticky stabilnı́, jestliže existuje pozitivně definitnı́ skalárnı́ funkce V (xk ) a jejı́ diference (9.4) podél řešenı́ systému je negativně definitnı́. Jestliže V (xk ) → ∞ pro ||xk || → ∞, je rovnovážný stav globálně asymptoticky stabilnı́. Přı́klad 9.3. Pro diskrétnı́ systém (x1 ≡ x, x2 ≡ y) xk+1 = yk2 yk+1 = x2k zvolı́me V = x2k + yk2 . Diference ∆V = V (xk+1 , yk+1 ) − V (xk , yk ) = yk4 + x4k − x2k − yk2 = x2k (x2k − 1) + yk2 (yk2 − 1) je negativně definitnı́ pro x2k < 1, yk2 < 1. Rovnovážný stav je tedy stabilnı́ ve čtvercové oblasti |xk | < 1, |yk | < 1. Kapitola 10 Periodická řešenı́ a jejich stabilita V této kapitole se budeme podrobněji zabývat periodickými řešenı́mi nelineárnı́ch systémů se spojitým časem. Se základnı́mi pojmy a problémy jsme se seznámili již v čl. 2.3. Při vyšetřovánı́ periodických řešenı́ je třeba určit existenci periodických řešenı́, jejich počet, stabilitu periodických řešenı́ při malých poruchách (chovánı́ trajektoriı́ soustavy v okolı́ periodické orbity), konkrétnı́ průběhy periodických řešenı́ (tvary limitnı́ch cyklů) a bifurkačnı́ změny v závislosti na parametrech systému. Metody studia periodických řešenı́ jsou náročnějšı́ než metody pro určovánı́ rovnovážných stavů a jejich stability. Bylo publikováno mnoho metod, žádná z nich však nenı́ univerzálnı́. Můžeme je zhruba rozdělit do těchto skupin: a) Analytické metody je možno použı́t jen u jednoduššı́ch systémů, nejčastěji u 2. řádu. Jednoduché přı́klady si ukážeme v čl. 10.1. Odhady periodických řešenı́ pro systémy 2. řádu budou uvedeny v čl. 10.2. b) Poincaréovo zobrazenı́ se použı́vá k popisu vlastnostı́ periodické orbity a chovánı́ trajektoriı́ v jejı́m blı́zkém okolı́. Metoda je výhodná pro studium bifurkacı́ periodických řešenı́ a bude uvedena v čl. 10.3. c) Přibližné analytické metody poskytujı́ odhady periodických řešenı́, jejich počtu a jejich stability i u značně složitých systémů. V regulačnı́ praxi se často použı́vá metoda ekvivalentnı́ch přenosů, se kterou se seznámı́me v kap. 13. Je výhodná zejména pro systémy s malým počtem nelinearit a s lineárnı́ částı́ vyššı́ho řádu. d) Numerické metody a simulace jsou vhodné u složitých nelineárnı́ch systémů pro určenı́ konkrétnı́ho průběhu stabilnı́ch periodických řešenı́ a pro odhad jejich period. Nestabilnı́ periodická řešenı́ se zı́skávajı́ obtı́žněji, s výjimkou speciálnı́ch přı́padů, kdy je možno integrovat rovnice systému v záporném směru času. Nalezenı́ periodických řešenı́ lze převést na nelineárnı́ okrajovou úlohu se smı́šenými okrajovými podmı́nkami. Pro řešenı́ takové úlohy se použı́vajı́ nejčastěji dva přı́stupy, a to diferenčnı́ metody a metoda střelby. Podrobnosti lze nalézt v publikacı́ch o numerických metodách. 10.1 Analytické metody studia periodických řešenı́ Analytické řešenı́ lze provést jen u speciálnı́ch přı́padů systémů nižšı́ho řádu pro n ≥ 2. U systémů prvnı́ho řádu nemohou periodická řešenı́ vzniknout. Pro řešenı́ je často výhodné převést zadaný systém z kartézských do polárnı́ch souřadnic. Přı́klad 10.1. Nelineárnı́ systém ẋ = x − y − x(x2 + y 2 ) ẏ = x + y − y(x2 + y 2 ) 90 KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 91 má rovnovážný stav v bodě (0, 0). Vlastnı́ čı́sla Jacobiovy matice v bodě (0, 0) jsou 1 ± j, rovnovážný stav je nestabilnı́ ohnisko. Trajektorie se tedy v blı́zkém okolı́ počátku rozvinuje a mohl by existovat limitnı́ cyklus. Převed’me daný systém do polárnı́ch souřadnic p y r = x2 + y 2 ϕ = arctg x = r cos ϕ y = r sin ϕ. x Pro derivace původnı́ch souřadnic pak platı́ ẋ = ṙ cos ϕ − r sin ϕ.ϕ̇ ẏ = ṙ sin ϕ + r cos ϕ.ϕ̇ Dosadı́me-li tyto vztahy do zadaných rovnic, dostaneme systém v polárnı́ch souřadnicı́ch ṙ = r(1 − r2 ) ϕ̇ = 1. Pevné body jsou: a) r = 0, který představuje nestabilnı́ rovnovážný stav (f 0 = df /dr = 1 − 3r2 ; pro r = 0 je f 0 = 1) b) r = 1 představuje stabilnı́ limitnı́ cyklus (asymptoticky stabilnı́ pevný bod radiálnı́ho pohybu). Pro je f 0 = −2. c) r = −1. Tato hodnota nemá fyzikálnı́ smysl. r=1 Přı́klad 10.2. Nelineárnı́ systém ẋ = −y − x[(x2 + y 2 )2 − 3(x2 + y 2 ) + 2] ẏ = x − y[(x2 + y 2 )2 − 3(x2 + y 2 ) + 2] má po převodu do polárnı́ch souřadnic tvar ṙ = −r(r2 − 1)(r2 − 2) ϕ̇ = 1. Existujı́ tři pevné body, které majı́ fyzikálnı́ smysl. Jsou to: a) r = 0, f 0 = −2: asymptoticky stabilnı́ rovnovážný stav (0,0) b) r = +1, f 0 = 2: nestabilnı́ limitnı́ cyklus √ c) r = + 2, f 0 = −4: stabilnı́ limitnı́ cyklus x2 + y 2 = 2. 10.2 Odhady periodických řešenı́ u systémů druhého řádu Pro autonomnı́ systémy 2. řádu ẋ1 = f1 (x1 , x2 ) ẋ2 = f2 (x1 , x2 ) (10.1) existujı́ některá jednoduchá kritéria, pomocı́ nichž lze odhadnout existenci nebo neexistenci periodických řešenı́. Index pevných bodů toku (Poincaréův index). Uvažujme u planárnı́ho toku ve fázové rovině jednoduchou uzavřenou křivku C, která neprocházı́ žádným pevným bodem a zvolme na nı́ libovolný bod P . Proložme tı́mto bodem vektor, jehož směr souhlası́ se směrem vektoru fázové rychlosti (f1 , f2 ). Bude-li se nynı́ bod P pohybovat po C proti směru hodinových ručiček, vektor (f1 , f2 ) spojitě rotuje a po jednom oběhu bodu P po křivce C bude přı́růstek úhlu 2πk (měřeno rovněž proti směru hodinových ručiček). Celé čı́slo k se nazývá index uzavřené křivky C a je nezávislé na tvaru křivky. Závisı́ pouze na charakteru pevných bodů uvnitř křivky C. Zvolı́me-li uzavřenou křivku C tak, aby obkličovala jediný izolovaný pevný bod x, pak se k nazývá indexem pevného bodu toku. Pro indexy pevného bodu a uzavřené křivky platı́ následujı́cı́ vztahy: KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 92 a) Index uzlu, ohniska nebo středu je +1. b) Index hyperbolického sedla je 1. c) Index uzavřené orbity je +1. d) Index uzavřené křivky, která nemá uvnitř žádný pevný bod, je 0. e) Index uzavřené křivky, která má uvnitř vı́ce pevných bodů, je roven součtu indexů těchto bodů. Tato tvrzenı́ lze snadno ověřit na fázových portrétech dvourozměrných systémů. Poznámka: Existujı́ také degenerované pevné body, které majı́ indexy odlišné od hodnot ±1. Jako důsledek uvedených hodnot indexů pevných bodů toku a uzavřených křivek platı́ Věta 10.1. Uvnitř uzavřené periodické trajektorie γ musı́ být nejméně jeden pevný bod. Je-li jen jeden, musı́ to být zdroj (nestabilnı́ uzel nebo ohnisko) nebo propad (stabilnı́ uzel nebo ohnisko). Jsou-li všechny pevné body uvnitř uzavřené trajektorie γ hyperbolické, musı́ jich být lichý počet 2n + 1; z nich n jsou sedla, n + 1 zdroje nebo propady. Obrázek 10.1: Prstencová oblast Věta 10.2. Prstencová oblast Ω bez pevných bodů, u nı́ž z obou okrajů směřuje vektorové pole dovnitř Ω, obsahuje alespoň jeden stabilnı́ limitnı́ cyklus (obr.10.1). Věta 10.3. Bendixsonovo kritérium neexistence limitnı́ch cyklů. V systému ẋ1 = f1 (x1 , x2 ), ẋ2 = f2 (x1 , x2 ) (f1 , f2 jsou alespoň třı́dy C 1 ) nemůže existovat limitnı́ cyklus v jednoduše souvislé oblasti Ω fázové roviny, neměnı́-li tam výraz I= ∂f1 ∂f2 + ∂x1 ∂x2 (10.2) znaménko nebo nenı́-li identicky rovný nule. Důkaz: Pro libovolnou trajektorii systému platı́ f2 (x1 , x2 ) dx2 = dx1 f1 (x1 , x2 (10.3) neboli f1 dx2 − f2 dx1 = 0. Předpokládejme, že limitnı́ cyklus existuje a uvažujme křivkový integrál po této trajektorii I (f1 dx2 − f2 dx1 ) = 0. (10.4) Podle Stokesovy věty vektorové analýzy lze tento integrál počı́tat jako integrál z plochy uzavřené limitnı́m cyklem I Z Z ∂f1 ∂f2 (f1 dx2 − f2 dx1 ) = ( + )dx1 dx2 = 0. (10.5) ∂x1 ∂x2 KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 93 Má-li být křivkový integrál rovný nule, musı́ integrand I= ∂f1 ∂f2 + ∂x1 ∂x2 být bud’ rovný nule nebo měnit v oblasti uzavřené limitnı́m cyklem znaménko. Nenı́-li tato podmı́nka splněna, nemůže existovat limitnı́ cyklus. Přı́klad 10.3. Pro nelineárnı́ systém z přı́kladu 4.3 je I = −a. Tento výraz neměnı́ znaménko a nenı́ roven nule nikde ve fázové rovině, proto nemůže existovat žádný limitnı́ cyklus. Přı́klad 10.4. Nelineárnı́ systém je popsán rovnicemi ẋ2 = −x1 + 2bx2 (1 − ẋ1 = x2 x22 ) 3a 0 < b < 1. Tento systém má jeden rovnovážný stav, nestabilnı́ ohnisko pro x1 = x2 = 0. Výraz I= ∂f1 ∂f2 x2 + = 2b(1 − 2 ). ∂x1 ∂x2 a Pro a < 0 nenı́ 0a √ nikdy I nulové ani neměnı́ znaménko, nemůže tedy existovat žádný limitnı́ cyklus. Pro a >√ pro |x2 | < a nemůže existovat limitnı́ cyklus, který je zcela obsažen v oblasti omezené hodnotou |x2 | < a. Může však existovat limitnı́ cyklus většı́. Bendixsonovo kritérium zobecnil Dulac. Věta 10.4. Dulacovo kritérium. Necht’ φ(x1 , x2 ) je spojitá funkce se spojitými derivacemi v jednoduše souvislé oblasti Ω fázové roviny. Pak v Ω nemůže existovat limitnı́ cyklus, neměnı́-li tam výraz ∂ ∂ (φf1 ) + (φf2 ) (10.6) ∂x1 ∂x2 znaménko nebo nenı́-li identicky rovný nule. Důkaz kritéria lze provést podobně jako u kritéria Bendixsonova. Přı́klad 10.5. Nelineárnı́ systém ẋ = x(y − 1) ẏ = x + y − 2y 2 může mı́t podle Bendixsonova kritéria limitnı́ cyklus, protože výraz I = −3y měnı́ znaménko. Použijeme-li Dulacova kritéria s funkcı́ φ(x, y) = x3 , pak ∂ ∂ (φf1 ) + (φf2 ) = −3x3 . ∂x1 ∂x2 Pro x = 0 jsou rovnice systému ẋ = 0 a ẏ = y − 2y 2 . Osa y je tedy trajektorie a žádná jiná trajektorie ji nemůže křižovat. Výraz −3x3 nemůže tedy měnit znaménko a proto neexistujı́ v celé fázové rovině uzavřené trajektorie. 10.3 Poincaréovo zobrazenı́ K popisu vlastnostı́ periodické orbity a chovánı́ trajektoriı́ v jejı́m blı́zkém okolı́ se s výhodou využı́vá tzv. Poincaréova zobrazenı́. Jak dále uvidı́me, je Poincaréovo zobrazenı́ výhodné pro studium stability i bifurkacı́ periodických řešenı́. Uvažujme autonomnı́ systém ẋ = f (x), x ∈ Rn , n ≥ 2. (10.7) Předpokládejme, že existuje limitnı́ cyklus γ a zvolme na něm libovolný bod x. Tı́mto bodem proložme lokálnı́ hyperplochu S dimenze n − 1, která protı́ná orbitu γ. Tato plocha nemusı́ být hyperrovina, KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 94 ale musı́ být vybrána tak, aby tok vektorového pole ji všude protı́nal transverzálně, tj. aby skalárnı́ součin f (x).n(x) 6= 0 pro všechna x ∈ S, kde n(x) je jednotkový vektor normály plochy S v bodě x. Označme U ⊆ S takové okolı́ bodu x, ve kterém periodická orbita má jen jeden průsečı́k x. Zkoumejme nynı́ chovánı́ trajektorie, která vycházı́ z nějakého bodu x0 ∈ U dostatečně blı́zkého k bodu x (obr. 10.2). Označme x1 = P (x0 ) prvnı́ průsečı́k trajektorie s řezem S, který následuje po x0 . Tı́m definujeme zobrazenı́ P (x), které se nazývá Poincaréovo zobrazenı́ přı́slušné k periodické orbitě γ. Toto zobrazenı́ je difeomorfismus a lze ho chápat jako diskrétnı́ dynamický systém xk+1 = P (xk ) definovaný na řezu S. Zobrazenı́ P plně určuje kvalitativnı́ chovánı́ toku soustavy ẋ = f (x) v okolı́ periodické orbity γ. Pevnému bodu x zobrazenı́ P odpovı́dá uzavřená trajektorie γ, periodickým bodům zobrazenı́ P s periodou p odpovı́dajı́ trajektorie, které se uzavřou po p obězı́ch. Stabilita pevného bodu x difeomorfismu P odpovı́dá stabilitě orbity γ pro vektorové pole f (x). Tuto stabilitu vyšetřı́me pomocı́ linearizace Poincaréova zobrazenı́ kolem bodu x. Obrázek 10.2: Poincaréovo zobrazenı́ Pomocı́ stabilnı́, nestabilnı́ a centrálnı́ variety pevného bodu zobrazenı́ P lze definovat stabilnı́, nestabilnı́ a centrálnı́ varietu uzavřené trajektorie toku. Je-li např. x hyperbolický pevný bod a má-li DP (x) (tj. matice linearizace Poincaréova zobrazenı́ v bodě x) ns vlastnı́ch čı́sel s modulem menšı́m než jedna a nu vlastnı́ch čı́sel s modulem většı́m než jedna (ns +nu = n−1), pak dim W s (x) = ns a dim W u (x) = nu pro difeomorfismus P . Stabilnı́ varieta W s (γ) periodické orbity γ je pak množina bodů všech trajektoriı́, které procházejı́ body stabilnı́ variety W s (x) difeomorfismu P . Obdobně to platı́ pro nestabilnı́ varietu W u (γ). Dimenze variet toku jsou o jednotku vyššı́ než dimenze odpovı́dajı́cı́ch variet difeomorfismu P . Pomocı́ Poincaréova zobrazenı́ lze formulovat kritérium orbitálnı́ stability uzavřené trajektorie γ. Věta 10.5. Necht’ γ je uzavřená trajektorie soustavy ẋ = f (x) a P jejı́ Poincaréovo zobrazenı́. Označme λ1 , λ2 , ..., λn−1 vlastnı́ čı́sla matice DP (x), kde x je pevný bod difeomorfismu P , odpovı́dajı́cı́ trajektorii γ. Je-li |λi | < 1 pro i = 1, 2, ..., n − 1, pak γ je orbitálně stabilnı́. Je-li |λk | > 1 alespoň pro jedno k ∈ {1, 2, ..., n − 1} je γ orbitálně nestabilnı́. Vlastnı́ čı́sla λi matice DP (x) se nazývajı́ multiplikátory trajektorie γ. Hlavnı́m přı́nosem Poincaréova zobrazenı́ je jeho geometrická názornost a převedenı́ problému chovánı́ dynamického systému ẋ = f (x) v Rn na studium chovánı́ diskrétnı́ho systému P v prostoru Rn−1 . Celý problém se tedy zredukuje o jednu dimenzi, vzhledem k celému fázovému prostoru je však Poincaréovo zobrazenı́ lokálnı́. Výpočet Poincaréova zobrazenı́ vyžaduje znalost obecného řešenı́ diferenciálnı́ rovnice ẋ = f (x) KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 95 a to lze najı́t jen v nejjednoduššı́ch přı́padech. Mnohdy se však P dá určit alespoň kvalitativně přibližnými metodami, složitějšı́ systémy se řešı́ numericky. Při numerickém řešenı́ se řez volı́ jako hyperplocha (obvykle hyperrovina) určená rovnicı́ S(x1 , ..., xn ) = 0. Systém se numericky integruje a v každém kroku integrace se vyhodnocuje znaménko funkce S. Při změně znaménka se zı́ská bod průsečı́ku trajektorie s plochou S pomocı́ interpolace mezi dvěma poslednı́mi body zı́skanými integracı́. Stejným způsobem zı́skáme dalšı́ body orbity Poincaréova zobrazenı́ a z jejı́ho charakteru pak můžeme posoudit stabilitu periodické orbity γ. 10.4 Rovnice ve variacı́ch Uved’me si ještě jiný přı́stup k popisu chovánı́ trajektoriı́ systému ẋ = f (x) v okolı́ uzavřené trajektorie. Tento způsob využı́vá výsledků Floquetovy teorie periodických systémů, kterou jsme popsali v čl. 4.1. Necht’ γ je trajektorie řešenı́ x(t) systému ẋ = f (x) pro počátečnı́ podmı́nku x0 . Proved’me perturbaci řešenı́ x(t) volbou blı́zké počátečnı́ podmı́nky y 0 a označme toto perturbované řešenı́ y(t). Pak můžeme psát y(t) = x(t) + z(t). Protože x(t) i y(t) jsou řešenı́mi rovnice ẋ = f (x), je ż(t) = ẏ(t) − ẋ(t) = f (y(t)) − f (x(t)). (10.8) ż(t) = f (x(t) + z(t)) − f (x(t)). (10.9) Po dosazenı́ za y(t) je Pravou stranu upravı́me pomocı́ Taylorova vztahu f (x(t) + z(t)) − f (x(t)) = ∂f (x(t)) z(t) + r(z(t)). ∂x (10.10) Nahradı́me-li pravou stranu rovnice (10.9) lineárnı́ aproximacı́ z (10.10), dostaneme diferenciálnı́ rovnici pro z(t) ∂f ż(t) = (x(t)) z(t), (10.11) ∂x která se nazývá rovnicı́ ve variacı́ch soustavy ẋ = f (x) pro řešenı́ x(t). Je to lineárnı́ neautonomnı́ rovnice ẋ = A(t)x s maticı́ ∂f A(t) = (x(t)). (10.12) ∂x Dále budeme předpokládat, že řešenı́ x(t) je periodické s periodou T , takže γ je uzavřená trajektorie. Pak A(t) je periodickou funkcı́ času, rovnice ve variacı́ch (10.11) odpovı́dá rovnici (4.15) a lze na ni aplikovat Floquetovu teorii. Multiplikátory uzavřené orbity γ lze stanovit numericky, a to obvykle výhodněji než u Poincaréova zobrazenı́. Pro určenı́ stability γ lze pak využı́t věty 10.5. Podrobnějšı́ výklad lze nalézt např. v [2]. 10.5 Úlohy 10.1. Ukažte, že x1 = cos t, x2 = sin t je periodické řešenı́ systému ẋ1 = x1 − x2 − x31 − x1 x22 ẋ2 = x1 + x2 − x21 x2 − x32 √ √ a x1 = 2 π cos t, x2 = 2 π sin t je periodické řešenı́ systému ẋ1 = −x2 + x1 sin x21 + x22 4 ẋ2 = x1 + x2 sin x21 + x22 4 KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 96 Nalezněte pro oba systémy rovnice ve variacı́ch kolem uvažovaného periodického řešenı́ a ukažte, že v obou přı́padech je limitnı́ cyklus orbitálně asymptoticky stabilnı́. 10.2. Uvažujte systém 2.řádu ẋ1 = −x2 + ax1 (x21 + x22 ) sin (x21 + x22 ) ẋ2 = x1 + ax2 (x21 + x22 ) sin (x21 + x22 ) Určete stabilitu rovnovážného stavu pro a = +1 a a = −1. (Použijte Ljapunovovu funkci V = x21 + x22 ). Ukažte, že x1 = n cos t, x2 = n sin t je periodické řešenı́ daného systému pro n = 1, 2... Odvod’te rovnici ve variacı́ch kolem těchto periodických řešenı́ a určete, že limitnı́ cykly jsou orbitálně asymptoticky stabilnı́ pro a = +1, jestliže n je sudé, a nestabilnı́, jestliže n je liché. 10.3. Ukažte, že periodický systém ẋ2 = −x1 − bx2 − a cos ωt ẋ1 = x2 má periodické řešenı́ ve tvaru x2 (t) = −ωB sin (ωt + α). x1 (t) = B cos (ωt + α) Nalezněte podmı́nky pro orbitálnı́ asymptotickou stabilitu limitnı́ho cyklu odpovı́dajı́cı́ho periodickému řešenı́. 10.4. Uvažujte systém 2. řádu π ẋ1 = −x2 + x2 (x21 + x22 ) sin p π ẋ2 = x1 + x2 (x21 + x22 ) sin p x21 + x22 x21 + x22 Ukažte, že tento systém má periodické řešenı́ x1 = 1 cos t, n x2 = 1 sin t n pro n = 1, 2, ...Určete orbitálnı́ stabilitu odpovı́dajı́cı́ch limitnı́ch cyklů. Ukažte, že libovolně blı́zko počátku existujı́ uzavřené i otevřené trajektorie. Určete stabilitu rovnovážného stavu v počátku. 10.5. Uvažujte systém ẋ1 = x2 ẋ2 = −x1 + (1 − x21 − x22 )x2 Určete stabilitu nulového řešenı́. Ukažte, že systém má limitnı́ cyklus x21 + x22 = 1 odpovı́dajı́cı́ periodickým řešenı́m x1 = sin (t + c) x2 = cos (t + c), kde c je konstanta. Diskutujte orbitálnı́ asymptotickou stabilitu této uzavřené trajektorie. Ukažte, že systém nemá žádné dalšı́ limitnı́ cykly. Návod: Uvažujte Ljapunovovu funkci V = x21 + x22 . Podél periodického řešenı́ s periodou T je Z 0 T V̇ (x)dt = 0. Kapitola 11 Bifurkace rovnovážných stavů a periodických řešenı́ Jak jsme viděli doposud u mnoha přı́kladů, modely reálných fyzikálnı́ch systémů obsahujı́ různé parametry, které se mohou měnit vlivem vnitřnı́ch i vnějšı́ch podmı́nek. Při určitých hodnotách těchto parametrů docházı́ k bifurkacı́m, které se projevujı́ strukturálnı́mi změnami v systému. Těmito bifurkačnı́mi jevy se nynı́ budeme zabývat trochu podrobněji. Teorie bifurkacı́ studuje systematicky kvalitativnı́ změny řešenı́ diferenciálnı́ch nebo diferenčnı́ch rovnic, měnı́-li se jeden nebo vı́ce parametrů (tzv. řı́dı́cı́ch parametrů). Tato teorie vede k rozloženı́ prostoru parametrů na oblasti, ve kterých nedocházı́ k bifurkacı́m (a systém je strukturálně stabilnı́) a na hranice mezi nimi, na nichž bifurkace nastávajı́. Složitost těchto oblastı́ podstatně roste s dimenzı́ parametrického prostoru a současně roste i možný počet typů bifurkacı́. Nejjednoduššı́ přı́pad představujı́ jednoparametrické bifurkace u dynamických systémů se spojitým časem. Všimneme si předevšı́m různých variant bifurkacı́ rovnovážných stavů a periodických řešenı́. Protože analýza těchto bifurkacı́ se obvykle omezuje na studium vektorových polı́ v blı́zkosti bifurkujı́cı́ch rovnovážných stavů a periodických orbit, nazývajı́ se tyto bifurkace lokálnı́. 11.1 Bifurkace rovnovážných stavů Budeme studovat dynamický systém popsaný rovnicı́ ẋ = f (x, α) s jednı́m proměnným parametrem α, ostatnı́ parametry systému budeme pokládat za pevné. Rovnovážné stavy x(α) budou závislé na hodnotě parametru α. Při kritické hodnotě α? tohoto parametru bude docházet k bifurkačnı́m jevům. V bifurkačnı́m bodě nenı́ systém strukturálně stabilnı́, matice Df (x, α? ) je singulárnı́. V článku 4.4 o centrálnı́ varietě jsme viděli, že dimenze bifurkačnı́ho problému závisı́ jen na počtu vlastnı́ch čı́sel matice linearizace, které při kritické hodnotě α? přecházejı́ přes imaginárnı́ osu. V nejjednoduššı́ch přı́padech se jedná o jedno reálné vlastnı́ čı́slo nebo o jednoduchý pár komplexně sdružených vlastnı́ch čı́sel. Budeme předpokládat, že ostatnı́ vlastnı́ čı́sla ležı́ v levé Gaussově polorovině. Bifurkace systému vyššı́ho řádu lze pak redukovat na typy bifurkacı́ diferenciálnı́ch rovnic 1. a 2. řádu. Podrobnějšı́m rozborem bychom zjistili, že stačı́ uvažovat tři základnı́ typy rovnice 1. řádu a jeden typ rovnice 2. řádu (tzv. normálnı́ formy). Jedná se o tyto přı́pady bifurkacı́: a) Tečná bifurkace. Nazývá se také bifurkace sedlo-uzel. Vyskytuje se u rovnice ẋ = α − x2 . (11.1) √ Rovnovážné stavy jsou x = ± α. Pro α < 0 nenı́ žádný rovnovážný stav, pro α > 0 jsou dva, √ √ x(1) = + α (stabilnı́) a x(2) = − α (nestabilnı́). Diagram řešenı́ je znázorněn na obr. 11.1a. 97 KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 98 Obrázek 11.1: Tečná a transkritická bifurkace b) Transkritická bifurkace. Nazývá se také ”křı́žová” bifurkace. Objevuje se u rovnice ẋ = αx − x2 . (11.2) Jsou dva rovnovážné stavy x(1) = 0 a x(2) = α. Pro α < 0 je prvnı́ stabilnı́, druhý nestabilnı́, pro α > 0 je tomu naopak. Diagram je zakreslen na obr. 11.1b. Transkritická bifurkace nastává také u rovnice ẋ = x2 − αx (11.3) Rovnovážné stavy jsou opět dva, x(1) = 0 a x(2) = α. Stabilita je patrna z obr. 11.1c. Obrázek 11.2: Vidličková a Hopfova bifurkace c) Vidličková bifurkace. Má podobně jako u předchozı́ho typu dvě varianty. Superkritická nastává u rovnice ẋ = αx − x3 (11.4) √ √ Pro α < 0 je jeden rovnovážný stav v nule, pro α > 0 jsou tři, x(1) = 0, x(2) = + α a x(3) = − α (obr 11.2a). Subkritická bifurkace se objevuje u rovnice ẋ = x3 − αx. (11.5) Pro α > 0 jsou tři rovnovážné stavy (dva nestabilnı́ a jeden stabilnı́), pro α < 0 je jeden nestabilnı́. d) Hopfova bifurkace nastává, když dvě komplexně sdružená vlastnı́ čı́sla matice linearizace přecházejı́ imaginárnı́ osu. Generuje se uzavřená invariantnı́ křivka kolem pevného bodu. Normálnı́ forma odpovı́dajı́cı́ tomuto typu je ẋ = αx − y − x(x2 + y 2 ) ẏ = x + αy − y(x2 + y 2 ) (11.6) KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 99 Jacobiova matice linearizace je J= " α − 3x2 − y 2 −1 − 2xy 1 − 2xy α − x2 − 3y 2 # Existuje jeden pevný bod (x, y) = (0, 0). Jacobiova matice má pro tento pevný bod tvar J (0) = " α −1 1 α # Odpovı́dajı́cı́ charakteristická rovnice λ2 − 2αλ + α2 + 1 = 0 má dva komplexně sdružené kořeny α ± j. Pro α < 0 je pevný bod stabilnı́, pro α > 0 nestabilnı́. Pro α = 0 měnı́ pevný bod stabilitu a současně vzniká stabilnı́ limitnı́ cyklus, jehož amplituda se zvětšuje se zvětšujı́cı́m se α. Odpovı́dajı́cı́ diagram je na obr. 11.2b. 11.2 Bifurkace periodických řešenı́ Všimněme si nynı́ stability periodických orbit, které závisejı́ na jednom proměnném parametru α. Bifurkace nastane tehdy, je-li některé vlastnı́ čı́slo linearizace Poincaréova zobrazenı́ v okolı́ periodické orbity γ(α) v absolutnı́ hodnotě rovno jedné. Nastává přitom zase několik možnostı́: a) Vlastnı́ čı́slo je rovno +1. (Je to analogie přı́padu vlastnı́ho čı́sla rovného nule pro rovnovážný stav spojitého systému). - tečná bifurkace; vzniká nebo zaniká pár periodických orbit (bifurkace sedlo-uzel) - křı́žová bifurkace; měnı́ se stabilita dvou limitnı́ch cyklů - vidličková bifurkace; vznikajı́ tři mezné cykly z jednoho. b) Vlastnı́ čı́slo je rovno −1. Je to tzv. subharmonická bifurkace neboli bifurkace zdvojenı́ periody. Jestliže pro α = α? přecházı́ jeden multiplikátor trajektorie γ z jednotkového kruhu ven, pak se stabilnı́ trajektorie měnı́ na nestabilnı́ a od nı́ se odvětvı́ uzavřená trajektorie s dvojnásobnou periodou. c) dvojice komplexně sdružených vlastnı́ch čı́sel (multiplikátorů) procházı́ jednotkovou kružnicı́. To odpovı́dá invariantnı́ kružnici Poincaréova zobrazenı́ a vznikne invariantnı́ torus T 2 . Na rozdı́l od obou předešlých přı́padů, které mohou existovat už v systémech 2. řádu nastává tento přı́pad až od 3. řádu. 11.3 Teorie katastrof Zakladatelem teorie katastrof je francouzský matematik René Thom, který vydal v r. 1972 knihu s názvem: Strukturálnı́ stabilita a morfogeneze. V nı́ se zabýval zejména studiem změn tvarů v biologii, pro které využil globálnı́ geometrické a analytické výsledky teorie singularit hladkých zobrazenı́. Z teorie singularit je známo, že pozvolná spojitá změna parametrů vyvolává často rychlou kvalitativnı́ změnu stavu, což je obvykle označováno jako skok. Thom nazval poněkud nadneseně tyto skokové změny katastrofami a teorii singularit spolu s jejı́mi aplikacemi teoriı́ katastrof. Thomova kniha a celá nová teorie vzbudily široký ohlas a rozsáhlé, ale často i dosti spekulativnı́ diskuse. Po opadnutı́ prvnı́ho nadšenı́ se ukázalo, že teorie katastrof nenı́ převratnou teoriı́, ale že přesto zůstává zajı́mavou partiı́ modernı́ matematiky, která přinesla řadu konkrétnı́ch výsledků nejen v matematice samotné, ale předevšı́m v oblasti fyzikálnı́ch a technických věd. O mı́ře konkrétnı́ho přı́nosu pro biologické a sociálnı́ vědy se vedou rozporné diskuse, protože velké množstvı́ přı́spěvků má zatı́m převážně spekulativnı́ charakter. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 100 V užšı́m smyslu je cı́lem teorie katastrof popis rychlých změn v chovánı́ dynamických systémů. Tato tzv. elementárnı́ teorie katastrof studuje bifurkačnı́ jevy předevšı́m u gradientnı́ch dynamických systémů, které jsou vytvářeny pomocı́ potenciálu, závislého na řı́dı́cı́ch parametrech. Možné bifurkace těchto gradientnı́ch systémů jsou v teorii katastrof popsány vyčerpávajı́cı́m způsobem. Mnozı́ autoři však chápou teorii katastrof obecněji jako spojenı́ teorie singularit a teorie bifurkacı́ spolu s jejich aplikacemi v nejrůznějšı́ch oborech. V dalšı́m se budeme zabývat jen jednoduchými výsledky elementárnı́ teorie katastrof, předevšı́m u gradientnı́ch systémů. V této oblasti dosáhl Thom pozoruhodných výsledků, které spočı́vajı́ zejména ve studiu a klasifikaci degenerovaných kritických bodů potenciálu. Skokové jevy, které jsou stěžejnı́ pro teorii katastrof, si můžeme přiblı́žit jednoduchým pokusem. Obrázek 11.3: Zeemanův stroj Zeeman vytvořil školnı́ přı́klad ”katastrofického stroje”, kterým je jednoduchý tlumený mechanický systém podle obr. 11.3. Volně otáčivý kotouč s pevným středem A má v jednom bodě obvodu P upevněna dvě zhruba stejně dlouhá vhodně napjatá gumová vlákna. Jeden konec levého vlákna je pevně fixován v bodě B, konec F pravého vlákna je volně pohyblivý a nazývá se řı́dı́cı́ bod systému. Při pohybu bodu F se bude kotouč otáčet a jeho polohu (stav systému) můžeme definovat úhlem x měřeným od základnı́ osy AB. Umı́stěme nynı́ bod F do nějakého bodu roviny a natočme kotouč do libovolné počátečnı́ polohy. Při uvolněnı́ kotouče se jeho pohyb ustálı́ v nějakém rovnovážném stavu. Snadno zjistı́me, že pokud bude bod F vně oblasti uzavřené křivkou na obr. 11.3, ustálı́ se kotouč v jedné rovnovážné poloze a systém má jeden atraktor. Při pohybu bodu F přes tuto oblast (např. podél přı́mky v obr. 11.3) bude mı́t systém dva atraktory, při přechodu hraničnı́ křivky (bifurkačnı́ množina) vykoná systém rychlý skok do druhého atraktoru. Bifurkačnı́ křivka má čtyři hroty, tj. obyčejné body vratu. Systém má dva řı́dı́cı́ parametry, kterými jsou souřadnice x, y bodu F . Jak uvidı́me v dalšı́m článku, teorie katastrof dokazuje, že na bifurkačnı́ křivce podobných systémů mohou být jen regulárnı́ body a hroty. 11.3.1 Elementárnı́ teorie katastrof Obecná teorie bifurkacı́ studuje chovánı́ dynamických systémů s n stavovými proměnnými a m řı́dı́cı́mi parametry αi , např. typu ẋ = f (x1 , ..., xn ; α1 , ..., αm ) x ∈ Rn α ∈ Rm . (11.7) KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 101 Elementárnı́ teorie katastrof, která je v podstatě podmnožinou teorie bifurkacı́, studuje bifurkačnı́ jevy u gradientnı́ch dynamických systémů popsaných rovnicemi x ∈ Rn ẋ = −gradx V (x, α) α ∈ Rm . (11.8) Základnı́ vlastnosti gradientnı́ch systémů byly uvedeny v čl.6.1. Zde budeme sledovat vliv změny parametrů α na chovánı́ systému. Definujme nejprve některé základnı́ pojmy. Množina pevných bodů systému (11.8) M = (x, α) | ∂V (x, α) = 0, ∂xi i = 1, ..., n (11.9) tvořı́ hyperplochu v prostoru Rn × Rm , jejı́ž prvky jsou při konstantnı́m α stacionárnı́mi (neboli kritickými) body potenciálu V . Katastrofická množina K je dána degenerovanými stacionárnı́mi body potenciálu    ∂ 2 V (x, α) K = (x, α) ∈ M | det   ∂xi ∂xj !n i,j=1    =0 .  (11.10) Bifurkačnı́ množina B je dána projekcı́ těchto degenerovaných stacionárnı́ch bodů do parametrického prostoru B = {α ∈ Rm | ∃ x ∈ Rn ; (x, α) ∈ M } . (11.11) Dále uvedeme přehled elementárnı́ch katastrof, přičemž pro každé f (x, α) stanovı́me a) množinu M ⊂ Rn × Rm všech stacionárnı́ch bodů funkce f (x, α) při pevném, ale libovolném α ∈ Rm , b) podmnožinu K ⊂ M ⊂ Rn × Rm všech degenerovaných stacionárnı́ch bodů, c) průmět B množiny K do prostoru parametrů Rm . 1. Uvažujme nejprve gradientnı́ systém 1. řádu (dim Rn = 1), který má maximálně čtyři proměnné parametry (dim Rm ≤ 4). Budeme studovat lokálnı́ chovánı́ potenciálu V (x) v blı́zkosti stacionárnı́ho bodu x, který můžeme bez ztráty obecnosti uvažovat v počátku. Pak x = 0, V (0) = 0. Budeme předpokládat, že potenciálnı́ funkci lze rozvinout v Taylorovu řadu V (x) = a0 + a1 x + a2 x2 + a3 x3 + ... (11.12) kde a0 = V (0) = 0, a1 = V 0 (0) = 0, ak = 1/k!(dk V /dxk )(0), k = 2,3,... Dále budeme uvažovat, že potenciálnı́ funkce může být ovlivněna vnějšı́mi nebo vnitřnı́mi poruchami, takže V závisı́ na parametrech α. Budeme studovat typy hladkých poruch, které podstatným způsobem ovlivňujı́ lokálnı́ chovánı́ V (x) pro x = 0. Je-li ak 6= 0, přicházejı́ v úvahu jen poruchy, jejichž stupeň n ≤ k, protože pro n > k platı́ při malé poruše |x| << 1 vztah |x|n << |x|k . Přı́pad 1. Necht’ a2 6= 0. Pak třı́parametrové rušenı́ vede na tvar V (x) = a2 x2 + µ2 x2 + µ1 x + µ0 . (11.13) Vhodnou transformacı́ souřadnic, volbou měřı́tek a eventuálnı́ změnou znaménka zı́skáme tzv. normálnı́ (standardnı́) tvar V (x) = 12 x2 , který nenı́ závislý na parametrech. Tı́m jsme vlastně zvolili lokálnı́ souřadnice ve vrcholu paraboly a označili jsme je stejnými pı́smeny x, V . Funkce V má v bodě x = 0 jednoduché minimum, nenastávajı́ žádné katastrofy. Potenciál V (x) odpovı́dá dynamickému systému ẋ = −x. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 102 Přı́pad 2. Katastrofa typu záhyb. Pro a2 = 0, a3 6= 0 a možné čtyřparametrové rušenı́ vede na potenciál V (x) = a3 x3 + µ3 x3 + µ2 x2 + µ1 x + µ0 . (11.14) Po vhodných transformacı́ch zı́skáme standardnı́ tvar 1 V (x) = x3 + α1 x, 3 (11.15) který závisı́ na jednom volném parametru. Tento potenciál odpovı́dá gradientnı́mu dynamickému systému ẋ = −x2 − α1 . Systém nemá pro α1 > 0 pevné body, pro α1 < 0 jsou dva. M = {(x, α1 ) ∈ R2 | x2 + α1 = 0} (11.16) Katastrofická množina K je jednobodová množina (obr. 11.4) K = {(x, α1 ) ∈ M | ∂ 2 V /∂x2 = 0} = {(0, 0)}. (11.17) Jejı́ průmět do prostoru parametru α1 je jediný bod 0. Pro α1 = 0 nastává tedy katastrofa (bifurkace) typu záhyb. Obrázek 11.4: Katastrofa typu záhyb Obrázek 11.5: Katastrofa typu hrot Přı́pad 3. Katastrofa typu hrot: a2 = a3 = 0, a4 6= 0. Obecný potenciál 4. stupně s pěti parametry lze zase vhodnými transformacemi převést na standardnı́ tvar 1 1 V (x, α1 , α2 ) = x4 + α1 x2 + α2 x, 4 2 (11.18) který závisı́ na dvou volitelných parametrech.Odpovı́dá dynamickému systému ẋ = −x3 − α1 x − α2 , (11.19) který v závislosti na parametrech nemá bud’ žádný rovnovážný stav, nebo jeden nebo tři. Odpovı́dajı́cı́ množiny jsou M = {(x, α1 , α2 ) ∈ R3 | x3 + α1 x + α2 = 0} K = {(x, α1 , α2 ) ∈ M | 3x2 + α1 = 0} = {(x, α1 , α2 ) | α1 = −3x2 , α2 = 2x3 } B = {(α1 , α2 ) ∈ R2 | 4α13 + 27α22 = 0}. Bifurkačnı́ množina B je znázorněna na obr. 11.5, množina pevných bodů M je zakreslena na obr. 11.6. Při x = α1 = α2 = 0 vzniká katastrofa typu hrot. Tento typ je nejjednoduššı́ bifurkacı́, která vznikne při variaci dvou parametrů. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 103 Přı́pad 4. Katastrofa typu vlaštovčı́ ocas: a2 = a3 = a4 = 0, a5 6= 0. Standardnı́ tvar potenciálu je závislý na třech parametrech 1 1 1 V (x, α1 , α2 , α3 ) = x5 + α1 x3 + α2 x2 + α3 x. 5 3 2 (11.20) Odpovı́dajı́cı́ množiny jsou M = {(x, α1 , α2 , α3 ) ∈ R4 | x4 + α1 x2 + α2 x + α3 = 0} K = {(x, α1 , α2 , α3 ) ∈ M | 4x3 + 2α1 x + α2 = 0}. Bifurkačnı́ množina B = {(α1 , α2 , α3 )} je projekcı́ množiny K do prostoru parametrů a má tvar vlaštovčı́ho ocasu (obr. 11.7). Obrázek 11.6: Katastrofa typu hrot Obrázek 11.7: Katastrofa typu vlaštovčı́ ocas Přı́pad 5. Katastrofa typu motýl: a2 = ... = a5 = 0, a6 6= 0. Standardnı́ forma potenciálu má čtyři volné parametry 1 1 1 1 V (x, α1 , α2 , α3 , α4 ) = x6 + α1 x4 + α2 x3 + α3 x2 + α4 x. 6 4 3 2 (11.21) Odpovı́dajı́cı́ bifurkace se nazývá katastrofa typu motýl. Uvedenými čtyřmi typy katastrof jsou vyčerpány všechny možné přı́pady, které mohou vzniknout u jednodimenzionálnı́ho systému, který je ovlivňován nejvýše čtyřmi parametry. 2. U gradientnı́ho systému druhého a vyššı́ho řádu (dim Rn ≥ 2) a třech volných parametrech jsou možné ještě dalšı́ dvě singularity, eliptický a hyperbolický bod. Při čtyřech volných parametrech vzniká ještě parabolický bod. Tyto singularity (katastrofy) jsou již složitějšı́ a jejich podrobný popis lze nalézt v např. v [29]. Thom odvodil ve své knize tuto základnı́ větu: Necht’ C je čtyřdimenzionálnı́ parametrický prostor, X libovolný konečněrozměrný stavový prostor a V hladká funkce na X parametrizovaná pomocı́ C. Necht’ M je množina stacionárnı́ch bodů funkce V . Pak je M hladká hyperplocha v X × C a jedinými typy singularit je výše uvedených sedm elementárnı́ch katastrof. Důkaz této věty je obtı́žný a lze ho nalézt v [29]. Pozoruhodné na této větě je, že existuje konečný počet elementárnı́ch katastrof a že nejsou závislé na dimenzi stavového prostoru. Bude-li dimenze parametrického prostoru C rovna pěti, lze dokázat, že jsou možné dalšı́ čtyři typy katastrof, pro dim C = 6 existuje nekonečně velký počet různých katastrof. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 11.3.2 104 Aplikace teorie katastrof Matematická teorie katastrof nalezla značné využitı́ nejen v matematice samotné, ale i v mnoha jiných oblastech. Velmi známé jsou aplikace ve fyzice. V mechanice jsou to např. skokové jevy při tlaku na elastické nosnı́ky, problémy stability průřezů při jeho různých tvarech, studium průhybu desek apod. Známými aplikacemi jsou fázové přechody v termodynamice, nespojité jevy v kvantové mechanice, aerodynamice, laserové fyzice aj. Významnou aplikaci tvořı́ teorie vlnoploch a kaustik, tj. obálek systému paprsků. Na podkladu metod teorie katastrof byly vypracovány např. některé teorie rozloženı́ hmoty ve vesmı́ru a možnosti vzniku galaxiı́ a jiných útvarů. Obecný charakter má využitı́ teorie katastrof při studiu hystereznı́ch jevů, které se objevujı́ také často v regulačnı́ technice. Velké množstvı́ aplikacı́ ve fyzikálnı́ch a technických oborech je popsáno v knize [29]. Poměrně málo konkrétnı́ch výsledků bylo zatı́m dosaženo v biologických a společenských vědách. Nejznámějšı́ jsou snad aplikace v psychologii, např. modelovánı́ agresivity pomocı́ katastrofy typu hrot, modelovánı́ různých psychických stavů, duševnı́ únavy, různých konfliktnı́ch situacı́ apod. V lékařstvı́ byly modelovány epidemické procesy, v ekonomii různé skokové jevy, např. modely vývoje cen na burze, krize v ekonomických systémech aj. Kapitola 12 Chaos V předchozı́ch kapitolách jsme se zabývali deterministickými nelineárnı́mi systémy, jejichž asymptotické chovánı́ vedlo na rovnovážné stavy nebo na periodická či kvaziperiodická řešenı́. Již Poincaré však v r. 1892 upozornil na možnost vzniku chaotického chovánı́ u některých mechanických systémů Hamiltonova typu. Bylo to však považováno za kuriozitu a nebyla tomu věnována dalšı́ pozornost. Teprve r. 1963 meteorolog Lorenz s pomocı́ počı́tače ukázal, že u systému třı́ relativně jednoduchých nelineárnı́ch rovnic (čl. 12.2) mohou při vhodné kombinaci parametrů vzniknout chaotické atraktory. Od té doby byla chaosu věnována velká pozornost a dnes existuje velké množstvı́ poznatků o chaotickém chovánı́ systémů prakticky ve všech oblastech vědy a techniky. V dalšı́ch článcı́ch si ukážeme některé jednoduché deterministické systémy, které majı́ při určitých hodnotách parametrů chaotické chovánı́. Vzhledem k tomu, že se neuvažuje nejistota ani ve vstupech ani v modelu systému, nazývá se tento typ chovánı́ deterministický chaos. Chaotické chovánı́ je ohraničené, nenı́ periodické a podobá se náhodnému. Je vysoce citlivé na změnu počátečnı́ch podmı́nek, i při velmi malé změně se odezvy po určité době značně lišı́. Dlouhodobé chovánı́ nelze tedy spolehlivě predikovat (např. nejistota dlouhodobých meteorologických předpovědı́). Fourierův rozklad chaotického průběhu má spojité spektrum. U autonomnı́ch systémů se spojitým časem může chaos vzniknout u 3. řádu a výše, u neautonomnı́ch již u 2. řádu. U systémů s diskrétnı́m časem popsaných diferenčnı́mi rovnicemi s neinvertovatelným zobrazenı́m f (endomorfismus) je chaotické chovánı́ možné už v jednorozměrném přı́padě, u difeomorfismů u 2. řádu a výše. Bylo prokázáno, že chaos se může vyskytnout téměř ve všech typech nelineárnı́ch systémů s dvěma a vı́ce stupni volnosti. Hodnocenı́ chaosu bylo až donedávna výlučně negativnı́. Teprve v poslednı́ch letech se poukazuje také na výhodné vlastnosti systémů s chaotickým chovánı́m. Chaos dovoluje lepšı́ absorpci energie a hybnosti, umožňuje mı́chánı́, je spojován se zdravou aktivitou na rozdı́l od periodického chovánı́ nebo stacionárnı́ho stavu spojovaných s ukončenı́m aktivity. Bylo rovněž ukázáno, že chaos působı́ jako silný organizačnı́ princip, např. v ekonomii nebo biologii. Chaosu lze využı́t k regulaci a byly publikovány některé metody syntézy chaosu [93]. Změny biologických regulačnı́ch mechanismů pomocı́ chaosu patřı́ pravděpodobně k hlavnı́m nástrojům evoluce biosystémů na všech úrovnı́ch organizace. Zdá se, že biosystémy často operujı́ těsně pod úrovnı́ přechodu k chaosu. Deterministický chaos se tak v poslednı́ch letech stal podnětem k formulaci mnoha nových a zásadnı́ch principů a myšlenek. 105 KAPITOLA 12. CHAOS 106 12.1 Chaos v diskrétnı́ch systémech 12.1.1 Kvadratická diferenčnı́ rovnice Klasický přı́klad jednoduchého dynamického systému s možnostı́ chaotického chovánı́ je diskrétnı́ systém s kvadratickým zobrazenı́m xk+1 = f (xk ) = rxk (1 − xk ), (12.1) kde x ∈ [0, 1] a pro 0 < r ≤ 4 se interval [0, 1] zobrazı́ na sebe, tj. f : [0, 1] → [0, 1]. Graf funkce y = rx(1 − x) je parabola symetrická podle přı́mky x = 1/2 a procházejı́cı́ osou x v bodech x = 0 a x = 1. Jejı́ strmost roste s rostoucı́m parametrem r. Vrchol paraboly je v bodě x = 1/2 a jeho pořadnice je r/4 (obr.12.1). Obrázek 12.1: Kvadratické zobrazenı́ Obrázek 12.2: Průběhy funkcı́ f a f 2 Tı́mto systémem lze např. modelovat růst určité populace na omezeném teritoriu. V některých populacı́ch se generace navzájem nepřekrývajı́, žijı́ vždy jen jedinci jedné generace (např. u některých druhů hmyzu). Pak nenı́ splněna podmı́nka překrývánı́ generacı́ pro spojitý model a populačnı́ dynamiku je možno modelovat uvedenou diferenčnı́ rovnicı́. Stavová proměnná xk zde udává počet jedinců nebo jejich hustotu v k-té generaci. Kvadratický člen zabraňuje neomezenému růstu populace, řı́dı́cı́ parametr r popisuje vliv okolı́ na populaci. Pro pevné body zobrazeni f platı́ x = f (x), tj. x = rx(1 − x). Tomu odpovı́dajı́ hodnoty x = 0 a x = 1 − 1/r pro r > 1. Pro různé hodnoty r má systém tyto vlastnosti: a) r ≤ 1. Existuje jen jeden pevný bod x = 0 a protože f 0 (0) = r < 1, je stabilnı́. Řešenı́m rovnice (12.1) je posloupnost hodnot x0 , x1 , x2 , ..., které budou konvergovat k nule. Populace s takovým parametrem r vyhyne. b) 1 < r < 3 . Existujı́ dva pevné body. Bod x = 0 je nynı́ nestabilnı́ a bod x = 1 − 1/r je stabilnı́, protože f 0 = −r + 2 < 1 v intervalu 1 < r < 3. Trajektorie z libovolné počátečnı́ podmı́nky v intervalu (0, 1) konvergujı́ k jednobodovému atraktoru. c) Pro r = 3 nastane bifurkace a druhý pevný bod bude rovněž nestabilnı́. Při dalšı́m zvýšenı́ r bude mı́t funkce f 2 čtyři pevné body. Na obr. 12.2 jsou pro srovnánı́ zakresleny průběhy funkce f a druhé iterace f 2 pro hodnoty r těsně pod hodnotou 3 a nad hodnotou 3. Je patrno, že pro r > 3 má funkce f 2 dva nestabilnı́ pevné body, které odpovı́dajı́ dvěma nestabilnı́m pevným bodům funkce f . Dalšı́ dva jsou stabilnı́ a odpovı́dajı́ periodickému atraktoru funkce f s periodou 2. Při dalšı́m zvyšovánı́ hodnoty r se zvětšuje amplituda periodické orbity a při r = 3, 45 se orbita s periodou 2 stane nestabilnı́ a vznikne stabilnı́ orbita s periodou 4. Graf funkce f 2 má nynı́ všechny čtyři pevné body nestabilnı́, graf čtvrté iterace f 4 bude mı́t kromě nestabilnı́ch pevných bodů také čtyři stabilnı́, které odpovı́dajı́ KAPITOLA 12. CHAOS 107 atraktoru s periodou 4. Toto zdvojovánı́ periody se při stoupajı́cı́m r opakuje a postupně vznikajı́ stabilnı́ orbity s periodou 8, 16, 32,.., přitom se stále zkracujı́ intervaly parametru r, při nichž nastává bifurkace. Posloupnost bifurkačnı́ch hodnot rm , při nichž vznikajı́ stabilnı́ orbity s periodou 2m , je konvergentnı́ s limitou r∞ = 3, 570. d) Při hodnotách r∞ < r < 4 je chovánı́ systému velmi složité. Existuje nekonečně mnoho intervalů parametru r (tzv. periodická okna), ve kterých existujı́ stabilnı́ periodická řešenı́. K jedné hodnotě parametru přı́slušı́ ovšem jen jedna stabilnı́ perioda. Nejširšı́ je okno periody tři. Existujı́ však také hodnoty parametrů, pro které nastává chaotické chovánı́. Velmi názorně to lze ukázat na bifurkačnı́m diagramu podle obr. 12.3. Pro hodnoty r < r∞ = 3, 57 je patrno zdvojovánı́ periody, od r∞ je systém v chaotické oblasti přerušované periodickými okny. Obrázek 12.3: Bifurkačnı́ diagram kvadratického zobrazenı́ Řešenı́ diferenčnı́ rovnice (12.1) vede tedy při zvětšovánı́ řı́dı́cı́ho parametru r od periodického řešenı́ s periodou 2 přes bifurkačnı́ kaskádu zdvojovánı́ period až k neperiodickému chaotickému chovánı́. Tato cesta k chaosu je charakteristická i pro mnoho jiných systémů. 12.1.2 Po částech lineárnı́ zobrazenı́ Ještě jednoduššı́ systémy s chaosem představujı́ zobrazenı́, která jsou po částech lineárnı́. Např. pilovitý průběh podle obr. 12.4 je zadán vztahy xk+1 = f (xk ) f : [0, 1] → [0, 1] f (x) = ( 2x, x ∈ [0, 1/2), 2x − 1, x ∈ [1/2, 1]. (12.2) Je to vlastně zobrazenı́ typu ”modulo” a lze ho zapsat také ve tvaru xk+1 = 2xk (mod 1). Zobrazenı́ je pro x = 1/2 nespojité, je neinvertovatelné a lze proto vyšetřovat jen kladné polotrajektorie. Z obr. 12.4 je patrno, že existujı́ dva pevné body x = 0 a x = 1, oba jsou nestabilnı́. Druhá iterace f 2 (x) = 22 x(mod 1), obecně f N (x) = 2N x(mod 1) pro x 6= 1, f N (1) = 1, takže f N má právě 2N pevných bodů. Některé z nich odpovı́dajı́ orbitám periody N, jiné majı́ nižšı́ periody. Všechny periodické orbity jsou nestabilnı́. KAPITOLA 12. CHAOS 108 Obrázek 12.4: Lineárnı́ zobrazenı́ a jeho druhá iterace Obrázek 12.5: Střechové zobrazenı́ Dalšı́m typem je symetrické ”střechové” zobrazenı́ podle obr. 12.5, vyjádřené vztahy xk+1 = f (xk ) f : [0, 1] → [0, 1] f (x) = ( 2x, x ∈ [0, 1/2], 2 − 2x, x ∈ (1/2, 1]. (12.3) Zobrazenı́ má dva pevné body a konečný počet orbit periody N . Všechny pevné body a periodické orbity jsou nestabilnı́. O tom se lze přesvědčit následujı́cı́m způsobem. Počátečnı́ podmı́nku x0 ∈ [0, 1) můžeme zapsat jako binárnı́ čı́slo x0 = ∞ X ai /2i a1 = 0 nebo 1. i=1 Zobrazenı́ f podle rovnice (12.3) použité na počátečnı́ podmı́nku x0 ∈ [0, 1/2) (tj. a1 = 0) znamená posunutı́ desetinné čárky o jedno mı́sto doprava, pro x0 ∈ [1/2, 1) ještě kromě posunutı́ také negaci každého ai . Pak f (x0 ) = f (0, a1 a2 a3 a4 ...) = ( 0, a2 a3 a4 0, a2 a3 a4 x0 ∈ [0, 1/2) x0 ∈ [1/2, 1) Pro racionálnı́ počátečnı́ podmı́nky je posloupnost {ai } od určitého mı́sta periodická, takže dynamický systém popsaný zobrazenı́m (12.3) se po uplynutı́ určitého přechodného jevu pohybuje po periodické orbitě. Všechny počátečnı́ podmı́nky odpovı́dajı́cı́ racionálnı́m čı́slům vytvářejı́ netypické trajektorie a odpovı́dajı́cı́ periodické orbity jsou nestabilnı́. Iracionálnı́m počátečnı́m podmı́nkám odpovı́dajı́ typické trajektorie, které bloudı́ v celém intervalu (0,1) a vykazujı́ tedy chaotické chovánı́. Také nesymetrické ”střechové” zobrazenı́ xk+1 = f (xk ) f : [0, 1] → [0, 1] f (x) = ( rx, x ∈ [0, 1/r], r(1 − x)/(r − 1), x ∈ (1/r, 1], (12.4) nemá pro r > 1 žádný stabilnı́ pevný bod a žádné stabilnı́ periodické řešenı́, takže skoro všechny trajektorie majı́ chaotický charakter. 12.1.3 Hénonovo zobrazenı́ Doposud uvedená jednorozměrná diskrétnı́ zobrazenı́ byla neinvertovatelná. U invertovatelných zobrazenı́ (difeomorfismů) nastanou chaotické jevy až od 2. řádu. Jako přı́klad může sloužit Hénonovo KAPITOLA 12. CHAOS 109 zobrazenı́ xk+1 = 1 − rx2k + yk , yk+1 = bxk , k∈Z r > 0, |b| < 1. Při určitých hodnotách parametrů vznikne chaotický atraktor. Podrobnosti např. v [43]. 12.2 Chaos u diferenciálnı́ch rovnic 12.2.1 Lorenzův model V r. 1962 studoval Saltzman Navierovy - Stokesovy nelineárnı́ parciálnı́ diferenciálnı́ rovnice popisujı́cı́ zahřı́vánı́ vrstvy tekutiny. Při řešenı́ pomocı́ Fourierových řad se ukázalo, že relativně velkou amplitudu majı́ jen tři členy, z nichž jeden popisuje rychlostnı́ profil a dalšı́ dva rozdělenı́ teploty. Pomocı́ vhodných aproximacı́ zı́skal Saltzman tři obyčejné nelineárnı́ diferenciálnı́ rovnice ẋ = s(y − x) ẏ = rx − y − xz ż = xy − bz, (12.5) kde parametry s, r, b > 0. V r. 1963 prováděl numerické zkoumánı́ tohoto modelu meteorolog Lorenz, který zjistil, že při určitých hodnotách parametrů se objevuje v systému chaotické chovánı́. Od té doby se pro systém (12.5) ujal název Lorenzův model. Uvažujme dále, že parametry s a b jsou pevné a parametr r proměnný. Obrázek 12.6: Lorenzův chaotický atraktor Jsou možné 3 rovnovážné stavy: 1) x(1) = y (1) = z (1) = 0. Tento stav označı́me jako bod p. Odpovı́dá kapalině v klidu a nastává pro libovolné r. 2) x(2) = y (2) = p b(r − 1), z (2) = r − 1 (bod q+ ) 3) x(3) = y (3) = − b(r − 1), z (3) = r − 1 (bod q− ). p Druhý a třetı́ rovnovážný stav existujı́ pro r > 1 a odpovı́dajı́ vzniku konvekčnı́ch buněk. KAPITOLA 12. CHAOS 110 1) Stabilita bodu p: det(A − λI) = −(s + λ) s 0 r −(1 + λ) 0 0 0 −(b + λ) = 0. (12.6) Charakteristická rovnice je (λ + b)[λ2 + (s + 1)λ − s(r − 1)] = 0. (12.7) Bod p = (0, 0, 0) je pro 0 < r < 1 asymptoticky stabilnı́ uzel. Pro r = 1 přecházı́ jedno reálné vlastnı́ čı́slo imaginárnı́ osu (bifurkace). Pro r > 1 je bod p sedlo s dimenzı́ W s (p) = 2. Osa z je z důvodů symetrie částı́ W s (p) . 2) Stabilita bodů q+ a q− : Dosazenı́m do Jacobiovy matice daného systému (12.5) dostaneme charakteristickou rovnici λ3 + (s + 1 + b)λ2 + b(s + r)λ + 2bs(r − 1) = 0. (12.8) Mez stability nastane pro hodnotu parametru r = r+ : r+ = s(s + b + 3) , s − (b + 1) (12.9) Parametr r musı́ být kladný, proto platı́ podmı́nka s > b + 1. Pro 1 < r < r+ jsou tedy oba pevné body asymptoticky stabilnı́. Pro meznı́ podmı́nku r = r+ přecházı́ jeden pár pkomplexně sdružených vlastnı́ch čı́sel Jacobiovy matice imaginárnı́ osu: λ1 = −(s + 1 + b), λ2,3 = ±j b(s + r). Pro r > r+ jsou oba pevné body nestabilnı́ a dimenze W s (q) = 1 a W u (q) = 2. Protože ve W u (q) docházı́ ke spirálnı́mu rozvinovánı́ a v W s (q) k přitahovánı́, jsou body q+ a q− sedla-ohniska. Pro r > r+ neexistuje tedy žádný stabilnı́ pevný bod. Protože Hopfova bifurkace pro r = r+ je subkritická, neexistuje pro r > r+ ani žádný stabilnı́ meznı́ cyklus. Protože také torus je vyloučen, musı́ existovat chaotické řešenı́. Bylo však zjištěno, že při vysokých hodnotách řı́dı́cı́ho parametru r se chaotické atraktory střı́dajı́ se stabilnı́mi limitnı́mi cykly, podobně jako tomu je např. u kvadratického diskrétnı́ho zobrazenı́. Na obr. 12.6 je zakreslen chaotický atraktor pro parametry s = 10, b = 8/3, r = 28. Trajektorie spirálovitě narůstajı́ kolem nestabilnı́ho pevného bodu q+ , pak následuje náhlý skok směrem k q− , kolem něho oscilace zase narůstajı́ atd. (Trajektorie se podobajı́ krouženı́ mouchy mezi dvěma lampami). Atraktor má složitou strukturu, skládá ze z nekonečně mnoha prostorově velmi blı́zko ležı́cı́ch listů [38]. 12.2.2 Jiné modely Lorenzův model nenı́ nejjednoduššı́m systémem se spojitým časem, ve kterém vznikajı́ chaotické atraktory. Je známo mnoho jiných systémů s chaotickým chovánı́m. Např. Rösslerův model ẋ = −y − z, ẏ = x + ay, ż = b + (x − c)z má při určitých pevných hodnotách a, b stabilnı́ limitnı́ cyklus, při růstu řı́dı́cı́ho parametru c probı́hajı́ bifurkace zdvojujı́cı́ periodu a pro c > c∞ vznikajı́ složité chaotické atraktory ve tvaru trychtýře (obr.12.7). Např. při pevných hodnotách a = b = 0, 2 a při proměnném c se měnı́ chovánı́ systému od jednoduchého periodického řešenı́ přes zdvojovánı́ period až k chaotickému chovánı́ pro c > c∞ ≈ 4, 2. KAPITOLA 12. CHAOS 111 Při určitých hodnotách c > c∞ (přibližně v rozsahu 4,25 - 4,5) se dokonce prolı́najı́ dvě chaotická pásma. Při plně vyvinutém chaosu jsou trajektorie na atraktoru narůstajı́cı́ spirály, které se při určité kritické amplitudě velmi rychle vracejı́ k nestabilnı́mu pevnému bodu, a znovu se rozvı́jejı́. Snad nejjednoduššı́ autonomnı́ obvod, ve kterém mohou vzniknout chaotické atraktory je obvod se dvěma kondenzátory, jednou indukčnostı́, jednı́m lineárnı́m a jednı́m nelineárnı́m odporem. Tento obvod popsal Chua [24]. Obrázek 12.7: Rösslerův chaotický atraktor Matematický model Chuova obvodu lze po zavedenı́ poměrných proměnných vyjádřit rovnicemi ẋ = a(y − h(x)) kde h(x) = ẏ = x − y + z    bx + a − b ax   bx − a + b ż = −βy, x≥1 |x| < 1 x ≤ −1 U neautonomnı́ch systémů se spojitým časem mohou vzniknout chaotické jevy od 2.řádu výše. Chaotické chovánı́ se objevuje při určitých hodnotách parametrů např. u buzeného Duffingova oscilátoru (rov. 2.12), Van der Polova oscilátoru (2.16) nebo u parametricky buzeného oscilátoru (2.18). 12.3 Vlastnosti chaotických atraktorů 12.3.1 Ljapunovovy exponenty Chovánı́ trajektoriı́ v okolı́ rovnovážného stavu autonomnı́ho systému ẋ = f (x) se popisuje pomocı́ vlastnı́ch čı́sel matice linearizace (čl.4.2), pro popis chovánı́ trajektoriı́ v okolı́ uzavřené trajektorie γ KAPITOLA 12. CHAOS 112 jsou vhodné jejı́ multiplikátory (čl.10.3). K popisu chovánı́ trajektoriı́ v okolı́ libovolné trajektorie Γ se použı́vajı́ Ljapunovovy exponenty (zvané také charakteristické exponenty), které jsou zobecněnı́m vlastnı́ch čı́sel nebo multiplikátorů. Ljapunovovy exponenty (LE) jsou reálná čı́sla, která lze výhodně použı́t pro klasifikaci nechaotických i chaotických atraktorů. Necht’ Γ(x0 ) je libovolná trajektorie, procházejı́cı́ zvoleným bodem x0 , která odpovı́dá řešenı́ x(t) = Φt (x0 ). Asymptotické chovánı́ trajektoriı́ ležı́cı́ch blı́zko Γ(x0 ) je dáno asymptotickým chovánı́m matice linearizace toku DΦt (x0 ) rovnice ve variacı́ch pro t → ∞. Zvolme v tečném prostoru Tx0 (Rn ) bodu x0 n lineárně nezávislých vektorů, tvořı́cı́ch jeho bázi. Vyberme z nich k vektorů v 1 až v k (1 ≤ k ≤ n), které určujı́ k-rozměrný podprostor, tj. ve stavovém prostoru k-rozměrný rovnoběžnostěn Pk (0) (obr. 12.8). Jeho objem Vk (0) je dán vztahem ||v 1 ∧ v 2 ∧ ... ∧ v k ||, který je normou vnějšı́ho součinu vektorů v 1 , ..., v k . Fázový tok posune bod x0 za čas t do bodu Φt (x0 ) a vektory v i se zobrazı́ na DΦt (x0 )v i , které vytvořı́ rovnoběžnostěn Pk (t). Jeho objem Vk (t) je ||DΦt (x0 )v 1 ∧ ... ∧ DΦt (x0 )v k ||. (12.10) Poznámka: Vnějšı́ součin vektorů (nazývaný také smı́šený součin vektorů) v 1 , v 2 , ..., v n je skalárnı́ součin (u, v n ), kde u =< v 1 , ..., v n−1 > je vektorový součin. Obrázek 12.8: Změna objemu ve fázovém prostoru Definice 12.1. Reálné čı́slo 1 ||DΦt (x0 )v 1 ∧ ... ∧ DΦt (x0 )v k || ln t→∞ t ||v 1 ∧ v 2 ∧ ... ∧ v k || λ(k) (x0 , v 1 , ..., v k ) = lim (12.11) se nazývá k-rozměrný Ljapunovův exponent trajektorie Γ(x0 ) (za předpokladu, že limita existuje). Poznámky: 1. V literatuře je zvykem označovat Ljapunovovy exponenty pı́smenem λ a proto je třeba dát pozor na záměnu se stejným označenı́m pro vlastnı́ čı́sla matic. 2. Volı́me-li v tečném prostoru jen jeden vektor, dostaneme jednorozměrný Ljapunovův exponent 1 ||Dφt (x0 )v|| ln t→∞ t ||v|| λ ≡ λ(1) ≡ λ(x0 , v) = lim (12.12) Jednorozměrné exponenty mohou nabývat při konstantnı́m x0 (tj. pro jednu trajektorii) nejvýše n různých hodnot λ1 ≥ λ2 ≥ λ3 ≥ ... ≥ λn . (12.13) Tyto exponenty popisujı́, jak rychle se odpovı́dajı́cı́ body na vyšetřované a perturbované trajektorii po dlouhé době od sebe vzdálı́ (λ > 0) nebo se k sobě přiblı́žı́ (λ < 0). Citlivá závislost na počátečnı́ch KAPITOLA 12. CHAOS 113 podmı́nkách nastává, je-li alespoň jeden LE kladný. n ) různých hodnot a každý z nich je součtem k jednorozměrných k LE. Např. pro trajektorii v R3 jsou tři dvourozměrné LE 3. k-rozměrné LE mohou nabývat ( (2) λ 1 = λ1 + λ2 (2) (2) λ2 = λ1 + λ3 λ3 = λ 2 + λ 3 . (12.14) 4. Jestliže množina lineárně nezávislých vektorů v 1 , ..., v k je v tečném prostoru Tx0 (Rn ) vybrána náhodně, pak lze dokázat, že pravá strana rovnice (12.11) konverguje s pravděpodobnostı́ jedna k (k) maximálnı́mu k-rozměrnému LE λmax . Vztah (12.12) nenı́ tedy pro určenı́ všech n jednorozměrných LE vhodný, protože všechny volby vektoru v vedou k maximálnı́mu λmax . Použitı́m vztahu (12.11) (1) (n) však můžeme zı́skat (pomocı́ počı́tače) n maximálnı́ch hodnot λmax , ..., λmax , z nichž lze přı́mo vyčı́slit všechny jednorozměrné LE podle vztahů λ1 = λ(1) max (1) λ2 = λ(2) max − λmax ... (n−1) λn = λ(n) max − λmax . (12.15) Jednorozměrné LE jsou vhodné pro klasifikaci ustáleného chovánı́. U diferenciálnı́ch rovnic s dimenzı́ n ≥ 3 mohou nastat čtyři různé typy atraktorů (tři nechaotické a jeden chaotický), které lze klasifikovat podle znamének Ljapunovových exponentů. Nechaotické atraktory 1. Rovnovážný stav: λi < 0, i = 1, ..., n; symbolicky (−, −, ..., −) 2. Limitnı́ cyklus: λ1 = 0, λi < 0 (i = 2, ..., n); (0, −, −, ..., −) 3. Kvaziperiodický atraktor (K-torus): λ1 = λ2 = ... = λK = 0; λi < 0 (i = K + 1, ..., n) (0, 0, ..., 0, −, −, ..., −). U nechaotických atraktorů nenı́ žádný LE kladný. Počet nulových LE nechaotického hyperbolického atraktoru udává (topologickou) dimenzi atraktoru. Rovnovážný stav má dimenzi 0, limitnı́ cyklus 1, K-torus dimenzi K. Obrázek 12.9: Změna objemového elementu u chaotické dynamiky Chaotické atraktory musejı́ mı́t alespoň jeden LE kladný a jeden nulový. Protože současně musı́ být součet LE každého atraktoru záporný, musı́ mı́t chaotický atraktor alespoň tři LE. Odtud vyplývá, že chaos nemůže nastat u autonomnı́ch systémů 1. a 2. řádu a u neautonomnı́ch systémů 1. řádu. Pro 3. řád jsou tedy LE λ1 > 0, λ2 = 0, λ3 < 0. Protože kontrakce musı́ převážit nad expanzı́, musı́ být λ3 < −λ1 . U 4. řádu jsou již tři možnosti, z nichž byly v reálných systémech pozorovány dvě: λ1 > 0, λ2 = 0, λ4 ≤ λ3 < 0 (+, 0, −, −) KAPITOLA 12. CHAOS λ1 ≥ λ2 > 0, λ3 = 0, λ4 < 0 114 (+, +, 0, −) (hyperchaos). Tečný prostor podél trajektorie Γ se rozpadá na tři části, v nichž se trajektorie a) vzdalujı́ exponenciálně rychle od Γ, b) rychlost vzdalovánı́ nebo přibližovánı́ je nižšı́ než exponenciálnı́, c) probı́há exponenciálně rychlá kontrakce ke Γ. Časový vývoj objemového elementu spočı́vá tedy u chaotického atraktoru v tom, že v jednom směru element rychle kontrahuje, v druhém zůstává (v průměru) konstantnı́ a ve třetı́m směru neustále expanduje. Protože však element musı́ zůstat v ohraničené množině uvnitř atraktoru, docházı́ nutně k postupnému skládánı́ a vytvářenı́ komplikované struktury chaotického atraktoru (obr.12.9). Ljapunovovy exponenty lze zı́skat výpočtem na počı́tači podle výše uvedených definičnı́ch vztahů nebo měřenı́m na reálném systému. V obou přı́padech však dostaneme jen vı́ce či méně přesné odhady těchto exponentů. 12.3.2 Dimenze atraktorů Existuje mnoho dynamických systémů, u nichž vznikajı́ chaotické atraktory. Abychom je mohli mezi sebou nějak srovnávat a klasifikovat do určitých třı́d podobnosti, je třeba mı́t k dispozici vhodný deskriptor, který by jednoduše a výstižně tyto atraktory charakterizoval. Takovým deskriptorem nemohou být původnı́ rovnice dynamického systému, protože bez podrobné analýzy se z nich nepozná složitost chovánı́. Navı́c je třeba studovat i systémy, u nichž předpokládáme existenci chaotického atraktoru, ale jejichž dynamický popis neznáme. Pro charakterizaci atraktorů nejsou také vhodné časové průběhy veličin, protože i u jednoho systému jsou při velmi citlivé závislosti na počátečnı́ch podmı́nkách každé dva průběhy značně odlišné. Srovnávánı́ průběhů pro dva různé systémy by proto bylo naprosto nesmyslné. Pro charakteristiku periodičnosti procesů lze použı́t autokorelačnı́ funkce nebo výkonové spektrálnı́ hustoty. Pro studium chaotických procesů, které jsou podstatně složitějšı́ než procesy periodické, jsou však nevýhodné. Poskytujı́ málo informace a navı́c popisujı́ systém velmi nepřesně, protože systémy velmi odlišné mohou mı́t řešenı́ s přibližně stejnými spektry. Byly proto navrženy některé speciálnı́ charakteristiky, které se obvykle nazývajı́ dimenze. Ty odrážejı́ určité kvalitativnı́ rysy chovánı́ dynamického systému, jako je např. složitost atraktoru, lze z nich odhadnout dolnı́ hranici počtu proměnných potřebných k modelovánı́ dynamického chovánı́ na atraktoru, resp. je lze chápat jako množstvı́ informace nutné k určenı́ polohy bodu na atraktoru s danou přesnostı́. Dimenze charakterizujı́ vlastnosti atraktoru jediným čı́slem a jsou invariantnı́ vůči spojité změně souřadnic stavového prostoru. To je důležité, protože při volbě jiné reprezentace, která vznikne spojitou transformacı́ původnı́ch veličin, se typ procesu neměnı́ a neměla by se proto měnit ani hodnota přı́slušné dimenze. Existuje mnoho definic dimenze, v základě je však lze rozdělit na dvě velké skupiny. Prvnı́ typ závisı́ jen na metrických vlastnostech, druhý pak na pravděpodobnostnı́ch vlastnostech, tj. závisı́ na frekvenci, s nı́ž typická trajektorie procházı́ různými částmi atraktoru. Mnoho přı́kladů potvrzuje domněnku, že dimenze prvnı́ skupiny dávajı́ tutéž hodnotu, která se obecně lišı́ od hodnoty, kterou dávajı́ definice druhé skupiny. Metrické dimenze. Jako přı́klad této skupiny dimenzı́ může sloužit Kolmogorovova dimenze zvaná také kapacita nebo fraktálnı́ dimenze ln N (ε) dK = lim (12.16) ε→0 ln(ε−1 ) kde N (ε) je minimálnı́ počet n-rozměrných krychliček o straně ε, potřebných k pokrytı́ uvažované množiny. Jestliže limita neexistuje, nelze dimenzi definovat. KAPITOLA 12. CHAOS 115 Uvedený vztah můžeme odvodit touto úvahou. Část stavového prostoru obsahujı́cı́ atraktor budeme uvažovat jako jednotkový objem, rozdělený pravidelnou mřı́žı́ krychliček o hraně ε. Počet krychliček N pokrývajı́cı́ch atraktor bude N = 1/εn , kde n je topologická dimenze daného stavového prostoru. Logaritmovánı́m tohoto vztahu dostaneme výraz n=− lnN lnN = . lnε ln(ε−1 ) (12.17) Abychom vyjádřili hustotu pokrytı́ dané části stavového prostoru atraktorem, budeme uvažovat pouze ty krychle, ve kterých ležı́ alespoň jeden bod atraktoru. Počet takových krychlı́ označme N (ε) a dosad’me do vztahu (12.17) za N . Tı́m dostaneme nějaké čı́slo dK (ε) = −lnN (ε)/lnε. Zvolı́me-li ε dostatečně velké, budou trajektorie atraktoru procházet všemi krychlemi a bude N = N (ε) a dK (ε) = n. Při postupném zmenšovánı́ ε nebude již atraktor procházet všemi krychlemi a bude platit, že N (ε) < N a dK (ε) < n. Čı́m bude ε menšı́, tı́m přesněji bude přı́slušné dK (ε) charakterizovat vyplněnı́ zvolené části stavového prostoru atraktorem. V určitém smyslu nejlepšı́ charakteristiku dostaneme, vezmeme-li limitu ln N (ε) dK = lim dK (ε) = lim . (12.18) ε→0 ε→0 − ln ε Takto definované čı́slo je právě Kolmogorovova dimenze (12.16). Tato dimenze odrážı́ kvalitativně mı́ru složitosti daného atraktoru. Např. jednobodový atraktor (rovnovážný stav) má dK = 0, protože pro libovolné ε je N (ε) = 1. To odpovı́dá intuitivnı́ představě, že bod nezaplňuje žádný prostor. Dále lze ukázat, že dimenze hladké křivky (např. limitnı́ho cyklu) je 1, dimenze hladké plochy je 2, hladké kplochy je k. To platı́ i pro jiné dimenze, které budou dále uvedeny. Numerické výpočty Kolmogorovovy dimenze fraktálnı́ch množin a chaotických atraktorů dávajı́ necelá čı́sla. Přı́klad 12.1. Dimenze jednotkového intervalu. Pokryjme jednotkový interval [0, 1] objemovými elementy (intervaly) o délce ε = 1/3k . K pokrytı́ je třeba N (ε) = 3k těchto objemových elementů. Pro k → ∞ bude ln3k = 1. k→∞ ln3k dK = lim Jednotkový interval má tedy fraktálnı́ dimenzi 1. Přı́klad 12.2. Cantorova fraktálnı́ množina vzniká iteračně postupným vynechávánı́m prostřednı́ch třetin nejprve z intervalu [0, 1], pak ze zbývajı́cı́ch dvou subintervalů [0,1/3], [2/3,1] atd. Použijeme-li k pokrytı́ zase elementy o délce ε = 1/3k , je v k-tém kroku počet potřebných elementů N (ε) = 2k a ln2k ln2 = = 0, 6309... k k→∞ ln3 ln3 dK = lim Cantorova množina nenı́ ani bod (s dimenzı́ 0), ani spojitý interval (s dimenzı́ 1). Fraktálnı́ množiny majı́ tedy neceločı́selné dimenze. Dimenze závislé na pravděpodobnostnı́ch vlastnostech. Přı́kladem dimenze tohoto typu je informačnı́ dimenze (Hausdorffova dimenze), která bere v úvahu také relativnı́ pravděpodobnost použitých krychliček. Je dána vztahem H(ε) , ε→0 ln (ε−1 ) dI = lim N (ε) H(ε) = X Pi ln(1/Pi ), (12.19) i=1 kde Pi je pravděpodobnost průchodu trajektoriı́ atraktoru i-tou krychličkou. H(ε) je vzhledem ke své definici informačnı́ entropie. Hausdorffova dimenze lépe odrážı́ vnitřnı́ strukturu chaotických atraktorů KAPITOLA 12. CHAOS 116 než fraktálnı́ dimenze, protože bere vlastně v úvahu i časové chovánı́ dynamického systému. Přı́klad 12.3. Předpokládejme zase, že atraktor je jednotkový interval a že hustota pravděpodobnosti je konstantnı́. Volme opět elementy pokrytı́ o délce ε = 1/3k . Pak N (ε) = 3k a Pi = 1/3k . Entropie k H(ε) = − 3 X 1 i=1 3k ln 1 = ln3k . 3k Informačnı́ dimenze ln3k = 1. k→∞ ln3k Dimenze dI = dK . Obecně platı́ dK ≥ dI , i když jejich numerický rozdı́l nemusı́ být velký. Např. pro Lorenzův atraktor při parametrech s = 10, b = 8/3, r = 24, 74 je dK = 2, 08 a dI = 2, 06. dI = lim Obě dimenze majı́ některé zajı́mavé vlastnosti. Zaokrouhlı́me-li jejich hodnotu nahoru na nejbližšı́ celé čı́slo, dostaneme topologickou dimenzi nejmenšı́ho stavového prostoru, který zahrne bez zkreslenı́ celý vyšetřovaný atraktor. Ljapunovova dimenze dL je dána vztahem dL = k + Pk i=1 λi |λk+1 | (12.20) Ljapunovovy exponenty atraktoru dynamického systému se spojitým časem jsou λ1 ≥ ... ≥ λn . Čı́slo k ve vztahu (12.20) je takové největšı́ celé čı́slo, pro které platı́ λ1 + ... + λk ≥ 0, a λk+1 je v absolutnı́ hodnotě nejmenšı́ záporný exponent. Ljapunovovy exponenty λi jsou tedy v relaci s dimenzı́ atraktoru. Pro stabilnı́ hyperbolický rovnovážný stav je dL = 0. Stabilnı́ limitnı́ cyklus má λ1 = 0, ostatnı́ Ljapunovovy exponenty jsou záporné, proto dL = 1. U chaotického atraktoru je Ljapunovova dimenze téměř vždy neceločı́selná. Numerické výpočty ukazujı́, že pro typický atraktor je dI = dL . Tento vztah má význam zejména při počı́tačových experimentech, protože Ljapunovovy exponenty se zjišt’ujı́ obvykle jednodušeji než dimenze. Kapitola 13 Metoda ekvivalentnı́ch přenosů Metoda ekvivalentnı́ch přenosů, známá také pod názvem metoda harmonické rovnováhy, je odvozena z asymptotických metod pro řešenı́ nelineárnı́ch systémů. Jejı́m základem je Krylovova a Bogoljubovova metoda harmonické linearizace. V letech 1947 až 1950 byla metoda ekvivalentnı́ch přenosů v pěti různých zemı́ch téměř nezávisle na sobě rozpracována pro praktické řešenı́ nelineárnı́ch problémů. Metoda umožňuje předevšı́m stanovit existenci meznı́ch cyklů, jejich počet a stabilitu. Je jı́ však možno využı́t i pro jednoduché syntézy nelineárnı́ch obvodů, pro vkládánı́ vhodných korekčnı́ch členů za účelem stabilizace apod. Rozšı́řenı́m základnı́ verze metody lze pak řešit i stabilitu buzených obvodů, existenci a vlastnosti subharmonických a ultraharmonických kmitů, skokových rezonancı́ apod. 13.1 Princip metody ekvivalentnı́ch přenosů pro jeden vstup Nejprve budeme vyšetřovat existenci periodických ustálených stavů autonomnı́ch systémů s jednou oddělenou stacionárnı́ nelinearitou a s lineárnı́mi členy, které jsou soustředěny do členu G(jω) (obr.13.1). Vzniknou-li v obvodu ustálené kmity, budou v různých mı́stech obvodu obecně periodické, ale neharmonické, zejména na výstupu nelinearity. Obrázek 13.1: Blokové schéma nelin. systému Budeme předpokládat, že lineárnı́ člen filtruje vyššı́ harmonické tohoto průběhu e2 (t), takže na výstupu lineárnı́ho prvku a tı́m také na vstupu nelinearity bude přı́tomna jen prvnı́ harmonická z výstupnı́ho signálu nelinearity. Za těchto předpokladů můžeme definovat tzv. ekvivalentnı́ přenos N nelineárnı́ho prvku jako poměr prvnı́ harmonické výstupu e2 (t) k sinovému signálu e1 (t) na vstupu nelinearity. Při vyšetřovánı́ existence autooscilacı́ v obvodu pak nahradı́me nelineárnı́ člen ekvivalentnı́m přenosem N a sestavı́me charakteristickou rovnici obvodu N G + 1 = 0, kterou řešı́me analogickými metodami, použı́vanými v teorii lineárnı́ch systémů. Při odvozenı́ metody budeme vycházet z těchto předpokladů: 1. Na výstupu nelineárnı́ho členu uvažujeme jen prvnı́ harmonickou. To znamená, že se bud’ musı́ 117 KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 118 nelineárnı́ charakteristika členu málo lišit od lineárnı́ho průběhu nebo lineárnı́ část musı́ mı́t vlastnosti dolnofrekvenčnı́ propusti (má-li rezonanci, musı́ být špička v oblasti prvnı́ harmonické). 2. Charakteristiky systému jsou časově invariantnı́. 3. Systém obsahuje jen jednu nelinearitu (na vı́ce nelinearit rozšı́řı́me metodu v čl. 13.5) 4. Při sinovém vstupu nemá výstup z nelinearity konstantnı́ složku (uvažujeme zatı́m jen nelineárnı́ členy s lichými statickými charakteristikami - na jiné typy charakteristik rozšı́řı́me metodu v čl. 13.6). Prvnı́ dva předpoklady jsou nezbytné, dalšı́ dva použijeme jen pro odvozenı́ základnı́ verze metody a v dalšı́ch článcı́ch ukážeme řešenı́ i bez těchto omezenı́. Odvozenı́ ekvivalentnı́ho přenosu pro jeden vstup Přivedeme-li na nelineárnı́ prvek (obr.13.1) vstupnı́ signál e1 (t) = A sin ωt (13.1) bude výstup e2 (t) obsahovat vyššı́ harmonické. Můžeme ho rozložit ve Fourierovu řadu e2 (t) = a1 sin ωt + a2 sin 2ωt + ... + b0 + b1 cos ωt + b2 cos 2ωt + ... (13.2) Podle předpokladu 4 bude člen b0 = 0. Uvažujeme-li na výstupu jen prvnı́ harmonickou, pak e2 (t) ≈ Aa(A, ω) sin ωt + Ab(A, ω) cos ωt, (13.3) položı́me-li a1 = Aa, b1 = Ab. Koeficienty u sinové a kosinové složky jsou obecně funkcı́ vstupnı́ amplitudy A a kruhové frekvence ω. Pro nelineárnı́ člen budeme nynı́ definovat jeho ekvivalentnı́ přenos jako poměr prvnı́ harmonické výstupnı́ho signálu k sinovému vstupu stejným způsobem jako pro lineárnı́ systémy (pomocı́ symbolicko-komplexnı́ metody). Pak Ê2 N (A, ω) = Ê1 = A[a(A, ω) + jb(A, ω)] = a(A, ω) + jb(A, ω). A (13.4) Přenos má obecně reálnou a imaginárnı́ složku a je funkcı́ amplitudy i frekvence vstupnı́ho signálu. Můžeme ho vyjádřit také pomocı́ amplitudy a fáze ve tvaru N (A, ω) = |N (A, ω)| ejγ(A, ω) , (13.5) kde |N (A, ω)| = q [a(A, ω)]2 + [b(A, ω)]2 γ(A, ω) = arctg b(A, ω) . a(A, ω) (13.6) Ekvivalentnı́ přenos můžeme vynášet do komplexnı́ roviny nebo do logaritmických souřadnic. Často se použı́vá inverznı́ hodnota ekvivalentnı́ho přenosu N −1 (A, ω) = 1 . N (A, ω) (13.7) Pro různé nelineárnı́ členy jsou v literatuře vypočı́tány a vykresleny ekvivalentnı́ přenosy v různých souřadnicı́ch. Pro výpočty koeficientů prvnı́ harmonické Fourierovy řady platı́ vztahy 2 a1 = T Z T e2 (t) sin ωtdt 0 2 b1 = T Z T e2 (t) cos ωtdt. (13.8) 0 Pro T = 2π/ω dostaneme výsledné vztahy a(A, ω) = a1 (A, ω) ω = A πA Z 0 2π/ω e2 (t) sin ωtdt (13.9) KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ b1 (A, ω) ω b(A, ω) = = A πA Z 119 2π/ω e2 (t) cos ωtdt (13.10) 0 Ekvivalentnı́ přenos se velmi často uvažuje ve tvaru N (A, ω) = KN N0 (A, ω), kde KN je konstanta nelinearity a N0 (A, ω) je normovaný ekvivalentnı́ přenos, který je v literatuře k dispozici ve formě tabulek a grafů. 13.2 Ekvivalentnı́ přenosy pro frekvenčně nezávislé nelinearity Při praktickém řešenı́ jednoduššı́ch nelineárnı́ch systémů se vyskytujı́ nejčastěji nelinearity, které jsou definovány jen statickou závislostı́, bud’ v analytickém tvaru nebo tabulkou či grafem. Výstupnı́ signál e2 = φ(e1 ) takové nelinearity závisı́ jen na okamžité hodnotě vstupu a ne na jeho derivacı́ch a integrálech. Ekvivalentnı́ přenos nebude v tomto přı́padě záviset na frekvenci ω a bude jen funkcı́ amplitudy N (A). Aby Fourierova řada výstupnı́ho signálu neměla podle předpokladu 4 konstantnı́ složku b0 , budeme uvažovat pouze liché charakteristiky, pro které platı́ φ(−e1 ) = −φ(e1 ). Obrázek 13.2: Průběhy signálů u trojpolohové charakteristiky Pro výpočet koeficientů položı́me ve vzorcı́ch (13.9) a (13.10) ωt = ψ. Pak a(A) = b(A) = 1 πA Z 2π 1 πA Z 2π e2 (ψ) sin ψdψ (13.11) e2 (ψ) cos ψdψ (13.12) 0 0 Imaginárnı́ složka b(A) je úměrná ploše statické charakteristiky nelineárnı́ho členu. Podle rovnice (13.12) totiž platı́ b(A) = 1 πA2 + Z Z 0 2π 1 φ(A sin ψ)d(A sin ψ) = πA2 0 φ(e1 )de1 + A Z −A φ(e1 )de1 + 0 Z "Z A φ(e1 )de1 + 0 # 0 −A φ(e1 )de1 = S , πA2 kde S je plocha uzavřená větvemi statické charakteristiky nelinearity. Pro jednoznačné charakteristiky je tedy b(A) = 0, přenos N (A) má tedy jen reálnou část. Přı́klad 13.1. Nelineárnı́ člen s trojpolohovou charakteristikou podle obr. 13.2 má ekvivalentnı́ přenos N (A) = a(A) = 4 πA Z π/2 α M sin ψ dψ = 4M cos α, πA KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 120 kde α = arcsin (δ/A), b(A) = 0. Abychom mohli vyšetřovat vlastnosti různých systémů, ve kterých je použito této nelinearity, ale s různými konstantami δ a M , je výhodné uvažovat vstupnı́ amplitudu v poměrné hodnotě A/δ. Použijeme pak normovaného přenosu pro poměrné amplitudy r r A 4M 4M δ 2 M 4 δ δ A A cos α = 1−( ) = 1 − ( )2 = KN N0 ( ), N ( ) = a( ) = δ δ πA πA A δ πA A δ kde KN = M/δ je konstanta nelinearity a zbytek výrazu tvořı́ normovaný ekvivalentnı́ přenos (pro poměrnou amplitudu) N0 (A/δ). Na obr. 13.3a je tento přenos zobrazen v závislosti na A/δ, na obr. 13.3b,c je vynesen N0 a N0−1 do komplexnı́ roviny, na obr.13.3d do souřadnic amplituda (v dB) - fáze (tzv. Nicholsův graf). Obr.13.3. Průběh normovaného ekvivalentnı́ho přenosu trojpolohového prvku a) závislost na poměrné amplitudě b) N0 v komplexnı́ rovině c) inverznı́ normovaný přenos v komplexnı́ rovině d) inverznı́ přenos v Nicholsově grafu Některé analytické výrazy pro ekvivalentnı́ přenosy jednoduššı́ch nelinearit jsou uvedeny v tab. 13.1. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 121 Tab. 13.1. Analytické vyjádřenı́ ekvivalentnı́ch přenosů jednoduchých nelinearit Složité typy nelinearit dávajı́ velmi nepřehledné vzorce a pro praktické účely se hodı́ jen jejich KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ grafické zobrazenı́. Obr. 13.4a Obr. 13.4b Obr. 13.4c 122 KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 123 Na obr. 13.4a,b,c jsou vyneseny průběhy normovaných ekvivalentnı́ch přenosů třı́ často se vyskytujı́cı́ch nelinearit. Normované přenosy v komplexnı́ rovině jsou pro dvě typické nelinearity na obr. 13.5 a 13.6. Obr. 13.5. Inverznı́ normovaný ekvivalentnı́ přenos v komplexnı́ rovině Obr. 13.6. Inverznı́ normovaný ekvivalentnı́ přenos hystereznı́ charakteristiky 13.3 Ekvivalentnı́ přenosy pro frekvenčně závislé nelinearity Při řešenı́ nelineárnı́ch systémů se vyskytujı́ také nelinearity, které jsou frekvenčně závislé. Jsou popsány nelineárnı́ diferenciálnı́ rovnicı́ a jejich ekvivalentnı́ přenos bude funkcı́ amplitudy i frekvence. Jako přı́klad může sloužit blok, který má v přı́mé větvi lineárnı́ prvek a ve zpětné vazbě statickou nelinearitu (obr. 13.7). Ekvivalentnı́ přenos mezi vstupem e1 a výstupem e2 je frekvenčně závislý. Na tento typ přenosů vede také řešenı́ systémů s většı́m počtem nelinearit, i když jednotlivé nelinearity KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 124 jsou frekvenčně nezávislé (čl. 13.5). Výpočet ekvivalentnı́ch přenosů pro frekvenčně závislé nelinearity lze provést různými metodami. V jednoduššı́ch přı́padech analyticky, častěji však jen pomocı́ počı́tače. Vykreslenı́ ekvivalentnı́ho přenosu v komplexnı́ rovině provádı́me tak, že pro zvolenou konstantnı́ frekvenci vypočı́táme a vyneseme jednu křivku pro různé vstupnı́ amplitudy. Přı́klad bude uveden v čl. 13.5. Obr. 13.7 13.4 Periodická řešenı́ autonomnı́ch systémů V nelineárnı́m autonomnı́m systému, jehož lineárnı́ část je soustředěna v přenosu G(jω) a nelinearita je nahrazena ekvivalentnı́m přenosem N (A, ω) (obr. 13.8), vzniknou ustálené kmity, bude-li platit Ê1 = −Ê3 . Tato podmı́nka znamená, že v rozpojeném obvodu při sinovém signálu e1 na vstupu nelineárnı́ho členu bude mı́t výstup e3 z lineárnı́ho členu stejnou amplitudu jako vstup a fázi otočenou o 1800 . Upravı́me-li uvedený vztah na Ê1 Ê2 =− Ê3 Ê2 Obr. 13.8 a dosadı́me-li za Ê3 Ê2 = G(jω) a Ê2 Ê1 = N (A, ω), dostaneme komplexnı́ rovnici G(jω)N (A, ω) + 1 = 0, (13.13) která je analogická charakteristické rovnici lineárnı́ho obvodu. Jejı́m řešenı́m zı́skáme přibližné hodnoty amplitud a frekvencı́ prvnı́ch harmonických limitnı́ch cyklů v obvodu. Řešenı́ rovnice (13.13) lze provést KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 125 různým způsobem: a) Analytické řešenı́ je vhodné pro zjištěnı́ obecných závislostı́, ale u složitých nelinearit a při vysokém řádu lineárnı́ části je velmi pracné a nevede bez použitı́ počı́tače k cı́li. Rovnici (13.13) můžeme psát ve tvaru [a(A, ω) + jb(A, ω)] [ReG(jω) + jImG(jω)] + 1 = 0. (13.14) Rozložı́me-li tuto komplexnı́ rovnici na reálnou a imaginárnı́ část U (A, ω) + jV (A, ω) = 0, pak řešenı́m soustavy U (A, ω) = 0, V (A, ω) = 0 nalezneme amplitudy Ai a základnı́ frekvence ωi všech meznı́ch cyklů. Kmity budou existovat, vyjdou-li odpovı́dajı́cı́ páry Ai , ωi reálné a kladné. Nalezené hodnoty amplitud představujı́ amplitudy kmitů na vstupu nelineárnı́ho členu. Zjistı́me-li existenci limitnı́ch cyklů, je třeba ještě stanovit jejich stabilitu, protože kmity mohou být stabilnı́ nebo nestabilnı́. Je možno dokázat [21], že periodické řešenı́ bude stabilnı́ při ∂U ∂V ∂U ∂V − > 0. ∂A ∂ω ∂ω ∂A (13.15) b) Grafické řešenı́ v komplexnı́ rovině je pro složitějšı́ systémy výhodnějšı́ než analytické. Aby byla splněna rovnice (13.13) musı́ platit např. G(jω) = − 1 N (A, ω) nebo 1 = −N (A, ω) G(jω) (13.16) nebo dalšı́ dvě možnosti s prohozenými znaménky. Budeme použı́vat prvnı́ tvar, který se pro frekvenčně nezávislé nelinearity zjednodušı́ na 1 G(jω) = − . (13.17) N (A) Do komplexnı́ roviny budeme vynášet frekvenčnı́ charakteristiku lineárnı́ části a záporný inverznı́ ekvivalentnı́ přenos (obr. 13.9). Průsečı́ky obou křivek určujı́ amplitudy a frekvence autooscilacı́. Jestliže se křivky neprotı́najı́, nevznikajı́ zpravidla v reálném systému autooscilace. Toto tvrzenı́ je však třeba brát opatrně, protože je někdy řešenı́ obvodu nepřı́pustně zjednodušeno, např. se neuvažovala některá nelinearita. Rovněž nemusejı́ platit předpoklady pro použitı́ metody ekvivalentnı́ch přenosů (např. lineárnı́ člen dostatečně nefiltruje vyššı́ harmonické). U naprosté většiny přı́padů však odhadneme fyzikálnı́m názorem, zda při neprotnutı́ křivek skutečně nenastávajı́ v systému autooscilace, přı́padně ověřı́me zı́skané výsledky simulacı́ na počı́tači. Křivky na obr. 13.9 se protı́najı́ ve dvou bodech P a Q. Je třeba určit, který z průsečı́ků odpovı́dá stabilnı́mu a který nestabilnı́mu limitnı́mu cyklu. Pro vyšetřenı́ stability, např. bodu P, předpokládejme malou změnu amplitudy A o ∆A. Aby bod P odpovı́dal stabilnı́m kmitům, musı́ být při zvětšené amplitudě A (tj. při kladném ∆A) oscilace tlumené a při zmenšené amplitudě A musı́ narůstat. Podle rovnice (13.17) a obr. 13.9 je tedy pro stabilnı́ meznı́ cyklus zapotřebı́, aby při kladném ∆A byl vektor odpovı́dajı́cı́ −N −1 (A) většı́ než G(jω), tj. 01 > 02. Pro záporné ∆A je pak třeba, aby −N −1 (A) bylo menšı́ než G(jω), tj. 03 < 04. Bod P odpovı́dá tedy stabilnı́mu meznı́mu cyklu a určuje reálné autooscilace v obvodu. Stejným způsobem zjistı́me, že bod Q odpovı́dá nestabilnı́mu meznı́mu cyklu. Při počátečnı́ch podmı́nkách amplitud menšı́ch než A, určené bodem Q, budou tedy v obvodu tlumené kmity. Pro většı́ počátečnı́ podmı́nky se obvod rozkmitává a kmity se ustálı́ na amplitudě a kmitočtu, které jsou dány bodem P. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ Obr.13.9 126 0br.13.10 Je-li ekvivalentnı́ přenos závislý na frekvenci, lze podmı́nku existence kmitů vyjádřit ve tvaru G(jω) = − 1 N (A, ω) (13.18) Řešenı́ v komplexnı́ rovině je již obtı́žnějšı́. Pro určitou zvolenou frekvenci ω = ω1 je záporný inverznı́ ekvivalentnı́ přenos už jen funkcı́ amplitudy a můžeme jej vynést do komplexnı́ roviny jako jednu křivku. Pro jinou hodnotu ω = ω2 zı́skáme dalšı́ křivku atd. K této jednoparametrické soustavě křivek přikreslı́me frekvenčnı́ charakteristiku lineárnı́ části (obr.13.10). Autooscilace odpovı́dajı́ jen těm průsečı́kům, ve kterých souhlası́ hodnoty frekvencı́. c) Grafické řešenı́ v logaritmických souřadnicı́ch je méně přehledné, protože je třeba vykreslovat dva grafy, jeden pro amplitudy a jeden pro fáze. Výhodou je snadné vynášenı́ frekvenčnı́ch charakteristik lineárnı́ části obvodu. d) Grafické řešenı́ v Nicholsově grafu (amplituda v dB - fáze ve stupnı́ch). Tento způsob spojuje výhody předchozı́ch metod. Řešenı́ se provádı́ v jediném obrázku a charakteristiky lineárnı́ části se rychle vynášejı́. 13.5 Nelineárnı́ systémy s většı́m počtem nelinearit Metodu ekvivalentnı́ch přenosů lze rozšı́řit i na vyšetřovánı́ stability autonomnı́ch obvodů s většı́m počtem nelinearit, které jsou od sebe odděleny lineárnı́mi členy nebo kde jsou nelinearity ve zpětných vazbách kolem lineárnı́ch členů. Uvažujme např. obvod podle obr. 13.11. Obr. 13.11. Obvod s většı́m počtem nelinearit KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 127 Rozpojme smyčku na vstupu do prvnı́ nelinearity a přived’me na tento vstup signál e1 = A1 sin ωt, v komplexnı́m zápisu Ê1 = A1 exp(jωt). Předpokládejme, že z periodického kmitánı́ na výstupu prvnı́ nelinearity projde na výstup lineárnı́ho členu G1 jen prvnı́ harmonická, vyššı́ harmonické budou prvkem G1 dostatečně odfiltrovány. Na vstupu druhého nelineárnı́ho členu bude proto opět sinový kmit e3 = A3 sin (ωt + φ). Pak platı́ obecně Ê2 = N1 (A1 , ω)Ê1 Ê3 = G1 (jω)Ê2 Ê4 = N2 (A3 , ω)Ê3 Ê5 = G2 (jω)Ê4 Aby mohly v uzavřeném obvodu existovat autooscilace, musı́ platit Ê5 = −Ê1 (13.19) Dosadı́me-li z předchozı́ch vztahů, dostaneme podmı́nku G1 (jω)G2 (jω)N1 (A1 , ω)N2 (A3 , ω) = −1. (13.20) Označı́me-li celkový přenos lineárnı́ části G(jω) = G1 (jω)G2 (jω), můžeme podmı́nku existence kmitů zapsat např. ve tvaru 1 (13.21) G(jω) = − N1 (A1 , ω)N2 (A3 , ω) Ekvivalentnı́ přenos N2 (A3 , ω) je funkcı́ frekvence a amplitudy A3 , která při zvolené hodnotě A1 již nenı́ nezávislá a je třeba ji vypočı́tat podle vztahu A3 = |G1 (jω)||N1 (A1 , ω)|A1 . Pak (13.22) 0 N2 (A3 , ω) = N2 (|G1 (jω)||N1 (A1 , ω)|A1 ; ω) = N2 (A1 , ω). (13.23) Podmı́nka harmonické rovnováhy platná pro vznik autooscilacı́ je G(jω) = − 1 = −N −1 (A1 , ω) 0 N1 (A1 , ω)N2 (A1 , ω) (13.24) I v přı́padě, že obě nelinearity majı́ ekvivalentnı́ přenos závislý jen na amplitudě, bude po přepočtu 0 podle rovnice (13.22) N2 funkcı́ amplitudy i frekvence a rovněž tak i výsledné přenosy N nebo N −1 . Řešenı́ vztahu (13.24) lze zase provést bud’ analyticky (vede však většinou na velmi komplikované výrazy) nebo graficky. Při většı́m počtu nelinearit je postup obdobný. 13.6 Nelineárnı́ systémy s nesymetrickými vlastnı́mi kmity V nelineárnı́ch systémech mohou kromě symetrických vlastnı́ch kmitů vznikat také kmity nesymetrické. Objevujı́ se předevšı́m při nesymetrické nelineárnı́ charakteristice (při působenı́ vnějšı́ch budı́cı́ch signálů i bez nich), vlivem konstantnı́ho nebo pomalu se měnı́cı́ho budı́cı́ho signálu i při symetrické nelineárnı́ charakteristice a v mnoha jiných přı́padech. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 128 Obr.13.12 Obr.13.13 Na obr. 13.12 je zakreslena nesymetrická nelinearita, u nı́ž vznikajı́ na výstupu nesymetrické kmity i při symetrickém vstupnı́m signálu. U symetrické nelinearity na obr. 13.13 má výstup konstantnı́ složku jen při nesymetrickém vstupnı́m kmitu e1 . Řešenı́ stability nelineárnı́ho systému se provádı́ obdobně jako u systému se symetrickými vlastnı́mi kmity. Předpokládá se zase, že vlivem filtračnı́ho účinku lineárnı́ho členu G jsou potlačeny vyššı́ harmonické, takže vstup na nelinearitu můžeme uvažovat ve tvaru e1 = A0 + A sin ωt. Výstupnı́ signál rozložı́me ve Fourierovu řadu a zanedbáme vyššı́ harmonické, konstantnı́ složku označı́me a0 . Pak e2 ≈ a0 (A0 , A, ω) + Aa(A0 , A, ω) sin ωt + Ab(A0 , A, ω) cos ωt, (13.25) kde všechny tři členy jsou obecně funkcı́ A0 , A, ω. Pro výpočet Fourierových koeficientů platı́ vztahy a0 (A0 , A, ω) = ω 2π Z 2π/ω ω πA Z 2π/ω ω b(A0 , A, ω) = πA Z 2π/ω a(A0 , A, ω) = e2 (t)dt (13.26) e2 (t) sin ωtdt (13.27) e2 (t) cos ωtdt (13.28) 0 0 0 KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 129 Definujeme-li ekvivalentnı́ přenos opět vztahem N (A0 , A, ω) = a(A0 , A, ω) + jb(A0 , A, ω), (13.29) představuje metoda ekvivalentnı́ch přenosů současné ověřenı́ platnosti dvou podmı́nek, a to podmı́nky stejnosměrné a střı́davé rovnováhy. Podmı́nka stejnosměrné rovnováhy definuje vztahy mezi konstantnı́mi složkami A0 = e10 na vstupu a e20 na výstupu nelinearity. Složka e20 musı́ být v rovnováze s e10 přes lineárnı́ část obvodu. Podmı́nku stejnosměrné rovnováhy lze tedy psát ve tvaru A0 = e10 = w − Ke20 (A0 , A, ω), (13.30) kde K je zesı́lenı́ lineárnı́ části obvodu pro konstantnı́ signál a w je vstup zpětnovazebnı́ho obvodu. Obsahuje-li přenos lineárnı́ části pól v počátku, musı́ být e20 rovno nule, aby e30 bylo konečné. Podmı́nka střı́davé rovnováhy je definována stejnými vztahy jako pro symetrické oscilace, tj. N (A0 , A, ω) G(jω) + 1 = 0. (13.31) Ekvivalentnı́ přenos je nynı́ obecně funkcı́ třı́ proměnných. V jednoduššı́ch přı́padech, kdy na vstupu obvodu je nulový nebo konstantnı́ vstupnı́ signál w, je také e10 = A0 rovno konstantě a z podmı́nky pro stejnosměrnou rovnováhu zı́skáme velikost A0 jako funkci A, ω. Dosadı́me-li toto řešenı́ do rovnice (13.31) pro střı́davou rovnováhu, zı́skáme jejı́m řešenı́m hodnoty A, ω přı́padných autooscilacı́. Po určenı́ A, ω je možno pak čı́selně stanovit i velikost A0 . Pro statické nelineárnı́ prvky jsou koeficienty a0 , a, b i přenos N jen funkcemi vstupnı́ amplitudy A a stejnosměrné složky na vstupu nelinearity A0 . Obr. 13.14. Nesymetrická reléová charakteristika V přı́kladu 13.2 je spočı́tán ekvivalentnı́ přenos nesymetrické nelinearity s nesymetrickým vstupnı́m signálem a v přı́kladu 13.3 je řešen nelineárnı́ systém s touto nelinearitou. Podrobné řešenı́ systémů s nesymetrickými vlastnı́mi kmity je uvedeno např. v [21]. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 130 Přı́klad 13.2. Na obr. 13.14a je znázorněna nesymetrická statická charakteristika dvoupolohového prvku. Koeficienty a0 , a, b i přenos N nejsou závislé na ω. Výstupnı́ signál z tohoto nesymetrického prvku má konstantnı́ složku e20 , a to i v přı́padě, že vstupnı́ signál by měl stejnosměrnou složku A0 nulovou. Pro e1 = A0 + A sin ψ, (ψ = ωt) je e20 = a0 (A0 , A) = = = 1 2π Z 2π e2 (ψ)dψ = 0 π−α 2π+α 1 (1 − m)M (1 + m)M α M dψ − mM dψ = + = 2π α 2 π π−α (1 − m)M (1 + m)M A0 + arcsin 2 π A Z Z (13.32) 2π 1 a(A0 , A) = N (A0 , A) = e2 (ψ) sin ψdψ = πA 0 Z π+α Z 2π−α M = sin ψdψ − m sin ψdψ = πA −α π+α Z 2(1 + m)M 2(1 + m)M = cos α = πA πA b(A0 , A) = 0. s 1−( A0 2 ) A (13.33) (13.34) Přı́klad 13.3. Určenı́ amplitudy a frekvence autooscilacı́ u systému podle obr. 13.15 s nespojitou nesymetrickou nelinearitou. Každý signál má konstantnı́ a střı́davou složku ei = ei0 + e?i . Obr. 13.15. Systém s nespojitou nesymetrickou nelinearitou Rovnováha konstantnı́ch složek. V ustáleném stavu se na vstupu nelineárnı́ho prvku objevı́ sinové kmity s konstantnı́ složkou e1 = A0 + A sin ωt, kde A0 = e10 . Složka e20 musı́ být rovna nule, jinak by integračnı́ člen trvale integroval. Pak platı́ A0 = e10 = e60 − K3 e30 = −K1 e30 − K3 e30 = −e30 (K1 + K3 ). Ze vztahu a0 = e20 = (1 − m)M (1 + m)M A0 + arcsin =0 2 π A plyne e10 = A0 = −A sin π1−m , 2 1+m Rozvedenı́m podle známých vztahů pro sin (α − β) je e10 = A0 = A cos π . 1+m (13.35) KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 131 Rovnováha střı́davých složek. Pro zjištěnı́ autooscilacı́ sestavı́me charakteristickou rovnici G(jω)N (A0 , A)+ 1 = 0. Ekvivalentnı́ přenos je podle vztahu (13.33) r e10 2 2(1 + m)M N (A0 , A) = 1−( ) . πA A Obr. 13.16 Dosadı́me-li za e10 ze vztahu (13.35), bude ekvivalentnı́ přenos již funkcı́ jen vstupnı́ amplitudy A 2(1 + m)M π konst. sin = πA 1+m A (13.36) K 2 K3 K 1 K2 + . s(T1 s + 1)(T2 s + 1) s(T2 s + 1) (13.37) N (A) = Přenos lineárnı́ části obvodu je G(s) = Charakteristickou rovnici je možno při volbě konkrétnı́ch čı́selných konstant řešit graficky. Tento jednoduššı́ systém můžeme ale také řešit analyticky, čı́mž zı́skáme obecné vztahy pro amplitudu a frekvenci autooscilacı́ pro různé volby konstant obvodu. Dosazenı́m lineárnı́ho přenosu do charakteristické rovnice dostaneme T1 T2 s3 + (T1 + T2 )s2 + (1 + T1 K2 K3 N (A))s + (K1 + K3 )K2 N (A) = 0. (13.38) Pro s = jω je třeba simultánně řešit dvě rovnice (K1 + K3 )K2 N (A) − (T1 + T2 )ω 2 = 0 (13.39) (1 + T1 K2 K3 N (A))ω − T1 T2 ω 3 = 0. (13.40) Vyloučı́me N (A) z rovnice (13.39) T1 T2 ω 2 − 1 . T 1 K 2 K3 Dosazenı́m do (13.40) a úpravou zı́skáme frekvenci autooscilacı́ s K1 + K3 ω= . T1 (T2 K1 − T1 K3 ) N (A) = (13.41) (13.42) Dosazenı́m N (A) a ω 2 do (13.39) zı́skáme po jednoduchých úpravách amplitudu autooscilacı́ A= 2M K2 T1 (T2 K1 − T1 K3 ) π Ac π (1 + m) sin = (1 + m) sin , π(T1 + T2 ) 1+m 2 1+m (13.43) KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 132 kde Ac je amplituda vlastnı́ch kmitů při symetrické nelinearitě. Tı́m jsme vyřešili vlastnosti autooscilacı́ obecně v závislosti na všech konstantách lineárnı́ i nelineárnı́ části obvodu. Na obr. 13.16 je vynesena amplituda A a posuv e10 v závislosti na veličině m, která charakterizuje nesymetrii nelineárnı́ho prvku. 13.7 Ekvivalentnı́ přenos nelinearity se dvěma vstupy Všechny jevy spojené se vznikem subharmonických nebo ultraharmonických kmitů a s otázkami stability autooscilačnı́ch nelineárnı́ch systémů buzených periodickým vstupnı́m signálem nelze již řešit jednoduchým ekvivalentnı́m přenosem, protože vstup na nelineárnı́ prvek nenı́ v těchto přı́padech jednoduchý sinový kmit. V literatuře byl zaveden tzv. ekvivalentnı́ přenos pro dva vstupy (v angl. literatuře ”Dual-input Describing Function, zkráceně DIDF), který umožnil vysvětlit velmi složité jevy, vznikajı́cı́ v buzených nelineárnı́ch obvodech. Uvedeme jen stručně princip a možnosti této metody, podrobnosti lze nalézt např. v [21,27]. Vstup na nelinearitu se uvažuje ve tvaru e1 = A sin (ωA t + ϕA ) + B sin (ωB t + ϕB ), (13.44) kde amplitudy A, B a frekvence ωA , ωB se určı́ podle povahy systému a jeho vstupů. Studuje-li se např. chovánı́ nelineárnı́ho autooscilačnı́ho systému buzeného vstupnı́m periodickým signálem, bude ωA odpovı́dat frekvenci autooscilacı́, ωB frekvenci vstupnı́ho signálu. Při zkoumánı́ vzniku subharmonických a ultraharmonických kmitů jsou frekvence v jednoduchém násobném poměru. Pro tyto speciálnı́ přı́pady můžeme položit ωB = nωA a vstup na nelinearitu se zjednodušı́ na tvar e1 = A sin ωt + B sin (nωt + ϕ). (13.45) Ekvivalentnı́ přenos pro dva vstupy je funkcı́ většı́ho počtu parametrů a jeho odvozenı́ pro různé nelinearity je složité. Ekvivalentnı́ přenos můžeme definovat jako poměr určité harmonické výstupu a přı́slušné složky o stejné frekvenci na vstupu nelineárnı́ho prvku. Protože na vstupu jsou dvě složky, lze definovat ekvivalentnı́ přenos pro každou z nich. Pomocı́ těchto přenosů lze pak studovat např. problémy vzniku a odstraněnı́ subharmonických v nelineárnı́ch obvodech, vznik ultraharmonických kmitů apod. Byly např. stanoveny oblasti v komplexnı́ rovině, do kterých nesmı́ vstoupit frekvenčnı́ charakteristika lineárnı́ části obvodu, nemajı́-li vzniknout subharmonické kmity. Pomocı́ metody ekvivalentnı́ch přenosů lze pak vkládat do obvodu vhodné korekce, které vzniku subharmonických zabránı́. Ekvivalentnı́ přenos pro dva vstupy lze zjednodušit, je-li frekvence vstupu mnohem vyššı́ než frekvence autooscilacı́ nebuzeného obvodu. Pak e1 = A sin ωt + B sin βt, β >> ω (13.46) Amplitudu nı́zkofrekvenčnı́ složky je pak možno považovat za konstantu v každém kmitu vysokofrekvenčnı́ složky. Tı́mto zjednodušenı́m lze vysvětlit např. možnosti odstraněnı́ autooscilacı́ pomocı́ periodického vstupnı́ho signálu. Dalšı́ zjednodušenı́ představuje ekvivalentnı́ přenos pro dva vstupy při malé amplitudě ε jednoho vstupnı́ho signálu na nelinearitu. Pro e1 pak platı́ e1 = A sin ωt + ε sin (nωt + ϕ). (13.47) Tato aproximace se často využı́vá při studiu stability oscilacı́, vzniku skokových rezonancı́ a jiných jevů. Ekvivalentnı́ přenos pro dva vstupy je v literatuře důkladně rozpracován, jsou tabelovány mnohé grafy různých přenosů pro běžně se vyskytujı́cı́ nelinearity a lze proto řešit i velmi speciálnı́ problémy KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 133 složitých nelineárnı́ch systémů. Musı́me mı́t ovšem stále na paměti, že metoda ekvivalentnı́ch přenosů je určitou vı́ce či méně přesnou aproximacı́ a je třeba vždy dbát na to, aby byly splněny podmı́nky dostatečné filtrace vyššı́ch harmonických. Zı́skané výsledky lze ovšem kontrolovat a zpřesňovat simulacı́. Kapitola 14 Metody syntézy nelineárnı́ch řı́dı́cı́ch systémů Úkolem syntézy je navrhnout k dané lineárnı́ nebo nelineárnı́ soustavě vhodný lineárnı́ nebo nelineárnı́ regulátor, který by zajistil splněnı́ požadavků na žádané chovánı́ uzavřeného obvodu. Bude-li cı́lem řı́zenı́ stabilnı́ chovánı́ a vhodná dynamika při velkých rychlostech a pracovnı́ch rozsazı́ch, je většinou nutné nelineárnı́ řı́zenı́. Úkoly řı́zenı́ můžeme rozdělit zhruba do dvou základnı́ch skupin. Jedná se bud’ o stabilizaci, kdy je cı́lem stabilizovat uzavřený obvod do jednoho rovnovážného stavu nebo o sledovánı́, při kterém je třeba navrhnout vhodný regulátor tak, aby výstup systému se pohyboval po žádané trajektorii. Stabilizačnı́ problém. Úkolem je nalézt pro daný nelineárnı́ systém ẋ = f (t, x, u) takový řı́dı́cı́ zákon u, aby při libovolné počátečnı́ podmı́nce x0 v požadované oblasti Ω směřoval stav x(t) do žádaného rovnovážného stavu a dosáhl jej v konečném nebo nekonečném čase (nebo zůstal alespoň dostatečně blı́zko). Přı́kladem stabilizačnı́ úlohy je regulace teploty v peci na konstantnı́ hodnotu, regulace hladiny v kotli, regulace letu letadla v konstantnı́ výšce apod. Problém sledovánı́. U tohoto problému je zadán systém ẋ = f (t, x, u), výstup y = h(x) a žádaná trajektorie výstupu reprezentovaná časovým průběhem řı́dı́cı́ veličiny w(t). Úkolem je nalézt takové řı́zenı́ u, aby při pohybu z libovolného počátečnı́ho stavu v oblasti Ω směřovala regulačnı́ odchylka e(t) = w(t) − y(t) k nule a stav zůstal ohraničený. Dokonalé sledovánı́ nastává, jestliže při vhodných počátečnı́ch podmı́nkách je y(t) = w(t) pro všechna t ≥ 0. Asymptotické sledovánı́ je takové, u něhož se dosáhne dokonalého sledovánı́ asymptoticky. U mnoha praktických problémů je pro výpočet vhodného řı́zenı́ u předem k dispozici žádaná hodnota w(t) spolu se svými derivacemi až do dostatečně vysokého řádu. Např. u robotů je pohyb po žádané trajektorii často předem naplánován, takže potřebné derivace w(t) lze snadno vypočı́tat. U jiných systémů je známý sice jen žádaný průběh w(t), ale jeho derivace lze zı́skat např. pomocı́ referenčnı́ho modelu. Problémy sledovánı́ jsou obtı́žnějšı́ než problémy stabilizace, protože při sledovánı́ musı́ řı́dı́cı́ systém udržovat nejen stabilnı́ stav systému, ale také udržovat výstup systému na požadované trajektorii. Při návrhu řı́zenı́ se obvykle postupuje v tomto sledu: 1) fyzikálnı́ systém se modeluje pomocı́ soustavy diferenciálnı́ch rovnic; 2) specifikuje se žádané chovánı́, zvolı́ se snı́mače a akčnı́ členy a namodelujı́ se jejich vlastnosti; 134 KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 135 3) navrhne se podle zvolené metody vhodná struktura řı́zenı́ systému a parametry tohoto řı́zenı́; 4) analýzuje se chovánı́ výsledného systému (nejčastěji simulacı́ na počı́tači). Nejsou-li vlastnosti vyhovujı́cı́, je třeba se vrátit k bodu tři a zvolit jinou metodu pro návrh řı́zenı́; 5) implementuje se řı́dı́cı́ systém pomocı́ analogového nebo čı́slicového řı́zenı́. U nelineárnı́ch systémů je důležitá podrobná znalost fyzikálnı́ch vlastnostı́ systému. Ta umožňuje často posoudit, které nelinearity jsou podstatné a které lze, alespoň při prvnı́m návrhu, zanedbat. Pochopenı́ fyzikálnı́ch vlastnostı́ často umožňuje vhodný návrh i u složitých systémů s mnoha vstupy a výstupy, např. u manipulátorů a robotů. Jejich inerčnı́ matice je pozitivně definitnı́ a může být využita pro volbu vhodné Ljapunovovy funkce, která zajistı́ globálnı́ stabilitu a konvergenci při sledovánı́ (odst. 14.2.2). Specifikace žádaného chovánı́ je u nelineárnı́ch systémů obtı́žnějšı́ než u systémů lineárnı́ch. Návrh musı́ zajistit stabilitu, nejlépe globálnı́, nebo alespoň v dostatečně velké oblasti počátečnı́ch podmı́nek. Pro zvolené typické trajektorie musı́ být zajištěna vyhovujı́cı́ rychlost a přesnost odezvy. Výsledný systém by měl být robustnı́, tj. necitlivý na poruchy, šum, malé změny parametrů, vliv nenamodelované dynamiky apod. Pro praxi je nezanedbatelná také cena řı́dı́cı́ho systému. 14.1 Linearizace nelineárnı́ch systémů Fyzikálnı́, chemické a jiné systémy jsou většinou nelineárnı́ a jejich řı́zenı́ je obtı́žné. Velmi často se proto snažı́me nějakým vhodným způsobem systém linearizovat, protože metody řı́zenı́ lineárnı́ch systémů jsou podrobně rozpracovány a umožňujı́ relativně jednoduchý návrh řı́dı́cı́ho systému. Linearizaci lze provádět různými metodami. Jde bud’ o linearizaci v jednom pracovnı́m bodě nebo ve vı́ce pracovnı́ch bodech, nebo o tzv. exaktnı́ (zpětnovazebnı́) linearizaci. Tyto přı́stupy si probereme dále podrobněji. 14.1.1 Linearizace v pracovnı́m bodě V mnoha přı́padech můžeme nelineárnı́ systém linearizovat ve zvoleném pracovnı́m bodě, lineárnı́ aproximace však dává jen lokálnı́ popis chovánı́ systému a zanedbává všechny speciálnı́ jevy, které mohou nelineárnı́ systémy mı́t. Často to však lze tolerovat a aproximačnı́ model pak umožnı́ využı́t všechny známé metody řı́zenı́ lineárnı́ch systémů. 14.1.2 Linearizace ve vı́ce pracovnı́ch bodech Metoda je známa pod anglickým názvem ”gain scheduling” (programované zesı́lenı́). U této metody se volı́ většı́ počet pracovnı́ch bodů, které dostatečně pokrývajı́ pracovnı́ oblast, a kolem nich se systém linearizuje. Pro každou linearizaci se pak navrhne vhodný, obvykle lineárnı́ regulátor. Globálnı́ nelineárnı́ regulátor se zı́ská bud’ přepı́nánı́m přı́slušných regulátorů při pohybu v blı́zkosti odpovı́dajı́cı́ho pracovnı́ho bodu nebo spojitou interpolacı́ parametrů regulátorů při pohybu mezi pracovnı́mi body. Tato heuristická metoda se použı́vá v mnoha aplikacı́ch, jako přı́klad lze uvést řı́zenı́ letadla. Jednotlivé linearizace odpovı́dajı́ různým letovým podmı́nkám, které jsou charakterizovány polohou a rychlostı́ letadla a atmosférickými vlivy. Nadřazený regulátor pak přepı́ná jednotlivé regulátory navržené pro dı́lčı́ linearizované soustavy. Metoda linearizace ve vı́ce pracovnı́ch bodech je principiálně jednoduchá a je užitečná zejména při řı́zenı́ ve velkých pracovnı́ch oblastech. Rychlé přepı́nánı́ jednotlivých regulátorů nebo rychlé spojité změny parametrů těchto regulátorů však mohou někdy vést ke zhoršenı́ přechodných jevů nebo dokonce k nestabilitě systému. Tyto jevy však většinou nenastanou při pomalých přechodech mezi různými KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 136 operačnı́mi podmı́nkami [44]. 14.1.3 Exaktnı́ linearizace Nejobecnějšı́m způsobem linearizace systému je tzv. exaktnı́ (přesná) linearizace, která se nazývá také často zpětnovazebnı́ linearizace. Základnı́ princip metody spočı́vá ve snaze vykompenzovat nelinearity systému jinými nelinearitami a převést jej tak na lineárnı́ systém. Kompenzace nelinearit může být bud’ částečná nebo úplná a lze ji provést bud’ globálně v celém stavovém prostoru nebo lokálně v určité oblasti, která však může být podstatně většı́ než je přı́pustná oblast při linearizaci kolem pracovnı́ho bodu. Metodám exaktnı́ch linearizacı́ je v poslednı́ch letech věnována velká pozornost a existuje množstvı́ publikacı́ na toto téma. Proto věnujeme exaktnı́m linearizacı́m samostatnou kapitolu 15. 14.2 Základnı́ metody syntézy řı́zenı́ Stejně jako pro analýzu nelineárnı́ch systémů tak i pro syntézu řı́zenı́ neexistuje univerzálnı́ metoda pro návrh vhodného regulátoru. Bylo publikováno mnoho metod, většina z nich je však vhodná jen pro určité typy systémů. Proto také klasifikace metod a jejich vlastnostı́ je obtı́žná. 14.2.1 Lineárnı́ nebo linearizovaná soustava s nelineárnı́m řı́zenı́m Pokud je daná regulovaná soustava lineárnı́ nebo ji lze některou z metod čl. 14.1 linearizovat s vyhovujı́cı́ přesnostı́ v požadované pracovnı́ oblasti, můžeme použı́t k jejı́mu popisu lineárnı́ diferenciálnı́ rovnice. K této soustavě pak můžeme zvolit spojitě nebo nespojitě pracujı́cı́ regulátor. 1. Spojitě pracujı́cı́ regulátory s parazitnı́mi nelinearitami Pro řı́zenı́ lineárnı́ soustavy volı́me nejčastěji PID-regulátor nebo stavový regulátor. Parazitnı́ nelinearity ve snı́mačı́ch, zesilovačı́ch nebo akčnı́ch členech bud’ při prvnı́m hrubém návrhu zanedbáme nebo se je snažı́me vhodným způsobem kompenzovat. Pokud to z nějakých důvodů nelze, provedeme syntézu regulátoru s parazitnı́mi nelinearitami některou metodou, která byla uvedena v předchozı́ch kapitolách. Vhodné zesı́lenı́ obvodu a jeho stabilitu můžeme zajistit např. pomocı́ Ljapunovovy teorie, Popovova nebo kruhového kritéria, nebo pomocı́ metody ekvivalentnı́ch přenosů. Dynamické vlastnosti výsledného návrhu ověřı́me simulacı́. Vliv nasycenı́ akčnı́ch členů Omezenı́ výstupu akčnı́ho členu vede ke zhoršenı́ přechodných jevů nebo i k nestabilitě při většı́ch poruchách. Má-li regulátor integračnı́ složku, pak při dosaženı́ hranice omezenı́ se nezvětšuje vstup na regulovanou soustavu, ale integrátor může dále integrovat. Vlivem omezenı́ akčnı́ veličiny je reakce regulátoru na změnu polarity jeho vstupnı́ho signálu zpožděna. Tento jev se označuje anglickým termı́nem windup a je třeba jej kompenzovat. Lze např. omezit vstupnı́ signál integračnı́ složky vhodnou nelineárnı́ zpětnou vazbou kolem integrátoru, nebo se integračnı́ složka nuluje, přestoupı́-li regulačnı́ odchylka určitou velikost. Podrobnějšı́ rozbor lze nalézt např. v [44]. Nejhoršı́ vliv má nasycenı́ na vstupu nestabilnı́ soustavy. Např. zpětnovazebnı́ systém s PIregulátorem s nasycenı́m a s jednoduchou nestabilnı́ soustavou s přenosem 1/(s − 1) dává při malých vstupnı́ch signálech w stabilnı́ odezvu, při většı́ch hodnotách w je systém silně nestabilnı́. V literatuře je uvedeno, že tento typ selhánı́ byl jednou z přı́čin katastrofy v Černobylu. Nepřı́jemný vliv saturace na vstupu soustavy lze snı́žit na minimum vhodným návrhem. Pokud je to možné, je třeba se vyhnout podmı́nečně stabilnı́m regulačnı́m obvodům a velkým hodnotám žádané KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 137 veličiny w. 2. Nespojitě pracujı́cı́ regulátory Tyto regulátory se použı́vajı́ tehdy, nenı́-li spojitá akčnı́ veličina z konstrukčnı́ho nebo ekonomického hlediska výhodná. Regulátor obsahuje většinou prvek s nespojitou charakteristikou dvoupolohového, třı́polohového nebo vı́cepolohového typu. Časté využitı́ je u jednoduchých a laciných regulacı́, např. při regulaci teploty v chladničkách, pračkách, žehličkách a jiných domácı́ch spotřebičı́ch, při regulaci asynchronnı́ch motorů aj. Návrh jednoduchých nespojitě pracujı́cı́ch regulátorů lze provést např. metodou ekvivalentnı́ch přenosů nebo simulacı́. Přı́klady syntézy řı́zenı́ s třı́polohovým regulátorem jsou uvedeny ve skriptu [5]. Nespojité regulátory jsou často doplněny impulsovánı́m, které může být bud’ z nezávislého zdroje nebo je realizováno pomocı́ samobuzených kmitů, které vzniknou přidánı́m vhodného lineárnı́ho členu do zpětné vazby kolem nespojitého prvku. Impulsovánı́m se činnost nespojitého regulátoru přibližuje činnosti regulátoru pracujı́cı́ho spojitě, protože plynulá změna akčnı́ veličiny se nahrazuje šı́řkovou pulsnı́ modulacı́ s konstantnı́ amplitudou. Doplněnı́m nespojitých regulátorů vhodnými nelineárnı́mi členy zı́skáme jednoduchá časově optimálnı́ řı́zenı́. Základnı́ schemata a způsoby návrhu jsou pro systémy nižšı́ho řádu uvedena ve skriptech [5,8]. 14.2.2 Nelineárnı́ soustava s lineárnı́m nebo nelineárnı́m řı́zenı́m Pokud jsme neprovedli linearizaci soustavy některou z metod čl. 14.1, můžeme navrhnout k dané nelineárnı́ regulované soustavě vhodný regulátor pomocı́ Ljapunovovy teorie nebo simulacı́. 1. Návrh řı́zenı́ pomocı́ Ljapunovovy teorie Pro návrh vhodného řı́zenı́ nelineárnı́ regulované soustavy můžeme použı́t přı́mou Ljapunovovu metodu. Postupovat lze v podstatě dvojı́m způsobem. Při prvnı́m přı́stupu zvolı́me nějakou Ljapunovovu funkci a pak hledáme řı́dı́cı́ zákon, který by potvrdil, že zvolená funkce vyhovuje. U druhého přı́stupu volı́me nejprve určité řı́zenı́ u(x), o němž předpokládáme, že bude vyhovujı́cı́ a pak hledáme Ljapunovovu funkci, která by ověřila stabilitu výsledného uzavřeného obvodu. Tyto přı́stupy se často využı́vajı́ při návrhu robustnı́ho řı́zenı́, adaptivnı́ho řı́zenı́, řı́zenı́ s klouzavým režimem aj. Přı́klad 14.1. Prvnı́ přı́stup k návrhu řı́zenı́ ilustrujme na systému ẋ2 = −a(x2 ) − b(x1 ) + u. ẋ1 = x2 (14.1) V odst. 5.3.1 jsme viděli, že pro nebuzený systém tohoto typu lze zvolit Ljapunovovu funkci na základě fyzikálnı́ analogie ve tvaru Z x1 1 2 V (x) = x2 + b(x1 )dx1 (14.2) 2 0 Systém je asymptoticky stabilnı́, jsou-li splněny podmı́nky x2 a(x2 ) > 0 ∀ x2 6= 0 a x1 b(x1 ) > 0 ∀ x1 6= 0. (14.3) Necht’ je dán např. systém ẋ1 = x2 ẋ2 = −α1 x32 − α2 x21 + u, (14.4) kde hodnoty koeficientů α1 , α2 nejsou přesně známy, platı́ však: α1 > −1 a |α2 | < 4. Uzavřený obvod bude stabilnı́, zvolı́me-li řı́zenı́ ve tvaru u = −x32 − 4(x1 + x31 ). (14.5) KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 138 Rovnice uzavřeného obvodu jsou ẋ2 = −(x32 + α1 x32 ) − (4x31 + α2 x21 + 4x1 ) ẋ1 = x2 (14.6) a jsou splněny podmı́nky stability x2 a(x2 ) = x2 (x32 + α1 x32 ) > 0 α1 > −1 pro x1 b(x1 ) = x1 (4x31 + α2 x21 + 4x1 ) > 0 pro |α2 | < 4. Návrh zajišt’uje kromě stability i určitou nezávislost na změnách parametrů v odpovı́dajı́cı́ch intervalech. Přı́klad 14.2. Druhý přı́stup ilustruje tento návrh. Je dán systém ẋ1 = x22 − x31 ẋ2 = −x2 + x1 u. (14.7) Volı́me-li řı́zenı́ u = x1 − x2 , je uzavřený obvod popsán rovnicemi ẋ1 = x22 − x31 ẋ2 = −x2 + x21 − x1 x2 . (14.8) Zvolme V = x21 + x22 . Derivace V̇ = −2(x41 − x21 x2 + x22 ) = −2[(x2 − 0, 5x21 )2 + 0, 75x41 ] je vždy záporná, takže x = 0 je asymptoticky stabilnı́ rovnovážný stav. Přı́klad 14.3. Návrh řı́zenı́ robotu [52]. Na tomto přı́kladu můžeme ilustrovat rovněž druhý přı́stup. U průmyslových robotů se často použı́vajı́ proporcionálně derivačnı́ regulátory pro řı́zenı́ polohy ramena. Složitá dynamika robota s n pohyblivými rameny je dána soustavou n nelineárnı́ch rovnic ve tvaru H(x)ẍ + b(x, ẋ) + g(x) = u, (14.9) kde x je n-dimenzionálnı́ vektor popisujı́cı́ úhlové polohy kloubů robotu, ẋ jsou rychlosti pohybu kloubů, g je vektor gravitačnı́ch momentů, b představuje odstředivé a Coriolisovy momenty, u je vektor vstupnı́ch (řı́dı́cı́ch) momentů a H je inerčnı́ matice rozměru n × n. Kinetická energie robotu je T = 1/2 ẋT H(x)ẋ a musı́ být kladná pro každou polohu x a každou nenulovou rychlost kloubu ẋ. Matice H(x) je tedy symetrická pozitivně definitnı́ matice. Cı́lem řı́zenı́ je dosaženı́ žádané polohy xw ramen robotu. Pro řı́zenı́ polohy budeme uvažovat proporcionálně derivačnı́ regulátory uj = −kP j x̃j − kDj ẋj , (14.10) kde x̃j = xj − xjw je odchylka polohy každého kloubu od žádané hodnoty a ẋj jsou rychlosti pohybu v kloubech. Obecněji můžeme řı́zenı́ zapsat ve tvaru u = −K P x̃ − K D ẋ, (14.11) kde K P a K D jsou konstantnı́ symetrické pozitivně definitnı́ matice (podle vztahů (14.10) by byly jen diagonálnı́). Na K P a K D se lze dı́vat jako na konstanty, které by u obecného mechanického systému definovaly nějaké pružiny nebo tlumiče. KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 139 Uvažujme nynı́ jako Ljapunovovu funkci V virtuálnı́ mechanickou energii uzavřeného obvodu při volbě řı́zenı́ podle rovnice (14.11) ve tvaru 1 V = [ẋT H ẋ + x̃T K P x̃], 2 (14.12) kde prvnı́ člen představuje kinetickou energii manipulátoru a druhý člen jakousi ”umělou” potenciálnı́ energii virtuálnı́ch pružin v zákonu řı́zenı́ (14.11). Při výpočtu derivace V̇ můžeme pro zjednodušenı́ použı́t energetický vztah platný v mechanice, který řı́ká, že rychlost změny kinetické energie je rovný výkonu vnějšı́ch sil d 1 T [ ẋ H ẋ] = ẋT u. dt 2 (14.13) V̇ = ẋT u + ẋT K P x̃ = ẋT (u + K P x̃). (14.14) Pak Při použitı́ řı́dı́cı́ho zákona (14.11) je V̇ = −ẋT K D ẋ ≤ 0. (14.15) V̇ je tedy výkon disipovaný virtuálnı́mi tlumiči (podobně jako v přı́kladu odst. 5.3.1). Lze se přesvědčit, že V̇ = 0 jen tehdy, když x̃ = 0. Proto systém konverguje do žádaného stavu a je globálně asymptoticky stabilnı́. 2. Návrh řı́zenı́ pomocı́ počı́tačové simulace V odst. 2.2.5 jsme uvedli některé simulačnı́ jazyky pro modelovánı́ systémů na čı́slicových počı́tačı́ch. Některé z nich jsou výhodné i pro návrh řı́dı́cı́ch algoritmů nelineárnı́ch systémů. Pro širšı́ využitı́ ve výzkumu a v průmyslu se použı́vajı́ např. jazyky ACSL, Desire, Omola, Dymola aj. Pro výuku je výhodný zejména systém SIMULINK, doplněný souborem programů Nonlinear Control Design Toolbox (NCD). Tento soubor umožňuje namodelovat nelineárnı́ regulovanou soustavu a zvolený typ regulátoru v systému SIMULINK a pak pomocı́ optimalizačnı́ch programů určit nejvýhodnějšı́ konstanty regulátoru. Systém umožňuje zvolit předem určité hranice časových průběhů různých veličin obvodu, nastavit maximálnı́ tolerované hodnoty překývnutı́, požadovanou dobu přechodu apod. Lze optimalizovat různé zvolené veličiny (skaláry, vektory i matice) a předem nastavit jejich tolerančnı́ oblasti pro zı́skánı́ robustnı́ho řı́zenı́. Do systému lze vkládat různé nelinearity, volit deterministické i náhodné vstupnı́ signály, minimalizovat řı́dı́cı́ energii, omezovat vliv poruchových veličin, vytvářet adaptivnı́ řı́zenı́ apod. Program neumı́ samozřejmě najı́t optimálnı́ strukturu řı́dı́cı́ho systému, nanavrhne vhodné kompenzačnı́ nelinearity apod. Důkladné znalosti teorie nelineárnı́ho řı́zenı́ a určité praktické zkušenosti jsou proto základnı́ podmı́nkou pro úspěšné využitı́ počı́tačové simulace. Kapitola 15 Exaktnı́ linearizace Exaktnı́ nebo také často nazývané zpětnovazebnı́ linearizace spočı́vajı́ na myšlence úplného nebo alespoň částečného vykompenzovánı́ nelinearit systému tak, aby výsledný systém měl bud’ menšı́ počet nelinearit nebo aby se choval mezi zvoleným vstupem a výstupem nebo stavy jako lineárnı́. Kompenzace nelinearit může být provedena globálně v celém stavovém prostoru nebo lokálně v určité oblasti, která však může být postačujı́cı́ pro prakticky se vyskytujı́cı́ počátečnı́ podmı́nky. Metodám zpětnovazebnı́ linearizace je v poslednı́ch letech věnována velká pozornost a existuje množstvı́ teoretických pracı́ i aplikačnı́ch výsledků. Dvě stěžejnı́ publikace z tohoto oboru jsou [36] a [49]. 15.1 Intuitivnı́ přı́stup k linearizaci U některých jednoduchých systémů je možno velmi snadno vykompenzovat nelinearity pomocı́ jiných nelinearit a zı́skat tak výsledný systém, který je lineárnı́. Ten je pak možno řı́dit některým ze způsobů, které jsou vypracovány v lineárnı́ teorii řı́zenı́. Uved’me si jednoduchý přı́klad, převzatý z [52]. Přı́klad 15.1. Regulace výšky hladiny v nádrži. Na obr. 15.1 je zakreslena rotačnı́ nádrž, u nı́ž je třeba udržovat výšku hladiny h [m] na žádané hodnotě hw . Označme dále přı́tok kapaliny u [m3 s−1 ], průřez odpadnı́ trubky a [m2 ] a plochu nádrže ve výšce h jako S(h) [m2 ]. Dynamický model nádrže je p S(h)ḣ = u − a 2gh. (15.1) Řı́zenı́ tohoto nelineárnı́ho systému můžeme provést různým způsobem. Zvolı́me-li např. proporcionálnı́ regulátor u = r0 e = r0 (hw − h), (15.2) √ nemůžeme dosáhnout nulové regulačnı́ odchylky, protože nelineárnı́ zpětná vazba a 2gh odstranı́ integračnı́ charakter soustavy. Nulovou regulačnı́ odchylku v ustáleném stavu zı́skáme integračnı́m regulátorem, ale i tento způsob řı́zenı́ nenı́ přı́liš vhodný. Při velkém hw bude plocha nádrže velká, rychlost změny výšky bude malá a h bude růst velmi pomalu. Dynamika změn bude silně záviset na okamžité hladině. Proved’me linearizaci daného systému tak, že zvolı́me řı́zenı́ p u = a 2gh + S(h)v, (15.3) kde v je nový vstup. Pak platı́ ḣ = v a mezi novým vstupem v a výstupem h je integračnı́ závislost. Nynı́ stačı́ použı́t proporcionánı́ regulátor v = r0 e = r0 (hw − h), 140 (15.4) KAPITOLA 15. EXAKTNÍ LINEARIZACE 141 při kterém je regulačnı́ odchylka v ustáleném stavu nulová a dynamika výsledného systému již nezávisı́ na okamžité hladině. Obrázek 15.1: Regulace výšky hladiny v nádrži Z přı́kladu je patrno, že vykompenzovánı́ nelinearit lze jednoduše provést pro třı́du nelineárnı́ch systémů popsaných ve tvaru tzv. řiditelné kanonické formy (analogie Frobeniova kanonického tvaru u lineárnı́ch systémů) ẋ1 = x2 ẋ2 = x3 ... ẋn−1 = xn (15.5) ẋn = f (x) + g(x)u. (15.6) 1 [v − f (x)], g(x) (15.7) Zvolı́me-li u ve tvaru u= vykompenzujı́ se nelinearity a dostaneme jednoduchý vztah mezi novým vstupem v a výstupem x1 ve tvaru n integračnı́ch členů. Při této linearizaci jsme nezavedli žádné transformace stavů, stavové proměnné nového (lineárnı́ho) systému jsou původnı́ proměnné x. Syntézu regulátoru můžeme nynı́ provést metodami, které jsou známy z teorie řı́zenı́ lineárnı́ch systémů. Použijme-li např. stavový regulátor, lze řı́dı́cı́ zákon napsat ve tvaru v = −k1 x1 − k2 x2 − ... − kn xn (15.8) a dosadit do vztahu (15.7). Např. u systému ẋ1 = x2 ẋ2 = f (x1 , x2 ) + g(x1 , x2 )u lze volit u ve tvaru u=− g(x1 , x2 ) 6= 0 f (x1 , x2 ) 1 + v. g(x1 , x2 ) g(x1 , x2 ) ∀ x1 , x2 (15.9) (15.10) Tı́m zı́skáme řiditelný lineárnı́ systém ẋ1 = x2 , ẋ2 = v, ke kterému můžeme zvolit vhodné lineárnı́ řı́zenı́. 15.1.1 Transformace stavových proměnných Nenı́-li zadaný nelineárnı́ systém v řiditelné kanonické formě, je linearizace již obtı́žnějšı́. Z teorie lineárnı́ch systémů je známo, že lze provést transformaci stavu a převést zadaný lineárnı́ systém do Frobeniova kanonického tvaru. Podobně to lze někdy udělat u nelineárnı́ho systému. Necht’ T (x) je hladké zobrazenı́ definované na oblasti Ω z Rn . Předpokládejme, že Jacobiova matice zobrazenı́ T je regulárnı́ v bodě x oblasti Ω. Pak T (x) definuje lokálnı́ difeomorfismus na KAPITOLA 15. EXAKTNÍ LINEARIZACE 142 nějaké oblasti Ω0 ⊂ Ω. Jsou-li T (x) a T −1 hladká zobrazenı́ a T (x) je invertovatelné pro všechna x ∈ Rn , pak transformace T (x) je globálnı́ difeomorfismus. Přı́klad 15.2. Uvažujme systém ẋ1 = x1 ln x2 ẋ2 = −x2 ln x1 + x2 u. (15.11) Zaved’me kolem rovnovážného stavu x = (1, 1) lokálnı́ transformace souřadnic z = T (x) z1 = T1 (x1 , x2 ) = ln x1 Pak z2 = T2 (x1 , x2 ) = ln x2 . ∂T1 ∂T1 1 ẋ1 + ẋ2 = (x1 ln x2 ) = ln x2 = z2 ∂x1 ∂x2 x1 ∂T2 ∂T2 1 ż2 = ẋ1 + ẋ2 = (−x2 ln x1 + x2 u) = −ln x1 + u = −z1 + u ∂x1 ∂x2 x2 ż1 = Nelineárnı́ systém (15.11) je tedy v nových souřadnicı́ch z lineárnı́ ż1 = z2 ż2 = −z1 + u. (15.12) Pro zadaný nelineárnı́ systém je ovšem obtı́žné určit, zda bude existovat transformace, která převede nelineárnı́ systém na ekvivalentnı́ systém lineárnı́. Tato úloha je obecně vyřešena v literatuře, ale věta i jejı́ důkaz jsou složité (viz např. [36]). Ukazuje se, že pouhá transformace souřadnic se při linearizaci dá v praxi použı́t jen u velmi malého počtu nelineárnı́ch systémů. Většina systémů je linearizovatelná nejen s použitı́m transformace, ale také pomocı́ vhodné přı́mé a zpětné nelineárnı́ vazby. Metody exaktnı́ch linearizacı́ můžeme rozdělit do dvou skupin. Složitějšı́ úlohu představuje linearizace vstup-stav, kdy se snažı́me linearizovat systém mezi vstupem a všemi jeho stavy. Tomuto přı́stupu se budeme věnovat v čl. 15.3 až po zavedenı́ některých nových matematických pojmů. Druhou skupinu tvořı́ metody linearizace vstup-výstup, které jsou teoreticky jednoduššı́ a proto si jejich princip uvedeme již v tomto úvodnı́m článku. 15.1.2 Linearizace vstup-výstup Dále budeme předpokládat, že nelineárnı́ systém je v afinnı́m tvaru ẋ = f (x) + g(x)u y = h(x) x ∈ Rn . (15.13) Zadaný systém chceme linearizovat a budeme zatı́m předpokládat, že ho lze pomocı́ vhodných transformacı́ a nelineárnı́ch vazeb převést na ekvivalentnı́ lineárnı́ systém ż = Az + bv ỹ = h̃(z) z ∈ Rn . (15.14) Tento lineárnı́ systém si můžeme zvolit v různém tvaru, nejčastěji se použı́vá sériové zapojenı́ integračnı́ch členů. Obě reprezentace (15.13) a (15.14) budou vstupně-výstupně ekvivalentnı́ právě tehdy, když při stejných vstupech je stejné chovánı́ výstupů, tj. když y (i) (t) = ỹ (i) (t) i = 0, 1, ..., n. (15.15) Výpočet lineárnı́ reprezentace lze provést tak, že výstup derivujeme postupně tolikrát, až se objevı́ závislost na řı́zenı́ u. Ukažme si tento postup na jednoduchých přı́kladech. KAPITOLA 15. EXAKTNÍ LINEARIZACE 143 a) Lineárnı́ reprezentace ve tvaru sériového zapojenı́ integrátorů Přı́klad 15.3. Nelineárnı́ systém ẋ1 = x2 − sin x1 ẋ2 = u y = x1 (15.16) chceme pomocı́ vhodných nelineárnı́ch vazeb převést na ekvivalentnı́ lineárnı́ systém reprezentovaný dvěma za sebou zapojenými integrátory ż1 = z2 ż2 = v ỹ = z1 . (15.17) Oba systémy budou ekvivalentnı́, jestliže ẏ = ỹ˙ y = ỹ ÿ = ỹ¨ Derivujme výstup y postupně tolikrát, až se objevı́ závislost na u. y ẏ ÿ = x1 = ẋ1 = x2 − sin x1 = −(cos x1 )ẋ1 + ẋ2 = −(cos x1 )x2 + sin x1 cos x1 + u. (15.18) Porovnánı́m přı́slušných derivacı́ y a ỹ je patrno, že z2 = x2 − sin x1 z1 = x1 u = v + x2 cos x1 − sin x1 cos x1 Vytvořı́me-li tyto nelineárnı́ členy a zavedeme-li je na vstup u, zı́skáme lineárnı́ systém, který mezi novým vstupem v a výstupem ỹ = z1 má dva sériově zapojené integračnı́ členy. Tı́m jsme vyřešili problém linearizace a můžeme přistoupit k řı́zenı́. Pro jednoduchost budeme uvažovat pouze stabilizaci do rovnovážného stavu. Pro zı́skaný lineárnı́ systém je vhodné navrhnout stavový regulátor v = −k1 z1 − k2 z2 = −k1 x1 − k2 x2 + k2 sin x1 , (15.19) takže v původnı́ch souřadnicı́ch je řı́zenı́ u dáno vztahem u = −k1 x1 − k2 x2 + k2 sin x1 + x2 cos x1 − sin x1 cos x1 . (15.20) Touto volbou jsou kompenzovány nelinearity původnı́ho systému a volbou konstant k1 , k2 lze nastavit vhodnou dynamiku. Přı́klad 15.4. Je dán systém ẋ1 = x2 − sin x1 ẋ2 = x2 cos x1 + u y = x1 (15.21) Proved’me linearizaci systému na ekvivalentnı́ systém ż1 = z2 ż2 = v ỹ = z1 . (15.22) stejným postupem jako v předchozı́m přı́kladě. Porovnánı́m derivacı́ výstypu zı́skáme pro vstup ekvivalentnı́ho lineárnı́ho systému vztah u = v − sin x1 cos x1 . (15.23) Je patrno, že zpětnovazebnı́ linearizace je jednoduššı́ než v předchozı́m přı́kladu, i když zadaný systém má dvě nelinearity. Je to ovšem dáno speciálnı́m tvarem těchto nelinearit, jak je ještě lépe vidět z následujı́cı́ho přı́kladu. Přı́klad 15.5. Je dán systém ẋ1 = x2 − sin x1 ẋ2 = x2 cos x1 − sin x1 cos x1 + u y = x1 (15.24) Porovnánı́m derivacı́ výstupů daného systému a lineárnı́ ekvivalence podle (15.21) zı́skáme u = v. Nenı́ tedy třeba žádná nelineárnı́ zpětná vazba, zadaný systém je ekvivalentnı́ lineárnı́mu systému s dvěma integrátory pouhou transformacı́ souřadnic z1 = x1 a z2 = x2 − sin x1 . KAPITOLA 15. EXAKTNÍ LINEARIZACE 144 Přı́klad 15.6. Je zadán systém ẋ1 = −2x1 + ax2 + sin x1 ẋ2 = −x2 cos x1 + u cos 2x1 y = x1 , který chceme linearizovat na ekvivalentnı́ systém ż1 = z2 ż2 = v ỹ = z1 . (15.25) Derivujeme-li výstupy, dostaneme vztahy y ẏ ÿ = = = = x1 ẋ1 = −2x1 + ax2 + sin x1 −2ẋ1 + aẋ2 + cos x1 .ẋ1 4x1 − 2ax2 − 2 sin x1 + au cos 2x1 − 2x1 cos x1 + sin x1 cos x1 ỹ ỹ˙ ỹ¨ = z1 = ż1 = z2 = −2x1 + ax2 + sin x1 = ż2 = v. Porovnánı́m derivacı́ výstupů zı́skáme transformačnı́ vztahy z2 = −2x1 + ax2 + sin x1 z1 = x1 a pro u vztah 1 (v − 4x1 + 2ax2 + 2 sin x1 + 2x1 cos x1 − sin x1 cos x1 ). (15.26) a cos 2x1 Je patrno, že v tomto přı́padě je linearizace dosaženo nelineárnı́ zpětnou vazbou a nelineárnı́m členem v přı́mé větvi 1/(a cos 2x1 ). Oba členy potřebné k linearizaci lze odvodit od původnı́ho stavu x daného systému. u= b) Lineárnı́ reprezentace ve tvaru obecného stabilnı́ho systému I když se nejčastěji použı́vá lineárnı́ reprezentace ve tvaru sériového zapojenı́ integrátorů, je někdy výhodná jiná reprezentace, jak je patrno z dalšı́ho přı́kladu. Přı́klad 15.7. Je zadán systém ẋ1 = x2 − 2x1 ẋ2 = x3 − x32 ẋ3 = −x3 + u y = x1 , (15.27) který chceme převést vhodnými transformacemi a vazbami na lineárnı́ systém se třemi jednokapacitnı́mi členy ż1 = z2 − 2z1 ż2 = z3 − z2 ż3 = −z3 + v ỹ = z1 . (15.28) Derivovánı́m výstupů dostaneme soustavy ẏ = ẋ1 = x2 − 2x1 y = x1 ÿ = −2x2 + 4x1 + x3 − x32 y (3) = −8x1 + 4x2 − 3x3 + u + x22 (2x2 − 3x3 + 3x32 ) a ỹ = z1 ỹ˙ = −2z1 + z2 ỹ¨ = 4z1 − 3z2 + z3 ỹ (3) = −8z1 + 7z2 − 4z3 + v. Porovnánı́m výstupů dostaneme transformačnı́ vztahy z = T (x) z1 = x1 z2 = x2 z3 = x2 + x3 − x32 a vztah pro u u = −x2 − x3 + 2x32 + 3x22 (x3 − x32 ) + v. Řı́zenı́ můžeme zase provést např. stavovým regulátorem pomocı́ pevných zpětných vazeb od nových stavů z. Protože je ale nynı́ ekvivalentnı́ lineárnı́ systém stabilnı́, je možno použı́t pro regulaci i jednoduchou zpětnou KAPITOLA 15. EXAKTNÍ LINEARIZACE 145 Obrázek 15.2: Linearizovaný systém a jeho řı́zenı́ vazbu od výstupu, např. integračnı́ regulátor pro zajištěnı́ nulové trvalé regulačnı́ odchylky. Tento integračnı́ prvek můžeme také realizovat přı́mo tak, že zvolı́me ekvivalentnı́ lineárnı́ systém ve tvaru integrál plus dva jednokapacitnı́ členy v sérii. Je patrno, že převod nelineárnı́ho systému na obecný lineárnı́ ekvivalentnı́ systém rozšiřuje různé varianty řı́zenı́. Z uvedených přı́kladů je patrno, že linearizaci daného systému (15.13) a tedy jeho převedenı́ na ekvivalentnı́ lineárnı́ systém (15.14) lze provést volbou u = α(x) + β(x)v, (15.29) kde v je nový vstup. Řı́zenı́ linearizovaného systému lze pak navrhnout pomocı́ některé vhodné metody, kterou známe z teorie lineárnı́ch systémů. Použijeme-li např. regulátor odvozený od stavu systému, potřebujeme nové stavy z = T (x). Ty jsou však zcela vyjı́mečně měřitelné na původnı́m systému a je třeba je zkonstruovat ze stavových veličin x (často pomocı́ počı́tače). Výsledné schema linearizovaného systému a jeho řı́zenı́ stavovým regulátorem je zakresleno na obr. 15.2. Z dosud uvedených přı́kladů je vidět, že zpětnovazebnı́ linearizace je podstatně odlišná od linearizace pomocı́ Taylorova rozvoje kolem pracovnı́ho nebo rovnovážného stavu, která platı́ jen v malé oblasti kolem tohoto stavu. Zpětnovazebnı́ linearizace může linearizovat daný systém bud’ globálně, tj. v celém stavovém prostoru nebo jen v určité oblasti. Např. z výsledků přı́kladu 15.6 je vidět, že linearizace nenı́ globálnı́, protože řı́zenı́ nenı́ definováno, jestliže x1 = (π/4 ± kπ/2), k = 1, 2... Bude-li počátečnı́ stav v těchto singulárnı́ch bodech, nemůže regulátor převést systém do rovnovážného stavu (0, 0). Z uvedených jednoduchých přı́kladů je také patrno, že jsme linearizace prováděli dosud značně intuitivně, bez vymezenı́ přesných podmı́nek a za značně zjednodušených předpokladů. Přesněji budeme úlohu formulovat v dalšı́ch článcı́ch, kde se budeme zabývat otázkou, kdy lze nelineárnı́ systém transformovat na systém lineárnı́ a jak nalézt vhodné transformace a zpětné vazby. K těmto účelům musı́me zavést některé nové matematické pojmy a definice. 15.2 Matematické prostředky pro zpětnovazebnı́ linearizace Definice 15.1. Lieova derivace. Je dána hladká skalárnı́ funkce h : Rn → R a hladké vektorové pole f : Rn → Rn . Pak Lieova derivace Lf h skalárnı́ho pole h vzhledem k vektorovému poli f je skalárnı́ funkce definovaná vztahem Lf h = ∇h.f = ∂h ∂h ∂h , ..., f (x) = f (x), ∂x1 ∂xn ∂x KAPITOLA 15. EXAKTNÍ LINEARIZACE 146 kde ∇h je gradient funkce h (řádkový vektor). Lieova derivace je směrová derivace skalárnı́ho pole h ve směru vektoru f . Rekursivně lze definovat vyššı́ derivace Lf2 h = Lf (Lf h) = ∇(Lf h).f Lf0 h = h Lfi h = Lf (Lfi−1 h) = ∇(Lfi−1 ).f Je-li g jiné vektorové pole, pak Lg Lf h = ∇(Lf h)g Pro nebuzený dynamický systém ẋ = f (x), y = h(x), jsou derivace výstupu ẏ = ÿ = ∂h ∂h ẋ = f (x) = Lf h ∂x ∂x ∂[Lf h] ∂[Lf h] ẋ = f (x) = Lf 2 h. ∂x ∂x Definice 15.2. Lieova závorka (derivace vektorového pole vzhledem k vektorovému poli). Necht’ f a g jsou dvě vektorová pole na Rn . Lieova závorka polı́ f a g je třetı́ vektorové pole definované vztahem ∂f ∂g f− g, [f , g] = (∇g)f − (∇f )g = ∂x ∂x kde ∂f /∂x, ∂g/∂x jsou Jacobiovy matice, např.    ∂f = ∂x   ∂f1 ∂x1 ... ∂fn ∂x1 ∂f1 ∂x2 ... ∂fn ∂x2 ... ... ... ∂f1 ∂xn ... ∂fn ∂xn       Často použı́vaný způsob zápisu Lieovy závorky je [f , g] = adf g. Rekursivnı́ vztahy lze pak psát ve zjednodušených tvarech adf 0 g = g adf 1 g = adf g = [f , g] adf 2 g = [f , [f , g]] = [f , adf g] obecně adf i g = [f , adf i−1 g]. Pro Lieovy závorky platı́: a) bilinearita [α1 f 1 + α2 f 2 , g] = α1 [f 1 , g] + α2 [f 2 , g] [f , α1 g 1 + α2 g 2 ] = α1 [f , g 1 ] + α2 [f , g 2 ], kde f , f 1 , f 2 , g, g 1 , g 2 jsou hladká vektorová pole a α1 a α2 jsou konstantnı́ skaláry; b) antikomutativnost [f , g] = −[g, f ] c) Jacobiova identita L[f ,g ] h = Lf Lg h − Lg Lf h, kde h(x) je hladká skalárnı́ funkce x. KAPITOLA 15. EXAKTNÍ LINEARIZACE 147 Definice 15.3. Distribuce. Uvažujme množinu {f 1 , f 2 , ..., f m } vektorových polı́ na Rn , m < n. Je-li pro každé x ∈ Rn m vektorů f 1 (x), ..., f m (x) lineárně nezávislých, řı́káme, že množina vektorových polı́ je m-dimenzionálnı́ distribuce D. Distribuce je involutivnı́ tehdy a jen tehdy, existujı́-li takové hladké skalárnı́ funkce γijk ,že [f i , f j ](x) = m X γijk (x)f k (x) 1 ≤ i, j ≤ m, i 6= j. k=1 Platı́-li vztah jen lokálně, pak distribuce je lokálně involutivnı́. Involutivita tedy znamená, že vytvořı́me-li Lieovu závorku z kterýchkoliv dvou polı́ množiny {f 1 , ..., f m }, pak výsledné vektorové pole lze vyjádřit jako lineárnı́ kombinaci původnı́ množiny vektorových polı́. Konstantnı́ vektorová pole jsou vždy involutivnı́. Lieova závorka dvou konstantnı́ch vektorů je vždy nulový vektor, který lze triviálně vyjádřit jako lineárnı́ kombinaci vektorových polı́. Definice 15.4. Množina lineárně nezávislých vektorových polı́ {f 1 , f 2 , ..., f m } na Rn je úplně integrovatelná tehdy a jen tehdy, existuje-li n−m skalárnı́ch funkcı́ h1 (x), h2 (x), ..., hn−m (x) vyhovujı́cı́ch soustavě parciálnı́ch diferenciálnı́ch rovnic ∇hi f j = 0, kde 1 ≤ i ≤ n−m, 1 ≤ j ≤ m, a gradienty ∇hi jsou lineárně nezávislé. Počet parciálnı́ch diferenciálnı́ch rovnic je m(n − m). Přı́klad 15.7. Pro n = 3 jsou dány skalárnı́ funkce fi (x1 , x2 , x3 ) a gi (x1 , x2 , x3 ) , i = 1, 2, 3. Těmito vektory f , g je jednoznačně definována soustava parciálnı́ch diferenciálnı́ch rovnic ∂h ∂h ∂h f1 + f2 + f3 = 0 ∂x1 ∂x2 ∂x3 ∂h ∂h ∂h g1 + g2 + g3 = 0. ∂x1 ∂x2 ∂x3 Existuje-li řešenı́ h(x1 , x2 , x3 ) uvedených rovnic, pak množina vektorových polı́ {f , g} je úplně integrovatelná. A priori ovšem nenı́ zřejmé, zda rovnice jsou řešitelné. Podmı́nku řešitelnosti udává Frobeniova věta. Věta 15.1. (Frobeniova). Množina lineárně nezávislých vektorových polı́ {f 1 , f 2 , ..., f m } je úplně integrovatelná tehdy a jen tehdy, jestliže je involutivnı́. Důkaz je podán např. v [36]. 15.3 Linearizace vstup-stav V tomto článku se budeme zabývat linearizacı́ vstup-stav u nelineárnı́ho afinnı́ho systému s jednı́m vstupem (bez výstupu) reprezentovaného stavovou rovnicı́ ẋ = f (x) + g(x)u, (15.30) kde f a g jsou hladká vektorová pole. V čl. 15.1 jsme na jednoduchých přı́kladech viděli, že exaktnı́ linearizaci lze vytvořit pomocı́ transformace stavů a nelineárnı́ přı́mé a zpětné vazby (obr. 15.2). Nynı́ se pokusı́me tyto jednoduché intuitivnı́ výsledky zobecnit. Nejprve budeme trochu detailněji definovat linearizaci vstup-stav. Definice 15.5. Afinnı́ nelineárnı́ systém s jednı́m vstupem ẋ = f (x) + g(x)u, kde f a g jsou hladká KAPITOLA 15. EXAKTNÍ LINEARIZACE 148 vektorová pole na Rn , je linearizovatelný ve smyslu vstup-stav, jestliže existuje oblast Ω v Rn , difeomorfismus T : Ω → Rn a taková nelineárnı́ vazba u = α(x) + β(x)v (15.31) že nové stavové proměnné z = T (x) a nový vstup v vytvářejı́ lineárnı́ t-invariantnı́ systém ż1 = z2 ż2 = z3 ... żn−1 = zn żn = v. (15.32) Linearizovaný systém je ve speciálnı́m kanonickém tvaru, který odpovı́dá sériovému zapojenı́ ideálnı́ch integračnı́ch členů. Nynı́ je třeba odpovědět na otázku, zda může být každý nelineárnı́ systém ve tvaru (15.30) převeden na ekvivalentnı́ lineárnı́ systém s novým vstupem v pomocı́ (lokálnı́) transformace z = T (x) a statické přı́mé a zpětné vazby u = α(x) + β(x)v. Věta 15.2. Nelineárnı́ systém (15.30) s hladkými vektorovými poli f (x) a g(x) je linearizovatelný ve smyslu vstup-stav tehdy a jen tehdy, existuje-li oblast Ω, v nı́ž platı́ podmı́nky: a) vektorová pole {g, adf g, ..., adn−1 g} jsou lineárně nezávislá v Ω f b) množina {g, adf g, ..., adn−2 g} je involutivnı́ v Ω. f Prvnı́ podmı́nku lze jednoduše interpretovat jako zobecněnou podmı́nku řiditelnosti pro nelineárnı́ systém (15.30). Pro lineárnı́ systém ẋ = Ax + bu se vektorová pole z podmı́nky a) změnı́ na [b, Ab, ..., An−1 b], což je známá podmı́nka řiditelnosti lineárnı́ho systému. Důkaz věty 15.2. Podejme poněkud zkrácený důkaz této věty, důkaz se všemi podrobnostmi lze nalézt např. v [49]. Ukažme nejprve nutnost podmı́nek věty 15.2. Předpokládejme, že existuje taková stavová transformace z = T (x) a vstupnı́ transformace u = α(x) + β(x)v, že z a v splňujı́ rovnice (15.32). Rozepsánı́m dostaneme ż1 = ∇T1 ẋ = ∂T1 (f + gu) = z2 = T2 . ∂x Podobně pro ostatnı́ složky platı́ ż2 = ∂T2 (f + gu) = T3 , ∂x ... żn = ∂Tn (f + gu) = v. ∂x To vede na množinu parciálnı́ch diferenciálnı́ch rovnic ∂T1 ∂T1 f+ gu = T2 ∂x ∂x ∂T2 ∂T2 f+ gu = T3 ∂x ∂x ∂Tn ∂Tn f+ gu = v. ∂x ∂x ... Složky T1 , ..., Tn jsou nezávislé na u, takže z předchozı́ch rovnic vyplývá Lg T1 = Lg T2 = ... = Lg Tn−1 = 0 Lf Ti = Ti+1 Lg Tn 6= 0 i = 1, 2, ..., n − 1. (15.33) (15.34) Všechny tyto vztahy platı́ pro všechna x ∈ Ω. Nynı́ ukážeme, že výše uvedená soustava parciálnı́ch diferenciálnı́ch rovnic pro Ti může být komprimována do množiny rovnic závislých jen na T1 . Na základě vlastnostı́ Lieových závorek je ∇T1 [f , g] = ∇(Lg T1 )f − ∇(Lf T1 )g = 0 − Lg T2 = 0. (15.35) S použitı́m tohoto výsledku můžeme indukcı́ ukázat, že ∇T1 adkf g = 0 k = 0, 1, 2, ..., n − 2 ∇T1 adn−1 g 6= 0. f (15.36) KAPITOLA 15. EXAKTNÍ LINEARIZACE 149 Z tohoto vztahu předevšı́m vyplývá, že vektorová pole g, adf g, ..., adfn−1 g musı́ být lineárně nezávislá. Proved’me důkaz sporem. Jesliže by pro nějaké i (i ≤ n − 1) existovaly skalárnı́ funkce α1 (x), ..., αi−1 (x) takové, že adif g = i−1 X αk adkf g k=0 platilo by adn−1 g= f n−2 X αk adkf g. k=n−i−1 Pak by muselo vzhledem k (15.36) platit ∇T1 adn−1 g= f n−2 X αk ∇T1 .adkf g = 0, k=n−i−1 což je ve sporu s (15.36). Ze vztahů (15.36) vyplývá také druhý výsledek: množina vektorových polı́ je involutivnı́. To je dáno Frobeniovou větou a existencı́ skalárnı́ funkce T1 , která vyhovuje n − 1 parciálnı́m diferenciálnı́m rovnicı́m ze vztahu (15.36). Nynı́ je možno ukázat, že dvě podmı́nky ve větě 15.2 jsou postačujı́cı́ pro linearizaci nelineárnı́ho systému (15.30) ve smyslu vstup-stav, tj. že je možno nalézt stavovou transformaci a vstupnı́ transformaci tak, aby platily rovnice (15.32). Jestliže je splněna podmı́nka involutivity, pak existuje nenulová skalárnı́ funkce T1 (x), která vyhovuje vztahům Lg T1 = Lad g T1 = ... = Ladn−2 g T1 = 0. (15.37) f f Dále lze ukázat, že tato množina parciálnı́ch diferenciálnı́ch rovnic je ekvivalentnı́ k množině rovnic Lg T1 = Lg Lf T1 = ... = Lg Lfn−2 T1 = 0. (15.38) Použijeme-li tedy transformaci T = [T1 , Lf T1 , ..., Lfn−1 T1 ]T jako novou množinu stavových proměnných, pak prvnı́ch n − 1 stavových rovnic je Ṫk = Tk+1 k = 1, ..., n − 1 (15.39) a poslednı́ stavová rovnice Ṫn = Lfn T1 + Lg Lfn−1 T1 u. (15.40) Dále lze ukázat, že při lineárnı́ nezávislosti vektorových polı́ {g, adf g, ..., adfn−1 g} a platnosti (15.37) je Lg Lfn−1 T1 6= 0 ∀ x ∈ Ω. (15.41) Zvolı́me-li řı́zenı́ u ve tvaru u=− 1 (Lfn T1 n−1 Lg Lf T1 + v), (15.42) pak poslednı́ stavová rovnice bude Ṫn = v, jak odpovı́dá žádanému tvaru v rovnici (15.32). Postup při návrhu linearizace vstup-stav Na základě předchozı́ věty a různých dı́lčı́ch výsledků zı́skaných při vedenı́ důkazu, můžeme při návrhu linearizace postupovat tı́mto způsobem: 1) Vypočteme pro zadaný systém (15.30) vektorová pole {g, adf g, ..., adn−1 g}. f KAPITOLA 15. EXAKTNÍ LINEARIZACE 150 2) Zjistı́me, jsou-li splněny podmı́nky řiditelnosti a involutivity. 3) Jsou-li splněny, nalezneme prvnı́ stav T1 z rovnic ∇T1 adif g = 0 ∇T1 adfn−1 g 6= 0. i = 1, 2, ..., n − 2 (15.43) 4) Vypočı́táme stavovou transformaci z = T (x) = [T1 Lf T1 ... Lfn−1 T1 ]T a vstupnı́ transformaci u = α(x) + β(x)v, kde α(x) = − Lfn T1 Lg Lfn−1 T1 β(x) = 1 Lg Lfn−1 T1 (15.44) Přı́klad 15.8. [52] Mechanický systém podle obr. 15.3 je vytvořen připojenı́m výstupnı́ho hřı́dele se zátěžı́ přes torznı́ pružinu ke hřı́deli hnacı́ho motoru. Systém lze popsat rovnicemi I ϕ¨1 + mgl sin ϕ1 + k(ϕ1 − ϕ2 ) = 0 J ϕ¨2 + k(ϕ2 − ϕ1 ) = u, kde J je moment setrvačnosti motoru, I je moment setrvačnosti ramena vzhledem k ose rotace, l vzdálenost výstupnı́ho hřı́dele od těžiště ramena, m hmotnost ramena, g gravitačnı́ zrychlenı́, k torznı́ konstanta pružiny, ϕ1 úhel natočenı́ výstupnı́ho hřı́dele (ramena), ϕ2 úhlová poloha hřı́dele motoru, u moment motoru. Zvolme stavový vektor x = [ϕ1 , ϕ˙1 , ϕ2 , ϕ˙2 ]T a označme mgl/I = a, k/I = b, 1/J = c a k/J = d. Pak ẋ1 = x2 ẋ2 = −a sin x1 − b(x1 − x3 ) ẋ3 = x4 ẋ4 = d(x1 − x3 ) + cu. Obrázek 15.3: Mechanický systém Jednoduchými výpočty určı́me matici řiditelnosti     [g, adf g, ad2f g, ad3f g] =   0 0 0 −bc 0 0 bc 0    0 −c 0 dc  c 0 −dc 0 Matice má hodnost 4 pro k > 0 a IJ < ∞. Dále je patrno, že vektorová pole {g, adf g, ad2f g} jsou konstantnı́ a tvořı́ proto involutivnı́ množinu. Daný systém je tedy linearizovatelný ve smyslu vstupstav. KAPITOLA 15. EXAKTNÍ LINEARIZACE 151 Dalšı́ postup spočı́vá v nalezenı́ vhodné stavové transformace z = T (x) a nelineárnı́ch vazeb u = α(x) + β(x)v. Podle (15.43) by prvnı́ složka T1 měla splňovat vztahy ∂T1 6= 0 ∂x1 ∂T1 =0 ∂x2 ∂T1 =0 ∂x3 ∂T1 =0 ∂x4 Je patrno, že T1 musı́ být pouze funkcı́ x1 . Nejjednoduššı́ volba je z1 = T1 = x1 . Nové stavové proměnné jsou pak z1 = T1 = x1 (15.45) ∂T1 f1 + ∂x1 ∂T2 f1 + = T3 = Lf T2 = ∂x1 ∂T3 = T4 = Lf T3 = f1 + ∂x1 z2 = T2 = Lf T1 = z3 z4 ∂T1 f2 = x2 ∂x2 ∂T2 f2 = −a sin x1 − bx1 + bx3 ∂x2 ∂T3 f3 = −ax2 cos x1 − bx2 + bx4 . ∂x3 (15.46) (15.47) (15.48) Podle vztahu (15.44) volı́me u = α(x) + β(x)v = − Lfn T1 1 + v n−1 n−1 Lg Lf T1 Lg Lf T1 Jednoduchými výpočty dostaneme výsledný vztah u= 1 (v − Lf4 T1 ), bc kde Lf4 T1 = a sin x1 (x22 + a cos x1 + b) + b(x1 − x3 )(b + d + a cos x1 ). Tato linearizace vstup-stav je globálnı́, protože difeomorfismus T (x) a vstupnı́ transformace jsou definovány všude. Pro linearizovaný systém můžeme nynı́ navrhnout vhodné řı́zenı́ pomocı́ známých metod lineárnı́ syntézy. 15.4 Linearizace vstup-výstup V tomto článku se budeme nejprve zabývat linearizacı́ nelineárnı́ho systému s jednı́m vstupem a jednı́m výstupem, který lze popsat afinnı́m vztahem ẋ = f (x) + g(x)u y = h(x), (15.49) Na rozdı́l od linearizace vstup-stav je zde definována výstupnı́ funkce y a cı́lem je vytvořit náhradnı́ lineárnı́ systém mezi výstupem y a novým vstupem v. Linearizace vstup-výstup je většinou jednodušeji realizovatelná než linearizace vstup-stav, v mnoha přı́padech však přinášı́ nové problémy např. s tzv. vnitřnı́ dynamikou (odst. 15.4.2). Princip linearizace vstup-výstup byl již ukázán na jednoduchých přı́kladech v čl. 15.1. Spočı́vá v opakovaném derivovánı́ výstupnı́ funkce y, které se provádı́ tak dlouho, až se objevı́ závislost na vstupnı́m signálu u. Prvnı́ derivace je ẏ = ∇h ẋ = ∇h(f + gu) = Lf h(x) + Lg h(x)u. Jestliže Lg h(x) 6= 0 pro všechna x v oblasti Ω, pak můžeme volit vstupnı́ transformaci u= 1 (−Lf h + v) Lg h KAPITOLA 15. EXAKTNÍ LINEARIZACE 152 a relace mezi výstupem a vstupem v bude ẏ = v. Jestliže Lg h(x) = 0 pro všechna x v oblasti, můžeme znovu derivovat ẏ a zı́skáme ÿ = Lf2 h(x) + Lg Lf h(x)u. Jestliže Lg Lf h(x) = 0, budeme derivovat dále, a to tak dlouho, než Lg Lfr−1 h(x) 6= 0. Pak je vstupnı́ transformace u= 1 (−Lfr h + v) Lg Lfr−1 h a vztah mezi vstupem a výstupem je y (r) = v. Počet derivacı́ potřebný k tomu, aby se objevila závislost na vstupnı́m signálu u udává relativnı́ stupeň systému. Tuto definici můžeme vyjádřit také pomocı́ Lieových derivacı́. Definice 15.6. Nelineárnı́ systém (15.49) s jednı́m vstupem a jednı́m výstupem má relativnı́ stupeň r v oblasti Ω, jestliže ∀x ∈ Ω je Lg Lfi h(x) = 0 Lg Lfr−1 h(x) 6= 0. ∀ i ≤ r − 1, (15.50) Lze dokázat, že u řiditelného systému řádu n lze provést nejvýše n derivacı́ jakéhokoliv výstupu, aby se ve vztahu objevil vstupnı́ signál u. To lze chápat i intuitivně. Kdyby bylo třeba vı́ce derivacı́, systém by měl řád vyššı́ než n; neobjevı́-li se při derivovánı́ výstupu vstup nikdy, systém nenı́ řiditelný. Relativnı́ stupeň r je tedy bud’ roven počtu stavů n nebo je menšı́. Jestliže je relativnı́ stupeň r systému roven počtu stavů n, pak linearizace vstup-výstup je současně linearizacı́ vstup-stav. Definice relativnı́ho stupně pro nelineárnı́ systém zcela odpovı́dá definici pro lineárnı́ systém ẋ = Ax + bu, y = cT x, u něhož vı́me, že relativnı́ stupeň r je rovněž menšı́ nebo roven řádu systému n. Provedeme-li operace uvedené v definici 15.6, pak u lineárnı́ho systému je relativnı́ stupeň nejmenšı́ celé čı́slo r takové, pro které platı́ cT Ak b = 0 k = 0, ..., r − 2 a cT Ar−1 b 6= 0. Toto čı́slo lze interpretovat jako rozdı́l mezi počtem pólů a počtem nul v přenosové funkci lineárnı́ho systému. Každý lineárnı́ systém, u něhož r < n, má nuly v přenosové funkci. Přı́klad 15.9. U mechanického systému z přı́kladu 15.8 definujme pomocnou výstupnı́ proměnnou y = x1 a řešme linearizaci systému jako problém linearizace vstup-výstup. Postupným derivovánı́m výstupu y zı́skáme vztahy y = x1 ẏ = ẋ1 = x2 ÿ = ẋ2 = −asinx1 − b(x1 − x3 ) y (3) = −ax2 cos x1 − bx2 + bx4 y (4) = ax22 sin x1 − a cos x1 [−a sin x1 − b(x1 − x3 )] + ba sin x1 + b(x1 − x3 ) + +bd(x1 − x3 ) + bcu = v Z poslednı́ rovnice vyplývá vztah pro řı́zenı́ u 1 1 v − [a sin x1 (x22 + a cos x1 + b) + b(x1 − x3 )(b + d + a cos x1 )], bc bc které odpovı́dá zı́skanému vztahu pro řı́zenı́ v přı́kladu 15.8, řešenı́ jsme ovšem tı́mto způsobem zı́skali mnohem snadněji. u= Dalšı́ jednoduché přı́klady pro přı́pad r = n jsme uvedli již v článku 15.1. KAPITOLA 15. EXAKTNÍ LINEARIZACE 15.4.1 153 Relativnı́ stupeň r < n. Normálnı́ formy. Jestliže r < n, lze nelineárnı́ systém transformovat na tzv. normálnı́ formu, kde pro část nových stavových proměnných z1 až zr zvolı́me jako v přı́padě r = n funkce [h, Lf h, ..., Lfr−1 h]. Dalšı́ n − r proměnné zr+1 , ..., zn zvolı́me tak, aby všechny proměnné zi , i = 1, ..., n byly vzájemně nezávislé. Dále je často možno vybrat Tr+1 (x), ..., Tn (x) takovým způsobem, aby Lg Ti (x) = 0, i = r + 1, ..., n pro všechna x ∈ Ω. Pak pro tato i je ∂Ti dzi = (f + gu) = Lf Ti (x) + Lg Ti (x)u = Lf Ti (x) = qi (z), dt ∂x dosadı́me-li x = T −1 (z) a označı́me-li qi (z) = Lf Ti (T −1 (z)) i = r + 1, ..., n. Stavový popis zadaného nelineárnı́ho systému je nynı́ v nových souřadnicı́ch z ve tvaru, který se nazývá normálnı́ forma ż1 = z2 ż2 = z3 ... żr+1 = qr+1 (z) żr−1 = zr ... żr = a(z) + b(z)u żn = qn (z) y = z1 . (15.51) (15.52) Označı́me-li prvnı́ch r souřadnic vektoru z vektorem ζ a souřadnice zr+1 , ..., zn vektorem η, lze normálnı́ formu zapsat ve tvaru    ζ1 ζ2  .   .. .   d  .  . =   dt  ζr  ζr−1   ζr a(ζ, η) + b(ζ, η)u       η̇ = q(ζ, η) y = ζ1 , (15.53) kde ζ = [z1 , ..., zr ]T η = [zr+1 , ..., zn ]T . Prvnı́ch r rovnic je v řiditelném kanonickém tvaru, n − r zbylých rovnic neobsahuje vstup systému u. Poznámka: Někdy nenı́ snadné určit n − r funkcı́ Tr+1 (x), ..., Tn (x) tak, aby Lg Ti (x) = 0, protože to vyžaduje řešit n − r parciálnı́ch diferenciálnı́ch rovnic. Obvykle je jednoduššı́ zvolit tyto funkce pouze tak, aby Jacobiova matice pro T (x) byla regulárnı́ v žádaném bodě x, což je postačujı́cı́ podmı́nkou k definovánı́ transformace souřadnic. Prvnı́ část normálnı́ formy je pak stejná jako v předchozı́m přı́padě, druhá část, odpovı́dajı́cı́ rovnici (15.52) je dána vztahy żr+1 = qr+1 (z) + pr+1 (z)u, ... , żn = qn (z) + pn (z)u, (15.54) v nichž se také objevuje vstupnı́ signál u. Přı́klad 15.10. [52] Uvažujme nelineárnı́ systém ẋ1 = −x1 + ex2 u ẋ2 = x1 x2 + u ẋ3 = x2 y = h(x) = x3 Derivace výstupu jsou ẏ = x2 ÿ = ẋ2 = x1 x2 + u. Systém má relativnı́ stupeň r = 2 a pro převedenı́ do normálnı́ formy zvolı́me z1 = ζ1 = h(x) = x3 z2 = ζ2 = Lf h(x) = x2 . (15.55) KAPITOLA 15. EXAKTNÍ LINEARIZACE 154 Třetı́ funkce η(x) by měla vyhovovat vztahu Lg η = ∂η x2 ∂η e + = 0. ∂x1 ∂x2 Jedno řešenı́ této rovnice je např. z3 = η(x) = 1 + x1 − ex2 . Stavová transformace je z = [ζ1 , ζ2 , η]T a jejı́ Jacobiova matice je regulárnı́ pro jakékoliv x. Inverznı́ transformace je dána vztahy x1 = −1 + η + eζ2 x2 = ζ2 x3 = ζ1 . Stavová transformace je platná globálně. Dynamika systému je v nových souřadnicı́ch v normálnı́ formě ζ˙1 = ζ2 15.4.2 ζ˙2 = (−1 + η + eζ2 )ζ2 + u η̇ = (1 − η − eζ2 )(1 + ζ2 eζ2 ). Vnitřnı́ a nulová dynamika Pomocı́ linearizace vstup-výstup je dynamika nelineárnı́ho systému rozdělena na vnějšı́ část mezi vstupem a výstupem a na vnitřnı́ ”nepozorovatelnou” část, která tvořı́ tzv. vnitřnı́ dynamiku. Protože vnějšı́ část je ve tvaru řiditelné kanonické formy mezi vstupem v a výstupem y, je snadné řı́dit v tak, aby se výstup y choval žádaným způsobem. Otázka přitom je, zda také vnitřnı́ dynamika se bude chovat vhodným způsobem, např. zůstanou-li jejı́ stavy ohraničené nebo ne. Tato vnitřnı́ dynamika je dána poslednı́mi (n − r) rovnicemi η̇ = q(ζ, η) v normálnı́ formě a závisı́ tedy i na vnějšı́ dynamice. Pokud je druhá část normálnı́ formy dána vztahem (15.54), pak je vnitřnı́ dynamika závislá dokonce i na specifickém řı́dı́cı́m signálu. Je patrno, že určenı́ stability vnitřnı́ dynamiky bude u složitějšı́ch systémů velmi obtı́žné, protože tato dynamika je obecně nelineárnı́, neautonomnı́ a závisı́ i na dynamice vnějšı́ uzavřené smyčky. Někdy se podařı́ určit stabilitu pomocı́ Ljapunovových funkcı́, u složitějšı́ch systémů se však vhodná funkce většinou nenalezne. Přitom řı́zenı́ navržené pro vnějšı́ část je prakticky použitelné pouze v přı́padě, že vnitřnı́ dynamika je stabilnı́. V opačném přı́padě nikoliv, protože nestabilita vnitřnı́ dynamiky vyvolá nežádoucı́ jevy, např. rozkmitánı́ systému, vibrace mechanických členů apod. Efektivnost linearizace vstup-výstup závisı́ proto předevšı́m na stabilitě vnitřnı́ dynamiky. Vnitřnı́ dynamika lineárnı́ch systémů Abychom objasnili trochu podrobněji otázky vnitřnı́ dynamiky, všimněme si nejprve této problematiky u lineárnı́ch systémů. Uved’me pro ilustraci jednoduchý přı́klad. Přı́klad 15.11. Lineárnı́ systém ẋ1 = x2 ẋ2 = x3 ẋ3 = −a0 x1 − a1 x2 − a2 x3 + u y = b0 x1 + b1 x2 má přenos G(s) = b 1 s + b0 s3 + a2 s2 + a1 s + a0 Úkolem je navrhnout řı́zenı́ u tak, aby bylo dosaženo asymptotického sledovánı́. Je znám požadovaný průběh výstupu yw (t) a jeho derivace ẏw (t), ÿw (t). Podobně jako u nelineárnı́ho systému můžeme i zde převést zadaný systém na ekvivalentnı́ reprezentaci ve tvaru sériového zapojenı́ integrátorů mezi výstupem a vstupem. Budeme-li postupně derivovat výstup y, pak ẏ = b0 ẋ1 + b1 ẋ2 = b0 x2 + b1 x3 ÿ = b0 ẋ2 + b1 ẋ3 = b0 x3 + b1 (−a0 x1 − a1 x2 − a2 x3 + u). KAPITOLA 15. EXAKTNÍ LINEARIZACE 155 Protože v druhé derivaci se již objevı́ vstupnı́ signál, je relativnı́ stupeň systému r = 2. Je patrno, že je rovný rozdı́lu mezi počtem pólů a počtem nul přenosu G(s). Volı́me-li řı́zenı́ ve tvaru u = (a0 x1 + a1 x2 + a2 x3 − b0 1 x3 ) + (k1 e + k2 ė + ÿw ), b1 b1 kde odchylka e = yw − y, pak ÿ = k1 e + k2 ė + ÿw tj. ë + k2 ė + k1 e = 0. Zvolené řı́zenı́ u vede na exponenciálně stabilnı́ odchylku, jejı́ž dynamika je 2. řádu. Vnitřnı́ dynamika bude proto popsána rovnicı́ 1. řádu. Nakreslı́me-li blokové schéma zadaného systému, je patrno, že jako vnitřnı́ stavovou proměnnou můžeme volit x1 , protože y, ẏ, x1 vytvářejı́ novou množinu stavů (jsou svázány s původnı́mi proměnnými x1 , x2 , x3 jednoznačnou transformacı́). Mezi ẋ1 a výstupem platı́ vztah ẋ1 b1 + x1 b0 = y. Internı́ dynamika je tedy dána rovnicı́ b0 1 x1 = y. b1 b1 Protože y je ohraničené, závisı́ stabilita vnitřnı́ dynamiky na členu b0 /b1 , tj. na poloze nuly v přenosu G(s). Je-li zadaný systém s minimálnı́ fázı́, pak b0 /b1 > 0. Nula ležı́ tedy v levé polorovině a vnitřnı́ dynamika je stabilnı́. ẋ1 + Výsledek uvedeného přı́kladu lze zobecnit na toto tvrzenı́. Internı́ dynamika lineárnı́ho systému je stabilnı́, jestliže nuly přenosu ležı́ v levé polorovině, tj. je-li systém s minimálnı́ fázı́ (důkaz např. v [36]). Vnitřnı́ a nulová dynamika nelineárnı́ch systémů Rozšı́řenı́ koncepce nul na nelineárnı́ systémy nenı́ jednoduché. U lineárnı́ch systémů jsou nuly přenosu dány vlastnostmi systému, takže stabilita internı́ dynamiky nezávisı́ na vstupnı́ch signálech. U nelineárnı́ch systémů však stabilita vnitřnı́ dynamiky na konkrétnı́ch řı́dı́cı́ch vstupech záviset může. Určitou cestu k odstraněnı́ této nesnáze představuje tzv. ”nulová dynamika”, která umožňuje učinit některé závěry o stabilitě vnitřnı́ dynamiky. Definice 15.7. Nulová dynamika nelineárnı́ho systému (15.49) je speciálnı́ přı́pad vnitřnı́ dynamiky, kdy se přivádı́ takový vstupnı́ signál, při němž výstup y je identicky rovný nule pro všechna t. Podmı́nka y(t) = 0 ∀t znamená, že všechny časové derivace y musı́ být nulové. Protože y(t) = z1 (t), musı́ být ż1 (t) = ż2 (t) = ... = żr (t) = 0, tj. ζ(t) = 0 pro všechna t. Řı́zenı́ u(t) musı́ pak být řešenı́m rovnice a(0, η(t)) + b(0, η(t))u(t) = 0. (15.56) Řı́zenı́ u, které udržuje vektor ζ na nule, je tedy u∗ (t) = − a(0, η(t)) b(0, η(t)) (15.57) a závisı́ tedy pouze na vnitřnı́ch stavech η(t). Nulová dynamika systému v normálnı́ formě je dána rovnicemi ζ̇ = 0 η̇ = q(0, η) (15.58) Má-li být výstup y(t) roven nule pro všechna t, musı́ být počátečnı́ stav nastaven na ζ(0) = 0, počátečnı́ stav η(0) může být zvolen libovolně. Časové průběhy vnitřnı́ch stavů η(t) a řı́zenı́ u∗ závisejı́ pak na počátečnı́ch podmı́nkách η(0). Z pohledu diferenciálnı́ geometrie je patrno, že nulová dynamika systému je jeho dynamika, při které je pohyb omezen na r-dimenzionálnı́ hladkou varietu M ⊂ Rn definovanou vztahem M = {x | h(x) = Lf h(x) = ... = Lfr−1 h(x) = 0}. KAPITOLA 15. EXAKTNÍ LINEARIZACE 156 Aby se systém pohyboval pouze po této varietě, musı́ zde ležet počátečnı́ stav x(0) a ekvivalentnı́ vstup v musı́ být nulový. Nulová dynamika je vnitřnı́ vlastnostı́ nelineárnı́ho systému, která nezávisı́ na volbě řı́zenı́ a na požadované trajektorii. Zkoumánı́ stability nulové dynamiky je mnohem snažšı́ než studium stability vnitřnı́ dynamiky, protože nulová dynamika zahrnuje jen vnitřnı́ stavy, zatı́m co internı́ dynamika je svázána s externı́ dynamikou a žádanými trajektoriemi. Zjednodušenı́ vnitřnı́ dynamiky na nulovou dynamiku umožňuje učinit některé jednoduššı́ závěry týkajı́cı́ se stability vnitřnı́ dynamiky. Např. u stabilizačnı́ úlohy je možno ukázat, že lokálnı́ asymptotická stabilita nulové dynamiky je postačujı́cı́ pro lokálnı́ asymptotickou stabilitu vnitřnı́ dynamiky. Užitečné výsledky lze zı́skat také pro úlohy sledovánı́. Systém, jehož nulová dynamika je asymptoticky stabilnı́, se nazývá systém s minimálnı́ fázı́. Nulová dynamika nám tedy umožňuje rozšı́řit pojem minimálně fázový systém i na nelineárnı́ systémy. Přı́klad 15.11. Výsledky linearizace nelineárnı́ho systému z přı́kladu 15.10 můžeme doplnit o internı́ dynamiku, která je reprezentována rovnicı́ η̇ = (1 − η − eζ2 )(1 + ζ2 eζ2 ). Nulovou dynamiku dostaneme, položı́me-li ζ1 = 0 a ζ2 = 0. Pak η̇ = −η. Vstupnı́ signál, který vždy nuluje výstup je u∗ = −(−1 + η + eζ2 )ζ2 . 15.4.3 Návrh řı́zenı́ při stabilizaci a sledovánı́ Po linearizaci nelineárnı́ho systému ve smyslu vstup-výstup je třeba navrhnout vhodný stavový regulátor a pak zjistit, zda vnitřnı́ dynamika je stabilnı́. V dalšı́m si všimneme odděleně problémů stabilizace a sledovánı́. Lokálnı́ asymptotická stabilizace. Předpokládejme, že nelineárnı́ systém (15.49) má rovnovážný stav v počátku (může být stabilnı́ nebo nestabilnı́). Lze ukázat, že stavový regulátor navržený pro lineárnı́ vnějšı́ dynamiku může stabilizovat celý systém za předpokladu, že nulová dynamika je asymptoticky stabilnı́. Věta 15.3. Předpokládejme, že nelineárnı́ systém (15.49) má relativnı́ stupeň r a jeho nulová dynamika je lokálně asymptoticky stabilnı́. Necht’ d(s) = sr + αr−1 sr−1 + ... + α1 s + α0 (15.59) je Hurwitzův polynom (jeho kořeny ležı́ v levé komplexnı́ polorovině). Pak stavová zpětná vazba u(x) = 1 [−Lfr h(x) − αr−1 Lfr−1 h(x) − ... − α1 Lf h(x) − α0 h(x)] Lg Lfr−1 h(x) (15.60) vede na lokálně asymptoticky stabilnı́ uzavřený systém. (Důkaz lze nalézt např. v [52]). U problémů stabilizace nezáležı́ na výstupnı́ funkci a je proto možno formálně vybrat výstup y = h(x) tak, aby odpovı́dajı́cı́ nulová dynamika byla asymptoticky stabilnı́. Úloha sledovánı́. Stavový regulátor navržený podle věty 15.3 může být snadno rozšı́řen na úlohy sledovánı́, jestliže se žádaný průběh výstupu a jeho derivacı́ zavede do rovnice (15.60) pro stavové řı́zenı́. Podrobnosti tohoto řešenı́ lze nalézt např v [52]. KAPITOLA 15. EXAKTNÍ LINEARIZACE 15.4.4 157 Systémy s vı́ce vstupy a výstupy Všechny dosud uvedené koncepce a postupy lze rozšı́řit na systémy s vı́ce vstupy a výstupy. Uvažujme nelineárnı́ systém se stejným počtem vstupů a výstupů ve tvaru ẋ = f (x) + g 1 (x)u1 + ... + g m (x)um (15.61) y1 = h1 (x) (15.62) ... ym = hm (x), kde ui jsou řı́dı́cı́ vstupy a yi výstupy, f a g i jsou hladká vektorová pole a hj hladké skalárnı́ funkce. Ve vektorovém zápisu je dán systém rovnicemi ẋ = f (x) + G(x)u y = h(x). (15.63) Linearizace vstup-výstup vyžaduje zase derivovánı́ výstupů yj tak dlouho, až se ve výrazu objevı́ vstupnı́ signály. Pro prvnı́ derivaci dostaneme vztah ẏj = Lf hj + m X (Lg i hj )ui . (15.64) i=1 Jestliže je Lg i hj (x) = 0 pro všechna i, vstupy se v rovnici neobjevı́ a je třeba derivovat dále. Předpokládejme, že rj je nejmenšı́ celé čı́slo takové, že alespoň jeden ze vstupů se objevı́ v derivaci (r ) yj j , pak (rj ) r = Lf j hj + yj m X r −1 Lg i Lf j hj u j , (15.65) i=1 r −1 kde Lg i Lf j hj (x) 6= 0 alespoň pro jedno i a ∀ x ∈ Ω. Provedeme-li tento postup pro každý výstup yj , dostaneme m rovnic, které můžeme zapsat v kompaktnı́ formě (r ) u1 Lr1 h1 (x) y 1      f  1 ...  + E(x)  ...   ...  =  (r ) Lfrm hm (x) um ym m (15.66) Lg 1 Lfr1 −1 h1 ... Lg m Lfr1 −1 h1   E(x) =  ... ... ...  rm −1 rm −1 Lg 1 Lf hm ... Lg m Lf hm (15.67)       kde m × m matice E(x) je   Jestliže matice E je regulárnı́ v oblasti Ω, pak vstupnı́ transformace v1 Lfr1 h1 (x)   −1  −1  ... u = −E   + E  ...  vm Lfrm hm (x)     (15.68) uskutečňuje lineárnı́ vztah mezi výstupem y a novým vstupem v (r1 ) y1 = v1 ... (rm ) ym = vm . (15.69) Mezi výstupy a novými vstupy v jsou nynı́ nejen lineárnı́ závislosti, ale jsou odstraněny i interakce mezi původnı́mi vstupy a výstupy. To má výhodu v tom, že nynı́ lze uskutečnit řı́zenı́ jednotlivých subsystémů se vstupem vi a výstupem yi nezávisle na sobě pomocı́ metod pro systémy s jednı́m vstupem a jednı́m výstupem. KAPITOLA 15. EXAKTNÍ LINEARIZACE 158 Při uvedeném postupu jsme viděli, že existuje relativnı́ stupeň pro každý výstup, takže relativnı́ stupeň celého systému je definován m celými čı́sly (r1 , ..., rm ). Celkový relativnı́ stupeň systému je dán jejich součtem, r = r1 + ... + rm . Relativnı́ stupeň r < n. Normálnı́ formu lze pro systém (15.63) zı́skat stejným způsobem jako pro systém s jednı́m vstupem a jednı́m výstupem. Za souřadnice ζ i zvolı́me ζ11 = h1 (x) ζ21 = Lf h1 (x) ... ζr11 = Lfr1 −1 h1 (x) ... ζrmm = Lfrm −1 hm (x). ..... ζ1m = hm (x) ζ2m = Lf hm (x) Souřadnice ζij , (j = 1, ..., m; i = 1, ..., rj ) jsou nezávislé a mohou být použity jako dı́lčı́ množina nového stavového vektoru. Jeho doplněnı́ provedeme n−r funkcemi η 1 až η n−r (x), které jsou nezávislé navzájem i k souřadnicı́m dřı́ve vybraným. Na rozdı́l od přı́padu s jednı́m vstupem však už nenı́ možno zaručit, že ∀x ∈ Ω Lg i η k (x) = 0 1≤i≤m 1≤k ≤n−r pokud vektorová pole g 1 , ..., g m nejsou involutivnı́ v Ω. Stavové rovnice pro zbylých n − r souřadnic budou tedy závislé na vstupnı́m vektoru u. Rovnice systému (15.61) lze tedy transformovat do normálnı́ formy, kde externı́ dynamika je dána vztahy ζ̇1j = ζ2j ... ζ̇rjj = aj (ζ, η) + m X bij (ζ, η)ui j = 1, 2, ..., m (15.70) i=1 a r aj (ζ, η) = Lf j hj (x) r −1 bij (ζ, η) = Lg i Lf j hj (x). Internı́ dynamika je η̇ = q(ζ, η) + P (ζ, η)u qk (ζ, η) = Lf ηk (x) Pki (ζ, η) = Lg i ηk (x) pro k = 1, ..., n − r a i = 1, ..., m. Vnitřnı́ a nulová dynamika. Pro stabilitu řı́zeného systému je zase třeba studovat stabilitu vnitřnı́ dynamiky. Je možno rovněž definovat zjednodušený přı́pad této dynamiky, tj.nulovou dynamiku, kdy výstupy systému se udržujı́ na nulové hodnotě. Pak ζ(t) = 0 a řı́dı́cı́ vstupy je třeba vybrat tak, aby u(t) = −E −1 (0, η) a(0, η), kde η(t) je řešenı́ diferenciálnı́ rovnice η̇(t) = q(0, η) − P (0, η)E −1 (0, η) a(0, η) s libovolnou počátečnı́ podmı́nkou η(0). Dynamická zpětná vazba. Linearizaci vstup-výstup lze uskutečnit pouze tehdy, jestliže matice E je regulárnı́ v Ω. Tato podmı́nka je často nesplnitelná a E je singulárnı́. Pak je možno přidat dynamiku do regulátoru a vytvořit dynamickou zpětnou vazbu od stavů. Jiná metoda využı́vá možnosti odvodit novou množinu nominálnı́ch výstupů tak, aby výsledná matice E byla regulárnı́. Problematika exaktnı́ch linearizacı́ je v současné době předmětem mnoha výzkumných úkolů a publikacı́. Teoretické výsledky byly aplikovány v mnoha oborech, např. při řı́zenı́ elektrických motorů, robotů, letadel, chemických výrob apod. Podrobné rozpracovánı́ teoretických problémů exaktnı́ linearizace lze nalézt předevšı́m ve vynikajı́cı́ch textech [36] a [49]. Přehled problémů globálnı́ linearizace je uveden v [61]. Kapitola 16 Identifikace nelineárnı́ch systémů Identifikace systému, to je určenı́ jeho struktury, stavů a parametrů může být založena na matematicko–fyzikálnı́ analýze zkoumaného objektu, nebo na rozboru změřených vstupnı́ch a výstupnı́ch dat, což je tzv. experimentálnı́ identifikace. V této kapitole se stručně seznámı́me s problémy experimentálnı́ identifikace stavů, parametrů i struktury nelineárnı́ch systémů. Nejprve se budeme zabývat deterministickými metodami identifikace, které jsou založeny na deterministických modelech nelineárnı́ch systémů a neznámé parametry těchto modelů se hledajı́ minimalizacı́ chybových funkcı́ měřených a simulovaných dat. Uvidı́me, že tyto metody jsou sice principielně jednoduché, ale vyžadujı́ poměrně kvalitnı́ předběžné odhady, nebot’ minimalizačnı́ procedury jinak konvergujı́ do falešných lokálnı́ch extrémů a chyba odhadu je nezanedbatelně veliká. V dalšı́ch odstavcı́ch se budeme stručně věnovat stochastickým metodám identifikace. Proto je nutno nejprve se stručně zmı́nit o stochastických modelech nelineárnı́ch systémů. Jednotı́cı́ základ metod identifikace je Bayesův přı́stup k identifikaci. Aproximačnı́ metoda založená na předpokladu normality šumu procesu a šumu měřenı́ a linearizaci nelineárnı́ho systému podél průběžných odhadů se nazývá rozšı́řený Kalmanův filtr. Pro řı́zenı́ systému má největšı́ význam průběžná identifikace, při které se odhady průběžně zpřesňujı́ naměřenými daty. Jednorázová identifikace spočı́vá v rozboru celé množiny naměřených dat. ¯ Odhadu parametrů při jednorázové identifikaci budeme řı́kat interpolace. Pokud známe několik možných alternativnı́ch struktur modelů identifikovaného objektu (až na konečný počet neznámých parametrů), můžeme provést klasifikaci těchto modelů. Klasifikace modelů spočı́vá v nalezenı́ jejich pravděpodobnosti podmı́něné změřenými daty. O tomto přı́stupu pojednáme v závěrečném odstavci této kapitoly. Protože řı́zenı́ systému i sběr dat se nynı́ realizuje téměř výhradně čı́slicovou technikou, tedy diskrétně, budeme se převážně věnovat systémům diskrétnı́m. V této kapitole uvedeme pouze některé metody. Výběr metod je podřı́zen rozsahu skripta a autorovou zkušenostı́. 16.1 Obecné úvahy Při následujı́cı́ch obecných úvahách o identifikaci nelineárnı́ch systémů vycházı́me z [76]. Základnı́ problém identifikace systému je nalezenı́ vhodné struktury modelu, to je určenı́ třı́dy modelů v nı́ž jsme schopni nalézt vyhovujı́cı́ model. Naladěnı́ modelu v dané struktuře spočı́vá obvykle v odhadu jeho neznámých parametrů, což je již jednoduššı́ problém. Základnı́m pravidlem je neodhadovat to, co již známe. Je tedy třeba využı́t veškerou apriornı́ informaci a znalosti o zkoumaném objektu. Rozlišujeme tři úrovně apriornı́ch znalostı́, které jsou pro 159 KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 160 názornost označeny ”barvami”. • Modely systému jako bı́lé skřı́ňky (white–box models). V tomto přı́padě je model úplně známý, je konstruován na základě apriornı́ch znalostı́ o objektu. To je přı́pad již zmı́něné matematicko–fyzikálnı́ analýzy zkoumaného objektu. • Modely šedé skřı́ňky (grey–box models): Máme pouze částečnou apriornı́ znalost a řada parametrů musı́ být určena z pozorovaných dat. Při tom můžeme rozlišit dva přı́pady. – Fyzikálnı́ modelovánı́. Struktura modelu je určena na základě fyzikálnı́ch znalostı́ o objektu a z dat určujeme pouze neznámé prametry modelu. – Částečné fyzikálnı́ modelovánı́. Naše znalosti o objektu vedou na určenı́ nelineárnı́ kombinace měřených dat. Tyto nové signály jsou potom využity ve struktuře modelu jako černé skřı́ňky. • Modely černé skřı́ňky (black–box models): Zde nemáme žádnou apriornı́ znalost o zkoumaném objektu. Je třeba zvolit takové třı́dy modelů, které jsou známé a které byly úspěšně využity v dřı́vějšı́ch aplikacı́ch. Lineárnı́ modely typu černé skřı́ňky vlastně spočı́vajı́ v popisu či aproximaci frekvenčnı́ch či časových charakteristik systému. Pro diskrétnı́ systém označı́me pozorované vstupy a výstupy u(k) resp. y(k) a šum e(k). Zavedeme operátor zpožděnı́ d (pak y(k − 1) = dy(k)). Polynom a(d) = a0 + a1 d + . . . + an dn použijeme k zápisu lineárnı́ kombinace zpožděných signálů, pak a(d)y(k) = a0 y(k) + a1 y(k − 1) + . . . + an y(k − n). Potom obecná třı́da lineárnı́ch diskrétnı́ch modelů je vyjádřena a(d)y(k) = b(d) c(d) u(k) + e(k) f (d) h(d) (16.1) Specielnı́ přı́pady jsou: při a(d) = 1 dostaneme tzv. Box–Jenkinsův model, při f (d) = h(d) = 1 zı́skáme tzv.ARMAX model (AutoRegressive model with Mowing Average and eXternal signal), při a(d) = c(d) = h(d) = 1 dostaneme model s chybou výstupu (output–error model) a při f (d) = c(d) = h(d) = 1 dostaneme tzv. ARX model. Nelineárnı́ modely černé skřı́ňky jsou mnohem komplikovanějšı́. Obecný nelineárnı́ model černé skřı́ňky je určen sjednocenı́m dvou zobrazenı́. Prvnı́ je zobrazenı́ minulých dat, jejichž množstvı́ v čase stále roste, na tak zvaný regresnı́ prostor konečné dimenze a druhé je zobrazenı́ z regresnı́ho prostoru na výstup systému. Problém identifikace nelineárnı́ho systému je následujı́cı́: Pozorujeme vstupy u(k) a výstupy y(k) na zkoumaném objektu uk = [u(k), u(k − 1), . . . , u(1)] y k = [y(k), y(k − 1), . . . , y(1)] a hledáme vztah mezi minulými pozorovánı́mi (daty) Dk−1 = [uk−1 , y k−1 ] a budoucı́m výstupem y(k) y(k) = g(uk−1 , y k−1 ) + v(k). (16.2) Aditivnı́ člen v(k) respektuje tu skutečnost, že výstup y(k) nenı́ přesnou funkcı́ minulých dat Dk−1 . Cı́lem je, aby chyba v(k) byla co nejmenšı́. Potom g(uk−1 , y k−1 ) je dobrou predikcı́ výstupu y(k) na základě minulých dat. Tuto predikci značı́me ŷ(k) = g(uk−1 , y k−1 ). KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 161 Problém je volba funkce g(.). Obvykle ji hledáme ve třı́dě funkcı́, které jsou parametrizovány konečněrozměrným vektorem parametrů θ, pak g = g(uk−1 , y k−1 , θ) (16.3) Tato parametrizace je většinou pouze přibližná. Pokud zvolı́me strukturu, pak nejvhodnějšı́ parametry nalezneme z dat minimalizacı́ rozdı́lu mezi modelem a změřenými daty θ ∗ = arg min θ k=N X ||y(k) − g(uk−1 , y k−1 , θ)||2 (16.4) k=1 Předchozı́ model g(uk−1 , y k−1 , θ) je přı́liš obecný. Proto, jak již bylo řečeno, g(.) vyjadřujeme jako sjednocenı́ dvou zobrazenı́. Jedno rostoucı́ množinu dat Dk zobrazı́ do konečněrozměrného vektoru ϕ(k) zvaného regresnı́ vektor a druhé zobrazı́ tento regresnı́ vektor na výstup. Pak g(uk−1 , y k−1 , θ) = g(ϕ(k), θ) kde ϕ(k) = ϕ(uk−1 , y k−1 ) Při tom tento regresnı́ vektor často opět parametrizujeme. Nelineárnı́ zobrazenı́ (16.3) se tedy dekomponuje do dvou problémů. Prvnı́m problémem je volba regresnı́ho vektoru ϕ(k) z minulých vstupů a výstupů a druhým problémem je volba nelineárnı́ho zobrazenı́ g(ϕ(k)) z regresnı́ho prostoru na výstup. Poznámka: Pro lineárnı́ model ve tvaru (16.1) je prediktor ve tvaru pseudolineárnı́ regrese ŷ(k|θ) = θ T ϕ(k, θ) Regresor, což jsou složky vektoru ϕ(k, θ), je pro ARX model tvořen pouze starými vstupy a výstupy u(k − i), y(k − i), pro i = 1, . . . , n. 2 U nelineárnı́ch systémů je regresor tvořen také starými vstupy a výstupy a také předchozı́mi výstupy z modelu ŷ(k−i|θ). Změřená data můžeme předzpracovat a užı́t filtrovaná data jako regresory. Nelineárnı́ zobrazenı́ g(ϕ(k), θ) z regresnı́ho prostoru na výstup je nejčastěji parametrizováno souborem funkcı́ X g(ϕ(k), θ) = αj gj (ϕ) kde gj (ϕ) jsou nějaké bázové funkce. Problémem je volba bázových funkcı́. Zde je celá řada možnostı́ od fourierových funkcı́, splinů, fuzzy modelů až k rekurentnı́m sı́tı́m. Pokud zvolı́me regresory ϕ(k, θ) a nelineárnı́ zobrazenı́ g(ϕ(k), θ) je problém identifikace nelineárnı́ho systému (nelineárnı́ho modelu černé skřı́ňky) převeden na odhad parametrů θ takového modelu. To je optimalizačnı́ úloha, která předpokládá vytvořenı́ kritéria optimalizace a volbu numerické metody řešenı́. Kritérium optimalizace je kvadratická nebo obecně nekvadratická norma chyby predikce. Každý ze zde uvedených kroků modelovánı́ systému jako černé skřı́ňky je složitý problém. Zde jsme pouze chtěli naznačit jednotlivé obecné kroky postupu při řešenı́ problému identifikace nelineárnı́ho dynamického systému. Uvažovali jsme zde pouze modely vnějšı́ho chovánı́ systému. Stavové modely bychom mohli zařadit do třı́dy modelů šedé skřı́ňky. Problémem je potom odhad stavů přı́padně parametrů v těchto stavových modelech. V dalšı́ch odstavcı́ch této kapitoly se budeme převážně věnovat těmto problémům. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 16.2 162 Deterministické modely a jejich identifikace Obecný nelineárnı́ spojitý systém je popsaný stavovými rovnicemi ẋ(t) = f (x(t), u(t), t) (16.5) y(t) = g (x(t), u(t), t) kde x(t) je stav systému v čase t, u(t) je vstup, y(t) je výstup systému a f (.) a g(.) jsou nelineárnı́ funkce svých argumentů. Obecný diskrétnı́ nelineárnı́ systém je popsaný stavovými rovnicemi x(k + 1) = f (x(k), u(k), k ) (16.6) y(k) = g (x(k), u(k), k ) které se formálně lišı́ pouze diskrétnı́m časem k. Předchozı́ stavové rovnice popisujı́ jednotným způsobem systémy jednorozměrové, což jsou systémy s jedinou vstupnı́ i výstupnı́ veličinou (systémy SISO - single input - single output) i systémy mnoharozměrové ( systémy MIMO - multiple input - multiple output). Mnoho nelineárnı́ch systémů je tvořeno statickou nelinearitou a dynamickým lineárnı́m modelem. Takové systémy modelujı́ mnoho reálných objektů. Podle toho, ve kterém mı́stě je umı́stěna statická nelinearita, mluvı́me o Hammersteinově nebo Wienerově modelu, přı́padně o jejich kombinaci. Hammersteinův model má statickou nelinearitu umı́stěnou na vstupnı́ straně systému. Tı́mto modelem můžeme popsat nelinearitu v akčnı́ch členech reálného objektu. Wienerův model má statickou nelinearitu umı́stěnou na výstupnı́ straně systému. Tı́mto modelem můžeme popsat nelinearitu čidel měřených veličin na reálném objektu. Kombinovaný Wiener - Hammersteinův model má statickou nelinearitu umı́stěnou uvnitř systému, to znamená, že je oddělena od vstupu i výstupu lineárnı́m dynamickým členem. Vlastnosti nelineárnı́ho systému jsou podstatně závislé na typu nelinearity. Rozlišuje se nelinearita kvadratická, obecně polynomiálnı́, nebo obecná nelinearita nespojitá na př. reléového typu. Určenı́ či volba struktury nelineárnı́ho systému je velmi důležitá i z hlediska identifikace nelineárnı́ho systému. Většinou pod identifikacı́ nelineárnı́ho systému si představujeme identifikaci stavů dynamického systému, nebo jeho parametrů, což jsou principielně shodné problémy. Struktura nelineárnı́ho systému musı́ být známá nebo je zvolena na základě znalostı́ reálného objektu. Existuje celá řada metod identifikace struktury nelineárnı́ch systémů - viz [66]. Obecně je možno o těchto metodách řı́cı́, že hodnotı́ a porovnávajı́ několik zvolených struktur nelineárnı́ch systémů a hodnotı́ jejich chyby odhadu výstupu. Při tom je třeba zamozřejmě odhadovat i zvolené parametry těchto alternativnı́ch modelů. Pokud máme několik alternativnı́ch struktur modelů, můžeme na základě dat vypočı́st jejich podmı́něnou pravděpodobnost, to je provést jejich klasifikaci. 16.2.1 Deterministické metody identifikace nelineárnı́ch systémů V tomto odstavci ukážeme, že identifikaci neznámých parametrů nelineárnı́ho systému na základě změřených hodnot vstupnı́ho a výstupnı́ho signálu je možno jednoduše převést na optimalizačnı́ problém. Na reálném objektu, který je předmětem identifikace provedeme měřenı́ vstupnı́ch a výstupnı́ch signálů. Volba vstupnı́ho signálu je velmi důležitá zvláště pro nelineárnı́ systém. Je zřejmé, že vstupnı́ signál musı́ být dostatečně frekvenčně bohatý abychom dobře mohli identifikovat dynamickou část systému. Amplituda vstupnı́ho signálu musı́ být dostatečná, abychom byli schopni identifikovat nelinearitu v systému. Protože neznáme počátečnı́ stav systému, je třeba experiment začı́t z nějakého KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 163 rovnovážného stavu - pak můžeme dosti dobře předpokládat, že stav na počátku experimentu je známý (na př. přibližně nulový). Máme tedy dostatečnou množinu vstupnı́ch a výstupnı́ch dat D1N D1N = {u(1), y(1), u(2), y(2), . . . , u(N ), y(N )} kde jsme indexem 1, N označili počátek a konec měřenı́. Pokud identifikujeme diskrétnı́ systém vše je v pořádku, pokud identifikujeme systém spojitý je třeba znát periodu vzorkovánı́ Ts . Čas spojitý a diskrétnı́ spolu souvisejı́ vztahem t = k Ts . Dále je třeba učinit nějaké předpoklady o průběhu vstupnı́ho signálu do spojitého systému. Často je měřicı́ experiment prováděn pomocı́ počı́tače a tak vstupnı́ signál je generován počı́tačem a přes analogo–čı́slicový převodnı́k je přiváděn na vstup identifikovaného objektu. Potom je vstupnı́ signál jednoznačně definován i mezi okamžiky vzorkovánı́. Nynı́ je třeba si vytvořit matematický model reálného objektu, jehož struktura je zvolena, model je tedy plně určen až na konečný počet neznámých parametrů θ, které jsou předmětem identifikace. Pro zvolené hodnoty neznámých parametrů můžeme vypočı́tat odezvu tohoto modelu na známý vstupnı́ signál, totožný se signálem, kterým jsme budili reálný neznámý objekt. Tı́m zı́skáme výstupnı́ posloupnost dat z modelu , která označı́me na př. y m (1), . . . , y m (N ). Je zřejmé, že budeme hledat takové parametry modelu, aby data zı́skaná na reálném objektu byla shodná s daty simulovanými na modelu. Zvolı́me si kritérium kvality na přı́klad ve tvaru J(θ) = N X (y(k) − y m (k, θ))T W k (y(k) − y m (k, θ)) (16.7) k=1 Kritérium může být libovolná nezáporná rostoucı́ funkce odchylky měřených a simulovaných dat. Zde jsme zvolili kvadratickou formu s pozitivně definitnı́ váhovou maticı́ W k , která může zohledňovat důležitost či přesnost jednotlivých dat. Nynı́ hledáme takové parametry θ ∗ , které minimalizujı́ zvolené kritérium θ ∗ = arg min J(θ) (16.8) θ Toto je problém statické optimalizace (úloha matematického programovánı́), který je možno řešit mnoha numerickými algoritmy. Volba numerické metody a podmı́nky na ukončenı́ iteracı́ je delikátnı́ problém, protože vždy je model pouze jistým přiblı́zenı́m k realitě. Z řady numerických optimalizačnı́ch metod připomeneme zde Levenbergerovu–Marquardtovu metodu nelineárnı́ch nejmenšı́ch čtverců. Nelinearity v modelu, zvláště nespojité mohou podstatným způsobem zhoršit či znemožnit konvergenci numerické metody. Proto je úplně podstatný počátečnı́ odhad parametrů, což závisı́ na apriornı́ch znalostech experimentátora o zkoumaném objektu. Byl vytvořen program na ověřenı́ této deterministické metody identifikace. Zı́skané zkušenosti ukazujı́, že shoda odezev systému a modelu může být dobrá a přesto nalezené parametry se mohou dosti lišit od parametrů skutečných. Kritérium kvality má řadu lokálnı́ch extrémů, které numerické metody nejsou schopny překonat. Nenı́ reálný předpoklad, že měřenı́ nejsou zatı́žena chybou. Simulace ukazujı́, že nepřesnosti měřenı́ ovlivňujı́ konvergenci metody a přesnost výsledků. Nynı́ uvedeme dva přı́klady na ilustraci uvedené metody. Přı́klad 1: Mějme spojitý nelineárnı́ systém popsaný stavovými rovnicemi ẋ1 (t) = θ1 sin(θ2 x1 (t)) + θ3 x1 (t) + θ4 cos(u(t)) ẋ2 (t) = θ5 x1 (t) y(t) = θ6 x2 (t) Skutečné parametry systému jsou θ= h −3 1 −5 1 1 1 i KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 164 Počátečnı́ odhad neznámých parametrů při startu minimalizačnı́ procedury byl θ= h −3.33 2.5 −4.6 1.4 0.5 1.4 i Počet vzorků odezvy byl N = 50. Po minimalizaci byl odhad parametrů roven θ= h −3.5 0.85 −5.5 0.92 0.91 1.2 i Rozdı́l v odezvě systému a identifikovaného modelu je zanedbatelný, přestože parametry nejsou odhadnuty přesně. Pokud měřený výstup zatı́žı́me chybou, kterou můžeme modelovat jako náhodný signál, je přesnost odhadu zhoršena i konvergence algoritmu je pomalejšı́. Přı́klad 2: Mějme diskrétnı́ nelineárnı́ systém popsaný stavovými rovnicemi x1 (k + 1) = θ1 x1 (k) + θ2 x2 (k) + θ3 u(k) x2 (k + 1) = θ4 x1 (k) + θ5 x2 (k) + θ6 u(k) y(t) = θ7 x1 (k) + sign (θ8 x2 (k)) + θ9 u(k) Skutečné parametry systému jsou θ= h 0.1 0.2 0.1 0.2 −0.1 0.2 1 3 0.5 i Počátečnı́ odhad neznámých parametrů při startu minimalizačnı́ procedury byl θ= h 0.06 0.13 0.12 0.2 −0.14 0.2 0.98 2.95 0.47 i Počet vzorků odezvy byl N = 200. Po minimalizaci byl odhad parametrů roven θ= h 0.08 0.2 0.084 0.21 −0.08 0.21 0.99 2.89 0.5 i Maximálnı́ chyba mezi měřeným a simulovaným výstupem je řádu 10−5 při vstupnı́m náhodném signálu velikosti řádově jednotky. Minimálnı́ hodnota minimalizovaného kritéria je J(θ ∗ ) = 4.4 × 10−8 . Při minimalizaci kritéria se osvědčilo volit konstantnı́ váhovou matici W k (při jediném výstupu se jedná o váhu Wk ) při prvnı́m běhu numerického algoritmu na minimalizaci kritéria a zı́skané výsledky dále zpřesnit novým během minimalizace s váhou rovnou absolutnı́ hodnotě maximálnı́ chyby v datech v přı́slušném čase. Simulace ukazujı́ na mnoho lokálnı́ch extrémů kritéria, které lze překonat pouze dobrým počátečnı́m odhadem hledaných parametrů. 16.3 Stochastické modely nelineárnı́ch systémů Statické nelineárnı́ modely Statický stochastický systém je obecně popsán podmı́něnou hustotou pravděpodobnosti p(y(t)|u(t), t) nebo p(y|u) pokud se jedná o systém časově invariantnı́. Nepodmı́něnou hustotu pravděpodobnosti výstupnı́ho vektoru dostaneme jednoduše jako marginálnı́ hustotu p(y) = Z p(y, u)du = Z p(y|u)p(u)du (16.9) Velmi často modelujeme stochastické systémy jako systémy deterministické, na které působı́ náhodné veličiny. Stochastický charakter takových systémů jim dodá generátor těchto náhodných veličin. Určenı́ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 165 stochastických vlastnostı́ výstupu je v tomto přı́padě vlastně problém transformace náhodných veličin nebo ve vı́cerozměrném přı́padě transformace náhodných vektorů. Statický systém je systém bez paměti u něhož vztah mezi vstupem u(t) a výstupem y(t) je popsán vztahem y(t) = g(u(t), t) (16.10) kde čas t je spojitý nebo diskrétnı́. Pokud je systém časově invariantnı́, transformace náhodného vstupnı́ho vektoru na vektor výstupnı́ nezávisı́ na čase a proto je možno všechny časové argumenty vypustit a stručně popisovat vztah mezi vstupem a výstupem vztahem y = g(u). Jednorozměrové systémy V jednorozměrovém přı́padě je situace přehledná. Pro určité y = y1 najdeme ze vztahu mezi vstupem a výstupem y = g(u) všechna ui pro která platı́ y1 = g(u1 ) = g(u2 ) = . . . = g(uj ). Neexistuje-li pro určité y1 řešenı́ u pro které y1 = g(u), pak p(y1 ) = 0. Pravděpodobnost Pr{y1 < y < y1 + dy}, že náhodná veličina y ležı́ ve ve zvoleném intervalu je rovna elementárnı́ ploše pod jejı́ hustotou pravděpodobnosti p(y1 )dy = Pr{y1 < y < y1 + dy} Protože ui jsou řešenı́ yi = g(ui ), pak současně platı́ p(y1 )dy = Pr{u1 < u < u1 + |du1 |; u2 < u < u2 + |du2 |; . . .} = p(u1 )|du1 | + p(u2 )|du2 | + . . . Uvědomme si, že přı́růstky dui nemusı́ být kladné, proto jsou přı́růstky brány v absolutnı́ hodnotě. Přı́růstky dui nalezneme ze vztahu dy = dg(ui ) = g 0 (ui )dui du Potom platı́ p(y1 )dy = p(u1 ) dy |g 0 (u 1 )| + p(u2 ) dy |g 0 (u 2 )| + ... Proto hustota pravděpodobnosti náhodné veličiny y v bodě y1 je rovna p(y1 ) = p(u1 ) p(u2 ) p(uj ) + 0 + ... + 0 0 |g (u1 )| |g (u2 )| |g (uj )| Pokud existuje jednoznačná inverznı́ funkce u = g −1 (y) k funkci g(y), pak platı́ následujı́cı́ obecný vztah pro hustotu pravděpodobnosti vstupnı́ náhodné veličiny py (y) = pu (g −1 (y)) 1 = pu (u) dg(u) du du dy u=g −1 (y) , (16.11) kde jsme indexy označili o jaké hustoty pravděpodobnosti se jedná. Střednı́ hodnota výstupu je dle definice µy = E{y} = Z ∞ g(u)p(u)du −∞ Je-li hustota pravděpodobnosti vstupu soustředěna kolem své střednı́ hodnoty µu (malý rozptyl vstupu), pak přibližně platı́ Z ∞ . µy = E{y} = g(µu ) p(u)du = g(µu ) (16.12) −∞ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 166 Také pro rozptyl výstupu můžeme odvodit přibližný vztah . σy2 = E{g(u)2 } − µ2u = E[g 0 (µu )]2 σu2 Přı́klad 3: Mějme lineárnı́ statický systém jehož výstup je roven y = au. Podle předchozı́ho vztahu je hustota pravděpodobnosti výstupu rovna py (y) = a1 pu ( ay ). Má-li náhodná veličina u normálnı́ rozdělenı́ u ∼ N (µ, σ 2 ), pak hustota pravděpodobnosti výstupu v bodě y = aµ je rovna py (aµ) = aµ 1 1 a pu ( a ) = a pu (µ). Odtud plyne, že náhodná veličina y má také normálnı́ rozdělenı́ se střednı́ hodnotou aµ a rozptylem a2 σ 2 . Nakreslete si průběh hustoty pravděpodobnosti výstupu pro konkrétnı́ hodnoty zesı́lenı́ a normálnı́ho rozdělenı́ vstupnı́ veličiny. Přı́klad 4: Odpor R je náhodná veličina s rovnoměrným rozdělenı́m v intervalu 90 ≤ R ≤ 110 Ω. Jaká je hustota pravděpodobnosti vodivosti G tohoto odporu. Hustota pravděpodobnosti náhodné veličiny R je p(R) = 1/20 na intervalu 90 ≤ R ≤ 110. Vodivost 1 je převrácená hodnota odporu G = . Jaká je tedy hustota pravděpodobnosti p(y) náhodné veličiny R a y = známe-li hustotu pravděpodobnosti p(u)? u Pro každé y má vztah y = a/u jediné řešenı́ u = a/y. Derivace g 0 (u) = −a/u2 = −y 2 /a. Proto hustota pravděpodobnosti p(y) náhodné veličiny y je rovna py (y) = |a| a pu ( ) 2 y y kde jsme indexy opět označili o jaké hustoty pravděpodobnoti se jedná. Pro náš přı́pad hustoty pravděpodobnosti vodivosti G při rovnoměrném rozloženı́ hustoty pravděpodobnosti jejı́ho odporu platı́ 1 1 1 1 1 1 pR ( ) = 2 pro ≤G≤ . 2 G G G 20 110 90 Průběh hustoty pravděpodobnosti odporu R a jeho vodivosti G je na obr. 16.1. pG (G) = Obrázek 16.1: Hustota pravděpodobnosti odporu R a vodivosti G Přı́klad 5: Necht’ výstup statického systému je roven y = a sin(u + θ), kde a > 0. Inverznı́ funkce je ui = arcsin( ay ) − θ. Derivace g 0 (ui ) = a cos(u + θ) = (a2 − y 2 )1/2 . Proto platı́ X 1 pu (ui ) py (y) = p 2 a − y2 i pro |y| < a, py (y) = 0 pro |y| > a. Pokud náhodná veličina u má rovnoměrné rozdělenı́ na intervalu (−π, π), pak je zřejmě p(u) = 1/2π na daném intervalu a vně tohoto intervalu je p(u) = 0. Funkce y = a sin(u + θ) má na daném intervalu dvě řešenı́ a proto py (y) = p 1 2 2 − y 2π a2 pro |y| < a, py (y) = 0 pro |y| > a KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 167 Průběh hustoty pravděpodobnosti náhodné veličiny u a y je na obr. 16.2. Obrázek 16.2: Hustota pravděpodobnosti náhodné veličiny u a y z přı́kladu 5. Mnoharozměrové statické systémy Nejprve budeme diskutovat systémy se dvěma vstupy a jednı́m výstupem. Jedná se potom o systém jehož výstup je určen vztahem y = g(u1 , u2 ). Pro určenı́ pravděpodobnostnı́ch charakteristik výstupu určı́me pro zvolenou hodnotu výstupu oblast U v rovině u1 , u2 pro kterou platı́ g(u1 , u2 ) < y. Distribučnı́ funkce Py (y) je potom určena jednoduše pravděpodobnostı́ Pr že výstup je menšı́ než zvolená hodnota y. Py (y) = Pr{(u1 , u2 ) ∈ U } = Z Z pu1,u2 (u1 , u2 )du1 du2 U (16.13) Hustotu pravděpodobnosti výstupu můžeme určit derivovánı́m předchozı́ho vztahu nebo podobně jako v předchozı́m jednorozměrovém přı́padě určenı́m oblasti ∆U v rovině u1 , u2 pro kterou platı́ y < g(u1 , u2 ) ≤ y+dy. Odtud pravděpodobnost, že výstup je v uvedeném intervalu je rovna elementárnı́ ploše Z Z py (y)dy = Pr{(u1 , u2 ) ∈ ∆U} = ∆U pu1,u2 (u1 , u2 )du1 du2 (16.14) Probereme nynı́ jako přı́klady několik specielnı́ch přı́padů. Přı́klad 6: Vztah mezi dvěma vstupy a jednı́m výstupem statického systému je určen vztahem y = u1 + u2 . V tomto přı́padě je distribučnı́ funkce výstupu rovna Py (y) = Z ∞ −∞ Z y−u2 −∞ pu1 ,u2 (u1 , u2 ) du1 du2 nebot’ pro dané y je u2 libovolné a u1 = y − u2 . Derivovánı́m předchozı́ho vztahu podle y dostaneme hustotu pravděpodobnosti výstupu py (y) = Z ∞ −∞ pu1 ,u2 (y − u2 , u2 ) du2 (16.15) Poznámka: Derivaci integrálu podle parametru provedeme podle Leibnitzova vzorce d dt Z b(t) f (t, τ )dτ = a(t) Z b(t) a(t) δf (t, τ ) d (b(t)) d (a(t)) dτ + f (t, b(t)) − f (t, a(t)) δt dt dt (16.16) 2 Pokud navı́c vstupnı́ náhodné veličiny jsou nezávislé, pak hustota pravděpodobnosti jejich součtu je rovna konvoluci jejich hustot py (y) = Z ∞ −∞ pu1 (y − u2 )pu2 (u2 ) du2 = Z ∞ −∞ pu1 (u1 )pu2 (y − u1 ) du1 (16.17) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 168 Pokud navı́c vstupnı́ veličiny nabývajı́ pouze nezáporné hodnoty je jejich součet také nezáporný a proto hustota pravděpodobnosti výstupu je rovna Z py (y) = y 0 a samozřejmě py (y) = 0 pu1 (y − u2 )pu2 (u2 ) du2 , pro y ≥ 0 pro y < 0. Přı́klad 7: Máme dva odpory které jsou zapojeny v serii. Odpor každého z nich je náhodná veličina s rovnoměrným rozdělenı́m v intervalu (80, 100) ohm. Celkový odpor seriové kombinace odporů je roven jejich součtu. Hustota pravděpodobnosti součtu je dána konvolucı́ dvou vzájemně nezávislých obdélnı́kových hustot jednotlivých odporů. Výsledkem konvoluce je trojúhelnı́kový průběh hustoty pravděpodobnosti součtu dvou odporů. Tato hustota je nenulová v intervalu (160, 200) - viz obr. 16.3. Obrázek 16.3: Hustota pravděpodobnosti odporů R1,2 a jejich součtu Rozmyslete si, jaké rozloženı́ hustoty pravděpodobnosti bude mı́t sériová kombinace třı́ a vı́ce odporů. Uvědomte si, jak se hustota pravděpodobnosti součtu několika odporů stále vı́ce blı́žı́ průběhu hustoty pravděpodobnosti normálnı́ho rozdělenı́. Přı́klad 8: Necht’ dva vlaky přijedou do určité stanice v časovém intervalu (0, T ). Doba jejich přı́jezdu je tedy náhodná veličina a obě náhodné veličiny necht’ jsou vzájemně nezávislé. Označı́me jako u1 a u2 časy přı́jezdu jednotlivých vlaků a necht’ y je časový interval mezi jejich přı́jezdem. Pak zřejmě platı́ y = |u1 − u2 | Nejprve určı́me hustotu náhodné veličiny z = u1 − u2 rovné rozdı́lu vstupů. Platı́ pz (z) = Z ∞ −∞ pu1 (z − u2 )pu2 (−u2 ) du2 , pro y ≥ 0 a hustota pravděpodobnosti náhodné veličiny z má trojúhelnı́kový průběh. Hustotu pravděpodobnosti výstupu y = |z|, která je nenulová pouze pro y ∈ (0, T ), dostaneme překlopenı́m záporné části hustoty veličiny z kolem osy y = 0, viz obr. 16.4. Obrázek 16.4: Hustota pravděpodobnosti náhodné veličiny u1,2 a y = |u1 − u2 | Ověřte, že střednı́ hodnota časového intervalu mezi přı́jezdy obou vlaků je rovna µy = T /3. Určete rozptyl této náhodné veličiny. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 169 Přı́klad 9: Necht’ nynı́ je výstup statického systému určen vztahem y = min(u1 , u2 ). Pro dané y je oblast U , pro kterou min(u1 , u2 ) ≤ y, určena zřejmě nerovnostı́ u1 ≤ y nebo u2 ≤ y. Nakreslete si v rovině u1 , u2 oblast bodů splňujı́cı́ch omezenı́ u1 ≤ y nebo u2 ≤ y. Odtud plyne vztah pro distribučnı́ funkci Py (y) Py (y) = Pu1 (y) + Pu2 (y) − Pu1 ,u2 (y, y) Pokud jsou náhodné veličiny u1 a u2 nezávislé, pak zřejmě Py (y) = Pu1 (y) + Pu2 (y) − Pu1 (y) Pu2 (y) Hustotu pravděpodobnosti výstupu dostaneme derivovánı́m předchozı́ho výrazu py (y) = pu1 (y) + pu2 (y) − pu1 (y) Pu2 (y) − pu2 (y) Pu1 (y) = pu1 (y) [1 − Pu2 (y)] + pu2 (y) [1 − Pu1 (y)] Přı́klad 10: Výstup statického systému je určen vztahem y = max(u1 , u2 ). Pro dané y je oblast U pro kterou max(u1 , u2 ) ≤ y určena zřejmě nerovnostı́ u1 ≤ y a u2 ≤ y. Nakreslete si opět v rovině u1 , u2 oblast bodů splňujı́cı́ch pro dané y omezenı́ u1 ≤ y a u2 ≤ y. Odtud plyne vztah pro distribučnı́ funkci Py (y) Py (y) = Pu1 ,u2 (y, y) Hustotu pravděpodobnosti výstupu dostaneme derivovánı́m předchozı́ho výrazu py (y) = dPu1 ,u2 (y, y) dPu1 ,u2 (y, y) + = du1 du2 Z y −∞ pu1 ,u2 (y, u2 )du2 + Z y −∞ pu1 ,u2 (u1 , y)du1 Pokud jsou náhodné veličiny u1 a u2 nezávislé, pak zřejmě Py (y) = Pu1 (y) Pu2 (y) py (y) = pu1 (y) Pu2 (y) + pu2 (y) Pu1 (y) Přı́klad 11: Předchozı́ vztahy můžeme použı́t při vyšetřovánı́ doby bezporuchového provozu dvou zařı́zenı́. Označme jako u1 a u2 náhodné veličiny, které jsou rovny době bezporuchového provozu dvou systémů S1 a S2 . Pravděpodobnost, že systém S1 se porouchá v čase t (za předpokladu, že začal pracovat v čase t = 0) je rovna distribučnı́ funkci Pu1 (t) náhodné veličiny u1 a podobně pro systém S2 . Necht’ složený systém S je tvořen subsystémy S1 a S2 . Označme jako y náhodnou veličinu, které je rovna době bezporuchového provozu složeného systému S. Nastane-li porucha složeného systému S tehdy, když alespoň v jednom subsystému nastane porucha, pak zřejmě náhodná veličina y je dána vztahem y = min(u1 , u2 ). To nastane na přı́klad tehdy, když subsystémy jsou zapojeny v serii. Nastane-li porucha složeného systému S tehdy, když v obou subsystémech nastane porucha, pak zřejmě náhodná veličina y je dána vztahem y = max(u1 , u2 ). To nastane na přı́klad tehdy, když subsystémy jsou zapojeny paralelně, to znamená, že zařı́zenı́ je schopno pracovat, když alespoň jeden systém je v bezporuchovém provozu. Systém S2 může být také použit jako záskok při poruše systému S1 . Potom doba bezporuchového provozu systému S tvořeného záskokovým zapojenı́m systémů S1 a S2 je rovna součtu bezporuchového provozu systémů S1 a S2 . Pak zřejmě náhodná veličina y je dána vztahem y = u1 + u2 . KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 170 Předpokládejme, že náhodné veličiny u1 a u2 jsou nezávislé a majı́ exponenciálnı́ rozdělenı́ pu1 (u1 ) = aeau1 , pu2 (u2 ) = bebu2 pro u1 > 0, u2 > 0. a pu1 (u1 ) = 0 pro u1 < 0 a pu2 (u2 ) = 0 pro u2 < 0 a navı́c a 6= b. Ověřte, že hustota pravděpodobnosti náhodné veličiny y při seriovém, paralelnı́m a záskokovém zapojenı́ subsystémů je po řadě rovna py (y) = (a + b)e(a+b)y py (y) = aeay + beby − (a + b)e(a+b)y ab ay py (y) = e − eby b−a Jaký je vztah pro hustotu pravděpodobnosti py (y) při záskokovém zapojenı́ subsystémů pokud a = b? 2 Pro obecný mnoharozměrový statický stochastický systém popsaný vztahem y = g(u) platı́ podobné vztahy. Omezı́me se na systémy se stejným počtem vstupů a výstupů u kterých existuje jednoznačná inverznı́ funkce u = g −1 (y). Pokud má systém menšı́ počet výstupů než vstupů, pak můžeme doplnit chybějı́cı́ počet výstupů některými vstupy (aby transformace byla jednoduchá). Marginálnı́ hustotu výstupu dostaneme vyintegrovánı́m uměle zavedených výstupů. Obráceně, pokud má systém vı́ce výstupů než vstupů, pak jej můžeme rozdělit na dva paralelnı́ systémy, které vyšetřujeme odděleně. Mějme tedy systém se stejným počtem vstupů a výstupů, kterých necht’ je m. Jednoznačná inverznı́ funkce existuje, pokud je pro každé y nenulový determinant Jakobiho matice (jakobián transformace g(y)). Jakobiho matice zobrazenı́ y = g(u) je rovna dg1 . . . , du m dg(u)   =  ..., ... ,...  J= du dgm dgm du1 , . . . , dum  dg1 du1 ,  (16.18) Abychom určili hustotu pravděpodobnosti p(y) výstupu systému ze známé vı́cerozměrové hustoty pravděpodobnosti vstupu p(u) a vlastnostı́ zobrazenı́ y = g(u), určı́me pro každé y inverznı́ funkci g −1 (y). Potom podle věty o substituci vypočteme vı́cerozměrnou hustotu pravděpodobnosti výstupu podle vztahu 1 py (y) = pu (g −1 (y)) (16.19) |det(J)| kde |det(J)| je absolutnı́ hodnota determinantu Jakobiho matice. Podobně určı́me globálnı́ charakteristiky výstupnı́ho vektoru. Vektor střednı́ch hodnot výstupu je roven Z µy = E{y} = ∞ g(u)p(u)du −∞ Kovariančnı́ matice výstupnı́ho vektoru je rovna cov(y) = P y = E{(y − E{y}) (y − E{y})T } Připomeňme, že v diagonále kovariančnı́ matice jsou rozptyly jednotlivých složek výstupu. Vzájemná kovariančnı́ matice mezi vstupnı́m a výstupnı́m vektorem je cov(y, u) = P y,u = E{(y − E{y}) (u − E{u})T } Uvedené vztahy použijeme při určovánı́ stochastických vlastnostı́ dynamických systémů. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 171 Diskrétnı́ dynamické nelineárnı́ systémy Stochastické diskrétnı́ dynamické systémy (systémy diskrétnı́ v čase ale spojité v úrovni všech veličin) jsou obecně popsány podmı́něnými hustotami pravděpodobnosti stavu a výstupu p(x(k + 1) | x(k), u(k)) (16.20) p(y(k) | x(k), u(k)), kde k je diskrétnı́ čas, x(k) je stav systému, u(k) je řı́zenı́ a y(k) je výstup systému. Prvnı́ podmı́něná hustota pravděpodobnosti popisuje stochastické vlastnosti vývoje stavu x(k) stochastického systému. Aby náhodný vektor x(k) byl stavem stochastického systému musı́ v sobě obsahovat veškerou informaci o minulém vývoji systému. Tuto t.zv. Markovovu vlastnost stavu můžeme vyjádřit vztahem p(x(k + 1)|x(k), x(k − 1), . . . , u(k), u(k − 1), . . .) = p(x(k + 1)|x(k), u(k)) Druhá podmı́něná hustota pravděpodobnosti v (16.20) popisuje stochastické vlastnosti výstupu systému, což často popisuje nepřesnosti měřicı́ch členů - čidel. Nelineárnı́ diskrétnı́ stochastický systém můžeme také popisovat stochastickou diferenčnı́ rovnicı́ x(k + 1) = f (x(k), u(k), v(k), k) (16.21) y(k) = g(x(k), u(k), e(k), k), kde náhodný vývoj stavu je reprezentovaný náhodným vektorem v(k) a náhodný vývoj výstupu je reprezentovaný náhodným vektorem e(k). Vývoj stavu a výstupu systému závisı́ na stochastických vlastnostech náhodných vektorů v(k) a e(k) a stochastických charakteristikách počátečnı́ho stavu x(0). Samozřejmě vývoj stavu ovlivňuje také řı́zenı́ u(k), které ale považujeme za deterministickou veličinu. Aby byla zachována Markovovská vlastnost stavu, musı́ platit p(v(k), v(k − 1), . . . , v(0), x(0)) = p(v(k)) p(v(k − 1)) . . . p(v(0)) p(x(0)) (16.22) To znamená, že náhodný proces v(k) musı́ tvořit posloupnost nezávislých náhodných vektorů. Stejná podmı́nka musı́ platit i pro náhodný proces e(k) a navı́c musı́ být náhodné procesy v(k) a e(k) vzájemně nezávislé. Také náhodný vektor x(0) musı́ být nezávislý na šumu procesu a šumu měřenı́. Řešenı́ stochastických diferenčnı́ch rovnic Řešenı́m diferenčnı́ rovnice stochastického diskrétnı́ho systému je náhodný proces x(k), který závisı́ na počátečnı́ podmı́nce x(0), řı́zenı́ u(k) na celém intervalu a samozřejmě na vlastnostech náhodného vektoru v(k). K úplné znalosti náhodného procesu x(k) je třeba znát libovolnou podmı́něnou konečněrozměrnou hustotu pravděpodobnosti p(x(k + 1), x(k), . . . , x(0)|u(k), u(k − 1), . . . , u(0)) Z Markovovy vlastnosti stavu plyne p(x(k + 1), x(k), . . . , x(0)|u(k), u(k − 1), . . . , u(0)) = p(x(k + 1)|x(k), u(k)) . . . p(x(1)|x(0), u(0)) p(x(0)) Zřejmě platı́ p(x(k + 1)|x(0)) = Z p(x(k + 1), x(i) | x(0))dx(i) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 172 a proto p(x(k + 1)|x(0)) = Z p(x(k + 1)|x(i))p(x(i)|x(0))dx(i), (16.23) kde 0 < i < k + 1. Tato rovnice se nazývá Chapman-Kolmogorovova rovnice. Určuje vývoj hustoty pravděpodobnosti stavu x(k + 1). Nepodmı́něnou hustotu pravděpodobnosti stavu x(k + 1) dostaneme jednoduše p(x(k + 1)) = Z p(x(k + 1)|x(0))p(x(0))dx(0) Je-li stochastický systém popsán stochastickou diferenčnı́ rovnicı́ (16.21), pak pro přenosovou hustotu pravděpodobnosti platı́ p(x(k + 1)|x(k), u(k) = pv (f −1 (x(k + 1), x(k), u(k)) , (k+1) det δx δ v (k) (16.24) (k+1) −1 je kde δx δ v (k) je Jakobián transformace mezi náhodným vektorem v(k) a vektorem x(k + 1) a f řešenı́ stochastické rovnice pro dané x(k + 1), x(k), u(k), pak v(k = f −1 (x(k + 1), x(k), u(k)) a pv je hustota pravděpodobnosti náhodného vektoru v(k). Poznámka: Pro častý přı́pad stochastické rovnice ve tvaru x(k + 1) = f (x(k), u(k), k) + v(k) (16.25) y(k) = g(x(k), u(k), k) + e(k), ve které šum procesu i měřenı́ vystupuje aditivně je Jakobián transformace roven jednotkové matici. Potom ve výrazu (16.24) pro přenosovou hustotu pravděpodobnosti je jmenovatel roven jedné. Je-li navı́c šum procesu v(k) posloupnost nezávislých vektorů (bı́lá posloupnost) s normálnı́m rozdělenı́m v(k) ∼ N (O; Q) je přenosová hustota pravděpobnosti také normálnı́ a je rovna p(x(k + 1)|x(k), u(k)) ∼ N (f (x(k), u(k), k); Q) (16.26) Také podmı́něná hustota pravděpodobnosti výstupu je normálnı́ se střednı́ hodnotou g(x(k), u(k), k) a kovariančnı́ matice výstupu je rovna kovariančnı́ matici šumu měřenı́. Poznámka: Pro stochastický lineárnı́ diskrétnı́ systém popsaný stavovou rovnicı́ x(k + 1) = Ax(k) + Bu(k) + F v(k) (16.27) y(k) = Cx(k) + Du(k) + He(k), kde šumy v(k), e(k) jsou nezávislé posloupnosti s normálnı́m rozdělenı́m v(k) ∼ N (O; Q) , e(k) ∼ N (O; R) jsou podmı́něné hustoty pravděpodobnosti také normálnı́, rovné p(x(k + 1)|x(k), u(k)) ∼ N (Ax(k) + Bu(k); F QF T ) (16.28) T p(y(k)|x(k), u(k)) ∼ N (Cx(k) + Du(k); HRH ) Poznámka: Stochastický nelineárnı́ diskrétnı́ systém popsaný stavovou rovnicı́ (16.25) můžeme linearizovat v nějakém pracovnı́m bodě x0 (k), u0 (k). Pak dostaneme linearizované stavové rovnice ve tvaru x(k + 1) = y(k) = df (x, u, k) df (x, u, k) x(k) + u(k) + v(k) dx du dg(x, u, k) dg(x, u, k) x(k) + u(k) + e(k), dx du (16.29) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 173 kde všechny derivace počı́táme v pracovnı́m bodě x0 (k), u0 (k). Potom pro tento linearizovaný systém můžeme podmı́něné hustoty pravděpodobnosti přibližně počı́tat podle vztahů uvedených v předchozı́ch dvou poznámkách. Poznámka: V některých přı́padech je stochastický nelineárnı́ diskrétnı́ systém popsaný stavovými rovnicemi v implicitnı́m tvaru x(k + 1) = F (x(k + 1), x(k), u(k)) + v(k) (16.30) Posunutý stav x(k + 1) se vyskytuje také na pravě straně stavové rovnice. Linearizaci této stavové rovnice provedeme opět v nějakém pracovnı́m bodě x0 (k + 1), x0 (k), u0 (k) dF (x(k + 1), x, u, k) x(k + 1) + dx(k + 1) dF (x(k + 1), x, u, k) dF (x(k + 1), x, u, k) x(k) + u(k) + v(k) dx(k) du(k) x(k + 1) = Po úpravě dostaneme linearizované rovnice ve tvaru dF (x(k + 1), x, u, k) −1 x(k + 1) = I − dx(k + 1) dF (x(k + 1), x, u, k) dF (x(k + 1), x, u, k) x(k) + u(k) + v(k) dx(k) du(k) kde všechny derivace opět počı́táme v pracovnı́m bodě x0 (k), u0 (k). Při tom předpokládáme, že inverznı́ matice v předchozı́m výrazu existuje. Uvědomme si, že linearizace a odstraněnı́ implicitnı́ho popisu je pouze přibližné, protože pro výpočet stavu v čase k + 1 musı́me v inverznı́ matici počı́tat derivaci dF /dx(k+1) v bodě x0 (k+1), který ještě neznáme. To lze přibližně odstranit pouze iteračnı́m výpočtem. 2 ’ Práce se stochastickými diskrétnı́mi systémy je poměrně jednoduchá, nebot na rozdı́l od spojitých stochastických systémů nenı́ třeba definovat derivaci a integrál stochastického procesu. Spojité dynamické nelineárnı́ systémy V tomto odstavci uvedeme stručně výsledky modelovánı́ a řešenı́ stochastických nelineárnı́ch systémů. Uvedené vztahy majı́ sloužit pouze jako uvedenı́ do složité problematiky analýzy vlastnostı́ spojitých stochastických systémů. Podrobnějšı́ rozbor této problematiky je možno nalézt v [20] a [37]. Stochastické spojité dynamické systémy jsou popsány Itovovou stochastickou diferenciálnı́ rovnicı́ dx(t) = f (x(t), u(t), t) dt + dw(t) (16.31) kde w(t) je tzv. Wienerův proces a dw(t) je přı́růstek tohoto procesu. Wienerův proces (nebo také Wiener–Lévyho proces) má normálnı́ rozdělenı́ s nulovou střednı́ hodnotou a má nezávislé a stacionárnı́ přı́růstky. Wienerův proces je formálně definován následujı́cı́mi vztahy: w(0) = O, E{w(t)} = O, ∀t > 0 T E{w(t)w(t) } = Q t. Wienerův proces matematicky popisuje Brownův pohyb. Realizace Wienerova procesu má zajı́mavé vlastnosti - je spojitá s pravděpodobnostı́ jedna a jejı́ derivace nikde neexistuje. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 174 Přı́růstek Wienerova procesu má nulovou střednı́ hodnotu, jeho kovariance je n E dw(t)dw(t)T o = Q dt a hodnoty přı́růstků v nepřekrývajı́cı́ch se časových intervalech jsou nezávislé. Rovnici (16.31) můžeme formálně zapsat ve tvaru ẋ(t) = f (x(t), u(t), t) + v(t), (16.32) kde náhodný proces v(t) je spojitý bı́lý šum s autokovariančnı́ matici cov {v(t1 ), v(t2 )} = Q δ(t1 − t2 ), (16.33) a δ(t) je Diracova funkce (Diracova distribuce). Popis stochastického systému podle (16.32) je třeba chápat pouze jako symbolickou analogii Itovovy stochastické diferenciálnı́ rovnice (16.31), nebot’ derivace dw(t) v(t) = dt Wienerova procesu w(t) neexistuje. Přesný popis spojitého stochastického systému je uveden v [20] nebo v [37]. Výstupnı́ rovnice spojitého stochastického systému se spojitým měřenı́m výstupu je y(t) = g (x(t), u(t), t) + e(t), (16.34) kde spojitý šum měřenı́ e(t) má nulovou střednı́ hodnotu a kovariančnı́ matici Res a je nekorelovaný se šumem procesu v(t). Index es znamená, že se jedná o šum spojitého měřicı́ho členu. Pokud uvažujeme diskrétnı́ měřenı́ výstupu, pak je výstupnı́ rovnice y(k) = g (x(k), u(k), k) + e(k) (16.35) kde diskrétnı́ čas k je svázán se spojitým časem t vztahem t = k T a T je perioda vzorkovánı́ (která nemusı́ být nutně konstantnı́). Diskrétnı́ bı́lý šum e(k) má nulovou střednı́ hodnotu a kovariančnı́ matici Red = T1 Res a je také nekorelovaný se šumem procesu v(t). Uvědomme si, že diskrétnı́ bı́lý π π šum má konstantnı́ spektrálnı́ hustotu na intervalu frekvencı́ ω ∈ − , a je to tedy bı́lý šum T T vzniklý vzorkovánı́m spojitého bı́lého šumu, který byl před vzorkovánı́m filtrován dolnofrekvenčnı́m filtrem s frekvenčnı́m rozsahem ve stejném frekvenčnı́m pásmu - viz věta o vzorkovánı́. Poznámka: Uvědomme si, že spojitý bı́lý šum e(t) je pouze matematickou abstrakcı́ a nenı́ fyzikálně realizovatelný. Spojitý bı́lý šum má frekvenčnı́ spektrum konstantnı́ na celém rozsahu frekvencı́ a takový signál by měl nekonečnou energii. Naproti tomu diskrétnı́ bı́lý šum e(k) s kovariančnı́ maticı́ E(e(k1 ) e(k2 )) = R δ(k1 −k2 ), kde δ(k) = 0 ∀k 6= 0, δ(0) = 1 je fyzikálně realizovatelný. Proto je potı́ž s diskretizacı́ nerealizovatelného spojitého bı́lého šumu. Je proto lepšı́ představit si, že spojitý i diskrétnı́ bı́lý šum modelujı́ nepřesnosti spojitého a diskrétnı́ho měřicı́ho členu. Vlastnosti těchto měřicı́ch členů spolu vůbec nemusejı́ souviset. 2 U spojitých stochastických systémů nás zajı́má, jak se v čase vyvı́jı́ podmı́něná hustota pravděpodobnosti stavu x v čase t z počátečnı́ho stavu z = x(t0 ) v čase t0 , při působenı́ deterministického řı́zenı́ u(τ ) na intervalu t > τ ≥ t0 . Tuto podmı́něnou hustotu označı́me p (x(t)|z, u(τ ), t > τ ≥ t0 ). Vývoj této hustoty je popsán tzv. Fokker–Planckovou nebo přı́mou Kolmogorovovou parciálnı́ diferenciálnı́ rovnicı́ ∂ p(x(t)|z(t), u(τ )) = −tr ∂t n ∂p(x(t)|z(t), u(τ ))f (x(t), u(t), t) 1 X ∂ 2 p(x(t)z(t), u(τ ))qi,j + ∂x(t) 2 i,j=1 ∂xi ∂xj (16.36) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 175 kde qi,j je (i, j)-tý prvek matice Q. Počátečnı́ podmı́nky jsou p (x(t0 )|z, u(t0 ), t0 ) = δ (x(t0 ) − z). Focker Planckova rovnice může být přı́mo řešena pouze ve specielnı́ch přı́padech. Zde ji uvádı́me spı́še pro ukázku toho, jak je vývoj hustoty stavu v čase komplikovaný u spojitých systémů. Nás ale vı́ce bude zajı́mat vývoj prvnı́ch dvou momentů - střednı́ hodnoty a kovariance stavu. b (t) = E {x(t) | z, u(τ )}. Pro ni platı́ Označı́me tedy podmı́něnou střednı́ hodnotu stavu jako x b (t) ∂x = E {f (x(t), u(t), t) | x(t0 ) = z, u(τ )} ∂t (16.37) Poznamenejme, že obecně b (t), u(t), t) E {f (x(t), u(t), t) | x(t0 )z, u(τ )} = 6 f (x n o b ) (x(t) − x b )T | x(t0 ) = z, u(τ ) . Pro jejı́ vývoj je Podmı́něná kovariance stavu je P (t) = E (x(t) − x možno odvodit následujı́cı́ vztah Ṗ (t) = h n o i h n o i b (x, u, t)T + b (t) . f E x(t) . f (x(t), u(t), t)T − x b (t)T + Q. E f (x(t), u(t), t) . x(t)T − fb (x, u, t) . x Předchozı́ rovnice jsou složité integro–diferenciálnı́ rovnice, protože operátor střednı́ hodnoty je integrálnı́ operátor k jehož řešenı́ je třeba znát podmı́něnou hustotu pravděpodobnosti stavu, která je určena řešenı́m Kolmogorovovy rovnice. Poznámka: Pro lineárnı́ stochastické systémy popsané stavovou rovnicı́ ẋ(t) = Ax(t) + Bu(t) + v(t) je vývoj podmı́něné střednı́ hodnoty popsán jednoduše vztahem ḃ b (t) x(t) = Ax a vývoj kovariančnı́ matice je určen řešenı́m Ljapunovovy rovnice Ṗ (t) = P (t)AT + AP (t) + Q. Předchozı́ diferenciálnı́ rovnice řešı́me z počátečnı́ch podmı́nek daných informacı́ o počátečnı́m stavu. 2 16.4 Stochastické metody identifikace nelineárnı́ch systémů 16.4.1 Bayesovské metody Jednotı́cı́m základem metod identifikace jsou Bayesovské metody. V nich se neznámé stavy, parametry či struktury považujı́ za náhodné veličiny. Našı́ subjektivnı́ představu o rozloženı́ pravděpodobnosti těchto náhodných veličin objektivizujeme daty změřenými na identifikovaném objektu. Předpokládejme, že pozorujeme (měřı́me) vstup u(τ ) a výstup y(τ ) v čase τ = 1, . . . , k−1 a naše znalost stavu systému založená na množině dat Dk−1 = {u(1), y(1), . . . , u(k−1), y(k−1)} je popsána podmı́něnou hustotou pravděpodobnosti p x(k)| Dk−1 . (16.38) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 176 Problém naši popsanou podmı́něnou hustotou pravděpodobnosti je, jak aktualizovat znalost stavu k−1 k (p.h.p.) p x(k)|D na p.d.f p x(k+1)|D poté, co jsou změřena nová vstupnı́ a výstupnı́ data {u(k), y(k)}. Při tom známe pravděpodobnostnı́ model systému, který určuje pravděpodobnostnı́ vlastnosti výstupu systému p (y(k)| x(k), u(k)) (16.39) a pravděpodobnostnı́ vývoj stavu systému p (x(k+1)| x(k), u(k), y(k)) . (16.40) Řešenı́ tohoto problému se skládá ze dvou kroků. Datový, (filtračnı́, nebo objektivnı́) krok je založený na vstupnı́ch a výstupnı́ch datech. Vycházı́me tedy ze známé p.h.p. p x(k)| Dk−1 . Povšimněme si, že tato p.h.p. je založena na datech až do času k−1. Užitı́m modelu výstupu určeným p.h.p. p (y(k)| x(k), u(k)) můžeme vzájemnou p.h.p. výstupu a stavu psát ve tvaru p y(k), x(k)| Dk−1 , u(k) = (16.41)   = p y(k)| x(k), u(k), Dk−1 p x(k)| Dk−1 , u(k) = p x(k)| y(k), u(k), Dk−1  p y(k)|u(k), Dk−1 , u(k)   } {z | Dk Z předchozı́ho vztahu užitı́m tzv. přirozených podmı́nek řı́zenı́ p x(k)| Dk−1 , u(k) = p x(k)| Dk−1 (16.42) plyne vztah pro aktualizaci p.h.p. pomocı́ nově zı́skaných dat p x(k)| Dk = 1 p y(k)| x(k), u(k), Dk−1 p x(k)| Dk−1 , u(k) α (16.43) kde normalizačnı́ konstanta α je nezávislá na datech a je rovna p y(k)| Dk−1 , u(k) = Z p y(k), x(k)| Dk−1 , u(k) dx(k) (16.44) až na normalizačnı́ konstantu Povšimněme si, že je datový krok součin věrohodnostnı́ funkce p y(k)| x(k), u(k), Dk−1 a p.h.p p x(k)| Dk−1 , u(k) založené na starých datech. Předchozı́m vztahem je ukončen datový krok algoritmu. Časový (predikčnı́ nebo subjektivnı́) krok je založen na pravděpodobnostnı́m modelu systému, který je určen známou p.h.p. (16.40). Využitı́m vztahu pro marginálnı́ hustotu pravděpodobnosti můžeme psát prediktivnı́ hustotu pravděpodobnosti ve tvaru p x(k+1)| Dk = Z p x(k+1), x(k)| Dk dx(k) Použitı́m vztahu pro podmiňovánı́ dostaneme konečný vztah pro prediktivnı́ p.h.p. stavu p x(k+1)| Dk = Z p x(k+1)| Dk , x(k) p x(k)| Dk dx(k) (16.45) Poznámka: Stejné vztahy platı́ pro spojitý systém, pouze časový krok se provádı́ obecně velmi obtı́žně pomocı́ Fokkerovy-Planckovy difuznı́ rovnice. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ u(k) 177 y(k) 10 120 8 100 6 80 4 60 2 0 0 5 10 40 0 15 5 Skut. hod. par. a(k) 10 1 8 0.8 6 0.6 4 0.4 2 0.2 0 0 5 10 15 p(a(0)) 10 0 0 15 5 10 Obrázek 16.5: Hodnoty předstihu u(k), okamžitého výkonu y(k), průběhu změn parametru a(k) i apriornı́ hustoty p(a(0)). Přı́klad 12: Odhad parametrů extremálnı́ charakteristiky spalovacı́ho motoru. U spalovacı́ho motoru má závislost mezi předstihem a výkonem motoru extremálnı́ charakter, který při velkém zjednodušenı́ lze popsat vztahem y = b − c(u − a)2 + e kde y je okamžitý výkon motoru, u je předstih, a, b, c jsou parametry polohy paraboly, šum e modeluje nepřesnosti měřenı́. p(a) p(a) p(a) 1.5 0.2 p(a) p(a) 2 2 2 1 1 1 1 0.5 0 0 5 10 2 0 0 5 10 0 0 3 3 2 2 1 1 5 10 1 0 0 5 10 1.5 0 0 5 10 2 1 0 0 5 10 0 0 5 10 0 0 4 4 2 2 0 0 5 10 0 0 3 3 3 2 2 2 1 1 1 5 10 5 10 5 10 1 0.5 0 0 5 10 0 0 5 10 0 0 5 10 0 0 5 10 0 0 Obrázek 16.6: Vývoj hustoty pravděpodobnosti p(a(k)) v čase KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 178 Poloha paraboly závisı́ na mnoha činitelı́ch (kvalitě paliva, otáčkách motoru, teplotě a opotřebenı́ motoru a pod.). Předpokládáme, že známe parametr b, (b = 100)a parametr c, (c = 1) a pak pouze parametr a je předmětem identifikace. Při tom předpokládáme, že parametr a leži v intervalu 0 ≤ a ≤ 10; přesněji řečeno pouze v tomto intervalu budeme zjišt’ovat průběh hustoty pravděpodobnosti p(a) tohoto parametru. Identifikaci parametru a převedeme na identifikaci stavu x(k) = a(k), kde stavová rovnice má tvar x(k + 1) = x(k) + v(k), a kde k je diskrétnı́ čas ve kterém provádı́me měřenı́ předstihu u(k) a okamžitého výkonu y(k). Vývoj parametru je tedy popsán jako ”náhodná procházka” a šum v(k) ∼ N (0, σv2 ) umožňuje sledovat změny parametrů. Pro stavový model popsaný předchozı́ rovnicı́ je rovnice paraboly výstupnı́ rovnicı́ systému, jehož stav (parametr a(k)) odhadujeme. Tuto výstupnı́ rovnici zapı́šeme ve tvaru y(k) = 100 − (u(k) − x(k))2 + e(k) Ladicı́ nástroje při identifikaci jsou jednak rozptyl šumu měřenı́ - tı́m vlastně modelujeme věrohodnost dat a rozptyl šumu stavu v(k). Pokud je rozptyl tohoto šumu nulový, modelujeme tı́m, že hledaný parametr má konstantnı́ hodnotu (což v praxi nenı́ nikdy splněno). Na počátku předpokládáme rovnoměrné rozdělenı́ hustoty pravděpodobnosti p(a). Protože předpokládáme normalitu šumu měřenı́, je i podmı́něná hustota výstupu normálnı́ 1 1 2σ12 (y(k)−(100−u(k)−a(k|k−1))2 )2 e e p y(k)|a(k), Dk−1 , u(k) = √ 2π σe Tato podmı́něná hustota výstupu se nazývá věrohodnostnı́ funkce l(a(k)|y(k). l(a) 0.1 0 0 0.1 5 0.1 0 0 l(a) 10 0 0 0.1 5 0.1 5 10 0 0 l(a) 10 0 0 0.1 5 0.1 5 10 0 0 l(a) 10 0 0 0.1 5 0.1 5 10 0 0 l(a) 10 0 0 5 10 5 10 5 10 0.1 5 10 0 0 0.1 0.1 0.1 0.1 0.1 0.05 0 0 5 10 0 0 5 10 0 0 5 10 0 0 5 10 0 0 Obrázek 16.7: Nekumulovaná věrohodnostnı́ funkce l(a(k)|y(k)) Výsledky simulace jsou uvedeny na obrázcı́ch 16.5, 16.6 a 16.7. Na obr. 16.5 jsou vyneseny simulované průběhy předstihu u(k), okamžitého výkonu y(k), skutečné hodnoty parametru a(k) a apriornı́ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 179 hustoty parametru p(a(0)). Protože je reálný předpoklad, že data nejsou změřena přesně, je k simulovanému výstupu přičten náhodný šum s rovnoměrným rozdělenı́m na intervalu [−5, +5]. Na obr. 16.6 je vynesen průběh hustoty pravděpodobnosti p(a(k|k)) pro několik prvnı́ch kroků identifikace. Skutečná hodnota parametru byla a(k) = 5 pro 1 ≤ k ≤ 5. Tomu odpovı́dajı́ průběhy hustot pravděpodobnosti p(a) v prvnı́m řádku obr. 16.6 postupně pro k = 1 až k = 5. Pro 6 ≤ k ≤ 10 je skutečná hodnota parametru a(k) = 2, to znamená, že v čase k = 5 nastala skoková změna parametru a. Pro 6 ≤ k ≤ 10 jsou průběhy hustoty parametru p(a(k)) vypočtené z dat podle Bayesova vztahu vyneseny postupně v druhém řádku obr. 16.6. Pro 11 ≤ k ≤ 15 je skutečná hodnota parametru a(k) = 7, to znamená, že v čase k = 11 nastala dalšı́ skoková změna parametru a. Pro 11 ≤ k ≤ 15 jsou průběhy hustoty parametru p(a(k)) vypočtené z dat podle Bayesova vztahu vyneseny postupně ve třetı́m řádku obr. 16.6. V obr. 16.7 jsou vyneseny průběhy věrohodnostnı́ funkce l(a(k)|y(k)) po jednotlivých krocı́ch k. Povšimněte si, že vlivem kvadratické závislosti vstupu a výstupu systému má někdy věrohodnostnı́ funkce dva extrémy na sledovaném intervalu. Hustota pravděpodobnosti p(a(k)) i věrohodnostnı́ funkce l(a(k)|y(k) byly počı́tány v sı́ti 500 hodnot na intervalu 0 ≤ a ≤ 10. Sledovánı́ změn parametru a bylo umožněno zapomı́nánı́m (viz šum stavu v(k) ), které zde bylo realizováno tı́m způsobem, že k hustotě p(a(k)) byla v časovém kroku přičtena nepatrná konstanta řádu 10−7 . V tomto přı́padě simulované výsledky estimace parametru a byly velmi uspokojivé. Uvědomte si ale velké potı́že při identifikaci vı́ce parametrů. 16.4.2 Rozšı́řený Kalmanův filtr Kalmanův filtr provádı́ za některých předpokladů výpočet prvnı́ch dvou momentů p.h.p stavu, jejı́ž obecný vývoj byl popsán v předchozı́m odstavci. Pokud je systém lineárnı́ a šumy stavu a výstupu jsou normálnı́, pak jsou také normálnı́ všechny podmı́něné hustoty pravděpodobnosti, které se vyskytovaly v předchozı́m odstavci. Normálnı́ rozloženı́ pravděpodobnosti je plně určeno prvnı́mi dvěma momenty střednı́ hodnotou a kovariancı́. Proto lze v čase vyvı́jet pouze tyto prvnı́ dva momenty a tento problém právě řešı́ Kalmanův filtr. Kalmanův filtr pro diskrétnı́ systémy Nejprve uvedeme Kalmanův filtr pro lineárnı́ diskrétnı́ systémy a potom uvedeme přibližný postup pro nelineárnı́ diskrétnı́ systémy. Uvažujme diskrétnı́ lineárnı́ stochastický systém popsaný stavovými rovnicemi ve tvaru x(k + 1) = A(k)x(k) + B(k)u(k) + v(k) (16.46) y(k) = C(k)x(k) + D(k)u(k) + e(k) kde k je diskrétnı́ čas, x(k), u(k) a y(k) jsou po řadě stavy, vstupy a výstupy systému a v(k) = N (0, P v ), e(k) = N (O, P e ) jsou vzájemně nezávislé šumy stavu a výstupu. Počátečnı́ stav x(k0 ) = N (µx0 , Rx0 ) je nezávislý na šumech stavu a výstupu. Optimálnı́ odhad stavu x(k), podmı́něný znalostı́ dat (vstupu a výstupu systému) až do času k, b (k|k). Prvnı́ argument znamená čas, ve kterém provádı́me odhad a druhý argument určuje označı́me x čas posledně zı́skaných dat. Tento odhad je roven podmı́něné střednı́ hodnotě b (k|k) = E{x(k)|u(k), y(k), u(k − 1), y(k − 1), . . .} = E{x(k)|D k } x (16.47) Predikci podmı́něné střednı́ hodnoty, která je rovna odhadu stavu x(k + 1) v čase (k + 1) založeném KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 180 b (k +1|k) = E{x(k + 1)|u(k), y(k), u(k − 1), y(k − 1), . . .}. Kona stejné množině dat Dk označı́me x variančnı́ matice chyby odhadu je rovna podmı́něné kovarianci Platı́ tedy b (k|k))(x(k) − x b (k|k))T |u(k), y(k), . . .} Rxx (k|k) = E{(x(k) − x p x(k)|Dk p x(k + 1)|Dk (16.48) b (k|k); Rxx (k|k), ) ∼ N (x b (k + 1|k); Rxx (k + 1|k), ) ∼ N (x Rekurzivnı́ odhadovánı́ stavu dynamického systému pomocı́ Kalmanova filtru můžeme rozdělit na dva kroky. V prvnı́m kroku provedeme filtraci (odhad) stochastické veličiny podle zı́skaných pozorovánı́. Ve druhém kroku stanovı́me predikci odhadované střednı́ hodnoty a kovariance pomocı́ stavových rovnic systému. Prvnı́ krok se nazývá objektivnı́ krok (zı́skaný na podkladě známých hodnot), druhý krok je subjektivnı́ krok, provedený na základě modelu systému. b (k|k − 1). Na základě známého vstupu u(k) a výstupu y(k) Mějme tedy odhadnutou veličinu x provedeme filtraci stavu a dostaneme b (k|k) = x b (k|k−1) + Rxy (k|k−1)R−1 b (k|k−1)) x yy (k|k−1)(y(k) − y b b y (k|k−1) = C(k)x(k|k−1) + D(k)u(k) Rxx (k|k) = Rxx (k|k−1) − Rxy (k|k−1)R−1 yy (k|k−1)Ryx (k|k−1) kde Rxy (k|k−1) = Rxx (k|k−1)C T a Ryy (k|k−1) = C(k)Rxx (k|k−1)C T + Re . Po úpravě dostaneme vztah pro filtraci podmı́něné střednı́ hodnoty ve tvaru b (k|k) = x b (k|k−1)−Rxx C T (CRxx C T +Re )−1 (y(k) − C x b (k|k−1)) + D(k)u(k) x (16.49) podmı́něná kovariančnı́ matice je rovna Rxx (k|k)=Rxx (k|k−1) − Rxx C T (CRxx C T + Re )−1 CRxx (16.50) kde kovariančnı́ matice stavu na pravé straně předchozı́ch rovnic je Rxx = Rxx (k|k − 1). Predikce podmı́něné střednı́ hodnoty stavu je určena na základě stavových rovnic modelu b (k+1|k) = Ax b (k|k) + Bu(k) x (16.51) Rxx (k+1|k) = ARxx (k|k)AT + Rv (16.52) Predikovaná kovariančnı́ matice je Vztahy (16.49), (16.50), (16.51) a (16.52) jsou rekurentnı́ vztahy řešené s počátečnı́ podmı́nkou b (k0 |k0 − 1) = µx0 a Rxx (k0 |k0 − 1) = Rx0 . x Všechny kovariančnı́ matice vyjadřujeme obvykle ve faktorizovaném tvaru jako součin třı́ matic R = LDLT , kde L je dolnı́ trojúhelnı́ková matice s jednotkovou diagonálou a matice D je diagonálnı́ matice. Pro úpravu matice do faktorizovaného tvaru můžeme použı́t algoritmus dyadické redukce. Filtraci i predikci provádı́me potom numericky výhodným algoritmem nevyžadujı́cı́ inverzi matice. Problém odhadovánı́ stavů lze Kalmanovým filtrem řešit přibližně i pro nelineárnı́ systém, jehož stavové rovnice jsou x(k + 1) = f (x(k), u(k), k) + v(k) y(k) = g(x(k), u(k), k) + e(k) (16.53) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 181 kde nelineárnı́ funkce f a g majı́ konečné prvnı́ derivace podle stavu x(k) a v(k) i e(k) jsou stochastické posloupnosti se stejným rozloženı́m jako v lineárnı́m přı́padě. Problém nelineárnı́ho odhadu vzniká také při současném odhadovánı́ stavů a parametrů lineárnı́ch systémů. Vývoj parametrů je popsán diferenčnı́mi rovnicemi, které jsou připojeny k původnı́m stavovým rovnicı́m systému. Nelineárnı́ problém je řešen linearizacı́ stavových rovnic na základě průběžně zı́skávaných odhadů stavů. Opět budeme rozlišovat dva kroky odhadovánı́ - filtraci a predikci. Filtrace stavu pomocı́ měřených hodnot vstupu a výstupu je rovna b (k|k) = x b (k|k − 1) + x (16.54) −1 T +Rxx C (CRxx C + Re ) b (k|k − 1), u(k), k)] [y(k) − g(x Rxx = Rxx − Rxx C (CRxx C + Re )−1 CRxx T T kde Rxx = Rxx (k|k − 1) a kde C = C(k) je matice určená linearizacı́ výstupnı́ rovnice v bodě b (k|k − 1): x ∂g(x(k), u(k), k) C(k) = (16.55) ∂x(k) b (k|k−1) x b (k|k + 1), provedeme pomocı́ nelineárnı́ stavové rovnice systému, pak Predikci stavu, tj. určenı́ x b (k + 1|k) = f (x b (k|k), u(k), k) x (16.56) 0 Rxx (k + 1|k) = ARxx (k|k)A + Rv b (k|k): kde matici A = A(k) zı́skáme linearizacı́ stavové rovnice v bodě x A(k) = ∂f (x(k), u(k), k) ∂x(k) b (k|k) x (16.57) b (k0 |k0 − 1) = µx0 , Rxx (k0 |k0 − 1) = Rx0 . Iteračnı́ algoritmus startujeme s počátečnı́m odhadem x Přı́klad 13: Jako přı́klad vyřešı́me problém odhadu parametrů makroekonomického modelu. Model je převzatý z literatury [51]. Byl sestaven pro makroekonomiku USA. Tento model vycházı́ z třı́sektorové ekonomiky (neuvažuje vývoz a dovoz). Vstupnı́ proměnné modelu jsou: G M Výstupnı́ proměnné modelu Y C I R reálné vládnı́ výdaje reálné peněžnı́ zásoby jsou: reálný hrubý domácı́ produkt reálná spotřeba domácnostı́ reálné investičnı́ výdaje úroková mı́ra Základnı́ rovnice modelu makroekonomiky USA předpokládáme dle [51] ve tvaru Y (k) = C(k) + I(k) + G(k) C(k) = c0 + c1 Y (k) + c2 C(k − 1) I(k) = i0 + i1 [Y (k − 1) − Y (k − 2)] + i2 Y (k) + i3 R(k − 4) R(k) = r0 + r1 Y (k) + r2 [Y (k) − Y (k − 1)] +r3 [M (k) − M (k − 1)] + r4 [R(k − 1) + R(k − 2)] (16.58) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 182 Obrázek 16.8: Data ekonomiky USA Jednotka diskrétnı́ho času k je čtvrtletı́. Prvnı́ rovnice vyjadřuje, že hrubý domácı́ produkt Y (k) je součtem spotřeby domácnostı́ C(k), investičnı́ch výdajů I(k) a vládnı́ch výdajů G(k). Druhá rovnice je rovnicı́ spotřebnı́ funkce a vyjadřuje, že spotřeba C(k) je přı́mo úměrná hrubému domácı́mu produktu Y (k) a spotřebě v minulém čtvrtletı́ C(k − 1). Třetı́ rovnice je rovnicı́ investičnı́ funkce a vyjadřuje závislost investičnı́ch výdajů I(k) na hrubém domácı́m produktu Y (k), dále na rozdı́lů domácı́ch produktů v minulém čtvrtletı́ a předminulém čtvrtletı́ [Y (k − 1) − Y (k − 2)] a investice jsou také ovlivněny ve velké mı́ře také výšı́ úrokové sazby před rokem R(k − 4). Čtvrtá rovnice je rovnice pro úrokovou mı́ru a popisuje, závislost úrokové mı́ry R(t) na hrubém domácı́m produktu vytvořeném v daném obdobı́ Y (k), na rozdı́lu hrubých domácı́ch produktů v současném a minulém čtvrtletı́ [Y (k) − Y (k − 1)], na rozdı́lu zásob peněz rovněž v současném a minulém čtvrtletı́ [M (k) − M (k − 1)] a také na součtu úrokových měr v minulém a předminulém čtvrtletı́ [R(k − 1) + R(k − 2)]. Neznámé parametry c0 , c1 , c2 , i0 , i1 , i2 , i3 , r0 , r1 , r2 , r3 , r4 v předcházejı́cı́ch rovnicı́ch jsou předmětem identifikace. Parametry s indexem 0 ponecháme konstantnı́. Ostatnı́ parametry budou proměnné v čase a jejich optimálnı́ hodnoty budeme hledat rozšı́řeným Kalmanovým filtem. Odhady parametrů modelu makroekonomiky USA se prováděly na základě časových řad dat od 1. čtvrtletı́ roku 1947 do 1. čtvrtletı́ roku 1988. Data byla převzata z [51]. Čı́selné hodnoty jsou graficky zobrazeny na obr. 16.8. Povšimněte si pro nás nezvyklého měřı́tka některých veličin v řádech stovek či tisı́ců miliard US dolarů. Pro transformaci modelu do tvaru stavových rovnic nelineárnı́ho stochastického systému (16.53) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 183 Obrázek 16.9: Parametry a jejich konfidenčnı́ intervaly provedeme časový posun rovnic, takže je budeme psát v následujı́cı́m tvaru Y (k + 1) = C(k + 1) + I(k + 1) + G(k + 1) (16.59) C(k + 1) = c0 + c1 (k)Y (k + 1) + c2 (k)C(k) I(k + 1) = i0 + i1 (k)[Y (k) − Y (k − 1)] + i2 (k)Y (k + 1) + i3 (k)R(k − 3) R(k + 1) = r0 + r1 (k)Y (k + 1) + r2 (k)[Y (k + 1) − Y (k)] + +r3 (k)[M (k + 1) − M (k)] + r4 (k)[R(k) + R(k − 1)] Neznámé parametry c1 , c2 , i1 , i2 , i3 , r1 , r2 , r3 , r4 budeme odhadovat jako proměnné v čase, a proto jsme i u nich zavedli časový index k. Parametry c0 , i0 , r0 předpokládáme konstantnı́ a proto u nich časový index nezavádı́me. V dalšı́m kroku dosadı́me rovnice (16.59b) a (16.59c) do rovnice (16.59a) a vyjádřı́me Y (k + 1) Y (k + 1) = c0 + i0 + i1 (k)[Y (k) − Y (k − 1)] + c2 (k)C(k) + i3 (k)R(k − 3) + G(k + 1) 1 − c1 (k) − i2 (k) Tento vztah znovu dosadı́me do rovnic (16.59b), (16.59c) a (16.59d) a dostaneme C(k + 1) = c0 + +c1 (k) + Y (k + 1) + c2 (k)C(k) I(k + 1) = i0 + i1 (k)[Y (k) − Y (k − 1)] + +i2 (k)Y (k + 1) + i3 (k)R(k − 3) R(k + 1) = r0 + +[r1 (k) + r2 (k)]Y (k + 1) − r2 (k)Y (k) + r3 (k)[M (k + 1) − M (k)] + r4 (k)[R(k) + R(k − 1)] (16.60) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 184 kde za Y (k + 1) dosadı́me z předchozı́ rovnice (16.60). Nynı́ zavedeme vstupnı́, výstupnı́ a stavový vektor modelu. Vstupnı́ vektor u(k) má složky u1 (k) = G(k), u2 (k) = M (k). Výstupnı́ vektor y(k) má složky y1 (k) = Y (k), y2 (k) = C(k), y3 (k) = I(k), y4 (k) = R(k). Stavový vektor x(k) má následujı́cı́ složky: Parametry spotřebnı́ funkce x1 (k) = c0 , x2 (k) = c1 (k), x3 (k) = c2 (k). Parametry investičnı́ funkce x4 (k) = i0 , x5 (k) = i1 (k), x6 (k) = i2 (k), x7 (k) = i3 (k). Parametry funkce úrokové mı́ry x8 (k) = r0 , x9 (k) = r1 (k), x10 (k) = r2 (k), x11 (k) = r3 (k), x12 (k) = r4 (k). Proměnnné x13 (k) = Y (k), x14 (k) = Y (k − 1), x15 (k) = C(k), x16 (k) = I(k), x17 (k) = R(k), x18 (k) = R(k − 1), x19 (k) = R(k − 2), x20 (k) = R(k − 3). Poté, co jsme definovali všechny potřebné vektory, můžeme napsat soustavu stavových a výstupnı́ch rovnic makroekonomického modelu. Pro přehlednost použijeme pomocnou proměnou z(t) = Y (k + 1) - viz. (16.60). z(k) = x1 + x4 + x5 (k)[x13 (k) − x14 (k)] + x3 (k)x16 (k) + x7 (k)x20 (k) + u1 (k + 1) 1 − x2 (k) − x6 (k) Stavové rovnice makromodelu majı́ následujı́cı́ tvar x1 (k + 1) x2 (k + 1) x3 (k + 1) x4 (k + 1) x5 (k + 1) x6 (k + 1) x7 (k + 1) x8 (k + 1) x9 (k + 1) x10 (k + 1) x11 (k + 1) x12 (k + 1) x13 (k + 1) x14 (k + 1) = = = = = = = = = = = = = = x1 (k) x2 (k) + v2 (k) x3 (k) + v3 (k) x4 (k) x5 (k) + v5 (k) x6 (k) + v6 (k) x7 (k) + v7 (k) x8 (k) x9 (k) + v9 (k) x10 (k) + v10 (k) x11 (k) + v11 (k) x12 (k) + v12 (k) z(k) + v13 (k) x13 (k) x1 (0) x2 (0) x3 (0) x4 (0) x5 (0) x6 (0) x7 (0) x8 (0) x9 (0) x10 (0) x11 (0) x12 (0) x13 (0) x14 (0) = = = = = = = = = = = = = = x15 (k + 1) = x1 (k) + x2 (k)z(k)+ +x3 (k)x15 (k) + v15 (k) x16 (k + 1) = x4 (k) + x5 (k)[x13 (k) − x14 (k)]+ +x6 (k)z(k) + x7 (k)x20 (k) + v16 (k) x17 (k + 1) = x8 (k) + [x9 (k) + x10 (k)]z(k)− −x10 (k)x13 (k) + x11 (k)[u2 (k + 1) − u2 (k)]+ +x12 (k)[x17 (k) + x18 (k)] + v17 (k) x18 (k + 1) = x17 (k) x19 (k + 1) = x18 (k) x20 (k + 1) = x19 (k) Výstupnı́ rovnice makromodelu: y1 (k) y2 (k) y3 (k) y4 (k) = = = = x13 (k) + e1 (k) x15 (k) + e2 (k) x16 (k) + e3 (k) x17 (k) + e4 (k) ĉ0 ĉ1 (0) ĉ2 (0) î0 î1 (0) î2 (0) î3 (0) r̂0 r̂1 (0) r̂2 (0) r̂3 (0) r̂4 (0) Y (4) Y (3) x15 (0) = C(4) x16 (0) = I(4) x17 (0) = R(4) x18 (0) = R(3) x19 (0) = R(2) x20 (0) = R(1) (16.61) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 185 Obrázek 16.10: Skutečné a predikované výstupy Výsledky odhadu parametrů modelu makroekonomiky USA byly zpracovány v diplomové práci [16]. Predikované hodnoty stavů (parametrů) spolu s jejich konfidenčnı́mi intervaly jsou na obr. 16.9. Konfidenčnı́ interval vyjadřuje mı́ru nejistity odhadu parametru. Pásmo nejistoty je rovno ±k σ, kde σ je směrodatná odchylka přı́slušného parametru a konstanta úměrnosti k se volı́ v intervalu [2, 3], (zde k = 2). Obr. 16.10 zobrazuje skutečné a predikované hodnoty výstupů. Z uvedeného obrázku vidı́me, že přesnost odhadu parametrů je vyhovujı́cı́. Chyby výstupů jsou na obr. 16.11. Pokud je odhad správný, tak posloupnost chyb výstupu je bı́lá posloupnost, což zde je přibližně splněno. Neuvádı́me zde kovariančnı́ matice šumu stavů i výstupu, na kterých podstatnou měrou závisı́ úspěšnost odhadů. Neuvádı́me zde ani apriornı́ odhady parametrů i jejich kovariance, které také ovlivňujı́ přesnost odhadů. Pokud zvolı́me nulové rozptyly šumů ve stavových rovnicı́ch popisujı́cı́ch vývoj parametrů, odhadujeme konstantnı́ parametry. Pro odhadované konstantnı́ parametry jsou na obr. 16.12 zobrazeny chyby výstupů. Chyby jsou v tomto přı́padě většı́ a chybová posloupnost zřejmě nenı́ v tomto přı́padě bı́lá posloupnost. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 186 Obrázek 16.11: Odchylky výstupů Obrázek 16.12: Odchylky výstupů Rozšı́řený Kalmanův filtr pro spojité systémy Nejprve uvedeme rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ systém s diskrétnı́m měřenı́m výstupu. Datový krok filtru je obdobný datovému kroku pro diskrétnı́ systémy. Časový krok se přibližně provádı́ použitı́m stochastické rovnice systému. Uvědomme si, že rozšı́řený Kalmanův filtr je pouze aproximacı́ s chybou druhého řádu. Mějme tedy spojitý nelineárnı́ stochastický systém s diskrétnı́m měřenı́m výstupu ẋ(t) = f (x(t), u(t), t) + v(t), y(k) = g (x(t), u(t), t) + e(k), (16.62) pro t = kT b (0), P (0)), w(t) ∼ N (O, Q), e(k) ∼ N (O, R). Při tom předpokládáme, že v(t) a kde x(0) ∼ N (x e(k) jsou nezávislé bı́lé šumy nekorelované s počátečnı́ podmı́nkou x(0). Diskrétnı́ měřenı́ výstupu je prováděno s periodou vzorkovánı́ T . KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 187 Ve shodě s předchozı́m značenı́m zavedeme podmı́něnou střednı́ hodnotu b (t|(k − 1)T ) = E (x(t)|y(k − 1), u(t)) x pro (k − 1)T ≤ t ≤ kT b (t|kT ) = E (x(t)|y(k), u(t)) , x pro t = kT. Podobně budeme značit podmı́něnou kovariančnı́ matici stavu P (t|(k − 1)T ) respektive P (t|kT ). Kalmanův filtr provádějı́cı́ aktualizaci podmı́něné střednı́ hodnoty stavu a podmı́něné kovariančnı́ matice stavu se opět skládá se dvou kroků - časového (modelového) a datového (filtračnı́ho). Časový krok: Vývoj podmı́něné střednı́ hodnoty stavu v čase je přibližně určen vztahem ḃ b (t|(k − 1)T ), u(t), t) x(t|(k − 1)T ) = f (x pro (k − 1)T ≤ t ≤ kT. (16.63) b , t)P (t|(k − 1)T ) + P (t|(k − 1)T )AT (x b , t) + Q, Ṗ (t|(k − 1)T ) = A(x (16.64) Vývoj podmı́něné kovariančnı́ matice je b , t) zı́skáme linearizacı́ kde matici A(x b , t) = A(x ∂f (x(t), u(t), t) . ∂x b (t|(k−1)T ) x(t)=x Datový krok: Aktualizace podmı́něné střednı́ hodnoty je b (t|kT ) = x b (t|(k − 1)T ) + K(k) [y(k) − g(x b (t|(k − 1)T ), u(t), t)] , x pro t = kT (16.65) a kde Kalmanovo zesı́lenı́ je rovno h b , k) C(x b , k)P (t|(k − 1)T ), C T (x b , k) + R K(k) = P (t|(k − 1)T ), C T (x i−1 , pro t = kT. (16.66) Aktualizace podmı́něné kovariančnı́ matice je b , k)P (t|(k − 1)T ) P (t|kT ) = P (t|(k − 1)T ) − K(k)C(x (16.67) b , k) zı́skáme linearizacı́ a matici C(x b , k) = C(x ∂g (x(t), u(t), t) ∂x b (t|(k−1)T ) x(t)=x v bodě t = kT. Nynı́ opět stručně uvedeme rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ systém se spojitým měřenı́m výstupu. Uvědomme si, že aktualizace (datový krok) podmı́něných střednı́ch hodnot stavu a jeho kovariance se při spojitém měřenı́ výstupu provádı́ spojitě v každém časovém okamžiku. Proto se v tomto přı́padě nerozlišuje datový a časový krok. Spojitý Kalmanův filtr můžeme odvodit limitnı́m přechodem z diskrétnı́ho Kalmanova filtru pro periodu vzorkovánı́ T → 0. Označı́me podmı́něnou střednı́ hodnotu stavu b (t) = E(x(t)|y(t), u(t)) x a podobně podmı́něnou kovariančnı́ matici stavu P (t). KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 188 Nejprve uvedeme Kalmanův filtr pro lineárnı́ spojitý systém se spojitým měřenı́m výstupu. Stochastický model tohoto systému a měřenı́ výstupu je ẋ(t) = Ax(t) + Bu(t) + v(t), (16.68) y(k) = Cx(t) + Du(t) + e(t) (16.69) b 0 , Rx0 ), w(t) ∼ N (O, Q), e(k) ∼ N (O, R). Při tom kde stejně jako v předchozı́m přı́padě x(0) ∼ N (x předpokládáme, že v(t) a e(t) jsou nezávislé bı́lé šumy nekorelované s počátečnı́ podmı́nkou x(0). Při tom musı́me předpokládat, že R > O (matice R musı́ být pozitivně definitnı́), což znamená, že všechny složky výstupu jsou zatı́ženy šumem, žádné měřenı́ výstupu nenı́ tedy absolutně přesné. Kalmanův filtr pro rekurzivnı́ odhadovánı́ podmı́něné střednı́ hodnoty stavu a jeho kovariance je popsán následujı́cı́mi vztahy. ḃ b (t) + Bu(t) + K(t) [y(t) − C x b (t) − Du(t)] , x(t) = Ax T T Ṗ (t) = AP (t) + P (t)A + Q − P (t)C R −1 CP (t) + e(t), b (0) = x b0 x (16.70) P (0) = Rx0 Kalmanovo zesı́lenı́ je v tomto přı́padě K(t) = P (t)C T R−1 Rovnice (16.70b) je Riccatiova rovnice, kterou při filtraci řešı́me dopředně ze známé počátečnı́ podmı́nky P (0) = Rx0 . Rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ stochastický systém se spojitým měřenı́m výstupu popsaný stavovými rovnicemi ẋ(t) = f (x(t), u(t), t) + v(t), (16.71) y(t) = g (x(t), u(t), t) + e(t) je popsán následujı́cı́mi vztahy ḃ b (t), u(t), t) + K(t) [y(t) − g (x b (t), u(t), t)] , x(t) = f (x T T b (0) = x b0 x b (t), t) P (t) + P (t)A (x b (t), t) + Q − P (t)C (x b (t), t) R Ṗ (t) = A (x −1 (16.72) b (t), t) P (t), C (x Riccatiovu rovnici (16.72b) řešı́me dopředně s počátečnı́ podmı́nkou P (0) = Rx0 . Kalmanovo zesı́lenı́ je v tomto přı́padě b (t), t) R−1 K(t) = P (t)C T (x b (t), t) a C (x b (t), t) zı́skáme linearizacı́ stavových rovnic stochastického systému (16.71) Matice A (x b (t), t) = A (x b (t), t) = C(x ∂f (x(t), u(t), t) ∂x b (t) x(t)=x ∂g (x(t), u(t), t) ∂x b (t) x(t)=x Protože zpracovánı́ dat se nynı́ stále častěji realizuje čı́slicově, je použitı́ spojitého Kalmanova filtru omezeno pouze na speciálnı́ přı́pady. 16.4.3 Stochastické metody interpolace V některých přı́padech máme k dispozici veškerá změřená data. Potom je výhodné provést odhad stavu systému, který je založen na celé množině dat a ne pouze na průběžně zı́skaných měřenı́ch. Tomuto způsobu odhadu řı́káme interpolace. Pokud použı́váme přůběžně zı́skané odhady stavu k řı́zenı́ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 189 systému, nenı́ možno interpolaci použı́t. Interpolace (pokud ji můžeme provést) nám může dát lepšı́ odhady stavu, protože tyto odhady jsou založeny na většı́ množině dat. Často odhadujeme nejenom stavy systému, ale i jeho parametry, které můžeme považovat za pomalu se měnı́cı́ stavy. Pokud v systému nastane nějaká změna parametrů, tak tato náhlá změna vůbec nenı́ obsažena v minulých datech a proto odhad založený na minulých datech nenı́ dobrý - viz přı́klad na konci tohoto odstavce. Interpolace, která k odhadu využı́vá i budoucı́ data nám dá odhad mnohem přesnějšı́. Výsledkem interpolace, to je odhadu stavu založeném na celé množině dat, je p.h.p p x(k)| Dkf (16.73) kde Dkf je celá množina dat od počátku měřenı́ až do koncového (finálnı́ho) času kf . Zde použijeme pro data od času k do kf označenı́ k Dkf = {u(k), y(k), . . . , u(kf ), y(kf )} potom celá množina dat je k Dkf = D1 f = {u(1), y(1), . . . , u(k), y(k), . . . , u(kf ), y(kf )} Nynı́ odvodı́me obecný vztah pro interpolaci jejı́mž výsledkem je p.h.p. stavu, kde vpodmı́nce je k celá množina dat. Předpokládáme, že známe filtrované p x(k)| D a predikované p x(k+1)| Dk p.h.p stavu. Interpolace bude řešena zpětným během filtru, který bude založen na znalosti predikované tedy pracovat bez dat. Budeme tedy aktualizovat p.h.p. a filtrované p.h.p., tento filtr bude p x(k+1)| Dkf na p.h.p. p x(k)| Dkf . Při tom využijeme pravděpodobnostnı́ popis systému určený p.h.p p (x(k+1)| x(k), y(k)). Ze vztahu pro podmı́něnou hustotu pravděpodobnosti dostanene k k f f p x(k), Dk+1 |Dk = p x(k)| Dkf p Dk+1 | Dk (16.74) Zavedenı́ stavu x(k+1) předchozı́ p.h.p. můžeme dostat jako marginálnı́ p.h.p. k f p x(k), Dk+1 |Dk = Z k f p x(k+1), x(k), Dk+1 |Dk dx(k+1) Dalšı́m užitı́m řetězového pravidla má předchozı́ výraz tvar k f p x(k), Dk+1 |Dk = Z k f p x(k)|x(k+1), Dk+1 , Dk k f |Dk dx(k+1) × p x(k+1)|Dkf p Dk+1 Z předchozı́ho vztahu a (16.74) plyne vztah pro interpolovanou p.h.p p x(k)| Dkf = Z k f p x(k)|x(k+1), Dk+1 , Dk p x(k+1)|Dkf dx(k+1) (16.75) Abychom mohli zjednodušit předchozı́ vztah pro interpolovaný odhad, využijeme vlastnost stavu systému. Užitı́m podmiňovánı́, můžeme zapsat p.h.p dvojı́m způsobem k f p Dk+1 , x(k)|Dk , x(k+1) k (16.76) f = p Dk+1 |x(k), Dk , x(k+1) p x(k)|Dk , x(k+1) k k f f = p x(k)|Dk+1 , Dk , x(k+1) p Dk+1 |Dk , x(k+1) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 190 Z definice stavu plyne (to je Markovova vlastnost stavu) k k f f p Dk+1 |x(k), Dk , x(k+1) = p Dk+1 |Dk , x(k+1) Tak z předchozı́ho je zřejmé, že k f p x(k)|Dk+1 , Dk , x(k+1) = p x(k)|Dk , x(k+1) (16.77) Konečný vztah pro zpětný filtr má tvar p x(k)| Dkf = Z p x(k)|x(k+1), Dk p x(k+1)|Dkf dx(k+1) (16.78) kde jsme využili vlastnost stavu popsanou v předchozı́m vztahu (16.77). Z Bayesova vztahu plyne pro p.h.p. p x(k+1)| x(k), Dk p x(k)| Dk (16.79) p x(k)|x(k+1), Dk = p (x(k+1)| Dk) Předchozı́ vztah je v podstatě krok velmi podobný datovému kroku, kde fiktivnı́ výstup je nynı́ stav x(k+1). Proto v tomto kroku podobném datovému kroku je použito stavové rovnice systému. Naproti tomu vztah (16.78) je zase podobný časovému kroku. Funkcionálnı́ procedura pro interpolovaný odhad je popsána vztahy (16.78) a (16.79) Tı́mto postupem byl zpětný filtr rozložen do dvou kroků. Rozklad problému interpolace do dvou kroků zpětného filtru je výhodný z numerického hlediska. Poprvé byl popsán v [90]. Vztah pro zpětný filtr, který řešı́ problém interpolace v jednom kroku dostaneme dosazenı́m (16.79) do (16.78) p x(k)| Dkf = p x(k)| Dk Z p x(k+1)|Dkf p (x(k+1)|x(k), y(k)) p (x(k+1)|Dk ) dx(k+1) (16.80) Předchozı́ vztahy použijeme pro odvozenı́ přibližného řešenı́ problému interpolace linearizacı́ - jakési obdoby rozšı́řeného Kalmanova filtru pro zpětný běh. Interpolace pro linearizovaný systém a normálnı́ šumy Při lineárnı́m systému a normálnı́ch šumech předchozı́ funkcionálnı́ rekurze můžeme změnit na algebraické rekurzivnı́ vztahy pro interpolovanou střednı́ hodnotu stavu a jeho kovariančnı́ matici. Použijeme zde stejné značenı́ jako pro rozvinutý Kalmanův filtr, to je b (k|τ ), Rxx (k|τ )) p (x(k)|Dτ ) = N (x p (x(k+1)|x(k), u(k)) = N (A(k)x(k) + B(k)u(k); Rv ) Označme střednı́ hodnotu a kovarianci, které jsou výsledkem fiktivnı́ho datového kroku (16.77) e e (k), R(k) p x(k)| x(k+1), Dk = N x (16.81) Fiktivnı́ datový krok (16.77) vede na následujı́cı́ vztahy pro aktualizaci střednı́ hodnoty a kovariance e (k) = x b (k|k) + F (k) (x(k+1) − x b (k+1|k)) x e R(k) = R(k|k) − F (k)R(k+1|k)F T (k) (16.82) kde Kalmanovo zesı́lenı́ F (k) je F (k) = R(k| k)AT (k) [R(k+1| k)]−1 (16.83) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 191 Aktualizace střednı́ hodnoty a kovariance podle vztahu (16.78) vede na b (k| kf ) = x b (k| k) + F (k) [x b (k+1| kf ) − x b (k+1| k)] x e R(k| kf ) = F (k)R(k+1| kf )F T (k) + R(k) (16.84) Tı́mto způsobem je zjednodušena procedura na interpolaci. Řešenı́ problému interpolace ve dvou krocı́ch usnadňuje numerickou implementaci algoritmu. Dosadı́me-li (16.82) do (16.84) dostaneme vztah pro interpolaci realizovanou zpětným během filtru v jediném kroku. b (k|kf ) = x b (k|k) + F (k) [x b (k+1|kf ) − x b (k+1|k)] x (16.85) T R(k|kf ) = R(k|k) − F (k) [R(k+1|k)−R(k+1|kf )] F (k) s Kalmanovým zesı́lenı́m F (k) podle (16.83). Vstup u(k) Vystup y(k) 4 20 3 10 2 0 1 −10 0 0 5 10 15 20 −20 0 Stav x1(k)= x(k) 1 10 0.5 0 0 −10 −0.5 5 10 k 15 10 15 20 Stav x2(k) = a(k) 20 −20 0 5 20 −1 0 5 10 k 15 20 Obrázek 16.13: Vstup u(k), výstup y(k) a stavy x1 (k), x2 (k) systému z přı́kladu 14 Poznámka: Při přibližné interpolaci v nelineárnı́m diskrétnı́m systému popsaném stavovou rovnicı́ x(k + 1) = f (x(k), u(k), k ), musı́me provést linearizaci tohoto systému a matici A(k) ve vztahu (16.83) pro zesı́lenı́ zpětného filtru počı́tat podle vztahu A(k) = ∂f (x(k), u(k), k) ∂x(k) b (k+1|kf ) x Přı́klad 14: Mějme jednoduchý lineárnı́ systém prvnı́ho řádu x(k + 1) = a(k) · x(k) + v(k) y(k) = x(k) + e(k) kde parametr a nenı́ známý. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 192 Problém současného odhadovánı́ stavu a parametru systému můžeme převést na problém odhadovánı́ stavu rozšı́řeného systému x1 (k + 1) = x2 (k) · x1 (k) + v1 (k) x2 (k + 1) = x2 (k) + v2 (k) y(k) = x1 (k) + e(k) kde stav x1 (k) = x(k) je roven původnı́mu stavu systému prvnı́ho řádu a x2 (k) = a(k). Šumy v1 a v2 můžeme použı́t jako ladicı́ nástroje, které realizujı́ zapomı́náni a umožňujı́ sledovánı́ změny parametru. Odhadovánı́ a interpolaci stavu rozšı́řeného nelineárnı́ho systému budeme realizovat linearizacı́. Rozvinutý Kalmanův filtr má stavovou matici A linearizovaného systému δf = A= δx " x2 (k) x1 (k) 0 1 # , Matice A je použita v predikčnı́m kroku a při interpolaci. Při predikci dosazujeme za stavy v každém kroku x1 = x̂1 (k|k) a x2 = x̂2 (k|k). Při interpolaci dosazujeme v každém kroku x1 = x̂1 (k + 1|kf ) a x2 = x̂2 (k + 1|kf ). Data u(k) a y(k) a skutečný průběh stavů x1 (k), x2 (k) jsou uvedeny v obr. 16.13. Povšimněte si, že v čase k = 10 se druhý stav (parametr a) skokem měnı́. Vlivem této změny dostává systém oscilačnı́ charakter. Výsledky simulace jsou uvedeny na obr. 16.14 a 16.15. Odhad stavu xhat1(t|t−1) Odhad stavu xhat2(t|t−1) 20 1 0.5 10 0 0 −0.5 −10 −20 0 −1 5 10 15 20 −1.5 0 Chyba odhadu e1=x1−xhat1 5 10 15 20 Chyba odhadu e2=x2−xhat2 10 1 0.5 0 0 −10 −0.5 −1 −20 −1.5 −30 0 5 10 k 15 20 −2 0 5 10 k 15 20 Obrázek 16.14: Predikované odhady stavů a jejich chyby z přı́kladu 14 b (k|k − 1) a jejich odchylky ep (k) = x(k) − x b (k|k − 1) V obr. 16.14 jsou predikované odhady stavů x b (k|k) a od skutečných stavů. V obr. 16.15 jsou uvedeny odchylky filtrovaných stavů ef (k) = x(k) − x b (k|kf ). odchylky interpolovaných stavů ei (k) = x(k) − x Povšimněte si velmi malé chyby při interpolaci u druhého stavu (parametru a), zatı́m co při filtraci je při náhlé změně parametru chyba estimace velká. Porovnejte také chyby při predikce a filtraci. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ Chyba filtrace e1 193 Chyba filtrace e2 1 0.5 x2(t)−xhat2(t|t) x1(t)−xhat1(t|t) 0.2 0 −0.2 0 0 −0.5 −1 −1.5 5 10 15 −2 0 20 Chyba interpolace e1 5 10 15 20 Chyba interpolace e2 0.2 x2(t)−xhat2(t|t_f) x1(t)−xhat1(t|t_f) 0.06 0 −0.2 0 5 10 k 15 20 0.04 0.02 0 −0.02 −0.04 0 5 10 k 15 20 Obrázek 16.15: Chyby filtrovaných a interpolovaných odhadů a přikladu 14 16.4.4 Klasifikace systémů Problém odhadovánı́ stavů resp. parametrů systému jsme řešili za předpokladu, že je známá struktura systému. Často ale neznáme jednoznačně strukturu systému a k danému reálnému objektu může existovat několik kandidátů na správnou strukturu jeho modelu. To znamená, že máme několik hypotéz o skutečné struktuře systému. Každé struktuře budeme přiřazovat jejı́ pravděpodobnost. Klasifikace systémů znamená aktualizaci pravděpodobnosti každé hypotézy na základě dat zı́skaných měřenı́m na reálném objektu. Někdy také neznáme některé ladicı́ parametry procedury odhadovánı́ stavů a parametrů systému. Přikladem mohou být kovariančnı́ matice šumů stavu i měřenı́. Také tento problém můžeme řešit pomocı́ klasifikace. Problém klasifikace systému zde nebudeme řešit jako rozhodovacı́ problém. Pokud bychom se museli rozhodnout, která struktura systému je správná, volili bychom nejjednodušeji tu strukturu, jejı́ž pravděpodobnost je nejvyššı́. Rozhodovacı́ problém vyžaduje volbu kritéria rozhodovánı́ a může být značně komplikovaný. Pro predikci a řı́zenı́ procesů nenı́ potřeba rozhodovat, která hypotéza o struktuře systému je správná a která je falešná. Zde budeme pouze altualizovat pravděpodobnosti hypotéz na základě zı́skaných dat. Je samozřejmé, že vedle řešenı́ problému klasifikace (výpočtu podmı́něných pravděpodobnostı́ hypotéz o struktuře modelu) je současně třeba v každé struktuře odhadovat neznámé stavy a parametry. Mějme tedy N alternativnı́ch modelů s různými strukturami. Každému alternativnı́mu modelu s předpokládanou (hypotetickou) strukturou přiřadı́me pravděpodobnost p(H i ), i = 1, 2, . . . , N . 1 , pokud nepreferujeme některé Apriornı́ pravděpodobnost ité hypotézy Hi můžeme volit p(Hi ) = N hypotézy. Bayesovský přı́stup ke klasifikaci systému je následujı́cı́: Vstup u(τ ) a výstup y(τ ) je pozorován v čase τ = 1, 2, · · · , k − 1. Naše znalost o pravděpodobnosti hypotéz podmı́něná množinou dat Dk−1 = {u(1), y(1), · · · , u(k − 1), y(k − 1)} KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 194 je popsána podmı́něnou pravděpodobnostı́ hypotéz p(Hi (k)|Dk−1 ). Náš problém je aktualizace této podmı́něné pravděpodobnosti hypotéz, to je přechod od p(Hi (k)|Dk−1 ) na p(Hi (k + 1)|Dk ) poté, co obdržı́me nová vstupnı́ a výstupnı́ data {u(k), y(k)}. Řešenı́ opět rozdělı́me do dvou kroků - datového a časového (filtraci a predikci). V datovém kroku klasifikace aktualizujeme na základě dat podmı́něnou pravděpodobnost p(Hi (k)|Dk−1 ) na p(Hi (k)|Dk ). K odvozenı́ potřebných vztahů použijeme vzorec pro podmı́něnou pravděpodobnost. p(y(k), u(k), Hi (k)|Dk−1 ) = p(y(k), u(k)|Hi (k), Dk−1 ) · p(Hi (k)|Dk−1 ) = p(Hi (k)|Dk−1 , y(k), u(k)) · p(y(k), u(k)|Dk−1 ) Odtud plyne Bayesův vztah pro podmı́něnou pravděpodobnost p(Hi (k)|Dk ) = p(y(k), u(k)|Hi (k), Dk−1 ) · p(Hi (k)|Dk−1 ) p(y(k), u(k)|Dk−1 ) Při úpravě předchozı́ho vztahu použijeme přirozené podmı́nky řı́zenı́ ve tvaru p(u(k)|Dk−1 , Hi (k)) = p(u(k)|Dk−1 ) které vyjadřujı́ fakt, že všechna naše znalost o hypotézách je založena na datech. Datový krok klasifikace po úpravě je vyjádřen následujı́cı́m vztahem p(Hi (k)|Dk ) = 1 p(y(k)|Hi (k), u(k), Dk−1 ) · p(Hi (k)|Dk−1 ) α (16.86) kde normalizačnı́ konstantu α volı́me takovou, aby součet podmı́něných pravděpodobnostı́ všech hypotéz byl roven jedné. Časový krok klasifikace je formálně jednoduchý. Podle vztahu pro marginálnı́ pravděpodobnost platı́ p(Hi (k + 1)|Dk ) = = i=N X i=1 i=N X p(Hi (k + 1), Hi (k)|Dk ) p(Hi (k + 1)|Hi (k), Dk )p(Hi (k)|Dk ) i=1 kde p(Hi (t + 1)|Hi (t), Dt ) je pravděpodobnostnı́ model vývoje hypotéz. Protože velmi často takový model neznáme, použı́váme časový krok pouze jako určitou formu zapomı́nánı́, přı́padně vážı́me pravděpodobnosti hypotéz nějakými alternativnı́mi pravděpodobnostmi. K tomu se přirozeně nabı́zı́ apriornı́ pravděpodobnost p(Hi ), proto p(Hi (k + 1)|Dk ) = λp(Hi (k)|Dk ) + (1 − λ)p(Hi ) (16.87) kde váhový koeficient λ volı́me v intervalu 0 < λ ≤ 1. Podmı́něná pravděpodobnost p(y(k)|Hi (k), D je věrohodnost hypotéz. Pokud je normálnı́, tak 1 p(y(t)|H (i) (k), Dk−1 ) = p r b − (y (t)−y e 2 1 (2π)m det R(i) yy (i) T ) ( −1 (y (t)−y b (i) ) R(i) yy ) kde m je dimenze vektoru y a b (i) = y b (i) (t|t − 1) = C (i) x b (i) (t|t − 1), y (i) R(i) xx = Rxx (t|t − 1) k−1 ) (16.88) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 195 Obrázek 16.16: Pravděpodobnosti modelů Potom snadno můžeme počı́tat podmı́něné pravděpodobnosti modelů různých struktur na základě dat. Přı́klad 15: Uvažujme nynı́ opět model a data makroekonomiky USA, viz přı́klad 13 této kapitoly. Vytvořı́me dva alternativnı́ makroekonomické modely. Prvnı́ je model s konstantnı́mi parametry a druhý model má časově proměnné parametry. Nejedná se tedy o různé struktury modelů, ale o dva alternativnı́ modely, které se lišı́ pouze modelem vývoje parametrů. Tyto modely se v podstatě lišı́ pouze různými kovariančnı́mi maticemi šumu v modelu vývoje parametrů. Model vývoje každého parametru θi (k) je často ve tvaru náhodné procházky θi (k + 1) = θi (k) + ei (k) kde rozptyl σi2 normálnı́ho bı́lého šumu ei (k) určuje schopnosti změny parametru θi (k) v čase. Pokud je rozptyl σi2 = 0, pak předpokládáme, že model má přı́slušný parametr konstantnı́. Pro daná data makroekonomiky USA, která byla uvedena v přı́kladu 13 byly počı́tány pravděpodobnosti těchto dvou alternativnı́ch modelů - viz lit. [16]. Struktura obou modelů byla stejná a je uvedena v přı́kladu 13. Apriornı́ pravděpodobnosti modelů byly zvoleny p(H (1) (0)) = 0.5, p(H (2) (0)) = 0.5, to znamená, že nepreferujeme žádný model. Vývoj pravděpodobnostı́ těchto dvou alternativnı́ch modelů makroekonomiky USA je uveden na obr. 16.16. Z průběhů podmı́něných pravděpodobnostı́ těchto alternativnı́ch modelů můžeme vyčı́st, že v obdobı́ od roku 1952 do roku 1974, kdy vývoj ekonomiky v USA byl poměrně plynulý se stoupajı́cı́ tendencı́, má model s konstantnı́mi parametry většı́ pravděpodobnost než model s proměnnými parametry. Tento model však selhává (jeho pravděpodobnost je nižšı́), když v ekonomice dojde k náhlým nečekaným změnám. Asi nejnázornějšı́m přı́kladem je obdobı́ dvou recesı́ v roce 1975 a 1982. V grafu KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 196 se promı́tá i řada dalšı́ch událostı́, které zasáhly americkou ekonomiku. Jsou to napřı́klad léta po druhé světové válce (1945-1950), na ně navazujı́cı́ Korejská válka (1950-1953), atentát na prezidenta J. F. Kennedyho v roce 1963 a dalšı́. V těchto obdobı́ch nečekaných změn je samozřejmě výhodnějšı́ model s proměnnými parametry, který je pružný a dokáže na tyto změny reagovat. 2 Uvedený přı́klad ukazuje, že klasifikace systémů - to je výpočet podmı́něných pravděpodobnostı́ několika alternativnı́ch modelů na základě dat - může být použita nejen k určenı́ nejpravděpodobnějšı́ struktury modelu, ale i k řešenı́ celé řady dalšı́ch problémů jako je na přı́klad detekce poruch v systému, posouzenı́ správné činnosti čidel nebo akčnı́ch členů a pod. Literatura Knihy a texty české a slovenské [1] Havlena V., Štecha J.: Modernı́ teorie řı́zenı́. Skriptum ČVUT FEL Praha, 1996. [2] Holodniok M., Klı́č A., Kubı́ček M., Marek M.: Metody analýzy nelineárnı́ch dynamických modelů. Academia, Praha, 1986. [3] Horáček P., Fuka J.: Systémy a modely. Skripta FEL ČVUT, Praha, 1996. [4] Horák J., Krlı́n L.: Deterministický chaos a matematické modely turbulence. Academia, Praha, 1996. [5] John J.: Systémy a řı́zenı́. Skripta FEL ČVUT, Praha, 1996. [6] Kolektiv: Oborové encyklopedie. Aplikovaná matematika I. II., SNTL, Praha, 1978. [7] Kotek Z., Kubı́k S., Razı́m M.: Nelineárnı́ dynamické systémy. SNTL, Praha, 1973. [8] Kotek Z., Razı́m M.: Teorie nelineárnı́ch, optimálnı́ch a adaptivnı́ch řı́dı́cı́ch systémů. Skripta FEL ČVUT, Praha, 1982. [9] Kubı́k S., Kotek Z., Strejc V., Štecha J.: Teorie automatického řı́zenı́ I. Lineárnı́ a nelineárnı́ systémy. SNTL, Praha, 1982. [10] Kubı́k S., Kotek Z., Razı́m M., Hrušák J., Branžovský J.: Teorie automatického řı́zenı́ II. Optimálnı́, adaptivnı́ a učı́cı́ se systémy. SNTL, Praha, 1982. [11] Marek M., Schreiber I.: Stochastické chovánı́ deterministických systémů. Academia, Praha, 1984. [12] Medved’ M.: Dynamické systémy. Veda, Bratislava, 1988. [13] Nagy J.: Vybrané partie z modernı́ matematiky. SNTL, Praha, 1976. [14] Nagy J.: Stabilita řešenı́ obyčejných diferenciálnı́ch rovnic. SNTL, Praha, 1980. [15] Štecha J., Havlena V.: Teorie dynamických systémů. Skriptum ČVUT FEL Praha, 1996. [16] Satoriová K.: Použitı́ alternativnı́ch modelů při identifikaci ekonomických systémů. Diplomová práce, ČVUT FEL Praha, 1996. Knihy a sbornı́ky jiné [17] Andronov A.A., Chajkin C.E.: Těorija kolebanij. Fizmatgiz, Moskva, 1959. [18] Arnold V.I.: Ordinary Differential Equations. M.I.T. Press, Cambridge, MA, 1973. [19] Arnold V.I.: Geometrical Methods in the Theory of Ordinary Differential Equations. Springer Verlag, New York, 1980. [20] Åstrom K.: Introduction to Stochastic Control Theory. Academic Press, N.York, 1970. [21] Atherton D.P.: Nonlinear Control Engineering. Van Nostrand Reinhold, London, 1975. 197 [22] Byrnes C.I., Lindquist A. (Eds): Theory and Application of Nonlinear Control Systems. NorthHolland, Dordrecht, 1986. [23] Byrnes Ch.I., Kurzhanski A.(Eds.): Modelling and Adaptive Control. Springer Verlag, Berlin, 1988. [24] Chua L.O.: Introduction to Nonlinear Network Theory. McGrawHill, New York, 1969. [25] Desoer C.A., Vidyasagar M.: Feedback Systems: Input-Output Properties. Academic Press, New York, 1975. [26] Gantmacher F.R.: Theory of Matrices. Chelsea Publishing Co., New York, 1959. [27] Gelb A., Vander Velde W.E.: Multiple-Input Describing Functions and Nonlinear System Design. McGraw-Hill, 1968. [28] Gibson J.E.: Nonlinear Automatic Control. McGraw-Hill, New York, 1963. [29] Gilmore R.: Catastrophe Theory for Scientists and Engineers. John Wiley, New York, 1981. [30] Goodwin G.C., Sin K.S.: Adaptive Filtering Prediction and Control.Prentice Hall, Englewood Cliffs, 1984. [31] Gőldner K., Kubı́k S.: Nichtlineare Systeme der Regelungstechnik. VEB Verlag Technik, Berlin, 1978. [32] Hahn W.: Theory and Application of Liapunov’s Direct Method. Prentice-Hall, Englewood Cliffs, N.J, 1963. [33] Guckenheimer J., Holmes P.: Nonlinear Oscillations, Dynamical Systems, and Bifurcations of Vector Fields. Springer, N.Y., 1983. [34] Haken H.: Synergetics. An Introduction. Springer-Verlag, Berlin, 1978. [35] Hsu J.C., Meyer A.U. Modern Control Principles and Applications. McGraw-Hill, New York, 1968. [36] Isidori A.: Nonlinear Control Systems. 3.vyd., Springer Verlag, New York, 1995. [37] Jazwinski A.H.: Stochastic Processes and Filtering Theory. Academic Press, N.York, 1970. [38] Jetschke G.: Mathematik der Selbstorganisation. VEB Verlag, Berlin, 1989. [39] Khalil H.: Nonlinear Systems. 2.vyd. Upper Sadle River, NJ, Prentice-Hall, 1996. [40] Kulhavý R.: Recursive Nonlinear Estimation, A Geometric Approach. Springer-Verlag, Berlin, 1996. [41] La Salle J., Lefschetz S.: Stability by Lyapunov’s Direct Method. Academic Press, 1961. [42] Lefschetz S.: Stability of Nonlinear Control Systems. Academic Press, 1962. [43] Leven R.W., Koch B.P., Pompe B.: Chaos in dissipativen Systemen. Akademie-Verlag, Berlin, 1989. [44] Levine W.S. (Ed.): The Control Handbook. CRC Press, USA, 1996. [45] Lewis F.L.: Optimal Estimation. J.Wiley, New York, 1986. 198 [46] Marek M., Schreiber I.: Chaotic Behavior of Deterministic Dissipative Systems. Academia, Praha, 1991. [47] Michel A.N., Miller R.K.: Qualitative Analysis of Large Scale Dynamical Systems. Academic Press, New York, 1977. [48] Narendra K.S., Taylor J.H.: Frequency Domain Criteria for Absolute Stability. New York, Academic Press, 1973. [49] Nijmeijer H., Van der Schaft A.J.: Nonlinear Dynamical Control Systems. Springer Verlag, 1990. [50] Papoulis A.: Probability, Random Variables and Stochastic Processes. McGraw Hill, New York, 1965. [51] Pindyck R.S., Rubinfeld D.L.: Econometric Models and Economic Forecasts. McGraw-Hill, New York, 1990. [52] Slotine J.E., Li W.: Applied Nonlinear Control. Prentice-Hall, New Jersey, 1991. [53] Vidyasagar M.: Input-Output Analysis of Large-Scale Interconnected Systems. Springer Verlag, New York, 1981. [54] Vidyasagar M.: Control System Synthesis: A Factorization Approach. M.I.T. Press, Cambridge, MA.,1985. [55] Vidyasagar M.: Nonlinear System Analysis. Second Edition. Englewood Cliffs, NJ, Prentice-Hall, 1993. [56] Vaněček A., Čelikovský S.: Control Systems. From Linear Analysis to Synthesis of Chaos. Prentice Hall, London, 1996. [57] Willems J.L.: Stability Theory of Dynamical Systems. Nelson, London, 1970. Články [58] Anderson B.D.O.: Stability of control systems with multiple nonlinearities. J.Franklin Inst., 282, s.155-160, 1966. [59] Brockett R.W., Willems J.W.: Frequency domain stability criteria, IEEE Trans.on Automatic Control, část I. AC-10, č.3, s.255-261, 1965; část II. AC-10, č.4, s.407-413, 1965. [60] Byrnes C.I., Isidori A, Willems J.C.: Passivity, feedback equivalence and the global stabilization of minimum phase nonlinear systems. IEEE Trans.on Automatic Control,36, č.11, s.1228-1240, 1991. [61] Čelikovský S.: Global linearization of nonlinear systems - A survey. Geometry in Nonlinear Control and Differential Inclusions. Banach Center Publications, vol.32. Institute of Mathematics, Polish Academy of Sciences, Varšava, 1995. [62] Deluca A.: Design of an exact nonlinear controller for induction motors. IEEE Trans.on Automatic Control, AC-34, č.12, s.1304-1307, 1989. [63] Estrada R.F.: On the stability of multiloop feedback systems. IEEE Trans.on Automatic Control, AC-17, s.781-791, 1972. [64] Glad S.T.: Robustness of nonlinear state feedback. A survey. Automatica, sv.23, s.425-435, 1987. 199 [65] Haddad W.M., Kapila V.: Absolute stability criteria for multiple slope-restricted monotonic nonlinearities. IEEE Trans.on Automatic Control, AC-40, č.2, s.361-365, 1995. [66] Haber R., Unbehauen H.: Structure identification of nonlinear dynamic systems. A survey on input/output approaches. Automatica, 26, č.4, s.651-678, 1990. [67] Havlena V.: Simultaneous parameter tracking and state estimation. Automatica, 29, č.4, s.10411052, 1993. [68] Havlena V.: Adaptive Kalman filter for a MIMO ARMAX system. Preprints of the 12th IFAC World Congress,sv.9, Sydney, 1993. [69] Hill D.J., Moylan P.J.: The stability of nonlinear dissipative systems. IEEE Trans.on Automatic Control, sv. 21, s. 708-711, 1976. [70] Hill D.J., Moylan P.J.: Stability results for nonlinear feedback systems. Automatica, sv.13, s.377382, 1977. [71] Hill D.J., Moylan P.J.: Dissipative dynamical systems: Basic input-output and state properties. J.Franklin Inst., sv. 309, s. 327-357, 1980. [72] Hunt L.R., Su R., Meyer G.: Global transformations of nonlinear systems. IEEE Trans.on Automatic Control, AC-28, č.1, s. 24-30, 1983. [73] Isidori A., Byrnes C.J.: Output regulation of nonlinear systems. IEEE Trans.on Automatic Control, AC-35, č.2, s.131-140, 1990. [74] Jakubovič V.A.: Rešenije někotorych matričnych něravěnstv vstrečajuščichsja v těorii avtomatičeskogo regulirovanija. Dokl. AN SSSR, č.6, 1958. [75] Krzseminski Z.: Nonlinear control of induction motor. Proc. 10th IFAC World Congress, s.349-354, Mnichov, 1987. [76] Kwakernaak H. (ed.): Special Issue on Trends in System Identification. Automatica, sv.31, č.12, 1995. [77] Lozano-Leal R., Joshi S.M.: Strictly positive real functions revisited. IEEE Trans.on Automatic Control, AC-35, s.1243-1245, 1990. [78] Mareels I.M., Bitmead R.R.: Nonlinear dynamics in adaptive control. Chaotic and periodic stabilization. Automatica, sv.22, č.6, s.641-655, 1986. [79] Meyer G., Su R., Hunt L.R.: Application of nonlinear transformations to automatic flight control. Automatica, 20, s.103-107, 1984. [80] Moore J.B., Anderson B.D.O.: A generalisation of the Popov criterion. J.Franklin Inst., 285, s. 488-492, 1968. [81] Ortega R., Canudas C., Seleme S.I.: Nonlinear control of induction motors: Torque tracking with unknown load disturbance. IEEE Trans.on Automatic Control, AC-38, č.11, s.1675-1680, 1993. [82] Peterka V.: Control of uncertain processes: Applied theory and algorithms. Supplement to Kybernetika 22, No.3 - 6, 1986. [83] Popov V.M.: Ob absolutnoj ustojčivosti nělinějnych sistěm avtomatičeskogo regulirovanija. Avtomatika i Telemechanika, č.8, 1961. 200 [84] Porter D.W., Michel A.N.: Input-output stability of time-varying nonlinear multiloop feedback systems. IEEE Trans.on Automatic Control, AC-19, s.422-427, 1974. [85] Rae W.G.: Stability criteria for control systems with many nonlinear elements. Automatica, sv.6, s. 463-467, 1970. [86] Ray K.S., Majumder D.D.: Application of the circle criteria for stability analysis of linear SISO and MIMO systems associated with fuzzy logic controller. IEEE Trans. Systems, Man, and Cybernetics, 14, s.345-349, 1984. [87] Singh V.: A stability inequality for nonlinear feedback systems with slope-restricted nonlinearity. IEEE Trans.on Automatic Control, AC-29, č.8, 1984. [88] Sinha P.K.: State feedback decoupling of nonlinear systems. IEEE Trans.on Automatic Control, AC-22, č.6, s.487-489,1977. [89] Sontag E.D.: New characterizations of input-output stability. IEEE Trans.on Automatic Control, AC-41, č.9, s. 1283-1294, 1996. [90] Štecha J., Havlena V.: Smoothing in simultaneous state and parameters estimation. Proceedings of Third European Control Conference, Roma, sv. 4, pp. 2165-2170, 1995. [91] Utkin V.I.: Variable structure systems with sliding mode: A Survey. IEEE Trans.on Automatic Control, AC-22, s.212-222, 1977. [92] Vaněček A., Čelikovský S.: Wrapped eigenstructure of chaos. Kybernetika, sv.29, č.1, s.73-79, 1993. [93] Vaněček A., Čelikovský S.: Synthesis of chaotic systems. Kybernetika, sv.30, č.5, s.537-542, 1994. [94] Vidyasagar M.: New directions of research in nonlinear system theory. Proc.IEEE, sv.74, č.8, s.1060-1091. [95] Wen J.T.: Time domain and frequency domain conditions for strict positive realness. IEEE Trans.on Automatic Control, AC-33, s.988-992, 1988. [96] Willems J.C.: Dissipative dynamical systems. Part I: General theory. Arch. Rational Mechanics and Analysis, sv. 45, s.321-351, 1972. 201

Doğrusal Olmayan Sistemler Ders Notları

Products

Support

Doğrusal Olmayan Sistemler Ders Notları

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib