ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Nelineárnı́ systémy Doc. Ing. Miroslav Razı́m, CSc. Prof. Ing. Jan Štecha, CSc. 1997 Edičnı́ středisko ČVUT, Praha 6, Zikova 4 Předmluva Skriptum Nelineárnı́ systémy je určeno předevšı́m pro studenty oboru Technická kybernetika, ale vzhledem k obecnějšı́mu pojetı́ probı́rané látky může sloužit jako základnı́ text i pro studenty jiných oborů, kteřı́ se zajı́majı́ o nelineárnı́ dynamické systémy a jejich řı́zenı́. Převážná část skripta je věnována analýze nelineárnı́ch systémů. Kromě klasických metod, k nimž patřı́ předevšı́m Ljapunovova teorie stability, Popovovo a kruhové kritérium a metoda ekvivalentnı́ch přenosů, jsou do skripta zařazeny i některé modernı́ partie, např. stabilita vstup-výstup, teorie bifurkacı́ rovnovážných stavů a periodických řešenı́, teorie katastrof a základnı́ poznatky o chaotickém chovánı́ systémů. Syntéze řı́zenı́ nelineárnı́ch systémů jsou věnovány kapitoly 14 a 15. Podrobněji jsou uvedeny předevšı́m metody exaktnı́ch linearizacı́, které představujı́ dnes hlavnı́ směr výzkumu nelineárnı́ho řı́zenı́. Závěrečná kapitola obsahuje některé vybrané metody identifikace nelineárnı́ch systémů. Snahou autorů bylo podat ve zhuštěné formě základnı́ přehled problematiky nelineárnı́ch systémů a jejich řı́zenı́. Probı́raná témata jsou proto ilustrována jen malým počtem jednoduchých přı́kladů, složitějšı́ přı́klady, aplikace a počı́tačové programy jsou náplnı́ seminárnı́ch a laboratornı́ch cvičenı́. Kapitoly 1 až 15 skripta zpracoval doc. Ing. Miroslav Razı́m, CSc., kapitolu 16 prof. Ing. Jan Štecha, CSc. Autoři děkujı́ recenzentovi skripta Ing. Antonı́nu Vaněčkovi, DrSc. za velmi pečlivé pročtenı́ rukopisu a za řadu podnětů, které přispěly k definitivnı́ úpravě textu. Autoři budou vděčni uživatelům skripta za připomı́nky, které přispějı́ ke zkvalitněnı́ textu při eventuálnı́m dalšı́m vydánı́. Praha, červen 1997. Autoři Obsah 1 Úvod 1 1.1 Nelineárnı́ prvky a jejich charakteristiky . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Nelineárnı́ dynamické systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.1 Rozdělenı́ nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.2 Matematický popis nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . 5 Sestavovánı́ rovnic nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 2 Základnı́ vlastnosti nelineárnı́ch systémů 10 2.1 Základnı́ pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2 Metody řešenı́ přechodných jevů nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . 13 2.2.1 Analytické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2.2 Metody malého parametru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.3 Grafické a graficko-analytické metody . . . . . . . . . . . . . . . . . . . . . . . 16 2.2.4 Numerické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2.5 Simulace nelineárnı́ch systémů na počı́tačı́ch . . . . . . . . . . . . . . . . . . . . 18 Ustálené stavy nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.1 Autonomnı́ nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.2 Neautonomnı́ nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3 3 Stabilita - základnı́ pojmy a definice 24 3.1 Stabilita rovnovážného stavu volného systému . . . . . . . . . . . . . . . . . . . . . . . 24 3.2 Stabilita pohybu volného systému . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.3 Jiné typy stability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4 Ljapunovova metoda linearizace 4.1 4.2 4.3 29 Lineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.1.1 Lineárnı́ autonomnı́ systémy 29 4.1.2 Lineárnı́ časově variantnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Prvnı́ Ljapunovova metoda pro nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . 36 4.2.1 Lokálnı́ stabilita rovnovážných stavů autonomnı́ch systémů . . . . . . . . . . . 36 4.2.2 Lokálnı́ stabilita rovnovážných stavů neautonomnı́ch systémů . . . . . . . . . . 39 Strukturálnı́ stabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 I 4.4 4.5 Centrálnı́ varieta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.4.1 Výpočet centrálnı́ variety a určovánı́ stability meznı́ho přı́padu . . . . . . . . . 43 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5 Přı́má Ljapunovova metoda 46 5.1 Ljapunovovy funkce pro autonomnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . 46 5.2 Ljapunovovy funkce pro lineárnı́ autonomnı́ systémy . . . . . . . . . . . . . . . . . . . 49 5.3 Ljapunovovy funkce pro nelineárnı́ autonomnı́ systémy . . . . . . . . . . . . . . . . . . 49 5.3.1 Volba Ljapunovovy funkce na základě fyzikálnı́ analogie . . . . . . . . . . . . . 50 5.3.2 Volba Ljapunovovy funkce pro nelineárnı́ systém podle analogie s linearizovaným systémem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Metoda variabilnı́ho gradientu . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3.3 5.4 Ljapunovovy funkce pro neautonomnı́ systémy . . . . . . . . . . . . . . . . . . . . . . 54 5.5 Věty o nestabilitě . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.6 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 6 Speciálnı́ systémy 58 6.1 Gradientnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.2 Pasivnı́ a disipativnı́ dynamické systémy . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.2.1 Pozitivně reálné lineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.2.2 Obecná teorie disipativnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . 63 7 Absolutnı́ stabilita 7.1 7.2 66 Popovovo kritérium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 7.1.1 Odvozenı́ Popovova kritéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.1.2 Popovovo kritérium a Ajzermanova hypotéza . . . . . . . . . . . . . . . . . . . 72 7.1.3 Transformace pólů a nul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 7.1.4 Rozšı́řenı́ Popovova kritéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Kruhové kritérium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 8 Stabilita vstup-výstup 78 8.1 Lebesgueovy prostory a jejich rozšı́řenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.2 Definice stability vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.3 Stabilita zpětnovazebnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 8.3.1 Stabilita při malém zesı́lenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 8.3.2 Přı́stup pomocı́ pasivity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 9 Nelineárnı́ diskrétnı́ systémy 86 9.1 Definice stability autonomnı́ho diskrétnı́ho systému . . . . . . . . . . . . . . . . . . . . 87 9.2 Vyšetřenı́ stability pevných bodů metodou linearizace . . . . . . . . . . . . . . . . . . 87 9.3 Vyšetřenı́ stability pomocı́ přı́mé Ljapunovovy metody . . . . . . . . . . . . . . . . . . 89 10 Periodická řešenı́ a jejich stabilita 90 II 10.1 Analytické metody studia periodických řešenı́ . . . . . . . . . . . . . . . . . . . . . . . 90 10.2 Odhady periodických řešenı́ u systémů druhého řádu . . . . . . . . . . . . . . . . . . . 91 10.3 Poincaréovo zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 10.4 Rovnice ve variacı́ch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 10.5 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 11 Bifurkace rovnovážných stavů a periodických řešenı́ 97 11.1 Bifurkace rovnovážných stavů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 11.2 Bifurkace periodických řešenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 11.3 Teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 11.3.1 Elementárnı́ teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 11.3.2 Aplikace teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 12 Chaos 105 12.1 Chaos v diskrétnı́ch systémech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 12.1.1 Kvadratická diferenčnı́ rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 12.1.2 Po částech lineárnı́ zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 12.1.3 Hénonovo zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 12.2 Chaos u diferenciálnı́ch rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 12.2.1 Lorenzův model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 12.2.2 Jiné modely . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 12.3 Vlastnosti chaotických atraktorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 12.3.1 Ljapunovovy exponenty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 12.3.2 Dimenze atraktorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 13 Metoda ekvivalentnı́ch přenosů 117 13.1 Princip metody ekvivalentnı́ch přenosů pro jeden vstup . . . . . . . . . . . . . . . . . 117 13.2 Ekvivalentnı́ přenosy pro frekvenčně nezávislé nelinearity . . . . . . . . . . . . . . . . 119 13.3 Ekvivalentnı́ přenosy pro frekvenčně závislé nelinearity . . . . . . . . . . . . . . . . . . 123 13.4 Periodická řešenı́ autonomnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . 124 13.5 Nelineárnı́ systémy s většı́m počtem nelinearit . . . . . . . . . . . . . . . . . . . . . . . 126 13.6 Nelineárnı́ systémy s nesymetrickými vlastnı́mi kmity . . . . . . . . . . . . . . . . . . 127 13.7 Ekvivalentnı́ přenos nelinearity se dvěma vstupy . . . . . . . . . . . . . . . . . . . . . 132 14 Metody syntézy nelineárnı́ch řı́dı́cı́ch systémů 134 14.1 Linearizace nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 14.1.1 Linearizace v pracovnı́m bodě . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 14.1.2 Linearizace ve vı́ce pracovnı́ch bodech . . . . . . . . . . . . . . . . . . . . . . . 135 14.1.3 Exaktnı́ linearizace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 14.2 Základnı́ metody syntézy řı́zenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 14.2.1 Lineárnı́ nebo linearizovaná soustava s nelineárnı́m řı́zenı́m . . . . . . . . . . . 136 14.2.2 Nelineárnı́ soustava s lineárnı́m nebo nelineárnı́m řı́zenı́m . . . . . . . . . . . . 137 III 15 Exaktnı́ linearizace 140 15.1 Intuitivnı́ přı́stup k linearizaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 15.1.1 Transformace stavových proměnných . . . . . . . . . . . . . . . . . . . . . . . . 141 15.1.2 Linearizace vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 15.2 Matematické prostředky pro zpětnovazebnı́ linearizace . . . . . . . . . . . . . . . . . . 145 15.3 Linearizace vstup-stav . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 15.4 Linearizace vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 15.4.1 Relativnı́ stupeň r < n. Normálnı́ formy. . . . . . . . . . . . . . . . . . . . . . . 153 15.4.2 Vnitřnı́ a nulová dynamika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 15.4.3 Návrh řı́zenı́ při stabilizaci a sledovánı́ . . . . . . . . . . . . . . . . . . . . . . . 156 15.4.4 Systémy s vı́ce vstupy a výstupy . . . . . . . . . . . . . . . . . . . . . . . . . . 157 16 Identifikace nelineárnı́ch systémů 159 16.1 Obecné úvahy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 16.2 Deterministické modely a jejich identifikace . . . . . . . . . . . . . . . . . . . . . . . . 162 16.2.1 Deterministické metody identifikace nelineárnı́ch systémů . . . . . . . . . . . . 162 16.3 Stochastické modely nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . 164 16.4 Stochastické metody identifikace nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . 175 16.4.1 Bayesovské metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 16.4.2 Rozšı́řený Kalmanův filtr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 16.4.3 Stochastické metody interpolace . . . . . . . . . . . . . . . . . . . . . . . . . . 188 16.4.4 Klasifikace systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 Literatura 197 IV Kapitola 1 Úvod V teorii lineárnı́ch systémů byly studovány fyzikálnı́ a jiné soustavy, které lze popsat lineárnı́mi diferenciálnı́mi rovnicemi. Tento způsob popisu umožňuje relativně jednoduché řešenı́, ale ve skutečnosti je jen určitou aproximacı́ skutečnosti, protože fyzikálnı́, biologické, ekonomické nebo jiné systémy jsou většinou ve své podstatě nelineárnı́. Mnohdy je možno některé nelineárnı́ systémy vyšetřovat s dostatečnou přesnostı́ jako lineárnı́, jestliže se jejich chovánı́ přı́liš neodlišuje od lineárnı́ aproximace, zejména při pohybu v blı́zkosti pracovnı́ch nebo rovnovážných stavů. Proto je znalost modernı́ lineárnı́ teorie nezbytná i pro studium nelineárnı́ch systémů. Často se však vyskytujı́ situace, kdy je linearizovaný model neadekvátnı́ nebo kdy je linearizace nepřı́pustná. Linearizace nám také neumožnı́ studovat speciálnı́ chovánı́, které se objevuje jen u nelineárnı́ch systémů a které nelze lineárnı́ teoriı́ vysvětlit. Jak uvidı́me v dalšı́ch kapitolách, jsou to např. různé typy ustálených oscilacı́, které nejsou vybuzeny vnějšı́m periodickým signálem, dále různé subharmonické a ultraharmonické kmity, skokové rezonance, chaotické jevy apod. Mnohé z těchto jevů jsou nežádoucı́ a jsou vyvolány parazitnı́mi nelinearitami v regulátorech a regulovaných soustavách, např. třenı́m, nasycenı́m, vůlı́ v převodech apod., jiné jevy jsou naopak žádoucı́ a do obvodu často vhodné nelinearity úmyslně zavádı́me. Existuje mnoho rozdı́lů mezi lineárnı́mi a nelineárnı́mi systémy. Řešenı́ lineárnı́ch systémů je velmi často možné zı́skat v uzavřeném tvaru, který umožňuje činit obecné závěry o chovánı́ systému. To v nelineárnı́m přı́padě nenı́ většinou možné a úlohu je třeba bud’ řešit numerickými metodami nebo provádět pouze kvalitativnı́ analýzu, která však často poskytne mnoho informacı́ o chovánı́ nelineárnı́ho systému. Je třeba si také uvědomit, že pro obtı́žnost řešenı́ se u nelineárnı́ch systémů použı́vá mnohem širšı́ paleta metod než u systémů lineárnı́ch, protože neexistuje univerzálnı́ metoda řešenı́. Nelineárnı́ systémy vyžadujı́ také znalost složitějšı́ch matematických disciplı́n jako je např. funkcionálnı́ analýza, diferenciálnı́ geometrie, teorie vektorových polı́ aj. Studium nelineárnı́ch systémů a jejich vlastnostı́ zvyšuje podstatně možnosti pracovat účinně s praktickými problémy a přispı́vá k hlubšı́mu pochopenı́ reálného světa, který je ve své podstatě nelineárnı́. Uvidı́me dále, že jedině pomocı́ nelineárnı́ch teoriı́ lze vysvětlit složité chovánı́ fyzikálnı́ch, biologických, ekonomických a jiných systémů. Např. evoluce v biologii, diferenciace buněk a tkánı́, vznik různých živočišných druhů, chovánı́ jedinců i populacı́, to vše je dáno složitými nelineárnı́mi interakcemi. Ale také řı́zenı́ složitých technických systémů, např. rychlých a přesných robotů, letadel apod. vyžaduje podrobnou znalost nelineárnı́ho chovánı́. Uved’me stručně některé důvody, které nás nutı́ k využitı́ nelineárnı́ho řı́zenı́. Pohyb ve velkých pracovnı́ch rozsazı́ch, kdy už neplatı́ podmı́nky linearizace kolem pracovnı́ho bodu. Lineárnı́ řı́zenı́ má pak často velmi špatné vlastnosti, nelze dosáhnout žádané přesnosti regulace a vyhovujı́cı́ kvality regulačnı́ho pochodu. Kompenzace nelinearit řı́zeného systému nebo vhodný návrh nelineárnı́ho regulátoru mohou vlastnosti celého systému podstatně zlepšit. 1 KAPITOLA 1. ÚVOD 2 Řı́zenı́ systémů s nelinearitami, které nelze linearizovat. V soustavách i regulátorech existuje v praxi mnoho nelinearit, které nedovolujı́ lineárnı́ aproximaci. Jsou to např. třenı́, nasycenı́, hystereze apod., které vyvolávajı́ nežádoucı́ jevy, např. různé typy oscilacı́, velké ustálené regulačnı́ odchylky aj. Jejich vliv je proto třeba predikovat a kompenzovat vhodným návrhem nelineárnı́ho řı́zenı́. Jednoduchost některých nelineárnı́ch systémů. Mnohé regulované soustavy lze velmi dobře řı́dit jednoduchými a často i lacinými prostředky, které přitom plně uspokojı́ požadavky na kvalitu regulace. Jako přı́klad mohou sloužit nespojité regulace teploty, tlaku, průtoku a jiných veličin, kde se v regulátorech často použı́vajı́ jednoduché prvky s charakteristikami reléového typu. Robustnı́ návrh s ohledem na změny parametrů. V mnoha praktických problémech je třeba uvažovat nejistoty v hodnotách parametrů modelu. Jedná se bud’ o pomalé změny parametrů v čase, např. vlivem stárnutı́ prvků, změnami v okolı́ systému apod., nebo o náhlé změny, např. při uchopenı́ zátěže u manipulátorů. Lineárnı́ řı́zenı́ může v těchto přı́padech vést na zhoršené regulačnı́ pochody nebo může dojı́t i k nestabilnı́mu chovánı́. Podstatně lépe se s těmito změnami vyrovná nelineárnı́ řı́zenı́, např. nelineárnı́ robustnı́ nebo adaptivnı́ řı́zenı́. V minulosti byla aplikace metod nelineárnı́ho řı́zenı́ obtı́žná, rychlá výpočetnı́ technika však dnes umožňuje jejich praktické využitı́. To vyvolalo také velký zájem o nelineárnı́ problémy, jejich výzkum a aplikaci. Vzhledem k velmi rozsáhlé problematice nelineárnı́ch systémů se můžeme v omezeném rozsahu skripta zabývat jen základnı́mi metodami analýzy dynamických systémů a některými vybranými metodami, které umožňujı́ syntézu nelineárnı́ch řı́dı́cı́ch systémů. V prvnı́ části skripta budeme předpokládat, že nelineárnı́ systém je popsán matematickými vztahy a budeme provádět analýzu jeho chovánı́, vyšetřovat přechodné jevy, ustálené stavy a jejich stabilitu při změnách počátečnı́ch podmı́nek a parametrů, možnost vzniku chaotického chovánı́, apod. V kapitolách 14 a 15 uvedeme některé metody syntézy vhodného řı́zenı́ dané nelineárnı́ regulované soustavy. Všimneme si jednoduchých možnostı́ řı́zenı́ pomocı́ lineárnı́ch a nelineárnı́ch spojitých i nespojitých regulátorů. Většı́ pozornost budeme věnovat metodám tzv. zpětnovazebnı́ linearizace, která na rozdı́l od jednoduché linearizace kolem pracovnı́ho bodu se snažı́ linearizovat daný nelineárnı́ systém ve většı́m pracovnı́m rozsahu, nebo dokonce i globálně. Tento přı́stup k syntéze řı́zenı́ nám pak umožnı́ návrh regulátoru pomocı́ velmi dobře propracovaných metod řı́zenı́ lineárnı́ch systémů. Poslednı́ kapitola skript je věnována některým problémům identifikace nelineárnı́ch systémů. 1.1 Nelineárnı́ prvky a jejich charakteristiky Nelineárnı́ systémy jsou složeny obvykle z různých lineárnı́ch a nelineárnı́ch členů. Tyto členy mohou být popsány bud’ algebraickými rovnicemi (tzv. statické členy) nebo diferenciálnı́mi rovnicemi (dynamické členy). V matematických modelech fyzikálnı́ch, biologických a jiných objektů se vyskytuje množstvı́ nejrůznějšı́ch typů nelineárnı́ch členů. Z důvodů omezeného prostoru si všimneme pouze typických nelinearit, které se nejčastěji vyskytujı́ v řı́dı́cı́ technice. Mnohé dalšı́ nelinearity uvidı́me v některých konkrétnı́ch přı́kladech v různých částech skripta. Statické prvky jsou takové, u nichž výstup závisı́ jen na okamžitých vstupnı́ch hodnotách a nikoliv na jejich derivacı́ch nebo integrálech. Takové prvky mohou být popsány a) statickou charakteristikou b) tabulkou hodnot (pro numerické zpracovánı́) c) analytickým výrazem y = φ(x). Pro účely analytického vyjádřenı́ nelineárnı́ch charakteristik se použı́vajı́ jednoduché aproximace nelinearity v pracovnı́ oblasti (odst.2.2.1). KAPITOLA 1. ÚVOD 3 V regulačnı́ technice se vyskytujı́ velmi často členy s těmito typy nelineárnı́ch charakteristik: a) Charakteristika typu nasycenı́ (obr.1.1a) se vyskytuje u různých snı́mačů a zesilovačů, jako nasycenı́ se projevujı́ dorazy u mechanických systémů, omezenı́ rychlosti u servomotorů apod. Pro výpočetnı́ účely se skutečný průběh křivky často nahrazuje lomenou charakteristikou (obr.1.1b). b) Charakteristika s pásmem necitlivosti (obr.1.1c). Tuto charakteristiku majı́ např. snı́mače, které majı́ nulový výstup při malých vstupnı́ch signálech (např. vlivem třenı́), hydraulické zesilovače s překrytı́m v rozvodu, některé systémy s vůlı́ v mechanických členech, servomotory při nı́zkém vstupnı́m napětı́ apod. Obr.1.1. Základnı́ typy nelineárnı́ch charakteristik. c) Hystereznı́ charakteristika se vyskytuje u regulačnı́ch členů se železem (servomotory). Podobnou charakteristiku majı́ za určitých podmı́nek také členy se suchým třenı́m nebo s vůlı́ v převodech (obr.1.1d). d) Charakteristika třenı́ (obr.1.1e). Sı́la nebo moment třenı́ závisı́ na rychlosti pohybu. U dynamického rotačnı́ho systému s třenı́m rozlišujeme klidové třenı́ M0 (tzv. statické třenı́, přilnavost) a třenı́ za pohybu, tzv. suché nebo Coulombovo třenı́ Mc . Má-li dynamický systém ještě lineárnı́ viskóznı́ tlumenı́, které také závisı́ na rychlosti, je výsledný tlumı́cı́ moment MT L kombinacı́ vlivu lineárnı́ho tlumenı́ a nelineárnı́ho třenı́ (obr.1.1f). e) Charakteristiky reléového typu jsou nespojité funkce, u nichž se výstup měnı́ skokem při určité hodnotě spojitě se měnı́cı́ho vstupu. Charakteristiky jsou bud’ dvoupolohové bez hystereze nebo s hysterezı́ (obr.1.1g) nebo trojpolohové (s pásmem necitlivosti) bez hystereze nebo s hysterezı́ (obr.1.1h). Zakreslené charakteristiky jsou symetrické, často však mohou být nesymetrické vzhledem k jedné nebo oběma osám. Výjı́mečně se vyskytujı́ také charakteristiky vı́cepolohové. f) Charakteristiky s obecným průběhem majı́ např. různé elektronické prvky (diody, tranzis- KAPITOLA 1. ÚVOD 4 tory, varistory, tyristory, doutnavky, nelineárnı́ kondenzátory a cı́vky aj.), které byly probı́rány v teorii obvodů. Obecné průběhy charakteristik majı́ také mnohé snı́mače fyzikálnı́ch veličin (teplot, průtoků aj.), akčnı́ členy (ventily) apod. Převážná část uvedených nelinearit se vyskytuje v regulačnı́m obvodu u regulátorů (snı́mače, zesilovače, servomotory, ventily), kde jsou obvykle snadno měřitelné a dajı́ se často vyjádřit statickou charakteristikou. Velké množstvı́ nelinearit se ovšem vyskytuje v regulovaných soustavách, při regulaci teplot, hladin, průtoků, tlaku, koncentrace, polohy aj. Fyzikálnı́, chemické, biologické a jiné systémy obsahujı́ mnoho nelinearit a jejich identifikace a matematický popis jsou mnohdy velmi obtı́žné. Nelineárnı́ prvky se v regulačnı́ technice dělı́ také někdy zhruba do dvou velkých skupin. Jsou to jednak přirozené nelinearity, které se někdy také nazývajı́ parazitnı́ a nelinearity úmyslně zaváděné. Prvnı́ z nich jsou v obvodech mnohdy nežádoucı́ a snažı́me se je vyloučit vylepšenou konstrukcı́ nebo kompenzovat vhodným návrhem regulátoru. Druhé do obvodů úmyslně zavádı́me, abychom vytvořili bud’ jednoduché a levné řı́zené systémy (např. pomocı́ dvoupolohových nebo trojpolohových prvků) nebo kompenzovali jiné nelinearity nebo realizovali různé optimálnı́ a suboptimálnı́ systémy. Mnohé nelinearity nemůžeme ovšem jednoznačně zařadit do určité skupiny. Např. nasycenı́ bude nevýhodné, jestliže snı́žı́ rychlost odezvy systému, jindy ho však úmyslně zavedeme pro zlepšenı́ stupně stability obvodu apod. 1.2 Nelineárnı́ dynamické systémy Nelineárnı́ systémy, které jsou složeny pouze ze statických prvků, jsou podrobně probı́rány v teorii obvodů a nebudeme se jimi v tomto textu zabývat. Dále budeme uvažovat pouze dynamické nelineárnı́ systémy, které obsahujı́ obvykle různé lineárnı́ členy a jednu nebo většı́ počet nelinearit. V nelineárnı́ch systémech může vzniknout velké množstvı́ různých jevů, které se nevyskytujı́ v systémech lineárnı́ch. Připomeňme si proto nejprve stručně vlastnosti lineárnı́ch systémů. Nebuzený lineárnı́ systém ẋ = Ax s regulárnı́ maticı́ A má jeden rovnovážný stav v počátku souřadnic, který je stabilnı́, majı́-li všechna vlastnı́ čı́sla matice A zápornou reálnou část. Tato stabilita nezávisı́ na počátečnı́ch podmı́nkách. Přechodný jev lineárnı́ho systému je složen z přirozených módů systému a obecné řešenı́ lze zı́skat analyticky. Buzený systém ẋ = Ax + Bu má při ohraničeném vstupu ohraničený výstup, jestliže nebuzený systém je asymptoticky stabilnı́. Připojı́me-li na vstup vnějšı́ harmonický signál, bude v ustáleném stavu na výstupu rovněž harmonický signál o stejné frekvenci. Protože u lineárnı́ch systémů platı́ princip superpozice, můžeme k popisu použı́t operátorového a frekvenčnı́ho přenosu, frekvenčnı́ charakteristiky nebo odezvy na specifický či obecný vstupnı́ signál. Chovánı́ nelineárnı́ho systému je mnohem komplikovanějšı́. Protože zde neplatı́ princip superpozice, nemůžeme využı́t operátorových a frekvenčnı́ch metod. Rovněž popis systému odezvou na specifický nebo obecný vstupnı́ signál je nevýhodný, protože chovánı́ závisı́ na typu signálu a jeho parametrech. Nebuzený nelineárnı́ systém může mı́t libovolný počet rovnovážných stavů, mohou v něm vzniknout ustálené kmity, které se nazývajı́ samovolně buzené kmity nebo autooscilace.Ty nejsou vybuzeny vnějšı́m periodickým signálem, ale jsou dány jen vlastnostmi nebuzeného systému. V některých nelineárnı́ch systémech mohou vzniknout kvaziperiodické kmity nebo chaotické chovánı́. V čl.1.3 si ukážeme některé tyto jevy na přı́kladu. Definice a podrobné rozbory uvedených jevů budou náplnı́ dalšı́ch kapitol. KAPITOLA 1. ÚVOD 1.2.1 5 Rozdělenı́ nelineárnı́ch systémů Nelineárnı́ systémy můžeme dělit podle různých kritériı́. 1. Podle vazby k okolı́ se rozlišujı́ tři druhy systémů: a) izolovaný systém, u něhož nedocházı́ k výměně energie a hmoty s okolı́m. Izolovaný systém dosahuje časově nezávislého ustáleného stavu, který se nazývá rovnovážný. V něm všechny makroskopické procesy ustanou a všechny makroskopické veličiny zůstávajı́ konstantnı́; b) uzavřený systém, který umožňuje pouze výměnu energie s okolı́m, k výměně hmoty nedocházı́; c) otevřený systém, který vyměňuje s okolı́m energii i hmotu. Uzavřené a otevřené systémy mohou za určitých podmı́nek dosáhnout časově nezávislého ustáleného stavu, v němž makroskopické veličiny zůstávajı́ konstantnı́, ale procesy přı́jmu a výdeje energie nebo i hmoty probı́hajı́. Takový ustálený stav se nazývá stacionárnı́. (V literatuře se tento pojem použı́vá často i pro stav rovnovážný). 2. Podle přı́tomnosti paměti v systému rozlišujeme systémy statické (bez paměti), u nichž všechny vnitřnı́ veličiny jsou jednoznačně určeny okamžitými hodnotami vstupnı́ch veličin a systémy dynamické (s pamětı́), u nichž okamžitá hodnota vnitřnı́ch veličin závisı́ na okamžitých i minulých hodnotách vstupů. 3. Podle závislosti na čase dělı́me systémy na autonomnı́, které nezávisı́ explicitně na čase (např. systémy nebuzené a časově invariantnı́) a systémy neautonomnı́, které jsou bud’ buzené nebo časově variantnı́ nebo obojı́. 4. Podle dalšı́ch kritériı́ můžeme dělit nelineárnı́ systémy např. na deterministické nebo stochastické, se soustředěnými parametry nebo s rozloženými (rozdělenými) parametry, se spojitým časem nebo s diskrétnı́m časem, nebuzené nebo buzené, neřı́zené nebo řı́zené, konzervativnı́ nebo disipativnı́, neadaptivnı́ nebo adaptivnı́, bez učenı́ nebo s učenı́m aj. 1.2.2 Matematický popis nelineárnı́ch systémů 1. Nelineárnı́ systémy se spojitým časem a) Obyčejné nelineárnı́ diferenciálnı́ rovnice popisujı́ systémy se soustředěnými parametry a spojitým časem. Použı́vá se nejčastěji zápis ve formě soustavy diferenciálnı́ch rovnic 1.řádu ẋ = f (x) - autonomnı́ systém (nebuzený, časově invariantnı́) ẋ = f (t, x) - neautonomnı́ systém (nebuzený, časově variantnı́). ẋ = f (x, u) - neautonomnı́ systém (buzený, časově invariantnı́) ẋ = f (t, x, u) - neautonomnı́ systém (buzený, časově variantnı́). Buzený nelineárnı́ systém v obecném tvaru ẋ = f (t, x, u) je obtı́žně řešitelný v uzavřeném tvaru, v praxi se však většinou setkáváme s jednoduššı́m typem systému, který nezávisı́ explicitně na čase ẋ = f (x) + g(x)u. Je to tzv. affinnı́ systém (systém lineárnı́ v řı́zenı́), který budeme použı́vat zejména při syntéze řı́zenı́ v kap.15. Speciálnı́ tvar má také bilineárnı́ systém ẋ = Ax + m X B j xuj , j=1 kde A, B j jsou matice rozměru (n × n). Např. bilineárnı́ systém pro dvě stavové a jednu vstupnı́ KAPITOLA 1. ÚVOD 6 proměnnou má tvar x˙1 = a11 x1 + a12 x2 + (b11 x1 + b12 x2 )u x˙2 = a21 x1 + a22 x2 + (b21 x1 + b22 x2 )u V dalšı́ch kapitolách se setkáme ještě s jinými typy systémů, které majı́ speciálnı́ vlastnosti. Jsou to např. gradientnı́ konzervativnı́, disipativnı́, symetrické a jiné systémy, které budou podrobněji popsány v kap.6. Poznámka: Rozdělenı́ systémů na buzené a nebuzené nenı́ přı́liš přesné. Jestliže v systému ẋ = f (t, x, u) je vstup u specifikován, přejde rovnice na tvar ẋ = f (t, x), který může tedy popisovat dva přı́pady: a) nenı́ vnějšı́ vstup do systému nebo b) je vnějšı́ vstup, ale je udržován na pevné hodnotě během studia chovánı́ systému. b) Parciálnı́ nelineárnı́ diferenciálnı́ rovnice popisujı́ systémy s rozloženými parametry. Jsou to např. rovnice přenosu tepla a hmoty, Navierovy-Stokesovy rovnice v hydrodynamice, rovnice difúze, absorpce, rovnice popisujı́cı́ populačnı́ systémy v biologii a ekologii aj. Nelineárnı́mi systémy, které vedou na parciálnı́ diferenciálnı́ rovnice, se pro omezený rozsah skripta nebudeme zabývat. 2. Nelineárnı́ systémy s diskrétnı́m časem jsou popsány diferenčnı́mi rovnicemi, obecně nelineárnı́ soustavou rovnic prvnı́ho řádu x(k + 1) = f [k, x(k), u(k)] y(k) = g[k, x(k), u(k)]. Nelineárnı́ diskrétnı́ systémy budou uvedeny v kap.9. 1.3 Sestavovánı́ rovnic nelineárnı́ch systémů Chceme-li provádět analýzu nebo syntézu složitých nelineárnı́ch systémů, je výhodné rozdělit systém na jednotlivé a co nejjednoduššı́ prvky a ty pak popisovat algebraickými nebo diferenciálnı́mi rovnicemi. Rovnice sestavujeme na základě známých zákonů, jako jsou např. zákony o zachovánı́ hmoty a energie, Newtonovy zákony, d’Alembertův princip, Kirchhoffovy zákony apod. Výhodné je také použı́t metodu vazebnı́ch grafů, která je podrobně rozpracována a doložena mnoha přı́klady v [3]. Zı́skané rovnice převádı́me na soustavu nelineárnı́ch diferenciálnı́ch rovnic 1.řádu. Obsahuje-li nelineárnı́ systém velký počet nelinearit, snažı́me se obvykle v prvnı́m přiblı́ženı́ některé nelinearity linearizovat. V obvodech pak zůstanou jen podstatné nelinearity, které linearizovat nelze, např. prvky s nespojitými charakteristikami reléového typu apod. V základnı́ch kurzech teorie automatického řı́zenı́ byly probı́rány různé mechanické a elektrické regulované soustavy a odvozovány jejich matematické modely. Uved’me zde proto jiný přı́klad na sestavenı́ rovnic, a to tepelně-chemický systém, který je současně velmi vhodný pro studium různých jevů vznikajı́cı́ch ve složitém nelineárnı́m systému. Podrobný rozbor vlastnostı́ tohoto systému je např. v [2]. Přı́klad 1.1. Průtočné reaktory jsou nádoby, do nichž se kontinuálně přivádějı́ výchozı́ látky, v reaktoru probı́hajı́ chemické reakce, a na výstupu se kontinuálně odebı́rá směs produktů. Předpokládejme, že do mı́chaného průtočného reaktoru (obr. 1.2) přicházı́ jen jedna vstupnı́ látka A s koncentraci cA1 [kg m−3 ]. Tato látka se v reaktoru rozkládá podle chemické reakce prvnı́ho řádu a na výstupu reaktoru odcházı́ s koncentracı́ cA . Látka A vstupuje do reaktoru při teplotě T1 [K], přı́toku F [m3 s−1 ], konstantnı́ hustotě ρ [kg m−3 ] a konstantnı́m měrném teple cp [J kg−1 ]. Dále budeme předpokládat, že v reaktoru probı́há jediná exotermická chemická reakce, směs v reaktoru je dokonale promı́chávána a reakčnı́ objem V [m3 ] je konstantnı́. Koncentrace reakčnı́ složky v reaktoru i na jeho výstupu je cA [kg m−3 ], teplota v reaktoru i na výstupu je T [K], teplota chladiva Tc [K], jeho průtok Fc [m3 s−1 ]. KAPITOLA 1. ÚVOD 7 ')(+*, -*,/.0,'21 3 !#"%$& ')(4, -5, .0,'61 3 ,- 7 /8 /!7# !#" $& Obr. 1.2. Mı́chaný průtočný reaktor. Uvažujme dále počátečnı́ podmı́nky cA (0) a T (0) pro t = 0. Budeme předpokládat, že v reaktoru probı́há reakce 1.řádu s reakčnı́ rychlostı́ r = kcA . Rychlostnı́ konstanta k je funkcı́ teploty v reaktoru podle Arrheniova vztahu E k = k∞ exp(− ), (1.1) RT kde E je aktivačnı́ energie a R univerzálnı́ plynová konstanta. Při vytvářenı́ matematického modelu reaktoru se uvažuje látková a entalpická (energetická) bilance. Látková bilance se sestavuje pro zvolenou složku reakčnı́ směsi, která je v našem přı́padě jediná. Bilanci této složky A lze vyjádřit obecně ve tvaru: akumulace = přı́vod - spotřeba nebo rozepsaně: (změna množstvı́ A v reaktoru za časovou jednotku) = (množstvı́ A přivedené do reaktoru za čas.jednotku) - (množstvı́ A odvedené z reaktoru za čas.jednotku) - (množstvı́ A spotřebované při reakci za čas.jednotku). Látkovou bilanci lze pak popsat diferenciálnı́ rovnicı́ V dcA E = F (cA1 − cA ) − k∞ cA V exp(− ), dt RT (1.2) uvažujeme-li reakci 1.řádu a závislost rychlostnı́ konstanty na teplotě podle Arrheniova vztahu (1.1). Entalpická bilance (pro izobarický proces) je vyjádřena obecně zase ve tvaru: akumulace = přı́vod - spotřeba. Jestliže se tepelná energie při reakci uvolňuje nebo spotřebovává a k přenosu tepla docházı́ pouze vedenı́m a prouděnı́m, lze sestavit bilanci: (časová změna tepla v reaktoru) = (teplo přivedené za jednotku času) - (teplo odvedené výstupnı́m proudem za jednotku času) - (teplo vyměněné stěnou reaktoru za jednotku času) + (teplo uvolněné při chemické přeměně za jednotku času). Pro konstantnı́ reakčnı́ objem V a konstantnı́ hustotu ρ lze psát entalpickou bilanci (při splněnı́ některých dalšı́ch podmı́nek, podrobnosti viz [2]) ρV cp dT E = ρF cp (T1 − T ) − kS(T − Tc ) + (−∆Hr )k∞ cA V exp(− ), dt RT (1.3) kde T1 je teplota na vstupu do reaktoru, T teplota v reaktoru a na jeho výstupu, Tc teplota chladiva, cp měrné teplo při konstantnı́m tlaku, k součinitel přestupu tepla, S plocha přestupu a ∆Hr reakčnı́ entalpie. KAPITOLA 1. ÚVOD 8 Rovnice (1.2) a (1.3) představujı́ soustavu dvou nelineárnı́ch diferenciálnı́ch rovnic pro stavové proměnné cA a T . Proved’me nynı́ rozbor vlastnostı́ tohoto systému pro různé přı́pady. 1. Izotermický systém. Teplotu v reaktoru uvažujeme konstantnı́. Lze to provést řı́zenı́m teploty reaktoru pomocı́ chladı́cı́ho systému. Jestliže T = konst., zůstává pouze rovnice (1.2) pro látkovou bilanci, rovnice (1.3) pro entalpickou bilanci odpadá. a) Lineárnı́ buzený systém s konstantnı́mi parametry dcA F = (cA1 − cA ) − k1 cA dt V (1.4) může mı́t řı́zenı́ cA1 bud’ konstantnı́ nebo časově proměnné. Pro cA1 = konst. je stacionárnı́ stav (dcA /dt = 0) F cA1 cA = F + k1 V Řešenı́ rovnice (1.4) pro různé počátečnı́ podmı́nky cA (0) je na obr. 1.3. Zvolme cA1 =konst., F = konst. a označme střednı́ dobu prodlenı́ τ = V /F . Pak lineárnı́ rovnice (1.4) má řešenı́ t cA1 cA (0) −(1 + k1 τ ) τ . 1 − 1 − (1 + k1 τ ) e cA (t) = 1 + k1 τ cA1 (1.5) Pro t → ∞ se řešenı́ blı́žı́ stacionárnı́mu řešenı́ cA = cA1 /(1 + k1 τ ). Na obr.1.4 je znázorněna závislost stacionárnı́ho řešenı́ na střednı́ době prodlenı́ τ (diagram řešenı́). U lineárnı́ho systému je pro každou hodnotu parametru τ řešenı́ jediné. Bude-li vstupnı́ koncentrace do reaktoru časově proměnná, např. ve tvaru periodické funkce cA1 (t) = A sin ωt, bude stavová veličina cA také sinovou funkcı́ času s jinou amplitudou a fázovým posuvem. Obr.1.3. Závislost koncentrace na čase. 0br.1.4. Závislost na době prodlenı́. b) Lineárnı́ systém s časově proměnnými parametry vznikne např. při pozvolné deaktivaci katalyzátoru, kdy klesá rychlostnı́ konstanta k1 podle vztahu k1 (t) = k10 (1 − αt), kde α je velmi malé kladné čı́slo. Pak (1.4) přejde na F dcA = (cA1 − cA ) − k1 (t)cA . dt V (1.6) c) Nelineárnı́ buzený systém vznikne např. tehdy, jestliže vstupnı́ koncentrace cA1 bude konstantnı́ a reakce bude řı́zena změnou průtoku F . Aby vynikl vztah mezi obecným značenı́m uvedeným KAPITOLA 1. ÚVOD 9 v čl. 1.2.2 a použitými symboly v přı́kladu, označme řı́zenı́ F ≡ u a cA ≡ x. Pak můžeme rovnici (1.4) psát ve tvaru 1 (1.7) ẋ = −k1 x + (cA1 − x)u. V Systém je nynı́ v nelineárnı́m afinnı́m tvaru ẋ = f (x) + g(x)u. 2. Neizotermický systém. Nebude-li v reaktoru udržována konstantnı́ teplota během reakce, vznikne neizotermický systém a musı́me uvažovat i rovnici (1.3) pro entalpickou bilanci. Systém má nynı́ dvě stavové proměnné cA a T a je popsán dvěma nelineárnı́mi diferenciálnı́mi rovnicemi 1. řádu. Simulacı́ systému zı́skáme tyto výsledky: Vstupnı́ koncentrace cA1 = konst. V závislosti na hodnotách parametrů rovnic mohou nastat tyto tři přı́pady: a) v reaktoru existuje jeden nestabilnı́ stacionárnı́ stav (cA , T ), od kterého se řešenı́ vzdaluje a po ustálenı́ vznikajı́ trvalé oscilace koncentrace i teploty; b) v reaktoru existujı́ tři stacionárnı́ stavy, jeden nestabilnı́ a dva stabilnı́. V závislosti na počátečnı́ch podmı́nkách směřuje řešenı́ do jednoho ze stabilnı́ch stavů; c) v reaktoru existujı́ tři stacionárnı́ stavy (jeden stabilnı́ a dva nestabilnı́) a jedno stabilnı́ periodické řešenı́. Vstupnı́ koncentrace je časově proměnná. Bude-li vstupnı́ koncentrace cA1 periodicky proměnná, pak mohou vzniknout tři odlišné typy výstupnı́ch průběhů cA a T . Výstup může být periodický, kvaziperiodický (časový průběh vykazuje např. dvě periodicity) nebo chaotický, kdy výstup se zcela nepravidelně měnı́. Z uvedeného přı́kladu je patrno, že i u relativně jednoduchého dvourozměrného nelineárnı́ho systému se setkáváme s celou řadou jevů, které nemohou v lineárnı́ch systémech nastat. V dalšı́ch kapitolách se jimi budeme zabývat podrobněji. Kapitola 2 Základnı́ vlastnosti nelineárnı́ch systémů 2.1 Základnı́ pojmy 1. Autonomnı́ systémy Velké množstvı́ fyzikálnı́ch, chemických, biologických a jiných systémů lze popsat soustavou homogennı́ch obyčejných diferenciálnı́ch rovnic 1. řádu ẋ1 = f1 (x1 , ..., xn ) ẋ2 = f2 (x1 , ..., xn ) ... ẋn = fn (x1 , ..., xn ), (2.1) ve vektorovém zápisu ẋ = f (x), kde fi , i = 1, ..., n jsou reálné funkce n reálných proměnných. Vektor x(t) = (x1 (t), ..., xn (t)) ∈ Rn a f : Rn → Rn je zobrazenı́ třı́dy C r , r ≥ 1. Soustavu (2.1) můžeme interpretovat jako matematický model reálného dynamického systému a pak x(t) je stav tohoto systému. Prostor Rn se nazývá stavový nebo fázový prostor systému (2.1) a zobrazenı́ f lze chápat jako vektorové pole na Rn . Každému bodu x ∈ Rn je přiřazen vektor f (x), který z bodu vycházı́. Tento vektor udává rychlost změny stavu ẋ = dx/dt (fázová rychlost). Mnoho praktických problémů vede na autonomnı́ systém ẋ = f (x), kde f : M → Rn je zobrazenı́ definované na podmnožině M ⊆ Rn . Touto podmnožinou může být nějaká křivka nebo plocha v Rn , obecně diferencovatelná varieta. Některé přı́klady na tyto variety budou uvedeny v dalšı́m textu. Zatı́m můžeme pro jednoduchost předpokládat, že vektorové pole f je definováno v celém prostoru Rn . Řešenı́ diferenciálnı́ rovnice ẋ = f (x) je diferencovatelné zobrazenı́ ϕ : I → Rn intervalu I = {t ∈ R, a < t < b} do stavového prostoru Rn , které pro všechna t ∈ I vyhovuje soustavě d [ϕ(t)] = f (ϕ(t)). dt Pro jednoduchost budeme dále předpokládat, že řešenı́ je definováno pro všechny časy t ∈ R. Protože vektorové pole f nezávisı́ na čase (je invariantnı́ vzhledem k posunutı́ času), můžeme počátečnı́ čas uvažovat vždy rovný nule. Počátečnı́ podmı́nka je pak x(0) = x0 . Zobrazenı́ ϕ(t) ∀t se také nazývá pohyb bodu a jeho znázorněnı́ ve stavovém (fázovém) prostoru je stavová (fázová) trajektorie (fázová křivka, orbita). Součin R × Rn je rozšı́řený stavový prostor, graf řešenı́ v R × Rn je tzv. integrálnı́ křivka. Řešenı́ diferenciálnı́ rovnice s počátečnı́ podmı́nkou x0 vyžaduje tedy nalezenı́ funkce ϕ(t) takové, že křivka x = ϕ(t) ležı́cı́ v Rn a parametrizovaná časem t, procházı́ bodem x0 a má v každém svém bodě x právě f (x) jako tečný vektor. Množina těchto tečných vektorů se nazývá směrové pole. Podobně i integrálnı́ křivka jako graf zobrazenı́ x = ϕ(t) v R × Rn má v každém bodě (t, ϕ(t)) tečnu, jejı́ž sklony vůči osám t, x jsou (1, f (x)). 10 KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 11 Poznámka: V dalšı́m budeme mı́sto obecného označenı́ ϕ(t) psát zjednodušeně x(t) nebo x(t, x0 ). Jsou-li splněny podmı́nky existence a jednoznačnosti, má rovnice ẋ = f (x) jediné řešenı́ vyhovujı́cı́ zadané počátečnı́ podmı́nce x0 . Každým regulárnı́m bodem stavového prostoru procházı́ tedy pouze jedna trajektorie, trajektorie se zde nemohou protı́nat ani se vzájemně dotýkat. Soubor všech řešenı́ x(t) pro všechny možné počátečnı́ podmı́nky lze vyjádřit souhrnným pojmem (fázový) tok Φ vektorového pole f , resp. tok diferenciálnı́ rovnice ẋ = f (x). Tok je zobrazenı́, které přiřazuje danému x0 a danému času t hodnotu řešenı́ x(t), které má jako počátečnı́ stav x0 , tj. Φ(t, x0 ) = x(t) nebo zkráceně Φt = x(t). Pro tok platı́ Φt2 (Φt1 (x0 )) = Φt1 +t2 (x0 ). Známe-li tedy řešenı́ x(t1 ) s počátečnı́m stavem x(t0 ) = x0 , pak řešenı́ x(t2 ) s počátečnı́m stavem x(t1 ) je totožné s řešenı́m x(t1 + t2 ) s počátečnı́m stavem x(t0 ). Trajektorie generované tokem Φ se nikde neprotı́najı́. Diferenciálnı́ rovnice, které majı́ globálnı́ tok, jsou vždy reverzibilnı́ v čase. Objasněme si pojem toku nejprve na jednoduchém lineárnı́m autonomnı́m systému. Systém 1. řádu ẋ = −kx, k > 0, x(0) = x0 , má řešenı́ x(t) = e−kt x0 . Zobrazenı́ Φt : R → R převede stav x0 na stav x(t) v čase t Φt x0 = e−kt x0 ⇒ Φt = e−kt Fázový tok odpovı́dajı́cı́ rovnici ẋ = −kx je tedy e−kt . Podobně u vektorové lineárnı́ rovnice ẋ = Ax je fázový tok Φt = eAt . Z přı́kladů je patrno, že je-li znám tok soustavy, pak jsou známa všechna řešenı́ soustavy x(t) = Φt x0 . U nelineárnı́ch systémů je analytické vyjádřenı́ toku obtı́žné, proto nebudeme otázky existence a určenı́ toku pro danou nelineárnı́ rovnici zkoumat a budeme pouze předpokládat, že jejı́ tok existuje. Při kvalitativnı́ analýze nelineárnı́ch systémů nás zajı́majı́ předevšı́m ustálené stavy, jejich typy a stabilita. U autonomnı́ch systémů mohou být ustálené stavy rovnovážné, periodické nebo kvaziperiodické. Některé nelineárnı́ systémy vykazujı́ chaotické chovánı́. Podrobnějšı́ výklad těchto přı́padů bude podán v čl.2.3 a v některých dalšı́ch kapitolách. Zde si pro ilustraci provedeme jen některé základnı́ úvahy. Problémy reálných dynamických systémů lze formulovat v různé terminologii. Můžeme zůstat u terminologie klasického pojetı́ diferenciálnı́ch rovnic nebo můžeme formulovat problém pomocı́ vektorových polı́ nebo také pomocı́ toků. Jak uvidı́me v dalšı́ch kapitolách lze některé problémy teorie nelineárnı́ch systémů výhodně formulovat v pojmech klasické teorie diferenciálnı́ch rovnic, jindy je výhodnějšı́ využı́t terminologie toků. Mnohé problémy lze zase velmi názorně řešit a zobrazovat pomocı́ vektorových polı́. Analýza nelineárnı́ch dynamických systémů začı́ná nejčastěji určovánı́m rovnovážných stavů a proto si jako přı́klad různých formulacı́ uved’me definici těchto stavů. Definice 2.1. Mějme soustavu diferenciálnı́ch rovnic ẋ = f (x) a necht’ Φt je jejı́ tok. Pak a) bod x ∈ Rn , pro který platı́ f (x) = 0 je singulárnı́ bod soustavy diferenciálnı́ch rovnic (také stacionárnı́ bod nebo stacionárnı́ řešenı́); b) bod x je nulový bod funkce f neboli rovnovážný stav vektorového pole f (x), resp. rovnovážný (klidový) stav dynamického systému popsaného rovnicı́ ẋ = f (x); c) bod x ∈ Rn , pro který platı́ Φt x = x ∀t ∈ R, se nazývá pevný bod toku. Pojmy singulárnı́ bod, stacionárnı́ bod, rovnovážný stav nebo pevný bod se proto často vzájemně zaměňujı́. Kromě rovnovážných stavů mohou u autonomnı́ch systémů od 2. řádu výše existovat uzavřené trajektorie (periodické orbity). Definice 2.2. Periodická orbita γ se základnı́ periodou T > 0 je řešenı́, pro které platı́ x(t) = KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 12 x(t + T ), tj. x(T ) = x(0) a x(t) 6= x(0) pro 0 < t < T . Řešenı́ s počátečnı́ podmı́nkou x(0) ∈ γ je periodické řešenı́ s periodou T . Speciálnı́ přı́pad periodických trajektoriı́ představujı́ homoklinické a heteroklinické trajektorie. Homoklinická trajektorie přı́slušná k rovnovážnému bodu x je trajektorie, která se asymptoticky blı́žı́ k x v čase t → ∞. Je to uzavřená křivka, která z bodu x vycházı́ a zase se do něho vracı́. Čas, který potřebuje fázový bod k oběhu homoklinické trajektorie, je nekonečně velký, rychlost pohybu se v blı́zkosti x blı́žı́ k nule. Homoklinickou orbitu lze chápat jako periodickou trajektorii s nekonečně velkou periodou. Heteroklinická trajektorie mezi dvěma stacionárnı́mi body x1 , x2 je trajektorie, která vycházı́ z jednoho bodu a končı́ ve druhém. Existujı́-li dvě heteroklinické orbity, z bodu x1 do x2 a z x2 do x1 , pak se vytvořı́ smyčka, která zase představuje periodickou orbitu s nekonečně velkou periodou. Obecné trajektorie toku mohou mı́t velmi složité vlastnosti, které budeme podrobněji rozebı́rat v dalšı́ch kapitolách. Zde si uvedeme pouze dva pojmy, které budeme později potřebovat. Definice 2.3. Necht’ Φ je tok soustavy (2.1) a γ je trajektorie procházejı́cı́ bodem x0 . a) Bod y ∈ Rn je ω-limitnı́ bod trajektorie γ, jestliže existuje taková posloupnost reálných čı́sel {tk }∞ k=1 , limk→∞ tk = +∞, že limk→∞ Φ(tk , x0 ) = y. Množina ω(γ) všech ω-limitnı́ch bodů dané trajektorie γ se nazývá ω-limitnı́ množina trajektorie γ. b) Bod z ∈ Rn je α-limitnı́ bod trajektorie γ, jestliže existuje taková posloupnost reálných čı́sel {tk }∞ k=1 , limk→∞ tk = −∞, že limk→∞ Φ(tk , x0 ) = z. Množina α(γ) všech α-limitnı́ch bodů dané trajektorie γ se nazývá α-limitnı́ množina trajektorie γ. Přı́klady: Trajektorie γ, která limituje do rovnovážného bodu x, má množinu svých ω-limitnı́ch bodů jednobodovou, tj. ω(γ) = x. Trajektorie γ, která limituje k uzavřenému meznı́mu cyklu γ, má ω(γ(x0 )) = γ. Každý bod y ∈ γ je ω-limitnı́m bodem trajektorie γ(x0 ). Systém (2.1) se po zadánı́ počátečnı́ podmı́nky bude pohybovat po určité trajektorii k rovnovážnému bodu nebo k periodické orbitě (pokud jsou stabilnı́) nebo k nějakému složitějšı́mu limitnı́mu objektu. Po uplynutı́ dostatečně dlouhého času se fázový bod dostane do blı́zkého okolı́ limitnı́ množiny. Přechodné jevy ztrácejı́ proto svou důležitost ve srovnánı́ s limitnı́ množinou. Proto nás bude zajı́mat předevšı́m asymptotické chovánı́ na těchto limitnı́ch množinách a v jejich blı́zkém okolı́. Limitnı́ objekty majı́ výhodnou vlastnost, kterou je invariantnost vzhledem k toku. Definice 2.4. Invariantnı́ množina S toku Φt je množina S ⊂ Rn , pro kterou platı́ implikace x ∈ S ⇒ Φt (x) ∈ S pro všechna t ∈ R. (Formálně lze také psát Φt (S) = S). Je-li S invariantnı́ množina systému (2.1), pak každá trajektorie, která procházı́ bodem x ∈ S, ležı́ celá v S. Např. rovnovážný stav je jednobodová invariantnı́ množina, každá individuálnı́ trajektorie (tedy i uzavřená trajektorie) je invariantnı́ množina. Invariantnı́ množiny mohou být i vı́cedimenzionálnı́, obecně mohou mı́t i tutéž dimenzi jako stavový prostor. Některé dalšı́ přı́klady budou uvedeny v kap.4. Důležitý typ limitnı́ množiny je atraktor. V literatuře existuje vı́ce definic atraktoru, protože atraktor může být velice komplikovanou množinou. Pro naše účely bude stačit tato definice: Definice 2.5. Uzavřená invariantnı́ množina A ⊂ Rn se nazývá atraktor, existuje-li takové okolı́ U ⊃ A, že pro všechna x ∈ U a pro Φt (x) ∈ U , t ≥ 0 limituje Φt (x) → A pro t → ∞. Množina U se nazývá oblast přitažlivosti atraktoru A. Poznámky: a) Vzhledem k velké složitosti některých atraktorů vyžaduje přesnějšı́ definice, aby v atraktoru exis- KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 13 tovala trajektorie, která jej hustě vyplnı́. Podrobnosti jsou např. v [32]. b) Přı́kladem nejjednoduššı́ch atraktorů jsou stabilnı́ rovnovážné stavy a stabilnı́ uzavřené trajektorie. Složitějšı́ atraktory (např. vı́cerozměrný torus, chaotický atraktor a jiné typy) budou uvedeny v dalšı́ch kapitolách. c) Objem atraktoru ve fázovém prostoru disipativnı́ch systémů je nulový. d) U konzervativnı́ch systémů neexistujı́ atraktory a oblasti přitažlivosti, fázový bod na trajektorii s danou počátečnı́ podmı́nkou se opakovaně navracı́ k původnı́ počátečnı́ podmı́nce. e) Repelor je množina, která má všechny vlastnosti s atraktorem shodné, ale trajektorie na rozdı́l od atraktoru odpuzuje. Při změně orientace času tj. při substituci t = −t se ve stavovém prostoru daného nelineárnı́ho dynamického systému změnı́ všechny atraktory na repelory a naopak. 2. Časově variantnı́ nebuzené systémy jsou popsány rovnicı́ ẋ = f (t, x) x(t0 ) = x0 . (2.2) Chovánı́ těchto systémů závisı́ na počátečnı́m čase t0 , který nemůžeme pokládat vždy za nulový. Základnı́ pojmy uvedené pro autonomnı́ systémy jsou platné i pro (2.2). Rovnovážný stav nastane, jestliže f (t, x) = 0 pro všechna t ≥ t0 . Definice invariantnı́ množiny je stejná jako pro autonomnı́ systémy, na rozdı́l od nich však trajektorie systému (2.2) nenı́ obecně invariantnı́ množinou. Existence a jednoznačnost řešenı́ Než přistoupı́me k vlastnı́mu řešenı́ nelineárnı́ch rovnic typu (2.1) nebo (2.2), je třeba zkoumat otázky existence a jednoznačnosti řešenı́. Rovnice mohou mı́t a) nejméně jedno řešenı́ (problém existence řešenı́); b) právě jedno řešenı́ pro všechny dostatečně malé hodnoty t (lokálnı́ existence a jednoznačnost řešenı́); c) právě jedno řešenı́ pro všechna t v intervalu [0, ∞) (globálnı́ existence a jednoznačnost řešenı́); d) právě jedno řešenı́ pro všechna t v intervalu [0, ∞) a toto řešenı́ závisı́ spojitě na počátečnı́ podmı́nce x0 . Pro praxi je nejvýhodnějšı́ čtvrtý přı́pad, je však známo, že bez určitých omezenı́ na funkci f nenı́ zaručena ani sama existence řešenı́. Z teorie diferenciálnı́ch rovnic jsou známy některé věty o jednoznačnosti a existenci řešenı́, jako je např. Cauchyova existenčnı́ věta, Lipschitzovy podmı́nky apod. Podrobný rozbor lze nalézt např. v [55]. Pro naše dalšı́ účely budeme předpokládat, že funkce f je dostatečně hladká k zajištěnı́ podmı́nek existence a jednoznačnosti řešenı́. 2.2 Metody řešenı́ přechodných jevů nelineárnı́ch systémů Viděli jsme již, že přechodné jevy u nelineárnı́ch systémů se mohou podstatně lišit od přechodných jevů lineárnı́ch systémů a mohou vést ke kvalitativně zcela novým typům chovánı́. Z mnoha metod, které byly vyvinuty pro řešenı́ nelineárnı́ch dynamických systémů uvedeme stručně jen ty, které se použı́vajı́ předevšı́m v regulačnı́ technice. Metody můžeme zhruba rozdělit na analytické, grafické, numerické a metody využı́vajı́cı́ simulace na počı́tačı́ch. 2.2.1 Analytické metody Podstatou analytických metod je integrace diferenciálnı́ rovnice systému. Hlavnı́ význam spočı́vá v tom, že zı́skáme obecné vztahy platné pro všechna řešenı́. a) Aproximace nelineárnı́ charakteristiky tečnou nebo sečnou v pracovnı́m bodě KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 14 Tato metoda nedává pro řešenı́ nelineárnı́ch systémů žádné kvalitativně nové výsledky, protože se jedná o běžnou linearizaci. Aproximace sečnou v určité pracovnı́ oblasti jen někdy lépe nahrazuje skutečnou nelineárnı́ charakteristiku než tečna v určitém pracovnı́m bodě. Linearizace nelineárnı́ch charakteristik se použı́vá nejčastěji tehdy, je-li v systému vı́ce nelinearit, z nichž některé jsou nepodstatné (např. se málo lišı́ od lineárnı́ charakteristiky). Ty je pak vhodné linearizovat a vytvořit pro prvnı́ aproximativnı́ řešenı́ systém s menšı́m počtem nelinearit. b) Aproximace nelineárnı́ charakteristiky přı́mkovými úseky Tato aproximace umožňuje nahradit nelineárnı́ rovnici systému několika lineárnı́mi diferenciálnı́mi rovnicemi, z nichž každá popisuje přechodný jev systému v určitém časovém intervalu, ve kterém se systém nacházı́ na přı́slušném linearizovaném úseku nelineárnı́ charakteristiky. Pro charakteristiky složené z přı́mek (např. reléové charakteristiky) je metoda přesná a proto se někdy jejı́ pomocı́ řešı́ přechodné jevy v jednoduššı́ch nespojitých nelineárnı́ch systémech. U této metody je však mnohdy obtı́žné určenı́ okamžiku přechodu z jedné lineárnı́ diferenciálnı́ rovnice na druhou a stanovenı́ nových počátečnı́ch podmı́nek při přechodu. Analytické řešenı́ okamžiků přepnutı́ vede často na složité transcendentnı́ rovnice, které je nutno řešit na počı́tači. c) Aproximace nelineárnı́ charakteristiky analytickým výrazem Nelinearita v systému je bud’ dána analytickou funkcı́ nebo se vhodnou funkcı́ aproximuje tak, aby vzniklá nelineárnı́ rovnice byla co nejjednoduššı́ a byla analyticky řešitelná. Z teorie diferenciálnı́ch rovnic je ovšem známo, že analyticky lze řešit jen málo typů nelineárnı́ch rovnic. Jsou to některé speciálnı́ typy rovnic 1.řádu např. rovnice Riccatiova, Lagrangeova, Clairautova nebo rovnice, které umožňujı́ řešenı́ metodou separace proměnných [6,18]. V regulačnı́ technice se této možnosti využije jen zřı́dka, častěji lze nelineárnı́ rovnice analyticky řešit v jednoduchých chemických, fyzikálnı́ch nebo biologických systémech. Analytické metody se častěji použı́vajı́ např. v radiotechnice pro teoretické řešenı́ modulace, detekce apod., a v teorii elektrických obvodů. Je-li nelineárnı́ funkce spojitá a má potřebný počet spojitých derivacı́, můžeme ji v okolı́ pracovnı́ho bodu vyjádřit MacLaurinovou nebo Taylorovou řadou, ze které vezmeme vhodný počet členů. Jedná se tedy o náhradu nelineárnı́ funkce y = f (x) mnohočlenem y = a0 + a1 x + a2 x2 + ... + an xn . Velmi často se použı́vá náhrada kvadratickou funkcı́ y = a0 + a1 x + a2 x2 nebo kubickou parabolou, např. ve tvaru y = a0 + a1 x − a3 x3 pro vyjádřenı́ charakteristik typu nasycenı́. Elektronické i mechanické prvky se často charakterizujı́ i jinými funkcemi, např. exponenciálnı́mi, goniometrickými apod. Přı́klad 2.1. Při modelovánı́ jednoduchých chemických reakcı́ dostáváme nelineárnı́ diferenciálnı́ rovnice, přičemž některé z nich lze řešit analyticky. Např. jednoduchá reakce druhého řádu k A + B −→ C spočı́vá v tom, že smı́šenı́m látek A a B dojde k jednosměrné reakci, při nı́ž vzniká výsledná látka C. Tento přı́pad lze modelovat jednoduchou nelineárnı́ diferenciálnı́ rovnicı́, která je analyticky řešitelná. Označme okamžité hodnoty koncentracı́ látek malými pı́smeny a, b, c. Uvažujme počátečnı́ hodnoty koncentracı́ a0 , b0 , c0 a látkovou bilanci a + c = a0 + c0 , b + c = b0 + c0 . Reakci lze popsat rovnicemi da db = = −kab dt dt dc = kab dt (2.3) KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 15 Obr.2.1. Průběh koncentracı́ u reakce 2.řádu. Zvolı́me-li pro jednoduchost např. c0 = 0, pak dc = kab = k(a0 − c)(b0 − c) dt Rozložı́me na částečné zlomky a integrujeme Z Z Z 1 dc dc − = kdt a0 − b0 b0 − c a0 − c (2.4) (2.5) Po integraci dostaneme kt = 1 b0 (a0 − c) ln a0 − b0 a0 (b0 − c) (2.6) Pro hledanou závislost koncentrace c na čase upravı́me na tvar c= a0 b0 (1 − e−(a0 − b0 )kt ) a − b e−(a0 − b0 )kt 0 (2.7) 0 Volı́me-li např. počátečnı́ hodnoty a0 = 1; b0 = 0, 5; c0 = 0 a k = 1, dostaneme vztah c= 0.5(1 − e−0.5t ) 1 − 0.5e−0.5t (2.8) Z látkové bilance lze zı́skat průběhy koncentracı́ a(t) a b(t). Všechny průběhy jsou zakresleny na obr. 2.1. 2.2.2 Metody malého parametru Jsou to přibližné analytické metody, které jsou rozšı́řeny zejména ve fyzice a radiotechnice. Použı́vajı́ se pro systémy, ve kterých se nelineárnı́ charakteristika nějakého prvku přı́liš nelišı́ od lineárnı́. Takový systém je blı́zký lineárnı́mu a někdy se nazývá kvazilineárnı́. Řešenı́ se hledá tak, že systém se nejprve řešı́ jako lineárnı́ a zı́skaný výsledek se zpřesňuje pomocı́ korekčnı́ch členů ve tvaru mocninných řad. Např. u nelineárnı́ diferenciálnı́ rovnice typu ẍ + ω02 x + µf (x, ẋ) = 0, kde µ < 1 je malý parametr, KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 16 hledáme řešenı́ ve tvaru x(t) = x0 (t) + µx1 (t) + µ2 x2 (t) + ... Člen x0 (t) je řešenı́m lineárnı́ rovnice ẍ + ω02 x = 0. Metody malého parametru lze použı́t i pro systémy s časově proměnnými parametry, jsou-li změny pomalé, nelze však jimi řešit systémy, u nichž se nelineárnı́ charakteristiky značně lišı́ od lineárnı́ch průběhů nebo kdy charakteristiky jsou nespojité. Z metod malého parametru jsou nejznámějšı́: a) metoda amplitudy s pomalou změnou (Van der Polova metoda) b) metoda perturbacı́ (Poincaréova metoda) Protože metody malého parametru jsou velmi pracné a nejsou rozšı́řeny v regulačnı́ technice, nebudeme se jimi podrobněji zabývat. 2.2.3 Grafické a graficko-analytické metody Před rozvojem počı́tačového modelovánı́ se použı́valo pro řešenı́ nelineárnı́ch diferenciálnı́ch rovnic mnoho grafických metod a metod použı́vajı́cı́ch nomogramy. Všechny tyto metody ztratily svůj význam a nebudeme je podrobněji rozvádět. Grafické znázorněnı́ trajektoriı́ ve stavovém (fázovém) prostoru se ovšem využı́vá velmi často, zejména u systémů druhého a třetı́ho řádu. Zakreslenı́ celého pole trajektoriı́ dává velmi rychlý názor na chovánı́ nelineárnı́ho systému při různých počátečnı́ch podmı́nkách. To je výhodné zejména u systémů druhého řádu, kdy pole trajektoriı́ ležı́ ve fázové rovině. Protože na diferenciálnı́ rovnice 2. řádu vede mnoho praktických aplikacı́, je znalost fázových portrétů velmi důležitá. Fázové trajektorie u 2. řádu lze nakreslit poměrně jednoduchou grafickou konstrukcı́, dnes se to však již neprovádı́, protože pole trajektoriı́ rychle a přesně generuje a zakreslı́ počı́tač při použitı́ vhodné simulačnı́ metody. Je však stále ještě užitečné seznámit se s jednoduchou grafickou metodou vhodnou pro zakreslenı́ fázové trajektorie, jednak pro rychlou orientačnı́ kontrolu výsledku z počı́tače a jednak pro zı́skánı́ určitého názoru na závislosti jednotlivých proměnných a času, kterým je parametrizována fázová trajektorie. Jednou z několika metod použitelných pro grafické zakreslenı́ fázové trajektorie je metoda tečen. Jejı́ princip si můžeme ukázat na jednoduché, ale často se v aplikacı́ch vyskytujı́cı́ diferenciálnı́ rovnici 2. řádu typu ẍ + g(ẋ) + f (x) = 0. Substitucı́ x = x1 , ẋ = x2 převedeme uvedenou rovnici na soustavu dvou rovnic 1. řádu ẋ1 = x2 ẋ2 = −g(x2 ) − f (x1 ). (2.9) Dělı́me-li druhou rovnici prvnı́ rovnicı́, zı́skáme popis systému ve tvaru dx2 −g(x2 ) − f (x1 ) = dx1 x2 (2.10) Tato rovnice vyjadřuje vztah pro směrnici tečny fázové trajektorie v rovině (x1 , x2 ). Velikost směrnice je dána pravou stranou, která musı́ být splněna v každém bodě fázové trajektorie. Grafická konstrukce spočı́vá tedy v tom, že v každém bodě fázové roviny sestrojujeme graficky tečnu podle vztahu (2.10). V rovině (x1 , x2 ) vyneseme ve stejném měřı́tku křivky x1 = −g(x2 ) a x2 = f (x1 ) (obr. 2.2). Element tečny v libovolně zvoleném bodě A zı́skáme takto: sestrojı́me rovnoběžky s osami, hodnotu funkce f (x1 ) pro x1 bodu A (úsečka a) naneseme na rovnoběžku s osou x1 tak, aby konec této úsečky padl na vertikálnı́ osu. Zı́skáme bod 1. Hodnota x1 v bodě A je záporná, hodnota f (x1 ) je rovněž záporná, podle vztahu (2.10) je tedy −f (x1 ) kladná úsečka 1-4. Od nı́ odečteme hodnotu −g(x2 ), která je na obrázku reprezentována úsečkou b. Zı́skáme bod 2. Úsečka 1-2 tedy představuje grafický rozdı́l −f (x1 ) − g(x2 ). Spustı́me-li z bodu 2 kolmici na vodorovnou osu, zı́skáme trojúhelnı́k 1-2-3, jehož jedna odvěsna představuje čitatel a druhá jmenovatel KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 17 Obrázek 2.1: Metoda tečen pravé strany vztahu (2.10). Kolmice na přeponu tohoto trojúhelnı́ka udává směr tečny v bodě A (sestrojı́me element tečny v bodě 1 a rovnoběžně posuneme do bodu A). Při praktické konstrukci nahrazujeme element tečny krátkým obloučkem ∆s opsaným kružı́tkem z bodu 3’. Abychom dosáhli vyhovujı́cı́ přesnosti metody, volı́me délku obloučku dostatečně malou (při středovém úhlu ∆ε asi 0,1 až 0,2 rad). Na elementu tečny zvolı́me dalšı́ bod B a konstrukci opakujeme. Tak je možno velmi rychle zakreslit část fázové trajektorie vycházejı́cı́ ze zvoleného počátečnı́ho stavu A. Tato trajektorie nenı́ ovšem ještě ocejchována časem, který je parametrem na trajektorii. Existujı́ však jednoduché vztahy mezi časem a elementem oblouku fázové trajektorie [7]. Čas odpovı́dajı́cı́ jednotlivým polohám zastupujı́cı́ho bodu je možno určit různými způsoby. Pro praktickou potřebu však stačı́ vztah udávajı́cı́ závislost mezi délkou oblouku fázové trajektorie a přı́růstkem času na tomto oblouku. Lze odvodit, že ∆ε = k∆t, kde ∆t je přı́růstek času na elementu trajektorie opsaném při středovém úhlu ∆ε a konstanta k rozměru s−1 je rovna jedné, jsou-li na obou osách fázové roviny zvolena stejná měřı́tka. Pro určité zvolené ∆t můžeme tedy při vynášenı́ fázové trajektorie provádět současně jejı́ kótovánı́ časem pomocı́ zvoleného úhlu ∆ε. 2.2.4 Numerické metody Složité nelineárnı́ systémy nelze řešit ani analyticky ani graficky a je třeba použı́t vhodné numerické metody. Běžné jsou klasické numerické metody, z nichž se nejčastěji použı́vajı́ metody Runge-Kutta a jejich modifikace. Programy těchto metod jsou běžným vybavenı́m čı́slicových počı́tačů. Kromě klasických metod byly vyvinuty také speciálnı́ metody, které použı́vajı́ různých odlišných způsobů numerické integrace, např. metody časových řad, metody odvozené ze Z-transformace a jiné. V regulačnı́ technice se prakticky nepoužı́vajı́. Podrobný rozbor numerických metod nepatřı́ do této přehledné publikace a lze ho nalézt ve speciálnı́ch monografiı́ch. KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 2.2.5 18 Simulace nelineárnı́ch systémů na počı́tačı́ch Složité nelineárnı́ systémy je výhodné modelovat na analogových, čı́slicových nebo hybridnı́ch počı́tačı́ch a to zejména v tom přı́padě, jestliže je třeba ověřovat chovánı́ systému při různých počátečnı́ch podmı́nkách, při různých hodnotách parametrů, při změně struktury systému nebo při návrhu vhodného řı́zenı́ nelineárnı́ho systému. V současnosti se modelovánı́ a simulace provádı́ nejčastěji na čı́slicovém počı́tači s využitı́m speciálnı́ch programů. Ze simulátorů blokových diagramů snad nejznámějšı́ a předevšı́m v akademické oblasti nejvı́ce využı́vaný je systém SIMULINK. Je to speciálnı́ programový balı́k pro simulaci dynamických lineárnı́ch i nelineárnı́ch systémů se soustředěnými parametry, který rozšiřuje známý počı́tačový software MATLAB. Z méně často použı́vaných programů lze uvést např. systém PSI (simulačnı́ program university v holandském Delftu) nebo systém SIMNON (simulačnı́ program švédského Technologického institutu v Lundu). Hojně použı́vaný je také System Build (Integrated Systems Inc.). Ten některými svými vlastnostmi převyšuje SIMULINK a je výhodný zejména při modelovánı́ složitých systémů se spojitými i diskrétnı́mi prvky. Má také samostatný editor pro práci s logickými obvody. Je využı́ván spı́še v průmyslových aplikacı́ch. Simulačnı́ jazyky pro širšı́ využitı́ jak ve výzkumu tak i v průmyslu jsou např. ACSL a Desire. Objektově orientované jazyky pro modelovánı́ jsou např. Omola nebo Dymola, které použı́vajı́ algoritmy pro manipulaci se symbolickými formulemi. Základnı́ přehled o různých simulačnı́ch jazycı́ch i o programech pro návrh regulačnı́ch systémů lze nalézt v [44]. Řešenı́ složitých nelineárnı́ch systémů umožňuje pouze simulace na počı́tačı́ch, která má ovšem kromě velkých výhod také značnou nevýhodu v tom, že většinou neposkytuje obecná řešenı́. Před simulacı́ je proto třeba určit hodnoty rovnovážných stavů, zjistit možnosti existence periodických řešenı́, různých typů bifurkacı́ apod. S těmito předchozı́mi znalostmi je pak simulace na počı́tačı́ch mnohem jednoduššı́, protože již vı́me, co asi můžeme od systému očekávat a jaké oblasti parametrů a počátečnı́ch podmı́nek máme volit. Metody simulacı́ a praktická práce s programovými soubory MATLAB a SIMULINK jsou náplnı́ cvičenı́ k tomuto předmětu. 2.3 2.3.1 Ustálené stavy nelineárnı́ch systémů Autonomnı́ nelineárnı́ systémy U autonomnı́ch nelineárnı́ch systémů mohou být ustálené stavy rovnovážné, periodické nebo kvaziperiodické. 1. Rovnovážné stavy se nazývajı́ také klidové stavy nebo v jiné terminologii stacionárnı́ stavy vektorového pole f , singulárnı́ body diferenciálnı́ rovnice ẋ = f (x) nebo pevné body toku. Systém může mı́t libovolný počet rovnovážných stavů a každý z nich může být stabilnı́ nebo nestabilnı́ (vyšetřovánı́ jejich stability bude provedeno v dalšı́ch kapitolách). Rovnovážný stav je reprezentován bodem ve stavovém prostoru a budeme jej označovat symbolem x (jinak se v literatuře použı́vá také označenı́ xe , xeq , x0 , x0 apod.). V rovnovážném stavu jsou všechny derivace ẋ nulové, vektorové pole vymizı́, takže rovnovážný stav určı́me, položı́me-li ẋ = 0. Tı́m zı́skáme soustavu algebraických nebo transcendentnı́ch rovnic f (x) = 0 a reálná řešenı́ této soustavy určı́ existujı́cı́ rovnovážné stavy. Toto řešenı́ je však mnohdy složité a často je třeba využı́t počı́tače. a) Analytické řešenı́ je možné v jednoduchých přı́padech při malém počtu rovnic. Přı́klad 2.2. Je zadán systém ẋ1 = −x2 − x31 ẋ2 = x1 − x32 . KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 19 Položı́me-li derivace rovny nule, pak z prvnı́ rovnice x2 √ = −x31 . Dosazenı́m do druhé pravé strany dostaneme x1 (1 + x81 ) = 0. Kořeny této rovnice jsou x1 = 0 a x1 = 8 −1. Dosazenı́m do Moivreova vztahu √ n a= p n ρejϕ = √ n ρ (cos ϕ + 2kπ ϕ + 2kπ + j sin ) n n zjistı́me, že všechny kořeny rovnice 1 + x81 = 0 jsou komplexnı́. Zadaný systém má tedy jen jeden rovnovážný stav pro x1 = 0 a x2 = 0. b) Grafické řešenı́ je někdy výhodné, zejména u systémů 2. řádu. Viděli jsme v předchozı́m přı́kladu, že bylo třeba řešit rovnici 1 + x81 = 0 pomocı́ složitého Moivreova vzorce. Nakreslı́me-li grafy funkcı́ x31 = −x2 a x32 = x1 (stačı́ odhad z několika bodů), vidı́me, že se protı́najı́ pouze v počátku souřadnic, tedy v jediném rovnovážném stavu (0,0). Přı́klad 2.3. Ukažte, že systém ẋ1 = a1 x1 − b1 x31 + c1 x2 ẋ2 = a2 x2 − b2 x32 + c2 x1 má v závislosti na velikosti parametrů a, b, c jeden, tři, pět nebo devět rovnovážných stavů. c) Numerické řešenı́ je nezbytné při složitějšı́ch algebraických nebo transcendentnı́ch rovnicı́ch nebo při simultánnı́m řešenı́ většı́ho počtu rovnic. V literatuře jsou k dispozici různé numerické metody, výhodné je použı́t metod v programech MAPLE, Mathematica nebo MATLAB. V posledně jmenovaném jsou např. programyfsolve a fsolve2 (v toolboxu OPTIM), které řešı́ nelineárnı́ algebraické rovnice a soustavy těchto rovnic metodou nejmenšı́ch čtverců, nebo program fzero (v toolboxu MATLAB/ FUNFUN), který hledá nuly funkce jedné proměnné. 2. Periodická řešenı́ nebo periodické ustálené stavy se u nelineárnı́ch autonomnı́ch systémů nazývajı́ samobuzené kmity nebo autooscilace a mohou být stabilnı́ nebo nestabilnı́. Ve stavovém prostoru jsou reprezentovány izolovanými uzavřenými trajektoriemi, kterým řı́káme limitnı́ nebo meznı́ cykly. Systém může mı́t jeden nebo vı́ce periodických ustálených stavů a zjišt’ovánı́ jejich existence a stability je již značně obtı́žné. Těmito problémy se budeme zabývat v kap. 10. Na obr. 2.3 jsou pro ilustraci zakresleny limitnı́ cykly pro systém 2.řádu. U stabilnı́ho cyklu (obr.2.3a) směřujı́ trajektorie z blı́zkého okolı́ k tomuto cyklu, u nestabilnı́ho (obr.2.3b) se na obou stranách od cyklu vzdalujı́. U polostabilnı́ho cyklu (obr.2.3c) se trajektorie z jedné strany přibližujı́ a z druhé vzdalujı́. Tento cyklus je pouze teoretickou hranicı́ při splynutı́ dvou cyklů (stabilnı́ho a nestabilnı́ho), kdy periodické řešenı́ systému bud’ vzniká nebo zaniká. Řešenı́ x(t) je periodické, platı́-li x(t) = x(t + T ) pro všechna t a nějakou minimálnı́ periodu T > 0. Periodické řešenı́ lze rozložit do Fourierovy řady, která má základnı́ složku s frekvencı́ 1/T a vyššı́ harmonické s frekvencemi k/T, k = 2, 3, ... Amplituda některých těchto spektrálnı́ch složek může být nulová (nebo velmi malá), protože nelineárnı́ systém může podstatně filtrovat některé harmonické. Přı́klad 2.4. Van der Polův oscilátor, velmi často použı́vaný pro demonstraci nelineárnı́ch problémů, je popsán rovnicemi ẋ1 = x2 ẋ2 = ε(1 − x21 )x2 − x1 (2.11) Namodelovánı́m na počı́tači zjistı́me, že systém má jeden rovnovážný stav v počátku a jedno stabilnı́ periodické řešenı́, jehož tvar závisı́ na parametru ε (obr. 2.4). 3. Kvaziperiodická řešenı́ vznikajı́ u autonomnı́ch obvodů pouze vzácně a proto si jejich vlastnosti ukážeme až u systémů neautonomnı́ch. 4. Chaotické chovánı́ . Některé nelineárnı́ systémy nedosáhnou v čase t → ∞ ustáleného chovánı́, ale trvale měnı́ nepravidelným způsobem (chaoticky) svoje stavové proměnné. Chovánı́ je podobné náhodnému, ale systém je popsán striktně deterministicky a neuvažuje se nejistota ani ve vstupu ani v modelu systému. Proto se tento typ chovánı́ nazývá deterministický chaos. Chaotické chovánı́ je ohraničené, nenı́ periodické, podobá se náhodnému. Je vysoce citlivé na změnu počátečnı́ch podmı́nek, KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 20 Obrázek 2.2: Typy limitnı́ch cyklů: a) stabilnı́, b) nestabilnı́, c) polostabilnı́ i při nepatrné změně se odezvy po určité době značně lišı́. Dlouhodobé chovánı́ nelze tedy spolehlivě predikovat. U autonomnı́ch systémů se spojitým časem může chaos nastat od 3. řádu výše (u neautonomnı́ch již od 2.řádu). Chaotické chovánı́ bylo pozorováno u nejrůznějšı́ch systémů, např. v hydrodynamice (turbulence), v atmosférické dynamice, ve vázaných chemických soustavách, v biologických systémech (v populačnı́ dynamice, neurobiologii), v elektrických obvodech a také v regulačnı́ technice. Podrobnějšı́ vlastnosti chaosu a přı́klady systémů s chaotickým chovánı́m budou uvedeny v samostatné kapitole 12. 2.3.2 Neautonomnı́ nelineárnı́ systémy Neautonomnı́ systémy mohou být nebuzené t-variantnı́ ẋ = f (t, x) nebo buzené t-invariantnı́ ẋ = f (x, u) nebo buzené t-variantnı́ ẋ = f (t, x, u). 1. Rovnovážné stavy mohou nastat u časově variantnı́ho systému ẋ = f (t, x), platı́-li f (t, x) = 0 ∀t ≥ t0 . Např. systém ẋ1 = x1 − x2 + x21 + x22 sin t ẋ2 = x1 + x2 − 2x1 x2 e−t má rovnovážný stav (0, 0). Klidové stavy buzených systémů ẋ = f (x, u) při konstantnı́m vstupu nazýváme stacionárnı́ stavy. Z obecnějšı́ho pohledu jsou buzené systémy uzavřené (nikoliv již izolované) systémy, které umožňujı́ výměnu energie s okolı́m. Jako přı́klad může sloužit kyvadlo, na jehož osu působı́ konstantnı́ vnějšı́ moment M a jehož dynamika je popsána systémem ẋ1 = x2 ẋ2 = −k1 x2 − k2 sin x1 + M, kde x1 je úhel vychýlenı́ kyvadla od vertikálnı́ osy a x2 jeho úhlová rychlost. Stacionárnı́ stav je pak dán vztahem k2 sin x1 = M . 2. Periodická řešenı́ mohou být u buzených nelineárnı́ch obvodů velmi rozmanitá. Budı́me-li nelineárnı́ systém např. harmonickým signálem s periodou T , bude na výstupu signál, který může obsahovat různé vyššı́ harmonické (ultraharmonické kmity). Často se však na výstupu objevujı́ také tzv. subharmonické kmity, kdy perioda výstupu je násobkem budı́cı́ periody T . Tyto jevy nemohou nastat u lineárnı́ch systémů. KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 21 Jako přı́klad může sloužit třeba Duffingova rovnice ẋ2 = x1 − x1 3 − ax2 + b cos ωt. ẋ1 = x2 (2.12) Např. pro a = 0, 15; b = 0, 3; ω = 1 (T = 6, 28) je na výstupu periodická funkce, jejı́ž prvnı́ harmonická má úhlovou frekvenci ω = 1 a existujı́ liché vyššı́ harmonické, jejichž amplituda rychle klesá. Pro a = 0, 22 naskočı́ 3. subharmonická s periodou T = 3.6, 28. Neautonomnı́ systém n-tého řádu ẋ = f (t, x) s periodickým ustáleným řešenı́m s periodou T můžeme vždy transformovat na autonomnı́ systém řádu (n+1), zavedeme-li dalšı́ stavovou proměnnou xn+1 = 2π t = ωt. T (2.13) Autonomnı́ systém je pak dán rovnicemi ẋ = f (x, xn+1 T ) 2π x(0) = x0 x ∈ Rn (2.14) 2π 2π =ω xn+1 (0) = t0 = ωt0 . (2.15) T T Perioda nové stavové proměnné xn+1 je 2π. Vzhledem k tomuto periodickému chovánı́ můžeme řešenı́ xn+1 omezit na interval 0 ≤ xn+1 < 2π. Stavový prostor Rn+1 lze pak transformovat na válcový stavový prostor Rn × S, kde S je kružnice. Použitı́m transformace (2.13) můžeme tedy výsledky studia autonomnı́ho systému aplikovat na časově periodický neautonomnı́ systém. ẋn+1 = Poznámka: Neperiodický neautonomnı́ systém může být také převeden na autonomnı́ systém pomocı́ transformace (2.13) s nějakou zvolenou periodou T > 0 (můžeme zvolit např. xn+1 = t). Řešenı́ bude však nutně neohraničené (xn+1 → ∞ pro t → ∞) a mnoho výsledků pro asymptotické chovánı́ autonomnı́ch systémů nelze pak použı́t. 3. Kvaziperiodická řešenı́ mohou vzniknout, když dvě nebo vı́ce periodických funkcı́ interagujı́ nelineárně. Jako přı́klad můžeme použı́t opět Van der Polův oscilátor, který v nebuzeném přı́padě vykazuje autooscilace s periodou T1 (obr 2.4). Přidáme-li nynı́ vnějšı́ harmonický budı́cı́ signál, dostaneme systém ẋ1 = x2 ẋ2 = ε(1 − x21 )x2 − x1 + A cos (2πt/T2 ). (2.16) Řešenı́ buzeného systému může být synchronizováno s nějakým násobkem vstupnı́ periody T2 a vznikne subharmonické kmitánı́, tj. periodický ustálený stav. Při konfliktu mezi T1 a T2 nemusı́ však také žádná perioda zvı́tězit a vzniknou kvaziperiodické kmity. Na obr. 2.5 je zakresleno kvaziperiodické kmitánı́ Van der Polova oscilátoru ve fázové rovině (x = x1 , y = x2 )[24]. Trajektorie jsou rovnoměrně distribuovány v prstencové (anulárnı́) oblasti, kterou hustě vyplňujı́. Kvaziperiodické řešenı́ x(t) lze vyjádřit součtem periodických řešenı́ x(t) = X hi (t), (2.17) i kde každé hi (t) lze rozložit ve Fourierovu řadu s prvnı́ harmonickou o frekvenci fi a s periodou Ti = 1/fi . Dále existuje množina základnı́ch frekvencı́ {fˆ1 , ..., fˆp } s těmito vlastnostmi: a) množina je lineárně nezávislá, tj. neexistuje nenulová množina konstant taková, aby platilo ˆ k1 f1 + ... + kp fˆp = 0, b) pro každé i platı́ fi = k1 fˆ1 + ... + kp fˆp pro nějaké konstanty {k1 , ..., kp }. KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ Obrázek 2.3: Nebuzený Van der Polův oscilátor 22 Obrázek 2.4: Buzený Van der Polův oscilátor Kvaziperiodické kmitánı́ je tedy tvořeno součtem periodických kmitů, jejichž frekvence je dána různými součty nebo rozdı́ly konečné množiny základnı́ch frekvencı́. Kvaziperiodické kmitánı́ s počtem p základnı́ch frekvencı́ se nazývá p-periodické. Nejjednoduššı́ přı́pad je dvouperiodické kmitánı́ x(t) = h1 (t) + h2 (t), kde periody T1 a T2 jsou nesoudělné, jejich podı́l je tedy iracionálnı́. Spektrum takového kmitánı́ se skládá ze dvou množin harmonických se základnı́mi frekvencemi k/T1 a k/T2 , k = 1, 2, ... Přı́kladem dvouperiodických kmitů jsou amplitudová a fázová modulace, kde dvě periodické funkce spolu interagujı́ nelineárně. Přı́kladem dynamického systému s kvaziperiodickým chovánı́m je výše uvedený Van der Polův oscilátor. Z obr. 2.5 je patrno, že dvouperiodická trajektorie ležı́ na množině, která je difeomorfnı́m zobrazenı́m dvourozměrného toru v trojrozměrném prostoru (obr. 2.6). Protože trajektorie je křivka a dvojrozměrný torus je plocha, neležı́ každý bod toru na trajektorii. Lze ale ukázat, že při dlouhodobém řešenı́ procházı́ trajektorie body, které ležı́ libovolně blı́zko od každého bodu na toru. Torus tedy představuje limitnı́ množinu kvaziperiodického chovánı́ a je prvnı́m přı́kladem limitnı́ množiny, která nenı́ jednoduchou křivkou. U dynamických systémů vyššı́ho řádu mohou také vzniknou kvaziperiodická řešenı́ vyššı́ch řádů, a jejich trajektorie vyplňujı́ množiny, které jsou difeomorfnı́ k vı́cerozměrnému toru (K-torus). Obrázek 2.5: Torus v trojrozměrném prostoru Obrázek 2.6: Chaos u Duffingova oscilátoru 4. Chaotické chovánı́ se může objevovat u neautonomnı́ch systémů se spojitým časem již od KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ 23 druhého řádu. Např. u parametricky buzeného oscilátoru ẍ + aẋ + b(1 + c cos ωt) sin x = 0 působı́ na kyvadlo periodická vnějšı́ sı́la, např. periodicky se pohybuje závěs kyvadla. Při určitých hodnotách parametrů systému vzniká chaotické chovánı́. Podobně např. u Duffingova oscilátoru, popsaného rovnicı́ (2.12), vzniká při vhodných podmı́nkách chaos (obr.2.7). Dalšı́ přı́klady budou uvedeny v kap. 12. Kapitola 3 Stabilita - základnı́ pojmy a definice Stabilita nelineárnı́ch systémů je velmi komplexnı́ pojem, který se zcela odlišuje od běžného pojetı́ stability u lineárnı́ch systémů. Stabilita lineárnı́ho systému je dána strukturou systému a nezávisı́ ani na jeho okamžitém stavu ani na vstupnı́ch signálech. Autonomnı́ lineárnı́ systém ẋ = Ax s regulárnı́ maticı́ A má jeden rovnovážný stav, který je stabilnı́ nebo nestabilnı́. Pro nelineárnı́ systémy existuje velké množstvı́ definic stability. Je to dáno tı́m, že nelineárnı́ systém má různé typy ustálených stavů a velkou variabilitu v chovánı́. Mnohé definice stability jsou proto speciálnı́ a majı́ omezené použitı́. Všimneme si tedy pouze některých nejdůležitějšı́ch definic, předevšı́m těch, které se týkajı́ ljapunovské a asymptotické stability. 3.1 Stabilita rovnovážného stavu volného systému V tomto článku budeme uvažovat volný časově variantnı́ nelineárnı́ systém ẋ = f (t, x), (3.1) kde f : R+ × Rn → Rn je spojitá funkce. Předpokládejme, že (3.1) má jednoznačné řešenı́ při každé počátečnı́ podmı́nce x(t0 ) = x0 . To bude např. tehdy, jestliže f splňuje globálnı́ Lipschitzovu podmı́nku. Dále budeme předpokládat, že systém (3.1) má stacionárnı́ řešenı́ x, pro které platı́ f (t, x) = 0 pro všechna t ≥ t0 . Promı́tneme-li graf řešenı́ z rozšı́řeného prostoru R+ ×Rn do stavového prostoru Rn , odpovı́dá stacionárnı́ řešenı́ jednobodové trajektorii x, tj. rovnovážnému stavu systému (3.1) a graf každého řešenı́ se promı́tne na trajektorii ve stavovém prostoru. Vyšetřovánı́ stability řešenı́ můžeme tedy převést na vyšetřovánı́ stability rovnovážného stavu x v prostoru Rn . Definice 3.1. Rovnovážný stav x systému (3.1) je (ljapunovsky ) stabilnı́, jestliže pro každé ε > 0 a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna řešenı́ s počátečnı́ podmı́nkou x0 vyhovujı́cı́ vztahu ||x0 − x|| < δ a pro všechna t ≥ t0 platı́ ||x(t; t0 , x0 − x|| < ε. (3.2) Poznámka: Za normu ||.|| volı́me obvykle euklidovskou normu, definovanou např. pro ||x|| předpisem ||x|| = q (x21 + x22 + ... + x2n ) Pak ||x|| < ε představuje sférickou oblast (vnitřek n-rozměrné hyperkoule), kterou budeme stručně označovat také Bε (podobně Bδ ). Definice 3.1 řı́ká, že rovnovážný stav je stabilnı́, jestliže po malém vychýlenı́ z tohoto stavu zůstane trajektorie systému v ε okolı́ rovnovážného stavu. Geometrická interpretace je znázorněna na obr. 24 KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 25 3.1. Definice 3.1 se týká jen chovánı́ v blı́zkém okolı́ rovnovážného stavu (tzv. stabilita v malém, mı́stnı́ (lokálnı́) stabilita), protože nevı́me předem, jak velké δ bude odpovı́dat zvolenému ε. Podle této definice nemusı́ trajektorie systému v čase t → ∞ konvergovat do rovnovážného stavu, ale může setrvávat libovolně blı́zko. Netlumený lineárnı́ systém druhého řádu popsaný rovnicı́ ẍ + ω02 x = 0 je proto také stabilnı́ ve smyslu této definice. Obr.3.1 Abychom v dalšı́m zjednodušili různé definice stability, budeme předpokládat, že rovnovážný stav systému je v počátku. Pokud má systém izolovaný rovnovážný stav jinde, je vždy možno lineárnı́ transformacı́ souřadnic tento stav do počátku posunout. Bez ztráty obecnosti budeme tedy předpokládat, že f (t, 0) = 0, ∀t ≥ t0 . Definici 3.1 můžeme pak přeformulovat na tvar: Definice 3.2. Rovnovážný stav 0 soustavy (3.1) je (ljapunovsky) stabilnı́, jestliže pro každé ε > 0 a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna řešenı́ s počátečnı́ podmı́nkou x0 vyhovujı́cı́ vztahu ||x0 || < δ a pro všechna t ≥ t0 platı́ ||x(t; t0 , x0 || < ε. (3.3) Rovnovážný stav je nestabilnı́, jestliže nenı́ stabilnı́ ve smyslu uvedené definice. Definice 3.3. Rovnovážný stav 0 je kvaziasymptoticky stabilnı́ (nebo také atrahujı́cı́ či konvergentnı́), jestliže pro jakékoliv t0 ∈ R+ existuje takové čı́slo δ1 (t0 ) > 0, že každé řešenı́ systému (3.1) vyhovujı́cı́ podmı́nce ||x0 || < δ1 konverguje k počátku pro t → ∞, tj. lim x(t; t0 , x0 ) = 0. t→∞ Pro kvaziasymptotickou stabilitu je nutné, aby rovnovážný stav byl izolovaný, to znamená, aby existovalo takové jeho okolı́, které neobsahuje žádné jiné rovnovážné stavy. To je v kontrastu s pojetı́m ljapunovské stability, které lze aplikovat i na rovnovážné stavy, které nejsou izolované. Definice 3.4. Rovnovážný stav 0 je asymptoticky stabilnı́, jestliže je ljapunovsky stabilnı́ a zároveň kvaziasymptoticky stabilnı́. Definice 3.5. Rovnovážný stav je neutrálně stabilnı́, je-li stabilnı́ dle definice 3.2 a nenı́ asymptoticky stabilnı́. V mnoha technických aplikacı́ch je asymptotická stabilita ještě nepostačujı́cı́ a je třeba vědět, jak rychle se řešenı́ blı́žı́ k rovnovážnému stavu. K tomuto účelu lze použı́t pojmu exponenciálnı́ stabilita. Definice 3.6. Rovnovážný stav 0 je exponenciálně stabilnı́, jestliže existujı́ takové konstanty r, α, λ > 0 nezávislé na volbě řešenı́, že ||x(t; t0 , x0 )|| ≤ α||x0 || exp −λt ∀ t ≥ t0 , t0 ≥ 0 (3.4) KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 26 pro všechna ||x0 || < r. Definice 3.6 řı́ká, že stavový vektor u exponenciálně stabilnı́ho rovnovážného stavu konverguje k počátku rychleji než nějaká exponenciálnı́ funkce. Kladné čı́slo λ se často nazývá rychlost exponenciálnı́ konvergence. Přı́klad 3.1. Systém ẋ = −(1 + sin2 t)x konverguje exponenciálně k hodnotě x = 0 s rychlostı́ λ = 1. Řešenı́ systému je Z t 2 x(t) = x(0)exp − [1 + sin τ ]dτ 0 a proto |x(t)| ≤ |x(0)|e . Pro libovolné t je plocha pod funkcı́ (1 + sin2 t) většı́ než t a proto e−t klesá pomaleji. −t Exponenciálnı́ stabilita je současně asymptotickou stabilitou, opačně to však neplatı́. Např. systém ẋ = −x2 , x(0) = 1 má řešenı́ x = 1/(1 + t) a tato funkce klesá pomaleji než jakákoliv exponenciálnı́ funkce e−λt pro λ > 0. Stejnoměrná stabilita Předchozı́ definice ljapunovské a asymptotické stability neautonomnı́ch systémů ukazujı́ na závažný vliv volby počátečnı́ho času. V praxi je obvykle žádoucı́, aby systém měl určitou stejnoměrnost ve svém chovánı́ bez ohledu na volbu počátečnı́ho času. To je podnětem k zavedenı́ pojmu stejnoměrná stabilita a stejnoměrná asymptotická stabilita. Definice 3.7. Rovnovážný stav 0 je stejnoměrně (ljapunovsky) stabilnı́, jestliže je ljapunovsky stabilnı́ podle definice 3.2 a čı́slo δ nezávisı́ na volbě počátečnı́ho okamžiku t0 . Rovnovážný stav je stejnoměrně kvaziasymptoticky stabilnı́, jestliže δ1 v definici 3.3 nezávisı́ na t0 a všechna řešenı́ se blı́žı́ k počátku stejnoměrně. Poznámka: Stejnoměrná konvergence nastává, jestliže pro každé ε > 0 existuje takové čı́slo T (ε), že ||x0 || < δ1 , ∀t0 ∈ R+ ⇒ ||x(t; t0 , x0 )|| < ε, ∀t > t0 + T (ε). Rovnovážný stav je stejnoměrně asymptoticky stabilnı́, jestliže je stejnoměrně stabilnı́ a stejnoměrně kvaziasymptoticky stabilnı́. Jestliže je rovnovážný stav stejnoměrně asymptoticky stabilnı́, je i asymptoticky stabilnı́. Opak však obecně neplatı́, jak je patrno z tohoto přı́kladu. Systém 1.řádu ẋ = −x/(1 + t) má obecné řešenı́ x(t) = 1 + t0 x(t0 ). 1+t Toto řešenı́ konverguje asymptoticky k nule, ale konvergence nenı́ stejnoměrná, protože při zvětšujı́cı́m se t0 potřebuje řešenı́ stále delšı́ čas k dosaženı́ stejné vzdálenosti od počátku. Globálnı́ stabilita. Všechny dosud uvedené definice charakterizujı́ lokálnı́ chovánı́ systému při malých výchylkách počátečnı́ho stavu od rovnováhy. Určenı́ skutečné oblasti stability je velmi obtı́žné a budeme se tı́mto problémem zabývat v kap.5. Pro praxi je nejvýhodnějšı́ zjištěnı́, že rovnovážný stav je globálně stabilnı́, tj. stabilnı́ při všech počátečnı́ch podmı́nkách. To ovšem předpokládá, že systém má pouze jeden rovnovážný stav. Definice 3.8. Je-li rovnovážný stav asymptoticky nebo exponenciálně stabilnı́ při všech počátečnı́ch podmı́nkách x0 ∈ Rn , je globálně asymptoticky nebo exponenciálně stabilnı́. U časově invariantnı́ho volného systému (tj. autonomnı́ho systému) ẋ = f (x) nezávisı́ chovánı́ na volbě počátečnı́ho času. Všechny předchozı́ definice zůstávajı́ v platnosti s tı́m, že čı́slo δ nezávisı́ na volbě počátečnı́ho okamžiku t0 a je pouze funkcı́ ε. Je-li tedy rovnovážný stav 0 autonomnı́ho systému ljapunovsky stabilnı́, je současně stejnoměrně ljapunovsky stabilnı́ apod. Důkaz těchto tvrzenı́ lze nalézt např. v [55]. KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 27 V uvedených definicı́ch stability jsme definovali stabilitu stavů systému. Podobným způsobem bychom mohli definovat i stabilitu výstupu systému. Může nastat situace, že nestabilnı́ složky stavu se na výstupu neprojevı́. Potom je systém na výstupu stabilnı́, i když nenı́ žádný stabilnı́ rovnovážný stav. Je-li systém pozorovatelný, pak každá složka stavu se projevı́ na výstupu a stabilita stavu a výstupu splývá. Těmito problémy se budeme zabývat při návrhu exaktnı́ch linearizacı́ v kap. 15. 3.2 Stabilita pohybu volného systému Tento typ stability se týká vzájemné polohy dvou řešenı́, z nichž jedno je nominálnı́ řešenı́ zkoumané z hlediska stability a druhé je perturbované řešenı́ se změněnou počátečnı́ podmı́nkou x(0) = x1 . Nominálnı́ řešenı́ bude zřejmě stabilnı́, jestliže při malé změně počátečnı́ podmı́nky zůstane perturbované řešenı́ dostatečně blı́zko k řešenı́ nominálnı́mu. Tuto intuitivnı́ představu stability libovolného řešenı́ budeme nynı́ formulovat přesněji. Definice 3.9. Řešenı́ x(t; t0 , x0 ) soustavy ẋ = f (t, x) je stabilnı́, jestliže pro každé ε > 0 a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna t ≥ t0 a pro ||x0 − x1 || < δ je ||x(t; t0 , x0 ) − x(t; t0 , x1 || < ε. (3.5) Vidı́me, že definice je velmi podobná definici 3.1 pro stabilitu rovnovážného stavu. Proto lze snadno transformovat i ostatnı́ definice z čl. 3.1 na stabilitu pohybu. Tyto nové definice však nenı́ ani třeba vytvářet, protože problém stability pohybu lze vždy redukovat přı́mo na ekvivalentnı́ problém stability rovnovážného stavu jiného dynamického systému. Předpokládejme, že chceme vyšetřovat stabilitu řešenı́ y(t) soustavy ẏ = g(t, y) při počátečnı́ podmı́nce y 0 . Proved’me perturbaci řešenı́ volbou blı́zké počátečnı́ podmı́nky v 0 = y 0 + x0 . Řešenı́ odpovı́dajı́cı́ této nové počátečnı́ podmı́nce v0 je v(t) a platı́ rovnice v̇ = g(t, v). Odchylka od původnı́ho řešenı́ je x(t) = v(t) − y(t), dynamické chovánı́ této odchylky je dáno neautonomnı́ diferenciálnı́ rovnicı́ ẋ(t) = v̇(t) − ẏ(t) = g(t, v) − g(t, y) = g(t, y + x) − g(t, y). (3.6) Označı́me-li f (t, x) = g(t, y + x) − g(t, y), dostaneme z původnı́ soustavy rovnice pro odchylku ẋ = f (t, x) f (t, 0) = 0. (3.7) Tato soustava má triviálnı́ (tj. nulové) řešenı́ a jeho vlastnosti můžeme vyšetřovat na základě definic uvedených v čl. 3.1. Závěry o stabilitě můžeme pak přenést pomocı́ zavedené transformace y = v − x na řešenı́ y(t) zadané soustavy. Perturbačnı́ dynamika (3.7) je neautonomnı́ a to i v přı́padě, že původnı́ vyšetřovaný systém je autonomnı́ ẏ = g(y), protože na pravé straně (3.7) se vyskytuje nominálnı́ trajektorie. Každé dı́lčı́ nominálnı́ trajektorii autonomnı́ho systému tedy odpovı́dá ekvivalentnı́ neautonomnı́ systém. Stabilita limitnı́ch cyklů autonomnı́ch systémů. Často se vyšetřuje stabilita pohybu podél uzavřené trajektorie systému, např. stabilita limitnı́ho cyklu autonomnı́ho systému. K tomu účelu můžeme použı́t definice 3.9, kterou upravı́me pro autonomnı́ systém. Zavedeme poruchovou trajektorii γ1 , která je blı́zká k limitnı́mu cyklu γ (obr. 3.2) a vyšetřı́me, zda bod P1 zůstává při pohybu trvale ve zvolené oblasti Bε , která obsahuje oblast Bδ . Bod P obı́há po limitnı́m cyklu a současně se pohybuje bod P1 po poruchové trajektorii γ1 . S oběma body se pohybujı́ i obě oblasti. Zůstane-li pro t > t0 bod P1 stále v oblasti Bε , je meznı́ cyklus ljapunovsky stabilnı́. Podle definice 3.9 je tedy třeba, aby nejen poruchová trajektorie γ1 zůstávala v blı́zkém okolı́ γ, ale aby také pohyb zastupujı́cı́ch bodů na γ a γ1 měl stejnou periodu. Např. perioda kmitů matematického KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE 28 kyvadla závisı́ na amplitudě kmitánı́. Takový systém je v podstatě stabilnı́, ale nenı́ stabilnı́ podle definice 3.9. Podobně je tomu u družice pohybujı́cı́ se v kruhové dráze kolem Země. Při malé poruše bude obı́hat např. po dráze velmi blı́zké, ale s jinou periodou. Pro praktické určenı́ stability je v těchto přı́padech definice 3.9 přı́liš přı́sná a pro stabilitu limitnı́ch cyklů je vhodná definice tzv. orbitálnı́ stability. Obr.3.2. Stabilita limitnı́ho cyklu Definice 3.10. Orbitálnı́ stabilita. Limitnı́ cyklus γ je orbitálně stabilnı́, jestliže pro libovolné ε > 0 existuje δ(ε) > 0 takové, že každá trajektorie vycházejı́cı́ v čase t0 z bodu vzdáleného méně než δ(ε) od γ zůstává ve vzdálenosti menšı́ než ε od γ. Každý limitnı́ cyklus, který je stabilnı́ ve smyslu Ljapunova, je také orbitálně stabilnı́, opačně to však již obecně neplatı́. Pro limitnı́ cyklus můžeme definovat také asymptotickou orbitálnı́ stabilitu, při nı́ž γ1 → γ pro t → ∞. Stabilitou periodických řešenı́ se budeme podrobněji zabývat v kap. 10. 3.3 Jiné typy stability Doposud jsme se zabývali pouze definicemi stability rovnovážného stavu a stability pohybu nebuzeného systému. Důležité je ovšem také určit, zda stav systému bude stabilnı́, jestliže přivedeme na vstup nějaký signál. Dále nás bude z praktického hlediska zajı́mat, zda při ohraničeném vstupnı́m signálu bude také ohraničený výstup systému. K řešenı́ těchto problémů musı́me definovat tzv. stabilitu vstup-výstup, kterou se budeme podrobněji zabývat v kap. 8. Všechny dosud uvedené definice stability se týkaly dynamických systémů zadaných diferenciálnı́mi rovnicemi s pevně určenými parametry. Důležité je ovšem také studovat stabilitu z hlediska změny těchto parametrů. Uvidı́me později, že při malých změnách hodnot parametrů docházı́ často k velmi odlišnému chovánı́ systému, měnı́ se počet rovnovážných stavů a jejich stabilita, vznikajı́ nebo zanikajı́ periodická řešenı́ apod. K postiženı́ těchto jevů budeme v kap.4 definovat tzv. strukturálnı́ stabilitu. Existuje ještě mnoho jiných definic různých typů stability, s některými se setkáme při řešenı́ speciálnı́ch problémů v dalšı́ch kapitolách. Kapitola 4 Ljapunovova metoda linearizace V předchozı́ kapitole jsme uvedli různé definice stability nelineárnı́ch systémů, ty však nejsou obvykle přı́liš vhodné pro praktické výpočty. Budeme proto potřebovat metody, které by umožnily rychlé určenı́ stability. V této kapitole se budeme zabývat řešenı́m lokálnı́ stability rovnovážných stavů nelineárnı́ch systémů pomocı́ linearizace systému v blı́zkém okolı́ těchto rovnovážných stavů. Tento způsob řešenı́ vypracoval A.M. Ljapunov a nazývá se prvnı́ Ljapunovova metoda. Je to formalizace intuitivnı́ představy, že za určitých předpokladů se bude nelineárnı́ systém při malých odchylkách od rovnovážného stavu chovat podobně jako jeho lineárnı́ aproximace. Výsledkem linearizace jsou soustavy lineárnı́ch diferenciálnı́ch rovnic, pomocı́ jejichž vlastnostı́ pak posuzujeme vlastnosti vyšetřovaného nelineárnı́ho systému. Proto si v dalšı́m článku shrneme nejprve základnı́ výsledky řešenı́ lineárnı́ch diferenciálnı́ch rovnic s důrazem na geometrické představy daných řešenı́. 4.1 4.1.1 Lineárnı́ systémy Lineárnı́ autonomnı́ systémy Budeme uvažovat lineárnı́ autonomnı́ systém ẋ = Ax, x(0) = x0 . (4.1) Tento systém má jeden rovnovážný stav v nule, je-li A regulárnı́ a nekonečně mnoho rovnovážných stavů, jestliže A je singulárnı́. Obecné řešenı́, které je dostatečně známo z teorie diferenciálnı́ch rovnic a z teorie lineárnı́ch řı́dı́cı́ch systémů, má tvar x(t) = eAt x0 , (4.2) kde fundamentálnı́ matice eAt se nazývá také tokem vektorového pole Ax. Pro exaktnı́ analytické řešenı́ je třeba znát vlastnı́ čı́sla matice A. Ta se určı́ z charakteristické rovnice det(A − λI) = a11 − λ a12 a21 a22 − λ ... ... an1 an2 ... a1n ... a2n ... ... ... ann − λ = 0. (4.3) Úpravou dostaneme algebraickou rovnici n-tého stupně an λn + an−1 λn−1 + ... + a1 λ + a0 = 0. (4.4) Kořeny této charakteristické rovnice jsou vlastnı́ čı́sla matice A. Ta mohou být reálná nebo komplexnı́ a jednonásobná nebo vı́cenásobná. 29 KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 30 a) reálná, jednonásobná vlastnı́ čı́sla Necht’ všechna vlastnı́ čı́sla λ1 , ..., λn jsou reálná a různá. Označme r 1 , ..., r n pravé vlastnı́ vektory matice A (sloupcové vektory) a q 1 , ..., q n levé vlastnı́ vektory (řádkové vektory). Jsou-li vlastnı́ čı́sla matice A různá, jsou levé a pravé vlastnı́ vektory navzájem ortogonálnı́. Vlastnı́ vektory vypočteme ze vztahů Ar i = λi r i q i A = q i λi i = 1, ..., n. (4.5) Obecné řešenı́ systému (4.1) je x(t) = n X ki r i eλi t , (4.6) i=1 kde ki jsou konstanty závislé na počátečnı́ch podmı́nkách. Členy r i eλi t se nazývajı́ módy dynamického systému. Směr módu je ve stavovém prostoru určen vlastnı́m vektorem r i , časový průběh módu je dán vlastnı́m čı́slem λi . Vlastnı́ vektory odpovı́dajı́cı́ záporným vlastnı́m čı́slům vytvářejı́ stabilnı́ podprostor E s , jehož dimenze je dána počtem záporných vlastnı́ch čı́sel. Podobně počet kladných vlastnı́ch čı́sel udává dimenzi nestabilnı́ho podprostoru E u , je-li nulové vlastnı́ čı́slo, existuje centrálnı́ podprostor E c , jehož dimenze dim E c = 1. Při počátečnı́ podmı́nce na vlastnı́m vektoru probı́há řešenı́ na tomto vektoru, při počátečnı́ podmı́nce v rovině určené dvěma vlastnı́mi vektory zůstane řešenı́ v této rovině atd. Lineárnı́ transformace y = Q−1 x vede na ẏ = Q−1 ẋ = Q−1 Ax = Q−1 AQy = AJ y tj. ẏi = λi yi i = 1, ..., n. Zavedenı́m nových souřadnic dostáváme tedy řešenı́, které je zbaveno vzájemné vazby proměnných yi (t) = eλi t yi (0) i = 1, ..., n. (4.7) Transformačnı́ matice Q, transformujı́cı́ původnı́ stavové rovnice systému do Jordanova kanonického tvaru, je po sloupcı́ch tvořena vlastnı́mi pravými vektory matice A. Jordanova matice AJ je diagonálnı́ matice tvořená vlastnı́mi čı́sly původnı́ matice A a vlastnı́ vektory Jordanovy matice jsou navzájem ortogonálnı́. b) komplexnı́, jednonásobná vlastnı́ čı́sla Protože matice A je reálná, musı́ při komplexnı́m vlastnı́m čı́sle µ = α + jω být také komplexně sdružené vlastnı́ čı́slo µ∗ = α − jω. Vlastnı́ vektory r + js jsou také komplexnı́. Pro n = 2 a dvě komplexně sdružená vlastnı́ čı́sla je Jordanova matice −1 AJ = Q AQ = " α + jω 0 0 α − jω # také komplexnı́, ale lze ji převést na reálnou normálnı́ formu " α −ω ω α # Řešenı́ diferenciálnı́ rovnice lze pak psát ve tvaru x(t) = " x1 (t) x2 (t) # = eαt [(k1 r + k2 s) cos ωt + (k2 r − k1 s) sin ωt] , KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 31 kde k1 , k2 jsou konstanty závislé na počátečnı́ch podmı́nkách. Má-li matice A vı́ce dvojic komplexně sdružených vlastnı́ch čı́sel, lze Jordanovu matici převést na tvar, který má v diagonále bloky rozměru 2x2, z nichž každý odpovı́dá jednomu páru komplexně sdružených vlastnı́ch čı́sel. Původnı́ diferenciálnı́ rovnice je tak převedena na nezávislé dvoudimenzionálnı́ dı́lčı́ rovnice. Podobně bychom mohli řešit lineárnı́ systémy, které majı́ reálná násobná nebo komplexně sdružená násobná vlastnı́ čı́sla. Má-li vlastnı́ čı́slo násobnost p, pak jeho odpovı́dajı́cı́ blok v Jordanově matici je řádu p. Podrobný rozbor je např. v [26]. Z teorie lineárnı́ch systémů je známo, že: a) rovnovážný stav 0 systému (4.1) je asymptoticky stabilnı́ právě tehdy, když všechna vlastnı́ čı́sla matice A majı́ záporné reálné části; b) rovnovážný stav 0 je (neutrálně) stabilnı́ právě tehdy, když A nemá vlastnı́ čı́sla s kladnou reálnou částı́ a vlastnı́ čı́sla s nulovou reálnou částı́ odpovı́dajı́ Jordanovým blokům řádu jedna; c) rovnovážný stav 0 je nestabilnı́, jestliže A má bud’ alespoň jedno vlastnı́ čı́slo s kladnou reálnou částı́ nebo vlastnı́ čı́slo s nulovou reálnou částı́, které odpovı́dá Jordanovu bloku s řádem většı́m než jedna. Invariantnı́ podprostory. Z předchozı́ch odstavců je patrno, že vhodnou transformacı́ souřadnic lze matici A, která má nenásobná vlastnı́ čı́sla λ1 , ..., λr , µ1 , µ∗1 , ..., µm , µ∗m , r + 2m = n převést na Jordanův kanonický tvar s jednorozměrnými a dvourozměrnými bloky v diagonále. Prostor Rn můžeme pak rozložit na jednorozměrné podprostory (pro reálná vlastnı́ čı́sla) a dvourozměrné podprostory (pro komplexnı́ vlastnı́ čı́sla) Rn = E1 ⊕ ... ⊕ Er ⊕ F1 ⊕ ... ⊕ Fm , kde dim Ei = 1, i = 1, ..., r a dim Fj = 2, j = 1, ..., m a symbol ⊕ značı́ součet algebraických struktur. Prostor Rn je tedy přı́mým ortogonálnı́m součtem invariantnı́ch jedno- a dvoudimenzionálnı́ch podprostorů. Průběh trajektoriı́ lze pak v souřadnicı́ch odpovı́dajı́cı́ch Jordanovu tvaru zı́skat superpozicı́ jednodimenzionálnı́ch a dvoudimenzionálnı́ch pohybů. V přı́padě násobných vlastnı́ch čı́sel je nutno provést rozloženı́ Rn do invariantnı́ch podprostorů vyššı́ dimenze, která dosahuje maximálně hodnoty násobnosti reálných resp. dvojnásobné hodnoty násobnosti komplexnı́ch vlastnı́ch čı́sel. Podprostor, který je vytvořen všemi vlastnı́mi vektory odpovı́dajı́cı́mi vlastnı́m čı́slům se zápornou (kladnou, nulovou) reálnou částı́ se nazývá stabilnı́ invariantnı́ podprostor E s (nestabilnı́ E u , centrálnı́ E c ). Rozměr podprostorů je ns , nu , nc , součet jejich rozměrů je roven n. Řešenı́ v E s klesajı́ exponenciálně (monotonně nebo oscilačně) k nule, řešenı́ v E u exponenciálně rostou (monotonně nebo oscilačně), řešenı́ v E c zůstávajı́ konstantnı́ nebo oscilujı́. V dalšı́ch článcı́ch uvidı́me, že znalosti fázových portrétů lineárnı́ch diferenciálnı́ch rovnic 1., 2. a 3. řádu nám dávajı́ představu o fázových portrétech v blı́zkém okolı́ rovnovážných stavů nelineárnı́ch systémů. Protože fázové portréty systémů 1.řádu jsou velmi jednoduché, všimneme si jen lineárnı́ch systémů 2. a 3. řádu. Lineárnı́ systém 2. řádu lze zapsat např. ve tvaru ẍ + 2aω0 ẋ + ω02 x = 0 nebo po zavedenı́ nových proměnných x = x1 a ẋ = x2 ve tvaru ẋ1 = x2 ẋ2 = −2aω0 x2 − ω02 x1 , 2 kde a je poměrné tlumenı́ a ω0 vlastnı́ frekvence √ netlumeného systému. Charakteristická rovnice λ + 2 2 2aω0 λ + ω0 = 0 má kořeny λ1,2 = ω0 (−a ± a − 1). Rovnovážný stav je v bodě (0,0) a v závislosti KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 32 na hodnotách parametrů a, ω0 se nazývá střed, uzel (stabilnı́ nebo nestabilnı́), ohnisko (stabilnı́ nebo nestabilnı́) a sedlo (vždy nestabilnı́). Odpovı́dajı́cı́ rozloženı́ kořenů charakteristické rovnice pro tyto přı́pady a fázové portréty jsou uvedeny v tab. 4.1. Na obr. 4.1 je zakreslen diagram parametrů a oblasti stability. Stabilnı́ rovnovážné stavy ležı́ pouze v prvnı́m kvadrantu tohoto diagramu. Lineárnı́ systém 2. řádu v obecnějšı́m tvaru lze vyjádřit rovnicemi ẋ1 = a11 x1 + a12 x2 ẋ2 = a21 x1 + a22 x2 (4.8) Označı́me-li zápornou stopu −(a11 + a22 ) matice A pı́smenem σ a determinant (a11 a22 − a12 a21 ) symbolem ∆, pak kořeny charakteristické rovnice jsou λ1,2 σ =− ± 2 s σ2 − ∆. 4 Řešenı́ závisı́ opět jen na dvou parametrech σ a ∆, odpovı́dajı́cı́ diagram parametrů je zakreslen na obr. 4.2. Parabola oddělujı́cı́ ohniska a uzly má rovnici σ 2 = 4∆. Vertikálnı́ osa je hranicı́ mezi sedlem a uzlem a body této osy ∆ = 0 představujı́ tzv. vı́cenásobné singulárnı́ body (např. uzel - sedlo). Obrázek 4.1: Diagram parametrů pro systém 2.řádu Obrázek 4.2: Diagram pro systém (4.8) Lineárnı́ systém 3. řádu má charakteristickou rovnici Jejı́ diskriminant je λ3 + aλ2 + bλ + c = 0. (4.9) D = (9c − ab)2 − (6b − 2a2 )(6ac − 2b2 ). (4.10) Přı́pad 1: D < 0 , kořeny λ1 , λ2 , λ3 jsou reálné a) je-li c < 0 mohou nastat tyto dı́lčı́ přı́pady: λ1 , λ2 , λ3 > 0 singulárnı́ bod je nestabilnı́ uzel; λ1 > 0; λ2 , λ3 < 0 sedlo b) je-li c > 0, pak: λ1 , λ2 , λ3 > 0 stabilnı́ uzel; λ1 > 0; λ2 , λ3 < 0 sedlo c) je-li c = 0, pak: λ1 = 0; λ2 , λ3 6= 0 uzel nebo sedlo. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 33 Tab. 4.1. Lineárnı́ systém 2. řádu Přı́pad 2: D = 0, kořeny λ1 , λ2 , λ3 jsou reálné. Existuje jeden dvojnásobný kořen a vznikajı́ podobné typy singulárnı́ch bodů jako u přı́padu 1. Pro c = 0 se charakteristická rovnice (4.10) redukuje na tvar λ(λ2 + aλ + b) = 0 D = 3b2 (4b − a2 ) = 0. Jestliže b 6= 0 je 4b − a2 = 0. Kořeny jsou λ1 = 0; λ2 = λ3 = −a/2. Pro a > 0 je proto singulárnı́ bod stabilnı́, pro a < 0 nestabilnı́. Jestliže b = 0, a 6= 0, pak λ1 = λ2 = 0 a λ3 = −a. Singulárnı́ bod je stabilnı́ pro a > 0. Přı́pad 3: D > 0, jeden kořen λ1 je reálný, λ2 , λ3 jsou komplexně sdružené. Pro c < 0 musı́ být tedy λ1 > 0, pro c = 0λ1 = 0 a pro c > 0 je λ1 < 0. V každém z těchto třı́ přı́padů vznikajı́ ještě tři KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 34 dalšı́ možnosti: Re(λ2 , λ3 ) > 0 Re(λ2 , λ3 ) = 0 Re(λ2 , λ3 ) < 0. Jestliže Re(λ2 , λ3 ) = 0, singulárnı́ bod je střed (stabilnı́ nebo nestabilnı́ podle znaménka λ1 ). U systémů třetı́ho řádu vznikajı́ již komplikované tvary trajektoriı́ kolem singulárnı́ch bodů a typy singularit se označujı́ v některých přı́padech smı́šenými názvy, např. uzel-ohnisko, ohnisko-sedlo apod. 4.1.2 Lineárnı́ časově variantnı́ systémy Uvažujme volný časově variantnı́ systém ẋ = A(t)x, (4.11) kde maticová funkce A(t) je typu (n,n), časově závislá a spojitá pro všechna t ≥ 0. Základnı́ vlastnosti tohoto systému jsou známy z přednášek o teorii lineárnı́ch systémů. Rovnovážný stav systému je v nule a je izolovaný, jestliže A(t) je regulárnı́ pro t ≥ 0. Matice X(t, t0 ), složená po sloupcı́ch z n lineárně nezávislých řešenı́ systému (4.11) se nazývá fundamentálnı́ matice. Je regulárnı́ pro všechna t a splňuje maticovou rovnici Ẋ(t, t0 ) = A(t)X(t, t0 ). Každé řešenı́ systému (4.11) je lineárnı́ funkcı́ n nezávislých řešenı́. Jestliže X 1 (t, t0 ) a X 2 (t, t0 ) jsou dvě fundamentálnı́ matice systému (4.11), pak existuje regulárnı́ konstantnı́ matice M , pro kterou platı́ X 1 (t, t0 )M = X 2 (t, t0 ). Stavová matice přechodu Φ(t, t0 ) je normovaná fundamentálnı́ matice s počátečnı́ hodnotou Φ(t0 , t0 ) = I. Je definována vztahem Φ(t, t0 ) = X(t, t0 )X −1 (t0 , t0 ). (4.12) Řešenı́ systému (4.11) lze pomocı́ stavové matice přechodu vyjádřit ve tvaru x(t; t0 , x0 ) = Φ(t, t0 )x(t0 ) (4.13) Analytický výraz pro Φ lze zı́skat jen u některých typů rovnic. Věta 4.1. Nulové řešenı́ systému (4.11) je stabilnı́ právě tehdy, když existuje takové M (t0 ), že platı́ ||Φ(t, t0 )|| ≤ M (t0 ) ∀t ≥ t0 ≥ 0. (4.14) Podobně lze definovat stejnoměrnou a asymptotickou stabilitu. Jejich spojenı́m s větou 4.1 pak platı́ věta Věta 4.2. Nulové řešenı́ systému (4.11) je stejnoměrně asymptoticky stabilnı́ právě když a) existuje takové M < ∞, nezávislé na t0 , že ||Φ(t, t0 )|| ≤ M ∀t ≥ t0 ; b) je splněna podmı́nka lim ||Φ(t, t0 )|| = 0 t→∞ stejnoměrně v t0 . To znamená, že pro libovolné ε > 0 existuje takové T (ε) nezávislé na t0 , že ||Φ(t, t0 )|| < ε pro všechna t ≥ t0 + T a všechna t0 ≥ 0. (Důkazy vět jsou např. v [55]). Podmı́nky stability podle vět 4.1 a 4.2 vyžadujı́ znalost fundamentálnı́ matice a tı́m i úplné množiny nezávislých řešenı́. Uvedené věty majı́ proto jen omezený význam, protože fundamentálnı́ matici lze spočı́tat jen u jednoduššı́ch systémů. Někdy je však zadaný systém ve speciálnı́m tvaru, který umožňuje stabilitu snadněji určit. Je to např. systém uvedený v dalšı́ větě. Věta 4.3. Lineárnı́ systém ẋ = [A+B(t)]x se nazývá systém s asymptoticky konstantnı́mi koeficienty, jestliže limt→∞ ||B(t)|| = 0. Nulové řešenı́ tohoto systému je asymptoticky stabilnı́, jestliže matice A má pouze vlastnı́ čı́sla se zápornou reálnou částı́. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 35 Periodické systémy Uvažujme soustavu diferenciálnı́ch rovnic s periodickými koeficienty x ∈ Rn , ẋ = A(t)x (4.15) kde prvky matice A(t) jsou funkce spojité na intervalu (−∞, ∞) a periodické s periodou T > 0, takže platı́ A(t + T ) = A(t). Také pro stavovou matici přechodu platı́ Φ(t + T, t0 ) = Φ(t, t0 ). Definujme před dalšı́mi úvahami o vlastnostech periodických systémů dvě pomocné věty. Věta 4.4. (Floquetova věta). Fundamentálnı́ matici soustavy (4.15) lze vyjádřit ve tvaru X(t, 0) = P (t)eRt , (4.16) kde X(t, 0) je fundamentálnı́ matice normovaná pro t = 0, prvky matice P (t) jsou spojitě diferencovatelné funkce periodické s periodou T , matice P (t) je regulárnı́, P (0) = I a R je konstantnı́ matice [55]. Věta 4.5. Pro každou regulárnı́ matici B existuje taková matice R, že platı́ B = exp(R). Definujme matici C vztahem C = Φ−1 (t, 0)Φ(t + T, 0). (4.17) C je konstantnı́ matice a je regulárnı́, protože je součinem dvou regulárnı́ch matic. Podle věty 4.5 lze volit matici R tak, že platı́ C = exp(RT ). Definujme dále matici P (t) jako P (t) = Φ(t, 0)e−Rt . (4.18) P (t) je regulárnı́, protože je součinem dvou regulárnı́ch matic, a je periodická, nebot’ platı́ P (t + T ) = Φ(t + T, 0)e−Rt e−RT = Φ(t, 0)Ce−RT e−Rt = P (t). (4.19) Pro t = 0 je P (0) = I a z periodičnosti P (t) vyplývá, že P (kT ) = I. Řešenı́ x(t; 0, x0 ) soustavy (4.15) lze pomocı́ stavové matice přechodu zapsat ve tvaru x(t; 0, x0 ) = Φ(t, 0)x0 = P (t)eRt x0 . (4.20) x(T ; 0, x0 ) = Φ(T, 0)x0 = P (T )eRT x0 = eRT x0 . (4.21) C = eRT = Φ(T, 0) (4.22) Pro t = T je Matice se nazývá matice monodromie, vlastnı́ čı́sla matice monodromie jsou (charakteristické) multiplikátory ρi i = 1, ..., n soustavy (4.15). Vlastnı́ čı́sla matice R jsou tzv. charakteristické (nebo Floquetovy) exponenty µi soustavy (4.15). Z lineárnı́ teorie je známo, že det[Φ(t, t0 )] = exp Z t tr(A)dt , (4.23) t0 kde tr(A) je stopa matice A. Z rovnic (4.22) a (4.23) pak vyplývá, že n Y i=1 ρi = exp Z t t0 tr(A)dt . (4.24) KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 36 Matice P , C, R jsou definovány pomocı́ stavové matice přechodu a neexistuje obecná metoda jejich výpočtu. Mohou být ale zı́skány numerickou integracı́ systému (4.15) po dobu periody T . Pro stabilitu rovnovážného stavu 0 systému (4.15) pak platı́ tato věta [55]. Věta 4.6. Rovnovážný stav 0 systému (4.15) je stejnoměrně asymptoticky stabilnı́, platı́-li pro všechny multiplikátory |ρi | < 1. Rovnovážný stav je stejnoměrně stabilnı́, platı́-li pro všechny multiplikátory |ρi | ≤ 1 a jsou-li multiplikátory s hodnotou |ρi | = 1 jednoduché nuly minimálnı́ho polynomu matice monodromie. Věta 4.7. Systém (4.15) má periodické řešenı́ s periodou T právě tehdy, má-li matice monodromie vlastnı́ čı́slo +1. Přı́klad 4.1. [55] Je dán periodický systém (4.15), jehož matice A je A(t) = " −1 + a cos2 t 1 − a sin t cos t −1 − a sin t cos t −1 + a sin2 t # . Dosazenı́m do zadané rovnice lze ověřit, že Φ(t, 0) = " exp [(a − 1)t] cos t exp [−t] sin t − exp [(a − 1)t] sin t exp [−t] cos t # . Perioda T daného systému je 2π a matice monodromie je Φ(2π, 0) = " exp [2(a − 1)π] 0 0 exp [−2π] # . Vlastnı́ čı́sla této matice jsou exp [2(a − 1)π] a exp [−2π]. Jestliže a > 1, pak prvnı́ vlastnı́ čı́slo je většı́ než jedna, a rovnovážný stav 0 je podle věty 4.6 nestabilnı́. Z přı́kladu je patrno, že stabilita neautonomnı́ho obvodu nemůže být určena přı́mo z vlastnı́ch čı́sel matice A(t) pro každý pevný čas t. Vlastnı́ čı́sla matice A(t) jsou v našem přı́kladu nezávislá na t a lze je stanovit z charakteristické rovnice λ2 + (2 − a)λ + (2 − a) = 0. Z nı́ vyplývá, že A(t) by bylo stabilnı́ pro a < 2, což odporuje předchozı́mu výsledku. 4.2 Prvnı́ Ljapunovova metoda pro nelineárnı́ systémy 4.2.1 Lokálnı́ stabilita rovnovážných stavů autonomnı́ch systémů V tomto článku budeme pomocı́ Ljapunovovy metody linearizace určovat lokálnı́ stabilitu rovnovážných stavů (stabilitu v malém). Uvažujme nejprve autonomnı́ nelineárnı́ systém ẋ = f (x) a jeho libovolný rovnovážný stav x = (x̄1 , x̄2 , ..., x̄n ). Předpokládejme dále, že funkce f = (f1 , f2 , ..., fn ) je spojitá a spojitě diferencovatelná v bodě x. Rozvedeme f v Taylorovu řadu kolem x. Protože v rovnovážném stavu je f (x) = 0, dostaneme při zanedbánı́ členů vyššı́ho řádu vztahy d ∂f1 ∂f1 (x1 − x̄1 ) = (x1 − x̄1 ) + ... + (xn − x̄n ) dt ∂x1 x ∂xn x .. . d ∂fn ∂fn (xn − x̄n ) = (x1 − x̄1 ) + ... + (xn − x̄n ) dt ∂x1 x ∂xn x nebo v maticovém tvaru d (x − x) = A(x − x), dt (4.25) (4.26) KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE kde ∂f A= = ∂x x ∂f1 ∂x1 ... ∂fn ∂x1 ∂f1 ∂x2 ... ∂fn ∂x2 ... ... ... 37 ∂f1 ∂xn ... ∂fn ∂xn (4.27) x je Jacobiova matice funkce f vyčı́slená v rovnovážném stavu x. Nazývá se také matice linearizace a označuje se často symboly J nebo Df . Zanedbánı́ členů vyššı́ho řádu je opodstatněno intuitivnı́ představou, že tyto členy nemajı́ v blı́zkosti rovnovážného stavu žádný podstatný vliv na strukturu trajektoriı́. Podrobný důkaz této oprávněné představy lze nalézt v učebnicı́ch matematiky. Zavedeme-li za odchylku x − x od rovnovážného stavu novou proměnnou z, je ż = Az (4.28) rovnice linearizace kolem rovnovážného stavu x. Stabilitu lze pak vyšetřit metodami použı́vanými pro řešenı́ stability lineárnı́ch systémů. Vlastnı́ čı́sla matice A určı́me z charakteristické rovnice systému (4.28) det [A − λI] = 0, kde I je jednotková matice a A konstantnı́ matice. Pak platı́ věta: Věta 4.8. Majı́-li všechna vlastnı́ čı́sla matice linearizace A záporné reálné části, je rovnovážný stav x systému ẋ = f (x) asymptoticky ljapunovsky stabilnı́. Má-li alespoň jedno vlastnı́ čı́slo kladnou reálnou část, je rovnovážný stav ljapunovsky nestabilnı́. V přı́padě, že jedno nebo vı́ce vlastnı́ch čı́sel matice A majı́ nulovou reálnou část, nenı́ možno podle lineárnı́ho přiblı́ženı́ stanovit stabilitu rovnovážného stavu vyšetřovaného nelineárnı́ho systému. Stabilita je určena vyššı́mi členy v Taylorově rozvoji, které byly při linearizaci zanedbány. V tomto přı́padě lze stabilitu určit pomocı́ tzv. centrálnı́ variety (čl. 4.4) nebo s využitı́m druhé Ljapunovovy metody (kap. 5). Je třeba znovu zdůraznit, že pomocı́ metody linearizace zı́skáme pouze lokálnı́ stabilitu, studiem globálnı́ stability se budeme zabývat v kap.5. Poznámka. U systémů 2. řádu (a částečně i 3.řádu) můžeme velmi často kromě zjištěnı́ stability rovnovážného stavu určit i pravděpodobné typy trajektoriı́ v jeho blı́zkém okolı́ na základě výsledků z čl. 4.1. Věta 4.12 v článku 4.3 to specifikuje podrobněji. I když asymptotická stabilita rovnovážného stavu nelineárnı́ho systému je dána asymptotickou stabilitou linearizovaného systému, nemusı́ klasifikace trajektoriı́ navzájem přesně odpovı́dat. Např. u nelineárnı́ho systému ẋ1 = −x1 − x2 q log x21 + x22 ẋ2 = −x1 + x1 q log x21 + x22 je rovnovážný stav (0,0) stabilnı́ ohnisko, u jeho linearizace však stabilnı́ uzel. Definice 4.1. Rovnovážný stav x se nazývá hyperbolický (také nedegenerovaný), jestliže všechna vlastnı́ čı́sla matice A majı́ nenulové reálné části. Přı́klad 4.2. Systémy 1.řádu. U systému ẋ = f (x), f : R → R vyšetřı́me stabilitu rovnovážného stavu x velmi jednoduše. Matice linearizace degeneruje na derivaci f 0 (x), takže platı́: a) f 0 (x) < 0 x je asymptoticky stabilnı́ b) f 0 (x) > 0 x je nestabilnı́ c) f 0 (x) = 0 z lineárnı́ aproximace nelze určit stabilitu. Protože Taylorův rozvoj u systémů 1. řádu je velmi jednoduchý, můžeme posoudit stabilitu přı́padu c) z členů vyššı́ho řádu. Je-li f 0 (x) = 0 a f 00 (x) 6= 0, je rovnovážný stav nestabilnı́. Jestliže pro f 0 (x) = 0 je f 00 (x) = 0, nelze opět stabilitu určit a je třeba posoudit třetı́ derivaci. Tyto závěry lze snadno odvodit z grafu funkce f (x). KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 38 Přı́klad 4.3. Systém 2.řádu. Je třeba určit rovnovážné stavy a typy trajektoriı́ v jejich okolı́ u nelineárnı́ho systému popsaného rovnicemi ẋ1 = x2 ẋ2 = bx1 − cx31 − ax2 (4.29) Položı́me-li pravé strany rovny nule, zı́skáme tři rovnovážné stavy r r b b (1) (2) (3) x = (0, 0) x = (+ ; 0) x = (− ; 0) c c Jacobiova matice pro danou soustavu rovnic má tvar ∂f1 ∂f1 " 0 ∂x1 ∂x2 A= ∂f2 ∂f2 = b − 3cx21 ∂x1 ∂x2 1 # . −a Dosadı́me-li do této matice čı́selnou hodnotu prvnı́ho rovnovážného stavu x1 = 0, x2 = 0, dostaneme charakteristickou rovnici det [A1 − λI] = λ2 + aλ − b = 0. p Jejı́ kořeny λ1,2 = −a/2 ± a2 /4 + b jsou reálné a opačných znamének, rovnovážný stav je tedy nestabilnı́. Protože pro 2. řád známe také průběh trajektoriı́ v blı́zkém okolı́ rovnovážného stavu, je z tab. 4.1 patrno, že rovnovážný stav je sedlo. Přı́mkové trajektorie sedla lze určit pomocı́ vlastnı́ch vektorů. Dosadı́me-li do Jacobiovy matice hodnoty druhého rovnovážného stavu, je charakteristická rovnice lineárnı́ho přiblı́ženı́ det[A2 − λI] = λ2 + aλ + 2b = 0. Typ rovnovážného stavu závisı́ na konkrétnı́ch hodnotách a, b. Pro a2 /4 < 2b jsou kořeny komplexně sdružené a rovnovážný stav je stabilnı́ ohnisko, pro a2 /4 > 2b jsou kořeny záporné reálné a rovnovážný stav je stabilnı́ uzel. Pro třetı́ rovnovážný stav dostáváme stejný výsledek. Pomocı́ metody linearizace zjistı́me tedy pro všechny rovnovážné stavy jejich stabilitu a tvary trajektoriı́ v blı́zkém okolı́ těchto rovnovážných stavů. Společně s dalšı́mi znalostmi o vektorovém poli (např. o nemožnosti existence uzavřených trajektoriı́ pro tento systém, viz čl. 10.2) si můžeme učinit dobrou představu i o globálnı́m průběhu trajektoriı́. Pro ilustraci chovánı́ systému i dále od rovnovážných stavů je na obr. 4.3 zakreslena celá sı́t’ fázových trajektoriı́. Je patrno, že systém se chová jako klopný obvod se dvěma stabilnı́mi rovnovážnými stavy. Každá trajektorie končı́ v jednom z obou stabilnı́ch rovnovážných stavů, s výjimkou té, která směřuje do sedla v bodě (0,0). Tato trajektorie se nazývá separatrix, protože odděluje oblasti přitažlivosti obou stabilnı́ch rovnovážných stavů. Závislost systému na parametrech. Budeme-li v rovnici 4.29 měnit hodnotu parametrů, např. snižovat velikost parametru b, budou se stabilnı́ rovnovážné stavy přibližovat k počátku a pro b = 0 bude mı́t systém jen jeden rovnovážný stav, jehož stabilitu nemůžeme nynı́ určit pomocı́ linearizace, protože Jacobiova matice bude singulárnı́ a jedno vlastnı́ čı́slo bude ležet na imaginárnı́ ose. Tento přı́pad vyšetřı́me později pomocı́ jiných metod (čl.4.4). Bude-li hodnota parametru b záporná, bude mı́t systém jeden stabilnı́ rovnovážný stav. Je patrno, že při kritické hodnotě parametru b = 0 nastává tzv. bifurkace, při nı́ž se kvalitativně měnı́ charakter fázového portrétu. Podrobnějšı́ rozbor bifurkačnı́ch problémů bude podán v kap. 11. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 39 Obr. 4.3. Pole trajektoriı́ systému 4.29 Řešenı́ lokálnı́ stability rovnovážných stavů nelineárnı́ho systému ẋ = f (x) lze provést také tak, že nejprve vhodnou transformacı́ posuneme vyšetřovaný rovnovážný stav do počátku. Pak x = 0, f (0) = 0 a Jacobiova matice A = [∂f /∂x] se vyhodnocuje pro x = 0. Taylorův rozvoj pravé strany lze při uvažovánı́ vyššı́ch členů zapsat ve tvaru f (x) = Ax + r(x), (4.30) kde r(x) reprezentuje všechny členy s druhými a vyššı́mi mocninami. Z toho vyplývá oprávněnost ljapunovské linearizace, protože ||r(x)|| lim = 0. (4.31) ||x||→0 ||x|| Lokálnı́ stabilitu rovnovážného stavu x = 0 posuzujeme zase podle vlastnı́ch čı́sel matice A a věty 4.8. Má-li pravá strana zadané nelineárnı́ diferenciálnı́ rovnice již tvar Ax + r(x) nebo ji na tuto formu můžeme snadno převést, je lokálnı́ stabilita rovnovážného stavu 0 dána přı́mo vlastnostmi matice A, platı́-li ovšem (4.31). Věta 4.9. Je dán systém ẋ = Ax + r(x) r(0) = 0, (4.32) n kde A je reálná konstantnı́ čtvercová matice a r je reálná vektorová funkce spojitá v oblasti Ω ⊂ R obsahujı́cı́ bod 0 a splňujı́cı́ podmı́nku (4.31). Pak platı́: a) majı́-li všechna vlastnı́ čı́sla matice A záporné reálné části, je x = 0 asymptoticky stabilnı́; b) má-li alespoň jedno vlastnı́ čı́slo matice A kladnou reálnou část, je x = 0 nestabilnı́. 4.2.2 Lokálnı́ stabilita rovnovážných stavů neautonomnı́ch systémů Ljapunovovu linearizačnı́ metodu lze použı́t také pro neautonomnı́ systémy. Uved’me nejprve obecnou větu, kterou dále využijeme pro lokálnı́ linearizaci neautonomnı́ho nelineárnı́ho systému. Věta 4.10. Řešenı́ x = 0 nelineárnı́ho časově variantnı́ho systému ẋ = A(t)x + r(t, x) r(t, 0) = 0 ∀t > 0 (4.33) KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 40 je stejnoměrně asymptoticky stabilnı́, jestliže a) lim ||x||→0 ||r(t, x)|| =0 ||x|| (4.34) a je splněna stejnoměrná konvergence lim ||x||→0 sup ||r(t, x)|| =0 ||x|| (4.35) b) A(t) je ohraničená pro všechna t c) nulové řešenı́ systému ẋ = A(t)x je stejnoměrně asymptoticky stabilnı́. Důkaz věty pomocı́ druhé Ljapunovovy metody lze nalézt např. v [55],s.212. Podmı́nky stability časově variantnı́ch lineárnı́ch systémů jsou známy z předmětu Teorie dynamických systémů. Poznámka: Podmı́nka stejnoměrnosti (4.35) znamená, že pro libovolné ε > 0 musı́ existovat takové δ > 0 nezávislé na t, že ||r(t, x)|| <ε ||x|| platı́ pro všechna t a všechna ||x|| < δ. Uvažujme nynı́ nebuzený časově variantnı́ systém ẋ = f (t, x) f (t, 0) = 0 ∀t ≥ 0 f ∈ Cr. (4.36) Taylorův rozvoj funkce f pro libovolný pevný čas t ≥ 0 vede na rovnici (4.33), kde A(t) = (∂f /∂x) pro x = 0. Z definice Jacobiovy matice A(t) vyplývá pro každé pevné t ≥ 0, že je splněna podmı́nka (4.34), nemusı́ být ovšem splněna stejnoměrná konvergence (4.35). Systém ẋ = A(t)x je však linearizacı́ neautonomnı́ho systému (4.36) kolem rovnovážného stavu 0 pouze tehdy , je-li splněna podmı́nka (4.35). Pak lze stabilitu nelineárnı́ho systému (4.36) řešit pomocı́ věty 4.10. Je třeba zdůraznit, že na rozdı́l od autonomnı́ch systémů neplatı́ u neautonomnı́ch systémů relace mezi nestabilitou linearizace ẋ = A(t)x a nestabilitou daného systému (4.36). U mnoha neautonomnı́ch systémů (4.36) je sice splněna podmı́nka (4.34), ale nikoliv (4.35). Pak nelze linearizačnı́ metodu použı́t. Přı́klad 4.4. Systém ẋ1 = −x1 + tx22 , ẋ2 = x1 − x2 má pro x = 0 matici A konstantnı́ a zbytek r(x) = [tx22 ; 0]T . Platı́ podmı́nka (4.34), ale ne stejnoměrnost (4.35), proto systém ẋ1 = −x1 , ẋ2 = x1 − x2 nenı́ linearizacı́ původnı́ho systému. Jacobiova matice A(t) neautonomnı́ho nelineárnı́ho systému je obecně t-variantnı́, pouze v některých speciálnı́ch přı́padech je konstantnı́. Např. systém ẋ = −x2 /t vede na linearizaci ẋ = −x. Podobně tomu bylo i v přı́kladu 4.4. Je-li matice linearizace konstantnı́, můžeme na rozdı́l od věty 4.10 posoudit i nestabilitu rovnovážného stavu. Věta 4.11. Jestliže Jacobiova matice A(t) = A je konstantnı́ pro všechna t ≥ 0 a jsou splněny podmı́nky (4.34) a (4.35), pak rovnovážný stav 0 nelineárnı́ho systému (4.36) je a) asymptoticky ljapunovsky stabilnı́, majı́-li všechna vlastnı́ čı́sla matice A záporné reálné části; b) nestabilnı́, jestliže jedno nebo vı́ce vlastnı́ch čı́sel matice A má kladnou reálnou část. Přı́klad 4.5. Pro určenı́ ljapunovské stability rovnovážného stavu 0 systému ẋ1 = x1 − x2 + x21 + x22 sin t ẋ2 = x1 + x2 − 2x1 x2 e−t lze použı́t věty 4.11, protože zadaný systém je již ve tvaru (4.33) s konstantnı́ maticı́ A a funkcı́ r(t, x), která splňuje podmı́nky (4.34) a (4.35) 2 1 −1 x1 + x22 sin t A= , r(t, x) = . 1 1 −2x1 x2 e−t Vlastnı́ čı́sla matice A jsou 1+j a 1−j a majı́ tedy kladnou reálnou část. Rovnovážný stav 0 je proto ljapunovsky nestabilnı́. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 4.3 41 Strukturálnı́ stabilita Reálné systémy, které popisujeme matematickými modely, např. ve formě autonomnı́ch diferenciálnı́ch rovnic ẋ = f (x), jsou neustále vystaveny různým poruchám (perturbacı́m). Vliv některých poruch se v modelu může projevit např. malými změnami vektorového pole f (x). Adekvátnost modelu je pak zajištěna tehdy, jestliže vektorové pole v(x), blı́zké v jistém smyslu vektorovému poli f (x), nevyvolá kvalitativnı́ změny v chovánı́ systému. Chceme proto, aby fázové portréty systémů ẋ = f (x) a ẋ = v(x) byly kvalitativně stejné, tj. aby systém ẋ = f (x) byl při malých poruchách strukturálně stabilnı́. Uved’me nynı́ přesnějšı́ formulace intuitivně zavedených pojmů. Uvažujme množinu všech vektorových polı́ třı́dy C r na Rn . Tuto množinu můžeme považovat za topologický prostor, jehož body jsou jednotlivá vektorová pole. Poznámka. Topologie je matematická disciplı́na studujı́cı́ topologické vlastnosti různých matematických objektů, tj. takové vlastnosti, které jsou invariantnı́ vzhledem k libovolnému homeomorfnı́mu zobrazenı́. Pro jednoduchost si můžeme představit topologický prostor jako metrický prostor. Základnı́ vlastnosti topologických prostorů jsou přehledně zpracovány v knize [13]. Homeomorfismus je zobrazenı́ h : Rn → Rm , které je prosté, spojité a jehož inverznı́ zobrazenı́ h−1 je rovněž spojité. Definice 4.2. Systémy ẋ = f (x) a ẋ = v(x) se nazývajı́ topologicky orbitálně ekvivalentnı́, jestliže existuje homeomorfismus h : Rn → Rn , který zobrazuje trajektorie jedné soustavy na trajektorie druhé soustavy při zachovánı́ směru jejich probı́hánı́. Fázové portréty takových systémů se pak nazývajı́ topologicky ekvivalentnı́ nebo kvalitativně stejné. Platı́-li to pro celý stavový prostor, jde o globálnı́ ekvivalenci. Např. fázové portréty stabilnı́ho uzlu u lineárnı́ho systému ẋ = Ax a stabilnı́ho ohniska u ẋ = Bx jsou globálně topologicky orbitálně ekvivalentnı́, protože trajektorie směřujı́cı́ do uzlu lze homeomorfně zobrazit na spirály směřujı́cı́ do ohniska. Pro nelineárnı́ systémy je globálnı́ verze obvykle přı́liš silná a je třeba uvažovat jen lokálnı́ verzi. Definice 4.3. Necht’ x je rovnovážný stav vektorového pole f na Rn a y rovnovážný stav pole v na Rn , U je okolı́ bodu x, V je okolı́ bodu y, a h : U → V je homeomorfismus, který zobrazuje U na V . Systémy ẋ = f (x) a ẋ = v(x) jsou lokálně topologicky orbitálně ekvivalentnı́ v bodech x, y, jsou-li topologicky orbitálně ekvivalentnı́ v jistých okolı́ch U, V bodů x, y. Definice 4.4. (Strukturálnı́ stabilita). Systém ẋ = f (x) je lokálně strukturálně stabilnı́ v bodě x, jestliže pro všechna vektorová pole v dostatečně blı́zká k poli f , je ẋ = v(x) v bodě y lokálně topologicky orbitálně ekvivalentnı́ se systémem ẋ = f (x) v bodě x. Věta 4.12. (Grobmanova-Hartmanova věta). Necht’ x je hyperbolický rovnovážný stav systému ẋ = f (x) a A = Df (x) je jeho matice linearizace. Pak soustavy ẋ = f (x) a ẋ = Ax jsou lokálně topologicky orbitálně ekvivalentnı́ v bodech x a 0, tj. fázový portrét soustavy ẋ = f (x) je v jistém okolı́ bodu x topologicky ekvivalentnı́ s fázovým portrétem lineárnı́ soustavy ẋ = Ax v okolı́ počátku. V okolı́ hyperbolických rovnovážných stavů se tedy fázový portrét kvalitativně neměnı́ a nedocházı́ proto k bifurkacı́m. Při studiu bifurkacı́ (kap. 11) se musı́me zabývat rovnovážnými stavy, které nejsou hyperbolické. Stabilitu těchto stavů však nelze určit pomocı́ linearizace, protože matice A tam má vlastnı́ čı́sla s nulovou reálnou částı́. Možnosti řešenı́ si ukážeme v dalšı́m článku o centrálnı́ varietě. 4.4 Centrálnı́ varieta V čl. 4.1 jsme ukázali, že u lineárnı́ho systému je možno v prostoru Rn najı́t lineárnı́ invariantnı́ podprostory E s , E u , E c , které jsou vytvořeny vlastnı́mi vektory přı́slušejı́cı́mi k vlastnı́m čı́slům se zápornými, kladnými a nulovými reálnými částmi. Také u nelineárnı́ch systémů existujı́ analogické podprostory, které jsou však již tvořeny nelineárnı́mi křivkami nebo plochami. Mluvı́me proto obecněji o varietách. (Varieta je souhrnný pojem pro křivky a plochy v n-rozměrném prostoru). Je-li x hyperbolický rovnovážný stav systému ẋ = f (x), má matice linearizace A = Df (x) jen vlastnı́ čı́sla s nenulovou reálnou částı́ a existuje lokálnı́ stabilnı́ a lokálnı́ nestabilnı́ varieta vektorového pole f v bodě KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 42 x. Tyto variety lze definovat např. vztahy: s Wloc (x) = {x ∈ U |Φt (x) → x pro t → ∞ a Φt (x) ∈ U ∀t ≥ 0} u Wloc (x) = {x ∈ U |Φt (x) → x pro t → −∞ a Φt (x) ∈ U ∀t ≤ 0}, s u kde U ⊂ Rn je otevřené okolı́ rovnovážného stavu x. Invariantnı́ variety Wloc a Wloc jsou nelineárnı́ analogiı́ s u stabilnı́ch a nestabilnı́ch invariantnı́ch podprostorů E a E u lineárnı́ch systémů (čl. 4.1) a majı́ podobný význam pro lokálnı́ topologickou klasifikaci vektorových polı́ jako invariantnı́ podprostory lineárnı́ch dynamických systémů pro jejich globálnı́ topologickou klasifikaci. Bude-li mı́t systém rovnovážný stav nehyperbolický, má matice linearizace A = Df (x) také jedno nebo vı́ce vlastnı́ch čı́sel s nulovou reálnou částı́ a tok v blı́zkosti rovnovážného stavu může být velmi komplikovaný. Docházı́ k bifurkacı́m a metoda linearizace již neumožňuje posoudit stabilitu rovnovážného stavu. V analogii s c lineárnı́m systémem zavedeme pak také pojem centrálnı́ variety Wloc . Protože rovnovážný stav x lze vždy vhodnou transformacı́ převést do počátku, budeme v dalšı́ch úvahách pro zjednodušenı́ předpokládat, že x = 0. Budeme tedy vyšetřovat fázový portrét systému ẋ = f (x) = Ax + r(x). (4.37) Linearizace systému v počátku je ẋ = Ax. Věta 4.13. Necht’ f (x) je C r vektorové pole na Rn , f (0) = 0, A = Df (0). Necht’ odpovı́dajı́cı́ invariantnı́ s podprostory matice A jsou E s , E u , E c . Potom existujı́ C r stabilnı́ a nestabilnı́ lokálnı́ invariantnı́ variety Wloc u s u r−1 c c a Wloc , které se dotýkajı́ v bodě 0 variet E a E a C centrálnı́ invariantnı́ varieta Wloc , k nı́ž E v nule je s u c tečné. Variety Wloc a Wloc jsou jednoznačné, Wloc však nemusı́ jednoznačná být (navı́c může ztratit hladkost). Důkaz věty je podán např. v [32]. s u c Na obr. 4.4 jsou pro ilustraci zakresleny lokálnı́ variety Wloc , Wloc , Wloc a invariantnı́ podprostory E s , u c E a E jejich linearizace v rovnovážném stavu 0. Na centrálnı́ varietě nemůžeme vyznačit směr toku bez specifických informacı́ o členech vyššı́ho řádu v blı́zkosti nuly. Průběhy lokálnı́ch variet se ovšem u konkrétnı́ho systému mohou lišit od průběhů na obr. 4.4. Abychom mohli určit rovnice centrálnı́ variety, je výhodné transformovat matici linearizace A do Jordanova kanonického tvaru. V něm jsou vlastnı́ vektory na sebe kolmé a to nám umožňuje pracovat s lokálnı́mi kartézskými souřadnicemi. Jordanova matice má tvar 0 A 0 0 AJ = 0 A − (4.38) 0 , + 0 0 A kde submatice A0 , A− , A+ majı́ vlastnı́ čı́sla s nulovou, zápornou a kladnou reálnou částı́. Soustava ẋ = Ax se rozpadla na tři nezávislé rovnice a lze ji zapsat ve tvaru ẋ0 = A0 x0 , ẋ− = A− x− , ẋ+ = A+ x+ , (4.39) kde x0 , x− , x+ jsou transformované proměnné původnı́ho systému. Abychom v dalšı́m nemuseli pracovat se složitým označenı́m podle rov. (4.39), použijme pı́smen x, y, z, kde pı́smenem x označı́me nynı́ jen proměnné odpovı́dajı́cı́ vlastnı́m čı́slům s nulovou reálnou částı́ x = x0 , y = x− , z = x+ . Dále položı́me A0 = B, A− = C, A+ = P . Původnı́ nelineárnı́ systém po transformaci lineárnı́ části do Jordanova tvaru a s použitı́m nového označenı́ proměnných lze nynı́ zapsat ve tvaru ẋ = Bx + F (x, y, z) ẏ = Cy + G(x, y, z) ż = P z + H(x, y, z) (4.40) Malou změnou parametrů matic C a P se kvalitativně neměnı́ fázové portréty druhé a třetı́ rovnice. Všechny kvalitativnı́ změny, které mohou nastat, jsou soustředěny do prvnı́ rovnice. Všechny závažné jevy KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 43 se tedy odehrávajı́ na centrálnı́ varietě. Tı́m se n-rozměrný bifurkačnı́ problém zredukuje na rozměr centrálnı́ variety, který je podstatně nižšı́ (nejčastěji jedno- nebo dvourozměrný). Vlivem nelineárnı́ch členů F , G, H se invariantnı́ podprostory lineárnı́ aproximace neničı́, pouze se deformujı́. Obr. 4.4. Lokálnı́ variety 4.4.1 Výpočet centrálnı́ variety a určovánı́ stability meznı́ho přı́padu Metoda linearizace neumožňuje určit stabilitu rovnovážného stavu v přı́padě, že matice linearizace má vlastnı́ čı́sla s nulovou reálnou částı́. Tento přı́pad lze však řešit pomocı́ centrálnı́ variety. Uvažujme pro zjednodušenı́, u že nenı́ nestabilnı́ varieta Wloc . Matice linearizace nemá tedy žádné vlastnı́ čı́slo s kladnou reálnou částı́, což je u reálného fyzikálnı́ho systému nejčastějšı́ přı́pad. Pak můžeme nelineárnı́ systém zapsat ve tvaru ẋ = Bx + F (x, y) ẏ = Cy + G(x, y), (4.41) kde x ∈ Rk , y ∈ Rn−k , B je matice rozměru k×k s vlastnı́mi čı́sly s nulovou reálnou částı́ a C je matice rozměru (n − k) × (n − k) s vlastnı́mi čı́sly se zápornou reálnou částı́. F , G jsou nelineárnı́ funkce všech proměnných a jsou spolu se svými prvnı́mi derivacemi v bodě (0,0) nulové. Protože centrálnı́ varieta ležı́ tečně k podprostoru E c a vlastnı́ vektory u Jordanova tvaru jsou na sebe c kolmé, můžeme pracovat s lokálnı́mi kartézskými souřadnicemi a Wloc vyjádřit ve tvaru c Wloc = {(x, y)|y = g(x), g(0) = g 0 (0) = 0}, (4.42) kde g(x) je vhodná funkce definovaná v okolı́ počátku U ⊂ Rk . Pohyb po centrálnı́ varietě je dán prvnı́ rovnicı́ soustavy (4.41), kterou můžeme nynı́ vyjádřit ve tvaru ẋ = Bx + F (x, g(x)). (4.43) K určenı́ g(x) diferencujme y(t) = g(x(t)) podle t a dosad’me z (4.43) ẏ = g 0 (x)ẋ = g 0 (x) [Bx + F (x, g(x))] = Cg(x) + G(x, g(x)) (4.44) Spolu s podmı́nkou g(0) = g 0 (0) = 0 je to nelineárnı́ diferenciálnı́ rovnice, kterou analyticky nelze obvykle vyřešit, ale kterou lze v mnoha přı́padech přibližně řešit v blı́zkosti x = 0 mocninnou řadou. Praktický postup si ukážeme na dvou jednoduchých přı́kladech. Přı́klad 4.6. Mějme systém dvou diferenciálnı́ch rovnic ẋ = −xy ẏ = −βy + x2 β > 0. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 44 Rovnovážný stav je v nule a matice linearizace v bodě nula má již Jordanův tvar 0 0 AJ (0, 0) = B = 0, C = −β F = −xy 0 −β G = x2 . Nulové vlastnı́ čı́slo neumožňuje určit stabilitu rovnovážného stavu podle prvnı́ Ljapunovovy metody. Určeme c funkci proto přibližný tvar centrálnı́ variety v blı́zkosti rovnovážného stavu. Volme např. jako aproximaci Wloc g(x) ve tvaru g(x) = ax2 + bx3 + cx4 + o(x5 ) a, b, c > 0 Podle vztahu (4.44) pak je g 0 (x)[−xg(x)] = −βg(x) + x2 . Po dosazenı́ −2a2 x4 + vyššı́ členy = (1 − βa)x2 − βbx3 − βcx4 . Aby se vyloučily členy do x4 , volme 1 − βa = 0 − 2a2 = −βc, − βb = 0 z čehož vyplývá a = 1/β Pak g(x) = b=0 c = 2/β 3 . 1 2 2 x + 3 x4 + o(x5 ). β β Protože ẋ = −xy = −xg(x), probı́há na centrálnı́ varietě přibližná dynamika 1 2 ẋ = − x3 − 3 x5 + o(x6 ). β β Protože jde o dynamiku prvnı́ho řádu, lze snadno určit, že bod (0,0) daného nelineárnı́ho systému je stabilnı́. Je také patrno, že pro určenı́ stability rovnovážného stavu (0,0) postačı́ prvnı́ člen ax2 v aproximaci centrálnı́ variety (nechceme-li určit přesněji jejı́ tvar v blı́zkém okolı́ bodu (0,0)). Přı́klad 4.7. Mějme systém u̇ = v v̇ = −v + αu2 + βuv. (4.45) Snadno se přesvědčı́me, že rovnovážný stav je v bodě (0,0) a Jacobiova matice v bodě (0,0) má vlastnı́ čı́sla 0 a -1 a nenı́ v Jordanově tvaru. Zadaný systém (4.45) nenı́ tedy v normálnı́ formě a je třeba ho na tuto formu převést. Vypočteme proto vlastnı́ vektory Jacobiovy matice A(0, 0), z nich určı́me transformačnı́ matici Q a stanovı́me závislost mezi danými proměnnými u, v a novými proměnnými normálnı́ formy, které označı́me x, y. 1 1 1 1 u x v1 = v2 = Q= =Q . 0 −1 0 −1 v y Mezi souřadnicemi je tedy vztah u = x + y, v = −y. Dosazenı́m do zadaných rovnic (4.45) a úpravou dostaneme normálnı́ formu ẋ = α(x + y)2 − β(xy + y 2 ) ẏ = −y − α(x + y)2 + β(xy + y 2 ), (4.46) kde lineárnı́ část je nynı́ v Jordanově tvaru. Porovnánı́m s rovnicemi (4.41) je patrno, že B = 0 a C = −1. Pro aproximaci centrálnı́ variety zvolme g(x) = ax2 , tj. aproximaci parabolou v okolı́ rovnovážného stavu. Dosazenı́m do vztahu (4.44) a porovnánı́m stran vyplývá, že a = −α, tj. g(x) = −αx2 . Dosazenı́m za y = g(x) = −αx2 do prvnı́ rovnice soustavy (4.46) dostaneme pro dynamiku na centrálnı́ varietě vztah ẋ = αx2 + α(β − 2α)x3 + o(x4 ), ze kterého snadno zjistı́me, že nulový rovnovážný stav je nestabilnı́. KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE 4.5 45 Úlohy 4.1. Určete rovnovážné stavy a stabilitu systému ẋ = xy + ax3 + bxy 2 ẏ = −y + cx2 + dx2 y pro různá znaménka a hodnoty konstant a, b, c, d. 4.2. Určete pomocı́ Ljapunovovy metody linearizace eventuelně pomocı́ centrálnı́ variety stabilitu nulového rovnovážného stavu u systémů a) ẋ = xy − αx ẏ = −βy + x2 pro různá znaménka a hodnoty parametrů α, β. 3 2 ẏ = −y + y 2 + x2 y − x3 a∈R b) ẋ = ax + x y c) ẋ = xy + ax3 + bxy 2 ẏ = −y + cx2 + dx2 y a, b, c, d ∈ R Kapitola 5 Přı́má Ljapunovova metoda Přı́má (nebo také druhá) Ljapunovova metoda umožňuje posoudit stabilitu nebo asymptotickou stabilitu v malém i ve velkém u lineárnı́ho i nelineárnı́ho autonomnı́ho i neautonomnı́ho systému. Metoda obcházı́ řešenı́ nelineárnı́ch diferenciálnı́ch rovnic hledánı́m tzv. ljapunovských funkcı́, které jsou matematickým zobecněnı́m základnı́ho fyzikálnı́ho principu, jı́mž je pokles celkové energie izolovaného disipativnı́ho systému při jeho pohybu. Je-li rovnovážný stav systému asymptoticky stabilnı́, pak při pohybu po trajektorii se akumulovaná energie systému s rostoucı́m časem zmenšuje a své minimálnı́ hodnoty dosáhne v rovnovážném stavu. Ljapunovova metoda spočı́vá v nalezenı́ vhodné funkce, kterou si lze zjednodušeně představit jako zobecněnou energii. Definitnost této funkce spolu s definitnostı́ jejı́ časové derivace podél řešenı́ stavové rovnice systému nám dá informaci o stabilitě systému. Principy této teorie si ukážeme nejprve na jednoduššı́ch systémech, kterými jsou autonomnı́ systémy. 5.1 Ljapunovovy funkce pro autonomnı́ systémy Uvažujme systém ẋ = f (x) f (0) = 0 (5.1) a zkoumejme stabilitu nulového řešenı́. Předpokládejme, že f je spojitá a spojitě diferencovatelná na Rn . Definice 5.1. Reálná funkce V (x), spojitá v oblasti Ω = {x ∈ Rn : ||x|| < B, B > 0} je pozitivně definitnı́ v Ω, jestliže V (0) = 0 a V (x) > 0 pro x 6= 0 v Ω. Jestliže uvedená vlastnost platı́ v celém stavovém prostoru, je V (x) globálně pozitivně definitnı́. Funkce je negativně definitnı́, jestliže −V (x) je pozitivně definitnı́. Funkce V (x) je pozitivně (resp. negativně) semidefinitnı́, je-li V (x) ≥ 0 (resp. V (x) ≤ 0) pro x 6= 0 a V (0) = 0. Velmi často použı́vanou Ljapunovovou funkcı́ je obecná kvadratická forma n proměnných V (x) = n X n X qij xi xj = xT Qx, (5.2) i=1 j=1 kde qij jsou reálné konstanty. Koeficienty u členů xi xj (i 6= j) jsou dány součtem qij + qji . Tyto koeficienty se nezměnı́, jestliže qij a qji položı́me rovny (qij + qji )/2. Kvadratickou formu lze pak psát ve tvaru (5.2), kde qij = qji , tj. Q je reálná symetrická matice. Tato forma je pozitivně definitnı́ právě tehdy, když všechny hlavnı́ minory determinantu matice Q jsou kladné (Sylvestrův teorém). Kvadratická forma je vhodnou Ljapunovovou funkcı́ pro lineárnı́ systémy, u nelineárnı́ch systémů však ve většině přı́padů nevyhovuje a je třeba hledat složitějšı́ typy funkcı́. U nich je však často velmi obtı́žné stanovit definitnost, která je základnı́m požadavkem u Ljapunovovy funkce, jak je patrno z následujı́cı́ definice. Definice 5.2. Ljapunovova funkce je taková reálná funkce V (x) definovaná na oblasti Ω = {x ∈ Rn : ||x|| < B}, která splňuje podmı́nky a) V (x) je spojitá a má spojité prvnı́ parciálnı́ derivace v oblasti Ω kolem počátku. b) V (x) je pozitivně definitnı́ v Ω. c) Časová derivace V̇ (x) podél řešenı́ daného systému (5.1) je negativně definitnı́ nebo negativně semidefinitnı́ v Ω. 46 KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 47 Derivace V̇ (x) podél řešenı́ daného systému je definována vztahem ∂V ∂V dV (x) = ẋ = f (x) dt ∂x ∂x (5.3) ∂V ∂V f1 (x) + ... + fn (x) = (grad V )T f (x) = (∇V )T f (x). ∂x1 ∂xn (5.4) V̇ = nebo v jiném zápisu V̇ = Věta 5.1. (Ljapunovovo kritérium). Existuje-li k danému systému (5.1) pozitivně definitnı́ Ljapunovova funkce v oblasti Ω a je-li tam V̇ (x) negativně semidefinitnı́ (resp. negativně definitnı́), je rovnovážný stav x = 0 ljapunovsky stabilnı́ (resp. asymptoticky stabilnı́) v Ω. Je-li V (x) pozitivně definitnı́ a V̇ (x) negativně definitnı́ v celém stavovém prostoru a V (x) → ∞ při ||x|| → ∞, je rovnovážný stav 0 globálně asymptoticky stabilnı́. Přı́klad 5.1. Dynamický systém ẋ1 = −x2 − x31 ẋ2 = x1 − x32 má jeden rovnovážný stav v počátku. Zvolme např. Ljapunovovu funkci ve tvaru kvadratické formy V = a1 x21 + a2 x22 . Derivace podél řešenı́ je V̇ = 2a1 x1 (−x2 − x31 ) + 2a2 x2 (x1 − x32 ) = −2a1 (x41 + x42 ), po volbě a2 = a1 . V̇ je negativně definitnı́, V je pozitivně definitnı́. Protože současně V (x) → ∞ pro ||x|| → ∞, je rovnovážný stav globálně asymptoticky stabilnı́. Volba Ljapunovovy funkce ve tvaru kvadratické formy zde vyhovı́ pouze proto, že zadaný systém má vhodný tvar. Při pozměněném tvaru rovnic již kvadratická forma nevyhovuje. Přı́klad 5.2. U dynamického systému ẋ1 = x1 (x21 + x22 − 1) − x2 ẋ2 = x1 + x2 (x21 + x22 − 1) s rovnovážným stavem v počátku můžeme rovněž volit Ljapunovovu funkci ve tvaru kvadratické formy V = x21 + x22 . Derivace podél řešenı́ daného systému je V̇ = 2(x21 + x22 )(x21 + x22 − 1). V oblasti Ω definované vztahem x21 + x22 < 1 (vnitřek jednotkového kruhu) je V̇ lokálně negativně definitnı́. Počátek je proto asymptoticky stabilnı́ v oblasti Ω. Geometrická interpretace Ljapunovovy věty. Ljapunovova věta o stabilitě má velmi názornou geometrickou interpretaci, která může sloužit i jako jednoduchý důkaz věty 5.1. Pro demonstraci zvolme např. lineárnı́ systém 2.řádu ẋ1 = x2 ẋ2 = −2aω0 x2 − ω0 2 x1 . (5.5) Ve fázové rovině zakreslı́me trajektorii tohoto systému např. pro a > 1, ω0 2 > 0 (obr.5.1). Jako Ljapunovovu funkci zvolı́me např. pozitivně definitnı́ funkci V = x21 + x22 . Průměty této funkce pro různé hodnoty V = konst. do roviny (x1 , x2 ) (vrstevnice) jsou rovněž zakresleny na obr. 5.1. Funkce V̇ (x) = (grad V )T ẋ představuje skalárnı́ součin gradientu ∇V a vektoru fázové rychlosti ẋ. Časová derivace V̇ (x) bude negativně definitnı́, jestliže vektor gradientu a vektor fázové rychlosti budou svı́rat v každém bodě trajektorie navzájem tupý úhel. Záporná definitnost funkce V̇ (x) bude tedy splněna, jestliže fázová trajektorie bude v každém bodě fázové roviny protı́nat vrstevnice ve směru klesajı́cı́ hodnoty V = konst. To je v našem přı́padě splněno a zvolená funkce V vyhovuje. Lze se snadno přesvědčit, že pro jiné hodnoty a, např. v intervalu 0 < a < 1 již Ljapunovova funkce V = x21 + x22 nevyhovı́ a musı́me zvolit obecnou kvadratickou formu (5.2). KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA Obrázek 5.1: Lineárnı́ systém 2.řádu 48 Obrázek 5.2: Vrstevnice Ljapunovovy funkce Při posuzovánı́ stability systému (5.1) postupujeme ovšem obráceně. Neznáme trajektorii pohybu ve stavovém prostoru, ale snažı́me se pouze najı́t takovou Ljapunovovu funkci, aby byly splněny podmı́nky věty 5.1. Poznámky: 1. Podmı́nka radiálnı́ neohraničenosti ||x|| → ∞ ve větě 5.1 zajišt’uje, že vrstevnice V (x) = Vα = konst. jsou uzavřené křivky (nebo plochy a hyperplochy u systémů 3. a vyššı́ho řádu). Kdyby nebyly uzavřené, mohly by se trajektorie vzdalovat od rovnovážného stavu a přitom stále protı́nat vrstevnice odpovı́dajı́cı́ klesajı́cı́m hodnotám Vα . Např. u pozitivně definitnı́ Ljapunovovy funkce V = [x21 /(1 + x21 )] + x22 jsou vrstevnice pro V > 1 neuzavřené. Fázová trajektorie se při určitých počátečnı́ch podmı́nkách může vzdalovat od počátku a přitom neustále protı́nat vrstevnice se snižujı́cı́ se hodnotou Vα (obr.5.2). 2. Ljapunovovy věty o stabilitě dávajı́ pouze postačujı́cı́ podmı́nky. Jestliže tedy při nějaké volbě Ljapunovovy funkce určı́me oblast stability Ω, je možné, že při jiné volbě určı́me oblast většı́. 3. Nemůžeme-li k danému systému najı́t vhodnou Ljapunovovu funkci, neznamená to, že systém je nestabilnı́. Lze jen konstatovat, že pokus o určenı́ stability se nezdařil. 4. Pro daný systém může existovat mnoho Ljapunovových funkcı́. Jestliže je V jeho Ljapunovova funkce, je takovou funkcı́ např.i V1 = ρV β , kde ρ > 0 a konstanta β > 1 (nemusı́ být celé čı́slo). 5. Pomocı́ Ljapunovovy teorie a některých jiných metod, které budou uvedeny v kap.7, lze často stanovit stabilitu pro celou třı́du nelineárnı́ch systémů. Stabilita takových systémů se nazývá absolutnı́ stabilita. 6. Kromě základnı́ch vět o stabilitě systému byly formulovány také různé věty o nestabilitě, které jsou užitečné v přı́padě, že se nepodařı́ nalézt vhodnou Ljapunovovu funkci podle věty 5.1. Tyto věty uvedeme až v čl.5.4 u neautonomnı́ch systémů. Pro praktické účely je důležitou vlastnostı́ asymptotická stabilita rovnovážného stavu, která existuje, jestliže V̇ (x) je negativně definitnı́. Zajistit tuto negativnı́ definitnost je však často velmi obtı́žné, a v mnoha přı́padech se podařı́ zajistit pouze negativnı́ semidefinitnost derivace Ljapunovovy funkce. Ale i v tomto přı́padě lze často učinit závěry o asymptotické stabilitě, jestliže využijeme následujı́cı́ věty. Věta 5.2. Uvažujme systém (5.1) a oblast Ω kolem počátku, ve které je V (x) pozitivně definitnı́ a V̇ (x) negativně semidefinitnı́. Jestliže množina definovaná vztahem V̇ (x) = 0 neobsahuje žádné trajektorie systému (5.1) kromě triviálnı́ trajektorie x = 0, pak rovnovážný stav 0 je asymptoticky KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 49 stabilnı́. Oblast Ω je oblast přitažlivosti rovnovážného stavu. Přı́klad na větu 5.2 bude uveden v čl. 5.3.1. Oblast Ω nemusı́ být ovšem úplnou oblastı́ přitažlivosti, protože může existovat vhodnějšı́ Ljapunovova funkce, která dá oblast většı́. Větu 5.2 lze zobecnit a formulovat tzv. věty o invariantnı́ch množinách, které dovolujı́ rozšı́řit pojetı́ Ljapunovovy funkce tak, aby popisovala i konvergenci obecnějšı́ho dynamického chovánı́, např. mı́sto k rovnovážnému stavu k limitnı́mu cyklu. [55]. 5.2 Ljapunovovy funkce pro lineárnı́ autonomnı́ systémy Ljapunovova teorie stability je obecnou metodou a můžeme tedy s jejı́ pomocı́ řešit i otázky stability lineárnı́ch systémů. Tento přı́stup nenı́ pro praktické řešenı́ stability konkrétnı́ho lineárnı́ho systému samozřejmě vhodný, protože známe jednoduchá kritéria, která vedou rychleji k cı́li. Ljapunovovo řešenı́ stability lineárnı́ch systémů je však základem pro řešenı́ stability systémů nelineárnı́ch. Dovoluje nám předevšı́m použı́vat pro lineárnı́ i nelineárnı́ systémy společnou metodiku a dále nám umožňuje vytvářet vhodné Ljapunovovy funkce i pro složité systémy vytvářené ze subsystémů. Jak uvidı́me dále, majı́ Ljapunovovy funkce aditivnı́ vlastnosti, podobně jako energie a proto Ljapunovovu funkci pro kombinace subsystémů můžeme odvodit z jednoduššı́ch funkcı́ pro jednotlivé subsystémy. Ljapunov dokázal, že pro stabilnı́ lineárnı́ autonomnı́ systém ẋ = Ax je vždy možno najı́t Ljapunovovu funkci ve tvaru pozitivně definitnı́ kvadratické formy, jejı́ž derivace podle času vzhledem k danému systému je negativně definitnı́. Uvažujme proto kvadratickou Ljapunovovu funkci V = xT P x, kde P je reálná symetrická matice. Časová derivace vzhledem k danému systému V̇ (x) = ẋT P x + xT P ẋ = xT AT P x + xT P Ax = xT (AT P + P A)x (5.6) AT P + P A = −Q, (5.7) Položı́me-li kde Q je symetrická matice, zı́skáme pro V̇ jinou kvadratickou formu V̇ = −xT Qx. Rovnice (5.7) se nazývá Ljapunovova maticová rovnice. Při vyšetřovánı́ stability můžeme tedy postupovat tak, že zvolı́me symetrickou pozitivně definitnı́ matici P , z Ljapunovovy rovnice (5.7) určı́me Q a zjistı́me, je-li pozitivně definitnı́. Nastane-li tento přı́pad, je počátek globálně asymptoticky stabilnı́. Pokud nenı́ Q pozitivně definitnı́, nelze stabilitu posoudit a je třeba vyzkoušet jinou volbu P . Abychom nemuseli náhodně zkoušet různé volby matice P , postupujeme výhodněji tak, že nejprve vybereme pozitivně definitnı́ matici Q, určı́me z Ljapunovovy rovnice P a stanovı́me jejı́ definitnost. Je-li P pozitivně definitnı́, je rovnovážný stav 0 globálně exponenciálně stabilnı́. Je-li Q pozitivně definitnı́ a P má alespoň jedno nekladné vlastnı́ čı́slo, je počátek nestabilnı́. Jestliže pro určitou volbu Q nemá rovnice (5.7) řešenı́ nebo nemá jednoznačné řešenı́ pro P , pak počátek nenı́ asymptoticky stabilnı́. Matici Q můžeme s výhodou zvolit jako jednotkovou matici nebo nějakou jinou diagonálnı́ matici. Podrobný rozbor problému lze nalézt např. v [55]. 5.3 Ljapunovovy funkce pro nelineárnı́ autonomnı́ systémy Úvodem je nutno zdůraznit, že zatı́m neexistuje jednoduchá a spolehlivá metoda, která by umožnila stanovit vhodnou Ljapunovovu funkci pro libovolný nelineárnı́ systém. Volba Ljapunovovy funkce ve tvaru kvadratické formy obecně selhává. Vyhovı́ jen v malém počtu speciálnı́ch přı́padů a proto ji pro praktické řešenı́ nelze použı́t. KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 50 Pro nelineárnı́ systémy bylo navrženo mnoho speciálnı́ch metod generovánı́ V (x) a některé metody obecné. V dalšı́ch článcı́ch si všimneme jen těch metod, kterých lze poměrně jednoduše využı́t pro praktická řešenı́. Velmi podrobný přehled většiny existujı́cı́ch metod lze nalézt v učebnici [9]. 5.3.1 Volba Ljapunovovy funkce na základě fyzikálnı́ analogie U nelineárnı́ch rovnic nižšı́ho řádu je možno najı́t jednoduchou fyzikálnı́ interpretaci Ljapunovovy teorie a podle nı́ navrhnout vhodnou funkci V (x). Této metody se často využı́vá v teoretické mechanice, v robotice apod., a je možno s jejı́ pomocı́ objasnit souvislosti mezi Ljapunovovou teoriı́ stability a a některými teoriemi optimálnı́ch systémů, zejména Pontrjaginovým principem maxima a dynamickým programovánı́m [9,10]. Uvažujme jednoduchý mechanický systém pružina, hmota, tlumič (obr. 5.3), v němž direktivnı́ sı́la f (x) a tlumı́cı́ sı́la g(ẋ) jsou nelineárnı́. Pro pohyb systému lze psát diferenciálnı́ rovnici ẍ + g(ẋ) + f (x) = 0 x(0) = x0 , ẋ(0) = ẋ0 . (5.8) U konzervativnı́ho systému je tlumenı́ g(ẋ) = 0 a celková energie je konstantnı́. Řešı́me-li konzervativnı́ systém ve fázové rovině se souřadnicemi x1 = x, x2 = ẋ, pak ẋ2 = −f (x1 ) ẋ1 = x2 (5.9) Pro f (x1 ) 6= 0 při x1 6= 0 a f (0) = 0 má systém jeden rovnovážný stav v počátku. Trajektorie jsou uzavřené křivky obklopujı́cı́ počátek a platı́ pro ně vztah dx2 f (x1 ) =− dx1 x2 (5.10) Integracı́ dostaneme rovnici trajektorie x22 + 2 Z x1 f (x1 )dx1 = konst. (5.11) 0 Prvnı́ člen představuje kinetickou energii a druhý potenciálnı́ energii, jejich součet je pak celková energie E(x1 , x2 ) pohybujı́cı́ho se systému. Trajektorie systému jsou tedy křivkami celkové energie tohoto konzervativnı́ho systému. Časová změna celkové energie je nulová dE(x1 , x2 ) = x2 ẋ2 + f (x1 )ẋ1 = x2 [ẋ2 + f (x1 )] = 0. dt (5.12) Disipativnı́ systém s tlumenı́m g(x2 ), kde g(x2 )x2 > 0 pro x2 6= 0 vede na rovnice ẋ1 = x2 , ẋ2 = −f (x1 ) − g(x2 ). Časová změna energie systému je nynı́ dE(x1 , x2 ) = x2 [ẋ2 + f (x1 )] = −g(x2 )x2 . dt (5.13) Protože g(x2 )x2 > 0 pro x2 6= 0, je patrno, že energie systému stále klesá s přibývajı́cı́m časem řešenı́, kromě bodů na ose x2 = 0. Zakreslı́me-li trajektorie systému do fázové roviny, v nı́ž jsou zaneseny také křivky konstantnı́ energie konzervativnı́ho systému (obr. 5.4), je vidět, že systém se pohybuje od jedné křivky reprezentujı́cı́ konstantnı́ energii ke druhé, která odpovı́dá energii nižšı́. Je-li tedy časová změna energie autonomnı́ho systému nekladná v každém bodě stavového prostoru, pak celková energie systému spojitě klesá až do absolutnı́ho minima, které nastane v rovnovážném stavu. U složitějšı́ch systémů je často velmi obtı́žné nalézt vztah pro celkovou energii systému, fyzikálně motivovaná ljapunovská funkce však může být určena u mnoha složitých mechanických systémů [52]. KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 51 Obrázek 5.3: Jednoduchý mechanický systém Obrázek systému 5.3.2 5.4: Trajektorie mechanického Volba Ljapunovovy funkce pro nelineárnı́ systém podle analogie s linearizovaným systémem Často se podařı́ sestrojit Ljapunovovu funkci na základě linearizovaného modelu. V nelineárnı́m systému zaměnı́me nejprve nelinearitu lineárnı́m členem, zvolı́me pro tento náhradnı́ lineárnı́ model vhodnou Ljapunovovu funkci ve tvaru kvadratické formy a pak změnı́me jejı́ tvar v tom výrazu, kde mı́sto lineárnı́ho členu je ve skutečnosti nelineárnı́ funkce. Této metody je možno často použı́t i na dosti složité systémy s většı́m počtem nelinearit. Způsob výpočtu ukáže nejlépe přı́klad. Přı́klad 5.3. Je třeba určit, pro jaké podmı́nky je stabilnı́ systém ẋ1 = f (x1 ) + βx2 ẋ2 = γx1 + δx2 f (0) = 0. (5.14) Nejprve nalezneme Ljapunovovu funkci pro linearizovaný model, ve kterém nahradı́me f (x1 ) výrazem αx1 . Podle čl. 5.2 zvolı́me obecnou kvadratickou formu, zderivujeme, zvolı́me nejjednoduššı́ tvar pro V̇ V̇ = −2(α + δ)(βγ − αδ)x21 (5.15) V = (δx1 − βx2 )2 + (αδ − βγ)x21 . (5.16) a spočteme V (x) Lineárnı́ model je stabilnı́ pro α + δ < 0, αδ − βγ > 0. Nynı́ vezmeme za základ funkci V podle (5.16) a sestrojı́me novou V (x) pro původnı́ systém (5.14), ve kterém je mı́sto αx1 nelineárnı́ funkce f (x1 ). Ve vztahu (5.16) je koeficient α u členu x21 . Člen αx21 můžeme zapsat ve tvaru Z x1 2 αx1 dx1 , 0 kde za αx1 dosadı́me f (x1 ). Jako Ljapunovovu funkci můžeme proto zvolit V = (δx1 − βx2 )2 + 2δ Z x1 f (x1 )dx1 − βγx21 (5.17) 0 Jejı́ derivace je f (x1 ) f (x1 ) + δ)(βγ − δ)x21 . x1 x1 Systém je globálně asymptoticky stabilnı́, platı́-li V̇ = −2( f (x1 ) δ − βγ > 0 x1 pro x1 6= 0 a f (x1 ) +δ <0 x1 (5.18) pro x1 6= 0 KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 52 x1 Z [f (x1 )δ − βγx1 ]dx1 → ∞ pro |x1 | → ∞. (5.19) 0 Protože systém (5.14) je stabilnı́ pro celou třı́du nelineárnı́ch funkcı́ f (x1 ), které vyhovujı́ podmı́nkám (5.19), je současně absolutně stabilnı́. 5.3.3 Metoda variabilnı́ho gradientu Pomocı́ této metody je možno navrhnout tvar Ljapunovovy funkce a nikoliv jen hledat koeficienty u nějakého tvaru předem zvoleného. Je to vlastně analytická metoda generovánı́ Ljapunovovy funkce, jejı́ž tvar zı́skáme vhodným výpočtem z daných rovnic systému. Ljapunovova věta o stabilitě předpokládá, že V (x) je spojitá a má spojité prvnı́ parciálnı́ derivace. Pak také existuje n-rozměrný vektor grad V (x) = ∇V se složkami (∇V )1 = ∂V ∂x1 (∇V )2 = ∂V ∂x2 ..., (∇V )n = ∂V ∂xn (5.20) Princip metody variabilnı́ho gradientu spočı́vá v tom, že mı́sto funkce V (x) zvolı́me nejprve obecně gradient ∇V a z něho teprve odvodı́me V (x) a V̇ (x) V̇ (x) = dV = (gradV )T ẋ = (∇V )T ẋ. dt (5.21) Provedeme-li analogii mezi potenciálnı́m vektorovým polem a uvedenými vztahy, je patrno, že ∇V tvořı́ vektorové pole a funkce V je jeho potenciál. Zobecnı́me-li vztahy, platné pro běžné trojrozměrné vektorové pole na n-rozměrný prostor, platı́, že potenciálnı́ funkci V můžeme určit z gradientu jako křivkový integrál Z x V = (∇V )T dx. (5.22) 0 Hornı́ mez x integrálu znamená, že integrujeme z počátku do libovolného bodu o souřadnicı́ch (x1 , x2 , ..., xn ) ve stavovém prostoru. V potenciálnı́m poli je křivkový integrál nezávislý na integračnı́ cestě. Nutnou a postačujı́cı́ podmı́nkou pro takové pole je vztah rot ∇V = 0, který má v kartézských souřadnicı́ch tvar ∂(∇V )j ∂(∇V )i = ∂xj ∂xi (i, j = 1, 2, ..., n). (5.23) Integraci ve vztahu (5.22) pak můžeme provést nejjednoduššeji ve směru os V = Z x 0 (∇V )T dx = Z x1 (∇V )1 (ξ1 , 0, 0, ..., 0)dξ1 + 0 + ... + Z x2 (∇V )2 (x1 , ξ2 , 0, ..., 0)dξ2 + 0 Z xn (∇V )n (x1 , x2 , ..., xn−1 , ξn )dξn , (5.24) 0 kde složka vektoru ∇V ve směru xi je (∇V )i = ∂V /∂xi . Věta 5.3. Rovnovážný stav x = 0 systému ẋ = f (x) je asymptoticky stabilnı́ v oblasti Ω, existuje-li taková reálná vektorová funkce ∇V , že platı́ a) vztahy (5.23); b) gradient ∇V nenı́ v oblasti Ω nikde roven nule kromě počátku; c) V̇ (x) je negativně definitnı́ nebo semidefinitnı́; d) množina definovaná vztahem V̇ (x) = 0 neobsahuje žádné trajektorie systému kromě počátku; e) V (x) je pozitivně definitnı́; KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 53 f) jedna z ploch V = konst. uzavı́rá oblast Ω. Shrnutı́ postupu při hledánı́ funkce V (x). Je dán systém ẋ = f (x), x = 0. 1) Volı́me ∇V ve tvaru α11 (x)x1 + α12 (x)x2 + ... + α1n (x)xn (∇V )1 .. . . ∇V = , = . . αn1 (x)x1 + αn2 (x)x2 + ... + αnn (x)xn (∇V )n kde αij má konstantnı́ a variabilnı́ část αij (x) = αijk + αijv (x1 , x2 , ..., xn−1 ), αii (x) = αiik + αiiv (xi ) αijk = αjik i 6= j αiik > 0 2) Vypočteme V̇ (x) = (∇V )T ẋ = (∇V )1 ẋ1 + ...(∇V )n ẋn , a za ẋi dosadı́me pravé strany daného nelineárnı́ho systému. 3) Zvolı́me V̇ (x) tak, aby bylo alespoň negativně semidefinitnı́ (tı́m určı́me část koeficientů αij ). 4) Z n(n − 1)/2 rovnic (5.23) určı́me zbylé koeficienty αij . 5) Určı́me funkci V podle vztahu (5.24) a stanovı́me jejı́ definitnost. Přı́klad 5.4. Určete stabilitu systému podle obr. 5.5 s obecnou nelineárnı́ funkcı́ f (σ), ležı́cı́ v 1. a 3. kvadrantu. Lineárnı́ část systému má přenos (s + 5)/s(s + 2) a podle obr. 5.5 pak můžeme zapsat lineárnı́ část systému ve tvaru ẋ1 = 5x2 + ẋ2 ẋ2 = −2x2 + f (σ) Dosadı́me-li z druhé rovnice do prvnı́ za ẋ2 a za f (σ) položı́me −f (x1 ), pak ẋ1 = 3x2 − f (x1 ) ẋ2 = −2x2 − f (x1 ). Obr.5.5. Stavové schema pro přı́klad 5.4 Pro účely výpočtu zavedeme formálně za funkci f (x1 ), která ležı́ v 1. a 3. kvadrantu součin g(x1 )x1 . Funkce g(x1 ) ležı́ pak v 1. a 2. kvadrantu a je tedy vždy kladná. Zvolme nynı́ gradient ve tvaru α11 x1 + α12 x2 ∇V = , α21 x1 + α22 x2 kde α jsou obecně funkcemi x. Pak V̇ = (α11 x1 + α12 x2 )[3x2 − g(x1 )x1 ] + (α21 x1 + α22 x2 )[−2x2 − g(x1 )x1 ] V̇ = −x21 [α11 g(x1 ) + α21 g(x1 )] − x22 [2α22 − 3α12 ]+ KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 54 +x1 x2 [3α11 − 2α21 − α12 g(x1 ) − α22 g(x1 )] Nejjednoduššı́ způsob volby V̇ (x) negativnı́, je α12 = α21 = 0 a pro eliminaci členu u x1 x2 α11 = α22 g(x1 ). 3 Volı́me-li např. α22 = 6, je α11 = 2g(x1 ) a V̇ = −α11 g(x1 )x21 − 2α22 x22 . Gradient jsme tedy zvolili ve tvaru ∇V = 2g(x1 )x1 6x2 = 2f (x1 ) 6x2 , kde jsme za g(x1 )x1 dosadili zase původnı́ funkci f (x1 ). Integracı́ gradientu podle vztahu (5.24) dostaneme Ljapunovovu funkci Z x1 Z x2 V = 2f (x1 )dx1 + 6x2 dx2 . 0 0 Druhý člen lze integrovat, takže výsledná Ljapunovova funkce je Z x1 V =2 f (x1 )dx1 + 3x22 . 0 Pokud f (x1 ) je kladné pro x1 kladné a f (x1 ) je záporné pro x1 záporné, pak integrál je vždy kladný a V (x) je pozitivně definitnı́. Konverguje-li integrál k nekonečnu pro |x1 | → ∞, pak vrstevnice V (x) jsou uzavřené křivky ve stavové rovině a systém je absolutně globálně asymptoticky stabilnı́. 5.4 Ljapunovovy funkce pro neautonomnı́ systémy Metody vyšetřovánı́ stability autonomnı́ch systémů nynı́ rozšı́řı́me pro neautonomnı́ systémy. Budeme uvažovat nebuzené, časově variantnı́ systémy ẋ = f (t, x) f (t, 0) = 0, (5.25) kde funkce f je spojitá vzhledem k t a spojitě diferencovatelná vzhledem ke stavu x v oblasti Ω = {(t, x) ∈ R×Rn |t ∈ (a, +∞), ||x|| < B, B > 0}. Rovnice (5.25) je jednoznačně řešitelná a má triviálnı́ řešenı́ (rovnovážný stav v nule) pro všechna t > a. Ljapunovova funkce pro neautonomnı́ systémy bude obecně záviset na čase. Uvažujme proto spojitou reálnou funkci V (t, x), V (t, 0) = 0 pro všechna t > a, definovanou v oblasti Ω a spojitě diferencovatelnou vzhledem k proměnným t a x na Ω. Definice 5.3. Funkce V (t, x) je a) pozitivně semidefinitnı́ (resp. negativně semidefinitnı́) v oblasti Ω právě tehdy, když V (t, x) ≥ 0 (resp. V (t, x) ≤ 0) pro všechna (t, x) ∈ Ω; b) pozitivně definitnı́ (resp. negativně definitnı́) na Ω právě tehdy, když existuje taková reálná funkce W (x), definovaná a spojitá v oblasti Ω0 = {x ∈ Rn | ||x|| < B}, že platı́ V (t, x) ≥ W (x) > 0 resp. V (t, x) ≤ −W (x) < 0 (5.26) pro (t, x) ∈ Ω, x 6= 0 a V (t, 0) = W (0) = 0; c) klesajı́cı́, jestliže existuje časově invariantnı́ pozitivně definitnı́ funkce W1 (x) taková, že W1 (x) ≥ V (t, x) pro všechna t ≥ t0 . KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 55 Přı́klad 5.5. a) Funkce V (t, x) = (1 + sin2 t)(x21 + x22 ) je pozitivně definitnı́, protože splňuje podmı́nku V (t, x) ≥ W (x) = x21 + x22 . Je také klesajı́cı́, protože W1 (x) = 2(x21 + x22 ) ≥ V (t, x). b) Funkce V (t, x) = (t + 1)(x21 + x22 ) je pozitivně definitnı́, protože V ≥ W (x) = x21 + x22 . Je také radiálně neohraničená, ale nenı́ klesajı́cı́, protože pro každé x 6= 0 je V jako funkce času neohraničená. c) Funkce V = x21 + x22 − 2bx1 x2 ebt je pozitivně definitnı́ pro −1 < b ≤ 0 a pozitivně semidefinitnı́ pro b = −1. Derivace funkce V podél řešenı́ soustavy (5.25) je V̇ (t, x) = ∂V ∂V ∂V + f1 (t, x) + ... + fn (t, x). ∂t ∂x1 ∂xn (5.27) Věta 5.4. (Ljapunovská stabilita). Existuje-li na oblasti Ω pozitivně definitnı́ spojitě diferencovatelná funkce V (t, x) a jejı́ derivace podél řešenı́ systému (5.25) je negativně semidefinitnı́, pak triviálnı́ řešenı́ je ljapunovsky stabilnı́ na Ω. Platı́-li uvedené podmı́nky a V je klesajı́cı́, je triviálnı́ řešenı́ stejnoměrně (ljapunovsky) stabilnı́. Věta 5.5. (Asymptotická stabilita). Existuje-li na oblasti Ω pozitivně definitnı́ spojitě diferencovatelná funkce V (t, x) a jejı́ derivace je negativně definitnı́, pak triviálnı́ řešenı́ je asymptoticky stabilnı́. Platı́-li uvedené podmı́nky a V je klesajı́cı́, je triviálnı́ řešenı́ stejnoměrně asymptoticky stabilnı́. Jsou-li dosud uvedené podmı́nky splněny v celém stavovém prostoru a V (t, x) je radiálně neohraničená, je triviálnı́ řešenı́ globálně stejnoměrně asymptoticky stabilnı́. Přı́klad 5.6. Uvažujme systém ẋ1 = −x1 − e−2t x2 ẋ2 = x1 − x2 Pro určenı́ stability rovnovážného bodu 0 zvolme Ljapunovovu funkci ve tvaru V (t, x) = x21 + (1 + e−2t )x22 . Tato funkce je pozitivně definitnı́, protože je většı́ než časově invariantnı́ pozitivnı́ funkce W (x) = x21 + x22 . Je také klesajı́cı́, protože je menšı́ než pozitivně definitnı́ funkce W1 (x) = x21 + 2x22 . Derivace V̇ je V̇ (t, x) = −2[x21 − x1 x2 + x22 (1 + 2e−2t )] a je patrno, že V̇ ≤ −2(x21 − x1 x2 + x22 ) = −(x1 − x2 )2 − x21 − x22 Funkce V je radiálně neohraničená, V̇ je negativně definitnı́, rovnovážný stav 0 je proto globálně asymptoticky stabilnı́. Přı́klad 5.7. Je dán systém druhého řádu s časově proměnným tlumenı́m ẍ + a(t)ẋ + bx = 0 tj. ẋ1 = x2 ẋ2 = −a(t)x2 − bx1 . Uvažujme pozitivně definitnı́ funkci V (t, x) = a volme β(t) = b − α2 + αa(t), α < √ 1 1 (αx1 + x2 )2 + β(t)x21 2 2 b. Derivace podél řešenı́ systému je α V̇ = [α − a(t)]x22 + [ȧ(t) − 2b]x21 2 V̇ je negativně definitnı́, jestliže a(t) > α > 0, ȧ(t) < 2b. Za předpokladu, že a(t) je shora ohraničené (V je klesajı́cı́), je rovnovážný stav 0 asymptoticky stabilnı́. KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA 5.5 56 Věty o nestabilitě Kromě uvedených vět o stabilitě systému jsou v literatuře formulovány také různé věty o nestabilitě, které jsou užitečné předevšı́m tehdy, jestliže se nepodařı́ najı́t vhodnou Ljapunovovu funkci a určit stabilitu. Dvě základnı́ věty o nestabilitě podal již Ljapunov, v mnoha praktických přı́padech vede však snadněji k cı́li věta, kterou odvodil Četajev. Dále uvedených vět lze přı́mo použı́t pro neautonomnı́ systémy, u autonomnı́ch systémů lze podmı́nky snadno zjednodušit. Důkazy uvedených vět lze nalézt např. v [55]. Věta 5.6. (Prvnı́ věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná klesajı́cı́ skalárnı́ funkce V (t, x) taková, že pro čas t0 ≥ 0 platı́: 1) V (t, 0) = 0 pro všechna t ≥ t0 , 2) V (t0 , x) může nabývat kladných hodnot libovolně blı́zko počátku, 3) V̇ (t, x) je pozitivně definitnı́ v Ω. Věta 5.7. (Druhá věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná klesajı́cı́ skalárnı́ funkce V (t, x) a platı́: 1) V (t0 , 0) = 0, 2) V (t0 , x) může nabývat kladných hodnot libovolně blı́zko počátku, 3) V̇ (t, x) − λV (t, x) ≥ 0, ∀ t ≥ t0 ∀ x ∈ Ω, konstanta λ > 0. Věta 5.8. (Četajevova věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná skalárnı́ funkce V (t, x), existuje oblast Ω1 ⊆ Ω a platı́: 1) V (t, x) a V̇ (t, x) jsou pozitivně definitnı́ v Ω1 , 2) počátek je hraničnı́m bodem Ω1 , 3) v hraničnı́ch bodech oblasti Ω1 je V (t, x) = 0 pro všechna t ≥ t0 . Přı́klad 5.8. Systém je zadán rovnicemi ẋ1 = x2 + x1 (x21 + x42 ) ẋ2 = −x1 + x2 (x21 + x42 ). Linearizacı́ kolem rovnovážného stavu (0,0) dostaneme systém ẋ1 = x2 a ẋ2 = −x1 . Vlastnı́ čı́sla jsou ±j, takže nelze posoudit stabilitu podle prvnı́ Ljapunovovy metody. Zvolı́me-li Ljapunovovu funkci V = (x21 +x22 )/2, je jejı́ derivace V̇ = (x21 + x22 )(x21 + x42 ). Protože V i V̇ jsou pozitivně definitnı́, je podle věty 5.6 stav (0,0) nestabilnı́. Přı́klad 5.9. Systém je popsán rovnicemi ẋ1 = x1 + 2x2 + x1 x22 ẋ2 = 2x1 + x2 − x21 x2 . Zvolme funkci V (x) = x21 − x22 , která nenı́ pozitivně definitnı́, ale může nabývat kladných hodnot libovolně blı́zko počátku. Jejı́ derivace je V̇ = 2x21 − 2x22 + 4x21 x22 = 2V + 4x21 x22 . Druhá věta o nestabilitě ukazuje, že rovnovážný stav v počátku je nestabilnı́. 5.6 Úlohy 5.1. Vyšetřete podmı́nky stability rovnovážného stavu systémů a) ẋ1 = x2 ẋ2 = −a(x1 ) − b(x2 ); a(0) = b(0) = 0 b) ẋ1 = x2 ẋ2 = x3 ẋ3 = −cx3 − bx2 − a(x1 ); a(0) = 0 c) ẋ1 = x2 ẋ2 = x3 ẋ3 = −cx3 − b(x2 ) − a(x1 ); a(0) = b(0) = 0 d) ẋ1 = x2 ẋ2 = x3 ẋ3 = −c(x3 ) − b(x2 ) − a(x1 ); a(0) = b(0) = c(0) = 0 e) ẋ1 = x2 ẋ2 = x3 ẋ3 = −c(x1 , x2 ) − bx2 − ax1 ; f) ẋ1 = x2 ẋ2 = x3 ẋ3 = −c(x1 , x2 ) − b(x2 ) − a(x1 ); a(0) = b(0) = 0 g) ẋ1 = ax21 + bx1 x2 + cx22 ẋ2 = kx1 − x2 + mx21 + nx22 + px1 x2 h) ẋ = ayz ẏ = −bxz ż = cxy 5.2. Vyšetřete podmı́nky stability rovnovážného stavu pomocı́ metody variabilnı́ho gradientu pro systémy KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA a) ẋ1 = x2 ẋ2 = −x2 − x31 b) ẋ1 = x2 ẋ2 = −ax1 − 2b|x1 |x2 2 3 c) ẋ1 = ax1 + bx2 ẋ2 = −cx2 + dx31 57 Kapitola 6 Speciálnı́ systémy 6.1 Gradientnı́ systémy Definice 6.1. Dynamický systém ẋ = f (x), pro který existuje taková dvakrát spojitě diferencovatelná funkce V : Rn → R, že platı́ f = −grad V (x), se nazývá gradientnı́ systém. Jeho rovnice pohybu lze zı́skat z potenciálu V (x) ∂V dxi = fi (x) = − dt ∂xi Protože pro druhé parciálnı́ derivace platı́ i = 1, ..., n. (6.1) ∂2V ∂2V = ∂xi ∂xj ∂xj ∂xi (6.2) je ẋ = f (x) gradientnı́m systémem pouze tehdy, jestliže ∂fi ∂fj (x) = (x) ∂xj ∂xi i, j = 1, ..., n ∀x ∈ Rn (6.3) Vektorové pole f musı́ tedy být potenciálové, jeho rotace rot f = 0. Je-li systém ẋ = f (x) gradientnı́, je potenciálnı́ funkce V jeho Ljapunovovou funkcı́. Věta 6.1. Gradientnı́ systém ẋ = −grad V (x) má tyto vlastnosti: a) V regulárnı́ch bodech (grad V (x) 6= 0) protı́najı́ trajektorie systému ekvipotenciálnı́ plochy V (x) = konst. ortogonálně. b) Pevné body systému jsou kritické body funkce V , tj. body, v nichž grad V = 0. c) Ostrá minima funkce V jsou asymptoticky stabilnı́ pevné body. d) Hyperbolické pevné body jsou n-dimenzionálnı́ uzly nebo sedla. e) Uzavřené trajektorie nemohou vzniknout. Matice linearizace A s prvky Aij = (∂fi /∂xj )(x) pro i, j = 1, ..., n je vzhledem k platnosti (6.3) symetrická a má proto jen reálná a různá vlastnı́ čı́sla, která jsou nenulová, je-li A regulárnı́. Ostrá minima funkce V odpovı́dajı́ asymptoticky stabilnı́m uzlům, maxima V nestabilnı́m uzlům a sedlové body V jsou také sedlovými body diferenciálnı́ rovnice. Pohyb v gradientových systémech odpovı́dá přetlumenému pohybu mechanické částice ve vnějšı́m potenciálovém poli podél spádnic funkce V k nejbližšı́mu minimu nebo sedlu. Ekvipotenciálnı́ plocha je množina M = {x|V (x) = konst.} a má v regulárnı́m bodě x tečnou hyperrovinu dimenze n − 1. Normálový vektor ν = grad V (x) 6= 0 směřuje v opačném směru než vektor fázové rychlosti f (x) na trajektorii systému. Má-li funkce V v bodě x ostré minimum, je v učitém okolı́ U bodu x pozitivně definitnı́. Jejı́ derivace n n X X ∂V dV ∂V (x) = (x)fi (x) = − (x) dt ∂xi ∂xi i=1 i=1 58 2 ≤0 (6.4) KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 59 Protože složky gradientu jsou v minimu nulové, je x (lokálně) asymptoticky stabilnı́. Přı́klad 6.1. 1. Všechny systémy popsané diferenciálnı́ rovnicı́ 1. řádu ẋ = f (x) jsou gradientnı́. 2. Systém 2. řádu se stavovými proměnnými x, y 1 ẏ = −ay + (x2 − y 2 ) 2 ẋ = −ax + xy je gradientnı́ systém ∂V ẋ = − ∂x ∂V ẏ = − ∂y a 1 V (x, y) = (x2 + y 2 ) + 2 2 y3 − x2 y 3 ! √ Rovnovážné stavy jsou stabilnı́ uzel v bodě (0, 0) a sedla v bodech (0, −2a) a (± 3a, a). 6.2 Pasivnı́ a disipativnı́ dynamické systémy V této části se budeme zabývat různými speciálnı́mi systémy, které se nazývajı́ pasivnı́, disipativnı́, konzervativnı́, bezeztrátové, pozitivně reálné, striktně pozitivně reálné apod. Postupně podáme definice těchto systémů a budeme studovat jejich vlastnosti a vzájemné vztahy. V dalšı́ch kapitolách uvidı́me, že tyto speciálnı́ systémy jsou výhodné např. při určovánı́ stability složitých nelineárnı́ch systémů, při návrhu exaktnı́ch linearizacı́ pro syntézu nelineárnı́ch řı́dı́cı́ch systémů aj. Nejprve si všimneme některých základnı́ch vlastnostı́ autonomnı́ch disipativnı́ch systémů, obecnějšı́ úvahy budou předmětem odstavce 6.2.2. Autonomnı́ dynamický systém ẋ = f (x) je ve fázovém prostoru Rn definován vektorovým polem f (x), které můžeme interpretovat jako rychlostnı́ pole fázového toku Φt . Divergence vektorového pole f n X ∂fi (x) (6.5) divf = ∂xi i=1 určuje rychlost změny velikosti objemového elementu υ(t) v bodě x vlivem toku Φt . Podle Liouvilleovy věty známé z mechaniky, je rychlost změny objemového elementu v čase t dána vztahem dυ = dt Z divf (x) dx. (6.6) υ Je-li div f konstantnı́ (nezávislá na x), pak dυ/dt = υ(t)divf a po integraci υ(t) = υ(0)et divf . (6.7) Je-li div f záporná, objemový element pod vlivem fázového toku kontrahuje a dynamický systém je disipativnı́. Podmı́nka div f < 0 však nenı́ pro disipativnı́ systém nutná, protože stačı́, aby objemové elementy kontrahovaly v časové limitě lim υ(t) = 0, (6.8) t→∞ přičemž v některých časových intervalech může dojı́t i k expanzi objemového elementu. Např. Van der Polův oscilátor (odst. 2.3.2) ẋ1 = x2 ẋ2 = ε(1 − x21 )x2 − x1 je disipativnı́ systém, ale div f (x1 , x2 ) = ε(1 − x21 ) může být kladná i záporná. KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 60 V kap. 12 uvedeme přı́klady dynamických disipativnı́ch systémů, které vykazujı́ chaotické chovánı́. V čl. 12.3 odvodı́me tzv. Ljapunovovy exponenty a ukážeme, že dynamický systém je disipativnı́, když součet všech Ljapunovových exponentů je záporný. Neexistuje však žádné jednoduché kritérium, které by z dané diferenciálnı́ rovnice umožnilo stanovit, zda systém je disipativnı́. Většinou to ale lze poznat z vlastnostı́ reálného systému, který matematickým modelem popisujeme. Disipativnı́ jsou např. mechanické systémy s viskóznı́m tlumenı́m nebo třenı́m, elektrické obvody s odporovými prvky, tepelné systémy, chemické reakce a jiné ireverzibilnı́ procesy. Kontrakce objemu u disipativnı́ho systému je lokálnı́ vlastnost, kterou můžeme ověřit v každém bodě prostoru v libovolném čase. V důsledku této kontrakce se u disipativnı́ch systémů po uplynutı́ dostatečně dlouhé doby soustředı́ chovánı́ v okolı́ relativně malé podmnožiny fázového prostoru nebo přı́mo na množině, která se nazývá atraktor. Různé typy atraktorů jsme poznali v kap. 2. Jestliže u dynamického systému ẋ = f (x) je div f = 0, pak elementárnı́ objem v Rn zůstává v čase konstantnı́, objemový element může ovšem měnit svůj tvar. Dynamický systém se pak nazývá konzervativnı́ (bezeztrátový). Přı́kladem jsou hamiltonovské systémy klasické mechaniky. U konzervativnı́ch systémů neexistujı́ oblasti přitažlivosti ani atraktory. Nejjednoduššı́m atraktorem disipativnı́ho systému je rovnovážný stav. Jeho stabilitu jsme v kap. 5 vyšetřovali pomocı́ Ljapunovových funkcı́, které jsme volili jako celkovou energii systému nebo jako složitějšı́ funkci, která představuje jakousi ”zobecněnou” energii. U izolovaného disipativnı́ho systému, u něhož nenı́ zvnějšku dodávána ani energie ani hmota, se chovánı́ v čase asymptoticky blı́žı́ k rovnovážnému stavu, který představuje termodynamickou rovnováhu. Složitějšı́ situace nastává v přı́padě, kdy systém vyměňuje s okolı́m energii nebo i hmotu. Pak je třeba definovat vstupy a výstupy systému a zavést obecnějšı́ pojetı́ disipativnı́ho systému. To bude náplnı́ odstavce 6.2.2. Předtı́m však budeme ještě definovat tzv. pozitivně reálné lineárnı́ systémy. 6.2.1 Pozitivně reálné lineárnı́ systémy Při analýze a syntéze nelineárnı́ch systémů je často možno dekomponovat zadaný systém na lineárnı́ část a nelineárnı́ subsystém. Jestliže přenos lineárnı́ho subsystému je tzv. pozitivně reálný, má výhodné vlastnosti, které umožňujı́ např. podstatně jednoduššı́ řešenı́ stability složeného systému. Lineárnı́ systémy s pozitivně reálnými přenosy se nazývajı́ pozitivně reálné a majı́ velký význam pro analýzu i návrh mnoha složitých nelineárnı́ch systémů. Uvažujme přenos lineárnı́ho systému s jednı́m vstupem a jednı́m výstupem ve tvaru racionálnı́ lomené funkce bm sm + bm−1 sm−1 + ... + b0 G(s) = (6.9) sn + an−1 sn−1 + ... + a0 kde koeficienty jsou reálné a n ≥ m. Rozdı́l n − m mezi stupněm jmenovatele a čitatele se nazývá relativnı́ stupeň systému. Definice 6.2. Přenos G(s) je pozitivně reálný (PR), jestliže Re [G(s)] ≥ 0 ∀ Re (s) ≥ 0. (6.10) Přenos G(s) je striktně pozitivně reálný (SPR), jestliže G(s − ε) je pozitivně reálný pro nějaké ε > 0. Podmı́nka pozitivnı́ reálnosti (6.10) znamená, že G(s) má vždy kladnou nebo nulovou reálnou část, má-li s = σ + jω kladnou nebo nulovou reálnou část σ. Pro přenosy vyššı́ho stupně je často obtı́žné určit pozitivnı́ reálnost přı́mo z definice (6.2), protože je třeba testovat podmı́nku (6.10) v celé pravé polorovině. Lze však využı́t tuto větu: Věta 6.2.. Přenos G(s) je striktně pozitivně reálný tehdy a jen tehdy, jestliže KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 61 a) G(s) je striktně stabilnı́ (póly jsou jen v levé polorovině) b) reálná část G(s) je striktně pozitivnı́ podél osy jω, tj. Re G(jω) > 0 pro všechna ω ≥ 0. Z podmı́nky b) věty 6.2 vyplývá, že systém se striktně pozitivně reálným přenosem G(s) má frekvenčnı́ charakteristiku v pravé komplexnı́ polorovině, má relativnı́ stupeň 0 nebo 1 a je minimálně fázový (všechny jeho nuly jsou v levé polorovině). To vyplývá z vlastnostı́ Nyquistových křivek, které majı́ u neminimálně fázových systémů a u systémů s relativnı́m stupněm r > 1 fázové posuny většı́ než 90o při vyššı́ch frekvencı́ch. Věta 6.3. Přenos G(s) je pozitivně reálný tehdy a jen tehdy, jestliže a) G(s) má jen póly s nekladnou reálnou částı́, přičemž póly na imaginárnı́ ose jsou jednonásobné s reálnými nezápornými rezidui b) Re G(jω) ≥ 0 pro taková ω ≥ 0, pro která jω nenı́ pólem G(s). Pozitivně reálné přenosy mohou mı́t tedy póly i na imaginárnı́ ose, striktně pozitivně reálné nikoliv. Definice 6.3. Lineárnı́ systém ẋ = Ax + bu y = cT x, (6.11) jehož přenos G(s) = cT (sI − A)−1 b splňuje podmı́nky věty 6.2, se nazývá striktně pozitivně reálný systém. Jsou-li splněny podmı́nky věty 6.3, jedná se o pozitivně reálný systém. Definice PR a SPR přenosů lze rozšı́řit na přenosové matice pro systémy s většı́m počtem vstupů a výstupů. Definice 6.4. Přenosová matice G(s) rozměru m × m je striktně pozitivně reálná, jestliže všechny jejı́ prvky Gij (s) jsou striktně stabilnı́ a pro všechna ω ≥ 0 platı́ G(jω) + G? (jω) > 0, (6.12) kde matice G? (jω) = GT (−jω). Věta 6.4. Je dán exponenciálně stabilnı́ lineárnı́ časově invariantnı́ systém s vı́ce vstupy a výstupy v minimálnı́ realizaci ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t) (6.13) s přenosovou maticı́ G(s) = D + C(sI − A)−1 B, (6.14) kde x ∈ Rn , u, y ∈ Rm a matice majı́ odpovı́dajı́cı́ rozměry. Předpokládejme dále, že m < n a B má plnou hodnost. Daný systém je striktně pozitivně reálný, platı́-li pro všechna ω ≥ 0 vztah G(jω) + G? (jω) > 0 (6.15) Důkaz této věty lze nalézt např. v [52]. Je třeba poznamenat, že někteřı́ autoři definujı́ striktně pozitivnı́ reálnost odlišnými způsoby a existuje proto vı́ce přı́stupů k tomuto konceptu. Podrobné srovnánı́ různých definic lze nalézt v [95]. Kalmanovo-Jakubovičovo lemma Jednou z nejužitečnějšı́ch vlastnostı́ pozitivně reálných lineárnı́ch systémů je ekvivalence mezi stavovou reprezentacı́ systému v časové oblasti a pozitivně reálným přenosem ve frekvenčnı́ oblasti. Tyto vztahy odvodili v různých formách Kalman, Jakubovič, Popov a jinı́ a jsou dnes nejčastěji známy pod názvem Kalmanovo-Jakubovičovo lemma. Toto lemma má velký význam v teorii stability lineárnı́ch i nelineárnı́ch systémů, při analýze robustnosti, v adaptivnı́m řı́zenı́, v teorii obvodů a jinde. KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 62 Obecnou formulaci provedeme nejprve pro striktně pozitivně reálné lineárnı́ t-invariantnı́ systémy s vı́ce vstupy a výstupy. Lemma 6.1 (Kalman-Jakubovič). Uvažujme systém popsaný vztahy (6.13) a (6.14), kde x ∈ Rn a y, u ∈ Rm , m < n. Předpokládejme, že matice A je Hurwitzova, pár (A, B) je řiditelný, pár (C, A) je pozorovatelný a ∀ ω ≥ 0. (6.16) G(jω) + G? (jω) > 0 Za těchto podmı́nek existuje symetrická pozitivně definitnı́ matice P ∈ Rn×n , matice Q ∈ Rm×n , W ∈ Rm×m a ε > 0, že platı́ AT P + P A = −QT Q − εP BT P + W T Q = C W T W = D + DT (6.17) Přenosová matice G vyhovujı́cı́ podmı́nce (6.16) je striktně pozitivně reálná. Důkaz lze nalézt např. v [55,74]. Vyžaduje několik speciálnı́ch poznatků z teorie lineárnı́ch systémů a je náročný. Jednoduššı́ verzi uvedené věty je možno odvodit pro systémy s jednı́m vstupem a jednı́m výstupem. Nenı́-li navı́c přı́má vazba mezi vstupem a výstupem, pak platı́ toto lemma: Lemma 6.2. Časově invariantnı́ řiditelný lineárnı́ systém ẋ = Ax + bu y = cT x (6.18) má přenos G(s) = cT (sI − A)−1 b striktně pozitivně reálný tehdy a jen tehdy, existujı́-li takové pozitivně definitnı́ matice P a Q, že platı́ AT P + P A = −Q P b = c. (6.19) Důkaz je uveden např. v [52]. Lemma 6.2 lze snadno rozšı́řit na systémy pouze pozitivně reálné. U nich musı́ platit podmı́nky (6.19) za zjednodušeného předpokladu, že matice Q může být pouze pozitivně semidefinitnı́. Lemma lze pak použı́t i na přenosy obsahujı́cı́ ideálnı́ integrátor 1/s. V dalšı́ kapitole použijeme pro odvozenı́ Popovova kritéria ještě jinou verzi uvedeného lemmatu, kterou odvodil rovněž Kalman. Pasivita a disipativita lineárnı́ch systémů Doposud uvedené definice a věty se týkaly pouze pozitivně reálných a striktně pozitivně reálných matic a systémů. Nynı́ přejdeme k pojmům pasivita a disipativita. Definice 6.5. Lineárnı́ systém s jednı́m vstupem a jednı́m výstupem definovaný rovnicemi (6.11) je pasivnı́ tehdy a jen tehdy, je-li pozitivně reálný, tj. splňuje-li jeho přenos podmı́nky věty 6.3. Systém je disipativnı́ tehdy a jen tehdy, je-li striktně pozitivně reálný, tj. splňuje-li jeho přenos podmı́nky věty 6.2. Podobná definice platı́ i pro systém s vı́ce vstupy a výstupy. Je třeba zdůraznit, že se tyto pojmy nepoužı́vajı́ v literatuře jednotně. Pojetı́ pasivity vzniklo původně v teorii elektrických obvodů, kde jako pasivnı́ systém se označuje systém tvořený pouze z pasivnı́ch prvků, tedy z kondenzátorů, indukčnostı́ a odporů (rezistorů). Zvolı́me-li vhodně v takovém obvodu vstupnı́ a výstupnı́ veličinu, můžeme definovat přenos, který je pozitivně reálný podle definice 6.2. Pak je pasivnı́ systém pozitivně reálný (ve smyslu zvoleného vstupu a výstupu). Vybereme-li však vstupnı́ a výstupnı́ veličinu u daného obvodu nevhodně, nebude již přenos pozitivně reálný a obvod, složený ze stejných pasivnı́ch prvků, nebude vyhovovat podmı́nce pasivity podle definice 6.5. Jako pasivnı́ budeme tedy definovat jen takový systém, který je vzhledem ke zvolenému vstupu a výstupu pozitivně reálný. Např. systém hmota, pružina, tlumič popsaný rovnicı́ mẍ + bẋ + cx = u, KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 63 kde vstupem je sı́la u a výstupem rychlost ẋ, je pozitivně reálný. Zvolı́me-li však za výstupnı́ veličinu polohu x, nenı́ již systém pozitivně reálný, a nenı́ tedy ani pasivnı́ ve smyslu definice 6.5, i když je složen pouze z pasivnı́ch prvků. 6.2.2 Obecná teorie disipativnı́ch systémů Teorie disipativnı́ch systémů zobecňuje známé fyzikálnı́ principy přenosu a zachovánı́ energie. Dodáváli se disipativnı́mu systému energie, část této energie disipuje a část zůstane v systému akumulována. Podobně je tomu při výdeji energie systémem. Disipativnı́ systém může tedy dodat do výstupu jen část toho, co naakumuloval a může akumulovat jen část energie, která mu byla vstupem dodána. Tyto fyzikálnı́ úvahy lze rozšı́řit a formulovat teorii disipativnı́ch systémů pomocı́ zobecněných energiı́ a výkonů. Nejprve zavedeme některé základnı́ pojmy použı́vané v obecné teorii disipativnı́ch systémů. Jsou obsaženy předevšı́m v lit. [60,71], kde lze nalézt také důkazy dále uvedených vět. Vzhledem k dalšı́mu praktickému využitı́ v teorii nelineárnı́ch disipativnı́ch systémů, budeme mı́sto zcela obecného systému uvažovat v aplikacı́ch nejčastěji se vyskytujı́cı́ nelineárnı́ afinnı́ systém ẋ = f (x) + G(x)u y = h(x), (6.20) kde x ∈ X = Rn , množina vstupnı́ch hodnot U = Rm , množina výstupnı́ch hodnot Y = Rm , f a m sloupců matice G jsou hladká vektorová pole a h je hladké zobrazenı́. Množina přı́pustných vstupů U s hodnotami v U je tvořena po úsecı́ch spojitými funkcemi definovanými na R. Předpokládejme dále, že f má alespoň jeden rovnovážný stav, který můžeme bez ztráty obecnosti uvažovat v počátku, tedy f (0) = 0 a h(0) = 0. Necht’ w(t) = w(u(t), y(t)) je reálná funkce definovaná na U × Y , která představuje zobecněný výkon a kterou budeme nazývat zásobovacı́ tok (angl. supply rate). Předpokládejme, že pro každé u ∈ U a každé x0 ∈ X je výstup y(t) takový, že w(t) splňuje vztah Z 0 t |w(τ )|dτ < ∞ ∀ t ≥ 0, (6.21) tj. funkce w je lokálně integrovatelná. Definice 6.6. Dynamický systém (6.20) se zásobovacı́m tokem w je disipativnı́, jestliže existuje spojitá nezáporná funkce V : X → R taková, že pro všechna u ∈ U, x0 ∈ X, t ≥ 0 Z V (x) − V (x0 ) ≤ t w(τ )dτ, (6.22) 0 kde x = x(t; x0 , u). Funkce V se nazývá akumulačnı́ funkce (někdy také zásobnı́ funkce, angl. storage function). Nerovnost (6.22) je tzv. disipačnı́ nerovnost. Definice 6.7. Dostupná zásoba (nebo také výstupnı́ akumulačnı́ funkce, angl. available storage) Va dynamického systému s tokem w je funkce Va : X → R definovaná vztahem Va (x) = sup − Z t w(τ )dτ . (6.23) 0 Supremum se určı́ přes všechny pohyby začı́najı́cı́ ve stavu x0 v čase 0 a přes všechna u ∈ U. Dostupná zásoba je maximálnı́ množstvı́ zásoby, která může být v každém okamžiku extrahována z dynamického systému. Funkce Va (x) je nezáporná, protože je to supremum z množiny čı́sel, které obsahujı́ nulový prvek. Pojem dostupné zásoby je zobecněnı́m pojetı́ ”dostupné energie”. KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 64 Dostupná zásoba Va je základnı́ funkcı́ pro určenı́, zda systém je či nenı́ disipativnı́. To specifikuje následujı́cı́ věta. Věta 6.5. Jestliže systém se zásobovacı́m tokem w je disipativnı́, dostupná zásoba Va (x) je konečná pro každé x ∈ X a splňuje podmı́nku 0 ≤ Va (x) ≤ V (x). (6.24) pro každé x ∈ X. Jestliže Va je třı́dy C 0 , pak Va je sama možnou akumulačnı́ funkcı́ V (x). Obráceně platı́, že systém je disipativnı́, jestliže Va (x) je třı́dy C 0 a konečná pro každé x ∈ X. Podrobnějšı́m rozborem obecných vlastnostı́ výše uvedených funkcı́ lze ukázat, že funkce toku w může být vybrána různým způsobem. Zvláště důležité jsou volby: w = ||u||2 − ||y||2 , w = (u, y), w = (u + ay, u + by) a některé dalšı́. Z hlediska aplikacı́ budeme dále uvažovat w jako skalárnı́ součin (u, y), který budeme psát ve tvaru y T u. Pomocı́ této volby, která velmi úzce souvisı́ s fyzikálnı́ představou výkonu nebo zobecněného výkonu, můžeme definovat pasivitu a pozitivnı́ reálnost z odst. 6.2.1 i pro nelineárnı́ systémy. Definice 6.8. Nelineárnı́ systém (6.20) je pasivnı́, jestliže existuje taková C 0 nezáporná akumulačnı́ funkce V : X → R, V (0) = 0, která splňuje disipačnı́ nerovnost (6.22) pro funkci w(u, y) = y T u. Platı́ tedy Z t V (x) − V (x0 ) ≤ y T (τ )u(τ )dτ. (6.25) 0 Systém (6.20) je pozitivně reálný, jestliže pro x0 = 0, t ≥ 0 a všechna přı́pustná řı́zenı́ u ∈ U platı́ nerovnost Z t 0 y T (τ )u(τ )dτ ≥ 0. (6.26) Poznámky: 1) Jestliže V (0) = 0 a V (x) ≥ 0, pak z (6.25) vyplývá, že každý pasivnı́ systém je pozitivně reálný. 2) Definice 6.8 představuje rozšı́řenı́ pojmu pozitivnı́ reálnosti na nelineárnı́ systémy. Nelze tu ovšem jednoduše testovat pozitivnı́ reálnost pomocı́ frekvenčnı́ch charakteristik jako u lineárnı́ho systému. 3) Pro x0 6= 0 je V (x0 ) > 0. Položı́me-li v (6.25) u = 0, je patrno, že funkce V klesá podél jakékoliv trajektorie nebuzeného systému. Z toho vyplývá, že pasivnı́ systémy s pozitivně definitnı́ funkcı́ V jsou ljapunovsky stabilnı́. Funkce V je Ljapunovovou funkcı́ pro systém ẋ = f (x). Budeme-li naopak volit takové řı́zenı́ u, aby výstup y se udržoval na nulové hodnotě, vyplývá z nerovnosti (6.25), že V je rovněž klesajı́cı́ podél jakékoliv trajektorie, která vyhovuje omezujı́cı́ podmı́nce y = 0. V kap. 15 uvidı́me, že všechny takové trajektorie definujı́ tzv. nulovou dynamiku nelineárnı́ho systému (6.20), jejı́ž stabilita hraje důležitou roli při syntéze řı́zenı́ pomocı́ exaktnı́ linearizace. Stabilita nulové dynamiky se ale velmi obtı́žně vyšetřuje. Z nerovnice (6.25) však vyplývá, že pasivnı́ systémy s pozitivně definitnı́ funkcı́ V majı́ tuto nulovou dynamiku ljapunovsky stabilnı́. 4) Pasivnı́ systém je bezeztrátový, jestliže v definici (6.8) je V (x) − V (x0 ) = Z t y T (τ )u(τ )dτ. (6.27) 0 5) Pasivnı́ systém podle definice 6.8 je striktně pasivnı́, existuje-li taková pozitivně definitnı́ funkce S : X → R, že pro všechna u ∈ U, x0 ∈ X, t ≥ 0 je V (x) − V (x0 ) = Z 0 t y T (τ )u(τ )dτ − Z 0 t S(x(τ ))dτ. (6.28) KAPITOLA 6. SPECIÁLNÍ SYSTÉMY 65 Funkce S představuje disipovaný výkon. Přı́klad 6.2. Mechanický systém, který tvořı́ hmota m, pružina s nelineárnı́ direktivnı́ silou a nelineárnı́ tlumič, je popsán např. rovnicı́ mẍ + x2 ẋ + x3 = u, kde vstupnı́ veličina u je vnějšı́ působı́cı́ sı́la F. Jestliže zvolı́me jako výstupnı́ veličinu rychlost ẋ, je systém pasivnı́ (vzhledem ke zvolenému vstupu a výstupu), protože ho můžeme zapsat ve tvaru (6.28) 1 1 mẋ2 + x4 = 2 4 Z 0 t ẋF dτ − Z t x2 ẋ2 dτ. (6.29) 0 Funkce V (x) je celková energie (kinetická a potenciálnı́) akumulovaná v systému a S = x2 ẋ2 je disipovaný výkon. Pasivnı́ dynamické systémy jsou výhodné při analýze složitých dynamických systémů, při studiu stability zpětnovazebnı́ch systémů (kap. 7 a 8), při návrhu exaktnı́ch linearizacı́ (kap. 15), v teorii elektrických obvodů aj. Paralelnı́ a zpětnovazebnı́ kombinace pasivnı́ch systémů vytvářejı́ opět pasivnı́ systémy a akumulačnı́ funkce V (Ljapunovovy funkce) a funkce S ve vztahu (6.28) majı́ aditivnı́ charakter X X V = Vi , S= Si . i i Podrobný rozbor lze nalézt např. v [52,71]. Teorie disipativnı́ch systémů je hluboce propracována v zobecněné termodynamice nevratných (ireverzibilnı́ch) procesů a disipativnı́ch struktur, které majı́ stěžejnı́ význam pro chemické a biologické systémy. Kapitola 7 Absolutnı́ stabilita V této kapitole se budeme zabývat určovánı́m stability nelineárnı́ch systémů, ve kterých lze oddělit dynamickou lineárnı́ část od nelineárnı́ch statických prvků (obr. 7.1). Tento typ úlohy se v literatuře nazývá také Lurjeho problém. Lineárnı́ část je obecně definována přenosovou maticı́ G(s) nebo stavovými rovnicemi ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t), (7.1) nelineárnı́ část obsahuje statické prvky z(t) = φ(t, y), které budou u jednotlivých úloh definovány podrobněji. Zpětnovazebnı́ spojenı́ mezi prvky je u(t) = −z(t). Dále budeme uvažovat jen systémy se stejným počtem vstupů a výstupů, kde x ∈ Rn , u, y, z ∈ Rm . V teorii stability se ukázalo výhodné zjišt’ovat stabilitu uzavřené smyčky z vlastnostı́ otevřené smyčky. Takovou metodou je u lineárnı́ch systémů předevšı́m velmi známé Nyquistovo kritérium, které je jednoduché a názorné, protože umožňuje využı́t pro určenı́ stability frekvenčnı́ charakteristiku systému. Snahou mnoha autorů proto bylo vytvořit podobná kritéria i pro nelineárnı́ systémy. 7.1 Popovovo kritérium V r. 1959 uveřejnil rumunský vědec V.M. Popov nové kritérium stability nelineárnı́ch systémů Lurjeho typu (obr. 7.1), které je velmi výhodné pro inženýrskou praxi, protože k vyšetřenı́ stability se použı́vá frekvenčnı́ch charakteristik lineárnı́ části obvodu. Kritérium bylo rozšı́řeno mnoha dalšı́mi autory a dnes jı́m lze vyšetřovat systémy se spojitými, nespojitými, hystereznı́mi i časově proměnnými nelineárnı́mi prvky, systémy s většı́m počtem nelinearit, diskrétnı́ nelineárnı́ systémy, fuzzy systémy, systémy s rozloženými parametry, adaptivnı́ systémy aj. Metoda umožňuje také posoudit stupeň stability nebo tlumenı́ systému a provádět některé jednoduché syntézy nelineárnı́ho systému. Ukázalo se také, že Popovovo kritérium je v úzkém vztahu k Ljapunovově teorii stability a jeho splněnı́ je nutnou a postačujı́cı́ podmı́nkou pro existenci Ljapunovovy funkce ve tvaru kvadratická forma plus integrál z nelinearity. Vyšetřovánı́ stability pomocı́ Popovova kritéria je výhodné při malém počtu nelinearit, přičemž řád lineárnı́ části může být vysoký. Tı́m představuje toto kritérium výhodný doplněk Ljapunovovy metody, která je naopak výhodná při vı́ce nelinearitách a nı́zkém řádu lineárnı́ části. Nejprve budeme uvažovat autonomnı́ nelineárnı́ systém podle obr. 7.1 s jednou nelinearitou ve zpětné vazbě a s lineárnı́m časově invariantnı́m subsystémem, který má jeden vstup a jeden výstup. Tato lineárnı́ část zahrnuje všechny lineárnı́ členy v obvodu. Uzavřený systém lze popsat rovnicemi ẋ = Ax + bu, y = cT x, 66 u = −φ(y), (7.2) KAPITOLA 7. ABSOLUTNÍ STABILITA 67 kde x ∈ Rn , u, y jsou skaláry. Přenos lineárnı́ části je G(s) = cT (sI − A)−1 b. (7.3) Dále budeme předpokládat, že v obvodu je jedna jednoznačná časově invariantnı́ nelinearita, která ležı́ v 1. a 3. kvadrantu v sektoru [0, k] a splňuje podmı́nky φ(0) = 0, 0≤ φ(y) ≤k y 0 ≤ k ≤ ∞, (7.4) kde k je sklon omezujı́cı́ přı́mky (obr.7.2). Zpětnovazebnı́ systém (7.2) má jeden rovnovážný stav x = 0. Obrázek 7.1: Schéma nelineárnı́ho systému Obrázek 7.2: Sektor nelineárnı́ charakteristiky Věta 7.1 (Popovovo kritérium). Uvažujme nelineárnı́ systém, u něhož a) všechna vlastnı́ čı́sla matice A majı́ záporné reálné části (G(s) má póly jen v levé polorovině) b) pár (A, b) je řiditelný, pár (c, A) je pozorovatelný c) statická charakteristika nelineárnı́ho prvku ležı́ v sektoru [0, k]. Za těchto podmı́nek je rovnovážný stav x = 0 systému (7.2) globálně absolutně asymptoticky stabilnı́ tehdy, existuje-li takové reálné čı́slo q > 0, že pro všechna ω ≥ 0 je splněna nerovnost Re[(1 + jωq)G(jω)] + 1 > 0. k (7.5) V přı́padě, že přenos lineárnı́ části má i pól v počátku, platı́ uvedené kritérium při omezenı́ nelineárnı́ho prvku na sektor (0, k], aby nevznikl jiný rovnovážný stav mimo počátek. Poznámky: a) Popovovo kritérium je pouze podmı́nkou postačujı́cı́. V určitých přı́padech může být systém stabilnı́ i pro většı́ zesı́lenı́ v obvodu než udá kritérium. Vyplývá to z toho, že se určuje stabilita pro celou třı́du nelinearit, z nichž některé mohou být pro stabilitu velmi nepřı́znivé, např. funkce s klesajı́cı́m úsekem charakteristiky. Toto obecnějšı́ pojetı́ má však i své výhody, protože v praxi může mı́t charakteristika velmi komplikovaný tvar nebo ji nelze dostatečně přesně určit. Charakteristiky se mohou také pomalu měnit, např. stárnutı́m prvku. b) Pro obecnou časově proměnnou nebo nejednoznačnou nelinearitu platı́ Popovovo kritérium s omezenı́m q=0 0 < k ≤ ∞. (7.6) Globálnı́ asymptotická stabilita je tedy splněna pouze tehdy, platı́-li Re G(jω) + 1 > 0. k (7.7) Frekvenčnı́ charakteristika G(jω) lineárnı́ části musı́ tedy ležet v komplexnı́ rovině vpravo od svislé přı́mky, procházejı́cı́ bodem −1/k. KAPITOLA 7. ABSOLUTNÍ STABILITA 68 Přı́klad 7.1. V systému podle obr. 7.1 má lineárnı́ část přenos G(s) = 10 s(2s + 1) a nelinearita ležı́ v sektoru (0, 1]. Pro určenı́ stability Popovovým kritériem můžeme zvolit např. q = 2. Pak podmı́nka Re[(1 + 2jω) 10 ]+1>0 jω(2jω + 1) je splněna pro všechna ω ≥ 0 a uzavřený systém má jeden rovnovážný stav v nule, který je absolutně asymptoticky stabilnı́ ve velkém. Grafické řešenı́ kritéria v komplexnı́ rovině. Pro určenı́ stability je tedy třeba v Popovově nerovnosti (7.5) zvolit určité q a zjistit, zda podmı́nka je splněna. Nenı́-li, musı́me volit jinou hodnotu q a postup opakovat, teoreticky pro všechna q > 0. Při složitějšı́ch přenosech G(jω) by to bylo neproveditelné, řešenı́ je však možno nalézt velmi jednoduše graficky v komplexnı́ rovině. Prvnı́ část nerovnosti (7.5) lze rozepsat ve tvaru Re [(1 + jωq)G(jω)] = Re {(1 + jωq)[Re G(jω) + jIm G(jω)]} = = Re [Re G(jω) + jωq Re G(jω) + jIm G(jω) − qω Im G(jω)] = = Re G(jω) − qω Im G(jω) = X − qY, (7.8) kde X = Re G(jω) Y = ω Im G(jω). (7.9) Nerovnost (7.5) lze tedy zapsat ve tvaru X − qY + 1 > 0. k (7.10) Rovnice 1 =0 (7.11) k je v souřadnicı́ch X, Y rovnicı́ tzv. Popovovy přı́mky, která procházı́ bodem −1/k na reálné ose a má sklon 1/q. Nerovnost (7.5) pak řı́ká, že všechny body se souřadnicemi X, Y musı́ být v oblasti definované podmı́nkou (7.5). Stabilitu pak vyšetřujeme tı́mto postupem: X − qY + Pro daný nelineárnı́ systém s lineárnı́ částı́ G(jω) nakreslı́me v komplexnı́ rovině tzv. modifikovanou frekvenčnı́ charakteristiku G? (jω) = X(ω) + jY (ω). (7.12) Reálná část této charakteristiky je stejná jako u G(jω), imaginárnı́ část je pro každý bod dána hodnotou imaginárnı́ částı́ G(jω) násobenou odpovı́dajı́cı́ hodnotou ω. Systém je stabilnı́, můžeme-li vést bodem (−1/k, j0) takovou přı́mku, která by ležela vlevo od modifikované charakteristiky, jestliže jı́ procházı́me ve směru od ω = 0 do ω = ∞. Připomeňme si, že při vyšetřovánı́ stability lineárnı́ch systémů pomocı́ Nyquistova kritéria nezáležı́ na tvaru celé frekvenčnı́ charakteristiky, ale pouze na jejı́ch průchodech reálnou osou. Popovovo kritérium pro nelineárnı́ systémy však bere v úvahu celý průběh modifikované frekvenčnı́ charakteristiky. KAPITOLA 7. ABSOLUTNÍ STABILITA 69 Přı́klad 7.2. Určete, zda systém se strukturou podle obr.7.1 a s lineárnı́ částı́ G(s) = 1 s(2s + 1)(s + 1)2 (0, 5s + 1) je stabilnı́ při jednoznačné časově invariantnı́ nelineárnı́ funkci, která ležı́ v 1. a 3. kvadrantu v sektoru (0; 0, 5]. Do komplexnı́ roviny vyneseme frekvenčnı́ charakteristiku lineárnı́ části obvodu (obr.7.3) a sestrojı́me k nı́ modifikovanou G? (jω). Je patrno, že bodem −1/k = −2 je možno vést libovolnou přı́mku tak, aby G? (jω) ležela pro všechny frekvence vpravo od této přı́mky. Systém je proto absolutně asymptoticky stabilnı́ ve velkém. Obr.7.3. Vyšetřenı́ stability systému z přı́kladu 7.2. Popovovo kritérium umožňuje zı́skat i obecnějšı́ závěry pro studium stability. Nahradı́me-li nelineárnı́ člen lineárnı́m, který má zesı́lenı́ k (sklon mezné přı́mky), je charakteristická rovnice výsledného uzavřeného lineárnı́ho obvodu kG(jω)+1 = 0. Na mezi stability bude obvod podle Nyquistova kritéria tehdy, nastane-li průsečı́k G(jω) se zápornou reálnou poloosou v bodě −1/k. V přı́kladu 7.2 je souřadnice tohoto průsečı́ku -1,86 tj. k = 0, 536. Z obr. 7.3 je patrno, že nelineárnı́ obvod s libovolnou nelinearitou v sektoru (0; 0, 536] bude rovněž stabilnı́. V bodě −1/k = −1, 86 je totiž možno vést meznı́ Popovovu přı́mku jako tečnu k modifikované charakteristice G? (jω). V tomto přı́padě platı́ tedy stejné podmı́nky stability pro daný nelineárnı́ systém z přı́kladu 7.2 i pro náhradnı́ lineárnı́ systém. Některé dalšı́ podobné přı́klady vedly k formulaci tzv. Ajzermanovy hypotézy, kterou můžeme stručně formulovat takto: Nahradı́me nelineárnı́ člen lineárnı́m prvkem se zesı́lenı́m k meznı́ přı́mky. Je-li výsledný lineárnı́ uzavřený obvod stabilnı́, je stabilnı́ také původnı́ obvod s nelinearitou ležı́cı́ v sektoru s hornı́ hranicı́ k. Pokud by tato hypotéza platila, bylo by možno nahradit vyšetřovánı́ stability nelineárnı́ho systému Lurjeho typu jednoduchými kritérii, které platı́ pro lineárnı́ systémy. Velmi brzy se však ukázalo, že Ajzermanova hypotéza platı́ pouze v některých přı́padech a nikoliv obecně, jak je ihned patrno z dalšı́ho přı́kladu. Přı́klad 7.3. Určete, zda je stabilnı́ obvod s nelineárnı́ charakteristikou ležı́cı́ v sektoru (0; 0, 7] a s lineárnı́m členem s přenosem 1 . (7.13) G(s) = s(s3 + s2 + 2s + 1) Vyneseme-li v komplexnı́ rovině (obr. 7.4) modifikovanou charakteristiku G? (jω), je patrno, že bodem −1/k = −1, 43 můžeme vést přı́mku tak, aby G? (jω) zůstala vpravo. Obvod je stabilnı́. Nahradı́me-li nelineárnı́ člen lineárnı́m se zesı́lenı́m k, pak z Nyquistova kritéria plyne, že náhradnı́ obvod je na mezi stability pro k = 1, nelineárnı́ obvod má však meznı́ zesı́lenı́ k = 0, 75. Vedeme-li totiž takovou meznı́ KAPITOLA 7. ABSOLUTNÍ STABILITA 70 Popovovu přı́mku, aby G? (jω) byla stále vpravo od nı́, je vidět, že tato přı́mka (zakreslená na obr. 7.3) protı́ná reálnou osu v bodě −1/k = −1, 33, tj. k = 0, 75. Ajzermanova hypotéza v tomto přı́padě neplatı́, tzv. Hurwitzův sektor (0, 1] je většı́ než Popovův (0; 0, 75]. Obr. 7.4. Modifikovaná frekvenčnı́ charakteristika 7.1.1 Odvozenı́ Popovova kritéria Důkaz Popovova kritéria je dosti náročný, zejména původnı́ postup, který podal Popov [83]. Jednodušeji lze odvodit toto kritérium pomocı́ Ljapunovovy funkce ve tvaru kvadratická forma plus integrál z nelinearity a pomocné věty předložené Kalmanem a Jakubovičem [74]. Odvozenı́ zároveň ukazuje, že Popovovo kritérium je nutnou a postačujı́cı́ podmı́nkou pro existenci Ljapunovovy funkce uvedeného typu. Odvozenı́ provedeme pouze pro přı́pad, kdy G(s) má póly jen v levé polorovině a v obvodu je časově invariantnı́ jednoznačná nelinearita. Ostatnı́ přı́pady lze odvodit analogicky nebo pomocı́ metody transformace pólů a nul (odst. 7.1.3). Zvolme pro nelineárnı́ systém (7.2) Ljapunovovu funkci V (x) = xT P x + Z y φ(y)dy, (7.14) 0 kde P je symetrická pozitivně definitnı́ matice. Protože φ(y) ležı́ v sektoru [0, k], je Funkce V je pozitivně definitnı́ a radiálně neohraničená. Jejı́ derivace Ry 0 φ(y)dy ≥ 0 ∀y. V̇ (x) = ẋT P x + xT P ẋ + φ(y)ẏ. (7.15) ẋ = Ax − bφ(y) (7.16) Z rovnic systému (7.2) vyplývá T T T T ẏ = c ẋ = c (Ax + bu) = c Ax − c bφ(y). (7.17) V̇ = xT AT P x + xT P Ax − bT P xφ(y) − xT P bφ(y) + cT Axφ(y) − cT bφ2 (y) (7.18) Dosazenı́m do (7.15) je KAPITOLA 7. ABSOLUTNÍ STABILITA 71 a po úpravě V̇ = xT (AT P + P A)x + (cT A − 2bT P )xφ(y) − cT bφ2 (y). (7.19) Přidejme do (7.19) výraz φ(y)[−gy + gcT x] + hφ2 (y) − hφ2 (y), (7.20) který nezměnı́ platnost rovnice (7.19). Výraz obsahuje dva volné parametry g, h, které můžeme volit tak, aby jejich poměr g/h udával směrnici přı́mky, pod kterou ležı́ nelineárnı́ charakteristika, tj. g/h = k. Pak V̇ = xT (AT P + P A)x + (cT A − 2bT P + gcT )xφ(y) − (h + cT b)φ2 (y) + (hφ(y) − gy)φ(y). (7.21) Aby systém (7.2) byl stabilnı́, je třeba, aby funkce V̇ byla negativně definitnı́. K určenı́ této definitnosti využijeme pomocné věty, kterou publikoval Kalman. Věta 7.2. Jsou dány dva reálné n-rozměrné vektory δ a b (b 6= 0), reálné čı́slo γ ≥ 0, symetrická pozitivně definitnı́ matice P a n × n matice A se zápornými reálnými vlastnı́mi čı́sly. Pak existuje reálný vektor s, že platı́ AT P + P A = −ssT √ δ − P b = − γs (7.22) (7.23) tehdy a jen tehdy, jestliže pro všechna reálná ω je 1 γ + Re[δ T (jωI − A)−1 b] ≥ 0. 2 (7.24) Zvolme nynı́ 1 δ = (A + gI)T c 2 Rovnice (7.23) bude mı́t pak tvar γ = h + cT b. (7.25) p 1 − P b + (A + gI)T c = − h + cT b s 2 (7.26) a jejı́ transpozice je − 2bT P T + cT A + cT g = −2sT p h + cT b. (7.27) Dosadı́me-li (7.27) a (7.22) do (7.21), pak pro P = P T je V̇ = −xT ssT x − 2sT p h + cT b xφ(y) − (h + cT b)φ2 (y) − hφ(y) V̇ = −[sT x + p h + cT b φ(y)]2 − hφ(y) g y − φ(y) . h g y − φ(y) h (7.28) (7.29) Protože g/h = k, ky − φ(y) ≥ 0, je druhý člen v (7.29) nekladný. Prvnı́ člen je záporný, existuje-li reálný vektor s, tj. platı́-li podmı́nka (7.24). Pak je V̇ negativně definitnı́ a systém (7.2) je globálně asymptoticky stabilnı́. Dosadı́me-li do nerovnosti (7.24) zvolené výrazy pro δ a γ z (7.25), dostaneme Popovovo kritérium v maticovém tvaru. Pak platı́ Věta 7.3. Systém (7.2) je globálně absolutně asymptoticky stabilnı́, existujı́-li takové dva parametry g, h > 0, že h + cT b ≥ 0 (7.30) KAPITOLA 7. ABSOLUTNÍ STABILITA 72 (h + cT b) + Re[cT (A + gI)(jωI − A)−1 b] ≥ 0. (7.31) Abychom dokázali, že podmı́nky (7.30) a (7.31) odpovı́dajı́ Popovovu kritériu podle věty 7.1, upravme (7.31) na tvar (7.5). Lineárnı́ část obvodu, která je dána vztahy y = cT x ẋ = Ax + bu (ẏ = cT ẋ), (7.32) převedeme do Laplaceovy transformace sX(s) = AX(s) + bU (s) (7.33) T (7.34) T sY (s) = c AX(s) + c bU (s) a přidáme do druhé rovnice výrazy −gY (s) + gcT X(s), které nezměnı́ jejı́ platnost. Z rovnice (7.33) vypočteme X(s) X(s) = (sI − A)−1 bU (s), (7.35) doplněná rovnice (7.34) vede na (s + g)Y (s) = cT (A + gI)X(s) + cT bU (s). (7.36) Dosazenı́m (7.35) do (7.36) zı́skáme přenos lineárnı́ části ve tvaru Y (s) 1 = G(s) = [cT (A + gI)(sI − A)−1 b + cT b] U (s) s+g (7.37) (jω + g)G(jω) = cT (A + gI)(jωI − A)−1 b + cT b. (7.38) a pro s = jω Srovnánı́m se vztahem (7.31) je patrno, že h + cT b + Re[cT (A + gI)(jωI − A)−1 b] = h + Re[cT (A + gI)(jωI − A)−1 b + cT b] = h + Re[(jω + g)G(jω)] = h 1 + Re[(1 + jω)G(jω)] ≥ 0. g g (7.39) Protože h/g = 1/k a 1/g je libovolný volitelný parametr q v Popovově definici, odpovı́dá (7.39) tvaru (7.5). 7.1.2 Popovovo kritérium a Ajzermanova hypotéza V předchozı́m odstavci jsme formulovali tzv. Ajzermanovu hypotézu, která pro nelineárnı́ systémy obecně neplatı́, existuje však mnoho jednoduchých systémů, které Ajzermanově domněnce vyhovujı́. Rozborem pomocı́ Popovova kritéria lze u jednoduššı́ch obvodů stanovit podmı́nky platnosti Ajzermanovy hypotézy. Uvažujme jako přı́klad nelineárnı́ systém s lineárnı́ částı́, která má přenos G(s) = s(a3 s3 1 . + a2 s2 + a1 s + 1) (7.40) Frekvenčnı́ charakteristika je pro určité hodnoty koeficientů znázorněna na obr. 7.5a, modifikovaná na obr. 7.5b. Kořeny polynomu v závorce jmenovatele přenosu (7.40) ležı́ v levé polorovině při a1 a2 −a3 > 0. KAPITOLA 7. ABSOLUTNÍ STABILITA 73 Obr. 7.5. Charakteristiky v komplexnı́ rovině a) frekvenčnı́ charakteristika b) modifikovaná frekvenčnı́ charakteristika Frekvenčnı́ přenos G(jω) vyjádřı́me ve tvaru G(jω) = −(a1 − a3 ω 2 )ω − j(1 − a2 ω 2 ) u = 2 2 2 2 2 ω[(1 − a2 ω ) + ω (a1 − a3 ω ) ] v (7.41) Imaginárnı́ část přenosu je rovna nule pro ω 2 = 1/a2 , reálná část přenosu pro tuto hodnotu ω má velikost a22 X1 = − (7.42) a1 a2 − a3 Modifikované frekvenčnı́ charakteristiky začı́najı́ v bodě (−a1 , −j) pro ω = 0. Směrnice tečny v průsečı́ku s osou X je a2 (7.43) tg α = a1 a2 − 2a3 Zı́skáme ji ze vztahů 2a2 ω 3 (a1 − a3 ω 2 )2 d[ω Im G(jω)] = (7.44) dω v2 d[Re G(jω)] 2a3 ω 3 (a1 − a3 ω 2 )2 + (a1 − a3 ω 2 )2a21 ω − 8a1 a3 ω 3 + 6a23 ω 5 = (7.45) dω v2 Společné body tečny a modifikované charakteristiky lze stanovit řešenı́m rovnice − 1 − a2 ω 2 = (1 − a2 ω 2 )2 + ω 2 (a1 − a3 ω 2 )2 " # a2 −(a1 − a3 ω 3 ) a22 = + , a1 a2 − 2a3 (1 − a2 ω 2 )2 + ω 2 (a1 − a3 ω 2 )2 a1 a2 − a3 (7.46) jejı́ž úpravou dostaneme kubickou rovnici v ω 2 a32 a23 ω 6 + a22 (a22 − 2a1 a3 )ω 4 + a2 (4a1 a2 a3 − 3a23 − 2a32 )ω 2 + + (a32 − 2a1 a2 a3 + 2a23 ) = 0. (7.47) Obtı́žné řešenı́ lze obejı́t, protože rovnice musı́ mı́t dva stejné kořeny, odpovı́dajı́cı́ bodu dotyku, pro který platı́ ω 2 = 1/a2 . Vydělı́me-li rovnici (7.47) součinem a22 (ω 2 − 1 2 ) = a22 ω 4 − 2a2 ω 2 + 1, a2 (7.48) KAPITOLA 7. ABSOLUTNÍ STABILITA 74 dostaneme vztah a2 a23 ω 2 + a32 − 2a1 a2 a3 + 2a23 = 0. (7.49) Kořeny rovnice (7.47) jsou tedy 2 ω1,2 = 1 a2 ω32 = 2a1 a2 a3 − a32 − 2a23 a2 a23 (7.50) Aby tečna v bodě (X1 , j0) neměla už žádný dalšı́ průsečı́k s modifikovanou frekvenčnı́ charakteristikou, musı́ platit 2a1 a2 a3 < 2a23 + a32 . (7.51) Z podmı́nky je patrno, že Ajzermanova hypotéza platı́ jen pro určité rozdělenı́ kořenů rovnice a3 s3 + a2 s2 + a1 s + 1 = 0. Dalšı́m rozborem lze ukázat, že pro všechny kořeny reálné záporné hypotéza platı́, při jednom reálném kořenu a dvou komplexně sdružených už Ajzermanova hypotéza obecně neplatı́ a je vázána podmı́nkou (7.51). V literatuře jsou odvozeny podmı́nky platnosti hypotézy pro různé typy systémů. Z rozborů je patrno, že nelineárnı́ systém má přı́snějšı́ podmı́nky stability než linearizovaný systém tehdy, má-li přenos lineárnı́ části komplexně sdružené póly s malou reálnou částı́ nebo s velkým modulem. Pak má nelineárnı́ systém většı́ sklon ke kmitánı́ a to zejména v přı́padech, kdy nelinearita má klesajı́cı́ části charakteristiky. Omezı́me-li se na nelinearity s neklesajı́cı́m průběhem, nejsou obvykle podmı́nky stability tak přı́sné. 7.1.3 Transformace pólů a nul Základnı́ Popovovu nerovnost (7.5) lze použı́t i pro systémy, které nesplňujı́ definované podmı́nky. Po zavedenı́ jednoduchých transformacı́ lze řešit např. obvody s nestabilnı́ lineárnı́ částı́, obvody s nelinearitami, které mohou zasahovat i do druhého a čtvrtého kvadrantu apod. Transformace posouvajı́cı́ póly přenosu lineárnı́ části Tuto transformaci můžeme např. použı́t, má-li zadaný systém nelinearitu v sektoru [a, b]. Systém podle obr.7.1 se nezměnı́, zavedeme-li vazby podle obr. 7.6. Výsledný obvod obsahuje novou nelineárnı́ funkci φa (y) = φ(y) − ay, ua = −φa (y). Přenos lineárnı́ části se změnı́ na Ua (s) G(s) = Ga (s) = Y (s) 1 + aG(s) Byla-li zadaná nelinearita v sektoru [a, b], je výsledná v sektoru [0, b − a]. Pokud Ga (s) vyhovuje podmı́nkám věty 7.5, lze Popovova kritéria použı́t pro tento upravený obvod. Je-li nový systém stabilnı́, je stabilnı́ i systém původně zadaný. Transformace tedy vyvolává posunutı́ pólů přenosu lineárnı́ části a změnu sektoru nelineárnı́ charakteristiky. Této techniky lze použı́t i pro vyšetřenı́ stability, je-li v zadaném systému lineárnı́ část nestabilnı́. Lze pomocı́ nı́ také podat důkaz Popovova kritéria pro přı́pad, že G(s) má póly na imaginárnı́ ose. Jestliže lineárnı́ část obvodu má dostatečně velký stupeň stability, můžeme v systému podle obr. 7.6 vytvořit i kladnou vazbu. Lze tak studovat stabilitu systémů, u nichž nelineárnı́ charakteristika zasahuje do 2. a 4. kvadrantu (obr. 7.7). KAPITOLA 7. ABSOLUTNÍ STABILITA 75 Obr. 7.6. Transformace pólů Obr.7.7. Nelinearita ve 2. a 4. kvadrantu Přı́klad 7.4. Pro nelineárnı́ systém s lineárnı́ částı́ G(s) = 1 (s − 1)(s + 2)(s + 3) je třeba stanovit sektor, v němž může ležet stacionárnı́ jednoznačná nelineárnı́ charakteristika, aby uzavřený obvod byl globálně asymptoticky stabilnı́. Protože přenos G(s) je nestabilnı́, použijeme metody transformace pólů. Ga (s) = G(s) 1 = 3 1 + G(s) s + 4s2 + s − 6 + a Pomocı́ Hurwitzova kritéria lze stanovit, že Ga (s) bude stabilnı́ pro 6 < a < 10 (Hurwitzův sektor). Zvolı́me-li a = 6, bude 1 Ga (s) = s(s2 + 4s + 1) na mezi stability. Nynı́ použijeme Popovova kritéria ke stanovenı́ sektoru (0, k], ve kterém může ležet nelinearita, aby systém s lineárnı́m přenosem Ga (s) byl stabilnı́. Zakreslı́me-li G?a (jω), zjistı́me, že k = 4. Zadaný systém s lineárnı́ částı́ G(s) bude tedy stabilnı́, bude-li nelinearita ležet v sektoru (6, 10). Hurwitzův sektor v tomto přı́padě souhlası́ s Popovovým sektorem a platı́ Ajzermanova hypotéza. Transformace posouvajı́cı́ nuly přenosu lineárnı́ části Úkolem této transformace je měnit sektor nelineárnı́ charakteristiky, aniž bychom změnili hodnoty pólů lineárnı́ho členu. V daném nelineárnı́m systému vytvořı́me zpětnou vazbu kolem nelineárnı́ho prvku (obr.7.8). Pak pro výsledný přenos lineárnı́ části Gc (s) a pro výslednou nelinearitu φc platı́ φc = φ(1 + cφ)−1 Gc (s) = G(s) − c Sektor [a, b] nelinearity se transformuje na sektor a b , , 1 + ac 1 + bc tedy např sektor [0, ∞) na [0, 1/c]. u = −φc (y) (7.52) KAPITOLA 7. ABSOLUTNÍ STABILITA 76 Obr. 7.8. Transformace nul 7.1.4 Rozšı́řenı́ Popovova kritéria Základnı́ verze Popovova kritéria byla rozšı́řena mnoha autory na různé složitějšı́ spojité i diskrétnı́ systémy. Již Popov rozpracoval svou metodu i pro obvody s většı́m počtem nelinearit. Kritérium je však vyjádřeno v maticové formě a jeho použitı́ je pracné. Jinı́ autoři uvažovali v nelineárnı́m systému pouze monotonnı́ nelinearity nebo nelinearity s omezenı́m lokálnı́ho sklonu. Jejich výsledky dávajı́ obvykle méně přı́sné podmı́nky stability než Popovovo kritérium, většinou však nelze použı́t jednoduchý grafický test jako u Popova. Pro omezený rozsah skripta nebudeme zde tato kritéria uvádět. Lze je nalézt v některých přehledných textech, např. v [48]. 7.2 Kruhové kritérium Jiný typ kritéria pro nelineárnı́ systém Lurjeho typu (obr.7.1) představuje tzv. kruhové kritérium, které umožňuje určit globálnı́ exponenciálnı́ stabilitu zpětnovazebnı́ch systémů s lineárnı́ částı́ G(s) a s časově variabilnı́mi a nejednoznačnými nelinearitami ležı́cı́mi v sektoru [a, b]. Dále uvedeme pouze jednoduššı́ verzi kritéria pro systém s lineárnı́ částı́ popsanou přenosem G(s) a s jednou zpětnovazebnı́ nelinearitou, která ležı́ v sektoru [a, b]. Symbolem D(a, b) označı́me kruh v komplexnı́ rovině, který má střed na reálné ose a jehož hraničnı́ kružnice procházı́ body −1/a a −1/b. Věta 7.4 (Kruhové kritérium). Uvažujme podle obr.7.1 systém ẋ = Ax + bu, y = cT x, u = −φ(y) při podmı́nkách a) (A, b, c) je minimálnı́ realizace přenosu G(s) b) nelinearita φ ležı́ v sektoru [a, b] a může být časově variantnı́ a nejednoznačná. Systém je globálně exponenciálně stabilnı́, platı́-li některá z těchto podmı́nek: 1) 0 < a < b: frekvenčnı́ charakteristika G(jω) musı́ ležet vně kruhu D(a, b) a musı́ ho obklı́čit ρ krát proti směru hodinových ručiček při ω stoupajı́cı́m od −∞ do ∞; ρ je počet vlastnı́ch čı́sel matice A s kladnou reálnou částı́. 2) 0 = a < b: matice A je Hurwitzova a Re G(jω) + 1/b > 0 pro všechna ω ≥ 0. 3) a < 0 < b: matice A je Hurwitzova, G(jω) ležı́ uvnitř disku D(a, b). 4) a < b ≤ 0: Posuzuje se jako v bodech 1) nebo 2), ale mı́sto G(jω) se uvažuje −G(jω), mı́sto a KAPITOLA 7. ABSOLUTNÍ STABILITA 77 bude −b a mı́sto b bude −a. Poznámka: Hurwitzova matice má všechna vlastnı́ čı́sla se zápornými reálnými částmi. Odvozenı́ kruhového kritéria a jeho rozšı́řenı́ na systémy s většı́m počtem nelinearit lze nalézt např. v [55]. Stejně jako Popovovo kritérium, představuje i kruhové kritérium pouze podmı́nku postačujı́cı́. Kruhové kritérium nahrazuje kritický bod −1/k Nyquistova kritéria kružnicı́, jejı́ž poloměr se zmenšuje, když se zužuje sektor, tj. když b se přibližuje k a. Pro a = b se kružnice změnı́ na kritický bod −1/a = −1/k Nyquistova kritéria. Přı́klad 7.5. Pro nelineárnı́ systém s přenosem lineárnı́ části G(s) = 1 (s − 1)(s + 3)(s + 4) chceme nalézt pomocı́ Popovova a kruhového kritéria sektor, ve kterém může ležet časově proměnná nejednoznačná nelinearita tak, aby uzavřený obvod byl globálně asymptoticky stabilnı́. 1) Pomocı́ transformace pólů zjistı́me, že Ga (s) bude stabilnı́ se zpětnou vazbou 12 < a < 42. Zvolı́me např. a = 12 a protože se jedná o časově proměnnou nelinearitu (q = 0), nakreslı́me frekvenčnı́ charakteristiku Ga (jω). Popovovu přı́mku pro q = 0 můžeme vést bodem (−1/4, 2; j0). Obecná nelinearita může tedy v transformovaném obvodu ležet v sektoru [0; 4, 2], v zadaném systému tedy v sektoru [12; 16, 2]. 2) U kruhového kritéria zakreslı́me přı́mo zadanou frekvenčnı́ charakteristiku G(jω). Ta musı́ ležet vně kružnic se středem na reálné ose. Takových kružnic je ovšem možno zakreslit nekonečně mnoho (obr.7.9). Každá kružnice odpovı́dá určitému sektoru, který závisı́ na dolnı́ hranici a. Např. pro a = 20 je sektor [20; 28, 5]. Je patrno, že každý sektor ležı́ uvnitř Hurwitzova sektoru [12, 42]. Kruhovým kritériem dostáváme tedy pro časově proměnnou nelinearitu obecnějšı́ výsledky než pomocı́ Popovova kritéria. Obr.7.9. Vyšetřenı́ oblastı́ stability pro přı́klad 7.5 Kapitola 8 Stabilita vstup-výstup Teorie stability ve smyslu vstup-výstup byla formulována teprve nedávno. Základnı́ výsledky byly publikovány po roce 1960 a od té doby byly rozvı́jeny v mnoha pracı́ch. Na rozdı́l od dobře známé ljapunovské teorie stability nenı́ však stabilita vstup-výstup zatı́m běžně použı́vána v inženýrské praxi. Je to dáno nejen krátkou dobou jejı́ho rozvoje, ale také tı́m, že tato teorie použı́vá některé relativně náročnějšı́ matematické disciplı́ny, předevšı́m funkcionálnı́ analýzu, která nenı́ pro inženýry zcela běžná. U Ljapunovovy teorie je základnı́m modelem systému soustava diferenciálnı́ch rovnic, které popisujı́ časový vývoj stavových proměnných systému. Ljapunovova teorie se týká ”vnitřnı́” stability systému, tj. chovánı́ stavu při zadané počátečnı́ podmı́nce a při nulovém vstupnı́m signálu. Při analýze stability vstup-výstup je systém zadán zobrazenı́m, které přiřazuje každému vstupu odpovı́dajı́cı́ výstup bez ohledu na počátečnı́ podmı́nky. Systém je tedy reprezentován nějakým operátorem nebo relacı́ a nenı́ třeba znát stavové diferenciálnı́ rovnice. Analýza vstup-výstup může být proto použita i v situacı́ch, kdy nenı́ definován stav systému, rovnovážný stav apod. Např. systémy s rozloženými parametry, dopravnı́m zpožděnı́m aj., se vyšetřujı́ na rozdı́l od Ljapunovovy teorie relativně stejně snadno jako systémy se soustředěnými parametry. U Ljapunovovy teorie se obvykle předpokládá, že systém má jediné řešenı́ při dané počátečnı́ podmı́nce a že toto řešenı́ závisı́ spojitě na počátečnı́m stavu a čase. Stabilita vstup-výstup takový předpoklad nevyžaduje. Představuje koncepci, která předvı́dá kvalitativnı́ chovánı́ zpětnovazebnı́ho systému jen z hrubé informace o prvcı́ch obvodu. Toto pojetı́ vede k robustnosti a motivovalo mnoho nových výzkumů v oblasti modernı́ teorie řı́zenı́. Aby teorie stability vstup-výstup mohla postihnout vliv nejrůznějšı́ch typů vstupnı́ch signálů, je třeba, aby tyto vstupnı́ a podobně i výstupnı́ signály byly definovány dostatečně obecně. To lze dosáhnout zavedenı́m měřitelných funkcı́ a rozšı́řených vektorových prostorů v Lebesgueově smyslu. Vzhledem k tomu, že malý rozsah skripta dovoluje jen stručný úvod do problematiky stability vstupvýstup, uvedeme jen některé základnı́ pojmy, definice stability a bez důkazů některá jednoduchá kritéria. Podrobnějšı́ rozbor problémů a důkazy uvedených vět lze nalézt např. v [53]. Dalšı́ část této kapitoly sleduje převážně výklad, který je uveden podrobně v knize [55]. 8.1 Lebesgueovy prostory a jejich rozšı́řenı́ Necht’ p je reálné čı́slo vyhovujı́cı́ podmı́nce 1 ≤ p < +∞. Označme symbolem Lp [0, ∞) = Lp množinu takových měřitelných funkcı́ f : R+ → R, pro které je Lebesgueův integrál konečný, tj. Z 0 ∞ |f (t)|p dt < ∞. (8.1) Množina L∞ [0, ∞) = L∞ je tvořena všemi měřitelnými funkcemi f , které jsou esenciálně ohraničené na intervalu [0, ∞) (tj. ohraničené skoro všude s výjimkou množiny mı́ry nula). 78 KAPITOLA 8. STABILITA VSTUP-VÝSTUP 79 Poznámka. Měřitelné funkce můžeme definovat samozřejmě na nějaké obecnějšı́ množině Ω, avšak vzhledem k tomu, že v našich aplikacı́ch budou funkce závislé na čase, uvažujeme již zjednodušenı́ na interval [0, ∞). Definujeme-li dále součet dvou funkcı́ f (t) a g(t) jako funkci h(t) = f (t) + g(t) a λ-násobek funkce f jako h(t) = λf (t), pak množina Lp je vektorovým prostorem a nazývá se Lebesgueův prostor Lp . Prostor Lp je prostor funkcı́ integrovatelných v p-té mocnině, zatı́mco L∞ je množina esenciálně ohraničených měřitelných funkcı́. Prostor L1 je prostor funkcı́ integrovatelných v Lebesgueově smyslu, prostor L2 je prostor funkcı́ integrovatelných s kvadrátem (kvadraticky integrovatelných). Přı́klad 8.1. Funkce f (t) = e−at , a > 0 patřı́ do Lp pro všechna p ∈ [1, ∞]. Funkce f (t) = 1/(t + 1) patřı́ do Lp pro všechna p > 1, ale ne do L1 . Lebesgueův prostor můžeme normovat zavedenı́m tzv. p-normy ||f ||p . Pro p ∈ [1, ∞) je norma ||f ||p : Lp → R+ definována vztahem ||f ||p = Z 0 ∞ p |f (t)| dt 1/p . (8.2) Podobně je definována norma ||f ||∞ : L∞ → R+ jako ||f ||∞ = ess.sup |f (t)|, (8.3) tj. supremum na definičnı́ množině kromě množiny mı́ry nula. Norma ||f ||∞ je užitečná, jsou-li u systému kladeny omezujı́cı́ podmı́nky na amplitudu signálů, 2-norma je zajı́mavá při omezenı́ na energii systému. Zavedenı́m normy pak tvořı́ pár (Lp , ||f ||p ) pro každé p ∈ [1, ∞] normovaný lineárnı́ prostor, který představuje přirozenou definici množiny všech ohraničených signálů. Pro dalšı́ úvahy nenı́ třeba podrobnějšı́ch znalostı́ z teorie mı́ry a měřitelnosti funkcı́ a můžeme pro zjednodušenı́ předpokládat, že dále použı́vané funkce budou většinou po úsecı́ch spojité. Podrobnějšı́ znalosti Lebesgueových prostorů jsou potřebné pro určovánı́ existence a jednoznačnosti řešenı́ a pro vedenı́ důkazů, které při omezeném rozsahu textu stejně nemůžeme uvádět. Praktické problémy stability vstup-výstup vyžadujı́ pracovat i s neohraničenými signály a proto budeme definovat rozšı́řené Lp -prostory pro tzv. ”zkrácené” funkce fT . Pro zadanou funkci f : R+ → R a pro každé T ∈ R+ je funkce fT : R+ → R definována vztahy fT (t) = ( f (t) 0 ≤ t ≤ T 0 t>T (8.4) Funkce fT představuje zkrácenı́ funkce f na interval [0, T ]. Rozšı́řený prostor Lpe obsahuje všechny měřitelné funkce f : R+ → R, pro které platı́ fT ∈ Lp pro všechna konečná T . Každá zkrácená funkce fT odpovı́dajı́cı́ původnı́ funkci f patřı́ tedy do Lp , ačkoliv sama funkce f může, ale nemusı́ patřit do Lp . Množina Lp je tedy podmnožinou Lpe . Množina Lp je normovaný prostor, Lpe nikoliv. Např. f (t) = t nepatřı́ do žádného prostoru Lp . Pro každé konečné T však funkce fT patřı́ do všech prostorů Lp pro p ∈ [1, ∞]. Proto f (t) = t patřı́ do prostoru Lpe pro každé p ∈ [1, ∞]. Kauzalita. Označme f vstupnı́ signál systému, reprezentovaného nějakým zobrazenı́m A a Af jeho výstup. Kauzálnı́ systém je takový systém, u něhož hodnota výstupu v čase t závisı́ pouze na hodnotách vstupu až do času t. Definice 8.1. Zobrazenı́ A se nazývá kauzálnı́, jestliže (Af )T = (AfT )T ∀T ≥0 ∀ f ∈ Lpe . (8.5) KAPITOLA 8. STABILITA VSTUP-VÝSTUP 80 U kauzálnı́ho systému hodnoty výstupu (Af )(t) na intervalu [0, T ] závisejı́ pouze na hodnotách f (t) na [0, T ]. Budou-li dvě vstupnı́ funkce stejné na intervalu [0, T ], budou odpovı́dajı́cı́ výstupy také stejné na [0, T ]. Zobecněné funkce Definice 8.2. Symbolem A označı́me množinu zobecněných funkcı́ (distribucı́) f (t), pro které je f (t) = 0 pro t < 0 a f (t) = ∞ X fi δ(t − ti ) + fa (t) pro t ≥ 0, 0 ≤ t0 < t1 < ..., (8.6) i=0 kde δ(t − ti ) označuje jednotkovou delta distribuci (Diracův impuls), a fa (t) je měřitelná funkce. Dále platı́ ∞ X |fi | < ∞ Z a ∞ 0 i=0 |fa (t)|dt < ∞. (8.7) Norma ||f ||A distribuce v A je definována vztahem ||f ||A = ∞ X |fi | + Z i=0 ∞ 0 |fa (t)|dt. (8.8) Množina A se tedy skládá z distribucı́, které jsou tvořeny součtem zpožděných impulsů, a měřitelné funkce, která je absolutně integrovatelná. Množinu A lze považovat za Lebesgueův prostor L1 [0, ∞) zvětšený o zpožděné impulsy. Předpokládejme, že f ∈ A. Pokud Re s ≥ 0, konverguje integrál F (s) = Z ∞ f (t)e−st dt = 0 ∞ X fi e−sti + Fa (s). (8.9) i=0 Na všechny prvky množiny A lze pak použı́t Laplaceovu transformaci a jejı́ oblast konvergence je uzavřená pravá komplexnı́ polorovina. Definice 8.3. Symbolem  označı́me množinu všech funkcı́ F (s), které jsou Laplaceovou transformacı́ prvků množiny A. Věta 8.1. Necht’ F (s) je racionálnı́ lomená funkce proměnné s. Pak F (s) ∈  právě tehdy, když všechny póly F (s) majı́ záporné reálné části a F (s) je ryzı́, tj. stupeň polynomu v čitateli je menšı́ nebo rovný stupni polynomu ve jmenovateli přenosu. 8.2 Definice stability vstup-výstup U Ljapunovovy teorie stability se obvykle předpokládá, že soustava diferenciálnı́ch rovnic systému má jediné řešenı́ při dané počátečnı́ podmı́nce a že toto řešenı́ závisı́ spojitě na počátečnı́m stavu a čase. Stabilita vstup-výstup takový předpoklad nevyžaduje. Lze pracovat např. i s nejednoznačnými zobrazenı́mi, které k určitému vstupu x přiřazujı́ vı́ce hodnot y. Proto se stabilita vstup-výstup definuje obvykle obecněji pomocı́ relacı́, i když v praktických problémech stačı́ velmi často definice pomocı́ operátorů. Jestliže je např. H operátor z množiny X do Y , pak pro každé x ∈ X existuje jediné y ∈ Y takové, že y = Hx. Jestliže však H je relace nemusı́ tomu tak být. Např. binárnı́ relace R na nějaké množině X je podmnožina z X × X. Pro určité x ∈ X může existovat jediné y ∈ X při platnosti (x, y) ∈ R. V jiném přı́padě však pro x ∈ X nemusı́ existovat žádné takové y, že platı́ (x, y) ∈ R, nebo KAPITOLA 8. STABILITA VSTUP-VÝSTUP 81 může naopak existovat libovolně mnoho hodnot y ∈ X takových, že (x, y) ∈ R. Pojetı́ relace je tedy obecnějšı́. Definice 8.4. Předpokládejme, že relace R je binárnı́ relace na Lpe . Pak a) R je Lp -stabilnı́, jestliže (x, y) ∈ R, x ∈ Lp ⇒ y ∈ Lp . b) Relace R je Lp -stabilnı́ s konečným zesı́lenı́m, jestliže je Lp -stabilnı́ a existujı́ takové konstanty γp < ∞, bp < ∞, že platı́ (x, y) ∈ R, x ∈ Lp ⇒ ||y||p ≤ γp ||x||p + bp . (8.10) c) Relace R je Lp -stabilnı́ s konečným zesı́lenı́m a nulovým vychýlenı́m, jestliže je Lp -stabilnı́ a existuje taková konstanta γp < ∞, že platı́ (x, y) ∈ R, x ∈ Lp ⇒ ||y||p ≤ γp ||x||p . (8.11) Poznámka. V dále uvedených větách o stabilitě vstup-výstup budeme mluvit zjednodušeně jen o Lp stabilitě a pokud nebude uvedeno jinak, budeme mı́t na mysli typ Lp stability s konečným zesı́lenı́m a nulovým vychýlenı́m. Necht’ je např. x ≡ u vstup dynamického systému popsaného vztahem y = Gu, kde G je operátor nebo relace. Splňuje-li vstupně-výstupnı́ pár (u, y) vztah y = Gu a je-li vstup ohraničen ve smyslu nějaké Lp normy, je stejně ohraničen i výstup. Navı́c existuje ohraničený poměr výstupnı́ normy ke vstupnı́ normě. To je běžné pojetı́ stability ve smyslu ohraničený vstup-ohraničený výstup, rozšı́řený ovšem na obecnějšı́ normy vstupů a výstupů. Poznámka. V jednoduššı́m pojetı́ stability vstup-výstup, kdy se nepracuje s Lebesgueovými prostory a normami, můžeme definovat stabilitu ohraničený vstup-ohraničený výstup mnohem jednodušeji, nemůžeme ale uvažovat speciálnı́ vstupnı́ funkce a některé složité typy dynamických systémů. V tomto zjednodušeném pojetı́ se stabilita definuje obvykle takto: Definice 8.5. Dynamický systém ẋ = f (t, x, u), y = g(t, x, u) je stabilnı́ ve smyslu ohraničený vstupohraničený výstup, jestliže každý ohraničený vstup dává ohraničený výstup bez ohledu na počátečnı́ stav. To znamená, že pro ||u(t)|| < M a t ≥ t0 existuje takové kladné N , které může záviset na x0 a u, že ||g[t, x(t; t0 , x0 ), u(t)]|| < N pro t ≥ t0 . Stabilita vstup-výstup lineárnı́ho systému Uvažujme lineárnı́ systém definovaný rovnicemi ẋ = Ax + Bu y = Cx + Du, (8.12) kde A, B, C, D jsou konstantnı́ matice, x ∈ Rn , y ∈ Rm , u ∈ Rr . Věta 8.2. Předpokládejme, že systém (8.12) je řiditelný a pozorovatelný. Pak je L∞ -stabilnı́ právě tehdy, když přı́slušný nebuzený systém ẋ = Ax je asymptoticky stabilnı́. Každý lineárnı́ systém, který může být reprezentován racionálnı́ přenosovou funkcı́ G(s) je Lp stabilnı́ s konečným zesı́lenı́m právě tehdy, když všechny póly jeho přenosu majı́ záporné reálné části. Pro praxi je výhodná 2-norma, která souvisı́ podle Parsevalova teorému Z 0 ∞ |g(t)|2 dt = 1 2π Z ∞ −∞ |G(jω)|2 dω s energiı́ signálu. Systém s jednı́m vstupem a jednı́m výstupem, který je L2 -stabilnı́ s konečným zesı́lenı́m, má koeficient γ2 = supω |G(jω)|. Jestliže Nyquistova křivka stabilnı́ho přenosu ležı́ celá KAPITOLA 8. STABILITA VSTUP-VÝSTUP 82 uvnitř kružnice o poloměru γ2 se středem v počátku, pak zesı́lenı́ systému podle 2-normy je menšı́ nebo rovno γ2 . 8.3 Stabilita zpětnovazebnı́ch systémů V předchozı́m článku jsme uvedli definice stability dynamického systému popsaného operátorem nebo relacı́. Hlavnı́m objektem studia stability vstup-výstup jsou však propojené dynamické systémy, jako je např. zpětnovazebnı́ systém podle obr. 8.1. Ten lze popsat rovnicemi e1 = u1 − y2 e2 = u2 + y1 y1 = G1 e1 y2 = G2 e2 , (8.13) kde G1 a G2 jsou relace nebo operátory zobrazujı́cı́ vhodný vstupnı́ prostor na výstupnı́ prostor. Systém lze zapsat ve tvaru " e1 e2 # = " u1 u2 # − " 0 I −I 0 #" y1 y2 # " y1 y2 # = " G1 0 0 G2 #" e1 e2 # , (8.14) kde všechny veličiny ei , ui , yi mohou být skaláry (systémy s jednı́m vstupem a výstupem, SISO) nebo vektory (systémy s vı́ce vstupy a výstupy, MIMO). V literatuře byly studovány předevšı́m dva přı́stupy k problému stability zpětnovazebnı́ch systémů. Je to stabilita při malém zesı́lenı́, kdy lze určit Lp -stabilitu pro všechny hodnoty p ∈ [1, ∞], a stabilita založená na principu pasivity systémů, kdy lze určit L2 -stabilitu. Prvnı́ přı́stup vede na kruhové kritérium, druhý na Popovovo kritérium. Obr.8.1. Zpětnovazebnı́ systém 8.3.1 Stabilita při malém zesı́lenı́ Věta 8.3. Uvažujme zpětnovazebnı́ systém podle obr.8.1 a předpokládejme, že je specifikováno nějaké p ∈ [1, ∞], že G1 i G2 jsou kauzálnı́ a Lp -stabilnı́ ve smyslu definice 8.4, a γ1p = γp (G1 ), γ2p = γp (G2 ). Pak je systém dle obr. 8.1 Lp -stabilnı́, jestliže γ1p γ2p < 1. (8.15) Vztah (8.15) se nazývá podmı́nka malého zesı́lenı́. (Důkaz věty lze nalézt v [55]). Předpokládáme-li tedy podle obr. 8.1 dva individuálně Lp -stabilnı́ subsystémy, jejichž zesı́lenı́ jsou nejvýše rovna γ1p a γ2p , pak uzavřený obvod je Lp -stabilnı́, jestliže součin zesı́lenı́ je menšı́ než jedna. Uvedenou větu lze použı́t pro studium stability pro všechny hodnoty p ∈ [1, ∞]. Přı́klad 8.2. Uvažujme obvod dle obr. 8.1, kde v přı́mé větvi je lineárnı́ časově invariantnı́ systém KAPITOLA 8. STABILITA VSTUP-VÝSTUP 83 s jednı́m vstupem a jednı́m výstupem a s přenosem G(jω) ∈ Â. Zpětnovazebnı́ prvek je statická jednoznačná časově variantnı́ nelinearita φ(t, x), která ležı́ v sektoru [−k, k]. Srovnánı́m s větou 8.3 je G1 = G(jω), G2 = φ. Necht’ p = 2; pak G1 a G2 jsou kauzálnı́ a L2 -stabilnı́. Dále je γ1 (G1 ) = sup |G(jω)|, ω γ2 (G2 ) ≤ k. Uzavřený systém je L2 -stabilnı́, platı́-li sup |G(jω)| k < 1 ω Poznámka: Pomocı́ vhodné transformace lze značně rozšı́řit oblast použitı́ věty 8.3. Např. při transformaci, která je analogická transformaci pólů v odst. 7.1.3, zavedeme přı́davný Lp -stabilnı́ lineárnı́ operátor K, který přičteme ke G2 a současně odečteme. Blokovými manipulacemi pak dostaneme systém podle obr. 8.2. Operátor K nynı́ působı́ jako zpětná vazba kolem G1 a paralelnı́ vazba ke G2 . Prvnı́ vnějšı́ vstup se změnı́ z u1 na u1 − Ku2 . Pak platı́ věta: Obr. 8.2. Transformace pólú Věta 8.4. Uvažujme systém podle obr. 8.2 a předpokládejme, že je specifikováno p ∈ [1, ∞], G2 je kauzálnı́ a Lp -stabilnı́. Pak celý uzavřený systém je Lp -stabilnı́, existuje-li takový Lp -stabilnı́ kauzálnı́ lineárnı́ operátor K, že platı́ a) G1 (I + KG1 )−1 je kauzálnı́ a Lp -stabilnı́ b) γp [G1 (I + KG1 )−1 ] . γp (G2 − K) < 1. (Důkaz je uveden např. v [55], s. 341). Spojenı́m věty 8.4 s Nyquistovým kritériem stability zı́skáme kruhové kritérium známé z čl. 7.2, které je ovšem nynı́ použitelné pro určenı́ stability vstup-výstup a pro obecnějšı́ typy lineárnı́ části obvodu než byly uvažovány v čl. 7.2, např. pro distribuované systémy, systémy s dopravnı́m zpožděnı́m apod. Věta 8.5. (Kruhové kritérium). Uvažujme systém podle obr. 8.1, kde ve zpětné vazbě je jednoznačná, obecně časově variantnı́ nelinearita φ patřı́cı́ do sektoru [a, b] a v přı́mé větvi je lineárnı́ systém s přenosem G(s) = Ga (s) + Gr (s). Gr (s) je racionálnı́ a striktně ryzı́, Ga (s) ∈  a existuje takové T > 0, že ga (t) = ∞ X gi δ(t − iT ) + gm (t) gm ∈ L1 i=0 Ga (s) = ∞ X i=0 gi e−sti + Gm (s) ti = iT. (8.16) KAPITOLA 8. STABILITA VSTUP-VÝSTUP 84 Za těchto předpokladů je zpětnovazebnı́ systém L2 -stabilnı́, je-li splněna některá z těchto podmı́nek: 1) ab > 0: Frekvenčnı́ charakteristika G(jω) = Ga (jω) + Gr (jω) musı́ ležet vně kruhu D(a, b); (G(jω) je konformnı́ zobrazenı́ imaginárnı́ osy při pohybu ω od −∞ do ∞ s půlkruhovým oběhem všech čistě imaginárnı́ch pólů). Jestliže ρ je počet pólů G(s) s kladnou reálnou částı́, pak lim {Arg[G(j2πn/T ) − z] − Arg[G(−j2πn/T ) − z]} = 2πρ, n→∞ ∀z ∈ D(a, b). (8.17) 2) 0 = a < b: G(s) ∈  a inf ω∈R ReG(jω) + 1/b > 0. 3) a < 0 < b: G(s) ∈  a G(jω) ležı́ uvnitř kruhu D(a, b). Důkaz věty je v [55], s.345. Věta dává postačujı́cı́ podmı́nky pro L2 -stabilitu. Poznámka: Ve výrazu (8.16) předpokládáme, že impulsy gap (t) = ∞ i=0 gi δ(t − iT ) v distribučnı́ části funkce ga (t) jsou zpožděné o stejný časový interval ti = iT, T > 0. Jejich transformace P Gap (jω) = ∞ X gi e−jωT i i=0 je periodickou funkcı́ s periodou 2π/T . Obsahuje-li G(jω) tyto impulsy, nemusı́ mı́t fázový úhel specifickou limitu, jestliže ω → ∞. Proto je třeba fázový úhel vyhodnocovat podle vztahu (8.17) při speciálně vybraných frekvencı́ch 2πn/T = nω. (Podrobnosti viz [55]). Jestliže ve vztahu (8.16) pro ga (t) nejsou zpožděné impulsy, což je nejčastějšı́ přı́pad v praktických úlohách, pak podmı́nka (8.17) ve větě 8.5 se změnı́ na jednoduššı́ podmı́nku, která odpovı́dá podmı́nce 1) věty 7.4 o kruhovém kritériu. Frekvenčnı́ charakteristika G(jω) musı́ ležet vně kruhu D(a, b) a musı́ jej obklı́čit ρ krát proti směru hodinových ručiček při ω stoupajı́cı́m od −∞ do +∞. 8.3.2 Přı́stup pomocı́ pasivity Tı́mto přı́stupem lze odvodit rozšı́řené Popovovo kritérium pro stabilitu vstup-výstup. Na rozdı́l od stability při malém zesı́lenı́ (odst. 8.3.1), kdy lze určit Lp -stabilitu pro všechna p ∈ [1, ∞], umožňuje přı́stup pomocı́ pasivity analyzovat převážně jen L2 -stabilitu (některé práce analyzujı́ tı́mto přı́stupem také L∞ -stabilitu). Jestliže všechny Lp -prostory jsou Banachovy prostory, je prostor L2 Hilbertův prostor se skalárnı́m (vnitřnı́m) součinem dvou funkcı́ f, g ∈ L2 (f, g) = Z ∞ f (t)g(t)dt. (8.18) 0 Analogicky pro f, g ∈ L2e definujeme zkrácený skalárnı́ součin (f, g)T = Z T f (t)g(t)dt. (8.19) 0 Věta 8.6. Uvažujme systém podle obr. 8.1. Předpokládejme, že existujı́ takové konstanty εi , δi , i = 1, 2, že (x, Gi x) ≥ εi ||x||2T 2 + δi ||Gi x||2T 2 , ∀T ≥ 0, ∀x ∈ L2e , i = 1, 2. (8.20) Systém je L2 -stabilnı́, jestliže δ1 + ε2 > 0, δ2 + ε1 > 0. (8.21) Důkaz v [55], s.350. V kap. 6 jsme definovali různé pojmy týkajı́cı́ se pasivity a disipativity systémů. Rozšı́řı́me nynı́ tyto pojmy na Lebesgueovy prostory. KAPITOLA 8. STABILITA VSTUP-VÝSTUP 85 Definice 8.6. Operátor G : L2e → L2e je pasivnı́, jestliže (x, Gx)T ≥ 0 ∀ T ≥ 0, ∀ x ∈ L2e (8.22) a striktně pasivnı́, existuje-li taková konstanta ε > 0, že (x, Gx)T ≥ ε ||x||2T 2 , ∀ T ≥ 0, ∀ x ∈ L2e . (8.23) Věta 8.7. Systém podle obr. 8.1 je L2 -stabilnı́, jestliže G1 i G2 jsou striktně pasivnı́. Důkaz: V tomto přı́padě je podle (8.20) δ1 = δ2 = 0. Protože ε1 > 0, ε2 > 0, platı́ (8.21). Věta 8.8. Systém podle obr. 8.1 je L2 -stabilnı́, jestliže je bud’ G1 striktně pasivnı́ s konečným zesı́lenı́m a G2 je pasivnı́, nebo G2 je striktně pasivnı́ s konečným zesı́lenı́m a G1 je pasivnı́. (Důkaz v [55]). Dalšı́m rozvojem těchto úvah lze zı́skat rozšı́řenou verzi Popovova kritéria (čl. 7.1) platnou pro stabilitu vstup-výstup. Protože Popovovo kritérium se pro SISO systémy snadno ověřuje graficky i pro vysoký řád lineárnı́ části systému, představuje velmi užitečný nástroj pro praktické určenı́ stability vstup-výstup. Věta 8.9 (Popovovo kritérium). Uvažujme systém podle obr. 8.1, kde v přı́mé větvi je lineárnı́ člen, pro který platı́: g(t) má distribučnı́ derivaci a g(t), ġ(t) ∈ A. Ve zpětné vazbě obvodu je jednoznačná časově invariantnı́ spojitá nelinearita φ : R → R, která patřı́ do sektoru [0, b], kde b může být nekonečně velké. Předpokládejme, že existuje taková konstanta q ≥ 0, že inf Re[(1 + jωq)G(jω)] + ω∈R 1 > 0. b (8.24) Pak funkce e1 , e2 , y1 , y2 patřı́ do L2 , jestliže u1 , u2 , u̇2 patřı́ do L2 . Důkaz kritéria a podrobný rozbor lze nalézt v [55]. V této kapitole byly vzhledem k omezenému rozsahu skripta uvedeny jen základnı́ problémy stability vstup-výstup a některá jednoduchá kritéria vhodná k praktickému ověřovánı́ stability. Podrobný rozbor těchto problémů je uveden zejména v [53] a [55]. Rozšı́řenı́ na diskrétnı́ systémy lze nalézt v [55], použitı́ pro mnoharozměrové a složité systémy je souhrnně podáno v [47] a [53]. Využitı́ principů pasivity a disipativity lze nalézt v pracı́ch [47,55]. Kapitola 9 Nelineárnı́ diskrétnı́ systémy V předchozı́ch kapitolách jsme popisovali základnı́ vlastnosti nelineárnı́ch spojitých systémů a zabývali jsme se předevšı́m rovnovážnými stavy a jejich stabilitou. V této kapitole rozšı́řı́me dosavadnı́ úvahy na diskrétnı́ systémy, které jsou v regulačnı́ technice velmi důležité vzhledem k využitı́ čı́slicových počı́tačů pro řı́zenı́. Diskrétnı́ systémy (systémy s diskrétnı́m časem), jsou popsány diferenčnı́mi rovnicemi, obecně nelineárnı́ soustavou rovnic prvnı́ho řádu x(k + 1) = f [k, x(k), u(k)] (9.1) y(k) = g[k, x(k), u(k)], (9.2) kde x(k) je stavový vektor, u(k) vstupnı́ vektor, k = 0, 1, 2, ... (k ∈ N0 ), x ∈ Rn a f : Rn → Rn (častěji f : M ⊂ Rn → Rn ) je C 1 nelineárnı́ funkce. Poznámka: V dalšı́ch úvahách budeme použı́vat označenı́ N pro množinu všech kladných celých čı́sel, N0 pro množinu všech nezáporných celých čı́sel a Z pro množinu všech celých čı́sel. Diskrétnı́ systém (9.1) vzniká různým způsobem, např. a) modelovánı́m fyzikálnı́ch diskrétnı́ch systémů, např. impulsnı́ch a logických obvodů, modelovánı́m biologických systémů (např. sledovánı́m počtu individuı́ xk určité populace v k-té generaci) apod. b) vzorkovánı́m spojitých systémů ve vhodných časových okamžicı́ch tk , např. při řı́zenı́ pomocı́ čı́slicových počı́tačů; c) u ekonomických modelů popisem stavu systému v diskrétnı́ch časových intervalech (dnech, měsı́cı́ch, rocı́ch); d) sledovánı́m následných průchodů x0 , x1 , x2 , ... trajektorie periodického průběhu množinou o nižšı́ dimenzi (tzv. Poincaréovo zobrazenı́ - viz kap.10); e) při použitı́ diskrétnı́ch algoritmů u numerických metod apod. V dalšı́ch úvahách zavedeme pro jednoduchost zápisu mı́sto x(k), y(k), u(k) označenı́ xk , y k , uk . Nebudeme použı́vat výstupnı́ rovnici (9.2) a omezı́me se většinou na autonomnı́, tj. volné a časově invariantnı́ systémy xk+1 = f (xk ), k ∈ N0 x(0) = x0 . (9.3) Rekurzivnı́ vztah nám na rozdı́l od systémů se spojitým časem umožňuje u diskrétnı́ho systému hledat řešenı́ postupným aplikovánı́m funkce f . Zı́skáme tak diskrétnı́ množinu {xk }∞ 0 x0 , x1 = f (x0 ), x2 = f (x1 ) = f (f (x0 )) = f 2 (x0 ), ... s počátečnı́m stavem x0 . Trajektorie je tedy diskrétnı́ množina bodů ve fázovém prostoru Rn . Analogie toku Φt diferenciálnı́ch rovnic je dána složeným zobrazenı́m f k , kde f k = f ◦ f ◦ f ... ◦ f 86 (k - krát) KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY 87 je k-tá iterace zobrazenı́ f a platı́ f k = f ◦ f k−1 , f 0 = 1. Jestliže f je regulárnı́ zobrazenı́ třı́dy C r a existuje regulárnı́ inverznı́ zobrazenı́ f −1 rovněž třı́dy C r , pak f je C r -difeomorfismus. V matematických modelech reálných systémů však často f nemá inverzi (endomorfismus) a trajektorie je definována jen v kladném směru času. Řı́káme také, že dynamický systém je polodeterminován. Později uvidı́me, že neinvertovatelnost zobrazenı́ f je např. u jednorozměrného systému nutným předpokladem pro existenci chaotického chovánı́. V dalšı́ch úvahách této kapitoly budeme předpokládat, že zobrazenı́ f je difeomorfismus. Definice 9.1. Necht’ f : Rn → Rn a x0 ∈ Rn . Množina Of (x0 ) = {f k (x0 ), k ∈ Z} se nazývá orbita (trajektorie) difeomorfismu f , procházejı́cı́ bodem x0 . Množina Of+ (x0 ) = {f k (x0 ), k ∈ N } Of− (x0 ) = {f −k (x0 ), k ∈ N } resp. se nazývá kladná, resp. záporná orbita difeomorfismu f , procházejı́cı́ bodem x0 . Definice 9.2. Bod x ∈ Rn , pro který platı́ f (x) = x, se nazývá rovnovážný stav diskrétnı́ho systému (9.3) nebo pevný bod zobrazenı́ f . p Definice 9.3. Množina bodů {xk }p−1 k=0 se nazývá periodická orbita periody p, platı́-li f (x0 ) = x0 k a f (x0 ) 6= x0 pro k = 1, 2, ..., p − 1. Všechny body periodické orbity γ s periodou p jsou pevnými body složeného zobrazenı́ (difeomorfismu) f p , tj. f p (x) = x pro všechna x ∈ γ. Každý pevný bod f je periodickým bodem s periodou jedna. 9.1 Definice stability autonomnı́ho diskrétnı́ho systému Protože všechny dalšı́ úvahy jsou analogické jako u systémů se spojitým časem, uvedeme jen základnı́ definice stability pro autonomnı́ systémy (9.3). Všechny ostatnı́ definice z kap.3 lze snadno transformovat pro diskrétnı́ systém, nahradı́me-li časy t a t0 symboly k a k0 . Definice 9.4.. Rovnovážný stav x systému (9.3) je (ljapunovsky) stabilnı́, jestliže pro každé ε > 0 existuje δ = δ(ε) takové, že ||x0 − x|| < δ(ε) ⇒ ||xk − x|| < ε ∀k ∈ N. Stav x je asymptoticky stabilnı́, je-li ljapunovsky stabilnı́ a existuje takové okolı́ U , že pro všechna x0 ∈ U je lim ||xk − x|| = 0. k→∞ Definice 9.5. Periodická orbita γ periody p je stabilnı́ (resp. asymptoticky stabilnı́), když bod x ∈ γ je stabilnı́m (resp. asymptoticky stabilnı́m) pevným bodem zobrazenı́ f p . 9.2 Vyšetřenı́ stability pevných bodů metodou linearizace Věta 9.1. Necht’ x je pevný bod iteračnı́ho zobrazenı́ xk+1 = f (xk ), f : M ⊂ Rn → Rn je alespoň třı́dy C 1 a λ1 , ..., λn jsou vlastnı́ čı́sla Jacobiovy matice linearizace kolem pevného bodu ∂f A = Df (x) = ∂x x=x Pak platı́: KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY 88 a) jestliže |λi | < 1 ∀i = 1, ..., n, je x lokálně asymptoticky stabilnı́; b) jestliže |λi | > 1 alespoň pro jedno i ∈ {1, ..., n} , je x nestabilnı́; c) jestliže |λi | = 1, nelze stabilitu pomocı́ linearizace určit. Podmı́nky věty vyplývajı́ z podmı́nek stability lineárnı́ch diskrétnı́ch systémů, které byly odvozeny v teorii lineárnı́ch řı́dı́cı́ch systémů. Definice 9.6. Pevný bod x je hyperbolický, nemá-li matice linearizace vlastnı́ čı́sla |λi | = 1. Difeomorfismus je v okolı́ svého hyperbolického pevného bodu strukturálně stabilnı́. Poznámka: Stabilitu periodické orbity γ vyšetřı́me, určı́me-li stabilitu pevného bodu difeomorfismu f p . O stabilitě orbity γ rozhodujı́ tedy vlastnı́ čı́sla matice A = {∂fip /∂xj } pro libovolný bod orbity. Přı́klad 9.1. Nelineárnı́ systém 1. řádu. U jednodimenzionálnı́ho systému xk+1 = f (xk ) f :R→R (často f : M ⊂ R → R) je možno trajektorii snadno zkonstruovat graficky. Do souřadnic (x, f (x)) zakreslı́me danou funkci f (x) a přı́mku y = x (obr 9.1). K počátečnı́mu stavu x0 je grafem dána hodnota x1 , vodorovná přı́mka odtud vedená protne přı́mku y = x v bodě, který má prvnı́ souřadnici rovněž x1 , na svislici určı́me x2 atd. Pevné body x = f (x) jsou dány průsečı́ky přı́mky y = x s grafem funkce f . V našem přı́padě podle obr. 9.1 jsou dva pevné body x(1) = 0 a x(2) = a. Stabilitu udává u 1. řádu přı́mo derivace funkce f v pevném bodě. Pro x(1) = 0 je |f 0 (0)| > 1 a pevný bod je nestabilnı́. Pro x(2) = a může být |f 0 (a)| < 1 (pevný bod je stabilnı́) nebo |f 0 (a)| > 1 a pak je pevný bod nestabilnı́. Je-li přitom f 0 (x) > 0 je průběh řešenı́ monotonnı́, pro f 0 (x) < 0 je oscilačnı́ (dokažte !). Dalšı́ přı́klady diskrétnı́ch systémů 1. řádu budou uvedeny v kapitole o chaosu (kap. 12). Obr.9.1. Nelineárnı́ funkce jedné proměnné. Přı́klad 9.2. Lineárnı́ diskrétnı́ systém 2. řádu. Diskrétnı́ lineárnı́ systém xk+1 = xk + yk (mod 1) yk+1 = xk + 2yk (mod 1) je definován na polootevřeném jednotkovém čtverci M = [0, 1)2 . (Abychom nemuseli použı́vat dvojı́ indexovánı́, zavedli jsme pro proměnné označenı́ x, y). Pevný bod (x, y) = (0, 0). Charakteristická rovnice λ2 − 3λ + 1 = 0 má kořeny λ1 = 2, 62 > 1 a λ2 = 0, 38 < 1. Pevný bod je nestabilnı́ sedlo. Podobně jako u systémů se spojitým časem můžeme i u diskrétnı́ch systémů definovat invariantnı́ podprostory pro lineárnı́ systémy a invariantnı́ lokálnı́ a globálnı́ variety pro nelineárnı́ systémy. U lineárnı́ch diskrétnı́ch systémů je stabilnı́ podprostor E s (resp. nestabilnı́ podprostor E u , resp. centrálnı́ podprostor E c ) vytvořen vlastnı́mi vektory odpovı́dajı́cı́mi vlastnı́m čı́slům, jejichž modul je menšı́ než 1 (resp. většı́ než 1, resp. roven 1). Pro nelineárnı́ diskrétnı́ systémy platı́ podobná věta jako věta (4.13) pro systémy se spojitým časem. KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY 89 Věta 9.2. Necht’ f : Rn → Rn je C 1 -difeomorfismus s hyperbolickým pevným bodem x. Pak s (x) a lokálnı́ nestabilnı́ varieta W u (x), které se dotýkajı́ v bodě x existujı́ lokálnı́ stabilnı́ varieta Wloc loc s lineárnı́ch podprostorů E (x) a E u (x) matice linearizace Df a majı́ odpovı́dajı́cı́ dimenze a stejnou hladkost jako zobrazenı́ f . Podobně jako u spojitých systémů jsou definovány i u diskrétnı́ch systémů globálnı́ stabilnı́ a nestabilnı́ variety, které jsou vytvořeny sjednocenı́m lokálnı́ch variet. Na rozdı́l od dynamických systémů se spojitým časem, u nichž globálnı́ W s a W u jsou vytvořeny sjednocenı́m hladkých křivek, jsou u diskrétnı́ch systémů W s a W u dány sjednocenı́m různých diskrétnı́ch posloupnostı́ bodů xk , jejichž globálnı́ průnik může být velmi složitý. U nehyperbolických pevných bodů vzniká také centrálnı́ varieta W c , které lze využı́t (obdobně jako u systémů se spojitým časem) pro určenı́ stability x, má-li matice A vlastnı́ čı́sla na jednotkové kružnici. 9.3 Vyšetřenı́ stability pomocı́ přı́mé Ljapunovovy metody Ljapunovovy věty o stabilitě a nestabilitě z kap.5 lze upravit také pro diskrétnı́ systémy. Derivaci Ljapunovovy funkce podél řešenı́ systému (9.3) nahradı́me diferencı́ ∆V (xk ) = V (xk+1 ) − V (xk ) = V (f (xk )) − V (xk ) (9.4) Věta 9.3. Předpokládejme, že diskrétnı́ systém (9.3) má rovnovážný stav v bodě 0. Tento stav je asymptoticky stabilnı́, jestliže existuje pozitivně definitnı́ skalárnı́ funkce V (xk ) a jejı́ diference (9.4) podél řešenı́ systému je negativně definitnı́. Jestliže V (xk ) → ∞ pro ||xk || → ∞, je rovnovážný stav globálně asymptoticky stabilnı́. Přı́klad 9.3. Pro diskrétnı́ systém (x1 ≡ x, x2 ≡ y) xk+1 = yk2 yk+1 = x2k zvolı́me V = x2k + yk2 . Diference ∆V = V (xk+1 , yk+1 ) − V (xk , yk ) = yk4 + x4k − x2k − yk2 = x2k (x2k − 1) + yk2 (yk2 − 1) je negativně definitnı́ pro x2k < 1, yk2 < 1. Rovnovážný stav je tedy stabilnı́ ve čtvercové oblasti |xk | < 1, |yk | < 1. Kapitola 10 Periodická řešenı́ a jejich stabilita V této kapitole se budeme podrobněji zabývat periodickými řešenı́mi nelineárnı́ch systémů se spojitým časem. Se základnı́mi pojmy a problémy jsme se seznámili již v čl. 2.3. Při vyšetřovánı́ periodických řešenı́ je třeba určit existenci periodických řešenı́, jejich počet, stabilitu periodických řešenı́ při malých poruchách (chovánı́ trajektoriı́ soustavy v okolı́ periodické orbity), konkrétnı́ průběhy periodických řešenı́ (tvary limitnı́ch cyklů) a bifurkačnı́ změny v závislosti na parametrech systému. Metody studia periodických řešenı́ jsou náročnějšı́ než metody pro určovánı́ rovnovážných stavů a jejich stability. Bylo publikováno mnoho metod, žádná z nich však nenı́ univerzálnı́. Můžeme je zhruba rozdělit do těchto skupin: a) Analytické metody je možno použı́t jen u jednoduššı́ch systémů, nejčastěji u 2. řádu. Jednoduché přı́klady si ukážeme v čl. 10.1. Odhady periodických řešenı́ pro systémy 2. řádu budou uvedeny v čl. 10.2. b) Poincaréovo zobrazenı́ se použı́vá k popisu vlastnostı́ periodické orbity a chovánı́ trajektoriı́ v jejı́m blı́zkém okolı́. Metoda je výhodná pro studium bifurkacı́ periodických řešenı́ a bude uvedena v čl. 10.3. c) Přibližné analytické metody poskytujı́ odhady periodických řešenı́, jejich počtu a jejich stability i u značně složitých systémů. V regulačnı́ praxi se často použı́vá metoda ekvivalentnı́ch přenosů, se kterou se seznámı́me v kap. 13. Je výhodná zejména pro systémy s malým počtem nelinearit a s lineárnı́ částı́ vyššı́ho řádu. d) Numerické metody a simulace jsou vhodné u složitých nelineárnı́ch systémů pro určenı́ konkrétnı́ho průběhu stabilnı́ch periodických řešenı́ a pro odhad jejich period. Nestabilnı́ periodická řešenı́ se zı́skávajı́ obtı́žněji, s výjimkou speciálnı́ch přı́padů, kdy je možno integrovat rovnice systému v záporném směru času. Nalezenı́ periodických řešenı́ lze převést na nelineárnı́ okrajovou úlohu se smı́šenými okrajovými podmı́nkami. Pro řešenı́ takové úlohy se použı́vajı́ nejčastěji dva přı́stupy, a to diferenčnı́ metody a metoda střelby. Podrobnosti lze nalézt v publikacı́ch o numerických metodách. 10.1 Analytické metody studia periodických řešenı́ Analytické řešenı́ lze provést jen u speciálnı́ch přı́padů systémů nižšı́ho řádu pro n ≥ 2. U systémů prvnı́ho řádu nemohou periodická řešenı́ vzniknout. Pro řešenı́ je často výhodné převést zadaný systém z kartézských do polárnı́ch souřadnic. Přı́klad 10.1. Nelineárnı́ systém ẋ = x − y − x(x2 + y 2 ) ẏ = x + y − y(x2 + y 2 ) 90 KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 91 má rovnovážný stav v bodě (0, 0). Vlastnı́ čı́sla Jacobiovy matice v bodě (0, 0) jsou 1 ± j, rovnovážný stav je nestabilnı́ ohnisko. Trajektorie se tedy v blı́zkém okolı́ počátku rozvinuje a mohl by existovat limitnı́ cyklus. Převed’me daný systém do polárnı́ch souřadnic p y r = x2 + y 2 ϕ = arctg x = r cos ϕ y = r sin ϕ. x Pro derivace původnı́ch souřadnic pak platı́ ẋ = ṙ cos ϕ − r sin ϕ.ϕ̇ ẏ = ṙ sin ϕ + r cos ϕ.ϕ̇ Dosadı́me-li tyto vztahy do zadaných rovnic, dostaneme systém v polárnı́ch souřadnicı́ch ṙ = r(1 − r2 ) ϕ̇ = 1. Pevné body jsou: a) r = 0, který představuje nestabilnı́ rovnovážný stav (f 0 = df /dr = 1 − 3r2 ; pro r = 0 je f 0 = 1) b) r = 1 představuje stabilnı́ limitnı́ cyklus (asymptoticky stabilnı́ pevný bod radiálnı́ho pohybu). Pro je f 0 = −2. c) r = −1. Tato hodnota nemá fyzikálnı́ smysl. r=1 Přı́klad 10.2. Nelineárnı́ systém ẋ = −y − x[(x2 + y 2 )2 − 3(x2 + y 2 ) + 2] ẏ = x − y[(x2 + y 2 )2 − 3(x2 + y 2 ) + 2] má po převodu do polárnı́ch souřadnic tvar ṙ = −r(r2 − 1)(r2 − 2) ϕ̇ = 1. Existujı́ tři pevné body, které majı́ fyzikálnı́ smysl. Jsou to: a) r = 0, f 0 = −2: asymptoticky stabilnı́ rovnovážný stav (0,0) b) r = +1, f 0 = 2: nestabilnı́ limitnı́ cyklus √ c) r = + 2, f 0 = −4: stabilnı́ limitnı́ cyklus x2 + y 2 = 2. 10.2 Odhady periodických řešenı́ u systémů druhého řádu Pro autonomnı́ systémy 2. řádu ẋ1 = f1 (x1 , x2 ) ẋ2 = f2 (x1 , x2 ) (10.1) existujı́ některá jednoduchá kritéria, pomocı́ nichž lze odhadnout existenci nebo neexistenci periodických řešenı́. Index pevných bodů toku (Poincaréův index). Uvažujme u planárnı́ho toku ve fázové rovině jednoduchou uzavřenou křivku C, která neprocházı́ žádným pevným bodem a zvolme na nı́ libovolný bod P . Proložme tı́mto bodem vektor, jehož směr souhlası́ se směrem vektoru fázové rychlosti (f1 , f2 ). Bude-li se nynı́ bod P pohybovat po C proti směru hodinových ručiček, vektor (f1 , f2 ) spojitě rotuje a po jednom oběhu bodu P po křivce C bude přı́růstek úhlu 2πk (měřeno rovněž proti směru hodinových ručiček). Celé čı́slo k se nazývá index uzavřené křivky C a je nezávislé na tvaru křivky. Závisı́ pouze na charakteru pevných bodů uvnitř křivky C. Zvolı́me-li uzavřenou křivku C tak, aby obkličovala jediný izolovaný pevný bod x, pak se k nazývá indexem pevného bodu toku. Pro indexy pevného bodu a uzavřené křivky platı́ následujı́cı́ vztahy: KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 92 a) Index uzlu, ohniska nebo středu je +1. b) Index hyperbolického sedla je 1. c) Index uzavřené orbity je +1. d) Index uzavřené křivky, která nemá uvnitř žádný pevný bod, je 0. e) Index uzavřené křivky, která má uvnitř vı́ce pevných bodů, je roven součtu indexů těchto bodů. Tato tvrzenı́ lze snadno ověřit na fázových portrétech dvourozměrných systémů. Poznámka: Existujı́ také degenerované pevné body, které majı́ indexy odlišné od hodnot ±1. Jako důsledek uvedených hodnot indexů pevných bodů toku a uzavřených křivek platı́ Věta 10.1. Uvnitř uzavřené periodické trajektorie γ musı́ být nejméně jeden pevný bod. Je-li jen jeden, musı́ to být zdroj (nestabilnı́ uzel nebo ohnisko) nebo propad (stabilnı́ uzel nebo ohnisko). Jsou-li všechny pevné body uvnitř uzavřené trajektorie γ hyperbolické, musı́ jich být lichý počet 2n + 1; z nich n jsou sedla, n + 1 zdroje nebo propady. Obrázek 10.1: Prstencová oblast Věta 10.2. Prstencová oblast Ω bez pevných bodů, u nı́ž z obou okrajů směřuje vektorové pole dovnitř Ω, obsahuje alespoň jeden stabilnı́ limitnı́ cyklus (obr.10.1). Věta 10.3. Bendixsonovo kritérium neexistence limitnı́ch cyklů. V systému ẋ1 = f1 (x1 , x2 ), ẋ2 = f2 (x1 , x2 ) (f1 , f2 jsou alespoň třı́dy C 1 ) nemůže existovat limitnı́ cyklus v jednoduše souvislé oblasti Ω fázové roviny, neměnı́-li tam výraz I= ∂f1 ∂f2 + ∂x1 ∂x2 (10.2) znaménko nebo nenı́-li identicky rovný nule. Důkaz: Pro libovolnou trajektorii systému platı́ f2 (x1 , x2 ) dx2 = dx1 f1 (x1 , x2 (10.3) neboli f1 dx2 − f2 dx1 = 0. Předpokládejme, že limitnı́ cyklus existuje a uvažujme křivkový integrál po této trajektorii I (f1 dx2 − f2 dx1 ) = 0. (10.4) Podle Stokesovy věty vektorové analýzy lze tento integrál počı́tat jako integrál z plochy uzavřené limitnı́m cyklem I Z Z ∂f1 ∂f2 (f1 dx2 − f2 dx1 ) = ( + )dx1 dx2 = 0. (10.5) ∂x1 ∂x2 KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 93 Má-li být křivkový integrál rovný nule, musı́ integrand I= ∂f1 ∂f2 + ∂x1 ∂x2 být bud’ rovný nule nebo měnit v oblasti uzavřené limitnı́m cyklem znaménko. Nenı́-li tato podmı́nka splněna, nemůže existovat limitnı́ cyklus. Přı́klad 10.3. Pro nelineárnı́ systém z přı́kladu 4.3 je I = −a. Tento výraz neměnı́ znaménko a nenı́ roven nule nikde ve fázové rovině, proto nemůže existovat žádný limitnı́ cyklus. Přı́klad 10.4. Nelineárnı́ systém je popsán rovnicemi ẋ2 = −x1 + 2bx2 (1 − ẋ1 = x2 x22 ) 3a 0 < b < 1. Tento systém má jeden rovnovážný stav, nestabilnı́ ohnisko pro x1 = x2 = 0. Výraz I= ∂f1 ∂f2 x2 + = 2b(1 − 2 ). ∂x1 ∂x2 a Pro a < 0 nenı́ 0a √ nikdy I nulové ani neměnı́ znaménko, nemůže tedy existovat žádný limitnı́ cyklus. Pro a >√ pro |x2 | < a nemůže existovat limitnı́ cyklus, který je zcela obsažen v oblasti omezené hodnotou |x2 | < a. Může však existovat limitnı́ cyklus většı́. Bendixsonovo kritérium zobecnil Dulac. Věta 10.4. Dulacovo kritérium. Necht’ φ(x1 , x2 ) je spojitá funkce se spojitými derivacemi v jednoduše souvislé oblasti Ω fázové roviny. Pak v Ω nemůže existovat limitnı́ cyklus, neměnı́-li tam výraz ∂ ∂ (φf1 ) + (φf2 ) (10.6) ∂x1 ∂x2 znaménko nebo nenı́-li identicky rovný nule. Důkaz kritéria lze provést podobně jako u kritéria Bendixsonova. Přı́klad 10.5. Nelineárnı́ systém ẋ = x(y − 1) ẏ = x + y − 2y 2 může mı́t podle Bendixsonova kritéria limitnı́ cyklus, protože výraz I = −3y měnı́ znaménko. Použijeme-li Dulacova kritéria s funkcı́ φ(x, y) = x3 , pak ∂ ∂ (φf1 ) + (φf2 ) = −3x3 . ∂x1 ∂x2 Pro x = 0 jsou rovnice systému ẋ = 0 a ẏ = y − 2y 2 . Osa y je tedy trajektorie a žádná jiná trajektorie ji nemůže křižovat. Výraz −3x3 nemůže tedy měnit znaménko a proto neexistujı́ v celé fázové rovině uzavřené trajektorie. 10.3 Poincaréovo zobrazenı́ K popisu vlastnostı́ periodické orbity a chovánı́ trajektoriı́ v jejı́m blı́zkém okolı́ se s výhodou využı́vá tzv. Poincaréova zobrazenı́. Jak dále uvidı́me, je Poincaréovo zobrazenı́ výhodné pro studium stability i bifurkacı́ periodických řešenı́. Uvažujme autonomnı́ systém ẋ = f (x), x ∈ Rn , n ≥ 2. (10.7) Předpokládejme, že existuje limitnı́ cyklus γ a zvolme na něm libovolný bod x. Tı́mto bodem proložme lokálnı́ hyperplochu S dimenze n − 1, která protı́ná orbitu γ. Tato plocha nemusı́ být hyperrovina, KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 94 ale musı́ být vybrána tak, aby tok vektorového pole ji všude protı́nal transverzálně, tj. aby skalárnı́ součin f (x).n(x) 6= 0 pro všechna x ∈ S, kde n(x) je jednotkový vektor normály plochy S v bodě x. Označme U ⊆ S takové okolı́ bodu x, ve kterém periodická orbita má jen jeden průsečı́k x. Zkoumejme nynı́ chovánı́ trajektorie, která vycházı́ z nějakého bodu x0 ∈ U dostatečně blı́zkého k bodu x (obr. 10.2). Označme x1 = P (x0 ) prvnı́ průsečı́k trajektorie s řezem S, který následuje po x0 . Tı́m definujeme zobrazenı́ P (x), které se nazývá Poincaréovo zobrazenı́ přı́slušné k periodické orbitě γ. Toto zobrazenı́ je difeomorfismus a lze ho chápat jako diskrétnı́ dynamický systém xk+1 = P (xk ) definovaný na řezu S. Zobrazenı́ P plně určuje kvalitativnı́ chovánı́ toku soustavy ẋ = f (x) v okolı́ periodické orbity γ. Pevnému bodu x zobrazenı́ P odpovı́dá uzavřená trajektorie γ, periodickým bodům zobrazenı́ P s periodou p odpovı́dajı́ trajektorie, které se uzavřou po p obězı́ch. Stabilita pevného bodu x difeomorfismu P odpovı́dá stabilitě orbity γ pro vektorové pole f (x). Tuto stabilitu vyšetřı́me pomocı́ linearizace Poincaréova zobrazenı́ kolem bodu x. Obrázek 10.2: Poincaréovo zobrazenı́ Pomocı́ stabilnı́, nestabilnı́ a centrálnı́ variety pevného bodu zobrazenı́ P lze definovat stabilnı́, nestabilnı́ a centrálnı́ varietu uzavřené trajektorie toku. Je-li např. x hyperbolický pevný bod a má-li DP (x) (tj. matice linearizace Poincaréova zobrazenı́ v bodě x) ns vlastnı́ch čı́sel s modulem menšı́m než jedna a nu vlastnı́ch čı́sel s modulem většı́m než jedna (ns +nu = n−1), pak dim W s (x) = ns a dim W u (x) = nu pro difeomorfismus P . Stabilnı́ varieta W s (γ) periodické orbity γ je pak množina bodů všech trajektoriı́, které procházejı́ body stabilnı́ variety W s (x) difeomorfismu P . Obdobně to platı́ pro nestabilnı́ varietu W u (γ). Dimenze variet toku jsou o jednotku vyššı́ než dimenze odpovı́dajı́cı́ch variet difeomorfismu P . Pomocı́ Poincaréova zobrazenı́ lze formulovat kritérium orbitálnı́ stability uzavřené trajektorie γ. Věta 10.5. Necht’ γ je uzavřená trajektorie soustavy ẋ = f (x) a P jejı́ Poincaréovo zobrazenı́. Označme λ1 , λ2 , ..., λn−1 vlastnı́ čı́sla matice DP (x), kde x je pevný bod difeomorfismu P , odpovı́dajı́cı́ trajektorii γ. Je-li |λi | < 1 pro i = 1, 2, ..., n − 1, pak γ je orbitálně stabilnı́. Je-li |λk | > 1 alespoň pro jedno k ∈ {1, 2, ..., n − 1} je γ orbitálně nestabilnı́. Vlastnı́ čı́sla λi matice DP (x) se nazývajı́ multiplikátory trajektorie γ. Hlavnı́m přı́nosem Poincaréova zobrazenı́ je jeho geometrická názornost a převedenı́ problému chovánı́ dynamického systému ẋ = f (x) v Rn na studium chovánı́ diskrétnı́ho systému P v prostoru Rn−1 . Celý problém se tedy zredukuje o jednu dimenzi, vzhledem k celému fázovému prostoru je však Poincaréovo zobrazenı́ lokálnı́. Výpočet Poincaréova zobrazenı́ vyžaduje znalost obecného řešenı́ diferenciálnı́ rovnice ẋ = f (x) KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 95 a to lze najı́t jen v nejjednoduššı́ch přı́padech. Mnohdy se však P dá určit alespoň kvalitativně přibližnými metodami, složitějšı́ systémy se řešı́ numericky. Při numerickém řešenı́ se řez volı́ jako hyperplocha (obvykle hyperrovina) určená rovnicı́ S(x1 , ..., xn ) = 0. Systém se numericky integruje a v každém kroku integrace se vyhodnocuje znaménko funkce S. Při změně znaménka se zı́ská bod průsečı́ku trajektorie s plochou S pomocı́ interpolace mezi dvěma poslednı́mi body zı́skanými integracı́. Stejným způsobem zı́skáme dalšı́ body orbity Poincaréova zobrazenı́ a z jejı́ho charakteru pak můžeme posoudit stabilitu periodické orbity γ. 10.4 Rovnice ve variacı́ch Uved’me si ještě jiný přı́stup k popisu chovánı́ trajektoriı́ systému ẋ = f (x) v okolı́ uzavřené trajektorie. Tento způsob využı́vá výsledků Floquetovy teorie periodických systémů, kterou jsme popsali v čl. 4.1. Necht’ γ je trajektorie řešenı́ x(t) systému ẋ = f (x) pro počátečnı́ podmı́nku x0 . Proved’me perturbaci řešenı́ x(t) volbou blı́zké počátečnı́ podmı́nky y 0 a označme toto perturbované řešenı́ y(t). Pak můžeme psát y(t) = x(t) + z(t). Protože x(t) i y(t) jsou řešenı́mi rovnice ẋ = f (x), je ż(t) = ẏ(t) − ẋ(t) = f (y(t)) − f (x(t)). (10.8) ż(t) = f (x(t) + z(t)) − f (x(t)). (10.9) Po dosazenı́ za y(t) je Pravou stranu upravı́me pomocı́ Taylorova vztahu f (x(t) + z(t)) − f (x(t)) = ∂f (x(t)) z(t) + r(z(t)). ∂x (10.10) Nahradı́me-li pravou stranu rovnice (10.9) lineárnı́ aproximacı́ z (10.10), dostaneme diferenciálnı́ rovnici pro z(t) ∂f ż(t) = (x(t)) z(t), (10.11) ∂x která se nazývá rovnicı́ ve variacı́ch soustavy ẋ = f (x) pro řešenı́ x(t). Je to lineárnı́ neautonomnı́ rovnice ẋ = A(t)x s maticı́ ∂f A(t) = (x(t)). (10.12) ∂x Dále budeme předpokládat, že řešenı́ x(t) je periodické s periodou T , takže γ je uzavřená trajektorie. Pak A(t) je periodickou funkcı́ času, rovnice ve variacı́ch (10.11) odpovı́dá rovnici (4.15) a lze na ni aplikovat Floquetovu teorii. Multiplikátory uzavřené orbity γ lze stanovit numericky, a to obvykle výhodněji než u Poincaréova zobrazenı́. Pro určenı́ stability γ lze pak využı́t věty 10.5. Podrobnějšı́ výklad lze nalézt např. v [2]. 10.5 Úlohy 10.1. Ukažte, že x1 = cos t, x2 = sin t je periodické řešenı́ systému ẋ1 = x1 − x2 − x31 − x1 x22 ẋ2 = x1 + x2 − x21 x2 − x32 √ √ a x1 = 2 π cos t, x2 = 2 π sin t je periodické řešenı́ systému ẋ1 = −x2 + x1 sin x21 + x22 4 ẋ2 = x1 + x2 sin x21 + x22 4 KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA 96 Nalezněte pro oba systémy rovnice ve variacı́ch kolem uvažovaného periodického řešenı́ a ukažte, že v obou přı́padech je limitnı́ cyklus orbitálně asymptoticky stabilnı́. 10.2. Uvažujte systém 2.řádu ẋ1 = −x2 + ax1 (x21 + x22 ) sin (x21 + x22 ) ẋ2 = x1 + ax2 (x21 + x22 ) sin (x21 + x22 ) Určete stabilitu rovnovážného stavu pro a = +1 a a = −1. (Použijte Ljapunovovu funkci V = x21 + x22 ). Ukažte, že x1 = n cos t, x2 = n sin t je periodické řešenı́ daného systému pro n = 1, 2... Odvod’te rovnici ve variacı́ch kolem těchto periodických řešenı́ a určete, že limitnı́ cykly jsou orbitálně asymptoticky stabilnı́ pro a = +1, jestliže n je sudé, a nestabilnı́, jestliže n je liché. 10.3. Ukažte, že periodický systém ẋ2 = −x1 − bx2 − a cos ωt ẋ1 = x2 má periodické řešenı́ ve tvaru x2 (t) = −ωB sin (ωt + α). x1 (t) = B cos (ωt + α) Nalezněte podmı́nky pro orbitálnı́ asymptotickou stabilitu limitnı́ho cyklu odpovı́dajı́cı́ho periodickému řešenı́. 10.4. Uvažujte systém 2. řádu π ẋ1 = −x2 + x2 (x21 + x22 ) sin p π ẋ2 = x1 + x2 (x21 + x22 ) sin p x21 + x22 x21 + x22 Ukažte, že tento systém má periodické řešenı́ x1 = 1 cos t, n x2 = 1 sin t n pro n = 1, 2, ...Určete orbitálnı́ stabilitu odpovı́dajı́cı́ch limitnı́ch cyklů. Ukažte, že libovolně blı́zko počátku existujı́ uzavřené i otevřené trajektorie. Určete stabilitu rovnovážného stavu v počátku. 10.5. Uvažujte systém ẋ1 = x2 ẋ2 = −x1 + (1 − x21 − x22 )x2 Určete stabilitu nulového řešenı́. Ukažte, že systém má limitnı́ cyklus x21 + x22 = 1 odpovı́dajı́cı́ periodickým řešenı́m x1 = sin (t + c) x2 = cos (t + c), kde c je konstanta. Diskutujte orbitálnı́ asymptotickou stabilitu této uzavřené trajektorie. Ukažte, že systém nemá žádné dalšı́ limitnı́ cykly. Návod: Uvažujte Ljapunovovu funkci V = x21 + x22 . Podél periodického řešenı́ s periodou T je Z 0 T V̇ (x)dt = 0. Kapitola 11 Bifurkace rovnovážných stavů a periodických řešenı́ Jak jsme viděli doposud u mnoha přı́kladů, modely reálných fyzikálnı́ch systémů obsahujı́ různé parametry, které se mohou měnit vlivem vnitřnı́ch i vnějšı́ch podmı́nek. Při určitých hodnotách těchto parametrů docházı́ k bifurkacı́m, které se projevujı́ strukturálnı́mi změnami v systému. Těmito bifurkačnı́mi jevy se nynı́ budeme zabývat trochu podrobněji. Teorie bifurkacı́ studuje systematicky kvalitativnı́ změny řešenı́ diferenciálnı́ch nebo diferenčnı́ch rovnic, měnı́-li se jeden nebo vı́ce parametrů (tzv. řı́dı́cı́ch parametrů). Tato teorie vede k rozloženı́ prostoru parametrů na oblasti, ve kterých nedocházı́ k bifurkacı́m (a systém je strukturálně stabilnı́) a na hranice mezi nimi, na nichž bifurkace nastávajı́. Složitost těchto oblastı́ podstatně roste s dimenzı́ parametrického prostoru a současně roste i možný počet typů bifurkacı́. Nejjednoduššı́ přı́pad představujı́ jednoparametrické bifurkace u dynamických systémů se spojitým časem. Všimneme si předevšı́m různých variant bifurkacı́ rovnovážných stavů a periodických řešenı́. Protože analýza těchto bifurkacı́ se obvykle omezuje na studium vektorových polı́ v blı́zkosti bifurkujı́cı́ch rovnovážných stavů a periodických orbit, nazývajı́ se tyto bifurkace lokálnı́. 11.1 Bifurkace rovnovážných stavů Budeme studovat dynamický systém popsaný rovnicı́ ẋ = f (x, α) s jednı́m proměnným parametrem α, ostatnı́ parametry systému budeme pokládat za pevné. Rovnovážné stavy x(α) budou závislé na hodnotě parametru α. Při kritické hodnotě α? tohoto parametru bude docházet k bifurkačnı́m jevům. V bifurkačnı́m bodě nenı́ systém strukturálně stabilnı́, matice Df (x, α? ) je singulárnı́. V článku 4.4 o centrálnı́ varietě jsme viděli, že dimenze bifurkačnı́ho problému závisı́ jen na počtu vlastnı́ch čı́sel matice linearizace, které při kritické hodnotě α? přecházejı́ přes imaginárnı́ osu. V nejjednoduššı́ch přı́padech se jedná o jedno reálné vlastnı́ čı́slo nebo o jednoduchý pár komplexně sdružených vlastnı́ch čı́sel. Budeme předpokládat, že ostatnı́ vlastnı́ čı́sla ležı́ v levé Gaussově polorovině. Bifurkace systému vyššı́ho řádu lze pak redukovat na typy bifurkacı́ diferenciálnı́ch rovnic 1. a 2. řádu. Podrobnějšı́m rozborem bychom zjistili, že stačı́ uvažovat tři základnı́ typy rovnice 1. řádu a jeden typ rovnice 2. řádu (tzv. normálnı́ formy). Jedná se o tyto přı́pady bifurkacı́: a) Tečná bifurkace. Nazývá se také bifurkace sedlo-uzel. Vyskytuje se u rovnice ẋ = α − x2 . (11.1) √ Rovnovážné stavy jsou x = ± α. Pro α < 0 nenı́ žádný rovnovážný stav, pro α > 0 jsou dva, √ √ x(1) = + α (stabilnı́) a x(2) = − α (nestabilnı́). Diagram řešenı́ je znázorněn na obr. 11.1a. 97 KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 98 Obrázek 11.1: Tečná a transkritická bifurkace b) Transkritická bifurkace. Nazývá se také ”křı́žová” bifurkace. Objevuje se u rovnice ẋ = αx − x2 . (11.2) Jsou dva rovnovážné stavy x(1) = 0 a x(2) = α. Pro α < 0 je prvnı́ stabilnı́, druhý nestabilnı́, pro α > 0 je tomu naopak. Diagram je zakreslen na obr. 11.1b. Transkritická bifurkace nastává také u rovnice ẋ = x2 − αx (11.3) Rovnovážné stavy jsou opět dva, x(1) = 0 a x(2) = α. Stabilita je patrna z obr. 11.1c. Obrázek 11.2: Vidličková a Hopfova bifurkace c) Vidličková bifurkace. Má podobně jako u předchozı́ho typu dvě varianty. Superkritická nastává u rovnice ẋ = αx − x3 (11.4) √ √ Pro α < 0 je jeden rovnovážný stav v nule, pro α > 0 jsou tři, x(1) = 0, x(2) = + α a x(3) = − α (obr 11.2a). Subkritická bifurkace se objevuje u rovnice ẋ = x3 − αx. (11.5) Pro α > 0 jsou tři rovnovážné stavy (dva nestabilnı́ a jeden stabilnı́), pro α < 0 je jeden nestabilnı́. d) Hopfova bifurkace nastává, když dvě komplexně sdružená vlastnı́ čı́sla matice linearizace přecházejı́ imaginárnı́ osu. Generuje se uzavřená invariantnı́ křivka kolem pevného bodu. Normálnı́ forma odpovı́dajı́cı́ tomuto typu je ẋ = αx − y − x(x2 + y 2 ) ẏ = x + αy − y(x2 + y 2 ) (11.6) KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 99 Jacobiova matice linearizace je J= " α − 3x2 − y 2 −1 − 2xy 1 − 2xy α − x2 − 3y 2 # Existuje jeden pevný bod (x, y) = (0, 0). Jacobiova matice má pro tento pevný bod tvar J (0) = " α −1 1 α # Odpovı́dajı́cı́ charakteristická rovnice λ2 − 2αλ + α2 + 1 = 0 má dva komplexně sdružené kořeny α ± j. Pro α < 0 je pevný bod stabilnı́, pro α > 0 nestabilnı́. Pro α = 0 měnı́ pevný bod stabilitu a současně vzniká stabilnı́ limitnı́ cyklus, jehož amplituda se zvětšuje se zvětšujı́cı́m se α. Odpovı́dajı́cı́ diagram je na obr. 11.2b. 11.2 Bifurkace periodických řešenı́ Všimněme si nynı́ stability periodických orbit, které závisejı́ na jednom proměnném parametru α. Bifurkace nastane tehdy, je-li některé vlastnı́ čı́slo linearizace Poincaréova zobrazenı́ v okolı́ periodické orbity γ(α) v absolutnı́ hodnotě rovno jedné. Nastává přitom zase několik možnostı́: a) Vlastnı́ čı́slo je rovno +1. (Je to analogie přı́padu vlastnı́ho čı́sla rovného nule pro rovnovážný stav spojitého systému). - tečná bifurkace; vzniká nebo zaniká pár periodických orbit (bifurkace sedlo-uzel) - křı́žová bifurkace; měnı́ se stabilita dvou limitnı́ch cyklů - vidličková bifurkace; vznikajı́ tři mezné cykly z jednoho. b) Vlastnı́ čı́slo je rovno −1. Je to tzv. subharmonická bifurkace neboli bifurkace zdvojenı́ periody. Jestliže pro α = α? přecházı́ jeden multiplikátor trajektorie γ z jednotkového kruhu ven, pak se stabilnı́ trajektorie měnı́ na nestabilnı́ a od nı́ se odvětvı́ uzavřená trajektorie s dvojnásobnou periodou. c) dvojice komplexně sdružených vlastnı́ch čı́sel (multiplikátorů) procházı́ jednotkovou kružnicı́. To odpovı́dá invariantnı́ kružnici Poincaréova zobrazenı́ a vznikne invariantnı́ torus T 2 . Na rozdı́l od obou předešlých přı́padů, které mohou existovat už v systémech 2. řádu nastává tento přı́pad až od 3. řádu. 11.3 Teorie katastrof Zakladatelem teorie katastrof je francouzský matematik René Thom, který vydal v r. 1972 knihu s názvem: Strukturálnı́ stabilita a morfogeneze. V nı́ se zabýval zejména studiem změn tvarů v biologii, pro které využil globálnı́ geometrické a analytické výsledky teorie singularit hladkých zobrazenı́. Z teorie singularit je známo, že pozvolná spojitá změna parametrů vyvolává často rychlou kvalitativnı́ změnu stavu, což je obvykle označováno jako skok. Thom nazval poněkud nadneseně tyto skokové změny katastrofami a teorii singularit spolu s jejı́mi aplikacemi teoriı́ katastrof. Thomova kniha a celá nová teorie vzbudily široký ohlas a rozsáhlé, ale často i dosti spekulativnı́ diskuse. Po opadnutı́ prvnı́ho nadšenı́ se ukázalo, že teorie katastrof nenı́ převratnou teoriı́, ale že přesto zůstává zajı́mavou partiı́ modernı́ matematiky, která přinesla řadu konkrétnı́ch výsledků nejen v matematice samotné, ale předevšı́m v oblasti fyzikálnı́ch a technických věd. O mı́ře konkrétnı́ho přı́nosu pro biologické a sociálnı́ vědy se vedou rozporné diskuse, protože velké množstvı́ přı́spěvků má zatı́m převážně spekulativnı́ charakter. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 100 V užšı́m smyslu je cı́lem teorie katastrof popis rychlých změn v chovánı́ dynamických systémů. Tato tzv. elementárnı́ teorie katastrof studuje bifurkačnı́ jevy předevšı́m u gradientnı́ch dynamických systémů, které jsou vytvářeny pomocı́ potenciálu, závislého na řı́dı́cı́ch parametrech. Možné bifurkace těchto gradientnı́ch systémů jsou v teorii katastrof popsány vyčerpávajı́cı́m způsobem. Mnozı́ autoři však chápou teorii katastrof obecněji jako spojenı́ teorie singularit a teorie bifurkacı́ spolu s jejich aplikacemi v nejrůznějšı́ch oborech. V dalšı́m se budeme zabývat jen jednoduchými výsledky elementárnı́ teorie katastrof, předevšı́m u gradientnı́ch systémů. V této oblasti dosáhl Thom pozoruhodných výsledků, které spočı́vajı́ zejména ve studiu a klasifikaci degenerovaných kritických bodů potenciálu. Skokové jevy, které jsou stěžejnı́ pro teorii katastrof, si můžeme přiblı́žit jednoduchým pokusem. Obrázek 11.3: Zeemanův stroj Zeeman vytvořil školnı́ přı́klad ”katastrofického stroje”, kterým je jednoduchý tlumený mechanický systém podle obr. 11.3. Volně otáčivý kotouč s pevným středem A má v jednom bodě obvodu P upevněna dvě zhruba stejně dlouhá vhodně napjatá gumová vlákna. Jeden konec levého vlákna je pevně fixován v bodě B, konec F pravého vlákna je volně pohyblivý a nazývá se řı́dı́cı́ bod systému. Při pohybu bodu F se bude kotouč otáčet a jeho polohu (stav systému) můžeme definovat úhlem x měřeným od základnı́ osy AB. Umı́stěme nynı́ bod F do nějakého bodu roviny a natočme kotouč do libovolné počátečnı́ polohy. Při uvolněnı́ kotouče se jeho pohyb ustálı́ v nějakém rovnovážném stavu. Snadno zjistı́me, že pokud bude bod F vně oblasti uzavřené křivkou na obr. 11.3, ustálı́ se kotouč v jedné rovnovážné poloze a systém má jeden atraktor. Při pohybu bodu F přes tuto oblast (např. podél přı́mky v obr. 11.3) bude mı́t systém dva atraktory, při přechodu hraničnı́ křivky (bifurkačnı́ množina) vykoná systém rychlý skok do druhého atraktoru. Bifurkačnı́ křivka má čtyři hroty, tj. obyčejné body vratu. Systém má dva řı́dı́cı́ parametry, kterými jsou souřadnice x, y bodu F . Jak uvidı́me v dalšı́m článku, teorie katastrof dokazuje, že na bifurkačnı́ křivce podobných systémů mohou být jen regulárnı́ body a hroty. 11.3.1 Elementárnı́ teorie katastrof Obecná teorie bifurkacı́ studuje chovánı́ dynamických systémů s n stavovými proměnnými a m řı́dı́cı́mi parametry αi , např. typu ẋ = f (x1 , ..., xn ; α1 , ..., αm ) x ∈ Rn α ∈ Rm . (11.7) KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 101 Elementárnı́ teorie katastrof, která je v podstatě podmnožinou teorie bifurkacı́, studuje bifurkačnı́ jevy u gradientnı́ch dynamických systémů popsaných rovnicemi x ∈ Rn ẋ = −gradx V (x, α) α ∈ Rm . (11.8) Základnı́ vlastnosti gradientnı́ch systémů byly uvedeny v čl.6.1. Zde budeme sledovat vliv změny parametrů α na chovánı́ systému. Definujme nejprve některé základnı́ pojmy. Množina pevných bodů systému (11.8) M = (x, α) | ∂V (x, α) = 0, ∂xi i = 1, ..., n (11.9) tvořı́ hyperplochu v prostoru Rn × Rm , jejı́ž prvky jsou při konstantnı́m α stacionárnı́mi (neboli kritickými) body potenciálu V . Katastrofická množina K je dána degenerovanými stacionárnı́mi body potenciálu ∂ 2 V (x, α) K = (x, α) ∈ M | det ∂xi ∂xj !n i,j=1 =0 . (11.10) Bifurkačnı́ množina B je dána projekcı́ těchto degenerovaných stacionárnı́ch bodů do parametrického prostoru B = {α ∈ Rm | ∃ x ∈ Rn ; (x, α) ∈ M } . (11.11) Dále uvedeme přehled elementárnı́ch katastrof, přičemž pro každé f (x, α) stanovı́me a) množinu M ⊂ Rn × Rm všech stacionárnı́ch bodů funkce f (x, α) při pevném, ale libovolném α ∈ Rm , b) podmnožinu K ⊂ M ⊂ Rn × Rm všech degenerovaných stacionárnı́ch bodů, c) průmět B množiny K do prostoru parametrů Rm . 1. Uvažujme nejprve gradientnı́ systém 1. řádu (dim Rn = 1), který má maximálně čtyři proměnné parametry (dim Rm ≤ 4). Budeme studovat lokálnı́ chovánı́ potenciálu V (x) v blı́zkosti stacionárnı́ho bodu x, který můžeme bez ztráty obecnosti uvažovat v počátku. Pak x = 0, V (0) = 0. Budeme předpokládat, že potenciálnı́ funkci lze rozvinout v Taylorovu řadu V (x) = a0 + a1 x + a2 x2 + a3 x3 + ... (11.12) kde a0 = V (0) = 0, a1 = V 0 (0) = 0, ak = 1/k!(dk V /dxk )(0), k = 2,3,... Dále budeme uvažovat, že potenciálnı́ funkce může být ovlivněna vnějšı́mi nebo vnitřnı́mi poruchami, takže V závisı́ na parametrech α. Budeme studovat typy hladkých poruch, které podstatným způsobem ovlivňujı́ lokálnı́ chovánı́ V (x) pro x = 0. Je-li ak 6= 0, přicházejı́ v úvahu jen poruchy, jejichž stupeň n ≤ k, protože pro n > k platı́ při malé poruše |x| << 1 vztah |x|n << |x|k . Přı́pad 1. Necht’ a2 6= 0. Pak třı́parametrové rušenı́ vede na tvar V (x) = a2 x2 + µ2 x2 + µ1 x + µ0 . (11.13) Vhodnou transformacı́ souřadnic, volbou měřı́tek a eventuálnı́ změnou znaménka zı́skáme tzv. normálnı́ (standardnı́) tvar V (x) = 12 x2 , který nenı́ závislý na parametrech. Tı́m jsme vlastně zvolili lokálnı́ souřadnice ve vrcholu paraboly a označili jsme je stejnými pı́smeny x, V . Funkce V má v bodě x = 0 jednoduché minimum, nenastávajı́ žádné katastrofy. Potenciál V (x) odpovı́dá dynamickému systému ẋ = −x. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 102 Přı́pad 2. Katastrofa typu záhyb. Pro a2 = 0, a3 6= 0 a možné čtyřparametrové rušenı́ vede na potenciál V (x) = a3 x3 + µ3 x3 + µ2 x2 + µ1 x + µ0 . (11.14) Po vhodných transformacı́ch zı́skáme standardnı́ tvar 1 V (x) = x3 + α1 x, 3 (11.15) který závisı́ na jednom volném parametru. Tento potenciál odpovı́dá gradientnı́mu dynamickému systému ẋ = −x2 − α1 . Systém nemá pro α1 > 0 pevné body, pro α1 < 0 jsou dva. M = {(x, α1 ) ∈ R2 | x2 + α1 = 0} (11.16) Katastrofická množina K je jednobodová množina (obr. 11.4) K = {(x, α1 ) ∈ M | ∂ 2 V /∂x2 = 0} = {(0, 0)}. (11.17) Jejı́ průmět do prostoru parametru α1 je jediný bod 0. Pro α1 = 0 nastává tedy katastrofa (bifurkace) typu záhyb. Obrázek 11.4: Katastrofa typu záhyb Obrázek 11.5: Katastrofa typu hrot Přı́pad 3. Katastrofa typu hrot: a2 = a3 = 0, a4 6= 0. Obecný potenciál 4. stupně s pěti parametry lze zase vhodnými transformacemi převést na standardnı́ tvar 1 1 V (x, α1 , α2 ) = x4 + α1 x2 + α2 x, 4 2 (11.18) který závisı́ na dvou volitelných parametrech.Odpovı́dá dynamickému systému ẋ = −x3 − α1 x − α2 , (11.19) který v závislosti na parametrech nemá bud’ žádný rovnovážný stav, nebo jeden nebo tři. Odpovı́dajı́cı́ množiny jsou M = {(x, α1 , α2 ) ∈ R3 | x3 + α1 x + α2 = 0} K = {(x, α1 , α2 ) ∈ M | 3x2 + α1 = 0} = {(x, α1 , α2 ) | α1 = −3x2 , α2 = 2x3 } B = {(α1 , α2 ) ∈ R2 | 4α13 + 27α22 = 0}. Bifurkačnı́ množina B je znázorněna na obr. 11.5, množina pevných bodů M je zakreslena na obr. 11.6. Při x = α1 = α2 = 0 vzniká katastrofa typu hrot. Tento typ je nejjednoduššı́ bifurkacı́, která vznikne při variaci dvou parametrů. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 103 Přı́pad 4. Katastrofa typu vlaštovčı́ ocas: a2 = a3 = a4 = 0, a5 6= 0. Standardnı́ tvar potenciálu je závislý na třech parametrech 1 1 1 V (x, α1 , α2 , α3 ) = x5 + α1 x3 + α2 x2 + α3 x. 5 3 2 (11.20) Odpovı́dajı́cı́ množiny jsou M = {(x, α1 , α2 , α3 ) ∈ R4 | x4 + α1 x2 + α2 x + α3 = 0} K = {(x, α1 , α2 , α3 ) ∈ M | 4x3 + 2α1 x + α2 = 0}. Bifurkačnı́ množina B = {(α1 , α2 , α3 )} je projekcı́ množiny K do prostoru parametrů a má tvar vlaštovčı́ho ocasu (obr. 11.7). Obrázek 11.6: Katastrofa typu hrot Obrázek 11.7: Katastrofa typu vlaštovčı́ ocas Přı́pad 5. Katastrofa typu motýl: a2 = ... = a5 = 0, a6 6= 0. Standardnı́ forma potenciálu má čtyři volné parametry 1 1 1 1 V (x, α1 , α2 , α3 , α4 ) = x6 + α1 x4 + α2 x3 + α3 x2 + α4 x. 6 4 3 2 (11.21) Odpovı́dajı́cı́ bifurkace se nazývá katastrofa typu motýl. Uvedenými čtyřmi typy katastrof jsou vyčerpány všechny možné přı́pady, které mohou vzniknout u jednodimenzionálnı́ho systému, který je ovlivňován nejvýše čtyřmi parametry. 2. U gradientnı́ho systému druhého a vyššı́ho řádu (dim Rn ≥ 2) a třech volných parametrech jsou možné ještě dalšı́ dvě singularity, eliptický a hyperbolický bod. Při čtyřech volných parametrech vzniká ještě parabolický bod. Tyto singularity (katastrofy) jsou již složitějšı́ a jejich podrobný popis lze nalézt v např. v [29]. Thom odvodil ve své knize tuto základnı́ větu: Necht’ C je čtyřdimenzionálnı́ parametrický prostor, X libovolný konečněrozměrný stavový prostor a V hladká funkce na X parametrizovaná pomocı́ C. Necht’ M je množina stacionárnı́ch bodů funkce V . Pak je M hladká hyperplocha v X × C a jedinými typy singularit je výše uvedených sedm elementárnı́ch katastrof. Důkaz této věty je obtı́žný a lze ho nalézt v [29]. Pozoruhodné na této větě je, že existuje konečný počet elementárnı́ch katastrof a že nejsou závislé na dimenzi stavového prostoru. Bude-li dimenze parametrického prostoru C rovna pěti, lze dokázat, že jsou možné dalšı́ čtyři typy katastrof, pro dim C = 6 existuje nekonečně velký počet různých katastrof. KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ 11.3.2 104 Aplikace teorie katastrof Matematická teorie katastrof nalezla značné využitı́ nejen v matematice samotné, ale i v mnoha jiných oblastech. Velmi známé jsou aplikace ve fyzice. V mechanice jsou to např. skokové jevy při tlaku na elastické nosnı́ky, problémy stability průřezů při jeho různých tvarech, studium průhybu desek apod. Známými aplikacemi jsou fázové přechody v termodynamice, nespojité jevy v kvantové mechanice, aerodynamice, laserové fyzice aj. Významnou aplikaci tvořı́ teorie vlnoploch a kaustik, tj. obálek systému paprsků. Na podkladu metod teorie katastrof byly vypracovány např. některé teorie rozloženı́ hmoty ve vesmı́ru a možnosti vzniku galaxiı́ a jiných útvarů. Obecný charakter má využitı́ teorie katastrof při studiu hystereznı́ch jevů, které se objevujı́ také často v regulačnı́ technice. Velké množstvı́ aplikacı́ ve fyzikálnı́ch a technických oborech je popsáno v knize [29]. Poměrně málo konkrétnı́ch výsledků bylo zatı́m dosaženo v biologických a společenských vědách. Nejznámějšı́ jsou snad aplikace v psychologii, např. modelovánı́ agresivity pomocı́ katastrofy typu hrot, modelovánı́ různých psychických stavů, duševnı́ únavy, různých konfliktnı́ch situacı́ apod. V lékařstvı́ byly modelovány epidemické procesy, v ekonomii různé skokové jevy, např. modely vývoje cen na burze, krize v ekonomických systémech aj. Kapitola 12 Chaos V předchozı́ch kapitolách jsme se zabývali deterministickými nelineárnı́mi systémy, jejichž asymptotické chovánı́ vedlo na rovnovážné stavy nebo na periodická či kvaziperiodická řešenı́. Již Poincaré však v r. 1892 upozornil na možnost vzniku chaotického chovánı́ u některých mechanických systémů Hamiltonova typu. Bylo to však považováno za kuriozitu a nebyla tomu věnována dalšı́ pozornost. Teprve r. 1963 meteorolog Lorenz s pomocı́ počı́tače ukázal, že u systému třı́ relativně jednoduchých nelineárnı́ch rovnic (čl. 12.2) mohou při vhodné kombinaci parametrů vzniknout chaotické atraktory. Od té doby byla chaosu věnována velká pozornost a dnes existuje velké množstvı́ poznatků o chaotickém chovánı́ systémů prakticky ve všech oblastech vědy a techniky. V dalšı́ch článcı́ch si ukážeme některé jednoduché deterministické systémy, které majı́ při určitých hodnotách parametrů chaotické chovánı́. Vzhledem k tomu, že se neuvažuje nejistota ani ve vstupech ani v modelu systému, nazývá se tento typ chovánı́ deterministický chaos. Chaotické chovánı́ je ohraničené, nenı́ periodické a podobá se náhodnému. Je vysoce citlivé na změnu počátečnı́ch podmı́nek, i při velmi malé změně se odezvy po určité době značně lišı́. Dlouhodobé chovánı́ nelze tedy spolehlivě predikovat (např. nejistota dlouhodobých meteorologických předpovědı́). Fourierův rozklad chaotického průběhu má spojité spektrum. U autonomnı́ch systémů se spojitým časem může chaos vzniknout u 3. řádu a výše, u neautonomnı́ch již u 2. řádu. U systémů s diskrétnı́m časem popsaných diferenčnı́mi rovnicemi s neinvertovatelným zobrazenı́m f (endomorfismus) je chaotické chovánı́ možné už v jednorozměrném přı́padě, u difeomorfismů u 2. řádu a výše. Bylo prokázáno, že chaos se může vyskytnout téměř ve všech typech nelineárnı́ch systémů s dvěma a vı́ce stupni volnosti. Hodnocenı́ chaosu bylo až donedávna výlučně negativnı́. Teprve v poslednı́ch letech se poukazuje také na výhodné vlastnosti systémů s chaotickým chovánı́m. Chaos dovoluje lepšı́ absorpci energie a hybnosti, umožňuje mı́chánı́, je spojován se zdravou aktivitou na rozdı́l od periodického chovánı́ nebo stacionárnı́ho stavu spojovaných s ukončenı́m aktivity. Bylo rovněž ukázáno, že chaos působı́ jako silný organizačnı́ princip, např. v ekonomii nebo biologii. Chaosu lze využı́t k regulaci a byly publikovány některé metody syntézy chaosu [93]. Změny biologických regulačnı́ch mechanismů pomocı́ chaosu patřı́ pravděpodobně k hlavnı́m nástrojům evoluce biosystémů na všech úrovnı́ch organizace. Zdá se, že biosystémy často operujı́ těsně pod úrovnı́ přechodu k chaosu. Deterministický chaos se tak v poslednı́ch letech stal podnětem k formulaci mnoha nových a zásadnı́ch principů a myšlenek. 105 KAPITOLA 12. CHAOS 106 12.1 Chaos v diskrétnı́ch systémech 12.1.1 Kvadratická diferenčnı́ rovnice Klasický přı́klad jednoduchého dynamického systému s možnostı́ chaotického chovánı́ je diskrétnı́ systém s kvadratickým zobrazenı́m xk+1 = f (xk ) = rxk (1 − xk ), (12.1) kde x ∈ [0, 1] a pro 0 < r ≤ 4 se interval [0, 1] zobrazı́ na sebe, tj. f : [0, 1] → [0, 1]. Graf funkce y = rx(1 − x) je parabola symetrická podle přı́mky x = 1/2 a procházejı́cı́ osou x v bodech x = 0 a x = 1. Jejı́ strmost roste s rostoucı́m parametrem r. Vrchol paraboly je v bodě x = 1/2 a jeho pořadnice je r/4 (obr.12.1). Obrázek 12.1: Kvadratické zobrazenı́ Obrázek 12.2: Průběhy funkcı́ f a f 2 Tı́mto systémem lze např. modelovat růst určité populace na omezeném teritoriu. V některých populacı́ch se generace navzájem nepřekrývajı́, žijı́ vždy jen jedinci jedné generace (např. u některých druhů hmyzu). Pak nenı́ splněna podmı́nka překrývánı́ generacı́ pro spojitý model a populačnı́ dynamiku je možno modelovat uvedenou diferenčnı́ rovnicı́. Stavová proměnná xk zde udává počet jedinců nebo jejich hustotu v k-té generaci. Kvadratický člen zabraňuje neomezenému růstu populace, řı́dı́cı́ parametr r popisuje vliv okolı́ na populaci. Pro pevné body zobrazeni f platı́ x = f (x), tj. x = rx(1 − x). Tomu odpovı́dajı́ hodnoty x = 0 a x = 1 − 1/r pro r > 1. Pro různé hodnoty r má systém tyto vlastnosti: a) r ≤ 1. Existuje jen jeden pevný bod x = 0 a protože f 0 (0) = r < 1, je stabilnı́. Řešenı́m rovnice (12.1) je posloupnost hodnot x0 , x1 , x2 , ..., které budou konvergovat k nule. Populace s takovým parametrem r vyhyne. b) 1 < r < 3 . Existujı́ dva pevné body. Bod x = 0 je nynı́ nestabilnı́ a bod x = 1 − 1/r je stabilnı́, protože f 0 = −r + 2 < 1 v intervalu 1 < r < 3. Trajektorie z libovolné počátečnı́ podmı́nky v intervalu (0, 1) konvergujı́ k jednobodovému atraktoru. c) Pro r = 3 nastane bifurkace a druhý pevný bod bude rovněž nestabilnı́. Při dalšı́m zvýšenı́ r bude mı́t funkce f 2 čtyři pevné body. Na obr. 12.2 jsou pro srovnánı́ zakresleny průběhy funkce f a druhé iterace f 2 pro hodnoty r těsně pod hodnotou 3 a nad hodnotou 3. Je patrno, že pro r > 3 má funkce f 2 dva nestabilnı́ pevné body, které odpovı́dajı́ dvěma nestabilnı́m pevným bodům funkce f . Dalšı́ dva jsou stabilnı́ a odpovı́dajı́ periodickému atraktoru funkce f s periodou 2. Při dalšı́m zvyšovánı́ hodnoty r se zvětšuje amplituda periodické orbity a při r = 3, 45 se orbita s periodou 2 stane nestabilnı́ a vznikne stabilnı́ orbita s periodou 4. Graf funkce f 2 má nynı́ všechny čtyři pevné body nestabilnı́, graf čtvrté iterace f 4 bude mı́t kromě nestabilnı́ch pevných bodů také čtyři stabilnı́, které odpovı́dajı́ KAPITOLA 12. CHAOS 107 atraktoru s periodou 4. Toto zdvojovánı́ periody se při stoupajı́cı́m r opakuje a postupně vznikajı́ stabilnı́ orbity s periodou 8, 16, 32,.., přitom se stále zkracujı́ intervaly parametru r, při nichž nastává bifurkace. Posloupnost bifurkačnı́ch hodnot rm , při nichž vznikajı́ stabilnı́ orbity s periodou 2m , je konvergentnı́ s limitou r∞ = 3, 570. d) Při hodnotách r∞ < r < 4 je chovánı́ systému velmi složité. Existuje nekonečně mnoho intervalů parametru r (tzv. periodická okna), ve kterých existujı́ stabilnı́ periodická řešenı́. K jedné hodnotě parametru přı́slušı́ ovšem jen jedna stabilnı́ perioda. Nejširšı́ je okno periody tři. Existujı́ však také hodnoty parametrů, pro které nastává chaotické chovánı́. Velmi názorně to lze ukázat na bifurkačnı́m diagramu podle obr. 12.3. Pro hodnoty r < r∞ = 3, 57 je patrno zdvojovánı́ periody, od r∞ je systém v chaotické oblasti přerušované periodickými okny. Obrázek 12.3: Bifurkačnı́ diagram kvadratického zobrazenı́ Řešenı́ diferenčnı́ rovnice (12.1) vede tedy při zvětšovánı́ řı́dı́cı́ho parametru r od periodického řešenı́ s periodou 2 přes bifurkačnı́ kaskádu zdvojovánı́ period až k neperiodickému chaotickému chovánı́. Tato cesta k chaosu je charakteristická i pro mnoho jiných systémů. 12.1.2 Po částech lineárnı́ zobrazenı́ Ještě jednoduššı́ systémy s chaosem představujı́ zobrazenı́, která jsou po částech lineárnı́. Např. pilovitý průběh podle obr. 12.4 je zadán vztahy xk+1 = f (xk ) f : [0, 1] → [0, 1] f (x) = ( 2x, x ∈ [0, 1/2), 2x − 1, x ∈ [1/2, 1]. (12.2) Je to vlastně zobrazenı́ typu ”modulo” a lze ho zapsat také ve tvaru xk+1 = 2xk (mod 1). Zobrazenı́ je pro x = 1/2 nespojité, je neinvertovatelné a lze proto vyšetřovat jen kladné polotrajektorie. Z obr. 12.4 je patrno, že existujı́ dva pevné body x = 0 a x = 1, oba jsou nestabilnı́. Druhá iterace f 2 (x) = 22 x(mod 1), obecně f N (x) = 2N x(mod 1) pro x 6= 1, f N (1) = 1, takže f N má právě 2N pevných bodů. Některé z nich odpovı́dajı́ orbitám periody N, jiné majı́ nižšı́ periody. Všechny periodické orbity jsou nestabilnı́. KAPITOLA 12. CHAOS 108 Obrázek 12.4: Lineárnı́ zobrazenı́ a jeho druhá iterace Obrázek 12.5: Střechové zobrazenı́ Dalšı́m typem je symetrické ”střechové” zobrazenı́ podle obr. 12.5, vyjádřené vztahy xk+1 = f (xk ) f : [0, 1] → [0, 1] f (x) = ( 2x, x ∈ [0, 1/2], 2 − 2x, x ∈ (1/2, 1]. (12.3) Zobrazenı́ má dva pevné body a konečný počet orbit periody N . Všechny pevné body a periodické orbity jsou nestabilnı́. O tom se lze přesvědčit následujı́cı́m způsobem. Počátečnı́ podmı́nku x0 ∈ [0, 1) můžeme zapsat jako binárnı́ čı́slo x0 = ∞ X ai /2i a1 = 0 nebo 1. i=1 Zobrazenı́ f podle rovnice (12.3) použité na počátečnı́ podmı́nku x0 ∈ [0, 1/2) (tj. a1 = 0) znamená posunutı́ desetinné čárky o jedno mı́sto doprava, pro x0 ∈ [1/2, 1) ještě kromě posunutı́ také negaci každého ai . Pak f (x0 ) = f (0, a1 a2 a3 a4 ...) = ( 0, a2 a3 a4 0, a2 a3 a4 x0 ∈ [0, 1/2) x0 ∈ [1/2, 1) Pro racionálnı́ počátečnı́ podmı́nky je posloupnost {ai } od určitého mı́sta periodická, takže dynamický systém popsaný zobrazenı́m (12.3) se po uplynutı́ určitého přechodného jevu pohybuje po periodické orbitě. Všechny počátečnı́ podmı́nky odpovı́dajı́cı́ racionálnı́m čı́slům vytvářejı́ netypické trajektorie a odpovı́dajı́cı́ periodické orbity jsou nestabilnı́. Iracionálnı́m počátečnı́m podmı́nkám odpovı́dajı́ typické trajektorie, které bloudı́ v celém intervalu (0,1) a vykazujı́ tedy chaotické chovánı́. Také nesymetrické ”střechové” zobrazenı́ xk+1 = f (xk ) f : [0, 1] → [0, 1] f (x) = ( rx, x ∈ [0, 1/r], r(1 − x)/(r − 1), x ∈ (1/r, 1], (12.4) nemá pro r > 1 žádný stabilnı́ pevný bod a žádné stabilnı́ periodické řešenı́, takže skoro všechny trajektorie majı́ chaotický charakter. 12.1.3 Hénonovo zobrazenı́ Doposud uvedená jednorozměrná diskrétnı́ zobrazenı́ byla neinvertovatelná. U invertovatelných zobrazenı́ (difeomorfismů) nastanou chaotické jevy až od 2. řádu. Jako přı́klad může sloužit Hénonovo KAPITOLA 12. CHAOS 109 zobrazenı́ xk+1 = 1 − rx2k + yk , yk+1 = bxk , k∈Z r > 0, |b| < 1. Při určitých hodnotách parametrů vznikne chaotický atraktor. Podrobnosti např. v [43]. 12.2 Chaos u diferenciálnı́ch rovnic 12.2.1 Lorenzův model V r. 1962 studoval Saltzman Navierovy - Stokesovy nelineárnı́ parciálnı́ diferenciálnı́ rovnice popisujı́cı́ zahřı́vánı́ vrstvy tekutiny. Při řešenı́ pomocı́ Fourierových řad se ukázalo, že relativně velkou amplitudu majı́ jen tři členy, z nichž jeden popisuje rychlostnı́ profil a dalšı́ dva rozdělenı́ teploty. Pomocı́ vhodných aproximacı́ zı́skal Saltzman tři obyčejné nelineárnı́ diferenciálnı́ rovnice ẋ = s(y − x) ẏ = rx − y − xz ż = xy − bz, (12.5) kde parametry s, r, b > 0. V r. 1963 prováděl numerické zkoumánı́ tohoto modelu meteorolog Lorenz, který zjistil, že při určitých hodnotách parametrů se objevuje v systému chaotické chovánı́. Od té doby se pro systém (12.5) ujal název Lorenzův model. Uvažujme dále, že parametry s a b jsou pevné a parametr r proměnný. Obrázek 12.6: Lorenzův chaotický atraktor Jsou možné 3 rovnovážné stavy: 1) x(1) = y (1) = z (1) = 0. Tento stav označı́me jako bod p. Odpovı́dá kapalině v klidu a nastává pro libovolné r. 2) x(2) = y (2) = p b(r − 1), z (2) = r − 1 (bod q+ ) 3) x(3) = y (3) = − b(r − 1), z (3) = r − 1 (bod q− ). p Druhý a třetı́ rovnovážný stav existujı́ pro r > 1 a odpovı́dajı́ vzniku konvekčnı́ch buněk. KAPITOLA 12. CHAOS 110 1) Stabilita bodu p: det(A − λI) = −(s + λ) s 0 r −(1 + λ) 0 0 0 −(b + λ) = 0. (12.6) Charakteristická rovnice je (λ + b)[λ2 + (s + 1)λ − s(r − 1)] = 0. (12.7) Bod p = (0, 0, 0) je pro 0 < r < 1 asymptoticky stabilnı́ uzel. Pro r = 1 přecházı́ jedno reálné vlastnı́ čı́slo imaginárnı́ osu (bifurkace). Pro r > 1 je bod p sedlo s dimenzı́ W s (p) = 2. Osa z je z důvodů symetrie částı́ W s (p) . 2) Stabilita bodů q+ a q− : Dosazenı́m do Jacobiovy matice daného systému (12.5) dostaneme charakteristickou rovnici λ3 + (s + 1 + b)λ2 + b(s + r)λ + 2bs(r − 1) = 0. (12.8) Mez stability nastane pro hodnotu parametru r = r+ : r+ = s(s + b + 3) , s − (b + 1) (12.9) Parametr r musı́ být kladný, proto platı́ podmı́nka s > b + 1. Pro 1 < r < r+ jsou tedy oba pevné body asymptoticky stabilnı́. Pro meznı́ podmı́nku r = r+ přecházı́ jeden pár pkomplexně sdružených vlastnı́ch čı́sel Jacobiovy matice imaginárnı́ osu: λ1 = −(s + 1 + b), λ2,3 = ±j b(s + r). Pro r > r+ jsou oba pevné body nestabilnı́ a dimenze W s (q) = 1 a W u (q) = 2. Protože ve W u (q) docházı́ ke spirálnı́mu rozvinovánı́ a v W s (q) k přitahovánı́, jsou body q+ a q− sedla-ohniska. Pro r > r+ neexistuje tedy žádný stabilnı́ pevný bod. Protože Hopfova bifurkace pro r = r+ je subkritická, neexistuje pro r > r+ ani žádný stabilnı́ meznı́ cyklus. Protože také torus je vyloučen, musı́ existovat chaotické řešenı́. Bylo však zjištěno, že při vysokých hodnotách řı́dı́cı́ho parametru r se chaotické atraktory střı́dajı́ se stabilnı́mi limitnı́mi cykly, podobně jako tomu je např. u kvadratického diskrétnı́ho zobrazenı́. Na obr. 12.6 je zakreslen chaotický atraktor pro parametry s = 10, b = 8/3, r = 28. Trajektorie spirálovitě narůstajı́ kolem nestabilnı́ho pevného bodu q+ , pak následuje náhlý skok směrem k q− , kolem něho oscilace zase narůstajı́ atd. (Trajektorie se podobajı́ krouženı́ mouchy mezi dvěma lampami). Atraktor má složitou strukturu, skládá ze z nekonečně mnoha prostorově velmi blı́zko ležı́cı́ch listů [38]. 12.2.2 Jiné modely Lorenzův model nenı́ nejjednoduššı́m systémem se spojitým časem, ve kterém vznikajı́ chaotické atraktory. Je známo mnoho jiných systémů s chaotickým chovánı́m. Např. Rösslerův model ẋ = −y − z, ẏ = x + ay, ż = b + (x − c)z má při určitých pevných hodnotách a, b stabilnı́ limitnı́ cyklus, při růstu řı́dı́cı́ho parametru c probı́hajı́ bifurkace zdvojujı́cı́ periodu a pro c > c∞ vznikajı́ složité chaotické atraktory ve tvaru trychtýře (obr.12.7). Např. při pevných hodnotách a = b = 0, 2 a při proměnném c se měnı́ chovánı́ systému od jednoduchého periodického řešenı́ přes zdvojovánı́ period až k chaotickému chovánı́ pro c > c∞ ≈ 4, 2. KAPITOLA 12. CHAOS 111 Při určitých hodnotách c > c∞ (přibližně v rozsahu 4,25 - 4,5) se dokonce prolı́najı́ dvě chaotická pásma. Při plně vyvinutém chaosu jsou trajektorie na atraktoru narůstajı́cı́ spirály, které se při určité kritické amplitudě velmi rychle vracejı́ k nestabilnı́mu pevnému bodu, a znovu se rozvı́jejı́. Snad nejjednoduššı́ autonomnı́ obvod, ve kterém mohou vzniknout chaotické atraktory je obvod se dvěma kondenzátory, jednou indukčnostı́, jednı́m lineárnı́m a jednı́m nelineárnı́m odporem. Tento obvod popsal Chua [24]. Obrázek 12.7: Rösslerův chaotický atraktor Matematický model Chuova obvodu lze po zavedenı́ poměrných proměnných vyjádřit rovnicemi ẋ = a(y − h(x)) kde h(x) = ẏ = x − y + z bx + a − b ax bx − a + b ż = −βy, x≥1 |x| < 1 x ≤ −1 U neautonomnı́ch systémů se spojitým časem mohou vzniknout chaotické jevy od 2.řádu výše. Chaotické chovánı́ se objevuje při určitých hodnotách parametrů např. u buzeného Duffingova oscilátoru (rov. 2.12), Van der Polova oscilátoru (2.16) nebo u parametricky buzeného oscilátoru (2.18). 12.3 Vlastnosti chaotických atraktorů 12.3.1 Ljapunovovy exponenty Chovánı́ trajektoriı́ v okolı́ rovnovážného stavu autonomnı́ho systému ẋ = f (x) se popisuje pomocı́ vlastnı́ch čı́sel matice linearizace (čl.4.2), pro popis chovánı́ trajektoriı́ v okolı́ uzavřené trajektorie γ KAPITOLA 12. CHAOS 112 jsou vhodné jejı́ multiplikátory (čl.10.3). K popisu chovánı́ trajektoriı́ v okolı́ libovolné trajektorie Γ se použı́vajı́ Ljapunovovy exponenty (zvané také charakteristické exponenty), které jsou zobecněnı́m vlastnı́ch čı́sel nebo multiplikátorů. Ljapunovovy exponenty (LE) jsou reálná čı́sla, která lze výhodně použı́t pro klasifikaci nechaotických i chaotických atraktorů. Necht’ Γ(x0 ) je libovolná trajektorie, procházejı́cı́ zvoleným bodem x0 , která odpovı́dá řešenı́ x(t) = Φt (x0 ). Asymptotické chovánı́ trajektoriı́ ležı́cı́ch blı́zko Γ(x0 ) je dáno asymptotickým chovánı́m matice linearizace toku DΦt (x0 ) rovnice ve variacı́ch pro t → ∞. Zvolme v tečném prostoru Tx0 (Rn ) bodu x0 n lineárně nezávislých vektorů, tvořı́cı́ch jeho bázi. Vyberme z nich k vektorů v 1 až v k (1 ≤ k ≤ n), které určujı́ k-rozměrný podprostor, tj. ve stavovém prostoru k-rozměrný rovnoběžnostěn Pk (0) (obr. 12.8). Jeho objem Vk (0) je dán vztahem ||v 1 ∧ v 2 ∧ ... ∧ v k ||, který je normou vnějšı́ho součinu vektorů v 1 , ..., v k . Fázový tok posune bod x0 za čas t do bodu Φt (x0 ) a vektory v i se zobrazı́ na DΦt (x0 )v i , které vytvořı́ rovnoběžnostěn Pk (t). Jeho objem Vk (t) je ||DΦt (x0 )v 1 ∧ ... ∧ DΦt (x0 )v k ||. (12.10) Poznámka: Vnějšı́ součin vektorů (nazývaný také smı́šený součin vektorů) v 1 , v 2 , ..., v n je skalárnı́ součin (u, v n ), kde u =< v 1 , ..., v n−1 > je vektorový součin. Obrázek 12.8: Změna objemu ve fázovém prostoru Definice 12.1. Reálné čı́slo 1 ||DΦt (x0 )v 1 ∧ ... ∧ DΦt (x0 )v k || ln t→∞ t ||v 1 ∧ v 2 ∧ ... ∧ v k || λ(k) (x0 , v 1 , ..., v k ) = lim (12.11) se nazývá k-rozměrný Ljapunovův exponent trajektorie Γ(x0 ) (za předpokladu, že limita existuje). Poznámky: 1. V literatuře je zvykem označovat Ljapunovovy exponenty pı́smenem λ a proto je třeba dát pozor na záměnu se stejným označenı́m pro vlastnı́ čı́sla matic. 2. Volı́me-li v tečném prostoru jen jeden vektor, dostaneme jednorozměrný Ljapunovův exponent 1 ||Dφt (x0 )v|| ln t→∞ t ||v|| λ ≡ λ(1) ≡ λ(x0 , v) = lim (12.12) Jednorozměrné exponenty mohou nabývat při konstantnı́m x0 (tj. pro jednu trajektorii) nejvýše n různých hodnot λ1 ≥ λ2 ≥ λ3 ≥ ... ≥ λn . (12.13) Tyto exponenty popisujı́, jak rychle se odpovı́dajı́cı́ body na vyšetřované a perturbované trajektorii po dlouhé době od sebe vzdálı́ (λ > 0) nebo se k sobě přiblı́žı́ (λ < 0). Citlivá závislost na počátečnı́ch KAPITOLA 12. CHAOS 113 podmı́nkách nastává, je-li alespoň jeden LE kladný. n ) různých hodnot a každý z nich je součtem k jednorozměrných k LE. Např. pro trajektorii v R3 jsou tři dvourozměrné LE 3. k-rozměrné LE mohou nabývat ( (2) λ 1 = λ1 + λ2 (2) (2) λ2 = λ1 + λ3 λ3 = λ 2 + λ 3 . (12.14) 4. Jestliže množina lineárně nezávislých vektorů v 1 , ..., v k je v tečném prostoru Tx0 (Rn ) vybrána náhodně, pak lze dokázat, že pravá strana rovnice (12.11) konverguje s pravděpodobnostı́ jedna k (k) maximálnı́mu k-rozměrnému LE λmax . Vztah (12.12) nenı́ tedy pro určenı́ všech n jednorozměrných LE vhodný, protože všechny volby vektoru v vedou k maximálnı́mu λmax . Použitı́m vztahu (12.11) (1) (n) však můžeme zı́skat (pomocı́ počı́tače) n maximálnı́ch hodnot λmax , ..., λmax , z nichž lze přı́mo vyčı́slit všechny jednorozměrné LE podle vztahů λ1 = λ(1) max (1) λ2 = λ(2) max − λmax ... (n−1) λn = λ(n) max − λmax . (12.15) Jednorozměrné LE jsou vhodné pro klasifikaci ustáleného chovánı́. U diferenciálnı́ch rovnic s dimenzı́ n ≥ 3 mohou nastat čtyři různé typy atraktorů (tři nechaotické a jeden chaotický), které lze klasifikovat podle znamének Ljapunovových exponentů. Nechaotické atraktory 1. Rovnovážný stav: λi < 0, i = 1, ..., n; symbolicky (−, −, ..., −) 2. Limitnı́ cyklus: λ1 = 0, λi < 0 (i = 2, ..., n); (0, −, −, ..., −) 3. Kvaziperiodický atraktor (K-torus): λ1 = λ2 = ... = λK = 0; λi < 0 (i = K + 1, ..., n) (0, 0, ..., 0, −, −, ..., −). U nechaotických atraktorů nenı́ žádný LE kladný. Počet nulových LE nechaotického hyperbolického atraktoru udává (topologickou) dimenzi atraktoru. Rovnovážný stav má dimenzi 0, limitnı́ cyklus 1, K-torus dimenzi K. Obrázek 12.9: Změna objemového elementu u chaotické dynamiky Chaotické atraktory musejı́ mı́t alespoň jeden LE kladný a jeden nulový. Protože současně musı́ být součet LE každého atraktoru záporný, musı́ mı́t chaotický atraktor alespoň tři LE. Odtud vyplývá, že chaos nemůže nastat u autonomnı́ch systémů 1. a 2. řádu a u neautonomnı́ch systémů 1. řádu. Pro 3. řád jsou tedy LE λ1 > 0, λ2 = 0, λ3 < 0. Protože kontrakce musı́ převážit nad expanzı́, musı́ být λ3 < −λ1 . U 4. řádu jsou již tři možnosti, z nichž byly v reálných systémech pozorovány dvě: λ1 > 0, λ2 = 0, λ4 ≤ λ3 < 0 (+, 0, −, −) KAPITOLA 12. CHAOS λ1 ≥ λ2 > 0, λ3 = 0, λ4 < 0 114 (+, +, 0, −) (hyperchaos). Tečný prostor podél trajektorie Γ se rozpadá na tři části, v nichž se trajektorie a) vzdalujı́ exponenciálně rychle od Γ, b) rychlost vzdalovánı́ nebo přibližovánı́ je nižšı́ než exponenciálnı́, c) probı́há exponenciálně rychlá kontrakce ke Γ. Časový vývoj objemového elementu spočı́vá tedy u chaotického atraktoru v tom, že v jednom směru element rychle kontrahuje, v druhém zůstává (v průměru) konstantnı́ a ve třetı́m směru neustále expanduje. Protože však element musı́ zůstat v ohraničené množině uvnitř atraktoru, docházı́ nutně k postupnému skládánı́ a vytvářenı́ komplikované struktury chaotického atraktoru (obr.12.9). Ljapunovovy exponenty lze zı́skat výpočtem na počı́tači podle výše uvedených definičnı́ch vztahů nebo měřenı́m na reálném systému. V obou přı́padech však dostaneme jen vı́ce či méně přesné odhady těchto exponentů. 12.3.2 Dimenze atraktorů Existuje mnoho dynamických systémů, u nichž vznikajı́ chaotické atraktory. Abychom je mohli mezi sebou nějak srovnávat a klasifikovat do určitých třı́d podobnosti, je třeba mı́t k dispozici vhodný deskriptor, který by jednoduše a výstižně tyto atraktory charakterizoval. Takovým deskriptorem nemohou být původnı́ rovnice dynamického systému, protože bez podrobné analýzy se z nich nepozná složitost chovánı́. Navı́c je třeba studovat i systémy, u nichž předpokládáme existenci chaotického atraktoru, ale jejichž dynamický popis neznáme. Pro charakterizaci atraktorů nejsou také vhodné časové průběhy veličin, protože i u jednoho systému jsou při velmi citlivé závislosti na počátečnı́ch podmı́nkách každé dva průběhy značně odlišné. Srovnávánı́ průběhů pro dva různé systémy by proto bylo naprosto nesmyslné. Pro charakteristiku periodičnosti procesů lze použı́t autokorelačnı́ funkce nebo výkonové spektrálnı́ hustoty. Pro studium chaotických procesů, které jsou podstatně složitějšı́ než procesy periodické, jsou však nevýhodné. Poskytujı́ málo informace a navı́c popisujı́ systém velmi nepřesně, protože systémy velmi odlišné mohou mı́t řešenı́ s přibližně stejnými spektry. Byly proto navrženy některé speciálnı́ charakteristiky, které se obvykle nazývajı́ dimenze. Ty odrážejı́ určité kvalitativnı́ rysy chovánı́ dynamického systému, jako je např. složitost atraktoru, lze z nich odhadnout dolnı́ hranici počtu proměnných potřebných k modelovánı́ dynamického chovánı́ na atraktoru, resp. je lze chápat jako množstvı́ informace nutné k určenı́ polohy bodu na atraktoru s danou přesnostı́. Dimenze charakterizujı́ vlastnosti atraktoru jediným čı́slem a jsou invariantnı́ vůči spojité změně souřadnic stavového prostoru. To je důležité, protože při volbě jiné reprezentace, která vznikne spojitou transformacı́ původnı́ch veličin, se typ procesu neměnı́ a neměla by se proto měnit ani hodnota přı́slušné dimenze. Existuje mnoho definic dimenze, v základě je však lze rozdělit na dvě velké skupiny. Prvnı́ typ závisı́ jen na metrických vlastnostech, druhý pak na pravděpodobnostnı́ch vlastnostech, tj. závisı́ na frekvenci, s nı́ž typická trajektorie procházı́ různými částmi atraktoru. Mnoho přı́kladů potvrzuje domněnku, že dimenze prvnı́ skupiny dávajı́ tutéž hodnotu, která se obecně lišı́ od hodnoty, kterou dávajı́ definice druhé skupiny. Metrické dimenze. Jako přı́klad této skupiny dimenzı́ může sloužit Kolmogorovova dimenze zvaná také kapacita nebo fraktálnı́ dimenze ln N (ε) dK = lim (12.16) ε→0 ln(ε−1 ) kde N (ε) je minimálnı́ počet n-rozměrných krychliček o straně ε, potřebných k pokrytı́ uvažované množiny. Jestliže limita neexistuje, nelze dimenzi definovat. KAPITOLA 12. CHAOS 115 Uvedený vztah můžeme odvodit touto úvahou. Část stavového prostoru obsahujı́cı́ atraktor budeme uvažovat jako jednotkový objem, rozdělený pravidelnou mřı́žı́ krychliček o hraně ε. Počet krychliček N pokrývajı́cı́ch atraktor bude N = 1/εn , kde n je topologická dimenze daného stavového prostoru. Logaritmovánı́m tohoto vztahu dostaneme výraz n=− lnN lnN = . lnε ln(ε−1 ) (12.17) Abychom vyjádřili hustotu pokrytı́ dané části stavového prostoru atraktorem, budeme uvažovat pouze ty krychle, ve kterých ležı́ alespoň jeden bod atraktoru. Počet takových krychlı́ označme N (ε) a dosad’me do vztahu (12.17) za N . Tı́m dostaneme nějaké čı́slo dK (ε) = −lnN (ε)/lnε. Zvolı́me-li ε dostatečně velké, budou trajektorie atraktoru procházet všemi krychlemi a bude N = N (ε) a dK (ε) = n. Při postupném zmenšovánı́ ε nebude již atraktor procházet všemi krychlemi a bude platit, že N (ε) < N a dK (ε) < n. Čı́m bude ε menšı́, tı́m přesněji bude přı́slušné dK (ε) charakterizovat vyplněnı́ zvolené části stavového prostoru atraktorem. V určitém smyslu nejlepšı́ charakteristiku dostaneme, vezmeme-li limitu ln N (ε) dK = lim dK (ε) = lim . (12.18) ε→0 ε→0 − ln ε Takto definované čı́slo je právě Kolmogorovova dimenze (12.16). Tato dimenze odrážı́ kvalitativně mı́ru složitosti daného atraktoru. Např. jednobodový atraktor (rovnovážný stav) má dK = 0, protože pro libovolné ε je N (ε) = 1. To odpovı́dá intuitivnı́ představě, že bod nezaplňuje žádný prostor. Dále lze ukázat, že dimenze hladké křivky (např. limitnı́ho cyklu) je 1, dimenze hladké plochy je 2, hladké kplochy je k. To platı́ i pro jiné dimenze, které budou dále uvedeny. Numerické výpočty Kolmogorovovy dimenze fraktálnı́ch množin a chaotických atraktorů dávajı́ necelá čı́sla. Přı́klad 12.1. Dimenze jednotkového intervalu. Pokryjme jednotkový interval [0, 1] objemovými elementy (intervaly) o délce ε = 1/3k . K pokrytı́ je třeba N (ε) = 3k těchto objemových elementů. Pro k → ∞ bude ln3k = 1. k→∞ ln3k dK = lim Jednotkový interval má tedy fraktálnı́ dimenzi 1. Přı́klad 12.2. Cantorova fraktálnı́ množina vzniká iteračně postupným vynechávánı́m prostřednı́ch třetin nejprve z intervalu [0, 1], pak ze zbývajı́cı́ch dvou subintervalů [0,1/3], [2/3,1] atd. Použijeme-li k pokrytı́ zase elementy o délce ε = 1/3k , je v k-tém kroku počet potřebných elementů N (ε) = 2k a ln2k ln2 = = 0, 6309... k k→∞ ln3 ln3 dK = lim Cantorova množina nenı́ ani bod (s dimenzı́ 0), ani spojitý interval (s dimenzı́ 1). Fraktálnı́ množiny majı́ tedy neceločı́selné dimenze. Dimenze závislé na pravděpodobnostnı́ch vlastnostech. Přı́kladem dimenze tohoto typu je informačnı́ dimenze (Hausdorffova dimenze), která bere v úvahu také relativnı́ pravděpodobnost použitých krychliček. Je dána vztahem H(ε) , ε→0 ln (ε−1 ) dI = lim N (ε) H(ε) = X Pi ln(1/Pi ), (12.19) i=1 kde Pi je pravděpodobnost průchodu trajektoriı́ atraktoru i-tou krychličkou. H(ε) je vzhledem ke své definici informačnı́ entropie. Hausdorffova dimenze lépe odrážı́ vnitřnı́ strukturu chaotických atraktorů KAPITOLA 12. CHAOS 116 než fraktálnı́ dimenze, protože bere vlastně v úvahu i časové chovánı́ dynamického systému. Přı́klad 12.3. Předpokládejme zase, že atraktor je jednotkový interval a že hustota pravděpodobnosti je konstantnı́. Volme opět elementy pokrytı́ o délce ε = 1/3k . Pak N (ε) = 3k a Pi = 1/3k . Entropie k H(ε) = − 3 X 1 i=1 3k ln 1 = ln3k . 3k Informačnı́ dimenze ln3k = 1. k→∞ ln3k Dimenze dI = dK . Obecně platı́ dK ≥ dI , i když jejich numerický rozdı́l nemusı́ být velký. Např. pro Lorenzův atraktor při parametrech s = 10, b = 8/3, r = 24, 74 je dK = 2, 08 a dI = 2, 06. dI = lim Obě dimenze majı́ některé zajı́mavé vlastnosti. Zaokrouhlı́me-li jejich hodnotu nahoru na nejbližšı́ celé čı́slo, dostaneme topologickou dimenzi nejmenšı́ho stavového prostoru, který zahrne bez zkreslenı́ celý vyšetřovaný atraktor. Ljapunovova dimenze dL je dána vztahem dL = k + Pk i=1 λi |λk+1 | (12.20) Ljapunovovy exponenty atraktoru dynamického systému se spojitým časem jsou λ1 ≥ ... ≥ λn . Čı́slo k ve vztahu (12.20) je takové největšı́ celé čı́slo, pro které platı́ λ1 + ... + λk ≥ 0, a λk+1 je v absolutnı́ hodnotě nejmenšı́ záporný exponent. Ljapunovovy exponenty λi jsou tedy v relaci s dimenzı́ atraktoru. Pro stabilnı́ hyperbolický rovnovážný stav je dL = 0. Stabilnı́ limitnı́ cyklus má λ1 = 0, ostatnı́ Ljapunovovy exponenty jsou záporné, proto dL = 1. U chaotického atraktoru je Ljapunovova dimenze téměř vždy neceločı́selná. Numerické výpočty ukazujı́, že pro typický atraktor je dI = dL . Tento vztah má význam zejména při počı́tačových experimentech, protože Ljapunovovy exponenty se zjišt’ujı́ obvykle jednodušeji než dimenze. Kapitola 13 Metoda ekvivalentnı́ch přenosů Metoda ekvivalentnı́ch přenosů, známá také pod názvem metoda harmonické rovnováhy, je odvozena z asymptotických metod pro řešenı́ nelineárnı́ch systémů. Jejı́m základem je Krylovova a Bogoljubovova metoda harmonické linearizace. V letech 1947 až 1950 byla metoda ekvivalentnı́ch přenosů v pěti různých zemı́ch téměř nezávisle na sobě rozpracována pro praktické řešenı́ nelineárnı́ch problémů. Metoda umožňuje předevšı́m stanovit existenci meznı́ch cyklů, jejich počet a stabilitu. Je jı́ však možno využı́t i pro jednoduché syntézy nelineárnı́ch obvodů, pro vkládánı́ vhodných korekčnı́ch členů za účelem stabilizace apod. Rozšı́řenı́m základnı́ verze metody lze pak řešit i stabilitu buzených obvodů, existenci a vlastnosti subharmonických a ultraharmonických kmitů, skokových rezonancı́ apod. 13.1 Princip metody ekvivalentnı́ch přenosů pro jeden vstup Nejprve budeme vyšetřovat existenci periodických ustálených stavů autonomnı́ch systémů s jednou oddělenou stacionárnı́ nelinearitou a s lineárnı́mi členy, které jsou soustředěny do členu G(jω) (obr.13.1). Vzniknou-li v obvodu ustálené kmity, budou v různých mı́stech obvodu obecně periodické, ale neharmonické, zejména na výstupu nelinearity. Obrázek 13.1: Blokové schéma nelin. systému Budeme předpokládat, že lineárnı́ člen filtruje vyššı́ harmonické tohoto průběhu e2 (t), takže na výstupu lineárnı́ho prvku a tı́m také na vstupu nelinearity bude přı́tomna jen prvnı́ harmonická z výstupnı́ho signálu nelinearity. Za těchto předpokladů můžeme definovat tzv. ekvivalentnı́ přenos N nelineárnı́ho prvku jako poměr prvnı́ harmonické výstupu e2 (t) k sinovému signálu e1 (t) na vstupu nelinearity. Při vyšetřovánı́ existence autooscilacı́ v obvodu pak nahradı́me nelineárnı́ člen ekvivalentnı́m přenosem N a sestavı́me charakteristickou rovnici obvodu N G + 1 = 0, kterou řešı́me analogickými metodami, použı́vanými v teorii lineárnı́ch systémů. Při odvozenı́ metody budeme vycházet z těchto předpokladů: 1. Na výstupu nelineárnı́ho členu uvažujeme jen prvnı́ harmonickou. To znamená, že se bud’ musı́ 117 KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 118 nelineárnı́ charakteristika členu málo lišit od lineárnı́ho průběhu nebo lineárnı́ část musı́ mı́t vlastnosti dolnofrekvenčnı́ propusti (má-li rezonanci, musı́ být špička v oblasti prvnı́ harmonické). 2. Charakteristiky systému jsou časově invariantnı́. 3. Systém obsahuje jen jednu nelinearitu (na vı́ce nelinearit rozšı́řı́me metodu v čl. 13.5) 4. Při sinovém vstupu nemá výstup z nelinearity konstantnı́ složku (uvažujeme zatı́m jen nelineárnı́ členy s lichými statickými charakteristikami - na jiné typy charakteristik rozšı́řı́me metodu v čl. 13.6). Prvnı́ dva předpoklady jsou nezbytné, dalšı́ dva použijeme jen pro odvozenı́ základnı́ verze metody a v dalšı́ch článcı́ch ukážeme řešenı́ i bez těchto omezenı́. Odvozenı́ ekvivalentnı́ho přenosu pro jeden vstup Přivedeme-li na nelineárnı́ prvek (obr.13.1) vstupnı́ signál e1 (t) = A sin ωt (13.1) bude výstup e2 (t) obsahovat vyššı́ harmonické. Můžeme ho rozložit ve Fourierovu řadu e2 (t) = a1 sin ωt + a2 sin 2ωt + ... + b0 + b1 cos ωt + b2 cos 2ωt + ... (13.2) Podle předpokladu 4 bude člen b0 = 0. Uvažujeme-li na výstupu jen prvnı́ harmonickou, pak e2 (t) ≈ Aa(A, ω) sin ωt + Ab(A, ω) cos ωt, (13.3) položı́me-li a1 = Aa, b1 = Ab. Koeficienty u sinové a kosinové složky jsou obecně funkcı́ vstupnı́ amplitudy A a kruhové frekvence ω. Pro nelineárnı́ člen budeme nynı́ definovat jeho ekvivalentnı́ přenos jako poměr prvnı́ harmonické výstupnı́ho signálu k sinovému vstupu stejným způsobem jako pro lineárnı́ systémy (pomocı́ symbolicko-komplexnı́ metody). Pak Ê2 N (A, ω) = Ê1 = A[a(A, ω) + jb(A, ω)] = a(A, ω) + jb(A, ω). A (13.4) Přenos má obecně reálnou a imaginárnı́ složku a je funkcı́ amplitudy i frekvence vstupnı́ho signálu. Můžeme ho vyjádřit také pomocı́ amplitudy a fáze ve tvaru N (A, ω) = |N (A, ω)| ejγ(A, ω) , (13.5) kde |N (A, ω)| = q [a(A, ω)]2 + [b(A, ω)]2 γ(A, ω) = arctg b(A, ω) . a(A, ω) (13.6) Ekvivalentnı́ přenos můžeme vynášet do komplexnı́ roviny nebo do logaritmických souřadnic. Často se použı́vá inverznı́ hodnota ekvivalentnı́ho přenosu N −1 (A, ω) = 1 . N (A, ω) (13.7) Pro různé nelineárnı́ členy jsou v literatuře vypočı́tány a vykresleny ekvivalentnı́ přenosy v různých souřadnicı́ch. Pro výpočty koeficientů prvnı́ harmonické Fourierovy řady platı́ vztahy 2 a1 = T Z T e2 (t) sin ωtdt 0 2 b1 = T Z T e2 (t) cos ωtdt. (13.8) 0 Pro T = 2π/ω dostaneme výsledné vztahy a(A, ω) = a1 (A, ω) ω = A πA Z 0 2π/ω e2 (t) sin ωtdt (13.9) KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ b1 (A, ω) ω b(A, ω) = = A πA Z 119 2π/ω e2 (t) cos ωtdt (13.10) 0 Ekvivalentnı́ přenos se velmi často uvažuje ve tvaru N (A, ω) = KN N0 (A, ω), kde KN je konstanta nelinearity a N0 (A, ω) je normovaný ekvivalentnı́ přenos, který je v literatuře k dispozici ve formě tabulek a grafů. 13.2 Ekvivalentnı́ přenosy pro frekvenčně nezávislé nelinearity Při praktickém řešenı́ jednoduššı́ch nelineárnı́ch systémů se vyskytujı́ nejčastěji nelinearity, které jsou definovány jen statickou závislostı́, bud’ v analytickém tvaru nebo tabulkou či grafem. Výstupnı́ signál e2 = φ(e1 ) takové nelinearity závisı́ jen na okamžité hodnotě vstupu a ne na jeho derivacı́ch a integrálech. Ekvivalentnı́ přenos nebude v tomto přı́padě záviset na frekvenci ω a bude jen funkcı́ amplitudy N (A). Aby Fourierova řada výstupnı́ho signálu neměla podle předpokladu 4 konstantnı́ složku b0 , budeme uvažovat pouze liché charakteristiky, pro které platı́ φ(−e1 ) = −φ(e1 ). Obrázek 13.2: Průběhy signálů u trojpolohové charakteristiky Pro výpočet koeficientů položı́me ve vzorcı́ch (13.9) a (13.10) ωt = ψ. Pak a(A) = b(A) = 1 πA Z 2π 1 πA Z 2π e2 (ψ) sin ψdψ (13.11) e2 (ψ) cos ψdψ (13.12) 0 0 Imaginárnı́ složka b(A) je úměrná ploše statické charakteristiky nelineárnı́ho členu. Podle rovnice (13.12) totiž platı́ b(A) = 1 πA2 + Z Z 0 2π 1 φ(A sin ψ)d(A sin ψ) = πA2 0 φ(e1 )de1 + A Z −A φ(e1 )de1 + 0 Z "Z A φ(e1 )de1 + 0 # 0 −A φ(e1 )de1 = S , πA2 kde S je plocha uzavřená větvemi statické charakteristiky nelinearity. Pro jednoznačné charakteristiky je tedy b(A) = 0, přenos N (A) má tedy jen reálnou část. Přı́klad 13.1. Nelineárnı́ člen s trojpolohovou charakteristikou podle obr. 13.2 má ekvivalentnı́ přenos N (A) = a(A) = 4 πA Z π/2 α M sin ψ dψ = 4M cos α, πA KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 120 kde α = arcsin (δ/A), b(A) = 0. Abychom mohli vyšetřovat vlastnosti různých systémů, ve kterých je použito této nelinearity, ale s různými konstantami δ a M , je výhodné uvažovat vstupnı́ amplitudu v poměrné hodnotě A/δ. Použijeme pak normovaného přenosu pro poměrné amplitudy r r A 4M 4M δ 2 M 4 δ δ A A cos α = 1−( ) = 1 − ( )2 = KN N0 ( ), N ( ) = a( ) = δ δ πA πA A δ πA A δ kde KN = M/δ je konstanta nelinearity a zbytek výrazu tvořı́ normovaný ekvivalentnı́ přenos (pro poměrnou amplitudu) N0 (A/δ). Na obr. 13.3a je tento přenos zobrazen v závislosti na A/δ, na obr. 13.3b,c je vynesen N0 a N0−1 do komplexnı́ roviny, na obr.13.3d do souřadnic amplituda (v dB) - fáze (tzv. Nicholsův graf). Obr.13.3. Průběh normovaného ekvivalentnı́ho přenosu trojpolohového prvku a) závislost na poměrné amplitudě b) N0 v komplexnı́ rovině c) inverznı́ normovaný přenos v komplexnı́ rovině d) inverznı́ přenos v Nicholsově grafu Některé analytické výrazy pro ekvivalentnı́ přenosy jednoduššı́ch nelinearit jsou uvedeny v tab. 13.1. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 121 Tab. 13.1. Analytické vyjádřenı́ ekvivalentnı́ch přenosů jednoduchých nelinearit Složité typy nelinearit dávajı́ velmi nepřehledné vzorce a pro praktické účely se hodı́ jen jejich KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ grafické zobrazenı́. Obr. 13.4a Obr. 13.4b Obr. 13.4c 122 KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 123 Na obr. 13.4a,b,c jsou vyneseny průběhy normovaných ekvivalentnı́ch přenosů třı́ často se vyskytujı́cı́ch nelinearit. Normované přenosy v komplexnı́ rovině jsou pro dvě typické nelinearity na obr. 13.5 a 13.6. Obr. 13.5. Inverznı́ normovaný ekvivalentnı́ přenos v komplexnı́ rovině Obr. 13.6. Inverznı́ normovaný ekvivalentnı́ přenos hystereznı́ charakteristiky 13.3 Ekvivalentnı́ přenosy pro frekvenčně závislé nelinearity Při řešenı́ nelineárnı́ch systémů se vyskytujı́ také nelinearity, které jsou frekvenčně závislé. Jsou popsány nelineárnı́ diferenciálnı́ rovnicı́ a jejich ekvivalentnı́ přenos bude funkcı́ amplitudy i frekvence. Jako přı́klad může sloužit blok, který má v přı́mé větvi lineárnı́ prvek a ve zpětné vazbě statickou nelinearitu (obr. 13.7). Ekvivalentnı́ přenos mezi vstupem e1 a výstupem e2 je frekvenčně závislý. Na tento typ přenosů vede také řešenı́ systémů s většı́m počtem nelinearit, i když jednotlivé nelinearity KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 124 jsou frekvenčně nezávislé (čl. 13.5). Výpočet ekvivalentnı́ch přenosů pro frekvenčně závislé nelinearity lze provést různými metodami. V jednoduššı́ch přı́padech analyticky, častěji však jen pomocı́ počı́tače. Vykreslenı́ ekvivalentnı́ho přenosu v komplexnı́ rovině provádı́me tak, že pro zvolenou konstantnı́ frekvenci vypočı́táme a vyneseme jednu křivku pro různé vstupnı́ amplitudy. Přı́klad bude uveden v čl. 13.5. Obr. 13.7 13.4 Periodická řešenı́ autonomnı́ch systémů V nelineárnı́m autonomnı́m systému, jehož lineárnı́ část je soustředěna v přenosu G(jω) a nelinearita je nahrazena ekvivalentnı́m přenosem N (A, ω) (obr. 13.8), vzniknou ustálené kmity, bude-li platit Ê1 = −Ê3 . Tato podmı́nka znamená, že v rozpojeném obvodu při sinovém signálu e1 na vstupu nelineárnı́ho členu bude mı́t výstup e3 z lineárnı́ho členu stejnou amplitudu jako vstup a fázi otočenou o 1800 . Upravı́me-li uvedený vztah na Ê1 Ê2 =− Ê3 Ê2 Obr. 13.8 a dosadı́me-li za Ê3 Ê2 = G(jω) a Ê2 Ê1 = N (A, ω), dostaneme komplexnı́ rovnici G(jω)N (A, ω) + 1 = 0, (13.13) která je analogická charakteristické rovnici lineárnı́ho obvodu. Jejı́m řešenı́m zı́skáme přibližné hodnoty amplitud a frekvencı́ prvnı́ch harmonických limitnı́ch cyklů v obvodu. Řešenı́ rovnice (13.13) lze provést KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 125 různým způsobem: a) Analytické řešenı́ je vhodné pro zjištěnı́ obecných závislostı́, ale u složitých nelinearit a při vysokém řádu lineárnı́ části je velmi pracné a nevede bez použitı́ počı́tače k cı́li. Rovnici (13.13) můžeme psát ve tvaru [a(A, ω) + jb(A, ω)] [ReG(jω) + jImG(jω)] + 1 = 0. (13.14) Rozložı́me-li tuto komplexnı́ rovnici na reálnou a imaginárnı́ část U (A, ω) + jV (A, ω) = 0, pak řešenı́m soustavy U (A, ω) = 0, V (A, ω) = 0 nalezneme amplitudy Ai a základnı́ frekvence ωi všech meznı́ch cyklů. Kmity budou existovat, vyjdou-li odpovı́dajı́cı́ páry Ai , ωi reálné a kladné. Nalezené hodnoty amplitud představujı́ amplitudy kmitů na vstupu nelineárnı́ho členu. Zjistı́me-li existenci limitnı́ch cyklů, je třeba ještě stanovit jejich stabilitu, protože kmity mohou být stabilnı́ nebo nestabilnı́. Je možno dokázat [21], že periodické řešenı́ bude stabilnı́ při ∂U ∂V ∂U ∂V − > 0. ∂A ∂ω ∂ω ∂A (13.15) b) Grafické řešenı́ v komplexnı́ rovině je pro složitějšı́ systémy výhodnějšı́ než analytické. Aby byla splněna rovnice (13.13) musı́ platit např. G(jω) = − 1 N (A, ω) nebo 1 = −N (A, ω) G(jω) (13.16) nebo dalšı́ dvě možnosti s prohozenými znaménky. Budeme použı́vat prvnı́ tvar, který se pro frekvenčně nezávislé nelinearity zjednodušı́ na 1 G(jω) = − . (13.17) N (A) Do komplexnı́ roviny budeme vynášet frekvenčnı́ charakteristiku lineárnı́ části a záporný inverznı́ ekvivalentnı́ přenos (obr. 13.9). Průsečı́ky obou křivek určujı́ amplitudy a frekvence autooscilacı́. Jestliže se křivky neprotı́najı́, nevznikajı́ zpravidla v reálném systému autooscilace. Toto tvrzenı́ je však třeba brát opatrně, protože je někdy řešenı́ obvodu nepřı́pustně zjednodušeno, např. se neuvažovala některá nelinearita. Rovněž nemusejı́ platit předpoklady pro použitı́ metody ekvivalentnı́ch přenosů (např. lineárnı́ člen dostatečně nefiltruje vyššı́ harmonické). U naprosté většiny přı́padů však odhadneme fyzikálnı́m názorem, zda při neprotnutı́ křivek skutečně nenastávajı́ v systému autooscilace, přı́padně ověřı́me zı́skané výsledky simulacı́ na počı́tači. Křivky na obr. 13.9 se protı́najı́ ve dvou bodech P a Q. Je třeba určit, který z průsečı́ků odpovı́dá stabilnı́mu a který nestabilnı́mu limitnı́mu cyklu. Pro vyšetřenı́ stability, např. bodu P, předpokládejme malou změnu amplitudy A o ∆A. Aby bod P odpovı́dal stabilnı́m kmitům, musı́ být při zvětšené amplitudě A (tj. při kladném ∆A) oscilace tlumené a při zmenšené amplitudě A musı́ narůstat. Podle rovnice (13.17) a obr. 13.9 je tedy pro stabilnı́ meznı́ cyklus zapotřebı́, aby při kladném ∆A byl vektor odpovı́dajı́cı́ −N −1 (A) většı́ než G(jω), tj. 01 > 02. Pro záporné ∆A je pak třeba, aby −N −1 (A) bylo menšı́ než G(jω), tj. 03 < 04. Bod P odpovı́dá tedy stabilnı́mu meznı́mu cyklu a určuje reálné autooscilace v obvodu. Stejným způsobem zjistı́me, že bod Q odpovı́dá nestabilnı́mu meznı́mu cyklu. Při počátečnı́ch podmı́nkách amplitud menšı́ch než A, určené bodem Q, budou tedy v obvodu tlumené kmity. Pro většı́ počátečnı́ podmı́nky se obvod rozkmitává a kmity se ustálı́ na amplitudě a kmitočtu, které jsou dány bodem P. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ Obr.13.9 126 0br.13.10 Je-li ekvivalentnı́ přenos závislý na frekvenci, lze podmı́nku existence kmitů vyjádřit ve tvaru G(jω) = − 1 N (A, ω) (13.18) Řešenı́ v komplexnı́ rovině je již obtı́žnějšı́. Pro určitou zvolenou frekvenci ω = ω1 je záporný inverznı́ ekvivalentnı́ přenos už jen funkcı́ amplitudy a můžeme jej vynést do komplexnı́ roviny jako jednu křivku. Pro jinou hodnotu ω = ω2 zı́skáme dalšı́ křivku atd. K této jednoparametrické soustavě křivek přikreslı́me frekvenčnı́ charakteristiku lineárnı́ části (obr.13.10). Autooscilace odpovı́dajı́ jen těm průsečı́kům, ve kterých souhlası́ hodnoty frekvencı́. c) Grafické řešenı́ v logaritmických souřadnicı́ch je méně přehledné, protože je třeba vykreslovat dva grafy, jeden pro amplitudy a jeden pro fáze. Výhodou je snadné vynášenı́ frekvenčnı́ch charakteristik lineárnı́ části obvodu. d) Grafické řešenı́ v Nicholsově grafu (amplituda v dB - fáze ve stupnı́ch). Tento způsob spojuje výhody předchozı́ch metod. Řešenı́ se provádı́ v jediném obrázku a charakteristiky lineárnı́ části se rychle vynášejı́. 13.5 Nelineárnı́ systémy s většı́m počtem nelinearit Metodu ekvivalentnı́ch přenosů lze rozšı́řit i na vyšetřovánı́ stability autonomnı́ch obvodů s většı́m počtem nelinearit, které jsou od sebe odděleny lineárnı́mi členy nebo kde jsou nelinearity ve zpětných vazbách kolem lineárnı́ch členů. Uvažujme např. obvod podle obr. 13.11. Obr. 13.11. Obvod s většı́m počtem nelinearit KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 127 Rozpojme smyčku na vstupu do prvnı́ nelinearity a přived’me na tento vstup signál e1 = A1 sin ωt, v komplexnı́m zápisu Ê1 = A1 exp(jωt). Předpokládejme, že z periodického kmitánı́ na výstupu prvnı́ nelinearity projde na výstup lineárnı́ho členu G1 jen prvnı́ harmonická, vyššı́ harmonické budou prvkem G1 dostatečně odfiltrovány. Na vstupu druhého nelineárnı́ho členu bude proto opět sinový kmit e3 = A3 sin (ωt + φ). Pak platı́ obecně Ê2 = N1 (A1 , ω)Ê1 Ê3 = G1 (jω)Ê2 Ê4 = N2 (A3 , ω)Ê3 Ê5 = G2 (jω)Ê4 Aby mohly v uzavřeném obvodu existovat autooscilace, musı́ platit Ê5 = −Ê1 (13.19) Dosadı́me-li z předchozı́ch vztahů, dostaneme podmı́nku G1 (jω)G2 (jω)N1 (A1 , ω)N2 (A3 , ω) = −1. (13.20) Označı́me-li celkový přenos lineárnı́ části G(jω) = G1 (jω)G2 (jω), můžeme podmı́nku existence kmitů zapsat např. ve tvaru 1 (13.21) G(jω) = − N1 (A1 , ω)N2 (A3 , ω) Ekvivalentnı́ přenos N2 (A3 , ω) je funkcı́ frekvence a amplitudy A3 , která při zvolené hodnotě A1 již nenı́ nezávislá a je třeba ji vypočı́tat podle vztahu A3 = |G1 (jω)||N1 (A1 , ω)|A1 . Pak (13.22) 0 N2 (A3 , ω) = N2 (|G1 (jω)||N1 (A1 , ω)|A1 ; ω) = N2 (A1 , ω). (13.23) Podmı́nka harmonické rovnováhy platná pro vznik autooscilacı́ je G(jω) = − 1 = −N −1 (A1 , ω) 0 N1 (A1 , ω)N2 (A1 , ω) (13.24) I v přı́padě, že obě nelinearity majı́ ekvivalentnı́ přenos závislý jen na amplitudě, bude po přepočtu 0 podle rovnice (13.22) N2 funkcı́ amplitudy i frekvence a rovněž tak i výsledné přenosy N nebo N −1 . Řešenı́ vztahu (13.24) lze zase provést bud’ analyticky (vede však většinou na velmi komplikované výrazy) nebo graficky. Při většı́m počtu nelinearit je postup obdobný. 13.6 Nelineárnı́ systémy s nesymetrickými vlastnı́mi kmity V nelineárnı́ch systémech mohou kromě symetrických vlastnı́ch kmitů vznikat také kmity nesymetrické. Objevujı́ se předevšı́m při nesymetrické nelineárnı́ charakteristice (při působenı́ vnějšı́ch budı́cı́ch signálů i bez nich), vlivem konstantnı́ho nebo pomalu se měnı́cı́ho budı́cı́ho signálu i při symetrické nelineárnı́ charakteristice a v mnoha jiných přı́padech. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 128 Obr.13.12 Obr.13.13 Na obr. 13.12 je zakreslena nesymetrická nelinearita, u nı́ž vznikajı́ na výstupu nesymetrické kmity i při symetrickém vstupnı́m signálu. U symetrické nelinearity na obr. 13.13 má výstup konstantnı́ složku jen při nesymetrickém vstupnı́m kmitu e1 . Řešenı́ stability nelineárnı́ho systému se provádı́ obdobně jako u systému se symetrickými vlastnı́mi kmity. Předpokládá se zase, že vlivem filtračnı́ho účinku lineárnı́ho členu G jsou potlačeny vyššı́ harmonické, takže vstup na nelinearitu můžeme uvažovat ve tvaru e1 = A0 + A sin ωt. Výstupnı́ signál rozložı́me ve Fourierovu řadu a zanedbáme vyššı́ harmonické, konstantnı́ složku označı́me a0 . Pak e2 ≈ a0 (A0 , A, ω) + Aa(A0 , A, ω) sin ωt + Ab(A0 , A, ω) cos ωt, (13.25) kde všechny tři členy jsou obecně funkcı́ A0 , A, ω. Pro výpočet Fourierových koeficientů platı́ vztahy a0 (A0 , A, ω) = ω 2π Z 2π/ω ω πA Z 2π/ω ω b(A0 , A, ω) = πA Z 2π/ω a(A0 , A, ω) = e2 (t)dt (13.26) e2 (t) sin ωtdt (13.27) e2 (t) cos ωtdt (13.28) 0 0 0 KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 129 Definujeme-li ekvivalentnı́ přenos opět vztahem N (A0 , A, ω) = a(A0 , A, ω) + jb(A0 , A, ω), (13.29) představuje metoda ekvivalentnı́ch přenosů současné ověřenı́ platnosti dvou podmı́nek, a to podmı́nky stejnosměrné a střı́davé rovnováhy. Podmı́nka stejnosměrné rovnováhy definuje vztahy mezi konstantnı́mi složkami A0 = e10 na vstupu a e20 na výstupu nelinearity. Složka e20 musı́ být v rovnováze s e10 přes lineárnı́ část obvodu. Podmı́nku stejnosměrné rovnováhy lze tedy psát ve tvaru A0 = e10 = w − Ke20 (A0 , A, ω), (13.30) kde K je zesı́lenı́ lineárnı́ části obvodu pro konstantnı́ signál a w je vstup zpětnovazebnı́ho obvodu. Obsahuje-li přenos lineárnı́ části pól v počátku, musı́ být e20 rovno nule, aby e30 bylo konečné. Podmı́nka střı́davé rovnováhy je definována stejnými vztahy jako pro symetrické oscilace, tj. N (A0 , A, ω) G(jω) + 1 = 0. (13.31) Ekvivalentnı́ přenos je nynı́ obecně funkcı́ třı́ proměnných. V jednoduššı́ch přı́padech, kdy na vstupu obvodu je nulový nebo konstantnı́ vstupnı́ signál w, je také e10 = A0 rovno konstantě a z podmı́nky pro stejnosměrnou rovnováhu zı́skáme velikost A0 jako funkci A, ω. Dosadı́me-li toto řešenı́ do rovnice (13.31) pro střı́davou rovnováhu, zı́skáme jejı́m řešenı́m hodnoty A, ω přı́padných autooscilacı́. Po určenı́ A, ω je možno pak čı́selně stanovit i velikost A0 . Pro statické nelineárnı́ prvky jsou koeficienty a0 , a, b i přenos N jen funkcemi vstupnı́ amplitudy A a stejnosměrné složky na vstupu nelinearity A0 . Obr. 13.14. Nesymetrická reléová charakteristika V přı́kladu 13.2 je spočı́tán ekvivalentnı́ přenos nesymetrické nelinearity s nesymetrickým vstupnı́m signálem a v přı́kladu 13.3 je řešen nelineárnı́ systém s touto nelinearitou. Podrobné řešenı́ systémů s nesymetrickými vlastnı́mi kmity je uvedeno např. v [21]. KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 130 Přı́klad 13.2. Na obr. 13.14a je znázorněna nesymetrická statická charakteristika dvoupolohového prvku. Koeficienty a0 , a, b i přenos N nejsou závislé na ω. Výstupnı́ signál z tohoto nesymetrického prvku má konstantnı́ složku e20 , a to i v přı́padě, že vstupnı́ signál by měl stejnosměrnou složku A0 nulovou. Pro e1 = A0 + A sin ψ, (ψ = ωt) je e20 = a0 (A0 , A) = = = 1 2π Z 2π e2 (ψ)dψ = 0 π−α 2π+α 1 (1 − m)M (1 + m)M α M dψ − mM dψ = + = 2π α 2 π π−α (1 − m)M (1 + m)M A0 + arcsin 2 π A Z Z (13.32) 2π 1 a(A0 , A) = N (A0 , A) = e2 (ψ) sin ψdψ = πA 0 Z π+α Z 2π−α M = sin ψdψ − m sin ψdψ = πA −α π+α Z 2(1 + m)M 2(1 + m)M = cos α = πA πA b(A0 , A) = 0. s 1−( A0 2 ) A (13.33) (13.34) Přı́klad 13.3. Určenı́ amplitudy a frekvence autooscilacı́ u systému podle obr. 13.15 s nespojitou nesymetrickou nelinearitou. Každý signál má konstantnı́ a střı́davou složku ei = ei0 + e?i . Obr. 13.15. Systém s nespojitou nesymetrickou nelinearitou Rovnováha konstantnı́ch složek. V ustáleném stavu se na vstupu nelineárnı́ho prvku objevı́ sinové kmity s konstantnı́ složkou e1 = A0 + A sin ωt, kde A0 = e10 . Složka e20 musı́ být rovna nule, jinak by integračnı́ člen trvale integroval. Pak platı́ A0 = e10 = e60 − K3 e30 = −K1 e30 − K3 e30 = −e30 (K1 + K3 ). Ze vztahu a0 = e20 = (1 − m)M (1 + m)M A0 + arcsin =0 2 π A plyne e10 = A0 = −A sin π1−m , 2 1+m Rozvedenı́m podle známých vztahů pro sin (α − β) je e10 = A0 = A cos π . 1+m (13.35) KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 131 Rovnováha střı́davých složek. Pro zjištěnı́ autooscilacı́ sestavı́me charakteristickou rovnici G(jω)N (A0 , A)+ 1 = 0. Ekvivalentnı́ přenos je podle vztahu (13.33) r e10 2 2(1 + m)M N (A0 , A) = 1−( ) . πA A Obr. 13.16 Dosadı́me-li za e10 ze vztahu (13.35), bude ekvivalentnı́ přenos již funkcı́ jen vstupnı́ amplitudy A 2(1 + m)M π konst. sin = πA 1+m A (13.36) K 2 K3 K 1 K2 + . s(T1 s + 1)(T2 s + 1) s(T2 s + 1) (13.37) N (A) = Přenos lineárnı́ části obvodu je G(s) = Charakteristickou rovnici je možno při volbě konkrétnı́ch čı́selných konstant řešit graficky. Tento jednoduššı́ systém můžeme ale také řešit analyticky, čı́mž zı́skáme obecné vztahy pro amplitudu a frekvenci autooscilacı́ pro různé volby konstant obvodu. Dosazenı́m lineárnı́ho přenosu do charakteristické rovnice dostaneme T1 T2 s3 + (T1 + T2 )s2 + (1 + T1 K2 K3 N (A))s + (K1 + K3 )K2 N (A) = 0. (13.38) Pro s = jω je třeba simultánně řešit dvě rovnice (K1 + K3 )K2 N (A) − (T1 + T2 )ω 2 = 0 (13.39) (1 + T1 K2 K3 N (A))ω − T1 T2 ω 3 = 0. (13.40) Vyloučı́me N (A) z rovnice (13.39) T1 T2 ω 2 − 1 . T 1 K 2 K3 Dosazenı́m do (13.40) a úpravou zı́skáme frekvenci autooscilacı́ s K1 + K3 ω= . T1 (T2 K1 − T1 K3 ) N (A) = (13.41) (13.42) Dosazenı́m N (A) a ω 2 do (13.39) zı́skáme po jednoduchých úpravách amplitudu autooscilacı́ A= 2M K2 T1 (T2 K1 − T1 K3 ) π Ac π (1 + m) sin = (1 + m) sin , π(T1 + T2 ) 1+m 2 1+m (13.43) KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 132 kde Ac je amplituda vlastnı́ch kmitů při symetrické nelinearitě. Tı́m jsme vyřešili vlastnosti autooscilacı́ obecně v závislosti na všech konstantách lineárnı́ i nelineárnı́ části obvodu. Na obr. 13.16 je vynesena amplituda A a posuv e10 v závislosti na veličině m, která charakterizuje nesymetrii nelineárnı́ho prvku. 13.7 Ekvivalentnı́ přenos nelinearity se dvěma vstupy Všechny jevy spojené se vznikem subharmonických nebo ultraharmonických kmitů a s otázkami stability autooscilačnı́ch nelineárnı́ch systémů buzených periodickým vstupnı́m signálem nelze již řešit jednoduchým ekvivalentnı́m přenosem, protože vstup na nelineárnı́ prvek nenı́ v těchto přı́padech jednoduchý sinový kmit. V literatuře byl zaveden tzv. ekvivalentnı́ přenos pro dva vstupy (v angl. literatuře ”Dual-input Describing Function, zkráceně DIDF), který umožnil vysvětlit velmi složité jevy, vznikajı́cı́ v buzených nelineárnı́ch obvodech. Uvedeme jen stručně princip a možnosti této metody, podrobnosti lze nalézt např. v [21,27]. Vstup na nelinearitu se uvažuje ve tvaru e1 = A sin (ωA t + ϕA ) + B sin (ωB t + ϕB ), (13.44) kde amplitudy A, B a frekvence ωA , ωB se určı́ podle povahy systému a jeho vstupů. Studuje-li se např. chovánı́ nelineárnı́ho autooscilačnı́ho systému buzeného vstupnı́m periodickým signálem, bude ωA odpovı́dat frekvenci autooscilacı́, ωB frekvenci vstupnı́ho signálu. Při zkoumánı́ vzniku subharmonických a ultraharmonických kmitů jsou frekvence v jednoduchém násobném poměru. Pro tyto speciálnı́ přı́pady můžeme položit ωB = nωA a vstup na nelinearitu se zjednodušı́ na tvar e1 = A sin ωt + B sin (nωt + ϕ). (13.45) Ekvivalentnı́ přenos pro dva vstupy je funkcı́ většı́ho počtu parametrů a jeho odvozenı́ pro různé nelinearity je složité. Ekvivalentnı́ přenos můžeme definovat jako poměr určité harmonické výstupu a přı́slušné složky o stejné frekvenci na vstupu nelineárnı́ho prvku. Protože na vstupu jsou dvě složky, lze definovat ekvivalentnı́ přenos pro každou z nich. Pomocı́ těchto přenosů lze pak studovat např. problémy vzniku a odstraněnı́ subharmonických v nelineárnı́ch obvodech, vznik ultraharmonických kmitů apod. Byly např. stanoveny oblasti v komplexnı́ rovině, do kterých nesmı́ vstoupit frekvenčnı́ charakteristika lineárnı́ části obvodu, nemajı́-li vzniknout subharmonické kmity. Pomocı́ metody ekvivalentnı́ch přenosů lze pak vkládat do obvodu vhodné korekce, které vzniku subharmonických zabránı́. Ekvivalentnı́ přenos pro dva vstupy lze zjednodušit, je-li frekvence vstupu mnohem vyššı́ než frekvence autooscilacı́ nebuzeného obvodu. Pak e1 = A sin ωt + B sin βt, β >> ω (13.46) Amplitudu nı́zkofrekvenčnı́ složky je pak možno považovat za konstantu v každém kmitu vysokofrekvenčnı́ složky. Tı́mto zjednodušenı́m lze vysvětlit např. možnosti odstraněnı́ autooscilacı́ pomocı́ periodického vstupnı́ho signálu. Dalšı́ zjednodušenı́ představuje ekvivalentnı́ přenos pro dva vstupy při malé amplitudě ε jednoho vstupnı́ho signálu na nelinearitu. Pro e1 pak platı́ e1 = A sin ωt + ε sin (nωt + ϕ). (13.47) Tato aproximace se často využı́vá při studiu stability oscilacı́, vzniku skokových rezonancı́ a jiných jevů. Ekvivalentnı́ přenos pro dva vstupy je v literatuře důkladně rozpracován, jsou tabelovány mnohé grafy různých přenosů pro běžně se vyskytujı́cı́ nelinearity a lze proto řešit i velmi speciálnı́ problémy KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ 133 složitých nelineárnı́ch systémů. Musı́me mı́t ovšem stále na paměti, že metoda ekvivalentnı́ch přenosů je určitou vı́ce či méně přesnou aproximacı́ a je třeba vždy dbát na to, aby byly splněny podmı́nky dostatečné filtrace vyššı́ch harmonických. Zı́skané výsledky lze ovšem kontrolovat a zpřesňovat simulacı́. Kapitola 14 Metody syntézy nelineárnı́ch řı́dı́cı́ch systémů Úkolem syntézy je navrhnout k dané lineárnı́ nebo nelineárnı́ soustavě vhodný lineárnı́ nebo nelineárnı́ regulátor, který by zajistil splněnı́ požadavků na žádané chovánı́ uzavřeného obvodu. Bude-li cı́lem řı́zenı́ stabilnı́ chovánı́ a vhodná dynamika při velkých rychlostech a pracovnı́ch rozsazı́ch, je většinou nutné nelineárnı́ řı́zenı́. Úkoly řı́zenı́ můžeme rozdělit zhruba do dvou základnı́ch skupin. Jedná se bud’ o stabilizaci, kdy je cı́lem stabilizovat uzavřený obvod do jednoho rovnovážného stavu nebo o sledovánı́, při kterém je třeba navrhnout vhodný regulátor tak, aby výstup systému se pohyboval po žádané trajektorii. Stabilizačnı́ problém. Úkolem je nalézt pro daný nelineárnı́ systém ẋ = f (t, x, u) takový řı́dı́cı́ zákon u, aby při libovolné počátečnı́ podmı́nce x0 v požadované oblasti Ω směřoval stav x(t) do žádaného rovnovážného stavu a dosáhl jej v konečném nebo nekonečném čase (nebo zůstal alespoň dostatečně blı́zko). Přı́kladem stabilizačnı́ úlohy je regulace teploty v peci na konstantnı́ hodnotu, regulace hladiny v kotli, regulace letu letadla v konstantnı́ výšce apod. Problém sledovánı́. U tohoto problému je zadán systém ẋ = f (t, x, u), výstup y = h(x) a žádaná trajektorie výstupu reprezentovaná časovým průběhem řı́dı́cı́ veličiny w(t). Úkolem je nalézt takové řı́zenı́ u, aby při pohybu z libovolného počátečnı́ho stavu v oblasti Ω směřovala regulačnı́ odchylka e(t) = w(t) − y(t) k nule a stav zůstal ohraničený. Dokonalé sledovánı́ nastává, jestliže při vhodných počátečnı́ch podmı́nkách je y(t) = w(t) pro všechna t ≥ 0. Asymptotické sledovánı́ je takové, u něhož se dosáhne dokonalého sledovánı́ asymptoticky. U mnoha praktických problémů je pro výpočet vhodného řı́zenı́ u předem k dispozici žádaná hodnota w(t) spolu se svými derivacemi až do dostatečně vysokého řádu. Např. u robotů je pohyb po žádané trajektorii často předem naplánován, takže potřebné derivace w(t) lze snadno vypočı́tat. U jiných systémů je známý sice jen žádaný průběh w(t), ale jeho derivace lze zı́skat např. pomocı́ referenčnı́ho modelu. Problémy sledovánı́ jsou obtı́žnějšı́ než problémy stabilizace, protože při sledovánı́ musı́ řı́dı́cı́ systém udržovat nejen stabilnı́ stav systému, ale také udržovat výstup systému na požadované trajektorii. Při návrhu řı́zenı́ se obvykle postupuje v tomto sledu: 1) fyzikálnı́ systém se modeluje pomocı́ soustavy diferenciálnı́ch rovnic; 2) specifikuje se žádané chovánı́, zvolı́ se snı́mače a akčnı́ členy a namodelujı́ se jejich vlastnosti; 134 KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 135 3) navrhne se podle zvolené metody vhodná struktura řı́zenı́ systému a parametry tohoto řı́zenı́; 4) analýzuje se chovánı́ výsledného systému (nejčastěji simulacı́ na počı́tači). Nejsou-li vlastnosti vyhovujı́cı́, je třeba se vrátit k bodu tři a zvolit jinou metodu pro návrh řı́zenı́; 5) implementuje se řı́dı́cı́ systém pomocı́ analogového nebo čı́slicového řı́zenı́. U nelineárnı́ch systémů je důležitá podrobná znalost fyzikálnı́ch vlastnostı́ systému. Ta umožňuje často posoudit, které nelinearity jsou podstatné a které lze, alespoň při prvnı́m návrhu, zanedbat. Pochopenı́ fyzikálnı́ch vlastnostı́ často umožňuje vhodný návrh i u složitých systémů s mnoha vstupy a výstupy, např. u manipulátorů a robotů. Jejich inerčnı́ matice je pozitivně definitnı́ a může být využita pro volbu vhodné Ljapunovovy funkce, která zajistı́ globálnı́ stabilitu a konvergenci při sledovánı́ (odst. 14.2.2). Specifikace žádaného chovánı́ je u nelineárnı́ch systémů obtı́žnějšı́ než u systémů lineárnı́ch. Návrh musı́ zajistit stabilitu, nejlépe globálnı́, nebo alespoň v dostatečně velké oblasti počátečnı́ch podmı́nek. Pro zvolené typické trajektorie musı́ být zajištěna vyhovujı́cı́ rychlost a přesnost odezvy. Výsledný systém by měl být robustnı́, tj. necitlivý na poruchy, šum, malé změny parametrů, vliv nenamodelované dynamiky apod. Pro praxi je nezanedbatelná také cena řı́dı́cı́ho systému. 14.1 Linearizace nelineárnı́ch systémů Fyzikálnı́, chemické a jiné systémy jsou většinou nelineárnı́ a jejich řı́zenı́ je obtı́žné. Velmi často se proto snažı́me nějakým vhodným způsobem systém linearizovat, protože metody řı́zenı́ lineárnı́ch systémů jsou podrobně rozpracovány a umožňujı́ relativně jednoduchý návrh řı́dı́cı́ho systému. Linearizaci lze provádět různými metodami. Jde bud’ o linearizaci v jednom pracovnı́m bodě nebo ve vı́ce pracovnı́ch bodech, nebo o tzv. exaktnı́ (zpětnovazebnı́) linearizaci. Tyto přı́stupy si probereme dále podrobněji. 14.1.1 Linearizace v pracovnı́m bodě V mnoha přı́padech můžeme nelineárnı́ systém linearizovat ve zvoleném pracovnı́m bodě, lineárnı́ aproximace však dává jen lokálnı́ popis chovánı́ systému a zanedbává všechny speciálnı́ jevy, které mohou nelineárnı́ systémy mı́t. Často to však lze tolerovat a aproximačnı́ model pak umožnı́ využı́t všechny známé metody řı́zenı́ lineárnı́ch systémů. 14.1.2 Linearizace ve vı́ce pracovnı́ch bodech Metoda je známa pod anglickým názvem ”gain scheduling” (programované zesı́lenı́). U této metody se volı́ většı́ počet pracovnı́ch bodů, které dostatečně pokrývajı́ pracovnı́ oblast, a kolem nich se systém linearizuje. Pro každou linearizaci se pak navrhne vhodný, obvykle lineárnı́ regulátor. Globálnı́ nelineárnı́ regulátor se zı́ská bud’ přepı́nánı́m přı́slušných regulátorů při pohybu v blı́zkosti odpovı́dajı́cı́ho pracovnı́ho bodu nebo spojitou interpolacı́ parametrů regulátorů při pohybu mezi pracovnı́mi body. Tato heuristická metoda se použı́vá v mnoha aplikacı́ch, jako přı́klad lze uvést řı́zenı́ letadla. Jednotlivé linearizace odpovı́dajı́ různým letovým podmı́nkám, které jsou charakterizovány polohou a rychlostı́ letadla a atmosférickými vlivy. Nadřazený regulátor pak přepı́ná jednotlivé regulátory navržené pro dı́lčı́ linearizované soustavy. Metoda linearizace ve vı́ce pracovnı́ch bodech je principiálně jednoduchá a je užitečná zejména při řı́zenı́ ve velkých pracovnı́ch oblastech. Rychlé přepı́nánı́ jednotlivých regulátorů nebo rychlé spojité změny parametrů těchto regulátorů však mohou někdy vést ke zhoršenı́ přechodných jevů nebo dokonce k nestabilitě systému. Tyto jevy však většinou nenastanou při pomalých přechodech mezi různými KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 136 operačnı́mi podmı́nkami [44]. 14.1.3 Exaktnı́ linearizace Nejobecnějšı́m způsobem linearizace systému je tzv. exaktnı́ (přesná) linearizace, která se nazývá také často zpětnovazebnı́ linearizace. Základnı́ princip metody spočı́vá ve snaze vykompenzovat nelinearity systému jinými nelinearitami a převést jej tak na lineárnı́ systém. Kompenzace nelinearit může být bud’ částečná nebo úplná a lze ji provést bud’ globálně v celém stavovém prostoru nebo lokálně v určité oblasti, která však může být podstatně většı́ než je přı́pustná oblast při linearizaci kolem pracovnı́ho bodu. Metodám exaktnı́ch linearizacı́ je v poslednı́ch letech věnována velká pozornost a existuje množstvı́ publikacı́ na toto téma. Proto věnujeme exaktnı́m linearizacı́m samostatnou kapitolu 15. 14.2 Základnı́ metody syntézy řı́zenı́ Stejně jako pro analýzu nelineárnı́ch systémů tak i pro syntézu řı́zenı́ neexistuje univerzálnı́ metoda pro návrh vhodného regulátoru. Bylo publikováno mnoho metod, většina z nich je však vhodná jen pro určité typy systémů. Proto také klasifikace metod a jejich vlastnostı́ je obtı́žná. 14.2.1 Lineárnı́ nebo linearizovaná soustava s nelineárnı́m řı́zenı́m Pokud je daná regulovaná soustava lineárnı́ nebo ji lze některou z metod čl. 14.1 linearizovat s vyhovujı́cı́ přesnostı́ v požadované pracovnı́ oblasti, můžeme použı́t k jejı́mu popisu lineárnı́ diferenciálnı́ rovnice. K této soustavě pak můžeme zvolit spojitě nebo nespojitě pracujı́cı́ regulátor. 1. Spojitě pracujı́cı́ regulátory s parazitnı́mi nelinearitami Pro řı́zenı́ lineárnı́ soustavy volı́me nejčastěji PID-regulátor nebo stavový regulátor. Parazitnı́ nelinearity ve snı́mačı́ch, zesilovačı́ch nebo akčnı́ch členech bud’ při prvnı́m hrubém návrhu zanedbáme nebo se je snažı́me vhodným způsobem kompenzovat. Pokud to z nějakých důvodů nelze, provedeme syntézu regulátoru s parazitnı́mi nelinearitami některou metodou, která byla uvedena v předchozı́ch kapitolách. Vhodné zesı́lenı́ obvodu a jeho stabilitu můžeme zajistit např. pomocı́ Ljapunovovy teorie, Popovova nebo kruhového kritéria, nebo pomocı́ metody ekvivalentnı́ch přenosů. Dynamické vlastnosti výsledného návrhu ověřı́me simulacı́. Vliv nasycenı́ akčnı́ch členů Omezenı́ výstupu akčnı́ho členu vede ke zhoršenı́ přechodných jevů nebo i k nestabilitě při většı́ch poruchách. Má-li regulátor integračnı́ složku, pak při dosaženı́ hranice omezenı́ se nezvětšuje vstup na regulovanou soustavu, ale integrátor může dále integrovat. Vlivem omezenı́ akčnı́ veličiny je reakce regulátoru na změnu polarity jeho vstupnı́ho signálu zpožděna. Tento jev se označuje anglickým termı́nem windup a je třeba jej kompenzovat. Lze např. omezit vstupnı́ signál integračnı́ složky vhodnou nelineárnı́ zpětnou vazbou kolem integrátoru, nebo se integračnı́ složka nuluje, přestoupı́-li regulačnı́ odchylka určitou velikost. Podrobnějšı́ rozbor lze nalézt např. v [44]. Nejhoršı́ vliv má nasycenı́ na vstupu nestabilnı́ soustavy. Např. zpětnovazebnı́ systém s PIregulátorem s nasycenı́m a s jednoduchou nestabilnı́ soustavou s přenosem 1/(s − 1) dává při malých vstupnı́ch signálech w stabilnı́ odezvu, při většı́ch hodnotách w je systém silně nestabilnı́. V literatuře je uvedeno, že tento typ selhánı́ byl jednou z přı́čin katastrofy v Černobylu. Nepřı́jemný vliv saturace na vstupu soustavy lze snı́žit na minimum vhodným návrhem. Pokud je to možné, je třeba se vyhnout podmı́nečně stabilnı́m regulačnı́m obvodům a velkým hodnotám žádané KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 137 veličiny w. 2. Nespojitě pracujı́cı́ regulátory Tyto regulátory se použı́vajı́ tehdy, nenı́-li spojitá akčnı́ veličina z konstrukčnı́ho nebo ekonomického hlediska výhodná. Regulátor obsahuje většinou prvek s nespojitou charakteristikou dvoupolohového, třı́polohového nebo vı́cepolohového typu. Časté využitı́ je u jednoduchých a laciných regulacı́, např. při regulaci teploty v chladničkách, pračkách, žehličkách a jiných domácı́ch spotřebičı́ch, při regulaci asynchronnı́ch motorů aj. Návrh jednoduchých nespojitě pracujı́cı́ch regulátorů lze provést např. metodou ekvivalentnı́ch přenosů nebo simulacı́. Přı́klady syntézy řı́zenı́ s třı́polohovým regulátorem jsou uvedeny ve skriptu [5]. Nespojité regulátory jsou často doplněny impulsovánı́m, které může být bud’ z nezávislého zdroje nebo je realizováno pomocı́ samobuzených kmitů, které vzniknou přidánı́m vhodného lineárnı́ho členu do zpětné vazby kolem nespojitého prvku. Impulsovánı́m se činnost nespojitého regulátoru přibližuje činnosti regulátoru pracujı́cı́ho spojitě, protože plynulá změna akčnı́ veličiny se nahrazuje šı́řkovou pulsnı́ modulacı́ s konstantnı́ amplitudou. Doplněnı́m nespojitých regulátorů vhodnými nelineárnı́mi členy zı́skáme jednoduchá časově optimálnı́ řı́zenı́. Základnı́ schemata a způsoby návrhu jsou pro systémy nižšı́ho řádu uvedena ve skriptech [5,8]. 14.2.2 Nelineárnı́ soustava s lineárnı́m nebo nelineárnı́m řı́zenı́m Pokud jsme neprovedli linearizaci soustavy některou z metod čl. 14.1, můžeme navrhnout k dané nelineárnı́ regulované soustavě vhodný regulátor pomocı́ Ljapunovovy teorie nebo simulacı́. 1. Návrh řı́zenı́ pomocı́ Ljapunovovy teorie Pro návrh vhodného řı́zenı́ nelineárnı́ regulované soustavy můžeme použı́t přı́mou Ljapunovovu metodu. Postupovat lze v podstatě dvojı́m způsobem. Při prvnı́m přı́stupu zvolı́me nějakou Ljapunovovu funkci a pak hledáme řı́dı́cı́ zákon, který by potvrdil, že zvolená funkce vyhovuje. U druhého přı́stupu volı́me nejprve určité řı́zenı́ u(x), o němž předpokládáme, že bude vyhovujı́cı́ a pak hledáme Ljapunovovu funkci, která by ověřila stabilitu výsledného uzavřeného obvodu. Tyto přı́stupy se často využı́vajı́ při návrhu robustnı́ho řı́zenı́, adaptivnı́ho řı́zenı́, řı́zenı́ s klouzavým režimem aj. Přı́klad 14.1. Prvnı́ přı́stup k návrhu řı́zenı́ ilustrujme na systému ẋ2 = −a(x2 ) − b(x1 ) + u. ẋ1 = x2 (14.1) V odst. 5.3.1 jsme viděli, že pro nebuzený systém tohoto typu lze zvolit Ljapunovovu funkci na základě fyzikálnı́ analogie ve tvaru Z x1 1 2 V (x) = x2 + b(x1 )dx1 (14.2) 2 0 Systém je asymptoticky stabilnı́, jsou-li splněny podmı́nky x2 a(x2 ) > 0 ∀ x2 6= 0 a x1 b(x1 ) > 0 ∀ x1 6= 0. (14.3) Necht’ je dán např. systém ẋ1 = x2 ẋ2 = −α1 x32 − α2 x21 + u, (14.4) kde hodnoty koeficientů α1 , α2 nejsou přesně známy, platı́ však: α1 > −1 a |α2 | < 4. Uzavřený obvod bude stabilnı́, zvolı́me-li řı́zenı́ ve tvaru u = −x32 − 4(x1 + x31 ). (14.5) KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 138 Rovnice uzavřeného obvodu jsou ẋ2 = −(x32 + α1 x32 ) − (4x31 + α2 x21 + 4x1 ) ẋ1 = x2 (14.6) a jsou splněny podmı́nky stability x2 a(x2 ) = x2 (x32 + α1 x32 ) > 0 α1 > −1 pro x1 b(x1 ) = x1 (4x31 + α2 x21 + 4x1 ) > 0 pro |α2 | < 4. Návrh zajišt’uje kromě stability i určitou nezávislost na změnách parametrů v odpovı́dajı́cı́ch intervalech. Přı́klad 14.2. Druhý přı́stup ilustruje tento návrh. Je dán systém ẋ1 = x22 − x31 ẋ2 = −x2 + x1 u. (14.7) Volı́me-li řı́zenı́ u = x1 − x2 , je uzavřený obvod popsán rovnicemi ẋ1 = x22 − x31 ẋ2 = −x2 + x21 − x1 x2 . (14.8) Zvolme V = x21 + x22 . Derivace V̇ = −2(x41 − x21 x2 + x22 ) = −2[(x2 − 0, 5x21 )2 + 0, 75x41 ] je vždy záporná, takže x = 0 je asymptoticky stabilnı́ rovnovážný stav. Přı́klad 14.3. Návrh řı́zenı́ robotu [52]. Na tomto přı́kladu můžeme ilustrovat rovněž druhý přı́stup. U průmyslových robotů se často použı́vajı́ proporcionálně derivačnı́ regulátory pro řı́zenı́ polohy ramena. Složitá dynamika robota s n pohyblivými rameny je dána soustavou n nelineárnı́ch rovnic ve tvaru H(x)ẍ + b(x, ẋ) + g(x) = u, (14.9) kde x je n-dimenzionálnı́ vektor popisujı́cı́ úhlové polohy kloubů robotu, ẋ jsou rychlosti pohybu kloubů, g je vektor gravitačnı́ch momentů, b představuje odstředivé a Coriolisovy momenty, u je vektor vstupnı́ch (řı́dı́cı́ch) momentů a H je inerčnı́ matice rozměru n × n. Kinetická energie robotu je T = 1/2 ẋT H(x)ẋ a musı́ být kladná pro každou polohu x a každou nenulovou rychlost kloubu ẋ. Matice H(x) je tedy symetrická pozitivně definitnı́ matice. Cı́lem řı́zenı́ je dosaženı́ žádané polohy xw ramen robotu. Pro řı́zenı́ polohy budeme uvažovat proporcionálně derivačnı́ regulátory uj = −kP j x̃j − kDj ẋj , (14.10) kde x̃j = xj − xjw je odchylka polohy každého kloubu od žádané hodnoty a ẋj jsou rychlosti pohybu v kloubech. Obecněji můžeme řı́zenı́ zapsat ve tvaru u = −K P x̃ − K D ẋ, (14.11) kde K P a K D jsou konstantnı́ symetrické pozitivně definitnı́ matice (podle vztahů (14.10) by byly jen diagonálnı́). Na K P a K D se lze dı́vat jako na konstanty, které by u obecného mechanického systému definovaly nějaké pružiny nebo tlumiče. KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ 139 Uvažujme nynı́ jako Ljapunovovu funkci V virtuálnı́ mechanickou energii uzavřeného obvodu při volbě řı́zenı́ podle rovnice (14.11) ve tvaru 1 V = [ẋT H ẋ + x̃T K P x̃], 2 (14.12) kde prvnı́ člen představuje kinetickou energii manipulátoru a druhý člen jakousi ”umělou” potenciálnı́ energii virtuálnı́ch pružin v zákonu řı́zenı́ (14.11). Při výpočtu derivace V̇ můžeme pro zjednodušenı́ použı́t energetický vztah platný v mechanice, který řı́ká, že rychlost změny kinetické energie je rovný výkonu vnějšı́ch sil d 1 T [ ẋ H ẋ] = ẋT u. dt 2 (14.13) V̇ = ẋT u + ẋT K P x̃ = ẋT (u + K P x̃). (14.14) Pak Při použitı́ řı́dı́cı́ho zákona (14.11) je V̇ = −ẋT K D ẋ ≤ 0. (14.15) V̇ je tedy výkon disipovaný virtuálnı́mi tlumiči (podobně jako v přı́kladu odst. 5.3.1). Lze se přesvědčit, že V̇ = 0 jen tehdy, když x̃ = 0. Proto systém konverguje do žádaného stavu a je globálně asymptoticky stabilnı́. 2. Návrh řı́zenı́ pomocı́ počı́tačové simulace V odst. 2.2.5 jsme uvedli některé simulačnı́ jazyky pro modelovánı́ systémů na čı́slicových počı́tačı́ch. Některé z nich jsou výhodné i pro návrh řı́dı́cı́ch algoritmů nelineárnı́ch systémů. Pro širšı́ využitı́ ve výzkumu a v průmyslu se použı́vajı́ např. jazyky ACSL, Desire, Omola, Dymola aj. Pro výuku je výhodný zejména systém SIMULINK, doplněný souborem programů Nonlinear Control Design Toolbox (NCD). Tento soubor umožňuje namodelovat nelineárnı́ regulovanou soustavu a zvolený typ regulátoru v systému SIMULINK a pak pomocı́ optimalizačnı́ch programů určit nejvýhodnějšı́ konstanty regulátoru. Systém umožňuje zvolit předem určité hranice časových průběhů různých veličin obvodu, nastavit maximálnı́ tolerované hodnoty překývnutı́, požadovanou dobu přechodu apod. Lze optimalizovat různé zvolené veličiny (skaláry, vektory i matice) a předem nastavit jejich tolerančnı́ oblasti pro zı́skánı́ robustnı́ho řı́zenı́. Do systému lze vkládat různé nelinearity, volit deterministické i náhodné vstupnı́ signály, minimalizovat řı́dı́cı́ energii, omezovat vliv poruchových veličin, vytvářet adaptivnı́ řı́zenı́ apod. Program neumı́ samozřejmě najı́t optimálnı́ strukturu řı́dı́cı́ho systému, nanavrhne vhodné kompenzačnı́ nelinearity apod. Důkladné znalosti teorie nelineárnı́ho řı́zenı́ a určité praktické zkušenosti jsou proto základnı́ podmı́nkou pro úspěšné využitı́ počı́tačové simulace. Kapitola 15 Exaktnı́ linearizace Exaktnı́ nebo také často nazývané zpětnovazebnı́ linearizace spočı́vajı́ na myšlence úplného nebo alespoň částečného vykompenzovánı́ nelinearit systému tak, aby výsledný systém měl bud’ menšı́ počet nelinearit nebo aby se choval mezi zvoleným vstupem a výstupem nebo stavy jako lineárnı́. Kompenzace nelinearit může být provedena globálně v celém stavovém prostoru nebo lokálně v určité oblasti, která však může být postačujı́cı́ pro prakticky se vyskytujı́cı́ počátečnı́ podmı́nky. Metodám zpětnovazebnı́ linearizace je v poslednı́ch letech věnována velká pozornost a existuje množstvı́ teoretických pracı́ i aplikačnı́ch výsledků. Dvě stěžejnı́ publikace z tohoto oboru jsou [36] a [49]. 15.1 Intuitivnı́ přı́stup k linearizaci U některých jednoduchých systémů je možno velmi snadno vykompenzovat nelinearity pomocı́ jiných nelinearit a zı́skat tak výsledný systém, který je lineárnı́. Ten je pak možno řı́dit některým ze způsobů, které jsou vypracovány v lineárnı́ teorii řı́zenı́. Uved’me si jednoduchý přı́klad, převzatý z [52]. Přı́klad 15.1. Regulace výšky hladiny v nádrži. Na obr. 15.1 je zakreslena rotačnı́ nádrž, u nı́ž je třeba udržovat výšku hladiny h [m] na žádané hodnotě hw . Označme dále přı́tok kapaliny u [m3 s−1 ], průřez odpadnı́ trubky a [m2 ] a plochu nádrže ve výšce h jako S(h) [m2 ]. Dynamický model nádrže je p S(h)ḣ = u − a 2gh. (15.1) Řı́zenı́ tohoto nelineárnı́ho systému můžeme provést různým způsobem. Zvolı́me-li např. proporcionálnı́ regulátor u = r0 e = r0 (hw − h), (15.2) √ nemůžeme dosáhnout nulové regulačnı́ odchylky, protože nelineárnı́ zpětná vazba a 2gh odstranı́ integračnı́ charakter soustavy. Nulovou regulačnı́ odchylku v ustáleném stavu zı́skáme integračnı́m regulátorem, ale i tento způsob řı́zenı́ nenı́ přı́liš vhodný. Při velkém hw bude plocha nádrže velká, rychlost změny výšky bude malá a h bude růst velmi pomalu. Dynamika změn bude silně záviset na okamžité hladině. Proved’me linearizaci daného systému tak, že zvolı́me řı́zenı́ p u = a 2gh + S(h)v, (15.3) kde v je nový vstup. Pak platı́ ḣ = v a mezi novým vstupem v a výstupem h je integračnı́ závislost. Nynı́ stačı́ použı́t proporcionánı́ regulátor v = r0 e = r0 (hw − h), 140 (15.4) KAPITOLA 15. EXAKTNÍ LINEARIZACE 141 při kterém je regulačnı́ odchylka v ustáleném stavu nulová a dynamika výsledného systému již nezávisı́ na okamžité hladině. Obrázek 15.1: Regulace výšky hladiny v nádrži Z přı́kladu je patrno, že vykompenzovánı́ nelinearit lze jednoduše provést pro třı́du nelineárnı́ch systémů popsaných ve tvaru tzv. řiditelné kanonické formy (analogie Frobeniova kanonického tvaru u lineárnı́ch systémů) ẋ1 = x2 ẋ2 = x3 ... ẋn−1 = xn (15.5) ẋn = f (x) + g(x)u. (15.6) 1 [v − f (x)], g(x) (15.7) Zvolı́me-li u ve tvaru u= vykompenzujı́ se nelinearity a dostaneme jednoduchý vztah mezi novým vstupem v a výstupem x1 ve tvaru n integračnı́ch členů. Při této linearizaci jsme nezavedli žádné transformace stavů, stavové proměnné nového (lineárnı́ho) systému jsou původnı́ proměnné x. Syntézu regulátoru můžeme nynı́ provést metodami, které jsou známy z teorie řı́zenı́ lineárnı́ch systémů. Použijme-li např. stavový regulátor, lze řı́dı́cı́ zákon napsat ve tvaru v = −k1 x1 − k2 x2 − ... − kn xn (15.8) a dosadit do vztahu (15.7). Např. u systému ẋ1 = x2 ẋ2 = f (x1 , x2 ) + g(x1 , x2 )u lze volit u ve tvaru u=− g(x1 , x2 ) 6= 0 f (x1 , x2 ) 1 + v. g(x1 , x2 ) g(x1 , x2 ) ∀ x1 , x2 (15.9) (15.10) Tı́m zı́skáme řiditelný lineárnı́ systém ẋ1 = x2 , ẋ2 = v, ke kterému můžeme zvolit vhodné lineárnı́ řı́zenı́. 15.1.1 Transformace stavových proměnných Nenı́-li zadaný nelineárnı́ systém v řiditelné kanonické formě, je linearizace již obtı́žnějšı́. Z teorie lineárnı́ch systémů je známo, že lze provést transformaci stavu a převést zadaný lineárnı́ systém do Frobeniova kanonického tvaru. Podobně to lze někdy udělat u nelineárnı́ho systému. Necht’ T (x) je hladké zobrazenı́ definované na oblasti Ω z Rn . Předpokládejme, že Jacobiova matice zobrazenı́ T je regulárnı́ v bodě x oblasti Ω. Pak T (x) definuje lokálnı́ difeomorfismus na KAPITOLA 15. EXAKTNÍ LINEARIZACE 142 nějaké oblasti Ω0 ⊂ Ω. Jsou-li T (x) a T −1 hladká zobrazenı́ a T (x) je invertovatelné pro všechna x ∈ Rn , pak transformace T (x) je globálnı́ difeomorfismus. Přı́klad 15.2. Uvažujme systém ẋ1 = x1 ln x2 ẋ2 = −x2 ln x1 + x2 u. (15.11) Zaved’me kolem rovnovážného stavu x = (1, 1) lokálnı́ transformace souřadnic z = T (x) z1 = T1 (x1 , x2 ) = ln x1 Pak z2 = T2 (x1 , x2 ) = ln x2 . ∂T1 ∂T1 1 ẋ1 + ẋ2 = (x1 ln x2 ) = ln x2 = z2 ∂x1 ∂x2 x1 ∂T2 ∂T2 1 ż2 = ẋ1 + ẋ2 = (−x2 ln x1 + x2 u) = −ln x1 + u = −z1 + u ∂x1 ∂x2 x2 ż1 = Nelineárnı́ systém (15.11) je tedy v nových souřadnicı́ch z lineárnı́ ż1 = z2 ż2 = −z1 + u. (15.12) Pro zadaný nelineárnı́ systém je ovšem obtı́žné určit, zda bude existovat transformace, která převede nelineárnı́ systém na ekvivalentnı́ systém lineárnı́. Tato úloha je obecně vyřešena v literatuře, ale věta i jejı́ důkaz jsou složité (viz např. [36]). Ukazuje se, že pouhá transformace souřadnic se při linearizaci dá v praxi použı́t jen u velmi malého počtu nelineárnı́ch systémů. Většina systémů je linearizovatelná nejen s použitı́m transformace, ale také pomocı́ vhodné přı́mé a zpětné nelineárnı́ vazby. Metody exaktnı́ch linearizacı́ můžeme rozdělit do dvou skupin. Složitějšı́ úlohu představuje linearizace vstup-stav, kdy se snažı́me linearizovat systém mezi vstupem a všemi jeho stavy. Tomuto přı́stupu se budeme věnovat v čl. 15.3 až po zavedenı́ některých nových matematických pojmů. Druhou skupinu tvořı́ metody linearizace vstup-výstup, které jsou teoreticky jednoduššı́ a proto si jejich princip uvedeme již v tomto úvodnı́m článku. 15.1.2 Linearizace vstup-výstup Dále budeme předpokládat, že nelineárnı́ systém je v afinnı́m tvaru ẋ = f (x) + g(x)u y = h(x) x ∈ Rn . (15.13) Zadaný systém chceme linearizovat a budeme zatı́m předpokládat, že ho lze pomocı́ vhodných transformacı́ a nelineárnı́ch vazeb převést na ekvivalentnı́ lineárnı́ systém ż = Az + bv ỹ = h̃(z) z ∈ Rn . (15.14) Tento lineárnı́ systém si můžeme zvolit v různém tvaru, nejčastěji se použı́vá sériové zapojenı́ integračnı́ch členů. Obě reprezentace (15.13) a (15.14) budou vstupně-výstupně ekvivalentnı́ právě tehdy, když při stejných vstupech je stejné chovánı́ výstupů, tj. když y (i) (t) = ỹ (i) (t) i = 0, 1, ..., n. (15.15) Výpočet lineárnı́ reprezentace lze provést tak, že výstup derivujeme postupně tolikrát, až se objevı́ závislost na řı́zenı́ u. Ukažme si tento postup na jednoduchých přı́kladech. KAPITOLA 15. EXAKTNÍ LINEARIZACE 143 a) Lineárnı́ reprezentace ve tvaru sériového zapojenı́ integrátorů Přı́klad 15.3. Nelineárnı́ systém ẋ1 = x2 − sin x1 ẋ2 = u y = x1 (15.16) chceme pomocı́ vhodných nelineárnı́ch vazeb převést na ekvivalentnı́ lineárnı́ systém reprezentovaný dvěma za sebou zapojenými integrátory ż1 = z2 ż2 = v ỹ = z1 . (15.17) Oba systémy budou ekvivalentnı́, jestliže ẏ = ỹ˙ y = ỹ ÿ = ỹ¨ Derivujme výstup y postupně tolikrát, až se objevı́ závislost na u. y ẏ ÿ = x1 = ẋ1 = x2 − sin x1 = −(cos x1 )ẋ1 + ẋ2 = −(cos x1 )x2 + sin x1 cos x1 + u. (15.18) Porovnánı́m přı́slušných derivacı́ y a ỹ je patrno, že z2 = x2 − sin x1 z1 = x1 u = v + x2 cos x1 − sin x1 cos x1 Vytvořı́me-li tyto nelineárnı́ členy a zavedeme-li je na vstup u, zı́skáme lineárnı́ systém, který mezi novým vstupem v a výstupem ỹ = z1 má dva sériově zapojené integračnı́ členy. Tı́m jsme vyřešili problém linearizace a můžeme přistoupit k řı́zenı́. Pro jednoduchost budeme uvažovat pouze stabilizaci do rovnovážného stavu. Pro zı́skaný lineárnı́ systém je vhodné navrhnout stavový regulátor v = −k1 z1 − k2 z2 = −k1 x1 − k2 x2 + k2 sin x1 , (15.19) takže v původnı́ch souřadnicı́ch je řı́zenı́ u dáno vztahem u = −k1 x1 − k2 x2 + k2 sin x1 + x2 cos x1 − sin x1 cos x1 . (15.20) Touto volbou jsou kompenzovány nelinearity původnı́ho systému a volbou konstant k1 , k2 lze nastavit vhodnou dynamiku. Přı́klad 15.4. Je dán systém ẋ1 = x2 − sin x1 ẋ2 = x2 cos x1 + u y = x1 (15.21) Proved’me linearizaci systému na ekvivalentnı́ systém ż1 = z2 ż2 = v ỹ = z1 . (15.22) stejným postupem jako v předchozı́m přı́kladě. Porovnánı́m derivacı́ výstypu zı́skáme pro vstup ekvivalentnı́ho lineárnı́ho systému vztah u = v − sin x1 cos x1 . (15.23) Je patrno, že zpětnovazebnı́ linearizace je jednoduššı́ než v předchozı́m přı́kladu, i když zadaný systém má dvě nelinearity. Je to ovšem dáno speciálnı́m tvarem těchto nelinearit, jak je ještě lépe vidět z následujı́cı́ho přı́kladu. Přı́klad 15.5. Je dán systém ẋ1 = x2 − sin x1 ẋ2 = x2 cos x1 − sin x1 cos x1 + u y = x1 (15.24) Porovnánı́m derivacı́ výstupů daného systému a lineárnı́ ekvivalence podle (15.21) zı́skáme u = v. Nenı́ tedy třeba žádná nelineárnı́ zpětná vazba, zadaný systém je ekvivalentnı́ lineárnı́mu systému s dvěma integrátory pouhou transformacı́ souřadnic z1 = x1 a z2 = x2 − sin x1 . KAPITOLA 15. EXAKTNÍ LINEARIZACE 144 Přı́klad 15.6. Je zadán systém ẋ1 = −2x1 + ax2 + sin x1 ẋ2 = −x2 cos x1 + u cos 2x1 y = x1 , který chceme linearizovat na ekvivalentnı́ systém ż1 = z2 ż2 = v ỹ = z1 . (15.25) Derivujeme-li výstupy, dostaneme vztahy y ẏ ÿ = = = = x1 ẋ1 = −2x1 + ax2 + sin x1 −2ẋ1 + aẋ2 + cos x1 .ẋ1 4x1 − 2ax2 − 2 sin x1 + au cos 2x1 − 2x1 cos x1 + sin x1 cos x1 ỹ ỹ˙ ỹ¨ = z1 = ż1 = z2 = −2x1 + ax2 + sin x1 = ż2 = v. Porovnánı́m derivacı́ výstupů zı́skáme transformačnı́ vztahy z2 = −2x1 + ax2 + sin x1 z1 = x1 a pro u vztah 1 (v − 4x1 + 2ax2 + 2 sin x1 + 2x1 cos x1 − sin x1 cos x1 ). (15.26) a cos 2x1 Je patrno, že v tomto přı́padě je linearizace dosaženo nelineárnı́ zpětnou vazbou a nelineárnı́m členem v přı́mé větvi 1/(a cos 2x1 ). Oba členy potřebné k linearizaci lze odvodit od původnı́ho stavu x daného systému. u= b) Lineárnı́ reprezentace ve tvaru obecného stabilnı́ho systému I když se nejčastěji použı́vá lineárnı́ reprezentace ve tvaru sériového zapojenı́ integrátorů, je někdy výhodná jiná reprezentace, jak je patrno z dalšı́ho přı́kladu. Přı́klad 15.7. Je zadán systém ẋ1 = x2 − 2x1 ẋ2 = x3 − x32 ẋ3 = −x3 + u y = x1 , (15.27) který chceme převést vhodnými transformacemi a vazbami na lineárnı́ systém se třemi jednokapacitnı́mi členy ż1 = z2 − 2z1 ż2 = z3 − z2 ż3 = −z3 + v ỹ = z1 . (15.28) Derivovánı́m výstupů dostaneme soustavy ẏ = ẋ1 = x2 − 2x1 y = x1 ÿ = −2x2 + 4x1 + x3 − x32 y (3) = −8x1 + 4x2 − 3x3 + u + x22 (2x2 − 3x3 + 3x32 ) a ỹ = z1 ỹ˙ = −2z1 + z2 ỹ¨ = 4z1 − 3z2 + z3 ỹ (3) = −8z1 + 7z2 − 4z3 + v. Porovnánı́m výstupů dostaneme transformačnı́ vztahy z = T (x) z1 = x1 z2 = x2 z3 = x2 + x3 − x32 a vztah pro u u = −x2 − x3 + 2x32 + 3x22 (x3 − x32 ) + v. Řı́zenı́ můžeme zase provést např. stavovým regulátorem pomocı́ pevných zpětných vazeb od nových stavů z. Protože je ale nynı́ ekvivalentnı́ lineárnı́ systém stabilnı́, je možno použı́t pro regulaci i jednoduchou zpětnou KAPITOLA 15. EXAKTNÍ LINEARIZACE 145 Obrázek 15.2: Linearizovaný systém a jeho řı́zenı́ vazbu od výstupu, např. integračnı́ regulátor pro zajištěnı́ nulové trvalé regulačnı́ odchylky. Tento integračnı́ prvek můžeme také realizovat přı́mo tak, že zvolı́me ekvivalentnı́ lineárnı́ systém ve tvaru integrál plus dva jednokapacitnı́ členy v sérii. Je patrno, že převod nelineárnı́ho systému na obecný lineárnı́ ekvivalentnı́ systém rozšiřuje různé varianty řı́zenı́. Z uvedených přı́kladů je patrno, že linearizaci daného systému (15.13) a tedy jeho převedenı́ na ekvivalentnı́ lineárnı́ systém (15.14) lze provést volbou u = α(x) + β(x)v, (15.29) kde v je nový vstup. Řı́zenı́ linearizovaného systému lze pak navrhnout pomocı́ některé vhodné metody, kterou známe z teorie lineárnı́ch systémů. Použijeme-li např. regulátor odvozený od stavu systému, potřebujeme nové stavy z = T (x). Ty jsou však zcela vyjı́mečně měřitelné na původnı́m systému a je třeba je zkonstruovat ze stavových veličin x (často pomocı́ počı́tače). Výsledné schema linearizovaného systému a jeho řı́zenı́ stavovým regulátorem je zakresleno na obr. 15.2. Z dosud uvedených přı́kladů je vidět, že zpětnovazebnı́ linearizace je podstatně odlišná od linearizace pomocı́ Taylorova rozvoje kolem pracovnı́ho nebo rovnovážného stavu, která platı́ jen v malé oblasti kolem tohoto stavu. Zpětnovazebnı́ linearizace může linearizovat daný systém bud’ globálně, tj. v celém stavovém prostoru nebo jen v určité oblasti. Např. z výsledků přı́kladu 15.6 je vidět, že linearizace nenı́ globálnı́, protože řı́zenı́ nenı́ definováno, jestliže x1 = (π/4 ± kπ/2), k = 1, 2... Bude-li počátečnı́ stav v těchto singulárnı́ch bodech, nemůže regulátor převést systém do rovnovážného stavu (0, 0). Z uvedených jednoduchých přı́kladů je také patrno, že jsme linearizace prováděli dosud značně intuitivně, bez vymezenı́ přesných podmı́nek a za značně zjednodušených předpokladů. Přesněji budeme úlohu formulovat v dalšı́ch článcı́ch, kde se budeme zabývat otázkou, kdy lze nelineárnı́ systém transformovat na systém lineárnı́ a jak nalézt vhodné transformace a zpětné vazby. K těmto účelům musı́me zavést některé nové matematické pojmy a definice. 15.2 Matematické prostředky pro zpětnovazebnı́ linearizace Definice 15.1. Lieova derivace. Je dána hladká skalárnı́ funkce h : Rn → R a hladké vektorové pole f : Rn → Rn . Pak Lieova derivace Lf h skalárnı́ho pole h vzhledem k vektorovému poli f je skalárnı́ funkce definovaná vztahem Lf h = ∇h.f = ∂h ∂h ∂h , ..., f (x) = f (x), ∂x1 ∂xn ∂x KAPITOLA 15. EXAKTNÍ LINEARIZACE 146 kde ∇h je gradient funkce h (řádkový vektor). Lieova derivace je směrová derivace skalárnı́ho pole h ve směru vektoru f . Rekursivně lze definovat vyššı́ derivace Lf2 h = Lf (Lf h) = ∇(Lf h).f Lf0 h = h Lfi h = Lf (Lfi−1 h) = ∇(Lfi−1 ).f Je-li g jiné vektorové pole, pak Lg Lf h = ∇(Lf h)g Pro nebuzený dynamický systém ẋ = f (x), y = h(x), jsou derivace výstupu ẏ = ÿ = ∂h ∂h ẋ = f (x) = Lf h ∂x ∂x ∂[Lf h] ∂[Lf h] ẋ = f (x) = Lf 2 h. ∂x ∂x Definice 15.2. Lieova závorka (derivace vektorového pole vzhledem k vektorovému poli). Necht’ f a g jsou dvě vektorová pole na Rn . Lieova závorka polı́ f a g je třetı́ vektorové pole definované vztahem ∂f ∂g f− g, [f , g] = (∇g)f − (∇f )g = ∂x ∂x kde ∂f /∂x, ∂g/∂x jsou Jacobiovy matice, např. ∂f = ∂x ∂f1 ∂x1 ... ∂fn ∂x1 ∂f1 ∂x2 ... ∂fn ∂x2 ... ... ... ∂f1 ∂xn ... ∂fn ∂xn Často použı́vaný způsob zápisu Lieovy závorky je [f , g] = adf g. Rekursivnı́ vztahy lze pak psát ve zjednodušených tvarech adf 0 g = g adf 1 g = adf g = [f , g] adf 2 g = [f , [f , g]] = [f , adf g] obecně adf i g = [f , adf i−1 g]. Pro Lieovy závorky platı́: a) bilinearita [α1 f 1 + α2 f 2 , g] = α1 [f 1 , g] + α2 [f 2 , g] [f , α1 g 1 + α2 g 2 ] = α1 [f , g 1 ] + α2 [f , g 2 ], kde f , f 1 , f 2 , g, g 1 , g 2 jsou hladká vektorová pole a α1 a α2 jsou konstantnı́ skaláry; b) antikomutativnost [f , g] = −[g, f ] c) Jacobiova identita L[f ,g ] h = Lf Lg h − Lg Lf h, kde h(x) je hladká skalárnı́ funkce x. KAPITOLA 15. EXAKTNÍ LINEARIZACE 147 Definice 15.3. Distribuce. Uvažujme množinu {f 1 , f 2 , ..., f m } vektorových polı́ na Rn , m < n. Je-li pro každé x ∈ Rn m vektorů f 1 (x), ..., f m (x) lineárně nezávislých, řı́káme, že množina vektorových polı́ je m-dimenzionálnı́ distribuce D. Distribuce je involutivnı́ tehdy a jen tehdy, existujı́-li takové hladké skalárnı́ funkce γijk ,že [f i , f j ](x) = m X γijk (x)f k (x) 1 ≤ i, j ≤ m, i 6= j. k=1 Platı́-li vztah jen lokálně, pak distribuce je lokálně involutivnı́. Involutivita tedy znamená, že vytvořı́me-li Lieovu závorku z kterýchkoliv dvou polı́ množiny {f 1 , ..., f m }, pak výsledné vektorové pole lze vyjádřit jako lineárnı́ kombinaci původnı́ množiny vektorových polı́. Konstantnı́ vektorová pole jsou vždy involutivnı́. Lieova závorka dvou konstantnı́ch vektorů je vždy nulový vektor, který lze triviálně vyjádřit jako lineárnı́ kombinaci vektorových polı́. Definice 15.4. Množina lineárně nezávislých vektorových polı́ {f 1 , f 2 , ..., f m } na Rn je úplně integrovatelná tehdy a jen tehdy, existuje-li n−m skalárnı́ch funkcı́ h1 (x), h2 (x), ..., hn−m (x) vyhovujı́cı́ch soustavě parciálnı́ch diferenciálnı́ch rovnic ∇hi f j = 0, kde 1 ≤ i ≤ n−m, 1 ≤ j ≤ m, a gradienty ∇hi jsou lineárně nezávislé. Počet parciálnı́ch diferenciálnı́ch rovnic je m(n − m). Přı́klad 15.7. Pro n = 3 jsou dány skalárnı́ funkce fi (x1 , x2 , x3 ) a gi (x1 , x2 , x3 ) , i = 1, 2, 3. Těmito vektory f , g je jednoznačně definována soustava parciálnı́ch diferenciálnı́ch rovnic ∂h ∂h ∂h f1 + f2 + f3 = 0 ∂x1 ∂x2 ∂x3 ∂h ∂h ∂h g1 + g2 + g3 = 0. ∂x1 ∂x2 ∂x3 Existuje-li řešenı́ h(x1 , x2 , x3 ) uvedených rovnic, pak množina vektorových polı́ {f , g} je úplně integrovatelná. A priori ovšem nenı́ zřejmé, zda rovnice jsou řešitelné. Podmı́nku řešitelnosti udává Frobeniova věta. Věta 15.1. (Frobeniova). Množina lineárně nezávislých vektorových polı́ {f 1 , f 2 , ..., f m } je úplně integrovatelná tehdy a jen tehdy, jestliže je involutivnı́. Důkaz je podán např. v [36]. 15.3 Linearizace vstup-stav V tomto článku se budeme zabývat linearizacı́ vstup-stav u nelineárnı́ho afinnı́ho systému s jednı́m vstupem (bez výstupu) reprezentovaného stavovou rovnicı́ ẋ = f (x) + g(x)u, (15.30) kde f a g jsou hladká vektorová pole. V čl. 15.1 jsme na jednoduchých přı́kladech viděli, že exaktnı́ linearizaci lze vytvořit pomocı́ transformace stavů a nelineárnı́ přı́mé a zpětné vazby (obr. 15.2). Nynı́ se pokusı́me tyto jednoduché intuitivnı́ výsledky zobecnit. Nejprve budeme trochu detailněji definovat linearizaci vstup-stav. Definice 15.5. Afinnı́ nelineárnı́ systém s jednı́m vstupem ẋ = f (x) + g(x)u, kde f a g jsou hladká KAPITOLA 15. EXAKTNÍ LINEARIZACE 148 vektorová pole na Rn , je linearizovatelný ve smyslu vstup-stav, jestliže existuje oblast Ω v Rn , difeomorfismus T : Ω → Rn a taková nelineárnı́ vazba u = α(x) + β(x)v (15.31) že nové stavové proměnné z = T (x) a nový vstup v vytvářejı́ lineárnı́ t-invariantnı́ systém ż1 = z2 ż2 = z3 ... żn−1 = zn żn = v. (15.32) Linearizovaný systém je ve speciálnı́m kanonickém tvaru, který odpovı́dá sériovému zapojenı́ ideálnı́ch integračnı́ch členů. Nynı́ je třeba odpovědět na otázku, zda může být každý nelineárnı́ systém ve tvaru (15.30) převeden na ekvivalentnı́ lineárnı́ systém s novým vstupem v pomocı́ (lokálnı́) transformace z = T (x) a statické přı́mé a zpětné vazby u = α(x) + β(x)v. Věta 15.2. Nelineárnı́ systém (15.30) s hladkými vektorovými poli f (x) a g(x) je linearizovatelný ve smyslu vstup-stav tehdy a jen tehdy, existuje-li oblast Ω, v nı́ž platı́ podmı́nky: a) vektorová pole {g, adf g, ..., adn−1 g} jsou lineárně nezávislá v Ω f b) množina {g, adf g, ..., adn−2 g} je involutivnı́ v Ω. f Prvnı́ podmı́nku lze jednoduše interpretovat jako zobecněnou podmı́nku řiditelnosti pro nelineárnı́ systém (15.30). Pro lineárnı́ systém ẋ = Ax + bu se vektorová pole z podmı́nky a) změnı́ na [b, Ab, ..., An−1 b], což je známá podmı́nka řiditelnosti lineárnı́ho systému. Důkaz věty 15.2. Podejme poněkud zkrácený důkaz této věty, důkaz se všemi podrobnostmi lze nalézt např. v [49]. Ukažme nejprve nutnost podmı́nek věty 15.2. Předpokládejme, že existuje taková stavová transformace z = T (x) a vstupnı́ transformace u = α(x) + β(x)v, že z a v splňujı́ rovnice (15.32). Rozepsánı́m dostaneme ż1 = ∇T1 ẋ = ∂T1 (f + gu) = z2 = T2 . ∂x Podobně pro ostatnı́ složky platı́ ż2 = ∂T2 (f + gu) = T3 , ∂x ... żn = ∂Tn (f + gu) = v. ∂x To vede na množinu parciálnı́ch diferenciálnı́ch rovnic ∂T1 ∂T1 f+ gu = T2 ∂x ∂x ∂T2 ∂T2 f+ gu = T3 ∂x ∂x ∂Tn ∂Tn f+ gu = v. ∂x ∂x ... Složky T1 , ..., Tn jsou nezávislé na u, takže z předchozı́ch rovnic vyplývá Lg T1 = Lg T2 = ... = Lg Tn−1 = 0 Lf Ti = Ti+1 Lg Tn 6= 0 i = 1, 2, ..., n − 1. (15.33) (15.34) Všechny tyto vztahy platı́ pro všechna x ∈ Ω. Nynı́ ukážeme, že výše uvedená soustava parciálnı́ch diferenciálnı́ch rovnic pro Ti může být komprimována do množiny rovnic závislých jen na T1 . Na základě vlastnostı́ Lieových závorek je ∇T1 [f , g] = ∇(Lg T1 )f − ∇(Lf T1 )g = 0 − Lg T2 = 0. (15.35) S použitı́m tohoto výsledku můžeme indukcı́ ukázat, že ∇T1 adkf g = 0 k = 0, 1, 2, ..., n − 2 ∇T1 adn−1 g 6= 0. f (15.36) KAPITOLA 15. EXAKTNÍ LINEARIZACE 149 Z tohoto vztahu předevšı́m vyplývá, že vektorová pole g, adf g, ..., adfn−1 g musı́ být lineárně nezávislá. Proved’me důkaz sporem. Jesliže by pro nějaké i (i ≤ n − 1) existovaly skalárnı́ funkce α1 (x), ..., αi−1 (x) takové, že adif g = i−1 X αk adkf g k=0 platilo by adn−1 g= f n−2 X αk adkf g. k=n−i−1 Pak by muselo vzhledem k (15.36) platit ∇T1 adn−1 g= f n−2 X αk ∇T1 .adkf g = 0, k=n−i−1 což je ve sporu s (15.36). Ze vztahů (15.36) vyplývá také druhý výsledek: množina vektorových polı́ je involutivnı́. To je dáno Frobeniovou větou a existencı́ skalárnı́ funkce T1 , která vyhovuje n − 1 parciálnı́m diferenciálnı́m rovnicı́m ze vztahu (15.36). Nynı́ je možno ukázat, že dvě podmı́nky ve větě 15.2 jsou postačujı́cı́ pro linearizaci nelineárnı́ho systému (15.30) ve smyslu vstup-stav, tj. že je možno nalézt stavovou transformaci a vstupnı́ transformaci tak, aby platily rovnice (15.32). Jestliže je splněna podmı́nka involutivity, pak existuje nenulová skalárnı́ funkce T1 (x), která vyhovuje vztahům Lg T1 = Lad g T1 = ... = Ladn−2 g T1 = 0. (15.37) f f Dále lze ukázat, že tato množina parciálnı́ch diferenciálnı́ch rovnic je ekvivalentnı́ k množině rovnic Lg T1 = Lg Lf T1 = ... = Lg Lfn−2 T1 = 0. (15.38) Použijeme-li tedy transformaci T = [T1 , Lf T1 , ..., Lfn−1 T1 ]T jako novou množinu stavových proměnných, pak prvnı́ch n − 1 stavových rovnic je Ṫk = Tk+1 k = 1, ..., n − 1 (15.39) a poslednı́ stavová rovnice Ṫn = Lfn T1 + Lg Lfn−1 T1 u. (15.40) Dále lze ukázat, že při lineárnı́ nezávislosti vektorových polı́ {g, adf g, ..., adfn−1 g} a platnosti (15.37) je Lg Lfn−1 T1 6= 0 ∀ x ∈ Ω. (15.41) Zvolı́me-li řı́zenı́ u ve tvaru u=− 1 (Lfn T1 n−1 Lg Lf T1 + v), (15.42) pak poslednı́ stavová rovnice bude Ṫn = v, jak odpovı́dá žádanému tvaru v rovnici (15.32). Postup při návrhu linearizace vstup-stav Na základě předchozı́ věty a různých dı́lčı́ch výsledků zı́skaných při vedenı́ důkazu, můžeme při návrhu linearizace postupovat tı́mto způsobem: 1) Vypočteme pro zadaný systém (15.30) vektorová pole {g, adf g, ..., adn−1 g}. f KAPITOLA 15. EXAKTNÍ LINEARIZACE 150 2) Zjistı́me, jsou-li splněny podmı́nky řiditelnosti a involutivity. 3) Jsou-li splněny, nalezneme prvnı́ stav T1 z rovnic ∇T1 adif g = 0 ∇T1 adfn−1 g 6= 0. i = 1, 2, ..., n − 2 (15.43) 4) Vypočı́táme stavovou transformaci z = T (x) = [T1 Lf T1 ... Lfn−1 T1 ]T a vstupnı́ transformaci u = α(x) + β(x)v, kde α(x) = − Lfn T1 Lg Lfn−1 T1 β(x) = 1 Lg Lfn−1 T1 (15.44) Přı́klad 15.8. [52] Mechanický systém podle obr. 15.3 je vytvořen připojenı́m výstupnı́ho hřı́dele se zátěžı́ přes torznı́ pružinu ke hřı́deli hnacı́ho motoru. Systém lze popsat rovnicemi I ϕ¨1 + mgl sin ϕ1 + k(ϕ1 − ϕ2 ) = 0 J ϕ¨2 + k(ϕ2 − ϕ1 ) = u, kde J je moment setrvačnosti motoru, I je moment setrvačnosti ramena vzhledem k ose rotace, l vzdálenost výstupnı́ho hřı́dele od těžiště ramena, m hmotnost ramena, g gravitačnı́ zrychlenı́, k torznı́ konstanta pružiny, ϕ1 úhel natočenı́ výstupnı́ho hřı́dele (ramena), ϕ2 úhlová poloha hřı́dele motoru, u moment motoru. Zvolme stavový vektor x = [ϕ1 , ϕ˙1 , ϕ2 , ϕ˙2 ]T a označme mgl/I = a, k/I = b, 1/J = c a k/J = d. Pak ẋ1 = x2 ẋ2 = −a sin x1 − b(x1 − x3 ) ẋ3 = x4 ẋ4 = d(x1 − x3 ) + cu. Obrázek 15.3: Mechanický systém Jednoduchými výpočty určı́me matici řiditelnosti [g, adf g, ad2f g, ad3f g] = 0 0 0 −bc 0 0 bc 0 0 −c 0 dc c 0 −dc 0 Matice má hodnost 4 pro k > 0 a IJ < ∞. Dále je patrno, že vektorová pole {g, adf g, ad2f g} jsou konstantnı́ a tvořı́ proto involutivnı́ množinu. Daný systém je tedy linearizovatelný ve smyslu vstupstav. KAPITOLA 15. EXAKTNÍ LINEARIZACE 151 Dalšı́ postup spočı́vá v nalezenı́ vhodné stavové transformace z = T (x) a nelineárnı́ch vazeb u = α(x) + β(x)v. Podle (15.43) by prvnı́ složka T1 měla splňovat vztahy ∂T1 6= 0 ∂x1 ∂T1 =0 ∂x2 ∂T1 =0 ∂x3 ∂T1 =0 ∂x4 Je patrno, že T1 musı́ být pouze funkcı́ x1 . Nejjednoduššı́ volba je z1 = T1 = x1 . Nové stavové proměnné jsou pak z1 = T1 = x1 (15.45) ∂T1 f1 + ∂x1 ∂T2 f1 + = T3 = Lf T2 = ∂x1 ∂T3 = T4 = Lf T3 = f1 + ∂x1 z2 = T2 = Lf T1 = z3 z4 ∂T1 f2 = x2 ∂x2 ∂T2 f2 = −a sin x1 − bx1 + bx3 ∂x2 ∂T3 f3 = −ax2 cos x1 − bx2 + bx4 . ∂x3 (15.46) (15.47) (15.48) Podle vztahu (15.44) volı́me u = α(x) + β(x)v = − Lfn T1 1 + v n−1 n−1 Lg Lf T1 Lg Lf T1 Jednoduchými výpočty dostaneme výsledný vztah u= 1 (v − Lf4 T1 ), bc kde Lf4 T1 = a sin x1 (x22 + a cos x1 + b) + b(x1 − x3 )(b + d + a cos x1 ). Tato linearizace vstup-stav je globálnı́, protože difeomorfismus T (x) a vstupnı́ transformace jsou definovány všude. Pro linearizovaný systém můžeme nynı́ navrhnout vhodné řı́zenı́ pomocı́ známých metod lineárnı́ syntézy. 15.4 Linearizace vstup-výstup V tomto článku se budeme nejprve zabývat linearizacı́ nelineárnı́ho systému s jednı́m vstupem a jednı́m výstupem, který lze popsat afinnı́m vztahem ẋ = f (x) + g(x)u y = h(x), (15.49) Na rozdı́l od linearizace vstup-stav je zde definována výstupnı́ funkce y a cı́lem je vytvořit náhradnı́ lineárnı́ systém mezi výstupem y a novým vstupem v. Linearizace vstup-výstup je většinou jednodušeji realizovatelná než linearizace vstup-stav, v mnoha přı́padech však přinášı́ nové problémy např. s tzv. vnitřnı́ dynamikou (odst. 15.4.2). Princip linearizace vstup-výstup byl již ukázán na jednoduchých přı́kladech v čl. 15.1. Spočı́vá v opakovaném derivovánı́ výstupnı́ funkce y, které se provádı́ tak dlouho, až se objevı́ závislost na vstupnı́m signálu u. Prvnı́ derivace je ẏ = ∇h ẋ = ∇h(f + gu) = Lf h(x) + Lg h(x)u. Jestliže Lg h(x) 6= 0 pro všechna x v oblasti Ω, pak můžeme volit vstupnı́ transformaci u= 1 (−Lf h + v) Lg h KAPITOLA 15. EXAKTNÍ LINEARIZACE 152 a relace mezi výstupem a vstupem v bude ẏ = v. Jestliže Lg h(x) = 0 pro všechna x v oblasti, můžeme znovu derivovat ẏ a zı́skáme ÿ = Lf2 h(x) + Lg Lf h(x)u. Jestliže Lg Lf h(x) = 0, budeme derivovat dále, a to tak dlouho, než Lg Lfr−1 h(x) 6= 0. Pak je vstupnı́ transformace u= 1 (−Lfr h + v) Lg Lfr−1 h a vztah mezi vstupem a výstupem je y (r) = v. Počet derivacı́ potřebný k tomu, aby se objevila závislost na vstupnı́m signálu u udává relativnı́ stupeň systému. Tuto definici můžeme vyjádřit také pomocı́ Lieových derivacı́. Definice 15.6. Nelineárnı́ systém (15.49) s jednı́m vstupem a jednı́m výstupem má relativnı́ stupeň r v oblasti Ω, jestliže ∀x ∈ Ω je Lg Lfi h(x) = 0 Lg Lfr−1 h(x) 6= 0. ∀ i ≤ r − 1, (15.50) Lze dokázat, že u řiditelného systému řádu n lze provést nejvýše n derivacı́ jakéhokoliv výstupu, aby se ve vztahu objevil vstupnı́ signál u. To lze chápat i intuitivně. Kdyby bylo třeba vı́ce derivacı́, systém by měl řád vyššı́ než n; neobjevı́-li se při derivovánı́ výstupu vstup nikdy, systém nenı́ řiditelný. Relativnı́ stupeň r je tedy bud’ roven počtu stavů n nebo je menšı́. Jestliže je relativnı́ stupeň r systému roven počtu stavů n, pak linearizace vstup-výstup je současně linearizacı́ vstup-stav. Definice relativnı́ho stupně pro nelineárnı́ systém zcela odpovı́dá definici pro lineárnı́ systém ẋ = Ax + bu, y = cT x, u něhož vı́me, že relativnı́ stupeň r je rovněž menšı́ nebo roven řádu systému n. Provedeme-li operace uvedené v definici 15.6, pak u lineárnı́ho systému je relativnı́ stupeň nejmenšı́ celé čı́slo r takové, pro které platı́ cT Ak b = 0 k = 0, ..., r − 2 a cT Ar−1 b 6= 0. Toto čı́slo lze interpretovat jako rozdı́l mezi počtem pólů a počtem nul v přenosové funkci lineárnı́ho systému. Každý lineárnı́ systém, u něhož r < n, má nuly v přenosové funkci. Přı́klad 15.9. U mechanického systému z přı́kladu 15.8 definujme pomocnou výstupnı́ proměnnou y = x1 a řešme linearizaci systému jako problém linearizace vstup-výstup. Postupným derivovánı́m výstupu y zı́skáme vztahy y = x1 ẏ = ẋ1 = x2 ÿ = ẋ2 = −asinx1 − b(x1 − x3 ) y (3) = −ax2 cos x1 − bx2 + bx4 y (4) = ax22 sin x1 − a cos x1 [−a sin x1 − b(x1 − x3 )] + ba sin x1 + b(x1 − x3 ) + +bd(x1 − x3 ) + bcu = v Z poslednı́ rovnice vyplývá vztah pro řı́zenı́ u 1 1 v − [a sin x1 (x22 + a cos x1 + b) + b(x1 − x3 )(b + d + a cos x1 )], bc bc které odpovı́dá zı́skanému vztahu pro řı́zenı́ v přı́kladu 15.8, řešenı́ jsme ovšem tı́mto způsobem zı́skali mnohem snadněji. u= Dalšı́ jednoduché přı́klady pro přı́pad r = n jsme uvedli již v článku 15.1. KAPITOLA 15. EXAKTNÍ LINEARIZACE 15.4.1 153 Relativnı́ stupeň r < n. Normálnı́ formy. Jestliže r < n, lze nelineárnı́ systém transformovat na tzv. normálnı́ formu, kde pro část nových stavových proměnných z1 až zr zvolı́me jako v přı́padě r = n funkce [h, Lf h, ..., Lfr−1 h]. Dalšı́ n − r proměnné zr+1 , ..., zn zvolı́me tak, aby všechny proměnné zi , i = 1, ..., n byly vzájemně nezávislé. Dále je často možno vybrat Tr+1 (x), ..., Tn (x) takovým způsobem, aby Lg Ti (x) = 0, i = r + 1, ..., n pro všechna x ∈ Ω. Pak pro tato i je ∂Ti dzi = (f + gu) = Lf Ti (x) + Lg Ti (x)u = Lf Ti (x) = qi (z), dt ∂x dosadı́me-li x = T −1 (z) a označı́me-li qi (z) = Lf Ti (T −1 (z)) i = r + 1, ..., n. Stavový popis zadaného nelineárnı́ho systému je nynı́ v nových souřadnicı́ch z ve tvaru, který se nazývá normálnı́ forma ż1 = z2 ż2 = z3 ... żr+1 = qr+1 (z) żr−1 = zr ... żr = a(z) + b(z)u żn = qn (z) y = z1 . (15.51) (15.52) Označı́me-li prvnı́ch r souřadnic vektoru z vektorem ζ a souřadnice zr+1 , ..., zn vektorem η, lze normálnı́ formu zapsat ve tvaru ζ1 ζ2 . .. . d . . = dt ζr ζr−1 ζr a(ζ, η) + b(ζ, η)u η̇ = q(ζ, η) y = ζ1 , (15.53) kde ζ = [z1 , ..., zr ]T η = [zr+1 , ..., zn ]T . Prvnı́ch r rovnic je v řiditelném kanonickém tvaru, n − r zbylých rovnic neobsahuje vstup systému u. Poznámka: Někdy nenı́ snadné určit n − r funkcı́ Tr+1 (x), ..., Tn (x) tak, aby Lg Ti (x) = 0, protože to vyžaduje řešit n − r parciálnı́ch diferenciálnı́ch rovnic. Obvykle je jednoduššı́ zvolit tyto funkce pouze tak, aby Jacobiova matice pro T (x) byla regulárnı́ v žádaném bodě x, což je postačujı́cı́ podmı́nkou k definovánı́ transformace souřadnic. Prvnı́ část normálnı́ formy je pak stejná jako v předchozı́m přı́padě, druhá část, odpovı́dajı́cı́ rovnici (15.52) je dána vztahy żr+1 = qr+1 (z) + pr+1 (z)u, ... , żn = qn (z) + pn (z)u, (15.54) v nichž se také objevuje vstupnı́ signál u. Přı́klad 15.10. [52] Uvažujme nelineárnı́ systém ẋ1 = −x1 + ex2 u ẋ2 = x1 x2 + u ẋ3 = x2 y = h(x) = x3 Derivace výstupu jsou ẏ = x2 ÿ = ẋ2 = x1 x2 + u. Systém má relativnı́ stupeň r = 2 a pro převedenı́ do normálnı́ formy zvolı́me z1 = ζ1 = h(x) = x3 z2 = ζ2 = Lf h(x) = x2 . (15.55) KAPITOLA 15. EXAKTNÍ LINEARIZACE 154 Třetı́ funkce η(x) by měla vyhovovat vztahu Lg η = ∂η x2 ∂η e + = 0. ∂x1 ∂x2 Jedno řešenı́ této rovnice je např. z3 = η(x) = 1 + x1 − ex2 . Stavová transformace je z = [ζ1 , ζ2 , η]T a jejı́ Jacobiova matice je regulárnı́ pro jakékoliv x. Inverznı́ transformace je dána vztahy x1 = −1 + η + eζ2 x2 = ζ2 x3 = ζ1 . Stavová transformace je platná globálně. Dynamika systému je v nových souřadnicı́ch v normálnı́ formě ζ˙1 = ζ2 15.4.2 ζ˙2 = (−1 + η + eζ2 )ζ2 + u η̇ = (1 − η − eζ2 )(1 + ζ2 eζ2 ). Vnitřnı́ a nulová dynamika Pomocı́ linearizace vstup-výstup je dynamika nelineárnı́ho systému rozdělena na vnějšı́ část mezi vstupem a výstupem a na vnitřnı́ ”nepozorovatelnou” část, která tvořı́ tzv. vnitřnı́ dynamiku. Protože vnějšı́ část je ve tvaru řiditelné kanonické formy mezi vstupem v a výstupem y, je snadné řı́dit v tak, aby se výstup y choval žádaným způsobem. Otázka přitom je, zda také vnitřnı́ dynamika se bude chovat vhodným způsobem, např. zůstanou-li jejı́ stavy ohraničené nebo ne. Tato vnitřnı́ dynamika je dána poslednı́mi (n − r) rovnicemi η̇ = q(ζ, η) v normálnı́ formě a závisı́ tedy i na vnějšı́ dynamice. Pokud je druhá část normálnı́ formy dána vztahem (15.54), pak je vnitřnı́ dynamika závislá dokonce i na specifickém řı́dı́cı́m signálu. Je patrno, že určenı́ stability vnitřnı́ dynamiky bude u složitějšı́ch systémů velmi obtı́žné, protože tato dynamika je obecně nelineárnı́, neautonomnı́ a závisı́ i na dynamice vnějšı́ uzavřené smyčky. Někdy se podařı́ určit stabilitu pomocı́ Ljapunovových funkcı́, u složitějšı́ch systémů se však vhodná funkce většinou nenalezne. Přitom řı́zenı́ navržené pro vnějšı́ část je prakticky použitelné pouze v přı́padě, že vnitřnı́ dynamika je stabilnı́. V opačném přı́padě nikoliv, protože nestabilita vnitřnı́ dynamiky vyvolá nežádoucı́ jevy, např. rozkmitánı́ systému, vibrace mechanických členů apod. Efektivnost linearizace vstup-výstup závisı́ proto předevšı́m na stabilitě vnitřnı́ dynamiky. Vnitřnı́ dynamika lineárnı́ch systémů Abychom objasnili trochu podrobněji otázky vnitřnı́ dynamiky, všimněme si nejprve této problematiky u lineárnı́ch systémů. Uved’me pro ilustraci jednoduchý přı́klad. Přı́klad 15.11. Lineárnı́ systém ẋ1 = x2 ẋ2 = x3 ẋ3 = −a0 x1 − a1 x2 − a2 x3 + u y = b0 x1 + b1 x2 má přenos G(s) = b 1 s + b0 s3 + a2 s2 + a1 s + a0 Úkolem je navrhnout řı́zenı́ u tak, aby bylo dosaženo asymptotického sledovánı́. Je znám požadovaný průběh výstupu yw (t) a jeho derivace ẏw (t), ÿw (t). Podobně jako u nelineárnı́ho systému můžeme i zde převést zadaný systém na ekvivalentnı́ reprezentaci ve tvaru sériového zapojenı́ integrátorů mezi výstupem a vstupem. Budeme-li postupně derivovat výstup y, pak ẏ = b0 ẋ1 + b1 ẋ2 = b0 x2 + b1 x3 ÿ = b0 ẋ2 + b1 ẋ3 = b0 x3 + b1 (−a0 x1 − a1 x2 − a2 x3 + u). KAPITOLA 15. EXAKTNÍ LINEARIZACE 155 Protože v druhé derivaci se již objevı́ vstupnı́ signál, je relativnı́ stupeň systému r = 2. Je patrno, že je rovný rozdı́lu mezi počtem pólů a počtem nul přenosu G(s). Volı́me-li řı́zenı́ ve tvaru u = (a0 x1 + a1 x2 + a2 x3 − b0 1 x3 ) + (k1 e + k2 ė + ÿw ), b1 b1 kde odchylka e = yw − y, pak ÿ = k1 e + k2 ė + ÿw tj. ë + k2 ė + k1 e = 0. Zvolené řı́zenı́ u vede na exponenciálně stabilnı́ odchylku, jejı́ž dynamika je 2. řádu. Vnitřnı́ dynamika bude proto popsána rovnicı́ 1. řádu. Nakreslı́me-li blokové schéma zadaného systému, je patrno, že jako vnitřnı́ stavovou proměnnou můžeme volit x1 , protože y, ẏ, x1 vytvářejı́ novou množinu stavů (jsou svázány s původnı́mi proměnnými x1 , x2 , x3 jednoznačnou transformacı́). Mezi ẋ1 a výstupem platı́ vztah ẋ1 b1 + x1 b0 = y. Internı́ dynamika je tedy dána rovnicı́ b0 1 x1 = y. b1 b1 Protože y je ohraničené, závisı́ stabilita vnitřnı́ dynamiky na členu b0 /b1 , tj. na poloze nuly v přenosu G(s). Je-li zadaný systém s minimálnı́ fázı́, pak b0 /b1 > 0. Nula ležı́ tedy v levé polorovině a vnitřnı́ dynamika je stabilnı́. ẋ1 + Výsledek uvedeného přı́kladu lze zobecnit na toto tvrzenı́. Internı́ dynamika lineárnı́ho systému je stabilnı́, jestliže nuly přenosu ležı́ v levé polorovině, tj. je-li systém s minimálnı́ fázı́ (důkaz např. v [36]). Vnitřnı́ a nulová dynamika nelineárnı́ch systémů Rozšı́řenı́ koncepce nul na nelineárnı́ systémy nenı́ jednoduché. U lineárnı́ch systémů jsou nuly přenosu dány vlastnostmi systému, takže stabilita internı́ dynamiky nezávisı́ na vstupnı́ch signálech. U nelineárnı́ch systémů však stabilita vnitřnı́ dynamiky na konkrétnı́ch řı́dı́cı́ch vstupech záviset může. Určitou cestu k odstraněnı́ této nesnáze představuje tzv. ”nulová dynamika”, která umožňuje učinit některé závěry o stabilitě vnitřnı́ dynamiky. Definice 15.7. Nulová dynamika nelineárnı́ho systému (15.49) je speciálnı́ přı́pad vnitřnı́ dynamiky, kdy se přivádı́ takový vstupnı́ signál, při němž výstup y je identicky rovný nule pro všechna t. Podmı́nka y(t) = 0 ∀t znamená, že všechny časové derivace y musı́ být nulové. Protože y(t) = z1 (t), musı́ být ż1 (t) = ż2 (t) = ... = żr (t) = 0, tj. ζ(t) = 0 pro všechna t. Řı́zenı́ u(t) musı́ pak být řešenı́m rovnice a(0, η(t)) + b(0, η(t))u(t) = 0. (15.56) Řı́zenı́ u, které udržuje vektor ζ na nule, je tedy u∗ (t) = − a(0, η(t)) b(0, η(t)) (15.57) a závisı́ tedy pouze na vnitřnı́ch stavech η(t). Nulová dynamika systému v normálnı́ formě je dána rovnicemi ζ̇ = 0 η̇ = q(0, η) (15.58) Má-li být výstup y(t) roven nule pro všechna t, musı́ být počátečnı́ stav nastaven na ζ(0) = 0, počátečnı́ stav η(0) může být zvolen libovolně. Časové průběhy vnitřnı́ch stavů η(t) a řı́zenı́ u∗ závisejı́ pak na počátečnı́ch podmı́nkách η(0). Z pohledu diferenciálnı́ geometrie je patrno, že nulová dynamika systému je jeho dynamika, při které je pohyb omezen na r-dimenzionálnı́ hladkou varietu M ⊂ Rn definovanou vztahem M = {x | h(x) = Lf h(x) = ... = Lfr−1 h(x) = 0}. KAPITOLA 15. EXAKTNÍ LINEARIZACE 156 Aby se systém pohyboval pouze po této varietě, musı́ zde ležet počátečnı́ stav x(0) a ekvivalentnı́ vstup v musı́ být nulový. Nulová dynamika je vnitřnı́ vlastnostı́ nelineárnı́ho systému, která nezávisı́ na volbě řı́zenı́ a na požadované trajektorii. Zkoumánı́ stability nulové dynamiky je mnohem snažšı́ než studium stability vnitřnı́ dynamiky, protože nulová dynamika zahrnuje jen vnitřnı́ stavy, zatı́m co internı́ dynamika je svázána s externı́ dynamikou a žádanými trajektoriemi. Zjednodušenı́ vnitřnı́ dynamiky na nulovou dynamiku umožňuje učinit některé jednoduššı́ závěry týkajı́cı́ se stability vnitřnı́ dynamiky. Např. u stabilizačnı́ úlohy je možno ukázat, že lokálnı́ asymptotická stabilita nulové dynamiky je postačujı́cı́ pro lokálnı́ asymptotickou stabilitu vnitřnı́ dynamiky. Užitečné výsledky lze zı́skat také pro úlohy sledovánı́. Systém, jehož nulová dynamika je asymptoticky stabilnı́, se nazývá systém s minimálnı́ fázı́. Nulová dynamika nám tedy umožňuje rozšı́řit pojem minimálně fázový systém i na nelineárnı́ systémy. Přı́klad 15.11. Výsledky linearizace nelineárnı́ho systému z přı́kladu 15.10 můžeme doplnit o internı́ dynamiku, která je reprezentována rovnicı́ η̇ = (1 − η − eζ2 )(1 + ζ2 eζ2 ). Nulovou dynamiku dostaneme, položı́me-li ζ1 = 0 a ζ2 = 0. Pak η̇ = −η. Vstupnı́ signál, který vždy nuluje výstup je u∗ = −(−1 + η + eζ2 )ζ2 . 15.4.3 Návrh řı́zenı́ při stabilizaci a sledovánı́ Po linearizaci nelineárnı́ho systému ve smyslu vstup-výstup je třeba navrhnout vhodný stavový regulátor a pak zjistit, zda vnitřnı́ dynamika je stabilnı́. V dalšı́m si všimneme odděleně problémů stabilizace a sledovánı́. Lokálnı́ asymptotická stabilizace. Předpokládejme, že nelineárnı́ systém (15.49) má rovnovážný stav v počátku (může být stabilnı́ nebo nestabilnı́). Lze ukázat, že stavový regulátor navržený pro lineárnı́ vnějšı́ dynamiku může stabilizovat celý systém za předpokladu, že nulová dynamika je asymptoticky stabilnı́. Věta 15.3. Předpokládejme, že nelineárnı́ systém (15.49) má relativnı́ stupeň r a jeho nulová dynamika je lokálně asymptoticky stabilnı́. Necht’ d(s) = sr + αr−1 sr−1 + ... + α1 s + α0 (15.59) je Hurwitzův polynom (jeho kořeny ležı́ v levé komplexnı́ polorovině). Pak stavová zpětná vazba u(x) = 1 [−Lfr h(x) − αr−1 Lfr−1 h(x) − ... − α1 Lf h(x) − α0 h(x)] Lg Lfr−1 h(x) (15.60) vede na lokálně asymptoticky stabilnı́ uzavřený systém. (Důkaz lze nalézt např. v [52]). U problémů stabilizace nezáležı́ na výstupnı́ funkci a je proto možno formálně vybrat výstup y = h(x) tak, aby odpovı́dajı́cı́ nulová dynamika byla asymptoticky stabilnı́. Úloha sledovánı́. Stavový regulátor navržený podle věty 15.3 může být snadno rozšı́řen na úlohy sledovánı́, jestliže se žádaný průběh výstupu a jeho derivacı́ zavede do rovnice (15.60) pro stavové řı́zenı́. Podrobnosti tohoto řešenı́ lze nalézt např v [52]. KAPITOLA 15. EXAKTNÍ LINEARIZACE 15.4.4 157 Systémy s vı́ce vstupy a výstupy Všechny dosud uvedené koncepce a postupy lze rozšı́řit na systémy s vı́ce vstupy a výstupy. Uvažujme nelineárnı́ systém se stejným počtem vstupů a výstupů ve tvaru ẋ = f (x) + g 1 (x)u1 + ... + g m (x)um (15.61) y1 = h1 (x) (15.62) ... ym = hm (x), kde ui jsou řı́dı́cı́ vstupy a yi výstupy, f a g i jsou hladká vektorová pole a hj hladké skalárnı́ funkce. Ve vektorovém zápisu je dán systém rovnicemi ẋ = f (x) + G(x)u y = h(x). (15.63) Linearizace vstup-výstup vyžaduje zase derivovánı́ výstupů yj tak dlouho, až se ve výrazu objevı́ vstupnı́ signály. Pro prvnı́ derivaci dostaneme vztah ẏj = Lf hj + m X (Lg i hj )ui . (15.64) i=1 Jestliže je Lg i hj (x) = 0 pro všechna i, vstupy se v rovnici neobjevı́ a je třeba derivovat dále. Předpokládejme, že rj je nejmenšı́ celé čı́slo takové, že alespoň jeden ze vstupů se objevı́ v derivaci (r ) yj j , pak (rj ) r = Lf j hj + yj m X r −1 Lg i Lf j hj u j , (15.65) i=1 r −1 kde Lg i Lf j hj (x) 6= 0 alespoň pro jedno i a ∀ x ∈ Ω. Provedeme-li tento postup pro každý výstup yj , dostaneme m rovnic, které můžeme zapsat v kompaktnı́ formě (r ) u1 Lr1 h1 (x) y 1 f 1 ... + E(x) ... ... = (r ) Lfrm hm (x) um ym m (15.66) Lg 1 Lfr1 −1 h1 ... Lg m Lfr1 −1 h1 E(x) = ... ... ... rm −1 rm −1 Lg 1 Lf hm ... Lg m Lf hm (15.67) kde m × m matice E(x) je Jestliže matice E je regulárnı́ v oblasti Ω, pak vstupnı́ transformace v1 Lfr1 h1 (x) −1 −1 ... u = −E + E ... vm Lfrm hm (x) (15.68) uskutečňuje lineárnı́ vztah mezi výstupem y a novým vstupem v (r1 ) y1 = v1 ... (rm ) ym = vm . (15.69) Mezi výstupy a novými vstupy v jsou nynı́ nejen lineárnı́ závislosti, ale jsou odstraněny i interakce mezi původnı́mi vstupy a výstupy. To má výhodu v tom, že nynı́ lze uskutečnit řı́zenı́ jednotlivých subsystémů se vstupem vi a výstupem yi nezávisle na sobě pomocı́ metod pro systémy s jednı́m vstupem a jednı́m výstupem. KAPITOLA 15. EXAKTNÍ LINEARIZACE 158 Při uvedeném postupu jsme viděli, že existuje relativnı́ stupeň pro každý výstup, takže relativnı́ stupeň celého systému je definován m celými čı́sly (r1 , ..., rm ). Celkový relativnı́ stupeň systému je dán jejich součtem, r = r1 + ... + rm . Relativnı́ stupeň r < n. Normálnı́ formu lze pro systém (15.63) zı́skat stejným způsobem jako pro systém s jednı́m vstupem a jednı́m výstupem. Za souřadnice ζ i zvolı́me ζ11 = h1 (x) ζ21 = Lf h1 (x) ... ζr11 = Lfr1 −1 h1 (x) ... ζrmm = Lfrm −1 hm (x). ..... ζ1m = hm (x) ζ2m = Lf hm (x) Souřadnice ζij , (j = 1, ..., m; i = 1, ..., rj ) jsou nezávislé a mohou být použity jako dı́lčı́ množina nového stavového vektoru. Jeho doplněnı́ provedeme n−r funkcemi η 1 až η n−r (x), které jsou nezávislé navzájem i k souřadnicı́m dřı́ve vybraným. Na rozdı́l od přı́padu s jednı́m vstupem však už nenı́ možno zaručit, že ∀x ∈ Ω Lg i η k (x) = 0 1≤i≤m 1≤k ≤n−r pokud vektorová pole g 1 , ..., g m nejsou involutivnı́ v Ω. Stavové rovnice pro zbylých n − r souřadnic budou tedy závislé na vstupnı́m vektoru u. Rovnice systému (15.61) lze tedy transformovat do normálnı́ formy, kde externı́ dynamika je dána vztahy ζ̇1j = ζ2j ... ζ̇rjj = aj (ζ, η) + m X bij (ζ, η)ui j = 1, 2, ..., m (15.70) i=1 a r aj (ζ, η) = Lf j hj (x) r −1 bij (ζ, η) = Lg i Lf j hj (x). Internı́ dynamika je η̇ = q(ζ, η) + P (ζ, η)u qk (ζ, η) = Lf ηk (x) Pki (ζ, η) = Lg i ηk (x) pro k = 1, ..., n − r a i = 1, ..., m. Vnitřnı́ a nulová dynamika. Pro stabilitu řı́zeného systému je zase třeba studovat stabilitu vnitřnı́ dynamiky. Je možno rovněž definovat zjednodušený přı́pad této dynamiky, tj.nulovou dynamiku, kdy výstupy systému se udržujı́ na nulové hodnotě. Pak ζ(t) = 0 a řı́dı́cı́ vstupy je třeba vybrat tak, aby u(t) = −E −1 (0, η) a(0, η), kde η(t) je řešenı́ diferenciálnı́ rovnice η̇(t) = q(0, η) − P (0, η)E −1 (0, η) a(0, η) s libovolnou počátečnı́ podmı́nkou η(0). Dynamická zpětná vazba. Linearizaci vstup-výstup lze uskutečnit pouze tehdy, jestliže matice E je regulárnı́ v Ω. Tato podmı́nka je často nesplnitelná a E je singulárnı́. Pak je možno přidat dynamiku do regulátoru a vytvořit dynamickou zpětnou vazbu od stavů. Jiná metoda využı́vá možnosti odvodit novou množinu nominálnı́ch výstupů tak, aby výsledná matice E byla regulárnı́. Problematika exaktnı́ch linearizacı́ je v současné době předmětem mnoha výzkumných úkolů a publikacı́. Teoretické výsledky byly aplikovány v mnoha oborech, např. při řı́zenı́ elektrických motorů, robotů, letadel, chemických výrob apod. Podrobné rozpracovánı́ teoretických problémů exaktnı́ linearizace lze nalézt předevšı́m ve vynikajı́cı́ch textech [36] a [49]. Přehled problémů globálnı́ linearizace je uveden v [61]. Kapitola 16 Identifikace nelineárnı́ch systémů Identifikace systému, to je určenı́ jeho struktury, stavů a parametrů může být založena na matematicko–fyzikálnı́ analýze zkoumaného objektu, nebo na rozboru změřených vstupnı́ch a výstupnı́ch dat, což je tzv. experimentálnı́ identifikace. V této kapitole se stručně seznámı́me s problémy experimentálnı́ identifikace stavů, parametrů i struktury nelineárnı́ch systémů. Nejprve se budeme zabývat deterministickými metodami identifikace, které jsou založeny na deterministických modelech nelineárnı́ch systémů a neznámé parametry těchto modelů se hledajı́ minimalizacı́ chybových funkcı́ měřených a simulovaných dat. Uvidı́me, že tyto metody jsou sice principielně jednoduché, ale vyžadujı́ poměrně kvalitnı́ předběžné odhady, nebot’ minimalizačnı́ procedury jinak konvergujı́ do falešných lokálnı́ch extrémů a chyba odhadu je nezanedbatelně veliká. V dalšı́ch odstavcı́ch se budeme stručně věnovat stochastickým metodám identifikace. Proto je nutno nejprve se stručně zmı́nit o stochastických modelech nelineárnı́ch systémů. Jednotı́cı́ základ metod identifikace je Bayesův přı́stup k identifikaci. Aproximačnı́ metoda založená na předpokladu normality šumu procesu a šumu měřenı́ a linearizaci nelineárnı́ho systému podél průběžných odhadů se nazývá rozšı́řený Kalmanův filtr. Pro řı́zenı́ systému má největšı́ význam průběžná identifikace, při které se odhady průběžně zpřesňujı́ naměřenými daty. Jednorázová identifikace spočı́vá v rozboru celé množiny naměřených dat. ¯ Odhadu parametrů při jednorázové identifikaci budeme řı́kat interpolace. Pokud známe několik možných alternativnı́ch struktur modelů identifikovaného objektu (až na konečný počet neznámých parametrů), můžeme provést klasifikaci těchto modelů. Klasifikace modelů spočı́vá v nalezenı́ jejich pravděpodobnosti podmı́něné změřenými daty. O tomto přı́stupu pojednáme v závěrečném odstavci této kapitoly. Protože řı́zenı́ systému i sběr dat se nynı́ realizuje téměř výhradně čı́slicovou technikou, tedy diskrétně, budeme se převážně věnovat systémům diskrétnı́m. V této kapitole uvedeme pouze některé metody. Výběr metod je podřı́zen rozsahu skripta a autorovou zkušenostı́. 16.1 Obecné úvahy Při následujı́cı́ch obecných úvahách o identifikaci nelineárnı́ch systémů vycházı́me z [76]. Základnı́ problém identifikace systému je nalezenı́ vhodné struktury modelu, to je určenı́ třı́dy modelů v nı́ž jsme schopni nalézt vyhovujı́cı́ model. Naladěnı́ modelu v dané struktuře spočı́vá obvykle v odhadu jeho neznámých parametrů, což je již jednoduššı́ problém. Základnı́m pravidlem je neodhadovat to, co již známe. Je tedy třeba využı́t veškerou apriornı́ informaci a znalosti o zkoumaném objektu. Rozlišujeme tři úrovně apriornı́ch znalostı́, které jsou pro 159 KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 160 názornost označeny ”barvami”. • Modely systému jako bı́lé skřı́ňky (white–box models). V tomto přı́padě je model úplně známý, je konstruován na základě apriornı́ch znalostı́ o objektu. To je přı́pad již zmı́něné matematicko–fyzikálnı́ analýzy zkoumaného objektu. • Modely šedé skřı́ňky (grey–box models): Máme pouze částečnou apriornı́ znalost a řada parametrů musı́ být určena z pozorovaných dat. Při tom můžeme rozlišit dva přı́pady. – Fyzikálnı́ modelovánı́. Struktura modelu je určena na základě fyzikálnı́ch znalostı́ o objektu a z dat určujeme pouze neznámé prametry modelu. – Částečné fyzikálnı́ modelovánı́. Naše znalosti o objektu vedou na určenı́ nelineárnı́ kombinace měřených dat. Tyto nové signály jsou potom využity ve struktuře modelu jako černé skřı́ňky. • Modely černé skřı́ňky (black–box models): Zde nemáme žádnou apriornı́ znalost o zkoumaném objektu. Je třeba zvolit takové třı́dy modelů, které jsou známé a které byly úspěšně využity v dřı́vějšı́ch aplikacı́ch. Lineárnı́ modely typu černé skřı́ňky vlastně spočı́vajı́ v popisu či aproximaci frekvenčnı́ch či časových charakteristik systému. Pro diskrétnı́ systém označı́me pozorované vstupy a výstupy u(k) resp. y(k) a šum e(k). Zavedeme operátor zpožděnı́ d (pak y(k − 1) = dy(k)). Polynom a(d) = a0 + a1 d + . . . + an dn použijeme k zápisu lineárnı́ kombinace zpožděných signálů, pak a(d)y(k) = a0 y(k) + a1 y(k − 1) + . . . + an y(k − n). Potom obecná třı́da lineárnı́ch diskrétnı́ch modelů je vyjádřena a(d)y(k) = b(d) c(d) u(k) + e(k) f (d) h(d) (16.1) Specielnı́ přı́pady jsou: při a(d) = 1 dostaneme tzv. Box–Jenkinsův model, při f (d) = h(d) = 1 zı́skáme tzv.ARMAX model (AutoRegressive model with Mowing Average and eXternal signal), při a(d) = c(d) = h(d) = 1 dostaneme model s chybou výstupu (output–error model) a při f (d) = c(d) = h(d) = 1 dostaneme tzv. ARX model. Nelineárnı́ modely černé skřı́ňky jsou mnohem komplikovanějšı́. Obecný nelineárnı́ model černé skřı́ňky je určen sjednocenı́m dvou zobrazenı́. Prvnı́ je zobrazenı́ minulých dat, jejichž množstvı́ v čase stále roste, na tak zvaný regresnı́ prostor konečné dimenze a druhé je zobrazenı́ z regresnı́ho prostoru na výstup systému. Problém identifikace nelineárnı́ho systému je následujı́cı́: Pozorujeme vstupy u(k) a výstupy y(k) na zkoumaném objektu uk = [u(k), u(k − 1), . . . , u(1)] y k = [y(k), y(k − 1), . . . , y(1)] a hledáme vztah mezi minulými pozorovánı́mi (daty) Dk−1 = [uk−1 , y k−1 ] a budoucı́m výstupem y(k) y(k) = g(uk−1 , y k−1 ) + v(k). (16.2) Aditivnı́ člen v(k) respektuje tu skutečnost, že výstup y(k) nenı́ přesnou funkcı́ minulých dat Dk−1 . Cı́lem je, aby chyba v(k) byla co nejmenšı́. Potom g(uk−1 , y k−1 ) je dobrou predikcı́ výstupu y(k) na základě minulých dat. Tuto predikci značı́me ŷ(k) = g(uk−1 , y k−1 ). KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 161 Problém je volba funkce g(.). Obvykle ji hledáme ve třı́dě funkcı́, které jsou parametrizovány konečněrozměrným vektorem parametrů θ, pak g = g(uk−1 , y k−1 , θ) (16.3) Tato parametrizace je většinou pouze přibližná. Pokud zvolı́me strukturu, pak nejvhodnějšı́ parametry nalezneme z dat minimalizacı́ rozdı́lu mezi modelem a změřenými daty θ ∗ = arg min θ k=N X ||y(k) − g(uk−1 , y k−1 , θ)||2 (16.4) k=1 Předchozı́ model g(uk−1 , y k−1 , θ) je přı́liš obecný. Proto, jak již bylo řečeno, g(.) vyjadřujeme jako sjednocenı́ dvou zobrazenı́. Jedno rostoucı́ množinu dat Dk zobrazı́ do konečněrozměrného vektoru ϕ(k) zvaného regresnı́ vektor a druhé zobrazı́ tento regresnı́ vektor na výstup. Pak g(uk−1 , y k−1 , θ) = g(ϕ(k), θ) kde ϕ(k) = ϕ(uk−1 , y k−1 ) Při tom tento regresnı́ vektor často opět parametrizujeme. Nelineárnı́ zobrazenı́ (16.3) se tedy dekomponuje do dvou problémů. Prvnı́m problémem je volba regresnı́ho vektoru ϕ(k) z minulých vstupů a výstupů a druhým problémem je volba nelineárnı́ho zobrazenı́ g(ϕ(k)) z regresnı́ho prostoru na výstup. Poznámka: Pro lineárnı́ model ve tvaru (16.1) je prediktor ve tvaru pseudolineárnı́ regrese ŷ(k|θ) = θ T ϕ(k, θ) Regresor, což jsou složky vektoru ϕ(k, θ), je pro ARX model tvořen pouze starými vstupy a výstupy u(k − i), y(k − i), pro i = 1, . . . , n. 2 U nelineárnı́ch systémů je regresor tvořen také starými vstupy a výstupy a také předchozı́mi výstupy z modelu ŷ(k−i|θ). Změřená data můžeme předzpracovat a užı́t filtrovaná data jako regresory. Nelineárnı́ zobrazenı́ g(ϕ(k), θ) z regresnı́ho prostoru na výstup je nejčastěji parametrizováno souborem funkcı́ X g(ϕ(k), θ) = αj gj (ϕ) kde gj (ϕ) jsou nějaké bázové funkce. Problémem je volba bázových funkcı́. Zde je celá řada možnostı́ od fourierových funkcı́, splinů, fuzzy modelů až k rekurentnı́m sı́tı́m. Pokud zvolı́me regresory ϕ(k, θ) a nelineárnı́ zobrazenı́ g(ϕ(k), θ) je problém identifikace nelineárnı́ho systému (nelineárnı́ho modelu černé skřı́ňky) převeden na odhad parametrů θ takového modelu. To je optimalizačnı́ úloha, která předpokládá vytvořenı́ kritéria optimalizace a volbu numerické metody řešenı́. Kritérium optimalizace je kvadratická nebo obecně nekvadratická norma chyby predikce. Každý ze zde uvedených kroků modelovánı́ systému jako černé skřı́ňky je složitý problém. Zde jsme pouze chtěli naznačit jednotlivé obecné kroky postupu při řešenı́ problému identifikace nelineárnı́ho dynamického systému. Uvažovali jsme zde pouze modely vnějšı́ho chovánı́ systému. Stavové modely bychom mohli zařadit do třı́dy modelů šedé skřı́ňky. Problémem je potom odhad stavů přı́padně parametrů v těchto stavových modelech. V dalšı́ch odstavcı́ch této kapitoly se budeme převážně věnovat těmto problémům. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 16.2 162 Deterministické modely a jejich identifikace Obecný nelineárnı́ spojitý systém je popsaný stavovými rovnicemi ẋ(t) = f (x(t), u(t), t) (16.5) y(t) = g (x(t), u(t), t) kde x(t) je stav systému v čase t, u(t) je vstup, y(t) je výstup systému a f (.) a g(.) jsou nelineárnı́ funkce svých argumentů. Obecný diskrétnı́ nelineárnı́ systém je popsaný stavovými rovnicemi x(k + 1) = f (x(k), u(k), k ) (16.6) y(k) = g (x(k), u(k), k ) které se formálně lišı́ pouze diskrétnı́m časem k. Předchozı́ stavové rovnice popisujı́ jednotným způsobem systémy jednorozměrové, což jsou systémy s jedinou vstupnı́ i výstupnı́ veličinou (systémy SISO - single input - single output) i systémy mnoharozměrové ( systémy MIMO - multiple input - multiple output). Mnoho nelineárnı́ch systémů je tvořeno statickou nelinearitou a dynamickým lineárnı́m modelem. Takové systémy modelujı́ mnoho reálných objektů. Podle toho, ve kterém mı́stě je umı́stěna statická nelinearita, mluvı́me o Hammersteinově nebo Wienerově modelu, přı́padně o jejich kombinaci. Hammersteinův model má statickou nelinearitu umı́stěnou na vstupnı́ straně systému. Tı́mto modelem můžeme popsat nelinearitu v akčnı́ch členech reálného objektu. Wienerův model má statickou nelinearitu umı́stěnou na výstupnı́ straně systému. Tı́mto modelem můžeme popsat nelinearitu čidel měřených veličin na reálném objektu. Kombinovaný Wiener - Hammersteinův model má statickou nelinearitu umı́stěnou uvnitř systému, to znamená, že je oddělena od vstupu i výstupu lineárnı́m dynamickým členem. Vlastnosti nelineárnı́ho systému jsou podstatně závislé na typu nelinearity. Rozlišuje se nelinearita kvadratická, obecně polynomiálnı́, nebo obecná nelinearita nespojitá na př. reléového typu. Určenı́ či volba struktury nelineárnı́ho systému je velmi důležitá i z hlediska identifikace nelineárnı́ho systému. Většinou pod identifikacı́ nelineárnı́ho systému si představujeme identifikaci stavů dynamického systému, nebo jeho parametrů, což jsou principielně shodné problémy. Struktura nelineárnı́ho systému musı́ být známá nebo je zvolena na základě znalostı́ reálného objektu. Existuje celá řada metod identifikace struktury nelineárnı́ch systémů - viz [66]. Obecně je možno o těchto metodách řı́cı́, že hodnotı́ a porovnávajı́ několik zvolených struktur nelineárnı́ch systémů a hodnotı́ jejich chyby odhadu výstupu. Při tom je třeba zamozřejmě odhadovat i zvolené parametry těchto alternativnı́ch modelů. Pokud máme několik alternativnı́ch struktur modelů, můžeme na základě dat vypočı́st jejich podmı́něnou pravděpodobnost, to je provést jejich klasifikaci. 16.2.1 Deterministické metody identifikace nelineárnı́ch systémů V tomto odstavci ukážeme, že identifikaci neznámých parametrů nelineárnı́ho systému na základě změřených hodnot vstupnı́ho a výstupnı́ho signálu je možno jednoduše převést na optimalizačnı́ problém. Na reálném objektu, který je předmětem identifikace provedeme měřenı́ vstupnı́ch a výstupnı́ch signálů. Volba vstupnı́ho signálu je velmi důležitá zvláště pro nelineárnı́ systém. Je zřejmé, že vstupnı́ signál musı́ být dostatečně frekvenčně bohatý abychom dobře mohli identifikovat dynamickou část systému. Amplituda vstupnı́ho signálu musı́ být dostatečná, abychom byli schopni identifikovat nelinearitu v systému. Protože neznáme počátečnı́ stav systému, je třeba experiment začı́t z nějakého KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 163 rovnovážného stavu - pak můžeme dosti dobře předpokládat, že stav na počátku experimentu je známý (na př. přibližně nulový). Máme tedy dostatečnou množinu vstupnı́ch a výstupnı́ch dat D1N D1N = {u(1), y(1), u(2), y(2), . . . , u(N ), y(N )} kde jsme indexem 1, N označili počátek a konec měřenı́. Pokud identifikujeme diskrétnı́ systém vše je v pořádku, pokud identifikujeme systém spojitý je třeba znát periodu vzorkovánı́ Ts . Čas spojitý a diskrétnı́ spolu souvisejı́ vztahem t = k Ts . Dále je třeba učinit nějaké předpoklady o průběhu vstupnı́ho signálu do spojitého systému. Často je měřicı́ experiment prováděn pomocı́ počı́tače a tak vstupnı́ signál je generován počı́tačem a přes analogo–čı́slicový převodnı́k je přiváděn na vstup identifikovaného objektu. Potom je vstupnı́ signál jednoznačně definován i mezi okamžiky vzorkovánı́. Nynı́ je třeba si vytvořit matematický model reálného objektu, jehož struktura je zvolena, model je tedy plně určen až na konečný počet neznámých parametrů θ, které jsou předmětem identifikace. Pro zvolené hodnoty neznámých parametrů můžeme vypočı́tat odezvu tohoto modelu na známý vstupnı́ signál, totožný se signálem, kterým jsme budili reálný neznámý objekt. Tı́m zı́skáme výstupnı́ posloupnost dat z modelu , která označı́me na př. y m (1), . . . , y m (N ). Je zřejmé, že budeme hledat takové parametry modelu, aby data zı́skaná na reálném objektu byla shodná s daty simulovanými na modelu. Zvolı́me si kritérium kvality na přı́klad ve tvaru J(θ) = N X (y(k) − y m (k, θ))T W k (y(k) − y m (k, θ)) (16.7) k=1 Kritérium může být libovolná nezáporná rostoucı́ funkce odchylky měřených a simulovaných dat. Zde jsme zvolili kvadratickou formu s pozitivně definitnı́ váhovou maticı́ W k , která může zohledňovat důležitost či přesnost jednotlivých dat. Nynı́ hledáme takové parametry θ ∗ , které minimalizujı́ zvolené kritérium θ ∗ = arg min J(θ) (16.8) θ Toto je problém statické optimalizace (úloha matematického programovánı́), který je možno řešit mnoha numerickými algoritmy. Volba numerické metody a podmı́nky na ukončenı́ iteracı́ je delikátnı́ problém, protože vždy je model pouze jistým přiblı́zenı́m k realitě. Z řady numerických optimalizačnı́ch metod připomeneme zde Levenbergerovu–Marquardtovu metodu nelineárnı́ch nejmenšı́ch čtverců. Nelinearity v modelu, zvláště nespojité mohou podstatným způsobem zhoršit či znemožnit konvergenci numerické metody. Proto je úplně podstatný počátečnı́ odhad parametrů, což závisı́ na apriornı́ch znalostech experimentátora o zkoumaném objektu. Byl vytvořen program na ověřenı́ této deterministické metody identifikace. Zı́skané zkušenosti ukazujı́, že shoda odezev systému a modelu může být dobrá a přesto nalezené parametry se mohou dosti lišit od parametrů skutečných. Kritérium kvality má řadu lokálnı́ch extrémů, které numerické metody nejsou schopny překonat. Nenı́ reálný předpoklad, že měřenı́ nejsou zatı́žena chybou. Simulace ukazujı́, že nepřesnosti měřenı́ ovlivňujı́ konvergenci metody a přesnost výsledků. Nynı́ uvedeme dva přı́klady na ilustraci uvedené metody. Přı́klad 1: Mějme spojitý nelineárnı́ systém popsaný stavovými rovnicemi ẋ1 (t) = θ1 sin(θ2 x1 (t)) + θ3 x1 (t) + θ4 cos(u(t)) ẋ2 (t) = θ5 x1 (t) y(t) = θ6 x2 (t) Skutečné parametry systému jsou θ= h −3 1 −5 1 1 1 i KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 164 Počátečnı́ odhad neznámých parametrů při startu minimalizačnı́ procedury byl θ= h −3.33 2.5 −4.6 1.4 0.5 1.4 i Počet vzorků odezvy byl N = 50. Po minimalizaci byl odhad parametrů roven θ= h −3.5 0.85 −5.5 0.92 0.91 1.2 i Rozdı́l v odezvě systému a identifikovaného modelu je zanedbatelný, přestože parametry nejsou odhadnuty přesně. Pokud měřený výstup zatı́žı́me chybou, kterou můžeme modelovat jako náhodný signál, je přesnost odhadu zhoršena i konvergence algoritmu je pomalejšı́. Přı́klad 2: Mějme diskrétnı́ nelineárnı́ systém popsaný stavovými rovnicemi x1 (k + 1) = θ1 x1 (k) + θ2 x2 (k) + θ3 u(k) x2 (k + 1) = θ4 x1 (k) + θ5 x2 (k) + θ6 u(k) y(t) = θ7 x1 (k) + sign (θ8 x2 (k)) + θ9 u(k) Skutečné parametry systému jsou θ= h 0.1 0.2 0.1 0.2 −0.1 0.2 1 3 0.5 i Počátečnı́ odhad neznámých parametrů při startu minimalizačnı́ procedury byl θ= h 0.06 0.13 0.12 0.2 −0.14 0.2 0.98 2.95 0.47 i Počet vzorků odezvy byl N = 200. Po minimalizaci byl odhad parametrů roven θ= h 0.08 0.2 0.084 0.21 −0.08 0.21 0.99 2.89 0.5 i Maximálnı́ chyba mezi měřeným a simulovaným výstupem je řádu 10−5 při vstupnı́m náhodném signálu velikosti řádově jednotky. Minimálnı́ hodnota minimalizovaného kritéria je J(θ ∗ ) = 4.4 × 10−8 . Při minimalizaci kritéria se osvědčilo volit konstantnı́ váhovou matici W k (při jediném výstupu se jedná o váhu Wk ) při prvnı́m běhu numerického algoritmu na minimalizaci kritéria a zı́skané výsledky dále zpřesnit novým během minimalizace s váhou rovnou absolutnı́ hodnotě maximálnı́ chyby v datech v přı́slušném čase. Simulace ukazujı́ na mnoho lokálnı́ch extrémů kritéria, které lze překonat pouze dobrým počátečnı́m odhadem hledaných parametrů. 16.3 Stochastické modely nelineárnı́ch systémů Statické nelineárnı́ modely Statický stochastický systém je obecně popsán podmı́něnou hustotou pravděpodobnosti p(y(t)|u(t), t) nebo p(y|u) pokud se jedná o systém časově invariantnı́. Nepodmı́něnou hustotu pravděpodobnosti výstupnı́ho vektoru dostaneme jednoduše jako marginálnı́ hustotu p(y) = Z p(y, u)du = Z p(y|u)p(u)du (16.9) Velmi často modelujeme stochastické systémy jako systémy deterministické, na které působı́ náhodné veličiny. Stochastický charakter takových systémů jim dodá generátor těchto náhodných veličin. Určenı́ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 165 stochastických vlastnostı́ výstupu je v tomto přı́padě vlastně problém transformace náhodných veličin nebo ve vı́cerozměrném přı́padě transformace náhodných vektorů. Statický systém je systém bez paměti u něhož vztah mezi vstupem u(t) a výstupem y(t) je popsán vztahem y(t) = g(u(t), t) (16.10) kde čas t je spojitý nebo diskrétnı́. Pokud je systém časově invariantnı́, transformace náhodného vstupnı́ho vektoru na vektor výstupnı́ nezávisı́ na čase a proto je možno všechny časové argumenty vypustit a stručně popisovat vztah mezi vstupem a výstupem vztahem y = g(u). Jednorozměrové systémy V jednorozměrovém přı́padě je situace přehledná. Pro určité y = y1 najdeme ze vztahu mezi vstupem a výstupem y = g(u) všechna ui pro která platı́ y1 = g(u1 ) = g(u2 ) = . . . = g(uj ). Neexistuje-li pro určité y1 řešenı́ u pro které y1 = g(u), pak p(y1 ) = 0. Pravděpodobnost Pr{y1 < y < y1 + dy}, že náhodná veličina y ležı́ ve ve zvoleném intervalu je rovna elementárnı́ ploše pod jejı́ hustotou pravděpodobnosti p(y1 )dy = Pr{y1 < y < y1 + dy} Protože ui jsou řešenı́ yi = g(ui ), pak současně platı́ p(y1 )dy = Pr{u1 < u < u1 + |du1 |; u2 < u < u2 + |du2 |; . . .} = p(u1 )|du1 | + p(u2 )|du2 | + . . . Uvědomme si, že přı́růstky dui nemusı́ být kladné, proto jsou přı́růstky brány v absolutnı́ hodnotě. Přı́růstky dui nalezneme ze vztahu dy = dg(ui ) = g 0 (ui )dui du Potom platı́ p(y1 )dy = p(u1 ) dy |g 0 (u 1 )| + p(u2 ) dy |g 0 (u 2 )| + ... Proto hustota pravděpodobnosti náhodné veličiny y v bodě y1 je rovna p(y1 ) = p(u1 ) p(u2 ) p(uj ) + 0 + ... + 0 0 |g (u1 )| |g (u2 )| |g (uj )| Pokud existuje jednoznačná inverznı́ funkce u = g −1 (y) k funkci g(y), pak platı́ následujı́cı́ obecný vztah pro hustotu pravděpodobnosti vstupnı́ náhodné veličiny py (y) = pu (g −1 (y)) 1 = pu (u) dg(u) du du dy u=g −1 (y) , (16.11) kde jsme indexy označili o jaké hustoty pravděpodobnosti se jedná. Střednı́ hodnota výstupu je dle definice µy = E{y} = Z ∞ g(u)p(u)du −∞ Je-li hustota pravděpodobnosti vstupu soustředěna kolem své střednı́ hodnoty µu (malý rozptyl vstupu), pak přibližně platı́ Z ∞ . µy = E{y} = g(µu ) p(u)du = g(µu ) (16.12) −∞ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 166 Také pro rozptyl výstupu můžeme odvodit přibližný vztah . σy2 = E{g(u)2 } − µ2u = E[g 0 (µu )]2 σu2 Přı́klad 3: Mějme lineárnı́ statický systém jehož výstup je roven y = au. Podle předchozı́ho vztahu je hustota pravděpodobnosti výstupu rovna py (y) = a1 pu ( ay ). Má-li náhodná veličina u normálnı́ rozdělenı́ u ∼ N (µ, σ 2 ), pak hustota pravděpodobnosti výstupu v bodě y = aµ je rovna py (aµ) = aµ 1 1 a pu ( a ) = a pu (µ). Odtud plyne, že náhodná veličina y má také normálnı́ rozdělenı́ se střednı́ hodnotou aµ a rozptylem a2 σ 2 . Nakreslete si průběh hustoty pravděpodobnosti výstupu pro konkrétnı́ hodnoty zesı́lenı́ a normálnı́ho rozdělenı́ vstupnı́ veličiny. Přı́klad 4: Odpor R je náhodná veličina s rovnoměrným rozdělenı́m v intervalu 90 ≤ R ≤ 110 Ω. Jaká je hustota pravděpodobnosti vodivosti G tohoto odporu. Hustota pravděpodobnosti náhodné veličiny R je p(R) = 1/20 na intervalu 90 ≤ R ≤ 110. Vodivost 1 je převrácená hodnota odporu G = . Jaká je tedy hustota pravděpodobnosti p(y) náhodné veličiny R a y = známe-li hustotu pravděpodobnosti p(u)? u Pro každé y má vztah y = a/u jediné řešenı́ u = a/y. Derivace g 0 (u) = −a/u2 = −y 2 /a. Proto hustota pravděpodobnosti p(y) náhodné veličiny y je rovna py (y) = |a| a pu ( ) 2 y y kde jsme indexy opět označili o jaké hustoty pravděpodobnoti se jedná. Pro náš přı́pad hustoty pravděpodobnosti vodivosti G při rovnoměrném rozloženı́ hustoty pravděpodobnosti jejı́ho odporu platı́ 1 1 1 1 1 1 pR ( ) = 2 pro ≤G≤ . 2 G G G 20 110 90 Průběh hustoty pravděpodobnosti odporu R a jeho vodivosti G je na obr. 16.1. pG (G) = Obrázek 16.1: Hustota pravděpodobnosti odporu R a vodivosti G Přı́klad 5: Necht’ výstup statického systému je roven y = a sin(u + θ), kde a > 0. Inverznı́ funkce je ui = arcsin( ay ) − θ. Derivace g 0 (ui ) = a cos(u + θ) = (a2 − y 2 )1/2 . Proto platı́ X 1 pu (ui ) py (y) = p 2 a − y2 i pro |y| < a, py (y) = 0 pro |y| > a. Pokud náhodná veličina u má rovnoměrné rozdělenı́ na intervalu (−π, π), pak je zřejmě p(u) = 1/2π na daném intervalu a vně tohoto intervalu je p(u) = 0. Funkce y = a sin(u + θ) má na daném intervalu dvě řešenı́ a proto py (y) = p 1 2 2 − y 2π a2 pro |y| < a, py (y) = 0 pro |y| > a KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 167 Průběh hustoty pravděpodobnosti náhodné veličiny u a y je na obr. 16.2. Obrázek 16.2: Hustota pravděpodobnosti náhodné veličiny u a y z přı́kladu 5. Mnoharozměrové statické systémy Nejprve budeme diskutovat systémy se dvěma vstupy a jednı́m výstupem. Jedná se potom o systém jehož výstup je určen vztahem y = g(u1 , u2 ). Pro určenı́ pravděpodobnostnı́ch charakteristik výstupu určı́me pro zvolenou hodnotu výstupu oblast U v rovině u1 , u2 pro kterou platı́ g(u1 , u2 ) < y. Distribučnı́ funkce Py (y) je potom určena jednoduše pravděpodobnostı́ Pr že výstup je menšı́ než zvolená hodnota y. Py (y) = Pr{(u1 , u2 ) ∈ U } = Z Z pu1,u2 (u1 , u2 )du1 du2 U (16.13) Hustotu pravděpodobnosti výstupu můžeme určit derivovánı́m předchozı́ho vztahu nebo podobně jako v předchozı́m jednorozměrovém přı́padě určenı́m oblasti ∆U v rovině u1 , u2 pro kterou platı́ y < g(u1 , u2 ) ≤ y+dy. Odtud pravděpodobnost, že výstup je v uvedeném intervalu je rovna elementárnı́ ploše Z Z py (y)dy = Pr{(u1 , u2 ) ∈ ∆U} = ∆U pu1,u2 (u1 , u2 )du1 du2 (16.14) Probereme nynı́ jako přı́klady několik specielnı́ch přı́padů. Přı́klad 6: Vztah mezi dvěma vstupy a jednı́m výstupem statického systému je určen vztahem y = u1 + u2 . V tomto přı́padě je distribučnı́ funkce výstupu rovna Py (y) = Z ∞ −∞ Z y−u2 −∞ pu1 ,u2 (u1 , u2 ) du1 du2 nebot’ pro dané y je u2 libovolné a u1 = y − u2 . Derivovánı́m předchozı́ho vztahu podle y dostaneme hustotu pravděpodobnosti výstupu py (y) = Z ∞ −∞ pu1 ,u2 (y − u2 , u2 ) du2 (16.15) Poznámka: Derivaci integrálu podle parametru provedeme podle Leibnitzova vzorce d dt Z b(t) f (t, τ )dτ = a(t) Z b(t) a(t) δf (t, τ ) d (b(t)) d (a(t)) dτ + f (t, b(t)) − f (t, a(t)) δt dt dt (16.16) 2 Pokud navı́c vstupnı́ náhodné veličiny jsou nezávislé, pak hustota pravděpodobnosti jejich součtu je rovna konvoluci jejich hustot py (y) = Z ∞ −∞ pu1 (y − u2 )pu2 (u2 ) du2 = Z ∞ −∞ pu1 (u1 )pu2 (y − u1 ) du1 (16.17) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 168 Pokud navı́c vstupnı́ veličiny nabývajı́ pouze nezáporné hodnoty je jejich součet také nezáporný a proto hustota pravděpodobnosti výstupu je rovna Z py (y) = y 0 a samozřejmě py (y) = 0 pu1 (y − u2 )pu2 (u2 ) du2 , pro y ≥ 0 pro y < 0. Přı́klad 7: Máme dva odpory které jsou zapojeny v serii. Odpor každého z nich je náhodná veličina s rovnoměrným rozdělenı́m v intervalu (80, 100) ohm. Celkový odpor seriové kombinace odporů je roven jejich součtu. Hustota pravděpodobnosti součtu je dána konvolucı́ dvou vzájemně nezávislých obdélnı́kových hustot jednotlivých odporů. Výsledkem konvoluce je trojúhelnı́kový průběh hustoty pravděpodobnosti součtu dvou odporů. Tato hustota je nenulová v intervalu (160, 200) - viz obr. 16.3. Obrázek 16.3: Hustota pravděpodobnosti odporů R1,2 a jejich součtu Rozmyslete si, jaké rozloženı́ hustoty pravděpodobnosti bude mı́t sériová kombinace třı́ a vı́ce odporů. Uvědomte si, jak se hustota pravděpodobnosti součtu několika odporů stále vı́ce blı́žı́ průběhu hustoty pravděpodobnosti normálnı́ho rozdělenı́. Přı́klad 8: Necht’ dva vlaky přijedou do určité stanice v časovém intervalu (0, T ). Doba jejich přı́jezdu je tedy náhodná veličina a obě náhodné veličiny necht’ jsou vzájemně nezávislé. Označı́me jako u1 a u2 časy přı́jezdu jednotlivých vlaků a necht’ y je časový interval mezi jejich přı́jezdem. Pak zřejmě platı́ y = |u1 − u2 | Nejprve určı́me hustotu náhodné veličiny z = u1 − u2 rovné rozdı́lu vstupů. Platı́ pz (z) = Z ∞ −∞ pu1 (z − u2 )pu2 (−u2 ) du2 , pro y ≥ 0 a hustota pravděpodobnosti náhodné veličiny z má trojúhelnı́kový průběh. Hustotu pravděpodobnosti výstupu y = |z|, která je nenulová pouze pro y ∈ (0, T ), dostaneme překlopenı́m záporné části hustoty veličiny z kolem osy y = 0, viz obr. 16.4. Obrázek 16.4: Hustota pravděpodobnosti náhodné veličiny u1,2 a y = |u1 − u2 | Ověřte, že střednı́ hodnota časového intervalu mezi přı́jezdy obou vlaků je rovna µy = T /3. Určete rozptyl této náhodné veličiny. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 169 Přı́klad 9: Necht’ nynı́ je výstup statického systému určen vztahem y = min(u1 , u2 ). Pro dané y je oblast U , pro kterou min(u1 , u2 ) ≤ y, určena zřejmě nerovnostı́ u1 ≤ y nebo u2 ≤ y. Nakreslete si v rovině u1 , u2 oblast bodů splňujı́cı́ch omezenı́ u1 ≤ y nebo u2 ≤ y. Odtud plyne vztah pro distribučnı́ funkci Py (y) Py (y) = Pu1 (y) + Pu2 (y) − Pu1 ,u2 (y, y) Pokud jsou náhodné veličiny u1 a u2 nezávislé, pak zřejmě Py (y) = Pu1 (y) + Pu2 (y) − Pu1 (y) Pu2 (y) Hustotu pravděpodobnosti výstupu dostaneme derivovánı́m předchozı́ho výrazu py (y) = pu1 (y) + pu2 (y) − pu1 (y) Pu2 (y) − pu2 (y) Pu1 (y) = pu1 (y) [1 − Pu2 (y)] + pu2 (y) [1 − Pu1 (y)] Přı́klad 10: Výstup statického systému je určen vztahem y = max(u1 , u2 ). Pro dané y je oblast U pro kterou max(u1 , u2 ) ≤ y určena zřejmě nerovnostı́ u1 ≤ y a u2 ≤ y. Nakreslete si opět v rovině u1 , u2 oblast bodů splňujı́cı́ch pro dané y omezenı́ u1 ≤ y a u2 ≤ y. Odtud plyne vztah pro distribučnı́ funkci Py (y) Py (y) = Pu1 ,u2 (y, y) Hustotu pravděpodobnosti výstupu dostaneme derivovánı́m předchozı́ho výrazu py (y) = dPu1 ,u2 (y, y) dPu1 ,u2 (y, y) + = du1 du2 Z y −∞ pu1 ,u2 (y, u2 )du2 + Z y −∞ pu1 ,u2 (u1 , y)du1 Pokud jsou náhodné veličiny u1 a u2 nezávislé, pak zřejmě Py (y) = Pu1 (y) Pu2 (y) py (y) = pu1 (y) Pu2 (y) + pu2 (y) Pu1 (y) Přı́klad 11: Předchozı́ vztahy můžeme použı́t při vyšetřovánı́ doby bezporuchového provozu dvou zařı́zenı́. Označme jako u1 a u2 náhodné veličiny, které jsou rovny době bezporuchového provozu dvou systémů S1 a S2 . Pravděpodobnost, že systém S1 se porouchá v čase t (za předpokladu, že začal pracovat v čase t = 0) je rovna distribučnı́ funkci Pu1 (t) náhodné veličiny u1 a podobně pro systém S2 . Necht’ složený systém S je tvořen subsystémy S1 a S2 . Označme jako y náhodnou veličinu, které je rovna době bezporuchového provozu složeného systému S. Nastane-li porucha složeného systému S tehdy, když alespoň v jednom subsystému nastane porucha, pak zřejmě náhodná veličina y je dána vztahem y = min(u1 , u2 ). To nastane na přı́klad tehdy, když subsystémy jsou zapojeny v serii. Nastane-li porucha složeného systému S tehdy, když v obou subsystémech nastane porucha, pak zřejmě náhodná veličina y je dána vztahem y = max(u1 , u2 ). To nastane na přı́klad tehdy, když subsystémy jsou zapojeny paralelně, to znamená, že zařı́zenı́ je schopno pracovat, když alespoň jeden systém je v bezporuchovém provozu. Systém S2 může být také použit jako záskok při poruše systému S1 . Potom doba bezporuchového provozu systému S tvořeného záskokovým zapojenı́m systémů S1 a S2 je rovna součtu bezporuchového provozu systémů S1 a S2 . Pak zřejmě náhodná veličina y je dána vztahem y = u1 + u2 . KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 170 Předpokládejme, že náhodné veličiny u1 a u2 jsou nezávislé a majı́ exponenciálnı́ rozdělenı́ pu1 (u1 ) = aeau1 , pu2 (u2 ) = bebu2 pro u1 > 0, u2 > 0. a pu1 (u1 ) = 0 pro u1 < 0 a pu2 (u2 ) = 0 pro u2 < 0 a navı́c a 6= b. Ověřte, že hustota pravděpodobnosti náhodné veličiny y při seriovém, paralelnı́m a záskokovém zapojenı́ subsystémů je po řadě rovna py (y) = (a + b)e(a+b)y py (y) = aeay + beby − (a + b)e(a+b)y ab ay py (y) = e − eby b−a Jaký je vztah pro hustotu pravděpodobnosti py (y) při záskokovém zapojenı́ subsystémů pokud a = b? 2 Pro obecný mnoharozměrový statický stochastický systém popsaný vztahem y = g(u) platı́ podobné vztahy. Omezı́me se na systémy se stejným počtem vstupů a výstupů u kterých existuje jednoznačná inverznı́ funkce u = g −1 (y). Pokud má systém menšı́ počet výstupů než vstupů, pak můžeme doplnit chybějı́cı́ počet výstupů některými vstupy (aby transformace byla jednoduchá). Marginálnı́ hustotu výstupu dostaneme vyintegrovánı́m uměle zavedených výstupů. Obráceně, pokud má systém vı́ce výstupů než vstupů, pak jej můžeme rozdělit na dva paralelnı́ systémy, které vyšetřujeme odděleně. Mějme tedy systém se stejným počtem vstupů a výstupů, kterých necht’ je m. Jednoznačná inverznı́ funkce existuje, pokud je pro každé y nenulový determinant Jakobiho matice (jakobián transformace g(y)). Jakobiho matice zobrazenı́ y = g(u) je rovna dg1 . . . , du m dg(u) = ..., ... ,... J= du dgm dgm du1 , . . . , dum dg1 du1 , (16.18) Abychom určili hustotu pravděpodobnosti p(y) výstupu systému ze známé vı́cerozměrové hustoty pravděpodobnosti vstupu p(u) a vlastnostı́ zobrazenı́ y = g(u), určı́me pro každé y inverznı́ funkci g −1 (y). Potom podle věty o substituci vypočteme vı́cerozměrnou hustotu pravděpodobnosti výstupu podle vztahu 1 py (y) = pu (g −1 (y)) (16.19) |det(J)| kde |det(J)| je absolutnı́ hodnota determinantu Jakobiho matice. Podobně určı́me globálnı́ charakteristiky výstupnı́ho vektoru. Vektor střednı́ch hodnot výstupu je roven Z µy = E{y} = ∞ g(u)p(u)du −∞ Kovariančnı́ matice výstupnı́ho vektoru je rovna cov(y) = P y = E{(y − E{y}) (y − E{y})T } Připomeňme, že v diagonále kovariančnı́ matice jsou rozptyly jednotlivých složek výstupu. Vzájemná kovariančnı́ matice mezi vstupnı́m a výstupnı́m vektorem je cov(y, u) = P y,u = E{(y − E{y}) (u − E{u})T } Uvedené vztahy použijeme při určovánı́ stochastických vlastnostı́ dynamických systémů. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 171 Diskrétnı́ dynamické nelineárnı́ systémy Stochastické diskrétnı́ dynamické systémy (systémy diskrétnı́ v čase ale spojité v úrovni všech veličin) jsou obecně popsány podmı́něnými hustotami pravděpodobnosti stavu a výstupu p(x(k + 1) | x(k), u(k)) (16.20) p(y(k) | x(k), u(k)), kde k je diskrétnı́ čas, x(k) je stav systému, u(k) je řı́zenı́ a y(k) je výstup systému. Prvnı́ podmı́něná hustota pravděpodobnosti popisuje stochastické vlastnosti vývoje stavu x(k) stochastického systému. Aby náhodný vektor x(k) byl stavem stochastického systému musı́ v sobě obsahovat veškerou informaci o minulém vývoji systému. Tuto t.zv. Markovovu vlastnost stavu můžeme vyjádřit vztahem p(x(k + 1)|x(k), x(k − 1), . . . , u(k), u(k − 1), . . .) = p(x(k + 1)|x(k), u(k)) Druhá podmı́něná hustota pravděpodobnosti v (16.20) popisuje stochastické vlastnosti výstupu systému, což často popisuje nepřesnosti měřicı́ch členů - čidel. Nelineárnı́ diskrétnı́ stochastický systém můžeme také popisovat stochastickou diferenčnı́ rovnicı́ x(k + 1) = f (x(k), u(k), v(k), k) (16.21) y(k) = g(x(k), u(k), e(k), k), kde náhodný vývoj stavu je reprezentovaný náhodným vektorem v(k) a náhodný vývoj výstupu je reprezentovaný náhodným vektorem e(k). Vývoj stavu a výstupu systému závisı́ na stochastických vlastnostech náhodných vektorů v(k) a e(k) a stochastických charakteristikách počátečnı́ho stavu x(0). Samozřejmě vývoj stavu ovlivňuje také řı́zenı́ u(k), které ale považujeme za deterministickou veličinu. Aby byla zachována Markovovská vlastnost stavu, musı́ platit p(v(k), v(k − 1), . . . , v(0), x(0)) = p(v(k)) p(v(k − 1)) . . . p(v(0)) p(x(0)) (16.22) To znamená, že náhodný proces v(k) musı́ tvořit posloupnost nezávislých náhodných vektorů. Stejná podmı́nka musı́ platit i pro náhodný proces e(k) a navı́c musı́ být náhodné procesy v(k) a e(k) vzájemně nezávislé. Také náhodný vektor x(0) musı́ být nezávislý na šumu procesu a šumu měřenı́. Řešenı́ stochastických diferenčnı́ch rovnic Řešenı́m diferenčnı́ rovnice stochastického diskrétnı́ho systému je náhodný proces x(k), který závisı́ na počátečnı́ podmı́nce x(0), řı́zenı́ u(k) na celém intervalu a samozřejmě na vlastnostech náhodného vektoru v(k). K úplné znalosti náhodného procesu x(k) je třeba znát libovolnou podmı́něnou konečněrozměrnou hustotu pravděpodobnosti p(x(k + 1), x(k), . . . , x(0)|u(k), u(k − 1), . . . , u(0)) Z Markovovy vlastnosti stavu plyne p(x(k + 1), x(k), . . . , x(0)|u(k), u(k − 1), . . . , u(0)) = p(x(k + 1)|x(k), u(k)) . . . p(x(1)|x(0), u(0)) p(x(0)) Zřejmě platı́ p(x(k + 1)|x(0)) = Z p(x(k + 1), x(i) | x(0))dx(i) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 172 a proto p(x(k + 1)|x(0)) = Z p(x(k + 1)|x(i))p(x(i)|x(0))dx(i), (16.23) kde 0 < i < k + 1. Tato rovnice se nazývá Chapman-Kolmogorovova rovnice. Určuje vývoj hustoty pravděpodobnosti stavu x(k + 1). Nepodmı́něnou hustotu pravděpodobnosti stavu x(k + 1) dostaneme jednoduše p(x(k + 1)) = Z p(x(k + 1)|x(0))p(x(0))dx(0) Je-li stochastický systém popsán stochastickou diferenčnı́ rovnicı́ (16.21), pak pro přenosovou hustotu pravděpodobnosti platı́ p(x(k + 1)|x(k), u(k) = pv (f −1 (x(k + 1), x(k), u(k)) , (k+1) det δx δ v (k) (16.24) (k+1) −1 je kde δx δ v (k) je Jakobián transformace mezi náhodným vektorem v(k) a vektorem x(k + 1) a f řešenı́ stochastické rovnice pro dané x(k + 1), x(k), u(k), pak v(k = f −1 (x(k + 1), x(k), u(k)) a pv je hustota pravděpodobnosti náhodného vektoru v(k). Poznámka: Pro častý přı́pad stochastické rovnice ve tvaru x(k + 1) = f (x(k), u(k), k) + v(k) (16.25) y(k) = g(x(k), u(k), k) + e(k), ve které šum procesu i měřenı́ vystupuje aditivně je Jakobián transformace roven jednotkové matici. Potom ve výrazu (16.24) pro přenosovou hustotu pravděpodobnosti je jmenovatel roven jedné. Je-li navı́c šum procesu v(k) posloupnost nezávislých vektorů (bı́lá posloupnost) s normálnı́m rozdělenı́m v(k) ∼ N (O; Q) je přenosová hustota pravděpobnosti také normálnı́ a je rovna p(x(k + 1)|x(k), u(k)) ∼ N (f (x(k), u(k), k); Q) (16.26) Také podmı́něná hustota pravděpodobnosti výstupu je normálnı́ se střednı́ hodnotou g(x(k), u(k), k) a kovariančnı́ matice výstupu je rovna kovariančnı́ matici šumu měřenı́. Poznámka: Pro stochastický lineárnı́ diskrétnı́ systém popsaný stavovou rovnicı́ x(k + 1) = Ax(k) + Bu(k) + F v(k) (16.27) y(k) = Cx(k) + Du(k) + He(k), kde šumy v(k), e(k) jsou nezávislé posloupnosti s normálnı́m rozdělenı́m v(k) ∼ N (O; Q) , e(k) ∼ N (O; R) jsou podmı́něné hustoty pravděpodobnosti také normálnı́, rovné p(x(k + 1)|x(k), u(k)) ∼ N (Ax(k) + Bu(k); F QF T ) (16.28) T p(y(k)|x(k), u(k)) ∼ N (Cx(k) + Du(k); HRH ) Poznámka: Stochastický nelineárnı́ diskrétnı́ systém popsaný stavovou rovnicı́ (16.25) můžeme linearizovat v nějakém pracovnı́m bodě x0 (k), u0 (k). Pak dostaneme linearizované stavové rovnice ve tvaru x(k + 1) = y(k) = df (x, u, k) df (x, u, k) x(k) + u(k) + v(k) dx du dg(x, u, k) dg(x, u, k) x(k) + u(k) + e(k), dx du (16.29) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 173 kde všechny derivace počı́táme v pracovnı́m bodě x0 (k), u0 (k). Potom pro tento linearizovaný systém můžeme podmı́něné hustoty pravděpodobnosti přibližně počı́tat podle vztahů uvedených v předchozı́ch dvou poznámkách. Poznámka: V některých přı́padech je stochastický nelineárnı́ diskrétnı́ systém popsaný stavovými rovnicemi v implicitnı́m tvaru x(k + 1) = F (x(k + 1), x(k), u(k)) + v(k) (16.30) Posunutý stav x(k + 1) se vyskytuje také na pravě straně stavové rovnice. Linearizaci této stavové rovnice provedeme opět v nějakém pracovnı́m bodě x0 (k + 1), x0 (k), u0 (k) dF (x(k + 1), x, u, k) x(k + 1) + dx(k + 1) dF (x(k + 1), x, u, k) dF (x(k + 1), x, u, k) x(k) + u(k) + v(k) dx(k) du(k) x(k + 1) = Po úpravě dostaneme linearizované rovnice ve tvaru dF (x(k + 1), x, u, k) −1 x(k + 1) = I − dx(k + 1) dF (x(k + 1), x, u, k) dF (x(k + 1), x, u, k) x(k) + u(k) + v(k) dx(k) du(k) kde všechny derivace opět počı́táme v pracovnı́m bodě x0 (k), u0 (k). Při tom předpokládáme, že inverznı́ matice v předchozı́m výrazu existuje. Uvědomme si, že linearizace a odstraněnı́ implicitnı́ho popisu je pouze přibližné, protože pro výpočet stavu v čase k + 1 musı́me v inverznı́ matici počı́tat derivaci dF /dx(k+1) v bodě x0 (k+1), který ještě neznáme. To lze přibližně odstranit pouze iteračnı́m výpočtem. 2 ’ Práce se stochastickými diskrétnı́mi systémy je poměrně jednoduchá, nebot na rozdı́l od spojitých stochastických systémů nenı́ třeba definovat derivaci a integrál stochastického procesu. Spojité dynamické nelineárnı́ systémy V tomto odstavci uvedeme stručně výsledky modelovánı́ a řešenı́ stochastických nelineárnı́ch systémů. Uvedené vztahy majı́ sloužit pouze jako uvedenı́ do složité problematiky analýzy vlastnostı́ spojitých stochastických systémů. Podrobnějšı́ rozbor této problematiky je možno nalézt v [20] a [37]. Stochastické spojité dynamické systémy jsou popsány Itovovou stochastickou diferenciálnı́ rovnicı́ dx(t) = f (x(t), u(t), t) dt + dw(t) (16.31) kde w(t) je tzv. Wienerův proces a dw(t) je přı́růstek tohoto procesu. Wienerův proces (nebo také Wiener–Lévyho proces) má normálnı́ rozdělenı́ s nulovou střednı́ hodnotou a má nezávislé a stacionárnı́ přı́růstky. Wienerův proces je formálně definován následujı́cı́mi vztahy: w(0) = O, E{w(t)} = O, ∀t > 0 T E{w(t)w(t) } = Q t. Wienerův proces matematicky popisuje Brownův pohyb. Realizace Wienerova procesu má zajı́mavé vlastnosti - je spojitá s pravděpodobnostı́ jedna a jejı́ derivace nikde neexistuje. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 174 Přı́růstek Wienerova procesu má nulovou střednı́ hodnotu, jeho kovariance je n E dw(t)dw(t)T o = Q dt a hodnoty přı́růstků v nepřekrývajı́cı́ch se časových intervalech jsou nezávislé. Rovnici (16.31) můžeme formálně zapsat ve tvaru ẋ(t) = f (x(t), u(t), t) + v(t), (16.32) kde náhodný proces v(t) je spojitý bı́lý šum s autokovariančnı́ matici cov {v(t1 ), v(t2 )} = Q δ(t1 − t2 ), (16.33) a δ(t) je Diracova funkce (Diracova distribuce). Popis stochastického systému podle (16.32) je třeba chápat pouze jako symbolickou analogii Itovovy stochastické diferenciálnı́ rovnice (16.31), nebot’ derivace dw(t) v(t) = dt Wienerova procesu w(t) neexistuje. Přesný popis spojitého stochastického systému je uveden v [20] nebo v [37]. Výstupnı́ rovnice spojitého stochastického systému se spojitým měřenı́m výstupu je y(t) = g (x(t), u(t), t) + e(t), (16.34) kde spojitý šum měřenı́ e(t) má nulovou střednı́ hodnotu a kovariančnı́ matici Res a je nekorelovaný se šumem procesu v(t). Index es znamená, že se jedná o šum spojitého měřicı́ho členu. Pokud uvažujeme diskrétnı́ měřenı́ výstupu, pak je výstupnı́ rovnice y(k) = g (x(k), u(k), k) + e(k) (16.35) kde diskrétnı́ čas k je svázán se spojitým časem t vztahem t = k T a T je perioda vzorkovánı́ (která nemusı́ být nutně konstantnı́). Diskrétnı́ bı́lý šum e(k) má nulovou střednı́ hodnotu a kovariančnı́ matici Red = T1 Res a je také nekorelovaný se šumem procesu v(t). Uvědomme si, že diskrétnı́ bı́lý π π šum má konstantnı́ spektrálnı́ hustotu na intervalu frekvencı́ ω ∈ − , a je to tedy bı́lý šum T T vzniklý vzorkovánı́m spojitého bı́lého šumu, který byl před vzorkovánı́m filtrován dolnofrekvenčnı́m filtrem s frekvenčnı́m rozsahem ve stejném frekvenčnı́m pásmu - viz věta o vzorkovánı́. Poznámka: Uvědomme si, že spojitý bı́lý šum e(t) je pouze matematickou abstrakcı́ a nenı́ fyzikálně realizovatelný. Spojitý bı́lý šum má frekvenčnı́ spektrum konstantnı́ na celém rozsahu frekvencı́ a takový signál by měl nekonečnou energii. Naproti tomu diskrétnı́ bı́lý šum e(k) s kovariančnı́ maticı́ E(e(k1 ) e(k2 )) = R δ(k1 −k2 ), kde δ(k) = 0 ∀k 6= 0, δ(0) = 1 je fyzikálně realizovatelný. Proto je potı́ž s diskretizacı́ nerealizovatelného spojitého bı́lého šumu. Je proto lepšı́ představit si, že spojitý i diskrétnı́ bı́lý šum modelujı́ nepřesnosti spojitého a diskrétnı́ho měřicı́ho členu. Vlastnosti těchto měřicı́ch členů spolu vůbec nemusejı́ souviset. 2 U spojitých stochastických systémů nás zajı́má, jak se v čase vyvı́jı́ podmı́něná hustota pravděpodobnosti stavu x v čase t z počátečnı́ho stavu z = x(t0 ) v čase t0 , při působenı́ deterministického řı́zenı́ u(τ ) na intervalu t > τ ≥ t0 . Tuto podmı́něnou hustotu označı́me p (x(t)|z, u(τ ), t > τ ≥ t0 ). Vývoj této hustoty je popsán tzv. Fokker–Planckovou nebo přı́mou Kolmogorovovou parciálnı́ diferenciálnı́ rovnicı́ ∂ p(x(t)|z(t), u(τ )) = −tr ∂t n ∂p(x(t)|z(t), u(τ ))f (x(t), u(t), t) 1 X ∂ 2 p(x(t)z(t), u(τ ))qi,j + ∂x(t) 2 i,j=1 ∂xi ∂xj (16.36) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 175 kde qi,j je (i, j)-tý prvek matice Q. Počátečnı́ podmı́nky jsou p (x(t0 )|z, u(t0 ), t0 ) = δ (x(t0 ) − z). Focker Planckova rovnice může být přı́mo řešena pouze ve specielnı́ch přı́padech. Zde ji uvádı́me spı́še pro ukázku toho, jak je vývoj hustoty stavu v čase komplikovaný u spojitých systémů. Nás ale vı́ce bude zajı́mat vývoj prvnı́ch dvou momentů - střednı́ hodnoty a kovariance stavu. b (t) = E {x(t) | z, u(τ )}. Pro ni platı́ Označı́me tedy podmı́něnou střednı́ hodnotu stavu jako x b (t) ∂x = E {f (x(t), u(t), t) | x(t0 ) = z, u(τ )} ∂t (16.37) Poznamenejme, že obecně b (t), u(t), t) E {f (x(t), u(t), t) | x(t0 )z, u(τ )} = 6 f (x n o b ) (x(t) − x b )T | x(t0 ) = z, u(τ ) . Pro jejı́ vývoj je Podmı́něná kovariance stavu je P (t) = E (x(t) − x možno odvodit následujı́cı́ vztah Ṗ (t) = h n o i h n o i b (x, u, t)T + b (t) . f E x(t) . f (x(t), u(t), t)T − x b (t)T + Q. E f (x(t), u(t), t) . x(t)T − fb (x, u, t) . x Předchozı́ rovnice jsou složité integro–diferenciálnı́ rovnice, protože operátor střednı́ hodnoty je integrálnı́ operátor k jehož řešenı́ je třeba znát podmı́něnou hustotu pravděpodobnosti stavu, která je určena řešenı́m Kolmogorovovy rovnice. Poznámka: Pro lineárnı́ stochastické systémy popsané stavovou rovnicı́ ẋ(t) = Ax(t) + Bu(t) + v(t) je vývoj podmı́něné střednı́ hodnoty popsán jednoduše vztahem ḃ b (t) x(t) = Ax a vývoj kovariančnı́ matice je určen řešenı́m Ljapunovovy rovnice Ṗ (t) = P (t)AT + AP (t) + Q. Předchozı́ diferenciálnı́ rovnice řešı́me z počátečnı́ch podmı́nek daných informacı́ o počátečnı́m stavu. 2 16.4 Stochastické metody identifikace nelineárnı́ch systémů 16.4.1 Bayesovské metody Jednotı́cı́m základem metod identifikace jsou Bayesovské metody. V nich se neznámé stavy, parametry či struktury považujı́ za náhodné veličiny. Našı́ subjektivnı́ představu o rozloženı́ pravděpodobnosti těchto náhodných veličin objektivizujeme daty změřenými na identifikovaném objektu. Předpokládejme, že pozorujeme (měřı́me) vstup u(τ ) a výstup y(τ ) v čase τ = 1, . . . , k−1 a naše znalost stavu systému založená na množině dat Dk−1 = {u(1), y(1), . . . , u(k−1), y(k−1)} je popsána podmı́něnou hustotou pravděpodobnosti p x(k)| Dk−1 . (16.38) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 176 Problém naši popsanou podmı́něnou hustotou pravděpodobnosti je, jak aktualizovat znalost stavu k−1 k (p.h.p.) p x(k)|D na p.d.f p x(k+1)|D poté, co jsou změřena nová vstupnı́ a výstupnı́ data {u(k), y(k)}. Při tom známe pravděpodobnostnı́ model systému, který určuje pravděpodobnostnı́ vlastnosti výstupu systému p (y(k)| x(k), u(k)) (16.39) a pravděpodobnostnı́ vývoj stavu systému p (x(k+1)| x(k), u(k), y(k)) . (16.40) Řešenı́ tohoto problému se skládá ze dvou kroků. Datový, (filtračnı́, nebo objektivnı́) krok je založený na vstupnı́ch a výstupnı́ch datech. Vycházı́me tedy ze známé p.h.p. p x(k)| Dk−1 . Povšimněme si, že tato p.h.p. je založena na datech až do času k−1. Užitı́m modelu výstupu určeným p.h.p. p (y(k)| x(k), u(k)) můžeme vzájemnou p.h.p. výstupu a stavu psát ve tvaru p y(k), x(k)| Dk−1 , u(k) = (16.41) = p y(k)| x(k), u(k), Dk−1 p x(k)| Dk−1 , u(k) = p x(k)| y(k), u(k), Dk−1 p y(k)|u(k), Dk−1 , u(k) } {z | Dk Z předchozı́ho vztahu užitı́m tzv. přirozených podmı́nek řı́zenı́ p x(k)| Dk−1 , u(k) = p x(k)| Dk−1 (16.42) plyne vztah pro aktualizaci p.h.p. pomocı́ nově zı́skaných dat p x(k)| Dk = 1 p y(k)| x(k), u(k), Dk−1 p x(k)| Dk−1 , u(k) α (16.43) kde normalizačnı́ konstanta α je nezávislá na datech a je rovna p y(k)| Dk−1 , u(k) = Z p y(k), x(k)| Dk−1 , u(k) dx(k) (16.44) až na normalizačnı́ konstantu Povšimněme si, že je datový krok součin věrohodnostnı́ funkce p y(k)| x(k), u(k), Dk−1 a p.h.p p x(k)| Dk−1 , u(k) založené na starých datech. Předchozı́m vztahem je ukončen datový krok algoritmu. Časový (predikčnı́ nebo subjektivnı́) krok je založen na pravděpodobnostnı́m modelu systému, který je určen známou p.h.p. (16.40). Využitı́m vztahu pro marginálnı́ hustotu pravděpodobnosti můžeme psát prediktivnı́ hustotu pravděpodobnosti ve tvaru p x(k+1)| Dk = Z p x(k+1), x(k)| Dk dx(k) Použitı́m vztahu pro podmiňovánı́ dostaneme konečný vztah pro prediktivnı́ p.h.p. stavu p x(k+1)| Dk = Z p x(k+1)| Dk , x(k) p x(k)| Dk dx(k) (16.45) Poznámka: Stejné vztahy platı́ pro spojitý systém, pouze časový krok se provádı́ obecně velmi obtı́žně pomocı́ Fokkerovy-Planckovy difuznı́ rovnice. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ u(k) 177 y(k) 10 120 8 100 6 80 4 60 2 0 0 5 10 40 0 15 5 Skut. hod. par. a(k) 10 1 8 0.8 6 0.6 4 0.4 2 0.2 0 0 5 10 15 p(a(0)) 10 0 0 15 5 10 Obrázek 16.5: Hodnoty předstihu u(k), okamžitého výkonu y(k), průběhu změn parametru a(k) i apriornı́ hustoty p(a(0)). Přı́klad 12: Odhad parametrů extremálnı́ charakteristiky spalovacı́ho motoru. U spalovacı́ho motoru má závislost mezi předstihem a výkonem motoru extremálnı́ charakter, který při velkém zjednodušenı́ lze popsat vztahem y = b − c(u − a)2 + e kde y je okamžitý výkon motoru, u je předstih, a, b, c jsou parametry polohy paraboly, šum e modeluje nepřesnosti měřenı́. p(a) p(a) p(a) 1.5 0.2 p(a) p(a) 2 2 2 1 1 1 1 0.5 0 0 5 10 2 0 0 5 10 0 0 3 3 2 2 1 1 5 10 1 0 0 5 10 1.5 0 0 5 10 2 1 0 0 5 10 0 0 5 10 0 0 4 4 2 2 0 0 5 10 0 0 3 3 3 2 2 2 1 1 1 5 10 5 10 5 10 1 0.5 0 0 5 10 0 0 5 10 0 0 5 10 0 0 5 10 0 0 Obrázek 16.6: Vývoj hustoty pravděpodobnosti p(a(k)) v čase KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 178 Poloha paraboly závisı́ na mnoha činitelı́ch (kvalitě paliva, otáčkách motoru, teplotě a opotřebenı́ motoru a pod.). Předpokládáme, že známe parametr b, (b = 100)a parametr c, (c = 1) a pak pouze parametr a je předmětem identifikace. Při tom předpokládáme, že parametr a leži v intervalu 0 ≤ a ≤ 10; přesněji řečeno pouze v tomto intervalu budeme zjišt’ovat průběh hustoty pravděpodobnosti p(a) tohoto parametru. Identifikaci parametru a převedeme na identifikaci stavu x(k) = a(k), kde stavová rovnice má tvar x(k + 1) = x(k) + v(k), a kde k je diskrétnı́ čas ve kterém provádı́me měřenı́ předstihu u(k) a okamžitého výkonu y(k). Vývoj parametru je tedy popsán jako ”náhodná procházka” a šum v(k) ∼ N (0, σv2 ) umožňuje sledovat změny parametrů. Pro stavový model popsaný předchozı́ rovnicı́ je rovnice paraboly výstupnı́ rovnicı́ systému, jehož stav (parametr a(k)) odhadujeme. Tuto výstupnı́ rovnici zapı́šeme ve tvaru y(k) = 100 − (u(k) − x(k))2 + e(k) Ladicı́ nástroje při identifikaci jsou jednak rozptyl šumu měřenı́ - tı́m vlastně modelujeme věrohodnost dat a rozptyl šumu stavu v(k). Pokud je rozptyl tohoto šumu nulový, modelujeme tı́m, že hledaný parametr má konstantnı́ hodnotu (což v praxi nenı́ nikdy splněno). Na počátku předpokládáme rovnoměrné rozdělenı́ hustoty pravděpodobnosti p(a). Protože předpokládáme normalitu šumu měřenı́, je i podmı́něná hustota výstupu normálnı́ 1 1 2σ12 (y(k)−(100−u(k)−a(k|k−1))2 )2 e e p y(k)|a(k), Dk−1 , u(k) = √ 2π σe Tato podmı́něná hustota výstupu se nazývá věrohodnostnı́ funkce l(a(k)|y(k). l(a) 0.1 0 0 0.1 5 0.1 0 0 l(a) 10 0 0 0.1 5 0.1 5 10 0 0 l(a) 10 0 0 0.1 5 0.1 5 10 0 0 l(a) 10 0 0 0.1 5 0.1 5 10 0 0 l(a) 10 0 0 5 10 5 10 5 10 0.1 5 10 0 0 0.1 0.1 0.1 0.1 0.1 0.05 0 0 5 10 0 0 5 10 0 0 5 10 0 0 5 10 0 0 Obrázek 16.7: Nekumulovaná věrohodnostnı́ funkce l(a(k)|y(k)) Výsledky simulace jsou uvedeny na obrázcı́ch 16.5, 16.6 a 16.7. Na obr. 16.5 jsou vyneseny simulované průběhy předstihu u(k), okamžitého výkonu y(k), skutečné hodnoty parametru a(k) a apriornı́ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 179 hustoty parametru p(a(0)). Protože je reálný předpoklad, že data nejsou změřena přesně, je k simulovanému výstupu přičten náhodný šum s rovnoměrným rozdělenı́m na intervalu [−5, +5]. Na obr. 16.6 je vynesen průběh hustoty pravděpodobnosti p(a(k|k)) pro několik prvnı́ch kroků identifikace. Skutečná hodnota parametru byla a(k) = 5 pro 1 ≤ k ≤ 5. Tomu odpovı́dajı́ průběhy hustot pravděpodobnosti p(a) v prvnı́m řádku obr. 16.6 postupně pro k = 1 až k = 5. Pro 6 ≤ k ≤ 10 je skutečná hodnota parametru a(k) = 2, to znamená, že v čase k = 5 nastala skoková změna parametru a. Pro 6 ≤ k ≤ 10 jsou průběhy hustoty parametru p(a(k)) vypočtené z dat podle Bayesova vztahu vyneseny postupně v druhém řádku obr. 16.6. Pro 11 ≤ k ≤ 15 je skutečná hodnota parametru a(k) = 7, to znamená, že v čase k = 11 nastala dalšı́ skoková změna parametru a. Pro 11 ≤ k ≤ 15 jsou průběhy hustoty parametru p(a(k)) vypočtené z dat podle Bayesova vztahu vyneseny postupně ve třetı́m řádku obr. 16.6. V obr. 16.7 jsou vyneseny průběhy věrohodnostnı́ funkce l(a(k)|y(k)) po jednotlivých krocı́ch k. Povšimněte si, že vlivem kvadratické závislosti vstupu a výstupu systému má někdy věrohodnostnı́ funkce dva extrémy na sledovaném intervalu. Hustota pravděpodobnosti p(a(k)) i věrohodnostnı́ funkce l(a(k)|y(k) byly počı́tány v sı́ti 500 hodnot na intervalu 0 ≤ a ≤ 10. Sledovánı́ změn parametru a bylo umožněno zapomı́nánı́m (viz šum stavu v(k) ), které zde bylo realizováno tı́m způsobem, že k hustotě p(a(k)) byla v časovém kroku přičtena nepatrná konstanta řádu 10−7 . V tomto přı́padě simulované výsledky estimace parametru a byly velmi uspokojivé. Uvědomte si ale velké potı́že při identifikaci vı́ce parametrů. 16.4.2 Rozšı́řený Kalmanův filtr Kalmanův filtr provádı́ za některých předpokladů výpočet prvnı́ch dvou momentů p.h.p stavu, jejı́ž obecný vývoj byl popsán v předchozı́m odstavci. Pokud je systém lineárnı́ a šumy stavu a výstupu jsou normálnı́, pak jsou také normálnı́ všechny podmı́něné hustoty pravděpodobnosti, které se vyskytovaly v předchozı́m odstavci. Normálnı́ rozloženı́ pravděpodobnosti je plně určeno prvnı́mi dvěma momenty střednı́ hodnotou a kovariancı́. Proto lze v čase vyvı́jet pouze tyto prvnı́ dva momenty a tento problém právě řešı́ Kalmanův filtr. Kalmanův filtr pro diskrétnı́ systémy Nejprve uvedeme Kalmanův filtr pro lineárnı́ diskrétnı́ systémy a potom uvedeme přibližný postup pro nelineárnı́ diskrétnı́ systémy. Uvažujme diskrétnı́ lineárnı́ stochastický systém popsaný stavovými rovnicemi ve tvaru x(k + 1) = A(k)x(k) + B(k)u(k) + v(k) (16.46) y(k) = C(k)x(k) + D(k)u(k) + e(k) kde k je diskrétnı́ čas, x(k), u(k) a y(k) jsou po řadě stavy, vstupy a výstupy systému a v(k) = N (0, P v ), e(k) = N (O, P e ) jsou vzájemně nezávislé šumy stavu a výstupu. Počátečnı́ stav x(k0 ) = N (µx0 , Rx0 ) je nezávislý na šumech stavu a výstupu. Optimálnı́ odhad stavu x(k), podmı́něný znalostı́ dat (vstupu a výstupu systému) až do času k, b (k|k). Prvnı́ argument znamená čas, ve kterém provádı́me odhad a druhý argument určuje označı́me x čas posledně zı́skaných dat. Tento odhad je roven podmı́něné střednı́ hodnotě b (k|k) = E{x(k)|u(k), y(k), u(k − 1), y(k − 1), . . .} = E{x(k)|D k } x (16.47) Predikci podmı́něné střednı́ hodnoty, která je rovna odhadu stavu x(k + 1) v čase (k + 1) založeném KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 180 b (k +1|k) = E{x(k + 1)|u(k), y(k), u(k − 1), y(k − 1), . . .}. Kona stejné množině dat Dk označı́me x variančnı́ matice chyby odhadu je rovna podmı́něné kovarianci Platı́ tedy b (k|k))(x(k) − x b (k|k))T |u(k), y(k), . . .} Rxx (k|k) = E{(x(k) − x p x(k)|Dk p x(k + 1)|Dk (16.48) b (k|k); Rxx (k|k), ) ∼ N (x b (k + 1|k); Rxx (k + 1|k), ) ∼ N (x Rekurzivnı́ odhadovánı́ stavu dynamického systému pomocı́ Kalmanova filtru můžeme rozdělit na dva kroky. V prvnı́m kroku provedeme filtraci (odhad) stochastické veličiny podle zı́skaných pozorovánı́. Ve druhém kroku stanovı́me predikci odhadované střednı́ hodnoty a kovariance pomocı́ stavových rovnic systému. Prvnı́ krok se nazývá objektivnı́ krok (zı́skaný na podkladě známých hodnot), druhý krok je subjektivnı́ krok, provedený na základě modelu systému. b (k|k − 1). Na základě známého vstupu u(k) a výstupu y(k) Mějme tedy odhadnutou veličinu x provedeme filtraci stavu a dostaneme b (k|k) = x b (k|k−1) + Rxy (k|k−1)R−1 b (k|k−1)) x yy (k|k−1)(y(k) − y b b y (k|k−1) = C(k)x(k|k−1) + D(k)u(k) Rxx (k|k) = Rxx (k|k−1) − Rxy (k|k−1)R−1 yy (k|k−1)Ryx (k|k−1) kde Rxy (k|k−1) = Rxx (k|k−1)C T a Ryy (k|k−1) = C(k)Rxx (k|k−1)C T + Re . Po úpravě dostaneme vztah pro filtraci podmı́něné střednı́ hodnoty ve tvaru b (k|k) = x b (k|k−1)−Rxx C T (CRxx C T +Re )−1 (y(k) − C x b (k|k−1)) + D(k)u(k) x (16.49) podmı́něná kovariančnı́ matice je rovna Rxx (k|k)=Rxx (k|k−1) − Rxx C T (CRxx C T + Re )−1 CRxx (16.50) kde kovariančnı́ matice stavu na pravé straně předchozı́ch rovnic je Rxx = Rxx (k|k − 1). Predikce podmı́něné střednı́ hodnoty stavu je určena na základě stavových rovnic modelu b (k+1|k) = Ax b (k|k) + Bu(k) x (16.51) Rxx (k+1|k) = ARxx (k|k)AT + Rv (16.52) Predikovaná kovariančnı́ matice je Vztahy (16.49), (16.50), (16.51) a (16.52) jsou rekurentnı́ vztahy řešené s počátečnı́ podmı́nkou b (k0 |k0 − 1) = µx0 a Rxx (k0 |k0 − 1) = Rx0 . x Všechny kovariančnı́ matice vyjadřujeme obvykle ve faktorizovaném tvaru jako součin třı́ matic R = LDLT , kde L je dolnı́ trojúhelnı́ková matice s jednotkovou diagonálou a matice D je diagonálnı́ matice. Pro úpravu matice do faktorizovaného tvaru můžeme použı́t algoritmus dyadické redukce. Filtraci i predikci provádı́me potom numericky výhodným algoritmem nevyžadujı́cı́ inverzi matice. Problém odhadovánı́ stavů lze Kalmanovým filtrem řešit přibližně i pro nelineárnı́ systém, jehož stavové rovnice jsou x(k + 1) = f (x(k), u(k), k) + v(k) y(k) = g(x(k), u(k), k) + e(k) (16.53) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 181 kde nelineárnı́ funkce f a g majı́ konečné prvnı́ derivace podle stavu x(k) a v(k) i e(k) jsou stochastické posloupnosti se stejným rozloženı́m jako v lineárnı́m přı́padě. Problém nelineárnı́ho odhadu vzniká také při současném odhadovánı́ stavů a parametrů lineárnı́ch systémů. Vývoj parametrů je popsán diferenčnı́mi rovnicemi, které jsou připojeny k původnı́m stavovým rovnicı́m systému. Nelineárnı́ problém je řešen linearizacı́ stavových rovnic na základě průběžně zı́skávaných odhadů stavů. Opět budeme rozlišovat dva kroky odhadovánı́ - filtraci a predikci. Filtrace stavu pomocı́ měřených hodnot vstupu a výstupu je rovna b (k|k) = x b (k|k − 1) + x (16.54) −1 T +Rxx C (CRxx C + Re ) b (k|k − 1), u(k), k)] [y(k) − g(x Rxx = Rxx − Rxx C (CRxx C + Re )−1 CRxx T T kde Rxx = Rxx (k|k − 1) a kde C = C(k) je matice určená linearizacı́ výstupnı́ rovnice v bodě b (k|k − 1): x ∂g(x(k), u(k), k) C(k) = (16.55) ∂x(k) b (k|k−1) x b (k|k + 1), provedeme pomocı́ nelineárnı́ stavové rovnice systému, pak Predikci stavu, tj. určenı́ x b (k + 1|k) = f (x b (k|k), u(k), k) x (16.56) 0 Rxx (k + 1|k) = ARxx (k|k)A + Rv b (k|k): kde matici A = A(k) zı́skáme linearizacı́ stavové rovnice v bodě x A(k) = ∂f (x(k), u(k), k) ∂x(k) b (k|k) x (16.57) b (k0 |k0 − 1) = µx0 , Rxx (k0 |k0 − 1) = Rx0 . Iteračnı́ algoritmus startujeme s počátečnı́m odhadem x Přı́klad 13: Jako přı́klad vyřešı́me problém odhadu parametrů makroekonomického modelu. Model je převzatý z literatury [51]. Byl sestaven pro makroekonomiku USA. Tento model vycházı́ z třı́sektorové ekonomiky (neuvažuje vývoz a dovoz). Vstupnı́ proměnné modelu jsou: G M Výstupnı́ proměnné modelu Y C I R reálné vládnı́ výdaje reálné peněžnı́ zásoby jsou: reálný hrubý domácı́ produkt reálná spotřeba domácnostı́ reálné investičnı́ výdaje úroková mı́ra Základnı́ rovnice modelu makroekonomiky USA předpokládáme dle [51] ve tvaru Y (k) = C(k) + I(k) + G(k) C(k) = c0 + c1 Y (k) + c2 C(k − 1) I(k) = i0 + i1 [Y (k − 1) − Y (k − 2)] + i2 Y (k) + i3 R(k − 4) R(k) = r0 + r1 Y (k) + r2 [Y (k) − Y (k − 1)] +r3 [M (k) − M (k − 1)] + r4 [R(k − 1) + R(k − 2)] (16.58) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 182 Obrázek 16.8: Data ekonomiky USA Jednotka diskrétnı́ho času k je čtvrtletı́. Prvnı́ rovnice vyjadřuje, že hrubý domácı́ produkt Y (k) je součtem spotřeby domácnostı́ C(k), investičnı́ch výdajů I(k) a vládnı́ch výdajů G(k). Druhá rovnice je rovnicı́ spotřebnı́ funkce a vyjadřuje, že spotřeba C(k) je přı́mo úměrná hrubému domácı́mu produktu Y (k) a spotřebě v minulém čtvrtletı́ C(k − 1). Třetı́ rovnice je rovnicı́ investičnı́ funkce a vyjadřuje závislost investičnı́ch výdajů I(k) na hrubém domácı́m produktu Y (k), dále na rozdı́lů domácı́ch produktů v minulém čtvrtletı́ a předminulém čtvrtletı́ [Y (k − 1) − Y (k − 2)] a investice jsou také ovlivněny ve velké mı́ře také výšı́ úrokové sazby před rokem R(k − 4). Čtvrtá rovnice je rovnice pro úrokovou mı́ru a popisuje, závislost úrokové mı́ry R(t) na hrubém domácı́m produktu vytvořeném v daném obdobı́ Y (k), na rozdı́lu hrubých domácı́ch produktů v současném a minulém čtvrtletı́ [Y (k) − Y (k − 1)], na rozdı́lu zásob peněz rovněž v současném a minulém čtvrtletı́ [M (k) − M (k − 1)] a také na součtu úrokových měr v minulém a předminulém čtvrtletı́ [R(k − 1) + R(k − 2)]. Neznámé parametry c0 , c1 , c2 , i0 , i1 , i2 , i3 , r0 , r1 , r2 , r3 , r4 v předcházejı́cı́ch rovnicı́ch jsou předmětem identifikace. Parametry s indexem 0 ponecháme konstantnı́. Ostatnı́ parametry budou proměnné v čase a jejich optimálnı́ hodnoty budeme hledat rozšı́řeným Kalmanovým filtem. Odhady parametrů modelu makroekonomiky USA se prováděly na základě časových řad dat od 1. čtvrtletı́ roku 1947 do 1. čtvrtletı́ roku 1988. Data byla převzata z [51]. Čı́selné hodnoty jsou graficky zobrazeny na obr. 16.8. Povšimněte si pro nás nezvyklého měřı́tka některých veličin v řádech stovek či tisı́ců miliard US dolarů. Pro transformaci modelu do tvaru stavových rovnic nelineárnı́ho stochastického systému (16.53) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 183 Obrázek 16.9: Parametry a jejich konfidenčnı́ intervaly provedeme časový posun rovnic, takže je budeme psát v následujı́cı́m tvaru Y (k + 1) = C(k + 1) + I(k + 1) + G(k + 1) (16.59) C(k + 1) = c0 + c1 (k)Y (k + 1) + c2 (k)C(k) I(k + 1) = i0 + i1 (k)[Y (k) − Y (k − 1)] + i2 (k)Y (k + 1) + i3 (k)R(k − 3) R(k + 1) = r0 + r1 (k)Y (k + 1) + r2 (k)[Y (k + 1) − Y (k)] + +r3 (k)[M (k + 1) − M (k)] + r4 (k)[R(k) + R(k − 1)] Neznámé parametry c1 , c2 , i1 , i2 , i3 , r1 , r2 , r3 , r4 budeme odhadovat jako proměnné v čase, a proto jsme i u nich zavedli časový index k. Parametry c0 , i0 , r0 předpokládáme konstantnı́ a proto u nich časový index nezavádı́me. V dalšı́m kroku dosadı́me rovnice (16.59b) a (16.59c) do rovnice (16.59a) a vyjádřı́me Y (k + 1) Y (k + 1) = c0 + i0 + i1 (k)[Y (k) − Y (k − 1)] + c2 (k)C(k) + i3 (k)R(k − 3) + G(k + 1) 1 − c1 (k) − i2 (k) Tento vztah znovu dosadı́me do rovnic (16.59b), (16.59c) a (16.59d) a dostaneme C(k + 1) = c0 + +c1 (k) + Y (k + 1) + c2 (k)C(k) I(k + 1) = i0 + i1 (k)[Y (k) − Y (k − 1)] + +i2 (k)Y (k + 1) + i3 (k)R(k − 3) R(k + 1) = r0 + +[r1 (k) + r2 (k)]Y (k + 1) − r2 (k)Y (k) + r3 (k)[M (k + 1) − M (k)] + r4 (k)[R(k) + R(k − 1)] (16.60) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 184 kde za Y (k + 1) dosadı́me z předchozı́ rovnice (16.60). Nynı́ zavedeme vstupnı́, výstupnı́ a stavový vektor modelu. Vstupnı́ vektor u(k) má složky u1 (k) = G(k), u2 (k) = M (k). Výstupnı́ vektor y(k) má složky y1 (k) = Y (k), y2 (k) = C(k), y3 (k) = I(k), y4 (k) = R(k). Stavový vektor x(k) má následujı́cı́ složky: Parametry spotřebnı́ funkce x1 (k) = c0 , x2 (k) = c1 (k), x3 (k) = c2 (k). Parametry investičnı́ funkce x4 (k) = i0 , x5 (k) = i1 (k), x6 (k) = i2 (k), x7 (k) = i3 (k). Parametry funkce úrokové mı́ry x8 (k) = r0 , x9 (k) = r1 (k), x10 (k) = r2 (k), x11 (k) = r3 (k), x12 (k) = r4 (k). Proměnnné x13 (k) = Y (k), x14 (k) = Y (k − 1), x15 (k) = C(k), x16 (k) = I(k), x17 (k) = R(k), x18 (k) = R(k − 1), x19 (k) = R(k − 2), x20 (k) = R(k − 3). Poté, co jsme definovali všechny potřebné vektory, můžeme napsat soustavu stavových a výstupnı́ch rovnic makroekonomického modelu. Pro přehlednost použijeme pomocnou proměnou z(t) = Y (k + 1) - viz. (16.60). z(k) = x1 + x4 + x5 (k)[x13 (k) − x14 (k)] + x3 (k)x16 (k) + x7 (k)x20 (k) + u1 (k + 1) 1 − x2 (k) − x6 (k) Stavové rovnice makromodelu majı́ následujı́cı́ tvar x1 (k + 1) x2 (k + 1) x3 (k + 1) x4 (k + 1) x5 (k + 1) x6 (k + 1) x7 (k + 1) x8 (k + 1) x9 (k + 1) x10 (k + 1) x11 (k + 1) x12 (k + 1) x13 (k + 1) x14 (k + 1) = = = = = = = = = = = = = = x1 (k) x2 (k) + v2 (k) x3 (k) + v3 (k) x4 (k) x5 (k) + v5 (k) x6 (k) + v6 (k) x7 (k) + v7 (k) x8 (k) x9 (k) + v9 (k) x10 (k) + v10 (k) x11 (k) + v11 (k) x12 (k) + v12 (k) z(k) + v13 (k) x13 (k) x1 (0) x2 (0) x3 (0) x4 (0) x5 (0) x6 (0) x7 (0) x8 (0) x9 (0) x10 (0) x11 (0) x12 (0) x13 (0) x14 (0) = = = = = = = = = = = = = = x15 (k + 1) = x1 (k) + x2 (k)z(k)+ +x3 (k)x15 (k) + v15 (k) x16 (k + 1) = x4 (k) + x5 (k)[x13 (k) − x14 (k)]+ +x6 (k)z(k) + x7 (k)x20 (k) + v16 (k) x17 (k + 1) = x8 (k) + [x9 (k) + x10 (k)]z(k)− −x10 (k)x13 (k) + x11 (k)[u2 (k + 1) − u2 (k)]+ +x12 (k)[x17 (k) + x18 (k)] + v17 (k) x18 (k + 1) = x17 (k) x19 (k + 1) = x18 (k) x20 (k + 1) = x19 (k) Výstupnı́ rovnice makromodelu: y1 (k) y2 (k) y3 (k) y4 (k) = = = = x13 (k) + e1 (k) x15 (k) + e2 (k) x16 (k) + e3 (k) x17 (k) + e4 (k) ĉ0 ĉ1 (0) ĉ2 (0) î0 î1 (0) î2 (0) î3 (0) r̂0 r̂1 (0) r̂2 (0) r̂3 (0) r̂4 (0) Y (4) Y (3) x15 (0) = C(4) x16 (0) = I(4) x17 (0) = R(4) x18 (0) = R(3) x19 (0) = R(2) x20 (0) = R(1) (16.61) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 185 Obrázek 16.10: Skutečné a predikované výstupy Výsledky odhadu parametrů modelu makroekonomiky USA byly zpracovány v diplomové práci [16]. Predikované hodnoty stavů (parametrů) spolu s jejich konfidenčnı́mi intervaly jsou na obr. 16.9. Konfidenčnı́ interval vyjadřuje mı́ru nejistity odhadu parametru. Pásmo nejistoty je rovno ±k σ, kde σ je směrodatná odchylka přı́slušného parametru a konstanta úměrnosti k se volı́ v intervalu [2, 3], (zde k = 2). Obr. 16.10 zobrazuje skutečné a predikované hodnoty výstupů. Z uvedeného obrázku vidı́me, že přesnost odhadu parametrů je vyhovujı́cı́. Chyby výstupů jsou na obr. 16.11. Pokud je odhad správný, tak posloupnost chyb výstupu je bı́lá posloupnost, což zde je přibližně splněno. Neuvádı́me zde kovariančnı́ matice šumu stavů i výstupu, na kterých podstatnou měrou závisı́ úspěšnost odhadů. Neuvádı́me zde ani apriornı́ odhady parametrů i jejich kovariance, které také ovlivňujı́ přesnost odhadů. Pokud zvolı́me nulové rozptyly šumů ve stavových rovnicı́ch popisujı́cı́ch vývoj parametrů, odhadujeme konstantnı́ parametry. Pro odhadované konstantnı́ parametry jsou na obr. 16.12 zobrazeny chyby výstupů. Chyby jsou v tomto přı́padě většı́ a chybová posloupnost zřejmě nenı́ v tomto přı́padě bı́lá posloupnost. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 186 Obrázek 16.11: Odchylky výstupů Obrázek 16.12: Odchylky výstupů Rozšı́řený Kalmanův filtr pro spojité systémy Nejprve uvedeme rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ systém s diskrétnı́m měřenı́m výstupu. Datový krok filtru je obdobný datovému kroku pro diskrétnı́ systémy. Časový krok se přibližně provádı́ použitı́m stochastické rovnice systému. Uvědomme si, že rozšı́řený Kalmanův filtr je pouze aproximacı́ s chybou druhého řádu. Mějme tedy spojitý nelineárnı́ stochastický systém s diskrétnı́m měřenı́m výstupu ẋ(t) = f (x(t), u(t), t) + v(t), y(k) = g (x(t), u(t), t) + e(k), (16.62) pro t = kT b (0), P (0)), w(t) ∼ N (O, Q), e(k) ∼ N (O, R). Při tom předpokládáme, že v(t) a kde x(0) ∼ N (x e(k) jsou nezávislé bı́lé šumy nekorelované s počátečnı́ podmı́nkou x(0). Diskrétnı́ měřenı́ výstupu je prováděno s periodou vzorkovánı́ T . KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 187 Ve shodě s předchozı́m značenı́m zavedeme podmı́něnou střednı́ hodnotu b (t|(k − 1)T ) = E (x(t)|y(k − 1), u(t)) x pro (k − 1)T ≤ t ≤ kT b (t|kT ) = E (x(t)|y(k), u(t)) , x pro t = kT. Podobně budeme značit podmı́něnou kovariančnı́ matici stavu P (t|(k − 1)T ) respektive P (t|kT ). Kalmanův filtr provádějı́cı́ aktualizaci podmı́něné střednı́ hodnoty stavu a podmı́něné kovariančnı́ matice stavu se opět skládá se dvou kroků - časového (modelového) a datového (filtračnı́ho). Časový krok: Vývoj podmı́něné střednı́ hodnoty stavu v čase je přibližně určen vztahem ḃ b (t|(k − 1)T ), u(t), t) x(t|(k − 1)T ) = f (x pro (k − 1)T ≤ t ≤ kT. (16.63) b , t)P (t|(k − 1)T ) + P (t|(k − 1)T )AT (x b , t) + Q, Ṗ (t|(k − 1)T ) = A(x (16.64) Vývoj podmı́něné kovariančnı́ matice je b , t) zı́skáme linearizacı́ kde matici A(x b , t) = A(x ∂f (x(t), u(t), t) . ∂x b (t|(k−1)T ) x(t)=x Datový krok: Aktualizace podmı́něné střednı́ hodnoty je b (t|kT ) = x b (t|(k − 1)T ) + K(k) [y(k) − g(x b (t|(k − 1)T ), u(t), t)] , x pro t = kT (16.65) a kde Kalmanovo zesı́lenı́ je rovno h b , k) C(x b , k)P (t|(k − 1)T ), C T (x b , k) + R K(k) = P (t|(k − 1)T ), C T (x i−1 , pro t = kT. (16.66) Aktualizace podmı́něné kovariančnı́ matice je b , k)P (t|(k − 1)T ) P (t|kT ) = P (t|(k − 1)T ) − K(k)C(x (16.67) b , k) zı́skáme linearizacı́ a matici C(x b , k) = C(x ∂g (x(t), u(t), t) ∂x b (t|(k−1)T ) x(t)=x v bodě t = kT. Nynı́ opět stručně uvedeme rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ systém se spojitým měřenı́m výstupu. Uvědomme si, že aktualizace (datový krok) podmı́něných střednı́ch hodnot stavu a jeho kovariance se při spojitém měřenı́ výstupu provádı́ spojitě v každém časovém okamžiku. Proto se v tomto přı́padě nerozlišuje datový a časový krok. Spojitý Kalmanův filtr můžeme odvodit limitnı́m přechodem z diskrétnı́ho Kalmanova filtru pro periodu vzorkovánı́ T → 0. Označı́me podmı́něnou střednı́ hodnotu stavu b (t) = E(x(t)|y(t), u(t)) x a podobně podmı́něnou kovariančnı́ matici stavu P (t). KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 188 Nejprve uvedeme Kalmanův filtr pro lineárnı́ spojitý systém se spojitým měřenı́m výstupu. Stochastický model tohoto systému a měřenı́ výstupu je ẋ(t) = Ax(t) + Bu(t) + v(t), (16.68) y(k) = Cx(t) + Du(t) + e(t) (16.69) b 0 , Rx0 ), w(t) ∼ N (O, Q), e(k) ∼ N (O, R). Při tom kde stejně jako v předchozı́m přı́padě x(0) ∼ N (x předpokládáme, že v(t) a e(t) jsou nezávislé bı́lé šumy nekorelované s počátečnı́ podmı́nkou x(0). Při tom musı́me předpokládat, že R > O (matice R musı́ být pozitivně definitnı́), což znamená, že všechny složky výstupu jsou zatı́ženy šumem, žádné měřenı́ výstupu nenı́ tedy absolutně přesné. Kalmanův filtr pro rekurzivnı́ odhadovánı́ podmı́něné střednı́ hodnoty stavu a jeho kovariance je popsán následujı́cı́mi vztahy. ḃ b (t) + Bu(t) + K(t) [y(t) − C x b (t) − Du(t)] , x(t) = Ax T T Ṗ (t) = AP (t) + P (t)A + Q − P (t)C R −1 CP (t) + e(t), b (0) = x b0 x (16.70) P (0) = Rx0 Kalmanovo zesı́lenı́ je v tomto přı́padě K(t) = P (t)C T R−1 Rovnice (16.70b) je Riccatiova rovnice, kterou při filtraci řešı́me dopředně ze známé počátečnı́ podmı́nky P (0) = Rx0 . Rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ stochastický systém se spojitým měřenı́m výstupu popsaný stavovými rovnicemi ẋ(t) = f (x(t), u(t), t) + v(t), (16.71) y(t) = g (x(t), u(t), t) + e(t) je popsán následujı́cı́mi vztahy ḃ b (t), u(t), t) + K(t) [y(t) − g (x b (t), u(t), t)] , x(t) = f (x T T b (0) = x b0 x b (t), t) P (t) + P (t)A (x b (t), t) + Q − P (t)C (x b (t), t) R Ṗ (t) = A (x −1 (16.72) b (t), t) P (t), C (x Riccatiovu rovnici (16.72b) řešı́me dopředně s počátečnı́ podmı́nkou P (0) = Rx0 . Kalmanovo zesı́lenı́ je v tomto přı́padě b (t), t) R−1 K(t) = P (t)C T (x b (t), t) a C (x b (t), t) zı́skáme linearizacı́ stavových rovnic stochastického systému (16.71) Matice A (x b (t), t) = A (x b (t), t) = C(x ∂f (x(t), u(t), t) ∂x b (t) x(t)=x ∂g (x(t), u(t), t) ∂x b (t) x(t)=x Protože zpracovánı́ dat se nynı́ stále častěji realizuje čı́slicově, je použitı́ spojitého Kalmanova filtru omezeno pouze na speciálnı́ přı́pady. 16.4.3 Stochastické metody interpolace V některých přı́padech máme k dispozici veškerá změřená data. Potom je výhodné provést odhad stavu systému, který je založen na celé množině dat a ne pouze na průběžně zı́skaných měřenı́ch. Tomuto způsobu odhadu řı́káme interpolace. Pokud použı́váme přůběžně zı́skané odhady stavu k řı́zenı́ KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 189 systému, nenı́ možno interpolaci použı́t. Interpolace (pokud ji můžeme provést) nám může dát lepšı́ odhady stavu, protože tyto odhady jsou založeny na většı́ množině dat. Často odhadujeme nejenom stavy systému, ale i jeho parametry, které můžeme považovat za pomalu se měnı́cı́ stavy. Pokud v systému nastane nějaká změna parametrů, tak tato náhlá změna vůbec nenı́ obsažena v minulých datech a proto odhad založený na minulých datech nenı́ dobrý - viz přı́klad na konci tohoto odstavce. Interpolace, která k odhadu využı́vá i budoucı́ data nám dá odhad mnohem přesnějšı́. Výsledkem interpolace, to je odhadu stavu založeném na celé množině dat, je p.h.p p x(k)| Dkf (16.73) kde Dkf je celá množina dat od počátku měřenı́ až do koncového (finálnı́ho) času kf . Zde použijeme pro data od času k do kf označenı́ k Dkf = {u(k), y(k), . . . , u(kf ), y(kf )} potom celá množina dat je k Dkf = D1 f = {u(1), y(1), . . . , u(k), y(k), . . . , u(kf ), y(kf )} Nynı́ odvodı́me obecný vztah pro interpolaci jejı́mž výsledkem je p.h.p. stavu, kde vpodmı́nce je k celá množina dat. Předpokládáme, že známe filtrované p x(k)| D a predikované p x(k+1)| Dk p.h.p stavu. Interpolace bude řešena zpětným během filtru, který bude založen na znalosti predikované tedy pracovat bez dat. Budeme tedy aktualizovat p.h.p. a filtrované p.h.p., tento filtr bude p x(k+1)| Dkf na p.h.p. p x(k)| Dkf . Při tom využijeme pravděpodobnostnı́ popis systému určený p.h.p p (x(k+1)| x(k), y(k)). Ze vztahu pro podmı́něnou hustotu pravděpodobnosti dostanene k k f f p x(k), Dk+1 |Dk = p x(k)| Dkf p Dk+1 | Dk (16.74) Zavedenı́ stavu x(k+1) předchozı́ p.h.p. můžeme dostat jako marginálnı́ p.h.p. k f p x(k), Dk+1 |Dk = Z k f p x(k+1), x(k), Dk+1 |Dk dx(k+1) Dalšı́m užitı́m řetězového pravidla má předchozı́ výraz tvar k f p x(k), Dk+1 |Dk = Z k f p x(k)|x(k+1), Dk+1 , Dk k f |Dk dx(k+1) × p x(k+1)|Dkf p Dk+1 Z předchozı́ho vztahu a (16.74) plyne vztah pro interpolovanou p.h.p p x(k)| Dkf = Z k f p x(k)|x(k+1), Dk+1 , Dk p x(k+1)|Dkf dx(k+1) (16.75) Abychom mohli zjednodušit předchozı́ vztah pro interpolovaný odhad, využijeme vlastnost stavu systému. Užitı́m podmiňovánı́, můžeme zapsat p.h.p dvojı́m způsobem k f p Dk+1 , x(k)|Dk , x(k+1) k (16.76) f = p Dk+1 |x(k), Dk , x(k+1) p x(k)|Dk , x(k+1) k k f f = p x(k)|Dk+1 , Dk , x(k+1) p Dk+1 |Dk , x(k+1) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 190 Z definice stavu plyne (to je Markovova vlastnost stavu) k k f f p Dk+1 |x(k), Dk , x(k+1) = p Dk+1 |Dk , x(k+1) Tak z předchozı́ho je zřejmé, že k f p x(k)|Dk+1 , Dk , x(k+1) = p x(k)|Dk , x(k+1) (16.77) Konečný vztah pro zpětný filtr má tvar p x(k)| Dkf = Z p x(k)|x(k+1), Dk p x(k+1)|Dkf dx(k+1) (16.78) kde jsme využili vlastnost stavu popsanou v předchozı́m vztahu (16.77). Z Bayesova vztahu plyne pro p.h.p. p x(k+1)| x(k), Dk p x(k)| Dk (16.79) p x(k)|x(k+1), Dk = p (x(k+1)| Dk) Předchozı́ vztah je v podstatě krok velmi podobný datovému kroku, kde fiktivnı́ výstup je nynı́ stav x(k+1). Proto v tomto kroku podobném datovému kroku je použito stavové rovnice systému. Naproti tomu vztah (16.78) je zase podobný časovému kroku. Funkcionálnı́ procedura pro interpolovaný odhad je popsána vztahy (16.78) a (16.79) Tı́mto postupem byl zpětný filtr rozložen do dvou kroků. Rozklad problému interpolace do dvou kroků zpětného filtru je výhodný z numerického hlediska. Poprvé byl popsán v [90]. Vztah pro zpětný filtr, který řešı́ problém interpolace v jednom kroku dostaneme dosazenı́m (16.79) do (16.78) p x(k)| Dkf = p x(k)| Dk Z p x(k+1)|Dkf p (x(k+1)|x(k), y(k)) p (x(k+1)|Dk ) dx(k+1) (16.80) Předchozı́ vztahy použijeme pro odvozenı́ přibližného řešenı́ problému interpolace linearizacı́ - jakési obdoby rozšı́řeného Kalmanova filtru pro zpětný běh. Interpolace pro linearizovaný systém a normálnı́ šumy Při lineárnı́m systému a normálnı́ch šumech předchozı́ funkcionálnı́ rekurze můžeme změnit na algebraické rekurzivnı́ vztahy pro interpolovanou střednı́ hodnotu stavu a jeho kovariančnı́ matici. Použijeme zde stejné značenı́ jako pro rozvinutý Kalmanův filtr, to je b (k|τ ), Rxx (k|τ )) p (x(k)|Dτ ) = N (x p (x(k+1)|x(k), u(k)) = N (A(k)x(k) + B(k)u(k); Rv ) Označme střednı́ hodnotu a kovarianci, které jsou výsledkem fiktivnı́ho datového kroku (16.77) e e (k), R(k) p x(k)| x(k+1), Dk = N x (16.81) Fiktivnı́ datový krok (16.77) vede na následujı́cı́ vztahy pro aktualizaci střednı́ hodnoty a kovariance e (k) = x b (k|k) + F (k) (x(k+1) − x b (k+1|k)) x e R(k) = R(k|k) − F (k)R(k+1|k)F T (k) (16.82) kde Kalmanovo zesı́lenı́ F (k) je F (k) = R(k| k)AT (k) [R(k+1| k)]−1 (16.83) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 191 Aktualizace střednı́ hodnoty a kovariance podle vztahu (16.78) vede na b (k| kf ) = x b (k| k) + F (k) [x b (k+1| kf ) − x b (k+1| k)] x e R(k| kf ) = F (k)R(k+1| kf )F T (k) + R(k) (16.84) Tı́mto způsobem je zjednodušena procedura na interpolaci. Řešenı́ problému interpolace ve dvou krocı́ch usnadňuje numerickou implementaci algoritmu. Dosadı́me-li (16.82) do (16.84) dostaneme vztah pro interpolaci realizovanou zpětným během filtru v jediném kroku. b (k|kf ) = x b (k|k) + F (k) [x b (k+1|kf ) − x b (k+1|k)] x (16.85) T R(k|kf ) = R(k|k) − F (k) [R(k+1|k)−R(k+1|kf )] F (k) s Kalmanovým zesı́lenı́m F (k) podle (16.83). Vstup u(k) Vystup y(k) 4 20 3 10 2 0 1 −10 0 0 5 10 15 20 −20 0 Stav x1(k)= x(k) 1 10 0.5 0 0 −10 −0.5 5 10 k 15 10 15 20 Stav x2(k) = a(k) 20 −20 0 5 20 −1 0 5 10 k 15 20 Obrázek 16.13: Vstup u(k), výstup y(k) a stavy x1 (k), x2 (k) systému z přı́kladu 14 Poznámka: Při přibližné interpolaci v nelineárnı́m diskrétnı́m systému popsaném stavovou rovnicı́ x(k + 1) = f (x(k), u(k), k ), musı́me provést linearizaci tohoto systému a matici A(k) ve vztahu (16.83) pro zesı́lenı́ zpětného filtru počı́tat podle vztahu A(k) = ∂f (x(k), u(k), k) ∂x(k) b (k+1|kf ) x Přı́klad 14: Mějme jednoduchý lineárnı́ systém prvnı́ho řádu x(k + 1) = a(k) · x(k) + v(k) y(k) = x(k) + e(k) kde parametr a nenı́ známý. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 192 Problém současného odhadovánı́ stavu a parametru systému můžeme převést na problém odhadovánı́ stavu rozšı́řeného systému x1 (k + 1) = x2 (k) · x1 (k) + v1 (k) x2 (k + 1) = x2 (k) + v2 (k) y(k) = x1 (k) + e(k) kde stav x1 (k) = x(k) je roven původnı́mu stavu systému prvnı́ho řádu a x2 (k) = a(k). Šumy v1 a v2 můžeme použı́t jako ladicı́ nástroje, které realizujı́ zapomı́náni a umožňujı́ sledovánı́ změny parametru. Odhadovánı́ a interpolaci stavu rozšı́řeného nelineárnı́ho systému budeme realizovat linearizacı́. Rozvinutý Kalmanův filtr má stavovou matici A linearizovaného systému δf = A= δx " x2 (k) x1 (k) 0 1 # , Matice A je použita v predikčnı́m kroku a při interpolaci. Při predikci dosazujeme za stavy v každém kroku x1 = x̂1 (k|k) a x2 = x̂2 (k|k). Při interpolaci dosazujeme v každém kroku x1 = x̂1 (k + 1|kf ) a x2 = x̂2 (k + 1|kf ). Data u(k) a y(k) a skutečný průběh stavů x1 (k), x2 (k) jsou uvedeny v obr. 16.13. Povšimněte si, že v čase k = 10 se druhý stav (parametr a) skokem měnı́. Vlivem této změny dostává systém oscilačnı́ charakter. Výsledky simulace jsou uvedeny na obr. 16.14 a 16.15. Odhad stavu xhat1(t|t−1) Odhad stavu xhat2(t|t−1) 20 1 0.5 10 0 0 −0.5 −10 −20 0 −1 5 10 15 20 −1.5 0 Chyba odhadu e1=x1−xhat1 5 10 15 20 Chyba odhadu e2=x2−xhat2 10 1 0.5 0 0 −10 −0.5 −1 −20 −1.5 −30 0 5 10 k 15 20 −2 0 5 10 k 15 20 Obrázek 16.14: Predikované odhady stavů a jejich chyby z přı́kladu 14 b (k|k − 1) a jejich odchylky ep (k) = x(k) − x b (k|k − 1) V obr. 16.14 jsou predikované odhady stavů x b (k|k) a od skutečných stavů. V obr. 16.15 jsou uvedeny odchylky filtrovaných stavů ef (k) = x(k) − x b (k|kf ). odchylky interpolovaných stavů ei (k) = x(k) − x Povšimněte si velmi malé chyby při interpolaci u druhého stavu (parametru a), zatı́m co při filtraci je při náhlé změně parametru chyba estimace velká. Porovnejte také chyby při predikce a filtraci. KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ Chyba filtrace e1 193 Chyba filtrace e2 1 0.5 x2(t)−xhat2(t|t) x1(t)−xhat1(t|t) 0.2 0 −0.2 0 0 −0.5 −1 −1.5 5 10 15 −2 0 20 Chyba interpolace e1 5 10 15 20 Chyba interpolace e2 0.2 x2(t)−xhat2(t|t_f) x1(t)−xhat1(t|t_f) 0.06 0 −0.2 0 5 10 k 15 20 0.04 0.02 0 −0.02 −0.04 0 5 10 k 15 20 Obrázek 16.15: Chyby filtrovaných a interpolovaných odhadů a přikladu 14 16.4.4 Klasifikace systémů Problém odhadovánı́ stavů resp. parametrů systému jsme řešili za předpokladu, že je známá struktura systému. Často ale neznáme jednoznačně strukturu systému a k danému reálnému objektu může existovat několik kandidátů na správnou strukturu jeho modelu. To znamená, že máme několik hypotéz o skutečné struktuře systému. Každé struktuře budeme přiřazovat jejı́ pravděpodobnost. Klasifikace systémů znamená aktualizaci pravděpodobnosti každé hypotézy na základě dat zı́skaných měřenı́m na reálném objektu. Někdy také neznáme některé ladicı́ parametry procedury odhadovánı́ stavů a parametrů systému. Přikladem mohou být kovariančnı́ matice šumů stavu i měřenı́. Také tento problém můžeme řešit pomocı́ klasifikace. Problém klasifikace systému zde nebudeme řešit jako rozhodovacı́ problém. Pokud bychom se museli rozhodnout, která struktura systému je správná, volili bychom nejjednodušeji tu strukturu, jejı́ž pravděpodobnost je nejvyššı́. Rozhodovacı́ problém vyžaduje volbu kritéria rozhodovánı́ a může být značně komplikovaný. Pro predikci a řı́zenı́ procesů nenı́ potřeba rozhodovat, která hypotéza o struktuře systému je správná a která je falešná. Zde budeme pouze altualizovat pravděpodobnosti hypotéz na základě zı́skaných dat. Je samozřejmé, že vedle řešenı́ problému klasifikace (výpočtu podmı́něných pravděpodobnostı́ hypotéz o struktuře modelu) je současně třeba v každé struktuře odhadovat neznámé stavy a parametry. Mějme tedy N alternativnı́ch modelů s různými strukturami. Každému alternativnı́mu modelu s předpokládanou (hypotetickou) strukturou přiřadı́me pravděpodobnost p(H i ), i = 1, 2, . . . , N . 1 , pokud nepreferujeme některé Apriornı́ pravděpodobnost ité hypotézy Hi můžeme volit p(Hi ) = N hypotézy. Bayesovský přı́stup ke klasifikaci systému je následujı́cı́: Vstup u(τ ) a výstup y(τ ) je pozorován v čase τ = 1, 2, · · · , k − 1. Naše znalost o pravděpodobnosti hypotéz podmı́něná množinou dat Dk−1 = {u(1), y(1), · · · , u(k − 1), y(k − 1)} KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 194 je popsána podmı́něnou pravděpodobnostı́ hypotéz p(Hi (k)|Dk−1 ). Náš problém je aktualizace této podmı́něné pravděpodobnosti hypotéz, to je přechod od p(Hi (k)|Dk−1 ) na p(Hi (k + 1)|Dk ) poté, co obdržı́me nová vstupnı́ a výstupnı́ data {u(k), y(k)}. Řešenı́ opět rozdělı́me do dvou kroků - datového a časového (filtraci a predikci). V datovém kroku klasifikace aktualizujeme na základě dat podmı́něnou pravděpodobnost p(Hi (k)|Dk−1 ) na p(Hi (k)|Dk ). K odvozenı́ potřebných vztahů použijeme vzorec pro podmı́něnou pravděpodobnost. p(y(k), u(k), Hi (k)|Dk−1 ) = p(y(k), u(k)|Hi (k), Dk−1 ) · p(Hi (k)|Dk−1 ) = p(Hi (k)|Dk−1 , y(k), u(k)) · p(y(k), u(k)|Dk−1 ) Odtud plyne Bayesův vztah pro podmı́něnou pravděpodobnost p(Hi (k)|Dk ) = p(y(k), u(k)|Hi (k), Dk−1 ) · p(Hi (k)|Dk−1 ) p(y(k), u(k)|Dk−1 ) Při úpravě předchozı́ho vztahu použijeme přirozené podmı́nky řı́zenı́ ve tvaru p(u(k)|Dk−1 , Hi (k)) = p(u(k)|Dk−1 ) které vyjadřujı́ fakt, že všechna naše znalost o hypotézách je založena na datech. Datový krok klasifikace po úpravě je vyjádřen následujı́cı́m vztahem p(Hi (k)|Dk ) = 1 p(y(k)|Hi (k), u(k), Dk−1 ) · p(Hi (k)|Dk−1 ) α (16.86) kde normalizačnı́ konstantu α volı́me takovou, aby součet podmı́něných pravděpodobnostı́ všech hypotéz byl roven jedné. Časový krok klasifikace je formálně jednoduchý. Podle vztahu pro marginálnı́ pravděpodobnost platı́ p(Hi (k + 1)|Dk ) = = i=N X i=1 i=N X p(Hi (k + 1), Hi (k)|Dk ) p(Hi (k + 1)|Hi (k), Dk )p(Hi (k)|Dk ) i=1 kde p(Hi (t + 1)|Hi (t), Dt ) je pravděpodobnostnı́ model vývoje hypotéz. Protože velmi často takový model neznáme, použı́váme časový krok pouze jako určitou formu zapomı́nánı́, přı́padně vážı́me pravděpodobnosti hypotéz nějakými alternativnı́mi pravděpodobnostmi. K tomu se přirozeně nabı́zı́ apriornı́ pravděpodobnost p(Hi ), proto p(Hi (k + 1)|Dk ) = λp(Hi (k)|Dk ) + (1 − λ)p(Hi ) (16.87) kde váhový koeficient λ volı́me v intervalu 0 < λ ≤ 1. Podmı́něná pravděpodobnost p(y(k)|Hi (k), D je věrohodnost hypotéz. Pokud je normálnı́, tak 1 p(y(t)|H (i) (k), Dk−1 ) = p r b − (y (t)−y e 2 1 (2π)m det R(i) yy (i) T ) ( −1 (y (t)−y b (i) ) R(i) yy ) kde m je dimenze vektoru y a b (i) = y b (i) (t|t − 1) = C (i) x b (i) (t|t − 1), y (i) R(i) xx = Rxx (t|t − 1) k−1 ) (16.88) KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 195 Obrázek 16.16: Pravděpodobnosti modelů Potom snadno můžeme počı́tat podmı́něné pravděpodobnosti modelů různých struktur na základě dat. Přı́klad 15: Uvažujme nynı́ opět model a data makroekonomiky USA, viz přı́klad 13 této kapitoly. Vytvořı́me dva alternativnı́ makroekonomické modely. Prvnı́ je model s konstantnı́mi parametry a druhý model má časově proměnné parametry. Nejedná se tedy o různé struktury modelů, ale o dva alternativnı́ modely, které se lišı́ pouze modelem vývoje parametrů. Tyto modely se v podstatě lišı́ pouze různými kovariančnı́mi maticemi šumu v modelu vývoje parametrů. Model vývoje každého parametru θi (k) je často ve tvaru náhodné procházky θi (k + 1) = θi (k) + ei (k) kde rozptyl σi2 normálnı́ho bı́lého šumu ei (k) určuje schopnosti změny parametru θi (k) v čase. Pokud je rozptyl σi2 = 0, pak předpokládáme, že model má přı́slušný parametr konstantnı́. Pro daná data makroekonomiky USA, která byla uvedena v přı́kladu 13 byly počı́tány pravděpodobnosti těchto dvou alternativnı́ch modelů - viz lit. [16]. Struktura obou modelů byla stejná a je uvedena v přı́kladu 13. Apriornı́ pravděpodobnosti modelů byly zvoleny p(H (1) (0)) = 0.5, p(H (2) (0)) = 0.5, to znamená, že nepreferujeme žádný model. Vývoj pravděpodobnostı́ těchto dvou alternativnı́ch modelů makroekonomiky USA je uveden na obr. 16.16. Z průběhů podmı́něných pravděpodobnostı́ těchto alternativnı́ch modelů můžeme vyčı́st, že v obdobı́ od roku 1952 do roku 1974, kdy vývoj ekonomiky v USA byl poměrně plynulý se stoupajı́cı́ tendencı́, má model s konstantnı́mi parametry většı́ pravděpodobnost než model s proměnnými parametry. Tento model však selhává (jeho pravděpodobnost je nižšı́), když v ekonomice dojde k náhlým nečekaným změnám. Asi nejnázornějšı́m přı́kladem je obdobı́ dvou recesı́ v roce 1975 a 1982. V grafu KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ 196 se promı́tá i řada dalšı́ch událostı́, které zasáhly americkou ekonomiku. Jsou to napřı́klad léta po druhé světové válce (1945-1950), na ně navazujı́cı́ Korejská válka (1950-1953), atentát na prezidenta J. F. Kennedyho v roce 1963 a dalšı́. V těchto obdobı́ch nečekaných změn je samozřejmě výhodnějšı́ model s proměnnými parametry, který je pružný a dokáže na tyto změny reagovat. 2 Uvedený přı́klad ukazuje, že klasifikace systémů - to je výpočet podmı́něných pravděpodobnostı́ několika alternativnı́ch modelů na základě dat - může být použita nejen k určenı́ nejpravděpodobnějšı́ struktury modelu, ale i k řešenı́ celé řady dalšı́ch problémů jako je na přı́klad detekce poruch v systému, posouzenı́ správné činnosti čidel nebo akčnı́ch členů a pod. Literatura Knihy a texty české a slovenské [1] Havlena V., Štecha J.: Modernı́ teorie řı́zenı́. Skriptum ČVUT FEL Praha, 1996. [2] Holodniok M., Klı́č A., Kubı́ček M., Marek M.: Metody analýzy nelineárnı́ch dynamických modelů. Academia, Praha, 1986. [3] Horáček P., Fuka J.: Systémy a modely. Skripta FEL ČVUT, Praha, 1996. [4] Horák J., Krlı́n L.: Deterministický chaos a matematické modely turbulence. Academia, Praha, 1996. [5] John J.: Systémy a řı́zenı́. Skripta FEL ČVUT, Praha, 1996. [6] Kolektiv: Oborové encyklopedie. Aplikovaná matematika I. II., SNTL, Praha, 1978. [7] Kotek Z., Kubı́k S., Razı́m M.: Nelineárnı́ dynamické systémy. SNTL, Praha, 1973. [8] Kotek Z., Razı́m M.: Teorie nelineárnı́ch, optimálnı́ch a adaptivnı́ch řı́dı́cı́ch systémů. Skripta FEL ČVUT, Praha, 1982. [9] Kubı́k S., Kotek Z., Strejc V., Štecha J.: Teorie automatického řı́zenı́ I. Lineárnı́ a nelineárnı́ systémy. SNTL, Praha, 1982. [10] Kubı́k S., Kotek Z., Razı́m M., Hrušák J., Branžovský J.: Teorie automatického řı́zenı́ II. Optimálnı́, adaptivnı́ a učı́cı́ se systémy. SNTL, Praha, 1982. [11] Marek M., Schreiber I.: Stochastické chovánı́ deterministických systémů. Academia, Praha, 1984. [12] Medved’ M.: Dynamické systémy. Veda, Bratislava, 1988. [13] Nagy J.: Vybrané partie z modernı́ matematiky. SNTL, Praha, 1976. [14] Nagy J.: Stabilita řešenı́ obyčejných diferenciálnı́ch rovnic. SNTL, Praha, 1980. [15] Štecha J., Havlena V.: Teorie dynamických systémů. Skriptum ČVUT FEL Praha, 1996. [16] Satoriová K.: Použitı́ alternativnı́ch modelů při identifikaci ekonomických systémů. Diplomová práce, ČVUT FEL Praha, 1996. Knihy a sbornı́ky jiné [17] Andronov A.A., Chajkin C.E.: Těorija kolebanij. Fizmatgiz, Moskva, 1959. [18] Arnold V.I.: Ordinary Differential Equations. M.I.T. Press, Cambridge, MA, 1973. [19] Arnold V.I.: Geometrical Methods in the Theory of Ordinary Differential Equations. Springer Verlag, New York, 1980. [20] Åstrom K.: Introduction to Stochastic Control Theory. Academic Press, N.York, 1970. [21] Atherton D.P.: Nonlinear Control Engineering. Van Nostrand Reinhold, London, 1975. 197 [22] Byrnes C.I., Lindquist A. (Eds): Theory and Application of Nonlinear Control Systems. NorthHolland, Dordrecht, 1986. [23] Byrnes Ch.I., Kurzhanski A.(Eds.): Modelling and Adaptive Control. Springer Verlag, Berlin, 1988. [24] Chua L.O.: Introduction to Nonlinear Network Theory. McGrawHill, New York, 1969. [25] Desoer C.A., Vidyasagar M.: Feedback Systems: Input-Output Properties. Academic Press, New York, 1975. [26] Gantmacher F.R.: Theory of Matrices. Chelsea Publishing Co., New York, 1959. [27] Gelb A., Vander Velde W.E.: Multiple-Input Describing Functions and Nonlinear System Design. McGraw-Hill, 1968. [28] Gibson J.E.: Nonlinear Automatic Control. McGraw-Hill, New York, 1963. [29] Gilmore R.: Catastrophe Theory for Scientists and Engineers. John Wiley, New York, 1981. [30] Goodwin G.C., Sin K.S.: Adaptive Filtering Prediction and Control.Prentice Hall, Englewood Cliffs, 1984. [31] Gőldner K., Kubı́k S.: Nichtlineare Systeme der Regelungstechnik. VEB Verlag Technik, Berlin, 1978. [32] Hahn W.: Theory and Application of Liapunov’s Direct Method. Prentice-Hall, Englewood Cliffs, N.J, 1963. [33] Guckenheimer J., Holmes P.: Nonlinear Oscillations, Dynamical Systems, and Bifurcations of Vector Fields. Springer, N.Y., 1983. [34] Haken H.: Synergetics. An Introduction. Springer-Verlag, Berlin, 1978. [35] Hsu J.C., Meyer A.U. Modern Control Principles and Applications. McGraw-Hill, New York, 1968. [36] Isidori A.: Nonlinear Control Systems. 3.vyd., Springer Verlag, New York, 1995. [37] Jazwinski A.H.: Stochastic Processes and Filtering Theory. Academic Press, N.York, 1970. [38] Jetschke G.: Mathematik der Selbstorganisation. VEB Verlag, Berlin, 1989. [39] Khalil H.: Nonlinear Systems. 2.vyd. Upper Sadle River, NJ, Prentice-Hall, 1996. [40] Kulhavý R.: Recursive Nonlinear Estimation, A Geometric Approach. Springer-Verlag, Berlin, 1996. [41] La Salle J., Lefschetz S.: Stability by Lyapunov’s Direct Method. Academic Press, 1961. [42] Lefschetz S.: Stability of Nonlinear Control Systems. Academic Press, 1962. [43] Leven R.W., Koch B.P., Pompe B.: Chaos in dissipativen Systemen. Akademie-Verlag, Berlin, 1989. [44] Levine W.S. (Ed.): The Control Handbook. CRC Press, USA, 1996. [45] Lewis F.L.: Optimal Estimation. J.Wiley, New York, 1986. 198 [46] Marek M., Schreiber I.: Chaotic Behavior of Deterministic Dissipative Systems. Academia, Praha, 1991. [47] Michel A.N., Miller R.K.: Qualitative Analysis of Large Scale Dynamical Systems. Academic Press, New York, 1977. [48] Narendra K.S., Taylor J.H.: Frequency Domain Criteria for Absolute Stability. New York, Academic Press, 1973. [49] Nijmeijer H., Van der Schaft A.J.: Nonlinear Dynamical Control Systems. Springer Verlag, 1990. [50] Papoulis A.: Probability, Random Variables and Stochastic Processes. McGraw Hill, New York, 1965. [51] Pindyck R.S., Rubinfeld D.L.: Econometric Models and Economic Forecasts. McGraw-Hill, New York, 1990. [52] Slotine J.E., Li W.: Applied Nonlinear Control. Prentice-Hall, New Jersey, 1991. [53] Vidyasagar M.: Input-Output Analysis of Large-Scale Interconnected Systems. Springer Verlag, New York, 1981. [54] Vidyasagar M.: Control System Synthesis: A Factorization Approach. M.I.T. Press, Cambridge, MA.,1985. [55] Vidyasagar M.: Nonlinear System Analysis. Second Edition. Englewood Cliffs, NJ, Prentice-Hall, 1993. [56] Vaněček A., Čelikovský S.: Control Systems. From Linear Analysis to Synthesis of Chaos. Prentice Hall, London, 1996. [57] Willems J.L.: Stability Theory of Dynamical Systems. Nelson, London, 1970. Články [58] Anderson B.D.O.: Stability of control systems with multiple nonlinearities. J.Franklin Inst., 282, s.155-160, 1966. [59] Brockett R.W., Willems J.W.: Frequency domain stability criteria, IEEE Trans.on Automatic Control, část I. AC-10, č.3, s.255-261, 1965; část II. AC-10, č.4, s.407-413, 1965. [60] Byrnes C.I., Isidori A, Willems J.C.: Passivity, feedback equivalence and the global stabilization of minimum phase nonlinear systems. IEEE Trans.on Automatic Control,36, č.11, s.1228-1240, 1991. [61] Čelikovský S.: Global linearization of nonlinear systems - A survey. Geometry in Nonlinear Control and Differential Inclusions. Banach Center Publications, vol.32. Institute of Mathematics, Polish Academy of Sciences, Varšava, 1995. [62] Deluca A.: Design of an exact nonlinear controller for induction motors. IEEE Trans.on Automatic Control, AC-34, č.12, s.1304-1307, 1989. [63] Estrada R.F.: On the stability of multiloop feedback systems. IEEE Trans.on Automatic Control, AC-17, s.781-791, 1972. [64] Glad S.T.: Robustness of nonlinear state feedback. A survey. Automatica, sv.23, s.425-435, 1987. 199 [65] Haddad W.M., Kapila V.: Absolute stability criteria for multiple slope-restricted monotonic nonlinearities. IEEE Trans.on Automatic Control, AC-40, č.2, s.361-365, 1995. [66] Haber R., Unbehauen H.: Structure identification of nonlinear dynamic systems. A survey on input/output approaches. Automatica, 26, č.4, s.651-678, 1990. [67] Havlena V.: Simultaneous parameter tracking and state estimation. Automatica, 29, č.4, s.10411052, 1993. [68] Havlena V.: Adaptive Kalman filter for a MIMO ARMAX system. Preprints of the 12th IFAC World Congress,sv.9, Sydney, 1993. [69] Hill D.J., Moylan P.J.: The stability of nonlinear dissipative systems. IEEE Trans.on Automatic Control, sv. 21, s. 708-711, 1976. [70] Hill D.J., Moylan P.J.: Stability results for nonlinear feedback systems. Automatica, sv.13, s.377382, 1977. [71] Hill D.J., Moylan P.J.: Dissipative dynamical systems: Basic input-output and state properties. J.Franklin Inst., sv. 309, s. 327-357, 1980. [72] Hunt L.R., Su R., Meyer G.: Global transformations of nonlinear systems. IEEE Trans.on Automatic Control, AC-28, č.1, s. 24-30, 1983. [73] Isidori A., Byrnes C.J.: Output regulation of nonlinear systems. IEEE Trans.on Automatic Control, AC-35, č.2, s.131-140, 1990. [74] Jakubovič V.A.: Rešenije někotorych matričnych něravěnstv vstrečajuščichsja v těorii avtomatičeskogo regulirovanija. Dokl. AN SSSR, č.6, 1958. [75] Krzseminski Z.: Nonlinear control of induction motor. Proc. 10th IFAC World Congress, s.349-354, Mnichov, 1987. [76] Kwakernaak H. (ed.): Special Issue on Trends in System Identification. Automatica, sv.31, č.12, 1995. [77] Lozano-Leal R., Joshi S.M.: Strictly positive real functions revisited. IEEE Trans.on Automatic Control, AC-35, s.1243-1245, 1990. [78] Mareels I.M., Bitmead R.R.: Nonlinear dynamics in adaptive control. Chaotic and periodic stabilization. Automatica, sv.22, č.6, s.641-655, 1986. [79] Meyer G., Su R., Hunt L.R.: Application of nonlinear transformations to automatic flight control. Automatica, 20, s.103-107, 1984. [80] Moore J.B., Anderson B.D.O.: A generalisation of the Popov criterion. J.Franklin Inst., 285, s. 488-492, 1968. [81] Ortega R., Canudas C., Seleme S.I.: Nonlinear control of induction motors: Torque tracking with unknown load disturbance. IEEE Trans.on Automatic Control, AC-38, č.11, s.1675-1680, 1993. [82] Peterka V.: Control of uncertain processes: Applied theory and algorithms. Supplement to Kybernetika 22, No.3 - 6, 1986. [83] Popov V.M.: Ob absolutnoj ustojčivosti nělinějnych sistěm avtomatičeskogo regulirovanija. Avtomatika i Telemechanika, č.8, 1961. 200 [84] Porter D.W., Michel A.N.: Input-output stability of time-varying nonlinear multiloop feedback systems. IEEE Trans.on Automatic Control, AC-19, s.422-427, 1974. [85] Rae W.G.: Stability criteria for control systems with many nonlinear elements. Automatica, sv.6, s. 463-467, 1970. [86] Ray K.S., Majumder D.D.: Application of the circle criteria for stability analysis of linear SISO and MIMO systems associated with fuzzy logic controller. IEEE Trans. Systems, Man, and Cybernetics, 14, s.345-349, 1984. [87] Singh V.: A stability inequality for nonlinear feedback systems with slope-restricted nonlinearity. IEEE Trans.on Automatic Control, AC-29, č.8, 1984. [88] Sinha P.K.: State feedback decoupling of nonlinear systems. IEEE Trans.on Automatic Control, AC-22, č.6, s.487-489,1977. [89] Sontag E.D.: New characterizations of input-output stability. IEEE Trans.on Automatic Control, AC-41, č.9, s. 1283-1294, 1996. [90] Štecha J., Havlena V.: Smoothing in simultaneous state and parameters estimation. Proceedings of Third European Control Conference, Roma, sv. 4, pp. 2165-2170, 1995. [91] Utkin V.I.: Variable structure systems with sliding mode: A Survey. IEEE Trans.on Automatic Control, AC-22, s.212-222, 1977. [92] Vaněček A., Čelikovský S.: Wrapped eigenstructure of chaos. Kybernetika, sv.29, č.1, s.73-79, 1993. [93] Vaněček A., Čelikovský S.: Synthesis of chaotic systems. Kybernetika, sv.30, č.5, s.537-542, 1994. [94] Vidyasagar M.: New directions of research in nonlinear system theory. Proc.IEEE, sv.74, č.8, s.1060-1091. [95] Wen J.T.: Time domain and frequency domain conditions for strict positive realness. IEEE Trans.on Automatic Control, AC-33, s.988-992, 1988. [96] Willems J.C.: Dissipative dynamical systems. Part I: General theory. Arch. Rational Mechanics and Analysis, sv. 45, s.321-351, 1972. 201