Stecha - Nelinearni systemy

advertisement
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
Fakulta elektrotechnická
Nelineárnı́ systémy
Doc. Ing. Miroslav Razı́m, CSc.
Prof. Ing. Jan Štecha, CSc.
1997
Edičnı́ středisko ČVUT, Praha 6, Zikova 4
Předmluva
Skriptum Nelineárnı́ systémy je určeno předevšı́m pro studenty oboru Technická kybernetika, ale
vzhledem k obecnějšı́mu pojetı́ probı́rané látky může sloužit jako základnı́ text i pro studenty jiných
oborů, kteřı́ se zajı́majı́ o nelineárnı́ dynamické systémy a jejich řı́zenı́.
Převážná část skripta je věnována analýze nelineárnı́ch systémů. Kromě klasických metod, k nimž
patřı́ předevšı́m Ljapunovova teorie stability, Popovovo a kruhové kritérium a metoda ekvivalentnı́ch
přenosů, jsou do skripta zařazeny i některé modernı́ partie, např. stabilita vstup-výstup, teorie bifurkacı́
rovnovážných stavů a periodických řešenı́, teorie katastrof a základnı́ poznatky o chaotickém chovánı́
systémů. Syntéze řı́zenı́ nelineárnı́ch systémů jsou věnovány kapitoly 14 a 15. Podrobněji jsou uvedeny
předevšı́m metody exaktnı́ch linearizacı́, které představujı́ dnes hlavnı́ směr výzkumu nelineárnı́ho
řı́zenı́. Závěrečná kapitola obsahuje některé vybrané metody identifikace nelineárnı́ch systémů.
Snahou autorů bylo podat ve zhuštěné formě základnı́ přehled problematiky nelineárnı́ch systémů
a jejich řı́zenı́. Probı́raná témata jsou proto ilustrována jen malým počtem jednoduchých přı́kladů,
složitějšı́ přı́klady, aplikace a počı́tačové programy jsou náplnı́ seminárnı́ch a laboratornı́ch cvičenı́.
Kapitoly 1 až 15 skripta zpracoval doc. Ing. Miroslav Razı́m, CSc., kapitolu 16 prof. Ing. Jan
Štecha, CSc.
Autoři děkujı́ recenzentovi skripta Ing. Antonı́nu Vaněčkovi, DrSc. za velmi pečlivé pročtenı́
rukopisu a za řadu podnětů, které přispěly k definitivnı́ úpravě textu.
Autoři budou vděčni uživatelům skripta za připomı́nky, které přispějı́ ke zkvalitněnı́ textu při
eventuálnı́m dalšı́m vydánı́.
Praha, červen 1997.
Autoři
Obsah
1 Úvod
1
1.1
Nelineárnı́ prvky a jejich charakteristiky . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2
Nelineárnı́ dynamické systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2.1
Rozdělenı́ nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2.2
Matematický popis nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . .
5
Sestavovánı́ rovnic nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.3
2 Základnı́ vlastnosti nelineárnı́ch systémů
10
2.1
Základnı́ pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2
Metody řešenı́ přechodných jevů nelineárnı́ch systémů . . . . . . . . . . . . . . . . . .
13
2.2.1
Analytické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.2.2
Metody malého parametru . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.2.3
Grafické a graficko-analytické metody . . . . . . . . . . . . . . . . . . . . . . .
16
2.2.4
Numerické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.2.5
Simulace nelineárnı́ch systémů na počı́tačı́ch . . . . . . . . . . . . . . . . . . . .
18
Ustálené stavy nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.3.1
Autonomnı́ nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.3.2
Neautonomnı́ nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.3
3 Stabilita - základnı́ pojmy a definice
24
3.1
Stabilita rovnovážného stavu volného systému . . . . . . . . . . . . . . . . . . . . . . .
24
3.2
Stabilita pohybu volného systému . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
3.3
Jiné typy stability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
4 Ljapunovova metoda linearizace
4.1
4.2
4.3
29
Lineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
4.1.1
Lineárnı́ autonomnı́ systémy
29
4.1.2
Lineárnı́ časově variantnı́ systémy
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
34
Prvnı́ Ljapunovova metoda pro nelineárnı́ systémy . . . . . . . . . . . . . . . . . . . .
36
4.2.1
Lokálnı́ stabilita rovnovážných stavů autonomnı́ch systémů . . . . . . . . . . .
36
4.2.2
Lokálnı́ stabilita rovnovážných stavů neautonomnı́ch systémů . . . . . . . . . .
39
Strukturálnı́ stabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
I
4.4
4.5
Centrálnı́ varieta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.4.1
Výpočet centrálnı́ variety a určovánı́ stability meznı́ho přı́padu . . . . . . . . .
43
Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
5 Přı́má Ljapunovova metoda
46
5.1
Ljapunovovy funkce pro autonomnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . .
46
5.2
Ljapunovovy funkce pro lineárnı́ autonomnı́ systémy . . . . . . . . . . . . . . . . . . .
49
5.3
Ljapunovovy funkce pro nelineárnı́ autonomnı́ systémy . . . . . . . . . . . . . . . . . .
49
5.3.1
Volba Ljapunovovy funkce na základě fyzikálnı́ analogie . . . . . . . . . . . . .
50
5.3.2
Volba Ljapunovovy funkce pro nelineárnı́ systém podle analogie s linearizovaným
systémem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
Metoda variabilnı́ho gradientu . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
5.3.3
5.4
Ljapunovovy funkce pro neautonomnı́ systémy
. . . . . . . . . . . . . . . . . . . . . .
54
5.5
Věty o nestabilitě . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
5.6
Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
6 Speciálnı́ systémy
58
6.1
Gradientnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
6.2
Pasivnı́ a disipativnı́ dynamické systémy . . . . . . . . . . . . . . . . . . . . . . . . . .
59
6.2.1
Pozitivně reálné lineárnı́ systémy . . . . . . . . . . . . . . . . . . . . . . . . . .
60
6.2.2
Obecná teorie disipativnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . .
63
7 Absolutnı́ stabilita
7.1
7.2
66
Popovovo kritérium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
7.1.1
Odvozenı́ Popovova kritéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
7.1.2
Popovovo kritérium a Ajzermanova hypotéza . . . . . . . . . . . . . . . . . . .
72
7.1.3
Transformace pólů a nul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
7.1.4
Rozšı́řenı́ Popovova kritéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
Kruhové kritérium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
8 Stabilita vstup-výstup
78
8.1
Lebesgueovy prostory a jejich rozšı́řenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . .
78
8.2
Definice stability vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
8.3
Stabilita zpětnovazebnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
8.3.1
Stabilita při malém zesı́lenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
8.3.2
Přı́stup pomocı́ pasivity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
9 Nelineárnı́ diskrétnı́ systémy
86
9.1
Definice stability autonomnı́ho diskrétnı́ho systému . . . . . . . . . . . . . . . . . . . .
87
9.2
Vyšetřenı́ stability pevných bodů metodou linearizace . . . . . . . . . . . . . . . . . .
87
9.3
Vyšetřenı́ stability pomocı́ přı́mé Ljapunovovy metody . . . . . . . . . . . . . . . . . .
89
10 Periodická řešenı́ a jejich stabilita
90
II
10.1 Analytické metody studia periodických řešenı́ . . . . . . . . . . . . . . . . . . . . . . .
90
10.2 Odhady periodických řešenı́ u systémů druhého řádu . . . . . . . . . . . . . . . . . . .
91
10.3 Poincaréovo zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
10.4 Rovnice ve variacı́ch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
10.5 Úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
11 Bifurkace rovnovážných stavů a periodických řešenı́
97
11.1 Bifurkace rovnovážných stavů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
11.2 Bifurkace periodických řešenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
11.3 Teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
11.3.1 Elementárnı́ teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
11.3.2 Aplikace teorie katastrof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
12 Chaos
105
12.1 Chaos v diskrétnı́ch systémech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
12.1.1 Kvadratická diferenčnı́ rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
12.1.2 Po částech lineárnı́ zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
12.1.3 Hénonovo zobrazenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
12.2 Chaos u diferenciálnı́ch rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
12.2.1 Lorenzův model
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
12.2.2 Jiné modely . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
12.3 Vlastnosti chaotických atraktorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
12.3.1 Ljapunovovy exponenty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
12.3.2 Dimenze atraktorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
13 Metoda ekvivalentnı́ch přenosů
117
13.1 Princip metody ekvivalentnı́ch přenosů pro jeden vstup . . . . . . . . . . . . . . . . . 117
13.2 Ekvivalentnı́ přenosy pro frekvenčně nezávislé nelinearity . . . . . . . . . . . . . . . . 119
13.3 Ekvivalentnı́ přenosy pro frekvenčně závislé nelinearity . . . . . . . . . . . . . . . . . . 123
13.4 Periodická řešenı́ autonomnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . 124
13.5 Nelineárnı́ systémy s většı́m počtem nelinearit . . . . . . . . . . . . . . . . . . . . . . . 126
13.6 Nelineárnı́ systémy s nesymetrickými vlastnı́mi kmity
. . . . . . . . . . . . . . . . . . 127
13.7 Ekvivalentnı́ přenos nelinearity se dvěma vstupy . . . . . . . . . . . . . . . . . . . . . 132
14 Metody syntézy nelineárnı́ch řı́dı́cı́ch systémů
134
14.1 Linearizace nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
14.1.1 Linearizace v pracovnı́m bodě . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
14.1.2 Linearizace ve vı́ce pracovnı́ch bodech . . . . . . . . . . . . . . . . . . . . . . . 135
14.1.3 Exaktnı́ linearizace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
14.2 Základnı́ metody syntézy řı́zenı́ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
14.2.1 Lineárnı́ nebo linearizovaná soustava s nelineárnı́m řı́zenı́m . . . . . . . . . . . 136
14.2.2 Nelineárnı́ soustava s lineárnı́m nebo nelineárnı́m řı́zenı́m . . . . . . . . . . . . 137
III
15 Exaktnı́ linearizace
140
15.1 Intuitivnı́ přı́stup k linearizaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
15.1.1 Transformace stavových proměnných . . . . . . . . . . . . . . . . . . . . . . . . 141
15.1.2 Linearizace vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
15.2 Matematické prostředky pro zpětnovazebnı́ linearizace . . . . . . . . . . . . . . . . . . 145
15.3 Linearizace vstup-stav . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
15.4 Linearizace vstup-výstup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
15.4.1 Relativnı́ stupeň r < n. Normálnı́ formy. . . . . . . . . . . . . . . . . . . . . . . 153
15.4.2 Vnitřnı́ a nulová dynamika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
15.4.3 Návrh řı́zenı́ při stabilizaci a sledovánı́ . . . . . . . . . . . . . . . . . . . . . . . 156
15.4.4 Systémy s vı́ce vstupy a výstupy . . . . . . . . . . . . . . . . . . . . . . . . . . 157
16 Identifikace nelineárnı́ch systémů
159
16.1 Obecné úvahy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
16.2 Deterministické modely a jejich identifikace . . . . . . . . . . . . . . . . . . . . . . . . 162
16.2.1 Deterministické metody identifikace nelineárnı́ch systémů . . . . . . . . . . . . 162
16.3 Stochastické modely nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . . . . . . . . 164
16.4 Stochastické metody identifikace nelineárnı́ch systémů . . . . . . . . . . . . . . . . . . 175
16.4.1 Bayesovské metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
16.4.2 Rozšı́řený Kalmanův filtr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
16.4.3 Stochastické metody interpolace . . . . . . . . . . . . . . . . . . . . . . . . . . 188
16.4.4 Klasifikace systémů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
Literatura
197
IV
Kapitola 1
Úvod
V teorii lineárnı́ch systémů byly studovány fyzikálnı́ a jiné soustavy, které lze popsat lineárnı́mi diferenciálnı́mi rovnicemi. Tento způsob popisu umožňuje relativně jednoduché řešenı́, ale ve skutečnosti
je jen určitou aproximacı́ skutečnosti, protože fyzikálnı́, biologické, ekonomické nebo jiné systémy
jsou většinou ve své podstatě nelineárnı́. Mnohdy je možno některé nelineárnı́ systémy vyšetřovat
s dostatečnou přesnostı́ jako lineárnı́, jestliže se jejich chovánı́ přı́liš neodlišuje od lineárnı́ aproximace, zejména při pohybu v blı́zkosti pracovnı́ch nebo rovnovážných stavů. Proto je znalost modernı́
lineárnı́ teorie nezbytná i pro studium nelineárnı́ch systémů. Často se však vyskytujı́ situace, kdy je
linearizovaný model neadekvátnı́ nebo kdy je linearizace nepřı́pustná.
Linearizace nám také neumožnı́ studovat speciálnı́ chovánı́, které se objevuje jen u nelineárnı́ch
systémů a které nelze lineárnı́ teoriı́ vysvětlit. Jak uvidı́me v dalšı́ch kapitolách, jsou to např. různé typy
ustálených oscilacı́, které nejsou vybuzeny vnějšı́m periodickým signálem, dále různé subharmonické a
ultraharmonické kmity, skokové rezonance, chaotické jevy apod. Mnohé z těchto jevů jsou nežádoucı́
a jsou vyvolány parazitnı́mi nelinearitami v regulátorech a regulovaných soustavách, např. třenı́m,
nasycenı́m, vůlı́ v převodech apod., jiné jevy jsou naopak žádoucı́ a do obvodu často vhodné nelinearity
úmyslně zavádı́me.
Existuje mnoho rozdı́lů mezi lineárnı́mi a nelineárnı́mi systémy. Řešenı́ lineárnı́ch systémů je velmi
často možné zı́skat v uzavřeném tvaru, který umožňuje činit obecné závěry o chovánı́ systému. To
v nelineárnı́m přı́padě nenı́ většinou možné a úlohu je třeba bud’ řešit numerickými metodami nebo
provádět pouze kvalitativnı́ analýzu, která však často poskytne mnoho informacı́ o chovánı́ nelineárnı́ho
systému. Je třeba si také uvědomit, že pro obtı́žnost řešenı́ se u nelineárnı́ch systémů použı́vá mnohem
širšı́ paleta metod než u systémů lineárnı́ch, protože neexistuje univerzálnı́ metoda řešenı́. Nelineárnı́
systémy vyžadujı́ také znalost složitějšı́ch matematických disciplı́n jako je např. funkcionálnı́ analýza,
diferenciálnı́ geometrie, teorie vektorových polı́ aj.
Studium nelineárnı́ch systémů a jejich vlastnostı́ zvyšuje podstatně možnosti pracovat účinně s
praktickými problémy a přispı́vá k hlubšı́mu pochopenı́ reálného světa, který je ve své podstatě nelineárnı́. Uvidı́me dále, že jedině pomocı́ nelineárnı́ch teoriı́ lze vysvětlit složité chovánı́ fyzikálnı́ch,
biologických, ekonomických a jiných systémů. Např. evoluce v biologii, diferenciace buněk a tkánı́,
vznik různých živočišných druhů, chovánı́ jedinců i populacı́, to vše je dáno složitými nelineárnı́mi
interakcemi. Ale také řı́zenı́ složitých technických systémů, např. rychlých a přesných robotů, letadel
apod. vyžaduje podrobnou znalost nelineárnı́ho chovánı́.
Uved’me stručně některé důvody, které nás nutı́ k využitı́ nelineárnı́ho řı́zenı́.
Pohyb ve velkých pracovnı́ch rozsazı́ch, kdy už neplatı́ podmı́nky linearizace kolem pracovnı́ho
bodu. Lineárnı́ řı́zenı́ má pak často velmi špatné vlastnosti, nelze dosáhnout žádané přesnosti regulace
a vyhovujı́cı́ kvality regulačnı́ho pochodu. Kompenzace nelinearit řı́zeného systému nebo vhodný návrh
nelineárnı́ho regulátoru mohou vlastnosti celého systému podstatně zlepšit.
1
KAPITOLA 1. ÚVOD
2
Řı́zenı́ systémů s nelinearitami, které nelze linearizovat. V soustavách i regulátorech existuje
v praxi mnoho nelinearit, které nedovolujı́ lineárnı́ aproximaci. Jsou to např. třenı́, nasycenı́, hystereze
apod., které vyvolávajı́ nežádoucı́ jevy, např. různé typy oscilacı́, velké ustálené regulačnı́ odchylky aj.
Jejich vliv je proto třeba predikovat a kompenzovat vhodným návrhem nelineárnı́ho řı́zenı́.
Jednoduchost některých nelineárnı́ch systémů. Mnohé regulované soustavy lze velmi dobře
řı́dit jednoduchými a často i lacinými prostředky, které přitom plně uspokojı́ požadavky na kvalitu
regulace. Jako přı́klad mohou sloužit nespojité regulace teploty, tlaku, průtoku a jiných veličin, kde se
v regulátorech často použı́vajı́ jednoduché prvky s charakteristikami reléového typu.
Robustnı́ návrh s ohledem na změny parametrů. V mnoha praktických problémech je třeba
uvažovat nejistoty v hodnotách parametrů modelu. Jedná se bud’ o pomalé změny parametrů v čase,
např. vlivem stárnutı́ prvků, změnami v okolı́ systému apod., nebo o náhlé změny, např. při uchopenı́
zátěže u manipulátorů. Lineárnı́ řı́zenı́ může v těchto přı́padech vést na zhoršené regulačnı́ pochody
nebo může dojı́t i k nestabilnı́mu chovánı́. Podstatně lépe se s těmito změnami vyrovná nelineárnı́
řı́zenı́, např. nelineárnı́ robustnı́ nebo adaptivnı́ řı́zenı́.
V minulosti byla aplikace metod nelineárnı́ho řı́zenı́ obtı́žná, rychlá výpočetnı́ technika však dnes
umožňuje jejich praktické využitı́. To vyvolalo také velký zájem o nelineárnı́ problémy, jejich výzkum
a aplikaci.
Vzhledem k velmi rozsáhlé problematice nelineárnı́ch systémů se můžeme v omezeném rozsahu
skripta zabývat jen základnı́mi metodami analýzy dynamických systémů a některými vybranými
metodami, které umožňujı́ syntézu nelineárnı́ch řı́dı́cı́ch systémů. V prvnı́ části skripta budeme
předpokládat, že nelineárnı́ systém je popsán matematickými vztahy a budeme provádět analýzu
jeho chovánı́, vyšetřovat přechodné jevy, ustálené stavy a jejich stabilitu při změnách počátečnı́ch
podmı́nek a parametrů, možnost vzniku chaotického chovánı́, apod.
V kapitolách 14 a 15 uvedeme některé metody syntézy vhodného řı́zenı́ dané nelineárnı́ regulované
soustavy. Všimneme si jednoduchých možnostı́ řı́zenı́ pomocı́ lineárnı́ch a nelineárnı́ch spojitých i
nespojitých regulátorů. Většı́ pozornost budeme věnovat metodám tzv. zpětnovazebnı́ linearizace,
která na rozdı́l od jednoduché linearizace kolem pracovnı́ho bodu se snažı́ linearizovat daný nelineárnı́
systém ve většı́m pracovnı́m rozsahu, nebo dokonce i globálně. Tento přı́stup k syntéze řı́zenı́ nám
pak umožnı́ návrh regulátoru pomocı́ velmi dobře propracovaných metod řı́zenı́ lineárnı́ch systémů.
Poslednı́ kapitola skript je věnována některým problémům identifikace nelineárnı́ch systémů.
1.1
Nelineárnı́ prvky a jejich charakteristiky
Nelineárnı́ systémy jsou složeny obvykle z různých lineárnı́ch a nelineárnı́ch členů. Tyto členy mohou
být popsány bud’ algebraickými rovnicemi (tzv. statické členy) nebo diferenciálnı́mi rovnicemi (dynamické členy). V matematických modelech fyzikálnı́ch, biologických a jiných objektů se vyskytuje
množstvı́ nejrůznějšı́ch typů nelineárnı́ch členů. Z důvodů omezeného prostoru si všimneme pouze
typických nelinearit, které se nejčastěji vyskytujı́ v řı́dı́cı́ technice. Mnohé dalšı́ nelinearity uvidı́me v
některých konkrétnı́ch přı́kladech v různých částech skripta.
Statické prvky jsou takové, u nichž výstup závisı́ jen na okamžitých vstupnı́ch hodnotách a nikoliv
na jejich derivacı́ch nebo integrálech. Takové prvky mohou být popsány
a) statickou charakteristikou
b) tabulkou hodnot (pro numerické zpracovánı́)
c) analytickým výrazem y = φ(x). Pro účely analytického vyjádřenı́ nelineárnı́ch charakteristik se
použı́vajı́ jednoduché aproximace nelinearity v pracovnı́ oblasti (odst.2.2.1).
KAPITOLA 1. ÚVOD
3
V regulačnı́ technice se vyskytujı́ velmi často členy s těmito typy nelineárnı́ch charakteristik:
a) Charakteristika typu nasycenı́ (obr.1.1a) se vyskytuje u různých snı́mačů a zesilovačů, jako
nasycenı́ se projevujı́ dorazy u mechanických systémů, omezenı́ rychlosti u servomotorů apod. Pro
výpočetnı́ účely se skutečný průběh křivky často nahrazuje lomenou charakteristikou (obr.1.1b).
b) Charakteristika s pásmem necitlivosti (obr.1.1c). Tuto charakteristiku majı́ např. snı́mače,
které majı́ nulový výstup při malých vstupnı́ch signálech (např. vlivem třenı́), hydraulické zesilovače s
překrytı́m v rozvodu, některé systémy s vůlı́ v mechanických členech, servomotory při nı́zkém vstupnı́m
napětı́ apod.
Obr.1.1. Základnı́ typy nelineárnı́ch charakteristik.
c) Hystereznı́ charakteristika se vyskytuje u regulačnı́ch členů se železem (servomotory). Podobnou charakteristiku majı́ za určitých podmı́nek také členy se suchým třenı́m nebo s vůlı́ v převodech
(obr.1.1d).
d) Charakteristika třenı́ (obr.1.1e). Sı́la nebo moment třenı́ závisı́ na rychlosti pohybu. U dynamického rotačnı́ho systému s třenı́m rozlišujeme klidové třenı́ M0 (tzv. statické třenı́, přilnavost) a
třenı́ za pohybu, tzv. suché nebo Coulombovo třenı́ Mc . Má-li dynamický systém ještě lineárnı́ viskóznı́
tlumenı́, které také závisı́ na rychlosti, je výsledný tlumı́cı́ moment MT L kombinacı́ vlivu lineárnı́ho
tlumenı́ a nelineárnı́ho třenı́ (obr.1.1f).
e) Charakteristiky reléového typu jsou nespojité funkce, u nichž se výstup měnı́ skokem při
určité hodnotě spojitě se měnı́cı́ho vstupu. Charakteristiky jsou bud’ dvoupolohové bez hystereze
nebo s hysterezı́ (obr.1.1g) nebo trojpolohové (s pásmem necitlivosti) bez hystereze nebo s hysterezı́
(obr.1.1h). Zakreslené charakteristiky jsou symetrické, často však mohou být nesymetrické vzhledem
k jedné nebo oběma osám. Výjı́mečně se vyskytujı́ také charakteristiky vı́cepolohové.
f) Charakteristiky s obecným průběhem majı́ např. různé elektronické prvky (diody, tranzis-
KAPITOLA 1. ÚVOD
4
tory, varistory, tyristory, doutnavky, nelineárnı́ kondenzátory a cı́vky aj.), které byly probı́rány v teorii
obvodů. Obecné průběhy charakteristik majı́ také mnohé snı́mače fyzikálnı́ch veličin (teplot, průtoků
aj.), akčnı́ členy (ventily) apod.
Převážná část uvedených nelinearit se vyskytuje v regulačnı́m obvodu u regulátorů (snı́mače, zesilovače, servomotory, ventily), kde jsou obvykle snadno měřitelné a dajı́ se často vyjádřit statickou
charakteristikou. Velké množstvı́ nelinearit se ovšem vyskytuje v regulovaných soustavách, při regulaci
teplot, hladin, průtoků, tlaku, koncentrace, polohy aj. Fyzikálnı́, chemické, biologické a jiné systémy
obsahujı́ mnoho nelinearit a jejich identifikace a matematický popis jsou mnohdy velmi obtı́žné.
Nelineárnı́ prvky se v regulačnı́ technice dělı́ také někdy zhruba do dvou velkých skupin. Jsou
to jednak přirozené nelinearity, které se někdy také nazývajı́ parazitnı́ a nelinearity úmyslně
zaváděné. Prvnı́ z nich jsou v obvodech mnohdy nežádoucı́ a snažı́me se je vyloučit vylepšenou
konstrukcı́ nebo kompenzovat vhodným návrhem regulátoru. Druhé do obvodů úmyslně zavádı́me,
abychom vytvořili bud’ jednoduché a levné řı́zené systémy (např. pomocı́ dvoupolohových nebo trojpolohových prvků) nebo kompenzovali jiné nelinearity nebo realizovali různé optimálnı́ a suboptimálnı́
systémy. Mnohé nelinearity nemůžeme ovšem jednoznačně zařadit do určité skupiny. Např. nasycenı́
bude nevýhodné, jestliže snı́žı́ rychlost odezvy systému, jindy ho však úmyslně zavedeme pro zlepšenı́
stupně stability obvodu apod.
1.2
Nelineárnı́ dynamické systémy
Nelineárnı́ systémy, které jsou složeny pouze ze statických prvků, jsou podrobně probı́rány v teorii
obvodů a nebudeme se jimi v tomto textu zabývat. Dále budeme uvažovat pouze dynamické nelineárnı́
systémy, které obsahujı́ obvykle různé lineárnı́ členy a jednu nebo většı́ počet nelinearit. V nelineárnı́ch
systémech může vzniknout velké množstvı́ různých jevů, které se nevyskytujı́ v systémech lineárnı́ch.
Připomeňme si proto nejprve stručně vlastnosti lineárnı́ch systémů.
Nebuzený lineárnı́ systém ẋ = Ax s regulárnı́ maticı́ A má jeden rovnovážný stav v počátku
souřadnic, který je stabilnı́, majı́-li všechna vlastnı́ čı́sla matice A zápornou reálnou část. Tato stabilita
nezávisı́ na počátečnı́ch podmı́nkách. Přechodný jev lineárnı́ho systému je složen z přirozených módů
systému a obecné řešenı́ lze zı́skat analyticky.
Buzený systém ẋ = Ax + Bu má při ohraničeném vstupu ohraničený výstup, jestliže nebuzený
systém je asymptoticky stabilnı́. Připojı́me-li na vstup vnějšı́ harmonický signál, bude v ustáleném
stavu na výstupu rovněž harmonický signál o stejné frekvenci.
Protože u lineárnı́ch systémů platı́ princip superpozice, můžeme k popisu použı́t operátorového a
frekvenčnı́ho přenosu, frekvenčnı́ charakteristiky nebo odezvy na specifický či obecný vstupnı́ signál.
Chovánı́ nelineárnı́ho systému je mnohem komplikovanějšı́. Protože zde neplatı́ princip superpozice, nemůžeme využı́t operátorových a frekvenčnı́ch metod. Rovněž popis systému odezvou na
specifický nebo obecný vstupnı́ signál je nevýhodný, protože chovánı́ závisı́ na typu signálu a jeho
parametrech.
Nebuzený nelineárnı́ systém může mı́t libovolný počet rovnovážných stavů, mohou v něm vzniknout ustálené kmity, které se nazývajı́ samovolně buzené kmity nebo autooscilace.Ty nejsou vybuzeny vnějšı́m periodickým signálem, ale jsou dány jen vlastnostmi nebuzeného systému. V některých
nelineárnı́ch systémech mohou vzniknout kvaziperiodické kmity nebo chaotické chovánı́. V čl.1.3 si
ukážeme některé tyto jevy na přı́kladu. Definice a podrobné rozbory uvedených jevů budou náplnı́
dalšı́ch kapitol.
KAPITOLA 1. ÚVOD
1.2.1
5
Rozdělenı́ nelineárnı́ch systémů
Nelineárnı́ systémy můžeme dělit podle různých kritériı́.
1. Podle vazby k okolı́ se rozlišujı́ tři druhy systémů:
a) izolovaný systém, u něhož nedocházı́ k výměně energie a hmoty s okolı́m. Izolovaný
systém dosahuje časově nezávislého ustáleného stavu, který se nazývá rovnovážný. V něm všechny
makroskopické procesy ustanou a všechny makroskopické veličiny zůstávajı́ konstantnı́;
b) uzavřený systém, který umožňuje pouze výměnu energie s okolı́m, k výměně hmoty nedocházı́;
c) otevřený systém, který vyměňuje s okolı́m energii i hmotu.
Uzavřené a otevřené systémy mohou za určitých podmı́nek dosáhnout časově nezávislého
ustáleného stavu, v němž makroskopické veličiny zůstávajı́ konstantnı́, ale procesy přı́jmu a výdeje
energie nebo i hmoty probı́hajı́. Takový ustálený stav se nazývá stacionárnı́. (V literatuře se tento
pojem použı́vá často i pro stav rovnovážný).
2. Podle přı́tomnosti paměti v systému rozlišujeme systémy statické (bez paměti), u nichž všechny
vnitřnı́ veličiny jsou jednoznačně určeny okamžitými hodnotami vstupnı́ch veličin a systémy dynamické
(s pamětı́), u nichž okamžitá hodnota vnitřnı́ch veličin závisı́ na okamžitých i minulých hodnotách
vstupů.
3. Podle závislosti na čase dělı́me systémy na autonomnı́, které nezávisı́ explicitně na čase (např.
systémy nebuzené a časově invariantnı́) a systémy neautonomnı́, které jsou bud’ buzené nebo časově
variantnı́ nebo obojı́.
4. Podle dalšı́ch kritériı́ můžeme dělit nelineárnı́ systémy např. na deterministické nebo stochastické, se soustředěnými parametry nebo s rozloženými (rozdělenými) parametry, se spojitým časem
nebo s diskrétnı́m časem, nebuzené nebo buzené, neřı́zené nebo řı́zené, konzervativnı́ nebo disipativnı́,
neadaptivnı́ nebo adaptivnı́, bez učenı́ nebo s učenı́m aj.
1.2.2
Matematický popis nelineárnı́ch systémů
1. Nelineárnı́ systémy se spojitým časem
a) Obyčejné nelineárnı́ diferenciálnı́ rovnice popisujı́ systémy se soustředěnými parametry a
spojitým časem. Použı́vá se nejčastěji zápis ve formě soustavy diferenciálnı́ch rovnic 1.řádu
ẋ = f (x) - autonomnı́ systém (nebuzený, časově invariantnı́)
ẋ = f (t, x) - neautonomnı́ systém (nebuzený, časově variantnı́).
ẋ = f (x, u) - neautonomnı́ systém (buzený, časově invariantnı́)
ẋ = f (t, x, u) - neautonomnı́ systém (buzený, časově variantnı́).
Buzený nelineárnı́ systém v obecném tvaru ẋ = f (t, x, u) je obtı́žně řešitelný v uzavřeném tvaru,
v praxi se však většinou setkáváme s jednoduššı́m typem systému, který nezávisı́ explicitně na čase
ẋ = f (x) + g(x)u.
Je to tzv. affinnı́ systém (systém lineárnı́ v řı́zenı́), který budeme použı́vat zejména při syntéze řı́zenı́
v kap.15.
Speciálnı́ tvar má také bilineárnı́ systém
ẋ = Ax +
m
X
B j xuj ,
j=1
kde A, B j jsou matice rozměru (n × n). Např. bilineárnı́ systém pro dvě stavové a jednu vstupnı́
KAPITOLA 1. ÚVOD
6
proměnnou má tvar
x˙1 = a11 x1 + a12 x2 + (b11 x1 + b12 x2 )u
x˙2 = a21 x1 + a22 x2 + (b21 x1 + b22 x2 )u
V dalšı́ch kapitolách se setkáme ještě s jinými typy systémů, které majı́ speciálnı́ vlastnosti. Jsou to
např. gradientnı́ konzervativnı́, disipativnı́, symetrické a jiné systémy, které budou podrobněji popsány
v kap.6.
Poznámka: Rozdělenı́ systémů na buzené a nebuzené nenı́ přı́liš přesné. Jestliže v systému ẋ =
f (t, x, u) je vstup u specifikován, přejde rovnice na tvar ẋ = f (t, x), který může tedy popisovat dva
přı́pady: a) nenı́ vnějšı́ vstup do systému nebo b) je vnějšı́ vstup, ale je udržován na pevné hodnotě
během studia chovánı́ systému.
b) Parciálnı́ nelineárnı́ diferenciálnı́ rovnice popisujı́ systémy s rozloženými parametry. Jsou to
např. rovnice přenosu tepla a hmoty, Navierovy-Stokesovy rovnice v hydrodynamice, rovnice difúze,
absorpce, rovnice popisujı́cı́ populačnı́ systémy v biologii a ekologii aj. Nelineárnı́mi systémy, které
vedou na parciálnı́ diferenciálnı́ rovnice, se pro omezený rozsah skripta nebudeme zabývat.
2. Nelineárnı́ systémy s diskrétnı́m časem jsou popsány diferenčnı́mi rovnicemi, obecně nelineárnı́
soustavou rovnic prvnı́ho řádu
x(k + 1) = f [k, x(k), u(k)]
y(k) = g[k, x(k), u(k)].
Nelineárnı́ diskrétnı́ systémy budou uvedeny v kap.9.
1.3
Sestavovánı́ rovnic nelineárnı́ch systémů
Chceme-li provádět analýzu nebo syntézu složitých nelineárnı́ch systémů, je výhodné rozdělit systém na
jednotlivé a co nejjednoduššı́ prvky a ty pak popisovat algebraickými nebo diferenciálnı́mi rovnicemi.
Rovnice sestavujeme na základě známých zákonů, jako jsou např. zákony o zachovánı́ hmoty a energie,
Newtonovy zákony, d’Alembertův princip, Kirchhoffovy zákony apod. Výhodné je také použı́t metodu
vazebnı́ch grafů, která je podrobně rozpracována a doložena mnoha přı́klady v [3]. Zı́skané rovnice
převádı́me na soustavu nelineárnı́ch diferenciálnı́ch rovnic 1.řádu.
Obsahuje-li nelineárnı́ systém velký počet nelinearit, snažı́me se obvykle v prvnı́m přiblı́ženı́ některé
nelinearity linearizovat. V obvodech pak zůstanou jen podstatné nelinearity, které linearizovat nelze,
např. prvky s nespojitými charakteristikami reléového typu apod.
V základnı́ch kurzech teorie automatického řı́zenı́ byly probı́rány různé mechanické a elektrické
regulované soustavy a odvozovány jejich matematické modely. Uved’me zde proto jiný přı́klad na sestavenı́ rovnic, a to tepelně-chemický systém, který je současně velmi vhodný pro studium různých jevů
vznikajı́cı́ch ve složitém nelineárnı́m systému. Podrobný rozbor vlastnostı́ tohoto systému je např. v
[2].
Přı́klad 1.1. Průtočné reaktory jsou nádoby, do nichž se kontinuálně přivádějı́ výchozı́ látky, v reaktoru probı́hajı́ chemické reakce, a na výstupu se kontinuálně odebı́rá směs produktů. Předpokládejme,
že do mı́chaného průtočného reaktoru (obr. 1.2) přicházı́ jen jedna vstupnı́ látka A s koncentraci cA1
[kg m−3 ]. Tato látka se v reaktoru rozkládá podle chemické reakce prvnı́ho řádu a na výstupu reaktoru odcházı́ s koncentracı́ cA . Látka A vstupuje do reaktoru při teplotě T1 [K], přı́toku F [m3 s−1 ],
konstantnı́ hustotě ρ [kg m−3 ] a konstantnı́m měrném teple cp [J kg−1 ]. Dále budeme předpokládat,
že v reaktoru probı́há jediná exotermická chemická reakce, směs v reaktoru je dokonale promı́chávána
a reakčnı́ objem V [m3 ] je konstantnı́. Koncentrace reakčnı́ složky v reaktoru i na jeho výstupu je cA
[kg m−3 ], teplota v reaktoru i na výstupu je T [K], teplota chladiva Tc [K], jeho průtok Fc [m3 s−1 ].
KAPITOLA 1. ÚVOD
7
')(+*, -*,/.0,'21
3
!#"%$&
')(4, -5, .0,'61
3 ,- 7 /8
/!7# !#" $&
Obr. 1.2. Mı́chaný průtočný reaktor.
Uvažujme dále počátečnı́ podmı́nky cA (0) a T (0) pro t = 0. Budeme předpokládat, že v reaktoru
probı́há reakce 1.řádu s reakčnı́ rychlostı́ r = kcA . Rychlostnı́ konstanta k je funkcı́ teploty v reaktoru
podle Arrheniova vztahu
E
k = k∞ exp(−
),
(1.1)
RT
kde E je aktivačnı́ energie a R univerzálnı́ plynová konstanta.
Při vytvářenı́ matematického modelu reaktoru se uvažuje látková a entalpická (energetická) bilance.
Látková bilance se sestavuje pro zvolenou složku reakčnı́ směsi, která je v našem přı́padě jediná.
Bilanci této složky A lze vyjádřit obecně ve tvaru: akumulace = přı́vod - spotřeba nebo rozepsaně: (změna množstvı́ A v reaktoru za časovou jednotku) = (množstvı́ A přivedené do reaktoru
za čas.jednotku) - (množstvı́ A odvedené z reaktoru za čas.jednotku) - (množstvı́ A spotřebované při
reakci za čas.jednotku).
Látkovou bilanci lze pak popsat diferenciálnı́ rovnicı́
V
dcA
E
= F (cA1 − cA ) − k∞ cA V exp(−
),
dt
RT
(1.2)
uvažujeme-li reakci 1.řádu a závislost rychlostnı́ konstanty na teplotě podle Arrheniova vztahu (1.1).
Entalpická bilance (pro izobarický proces) je vyjádřena obecně zase ve tvaru: akumulace = přı́vod
- spotřeba. Jestliže se tepelná energie při reakci uvolňuje nebo spotřebovává a k přenosu tepla docházı́
pouze vedenı́m a prouděnı́m, lze sestavit bilanci:
(časová změna tepla v reaktoru) = (teplo přivedené za jednotku času) - (teplo odvedené výstupnı́m
proudem za jednotku času) - (teplo vyměněné stěnou reaktoru za jednotku času) + (teplo uvolněné
při chemické přeměně za jednotku času). Pro konstantnı́ reakčnı́ objem V a konstantnı́ hustotu ρ lze
psát entalpickou bilanci (při splněnı́ některých dalšı́ch podmı́nek, podrobnosti viz [2])
ρV cp
dT
E
= ρF cp (T1 − T ) − kS(T − Tc ) + (−∆Hr )k∞ cA V exp(−
),
dt
RT
(1.3)
kde T1 je teplota na vstupu do reaktoru, T teplota v reaktoru a na jeho výstupu, Tc teplota chladiva,
cp měrné teplo při konstantnı́m tlaku, k součinitel přestupu tepla, S plocha přestupu a ∆Hr reakčnı́
entalpie.
KAPITOLA 1. ÚVOD
8
Rovnice (1.2) a (1.3) představujı́ soustavu dvou nelineárnı́ch diferenciálnı́ch rovnic pro stavové
proměnné cA a T . Proved’me nynı́ rozbor vlastnostı́ tohoto systému pro různé přı́pady.
1. Izotermický systém. Teplotu v reaktoru uvažujeme konstantnı́. Lze to provést řı́zenı́m teploty
reaktoru pomocı́ chladı́cı́ho systému. Jestliže T = konst., zůstává pouze rovnice (1.2) pro látkovou
bilanci, rovnice (1.3) pro entalpickou bilanci odpadá.
a) Lineárnı́ buzený systém s konstantnı́mi parametry
dcA
F
= (cA1 − cA ) − k1 cA
dt
V
(1.4)
může mı́t řı́zenı́ cA1 bud’ konstantnı́ nebo časově proměnné. Pro cA1 = konst. je stacionárnı́ stav
(dcA /dt = 0)
F cA1
cA =
F + k1 V
Řešenı́ rovnice (1.4) pro různé počátečnı́ podmı́nky cA (0) je na obr. 1.3. Zvolme cA1 =konst., F =
konst. a označme střednı́ dobu prodlenı́ τ = V /F . Pak lineárnı́ rovnice (1.4) má řešenı́




t
cA1
cA (0) −(1 + k1 τ ) 
τ .
1 − 1 − (1 + k1 τ )
e
cA (t) =

1 + k1 τ 
cA1


(1.5)
Pro t → ∞ se řešenı́ blı́žı́ stacionárnı́mu řešenı́ cA = cA1 /(1 + k1 τ ). Na obr.1.4 je znázorněna závislost
stacionárnı́ho řešenı́ na střednı́ době prodlenı́ τ (diagram řešenı́). U lineárnı́ho systému je pro každou
hodnotu parametru τ řešenı́ jediné.
Bude-li vstupnı́ koncentrace do reaktoru časově proměnná, např. ve tvaru periodické funkce
cA1 (t) = A sin ωt, bude stavová veličina cA také sinovou funkcı́ času s jinou amplitudou a fázovým
posuvem.
Obr.1.3. Závislost koncentrace na čase.
0br.1.4. Závislost na době prodlenı́.
b) Lineárnı́ systém s časově proměnnými parametry vznikne např. při pozvolné deaktivaci
katalyzátoru, kdy klesá rychlostnı́ konstanta k1 podle vztahu k1 (t) = k10 (1 − αt), kde α je velmi malé
kladné čı́slo. Pak (1.4) přejde na
F
dcA
= (cA1 − cA ) − k1 (t)cA .
dt
V
(1.6)
c) Nelineárnı́ buzený systém vznikne např. tehdy, jestliže vstupnı́ koncentrace cA1 bude konstantnı́ a reakce bude řı́zena změnou průtoku F . Aby vynikl vztah mezi obecným značenı́m uvedeným
KAPITOLA 1. ÚVOD
9
v čl. 1.2.2 a použitými symboly v přı́kladu, označme řı́zenı́ F ≡ u a cA ≡ x. Pak můžeme rovnici (1.4)
psát ve tvaru
1
(1.7)
ẋ = −k1 x + (cA1 − x)u.
V
Systém je nynı́ v nelineárnı́m afinnı́m tvaru ẋ = f (x) + g(x)u.
2. Neizotermický systém. Nebude-li v reaktoru udržována konstantnı́ teplota během reakce, vznikne
neizotermický systém a musı́me uvažovat i rovnici (1.3) pro entalpickou bilanci. Systém má nynı́ dvě
stavové proměnné cA a T a je popsán dvěma nelineárnı́mi diferenciálnı́mi rovnicemi 1. řádu. Simulacı́
systému zı́skáme tyto výsledky:
Vstupnı́ koncentrace cA1 = konst. V závislosti na hodnotách parametrů rovnic mohou nastat tyto
tři přı́pady:
a) v reaktoru existuje jeden nestabilnı́ stacionárnı́ stav (cA , T ), od kterého se řešenı́ vzdaluje a po
ustálenı́ vznikajı́ trvalé oscilace koncentrace i teploty;
b) v reaktoru existujı́ tři stacionárnı́ stavy, jeden nestabilnı́ a dva stabilnı́. V závislosti na
počátečnı́ch podmı́nkách směřuje řešenı́ do jednoho ze stabilnı́ch stavů;
c) v reaktoru existujı́ tři stacionárnı́ stavy (jeden stabilnı́ a dva nestabilnı́) a jedno stabilnı́ periodické řešenı́.
Vstupnı́ koncentrace je časově proměnná. Bude-li vstupnı́ koncentrace cA1 periodicky proměnná,
pak mohou vzniknout tři odlišné typy výstupnı́ch průběhů cA a T . Výstup může být periodický,
kvaziperiodický (časový průběh vykazuje např. dvě periodicity) nebo chaotický, kdy výstup se zcela
nepravidelně měnı́.
Z uvedeného přı́kladu je patrno, že i u relativně jednoduchého dvourozměrného nelineárnı́ho
systému se setkáváme s celou řadou jevů, které nemohou v lineárnı́ch systémech nastat. V dalšı́ch
kapitolách se jimi budeme zabývat podrobněji.
Kapitola 2
Základnı́ vlastnosti nelineárnı́ch
systémů
2.1
Základnı́ pojmy
1. Autonomnı́ systémy
Velké množstvı́ fyzikálnı́ch, chemických, biologických a jiných systémů lze popsat soustavou homogennı́ch obyčejných diferenciálnı́ch rovnic 1. řádu
ẋ1 = f1 (x1 , ..., xn )
ẋ2 = f2 (x1 , ..., xn )
...
ẋn = fn (x1 , ..., xn ),
(2.1)
ve vektorovém zápisu ẋ = f (x), kde fi , i = 1, ..., n jsou reálné funkce n reálných proměnných.
Vektor x(t) = (x1 (t), ..., xn (t)) ∈ Rn a f : Rn → Rn je zobrazenı́ třı́dy C r , r ≥ 1. Soustavu (2.1)
můžeme interpretovat jako matematický model reálného dynamického systému a pak x(t) je stav
tohoto systému. Prostor Rn se nazývá stavový nebo fázový prostor systému (2.1) a zobrazenı́ f lze
chápat jako vektorové pole na Rn . Každému bodu x ∈ Rn je přiřazen vektor f (x), který z bodu
vycházı́. Tento vektor udává rychlost změny stavu ẋ = dx/dt (fázová rychlost).
Mnoho praktických problémů vede na autonomnı́ systém ẋ = f (x), kde f : M → Rn je zobrazenı́
definované na podmnožině M ⊆ Rn . Touto podmnožinou může být nějaká křivka nebo plocha v Rn ,
obecně diferencovatelná varieta. Některé přı́klady na tyto variety budou uvedeny v dalšı́m textu. Zatı́m
můžeme pro jednoduchost předpokládat, že vektorové pole f je definováno v celém prostoru Rn .
Řešenı́ diferenciálnı́ rovnice ẋ = f (x) je diferencovatelné zobrazenı́ ϕ : I → Rn intervalu
I = {t ∈ R, a < t < b} do stavového prostoru Rn , které pro všechna t ∈ I vyhovuje soustavě
d
[ϕ(t)] = f (ϕ(t)).
dt
Pro jednoduchost budeme dále předpokládat, že řešenı́ je definováno pro všechny časy t ∈ R. Protože
vektorové pole f nezávisı́ na čase (je invariantnı́ vzhledem k posunutı́ času), můžeme počátečnı́ čas
uvažovat vždy rovný nule. Počátečnı́ podmı́nka je pak x(0) = x0 .
Zobrazenı́ ϕ(t) ∀t se také nazývá pohyb bodu a jeho znázorněnı́ ve stavovém (fázovém) prostoru
je stavová (fázová) trajektorie (fázová křivka, orbita). Součin R × Rn je rozšı́řený stavový
prostor, graf řešenı́ v R × Rn je tzv. integrálnı́ křivka.
Řešenı́ diferenciálnı́ rovnice s počátečnı́ podmı́nkou x0 vyžaduje tedy nalezenı́ funkce ϕ(t) takové,
že křivka x = ϕ(t) ležı́cı́ v Rn a parametrizovaná časem t, procházı́ bodem x0 a má v každém svém
bodě x právě f (x) jako tečný vektor. Množina těchto tečných vektorů se nazývá směrové pole.
Podobně i integrálnı́ křivka jako graf zobrazenı́ x = ϕ(t) v R × Rn má v každém bodě (t, ϕ(t)) tečnu,
jejı́ž sklony vůči osám t, x jsou (1, f (x)).
10
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
11
Poznámka: V dalšı́m budeme mı́sto obecného označenı́ ϕ(t) psát zjednodušeně x(t) nebo x(t, x0 ).
Jsou-li splněny podmı́nky existence a jednoznačnosti, má rovnice ẋ = f (x) jediné řešenı́ vyhovujı́cı́
zadané počátečnı́ podmı́nce x0 . Každým regulárnı́m bodem stavového prostoru procházı́ tedy pouze
jedna trajektorie, trajektorie se zde nemohou protı́nat ani se vzájemně dotýkat.
Soubor všech řešenı́ x(t) pro všechny možné počátečnı́ podmı́nky lze vyjádřit souhrnným pojmem
(fázový) tok Φ vektorového pole f , resp. tok diferenciálnı́ rovnice ẋ = f (x). Tok je zobrazenı́,
které přiřazuje danému x0 a danému času t hodnotu řešenı́ x(t), které má jako počátečnı́ stav x0 , tj.
Φ(t, x0 ) = x(t) nebo zkráceně Φt = x(t). Pro tok platı́ Φt2 (Φt1 (x0 )) = Φt1 +t2 (x0 ). Známe-li tedy
řešenı́ x(t1 ) s počátečnı́m stavem x(t0 ) = x0 , pak řešenı́ x(t2 ) s počátečnı́m stavem x(t1 ) je totožné s
řešenı́m x(t1 + t2 ) s počátečnı́m stavem x(t0 ). Trajektorie generované tokem Φ se nikde neprotı́najı́.
Diferenciálnı́ rovnice, které majı́ globálnı́ tok, jsou vždy reverzibilnı́ v čase.
Objasněme si pojem toku nejprve na jednoduchém lineárnı́m autonomnı́m systému. Systém 1. řádu
ẋ = −kx, k > 0, x(0) = x0 , má řešenı́ x(t) = e−kt x0 . Zobrazenı́ Φt : R → R převede stav x0 na stav
x(t) v čase t
Φt x0 = e−kt x0
⇒
Φt = e−kt
Fázový tok odpovı́dajı́cı́ rovnici ẋ = −kx je tedy e−kt . Podobně u vektorové lineárnı́ rovnice ẋ = Ax
je fázový tok Φt = eAt . Z přı́kladů je patrno, že je-li znám tok soustavy, pak jsou známa všechna
řešenı́ soustavy x(t) = Φt x0 .
U nelineárnı́ch systémů je analytické vyjádřenı́ toku obtı́žné, proto nebudeme otázky existence a
určenı́ toku pro danou nelineárnı́ rovnici zkoumat a budeme pouze předpokládat, že jejı́ tok existuje.
Při kvalitativnı́ analýze nelineárnı́ch systémů nás zajı́majı́ předevšı́m ustálené stavy, jejich typy a
stabilita. U autonomnı́ch systémů mohou být ustálené stavy rovnovážné, periodické nebo kvaziperiodické. Některé nelineárnı́ systémy vykazujı́ chaotické chovánı́. Podrobnějšı́ výklad těchto přı́padů bude
podán v čl.2.3 a v některých dalšı́ch kapitolách. Zde si pro ilustraci provedeme jen některé základnı́
úvahy.
Problémy reálných dynamických systémů lze formulovat v různé terminologii. Můžeme zůstat u
terminologie klasického pojetı́ diferenciálnı́ch rovnic nebo můžeme formulovat problém pomocı́ vektorových polı́ nebo také pomocı́ toků. Jak uvidı́me v dalšı́ch kapitolách lze některé problémy teorie
nelineárnı́ch systémů výhodně formulovat v pojmech klasické teorie diferenciálnı́ch rovnic, jindy je
výhodnějšı́ využı́t terminologie toků. Mnohé problémy lze zase velmi názorně řešit a zobrazovat pomocı́ vektorových polı́.
Analýza nelineárnı́ch dynamických systémů začı́ná nejčastěji určovánı́m rovnovážných stavů a
proto si jako přı́klad různých formulacı́ uved’me definici těchto stavů.
Definice 2.1. Mějme soustavu diferenciálnı́ch rovnic ẋ = f (x) a necht’ Φt je jejı́ tok. Pak
a) bod x ∈ Rn , pro který platı́ f (x) = 0 je singulárnı́ bod soustavy diferenciálnı́ch rovnic (také
stacionárnı́ bod nebo stacionárnı́ řešenı́);
b) bod x je nulový bod funkce f neboli rovnovážný stav vektorového pole f (x), resp. rovnovážný
(klidový) stav dynamického systému popsaného rovnicı́ ẋ = f (x);
c) bod x ∈ Rn , pro který platı́ Φt x = x ∀t ∈ R, se nazývá pevný bod toku.
Pojmy singulárnı́ bod, stacionárnı́ bod, rovnovážný stav nebo pevný bod se proto často vzájemně
zaměňujı́.
Kromě rovnovážných stavů mohou u autonomnı́ch systémů od 2. řádu výše existovat uzavřené
trajektorie (periodické orbity).
Definice 2.2. Periodická orbita γ se základnı́ periodou T > 0 je řešenı́, pro které platı́ x(t) =
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
12
x(t + T ), tj. x(T ) = x(0) a x(t) 6= x(0) pro 0 < t < T . Řešenı́ s počátečnı́ podmı́nkou x(0) ∈ γ je
periodické řešenı́ s periodou T .
Speciálnı́ přı́pad periodických trajektoriı́ představujı́ homoklinické a heteroklinické trajektorie.
Homoklinická trajektorie přı́slušná k rovnovážnému bodu x je trajektorie, která se asymptoticky
blı́žı́ k x v čase t → ∞. Je to uzavřená křivka, která z bodu x vycházı́ a zase se do něho vracı́. Čas,
který potřebuje fázový bod k oběhu homoklinické trajektorie, je nekonečně velký, rychlost pohybu se
v blı́zkosti x blı́žı́ k nule. Homoklinickou orbitu lze chápat jako periodickou trajektorii s nekonečně
velkou periodou.
Heteroklinická trajektorie mezi dvěma stacionárnı́mi body x1 , x2 je trajektorie, která vycházı́ z
jednoho bodu a končı́ ve druhém. Existujı́-li dvě heteroklinické orbity, z bodu x1 do x2 a z x2 do x1 ,
pak se vytvořı́ smyčka, která zase představuje periodickou orbitu s nekonečně velkou periodou.
Obecné trajektorie toku mohou mı́t velmi složité vlastnosti, které budeme podrobněji rozebı́rat v
dalšı́ch kapitolách. Zde si uvedeme pouze dva pojmy, které budeme později potřebovat.
Definice 2.3. Necht’ Φ je tok soustavy (2.1) a γ je trajektorie procházejı́cı́ bodem x0 .
a) Bod y ∈ Rn je ω-limitnı́ bod trajektorie γ, jestliže existuje taková posloupnost reálných čı́sel
{tk }∞
k=1 , limk→∞ tk = +∞, že limk→∞ Φ(tk , x0 ) = y. Množina ω(γ) všech ω-limitnı́ch bodů dané
trajektorie γ se nazývá ω-limitnı́ množina trajektorie γ.
b) Bod z ∈ Rn je α-limitnı́ bod trajektorie γ, jestliže existuje taková posloupnost reálných čı́sel
{tk }∞
k=1 , limk→∞ tk = −∞, že limk→∞ Φ(tk , x0 ) = z. Množina α(γ) všech α-limitnı́ch bodů dané
trajektorie γ se nazývá α-limitnı́ množina trajektorie γ.
Přı́klady: Trajektorie γ, která limituje do rovnovážného bodu x, má množinu svých ω-limitnı́ch
bodů jednobodovou, tj. ω(γ) = x. Trajektorie γ, která limituje k uzavřenému meznı́mu cyklu γ, má
ω(γ(x0 )) = γ. Každý bod y ∈ γ je ω-limitnı́m bodem trajektorie γ(x0 ).
Systém (2.1) se po zadánı́ počátečnı́ podmı́nky bude pohybovat po určité trajektorii k
rovnovážnému bodu nebo k periodické orbitě (pokud jsou stabilnı́) nebo k nějakému složitějšı́mu
limitnı́mu objektu. Po uplynutı́ dostatečně dlouhého času se fázový bod dostane do blı́zkého okolı́
limitnı́ množiny. Přechodné jevy ztrácejı́ proto svou důležitost ve srovnánı́ s limitnı́ množinou. Proto
nás bude zajı́mat předevšı́m asymptotické chovánı́ na těchto limitnı́ch množinách a v jejich blı́zkém
okolı́. Limitnı́ objekty majı́ výhodnou vlastnost, kterou je invariantnost vzhledem k toku.
Definice 2.4. Invariantnı́ množina S toku Φt je množina S ⊂ Rn , pro kterou platı́ implikace
x ∈ S ⇒ Φt (x) ∈ S pro všechna t ∈ R. (Formálně lze také psát Φt (S) = S).
Je-li S invariantnı́ množina systému (2.1), pak každá trajektorie, která procházı́ bodem x ∈ S,
ležı́ celá v S. Např. rovnovážný stav je jednobodová invariantnı́ množina, každá individuálnı́ trajektorie (tedy i uzavřená trajektorie) je invariantnı́ množina. Invariantnı́ množiny mohou být i
vı́cedimenzionálnı́, obecně mohou mı́t i tutéž dimenzi jako stavový prostor. Některé dalšı́ přı́klady
budou uvedeny v kap.4.
Důležitý typ limitnı́ množiny je atraktor. V literatuře existuje vı́ce definic atraktoru, protože atraktor může být velice komplikovanou množinou. Pro naše účely bude stačit tato definice:
Definice 2.5. Uzavřená invariantnı́ množina A ⊂ Rn se nazývá atraktor, existuje-li takové okolı́
U ⊃ A, že pro všechna x ∈ U a pro Φt (x) ∈ U , t ≥ 0 limituje Φt (x) → A pro t → ∞. Množina U se
nazývá oblast přitažlivosti atraktoru A.
Poznámky:
a) Vzhledem k velké složitosti některých atraktorů vyžaduje přesnějšı́ definice, aby v atraktoru exis-
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
13
tovala trajektorie, která jej hustě vyplnı́. Podrobnosti jsou např. v [32].
b) Přı́kladem nejjednoduššı́ch atraktorů jsou stabilnı́ rovnovážné stavy a stabilnı́ uzavřené trajektorie.
Složitějšı́ atraktory (např. vı́cerozměrný torus, chaotický atraktor a jiné typy) budou uvedeny v dalšı́ch
kapitolách.
c) Objem atraktoru ve fázovém prostoru disipativnı́ch systémů je nulový.
d) U konzervativnı́ch systémů neexistujı́ atraktory a oblasti přitažlivosti, fázový bod na trajektorii s
danou počátečnı́ podmı́nkou se opakovaně navracı́ k původnı́ počátečnı́ podmı́nce.
e) Repelor je množina, která má všechny vlastnosti s atraktorem shodné, ale trajektorie na rozdı́l od
atraktoru odpuzuje. Při změně orientace času tj. při substituci t = −t se ve stavovém prostoru daného
nelineárnı́ho dynamického systému změnı́ všechny atraktory na repelory a naopak.
2. Časově variantnı́ nebuzené systémy jsou popsány rovnicı́
ẋ = f (t, x)
x(t0 ) = x0 .
(2.2)
Chovánı́ těchto systémů závisı́ na počátečnı́m čase t0 , který nemůžeme pokládat vždy za nulový.
Základnı́ pojmy uvedené pro autonomnı́ systémy jsou platné i pro (2.2). Rovnovážný stav nastane,
jestliže f (t, x) = 0 pro všechna t ≥ t0 . Definice invariantnı́ množiny je stejná jako pro autonomnı́
systémy, na rozdı́l od nich však trajektorie systému (2.2) nenı́ obecně invariantnı́ množinou.
Existence a jednoznačnost řešenı́
Než přistoupı́me k vlastnı́mu řešenı́ nelineárnı́ch rovnic typu (2.1) nebo (2.2), je třeba zkoumat otázky
existence a jednoznačnosti řešenı́. Rovnice mohou mı́t
a) nejméně jedno řešenı́ (problém existence řešenı́);
b) právě jedno řešenı́ pro všechny dostatečně malé hodnoty t (lokálnı́ existence a jednoznačnost řešenı́);
c) právě jedno řešenı́ pro všechna t v intervalu [0, ∞) (globálnı́ existence a jednoznačnost řešenı́);
d) právě jedno řešenı́ pro všechna t v intervalu [0, ∞) a toto řešenı́ závisı́ spojitě na počátečnı́ podmı́nce
x0 .
Pro praxi je nejvýhodnějšı́ čtvrtý přı́pad, je však známo, že bez určitých omezenı́ na funkci f
nenı́ zaručena ani sama existence řešenı́. Z teorie diferenciálnı́ch rovnic jsou známy některé věty o
jednoznačnosti a existenci řešenı́, jako je např. Cauchyova existenčnı́ věta, Lipschitzovy podmı́nky
apod. Podrobný rozbor lze nalézt např. v [55]. Pro naše dalšı́ účely budeme předpokládat, že funkce
f je dostatečně hladká k zajištěnı́ podmı́nek existence a jednoznačnosti řešenı́.
2.2
Metody řešenı́ přechodných jevů nelineárnı́ch systémů
Viděli jsme již, že přechodné jevy u nelineárnı́ch systémů se mohou podstatně lišit od přechodných
jevů lineárnı́ch systémů a mohou vést ke kvalitativně zcela novým typům chovánı́. Z mnoha metod,
které byly vyvinuty pro řešenı́ nelineárnı́ch dynamických systémů uvedeme stručně jen ty, které se
použı́vajı́ předevšı́m v regulačnı́ technice. Metody můžeme zhruba rozdělit na analytické, grafické,
numerické a metody využı́vajı́cı́ simulace na počı́tačı́ch.
2.2.1
Analytické metody
Podstatou analytických metod je integrace diferenciálnı́ rovnice systému. Hlavnı́ význam spočı́vá v
tom, že zı́skáme obecné vztahy platné pro všechna řešenı́.
a) Aproximace nelineárnı́ charakteristiky tečnou nebo sečnou v pracovnı́m bodě
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
14
Tato metoda nedává pro řešenı́ nelineárnı́ch systémů žádné kvalitativně nové výsledky, protože se
jedná o běžnou linearizaci. Aproximace sečnou v určité pracovnı́ oblasti jen někdy lépe nahrazuje
skutečnou nelineárnı́ charakteristiku než tečna v určitém pracovnı́m bodě.
Linearizace nelineárnı́ch charakteristik se použı́vá nejčastěji tehdy, je-li v systému vı́ce nelinearit,
z nichž některé jsou nepodstatné (např. se málo lišı́ od lineárnı́ charakteristiky). Ty je pak vhodné
linearizovat a vytvořit pro prvnı́ aproximativnı́ řešenı́ systém s menšı́m počtem nelinearit.
b) Aproximace nelineárnı́ charakteristiky přı́mkovými úseky
Tato aproximace umožňuje nahradit nelineárnı́ rovnici systému několika lineárnı́mi diferenciálnı́mi
rovnicemi, z nichž každá popisuje přechodný jev systému v určitém časovém intervalu, ve kterém
se systém nacházı́ na přı́slušném linearizovaném úseku nelineárnı́ charakteristiky. Pro charakteristiky
složené z přı́mek (např. reléové charakteristiky) je metoda přesná a proto se někdy jejı́ pomocı́ řešı́
přechodné jevy v jednoduššı́ch nespojitých nelineárnı́ch systémech.
U této metody je však mnohdy obtı́žné určenı́ okamžiku přechodu z jedné lineárnı́ diferenciálnı́
rovnice na druhou a stanovenı́ nových počátečnı́ch podmı́nek při přechodu. Analytické řešenı́ okamžiků
přepnutı́ vede často na složité transcendentnı́ rovnice, které je nutno řešit na počı́tači.
c) Aproximace nelineárnı́ charakteristiky analytickým výrazem
Nelinearita v systému je bud’ dána analytickou funkcı́ nebo se vhodnou funkcı́ aproximuje tak, aby
vzniklá nelineárnı́ rovnice byla co nejjednoduššı́ a byla analyticky řešitelná. Z teorie diferenciálnı́ch
rovnic je ovšem známo, že analyticky lze řešit jen málo typů nelineárnı́ch rovnic. Jsou to některé
speciálnı́ typy rovnic 1.řádu např. rovnice Riccatiova, Lagrangeova, Clairautova nebo rovnice, které
umožňujı́ řešenı́ metodou separace proměnných [6,18]. V regulačnı́ technice se této možnosti využije
jen zřı́dka, častěji lze nelineárnı́ rovnice analyticky řešit v jednoduchých chemických, fyzikálnı́ch nebo
biologických systémech. Analytické metody se častěji použı́vajı́ např. v radiotechnice pro teoretické
řešenı́ modulace, detekce apod., a v teorii elektrických obvodů.
Je-li nelineárnı́ funkce spojitá a má potřebný počet spojitých derivacı́, můžeme ji v okolı́ pracovnı́ho
bodu vyjádřit MacLaurinovou nebo Taylorovou řadou, ze které vezmeme vhodný počet členů. Jedná
se tedy o náhradu nelineárnı́ funkce y = f (x) mnohočlenem
y = a0 + a1 x + a2 x2 + ... + an xn .
Velmi často se použı́vá náhrada kvadratickou funkcı́ y = a0 + a1 x + a2 x2 nebo kubickou parabolou,
např. ve tvaru y = a0 + a1 x − a3 x3 pro vyjádřenı́ charakteristik typu nasycenı́. Elektronické i mechanické prvky se často charakterizujı́ i jinými funkcemi, např. exponenciálnı́mi, goniometrickými apod.
Přı́klad 2.1. Při modelovánı́ jednoduchých chemických reakcı́ dostáváme nelineárnı́ diferenciálnı́ rovnice,
přičemž některé z nich lze řešit analyticky. Např. jednoduchá reakce druhého řádu
k
A + B −→ C
spočı́vá v tom, že smı́šenı́m látek A a B dojde k jednosměrné reakci, při nı́ž vzniká výsledná látka C. Tento přı́pad
lze modelovat jednoduchou nelineárnı́ diferenciálnı́ rovnicı́, která je analyticky řešitelná. Označme okamžité
hodnoty koncentracı́ látek malými pı́smeny a, b, c. Uvažujme počátečnı́ hodnoty koncentracı́ a0 , b0 , c0 a látkovou
bilanci a + c = a0 + c0 , b + c = b0 + c0 . Reakci lze popsat rovnicemi
da
db
=
= −kab
dt
dt
dc
= kab
dt
(2.3)
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
15
Obr.2.1. Průběh koncentracı́ u reakce 2.řádu.
Zvolı́me-li pro jednoduchost např. c0 = 0, pak
dc
= kab = k(a0 − c)(b0 − c)
dt
Rozložı́me na částečné zlomky a integrujeme
Z
Z
Z
1
dc
dc
−
= kdt
a0 − b0
b0 − c
a0 − c
(2.4)
(2.5)
Po integraci dostaneme
kt =
1
b0 (a0 − c)
ln
a0 − b0
a0 (b0 − c)
(2.6)
Pro hledanou závislost koncentrace c na čase upravı́me na tvar
c=
a0 b0 (1 − e−(a0 − b0 )kt )
a − b e−(a0 − b0 )kt
0
(2.7)
0
Volı́me-li např. počátečnı́ hodnoty a0 = 1; b0 = 0, 5; c0 = 0 a k = 1, dostaneme vztah
c=
0.5(1 − e−0.5t )
1 − 0.5e−0.5t
(2.8)
Z látkové bilance lze zı́skat průběhy koncentracı́ a(t) a b(t). Všechny průběhy jsou zakresleny na obr. 2.1.
2.2.2
Metody malého parametru
Jsou to přibližné analytické metody, které jsou rozšı́řeny zejména ve fyzice a radiotechnice. Použı́vajı́
se pro systémy, ve kterých se nelineárnı́ charakteristika nějakého prvku přı́liš nelišı́ od lineárnı́. Takový
systém je blı́zký lineárnı́mu a někdy se nazývá kvazilineárnı́. Řešenı́ se hledá tak, že systém se nejprve
řešı́ jako lineárnı́ a zı́skaný výsledek se zpřesňuje pomocı́ korekčnı́ch členů ve tvaru mocninných řad.
Např. u nelineárnı́ diferenciálnı́ rovnice typu ẍ + ω02 x + µf (x, ẋ) = 0, kde µ < 1 je malý parametr,
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
16
hledáme řešenı́ ve tvaru x(t) = x0 (t) + µx1 (t) + µ2 x2 (t) + ... Člen x0 (t) je řešenı́m lineárnı́ rovnice
ẍ + ω02 x = 0.
Metody malého parametru lze použı́t i pro systémy s časově proměnnými parametry, jsou-li změny
pomalé, nelze však jimi řešit systémy, u nichž se nelineárnı́ charakteristiky značně lišı́ od lineárnı́ch
průběhů nebo kdy charakteristiky jsou nespojité.
Z metod malého parametru jsou nejznámějšı́:
a) metoda amplitudy s pomalou změnou (Van der Polova metoda)
b) metoda perturbacı́ (Poincaréova metoda)
Protože metody malého parametru jsou velmi pracné a nejsou rozšı́řeny v regulačnı́ technice,
nebudeme se jimi podrobněji zabývat.
2.2.3
Grafické a graficko-analytické metody
Před rozvojem počı́tačového modelovánı́ se použı́valo pro řešenı́ nelineárnı́ch diferenciálnı́ch rovnic
mnoho grafických metod a metod použı́vajı́cı́ch nomogramy. Všechny tyto metody ztratily svůj význam
a nebudeme je podrobněji rozvádět.
Grafické znázorněnı́ trajektoriı́ ve stavovém (fázovém) prostoru se ovšem využı́vá velmi často,
zejména u systémů druhého a třetı́ho řádu. Zakreslenı́ celého pole trajektoriı́ dává velmi rychlý názor
na chovánı́ nelineárnı́ho systému při různých počátečnı́ch podmı́nkách. To je výhodné zejména u
systémů druhého řádu, kdy pole trajektoriı́ ležı́ ve fázové rovině. Protože na diferenciálnı́ rovnice 2.
řádu vede mnoho praktických aplikacı́, je znalost fázových portrétů velmi důležitá. Fázové trajektorie u
2. řádu lze nakreslit poměrně jednoduchou grafickou konstrukcı́, dnes se to však již neprovádı́, protože
pole trajektoriı́ rychle a přesně generuje a zakreslı́ počı́tač při použitı́ vhodné simulačnı́ metody.
Je však stále ještě užitečné seznámit se s jednoduchou grafickou metodou vhodnou pro zakreslenı́
fázové trajektorie, jednak pro rychlou orientačnı́ kontrolu výsledku z počı́tače a jednak pro zı́skánı́
určitého názoru na závislosti jednotlivých proměnných a času, kterým je parametrizována fázová
trajektorie.
Jednou z několika metod použitelných pro grafické zakreslenı́ fázové trajektorie je metoda tečen.
Jejı́ princip si můžeme ukázat na jednoduché, ale často se v aplikacı́ch vyskytujı́cı́ diferenciálnı́ rovnici
2. řádu typu ẍ + g(ẋ) + f (x) = 0. Substitucı́ x = x1 , ẋ = x2 převedeme uvedenou rovnici na soustavu
dvou rovnic 1. řádu
ẋ1 = x2
ẋ2 = −g(x2 ) − f (x1 ).
(2.9)
Dělı́me-li druhou rovnici prvnı́ rovnicı́, zı́skáme popis systému ve tvaru
dx2
−g(x2 ) − f (x1 )
=
dx1
x2
(2.10)
Tato rovnice vyjadřuje vztah pro směrnici tečny fázové trajektorie v rovině (x1 , x2 ). Velikost
směrnice je dána pravou stranou, která musı́ být splněna v každém bodě fázové trajektorie. Grafická
konstrukce spočı́vá tedy v tom, že v každém bodě fázové roviny sestrojujeme graficky tečnu podle
vztahu (2.10). V rovině (x1 , x2 ) vyneseme ve stejném měřı́tku křivky x1 = −g(x2 ) a x2 = f (x1 )
(obr. 2.2). Element tečny v libovolně zvoleném bodě A zı́skáme takto: sestrojı́me rovnoběžky s osami,
hodnotu funkce f (x1 ) pro x1 bodu A (úsečka a) naneseme
na rovnoběžku s osou x1 tak, aby konec této úsečky padl na vertikálnı́ osu. Zı́skáme bod 1. Hodnota
x1 v bodě A je záporná, hodnota f (x1 ) je rovněž záporná, podle vztahu (2.10) je tedy −f (x1 ) kladná
úsečka 1-4. Od nı́ odečteme hodnotu −g(x2 ), která je na obrázku reprezentována úsečkou b. Zı́skáme
bod 2. Úsečka 1-2 tedy představuje grafický rozdı́l −f (x1 ) − g(x2 ). Spustı́me-li z bodu 2 kolmici na
vodorovnou osu, zı́skáme trojúhelnı́k 1-2-3, jehož jedna odvěsna představuje čitatel a druhá jmenovatel
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
17
Obrázek 2.1: Metoda tečen
pravé strany vztahu (2.10). Kolmice na přeponu tohoto trojúhelnı́ka udává směr tečny v bodě A
(sestrojı́me element tečny v bodě 1 a rovnoběžně posuneme do bodu A).
Při praktické konstrukci nahrazujeme element tečny krátkým obloučkem ∆s opsaným kružı́tkem z
bodu 3’. Abychom dosáhli vyhovujı́cı́ přesnosti metody, volı́me délku obloučku dostatečně malou (při
středovém úhlu ∆ε asi 0,1 až 0,2 rad). Na elementu tečny zvolı́me dalšı́ bod B a konstrukci opakujeme.
Tak je možno velmi rychle zakreslit část fázové trajektorie vycházejı́cı́ ze zvoleného počátečnı́ho stavu
A. Tato trajektorie nenı́ ovšem ještě ocejchována časem, který je parametrem na trajektorii. Existujı́
však jednoduché vztahy mezi časem a elementem oblouku fázové trajektorie [7].
Čas odpovı́dajı́cı́ jednotlivým polohám zastupujı́cı́ho bodu je možno určit různými způsoby. Pro
praktickou potřebu však stačı́ vztah udávajı́cı́ závislost mezi délkou oblouku fázové trajektorie a
přı́růstkem času na tomto oblouku. Lze odvodit, že ∆ε = k∆t, kde ∆t je přı́růstek času na elementu trajektorie opsaném při středovém úhlu ∆ε a konstanta k rozměru s−1 je rovna jedné, jsou-li
na obou osách fázové roviny zvolena stejná měřı́tka. Pro určité zvolené ∆t můžeme tedy při vynášenı́
fázové trajektorie provádět současně jejı́ kótovánı́ časem pomocı́ zvoleného úhlu ∆ε.
2.2.4
Numerické metody
Složité nelineárnı́ systémy nelze řešit ani analyticky ani graficky a je třeba použı́t vhodné numerické
metody. Běžné jsou klasické numerické metody, z nichž se nejčastěji použı́vajı́ metody Runge-Kutta
a jejich modifikace. Programy těchto metod jsou běžným vybavenı́m čı́slicových počı́tačů. Kromě
klasických metod byly vyvinuty také speciálnı́ metody, které použı́vajı́ různých odlišných způsobů numerické integrace, např. metody časových řad, metody odvozené ze Z-transformace a jiné. V regulačnı́
technice se prakticky nepoužı́vajı́. Podrobný rozbor numerických metod nepatřı́ do této přehledné
publikace a lze ho nalézt ve speciálnı́ch monografiı́ch.
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
2.2.5
18
Simulace nelineárnı́ch systémů na počı́tačı́ch
Složité nelineárnı́ systémy je výhodné modelovat na analogových, čı́slicových nebo hybridnı́ch
počı́tačı́ch a to zejména v tom přı́padě, jestliže je třeba ověřovat chovánı́ systému při různých
počátečnı́ch podmı́nkách, při různých hodnotách parametrů, při změně struktury systému nebo
při návrhu vhodného řı́zenı́ nelineárnı́ho systému. V současnosti se modelovánı́ a simulace provádı́
nejčastěji na čı́slicovém počı́tači s využitı́m speciálnı́ch programů.
Ze simulátorů blokových diagramů snad nejznámějšı́ a předevšı́m v akademické oblasti nejvı́ce
využı́vaný je systém SIMULINK. Je to speciálnı́ programový balı́k pro simulaci dynamických lineárnı́ch
i nelineárnı́ch systémů se soustředěnými parametry, který rozšiřuje známý počı́tačový software MATLAB. Z méně často použı́vaných programů lze uvést např. systém PSI (simulačnı́ program university v
holandském Delftu) nebo systém SIMNON (simulačnı́ program švédského Technologického institutu v
Lundu). Hojně použı́vaný je také System Build (Integrated Systems Inc.). Ten některými svými vlastnostmi převyšuje SIMULINK a je výhodný zejména při modelovánı́ složitých systémů se spojitými
i diskrétnı́mi prvky. Má také samostatný editor pro práci s logickými obvody. Je využı́ván spı́še v
průmyslových aplikacı́ch.
Simulačnı́ jazyky pro širšı́ využitı́ jak ve výzkumu tak i v průmyslu jsou např. ACSL a Desire.
Objektově orientované jazyky pro modelovánı́ jsou např. Omola nebo Dymola, které použı́vajı́ algoritmy pro manipulaci se symbolickými formulemi. Základnı́ přehled o různých simulačnı́ch jazycı́ch i
o programech pro návrh regulačnı́ch systémů lze nalézt v [44].
Řešenı́ složitých nelineárnı́ch systémů umožňuje pouze simulace na počı́tačı́ch, která má ovšem
kromě velkých výhod také značnou nevýhodu v tom, že většinou neposkytuje obecná řešenı́. Před
simulacı́ je proto třeba určit hodnoty rovnovážných stavů, zjistit možnosti existence periodických
řešenı́, různých typů bifurkacı́ apod. S těmito předchozı́mi znalostmi je pak simulace na počı́tačı́ch
mnohem jednoduššı́, protože již vı́me, co asi můžeme od systému očekávat a jaké oblasti parametrů a
počátečnı́ch podmı́nek máme volit.
Metody simulacı́ a praktická práce s programovými soubory MATLAB a SIMULINK jsou náplnı́
cvičenı́ k tomuto předmětu.
2.3
2.3.1
Ustálené stavy nelineárnı́ch systémů
Autonomnı́ nelineárnı́ systémy
U autonomnı́ch nelineárnı́ch systémů mohou být ustálené stavy rovnovážné, periodické nebo kvaziperiodické.
1. Rovnovážné stavy se nazývajı́ také klidové stavy nebo v jiné terminologii stacionárnı́ stavy
vektorového pole f , singulárnı́ body diferenciálnı́ rovnice ẋ = f (x) nebo pevné body toku. Systém
může mı́t libovolný počet rovnovážných stavů a každý z nich může být stabilnı́ nebo nestabilnı́
(vyšetřovánı́ jejich stability bude provedeno v dalšı́ch kapitolách). Rovnovážný stav je reprezentován
bodem ve stavovém prostoru a budeme jej označovat symbolem x (jinak se v literatuře použı́vá také
označenı́ xe , xeq , x0 , x0 apod.). V rovnovážném stavu jsou všechny derivace ẋ nulové, vektorové pole
vymizı́, takže rovnovážný stav určı́me, položı́me-li ẋ = 0. Tı́m zı́skáme soustavu algebraických nebo
transcendentnı́ch rovnic f (x) = 0 a reálná řešenı́ této soustavy určı́ existujı́cı́ rovnovážné stavy. Toto
řešenı́ je však mnohdy složité a často je třeba využı́t počı́tače.
a) Analytické řešenı́ je možné v jednoduchých přı́padech při malém počtu rovnic.
Přı́klad 2.2. Je zadán systém
ẋ1 = −x2 − x31
ẋ2 = x1 − x32 .
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
19
Položı́me-li derivace rovny nule, pak z prvnı́ rovnice x2 √
= −x31 . Dosazenı́m do druhé pravé strany dostaneme
x1 (1 + x81 ) = 0. Kořeny této rovnice jsou x1 = 0 a x1 = 8 −1. Dosazenı́m do Moivreova vztahu
√
n
a=
p
n
ρejϕ =
√
n
ρ (cos
ϕ + 2kπ
ϕ + 2kπ
+ j sin
)
n
n
zjistı́me, že všechny kořeny rovnice 1 + x81 = 0 jsou komplexnı́. Zadaný systém má tedy jen jeden rovnovážný
stav pro x1 = 0 a x2 = 0.
b) Grafické řešenı́ je někdy výhodné, zejména u systémů 2. řádu. Viděli jsme v předchozı́m přı́kladu,
že bylo třeba řešit rovnici 1 + x81 = 0 pomocı́ složitého Moivreova vzorce. Nakreslı́me-li grafy funkcı́
x31 = −x2 a x32 = x1 (stačı́ odhad z několika bodů), vidı́me, že se protı́najı́ pouze v počátku souřadnic,
tedy v jediném rovnovážném stavu (0,0).
Přı́klad 2.3. Ukažte, že systém
ẋ1 = a1 x1 − b1 x31 + c1 x2
ẋ2 = a2 x2 − b2 x32 + c2 x1
má v závislosti na velikosti parametrů a, b, c jeden, tři, pět nebo devět rovnovážných stavů.
c) Numerické řešenı́ je nezbytné při složitějšı́ch algebraických nebo transcendentnı́ch rovnicı́ch nebo
při simultánnı́m řešenı́ většı́ho počtu rovnic. V literatuře jsou k dispozici různé numerické metody,
výhodné je použı́t metod v programech MAPLE, Mathematica nebo MATLAB. V posledně jmenovaném jsou např. programyfsolve a fsolve2 (v toolboxu OPTIM), které řešı́ nelineárnı́ algebraické
rovnice a soustavy těchto rovnic metodou nejmenšı́ch čtverců, nebo program fzero (v toolboxu MATLAB/ FUNFUN), který hledá nuly funkce jedné proměnné.
2. Periodická řešenı́ nebo periodické ustálené stavy se u nelineárnı́ch autonomnı́ch systémů
nazývajı́ samobuzené kmity nebo autooscilace a mohou být stabilnı́ nebo nestabilnı́. Ve stavovém prostoru jsou reprezentovány izolovanými uzavřenými trajektoriemi, kterým řı́káme limitnı́ nebo meznı́
cykly. Systém může mı́t jeden nebo vı́ce periodických ustálených stavů a zjišt’ovánı́ jejich existence a
stability je již značně obtı́žné. Těmito problémy se budeme zabývat v kap. 10.
Na obr. 2.3 jsou pro ilustraci zakresleny limitnı́ cykly pro systém 2.řádu. U stabilnı́ho cyklu
(obr.2.3a) směřujı́ trajektorie z blı́zkého okolı́ k tomuto cyklu, u nestabilnı́ho (obr.2.3b) se na obou
stranách od cyklu vzdalujı́. U polostabilnı́ho cyklu (obr.2.3c) se trajektorie z jedné strany přibližujı́
a z druhé vzdalujı́. Tento cyklus je pouze teoretickou hranicı́ při splynutı́ dvou cyklů (stabilnı́ho a
nestabilnı́ho), kdy periodické řešenı́ systému bud’ vzniká nebo zaniká.
Řešenı́ x(t) je periodické, platı́-li x(t) = x(t + T ) pro všechna t a nějakou minimálnı́ periodu
T > 0. Periodické řešenı́ lze rozložit do Fourierovy řady, která má základnı́ složku s frekvencı́ 1/T a
vyššı́ harmonické s frekvencemi k/T, k = 2, 3, ... Amplituda některých těchto spektrálnı́ch složek může
být nulová (nebo velmi malá), protože nelineárnı́ systém může podstatně filtrovat některé harmonické.
Přı́klad 2.4. Van der Polův oscilátor, velmi často použı́vaný pro demonstraci nelineárnı́ch problémů,
je popsán rovnicemi
ẋ1 = x2
ẋ2 = ε(1 − x21 )x2 − x1
(2.11)
Namodelovánı́m na počı́tači zjistı́me, že systém má jeden rovnovážný stav v počátku a jedno stabilnı́
periodické řešenı́, jehož tvar závisı́ na parametru ε (obr. 2.4).
3. Kvaziperiodická řešenı́ vznikajı́ u autonomnı́ch obvodů pouze vzácně a proto si jejich vlastnosti ukážeme až u systémů neautonomnı́ch.
4. Chaotické chovánı́ . Některé nelineárnı́ systémy nedosáhnou v čase t → ∞ ustáleného chovánı́,
ale trvale měnı́ nepravidelným způsobem (chaoticky) svoje stavové proměnné. Chovánı́ je podobné
náhodnému, ale systém je popsán striktně deterministicky a neuvažuje se nejistota ani ve vstupu ani
v modelu systému. Proto se tento typ chovánı́ nazývá deterministický chaos. Chaotické chovánı́ je
ohraničené, nenı́ periodické, podobá se náhodnému. Je vysoce citlivé na změnu počátečnı́ch podmı́nek,
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
20
Obrázek 2.2: Typy limitnı́ch cyklů: a) stabilnı́, b) nestabilnı́, c) polostabilnı́
i při nepatrné změně se odezvy po určité době značně lišı́. Dlouhodobé chovánı́ nelze tedy spolehlivě
predikovat.
U autonomnı́ch systémů se spojitým časem může chaos nastat od 3. řádu výše (u neautonomnı́ch
již od 2.řádu). Chaotické chovánı́ bylo pozorováno u nejrůznějšı́ch systémů, např. v hydrodynamice
(turbulence), v atmosférické dynamice, ve vázaných chemických soustavách, v biologických systémech
(v populačnı́ dynamice, neurobiologii), v elektrických obvodech a také v regulačnı́ technice. Podrobnějšı́
vlastnosti chaosu a přı́klady systémů s chaotickým chovánı́m budou uvedeny v samostatné kapitole
12.
2.3.2
Neautonomnı́ nelineárnı́ systémy
Neautonomnı́ systémy mohou být nebuzené t-variantnı́ ẋ = f (t, x) nebo buzené t-invariantnı́ ẋ =
f (x, u) nebo buzené t-variantnı́ ẋ = f (t, x, u).
1. Rovnovážné stavy mohou nastat u časově variantnı́ho systému ẋ = f (t, x), platı́-li f (t, x) =
0 ∀t ≥ t0 . Např. systém
ẋ1 = x1 − x2 + x21 + x22 sin t
ẋ2 = x1 + x2 − 2x1 x2 e−t
má rovnovážný stav (0, 0).
Klidové stavy buzených systémů ẋ = f (x, u) při konstantnı́m vstupu nazýváme stacionárnı́
stavy. Z obecnějšı́ho pohledu jsou buzené systémy uzavřené (nikoliv již izolované) systémy, které
umožňujı́ výměnu energie s okolı́m.
Jako přı́klad může sloužit kyvadlo, na jehož osu působı́ konstantnı́ vnějšı́ moment M a jehož
dynamika je popsána systémem
ẋ1 = x2
ẋ2 = −k1 x2 − k2 sin x1 + M,
kde x1 je úhel vychýlenı́ kyvadla od vertikálnı́ osy a x2 jeho úhlová rychlost. Stacionárnı́ stav je pak
dán vztahem k2 sin x1 = M .
2. Periodická řešenı́ mohou být u buzených nelineárnı́ch obvodů velmi rozmanitá. Budı́me-li
nelineárnı́ systém např. harmonickým signálem s periodou T , bude na výstupu signál, který může
obsahovat různé vyššı́ harmonické (ultraharmonické kmity). Často se však na výstupu objevujı́ také
tzv. subharmonické kmity, kdy perioda výstupu je násobkem budı́cı́ periody T . Tyto jevy nemohou
nastat u lineárnı́ch systémů.
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
21
Jako přı́klad může sloužit třeba Duffingova rovnice
ẋ2 = x1 − x1 3 − ax2 + b cos ωt.
ẋ1 = x2
(2.12)
Např. pro a = 0, 15; b = 0, 3; ω = 1 (T = 6, 28) je na výstupu periodická funkce, jejı́ž prvnı́ harmonická
má úhlovou frekvenci ω = 1 a existujı́ liché vyššı́ harmonické, jejichž amplituda rychle klesá. Pro
a = 0, 22 naskočı́ 3. subharmonická s periodou T = 3.6, 28.
Neautonomnı́ systém n-tého řádu ẋ = f (t, x) s periodickým ustáleným řešenı́m s periodou T
můžeme vždy transformovat na autonomnı́ systém řádu (n+1), zavedeme-li dalšı́ stavovou proměnnou
xn+1 =
2π
t = ωt.
T
(2.13)
Autonomnı́ systém je pak dán rovnicemi
ẋ = f (x, xn+1
T
)
2π
x(0) = x0
x ∈ Rn
(2.14)
2π
2π
=ω
xn+1 (0) =
t0 = ωt0 .
(2.15)
T
T
Perioda nové stavové proměnné xn+1 je 2π. Vzhledem k tomuto periodickému chovánı́ můžeme řešenı́
xn+1 omezit na interval 0 ≤ xn+1 < 2π. Stavový prostor Rn+1 lze pak transformovat na válcový
stavový prostor Rn × S, kde S je kružnice. Použitı́m transformace (2.13) můžeme tedy výsledky
studia autonomnı́ho systému aplikovat na časově periodický neautonomnı́ systém.
ẋn+1 =
Poznámka: Neperiodický neautonomnı́ systém může být také převeden na autonomnı́ systém pomocı́
transformace (2.13) s nějakou zvolenou periodou T > 0 (můžeme zvolit např. xn+1 = t). Řešenı́ bude
však nutně neohraničené (xn+1 → ∞ pro t → ∞) a mnoho výsledků pro asymptotické chovánı́
autonomnı́ch systémů nelze pak použı́t.
3. Kvaziperiodická řešenı́ mohou vzniknout, když dvě nebo vı́ce periodických funkcı́ interagujı́ nelineárně. Jako přı́klad můžeme použı́t opět Van der Polův oscilátor, který v nebuzeném
přı́padě vykazuje autooscilace s periodou T1 (obr 2.4). Přidáme-li nynı́ vnějšı́ harmonický budı́cı́ signál,
dostaneme systém
ẋ1 = x2
ẋ2 = ε(1 − x21 )x2 − x1 + A cos (2πt/T2 ).
(2.16)
Řešenı́ buzeného systému může být synchronizováno s nějakým násobkem vstupnı́ periody T2 a vznikne
subharmonické kmitánı́, tj. periodický ustálený stav. Při konfliktu mezi T1 a T2 nemusı́ však také
žádná perioda zvı́tězit a vzniknou kvaziperiodické kmity. Na obr. 2.5 je zakresleno kvaziperiodické
kmitánı́ Van der Polova oscilátoru ve fázové rovině (x = x1 , y = x2 )[24]. Trajektorie jsou rovnoměrně
distribuovány v prstencové (anulárnı́) oblasti, kterou hustě vyplňujı́.
Kvaziperiodické řešenı́ x(t) lze vyjádřit součtem periodických řešenı́
x(t) =
X
hi (t),
(2.17)
i
kde každé hi (t) lze rozložit ve Fourierovu řadu s prvnı́ harmonickou o frekvenci fi a s periodou Ti =
1/fi .
Dále existuje množina základnı́ch frekvencı́ {fˆ1 , ..., fˆp } s těmito vlastnostmi:
a) množina je lineárně nezávislá, tj. neexistuje nenulová množina konstant taková, aby platilo
ˆ
k1 f1 + ... + kp fˆp = 0,
b) pro každé i platı́ fi = k1 fˆ1 + ... + kp fˆp pro nějaké konstanty {k1 , ..., kp }.
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
Obrázek 2.3: Nebuzený Van der Polův oscilátor
22
Obrázek 2.4: Buzený Van der Polův oscilátor
Kvaziperiodické kmitánı́ je tedy tvořeno součtem periodických kmitů, jejichž frekvence je dána
různými součty nebo rozdı́ly konečné množiny základnı́ch frekvencı́. Kvaziperiodické kmitánı́ s počtem
p základnı́ch frekvencı́ se nazývá p-periodické.
Nejjednoduššı́ přı́pad je dvouperiodické kmitánı́ x(t) = h1 (t) + h2 (t), kde periody T1 a T2 jsou
nesoudělné, jejich podı́l je tedy iracionálnı́. Spektrum takového kmitánı́ se skládá ze dvou množin
harmonických se základnı́mi frekvencemi k/T1 a k/T2 , k = 1, 2, ... Přı́kladem dvouperiodických kmitů
jsou amplitudová a fázová modulace, kde dvě periodické funkce spolu interagujı́ nelineárně.
Přı́kladem dynamického systému s kvaziperiodickým chovánı́m je výše uvedený Van der Polův
oscilátor. Z obr. 2.5 je patrno, že dvouperiodická trajektorie ležı́ na množině, která je difeomorfnı́m
zobrazenı́m dvourozměrného toru v trojrozměrném prostoru (obr. 2.6). Protože trajektorie je křivka a
dvojrozměrný torus je plocha, neležı́ každý bod toru na trajektorii. Lze ale ukázat, že při dlouhodobém
řešenı́ procházı́ trajektorie body, které ležı́ libovolně blı́zko od každého bodu na toru. Torus tedy
představuje limitnı́ množinu kvaziperiodického chovánı́ a je prvnı́m přı́kladem limitnı́ množiny, která
nenı́ jednoduchou křivkou. U dynamických systémů vyššı́ho řádu mohou také vzniknou kvaziperiodická
řešenı́ vyššı́ch řádů, a jejich trajektorie vyplňujı́ množiny, které jsou difeomorfnı́ k vı́cerozměrnému
toru (K-torus).
Obrázek 2.5: Torus v trojrozměrném prostoru
Obrázek 2.6: Chaos u Duffingova oscilátoru
4. Chaotické chovánı́ se může objevovat u neautonomnı́ch systémů se spojitým časem již od
KAPITOLA 2. ZÁKLADNÍ VLASTNOSTI NELINEÁRNÍCH SYSTÉMŮ
23
druhého řádu. Např. u parametricky buzeného oscilátoru
ẍ + aẋ + b(1 + c cos ωt) sin x = 0
působı́ na kyvadlo periodická vnějšı́ sı́la, např. periodicky se pohybuje závěs kyvadla. Při určitých
hodnotách parametrů systému vzniká chaotické chovánı́. Podobně např. u Duffingova oscilátoru, popsaného rovnicı́ (2.12), vzniká při vhodných podmı́nkách chaos (obr.2.7). Dalšı́ přı́klady budou uvedeny
v kap. 12.
Kapitola 3
Stabilita - základnı́ pojmy a definice
Stabilita nelineárnı́ch systémů je velmi komplexnı́ pojem, který se zcela odlišuje od běžného pojetı́
stability u lineárnı́ch systémů. Stabilita lineárnı́ho systému je dána strukturou systému a nezávisı́ ani
na jeho okamžitém stavu ani na vstupnı́ch signálech. Autonomnı́ lineárnı́ systém ẋ = Ax s regulárnı́
maticı́ A má jeden rovnovážný stav, který je stabilnı́ nebo nestabilnı́.
Pro nelineárnı́ systémy existuje velké množstvı́ definic stability. Je to dáno tı́m, že nelineárnı́ systém
má různé typy ustálených stavů a velkou variabilitu v chovánı́. Mnohé definice stability jsou proto
speciálnı́ a majı́ omezené použitı́. Všimneme si tedy pouze některých nejdůležitějšı́ch definic, předevšı́m
těch, které se týkajı́ ljapunovské a asymptotické stability.
3.1
Stabilita rovnovážného stavu volného systému
V tomto článku budeme uvažovat volný časově variantnı́ nelineárnı́ systém
ẋ = f (t, x),
(3.1)
kde f : R+ × Rn → Rn je spojitá funkce. Předpokládejme, že (3.1) má jednoznačné řešenı́ při
každé počátečnı́ podmı́nce x(t0 ) = x0 . To bude např. tehdy, jestliže f splňuje globálnı́ Lipschitzovu podmı́nku. Dále budeme předpokládat, že systém (3.1) má stacionárnı́ řešenı́ x, pro které platı́
f (t, x) = 0 pro všechna t ≥ t0 . Promı́tneme-li graf řešenı́ z rozšı́řeného prostoru R+ ×Rn do stavového
prostoru Rn , odpovı́dá stacionárnı́ řešenı́ jednobodové trajektorii x, tj. rovnovážnému stavu systému
(3.1) a graf každého řešenı́ se promı́tne na trajektorii ve stavovém prostoru. Vyšetřovánı́ stability
řešenı́ můžeme tedy převést na vyšetřovánı́ stability rovnovážného stavu x v prostoru Rn .
Definice 3.1. Rovnovážný stav x systému (3.1) je (ljapunovsky ) stabilnı́, jestliže pro každé ε > 0
a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna řešenı́ s počátečnı́ podmı́nkou
x0 vyhovujı́cı́ vztahu ||x0 − x|| < δ a pro všechna t ≥ t0 platı́
||x(t; t0 , x0 − x|| < ε.
(3.2)
Poznámka: Za normu ||.|| volı́me obvykle euklidovskou normu, definovanou např. pro ||x|| předpisem
||x|| =
q
(x21 + x22 + ... + x2n )
Pak ||x|| < ε představuje sférickou oblast (vnitřek n-rozměrné hyperkoule), kterou budeme stručně
označovat také Bε (podobně Bδ ).
Definice 3.1 řı́ká, že rovnovážný stav je stabilnı́, jestliže po malém vychýlenı́ z tohoto stavu zůstane
trajektorie systému v ε okolı́ rovnovážného stavu. Geometrická interpretace je znázorněna na obr.
24
KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE
25
3.1. Definice 3.1 se týká jen chovánı́ v blı́zkém okolı́ rovnovážného stavu (tzv. stabilita v malém,
mı́stnı́ (lokálnı́) stabilita), protože nevı́me předem, jak velké δ bude odpovı́dat zvolenému ε. Podle
této definice nemusı́ trajektorie systému v čase t → ∞ konvergovat do rovnovážného stavu, ale může
setrvávat libovolně blı́zko. Netlumený lineárnı́ systém druhého řádu popsaný rovnicı́ ẍ + ω02 x = 0 je
proto také stabilnı́ ve smyslu této definice.
Obr.3.1
Abychom v dalšı́m zjednodušili různé definice stability, budeme předpokládat, že rovnovážný stav
systému je v počátku. Pokud má systém izolovaný rovnovážný stav jinde, je vždy možno lineárnı́ transformacı́ souřadnic tento stav do počátku posunout. Bez ztráty obecnosti budeme tedy předpokládat,
že f (t, 0) = 0, ∀t ≥ t0 . Definici 3.1 můžeme pak přeformulovat na tvar:
Definice 3.2. Rovnovážný stav 0 soustavy (3.1) je (ljapunovsky) stabilnı́, jestliže pro každé ε > 0
a každé t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna řešenı́ s počátečnı́ podmı́nkou
x0 vyhovujı́cı́ vztahu ||x0 || < δ a pro všechna t ≥ t0 platı́
||x(t; t0 , x0 || < ε.
(3.3)
Rovnovážný stav je nestabilnı́, jestliže nenı́ stabilnı́ ve smyslu uvedené definice.
Definice 3.3. Rovnovážný stav 0 je kvaziasymptoticky stabilnı́ (nebo také atrahujı́cı́ či konvergentnı́), jestliže pro jakékoliv t0 ∈ R+ existuje takové čı́slo δ1 (t0 ) > 0, že každé řešenı́ systému (3.1)
vyhovujı́cı́ podmı́nce ||x0 || < δ1 konverguje k počátku pro t → ∞, tj.
lim x(t; t0 , x0 ) = 0.
t→∞
Pro kvaziasymptotickou stabilitu je nutné, aby rovnovážný stav byl izolovaný, to znamená, aby existovalo takové jeho okolı́, které neobsahuje žádné jiné rovnovážné stavy. To je v kontrastu s pojetı́m
ljapunovské stability, které lze aplikovat i na rovnovážné stavy, které nejsou izolované.
Definice 3.4. Rovnovážný stav 0 je asymptoticky stabilnı́, jestliže je ljapunovsky stabilnı́ a zároveň
kvaziasymptoticky stabilnı́.
Definice 3.5. Rovnovážný stav je neutrálně stabilnı́, je-li stabilnı́ dle definice 3.2 a nenı́ asymptoticky stabilnı́.
V mnoha technických aplikacı́ch je asymptotická stabilita ještě nepostačujı́cı́ a je třeba vědět, jak
rychle se řešenı́ blı́žı́ k rovnovážnému stavu. K tomuto účelu lze použı́t pojmu exponenciálnı́ stabilita.
Definice 3.6. Rovnovážný stav 0 je exponenciálně stabilnı́, jestliže existujı́ takové konstanty
r, α, λ > 0 nezávislé na volbě řešenı́, že
||x(t; t0 , x0 )|| ≤ α||x0 || exp −λt
∀ t ≥ t0 ,
t0 ≥ 0
(3.4)
KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE
26
pro všechna ||x0 || < r.
Definice 3.6 řı́ká, že stavový vektor u exponenciálně stabilnı́ho rovnovážného stavu konverguje k
počátku rychleji než nějaká exponenciálnı́ funkce. Kladné čı́slo λ se často nazývá rychlost exponenciálnı́
konvergence.
Přı́klad 3.1. Systém ẋ = −(1 + sin2 t)x konverguje exponenciálně k hodnotě x = 0 s rychlostı́ λ = 1. Řešenı́
systému je
Z t
2
x(t) = x(0)exp −
[1 + sin τ ]dτ
0
a proto |x(t)| ≤ |x(0)|e . Pro libovolné t je plocha pod funkcı́ (1 + sin2 t) většı́ než t a proto e−t klesá pomaleji.
−t
Exponenciálnı́ stabilita je současně asymptotickou stabilitou, opačně to však neplatı́. Např. systém
ẋ = −x2 , x(0) = 1 má řešenı́ x = 1/(1 + t) a tato funkce klesá pomaleji než jakákoliv exponenciálnı́
funkce e−λt pro λ > 0.
Stejnoměrná stabilita
Předchozı́ definice ljapunovské a asymptotické stability neautonomnı́ch systémů ukazujı́ na závažný
vliv volby počátečnı́ho času. V praxi je obvykle žádoucı́, aby systém měl určitou stejnoměrnost ve
svém chovánı́ bez ohledu na volbu počátečnı́ho času. To je podnětem k zavedenı́ pojmu stejnoměrná
stabilita a stejnoměrná asymptotická stabilita.
Definice 3.7. Rovnovážný stav 0 je stejnoměrně (ljapunovsky) stabilnı́, jestliže je ljapunovsky
stabilnı́ podle definice 3.2 a čı́slo δ nezávisı́ na volbě počátečnı́ho okamžiku t0 .
Rovnovážný stav je stejnoměrně kvaziasymptoticky stabilnı́, jestliže δ1 v definici 3.3 nezávisı́ na
t0 a všechna řešenı́ se blı́žı́ k počátku stejnoměrně.
Poznámka: Stejnoměrná konvergence nastává, jestliže pro každé ε > 0 existuje takové čı́slo T (ε), že
||x0 || < δ1 , ∀t0 ∈ R+ ⇒ ||x(t; t0 , x0 )|| < ε, ∀t > t0 + T (ε).
Rovnovážný stav je stejnoměrně asymptoticky stabilnı́, jestliže je stejnoměrně stabilnı́ a stejnoměrně kvaziasymptoticky stabilnı́.
Jestliže je rovnovážný stav stejnoměrně asymptoticky stabilnı́, je i asymptoticky stabilnı́. Opak
však obecně neplatı́, jak je patrno z tohoto přı́kladu. Systém 1.řádu ẋ = −x/(1 + t) má obecné řešenı́
x(t) =
1 + t0
x(t0 ).
1+t
Toto řešenı́ konverguje asymptoticky k nule, ale konvergence nenı́ stejnoměrná, protože při zvětšujı́cı́m
se t0 potřebuje řešenı́ stále delšı́ čas k dosaženı́ stejné vzdálenosti od počátku.
Globálnı́ stabilita. Všechny dosud uvedené definice charakterizujı́ lokálnı́ chovánı́ systému při malých
výchylkách počátečnı́ho stavu od rovnováhy. Určenı́ skutečné oblasti stability je velmi obtı́žné a
budeme se tı́mto problémem zabývat v kap.5. Pro praxi je nejvýhodnějšı́ zjištěnı́, že rovnovážný stav
je globálně stabilnı́, tj. stabilnı́ při všech počátečnı́ch podmı́nkách. To ovšem předpokládá, že systém
má pouze jeden rovnovážný stav.
Definice 3.8. Je-li rovnovážný stav asymptoticky nebo exponenciálně stabilnı́ při všech počátečnı́ch
podmı́nkách x0 ∈ Rn , je globálně asymptoticky nebo exponenciálně stabilnı́.
U časově invariantnı́ho volného systému (tj. autonomnı́ho systému) ẋ = f (x) nezávisı́
chovánı́ na volbě počátečnı́ho času. Všechny předchozı́ definice zůstávajı́ v platnosti s tı́m, že čı́slo
δ nezávisı́ na volbě počátečnı́ho okamžiku t0 a je pouze funkcı́ ε. Je-li tedy rovnovážný stav 0 autonomnı́ho systému ljapunovsky stabilnı́, je současně stejnoměrně ljapunovsky stabilnı́ apod. Důkaz
těchto tvrzenı́ lze nalézt např. v [55].
KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE
27
V uvedených definicı́ch stability jsme definovali stabilitu stavů systému. Podobným způsobem
bychom mohli definovat i stabilitu výstupu systému. Může nastat situace, že nestabilnı́ složky stavu
se na výstupu neprojevı́. Potom je systém na výstupu stabilnı́, i když nenı́ žádný stabilnı́ rovnovážný
stav. Je-li systém pozorovatelný, pak každá složka stavu se projevı́ na výstupu a stabilita stavu a
výstupu splývá. Těmito problémy se budeme zabývat při návrhu exaktnı́ch linearizacı́ v kap. 15.
3.2
Stabilita pohybu volného systému
Tento typ stability se týká vzájemné polohy dvou řešenı́, z nichž jedno je nominálnı́ řešenı́ zkoumané
z hlediska stability a druhé je perturbované řešenı́ se změněnou počátečnı́ podmı́nkou x(0) = x1 .
Nominálnı́ řešenı́ bude zřejmě stabilnı́, jestliže při malé změně počátečnı́ podmı́nky zůstane perturbované řešenı́ dostatečně blı́zko k řešenı́ nominálnı́mu. Tuto intuitivnı́ představu stability libovolného
řešenı́ budeme nynı́ formulovat přesněji.
Definice 3.9. Řešenı́ x(t; t0 , x0 ) soustavy ẋ = f (t, x) je stabilnı́, jestliže pro každé ε > 0 a každé
t0 ∈ R+ existuje takové čı́slo δ = δ(ε, t0 ) > 0, že pro všechna t ≥ t0 a pro ||x0 − x1 || < δ je
||x(t; t0 , x0 ) − x(t; t0 , x1 || < ε.
(3.5)
Vidı́me, že definice je velmi podobná definici 3.1 pro stabilitu rovnovážného stavu. Proto lze snadno
transformovat i ostatnı́ definice z čl. 3.1 na stabilitu pohybu. Tyto nové definice však nenı́ ani třeba
vytvářet, protože problém stability pohybu lze vždy redukovat přı́mo na ekvivalentnı́ problém stability
rovnovážného stavu jiného dynamického systému.
Předpokládejme, že chceme vyšetřovat stabilitu řešenı́ y(t) soustavy ẏ = g(t, y) při počátečnı́
podmı́nce y 0 . Proved’me perturbaci řešenı́ volbou blı́zké počátečnı́ podmı́nky v 0 = y 0 + x0 . Řešenı́
odpovı́dajı́cı́ této nové počátečnı́ podmı́nce v0 je v(t) a platı́ rovnice v̇ = g(t, v). Odchylka od
původnı́ho řešenı́ je x(t) = v(t) − y(t), dynamické chovánı́ této odchylky je dáno neautonomnı́ diferenciálnı́ rovnicı́
ẋ(t) = v̇(t) − ẏ(t) = g(t, v) − g(t, y) = g(t, y + x) − g(t, y).
(3.6)
Označı́me-li f (t, x) = g(t, y + x) − g(t, y), dostaneme z původnı́ soustavy rovnice pro odchylku
ẋ = f (t, x)
f (t, 0) = 0.
(3.7)
Tato soustava má triviálnı́ (tj. nulové) řešenı́ a jeho vlastnosti můžeme vyšetřovat na základě definic
uvedených v čl. 3.1. Závěry o stabilitě můžeme pak přenést pomocı́ zavedené transformace y = v − x
na řešenı́ y(t) zadané soustavy.
Perturbačnı́ dynamika (3.7) je neautonomnı́ a to i v přı́padě, že původnı́ vyšetřovaný systém je
autonomnı́ ẏ = g(y), protože na pravé straně (3.7) se vyskytuje nominálnı́ trajektorie. Každé dı́lčı́
nominálnı́ trajektorii autonomnı́ho systému tedy odpovı́dá ekvivalentnı́ neautonomnı́ systém.
Stabilita limitnı́ch cyklů autonomnı́ch systémů.
Často se vyšetřuje stabilita pohybu podél uzavřené trajektorie systému, např. stabilita limitnı́ho
cyklu autonomnı́ho systému. K tomu účelu můžeme použı́t definice 3.9, kterou upravı́me pro autonomnı́
systém. Zavedeme poruchovou trajektorii γ1 , která je blı́zká k limitnı́mu cyklu γ (obr. 3.2) a vyšetřı́me,
zda bod P1 zůstává při pohybu trvale ve zvolené oblasti Bε , která obsahuje oblast Bδ . Bod P obı́há po
limitnı́m cyklu a současně se pohybuje bod P1 po poruchové trajektorii γ1 . S oběma body se pohybujı́
i obě oblasti. Zůstane-li pro t > t0 bod P1 stále v oblasti Bε , je meznı́ cyklus ljapunovsky stabilnı́.
Podle definice 3.9 je tedy třeba, aby nejen poruchová trajektorie γ1 zůstávala v blı́zkém okolı́ γ, ale
aby také pohyb zastupujı́cı́ch bodů na γ a γ1 měl stejnou periodu. Např. perioda kmitů matematického
KAPITOLA 3. STABILITA - ZÁKLADNÍ POJMY A DEFINICE
28
kyvadla závisı́ na amplitudě kmitánı́. Takový systém je v podstatě stabilnı́, ale nenı́ stabilnı́ podle
definice 3.9. Podobně je tomu u družice pohybujı́cı́ se v kruhové dráze kolem Země. Při malé poruše
bude obı́hat např. po dráze velmi blı́zké, ale s jinou periodou. Pro praktické určenı́ stability je v těchto
přı́padech definice 3.9 přı́liš přı́sná a pro stabilitu limitnı́ch cyklů je vhodná definice tzv. orbitálnı́
stability.
Obr.3.2. Stabilita limitnı́ho cyklu
Definice 3.10. Orbitálnı́ stabilita. Limitnı́ cyklus γ je orbitálně stabilnı́, jestliže pro libovolné
ε > 0 existuje δ(ε) > 0 takové, že každá trajektorie vycházejı́cı́ v čase t0 z bodu vzdáleného méně než
δ(ε) od γ zůstává ve vzdálenosti menšı́ než ε od γ.
Každý limitnı́ cyklus, který je stabilnı́ ve smyslu Ljapunova, je také orbitálně stabilnı́, opačně to
však již obecně neplatı́. Pro limitnı́ cyklus můžeme definovat také asymptotickou orbitálnı́ stabilitu,
při nı́ž γ1 → γ pro t → ∞. Stabilitou periodických řešenı́ se budeme podrobněji zabývat v kap. 10.
3.3
Jiné typy stability
Doposud jsme se zabývali pouze definicemi stability rovnovážného stavu a stability pohybu nebuzeného
systému. Důležité je ovšem také určit, zda stav systému bude stabilnı́, jestliže přivedeme na vstup
nějaký signál. Dále nás bude z praktického hlediska zajı́mat, zda při ohraničeném vstupnı́m signálu
bude také ohraničený výstup systému. K řešenı́ těchto problémů musı́me definovat tzv. stabilitu
vstup-výstup, kterou se budeme podrobněji zabývat v kap. 8.
Všechny dosud uvedené definice stability se týkaly dynamických systémů zadaných diferenciálnı́mi
rovnicemi s pevně určenými parametry. Důležité je ovšem také studovat stabilitu z hlediska změny
těchto parametrů. Uvidı́me později, že při malých změnách hodnot parametrů docházı́ často k velmi
odlišnému chovánı́ systému, měnı́ se počet rovnovážných stavů a jejich stabilita, vznikajı́ nebo zanikajı́
periodická řešenı́ apod. K postiženı́ těchto jevů budeme v kap.4 definovat tzv. strukturálnı́ stabilitu.
Existuje ještě mnoho jiných definic různých typů stability, s některými se setkáme při řešenı́
speciálnı́ch problémů v dalšı́ch kapitolách.
Kapitola 4
Ljapunovova metoda linearizace
V předchozı́ kapitole jsme uvedli různé definice stability nelineárnı́ch systémů, ty však nejsou obvykle
přı́liš vhodné pro praktické výpočty. Budeme proto potřebovat metody, které by umožnily rychlé
určenı́ stability. V této kapitole se budeme zabývat řešenı́m lokálnı́ stability rovnovážných stavů
nelineárnı́ch systémů pomocı́ linearizace systému v blı́zkém okolı́ těchto rovnovážných stavů. Tento
způsob řešenı́ vypracoval A.M. Ljapunov a nazývá se prvnı́ Ljapunovova metoda. Je to formalizace
intuitivnı́ představy, že za určitých předpokladů se bude nelineárnı́ systém při malých odchylkách od
rovnovážného stavu chovat podobně jako jeho lineárnı́ aproximace. Výsledkem linearizace jsou soustavy
lineárnı́ch diferenciálnı́ch rovnic, pomocı́ jejichž vlastnostı́ pak posuzujeme vlastnosti vyšetřovaného
nelineárnı́ho systému. Proto si v dalšı́m článku shrneme nejprve základnı́ výsledky řešenı́ lineárnı́ch
diferenciálnı́ch rovnic s důrazem na geometrické představy daných řešenı́.
4.1
4.1.1
Lineárnı́ systémy
Lineárnı́ autonomnı́ systémy
Budeme uvažovat lineárnı́ autonomnı́ systém
ẋ = Ax,
x(0) = x0 .
(4.1)
Tento systém má jeden rovnovážný stav v nule, je-li A regulárnı́ a nekonečně mnoho rovnovážných
stavů, jestliže A je singulárnı́.
Obecné řešenı́, které je dostatečně známo z teorie diferenciálnı́ch rovnic a z teorie lineárnı́ch řı́dı́cı́ch
systémů, má tvar
x(t) = eAt x0 ,
(4.2)
kde fundamentálnı́ matice eAt se nazývá také tokem vektorového pole Ax. Pro exaktnı́ analytické
řešenı́ je třeba znát vlastnı́ čı́sla matice A. Ta se určı́ z charakteristické rovnice
det(A − λI) =
a11 − λ
a12
a21
a22 − λ
...
...
an1
an2
...
a1n
...
a2n
...
...
... ann − λ
= 0.
(4.3)
Úpravou dostaneme algebraickou rovnici n-tého stupně
an λn + an−1 λn−1 + ... + a1 λ + a0 = 0.
(4.4)
Kořeny této charakteristické rovnice jsou vlastnı́ čı́sla matice A. Ta mohou být reálná nebo komplexnı́
a jednonásobná nebo vı́cenásobná.
29
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
30
a) reálná, jednonásobná vlastnı́ čı́sla
Necht’ všechna vlastnı́ čı́sla λ1 , ..., λn jsou reálná a různá. Označme r 1 , ..., r n pravé vlastnı́ vektory
matice A (sloupcové vektory) a q 1 , ..., q n levé vlastnı́ vektory (řádkové vektory). Jsou-li vlastnı́ čı́sla
matice A různá, jsou levé a pravé vlastnı́ vektory navzájem ortogonálnı́. Vlastnı́ vektory vypočteme
ze vztahů
Ar i = λi r i
q i A = q i λi
i = 1, ..., n.
(4.5)
Obecné řešenı́ systému (4.1) je
x(t) =
n
X
ki r i eλi t ,
(4.6)
i=1
kde ki jsou konstanty závislé na počátečnı́ch podmı́nkách. Členy r i eλi t se nazývajı́ módy dynamického
systému. Směr módu je ve stavovém prostoru určen vlastnı́m vektorem r i , časový průběh módu je
dán vlastnı́m čı́slem λi . Vlastnı́ vektory odpovı́dajı́cı́ záporným vlastnı́m čı́slům vytvářejı́ stabilnı́
podprostor E s , jehož dimenze je dána počtem záporných vlastnı́ch čı́sel. Podobně počet kladných
vlastnı́ch čı́sel udává dimenzi nestabilnı́ho podprostoru E u , je-li nulové vlastnı́ čı́slo, existuje centrálnı́
podprostor E c , jehož dimenze dim E c = 1. Při počátečnı́ podmı́nce na vlastnı́m vektoru probı́há řešenı́
na tomto vektoru, při počátečnı́ podmı́nce v rovině určené dvěma vlastnı́mi vektory zůstane řešenı́ v
této rovině atd.
Lineárnı́ transformace y = Q−1 x vede na
ẏ = Q−1 ẋ = Q−1 Ax = Q−1 AQy = AJ y
tj.
ẏi = λi yi
i = 1, ..., n.
Zavedenı́m nových souřadnic dostáváme tedy řešenı́, které je zbaveno vzájemné vazby proměnných
yi (t) = eλi t yi (0)
i = 1, ..., n.
(4.7)
Transformačnı́ matice Q, transformujı́cı́ původnı́ stavové rovnice systému do Jordanova kanonického
tvaru, je po sloupcı́ch tvořena vlastnı́mi pravými vektory matice A. Jordanova matice AJ je diagonálnı́
matice tvořená vlastnı́mi čı́sly původnı́ matice A a vlastnı́ vektory Jordanovy matice jsou navzájem
ortogonálnı́.
b) komplexnı́, jednonásobná vlastnı́ čı́sla
Protože matice A je reálná, musı́ při komplexnı́m vlastnı́m čı́sle µ = α + jω být také komplexně
sdružené vlastnı́ čı́slo µ∗ = α − jω. Vlastnı́ vektory r + js jsou také komplexnı́.
Pro n = 2 a dvě komplexně sdružená vlastnı́ čı́sla je Jordanova matice
−1
AJ = Q
AQ =
"
α + jω
0
0
α − jω
#
také komplexnı́, ale lze ji převést na reálnou normálnı́ formu
"
α −ω
ω
α
#
Řešenı́ diferenciálnı́ rovnice lze pak psát ve tvaru
x(t) =
"
x1 (t)
x2 (t)
#
= eαt [(k1 r + k2 s) cos ωt + (k2 r − k1 s) sin ωt] ,
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
31
kde k1 , k2 jsou konstanty závislé na počátečnı́ch podmı́nkách.
Má-li matice A vı́ce dvojic komplexně sdružených vlastnı́ch čı́sel, lze Jordanovu matici převést
na tvar, který má v diagonále bloky rozměru 2x2, z nichž každý odpovı́dá jednomu páru komplexně
sdružených vlastnı́ch čı́sel. Původnı́ diferenciálnı́ rovnice je tak převedena na nezávislé dvoudimenzionálnı́ dı́lčı́ rovnice.
Podobně bychom mohli řešit lineárnı́ systémy, které majı́ reálná násobná nebo komplexně sdružená
násobná vlastnı́ čı́sla. Má-li vlastnı́ čı́slo násobnost p, pak jeho odpovı́dajı́cı́ blok v Jordanově matici
je řádu p. Podrobný rozbor je např. v [26].
Z teorie lineárnı́ch systémů je známo, že:
a) rovnovážný stav 0 systému (4.1) je asymptoticky stabilnı́ právě tehdy, když všechna vlastnı́ čı́sla
matice A majı́ záporné reálné části;
b) rovnovážný stav 0 je (neutrálně) stabilnı́ právě tehdy, když A nemá vlastnı́ čı́sla s kladnou
reálnou částı́ a vlastnı́ čı́sla s nulovou reálnou částı́ odpovı́dajı́ Jordanovým blokům řádu jedna;
c) rovnovážný stav 0 je nestabilnı́, jestliže A má bud’ alespoň jedno vlastnı́ čı́slo s kladnou reálnou
částı́ nebo vlastnı́ čı́slo s nulovou reálnou částı́, které odpovı́dá Jordanovu bloku s řádem většı́m než
jedna.
Invariantnı́ podprostory. Z předchozı́ch odstavců je patrno, že vhodnou transformacı́ souřadnic lze
matici A, která má nenásobná vlastnı́ čı́sla
λ1 , ..., λr , µ1 , µ∗1 , ..., µm , µ∗m ,
r + 2m = n
převést na Jordanův kanonický tvar s jednorozměrnými a dvourozměrnými bloky v diagonále. Prostor
Rn můžeme pak rozložit na jednorozměrné podprostory (pro reálná vlastnı́ čı́sla) a dvourozměrné
podprostory (pro komplexnı́ vlastnı́ čı́sla)
Rn = E1 ⊕ ... ⊕ Er ⊕ F1 ⊕ ... ⊕ Fm ,
kde dim Ei = 1, i = 1, ..., r a dim Fj = 2, j = 1, ..., m a symbol ⊕ značı́ součet algebraických struktur.
Prostor Rn je tedy přı́mým ortogonálnı́m součtem invariantnı́ch jedno- a dvoudimenzionálnı́ch podprostorů. Průběh trajektoriı́ lze pak v souřadnicı́ch odpovı́dajı́cı́ch Jordanovu tvaru zı́skat superpozicı́
jednodimenzionálnı́ch a dvoudimenzionálnı́ch pohybů.
V přı́padě násobných vlastnı́ch čı́sel je nutno provést rozloženı́ Rn do invariantnı́ch podprostorů
vyššı́ dimenze, která dosahuje maximálně hodnoty násobnosti reálných resp. dvojnásobné hodnoty
násobnosti komplexnı́ch vlastnı́ch čı́sel.
Podprostor, který je vytvořen všemi vlastnı́mi vektory odpovı́dajı́cı́mi vlastnı́m čı́slům se zápornou
(kladnou, nulovou) reálnou částı́ se nazývá stabilnı́ invariantnı́ podprostor E s (nestabilnı́ E u ,
centrálnı́ E c ). Rozměr podprostorů je ns , nu , nc , součet jejich rozměrů je roven n. Řešenı́ v E s klesajı́
exponenciálně (monotonně nebo oscilačně) k nule, řešenı́ v E u exponenciálně rostou (monotonně nebo
oscilačně), řešenı́ v E c zůstávajı́ konstantnı́ nebo oscilujı́.
V dalšı́ch článcı́ch uvidı́me, že znalosti fázových portrétů lineárnı́ch diferenciálnı́ch rovnic 1., 2. a
3. řádu nám dávajı́ představu o fázových portrétech v blı́zkém okolı́ rovnovážných stavů nelineárnı́ch
systémů. Protože fázové portréty systémů 1.řádu jsou velmi jednoduché, všimneme si jen lineárnı́ch
systémů 2. a 3. řádu.
Lineárnı́ systém 2. řádu lze zapsat např. ve tvaru ẍ + 2aω0 ẋ + ω02 x = 0 nebo po zavedenı́ nových
proměnných x = x1 a ẋ = x2 ve tvaru
ẋ1 = x2
ẋ2 = −2aω0 x2 − ω02 x1 ,
2
kde a je poměrné tlumenı́ a ω0 vlastnı́ frekvence
√ netlumeného systému. Charakteristická rovnice λ +
2
2
2aω0 λ + ω0 = 0 má kořeny λ1,2 = ω0 (−a ± a − 1). Rovnovážný stav je v bodě (0,0) a v závislosti
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
32
na hodnotách parametrů a, ω0 se nazývá střed, uzel (stabilnı́ nebo nestabilnı́), ohnisko (stabilnı́ nebo
nestabilnı́) a sedlo (vždy nestabilnı́). Odpovı́dajı́cı́ rozloženı́ kořenů charakteristické rovnice pro tyto
přı́pady a fázové portréty jsou uvedeny v tab. 4.1. Na obr. 4.1 je zakreslen diagram parametrů a oblasti
stability. Stabilnı́ rovnovážné stavy ležı́ pouze v prvnı́m kvadrantu tohoto diagramu.
Lineárnı́ systém 2. řádu v obecnějšı́m tvaru lze vyjádřit rovnicemi
ẋ1 = a11 x1 + a12 x2
ẋ2 = a21 x1 + a22 x2
(4.8)
Označı́me-li zápornou stopu −(a11 + a22 ) matice A pı́smenem σ a determinant (a11 a22 − a12 a21 )
symbolem ∆, pak kořeny charakteristické rovnice jsou
λ1,2
σ
=− ±
2
s
σ2
− ∆.
4
Řešenı́ závisı́ opět jen na dvou parametrech σ a ∆, odpovı́dajı́cı́ diagram parametrů je zakreslen na
obr. 4.2. Parabola oddělujı́cı́ ohniska a uzly má rovnici σ 2 = 4∆. Vertikálnı́ osa je hranicı́ mezi sedlem
a uzlem a body této osy ∆ = 0 představujı́ tzv. vı́cenásobné singulárnı́ body (např. uzel - sedlo).
Obrázek 4.1: Diagram parametrů pro systém
2.řádu
Obrázek 4.2: Diagram pro systém (4.8)
Lineárnı́ systém 3. řádu má charakteristickou rovnici
Jejı́ diskriminant je
λ3 + aλ2 + bλ + c = 0.
(4.9)
D = (9c − ab)2 − (6b − 2a2 )(6ac − 2b2 ).
(4.10)
Přı́pad 1: D < 0 , kořeny λ1 , λ2 , λ3 jsou reálné
a) je-li c < 0 mohou nastat tyto dı́lčı́ přı́pady:
λ1 , λ2 , λ3 > 0 singulárnı́ bod je nestabilnı́ uzel; λ1 > 0; λ2 , λ3 < 0 sedlo
b) je-li c > 0, pak: λ1 , λ2 , λ3 > 0 stabilnı́ uzel; λ1 > 0; λ2 , λ3 < 0 sedlo
c) je-li c = 0, pak: λ1 = 0; λ2 , λ3 6= 0 uzel nebo sedlo.
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
33
Tab. 4.1. Lineárnı́ systém 2. řádu
Přı́pad 2: D = 0, kořeny λ1 , λ2 , λ3 jsou reálné.
Existuje jeden dvojnásobný kořen a vznikajı́ podobné typy singulárnı́ch bodů jako u přı́padu 1.
Pro c = 0 se charakteristická rovnice (4.10) redukuje na tvar
λ(λ2 + aλ + b) = 0
D = 3b2 (4b − a2 ) = 0.
Jestliže b 6= 0 je 4b − a2 = 0. Kořeny jsou λ1 = 0; λ2 = λ3 = −a/2. Pro a > 0 je proto singulárnı́ bod
stabilnı́, pro a < 0 nestabilnı́. Jestliže b = 0, a 6= 0, pak λ1 = λ2 = 0 a λ3 = −a. Singulárnı́ bod je
stabilnı́ pro a > 0.
Přı́pad 3: D > 0, jeden kořen λ1 je reálný, λ2 , λ3 jsou komplexně sdružené. Pro c < 0 musı́ být
tedy λ1 > 0, pro c = 0λ1 = 0 a pro c > 0 je λ1 < 0. V každém z těchto třı́ přı́padů vznikajı́ ještě tři
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
34
dalšı́ možnosti:
Re(λ2 , λ3 ) > 0
Re(λ2 , λ3 ) = 0
Re(λ2 , λ3 ) < 0.
Jestliže Re(λ2 , λ3 ) = 0, singulárnı́ bod je střed (stabilnı́ nebo nestabilnı́ podle znaménka λ1 ). U systémů
třetı́ho řádu vznikajı́ již komplikované tvary trajektoriı́ kolem singulárnı́ch bodů a typy singularit se
označujı́ v některých přı́padech smı́šenými názvy, např. uzel-ohnisko, ohnisko-sedlo apod.
4.1.2
Lineárnı́ časově variantnı́ systémy
Uvažujme volný časově variantnı́ systém
ẋ = A(t)x,
(4.11)
kde maticová funkce A(t) je typu (n,n), časově závislá a spojitá pro všechna t ≥ 0. Základnı́ vlastnosti
tohoto systému jsou známy z přednášek o teorii lineárnı́ch systémů. Rovnovážný stav systému je v nule
a je izolovaný, jestliže A(t) je regulárnı́ pro t ≥ 0. Matice X(t, t0 ), složená po sloupcı́ch z n lineárně
nezávislých řešenı́ systému (4.11) se nazývá fundamentálnı́ matice. Je regulárnı́ pro všechna t a
splňuje maticovou rovnici Ẋ(t, t0 ) = A(t)X(t, t0 ). Každé řešenı́ systému (4.11) je lineárnı́ funkcı́ n
nezávislých řešenı́. Jestliže X 1 (t, t0 ) a X 2 (t, t0 ) jsou dvě fundamentálnı́ matice systému (4.11), pak
existuje regulárnı́ konstantnı́ matice M , pro kterou platı́ X 1 (t, t0 )M = X 2 (t, t0 ).
Stavová matice přechodu Φ(t, t0 ) je normovaná fundamentálnı́ matice s počátečnı́ hodnotou
Φ(t0 , t0 ) = I. Je definována vztahem
Φ(t, t0 ) = X(t, t0 )X −1 (t0 , t0 ).
(4.12)
Řešenı́ systému (4.11) lze pomocı́ stavové matice přechodu vyjádřit ve tvaru
x(t; t0 , x0 ) = Φ(t, t0 )x(t0 )
(4.13)
Analytický výraz pro Φ lze zı́skat jen u některých typů rovnic.
Věta 4.1. Nulové řešenı́ systému (4.11) je stabilnı́ právě tehdy, když existuje takové M (t0 ), že platı́
||Φ(t, t0 )|| ≤ M (t0 )
∀t ≥ t0 ≥ 0.
(4.14)
Podobně lze definovat stejnoměrnou a asymptotickou stabilitu. Jejich spojenı́m s větou 4.1 pak platı́
věta
Věta 4.2. Nulové řešenı́ systému (4.11) je stejnoměrně asymptoticky stabilnı́ právě když
a) existuje takové M < ∞, nezávislé na t0 , že ||Φ(t, t0 )|| ≤ M ∀t ≥ t0 ;
b) je splněna podmı́nka
lim ||Φ(t, t0 )|| = 0
t→∞
stejnoměrně v t0 . To znamená, že pro libovolné ε > 0 existuje takové T (ε) nezávislé na t0 , že
||Φ(t, t0 )|| < ε pro všechna t ≥ t0 + T a všechna t0 ≥ 0. (Důkazy vět jsou např. v [55]).
Podmı́nky stability podle vět 4.1 a 4.2 vyžadujı́ znalost fundamentálnı́ matice a tı́m i úplné množiny
nezávislých řešenı́. Uvedené věty majı́ proto jen omezený význam, protože fundamentálnı́ matici lze
spočı́tat jen u jednoduššı́ch systémů. Někdy je však zadaný systém ve speciálnı́m tvaru, který umožňuje
stabilitu snadněji určit. Je to např. systém uvedený v dalšı́ větě.
Věta 4.3. Lineárnı́ systém ẋ = [A+B(t)]x se nazývá systém s asymptoticky konstantnı́mi koeficienty,
jestliže limt→∞ ||B(t)|| = 0. Nulové řešenı́ tohoto systému je asymptoticky stabilnı́, jestliže matice A
má pouze vlastnı́ čı́sla se zápornou reálnou částı́.
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
35
Periodické systémy
Uvažujme soustavu diferenciálnı́ch rovnic s periodickými koeficienty
x ∈ Rn ,
ẋ = A(t)x
(4.15)
kde prvky matice A(t) jsou funkce spojité na intervalu (−∞, ∞) a periodické s periodou T > 0, takže
platı́ A(t + T ) = A(t). Také pro stavovou matici přechodu platı́ Φ(t + T, t0 ) = Φ(t, t0 ).
Definujme před dalšı́mi úvahami o vlastnostech periodických systémů dvě pomocné věty.
Věta 4.4. (Floquetova věta). Fundamentálnı́ matici soustavy (4.15) lze vyjádřit ve tvaru
X(t, 0) = P (t)eRt ,
(4.16)
kde X(t, 0) je fundamentálnı́ matice normovaná pro t = 0, prvky matice P (t) jsou spojitě diferencovatelné funkce periodické s periodou T , matice P (t) je regulárnı́, P (0) = I a R je konstantnı́ matice
[55].
Věta 4.5. Pro každou regulárnı́ matici B existuje taková matice R, že platı́ B = exp(R).
Definujme matici C vztahem
C = Φ−1 (t, 0)Φ(t + T, 0).
(4.17)
C je konstantnı́ matice a je regulárnı́, protože je součinem dvou regulárnı́ch matic. Podle věty 4.5 lze
volit matici R tak, že platı́ C = exp(RT ). Definujme dále matici P (t) jako
P (t) = Φ(t, 0)e−Rt .
(4.18)
P (t) je regulárnı́, protože je součinem dvou regulárnı́ch matic, a je periodická, nebot’ platı́
P (t + T ) = Φ(t + T, 0)e−Rt e−RT = Φ(t, 0)Ce−RT e−Rt = P (t).
(4.19)
Pro t = 0 je P (0) = I a z periodičnosti P (t) vyplývá, že P (kT ) = I.
Řešenı́ x(t; 0, x0 ) soustavy (4.15) lze pomocı́ stavové matice přechodu zapsat ve tvaru
x(t; 0, x0 ) = Φ(t, 0)x0 = P (t)eRt x0 .
(4.20)
x(T ; 0, x0 ) = Φ(T, 0)x0 = P (T )eRT x0 = eRT x0 .
(4.21)
C = eRT = Φ(T, 0)
(4.22)
Pro t = T je
Matice
se nazývá matice monodromie, vlastnı́ čı́sla matice monodromie jsou (charakteristické) multiplikátory ρi i = 1, ..., n soustavy (4.15). Vlastnı́ čı́sla matice R jsou tzv. charakteristické (nebo
Floquetovy) exponenty µi soustavy (4.15).
Z lineárnı́ teorie je známo, že
det[Φ(t, t0 )] = exp
Z
t
tr(A)dt ,
(4.23)
t0
kde tr(A) je stopa matice A. Z rovnic (4.22) a (4.23) pak vyplývá, že
n
Y
i=1
ρi = exp
Z
t
t0
tr(A)dt .
(4.24)
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
36
Matice P , C, R jsou definovány pomocı́ stavové matice přechodu a neexistuje obecná metoda jejich
výpočtu. Mohou být ale zı́skány numerickou integracı́ systému (4.15) po dobu periody T .
Pro stabilitu rovnovážného stavu 0 systému (4.15) pak platı́ tato věta [55].
Věta 4.6. Rovnovážný stav 0 systému (4.15) je stejnoměrně asymptoticky stabilnı́, platı́-li pro všechny
multiplikátory |ρi | < 1. Rovnovážný stav je stejnoměrně stabilnı́, platı́-li pro všechny multiplikátory
|ρi | ≤ 1 a jsou-li multiplikátory s hodnotou |ρi | = 1 jednoduché nuly minimálnı́ho polynomu matice
monodromie.
Věta 4.7. Systém (4.15) má periodické řešenı́ s periodou T právě tehdy, má-li matice monodromie
vlastnı́ čı́slo +1.
Přı́klad 4.1. [55] Je dán periodický systém (4.15), jehož matice A je
A(t) =
"
−1 + a cos2 t
1 − a sin t cos t
−1 − a sin t cos t −1 + a sin2 t
#
.
Dosazenı́m do zadané rovnice lze ověřit, že
Φ(t, 0) =
"
exp [(a − 1)t] cos t exp [−t] sin t
− exp [(a − 1)t] sin t exp [−t] cos t
#
.
Perioda T daného systému je 2π a matice monodromie je
Φ(2π, 0) =
"
exp [2(a − 1)π]
0
0
exp [−2π]
#
.
Vlastnı́ čı́sla této matice jsou exp [2(a − 1)π] a exp [−2π]. Jestliže a > 1, pak prvnı́ vlastnı́ čı́slo je většı́
než jedna, a rovnovážný stav 0 je podle věty 4.6 nestabilnı́.
Z přı́kladu je patrno, že stabilita neautonomnı́ho obvodu nemůže být určena přı́mo z vlastnı́ch čı́sel
matice A(t) pro každý pevný čas t. Vlastnı́ čı́sla matice A(t) jsou v našem přı́kladu nezávislá na t a
lze je stanovit z charakteristické rovnice λ2 + (2 − a)λ + (2 − a) = 0. Z nı́ vyplývá, že A(t) by bylo
stabilnı́ pro a < 2, což odporuje předchozı́mu výsledku.
4.2
Prvnı́ Ljapunovova metoda pro nelineárnı́ systémy
4.2.1
Lokálnı́ stabilita rovnovážných stavů autonomnı́ch systémů
V tomto článku budeme pomocı́ Ljapunovovy metody linearizace určovat lokálnı́ stabilitu
rovnovážných stavů (stabilitu v malém). Uvažujme nejprve autonomnı́ nelineárnı́ systém ẋ = f (x) a
jeho libovolný rovnovážný stav x = (x̄1 , x̄2 , ..., x̄n ). Předpokládejme dále, že funkce f = (f1 , f2 , ..., fn )
je spojitá a spojitě diferencovatelná v bodě x. Rozvedeme f v Taylorovu řadu kolem x. Protože v
rovnovážném stavu je f (x) = 0, dostaneme při zanedbánı́ členů vyššı́ho řádu vztahy
d
∂f1
∂f1
(x1 − x̄1 ) =
(x1 − x̄1 ) + ... +
(xn − x̄n )
dt
∂x1 x
∂xn x
..
.
d
∂fn
∂fn
(xn − x̄n ) =
(x1 − x̄1 ) + ... +
(xn − x̄n )
dt
∂x1 x
∂xn x
nebo v maticovém tvaru
d
(x − x) = A(x − x),
dt
(4.25)
(4.26)
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
kde



∂f
A=
=
∂x x 

∂f1
∂x1
...
∂fn
∂x1
∂f1
∂x2
...
∂fn
∂x2
...
...
...
37
∂f1
∂xn
...
∂fn
∂xn






(4.27)
x
je Jacobiova matice funkce f vyčı́slená v rovnovážném stavu x. Nazývá se také matice linearizace a
označuje se často symboly J nebo Df .
Zanedbánı́ členů vyššı́ho řádu je opodstatněno intuitivnı́ představou, že tyto členy nemajı́ v blı́zkosti
rovnovážného stavu žádný podstatný vliv na strukturu trajektoriı́. Podrobný důkaz této oprávněné
představy lze nalézt v učebnicı́ch matematiky.
Zavedeme-li za odchylku x − x od rovnovážného stavu novou proměnnou z, je
ż = Az
(4.28)
rovnice linearizace kolem rovnovážného stavu x. Stabilitu lze pak vyšetřit metodami použı́vanými pro
řešenı́ stability lineárnı́ch systémů. Vlastnı́ čı́sla matice A určı́me z charakteristické rovnice systému
(4.28) det [A − λI] = 0, kde I je jednotková matice a A konstantnı́ matice. Pak platı́ věta:
Věta 4.8. Majı́-li všechna vlastnı́ čı́sla matice linearizace A záporné reálné části, je rovnovážný stav
x systému ẋ = f (x) asymptoticky ljapunovsky stabilnı́. Má-li alespoň jedno vlastnı́ čı́slo kladnou
reálnou část, je rovnovážný stav ljapunovsky nestabilnı́.
V přı́padě, že jedno nebo vı́ce vlastnı́ch čı́sel matice A majı́ nulovou reálnou část, nenı́ možno
podle lineárnı́ho přiblı́ženı́ stanovit stabilitu rovnovážného stavu vyšetřovaného nelineárnı́ho systému.
Stabilita je určena vyššı́mi členy v Taylorově rozvoji, které byly při linearizaci zanedbány. V tomto
přı́padě lze stabilitu určit pomocı́ tzv. centrálnı́ variety (čl. 4.4) nebo s využitı́m druhé Ljapunovovy
metody (kap. 5).
Je třeba znovu zdůraznit, že pomocı́ metody linearizace zı́skáme pouze lokálnı́ stabilitu, studiem
globálnı́ stability se budeme zabývat v kap.5.
Poznámka. U systémů 2. řádu (a částečně i 3.řádu) můžeme velmi často kromě zjištěnı́ stability
rovnovážného stavu určit i pravděpodobné typy trajektoriı́ v jeho blı́zkém okolı́ na základě výsledků z
čl. 4.1. Věta 4.12 v článku 4.3 to specifikuje podrobněji. I když asymptotická stabilita rovnovážného
stavu nelineárnı́ho systému je dána asymptotickou stabilitou linearizovaného systému, nemusı́ klasifikace trajektoriı́ navzájem přesně odpovı́dat. Např. u nelineárnı́ho systému
ẋ1 = −x1 −
x2
q
log x21 + x22
ẋ2 = −x1 +
x1
q
log x21 + x22
je rovnovážný stav (0,0) stabilnı́ ohnisko, u jeho linearizace však stabilnı́ uzel.
Definice 4.1. Rovnovážný stav x se nazývá hyperbolický (také nedegenerovaný), jestliže všechna
vlastnı́ čı́sla matice A majı́ nenulové reálné části.
Přı́klad 4.2. Systémy 1.řádu. U systému ẋ = f (x), f : R → R vyšetřı́me stabilitu rovnovážného stavu x
velmi jednoduše. Matice linearizace degeneruje na derivaci f 0 (x), takže platı́:
a) f 0 (x) < 0 x je asymptoticky stabilnı́
b) f 0 (x) > 0 x je nestabilnı́
c) f 0 (x) = 0 z lineárnı́ aproximace nelze určit stabilitu.
Protože Taylorův rozvoj u systémů 1. řádu je velmi jednoduchý, můžeme posoudit stabilitu přı́padu c) z
členů vyššı́ho řádu. Je-li f 0 (x) = 0 a f 00 (x) 6= 0, je rovnovážný stav nestabilnı́. Jestliže pro f 0 (x) = 0 je f 00 (x) = 0,
nelze opět stabilitu určit a je třeba posoudit třetı́ derivaci. Tyto závěry lze snadno odvodit z grafu funkce f (x).
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
38
Přı́klad 4.3. Systém 2.řádu. Je třeba určit rovnovážné stavy a typy trajektoriı́ v jejich okolı́ u nelineárnı́ho
systému popsaného rovnicemi
ẋ1 = x2
ẋ2 = bx1 − cx31 − ax2
(4.29)
Položı́me-li pravé strany rovny nule, zı́skáme tři rovnovážné stavy
r
r
b
b
(1)
(2)
(3)
x = (0, 0)
x = (+
; 0)
x = (−
; 0)
c
c
Jacobiova matice pro danou soustavu rovnic má tvar


∂f1 ∂f1
"
0
 ∂x1 ∂x2 

A=
 ∂f2 ∂f2  =
b − 3cx21
∂x1 ∂x2
1
#
.
−a
Dosadı́me-li do této matice čı́selnou hodnotu prvnı́ho rovnovážného stavu x1 = 0, x2 = 0, dostaneme charakteristickou rovnici
det [A1 − λI] = λ2 + aλ − b = 0.
p
Jejı́ kořeny λ1,2 = −a/2 ± a2 /4 + b jsou reálné a opačných znamének, rovnovážný stav je tedy nestabilnı́.
Protože pro 2. řád známe také průběh trajektoriı́ v blı́zkém okolı́ rovnovážného stavu, je z tab. 4.1 patrno, že
rovnovážný stav je sedlo. Přı́mkové trajektorie sedla lze určit pomocı́ vlastnı́ch vektorů.
Dosadı́me-li do Jacobiovy matice hodnoty druhého rovnovážného stavu, je charakteristická rovnice lineárnı́ho
přiblı́ženı́
det[A2 − λI] = λ2 + aλ + 2b = 0.
Typ rovnovážného stavu závisı́ na konkrétnı́ch hodnotách a, b. Pro a2 /4 < 2b jsou kořeny komplexně sdružené
a rovnovážný stav je stabilnı́ ohnisko, pro a2 /4 > 2b jsou kořeny záporné reálné a rovnovážný stav je stabilnı́
uzel. Pro třetı́ rovnovážný stav dostáváme stejný výsledek.
Pomocı́ metody linearizace zjistı́me tedy pro všechny rovnovážné stavy jejich stabilitu a tvary trajektoriı́ v
blı́zkém okolı́ těchto rovnovážných stavů. Společně s dalšı́mi znalostmi o vektorovém poli (např. o nemožnosti
existence uzavřených trajektoriı́ pro tento systém, viz čl. 10.2) si můžeme učinit dobrou představu i o globálnı́m
průběhu trajektoriı́. Pro ilustraci chovánı́ systému i dále od rovnovážných stavů je na obr. 4.3 zakreslena celá
sı́t’ fázových trajektoriı́. Je patrno, že systém se chová jako klopný obvod se dvěma stabilnı́mi rovnovážnými
stavy. Každá trajektorie končı́ v jednom z obou stabilnı́ch rovnovážných stavů, s výjimkou té, která směřuje do
sedla v bodě (0,0). Tato trajektorie se nazývá separatrix, protože odděluje oblasti přitažlivosti obou stabilnı́ch
rovnovážných stavů.
Závislost systému na parametrech. Budeme-li v rovnici 4.29 měnit hodnotu parametrů, např. snižovat
velikost parametru b, budou se stabilnı́ rovnovážné stavy přibližovat k počátku a pro b = 0 bude mı́t systém
jen jeden rovnovážný stav, jehož stabilitu nemůžeme nynı́ určit pomocı́ linearizace, protože Jacobiova matice
bude singulárnı́ a jedno vlastnı́ čı́slo bude ležet na imaginárnı́ ose. Tento přı́pad vyšetřı́me později pomocı́ jiných
metod (čl.4.4).
Bude-li hodnota parametru b záporná, bude mı́t systém jeden stabilnı́ rovnovážný stav. Je patrno, že při
kritické hodnotě parametru b = 0 nastává tzv. bifurkace, při nı́ž se kvalitativně měnı́ charakter fázového
portrétu. Podrobnějšı́ rozbor bifurkačnı́ch problémů bude podán v kap. 11.
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
39
Obr. 4.3. Pole trajektoriı́ systému 4.29
Řešenı́ lokálnı́ stability rovnovážných stavů nelineárnı́ho systému ẋ = f (x) lze provést také tak, že nejprve
vhodnou transformacı́ posuneme vyšetřovaný rovnovážný stav do počátku. Pak x = 0, f (0) = 0 a Jacobiova
matice A = [∂f /∂x] se vyhodnocuje pro x = 0. Taylorův rozvoj pravé strany lze při uvažovánı́ vyššı́ch členů
zapsat ve tvaru
f (x) = Ax + r(x),
(4.30)
kde r(x) reprezentuje všechny členy s druhými a vyššı́mi mocninami. Z toho vyplývá oprávněnost ljapunovské
linearizace, protože
||r(x)||
lim
= 0.
(4.31)
||x||→0 ||x||
Lokálnı́ stabilitu rovnovážného stavu x = 0 posuzujeme zase podle vlastnı́ch čı́sel matice A a věty 4.8.
Má-li pravá strana zadané nelineárnı́ diferenciálnı́ rovnice již tvar Ax + r(x) nebo ji na tuto formu můžeme
snadno převést, je lokálnı́ stabilita rovnovážného stavu 0 dána přı́mo vlastnostmi matice A, platı́-li ovšem (4.31).
Věta 4.9. Je dán systém
ẋ = Ax + r(x)
r(0) = 0,
(4.32)
n
kde A je reálná konstantnı́ čtvercová matice a r je reálná vektorová funkce spojitá v oblasti Ω ⊂ R obsahujı́cı́
bod 0 a splňujı́cı́ podmı́nku (4.31). Pak platı́:
a) majı́-li všechna vlastnı́ čı́sla matice A záporné reálné části, je x = 0 asymptoticky stabilnı́;
b) má-li alespoň jedno vlastnı́ čı́slo matice A kladnou reálnou část, je x = 0 nestabilnı́.
4.2.2
Lokálnı́ stabilita rovnovážných stavů neautonomnı́ch systémů
Ljapunovovu linearizačnı́ metodu lze použı́t také pro neautonomnı́ systémy. Uved’me nejprve obecnou větu,
kterou dále využijeme pro lokálnı́ linearizaci neautonomnı́ho nelineárnı́ho systému.
Věta 4.10. Řešenı́ x = 0 nelineárnı́ho časově variantnı́ho systému
ẋ = A(t)x + r(t, x)
r(t, 0) = 0
∀t > 0
(4.33)
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
40
je stejnoměrně asymptoticky stabilnı́, jestliže a)
lim
||x||→0
||r(t, x)||
=0
||x||
(4.34)
a je splněna stejnoměrná konvergence
lim
||x||→0
sup
||r(t, x)||
=0
||x||
(4.35)
b) A(t) je ohraničená pro všechna t
c) nulové řešenı́ systému ẋ = A(t)x je stejnoměrně asymptoticky stabilnı́.
Důkaz věty pomocı́ druhé Ljapunovovy metody lze nalézt např. v [55],s.212. Podmı́nky stability časově
variantnı́ch lineárnı́ch systémů jsou známy z předmětu Teorie dynamických systémů.
Poznámka: Podmı́nka stejnoměrnosti (4.35) znamená, že pro libovolné ε > 0 musı́ existovat takové δ > 0
nezávislé na t, že
||r(t, x)||
<ε
||x||
platı́ pro všechna t a všechna ||x|| < δ.
Uvažujme nynı́ nebuzený časově variantnı́ systém
ẋ = f (t, x)
f (t, 0) = 0
∀t ≥ 0
f ∈ Cr.
(4.36)
Taylorův rozvoj funkce f pro libovolný pevný čas t ≥ 0 vede na rovnici (4.33), kde A(t) = (∂f /∂x) pro x = 0.
Z definice Jacobiovy matice A(t) vyplývá pro každé pevné t ≥ 0, že je splněna podmı́nka (4.34), nemusı́ být
ovšem splněna stejnoměrná konvergence (4.35). Systém ẋ = A(t)x je však linearizacı́ neautonomnı́ho systému
(4.36) kolem rovnovážného stavu 0 pouze tehdy , je-li splněna podmı́nka (4.35). Pak lze stabilitu nelineárnı́ho
systému (4.36) řešit pomocı́ věty 4.10. Je třeba zdůraznit, že na rozdı́l od autonomnı́ch systémů neplatı́ u
neautonomnı́ch systémů relace mezi nestabilitou linearizace ẋ = A(t)x a nestabilitou daného systému (4.36).
U mnoha neautonomnı́ch systémů (4.36) je sice splněna podmı́nka (4.34), ale nikoliv (4.35). Pak nelze
linearizačnı́ metodu použı́t.
Přı́klad 4.4. Systém ẋ1 = −x1 + tx22 , ẋ2 = x1 − x2 má pro x = 0 matici A konstantnı́ a zbytek r(x) = [tx22 ; 0]T .
Platı́ podmı́nka (4.34), ale ne stejnoměrnost (4.35), proto systém ẋ1 = −x1 , ẋ2 = x1 − x2 nenı́ linearizacı́
původnı́ho systému.
Jacobiova matice A(t) neautonomnı́ho nelineárnı́ho systému je obecně t-variantnı́, pouze v některých
speciálnı́ch přı́padech je konstantnı́. Např. systém ẋ = −x2 /t vede na linearizaci ẋ = −x. Podobně tomu
bylo i v přı́kladu 4.4. Je-li matice linearizace konstantnı́, můžeme na rozdı́l od věty 4.10 posoudit i nestabilitu
rovnovážného stavu.
Věta 4.11. Jestliže Jacobiova matice A(t) = A je konstantnı́ pro všechna t ≥ 0 a jsou splněny podmı́nky (4.34)
a (4.35), pak rovnovážný stav 0 nelineárnı́ho systému (4.36) je
a) asymptoticky ljapunovsky stabilnı́, majı́-li všechna vlastnı́ čı́sla matice A záporné reálné části;
b) nestabilnı́, jestliže jedno nebo vı́ce vlastnı́ch čı́sel matice A má kladnou reálnou část.
Přı́klad 4.5. Pro určenı́ ljapunovské stability rovnovážného stavu 0 systému
ẋ1 = x1 − x2 + x21 + x22 sin t
ẋ2 = x1 + x2 − 2x1 x2 e−t
lze použı́t věty 4.11, protože zadaný systém je již ve tvaru (4.33) s konstantnı́ maticı́ A a funkcı́ r(t, x), která
splňuje podmı́nky (4.34) a (4.35)
2
1 −1
x1 + x22 sin t
A=
,
r(t, x) =
.
1 1
−2x1 x2 e−t
Vlastnı́ čı́sla matice A jsou 1+j a 1−j a majı́ tedy kladnou reálnou část. Rovnovážný stav 0 je proto ljapunovsky
nestabilnı́.
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
4.3
41
Strukturálnı́ stabilita
Reálné systémy, které popisujeme matematickými modely, např. ve formě autonomnı́ch diferenciálnı́ch rovnic
ẋ = f (x), jsou neustále vystaveny různým poruchám (perturbacı́m). Vliv některých poruch se v modelu může
projevit např. malými změnami vektorového pole f (x). Adekvátnost modelu je pak zajištěna tehdy, jestliže
vektorové pole v(x), blı́zké v jistém smyslu vektorovému poli f (x), nevyvolá kvalitativnı́ změny v chovánı́
systému. Chceme proto, aby fázové portréty systémů ẋ = f (x) a ẋ = v(x) byly kvalitativně stejné, tj. aby
systém ẋ = f (x) byl při malých poruchách strukturálně stabilnı́.
Uved’me nynı́ přesnějšı́ formulace intuitivně zavedených pojmů. Uvažujme množinu všech vektorových polı́
třı́dy C r na Rn . Tuto množinu můžeme považovat za topologický prostor, jehož body jsou jednotlivá vektorová
pole.
Poznámka. Topologie je matematická disciplı́na studujı́cı́ topologické vlastnosti různých matematických objektů, tj. takové vlastnosti, které jsou invariantnı́ vzhledem k libovolnému homeomorfnı́mu zobrazenı́. Pro
jednoduchost si můžeme představit topologický prostor jako metrický prostor. Základnı́ vlastnosti topologických prostorů jsou přehledně zpracovány v knize [13]. Homeomorfismus je zobrazenı́ h : Rn → Rm , které je
prosté, spojité a jehož inverznı́ zobrazenı́ h−1 je rovněž spojité.
Definice 4.2. Systémy ẋ = f (x) a ẋ = v(x) se nazývajı́ topologicky orbitálně ekvivalentnı́, jestliže existuje
homeomorfismus h : Rn → Rn , který zobrazuje trajektorie jedné soustavy na trajektorie druhé soustavy při zachovánı́ směru jejich probı́hánı́. Fázové portréty takových systémů se pak nazývajı́ topologicky ekvivalentnı́
nebo kvalitativně stejné. Platı́-li to pro celý stavový prostor, jde o globálnı́ ekvivalenci.
Např. fázové portréty stabilnı́ho uzlu u lineárnı́ho systému ẋ = Ax a stabilnı́ho ohniska u ẋ = Bx jsou
globálně topologicky orbitálně ekvivalentnı́, protože trajektorie směřujı́cı́ do uzlu lze homeomorfně zobrazit na
spirály směřujı́cı́ do ohniska.
Pro nelineárnı́ systémy je globálnı́ verze obvykle přı́liš silná a je třeba uvažovat jen lokálnı́ verzi.
Definice 4.3. Necht’ x je rovnovážný stav vektorového pole f na Rn a y rovnovážný stav pole v na Rn ,
U je okolı́ bodu x, V je okolı́ bodu y, a h : U → V je homeomorfismus, který zobrazuje U na V . Systémy
ẋ = f (x) a ẋ = v(x) jsou lokálně topologicky orbitálně ekvivalentnı́ v bodech x, y, jsou-li topologicky
orbitálně ekvivalentnı́ v jistých okolı́ch U, V bodů x, y.
Definice 4.4. (Strukturálnı́ stabilita). Systém ẋ = f (x) je lokálně strukturálně stabilnı́ v bodě x,
jestliže pro všechna vektorová pole v dostatečně blı́zká k poli f , je ẋ = v(x) v bodě y lokálně topologicky
orbitálně ekvivalentnı́ se systémem ẋ = f (x) v bodě x.
Věta 4.12. (Grobmanova-Hartmanova věta). Necht’ x je hyperbolický rovnovážný stav systému ẋ = f (x) a
A = Df (x) je jeho matice linearizace. Pak soustavy ẋ = f (x) a ẋ = Ax jsou lokálně topologicky orbitálně
ekvivalentnı́ v bodech x a 0, tj. fázový portrét soustavy ẋ = f (x) je v jistém okolı́ bodu x topologicky
ekvivalentnı́ s fázovým portrétem lineárnı́ soustavy ẋ = Ax v okolı́ počátku.
V okolı́ hyperbolických rovnovážných stavů se tedy fázový portrét kvalitativně neměnı́ a nedocházı́ proto
k bifurkacı́m. Při studiu bifurkacı́ (kap. 11) se musı́me zabývat rovnovážnými stavy, které nejsou hyperbolické.
Stabilitu těchto stavů však nelze určit pomocı́ linearizace, protože matice A tam má vlastnı́ čı́sla s nulovou
reálnou částı́. Možnosti řešenı́ si ukážeme v dalšı́m článku o centrálnı́ varietě.
4.4
Centrálnı́ varieta
V čl. 4.1 jsme ukázali, že u lineárnı́ho systému je možno v prostoru Rn najı́t lineárnı́ invariantnı́ podprostory
E s , E u , E c , které jsou vytvořeny vlastnı́mi vektory přı́slušejı́cı́mi k vlastnı́m čı́slům se zápornými, kladnými
a nulovými reálnými částmi. Také u nelineárnı́ch systémů existujı́ analogické podprostory, které jsou však již
tvořeny nelineárnı́mi křivkami nebo plochami. Mluvı́me proto obecněji o varietách. (Varieta je souhrnný pojem
pro křivky a plochy v n-rozměrném prostoru).
Je-li x hyperbolický rovnovážný stav systému ẋ = f (x), má matice linearizace A = Df (x) jen vlastnı́
čı́sla s nenulovou reálnou částı́ a existuje lokálnı́ stabilnı́ a lokálnı́ nestabilnı́ varieta vektorového pole f v bodě
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
42
x. Tyto variety lze definovat např. vztahy:
s
Wloc
(x) = {x ∈ U |Φt (x) → x pro t → ∞ a Φt (x) ∈ U ∀t ≥ 0}
u
Wloc
(x) = {x ∈ U |Φt (x) → x pro t → −∞ a Φt (x) ∈ U ∀t ≤ 0},
s
u
kde U ⊂ Rn je otevřené okolı́ rovnovážného stavu x. Invariantnı́ variety Wloc
a Wloc
jsou nelineárnı́ analogiı́
s
u
stabilnı́ch a nestabilnı́ch invariantnı́ch podprostorů E a E u lineárnı́ch systémů (čl. 4.1) a majı́ podobný
význam pro lokálnı́ topologickou klasifikaci vektorových polı́ jako invariantnı́ podprostory lineárnı́ch dynamických systémů pro jejich globálnı́ topologickou klasifikaci.
Bude-li mı́t systém rovnovážný stav nehyperbolický, má matice linearizace A = Df (x) také jedno nebo
vı́ce vlastnı́ch čı́sel s nulovou reálnou částı́ a tok v blı́zkosti rovnovážného stavu může být velmi komplikovaný.
Docházı́ k bifurkacı́m a metoda linearizace již neumožňuje posoudit stabilitu rovnovážného stavu. V analogii s
c
lineárnı́m systémem zavedeme pak také pojem centrálnı́ variety Wloc
.
Protože rovnovážný stav x lze vždy vhodnou transformacı́ převést do počátku, budeme v dalšı́ch úvahách
pro zjednodušenı́ předpokládat, že x = 0. Budeme tedy vyšetřovat fázový portrét systému
ẋ = f (x) = Ax + r(x).
(4.37)
Linearizace systému v počátku je ẋ = Ax.
Věta 4.13. Necht’ f (x) je C r vektorové pole na Rn , f (0) = 0, A = Df (0). Necht’ odpovı́dajı́cı́ invariantnı́
s
podprostory matice A jsou E s , E u , E c . Potom existujı́ C r stabilnı́ a nestabilnı́ lokálnı́ invariantnı́ variety Wloc
u
s
u
r−1
c
c
a Wloc , které se dotýkajı́ v bodě 0 variet E a E a C
centrálnı́ invariantnı́ varieta Wloc , k nı́ž E v nule je
s
u
c
tečné. Variety Wloc
a Wloc
jsou jednoznačné, Wloc
však nemusı́ jednoznačná být (navı́c může ztratit hladkost).
Důkaz věty je podán např. v [32].
s
u
c
Na obr. 4.4 jsou pro ilustraci zakresleny lokálnı́ variety Wloc
, Wloc
, Wloc
a invariantnı́ podprostory E s ,
u
c
E a E jejich linearizace v rovnovážném stavu 0. Na centrálnı́ varietě nemůžeme vyznačit směr toku bez
specifických informacı́ o členech vyššı́ho řádu v blı́zkosti nuly. Průběhy lokálnı́ch variet se ovšem u konkrétnı́ho
systému mohou lišit od průběhů na obr. 4.4.
Abychom mohli určit rovnice centrálnı́ variety, je výhodné transformovat matici linearizace A do Jordanova kanonického tvaru. V něm jsou vlastnı́ vektory na sebe kolmé a to nám umožňuje pracovat s lokálnı́mi
kartézskými souřadnicemi.
Jordanova matice má tvar
 0

A
0
0
AJ =  0 A −
(4.38)
0 ,
+
0
0
A
kde submatice A0 , A− , A+ majı́ vlastnı́ čı́sla s nulovou, zápornou a kladnou reálnou částı́. Soustava ẋ = Ax se
rozpadla na tři nezávislé rovnice a lze ji zapsat ve tvaru
ẋ0 = A0 x0 ,
ẋ− = A− x− ,
ẋ+ = A+ x+ ,
(4.39)
kde x0 , x− , x+ jsou transformované proměnné původnı́ho systému.
Abychom v dalšı́m nemuseli pracovat se složitým označenı́m podle rov. (4.39), použijme pı́smen x, y, z, kde
pı́smenem x označı́me nynı́ jen proměnné odpovı́dajı́cı́ vlastnı́m čı́slům s nulovou reálnou částı́
x = x0 ,
y = x− ,
z = x+ .
Dále položı́me A0 = B, A− = C, A+ = P . Původnı́ nelineárnı́ systém po transformaci lineárnı́ části do
Jordanova tvaru a s použitı́m nového označenı́ proměnných lze nynı́ zapsat ve tvaru
ẋ = Bx + F (x, y, z)
ẏ = Cy + G(x, y, z)
ż = P z + H(x, y, z)
(4.40)
Malou změnou parametrů matic C a P se kvalitativně neměnı́ fázové portréty druhé a třetı́ rovnice.
Všechny kvalitativnı́ změny, které mohou nastat, jsou soustředěny do prvnı́ rovnice. Všechny závažné jevy
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
43
se tedy odehrávajı́ na centrálnı́ varietě. Tı́m se n-rozměrný bifurkačnı́ problém zredukuje na rozměr centrálnı́
variety, který je podstatně nižšı́ (nejčastěji jedno- nebo dvourozměrný). Vlivem nelineárnı́ch členů F , G, H se
invariantnı́ podprostory lineárnı́ aproximace neničı́, pouze se deformujı́.
Obr. 4.4. Lokálnı́ variety
4.4.1
Výpočet centrálnı́ variety a určovánı́ stability meznı́ho přı́padu
Metoda linearizace neumožňuje určit stabilitu rovnovážného stavu v přı́padě, že matice linearizace má vlastnı́
čı́sla s nulovou reálnou částı́. Tento přı́pad lze však řešit pomocı́ centrálnı́ variety. Uvažujme pro zjednodušenı́,
u
že nenı́ nestabilnı́ varieta Wloc
. Matice linearizace nemá tedy žádné vlastnı́ čı́slo s kladnou reálnou částı́, což je
u reálného fyzikálnı́ho systému nejčastějšı́ přı́pad. Pak můžeme nelineárnı́ systém zapsat ve tvaru
ẋ = Bx + F (x, y)
ẏ = Cy + G(x, y),
(4.41)
kde x ∈ Rk , y ∈ Rn−k , B je matice rozměru k×k s vlastnı́mi čı́sly s nulovou reálnou částı́ a C je matice rozměru
(n − k) × (n − k) s vlastnı́mi čı́sly se zápornou reálnou částı́. F , G jsou nelineárnı́ funkce všech proměnných a
jsou spolu se svými prvnı́mi derivacemi v bodě (0,0) nulové.
Protože centrálnı́ varieta ležı́ tečně k podprostoru E c a vlastnı́ vektory u Jordanova tvaru jsou na sebe
c
kolmé, můžeme pracovat s lokálnı́mi kartézskými souřadnicemi a Wloc
vyjádřit ve tvaru
c
Wloc
= {(x, y)|y = g(x), g(0) = g 0 (0) = 0},
(4.42)
kde g(x) je vhodná funkce definovaná v okolı́ počátku U ⊂ Rk . Pohyb po centrálnı́ varietě je dán prvnı́ rovnicı́
soustavy (4.41), kterou můžeme nynı́ vyjádřit ve tvaru
ẋ = Bx + F (x, g(x)).
(4.43)
K určenı́ g(x) diferencujme y(t) = g(x(t)) podle t a dosad’me z (4.43)
ẏ = g 0 (x)ẋ = g 0 (x) [Bx + F (x, g(x))] = Cg(x) + G(x, g(x))
(4.44)
Spolu s podmı́nkou g(0) = g 0 (0) = 0 je to nelineárnı́ diferenciálnı́ rovnice, kterou analyticky nelze obvykle
vyřešit, ale kterou lze v mnoha přı́padech přibližně řešit v blı́zkosti x = 0 mocninnou řadou. Praktický postup
si ukážeme na dvou jednoduchých přı́kladech.
Přı́klad 4.6. Mějme systém dvou diferenciálnı́ch rovnic
ẋ = −xy
ẏ = −βy + x2
β > 0.
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
44
Rovnovážný stav je v nule a matice linearizace v bodě nula má již Jordanův tvar
0 0
AJ (0, 0) =
B = 0,
C = −β
F = −xy
0 −β
G = x2 .
Nulové vlastnı́ čı́slo neumožňuje určit stabilitu rovnovážného stavu podle prvnı́ Ljapunovovy metody. Určeme
c
funkci
proto přibližný tvar centrálnı́ variety v blı́zkosti rovnovážného stavu. Volme např. jako aproximaci Wloc
g(x) ve tvaru
g(x) = ax2 + bx3 + cx4 + o(x5 )
a, b, c > 0
Podle vztahu (4.44) pak je
g 0 (x)[−xg(x)] = −βg(x) + x2 .
Po dosazenı́
−2a2 x4 + vyššı́ členy = (1 − βa)x2 − βbx3 − βcx4 .
Aby se vyloučily členy do x4 , volme
1 − βa = 0
− 2a2 = −βc,
− βb = 0
z čehož vyplývá
a = 1/β
Pak
g(x) =
b=0
c = 2/β 3 .
1 2
2
x + 3 x4 + o(x5 ).
β
β
Protože ẋ = −xy = −xg(x), probı́há na centrálnı́ varietě přibližná dynamika
1
2
ẋ = − x3 − 3 x5 + o(x6 ).
β
β
Protože jde o dynamiku prvnı́ho řádu, lze snadno určit, že bod (0,0) daného nelineárnı́ho systému je stabilnı́.
Je také patrno, že pro určenı́ stability rovnovážného stavu (0,0) postačı́ prvnı́ člen ax2 v aproximaci centrálnı́
variety (nechceme-li určit přesněji jejı́ tvar v blı́zkém okolı́ bodu (0,0)).
Přı́klad 4.7. Mějme systém
u̇ = v
v̇ = −v + αu2 + βuv.
(4.45)
Snadno se přesvědčı́me, že rovnovážný stav je v bodě (0,0) a Jacobiova matice v bodě (0,0) má vlastnı́ čı́sla 0
a -1 a nenı́ v Jordanově tvaru. Zadaný systém (4.45) nenı́ tedy v normálnı́ formě a je třeba ho na tuto formu
převést. Vypočteme proto vlastnı́ vektory Jacobiovy matice A(0, 0), z nich určı́me transformačnı́ matici Q a
stanovı́me závislost mezi danými proměnnými u, v a novými proměnnými normálnı́ formy, které označı́me x, y.
1
1
1
1
u
x
v1 =
v2 =
Q=
=Q
.
0
−1
0 −1
v
y
Mezi souřadnicemi je tedy vztah u = x + y, v = −y. Dosazenı́m do zadaných rovnic (4.45) a úpravou dostaneme
normálnı́ formu
ẋ = α(x + y)2 − β(xy + y 2 )
ẏ = −y − α(x + y)2 + β(xy + y 2 ),
(4.46)
kde lineárnı́ část je nynı́ v Jordanově tvaru. Porovnánı́m s rovnicemi (4.41) je patrno, že B = 0 a C = −1.
Pro aproximaci centrálnı́ variety zvolme g(x) = ax2 , tj. aproximaci parabolou v okolı́ rovnovážného stavu.
Dosazenı́m do vztahu (4.44) a porovnánı́m stran vyplývá, že a = −α, tj. g(x) = −αx2 . Dosazenı́m za y = g(x) =
−αx2 do prvnı́ rovnice soustavy (4.46) dostaneme pro dynamiku na centrálnı́ varietě vztah
ẋ = αx2 + α(β − 2α)x3 + o(x4 ),
ze kterého snadno zjistı́me, že nulový rovnovážný stav je nestabilnı́.
KAPITOLA 4. LJAPUNOVOVA METODA LINEARIZACE
4.5
45
Úlohy
4.1. Určete rovnovážné stavy a stabilitu systému
ẋ = xy + ax3 + bxy 2
ẏ = −y + cx2 + dx2 y
pro různá znaménka a hodnoty konstant a, b, c, d.
4.2. Určete pomocı́ Ljapunovovy metody linearizace eventuelně pomocı́ centrálnı́ variety stabilitu nulového
rovnovážného stavu u systémů
a) ẋ = xy − αx
ẏ = −βy + x2
pro různá znaménka a hodnoty parametrů α, β.
3
2
ẏ = −y + y 2 + x2 y − x3
a∈R
b) ẋ = ax + x y
c) ẋ = xy + ax3 + bxy 2
ẏ = −y + cx2 + dx2 y
a, b, c, d ∈ R
Kapitola 5
Přı́má Ljapunovova metoda
Přı́má (nebo také druhá) Ljapunovova metoda umožňuje posoudit stabilitu nebo asymptotickou stabilitu v
malém i ve velkém u lineárnı́ho i nelineárnı́ho autonomnı́ho i neautonomnı́ho systému. Metoda obcházı́ řešenı́
nelineárnı́ch diferenciálnı́ch rovnic hledánı́m tzv. ljapunovských funkcı́, které jsou matematickým zobecněnı́m
základnı́ho fyzikálnı́ho principu, jı́mž je pokles celkové energie izolovaného disipativnı́ho systému při jeho pohybu. Je-li rovnovážný stav systému asymptoticky stabilnı́, pak při pohybu po trajektorii se akumulovaná energie systému s rostoucı́m časem zmenšuje a své minimálnı́ hodnoty dosáhne v rovnovážném stavu. Ljapunovova
metoda spočı́vá v nalezenı́ vhodné funkce, kterou si lze zjednodušeně představit jako zobecněnou energii. Definitnost této funkce spolu s definitnostı́ jejı́ časové derivace podél řešenı́ stavové rovnice systému nám dá informaci
o stabilitě systému. Principy této teorie si ukážeme nejprve na jednoduššı́ch systémech, kterými jsou autonomnı́
systémy.
5.1
Ljapunovovy funkce pro autonomnı́ systémy
Uvažujme systém
ẋ = f (x)
f (0) = 0
(5.1)
a zkoumejme stabilitu nulového řešenı́. Předpokládejme, že f je spojitá a spojitě diferencovatelná na Rn .
Definice 5.1. Reálná funkce V (x), spojitá v oblasti Ω = {x ∈ Rn : ||x|| < B, B > 0} je pozitivně definitnı́
v Ω, jestliže V (0) = 0 a V (x) > 0 pro x 6= 0 v Ω. Jestliže uvedená vlastnost platı́ v celém stavovém prostoru,
je V (x) globálně pozitivně definitnı́. Funkce je negativně definitnı́, jestliže −V (x) je pozitivně definitnı́. Funkce
V (x) je pozitivně (resp. negativně) semidefinitnı́, je-li V (x) ≥ 0 (resp. V (x) ≤ 0) pro x 6= 0 a V (0) = 0.
Velmi často použı́vanou Ljapunovovou funkcı́ je obecná kvadratická forma n proměnných
V (x) =
n X
n
X
qij xi xj = xT Qx,
(5.2)
i=1 j=1
kde qij jsou reálné konstanty. Koeficienty u členů xi xj (i 6= j) jsou dány součtem qij + qji . Tyto koeficienty
se nezměnı́, jestliže qij a qji položı́me rovny (qij + qji )/2. Kvadratickou formu lze pak psát ve tvaru (5.2), kde
qij = qji , tj. Q je reálná symetrická matice. Tato forma je pozitivně definitnı́ právě tehdy, když všechny hlavnı́
minory determinantu matice Q jsou kladné (Sylvestrův teorém).
Kvadratická forma je vhodnou Ljapunovovou funkcı́ pro lineárnı́ systémy, u nelineárnı́ch systémů však ve
většině přı́padů nevyhovuje a je třeba hledat složitějšı́ typy funkcı́. U nich je však často velmi obtı́žné stanovit
definitnost, která je základnı́m požadavkem u Ljapunovovy funkce, jak je patrno z následujı́cı́ definice.
Definice 5.2. Ljapunovova funkce je taková reálná funkce V (x) definovaná na oblasti Ω = {x ∈ Rn : ||x|| <
B}, která splňuje podmı́nky
a) V (x) je spojitá a má spojité prvnı́ parciálnı́ derivace v oblasti Ω kolem počátku.
b) V (x) je pozitivně definitnı́ v Ω.
c) Časová derivace V̇ (x) podél řešenı́ daného systému (5.1) je negativně definitnı́ nebo negativně semidefinitnı́
v Ω.
46
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
47
Derivace V̇ (x) podél řešenı́ daného systému je definována vztahem
∂V
∂V
dV (x)
=
ẋ =
f (x)
dt
∂x
∂x
(5.3)
∂V
∂V
f1 (x) + ... +
fn (x) = (grad V )T f (x) = (∇V )T f (x).
∂x1
∂xn
(5.4)
V̇ =
nebo v jiném zápisu
V̇ =
Věta 5.1. (Ljapunovovo kritérium). Existuje-li k danému systému (5.1) pozitivně definitnı́ Ljapunovova
funkce v oblasti Ω a je-li tam V̇ (x) negativně semidefinitnı́ (resp. negativně definitnı́), je rovnovážný stav x = 0
ljapunovsky stabilnı́ (resp. asymptoticky stabilnı́) v Ω.
Je-li V (x) pozitivně definitnı́ a V̇ (x) negativně definitnı́ v celém stavovém prostoru a V (x) → ∞ při
||x|| → ∞, je rovnovážný stav 0 globálně asymptoticky stabilnı́.
Přı́klad 5.1. Dynamický systém
ẋ1 = −x2 − x31
ẋ2 = x1 − x32
má jeden rovnovážný stav v počátku. Zvolme např. Ljapunovovu funkci ve tvaru kvadratické formy V = a1 x21 +
a2 x22 . Derivace podél řešenı́ je
V̇ = 2a1 x1 (−x2 − x31 ) + 2a2 x2 (x1 − x32 ) = −2a1 (x41 + x42 ),
po volbě a2 = a1 . V̇ je negativně definitnı́, V je pozitivně definitnı́. Protože současně V (x) → ∞ pro ||x|| → ∞,
je rovnovážný stav globálně asymptoticky stabilnı́.
Volba Ljapunovovy funkce ve tvaru kvadratické formy zde vyhovı́ pouze proto, že zadaný systém má vhodný
tvar. Při pozměněném tvaru rovnic již kvadratická forma nevyhovuje.
Přı́klad 5.2. U dynamického systému
ẋ1 = x1 (x21 + x22 − 1) − x2
ẋ2 = x1 + x2 (x21 + x22 − 1)
s rovnovážným stavem v počátku můžeme rovněž volit Ljapunovovu funkci ve tvaru kvadratické formy V =
x21 + x22 . Derivace podél řešenı́ daného systému je V̇ = 2(x21 + x22 )(x21 + x22 − 1). V oblasti Ω definované vztahem
x21 + x22 < 1 (vnitřek jednotkového kruhu) je V̇ lokálně negativně definitnı́. Počátek je proto asymptoticky
stabilnı́ v oblasti Ω.
Geometrická interpretace Ljapunovovy věty. Ljapunovova věta o stabilitě má velmi názornou
geometrickou interpretaci, která může sloužit i jako jednoduchý důkaz věty 5.1. Pro demonstraci
zvolme např. lineárnı́ systém 2.řádu
ẋ1 = x2
ẋ2 = −2aω0 x2 − ω0 2 x1 .
(5.5)
Ve fázové rovině zakreslı́me trajektorii tohoto systému např. pro a > 1, ω0 2 > 0 (obr.5.1). Jako
Ljapunovovu funkci zvolı́me např. pozitivně definitnı́ funkci V = x21 + x22 . Průměty této funkce pro
různé hodnoty V = konst. do roviny (x1 , x2 ) (vrstevnice) jsou rovněž zakresleny na obr. 5.1. Funkce
V̇ (x) = (grad V )T ẋ představuje skalárnı́ součin gradientu ∇V a vektoru fázové rychlosti ẋ. Časová
derivace V̇ (x) bude negativně definitnı́, jestliže vektor gradientu a vektor fázové rychlosti budou svı́rat
v každém bodě trajektorie navzájem tupý úhel. Záporná definitnost funkce V̇ (x) bude tedy splněna,
jestliže fázová trajektorie bude v každém bodě fázové roviny protı́nat vrstevnice ve směru klesajı́cı́
hodnoty V = konst. To je v našem přı́padě splněno a zvolená funkce V vyhovuje. Lze se snadno
přesvědčit, že pro jiné hodnoty a, např. v intervalu 0 < a < 1 již Ljapunovova funkce V = x21 + x22
nevyhovı́ a musı́me zvolit obecnou kvadratickou formu (5.2).
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
Obrázek 5.1: Lineárnı́ systém 2.řádu
48
Obrázek 5.2: Vrstevnice Ljapunovovy funkce
Při posuzovánı́ stability systému (5.1) postupujeme ovšem obráceně. Neznáme trajektorii pohybu
ve stavovém prostoru, ale snažı́me se pouze najı́t takovou Ljapunovovu funkci, aby byly splněny
podmı́nky věty 5.1.
Poznámky:
1. Podmı́nka radiálnı́ neohraničenosti ||x|| → ∞ ve větě 5.1 zajišt’uje, že vrstevnice V (x) = Vα
= konst. jsou uzavřené křivky (nebo plochy a hyperplochy u systémů 3. a vyššı́ho řádu). Kdyby
nebyly uzavřené, mohly by se trajektorie vzdalovat od rovnovážného stavu a přitom stále protı́nat
vrstevnice odpovı́dajı́cı́ klesajı́cı́m hodnotám Vα . Např. u pozitivně definitnı́ Ljapunovovy funkce
V = [x21 /(1 + x21 )] + x22 jsou vrstevnice pro V > 1 neuzavřené. Fázová trajektorie se při určitých
počátečnı́ch podmı́nkách může vzdalovat od počátku a přitom neustále protı́nat vrstevnice se snižujı́cı́
se hodnotou Vα (obr.5.2).
2. Ljapunovovy věty o stabilitě dávajı́ pouze postačujı́cı́ podmı́nky. Jestliže tedy při nějaké volbě
Ljapunovovy funkce určı́me oblast stability Ω, je možné, že při jiné volbě určı́me oblast většı́.
3. Nemůžeme-li k danému systému najı́t vhodnou Ljapunovovu funkci, neznamená to, že systém je
nestabilnı́. Lze jen konstatovat, že pokus o určenı́ stability se nezdařil.
4. Pro daný systém může existovat mnoho Ljapunovových funkcı́. Jestliže je V jeho Ljapunovova
funkce, je takovou funkcı́ např.i V1 = ρV β , kde ρ > 0 a konstanta β > 1 (nemusı́ být celé čı́slo).
5. Pomocı́ Ljapunovovy teorie a některých jiných metod, které budou uvedeny v kap.7, lze často
stanovit stabilitu pro celou třı́du nelineárnı́ch systémů. Stabilita takových systémů se nazývá absolutnı́ stabilita.
6. Kromě základnı́ch vět o stabilitě systému byly formulovány také různé věty o nestabilitě, které
jsou užitečné v přı́padě, že se nepodařı́ nalézt vhodnou Ljapunovovu funkci podle věty 5.1. Tyto věty
uvedeme až v čl.5.4 u neautonomnı́ch systémů.
Pro praktické účely je důležitou vlastnostı́ asymptotická stabilita rovnovážného stavu, která existuje,
jestliže V̇ (x) je negativně definitnı́. Zajistit tuto negativnı́ definitnost je však často velmi obtı́žné, a v
mnoha přı́padech se podařı́ zajistit pouze negativnı́ semidefinitnost derivace Ljapunovovy funkce. Ale
i v tomto přı́padě lze často učinit závěry o asymptotické stabilitě, jestliže využijeme následujı́cı́ věty.
Věta 5.2. Uvažujme systém (5.1) a oblast Ω kolem počátku, ve které je V (x) pozitivně definitnı́ a
V̇ (x) negativně semidefinitnı́. Jestliže množina definovaná vztahem V̇ (x) = 0 neobsahuje žádné
trajektorie systému (5.1) kromě triviálnı́ trajektorie x = 0, pak rovnovážný stav 0 je asymptoticky
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
49
stabilnı́. Oblast Ω je oblast přitažlivosti rovnovážného stavu.
Přı́klad na větu 5.2 bude uveden v čl. 5.3.1. Oblast Ω nemusı́ být ovšem úplnou oblastı́ přitažlivosti,
protože může existovat vhodnějšı́ Ljapunovova funkce, která dá oblast většı́. Větu 5.2 lze zobecnit a
formulovat tzv. věty o invariantnı́ch množinách, které dovolujı́ rozšı́řit pojetı́ Ljapunovovy funkce tak,
aby popisovala i konvergenci obecnějšı́ho dynamického chovánı́, např. mı́sto k rovnovážnému stavu k
limitnı́mu cyklu. [55].
5.2
Ljapunovovy funkce pro lineárnı́ autonomnı́ systémy
Ljapunovova teorie stability je obecnou metodou a můžeme tedy s jejı́ pomocı́ řešit i otázky stability
lineárnı́ch systémů. Tento přı́stup nenı́ pro praktické řešenı́ stability konkrétnı́ho lineárnı́ho systému
samozřejmě vhodný, protože známe jednoduchá kritéria, která vedou rychleji k cı́li. Ljapunovovo
řešenı́ stability lineárnı́ch systémů je však základem pro řešenı́ stability systémů nelineárnı́ch. Dovoluje nám předevšı́m použı́vat pro lineárnı́ i nelineárnı́ systémy společnou metodiku a dále nám
umožňuje vytvářet vhodné Ljapunovovy funkce i pro složité systémy vytvářené ze subsystémů. Jak
uvidı́me dále, majı́ Ljapunovovy funkce aditivnı́ vlastnosti, podobně jako energie a proto Ljapunovovu
funkci pro kombinace subsystémů můžeme odvodit z jednoduššı́ch funkcı́ pro jednotlivé subsystémy.
Ljapunov dokázal, že pro stabilnı́ lineárnı́ autonomnı́ systém ẋ = Ax je vždy možno najı́t
Ljapunovovu funkci ve tvaru pozitivně definitnı́ kvadratické formy, jejı́ž derivace podle času vzhledem k danému systému je negativně definitnı́. Uvažujme proto kvadratickou Ljapunovovu funkci
V = xT P x, kde P je reálná symetrická matice. Časová derivace vzhledem k danému systému
V̇ (x) = ẋT P x + xT P ẋ = xT AT P x + xT P Ax = xT (AT P + P A)x
(5.6)
AT P + P A = −Q,
(5.7)
Položı́me-li
kde Q je symetrická matice, zı́skáme pro V̇ jinou kvadratickou formu V̇ = −xT Qx. Rovnice (5.7) se
nazývá Ljapunovova maticová rovnice.
Při vyšetřovánı́ stability můžeme tedy postupovat tak, že zvolı́me symetrickou pozitivně definitnı́
matici P , z Ljapunovovy rovnice (5.7) určı́me Q a zjistı́me, je-li pozitivně definitnı́. Nastane-li tento
přı́pad, je počátek globálně asymptoticky stabilnı́. Pokud nenı́ Q pozitivně definitnı́, nelze stabilitu
posoudit a je třeba vyzkoušet jinou volbu P .
Abychom nemuseli náhodně zkoušet různé volby matice P , postupujeme výhodněji tak, že nejprve
vybereme pozitivně definitnı́ matici Q, určı́me z Ljapunovovy rovnice P a stanovı́me jejı́ definitnost.
Je-li P pozitivně definitnı́, je rovnovážný stav 0 globálně exponenciálně stabilnı́. Je-li Q pozitivně
definitnı́ a P má alespoň jedno nekladné vlastnı́ čı́slo, je počátek nestabilnı́. Jestliže pro určitou volbu
Q nemá rovnice (5.7) řešenı́ nebo nemá jednoznačné řešenı́ pro P , pak počátek nenı́ asymptoticky
stabilnı́. Matici Q můžeme s výhodou zvolit jako jednotkovou matici nebo nějakou jinou diagonálnı́
matici. Podrobný rozbor problému lze nalézt např. v [55].
5.3
Ljapunovovy funkce pro nelineárnı́ autonomnı́ systémy
Úvodem je nutno zdůraznit, že zatı́m neexistuje jednoduchá a spolehlivá metoda, která by umožnila
stanovit vhodnou Ljapunovovu funkci pro libovolný nelineárnı́ systém. Volba Ljapunovovy funkce ve
tvaru kvadratické formy obecně selhává. Vyhovı́ jen v malém počtu speciálnı́ch přı́padů a proto ji pro
praktické řešenı́ nelze použı́t.
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
50
Pro nelineárnı́ systémy bylo navrženo mnoho speciálnı́ch metod generovánı́ V (x) a některé metody
obecné. V dalšı́ch článcı́ch si všimneme jen těch metod, kterých lze poměrně jednoduše využı́t pro
praktická řešenı́. Velmi podrobný přehled většiny existujı́cı́ch metod lze nalézt v učebnici [9].
5.3.1
Volba Ljapunovovy funkce na základě fyzikálnı́ analogie
U nelineárnı́ch rovnic nižšı́ho řádu je možno najı́t jednoduchou fyzikálnı́ interpretaci Ljapunovovy
teorie a podle nı́ navrhnout vhodnou funkci V (x). Této metody se často využı́vá v teoretické mechanice,
v robotice apod., a je možno s jejı́ pomocı́ objasnit souvislosti mezi Ljapunovovou teoriı́ stability a a
některými teoriemi optimálnı́ch systémů, zejména Pontrjaginovým principem maxima a dynamickým
programovánı́m [9,10].
Uvažujme jednoduchý mechanický systém pružina, hmota, tlumič (obr. 5.3), v němž direktivnı́ sı́la
f (x) a tlumı́cı́ sı́la g(ẋ) jsou nelineárnı́. Pro pohyb systému lze psát diferenciálnı́ rovnici
ẍ + g(ẋ) + f (x) = 0
x(0) = x0 ,
ẋ(0) = ẋ0 .
(5.8)
U konzervativnı́ho systému je tlumenı́ g(ẋ) = 0 a celková energie je konstantnı́. Řešı́me-li
konzervativnı́ systém ve fázové rovině se souřadnicemi x1 = x, x2 = ẋ, pak
ẋ2 = −f (x1 )
ẋ1 = x2
(5.9)
Pro f (x1 ) 6= 0 při x1 6= 0 a f (0) = 0 má systém jeden rovnovážný stav v počátku. Trajektorie jsou
uzavřené křivky obklopujı́cı́ počátek a platı́ pro ně vztah
dx2
f (x1 )
=−
dx1
x2
(5.10)
Integracı́ dostaneme rovnici trajektorie
x22
+
2
Z
x1
f (x1 )dx1 = konst.
(5.11)
0
Prvnı́ člen představuje kinetickou energii a druhý potenciálnı́ energii, jejich součet je pak celková
energie E(x1 , x2 ) pohybujı́cı́ho se systému. Trajektorie systému jsou tedy křivkami celkové energie
tohoto konzervativnı́ho systému. Časová změna celkové energie je nulová
dE(x1 , x2 )
= x2 ẋ2 + f (x1 )ẋ1 = x2 [ẋ2 + f (x1 )] = 0.
dt
(5.12)
Disipativnı́ systém s tlumenı́m g(x2 ), kde g(x2 )x2 > 0 pro x2 6= 0 vede na rovnice ẋ1 = x2 ,
ẋ2 = −f (x1 ) − g(x2 ). Časová změna energie systému je nynı́
dE(x1 , x2 )
= x2 [ẋ2 + f (x1 )] = −g(x2 )x2 .
dt
(5.13)
Protože g(x2 )x2 > 0 pro x2 6= 0, je patrno, že energie systému stále klesá s přibývajı́cı́m časem řešenı́,
kromě bodů na ose x2 = 0. Zakreslı́me-li trajektorie systému do fázové roviny, v nı́ž jsou zaneseny
také křivky konstantnı́ energie konzervativnı́ho systému (obr. 5.4), je vidět, že systém se pohybuje od
jedné křivky reprezentujı́cı́ konstantnı́ energii ke druhé, která odpovı́dá energii nižšı́.
Je-li tedy časová změna energie autonomnı́ho systému nekladná v každém bodě stavového prostoru,
pak celková energie systému spojitě klesá až do absolutnı́ho minima, které nastane v rovnovážném
stavu. U složitějšı́ch systémů je často velmi obtı́žné nalézt vztah pro celkovou energii systému, fyzikálně
motivovaná ljapunovská funkce však může být určena u mnoha složitých mechanických systémů [52].
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
51
Obrázek 5.3: Jednoduchý mechanický systém
Obrázek
systému
5.3.2
5.4:
Trajektorie
mechanického
Volba Ljapunovovy funkce pro nelineárnı́ systém podle analogie s linearizovaným systémem
Často se podařı́ sestrojit Ljapunovovu funkci na základě linearizovaného modelu. V nelineárnı́m
systému zaměnı́me nejprve nelinearitu lineárnı́m členem, zvolı́me pro tento náhradnı́ lineárnı́ model
vhodnou Ljapunovovu funkci ve tvaru kvadratické formy a pak změnı́me jejı́ tvar v tom výrazu, kde
mı́sto lineárnı́ho členu je ve skutečnosti nelineárnı́ funkce. Této metody je možno často použı́t i na
dosti složité systémy s většı́m počtem nelinearit. Způsob výpočtu ukáže nejlépe přı́klad.
Přı́klad 5.3. Je třeba určit, pro jaké podmı́nky je stabilnı́ systém
ẋ1 = f (x1 ) + βx2
ẋ2 = γx1 + δx2
f (0) = 0.
(5.14)
Nejprve nalezneme Ljapunovovu funkci pro linearizovaný model, ve kterém nahradı́me f (x1 ) výrazem αx1 .
Podle čl. 5.2 zvolı́me obecnou kvadratickou formu, zderivujeme, zvolı́me nejjednoduššı́ tvar pro V̇
V̇ = −2(α + δ)(βγ − αδ)x21
(5.15)
V = (δx1 − βx2 )2 + (αδ − βγ)x21 .
(5.16)
a spočteme V (x)
Lineárnı́ model je stabilnı́ pro α + δ < 0, αδ − βγ > 0.
Nynı́ vezmeme za základ funkci V podle (5.16) a sestrojı́me novou V (x) pro původnı́ systém (5.14), ve
kterém je mı́sto αx1 nelineárnı́ funkce f (x1 ). Ve vztahu (5.16) je koeficient α u členu x21 . Člen αx21 můžeme
zapsat ve tvaru
Z
x1
2
αx1 dx1 ,
0
kde za αx1 dosadı́me f (x1 ).
Jako Ljapunovovu funkci můžeme proto zvolit
V = (δx1 − βx2 )2 + 2δ
Z
x1
f (x1 )dx1 − βγx21
(5.17)
0
Jejı́ derivace je
f (x1 )
f (x1 )
+ δ)(βγ −
δ)x21 .
x1
x1
Systém je globálně asymptoticky stabilnı́, platı́-li
V̇ = −2(
f (x1 )
δ − βγ > 0
x1
pro x1 6= 0
a
f (x1 )
+δ <0
x1
(5.18)
pro x1 6= 0
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
52
x1
Z
[f (x1 )δ − βγx1 ]dx1 → ∞
pro |x1 | → ∞.
(5.19)
0
Protože systém (5.14) je stabilnı́ pro celou třı́du nelineárnı́ch funkcı́ f (x1 ), které vyhovujı́ podmı́nkám (5.19),
je současně absolutně stabilnı́.
5.3.3
Metoda variabilnı́ho gradientu
Pomocı́ této metody je možno navrhnout tvar Ljapunovovy funkce a nikoliv jen hledat koeficienty u
nějakého tvaru předem zvoleného. Je to vlastně analytická metoda generovánı́ Ljapunovovy funkce,
jejı́ž tvar zı́skáme vhodným výpočtem z daných rovnic systému.
Ljapunovova věta o stabilitě předpokládá, že V (x) je spojitá a má spojité prvnı́ parciálnı́ derivace.
Pak také existuje n-rozměrný vektor grad V (x) = ∇V se složkami
(∇V )1 =
∂V
∂x1
(∇V )2 =
∂V
∂x2
...,
(∇V )n =
∂V
∂xn
(5.20)
Princip metody variabilnı́ho gradientu spočı́vá v tom, že mı́sto funkce V (x) zvolı́me nejprve obecně
gradient ∇V a z něho teprve odvodı́me V (x) a V̇ (x)
V̇ (x) =
dV
= (gradV )T ẋ = (∇V )T ẋ.
dt
(5.21)
Provedeme-li analogii mezi potenciálnı́m vektorovým polem a uvedenými vztahy, je patrno, že ∇V
tvořı́ vektorové pole a funkce V je jeho potenciál. Zobecnı́me-li vztahy, platné pro běžné trojrozměrné
vektorové pole na n-rozměrný prostor, platı́, že potenciálnı́ funkci V můžeme určit z gradientu jako
křivkový integrál
Z x
V =
(∇V )T dx.
(5.22)
0
Hornı́ mez x integrálu znamená, že integrujeme z počátku do libovolného bodu o souřadnicı́ch
(x1 , x2 , ..., xn ) ve stavovém prostoru.
V potenciálnı́m poli je křivkový integrál nezávislý na integračnı́ cestě. Nutnou a postačujı́cı́
podmı́nkou pro takové pole je vztah rot ∇V = 0, který má v kartézských souřadnicı́ch tvar
∂(∇V )j
∂(∇V )i
=
∂xj
∂xi
(i, j = 1, 2, ..., n).
(5.23)
Integraci ve vztahu (5.22) pak můžeme provést nejjednoduššeji ve směru os
V =
Z x
0
(∇V )T dx =
Z
x1
(∇V )1 (ξ1 , 0, 0, ..., 0)dξ1 +
0
+ ... +
Z
x2
(∇V )2 (x1 , ξ2 , 0, ..., 0)dξ2 +
0
Z
xn
(∇V )n (x1 , x2 , ..., xn−1 , ξn )dξn ,
(5.24)
0
kde složka vektoru ∇V ve směru xi je (∇V )i = ∂V /∂xi .
Věta 5.3. Rovnovážný stav x = 0 systému ẋ = f (x) je asymptoticky stabilnı́ v oblasti Ω, existuje-li
taková reálná vektorová funkce ∇V , že platı́
a) vztahy (5.23);
b) gradient ∇V nenı́ v oblasti Ω nikde roven nule kromě počátku;
c) V̇ (x) je negativně definitnı́ nebo semidefinitnı́;
d) množina definovaná vztahem V̇ (x) = 0 neobsahuje žádné trajektorie systému kromě počátku;
e) V (x) je pozitivně definitnı́;
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
53
f) jedna z ploch V = konst. uzavı́rá oblast Ω.
Shrnutı́ postupu při hledánı́ funkce V (x). Je dán systém ẋ = f (x), x = 0.
1) Volı́me ∇V ve tvaru
α11 (x)x1 + α12 (x)x2 + ... + α1n (x)xn
(∇V )1


 
..
.
.
∇V = 
,
=
.
.
αn1 (x)x1 + αn2 (x)x2 + ... + αnn (x)xn
(∇V )n




kde αij má konstantnı́ a variabilnı́ část
αij (x) = αijk + αijv (x1 , x2 , ..., xn−1 ),
αii (x) = αiik + αiiv (xi )
αijk = αjik
i 6= j
αiik > 0
2) Vypočteme
V̇ (x) = (∇V )T ẋ = (∇V )1 ẋ1 + ...(∇V )n ẋn ,
a za ẋi dosadı́me pravé strany daného nelineárnı́ho systému.
3) Zvolı́me V̇ (x) tak, aby bylo alespoň negativně semidefinitnı́ (tı́m určı́me část koeficientů αij ).
4) Z n(n − 1)/2 rovnic (5.23) určı́me zbylé koeficienty αij .
5) Určı́me funkci V podle vztahu (5.24) a stanovı́me jejı́ definitnost.
Přı́klad 5.4. Určete stabilitu systému podle obr. 5.5 s obecnou nelineárnı́ funkcı́ f (σ), ležı́cı́ v 1. a 3. kvadrantu.
Lineárnı́ část systému má přenos (s + 5)/s(s + 2) a podle obr. 5.5 pak můžeme zapsat lineárnı́ část systému ve
tvaru
ẋ1 = 5x2 + ẋ2
ẋ2 = −2x2 + f (σ)
Dosadı́me-li z druhé rovnice do prvnı́ za ẋ2 a za f (σ) položı́me −f (x1 ), pak
ẋ1 = 3x2 − f (x1 )
ẋ2 = −2x2 − f (x1 ).
Obr.5.5. Stavové schema pro přı́klad 5.4
Pro účely výpočtu zavedeme formálně za funkci f (x1 ), která ležı́ v 1. a 3. kvadrantu součin g(x1 )x1 . Funkce
g(x1 ) ležı́ pak v 1. a 2. kvadrantu a je tedy vždy kladná. Zvolme nynı́ gradient ve tvaru
α11 x1 + α12 x2
∇V =
,
α21 x1 + α22 x2
kde α jsou obecně funkcemi x. Pak
V̇ = (α11 x1 + α12 x2 )[3x2 − g(x1 )x1 ] + (α21 x1 + α22 x2 )[−2x2 − g(x1 )x1 ]
V̇ = −x21 [α11 g(x1 ) + α21 g(x1 )] − x22 [2α22 − 3α12 ]+
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
54
+x1 x2 [3α11 − 2α21 − α12 g(x1 ) − α22 g(x1 )]
Nejjednoduššı́ způsob volby V̇ (x) negativnı́, je α12 = α21 = 0 a pro eliminaci členu u x1 x2
α11 =
α22
g(x1 ).
3
Volı́me-li např. α22 = 6, je α11 = 2g(x1 ) a
V̇ = −α11 g(x1 )x21 − 2α22 x22 .
Gradient jsme tedy zvolili ve tvaru
∇V =
2g(x1 )x1
6x2
=
2f (x1 )
6x2
,
kde jsme za g(x1 )x1 dosadili zase původnı́ funkci f (x1 ).
Integracı́ gradientu podle vztahu (5.24) dostaneme Ljapunovovu funkci
Z x1
Z x2
V =
2f (x1 )dx1 +
6x2 dx2 .
0
0
Druhý člen lze integrovat, takže výsledná Ljapunovova funkce je
Z x1
V =2
f (x1 )dx1 + 3x22 .
0
Pokud f (x1 ) je kladné pro x1 kladné a f (x1 ) je záporné pro x1 záporné, pak integrál je vždy kladný a V (x) je
pozitivně definitnı́. Konverguje-li integrál k nekonečnu pro |x1 | → ∞, pak vrstevnice V (x) jsou uzavřené křivky
ve stavové rovině a systém je absolutně globálně asymptoticky stabilnı́.
5.4
Ljapunovovy funkce pro neautonomnı́ systémy
Metody vyšetřovánı́ stability autonomnı́ch systémů nynı́ rozšı́řı́me pro neautonomnı́ systémy. Budeme
uvažovat nebuzené, časově variantnı́ systémy
ẋ = f (t, x)
f (t, 0) = 0,
(5.25)
kde funkce f je spojitá vzhledem k t a spojitě diferencovatelná vzhledem ke stavu x v oblasti Ω =
{(t, x) ∈ R×Rn |t ∈ (a, +∞), ||x|| < B, B > 0}. Rovnice (5.25) je jednoznačně řešitelná a má triviálnı́
řešenı́ (rovnovážný stav v nule) pro všechna t > a.
Ljapunovova funkce pro neautonomnı́ systémy bude obecně záviset na čase. Uvažujme proto spojitou reálnou funkci V (t, x), V (t, 0) = 0 pro všechna t > a, definovanou v oblasti Ω a spojitě diferencovatelnou vzhledem k proměnným t a x na Ω.
Definice 5.3. Funkce V (t, x) je
a) pozitivně semidefinitnı́ (resp. negativně semidefinitnı́) v oblasti Ω právě tehdy, když V (t, x) ≥ 0
(resp. V (t, x) ≤ 0) pro všechna (t, x) ∈ Ω;
b) pozitivně definitnı́ (resp. negativně definitnı́) na Ω právě tehdy, když existuje taková reálná
funkce W (x), definovaná a spojitá v oblasti Ω0 = {x ∈ Rn | ||x|| < B}, že platı́
V (t, x) ≥ W (x) > 0
resp.
V (t, x) ≤ −W (x) < 0
(5.26)
pro (t, x) ∈ Ω, x 6= 0 a V (t, 0) = W (0) = 0;
c) klesajı́cı́, jestliže existuje časově invariantnı́ pozitivně definitnı́ funkce W1 (x) taková, že W1 (x) ≥
V (t, x) pro všechna t ≥ t0 .
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
55
Přı́klad 5.5.
a) Funkce V (t, x) = (1 + sin2 t)(x21 + x22 ) je pozitivně definitnı́, protože splňuje podmı́nku V (t, x) ≥
W (x) = x21 + x22 . Je také klesajı́cı́, protože W1 (x) = 2(x21 + x22 ) ≥ V (t, x).
b) Funkce V (t, x) = (t + 1)(x21 + x22 ) je pozitivně definitnı́, protože V ≥ W (x) = x21 + x22 . Je také
radiálně neohraničená, ale nenı́ klesajı́cı́, protože pro každé x 6= 0 je V jako funkce času neohraničená.
c) Funkce V = x21 + x22 − 2bx1 x2 ebt je pozitivně definitnı́ pro −1 < b ≤ 0 a pozitivně semidefinitnı́ pro
b = −1.
Derivace funkce V podél řešenı́ soustavy (5.25) je
V̇ (t, x) =
∂V
∂V
∂V
+
f1 (t, x) + ... +
fn (t, x).
∂t
∂x1
∂xn
(5.27)
Věta 5.4. (Ljapunovská stabilita). Existuje-li na oblasti Ω pozitivně definitnı́ spojitě diferencovatelná funkce V (t, x) a jejı́ derivace podél řešenı́ systému (5.25) je negativně semidefinitnı́, pak triviálnı́
řešenı́ je ljapunovsky stabilnı́ na Ω.
Platı́-li uvedené podmı́nky a V je klesajı́cı́, je triviálnı́ řešenı́ stejnoměrně (ljapunovsky) stabilnı́.
Věta 5.5. (Asymptotická stabilita). Existuje-li na oblasti Ω pozitivně definitnı́ spojitě diferencovatelná funkce V (t, x) a jejı́ derivace je negativně definitnı́, pak triviálnı́ řešenı́ je asymptoticky
stabilnı́.
Platı́-li uvedené podmı́nky a V je klesajı́cı́, je triviálnı́ řešenı́ stejnoměrně asymptoticky stabilnı́.
Jsou-li dosud uvedené podmı́nky splněny v celém stavovém prostoru a V (t, x) je radiálně
neohraničená, je triviálnı́ řešenı́ globálně stejnoměrně asymptoticky stabilnı́.
Přı́klad 5.6. Uvažujme systém
ẋ1 = −x1 − e−2t x2
ẋ2 = x1 − x2
Pro určenı́ stability rovnovážného bodu 0 zvolme Ljapunovovu funkci ve tvaru
V (t, x) = x21 + (1 + e−2t )x22 .
Tato funkce je pozitivně definitnı́, protože je většı́ než časově invariantnı́ pozitivnı́ funkce W (x) = x21 + x22 . Je
také klesajı́cı́, protože je menšı́ než pozitivně definitnı́ funkce W1 (x) = x21 + 2x22 . Derivace V̇ je
V̇ (t, x) = −2[x21 − x1 x2 + x22 (1 + 2e−2t )]
a je patrno, že
V̇ ≤ −2(x21 − x1 x2 + x22 ) = −(x1 − x2 )2 − x21 − x22
Funkce V je radiálně neohraničená, V̇ je negativně definitnı́, rovnovážný stav 0 je proto globálně asymptoticky
stabilnı́.
Přı́klad 5.7. Je dán systém druhého řádu s časově proměnným tlumenı́m
ẍ + a(t)ẋ + bx = 0
tj.
ẋ1 = x2
ẋ2 = −a(t)x2 − bx1 .
Uvažujme pozitivně definitnı́ funkci
V (t, x) =
a volme β(t) = b − α2 + αa(t), α <
√
1
1
(αx1 + x2 )2 + β(t)x21
2
2
b. Derivace podél řešenı́ systému je
α
V̇ = [α − a(t)]x22 + [ȧ(t) − 2b]x21
2
V̇ je negativně definitnı́, jestliže a(t) > α > 0, ȧ(t) < 2b. Za předpokladu, že a(t) je shora ohraničené (V je
klesajı́cı́), je rovnovážný stav 0 asymptoticky stabilnı́.
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
5.5
56
Věty o nestabilitě
Kromě uvedených vět o stabilitě systému jsou v literatuře formulovány také různé věty o nestabilitě,
které jsou užitečné předevšı́m tehdy, jestliže se nepodařı́ najı́t vhodnou Ljapunovovu funkci a určit
stabilitu. Dvě základnı́ věty o nestabilitě podal již Ljapunov, v mnoha praktických přı́padech vede však
snadněji k cı́li věta, kterou odvodil Četajev. Dále uvedených vět lze přı́mo použı́t pro neautonomnı́
systémy, u autonomnı́ch systémů lze podmı́nky snadno zjednodušit. Důkazy uvedených vět lze nalézt
např. v [55].
Věta 5.6. (Prvnı́ věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li
na oblasti Ω kolem počátku spojitě diferencovatelná klesajı́cı́ skalárnı́ funkce V (t, x) taková, že pro čas
t0 ≥ 0 platı́: 1) V (t, 0) = 0 pro všechna t ≥ t0 , 2) V (t0 , x) může nabývat kladných hodnot libovolně
blı́zko počátku, 3) V̇ (t, x) je pozitivně definitnı́ v Ω.
Věta 5.7. (Druhá věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́, existuje-li na
oblasti Ω kolem počátku spojitě diferencovatelná klesajı́cı́ skalárnı́ funkce V (t, x) a platı́: 1) V (t0 , 0) =
0, 2) V (t0 , x) může nabývat kladných hodnot libovolně blı́zko počátku, 3) V̇ (t, x) − λV (t, x) ≥ 0,
∀ t ≥ t0 ∀ x ∈ Ω, konstanta λ > 0.
Věta 5.8. (Četajevova věta o nestabilitě). Rovnovážný stav 0 systému (5.25) je nestabilnı́,
existuje-li na oblasti Ω kolem počátku spojitě diferencovatelná skalárnı́ funkce V (t, x), existuje oblast
Ω1 ⊆ Ω a platı́: 1) V (t, x) a V̇ (t, x) jsou pozitivně definitnı́ v Ω1 , 2) počátek je hraničnı́m bodem Ω1 ,
3) v hraničnı́ch bodech oblasti Ω1 je V (t, x) = 0 pro všechna t ≥ t0 .
Přı́klad 5.8. Systém je zadán rovnicemi
ẋ1 = x2 + x1 (x21 + x42 )
ẋ2 = −x1 + x2 (x21 + x42 ).
Linearizacı́ kolem rovnovážného stavu (0,0) dostaneme systém ẋ1 = x2 a ẋ2 = −x1 . Vlastnı́ čı́sla jsou ±j, takže
nelze posoudit stabilitu podle prvnı́ Ljapunovovy metody. Zvolı́me-li Ljapunovovu funkci V = (x21 +x22 )/2, je jejı́
derivace V̇ = (x21 + x22 )(x21 + x42 ). Protože V i V̇ jsou pozitivně definitnı́, je podle věty 5.6 stav (0,0) nestabilnı́.
Přı́klad 5.9. Systém je popsán rovnicemi
ẋ1 = x1 + 2x2 + x1 x22
ẋ2 = 2x1 + x2 − x21 x2 .
Zvolme funkci V (x) = x21 − x22 , která nenı́ pozitivně definitnı́, ale může nabývat kladných hodnot libovolně
blı́zko počátku. Jejı́ derivace je
V̇ = 2x21 − 2x22 + 4x21 x22 = 2V + 4x21 x22 .
Druhá věta o nestabilitě ukazuje, že rovnovážný stav v počátku je nestabilnı́.
5.6
Úlohy
5.1. Vyšetřete podmı́nky stability rovnovážného stavu systémů
a) ẋ1 = x2
ẋ2 = −a(x1 ) − b(x2 );
a(0) = b(0) = 0
b) ẋ1 = x2
ẋ2 = x3
ẋ3 = −cx3 − bx2 − a(x1 ); a(0) = 0
c) ẋ1 = x2
ẋ2 = x3
ẋ3 = −cx3 − b(x2 ) − a(x1 ); a(0) = b(0) = 0
d) ẋ1 = x2
ẋ2 = x3
ẋ3 = −c(x3 ) − b(x2 ) − a(x1 ); a(0) = b(0) = c(0) = 0
e) ẋ1 = x2
ẋ2 = x3
ẋ3 = −c(x1 , x2 ) − bx2 − ax1 ;
f) ẋ1 = x2
ẋ2 = x3
ẋ3 = −c(x1 , x2 ) − b(x2 ) − a(x1 ); a(0) = b(0) = 0
g) ẋ1 = ax21 + bx1 x2 + cx22
ẋ2 = kx1 − x2 + mx21 + nx22 + px1 x2
h) ẋ = ayz
ẏ = −bxz
ż = cxy
5.2. Vyšetřete podmı́nky stability rovnovážného stavu pomocı́ metody variabilnı́ho gradientu pro systémy
KAPITOLA 5. PŘÍMÁ LJAPUNOVOVA METODA
a) ẋ1 = x2
ẋ2 = −x2 − x31
b) ẋ1 = x2
ẋ2 = −ax1 − 2b|x1 |x2
2
3
c) ẋ1 = ax1 + bx2
ẋ2 = −cx2 + dx31
57
Kapitola 6
Speciálnı́ systémy
6.1
Gradientnı́ systémy
Definice 6.1. Dynamický systém ẋ = f (x), pro který existuje taková dvakrát spojitě diferencovatelná
funkce V : Rn → R, že platı́ f = −grad V (x), se nazývá gradientnı́ systém.
Jeho rovnice pohybu lze zı́skat z potenciálu V (x)
∂V
dxi
= fi (x) = −
dt
∂xi
Protože pro druhé parciálnı́ derivace platı́
i = 1, ..., n.
(6.1)
∂2V
∂2V
=
∂xi ∂xj
∂xj ∂xi
(6.2)
je ẋ = f (x) gradientnı́m systémem pouze tehdy, jestliže
∂fi
∂fj
(x) =
(x)
∂xj
∂xi
i, j = 1, ..., n
∀x ∈ Rn
(6.3)
Vektorové pole f musı́ tedy být potenciálové, jeho rotace rot f = 0. Je-li systém ẋ = f (x) gradientnı́,
je potenciálnı́ funkce V jeho Ljapunovovou funkcı́.
Věta 6.1. Gradientnı́ systém ẋ = −grad V (x) má tyto vlastnosti:
a) V regulárnı́ch bodech (grad V (x) 6= 0) protı́najı́ trajektorie systému ekvipotenciálnı́ plochy
V (x) = konst. ortogonálně.
b) Pevné body systému jsou kritické body funkce V , tj. body, v nichž grad V = 0.
c) Ostrá minima funkce V jsou asymptoticky stabilnı́ pevné body.
d) Hyperbolické pevné body jsou n-dimenzionálnı́ uzly nebo sedla.
e) Uzavřené trajektorie nemohou vzniknout.
Matice linearizace A s prvky Aij = (∂fi /∂xj )(x) pro i, j = 1, ..., n je vzhledem k platnosti (6.3)
symetrická a má proto jen reálná a různá vlastnı́ čı́sla, která jsou nenulová, je-li A regulárnı́. Ostrá
minima funkce V odpovı́dajı́ asymptoticky stabilnı́m uzlům, maxima V nestabilnı́m uzlům a sedlové
body V jsou také sedlovými body diferenciálnı́ rovnice. Pohyb v gradientových systémech odpovı́dá
přetlumenému pohybu mechanické částice ve vnějšı́m potenciálovém poli podél spádnic funkce V k
nejbližšı́mu minimu nebo sedlu. Ekvipotenciálnı́ plocha je množina M = {x|V (x) = konst.} a má v
regulárnı́m bodě x tečnou hyperrovinu dimenze n − 1. Normálový vektor ν = grad V (x) 6= 0 směřuje
v opačném směru než vektor fázové rychlosti f (x) na trajektorii systému. Má-li funkce V v bodě x
ostré minimum, je v učitém okolı́ U bodu x pozitivně definitnı́. Jejı́ derivace
n
n
X
X
∂V
dV
∂V
(x) =
(x)fi (x) = −
(x)
dt
∂xi
∂xi
i=1
i=1
58
2
≤0
(6.4)
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
59
Protože složky gradientu jsou v minimu nulové, je x (lokálně) asymptoticky stabilnı́.
Přı́klad 6.1.
1. Všechny systémy popsané diferenciálnı́ rovnicı́ 1. řádu ẋ = f (x) jsou gradientnı́.
2. Systém 2. řádu se stavovými proměnnými x, y
1
ẏ = −ay + (x2 − y 2 )
2
ẋ = −ax + xy
je gradientnı́ systém
∂V
ẋ = −
∂x
∂V
ẏ = −
∂y
a
1
V (x, y) = (x2 + y 2 ) +
2
2
y3
− x2 y
3
!
√
Rovnovážné stavy jsou stabilnı́ uzel v bodě (0, 0) a sedla v bodech (0, −2a) a (± 3a, a).
6.2
Pasivnı́ a disipativnı́ dynamické systémy
V této části se budeme zabývat různými speciálnı́mi systémy, které se nazývajı́ pasivnı́, disipativnı́,
konzervativnı́, bezeztrátové, pozitivně reálné, striktně pozitivně reálné apod. Postupně podáme definice
těchto systémů a budeme studovat jejich vlastnosti a vzájemné vztahy. V dalšı́ch kapitolách uvidı́me,
že tyto speciálnı́ systémy jsou výhodné např. při určovánı́ stability složitých nelineárnı́ch systémů, při
návrhu exaktnı́ch linearizacı́ pro syntézu nelineárnı́ch řı́dı́cı́ch systémů aj.
Nejprve si všimneme některých základnı́ch vlastnostı́ autonomnı́ch disipativnı́ch systémů, obecnějšı́
úvahy budou předmětem odstavce 6.2.2.
Autonomnı́ dynamický systém ẋ = f (x) je ve fázovém prostoru Rn definován vektorovým polem
f (x), které můžeme interpretovat jako rychlostnı́ pole fázového toku Φt . Divergence vektorového pole
f
n
X
∂fi (x)
(6.5)
divf =
∂xi
i=1
určuje rychlost změny velikosti objemového elementu υ(t) v bodě x vlivem toku Φt . Podle Liouvilleovy
věty známé z mechaniky, je rychlost změny objemového elementu v čase t dána vztahem
dυ
=
dt
Z
divf (x) dx.
(6.6)
υ
Je-li div f konstantnı́ (nezávislá na x), pak dυ/dt = υ(t)divf a po integraci
υ(t) = υ(0)et divf .
(6.7)
Je-li div f záporná, objemový element pod vlivem fázového toku kontrahuje a dynamický systém je
disipativnı́. Podmı́nka div f < 0 však nenı́ pro disipativnı́ systém nutná, protože stačı́, aby objemové
elementy kontrahovaly v časové limitě
lim υ(t) = 0,
(6.8)
t→∞
přičemž v některých časových intervalech může dojı́t i k expanzi objemového elementu.
Např. Van der Polův oscilátor (odst. 2.3.2)
ẋ1 = x2
ẋ2 = ε(1 − x21 )x2 − x1
je disipativnı́ systém, ale div f (x1 , x2 ) = ε(1 − x21 ) může být kladná i záporná.
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
60
V kap. 12 uvedeme přı́klady dynamických disipativnı́ch systémů, které vykazujı́ chaotické chovánı́.
V čl. 12.3 odvodı́me tzv. Ljapunovovy exponenty a ukážeme, že dynamický systém je disipativnı́,
když součet všech Ljapunovových exponentů je záporný. Neexistuje však žádné jednoduché kritérium,
které by z dané diferenciálnı́ rovnice umožnilo stanovit, zda systém je disipativnı́. Většinou to ale
lze poznat z vlastnostı́ reálného systému, který matematickým modelem popisujeme. Disipativnı́ jsou
např. mechanické systémy s viskóznı́m tlumenı́m nebo třenı́m, elektrické obvody s odporovými prvky,
tepelné systémy, chemické reakce a jiné ireverzibilnı́ procesy.
Kontrakce objemu u disipativnı́ho systému je lokálnı́ vlastnost, kterou můžeme ověřit v každém
bodě prostoru v libovolném čase. V důsledku této kontrakce se u disipativnı́ch systémů po uplynutı́
dostatečně dlouhé doby soustředı́ chovánı́ v okolı́ relativně malé podmnožiny fázového prostoru nebo
přı́mo na množině, která se nazývá atraktor. Různé typy atraktorů jsme poznali v kap. 2.
Jestliže u dynamického systému ẋ = f (x) je div f = 0, pak elementárnı́ objem v Rn zůstává v čase
konstantnı́, objemový element může ovšem měnit svůj tvar. Dynamický systém se pak nazývá konzervativnı́ (bezeztrátový). Přı́kladem jsou hamiltonovské systémy klasické mechaniky. U konzervativnı́ch
systémů neexistujı́ oblasti přitažlivosti ani atraktory.
Nejjednoduššı́m atraktorem disipativnı́ho systému je rovnovážný stav. Jeho stabilitu jsme v kap.
5 vyšetřovali pomocı́ Ljapunovových funkcı́, které jsme volili jako celkovou energii systému nebo
jako složitějšı́ funkci, která představuje jakousi ”zobecněnou” energii. U izolovaného disipativnı́ho
systému, u něhož nenı́ zvnějšku dodávána ani energie ani hmota, se chovánı́ v čase asymptoticky blı́žı́
k rovnovážnému stavu, který představuje termodynamickou rovnováhu.
Složitějšı́ situace nastává v přı́padě, kdy systém vyměňuje s okolı́m energii nebo i hmotu. Pak je
třeba definovat vstupy a výstupy systému a zavést obecnějšı́ pojetı́ disipativnı́ho systému. To bude
náplnı́ odstavce 6.2.2. Předtı́m však budeme ještě definovat tzv. pozitivně reálné lineárnı́ systémy.
6.2.1
Pozitivně reálné lineárnı́ systémy
Při analýze a syntéze nelineárnı́ch systémů je často možno dekomponovat zadaný systém na lineárnı́
část a nelineárnı́ subsystém. Jestliže přenos lineárnı́ho subsystému je tzv. pozitivně reálný, má výhodné
vlastnosti, které umožňujı́ např. podstatně jednoduššı́ řešenı́ stability složeného systému. Lineárnı́
systémy s pozitivně reálnými přenosy se nazývajı́ pozitivně reálné a majı́ velký význam pro analýzu i
návrh mnoha složitých nelineárnı́ch systémů.
Uvažujme přenos lineárnı́ho systému s jednı́m vstupem a jednı́m výstupem ve tvaru racionálnı́
lomené funkce
bm sm + bm−1 sm−1 + ... + b0
G(s) =
(6.9)
sn + an−1 sn−1 + ... + a0
kde koeficienty jsou reálné a n ≥ m. Rozdı́l n − m mezi stupněm jmenovatele a čitatele se nazývá
relativnı́ stupeň systému.
Definice 6.2. Přenos G(s) je pozitivně reálný (PR), jestliže
Re [G(s)] ≥ 0
∀ Re (s) ≥ 0.
(6.10)
Přenos G(s) je striktně pozitivně reálný (SPR), jestliže G(s − ε) je pozitivně reálný pro nějaké
ε > 0.
Podmı́nka pozitivnı́ reálnosti (6.10) znamená, že G(s) má vždy kladnou nebo nulovou reálnou část,
má-li s = σ + jω kladnou nebo nulovou reálnou část σ. Pro přenosy vyššı́ho stupně je často obtı́žné
určit pozitivnı́ reálnost přı́mo z definice (6.2), protože je třeba testovat podmı́nku (6.10) v celé pravé
polorovině. Lze však využı́t tuto větu:
Věta 6.2.. Přenos G(s) je striktně pozitivně reálný tehdy a jen tehdy, jestliže
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
61
a) G(s) je striktně stabilnı́ (póly jsou jen v levé polorovině)
b) reálná část G(s) je striktně pozitivnı́ podél osy jω, tj. Re G(jω) > 0 pro všechna ω ≥ 0.
Z podmı́nky b) věty 6.2 vyplývá, že systém se striktně pozitivně reálným přenosem G(s) má
frekvenčnı́ charakteristiku v pravé komplexnı́ polorovině, má relativnı́ stupeň 0 nebo 1 a je minimálně
fázový (všechny jeho nuly jsou v levé polorovině). To vyplývá z vlastnostı́ Nyquistových křivek, které
majı́ u neminimálně fázových systémů a u systémů s relativnı́m stupněm r > 1 fázové posuny většı́
než 90o při vyššı́ch frekvencı́ch.
Věta 6.3. Přenos G(s) je pozitivně reálný tehdy a jen tehdy, jestliže
a) G(s) má jen póly s nekladnou reálnou částı́, přičemž póly na imaginárnı́ ose jsou jednonásobné s
reálnými nezápornými rezidui
b) Re G(jω) ≥ 0 pro taková ω ≥ 0, pro která jω nenı́ pólem G(s).
Pozitivně reálné přenosy mohou mı́t tedy póly i na imaginárnı́ ose, striktně pozitivně reálné nikoliv.
Definice 6.3. Lineárnı́ systém
ẋ = Ax + bu
y = cT x,
(6.11)
jehož přenos G(s) = cT (sI − A)−1 b splňuje podmı́nky věty 6.2, se nazývá striktně pozitivně reálný
systém. Jsou-li splněny podmı́nky věty 6.3, jedná se o pozitivně reálný systém.
Definice PR a SPR přenosů lze rozšı́řit na přenosové matice pro systémy s většı́m počtem vstupů a
výstupů.
Definice 6.4. Přenosová matice G(s) rozměru m × m je striktně pozitivně reálná, jestliže všechny
jejı́ prvky Gij (s) jsou striktně stabilnı́ a pro všechna ω ≥ 0 platı́
G(jω) + G? (jω) > 0,
(6.12)
kde matice G? (jω) = GT (−jω).
Věta 6.4. Je dán exponenciálně stabilnı́ lineárnı́ časově invariantnı́ systém s vı́ce vstupy a výstupy v
minimálnı́ realizaci
ẋ(t) = Ax(t) + Bu(t)
y(t) = Cx(t) + Du(t)
(6.13)
s přenosovou maticı́
G(s) = D + C(sI − A)−1 B,
(6.14)
kde x ∈ Rn , u, y ∈ Rm a matice majı́ odpovı́dajı́cı́ rozměry. Předpokládejme dále, že m < n a B má
plnou hodnost.
Daný systém je striktně pozitivně reálný, platı́-li pro všechna ω ≥ 0 vztah
G(jω) + G? (jω) > 0
(6.15)
Důkaz této věty lze nalézt např. v [52]. Je třeba poznamenat, že někteřı́ autoři definujı́ striktně pozitivnı́ reálnost odlišnými způsoby a existuje proto vı́ce přı́stupů k tomuto konceptu. Podrobné srovnánı́
různých definic lze nalézt v [95].
Kalmanovo-Jakubovičovo lemma
Jednou z nejužitečnějšı́ch vlastnostı́ pozitivně reálných lineárnı́ch systémů je ekvivalence mezi stavovou
reprezentacı́ systému v časové oblasti a pozitivně reálným přenosem ve frekvenčnı́ oblasti. Tyto vztahy odvodili v různých formách Kalman, Jakubovič, Popov a jinı́ a jsou dnes nejčastěji známy pod
názvem Kalmanovo-Jakubovičovo lemma. Toto lemma má velký význam v teorii stability lineárnı́ch i
nelineárnı́ch systémů, při analýze robustnosti, v adaptivnı́m řı́zenı́, v teorii obvodů a jinde.
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
62
Obecnou formulaci provedeme nejprve pro striktně pozitivně reálné lineárnı́ t-invariantnı́ systémy
s vı́ce vstupy a výstupy.
Lemma 6.1 (Kalman-Jakubovič). Uvažujme systém popsaný vztahy (6.13) a (6.14), kde x ∈ Rn a
y, u ∈ Rm , m < n. Předpokládejme, že matice A je Hurwitzova, pár (A, B) je řiditelný, pár (C, A)
je pozorovatelný a
∀ ω ≥ 0.
(6.16)
G(jω) + G? (jω) > 0
Za těchto podmı́nek existuje symetrická pozitivně definitnı́ matice P ∈ Rn×n , matice Q ∈ Rm×n ,
W ∈ Rm×m a ε > 0, že platı́
AT P + P A = −QT Q − εP
BT P + W T Q = C
W T W = D + DT
(6.17)
Přenosová matice G vyhovujı́cı́ podmı́nce (6.16) je striktně pozitivně reálná.
Důkaz lze nalézt např. v [55,74]. Vyžaduje několik speciálnı́ch poznatků z teorie lineárnı́ch systémů
a je náročný.
Jednoduššı́ verzi uvedené věty je možno odvodit pro systémy s jednı́m vstupem a jednı́m výstupem.
Nenı́-li navı́c přı́má vazba mezi vstupem a výstupem, pak platı́ toto lemma:
Lemma 6.2. Časově invariantnı́ řiditelný lineárnı́ systém
ẋ = Ax + bu
y = cT x
(6.18)
má přenos G(s) = cT (sI − A)−1 b striktně pozitivně reálný tehdy a jen tehdy, existujı́-li takové
pozitivně definitnı́ matice P a Q, že platı́
AT P + P A = −Q
P b = c.
(6.19)
Důkaz je uveden např. v [52]. Lemma 6.2 lze snadno rozšı́řit na systémy pouze pozitivně reálné. U nich
musı́ platit podmı́nky (6.19) za zjednodušeného předpokladu, že matice Q může být pouze pozitivně
semidefinitnı́. Lemma lze pak použı́t i na přenosy obsahujı́cı́ ideálnı́ integrátor 1/s. V dalšı́ kapitole
použijeme pro odvozenı́ Popovova kritéria ještě jinou verzi uvedeného lemmatu, kterou odvodil rovněž
Kalman.
Pasivita a disipativita lineárnı́ch systémů
Doposud uvedené definice a věty se týkaly pouze pozitivně reálných a striktně pozitivně reálných matic
a systémů. Nynı́ přejdeme k pojmům pasivita a disipativita.
Definice 6.5. Lineárnı́ systém s jednı́m vstupem a jednı́m výstupem definovaný rovnicemi (6.11) je
pasivnı́ tehdy a jen tehdy, je-li pozitivně reálný, tj. splňuje-li jeho přenos podmı́nky věty 6.3. Systém
je disipativnı́ tehdy a jen tehdy, je-li striktně pozitivně reálný, tj. splňuje-li jeho přenos podmı́nky
věty 6.2. Podobná definice platı́ i pro systém s vı́ce vstupy a výstupy.
Je třeba zdůraznit, že se tyto pojmy nepoužı́vajı́ v literatuře jednotně. Pojetı́ pasivity vzniklo
původně v teorii elektrických obvodů, kde jako pasivnı́ systém se označuje systém tvořený pouze z
pasivnı́ch prvků, tedy z kondenzátorů, indukčnostı́ a odporů (rezistorů). Zvolı́me-li vhodně v takovém
obvodu vstupnı́ a výstupnı́ veličinu, můžeme definovat přenos, který je pozitivně reálný podle definice
6.2. Pak je pasivnı́ systém pozitivně reálný (ve smyslu zvoleného vstupu a výstupu). Vybereme-li však
vstupnı́ a výstupnı́ veličinu u daného obvodu nevhodně, nebude již přenos pozitivně reálný a obvod,
složený ze stejných pasivnı́ch prvků, nebude vyhovovat podmı́nce pasivity podle definice 6.5. Jako
pasivnı́ budeme tedy definovat jen takový systém, který je vzhledem ke zvolenému vstupu a výstupu
pozitivně reálný.
Např. systém hmota, pružina, tlumič popsaný rovnicı́
mẍ + bẋ + cx = u,
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
63
kde vstupem je sı́la u a výstupem rychlost ẋ, je pozitivně reálný. Zvolı́me-li však za výstupnı́ veličinu
polohu x, nenı́ již systém pozitivně reálný, a nenı́ tedy ani pasivnı́ ve smyslu definice 6.5, i když je
složen pouze z pasivnı́ch prvků.
6.2.2
Obecná teorie disipativnı́ch systémů
Teorie disipativnı́ch systémů zobecňuje známé fyzikálnı́ principy přenosu a zachovánı́ energie. Dodáváli se disipativnı́mu systému energie, část této energie disipuje a část zůstane v systému akumulována.
Podobně je tomu při výdeji energie systémem. Disipativnı́ systém může tedy dodat do výstupu jen
část toho, co naakumuloval a může akumulovat jen část energie, která mu byla vstupem dodána. Tyto
fyzikálnı́ úvahy lze rozšı́řit a formulovat teorii disipativnı́ch systémů pomocı́ zobecněných energiı́ a
výkonů.
Nejprve zavedeme některé základnı́ pojmy použı́vané v obecné teorii disipativnı́ch systémů. Jsou
obsaženy předevšı́m v lit. [60,71], kde lze nalézt také důkazy dále uvedených vět.
Vzhledem k dalšı́mu praktickému využitı́ v teorii nelineárnı́ch disipativnı́ch systémů, budeme mı́sto
zcela obecného systému uvažovat v aplikacı́ch nejčastěji se vyskytujı́cı́ nelineárnı́ afinnı́ systém
ẋ = f (x) + G(x)u
y = h(x),
(6.20)
kde x ∈ X = Rn , množina vstupnı́ch hodnot U = Rm , množina výstupnı́ch hodnot Y = Rm , f a m
sloupců matice G jsou hladká vektorová pole a h je hladké zobrazenı́. Množina přı́pustných vstupů U
s hodnotami v U je tvořena po úsecı́ch spojitými funkcemi definovanými na R. Předpokládejme dále,
že f má alespoň jeden rovnovážný stav, který můžeme bez ztráty obecnosti uvažovat v počátku, tedy
f (0) = 0 a h(0) = 0.
Necht’ w(t) = w(u(t), y(t)) je reálná funkce definovaná na U × Y , která představuje zobecněný
výkon a kterou budeme nazývat zásobovacı́ tok (angl. supply rate). Předpokládejme, že pro každé
u ∈ U a každé x0 ∈ X je výstup y(t) takový, že w(t) splňuje vztah
Z
0
t
|w(τ )|dτ < ∞
∀ t ≥ 0,
(6.21)
tj. funkce w je lokálně integrovatelná.
Definice 6.6. Dynamický systém (6.20) se zásobovacı́m tokem w je disipativnı́, jestliže existuje
spojitá nezáporná funkce V : X → R taková, že pro všechna u ∈ U, x0 ∈ X, t ≥ 0
Z
V (x) − V (x0 ) ≤
t
w(τ )dτ,
(6.22)
0
kde x = x(t; x0 , u). Funkce V se nazývá akumulačnı́ funkce (někdy také zásobnı́ funkce, angl. storage
function). Nerovnost (6.22) je tzv. disipačnı́ nerovnost.
Definice 6.7. Dostupná zásoba (nebo také výstupnı́ akumulačnı́ funkce, angl. available storage) Va
dynamického systému s tokem w je funkce Va : X → R definovaná vztahem
Va (x) = sup −
Z
t
w(τ )dτ .
(6.23)
0
Supremum se určı́ přes všechny pohyby začı́najı́cı́ ve stavu x0 v čase 0 a přes všechna u ∈ U. Dostupná
zásoba je maximálnı́ množstvı́ zásoby, která může být v každém okamžiku extrahována z dynamického
systému. Funkce Va (x) je nezáporná, protože je to supremum z množiny čı́sel, které obsahujı́ nulový
prvek. Pojem dostupné zásoby je zobecněnı́m pojetı́ ”dostupné energie”.
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
64
Dostupná zásoba Va je základnı́ funkcı́ pro určenı́, zda systém je či nenı́ disipativnı́. To specifikuje
následujı́cı́ věta.
Věta 6.5. Jestliže systém se zásobovacı́m tokem w je disipativnı́, dostupná zásoba Va (x) je konečná
pro každé x ∈ X a splňuje podmı́nku
0 ≤ Va (x) ≤ V (x).
(6.24)
pro každé x ∈ X. Jestliže Va je třı́dy C 0 , pak Va je sama možnou akumulačnı́ funkcı́ V (x). Obráceně
platı́, že systém je disipativnı́, jestliže Va (x) je třı́dy C 0 a konečná pro každé x ∈ X.
Podrobnějšı́m rozborem obecných vlastnostı́ výše uvedených funkcı́ lze ukázat, že funkce toku w
může být vybrána různým způsobem. Zvláště důležité jsou volby: w = ||u||2 − ||y||2 , w = (u, y),
w = (u + ay, u + by) a některé dalšı́. Z hlediska aplikacı́ budeme dále uvažovat w jako skalárnı́
součin (u, y), který budeme psát ve tvaru y T u. Pomocı́ této volby, která velmi úzce souvisı́ s fyzikálnı́
představou výkonu nebo zobecněného výkonu, můžeme definovat pasivitu a pozitivnı́ reálnost z odst.
6.2.1 i pro nelineárnı́ systémy.
Definice 6.8. Nelineárnı́ systém (6.20) je pasivnı́, jestliže existuje taková C 0 nezáporná akumulačnı́
funkce V : X → R, V (0) = 0, která splňuje disipačnı́ nerovnost (6.22) pro funkci w(u, y) = y T u.
Platı́ tedy
Z
t
V (x) − V (x0 ) ≤
y T (τ )u(τ )dτ.
(6.25)
0
Systém (6.20) je pozitivně reálný, jestliže pro x0 = 0, t ≥ 0 a všechna přı́pustná řı́zenı́ u ∈ U platı́
nerovnost
Z
t
0
y T (τ )u(τ )dτ ≥ 0.
(6.26)
Poznámky:
1) Jestliže V (0) = 0 a V (x) ≥ 0, pak z (6.25) vyplývá, že každý pasivnı́ systém je pozitivně reálný.
2) Definice 6.8 představuje rozšı́řenı́ pojmu pozitivnı́ reálnosti na nelineárnı́ systémy. Nelze tu ovšem
jednoduše testovat pozitivnı́ reálnost pomocı́ frekvenčnı́ch charakteristik jako u lineárnı́ho systému.
3) Pro x0 6= 0 je V (x0 ) > 0. Položı́me-li v (6.25) u = 0, je patrno, že funkce V klesá podél jakékoliv
trajektorie nebuzeného systému. Z toho vyplývá, že pasivnı́ systémy s pozitivně definitnı́ funkcı́ V jsou
ljapunovsky stabilnı́. Funkce V je Ljapunovovou funkcı́ pro systém ẋ = f (x).
Budeme-li naopak volit takové řı́zenı́ u, aby výstup y se udržoval na nulové hodnotě, vyplývá
z nerovnosti (6.25), že V je rovněž klesajı́cı́ podél jakékoliv trajektorie, která vyhovuje omezujı́cı́
podmı́nce y = 0. V kap. 15 uvidı́me, že všechny takové trajektorie definujı́ tzv. nulovou dynamiku
nelineárnı́ho systému (6.20), jejı́ž stabilita hraje důležitou roli při syntéze řı́zenı́ pomocı́ exaktnı́ linearizace. Stabilita nulové dynamiky se ale velmi obtı́žně vyšetřuje. Z nerovnice (6.25) však vyplývá,
že pasivnı́ systémy s pozitivně definitnı́ funkcı́ V majı́ tuto nulovou dynamiku ljapunovsky stabilnı́.
4) Pasivnı́ systém je bezeztrátový, jestliže v definici (6.8) je
V (x) − V (x0 ) =
Z
t
y T (τ )u(τ )dτ.
(6.27)
0
5) Pasivnı́ systém podle definice 6.8 je striktně pasivnı́, existuje-li taková pozitivně definitnı́ funkce
S : X → R, že pro všechna u ∈ U, x0 ∈ X, t ≥ 0 je
V (x) − V (x0 ) =
Z
0
t
y T (τ )u(τ )dτ −
Z
0
t
S(x(τ ))dτ.
(6.28)
KAPITOLA 6. SPECIÁLNÍ SYSTÉMY
65
Funkce S představuje disipovaný výkon.
Přı́klad 6.2. Mechanický systém, který tvořı́ hmota m, pružina s nelineárnı́ direktivnı́ silou a nelineárnı́ tlumič, je popsán např. rovnicı́
mẍ + x2 ẋ + x3 = u,
kde vstupnı́ veličina u je vnějšı́ působı́cı́ sı́la F. Jestliže zvolı́me jako výstupnı́ veličinu rychlost ẋ, je
systém pasivnı́ (vzhledem ke zvolenému vstupu a výstupu), protože ho můžeme zapsat ve tvaru (6.28)
1
1
mẋ2 + x4 =
2
4
Z
0
t
ẋF dτ −
Z
t
x2 ẋ2 dτ.
(6.29)
0
Funkce V (x) je celková energie (kinetická a potenciálnı́) akumulovaná v systému a S = x2 ẋ2 je
disipovaný výkon.
Pasivnı́ dynamické systémy jsou výhodné při analýze složitých dynamických systémů, při studiu
stability zpětnovazebnı́ch systémů (kap. 7 a 8), při návrhu exaktnı́ch linearizacı́ (kap. 15), v teorii
elektrických obvodů aj. Paralelnı́ a zpětnovazebnı́ kombinace pasivnı́ch systémů vytvářejı́ opět pasivnı́
systémy a akumulačnı́ funkce V (Ljapunovovy funkce) a funkce S ve vztahu (6.28) majı́ aditivnı́
charakter
X
X
V =
Vi ,
S=
Si .
i
i
Podrobný rozbor lze nalézt např. v [52,71].
Teorie disipativnı́ch systémů je hluboce propracována v zobecněné termodynamice nevratných
(ireverzibilnı́ch) procesů a disipativnı́ch struktur, které majı́ stěžejnı́ význam pro chemické a biologické
systémy.
Kapitola 7
Absolutnı́ stabilita
V této kapitole se budeme zabývat určovánı́m stability nelineárnı́ch systémů, ve kterých lze oddělit
dynamickou lineárnı́ část od nelineárnı́ch statických prvků (obr. 7.1). Tento typ úlohy se v literatuře nazývá také Lurjeho problém. Lineárnı́ část je obecně definována přenosovou maticı́ G(s) nebo
stavovými rovnicemi
ẋ(t) = Ax(t) + Bu(t)
y(t) = Cx(t) + Du(t),
(7.1)
nelineárnı́ část obsahuje statické prvky z(t) = φ(t, y), které budou u jednotlivých úloh definovány
podrobněji. Zpětnovazebnı́ spojenı́ mezi prvky je u(t) = −z(t). Dále budeme uvažovat jen systémy se
stejným počtem vstupů a výstupů, kde x ∈ Rn , u, y, z ∈ Rm .
V teorii stability se ukázalo výhodné zjišt’ovat stabilitu uzavřené smyčky z vlastnostı́ otevřené
smyčky. Takovou metodou je u lineárnı́ch systémů předevšı́m velmi známé Nyquistovo kritérium,
které je jednoduché a názorné, protože umožňuje využı́t pro určenı́ stability frekvenčnı́ charakteristiku
systému. Snahou mnoha autorů proto bylo vytvořit podobná kritéria i pro nelineárnı́ systémy.
7.1
Popovovo kritérium
V r. 1959 uveřejnil rumunský vědec V.M. Popov nové kritérium stability nelineárnı́ch systémů Lurjeho typu (obr. 7.1), které je velmi výhodné pro inženýrskou praxi, protože k vyšetřenı́ stability se
použı́vá frekvenčnı́ch charakteristik lineárnı́ části obvodu. Kritérium bylo rozšı́řeno mnoha dalšı́mi autory a dnes jı́m lze vyšetřovat systémy se spojitými, nespojitými, hystereznı́mi i časově proměnnými
nelineárnı́mi prvky, systémy s většı́m počtem nelinearit, diskrétnı́ nelineárnı́ systémy, fuzzy systémy,
systémy s rozloženými parametry, adaptivnı́ systémy aj. Metoda umožňuje také posoudit stupeň stability nebo tlumenı́ systému a provádět některé jednoduché syntézy nelineárnı́ho systému.
Ukázalo se také, že Popovovo kritérium je v úzkém vztahu k Ljapunovově teorii stability a jeho
splněnı́ je nutnou a postačujı́cı́ podmı́nkou pro existenci Ljapunovovy funkce ve tvaru kvadratická
forma plus integrál z nelinearity. Vyšetřovánı́ stability pomocı́ Popovova kritéria je výhodné při malém
počtu nelinearit, přičemž řád lineárnı́ části může být vysoký. Tı́m představuje toto kritérium výhodný
doplněk Ljapunovovy metody, která je naopak výhodná při vı́ce nelinearitách a nı́zkém řádu lineárnı́
části.
Nejprve budeme uvažovat autonomnı́ nelineárnı́ systém podle obr. 7.1 s jednou nelinearitou ve
zpětné vazbě a s lineárnı́m časově invariantnı́m subsystémem, který má jeden vstup a jeden výstup.
Tato lineárnı́ část zahrnuje všechny lineárnı́ členy v obvodu. Uzavřený systém lze popsat rovnicemi
ẋ = Ax + bu,
y = cT x,
66
u = −φ(y),
(7.2)
KAPITOLA 7. ABSOLUTNÍ STABILITA
67
kde x ∈ Rn , u, y jsou skaláry. Přenos lineárnı́ části je
G(s) = cT (sI − A)−1 b.
(7.3)
Dále budeme předpokládat, že v obvodu je jedna jednoznačná časově invariantnı́ nelinearita, která ležı́
v 1. a 3. kvadrantu v sektoru [0, k] a splňuje podmı́nky
φ(0) = 0,
0≤
φ(y)
≤k
y
0 ≤ k ≤ ∞,
(7.4)
kde k je sklon omezujı́cı́ přı́mky (obr.7.2). Zpětnovazebnı́ systém (7.2) má jeden rovnovážný stav
x = 0.
Obrázek 7.1: Schéma nelineárnı́ho systému
Obrázek 7.2: Sektor nelineárnı́ charakteristiky
Věta 7.1 (Popovovo kritérium). Uvažujme nelineárnı́ systém, u něhož
a) všechna vlastnı́ čı́sla matice A majı́ záporné reálné části (G(s) má póly jen v levé polorovině)
b) pár (A, b) je řiditelný, pár (c, A) je pozorovatelný
c) statická charakteristika nelineárnı́ho prvku ležı́ v sektoru [0, k].
Za těchto podmı́nek je rovnovážný stav x = 0 systému (7.2) globálně absolutně asymptoticky
stabilnı́ tehdy, existuje-li takové reálné čı́slo q > 0, že pro všechna ω ≥ 0 je splněna nerovnost
Re[(1 + jωq)G(jω)] +
1
> 0.
k
(7.5)
V přı́padě, že přenos lineárnı́ části má i pól v počátku, platı́ uvedené kritérium při omezenı́ nelineárnı́ho
prvku na sektor (0, k], aby nevznikl jiný rovnovážný stav mimo počátek.
Poznámky:
a) Popovovo kritérium je pouze podmı́nkou postačujı́cı́. V určitých přı́padech může být systém stabilnı́
i pro většı́ zesı́lenı́ v obvodu než udá kritérium. Vyplývá to z toho, že se určuje stabilita pro celou třı́du
nelinearit, z nichž některé mohou být pro stabilitu velmi nepřı́znivé, např. funkce s klesajı́cı́m úsekem
charakteristiky. Toto obecnějšı́ pojetı́ má však i své výhody, protože v praxi může mı́t charakteristika
velmi komplikovaný tvar nebo ji nelze dostatečně přesně určit. Charakteristiky se mohou také pomalu
měnit, např. stárnutı́m prvku.
b) Pro obecnou časově proměnnou nebo nejednoznačnou nelinearitu platı́ Popovovo kritérium s
omezenı́m
q=0
0 < k ≤ ∞.
(7.6)
Globálnı́ asymptotická stabilita je tedy splněna pouze tehdy, platı́-li
Re G(jω) +
1
> 0.
k
(7.7)
Frekvenčnı́ charakteristika G(jω) lineárnı́ části musı́ tedy ležet v komplexnı́ rovině vpravo od svislé
přı́mky, procházejı́cı́ bodem −1/k.
KAPITOLA 7. ABSOLUTNÍ STABILITA
68
Přı́klad 7.1. V systému podle obr. 7.1 má lineárnı́ část přenos
G(s) =
10
s(2s + 1)
a nelinearita ležı́ v sektoru (0, 1].
Pro určenı́ stability Popovovým kritériem můžeme zvolit např. q = 2. Pak podmı́nka
Re[(1 + 2jω)
10
]+1>0
jω(2jω + 1)
je splněna pro všechna ω ≥ 0 a uzavřený systém má jeden rovnovážný stav v nule, který je absolutně
asymptoticky stabilnı́ ve velkém.
Grafické řešenı́ kritéria v komplexnı́ rovině.
Pro určenı́ stability je tedy třeba v Popovově nerovnosti (7.5) zvolit určité q a zjistit, zda podmı́nka je
splněna. Nenı́-li, musı́me volit jinou hodnotu q a postup opakovat, teoreticky pro všechna q > 0. Při
složitějšı́ch přenosech G(jω) by to bylo neproveditelné, řešenı́ je však možno nalézt velmi jednoduše
graficky v komplexnı́ rovině.
Prvnı́ část nerovnosti (7.5) lze rozepsat ve tvaru
Re [(1 + jωq)G(jω)] = Re {(1 + jωq)[Re G(jω) + jIm G(jω)]} =
= Re [Re G(jω) + jωq Re G(jω) + jIm G(jω) − qω Im G(jω)] =
= Re G(jω) − qω Im G(jω) = X − qY,
(7.8)
kde
X = Re G(jω)
Y = ω Im G(jω).
(7.9)
Nerovnost (7.5) lze tedy zapsat ve tvaru
X − qY +
1
> 0.
k
(7.10)
Rovnice
1
=0
(7.11)
k
je v souřadnicı́ch X, Y rovnicı́ tzv. Popovovy přı́mky, která procházı́ bodem −1/k na reálné ose a
má sklon 1/q. Nerovnost (7.5) pak řı́ká, že všechny body se souřadnicemi X, Y musı́ být v oblasti
definované podmı́nkou (7.5). Stabilitu pak vyšetřujeme tı́mto postupem:
X − qY +
Pro daný nelineárnı́ systém s lineárnı́ částı́ G(jω) nakreslı́me v komplexnı́ rovině tzv. modifikovanou
frekvenčnı́ charakteristiku
G? (jω) = X(ω) + jY (ω).
(7.12)
Reálná část této charakteristiky je stejná jako u G(jω), imaginárnı́ část je pro každý bod dána hodnotou
imaginárnı́ částı́ G(jω) násobenou odpovı́dajı́cı́ hodnotou ω. Systém je stabilnı́, můžeme-li vést bodem
(−1/k, j0) takovou přı́mku, která by ležela vlevo od modifikované charakteristiky, jestliže jı́ procházı́me
ve směru od ω = 0 do ω = ∞.
Připomeňme si, že při vyšetřovánı́ stability lineárnı́ch systémů pomocı́ Nyquistova kritéria nezáležı́
na tvaru celé frekvenčnı́ charakteristiky, ale pouze na jejı́ch průchodech reálnou osou. Popovovo
kritérium pro nelineárnı́ systémy však bere v úvahu celý průběh modifikované frekvenčnı́ charakteristiky.
KAPITOLA 7. ABSOLUTNÍ STABILITA
69
Přı́klad 7.2. Určete, zda systém se strukturou podle obr.7.1 a s lineárnı́ částı́
G(s) =
1
s(2s + 1)(s + 1)2 (0, 5s + 1)
je stabilnı́ při jednoznačné časově invariantnı́ nelineárnı́ funkci, která ležı́ v 1. a 3. kvadrantu v sektoru (0; 0, 5].
Do komplexnı́ roviny vyneseme frekvenčnı́ charakteristiku lineárnı́ části obvodu (obr.7.3) a sestrojı́me k nı́
modifikovanou G? (jω). Je patrno, že bodem −1/k = −2 je možno vést libovolnou přı́mku tak, aby G? (jω) ležela
pro všechny frekvence vpravo od této přı́mky. Systém je proto absolutně asymptoticky stabilnı́ ve velkém.
Obr.7.3. Vyšetřenı́ stability systému z přı́kladu 7.2.
Popovovo kritérium umožňuje zı́skat i obecnějšı́ závěry pro studium stability. Nahradı́me-li
nelineárnı́ člen lineárnı́m, který má zesı́lenı́ k (sklon mezné přı́mky), je charakteristická rovnice
výsledného uzavřeného lineárnı́ho obvodu kG(jω)+1 = 0. Na mezi stability bude obvod podle Nyquistova kritéria tehdy, nastane-li průsečı́k G(jω) se zápornou reálnou poloosou v bodě −1/k. V přı́kladu
7.2 je souřadnice tohoto průsečı́ku -1,86 tj. k = 0, 536. Z obr. 7.3 je patrno, že nelineárnı́ obvod s libovolnou nelinearitou v sektoru (0; 0, 536] bude rovněž stabilnı́. V bodě −1/k = −1, 86 je totiž možno
vést meznı́ Popovovu přı́mku jako tečnu k modifikované charakteristice G? (jω).
V tomto přı́padě platı́ tedy stejné podmı́nky stability pro daný nelineárnı́ systém z přı́kladu 7.2 i
pro náhradnı́ lineárnı́ systém. Některé dalšı́ podobné přı́klady vedly k formulaci tzv. Ajzermanovy
hypotézy, kterou můžeme stručně formulovat takto: Nahradı́me nelineárnı́ člen lineárnı́m prvkem se
zesı́lenı́m k meznı́ přı́mky. Je-li výsledný lineárnı́ uzavřený obvod stabilnı́, je stabilnı́ také původnı́
obvod s nelinearitou ležı́cı́ v sektoru s hornı́ hranicı́ k.
Pokud by tato hypotéza platila, bylo by možno nahradit vyšetřovánı́ stability nelineárnı́ho systému
Lurjeho typu jednoduchými kritérii, které platı́ pro lineárnı́ systémy. Velmi brzy se však ukázalo, že
Ajzermanova hypotéza platı́ pouze v některých přı́padech a nikoliv obecně, jak je ihned patrno z
dalšı́ho přı́kladu.
Přı́klad 7.3. Určete, zda je stabilnı́ obvod s nelineárnı́ charakteristikou ležı́cı́ v sektoru (0; 0, 7] a s lineárnı́m
členem s přenosem
1
.
(7.13)
G(s) =
s(s3 + s2 + 2s + 1)
Vyneseme-li v komplexnı́ rovině (obr. 7.4) modifikovanou charakteristiku G? (jω), je patrno, že bodem −1/k =
−1, 43 můžeme vést přı́mku tak, aby G? (jω) zůstala vpravo. Obvod je stabilnı́.
Nahradı́me-li nelineárnı́ člen lineárnı́m se zesı́lenı́m k, pak z Nyquistova kritéria plyne, že náhradnı́ obvod je
na mezi stability pro k = 1, nelineárnı́ obvod má však meznı́ zesı́lenı́ k = 0, 75. Vedeme-li totiž takovou meznı́
KAPITOLA 7. ABSOLUTNÍ STABILITA
70
Popovovu přı́mku, aby G? (jω) byla stále vpravo od nı́, je vidět, že tato přı́mka (zakreslená na obr. 7.3) protı́ná
reálnou osu v bodě −1/k = −1, 33, tj. k = 0, 75. Ajzermanova hypotéza v tomto přı́padě neplatı́, tzv. Hurwitzův
sektor (0, 1] je většı́ než Popovův (0; 0, 75].
Obr. 7.4. Modifikovaná frekvenčnı́ charakteristika
7.1.1
Odvozenı́ Popovova kritéria
Důkaz Popovova kritéria je dosti náročný, zejména původnı́ postup, který podal Popov [83].
Jednodušeji lze odvodit toto kritérium pomocı́ Ljapunovovy funkce ve tvaru kvadratická forma plus
integrál z nelinearity a pomocné věty předložené Kalmanem a Jakubovičem [74]. Odvozenı́ zároveň
ukazuje, že Popovovo kritérium je nutnou a postačujı́cı́ podmı́nkou pro existenci Ljapunovovy funkce
uvedeného typu. Odvozenı́ provedeme pouze pro přı́pad, kdy G(s) má póly jen v levé polorovině a
v obvodu je časově invariantnı́ jednoznačná nelinearita. Ostatnı́ přı́pady lze odvodit analogicky nebo
pomocı́ metody transformace pólů a nul (odst. 7.1.3).
Zvolme pro nelineárnı́ systém (7.2) Ljapunovovu funkci
V (x) = xT P x +
Z
y
φ(y)dy,
(7.14)
0
kde P je symetrická pozitivně definitnı́ matice. Protože φ(y) ležı́ v sektoru [0, k], je
Funkce V je pozitivně definitnı́ a radiálně neohraničená. Jejı́ derivace
Ry
0
φ(y)dy ≥ 0 ∀y.
V̇ (x) = ẋT P x + xT P ẋ + φ(y)ẏ.
(7.15)
ẋ = Ax − bφ(y)
(7.16)
Z rovnic systému (7.2) vyplývá
T
T
T
T
ẏ = c ẋ = c (Ax + bu) = c Ax − c bφ(y).
(7.17)
V̇ = xT AT P x + xT P Ax − bT P xφ(y) − xT P bφ(y) + cT Axφ(y) − cT bφ2 (y)
(7.18)
Dosazenı́m do (7.15) je
KAPITOLA 7. ABSOLUTNÍ STABILITA
71
a po úpravě
V̇ = xT (AT P + P A)x + (cT A − 2bT P )xφ(y) − cT bφ2 (y).
(7.19)
Přidejme do (7.19) výraz
φ(y)[−gy + gcT x] + hφ2 (y) − hφ2 (y),
(7.20)
který nezměnı́ platnost rovnice (7.19). Výraz obsahuje dva volné parametry g, h, které můžeme volit
tak, aby jejich poměr g/h udával směrnici přı́mky, pod kterou ležı́ nelineárnı́ charakteristika, tj. g/h =
k. Pak
V̇ = xT (AT P + P A)x + (cT A − 2bT P + gcT )xφ(y)
− (h + cT b)φ2 (y) + (hφ(y) − gy)φ(y).
(7.21)
Aby systém (7.2) byl stabilnı́, je třeba, aby funkce V̇ byla negativně definitnı́. K určenı́ této definitnosti
využijeme pomocné věty, kterou publikoval Kalman.
Věta 7.2. Jsou dány dva reálné n-rozměrné vektory δ a b (b 6= 0), reálné čı́slo γ ≥ 0, symetrická
pozitivně definitnı́ matice P a n × n matice A se zápornými reálnými vlastnı́mi čı́sly. Pak existuje
reálný vektor s, že platı́
AT P + P A = −ssT
√
δ − P b = − γs
(7.22)
(7.23)
tehdy a jen tehdy, jestliže pro všechna reálná ω je
1
γ + Re[δ T (jωI − A)−1 b] ≥ 0.
2
(7.24)
Zvolme nynı́
1
δ = (A + gI)T c
2
Rovnice (7.23) bude mı́t pak tvar
γ = h + cT b.
(7.25)
p
1
− P b + (A + gI)T c = − h + cT b s
2
(7.26)
a jejı́ transpozice je
− 2bT P T + cT A + cT g = −2sT
p
h + cT b.
(7.27)
Dosadı́me-li (7.27) a (7.22) do (7.21), pak pro P = P T je
V̇ = −xT ssT x − 2sT
p
h + cT b xφ(y) − (h + cT b)φ2 (y) − hφ(y)
V̇ = −[sT x +
p
h + cT b φ(y)]2 − hφ(y)
g
y − φ(y) .
h
g
y − φ(y)
h
(7.28)
(7.29)
Protože g/h = k, ky − φ(y) ≥ 0, je druhý člen v (7.29) nekladný. Prvnı́ člen je záporný, existuje-li
reálný vektor s, tj. platı́-li podmı́nka (7.24). Pak je V̇ negativně definitnı́ a systém (7.2) je globálně
asymptoticky stabilnı́.
Dosadı́me-li do nerovnosti (7.24) zvolené výrazy pro δ a γ z (7.25), dostaneme Popovovo kritérium
v maticovém tvaru. Pak platı́
Věta 7.3. Systém (7.2) je globálně absolutně asymptoticky stabilnı́, existujı́-li takové dva parametry
g, h > 0, že
h + cT b ≥ 0
(7.30)
KAPITOLA 7. ABSOLUTNÍ STABILITA
72
(h + cT b) + Re[cT (A + gI)(jωI − A)−1 b] ≥ 0.
(7.31)
Abychom dokázali, že podmı́nky (7.30) a (7.31) odpovı́dajı́ Popovovu kritériu podle věty 7.1,
upravme (7.31) na tvar (7.5). Lineárnı́ část obvodu, která je dána vztahy
y = cT x
ẋ = Ax + bu
(ẏ = cT ẋ),
(7.32)
převedeme do Laplaceovy transformace
sX(s) = AX(s) + bU (s)
(7.33)
T
(7.34)
T
sY (s) = c AX(s) + c bU (s)
a přidáme do druhé rovnice výrazy −gY (s) + gcT X(s), které nezměnı́ jejı́ platnost. Z rovnice (7.33)
vypočteme X(s)
X(s) = (sI − A)−1 bU (s),
(7.35)
doplněná rovnice (7.34) vede na
(s + g)Y (s) = cT (A + gI)X(s) + cT bU (s).
(7.36)
Dosazenı́m (7.35) do (7.36) zı́skáme přenos lineárnı́ části ve tvaru
Y (s)
1
= G(s) =
[cT (A + gI)(sI − A)−1 b + cT b]
U (s)
s+g
(7.37)
(jω + g)G(jω) = cT (A + gI)(jωI − A)−1 b + cT b.
(7.38)
a pro s = jω
Srovnánı́m se vztahem (7.31) je patrno, že
h + cT b + Re[cT (A + gI)(jωI − A)−1 b] = h + Re[cT (A + gI)(jωI − A)−1 b + cT b]
= h + Re[(jω + g)G(jω)] =
h
1
+ Re[(1 + jω)G(jω)] ≥ 0.
g
g
(7.39)
Protože h/g = 1/k a 1/g je libovolný volitelný parametr q v Popovově definici, odpovı́dá (7.39) tvaru
(7.5).
7.1.2
Popovovo kritérium a Ajzermanova hypotéza
V předchozı́m odstavci jsme formulovali tzv. Ajzermanovu hypotézu, která pro nelineárnı́ systémy
obecně neplatı́, existuje však mnoho jednoduchých systémů, které Ajzermanově domněnce vyhovujı́.
Rozborem pomocı́ Popovova kritéria lze u jednoduššı́ch obvodů stanovit podmı́nky platnosti Ajzermanovy hypotézy. Uvažujme jako přı́klad nelineárnı́ systém s lineárnı́ částı́, která má přenos
G(s) =
s(a3
s3
1
.
+ a2 s2 + a1 s + 1)
(7.40)
Frekvenčnı́ charakteristika je pro určité hodnoty koeficientů znázorněna na obr. 7.5a, modifikovaná na
obr. 7.5b. Kořeny polynomu v závorce jmenovatele přenosu (7.40) ležı́ v levé polorovině při a1 a2 −a3 >
0.
KAPITOLA 7. ABSOLUTNÍ STABILITA
73
Obr. 7.5. Charakteristiky v komplexnı́ rovině
a) frekvenčnı́ charakteristika
b) modifikovaná frekvenčnı́ charakteristika
Frekvenčnı́ přenos G(jω) vyjádřı́me ve tvaru
G(jω) =
−(a1 − a3 ω 2 )ω − j(1 − a2 ω 2 )
u
=
2
2
2
2
2
ω[(1 − a2 ω ) + ω (a1 − a3 ω ) ]
v
(7.41)
Imaginárnı́ část přenosu je rovna nule pro ω 2 = 1/a2 , reálná část přenosu pro tuto hodnotu ω má
velikost
a22
X1 = −
(7.42)
a1 a2 − a3
Modifikované frekvenčnı́ charakteristiky začı́najı́ v bodě (−a1 , −j) pro ω = 0. Směrnice tečny v
průsečı́ku s osou X je
a2
(7.43)
tg α =
a1 a2 − 2a3
Zı́skáme ji ze vztahů
2a2 ω 3 (a1 − a3 ω 2 )2
d[ω Im G(jω)]
=
(7.44)
dω
v2
d[Re G(jω)]
2a3 ω 3 (a1 − a3 ω 2 )2 + (a1 − a3 ω 2 )2a21 ω − 8a1 a3 ω 3 + 6a23 ω 5
=
(7.45)
dω
v2
Společné body tečny a modifikované charakteristiky lze stanovit řešenı́m rovnice
−
1 − a2 ω 2
=
(1 − a2 ω 2 )2 + ω 2 (a1 − a3 ω 2 )2
"
#
a2
−(a1 − a3 ω 3 )
a22
=
+
,
a1 a2 − 2a3 (1 − a2 ω 2 )2 + ω 2 (a1 − a3 ω 2 )2 a1 a2 − a3
(7.46)
jejı́ž úpravou dostaneme kubickou rovnici v ω 2
a32 a23 ω 6 + a22 (a22 − 2a1 a3 )ω 4 + a2 (4a1 a2 a3 − 3a23 − 2a32 )ω 2 +
+ (a32 − 2a1 a2 a3 + 2a23 ) = 0.
(7.47)
Obtı́žné řešenı́ lze obejı́t, protože rovnice musı́ mı́t dva stejné kořeny, odpovı́dajı́cı́ bodu dotyku, pro
který platı́ ω 2 = 1/a2 . Vydělı́me-li rovnici (7.47) součinem
a22 (ω 2 −
1 2
) = a22 ω 4 − 2a2 ω 2 + 1,
a2
(7.48)
KAPITOLA 7. ABSOLUTNÍ STABILITA
74
dostaneme vztah
a2 a23 ω 2 + a32 − 2a1 a2 a3 + 2a23 = 0.
(7.49)
Kořeny rovnice (7.47) jsou tedy
2
ω1,2
=
1
a2
ω32 =
2a1 a2 a3 − a32 − 2a23
a2 a23
(7.50)
Aby tečna v bodě (X1 , j0) neměla už žádný dalšı́ průsečı́k s modifikovanou frekvenčnı́ charakteristikou,
musı́ platit
2a1 a2 a3 < 2a23 + a32 .
(7.51)
Z podmı́nky je patrno, že Ajzermanova hypotéza platı́ jen pro určité rozdělenı́ kořenů rovnice a3 s3 +
a2 s2 + a1 s + 1 = 0. Dalšı́m rozborem lze ukázat, že pro všechny kořeny reálné záporné hypotéza platı́,
při jednom reálném kořenu a dvou komplexně sdružených už Ajzermanova hypotéza obecně neplatı́ a
je vázána podmı́nkou (7.51). V literatuře jsou odvozeny podmı́nky platnosti hypotézy pro různé typy
systémů.
Z rozborů je patrno, že nelineárnı́ systém má přı́snějšı́ podmı́nky stability než linearizovaný systém
tehdy, má-li přenos lineárnı́ části komplexně sdružené póly s malou reálnou částı́ nebo s velkým modulem. Pak má nelineárnı́ systém většı́ sklon ke kmitánı́ a to zejména v přı́padech, kdy nelinearita má
klesajı́cı́ části charakteristiky. Omezı́me-li se na nelinearity s neklesajı́cı́m průběhem, nejsou obvykle
podmı́nky stability tak přı́sné.
7.1.3
Transformace pólů a nul
Základnı́ Popovovu nerovnost (7.5) lze použı́t i pro systémy, které nesplňujı́ definované podmı́nky.
Po zavedenı́ jednoduchých transformacı́ lze řešit např. obvody s nestabilnı́ lineárnı́ částı́, obvody s
nelinearitami, které mohou zasahovat i do druhého a čtvrtého kvadrantu apod.
Transformace posouvajı́cı́ póly přenosu lineárnı́ části
Tuto transformaci můžeme např. použı́t, má-li zadaný systém nelinearitu v sektoru [a, b]. Systém
podle obr.7.1 se nezměnı́, zavedeme-li vazby podle obr. 7.6. Výsledný obvod obsahuje novou nelineárnı́
funkci φa (y) = φ(y) − ay, ua = −φa (y). Přenos lineárnı́ části se změnı́ na
Ua (s)
G(s)
= Ga (s) =
Y (s)
1 + aG(s)
Byla-li zadaná nelinearita v sektoru [a, b], je výsledná v sektoru [0, b − a]. Pokud Ga (s) vyhovuje
podmı́nkám věty 7.5, lze Popovova kritéria použı́t pro tento upravený obvod. Je-li nový systém stabilnı́,
je stabilnı́ i systém původně zadaný.
Transformace tedy vyvolává posunutı́ pólů přenosu lineárnı́ části a změnu sektoru nelineárnı́
charakteristiky. Této techniky lze použı́t i pro vyšetřenı́ stability, je-li v zadaném systému lineárnı́
část nestabilnı́. Lze pomocı́ nı́ také podat důkaz Popovova kritéria pro přı́pad, že G(s) má póly na
imaginárnı́ ose.
Jestliže lineárnı́ část obvodu má dostatečně velký stupeň stability, můžeme v systému podle obr.
7.6 vytvořit i kladnou vazbu. Lze tak studovat stabilitu systémů, u nichž nelineárnı́ charakteristika
zasahuje do 2. a 4. kvadrantu (obr. 7.7).
KAPITOLA 7. ABSOLUTNÍ STABILITA
75
Obr. 7.6. Transformace pólů
Obr.7.7. Nelinearita ve 2. a 4. kvadrantu
Přı́klad 7.4. Pro nelineárnı́ systém s lineárnı́ částı́
G(s) =
1
(s − 1)(s + 2)(s + 3)
je třeba stanovit sektor, v němž může ležet stacionárnı́ jednoznačná nelineárnı́ charakteristika, aby uzavřený
obvod byl globálně asymptoticky stabilnı́.
Protože přenos G(s) je nestabilnı́, použijeme metody transformace pólů.
Ga (s) =
G(s)
1
= 3
1 + G(s)
s + 4s2 + s − 6 + a
Pomocı́ Hurwitzova kritéria lze stanovit, že Ga (s) bude stabilnı́ pro 6 < a < 10 (Hurwitzův sektor). Zvolı́me-li
a = 6, bude
1
Ga (s) =
s(s2 + 4s + 1)
na mezi stability. Nynı́ použijeme Popovova kritéria ke stanovenı́ sektoru (0, k], ve kterém může ležet nelinearita,
aby systém s lineárnı́m přenosem Ga (s) byl stabilnı́. Zakreslı́me-li G?a (jω), zjistı́me, že k = 4. Zadaný systém
s lineárnı́ částı́ G(s) bude tedy stabilnı́, bude-li nelinearita ležet v sektoru (6, 10). Hurwitzův sektor v tomto
přı́padě souhlası́ s Popovovým sektorem a platı́ Ajzermanova hypotéza.
Transformace posouvajı́cı́ nuly přenosu lineárnı́ části
Úkolem této transformace je měnit sektor nelineárnı́ charakteristiky, aniž bychom změnili hodnoty pólů
lineárnı́ho členu. V daném nelineárnı́m systému vytvořı́me zpětnou vazbu kolem nelineárnı́ho prvku (obr.7.8).
Pak pro výsledný přenos lineárnı́ části Gc (s) a pro výslednou nelinearitu φc platı́
φc = φ(1 + cφ)−1
Gc (s) = G(s) − c
Sektor [a, b] nelinearity se transformuje na sektor
a
b
,
,
1 + ac 1 + bc
tedy např sektor [0, ∞) na [0, 1/c].
u = −φc (y)
(7.52)
KAPITOLA 7. ABSOLUTNÍ STABILITA
76
Obr. 7.8. Transformace nul
7.1.4
Rozšı́řenı́ Popovova kritéria
Základnı́ verze Popovova kritéria byla rozšı́řena mnoha autory na různé složitějšı́ spojité i diskrétnı́
systémy. Již Popov rozpracoval svou metodu i pro obvody s většı́m počtem nelinearit. Kritérium
je však vyjádřeno v maticové formě a jeho použitı́ je pracné. Jinı́ autoři uvažovali v nelineárnı́m
systému pouze monotonnı́ nelinearity nebo nelinearity s omezenı́m lokálnı́ho sklonu. Jejich výsledky
dávajı́ obvykle méně přı́sné podmı́nky stability než Popovovo kritérium, většinou však nelze použı́t
jednoduchý grafický test jako u Popova. Pro omezený rozsah skripta nebudeme zde tato kritéria
uvádět. Lze je nalézt v některých přehledných textech, např. v [48].
7.2
Kruhové kritérium
Jiný typ kritéria pro nelineárnı́ systém Lurjeho typu (obr.7.1) představuje tzv. kruhové kritérium,
které umožňuje určit globálnı́ exponenciálnı́ stabilitu zpětnovazebnı́ch systémů s lineárnı́ částı́ G(s)
a s časově variabilnı́mi a nejednoznačnými nelinearitami ležı́cı́mi v sektoru [a, b].
Dále uvedeme pouze jednoduššı́ verzi kritéria pro systém s lineárnı́ částı́ popsanou přenosem G(s)
a s jednou zpětnovazebnı́ nelinearitou, která ležı́ v sektoru [a, b]. Symbolem D(a, b) označı́me kruh v
komplexnı́ rovině, který má střed na reálné ose a jehož hraničnı́ kružnice procházı́ body −1/a a −1/b.
Věta 7.4 (Kruhové kritérium). Uvažujme podle obr.7.1 systém ẋ = Ax + bu, y = cT x, u = −φ(y)
při podmı́nkách
a) (A, b, c) je minimálnı́ realizace přenosu G(s)
b) nelinearita φ ležı́ v sektoru [a, b] a může být časově variantnı́ a nejednoznačná.
Systém je globálně exponenciálně stabilnı́, platı́-li některá z těchto podmı́nek:
1) 0 < a < b: frekvenčnı́ charakteristika G(jω) musı́ ležet vně kruhu D(a, b) a musı́ ho obklı́čit ρ
krát proti směru hodinových ručiček při ω stoupajı́cı́m od −∞ do ∞; ρ je počet vlastnı́ch čı́sel matice
A s kladnou reálnou částı́.
2) 0 = a < b: matice A je Hurwitzova a Re G(jω) + 1/b > 0 pro všechna ω ≥ 0.
3) a < 0 < b: matice A je Hurwitzova, G(jω) ležı́ uvnitř disku D(a, b).
4) a < b ≤ 0: Posuzuje se jako v bodech 1) nebo 2), ale mı́sto G(jω) se uvažuje −G(jω), mı́sto a
KAPITOLA 7. ABSOLUTNÍ STABILITA
77
bude −b a mı́sto b bude −a.
Poznámka: Hurwitzova matice má všechna vlastnı́ čı́sla se zápornými reálnými částmi. Odvozenı́
kruhového kritéria a jeho rozšı́řenı́ na systémy s většı́m počtem nelinearit lze nalézt např. v [55].
Stejně jako Popovovo kritérium, představuje i kruhové kritérium pouze podmı́nku postačujı́cı́. Kruhové
kritérium nahrazuje kritický bod −1/k Nyquistova kritéria kružnicı́, jejı́ž poloměr se zmenšuje, když
se zužuje sektor, tj. když b se přibližuje k a. Pro a = b se kružnice změnı́ na kritický bod −1/a = −1/k
Nyquistova kritéria.
Přı́klad 7.5. Pro nelineárnı́ systém s přenosem lineárnı́ části
G(s) =
1
(s − 1)(s + 3)(s + 4)
chceme nalézt pomocı́ Popovova a kruhového kritéria sektor, ve kterém může ležet časově proměnná nejednoznačná nelinearita tak, aby uzavřený obvod byl globálně asymptoticky stabilnı́.
1) Pomocı́ transformace pólů zjistı́me, že Ga (s) bude stabilnı́ se zpětnou vazbou 12 < a < 42. Zvolı́me např.
a = 12 a protože se jedná o časově proměnnou nelinearitu (q = 0), nakreslı́me frekvenčnı́ charakteristiku Ga (jω).
Popovovu přı́mku pro q = 0 můžeme vést bodem (−1/4, 2; j0). Obecná nelinearita může tedy v transformovaném
obvodu ležet v sektoru [0; 4, 2], v zadaném systému tedy v sektoru [12; 16, 2].
2) U kruhového kritéria zakreslı́me přı́mo zadanou frekvenčnı́ charakteristiku G(jω). Ta musı́ ležet vně
kružnic se středem na reálné ose. Takových kružnic je ovšem možno zakreslit nekonečně mnoho (obr.7.9). Každá
kružnice odpovı́dá určitému sektoru, který závisı́ na dolnı́ hranici a. Např. pro a = 20 je sektor [20; 28, 5]. Je
patrno, že každý sektor ležı́ uvnitř Hurwitzova sektoru [12, 42]. Kruhovým kritériem dostáváme tedy pro časově
proměnnou nelinearitu obecnějšı́ výsledky než pomocı́ Popovova kritéria.
Obr.7.9. Vyšetřenı́ oblastı́ stability pro přı́klad 7.5
Kapitola 8
Stabilita vstup-výstup
Teorie stability ve smyslu vstup-výstup byla formulována teprve nedávno. Základnı́ výsledky byly
publikovány po roce 1960 a od té doby byly rozvı́jeny v mnoha pracı́ch. Na rozdı́l od dobře známé
ljapunovské teorie stability nenı́ však stabilita vstup-výstup zatı́m běžně použı́vána v inženýrské praxi.
Je to dáno nejen krátkou dobou jejı́ho rozvoje, ale také tı́m, že tato teorie použı́vá některé relativně
náročnějšı́ matematické disciplı́ny, předevšı́m funkcionálnı́ analýzu, která nenı́ pro inženýry zcela běžná.
U Ljapunovovy teorie je základnı́m modelem systému soustava diferenciálnı́ch rovnic, které popisujı́
časový vývoj stavových proměnných systému. Ljapunovova teorie se týká ”vnitřnı́” stability systému,
tj. chovánı́ stavu při zadané počátečnı́ podmı́nce a při nulovém vstupnı́m signálu.
Při analýze stability vstup-výstup je systém zadán zobrazenı́m, které přiřazuje každému vstupu
odpovı́dajı́cı́ výstup bez ohledu na počátečnı́ podmı́nky. Systém je tedy reprezentován nějakým
operátorem nebo relacı́ a nenı́ třeba znát stavové diferenciálnı́ rovnice. Analýza vstup-výstup může být
proto použita i v situacı́ch, kdy nenı́ definován stav systému, rovnovážný stav apod. Např. systémy
s rozloženými parametry, dopravnı́m zpožděnı́m aj., se vyšetřujı́ na rozdı́l od Ljapunovovy teorie
relativně stejně snadno jako systémy se soustředěnými parametry. U Ljapunovovy teorie se obvykle
předpokládá, že systém má jediné řešenı́ při dané počátečnı́ podmı́nce a že toto řešenı́ závisı́ spojitě na
počátečnı́m stavu a čase. Stabilita vstup-výstup takový předpoklad nevyžaduje. Představuje koncepci,
která předvı́dá kvalitativnı́ chovánı́ zpětnovazebnı́ho systému jen z hrubé informace o prvcı́ch obvodu.
Toto pojetı́ vede k robustnosti a motivovalo mnoho nových výzkumů v oblasti modernı́ teorie řı́zenı́.
Aby teorie stability vstup-výstup mohla postihnout vliv nejrůznějšı́ch typů vstupnı́ch signálů,
je třeba, aby tyto vstupnı́ a podobně i výstupnı́ signály byly definovány dostatečně obecně. To lze
dosáhnout zavedenı́m měřitelných funkcı́ a rozšı́řených vektorových prostorů v Lebesgueově smyslu.
Vzhledem k tomu, že malý rozsah skripta dovoluje jen stručný úvod do problematiky stability vstupvýstup, uvedeme jen některé základnı́ pojmy, definice stability a bez důkazů některá jednoduchá
kritéria. Podrobnějšı́ rozbor problémů a důkazy uvedených vět lze nalézt např. v [53]. Dalšı́ část této
kapitoly sleduje převážně výklad, který je uveden podrobně v knize [55].
8.1
Lebesgueovy prostory a jejich rozšı́řenı́
Necht’ p je reálné čı́slo vyhovujı́cı́ podmı́nce 1 ≤ p < +∞. Označme symbolem Lp [0, ∞) = Lp množinu
takových měřitelných funkcı́ f : R+ → R, pro které je Lebesgueův integrál konečný, tj.
Z
0
∞
|f (t)|p dt < ∞.
(8.1)
Množina L∞ [0, ∞) = L∞ je tvořena všemi měřitelnými funkcemi f , které jsou esenciálně ohraničené
na intervalu [0, ∞) (tj. ohraničené skoro všude s výjimkou množiny mı́ry nula).
78
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
79
Poznámka. Měřitelné funkce můžeme definovat samozřejmě na nějaké obecnějšı́ množině Ω, avšak
vzhledem k tomu, že v našich aplikacı́ch budou funkce závislé na čase, uvažujeme již zjednodušenı́ na
interval [0, ∞).
Definujeme-li dále součet dvou funkcı́ f (t) a g(t) jako funkci h(t) = f (t) + g(t) a λ-násobek funkce
f jako h(t) = λf (t), pak množina Lp je vektorovým prostorem a nazývá se Lebesgueův prostor
Lp . Prostor Lp je prostor funkcı́ integrovatelných v p-té mocnině, zatı́mco L∞ je množina esenciálně
ohraničených měřitelných funkcı́. Prostor L1 je prostor funkcı́ integrovatelných v Lebesgueově smyslu,
prostor L2 je prostor funkcı́ integrovatelných s kvadrátem (kvadraticky integrovatelných).
Přı́klad 8.1. Funkce f (t) = e−at , a > 0 patřı́ do Lp pro všechna p ∈ [1, ∞]. Funkce f (t) = 1/(t + 1)
patřı́ do Lp pro všechna p > 1, ale ne do L1 .
Lebesgueův prostor můžeme normovat zavedenı́m tzv. p-normy ||f ||p . Pro p ∈ [1, ∞) je norma
||f ||p : Lp → R+ definována vztahem
||f ||p =
Z
0
∞
p
|f (t)| dt
1/p
.
(8.2)
Podobně je definována norma ||f ||∞ : L∞ → R+ jako
||f ||∞ = ess.sup |f (t)|,
(8.3)
tj. supremum na definičnı́ množině kromě množiny mı́ry nula. Norma ||f ||∞ je užitečná, jsou-li u
systému kladeny omezujı́cı́ podmı́nky na amplitudu signálů, 2-norma je zajı́mavá při omezenı́ na
energii systému.
Zavedenı́m normy pak tvořı́ pár (Lp , ||f ||p ) pro každé p ∈ [1, ∞] normovaný lineárnı́ prostor,
který představuje přirozenou definici množiny všech ohraničených signálů. Pro dalšı́ úvahy nenı́ třeba
podrobnějšı́ch znalostı́ z teorie mı́ry a měřitelnosti funkcı́ a můžeme pro zjednodušenı́ předpokládat, že
dále použı́vané funkce budou většinou po úsecı́ch spojité. Podrobnějšı́ znalosti Lebesgueových prostorů
jsou potřebné pro určovánı́ existence a jednoznačnosti řešenı́ a pro vedenı́ důkazů, které při omezeném
rozsahu textu stejně nemůžeme uvádět.
Praktické problémy stability vstup-výstup vyžadujı́ pracovat i s neohraničenými signály a proto
budeme definovat rozšı́řené Lp -prostory pro tzv. ”zkrácené” funkce fT . Pro zadanou funkci f : R+ →
R a pro každé T ∈ R+ je funkce fT : R+ → R definována vztahy
fT (t) =
(
f (t) 0 ≤ t ≤ T
0
t>T
(8.4)
Funkce fT představuje zkrácenı́ funkce f na interval [0, T ].
Rozšı́řený prostor Lpe obsahuje všechny měřitelné funkce f : R+ → R, pro které platı́ fT ∈ Lp pro
všechna konečná T . Každá zkrácená funkce fT odpovı́dajı́cı́ původnı́ funkci f patřı́ tedy do Lp , ačkoliv
sama funkce f může, ale nemusı́ patřit do Lp . Množina Lp je tedy podmnožinou Lpe . Množina Lp je
normovaný prostor, Lpe nikoliv.
Např. f (t) = t nepatřı́ do žádného prostoru Lp . Pro každé konečné T však funkce fT patřı́ do všech
prostorů Lp pro p ∈ [1, ∞]. Proto f (t) = t patřı́ do prostoru Lpe pro každé p ∈ [1, ∞].
Kauzalita. Označme f vstupnı́ signál systému, reprezentovaného nějakým zobrazenı́m A a Af jeho
výstup. Kauzálnı́ systém je takový systém, u něhož hodnota výstupu v čase t závisı́ pouze na hodnotách
vstupu až do času t.
Definice 8.1. Zobrazenı́ A se nazývá kauzálnı́, jestliže
(Af )T = (AfT )T
∀T ≥0
∀ f ∈ Lpe .
(8.5)
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
80
U kauzálnı́ho systému hodnoty výstupu (Af )(t) na intervalu [0, T ] závisejı́ pouze na hodnotách f (t) na
[0, T ]. Budou-li dvě vstupnı́ funkce stejné na intervalu [0, T ], budou odpovı́dajı́cı́ výstupy také stejné
na [0, T ].
Zobecněné funkce
Definice 8.2. Symbolem A označı́me množinu zobecněných funkcı́ (distribucı́) f (t), pro které je
f (t) = 0 pro t < 0 a
f (t) =
∞
X
fi δ(t − ti ) + fa (t)
pro t ≥ 0,
0 ≤ t0 < t1 < ...,
(8.6)
i=0
kde δ(t − ti ) označuje jednotkovou delta distribuci (Diracův impuls), a fa (t) je měřitelná funkce. Dále
platı́
∞
X
|fi | < ∞
Z
a
∞
0
i=0
|fa (t)|dt < ∞.
(8.7)
Norma ||f ||A distribuce v A je definována vztahem
||f ||A =
∞
X
|fi | +
Z
i=0
∞
0
|fa (t)|dt.
(8.8)
Množina A se tedy skládá z distribucı́, které jsou tvořeny součtem zpožděných impulsů, a měřitelné
funkce, která je absolutně integrovatelná. Množinu A lze považovat za Lebesgueův prostor L1 [0, ∞)
zvětšený o zpožděné impulsy.
Předpokládejme, že f ∈ A. Pokud Re s ≥ 0, konverguje integrál
F (s) =
Z
∞
f (t)e−st dt =
0
∞
X
fi e−sti + Fa (s).
(8.9)
i=0
Na všechny prvky množiny A lze pak použı́t Laplaceovu transformaci a jejı́ oblast konvergence je
uzavřená pravá komplexnı́ polorovina.
Definice 8.3. Symbolem  označı́me množinu všech funkcı́ F (s), které jsou Laplaceovou transformacı́
prvků množiny A.
Věta 8.1. Necht’ F (s) je racionálnı́ lomená funkce proměnné s. Pak F (s) ∈ Â právě tehdy, když
všechny póly F (s) majı́ záporné reálné části a F (s) je ryzı́, tj. stupeň polynomu v čitateli je menšı́
nebo rovný stupni polynomu ve jmenovateli přenosu.
8.2
Definice stability vstup-výstup
U Ljapunovovy teorie stability se obvykle předpokládá, že soustava diferenciálnı́ch rovnic systému
má jediné řešenı́ při dané počátečnı́ podmı́nce a že toto řešenı́ závisı́ spojitě na počátečnı́m stavu a
čase. Stabilita vstup-výstup takový předpoklad nevyžaduje. Lze pracovat např. i s nejednoznačnými
zobrazenı́mi, které k určitému vstupu x přiřazujı́ vı́ce hodnot y. Proto se stabilita vstup-výstup definuje
obvykle obecněji pomocı́ relacı́, i když v praktických problémech stačı́ velmi často definice pomocı́
operátorů. Jestliže je např. H operátor z množiny X do Y , pak pro každé x ∈ X existuje jediné y ∈ Y
takové, že y = Hx. Jestliže však H je relace nemusı́ tomu tak být. Např. binárnı́ relace R na nějaké
množině X je podmnožina z X × X. Pro určité x ∈ X může existovat jediné y ∈ X při platnosti
(x, y) ∈ R. V jiném přı́padě však pro x ∈ X nemusı́ existovat žádné takové y, že platı́ (x, y) ∈ R, nebo
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
81
může naopak existovat libovolně mnoho hodnot y ∈ X takových, že (x, y) ∈ R. Pojetı́ relace je tedy
obecnějšı́.
Definice 8.4. Předpokládejme, že relace R je binárnı́ relace na Lpe . Pak
a) R je Lp -stabilnı́, jestliže (x, y) ∈ R, x ∈ Lp ⇒ y ∈ Lp .
b) Relace R je Lp -stabilnı́ s konečným zesı́lenı́m, jestliže je Lp -stabilnı́ a existujı́ takové konstanty
γp < ∞, bp < ∞, že platı́
(x, y) ∈ R,
x ∈ Lp ⇒ ||y||p ≤ γp ||x||p + bp .
(8.10)
c) Relace R je Lp -stabilnı́ s konečným zesı́lenı́m a nulovým vychýlenı́m, jestliže je Lp -stabilnı́
a existuje taková konstanta γp < ∞, že platı́
(x, y) ∈ R,
x ∈ Lp ⇒ ||y||p ≤ γp ||x||p .
(8.11)
Poznámka. V dále uvedených větách o stabilitě vstup-výstup budeme mluvit zjednodušeně jen o Lp
stabilitě a pokud nebude uvedeno jinak, budeme mı́t na mysli typ Lp stability s konečným zesı́lenı́m
a nulovým vychýlenı́m.
Necht’ je např. x ≡ u vstup dynamického systému popsaného vztahem y = Gu, kde G je operátor
nebo relace. Splňuje-li vstupně-výstupnı́ pár (u, y) vztah y = Gu a je-li vstup ohraničen ve smyslu
nějaké Lp normy, je stejně ohraničen i výstup. Navı́c existuje ohraničený poměr výstupnı́ normy ke
vstupnı́ normě. To je běžné pojetı́ stability ve smyslu ohraničený vstup-ohraničený výstup, rozšı́řený
ovšem na obecnějšı́ normy vstupů a výstupů.
Poznámka. V jednoduššı́m pojetı́ stability vstup-výstup, kdy se nepracuje s Lebesgueovými prostory
a normami, můžeme definovat stabilitu ohraničený vstup-ohraničený výstup mnohem jednodušeji,
nemůžeme ale uvažovat speciálnı́ vstupnı́ funkce a některé složité typy dynamických systémů. V tomto
zjednodušeném pojetı́ se stabilita definuje obvykle takto:
Definice 8.5. Dynamický systém ẋ = f (t, x, u), y = g(t, x, u) je stabilnı́ ve smyslu ohraničený vstupohraničený výstup, jestliže každý ohraničený vstup dává ohraničený výstup bez ohledu na počátečnı́
stav. To znamená, že pro ||u(t)|| < M a t ≥ t0 existuje takové kladné N , které může záviset na x0 a
u, že
||g[t, x(t; t0 , x0 ), u(t)]|| < N
pro t ≥ t0 .
Stabilita vstup-výstup lineárnı́ho systému
Uvažujme lineárnı́ systém definovaný rovnicemi
ẋ = Ax + Bu
y = Cx + Du,
(8.12)
kde A, B, C, D jsou konstantnı́ matice, x ∈ Rn , y ∈ Rm , u ∈ Rr .
Věta 8.2. Předpokládejme, že systém (8.12) je řiditelný a pozorovatelný. Pak je L∞ -stabilnı́ právě
tehdy, když přı́slušný nebuzený systém ẋ = Ax je asymptoticky stabilnı́.
Každý lineárnı́ systém, který může být reprezentován racionálnı́ přenosovou funkcı́ G(s) je Lp stabilnı́ s konečným zesı́lenı́m právě tehdy, když všechny póly jeho přenosu majı́ záporné reálné části.
Pro praxi je výhodná 2-norma, která souvisı́ podle Parsevalova teorému
Z
0
∞
|g(t)|2 dt =
1
2π
Z
∞
−∞
|G(jω)|2 dω
s energiı́ signálu. Systém s jednı́m vstupem a jednı́m výstupem, který je L2 -stabilnı́ s konečným
zesı́lenı́m, má koeficient γ2 = supω |G(jω)|. Jestliže Nyquistova křivka stabilnı́ho přenosu ležı́ celá
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
82
uvnitř kružnice o poloměru γ2 se středem v počátku, pak zesı́lenı́ systému podle 2-normy je menšı́
nebo rovno γ2 .
8.3
Stabilita zpětnovazebnı́ch systémů
V předchozı́m článku jsme uvedli definice stability dynamického systému popsaného operátorem nebo
relacı́. Hlavnı́m objektem studia stability vstup-výstup jsou však propojené dynamické systémy, jako
je např. zpětnovazebnı́ systém podle obr. 8.1. Ten lze popsat rovnicemi
e1 = u1 − y2
e2 = u2 + y1
y1 = G1 e1
y2 = G2 e2 ,
(8.13)
kde G1 a G2 jsou relace nebo operátory zobrazujı́cı́ vhodný vstupnı́ prostor na výstupnı́ prostor.
Systém lze zapsat ve tvaru
"
e1
e2
#
=
"
u1
u2
#
−
"
0 I
−I 0
#"
y1
y2
#
"
y1
y2
#
=
"
G1 0
0 G2
#"
e1
e2
#
,
(8.14)
kde všechny veličiny ei , ui , yi mohou být skaláry (systémy s jednı́m vstupem a výstupem, SISO)
nebo vektory (systémy s vı́ce vstupy a výstupy, MIMO).
V literatuře byly studovány předevšı́m dva přı́stupy k problému stability zpětnovazebnı́ch systémů.
Je to stabilita při malém zesı́lenı́, kdy lze určit Lp -stabilitu pro všechny hodnoty p ∈ [1, ∞], a stabilita
založená na principu pasivity systémů, kdy lze určit L2 -stabilitu. Prvnı́ přı́stup vede na kruhové
kritérium, druhý na Popovovo kritérium.
Obr.8.1. Zpětnovazebnı́ systém
8.3.1
Stabilita při malém zesı́lenı́
Věta 8.3. Uvažujme zpětnovazebnı́ systém podle obr.8.1 a předpokládejme, že je specifikováno nějaké
p ∈ [1, ∞], že G1 i G2 jsou kauzálnı́ a Lp -stabilnı́ ve smyslu definice 8.4, a γ1p = γp (G1 ), γ2p = γp (G2 ).
Pak je systém dle obr. 8.1 Lp -stabilnı́, jestliže
γ1p γ2p < 1.
(8.15)
Vztah (8.15) se nazývá podmı́nka malého zesı́lenı́. (Důkaz věty lze nalézt v [55]).
Předpokládáme-li tedy podle obr. 8.1 dva individuálně Lp -stabilnı́ subsystémy, jejichž zesı́lenı́ jsou
nejvýše rovna γ1p a γ2p , pak uzavřený obvod je Lp -stabilnı́, jestliže součin zesı́lenı́ je menšı́ než jedna.
Uvedenou větu lze použı́t pro studium stability pro všechny hodnoty p ∈ [1, ∞].
Přı́klad 8.2. Uvažujme obvod dle obr. 8.1, kde v přı́mé větvi je lineárnı́ časově invariantnı́ systém
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
83
s jednı́m vstupem a jednı́m výstupem a s přenosem G(jω) ∈ Â. Zpětnovazebnı́ prvek je statická
jednoznačná časově variantnı́ nelinearita φ(t, x), která ležı́ v sektoru [−k, k]. Srovnánı́m s větou 8.3 je
G1 = G(jω), G2 = φ. Necht’ p = 2; pak G1 a G2 jsou kauzálnı́ a L2 -stabilnı́. Dále je
γ1 (G1 ) = sup |G(jω)|,
ω
γ2 (G2 ) ≤ k.
Uzavřený systém je L2 -stabilnı́, platı́-li
sup |G(jω)| k < 1
ω
Poznámka: Pomocı́ vhodné transformace lze značně rozšı́řit oblast použitı́ věty 8.3. Např. při transformaci, která je analogická transformaci pólů v odst. 7.1.3, zavedeme přı́davný Lp -stabilnı́ lineárnı́
operátor K, který přičteme ke G2 a současně odečteme. Blokovými manipulacemi pak dostaneme
systém podle obr. 8.2. Operátor K nynı́ působı́ jako zpětná vazba kolem G1 a paralelnı́ vazba ke G2 .
Prvnı́ vnějšı́ vstup se změnı́ z u1 na u1 − Ku2 . Pak platı́ věta:
Obr. 8.2. Transformace pólú
Věta 8.4. Uvažujme systém podle obr. 8.2 a předpokládejme, že je specifikováno p ∈ [1, ∞], G2 je
kauzálnı́ a Lp -stabilnı́. Pak celý uzavřený systém je Lp -stabilnı́, existuje-li takový Lp -stabilnı́ kauzálnı́
lineárnı́ operátor K, že platı́
a) G1 (I + KG1 )−1 je kauzálnı́ a Lp -stabilnı́
b) γp [G1 (I + KG1 )−1 ] . γp (G2 − K) < 1. (Důkaz je uveden např. v [55], s. 341).
Spojenı́m věty 8.4 s Nyquistovým kritériem stability zı́skáme kruhové kritérium známé z čl. 7.2,
které je ovšem nynı́ použitelné pro určenı́ stability vstup-výstup a pro obecnějšı́ typy lineárnı́ části
obvodu než byly uvažovány v čl. 7.2, např. pro distribuované systémy, systémy s dopravnı́m zpožděnı́m
apod.
Věta 8.5. (Kruhové kritérium). Uvažujme systém podle obr. 8.1, kde ve zpětné vazbě je jednoznačná, obecně časově variantnı́ nelinearita φ patřı́cı́ do sektoru [a, b] a v přı́mé větvi je lineárnı́
systém s přenosem G(s) = Ga (s) + Gr (s). Gr (s) je racionálnı́ a striktně ryzı́, Ga (s) ∈ Â a existuje
takové T > 0, že
ga (t) =
∞
X
gi δ(t − iT ) + gm (t)
gm ∈ L1
i=0
Ga (s) =
∞
X
i=0
gi e−sti + Gm (s)
ti = iT.
(8.16)
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
84
Za těchto předpokladů je zpětnovazebnı́ systém L2 -stabilnı́, je-li splněna některá z těchto podmı́nek:
1) ab > 0: Frekvenčnı́ charakteristika G(jω) = Ga (jω) + Gr (jω) musı́ ležet vně kruhu D(a, b); (G(jω)
je konformnı́ zobrazenı́ imaginárnı́ osy při pohybu ω od −∞ do ∞ s půlkruhovým oběhem všech čistě
imaginárnı́ch pólů).
Jestliže ρ je počet pólů G(s) s kladnou reálnou částı́, pak
lim {Arg[G(j2πn/T ) − z] − Arg[G(−j2πn/T ) − z]} = 2πρ,
n→∞
∀z ∈ D(a, b).
(8.17)
2) 0 = a < b: G(s) ∈ Â a inf ω∈R ReG(jω) + 1/b > 0.
3) a < 0 < b: G(s) ∈ Â a G(jω) ležı́ uvnitř kruhu D(a, b).
Důkaz věty je v [55], s.345. Věta dává postačujı́cı́ podmı́nky pro L2 -stabilitu.
Poznámka: Ve výrazu (8.16) předpokládáme, že impulsy gap (t) = ∞
i=0 gi δ(t − iT ) v distribučnı́ části
funkce ga (t) jsou zpožděné o stejný časový interval ti = iT, T > 0. Jejich transformace
P
Gap (jω) =
∞
X
gi e−jωT i
i=0
je periodickou funkcı́ s periodou 2π/T . Obsahuje-li G(jω) tyto impulsy, nemusı́ mı́t fázový úhel specifickou limitu, jestliže ω → ∞. Proto je třeba fázový úhel vyhodnocovat podle vztahu (8.17) při speciálně
vybraných frekvencı́ch 2πn/T = nω. (Podrobnosti viz [55]).
Jestliže ve vztahu (8.16) pro ga (t) nejsou zpožděné impulsy, což je nejčastějšı́ přı́pad v praktických
úlohách, pak podmı́nka (8.17) ve větě 8.5 se změnı́ na jednoduššı́ podmı́nku, která odpovı́dá podmı́nce
1) věty 7.4 o kruhovém kritériu. Frekvenčnı́ charakteristika G(jω) musı́ ležet vně kruhu D(a, b) a musı́
jej obklı́čit ρ krát proti směru hodinových ručiček při ω stoupajı́cı́m od −∞ do +∞.
8.3.2
Přı́stup pomocı́ pasivity
Tı́mto přı́stupem lze odvodit rozšı́řené Popovovo kritérium pro stabilitu vstup-výstup. Na rozdı́l od
stability při malém zesı́lenı́ (odst. 8.3.1), kdy lze určit Lp -stabilitu pro všechna p ∈ [1, ∞], umožňuje
přı́stup pomocı́ pasivity analyzovat převážně jen L2 -stabilitu (některé práce analyzujı́ tı́mto přı́stupem
také L∞ -stabilitu).
Jestliže všechny Lp -prostory jsou Banachovy prostory, je prostor L2 Hilbertův prostor se skalárnı́m
(vnitřnı́m) součinem dvou funkcı́ f, g ∈ L2
(f, g) =
Z
∞
f (t)g(t)dt.
(8.18)
0
Analogicky pro f, g ∈ L2e definujeme zkrácený skalárnı́ součin
(f, g)T =
Z
T
f (t)g(t)dt.
(8.19)
0
Věta 8.6. Uvažujme systém podle obr. 8.1. Předpokládejme, že existujı́ takové konstanty εi , δi , i =
1, 2, že
(x, Gi x) ≥ εi ||x||2T 2 + δi ||Gi x||2T 2 ,
∀T ≥ 0, ∀x ∈ L2e , i = 1, 2.
(8.20)
Systém je L2 -stabilnı́, jestliže
δ1 + ε2 > 0,
δ2 + ε1 > 0.
(8.21)
Důkaz v [55], s.350.
V kap. 6 jsme definovali různé pojmy týkajı́cı́ se pasivity a disipativity systémů. Rozšı́řı́me nynı́
tyto pojmy na Lebesgueovy prostory.
KAPITOLA 8. STABILITA VSTUP-VÝSTUP
85
Definice 8.6. Operátor G : L2e → L2e je pasivnı́, jestliže
(x, Gx)T ≥ 0
∀ T ≥ 0,
∀ x ∈ L2e
(8.22)
a striktně pasivnı́, existuje-li taková konstanta ε > 0, že
(x, Gx)T ≥ ε ||x||2T 2 ,
∀ T ≥ 0,
∀ x ∈ L2e .
(8.23)
Věta 8.7. Systém podle obr. 8.1 je L2 -stabilnı́, jestliže G1 i G2 jsou striktně pasivnı́.
Důkaz: V tomto přı́padě je podle (8.20) δ1 = δ2 = 0. Protože ε1 > 0, ε2 > 0, platı́ (8.21).
Věta 8.8. Systém podle obr. 8.1 je L2 -stabilnı́, jestliže je bud’ G1 striktně pasivnı́ s konečným zesı́lenı́m
a G2 je pasivnı́, nebo G2 je striktně pasivnı́ s konečným zesı́lenı́m a G1 je pasivnı́. (Důkaz v [55]).
Dalšı́m rozvojem těchto úvah lze zı́skat rozšı́řenou verzi Popovova kritéria (čl. 7.1) platnou pro
stabilitu vstup-výstup. Protože Popovovo kritérium se pro SISO systémy snadno ověřuje graficky i pro
vysoký řád lineárnı́ části systému, představuje velmi užitečný nástroj pro praktické určenı́ stability
vstup-výstup.
Věta 8.9 (Popovovo kritérium). Uvažujme systém podle obr. 8.1, kde v přı́mé větvi je lineárnı́ člen,
pro který platı́: g(t) má distribučnı́ derivaci a g(t), ġ(t) ∈ A. Ve zpětné vazbě obvodu je jednoznačná
časově invariantnı́ spojitá nelinearita φ : R → R, která patřı́ do sektoru [0, b], kde b může být nekonečně
velké.
Předpokládejme, že existuje taková konstanta q ≥ 0, že
inf Re[(1 + jωq)G(jω)] +
ω∈R
1
> 0.
b
(8.24)
Pak funkce e1 , e2 , y1 , y2 patřı́ do L2 , jestliže u1 , u2 , u̇2 patřı́ do L2 .
Důkaz kritéria a podrobný rozbor lze nalézt v [55].
V této kapitole byly vzhledem k omezenému rozsahu skripta uvedeny jen základnı́ problémy stability vstup-výstup a některá jednoduchá kritéria vhodná k praktickému ověřovánı́ stability. Podrobný
rozbor těchto problémů je uveden zejména v [53] a [55]. Rozšı́řenı́ na diskrétnı́ systémy lze nalézt v
[55], použitı́ pro mnoharozměrové a složité systémy je souhrnně podáno v [47] a [53]. Využitı́ principů
pasivity a disipativity lze nalézt v pracı́ch [47,55].
Kapitola 9
Nelineárnı́ diskrétnı́ systémy
V předchozı́ch kapitolách jsme popisovali základnı́ vlastnosti nelineárnı́ch spojitých systémů a zabývali
jsme se předevšı́m rovnovážnými stavy a jejich stabilitou. V této kapitole rozšı́řı́me dosavadnı́ úvahy
na diskrétnı́ systémy, které jsou v regulačnı́ technice velmi důležité vzhledem k využitı́ čı́slicových
počı́tačů pro řı́zenı́.
Diskrétnı́ systémy (systémy s diskrétnı́m časem), jsou popsány diferenčnı́mi rovnicemi, obecně
nelineárnı́ soustavou rovnic prvnı́ho řádu
x(k + 1) = f [k, x(k), u(k)]
(9.1)
y(k) = g[k, x(k), u(k)],
(9.2)
kde x(k) je stavový vektor, u(k) vstupnı́ vektor, k = 0, 1, 2, ... (k ∈ N0 ), x ∈ Rn a f : Rn → Rn
(častěji f : M ⊂ Rn → Rn ) je C 1 nelineárnı́ funkce.
Poznámka: V dalšı́ch úvahách budeme použı́vat označenı́ N pro množinu všech kladných celých čı́sel, N0 pro
množinu všech nezáporných celých čı́sel a Z pro množinu všech celých čı́sel.
Diskrétnı́ systém (9.1) vzniká různým způsobem, např.
a) modelovánı́m fyzikálnı́ch diskrétnı́ch systémů, např. impulsnı́ch a logických obvodů, modelovánı́m
biologických systémů (např. sledovánı́m počtu individuı́ xk určité populace v k-té generaci) apod.
b) vzorkovánı́m spojitých systémů ve vhodných časových okamžicı́ch tk , např. při řı́zenı́ pomocı́
čı́slicových počı́tačů;
c) u ekonomických modelů popisem stavu systému v diskrétnı́ch časových intervalech (dnech, měsı́cı́ch,
rocı́ch);
d) sledovánı́m následných průchodů x0 , x1 , x2 , ... trajektorie periodického průběhu množinou o nižšı́
dimenzi (tzv. Poincaréovo zobrazenı́ - viz kap.10);
e) při použitı́ diskrétnı́ch algoritmů u numerických metod apod.
V dalšı́ch úvahách zavedeme pro jednoduchost zápisu mı́sto x(k), y(k), u(k) označenı́ xk , y k , uk .
Nebudeme použı́vat výstupnı́ rovnici (9.2) a omezı́me se většinou na autonomnı́, tj. volné a časově
invariantnı́ systémy
xk+1 = f (xk ),
k ∈ N0
x(0) = x0 .
(9.3)
Rekurzivnı́ vztah nám na rozdı́l od systémů se spojitým časem umožňuje u diskrétnı́ho systému hledat
řešenı́ postupným aplikovánı́m funkce f . Zı́skáme tak diskrétnı́ množinu {xk }∞
0
x0 , x1 = f (x0 ), x2 = f (x1 ) = f (f (x0 )) = f 2 (x0 ), ...
s počátečnı́m stavem x0 . Trajektorie je tedy diskrétnı́ množina bodů ve fázovém prostoru Rn .
Analogie toku Φt diferenciálnı́ch rovnic je dána složeným zobrazenı́m f k , kde
f k = f ◦ f ◦ f ... ◦ f
86
(k - krát)
KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY
87
je k-tá iterace zobrazenı́ f a platı́ f k = f ◦ f k−1 , f 0 = 1.
Jestliže f je regulárnı́ zobrazenı́ třı́dy C r a existuje regulárnı́ inverznı́ zobrazenı́ f −1 rovněž třı́dy
C r , pak f je C r -difeomorfismus. V matematických modelech reálných systémů však často f nemá
inverzi (endomorfismus) a trajektorie je definována jen v kladném směru času. Řı́káme také, že dynamický systém je polodeterminován. Později uvidı́me, že neinvertovatelnost zobrazenı́ f je např. u
jednorozměrného systému nutným předpokladem pro existenci chaotického chovánı́. V dalšı́ch úvahách
této kapitoly budeme předpokládat, že zobrazenı́ f je difeomorfismus.
Definice 9.1. Necht’ f : Rn → Rn a x0 ∈ Rn . Množina Of (x0 ) = {f k (x0 ), k ∈ Z} se nazývá orbita
(trajektorie) difeomorfismu f , procházejı́cı́ bodem x0 . Množina
Of+ (x0 ) = {f k (x0 ), k ∈ N }
Of− (x0 ) = {f −k (x0 ), k ∈ N }
resp.
se nazývá kladná, resp. záporná orbita difeomorfismu f , procházejı́cı́ bodem x0 .
Definice 9.2. Bod x ∈ Rn , pro který platı́ f (x) = x, se nazývá rovnovážný stav diskrétnı́ho
systému (9.3) nebo pevný bod zobrazenı́ f .
p
Definice 9.3. Množina bodů {xk }p−1
k=0 se nazývá periodická orbita periody p, platı́-li f (x0 ) = x0
k
a f (x0 ) 6= x0 pro k = 1, 2, ..., p − 1.
Všechny body periodické orbity γ s periodou p jsou pevnými body složeného zobrazenı́ (difeomorfismu) f p , tj. f p (x) = x pro všechna x ∈ γ. Každý pevný bod f je periodickým bodem s periodou
jedna.
9.1
Definice stability autonomnı́ho diskrétnı́ho systému
Protože všechny dalšı́ úvahy jsou analogické jako u systémů se spojitým časem, uvedeme jen základnı́
definice stability pro autonomnı́ systémy (9.3). Všechny ostatnı́ definice z kap.3 lze snadno transformovat pro diskrétnı́ systém, nahradı́me-li časy t a t0 symboly k a k0 .
Definice 9.4.. Rovnovážný stav x systému (9.3) je (ljapunovsky) stabilnı́, jestliže pro každé
ε > 0 existuje δ = δ(ε) takové, že
||x0 − x|| < δ(ε) ⇒ ||xk − x|| < ε
∀k ∈ N.
Stav x je asymptoticky stabilnı́, je-li ljapunovsky stabilnı́ a existuje takové okolı́ U , že pro všechna
x0 ∈ U je
lim ||xk − x|| = 0.
k→∞
Definice 9.5. Periodická orbita γ periody p je stabilnı́ (resp. asymptoticky stabilnı́), když bod
x ∈ γ je stabilnı́m (resp. asymptoticky stabilnı́m) pevným bodem zobrazenı́ f p .
9.2
Vyšetřenı́ stability pevných bodů metodou linearizace
Věta 9.1. Necht’ x je pevný bod iteračnı́ho zobrazenı́ xk+1 = f (xk ), f : M ⊂ Rn → Rn je alespoň
třı́dy C 1 a λ1 , ..., λn jsou vlastnı́ čı́sla Jacobiovy matice linearizace kolem pevného bodu
∂f
A = Df (x) =
∂x x=x
Pak platı́:
KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY
88
a) jestliže |λi | < 1 ∀i = 1, ..., n, je x lokálně asymptoticky stabilnı́;
b) jestliže |λi | > 1 alespoň pro jedno i ∈ {1, ..., n} , je x nestabilnı́;
c) jestliže |λi | = 1, nelze stabilitu pomocı́ linearizace určit.
Podmı́nky věty vyplývajı́ z podmı́nek stability lineárnı́ch diskrétnı́ch systémů, které byly odvozeny
v teorii lineárnı́ch řı́dı́cı́ch systémů.
Definice 9.6. Pevný bod x je hyperbolický, nemá-li matice linearizace vlastnı́ čı́sla |λi | = 1. Difeomorfismus je v okolı́ svého hyperbolického pevného bodu strukturálně stabilnı́.
Poznámka: Stabilitu periodické orbity γ vyšetřı́me, určı́me-li stabilitu pevného bodu difeomorfismu
f p . O stabilitě orbity γ rozhodujı́ tedy vlastnı́ čı́sla matice A = {∂fip /∂xj } pro libovolný bod orbity.
Přı́klad 9.1. Nelineárnı́ systém 1. řádu. U jednodimenzionálnı́ho systému
xk+1 = f (xk )
f :R→R
(často f : M ⊂ R → R)
je možno trajektorii snadno zkonstruovat graficky. Do souřadnic (x, f (x)) zakreslı́me danou funkci f (x) a přı́mku
y = x (obr 9.1). K počátečnı́mu stavu x0 je grafem dána hodnota x1 , vodorovná přı́mka odtud vedená protne
přı́mku y = x v bodě, který má prvnı́ souřadnici rovněž x1 , na svislici určı́me x2 atd.
Pevné body x = f (x) jsou dány průsečı́ky přı́mky y = x s grafem funkce f . V našem přı́padě podle obr. 9.1
jsou dva pevné body x(1) = 0 a x(2) = a. Stabilitu udává u 1. řádu přı́mo derivace funkce f v pevném bodě. Pro
x(1) = 0 je |f 0 (0)| > 1 a pevný bod je nestabilnı́. Pro x(2) = a může být |f 0 (a)| < 1 (pevný bod je stabilnı́) nebo
|f 0 (a)| > 1 a pak je pevný bod nestabilnı́. Je-li přitom f 0 (x) > 0 je průběh řešenı́ monotonnı́, pro f 0 (x) < 0 je
oscilačnı́ (dokažte !).
Dalšı́ přı́klady diskrétnı́ch systémů 1. řádu budou uvedeny v kapitole o chaosu (kap. 12).
Obr.9.1. Nelineárnı́ funkce jedné proměnné.
Přı́klad 9.2. Lineárnı́ diskrétnı́ systém 2. řádu. Diskrétnı́ lineárnı́ systém
xk+1 = xk + yk (mod 1)
yk+1 = xk + 2yk (mod 1)
je definován na polootevřeném jednotkovém čtverci M = [0, 1)2 . (Abychom nemuseli použı́vat dvojı́
indexovánı́, zavedli jsme pro proměnné označenı́ x, y). Pevný bod (x, y) = (0, 0). Charakteristická
rovnice λ2 − 3λ + 1 = 0 má kořeny λ1 = 2, 62 > 1 a λ2 = 0, 38 < 1. Pevný bod je nestabilnı́ sedlo.
Podobně jako u systémů se spojitým časem můžeme i u diskrétnı́ch systémů definovat invariantnı́
podprostory pro lineárnı́ systémy a invariantnı́ lokálnı́ a globálnı́ variety pro nelineárnı́ systémy. U
lineárnı́ch diskrétnı́ch systémů je stabilnı́ podprostor E s (resp. nestabilnı́ podprostor E u , resp. centrálnı́
podprostor E c ) vytvořen vlastnı́mi vektory odpovı́dajı́cı́mi vlastnı́m čı́slům, jejichž modul je menšı́ než
1 (resp. většı́ než 1, resp. roven 1). Pro nelineárnı́ diskrétnı́ systémy platı́ podobná věta jako věta (4.13)
pro systémy se spojitým časem.
KAPITOLA 9. NELINEÁRNÍ DISKRÉTNÍ SYSTÉMY
89
Věta 9.2. Necht’ f : Rn → Rn je C 1 -difeomorfismus s hyperbolickým pevným bodem x. Pak
s (x) a lokálnı́ nestabilnı́ varieta W u (x), které se dotýkajı́ v bodě x
existujı́ lokálnı́ stabilnı́ varieta Wloc
loc
s
lineárnı́ch podprostorů E (x) a E u (x) matice linearizace Df a majı́ odpovı́dajı́cı́ dimenze a stejnou
hladkost jako zobrazenı́ f .
Podobně jako u spojitých systémů jsou definovány i u diskrétnı́ch systémů globálnı́ stabilnı́
a nestabilnı́ variety, které jsou vytvořeny sjednocenı́m lokálnı́ch variet. Na rozdı́l od dynamických
systémů se spojitým časem, u nichž globálnı́ W s a W u jsou vytvořeny sjednocenı́m hladkých křivek,
jsou u diskrétnı́ch systémů W s a W u dány sjednocenı́m různých diskrétnı́ch posloupnostı́ bodů xk ,
jejichž globálnı́ průnik může být velmi složitý.
U nehyperbolických pevných bodů vzniká také centrálnı́ varieta W c , které lze využı́t (obdobně
jako u systémů se spojitým časem) pro určenı́ stability x, má-li matice A vlastnı́ čı́sla na jednotkové
kružnici.
9.3
Vyšetřenı́ stability pomocı́ přı́mé Ljapunovovy metody
Ljapunovovy věty o stabilitě a nestabilitě z kap.5 lze upravit také pro diskrétnı́ systémy. Derivaci
Ljapunovovy funkce podél řešenı́ systému (9.3) nahradı́me diferencı́
∆V (xk ) = V (xk+1 ) − V (xk ) = V (f (xk )) − V (xk )
(9.4)
Věta 9.3. Předpokládejme, že diskrétnı́ systém (9.3) má rovnovážný stav v bodě 0. Tento stav je
asymptoticky stabilnı́, jestliže existuje pozitivně definitnı́ skalárnı́ funkce V (xk ) a jejı́ diference (9.4)
podél řešenı́ systému je negativně definitnı́.
Jestliže V (xk ) → ∞ pro ||xk || → ∞, je rovnovážný stav globálně asymptoticky stabilnı́.
Přı́klad 9.3. Pro diskrétnı́ systém (x1 ≡ x, x2 ≡ y)
xk+1 = yk2
yk+1 = x2k
zvolı́me V = x2k + yk2 . Diference
∆V = V (xk+1 , yk+1 ) − V (xk , yk ) = yk4 + x4k − x2k − yk2 = x2k (x2k − 1) + yk2 (yk2 − 1)
je negativně definitnı́ pro x2k < 1, yk2 < 1. Rovnovážný stav je tedy stabilnı́ ve čtvercové oblasti |xk | < 1,
|yk | < 1.
Kapitola 10
Periodická řešenı́ a jejich stabilita
V této kapitole se budeme podrobněji zabývat periodickými řešenı́mi nelineárnı́ch systémů se spojitým
časem. Se základnı́mi pojmy a problémy jsme se seznámili již v čl. 2.3.
Při vyšetřovánı́ periodických řešenı́ je třeba určit existenci periodických řešenı́, jejich počet, stabilitu periodických řešenı́ při malých poruchách (chovánı́ trajektoriı́ soustavy v okolı́ periodické orbity), konkrétnı́ průběhy periodických řešenı́ (tvary limitnı́ch cyklů) a bifurkačnı́ změny v závislosti
na parametrech systému.
Metody studia periodických řešenı́ jsou náročnějšı́ než metody pro určovánı́ rovnovážných stavů
a jejich stability. Bylo publikováno mnoho metod, žádná z nich však nenı́ univerzálnı́. Můžeme je
zhruba rozdělit do těchto skupin:
a) Analytické metody je možno použı́t jen u jednoduššı́ch systémů, nejčastěji u 2. řádu. Jednoduché
přı́klady si ukážeme v čl. 10.1. Odhady periodických řešenı́ pro systémy 2. řádu budou uvedeny v čl.
10.2.
b) Poincaréovo zobrazenı́ se použı́vá k popisu vlastnostı́ periodické orbity a chovánı́ trajektoriı́ v
jejı́m blı́zkém okolı́. Metoda je výhodná pro studium bifurkacı́ periodických řešenı́ a bude uvedena v
čl. 10.3.
c) Přibližné analytické metody poskytujı́ odhady periodických řešenı́, jejich počtu a jejich stability
i u značně složitých systémů. V regulačnı́ praxi se často použı́vá metoda ekvivalentnı́ch přenosů,
se kterou se seznámı́me v kap. 13. Je výhodná zejména pro systémy s malým počtem nelinearit a s
lineárnı́ částı́ vyššı́ho řádu.
d) Numerické metody a simulace jsou vhodné u složitých nelineárnı́ch systémů pro určenı́
konkrétnı́ho průběhu stabilnı́ch periodických řešenı́ a pro odhad jejich period. Nestabilnı́ periodická
řešenı́ se zı́skávajı́ obtı́žněji, s výjimkou speciálnı́ch přı́padů, kdy je možno integrovat rovnice systému
v záporném směru času. Nalezenı́ periodických řešenı́ lze převést na nelineárnı́ okrajovou úlohu se
smı́šenými okrajovými podmı́nkami. Pro řešenı́ takové úlohy se použı́vajı́ nejčastěji dva přı́stupy, a to
diferenčnı́ metody a metoda střelby. Podrobnosti lze nalézt v publikacı́ch o numerických metodách.
10.1
Analytické metody studia periodických řešenı́
Analytické řešenı́ lze provést jen u speciálnı́ch přı́padů systémů nižšı́ho řádu pro n ≥ 2. U systémů
prvnı́ho řádu nemohou periodická řešenı́ vzniknout. Pro řešenı́ je často výhodné převést zadaný systém
z kartézských do polárnı́ch souřadnic.
Přı́klad 10.1. Nelineárnı́ systém
ẋ = x − y − x(x2 + y 2 )
ẏ = x + y − y(x2 + y 2 )
90
KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA
91
má rovnovážný stav v bodě (0, 0). Vlastnı́ čı́sla Jacobiovy matice v bodě (0, 0) jsou 1 ± j, rovnovážný stav je
nestabilnı́ ohnisko. Trajektorie se tedy v blı́zkém okolı́ počátku rozvinuje a mohl by existovat limitnı́ cyklus.
Převed’me daný systém do polárnı́ch souřadnic
p
y
r = x2 + y 2
ϕ = arctg
x = r cos ϕ
y = r sin ϕ.
x
Pro derivace původnı́ch souřadnic pak platı́
ẋ = ṙ cos ϕ − r sin ϕ.ϕ̇
ẏ = ṙ sin ϕ + r cos ϕ.ϕ̇
Dosadı́me-li tyto vztahy do zadaných rovnic, dostaneme systém v polárnı́ch souřadnicı́ch
ṙ = r(1 − r2 )
ϕ̇ = 1.
Pevné body jsou:
a) r = 0, který představuje nestabilnı́ rovnovážný stav (f 0 = df /dr = 1 − 3r2 ; pro r = 0 je f 0 = 1)
b) r = 1 představuje stabilnı́ limitnı́ cyklus (asymptoticky stabilnı́ pevný bod radiálnı́ho pohybu). Pro
je f 0 = −2.
c) r = −1. Tato hodnota nemá fyzikálnı́ smysl.
r=1
Přı́klad 10.2. Nelineárnı́ systém
ẋ = −y − x[(x2 + y 2 )2 − 3(x2 + y 2 ) + 2]
ẏ = x − y[(x2 + y 2 )2 − 3(x2 + y 2 ) + 2]
má po převodu do polárnı́ch souřadnic tvar
ṙ = −r(r2 − 1)(r2 − 2)
ϕ̇ = 1.
Existujı́ tři pevné body, které majı́ fyzikálnı́ smysl. Jsou to:
a) r = 0, f 0 = −2: asymptoticky stabilnı́ rovnovážný stav (0,0)
b) r = +1, f 0 = 2: nestabilnı́ limitnı́ cyklus
√
c) r = + 2, f 0 = −4: stabilnı́ limitnı́ cyklus x2 + y 2 = 2.
10.2
Odhady periodických řešenı́ u systémů druhého řádu
Pro autonomnı́ systémy 2. řádu
ẋ1 = f1 (x1 , x2 )
ẋ2 = f2 (x1 , x2 )
(10.1)
existujı́ některá jednoduchá kritéria, pomocı́ nichž lze odhadnout existenci nebo neexistenci periodických řešenı́.
Index pevných bodů toku (Poincaréův index).
Uvažujme u planárnı́ho toku ve fázové rovině jednoduchou uzavřenou křivku C, která neprocházı́
žádným pevným bodem a zvolme na nı́ libovolný bod P . Proložme tı́mto bodem vektor, jehož směr
souhlası́ se směrem vektoru fázové rychlosti (f1 , f2 ). Bude-li se nynı́ bod P pohybovat po C proti
směru hodinových ručiček, vektor (f1 , f2 ) spojitě rotuje a po jednom oběhu bodu P po křivce C bude
přı́růstek úhlu 2πk (měřeno rovněž proti směru hodinových ručiček). Celé čı́slo k se nazývá index
uzavřené křivky C a je nezávislé na tvaru křivky. Závisı́ pouze na charakteru pevných bodů uvnitř
křivky C.
Zvolı́me-li uzavřenou křivku C tak, aby obkličovala jediný izolovaný pevný bod x, pak se k nazývá
indexem pevného bodu toku. Pro indexy pevného bodu a uzavřené křivky platı́ následujı́cı́ vztahy:
KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA
92
a) Index uzlu, ohniska nebo středu je +1.
b) Index hyperbolického sedla je 1.
c) Index uzavřené orbity je +1.
d) Index uzavřené křivky, která nemá uvnitř žádný pevný bod, je 0.
e) Index uzavřené křivky, která má uvnitř vı́ce pevných bodů, je roven součtu indexů těchto bodů.
Tato tvrzenı́ lze snadno ověřit na fázových portrétech dvourozměrných systémů.
Poznámka: Existujı́ také degenerované pevné body, které majı́ indexy odlišné od hodnot ±1.
Jako důsledek uvedených hodnot indexů pevných bodů toku a uzavřených křivek platı́
Věta 10.1. Uvnitř uzavřené periodické trajektorie γ musı́ být nejméně jeden pevný bod. Je-li jen
jeden, musı́ to být zdroj (nestabilnı́ uzel nebo ohnisko) nebo propad (stabilnı́ uzel nebo ohnisko).
Jsou-li všechny pevné body uvnitř uzavřené trajektorie γ hyperbolické, musı́ jich být lichý počet
2n + 1; z nich n jsou sedla, n + 1 zdroje nebo propady.
Obrázek 10.1: Prstencová oblast
Věta 10.2. Prstencová oblast Ω bez pevných bodů, u nı́ž z obou okrajů směřuje vektorové pole
dovnitř Ω, obsahuje alespoň jeden stabilnı́ limitnı́ cyklus (obr.10.1).
Věta 10.3. Bendixsonovo kritérium neexistence limitnı́ch cyklů.
V systému ẋ1 = f1 (x1 , x2 ), ẋ2 = f2 (x1 , x2 ) (f1 , f2 jsou alespoň třı́dy C 1 ) nemůže existovat limitnı́
cyklus v jednoduše souvislé oblasti Ω fázové roviny, neměnı́-li tam výraz
I=
∂f1
∂f2
+
∂x1 ∂x2
(10.2)
znaménko nebo nenı́-li identicky rovný nule.
Důkaz: Pro libovolnou trajektorii systému platı́
f2 (x1 , x2 )
dx2
=
dx1
f1 (x1 , x2
(10.3)
neboli f1 dx2 − f2 dx1 = 0. Předpokládejme, že limitnı́ cyklus existuje a uvažujme křivkový integrál po
této trajektorii
I
(f1 dx2 − f2 dx1 ) = 0.
(10.4)
Podle Stokesovy věty vektorové analýzy lze tento integrál počı́tat jako integrál z plochy uzavřené
limitnı́m cyklem
I
Z Z
∂f1
∂f2
(f1 dx2 − f2 dx1 ) =
(
+
)dx1 dx2 = 0.
(10.5)
∂x1 ∂x2
KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA
93
Má-li být křivkový integrál rovný nule, musı́ integrand
I=
∂f1
∂f2
+
∂x1 ∂x2
být bud’ rovný nule nebo měnit v oblasti uzavřené limitnı́m cyklem znaménko. Nenı́-li tato podmı́nka
splněna, nemůže existovat limitnı́ cyklus.
Přı́klad 10.3. Pro nelineárnı́ systém z přı́kladu 4.3 je I = −a. Tento výraz neměnı́ znaménko a nenı́ roven nule
nikde ve fázové rovině, proto nemůže existovat žádný limitnı́ cyklus.
Přı́klad 10.4. Nelineárnı́ systém je popsán rovnicemi
ẋ2 = −x1 + 2bx2 (1 −
ẋ1 = x2
x22
)
3a
0 < b < 1.
Tento systém má jeden rovnovážný stav, nestabilnı́ ohnisko pro x1 = x2 = 0. Výraz
I=
∂f1
∂f2
x2
+
= 2b(1 − 2 ).
∂x1
∂x2
a
Pro a < 0 nenı́
0a
√ nikdy I nulové ani neměnı́ znaménko, nemůže tedy existovat žádný limitnı́ cyklus. Pro a >√
pro |x2 | < a nemůže existovat limitnı́ cyklus, který je zcela obsažen v oblasti omezené hodnotou |x2 | < a.
Může však existovat limitnı́ cyklus většı́.
Bendixsonovo kritérium zobecnil Dulac.
Věta 10.4. Dulacovo kritérium. Necht’ φ(x1 , x2 ) je spojitá funkce se spojitými derivacemi v
jednoduše souvislé oblasti Ω fázové roviny. Pak v Ω nemůže existovat limitnı́ cyklus, neměnı́-li tam
výraz
∂
∂
(φf1 ) +
(φf2 )
(10.6)
∂x1
∂x2
znaménko nebo nenı́-li identicky rovný nule.
Důkaz kritéria lze provést podobně jako u kritéria Bendixsonova.
Přı́klad 10.5. Nelineárnı́ systém
ẋ = x(y − 1)
ẏ = x + y − 2y 2
může mı́t podle Bendixsonova kritéria limitnı́ cyklus, protože výraz I = −3y měnı́ znaménko. Použijeme-li
Dulacova kritéria s funkcı́ φ(x, y) = x3 , pak
∂
∂
(φf1 ) +
(φf2 ) = −3x3 .
∂x1
∂x2
Pro x = 0 jsou rovnice systému ẋ = 0 a ẏ = y − 2y 2 . Osa y je tedy trajektorie a žádná jiná trajektorie ji nemůže
křižovat. Výraz −3x3 nemůže tedy měnit znaménko a proto neexistujı́ v celé fázové rovině uzavřené trajektorie.
10.3
Poincaréovo zobrazenı́
K popisu vlastnostı́ periodické orbity a chovánı́ trajektoriı́ v jejı́m blı́zkém okolı́ se s výhodou využı́vá
tzv. Poincaréova zobrazenı́. Jak dále uvidı́me, je Poincaréovo zobrazenı́ výhodné pro studium stability
i bifurkacı́ periodických řešenı́.
Uvažujme autonomnı́ systém
ẋ = f (x),
x ∈ Rn ,
n ≥ 2.
(10.7)
Předpokládejme, že existuje limitnı́ cyklus γ a zvolme na něm libovolný bod x. Tı́mto bodem proložme
lokálnı́ hyperplochu S dimenze n − 1, která protı́ná orbitu γ. Tato plocha nemusı́ být hyperrovina,
KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA
94
ale musı́ být vybrána tak, aby tok vektorového pole ji všude protı́nal transverzálně, tj. aby skalárnı́
součin f (x).n(x) 6= 0 pro všechna x ∈ S, kde n(x) je jednotkový vektor normály plochy S v bodě x.
Označme U ⊆ S takové okolı́ bodu x, ve kterém periodická orbita má jen jeden průsečı́k x.
Zkoumejme nynı́ chovánı́ trajektorie, která vycházı́ z nějakého bodu x0 ∈ U dostatečně blı́zkého k
bodu x (obr. 10.2). Označme x1 = P (x0 ) prvnı́ průsečı́k trajektorie s řezem S, který následuje po x0 .
Tı́m definujeme zobrazenı́ P (x), které se nazývá Poincaréovo zobrazenı́ přı́slušné k periodické orbitě
γ. Toto zobrazenı́ je difeomorfismus a lze ho chápat jako diskrétnı́ dynamický systém xk+1 = P (xk )
definovaný na řezu S.
Zobrazenı́ P plně určuje kvalitativnı́ chovánı́ toku soustavy ẋ = f (x) v okolı́ periodické orbity
γ. Pevnému bodu x zobrazenı́ P odpovı́dá uzavřená trajektorie γ, periodickým bodům zobrazenı́
P s periodou p odpovı́dajı́ trajektorie, které se uzavřou po p obězı́ch. Stabilita pevného bodu x
difeomorfismu P odpovı́dá stabilitě orbity γ pro vektorové pole f (x). Tuto stabilitu vyšetřı́me pomocı́
linearizace Poincaréova zobrazenı́ kolem bodu x.
Obrázek 10.2: Poincaréovo zobrazenı́
Pomocı́ stabilnı́, nestabilnı́ a centrálnı́ variety pevného bodu zobrazenı́ P lze definovat stabilnı́,
nestabilnı́ a centrálnı́ varietu uzavřené trajektorie toku. Je-li např. x hyperbolický pevný bod a má-li
DP (x) (tj. matice linearizace Poincaréova zobrazenı́ v bodě x) ns vlastnı́ch čı́sel s modulem menšı́m
než jedna a nu vlastnı́ch čı́sel s modulem většı́m než jedna (ns +nu = n−1), pak dim W s (x) = ns a dim
W u (x) = nu pro difeomorfismus P . Stabilnı́ varieta W s (γ) periodické orbity γ je pak množina bodů
všech trajektoriı́, které procházejı́ body stabilnı́ variety W s (x) difeomorfismu P . Obdobně to platı́
pro nestabilnı́ varietu W u (γ). Dimenze variet toku jsou o jednotku vyššı́ než dimenze odpovı́dajı́cı́ch
variet difeomorfismu P .
Pomocı́ Poincaréova zobrazenı́ lze formulovat kritérium orbitálnı́ stability uzavřené trajektorie γ.
Věta 10.5. Necht’ γ je uzavřená trajektorie soustavy ẋ = f (x) a P jejı́ Poincaréovo zobrazenı́. Označme λ1 , λ2 , ..., λn−1 vlastnı́ čı́sla matice DP (x), kde x je pevný bod difeomorfismu
P , odpovı́dajı́cı́ trajektorii γ.
Je-li |λi | < 1 pro i = 1, 2, ..., n − 1, pak γ je orbitálně stabilnı́.
Je-li |λk | > 1 alespoň pro jedno k ∈ {1, 2, ..., n − 1} je γ orbitálně nestabilnı́.
Vlastnı́ čı́sla λi matice DP (x) se nazývajı́ multiplikátory trajektorie γ.
Hlavnı́m přı́nosem Poincaréova zobrazenı́ je jeho geometrická názornost a převedenı́ problému
chovánı́ dynamického systému ẋ = f (x) v Rn na studium chovánı́ diskrétnı́ho systému P v prostoru
Rn−1 . Celý problém se tedy zredukuje o jednu dimenzi, vzhledem k celému fázovému prostoru je však
Poincaréovo zobrazenı́ lokálnı́.
Výpočet Poincaréova zobrazenı́ vyžaduje znalost obecného řešenı́ diferenciálnı́ rovnice ẋ = f (x)
KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA
95
a to lze najı́t jen v nejjednoduššı́ch přı́padech. Mnohdy se však P dá určit alespoň kvalitativně
přibližnými metodami, složitějšı́ systémy se řešı́ numericky.
Při numerickém řešenı́ se řez volı́ jako hyperplocha (obvykle hyperrovina) určená rovnicı́
S(x1 , ..., xn ) = 0. Systém se numericky integruje a v každém kroku integrace se vyhodnocuje znaménko
funkce S. Při změně znaménka se zı́ská bod průsečı́ku trajektorie s plochou S pomocı́ interpolace mezi
dvěma poslednı́mi body zı́skanými integracı́. Stejným způsobem zı́skáme dalšı́ body orbity Poincaréova
zobrazenı́ a z jejı́ho charakteru pak můžeme posoudit stabilitu periodické orbity γ.
10.4
Rovnice ve variacı́ch
Uved’me si ještě jiný přı́stup k popisu chovánı́ trajektoriı́ systému ẋ = f (x) v okolı́ uzavřené trajektorie. Tento způsob využı́vá výsledků Floquetovy teorie periodických systémů, kterou jsme popsali v
čl. 4.1.
Necht’ γ je trajektorie řešenı́ x(t) systému ẋ = f (x) pro počátečnı́ podmı́nku x0 . Proved’me
perturbaci řešenı́ x(t) volbou blı́zké počátečnı́ podmı́nky y 0 a označme toto perturbované řešenı́ y(t).
Pak můžeme psát y(t) = x(t) + z(t). Protože x(t) i y(t) jsou řešenı́mi rovnice ẋ = f (x), je
ż(t) = ẏ(t) − ẋ(t) = f (y(t)) − f (x(t)).
(10.8)
ż(t) = f (x(t) + z(t)) − f (x(t)).
(10.9)
Po dosazenı́ za y(t) je
Pravou stranu upravı́me pomocı́ Taylorova vztahu
f (x(t) + z(t)) − f (x(t)) =
∂f
(x(t)) z(t) + r(z(t)).
∂x
(10.10)
Nahradı́me-li pravou stranu rovnice (10.9) lineárnı́ aproximacı́ z (10.10), dostaneme diferenciálnı́
rovnici pro z(t)
∂f
ż(t) =
(x(t)) z(t),
(10.11)
∂x
která se nazývá rovnicı́ ve variacı́ch soustavy ẋ = f (x) pro řešenı́ x(t). Je to lineárnı́ neautonomnı́
rovnice ẋ = A(t)x s maticı́
∂f
A(t) =
(x(t)).
(10.12)
∂x
Dále budeme předpokládat, že řešenı́ x(t) je periodické s periodou T , takže γ je uzavřená trajektorie.
Pak A(t) je periodickou funkcı́ času, rovnice ve variacı́ch (10.11) odpovı́dá rovnici (4.15) a lze na ni
aplikovat Floquetovu teorii. Multiplikátory uzavřené orbity γ lze stanovit numericky, a to obvykle
výhodněji než u Poincaréova zobrazenı́. Pro určenı́ stability γ lze pak využı́t věty 10.5. Podrobnějšı́
výklad lze nalézt např. v [2].
10.5
Úlohy
10.1. Ukažte, že x1 = cos t, x2 = sin t je periodické řešenı́ systému
ẋ1 = x1 − x2 − x31 − x1 x22
ẋ2 = x1 + x2 − x21 x2 − x32
√
√
a x1 = 2 π cos t, x2 = 2 π sin t je periodické řešenı́ systému
ẋ1 = −x2 + x1 sin
x21 + x22
4
ẋ2 = x1 + x2 sin
x21 + x22
4
KAPITOLA 10. PERIODICKÁ ŘEŠENÍ A JEJICH STABILITA
96
Nalezněte pro oba systémy rovnice ve variacı́ch kolem uvažovaného periodického řešenı́ a ukažte, že v obou
přı́padech je limitnı́ cyklus orbitálně asymptoticky stabilnı́.
10.2. Uvažujte systém 2.řádu
ẋ1 = −x2 + ax1 (x21 + x22 ) sin (x21 + x22 )
ẋ2 = x1 + ax2 (x21 + x22 ) sin (x21 + x22 )
Určete stabilitu rovnovážného stavu pro a = +1 a a = −1. (Použijte Ljapunovovu funkci V = x21 + x22 ).
Ukažte, že x1 = n cos t, x2 = n sin t je periodické řešenı́ daného systému pro n = 1, 2... Odvod’te rovnici
ve variacı́ch kolem těchto periodických řešenı́ a určete, že limitnı́ cykly jsou orbitálně asymptoticky stabilnı́ pro
a = +1, jestliže n je sudé, a nestabilnı́, jestliže n je liché.
10.3. Ukažte, že periodický systém
ẋ2 = −x1 − bx2 − a cos ωt
ẋ1 = x2
má periodické řešenı́ ve tvaru
x2 (t) = −ωB sin (ωt + α).
x1 (t) = B cos (ωt + α)
Nalezněte podmı́nky pro orbitálnı́ asymptotickou stabilitu limitnı́ho cyklu odpovı́dajı́cı́ho periodickému řešenı́.
10.4. Uvažujte systém 2. řádu
π
ẋ1 = −x2 + x2 (x21 + x22 ) sin p
π
ẋ2 = x1 + x2 (x21 + x22 ) sin p
x21 + x22
x21 + x22
Ukažte, že tento systém má periodické řešenı́
x1 =
1
cos t,
n
x2 =
1
sin t
n
pro n = 1, 2, ...Určete orbitálnı́ stabilitu odpovı́dajı́cı́ch limitnı́ch cyklů. Ukažte, že libovolně blı́zko počátku
existujı́ uzavřené i otevřené trajektorie. Určete stabilitu rovnovážného stavu v počátku.
10.5. Uvažujte systém
ẋ1 = x2
ẋ2 = −x1 + (1 − x21 − x22 )x2
Určete stabilitu nulového řešenı́. Ukažte, že systém má limitnı́ cyklus x21 + x22 = 1 odpovı́dajı́cı́ periodickým
řešenı́m
x1 = sin (t + c)
x2 = cos (t + c),
kde c je konstanta. Diskutujte orbitálnı́ asymptotickou stabilitu této uzavřené trajektorie. Ukažte, že systém
nemá žádné dalšı́ limitnı́ cykly.
Návod: Uvažujte Ljapunovovu funkci V = x21 + x22 . Podél periodického řešenı́ s periodou T je
Z
0
T
V̇ (x)dt = 0.
Kapitola 11
Bifurkace rovnovážných stavů a
periodických řešenı́
Jak jsme viděli doposud u mnoha přı́kladů, modely reálných fyzikálnı́ch systémů obsahujı́ různé
parametry, které se mohou měnit vlivem vnitřnı́ch i vnějšı́ch podmı́nek. Při určitých hodnotách těchto
parametrů docházı́ k bifurkacı́m, které se projevujı́ strukturálnı́mi změnami v systému. Těmito bifurkačnı́mi jevy se nynı́ budeme zabývat trochu podrobněji.
Teorie bifurkacı́ studuje systematicky kvalitativnı́ změny řešenı́ diferenciálnı́ch nebo diferenčnı́ch
rovnic, měnı́-li se jeden nebo vı́ce parametrů (tzv. řı́dı́cı́ch parametrů). Tato teorie vede k rozloženı́
prostoru parametrů na oblasti, ve kterých nedocházı́ k bifurkacı́m (a systém je strukturálně stabilnı́) a
na hranice mezi nimi, na nichž bifurkace nastávajı́. Složitost těchto oblastı́ podstatně roste s dimenzı́
parametrického prostoru a současně roste i možný počet typů bifurkacı́.
Nejjednoduššı́ přı́pad představujı́ jednoparametrické bifurkace u dynamických systémů se spojitým časem. Všimneme si předevšı́m různých variant bifurkacı́ rovnovážných stavů a periodických
řešenı́. Protože analýza těchto bifurkacı́ se obvykle omezuje na studium vektorových polı́ v blı́zkosti
bifurkujı́cı́ch rovnovážných stavů a periodických orbit, nazývajı́ se tyto bifurkace lokálnı́.
11.1
Bifurkace rovnovážných stavů
Budeme studovat dynamický systém popsaný rovnicı́ ẋ = f (x, α) s jednı́m proměnným parametrem
α, ostatnı́ parametry systému budeme pokládat za pevné. Rovnovážné stavy x(α) budou závislé na
hodnotě parametru α. Při kritické hodnotě α? tohoto parametru bude docházet k bifurkačnı́m jevům.
V bifurkačnı́m bodě nenı́ systém strukturálně stabilnı́, matice Df (x, α? ) je singulárnı́.
V článku 4.4 o centrálnı́ varietě jsme viděli, že dimenze bifurkačnı́ho problému závisı́ jen na
počtu vlastnı́ch čı́sel matice linearizace, které při kritické hodnotě α? přecházejı́ přes imaginárnı́
osu. V nejjednoduššı́ch přı́padech se jedná o jedno reálné vlastnı́ čı́slo nebo o jednoduchý pár komplexně sdružených vlastnı́ch čı́sel. Budeme předpokládat, že ostatnı́ vlastnı́ čı́sla ležı́ v levé Gaussově
polorovině. Bifurkace systému vyššı́ho řádu lze pak redukovat na typy bifurkacı́ diferenciálnı́ch rovnic
1. a 2. řádu. Podrobnějšı́m rozborem bychom zjistili, že stačı́ uvažovat tři základnı́ typy rovnice 1.
řádu a jeden typ rovnice 2. řádu (tzv. normálnı́ formy). Jedná se o tyto přı́pady bifurkacı́:
a) Tečná bifurkace. Nazývá se také bifurkace sedlo-uzel. Vyskytuje se u rovnice
ẋ = α − x2 .
(11.1)
√
Rovnovážné stavy jsou x = ± α. Pro α < 0 nenı́ žádný rovnovážný stav, pro α > 0 jsou dva,
√
√
x(1) = + α (stabilnı́) a x(2) = − α (nestabilnı́). Diagram řešenı́ je znázorněn na obr. 11.1a.
97
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
98
Obrázek 11.1: Tečná a transkritická bifurkace
b) Transkritická bifurkace. Nazývá se také ”křı́žová” bifurkace. Objevuje se u rovnice
ẋ = αx − x2 .
(11.2)
Jsou dva rovnovážné stavy x(1) = 0 a x(2) = α. Pro α < 0 je prvnı́ stabilnı́, druhý nestabilnı́, pro α > 0
je tomu naopak. Diagram je zakreslen na obr. 11.1b. Transkritická bifurkace nastává také u rovnice
ẋ = x2 − αx
(11.3)
Rovnovážné stavy jsou opět dva, x(1) = 0 a x(2) = α. Stabilita je patrna z obr. 11.1c.
Obrázek 11.2: Vidličková a Hopfova bifurkace
c) Vidličková bifurkace. Má podobně jako u předchozı́ho typu dvě varianty. Superkritická
nastává u rovnice
ẋ = αx − x3
(11.4)
√
√
Pro α < 0 je jeden rovnovážný stav v nule, pro α > 0 jsou tři, x(1) = 0, x(2) = + α a x(3) = − α
(obr 11.2a). Subkritická bifurkace se objevuje u rovnice
ẋ = x3 − αx.
(11.5)
Pro α > 0 jsou tři rovnovážné stavy (dva nestabilnı́ a jeden stabilnı́), pro α < 0 je jeden nestabilnı́.
d) Hopfova bifurkace nastává, když dvě komplexně sdružená vlastnı́ čı́sla matice linearizace
přecházejı́ imaginárnı́ osu. Generuje se uzavřená invariantnı́ křivka kolem pevného bodu. Normálnı́
forma odpovı́dajı́cı́ tomuto typu je
ẋ = αx − y − x(x2 + y 2 )
ẏ = x + αy − y(x2 + y 2 )
(11.6)
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
99
Jacobiova matice linearizace je
J=
"
α − 3x2 − y 2
−1 − 2xy
1 − 2xy
α − x2 − 3y 2
#
Existuje jeden pevný bod (x, y) = (0, 0). Jacobiova matice má pro tento pevný bod tvar
J (0) =
"
α −1
1 α
#
Odpovı́dajı́cı́ charakteristická rovnice λ2 − 2αλ + α2 + 1 = 0 má dva komplexně sdružené kořeny α ± j.
Pro α < 0 je pevný bod stabilnı́, pro α > 0 nestabilnı́. Pro α = 0 měnı́ pevný bod stabilitu a současně
vzniká stabilnı́ limitnı́ cyklus, jehož amplituda se zvětšuje se zvětšujı́cı́m se α. Odpovı́dajı́cı́ diagram
je na obr. 11.2b.
11.2
Bifurkace periodických řešenı́
Všimněme si nynı́ stability periodických orbit, které závisejı́ na jednom proměnném parametru α.
Bifurkace nastane tehdy, je-li některé vlastnı́ čı́slo linearizace Poincaréova zobrazenı́ v okolı́ periodické
orbity γ(α) v absolutnı́ hodnotě rovno jedné. Nastává přitom zase několik možnostı́:
a) Vlastnı́ čı́slo je rovno +1. (Je to analogie přı́padu vlastnı́ho čı́sla rovného nule pro rovnovážný stav
spojitého systému).
- tečná bifurkace; vzniká nebo zaniká pár periodických orbit (bifurkace sedlo-uzel)
- křı́žová bifurkace; měnı́ se stabilita dvou limitnı́ch cyklů
- vidličková bifurkace; vznikajı́ tři mezné cykly z jednoho.
b) Vlastnı́ čı́slo je rovno −1. Je to tzv. subharmonická bifurkace neboli bifurkace zdvojenı́ periody.
Jestliže pro α = α? přecházı́ jeden multiplikátor trajektorie γ z jednotkového kruhu ven, pak se stabilnı́
trajektorie měnı́ na nestabilnı́ a od nı́ se odvětvı́ uzavřená trajektorie s dvojnásobnou periodou.
c) dvojice komplexně sdružených vlastnı́ch čı́sel (multiplikátorů) procházı́ jednotkovou kružnicı́. To
odpovı́dá invariantnı́ kružnici Poincaréova zobrazenı́ a vznikne invariantnı́ torus T 2 . Na rozdı́l od
obou předešlých přı́padů, které mohou existovat už v systémech 2. řádu nastává tento přı́pad až od 3.
řádu.
11.3
Teorie katastrof
Zakladatelem teorie katastrof je francouzský matematik René Thom, který vydal v r. 1972 knihu s
názvem: Strukturálnı́ stabilita a morfogeneze. V nı́ se zabýval zejména studiem změn tvarů v biologii,
pro které využil globálnı́ geometrické a analytické výsledky teorie singularit hladkých zobrazenı́. Z
teorie singularit je známo, že pozvolná spojitá změna parametrů vyvolává často rychlou kvalitativnı́
změnu stavu, což je obvykle označováno jako skok. Thom nazval poněkud nadneseně tyto skokové
změny katastrofami a teorii singularit spolu s jejı́mi aplikacemi teoriı́ katastrof.
Thomova kniha a celá nová teorie vzbudily široký ohlas a rozsáhlé, ale často i dosti spekulativnı́
diskuse. Po opadnutı́ prvnı́ho nadšenı́ se ukázalo, že teorie katastrof nenı́ převratnou teoriı́, ale že
přesto zůstává zajı́mavou partiı́ modernı́ matematiky, která přinesla řadu konkrétnı́ch výsledků nejen
v matematice samotné, ale předevšı́m v oblasti fyzikálnı́ch a technických věd. O mı́ře konkrétnı́ho
přı́nosu pro biologické a sociálnı́ vědy se vedou rozporné diskuse, protože velké množstvı́ přı́spěvků
má zatı́m převážně spekulativnı́ charakter.
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
100
V užšı́m smyslu je cı́lem teorie katastrof popis rychlých změn v chovánı́ dynamických systémů. Tato
tzv. elementárnı́ teorie katastrof studuje bifurkačnı́ jevy předevšı́m u gradientnı́ch dynamických
systémů, které jsou vytvářeny pomocı́ potenciálu, závislého na řı́dı́cı́ch parametrech. Možné bifurkace
těchto gradientnı́ch systémů jsou v teorii katastrof popsány vyčerpávajı́cı́m způsobem.
Mnozı́ autoři však chápou teorii katastrof obecněji jako spojenı́ teorie singularit a teorie bifurkacı́
spolu s jejich aplikacemi v nejrůznějšı́ch oborech.
V dalšı́m se budeme zabývat jen jednoduchými výsledky elementárnı́ teorie katastrof, předevšı́m u
gradientnı́ch systémů. V této oblasti dosáhl Thom pozoruhodných výsledků, které spočı́vajı́ zejména
ve studiu a klasifikaci degenerovaných kritických bodů potenciálu. Skokové jevy, které jsou stěžejnı́
pro teorii katastrof, si můžeme přiblı́žit jednoduchým pokusem.
Obrázek 11.3: Zeemanův stroj
Zeeman vytvořil školnı́ přı́klad ”katastrofického stroje”, kterým je jednoduchý tlumený mechanický systém podle obr. 11.3. Volně otáčivý kotouč s pevným středem A má v jednom bodě obvodu
P upevněna dvě zhruba stejně dlouhá vhodně napjatá gumová vlákna. Jeden konec levého vlákna je
pevně fixován v bodě B, konec F pravého vlákna je volně pohyblivý a nazývá se řı́dı́cı́ bod systému.
Při pohybu bodu F se bude kotouč otáčet a jeho polohu (stav systému) můžeme definovat úhlem x
měřeným od základnı́ osy AB.
Umı́stěme nynı́ bod F do nějakého bodu roviny a natočme kotouč do libovolné počátečnı́ polohy.
Při uvolněnı́ kotouče se jeho pohyb ustálı́ v nějakém rovnovážném stavu. Snadno zjistı́me, že pokud
bude bod F vně oblasti uzavřené křivkou na obr. 11.3, ustálı́ se kotouč v jedné rovnovážné poloze a
systém má jeden atraktor. Při pohybu bodu F přes tuto oblast (např. podél přı́mky v obr. 11.3) bude
mı́t systém dva atraktory, při přechodu hraničnı́ křivky (bifurkačnı́ množina) vykoná systém rychlý
skok do druhého atraktoru. Bifurkačnı́ křivka má čtyři hroty, tj. obyčejné body vratu. Systém má dva
řı́dı́cı́ parametry, kterými jsou souřadnice x, y bodu F . Jak uvidı́me v dalšı́m článku, teorie katastrof
dokazuje, že na bifurkačnı́ křivce podobných systémů mohou být jen regulárnı́ body a hroty.
11.3.1
Elementárnı́ teorie katastrof
Obecná teorie bifurkacı́ studuje chovánı́ dynamických systémů s n stavovými proměnnými a m řı́dı́cı́mi
parametry αi , např. typu
ẋ = f (x1 , ..., xn ; α1 , ..., αm )
x ∈ Rn
α ∈ Rm .
(11.7)
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
101
Elementárnı́ teorie katastrof, která je v podstatě podmnožinou teorie bifurkacı́, studuje bifurkačnı́ jevy
u gradientnı́ch dynamických systémů popsaných rovnicemi
x ∈ Rn
ẋ = −gradx V (x, α)
α ∈ Rm .
(11.8)
Základnı́ vlastnosti gradientnı́ch systémů byly uvedeny v čl.6.1. Zde budeme sledovat vliv změny
parametrů α na chovánı́ systému. Definujme nejprve některé základnı́ pojmy.
Množina pevných bodů systému (11.8)
M = (x, α) |
∂V (x, α)
= 0,
∂xi
i = 1, ..., n
(11.9)
tvořı́ hyperplochu v prostoru Rn × Rm , jejı́ž prvky jsou při konstantnı́m α stacionárnı́mi (neboli
kritickými) body potenciálu V .
Katastrofická množina K je dána degenerovanými stacionárnı́mi body potenciálu



∂ 2 V (x, α)
K = (x, α) ∈ M | det 

∂xi ∂xj
!n
i,j=1



=0 .

(11.10)
Bifurkačnı́ množina B je dána projekcı́ těchto degenerovaných stacionárnı́ch bodů do parametrického prostoru
B = {α ∈ Rm | ∃ x ∈ Rn ; (x, α) ∈ M } .
(11.11)
Dále uvedeme přehled elementárnı́ch katastrof, přičemž pro každé f (x, α) stanovı́me
a) množinu M ⊂ Rn × Rm všech stacionárnı́ch bodů funkce f (x, α) při pevném, ale libovolném
α ∈ Rm ,
b) podmnožinu K ⊂ M ⊂ Rn × Rm všech degenerovaných stacionárnı́ch bodů,
c) průmět B množiny K do prostoru parametrů Rm .
1. Uvažujme nejprve gradientnı́ systém 1. řádu (dim Rn = 1), který má maximálně čtyři
proměnné parametry (dim Rm ≤ 4). Budeme studovat lokálnı́ chovánı́ potenciálu V (x) v blı́zkosti
stacionárnı́ho bodu x, který můžeme bez ztráty obecnosti uvažovat v počátku. Pak x = 0, V (0) = 0.
Budeme předpokládat, že potenciálnı́ funkci lze rozvinout v Taylorovu řadu
V (x) = a0 + a1 x + a2 x2 + a3 x3 + ...
(11.12)
kde a0 = V (0) = 0, a1 = V 0 (0) = 0, ak = 1/k!(dk V /dxk )(0), k = 2,3,... Dále budeme uvažovat, že
potenciálnı́ funkce může být ovlivněna vnějšı́mi nebo vnitřnı́mi poruchami, takže V závisı́ na parametrech α. Budeme studovat typy hladkých poruch, které podstatným způsobem ovlivňujı́ lokálnı́ chovánı́
V (x) pro x = 0. Je-li ak 6= 0, přicházejı́ v úvahu jen poruchy, jejichž stupeň n ≤ k, protože pro n > k
platı́ při malé poruše |x| << 1 vztah |x|n << |x|k .
Přı́pad 1. Necht’ a2 6= 0. Pak třı́parametrové rušenı́ vede na tvar
V (x) = a2 x2 + µ2 x2 + µ1 x + µ0 .
(11.13)
Vhodnou transformacı́ souřadnic, volbou měřı́tek a eventuálnı́ změnou znaménka zı́skáme tzv.
normálnı́ (standardnı́) tvar V (x) = 12 x2 , který nenı́ závislý na parametrech. Tı́m jsme vlastně
zvolili lokálnı́ souřadnice ve vrcholu paraboly a označili jsme je stejnými pı́smeny x, V . Funkce V má
v bodě x = 0 jednoduché minimum, nenastávajı́ žádné katastrofy. Potenciál V (x) odpovı́dá dynamickému systému ẋ = −x.
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
102
Přı́pad 2. Katastrofa typu záhyb. Pro a2 = 0, a3 6= 0 a možné čtyřparametrové rušenı́ vede na
potenciál
V (x) = a3 x3 + µ3 x3 + µ2 x2 + µ1 x + µ0 .
(11.14)
Po vhodných transformacı́ch zı́skáme standardnı́ tvar
1
V (x) = x3 + α1 x,
3
(11.15)
který závisı́ na jednom volném parametru. Tento potenciál odpovı́dá gradientnı́mu dynamickému
systému ẋ = −x2 − α1 . Systém nemá pro α1 > 0 pevné body, pro α1 < 0 jsou dva.
M = {(x, α1 ) ∈ R2 | x2 + α1 = 0}
(11.16)
Katastrofická množina K je jednobodová množina (obr. 11.4)
K = {(x, α1 ) ∈ M | ∂ 2 V /∂x2 = 0} = {(0, 0)}.
(11.17)
Jejı́ průmět do prostoru parametru α1 je jediný bod 0. Pro α1 = 0 nastává tedy katastrofa (bifurkace)
typu záhyb.
Obrázek 11.4: Katastrofa typu záhyb
Obrázek 11.5: Katastrofa typu hrot
Přı́pad 3. Katastrofa typu hrot: a2 = a3 = 0, a4 6= 0. Obecný potenciál 4. stupně s pěti parametry
lze zase vhodnými transformacemi převést na standardnı́ tvar
1
1
V (x, α1 , α2 ) = x4 + α1 x2 + α2 x,
4
2
(11.18)
který závisı́ na dvou volitelných parametrech.Odpovı́dá dynamickému systému
ẋ = −x3 − α1 x − α2 ,
(11.19)
který v závislosti na parametrech nemá bud’ žádný rovnovážný stav, nebo jeden nebo tři. Odpovı́dajı́cı́
množiny jsou
M = {(x, α1 , α2 ) ∈ R3 | x3 + α1 x + α2 = 0}
K = {(x, α1 , α2 ) ∈ M | 3x2 + α1 = 0} = {(x, α1 , α2 ) | α1 = −3x2 , α2 = 2x3 }
B = {(α1 , α2 ) ∈ R2 | 4α13 + 27α22 = 0}.
Bifurkačnı́ množina B je znázorněna na obr. 11.5, množina pevných bodů M je zakreslena na obr.
11.6. Při x = α1 = α2 = 0 vzniká katastrofa typu hrot. Tento typ je nejjednoduššı́ bifurkacı́, která
vznikne při variaci dvou parametrů.
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
103
Přı́pad 4. Katastrofa typu vlaštovčı́ ocas: a2 = a3 = a4 = 0, a5 6= 0. Standardnı́ tvar potenciálu
je závislý na třech parametrech
1
1
1
V (x, α1 , α2 , α3 ) = x5 + α1 x3 + α2 x2 + α3 x.
5
3
2
(11.20)
Odpovı́dajı́cı́ množiny jsou
M = {(x, α1 , α2 , α3 ) ∈ R4 | x4 + α1 x2 + α2 x + α3 = 0}
K = {(x, α1 , α2 , α3 ) ∈ M | 4x3 + 2α1 x + α2 = 0}.
Bifurkačnı́ množina B = {(α1 , α2 , α3 )} je projekcı́ množiny K do prostoru parametrů a má tvar
vlaštovčı́ho ocasu (obr. 11.7).
Obrázek 11.6: Katastrofa typu hrot
Obrázek 11.7: Katastrofa typu vlaštovčı́ ocas
Přı́pad 5. Katastrofa typu motýl: a2 = ... = a5 = 0, a6 6= 0. Standardnı́ forma potenciálu má
čtyři volné parametry
1
1
1
1
V (x, α1 , α2 , α3 , α4 ) = x6 + α1 x4 + α2 x3 + α3 x2 + α4 x.
6
4
3
2
(11.21)
Odpovı́dajı́cı́ bifurkace se nazývá katastrofa typu motýl.
Uvedenými čtyřmi typy katastrof jsou vyčerpány všechny možné přı́pady, které mohou vzniknout
u jednodimenzionálnı́ho systému, který je ovlivňován nejvýše čtyřmi parametry.
2. U gradientnı́ho systému druhého a vyššı́ho řádu (dim Rn ≥ 2) a třech volných parametrech jsou možné ještě dalšı́ dvě singularity, eliptický a hyperbolický bod. Při čtyřech volných parametrech vzniká ještě parabolický bod. Tyto singularity (katastrofy) jsou již složitějšı́ a jejich podrobný
popis lze nalézt v např. v [29].
Thom odvodil ve své knize tuto základnı́ větu: Necht’ C je čtyřdimenzionálnı́ parametrický prostor,
X libovolný konečněrozměrný stavový prostor a V hladká funkce na X parametrizovaná pomocı́ C.
Necht’ M je množina stacionárnı́ch bodů funkce V . Pak je M hladká hyperplocha v X × C a jedinými
typy singularit je výše uvedených sedm elementárnı́ch katastrof.
Důkaz této věty je obtı́žný a lze ho nalézt v [29]. Pozoruhodné na této větě je, že existuje konečný
počet elementárnı́ch katastrof a že nejsou závislé na dimenzi stavového prostoru.
Bude-li dimenze parametrického prostoru C rovna pěti, lze dokázat, že jsou možné dalšı́ čtyři typy
katastrof, pro dim C = 6 existuje nekonečně velký počet různých katastrof.
KAPITOLA 11. BIFURKACE ROVNOVÁŽNÝCH STAVŮ A PERIODICKÝCH ŘEŠENÍ
11.3.2
104
Aplikace teorie katastrof
Matematická teorie katastrof nalezla značné využitı́ nejen v matematice samotné, ale i v mnoha jiných
oblastech. Velmi známé jsou aplikace ve fyzice. V mechanice jsou to např. skokové jevy při tlaku na
elastické nosnı́ky, problémy stability průřezů při jeho různých tvarech, studium průhybu desek apod.
Známými aplikacemi jsou fázové přechody v termodynamice, nespojité jevy v kvantové mechanice,
aerodynamice, laserové fyzice aj. Významnou aplikaci tvořı́ teorie vlnoploch a kaustik, tj. obálek
systému paprsků. Na podkladu metod teorie katastrof byly vypracovány např. některé teorie rozloženı́
hmoty ve vesmı́ru a možnosti vzniku galaxiı́ a jiných útvarů. Obecný charakter má využitı́ teorie
katastrof při studiu hystereznı́ch jevů, které se objevujı́ také často v regulačnı́ technice. Velké množstvı́
aplikacı́ ve fyzikálnı́ch a technických oborech je popsáno v knize [29].
Poměrně málo konkrétnı́ch výsledků bylo zatı́m dosaženo v biologických a společenských vědách.
Nejznámějšı́ jsou snad aplikace v psychologii, např. modelovánı́ agresivity pomocı́ katastrofy typu hrot,
modelovánı́ různých psychických stavů, duševnı́ únavy, různých konfliktnı́ch situacı́ apod. V lékařstvı́
byly modelovány epidemické procesy, v ekonomii různé skokové jevy, např. modely vývoje cen na
burze, krize v ekonomických systémech aj.
Kapitola 12
Chaos
V předchozı́ch kapitolách jsme se zabývali deterministickými nelineárnı́mi systémy, jejichž asymptotické chovánı́ vedlo na rovnovážné stavy nebo na periodická či kvaziperiodická řešenı́. Již Poincaré
však v r. 1892 upozornil na možnost vzniku chaotického chovánı́ u některých mechanických systémů
Hamiltonova typu. Bylo to však považováno za kuriozitu a nebyla tomu věnována dalšı́ pozornost.
Teprve r. 1963 meteorolog Lorenz s pomocı́ počı́tače ukázal, že u systému třı́ relativně jednoduchých
nelineárnı́ch rovnic (čl. 12.2) mohou při vhodné kombinaci parametrů vzniknout chaotické atraktory. Od té doby byla chaosu věnována velká pozornost a dnes existuje velké množstvı́ poznatků o
chaotickém chovánı́ systémů prakticky ve všech oblastech vědy a techniky.
V dalšı́ch článcı́ch si ukážeme některé jednoduché deterministické systémy, které majı́ při určitých
hodnotách parametrů chaotické chovánı́. Vzhledem k tomu, že se neuvažuje nejistota ani ve vstupech ani v modelu systému, nazývá se tento typ chovánı́ deterministický chaos. Chaotické chovánı́
je ohraničené, nenı́ periodické a podobá se náhodnému. Je vysoce citlivé na změnu počátečnı́ch
podmı́nek, i při velmi malé změně se odezvy po určité době značně lišı́. Dlouhodobé chovánı́ nelze
tedy spolehlivě predikovat (např. nejistota dlouhodobých meteorologických předpovědı́). Fourierův
rozklad chaotického průběhu má spojité spektrum.
U autonomnı́ch systémů se spojitým časem může chaos vzniknout u 3. řádu a výše, u neautonomnı́ch již u 2. řádu. U systémů s diskrétnı́m časem popsaných diferenčnı́mi rovnicemi s neinvertovatelným zobrazenı́m f (endomorfismus) je chaotické chovánı́ možné už v jednorozměrném přı́padě, u
difeomorfismů u 2. řádu a výše. Bylo prokázáno, že chaos se může vyskytnout téměř ve všech typech
nelineárnı́ch systémů s dvěma a vı́ce stupni volnosti.
Hodnocenı́ chaosu bylo až donedávna výlučně negativnı́. Teprve v poslednı́ch letech se poukazuje
také na výhodné vlastnosti systémů s chaotickým chovánı́m. Chaos dovoluje lepšı́ absorpci energie
a hybnosti, umožňuje mı́chánı́, je spojován se zdravou aktivitou na rozdı́l od periodického chovánı́
nebo stacionárnı́ho stavu spojovaných s ukončenı́m aktivity. Bylo rovněž ukázáno, že chaos působı́
jako silný organizačnı́ princip, např. v ekonomii nebo biologii. Chaosu lze využı́t k regulaci a byly
publikovány některé metody syntézy chaosu [93]. Změny biologických regulačnı́ch mechanismů pomocı́
chaosu patřı́ pravděpodobně k hlavnı́m nástrojům evoluce biosystémů na všech úrovnı́ch organizace.
Zdá se, že biosystémy často operujı́ těsně pod úrovnı́ přechodu k chaosu. Deterministický chaos se tak
v poslednı́ch letech stal podnětem k formulaci mnoha nových a zásadnı́ch principů a myšlenek.
105
KAPITOLA 12. CHAOS
106
12.1
Chaos v diskrétnı́ch systémech
12.1.1
Kvadratická diferenčnı́ rovnice
Klasický přı́klad jednoduchého dynamického systému s možnostı́ chaotického chovánı́ je diskrétnı́
systém s kvadratickým zobrazenı́m
xk+1 = f (xk ) = rxk (1 − xk ),
(12.1)
kde x ∈ [0, 1] a pro 0 < r ≤ 4 se interval [0, 1] zobrazı́ na sebe, tj. f : [0, 1] → [0, 1]. Graf funkce
y = rx(1 − x) je parabola symetrická podle přı́mky x = 1/2 a procházejı́cı́ osou x v bodech x = 0
a x = 1. Jejı́ strmost roste s rostoucı́m parametrem r. Vrchol paraboly je v bodě x = 1/2 a jeho
pořadnice je r/4 (obr.12.1).
Obrázek 12.1: Kvadratické zobrazenı́
Obrázek 12.2: Průběhy funkcı́ f a f 2
Tı́mto systémem lze např. modelovat růst určité populace na omezeném teritoriu. V některých
populacı́ch se generace navzájem nepřekrývajı́, žijı́ vždy jen jedinci jedné generace (např. u některých
druhů hmyzu). Pak nenı́ splněna podmı́nka překrývánı́ generacı́ pro spojitý model a populačnı́ dynamiku je možno modelovat uvedenou diferenčnı́ rovnicı́. Stavová proměnná xk zde udává počet jedinců
nebo jejich hustotu v k-té generaci. Kvadratický člen zabraňuje neomezenému růstu populace, řı́dı́cı́
parametr r popisuje vliv okolı́ na populaci.
Pro pevné body zobrazeni f platı́ x = f (x), tj. x = rx(1 − x). Tomu odpovı́dajı́ hodnoty x = 0 a
x = 1 − 1/r pro r > 1. Pro různé hodnoty r má systém tyto vlastnosti:
a) r ≤ 1. Existuje jen jeden pevný bod x = 0 a protože f 0 (0) = r < 1, je stabilnı́. Řešenı́m
rovnice (12.1) je posloupnost hodnot x0 , x1 , x2 , ..., které budou konvergovat k nule. Populace s takovým
parametrem r vyhyne.
b) 1 < r < 3 . Existujı́ dva pevné body. Bod x = 0 je nynı́ nestabilnı́ a bod x = 1 − 1/r je stabilnı́,
protože f 0 = −r + 2 < 1 v intervalu 1 < r < 3. Trajektorie z libovolné počátečnı́ podmı́nky v intervalu
(0, 1) konvergujı́ k jednobodovému atraktoru.
c) Pro r = 3 nastane bifurkace a druhý pevný bod bude rovněž nestabilnı́. Při dalšı́m zvýšenı́ r bude
mı́t funkce f 2 čtyři pevné body. Na obr. 12.2 jsou pro srovnánı́ zakresleny průběhy funkce f a druhé
iterace f 2 pro hodnoty r těsně pod hodnotou 3 a nad hodnotou 3. Je patrno, že pro r > 3 má funkce
f 2 dva nestabilnı́ pevné body, které odpovı́dajı́ dvěma nestabilnı́m pevným bodům funkce f . Dalšı́
dva jsou stabilnı́ a odpovı́dajı́ periodickému atraktoru funkce f s periodou 2. Při dalšı́m zvyšovánı́
hodnoty r se zvětšuje amplituda periodické orbity a při r = 3, 45 se orbita s periodou 2 stane nestabilnı́
a vznikne stabilnı́ orbita s periodou 4. Graf funkce f 2 má nynı́ všechny čtyři pevné body nestabilnı́,
graf čtvrté iterace f 4 bude mı́t kromě nestabilnı́ch pevných bodů také čtyři stabilnı́, které odpovı́dajı́
KAPITOLA 12. CHAOS
107
atraktoru s periodou 4. Toto zdvojovánı́ periody se při stoupajı́cı́m r opakuje a postupně vznikajı́
stabilnı́ orbity s periodou 8, 16, 32,.., přitom se stále zkracujı́ intervaly parametru r, při nichž nastává
bifurkace. Posloupnost bifurkačnı́ch hodnot rm , při nichž vznikajı́ stabilnı́ orbity s periodou 2m , je
konvergentnı́ s limitou r∞ = 3, 570.
d) Při hodnotách r∞ < r < 4 je chovánı́ systému velmi složité. Existuje nekonečně mnoho intervalů
parametru r (tzv. periodická okna), ve kterých existujı́ stabilnı́ periodická řešenı́. K jedné hodnotě
parametru přı́slušı́ ovšem jen jedna stabilnı́ perioda. Nejširšı́ je okno periody tři. Existujı́ však také
hodnoty parametrů, pro které nastává chaotické chovánı́. Velmi názorně to lze ukázat na bifurkačnı́m
diagramu podle obr. 12.3. Pro hodnoty r < r∞ = 3, 57 je patrno zdvojovánı́ periody, od r∞ je systém
v chaotické oblasti přerušované periodickými okny.
Obrázek 12.3: Bifurkačnı́ diagram kvadratického zobrazenı́
Řešenı́ diferenčnı́ rovnice (12.1) vede tedy při zvětšovánı́ řı́dı́cı́ho parametru r od periodického
řešenı́ s periodou 2 přes bifurkačnı́ kaskádu zdvojovánı́ period až k neperiodickému chaotickému
chovánı́. Tato cesta k chaosu je charakteristická i pro mnoho jiných systémů.
12.1.2
Po částech lineárnı́ zobrazenı́
Ještě jednoduššı́ systémy s chaosem představujı́ zobrazenı́, která jsou po částech lineárnı́. Např.
pilovitý průběh podle obr. 12.4 je zadán vztahy
xk+1 = f (xk )
f : [0, 1] → [0, 1]
f (x) =
(
2x,
x ∈ [0, 1/2),
2x − 1, x ∈ [1/2, 1].
(12.2)
Je to vlastně zobrazenı́ typu ”modulo” a lze ho zapsat také ve tvaru xk+1 = 2xk (mod 1). Zobrazenı́
je pro x = 1/2 nespojité, je neinvertovatelné a lze proto vyšetřovat jen kladné polotrajektorie. Z
obr. 12.4 je patrno, že existujı́ dva pevné body x = 0 a x = 1, oba jsou nestabilnı́. Druhá iterace
f 2 (x) = 22 x(mod 1), obecně f N (x) = 2N x(mod 1) pro x 6= 1, f N (1) = 1, takže f N má právě
2N pevných bodů. Některé z nich odpovı́dajı́ orbitám periody N, jiné majı́ nižšı́ periody. Všechny
periodické orbity jsou nestabilnı́.
KAPITOLA 12. CHAOS
108
Obrázek 12.4: Lineárnı́ zobrazenı́ a jeho druhá
iterace
Obrázek 12.5: Střechové zobrazenı́
Dalšı́m typem je symetrické ”střechové” zobrazenı́ podle obr. 12.5, vyjádřené vztahy
xk+1 = f (xk )
f : [0, 1] → [0, 1]
f (x) =
(
2x,
x ∈ [0, 1/2],
2 − 2x, x ∈ (1/2, 1].
(12.3)
Zobrazenı́ má dva pevné body a konečný počet orbit periody N . Všechny pevné body a periodické
orbity jsou nestabilnı́. O tom se lze přesvědčit následujı́cı́m způsobem.
Počátečnı́ podmı́nku x0 ∈ [0, 1) můžeme zapsat jako binárnı́ čı́slo
x0 =
∞
X
ai /2i
a1 = 0 nebo 1.
i=1
Zobrazenı́ f podle rovnice (12.3) použité na počátečnı́ podmı́nku x0 ∈ [0, 1/2) (tj. a1 = 0) znamená
posunutı́ desetinné čárky o jedno mı́sto doprava, pro x0 ∈ [1/2, 1) ještě kromě posunutı́ také negaci
každého ai . Pak
f (x0 ) = f (0, a1 a2 a3 a4 ...) =
(
0, a2 a3 a4
0, a2 a3 a4
x0 ∈ [0, 1/2)
x0 ∈ [1/2, 1)
Pro racionálnı́ počátečnı́ podmı́nky je posloupnost {ai } od určitého mı́sta periodická, takže dynamický
systém popsaný zobrazenı́m (12.3) se po uplynutı́ určitého přechodného jevu pohybuje po periodické
orbitě. Všechny počátečnı́ podmı́nky odpovı́dajı́cı́ racionálnı́m čı́slům vytvářejı́ netypické trajektorie a
odpovı́dajı́cı́ periodické orbity jsou nestabilnı́. Iracionálnı́m počátečnı́m podmı́nkám odpovı́dajı́ typické
trajektorie, které bloudı́ v celém intervalu (0,1) a vykazujı́ tedy chaotické chovánı́.
Také nesymetrické ”střechové” zobrazenı́
xk+1 = f (xk )
f : [0, 1] → [0, 1]
f (x) =
(
rx,
x ∈ [0, 1/r],
r(1 − x)/(r − 1), x ∈ (1/r, 1],
(12.4)
nemá pro r > 1 žádný stabilnı́ pevný bod a žádné stabilnı́ periodické řešenı́, takže skoro všechny
trajektorie majı́ chaotický charakter.
12.1.3
Hénonovo zobrazenı́
Doposud uvedená jednorozměrná diskrétnı́ zobrazenı́ byla neinvertovatelná. U invertovatelných zobrazenı́ (difeomorfismů) nastanou chaotické jevy až od 2. řádu. Jako přı́klad může sloužit Hénonovo
KAPITOLA 12. CHAOS
109
zobrazenı́
xk+1 = 1 − rx2k + yk ,
yk+1 = bxk ,
k∈Z
r > 0,
|b| < 1.
Při určitých hodnotách parametrů vznikne chaotický atraktor. Podrobnosti např. v [43].
12.2
Chaos u diferenciálnı́ch rovnic
12.2.1
Lorenzův model
V r. 1962 studoval Saltzman Navierovy - Stokesovy nelineárnı́ parciálnı́ diferenciálnı́ rovnice popisujı́cı́
zahřı́vánı́ vrstvy tekutiny. Při řešenı́ pomocı́ Fourierových řad se ukázalo, že relativně velkou amplitudu
majı́ jen tři členy, z nichž jeden popisuje rychlostnı́ profil a dalšı́ dva rozdělenı́ teploty. Pomocı́ vhodných
aproximacı́ zı́skal Saltzman tři obyčejné nelineárnı́ diferenciálnı́ rovnice
ẋ = s(y − x)
ẏ = rx − y − xz
ż = xy − bz,
(12.5)
kde parametry s, r, b > 0.
V r. 1963 prováděl numerické zkoumánı́ tohoto modelu meteorolog Lorenz, který zjistil, že při
určitých hodnotách parametrů se objevuje v systému chaotické chovánı́. Od té doby se pro systém
(12.5) ujal název Lorenzův model.
Uvažujme dále, že parametry s a b jsou pevné a parametr r proměnný.
Obrázek 12.6: Lorenzův chaotický atraktor
Jsou možné 3 rovnovážné stavy:
1) x(1) = y (1) = z (1) = 0. Tento stav označı́me jako bod p. Odpovı́dá kapalině v klidu a nastává
pro libovolné r.
2) x(2) = y (2) =
p
b(r − 1), z (2) = r − 1 (bod q+ )
3) x(3) = y (3) = − b(r − 1), z (3) = r − 1 (bod q− ).
p
Druhý a třetı́ rovnovážný stav existujı́ pro r > 1 a odpovı́dajı́ vzniku konvekčnı́ch buněk.
KAPITOLA 12. CHAOS
110
1) Stabilita bodu p:
det(A − λI) =
−(s + λ)
s
0
r
−(1 + λ)
0
0
0
−(b + λ)
= 0.
(12.6)
Charakteristická rovnice je
(λ + b)[λ2 + (s + 1)λ − s(r − 1)] = 0.
(12.7)
Bod p = (0, 0, 0) je pro 0 < r < 1 asymptoticky stabilnı́ uzel. Pro r = 1 přecházı́ jedno reálné vlastnı́
čı́slo imaginárnı́ osu (bifurkace). Pro r > 1 je bod p sedlo s dimenzı́ W s (p) = 2. Osa z je z důvodů
symetrie částı́ W s (p) .
2) Stabilita bodů q+ a q− :
Dosazenı́m do Jacobiovy matice daného systému (12.5) dostaneme charakteristickou rovnici
λ3 + (s + 1 + b)λ2 + b(s + r)λ + 2bs(r − 1) = 0.
(12.8)
Mez stability nastane pro hodnotu parametru r = r+ :
r+ =
s(s + b + 3)
,
s − (b + 1)
(12.9)
Parametr r musı́ být kladný, proto platı́ podmı́nka s > b + 1.
Pro 1 < r < r+ jsou tedy oba pevné body asymptoticky stabilnı́. Pro meznı́ podmı́nku r = r+
přecházı́ jeden pár
pkomplexně sdružených vlastnı́ch čı́sel Jacobiovy matice imaginárnı́ osu: λ1 = −(s +
1 + b), λ2,3 = ±j b(s + r).
Pro r > r+ jsou oba pevné body nestabilnı́ a dimenze W s (q) = 1 a W u (q) = 2. Protože ve W u (q)
docházı́ ke spirálnı́mu rozvinovánı́ a v W s (q) k přitahovánı́, jsou body q+ a q− sedla-ohniska.
Pro r > r+ neexistuje tedy žádný stabilnı́ pevný bod. Protože Hopfova bifurkace pro r = r+ je
subkritická, neexistuje pro r > r+ ani žádný stabilnı́ meznı́ cyklus. Protože také torus je vyloučen,
musı́ existovat chaotické řešenı́. Bylo však zjištěno, že při vysokých hodnotách řı́dı́cı́ho parametru r se
chaotické atraktory střı́dajı́ se stabilnı́mi limitnı́mi cykly, podobně jako tomu je např. u kvadratického
diskrétnı́ho zobrazenı́.
Na obr. 12.6 je zakreslen chaotický atraktor pro parametry s = 10, b = 8/3, r = 28. Trajektorie
spirálovitě narůstajı́ kolem nestabilnı́ho pevného bodu q+ , pak následuje náhlý skok směrem k q− ,
kolem něho oscilace zase narůstajı́ atd. (Trajektorie se podobajı́ krouženı́ mouchy mezi dvěma lampami). Atraktor má složitou strukturu, skládá ze z nekonečně mnoha prostorově velmi blı́zko ležı́cı́ch
listů [38].
12.2.2
Jiné modely
Lorenzův model nenı́ nejjednoduššı́m systémem se spojitým časem, ve kterém vznikajı́ chaotické atraktory. Je známo mnoho jiných systémů s chaotickým chovánı́m. Např. Rösslerův model
ẋ = −y − z,
ẏ = x + ay,
ż = b + (x − c)z
má při určitých pevných hodnotách a, b stabilnı́ limitnı́ cyklus, při růstu řı́dı́cı́ho parametru c probı́hajı́
bifurkace zdvojujı́cı́ periodu a pro c > c∞ vznikajı́ složité chaotické atraktory ve tvaru trychtýře
(obr.12.7).
Např. při pevných hodnotách a = b = 0, 2 a při proměnném c se měnı́ chovánı́ systému od
jednoduchého periodického řešenı́ přes zdvojovánı́ period až k chaotickému chovánı́ pro c > c∞ ≈ 4, 2.
KAPITOLA 12. CHAOS
111
Při určitých hodnotách c > c∞ (přibližně v rozsahu 4,25 - 4,5) se dokonce prolı́najı́ dvě chaotická
pásma. Při plně vyvinutém chaosu jsou trajektorie na atraktoru narůstajı́cı́ spirály, které se při určité
kritické amplitudě velmi rychle vracejı́ k nestabilnı́mu pevnému bodu, a znovu se rozvı́jejı́.
Snad nejjednoduššı́ autonomnı́ obvod, ve kterém mohou vzniknout chaotické atraktory je obvod
se dvěma kondenzátory, jednou indukčnostı́, jednı́m lineárnı́m a jednı́m nelineárnı́m odporem. Tento
obvod popsal Chua [24].
Obrázek 12.7: Rösslerův chaotický atraktor
Matematický model Chuova obvodu lze po zavedenı́ poměrných proměnných vyjádřit rovnicemi
ẋ = a(y − h(x))
kde
h(x) =
ẏ = x − y + z


 bx + a − b
ax

 bx − a + b
ż = −βy,
x≥1
|x| < 1
x ≤ −1
U neautonomnı́ch systémů se spojitým časem mohou vzniknout chaotické jevy od 2.řádu výše.
Chaotické chovánı́ se objevuje při určitých hodnotách parametrů např. u buzeného Duffingova oscilátoru (rov. 2.12), Van der Polova oscilátoru (2.16) nebo u parametricky buzeného oscilátoru (2.18).
12.3
Vlastnosti chaotických atraktorů
12.3.1
Ljapunovovy exponenty
Chovánı́ trajektoriı́ v okolı́ rovnovážného stavu autonomnı́ho systému ẋ = f (x) se popisuje pomocı́
vlastnı́ch čı́sel matice linearizace (čl.4.2), pro popis chovánı́ trajektoriı́ v okolı́ uzavřené trajektorie γ
KAPITOLA 12. CHAOS
112
jsou vhodné jejı́ multiplikátory (čl.10.3). K popisu chovánı́ trajektoriı́ v okolı́ libovolné trajektorie Γ
se použı́vajı́ Ljapunovovy exponenty (zvané také charakteristické exponenty), které jsou zobecněnı́m
vlastnı́ch čı́sel nebo multiplikátorů. Ljapunovovy exponenty (LE) jsou reálná čı́sla, která lze výhodně
použı́t pro klasifikaci nechaotických i chaotických atraktorů.
Necht’ Γ(x0 ) je libovolná trajektorie, procházejı́cı́ zvoleným bodem x0 , která odpovı́dá řešenı́
x(t) = Φt (x0 ). Asymptotické chovánı́ trajektoriı́ ležı́cı́ch blı́zko Γ(x0 ) je dáno asymptotickým
chovánı́m matice linearizace toku DΦt (x0 ) rovnice ve variacı́ch pro t → ∞.
Zvolme v tečném prostoru Tx0 (Rn ) bodu x0 n lineárně nezávislých vektorů, tvořı́cı́ch jeho bázi.
Vyberme z nich k vektorů v 1 až v k (1 ≤ k ≤ n), které určujı́ k-rozměrný podprostor, tj. ve stavovém
prostoru k-rozměrný rovnoběžnostěn Pk (0) (obr. 12.8). Jeho objem Vk (0) je dán vztahem ||v 1 ∧ v 2 ∧
... ∧ v k ||, který je normou vnějšı́ho součinu vektorů v 1 , ..., v k . Fázový tok posune bod x0 za čas t do
bodu Φt (x0 ) a vektory v i se zobrazı́ na DΦt (x0 )v i , které vytvořı́ rovnoběžnostěn Pk (t). Jeho objem
Vk (t) je
||DΦt (x0 )v 1 ∧ ... ∧ DΦt (x0 )v k ||.
(12.10)
Poznámka: Vnějšı́ součin vektorů (nazývaný také smı́šený součin vektorů) v 1 , v 2 , ..., v n je skalárnı́
součin (u, v n ), kde u =< v 1 , ..., v n−1 > je vektorový součin.
Obrázek 12.8: Změna objemu ve fázovém prostoru
Definice 12.1. Reálné čı́slo
1
||DΦt (x0 )v 1 ∧ ... ∧ DΦt (x0 )v k ||
ln
t→∞ t
||v 1 ∧ v 2 ∧ ... ∧ v k ||
λ(k) (x0 , v 1 , ..., v k ) = lim
(12.11)
se nazývá k-rozměrný Ljapunovův exponent trajektorie Γ(x0 ) (za předpokladu, že limita existuje).
Poznámky:
1. V literatuře je zvykem označovat Ljapunovovy exponenty pı́smenem λ a proto je třeba dát pozor
na záměnu se stejným označenı́m pro vlastnı́ čı́sla matic.
2. Volı́me-li v tečném prostoru jen jeden vektor, dostaneme jednorozměrný Ljapunovův exponent
1
||Dφt (x0 )v||
ln
t→∞ t
||v||
λ ≡ λ(1) ≡ λ(x0 , v) = lim
(12.12)
Jednorozměrné exponenty mohou nabývat při konstantnı́m x0 (tj. pro jednu trajektorii) nejvýše n
různých hodnot
λ1 ≥ λ2 ≥ λ3 ≥ ... ≥ λn .
(12.13)
Tyto exponenty popisujı́, jak rychle se odpovı́dajı́cı́ body na vyšetřované a perturbované trajektorii
po dlouhé době od sebe vzdálı́ (λ > 0) nebo se k sobě přiblı́žı́ (λ < 0). Citlivá závislost na počátečnı́ch
KAPITOLA 12. CHAOS
113
podmı́nkách nastává, je-li alespoň jeden LE kladný.
n
) různých hodnot a každý z nich je součtem k jednorozměrných
k
LE. Např. pro trajektorii v R3 jsou tři dvourozměrné LE
3. k-rozměrné LE mohou nabývat (
(2)
λ 1 = λ1 + λ2
(2)
(2)
λ2 = λ1 + λ3
λ3 = λ 2 + λ 3 .
(12.14)
4. Jestliže množina lineárně nezávislých vektorů v 1 , ..., v k je v tečném prostoru Tx0 (Rn ) vybrána
náhodně, pak lze dokázat, že pravá strana rovnice (12.11) konverguje s pravděpodobnostı́ jedna k
(k)
maximálnı́mu k-rozměrnému LE λmax . Vztah (12.12) nenı́ tedy pro určenı́ všech n jednorozměrných
LE vhodný, protože všechny volby vektoru v vedou k maximálnı́mu λmax . Použitı́m vztahu (12.11)
(1)
(n)
však můžeme zı́skat (pomocı́ počı́tače) n maximálnı́ch hodnot λmax , ..., λmax , z nichž lze přı́mo vyčı́slit
všechny jednorozměrné LE podle vztahů
λ1 = λ(1)
max
(1)
λ2 = λ(2)
max − λmax
...
(n−1)
λn = λ(n)
max − λmax .
(12.15)
Jednorozměrné LE jsou vhodné pro klasifikaci ustáleného chovánı́. U diferenciálnı́ch rovnic s dimenzı́ n ≥ 3 mohou nastat čtyři různé typy atraktorů (tři nechaotické a jeden chaotický), které lze
klasifikovat podle znamének Ljapunovových exponentů.
Nechaotické atraktory
1. Rovnovážný stav: λi < 0, i = 1, ..., n; symbolicky (−, −, ..., −)
2. Limitnı́ cyklus: λ1 = 0, λi < 0 (i = 2, ..., n); (0, −, −, ..., −)
3. Kvaziperiodický atraktor (K-torus): λ1 = λ2 = ... = λK = 0;
λi < 0
(i = K + 1, ..., n)
(0, 0, ..., 0, −, −, ..., −).
U nechaotických atraktorů nenı́ žádný LE kladný. Počet nulových LE nechaotického hyperbolického
atraktoru udává (topologickou) dimenzi atraktoru. Rovnovážný stav má dimenzi 0, limitnı́ cyklus 1,
K-torus dimenzi K.
Obrázek 12.9: Změna objemového elementu u chaotické dynamiky
Chaotické atraktory musejı́ mı́t alespoň jeden LE kladný a jeden nulový. Protože současně musı́
být součet LE každého atraktoru záporný, musı́ mı́t chaotický atraktor alespoň tři LE. Odtud vyplývá,
že chaos nemůže nastat u autonomnı́ch systémů 1. a 2. řádu a u neautonomnı́ch systémů 1. řádu. Pro
3. řád jsou tedy LE λ1 > 0, λ2 = 0, λ3 < 0. Protože kontrakce musı́ převážit nad expanzı́, musı́ být
λ3 < −λ1 .
U 4. řádu jsou již tři možnosti, z nichž byly v reálných systémech pozorovány dvě:
λ1 > 0, λ2 = 0, λ4 ≤ λ3 < 0
(+, 0, −, −)
KAPITOLA 12. CHAOS
λ1 ≥ λ2 > 0, λ3 = 0, λ4 < 0
114
(+, +, 0, −) (hyperchaos).
Tečný prostor podél trajektorie Γ se rozpadá na tři části, v nichž se trajektorie a) vzdalujı́ exponenciálně rychle od Γ, b) rychlost vzdalovánı́ nebo přibližovánı́ je nižšı́ než exponenciálnı́, c) probı́há
exponenciálně rychlá kontrakce ke Γ. Časový vývoj objemového elementu spočı́vá tedy u chaotického
atraktoru v tom, že v jednom směru element rychle kontrahuje, v druhém zůstává (v průměru)
konstantnı́ a ve třetı́m směru neustále expanduje. Protože však element musı́ zůstat v ohraničené
množině uvnitř atraktoru, docházı́ nutně k postupnému skládánı́ a vytvářenı́ komplikované struktury
chaotického atraktoru (obr.12.9).
Ljapunovovy exponenty lze zı́skat výpočtem na počı́tači podle výše uvedených definičnı́ch vztahů
nebo měřenı́m na reálném systému. V obou přı́padech však dostaneme jen vı́ce či méně přesné odhady
těchto exponentů.
12.3.2
Dimenze atraktorů
Existuje mnoho dynamických systémů, u nichž vznikajı́ chaotické atraktory. Abychom je mohli mezi sebou nějak srovnávat a klasifikovat do určitých třı́d podobnosti, je třeba mı́t k dispozici vhodný deskriptor, který by jednoduše a výstižně tyto atraktory charakterizoval. Takovým deskriptorem nemohou
být původnı́ rovnice dynamického systému, protože bez podrobné analýzy se z nich nepozná složitost
chovánı́. Navı́c je třeba studovat i systémy, u nichž předpokládáme existenci chaotického atraktoru,
ale jejichž dynamický popis neznáme.
Pro charakterizaci atraktorů nejsou také vhodné časové průběhy veličin, protože i u jednoho
systému jsou při velmi citlivé závislosti na počátečnı́ch podmı́nkách každé dva průběhy značně odlišné.
Srovnávánı́ průběhů pro dva různé systémy by proto bylo naprosto nesmyslné.
Pro charakteristiku periodičnosti procesů lze použı́t autokorelačnı́ funkce nebo výkonové spektrálnı́
hustoty. Pro studium chaotických procesů, které jsou podstatně složitějšı́ než procesy periodické, jsou
však nevýhodné. Poskytujı́ málo informace a navı́c popisujı́ systém velmi nepřesně, protože systémy
velmi odlišné mohou mı́t řešenı́ s přibližně stejnými spektry.
Byly proto navrženy některé speciálnı́ charakteristiky, které se obvykle nazývajı́ dimenze. Ty
odrážejı́ určité kvalitativnı́ rysy chovánı́ dynamického systému, jako je např. složitost atraktoru, lze z
nich odhadnout dolnı́ hranici počtu proměnných potřebných k modelovánı́ dynamického chovánı́ na
atraktoru, resp. je lze chápat jako množstvı́ informace nutné k určenı́ polohy bodu na atraktoru s
danou přesnostı́. Dimenze charakterizujı́ vlastnosti atraktoru jediným čı́slem a jsou invariantnı́ vůči
spojité změně souřadnic stavového prostoru. To je důležité, protože při volbě jiné reprezentace, která
vznikne spojitou transformacı́ původnı́ch veličin, se typ procesu neměnı́ a neměla by se proto měnit
ani hodnota přı́slušné dimenze.
Existuje mnoho definic dimenze, v základě je však lze rozdělit na dvě velké skupiny. Prvnı́ typ
závisı́ jen na metrických vlastnostech, druhý pak na pravděpodobnostnı́ch vlastnostech, tj. závisı́ na
frekvenci, s nı́ž typická trajektorie procházı́ různými částmi atraktoru. Mnoho přı́kladů potvrzuje
domněnku, že dimenze prvnı́ skupiny dávajı́ tutéž hodnotu, která se obecně lišı́ od hodnoty, kterou
dávajı́ definice druhé skupiny.
Metrické dimenze.
Jako přı́klad této skupiny dimenzı́ může sloužit Kolmogorovova dimenze zvaná také kapacita nebo
fraktálnı́ dimenze
ln N (ε)
dK = lim
(12.16)
ε→0 ln(ε−1 )
kde N (ε) je minimálnı́ počet n-rozměrných krychliček o straně ε, potřebných k pokrytı́ uvažované
množiny. Jestliže limita neexistuje, nelze dimenzi definovat.
KAPITOLA 12. CHAOS
115
Uvedený vztah můžeme odvodit touto úvahou. Část stavového prostoru obsahujı́cı́ atraktor budeme
uvažovat jako jednotkový objem, rozdělený pravidelnou mřı́žı́ krychliček o hraně ε. Počet krychliček
N pokrývajı́cı́ch atraktor bude N = 1/εn , kde n je topologická dimenze daného stavového prostoru.
Logaritmovánı́m tohoto vztahu dostaneme výraz
n=−
lnN
lnN
=
.
lnε
ln(ε−1 )
(12.17)
Abychom vyjádřili hustotu pokrytı́ dané části stavového prostoru atraktorem, budeme uvažovat pouze
ty krychle, ve kterých ležı́ alespoň jeden bod atraktoru. Počet takových krychlı́ označme N (ε) a
dosad’me do vztahu (12.17) za N . Tı́m dostaneme nějaké čı́slo dK (ε) = −lnN (ε)/lnε. Zvolı́me-li ε
dostatečně velké, budou trajektorie atraktoru procházet všemi krychlemi a bude N = N (ε) a dK (ε) =
n. Při postupném zmenšovánı́ ε nebude již atraktor procházet všemi krychlemi a bude platit, že
N (ε) < N a dK (ε) < n. Čı́m bude ε menšı́, tı́m přesněji bude přı́slušné dK (ε) charakterizovat vyplněnı́
zvolené části stavového prostoru atraktorem. V určitém smyslu nejlepšı́ charakteristiku dostaneme,
vezmeme-li limitu
ln N (ε)
dK = lim dK (ε) = lim
.
(12.18)
ε→0
ε→0 − ln ε
Takto definované čı́slo je právě Kolmogorovova dimenze (12.16). Tato dimenze odrážı́ kvalitativně mı́ru
složitosti daného atraktoru. Např. jednobodový atraktor (rovnovážný stav) má dK = 0, protože pro
libovolné ε je N (ε) = 1. To odpovı́dá intuitivnı́ představě, že bod nezaplňuje žádný prostor. Dále lze
ukázat, že dimenze hladké křivky (např. limitnı́ho cyklu) je 1, dimenze hladké plochy je 2, hladké kplochy je k. To platı́ i pro jiné dimenze, které budou dále uvedeny. Numerické výpočty Kolmogorovovy
dimenze fraktálnı́ch množin a chaotických atraktorů dávajı́ necelá čı́sla.
Přı́klad 12.1. Dimenze jednotkového intervalu.
Pokryjme jednotkový interval [0, 1] objemovými elementy (intervaly) o délce ε = 1/3k . K pokrytı́ je
třeba N (ε) = 3k těchto objemových elementů. Pro k → ∞ bude
ln3k
= 1.
k→∞ ln3k
dK = lim
Jednotkový interval má tedy fraktálnı́ dimenzi 1.
Přı́klad 12.2. Cantorova fraktálnı́ množina vzniká iteračně postupným vynechávánı́m prostřednı́ch
třetin nejprve z intervalu [0, 1], pak ze zbývajı́cı́ch dvou subintervalů [0,1/3], [2/3,1] atd. Použijeme-li
k pokrytı́ zase elementy o délce ε = 1/3k , je v k-tém kroku počet potřebných elementů N (ε) = 2k a
ln2k
ln2
=
= 0, 6309...
k
k→∞ ln3
ln3
dK = lim
Cantorova množina nenı́ ani bod (s dimenzı́ 0), ani spojitý interval (s dimenzı́ 1). Fraktálnı́ množiny
majı́ tedy neceločı́selné dimenze.
Dimenze závislé na pravděpodobnostnı́ch vlastnostech. Přı́kladem dimenze tohoto typu je
informačnı́ dimenze (Hausdorffova dimenze), která bere v úvahu také relativnı́ pravděpodobnost
použitých krychliček. Je dána vztahem
H(ε)
,
ε→0 ln (ε−1 )
dI = lim
N (ε)
H(ε) =
X
Pi ln(1/Pi ),
(12.19)
i=1
kde Pi je pravděpodobnost průchodu trajektoriı́ atraktoru i-tou krychličkou. H(ε) je vzhledem ke své
definici informačnı́ entropie. Hausdorffova dimenze lépe odrážı́ vnitřnı́ strukturu chaotických atraktorů
KAPITOLA 12. CHAOS
116
než fraktálnı́ dimenze, protože bere vlastně v úvahu i časové chovánı́ dynamického systému.
Přı́klad 12.3. Předpokládejme zase, že atraktor je jednotkový interval a že hustota pravděpodobnosti
je konstantnı́. Volme opět elementy pokrytı́ o délce ε = 1/3k . Pak N (ε) = 3k a Pi = 1/3k . Entropie
k
H(ε) = −
3
X
1
i=1
3k
ln
1
= ln3k .
3k
Informačnı́ dimenze
ln3k
= 1.
k→∞ ln3k
Dimenze dI = dK . Obecně platı́ dK ≥ dI , i když jejich numerický rozdı́l nemusı́ být velký. Např. pro
Lorenzův atraktor při parametrech s = 10, b = 8/3, r = 24, 74 je dK = 2, 08 a dI = 2, 06.
dI = lim
Obě dimenze majı́ některé zajı́mavé vlastnosti. Zaokrouhlı́me-li jejich hodnotu nahoru na nejbližšı́
celé čı́slo, dostaneme topologickou dimenzi nejmenšı́ho stavového prostoru, který zahrne bez zkreslenı́
celý vyšetřovaný atraktor.
Ljapunovova dimenze dL je dána vztahem
dL = k +
Pk
i=1 λi
|λk+1 |
(12.20)
Ljapunovovy exponenty atraktoru dynamického systému se spojitým časem jsou λ1 ≥ ... ≥ λn . Čı́slo
k ve vztahu (12.20) je takové největšı́ celé čı́slo, pro které platı́ λ1 + ... + λk ≥ 0, a λk+1 je v absolutnı́
hodnotě nejmenšı́ záporný exponent. Ljapunovovy exponenty λi jsou tedy v relaci s dimenzı́ atraktoru.
Pro stabilnı́ hyperbolický rovnovážný stav je dL = 0. Stabilnı́ limitnı́ cyklus má λ1 = 0, ostatnı́
Ljapunovovy exponenty jsou záporné, proto dL = 1. U chaotického atraktoru je Ljapunovova dimenze
téměř vždy neceločı́selná. Numerické výpočty ukazujı́, že pro typický atraktor je dI = dL . Tento
vztah má význam zejména při počı́tačových experimentech, protože Ljapunovovy exponenty se zjišt’ujı́
obvykle jednodušeji než dimenze.
Kapitola 13
Metoda ekvivalentnı́ch přenosů
Metoda ekvivalentnı́ch přenosů, známá také pod názvem metoda harmonické rovnováhy, je odvozena z
asymptotických metod pro řešenı́ nelineárnı́ch systémů. Jejı́m základem je Krylovova a Bogoljubovova
metoda harmonické linearizace. V letech 1947 až 1950 byla metoda ekvivalentnı́ch přenosů v pěti
různých zemı́ch téměř nezávisle na sobě rozpracována pro praktické řešenı́ nelineárnı́ch problémů.
Metoda umožňuje předevšı́m stanovit existenci meznı́ch cyklů, jejich počet a stabilitu. Je jı́ však
možno využı́t i pro jednoduché syntézy nelineárnı́ch obvodů, pro vkládánı́ vhodných korekčnı́ch členů
za účelem stabilizace apod. Rozšı́řenı́m základnı́ verze metody lze pak řešit i stabilitu buzených obvodů,
existenci a vlastnosti subharmonických a ultraharmonických kmitů, skokových rezonancı́ apod.
13.1
Princip metody ekvivalentnı́ch přenosů pro jeden vstup
Nejprve budeme vyšetřovat existenci periodických ustálených stavů autonomnı́ch systémů s jednou oddělenou stacionárnı́ nelinearitou a s lineárnı́mi členy, které jsou soustředěny do členu G(jω)
(obr.13.1). Vzniknou-li v obvodu ustálené kmity, budou v různých mı́stech obvodu obecně periodické,
ale neharmonické, zejména na výstupu nelinearity.
Obrázek 13.1: Blokové schéma nelin. systému
Budeme předpokládat, že lineárnı́ člen filtruje vyššı́ harmonické tohoto průběhu e2 (t), takže na
výstupu lineárnı́ho prvku a tı́m také na vstupu nelinearity bude přı́tomna jen prvnı́ harmonická z
výstupnı́ho signálu nelinearity. Za těchto předpokladů můžeme definovat tzv. ekvivalentnı́ přenos
N nelineárnı́ho prvku jako poměr prvnı́ harmonické výstupu e2 (t) k sinovému signálu e1 (t) na vstupu
nelinearity.
Při vyšetřovánı́ existence autooscilacı́ v obvodu pak nahradı́me nelineárnı́ člen ekvivalentnı́m
přenosem N a sestavı́me charakteristickou rovnici obvodu N G + 1 = 0, kterou řešı́me analogickými
metodami, použı́vanými v teorii lineárnı́ch systémů.
Při odvozenı́ metody budeme vycházet z těchto předpokladů:
1. Na výstupu nelineárnı́ho členu uvažujeme jen prvnı́ harmonickou. To znamená, že se bud’ musı́
117
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
118
nelineárnı́ charakteristika členu málo lišit od lineárnı́ho průběhu nebo lineárnı́ část musı́ mı́t vlastnosti
dolnofrekvenčnı́ propusti (má-li rezonanci, musı́ být špička v oblasti prvnı́ harmonické).
2. Charakteristiky systému jsou časově invariantnı́.
3. Systém obsahuje jen jednu nelinearitu (na vı́ce nelinearit rozšı́řı́me metodu v čl. 13.5)
4. Při sinovém vstupu nemá výstup z nelinearity konstantnı́ složku (uvažujeme zatı́m jen nelineárnı́
členy s lichými statickými charakteristikami - na jiné typy charakteristik rozšı́řı́me metodu v čl. 13.6).
Prvnı́ dva předpoklady jsou nezbytné, dalšı́ dva použijeme jen pro odvozenı́ základnı́ verze metody
a v dalšı́ch článcı́ch ukážeme řešenı́ i bez těchto omezenı́.
Odvozenı́ ekvivalentnı́ho přenosu pro jeden vstup
Přivedeme-li na nelineárnı́ prvek (obr.13.1) vstupnı́ signál
e1 (t) = A sin ωt
(13.1)
bude výstup e2 (t) obsahovat vyššı́ harmonické. Můžeme ho rozložit ve Fourierovu řadu
e2 (t) = a1 sin ωt + a2 sin 2ωt + ... + b0 + b1 cos ωt + b2 cos 2ωt + ...
(13.2)
Podle předpokladu 4 bude člen b0 = 0. Uvažujeme-li na výstupu jen prvnı́ harmonickou, pak
e2 (t) ≈ Aa(A, ω) sin ωt + Ab(A, ω) cos ωt,
(13.3)
položı́me-li a1 = Aa, b1 = Ab. Koeficienty u sinové a kosinové složky jsou obecně funkcı́ vstupnı́
amplitudy A a kruhové frekvence ω.
Pro nelineárnı́ člen budeme nynı́ definovat jeho ekvivalentnı́ přenos jako poměr prvnı́ harmonické výstupnı́ho signálu k sinovému vstupu stejným způsobem jako pro lineárnı́ systémy (pomocı́
symbolicko-komplexnı́ metody). Pak
Ê2
N (A, ω) =
Ê1
=
A[a(A, ω) + jb(A, ω)]
= a(A, ω) + jb(A, ω).
A
(13.4)
Přenos má obecně reálnou a imaginárnı́ složku a je funkcı́ amplitudy i frekvence vstupnı́ho signálu.
Můžeme ho vyjádřit také pomocı́ amplitudy a fáze ve tvaru
N (A, ω) = |N (A, ω)| ejγ(A, ω) ,
(13.5)
kde
|N (A, ω)| =
q
[a(A, ω)]2 + [b(A, ω)]2
γ(A, ω) = arctg
b(A, ω)
.
a(A, ω)
(13.6)
Ekvivalentnı́ přenos můžeme vynášet do komplexnı́ roviny nebo do logaritmických souřadnic. Často
se použı́vá inverznı́ hodnota ekvivalentnı́ho přenosu
N −1 (A, ω) =
1
.
N (A, ω)
(13.7)
Pro různé nelineárnı́ členy jsou v literatuře vypočı́tány a vykresleny ekvivalentnı́ přenosy v různých
souřadnicı́ch. Pro výpočty koeficientů prvnı́ harmonické Fourierovy řady platı́ vztahy
2
a1 =
T
Z
T
e2 (t) sin ωtdt
0
2
b1 =
T
Z
T
e2 (t) cos ωtdt.
(13.8)
0
Pro T = 2π/ω dostaneme výsledné vztahy
a(A, ω) =
a1 (A, ω)
ω
=
A
πA
Z
0
2π/ω
e2 (t) sin ωtdt
(13.9)
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
b1 (A, ω)
ω
b(A, ω) =
=
A
πA
Z
119
2π/ω
e2 (t) cos ωtdt
(13.10)
0
Ekvivalentnı́ přenos se velmi často uvažuje ve tvaru N (A, ω) = KN N0 (A, ω), kde KN je konstanta
nelinearity a N0 (A, ω) je normovaný ekvivalentnı́ přenos, který je v literatuře k dispozici ve formě
tabulek a grafů.
13.2
Ekvivalentnı́ přenosy pro frekvenčně nezávislé nelinearity
Při praktickém řešenı́ jednoduššı́ch nelineárnı́ch systémů se vyskytujı́ nejčastěji nelinearity, které jsou
definovány jen statickou závislostı́, bud’ v analytickém tvaru nebo tabulkou či grafem. Výstupnı́ signál
e2 = φ(e1 ) takové nelinearity závisı́ jen na okamžité hodnotě vstupu a ne na jeho derivacı́ch a integrálech. Ekvivalentnı́ přenos nebude v tomto přı́padě záviset na frekvenci ω a bude jen funkcı́ amplitudy N (A). Aby Fourierova řada výstupnı́ho signálu neměla podle předpokladu 4 konstantnı́ složku
b0 , budeme uvažovat pouze liché charakteristiky, pro které platı́ φ(−e1 ) = −φ(e1 ).
Obrázek 13.2: Průběhy signálů u trojpolohové charakteristiky
Pro výpočet koeficientů položı́me ve vzorcı́ch (13.9) a (13.10) ωt = ψ. Pak
a(A) =
b(A) =
1
πA
Z
2π
1
πA
Z
2π
e2 (ψ) sin ψdψ
(13.11)
e2 (ψ) cos ψdψ
(13.12)
0
0
Imaginárnı́ složka b(A) je úměrná ploše statické charakteristiky nelineárnı́ho členu. Podle rovnice
(13.12) totiž platı́
b(A) =
1
πA2
+
Z
Z
0
2π
1
φ(A sin ψ)d(A sin ψ) =
πA2
0
φ(e1 )de1 +
A
Z
−A
φ(e1 )de1 +
0
Z
"Z
A
φ(e1 )de1 +
0
#
0
−A
φ(e1 )de1 =
S
,
πA2
kde S je plocha uzavřená větvemi statické charakteristiky nelinearity. Pro jednoznačné charakteristiky
je tedy b(A) = 0, přenos N (A) má tedy jen reálnou část.
Přı́klad 13.1. Nelineárnı́ člen s trojpolohovou charakteristikou podle obr. 13.2 má ekvivalentnı́ přenos
N (A) = a(A) =
4
πA
Z
π/2
α
M sin ψ dψ =
4M
cos α,
πA
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
120
kde α = arcsin (δ/A), b(A) = 0.
Abychom mohli vyšetřovat vlastnosti různých systémů, ve kterých je použito této nelinearity, ale s různými
konstantami δ a M , je výhodné uvažovat vstupnı́ amplitudu v poměrné hodnotě A/δ. Použijeme pak normovaného přenosu pro poměrné amplitudy
r
r
A
4M
4M
δ 2
M 4 δ
δ
A
A
cos α =
1−( ) =
1 − ( )2 = KN N0 ( ),
N ( ) = a( ) =
δ
δ
πA
πA
A
δ πA
A
δ
kde KN = M/δ je konstanta nelinearity a zbytek výrazu tvořı́ normovaný ekvivalentnı́ přenos (pro poměrnou
amplitudu) N0 (A/δ). Na obr. 13.3a je tento přenos zobrazen v závislosti na A/δ, na obr. 13.3b,c je vynesen N0
a N0−1 do komplexnı́ roviny, na obr.13.3d do souřadnic amplituda (v dB) - fáze (tzv. Nicholsův graf).
Obr.13.3. Průběh normovaného ekvivalentnı́ho přenosu trojpolohového prvku
a) závislost na poměrné amplitudě
b) N0 v komplexnı́ rovině
c) inverznı́ normovaný přenos v komplexnı́ rovině
d) inverznı́ přenos v Nicholsově grafu
Některé analytické výrazy pro ekvivalentnı́ přenosy jednoduššı́ch nelinearit jsou uvedeny v tab.
13.1.
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
121
Tab. 13.1. Analytické vyjádřenı́ ekvivalentnı́ch přenosů jednoduchých nelinearit
Složité typy nelinearit dávajı́ velmi nepřehledné vzorce a pro praktické účely se hodı́ jen jejich
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
grafické zobrazenı́.
Obr. 13.4a
Obr. 13.4b
Obr. 13.4c
122
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
123
Na obr. 13.4a,b,c jsou vyneseny průběhy normovaných ekvivalentnı́ch přenosů třı́ často se vyskytujı́cı́ch nelinearit. Normované přenosy v komplexnı́ rovině jsou pro dvě typické nelinearity na obr.
13.5 a 13.6.
Obr. 13.5. Inverznı́ normovaný ekvivalentnı́ přenos v komplexnı́ rovině
Obr. 13.6. Inverznı́ normovaný ekvivalentnı́ přenos hystereznı́ charakteristiky
13.3
Ekvivalentnı́ přenosy pro frekvenčně závislé nelinearity
Při řešenı́ nelineárnı́ch systémů se vyskytujı́ také nelinearity, které jsou frekvenčně závislé. Jsou
popsány nelineárnı́ diferenciálnı́ rovnicı́ a jejich ekvivalentnı́ přenos bude funkcı́ amplitudy i frekvence.
Jako přı́klad může sloužit blok, který má v přı́mé větvi lineárnı́ prvek a ve zpětné vazbě statickou
nelinearitu (obr. 13.7). Ekvivalentnı́ přenos mezi vstupem e1 a výstupem e2 je frekvenčně závislý. Na
tento typ přenosů vede také řešenı́ systémů s většı́m počtem nelinearit, i když jednotlivé nelinearity
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
124
jsou frekvenčně nezávislé (čl. 13.5).
Výpočet ekvivalentnı́ch přenosů pro frekvenčně závislé nelinearity lze provést různými metodami. V
jednoduššı́ch přı́padech analyticky, častěji však jen pomocı́ počı́tače. Vykreslenı́ ekvivalentnı́ho přenosu
v komplexnı́ rovině provádı́me tak, že pro zvolenou konstantnı́ frekvenci vypočı́táme a vyneseme jednu
křivku pro různé vstupnı́ amplitudy. Přı́klad bude uveden v čl. 13.5.
Obr. 13.7
13.4
Periodická řešenı́ autonomnı́ch systémů
V nelineárnı́m autonomnı́m systému, jehož lineárnı́ část je soustředěna v přenosu G(jω) a nelinearita
je nahrazena ekvivalentnı́m přenosem N (A, ω) (obr. 13.8), vzniknou ustálené kmity,
bude-li platit Ê1 = −Ê3 . Tato podmı́nka znamená, že v rozpojeném obvodu při sinovém signálu
e1 na vstupu nelineárnı́ho členu bude mı́t výstup e3 z lineárnı́ho členu stejnou amplitudu jako vstup
a fázi otočenou o 1800 . Upravı́me-li uvedený vztah na
Ê1
Ê2
=−
Ê3
Ê2
Obr. 13.8
a dosadı́me-li za
Ê3
Ê2
= G(jω)
a
Ê2
Ê1
= N (A, ω),
dostaneme komplexnı́ rovnici
G(jω)N (A, ω) + 1 = 0,
(13.13)
která je analogická charakteristické rovnici lineárnı́ho obvodu. Jejı́m řešenı́m zı́skáme přibližné hodnoty
amplitud a frekvencı́ prvnı́ch harmonických limitnı́ch cyklů v obvodu. Řešenı́ rovnice (13.13) lze provést
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
125
různým způsobem:
a) Analytické řešenı́ je vhodné pro zjištěnı́ obecných závislostı́, ale u složitých nelinearit a při
vysokém řádu lineárnı́ části je velmi pracné a nevede bez použitı́ počı́tače k cı́li. Rovnici (13.13)
můžeme psát ve tvaru
[a(A, ω) + jb(A, ω)] [ReG(jω) + jImG(jω)] + 1 = 0.
(13.14)
Rozložı́me-li tuto komplexnı́ rovnici na reálnou a imaginárnı́ část
U (A, ω) + jV (A, ω) = 0,
pak řešenı́m soustavy U (A, ω) = 0, V (A, ω) = 0 nalezneme amplitudy Ai a základnı́ frekvence ωi všech
meznı́ch cyklů. Kmity budou existovat, vyjdou-li odpovı́dajı́cı́ páry Ai , ωi reálné a kladné. Nalezené
hodnoty amplitud představujı́ amplitudy kmitů na vstupu nelineárnı́ho členu. Zjistı́me-li existenci limitnı́ch cyklů, je třeba ještě stanovit jejich stabilitu, protože kmity mohou být stabilnı́ nebo nestabilnı́.
Je možno dokázat [21], že periodické řešenı́ bude stabilnı́ při
∂U ∂V
∂U ∂V
−
> 0.
∂A ∂ω
∂ω ∂A
(13.15)
b) Grafické řešenı́ v komplexnı́ rovině je pro složitějšı́ systémy výhodnějšı́ než analytické. Aby
byla splněna rovnice (13.13) musı́ platit např.
G(jω) = −
1
N (A, ω)
nebo
1
= −N (A, ω)
G(jω)
(13.16)
nebo dalšı́ dvě možnosti s prohozenými znaménky. Budeme použı́vat prvnı́ tvar, který se pro frekvenčně
nezávislé nelinearity zjednodušı́ na
1
G(jω) = −
.
(13.17)
N (A)
Do komplexnı́ roviny budeme vynášet frekvenčnı́ charakteristiku lineárnı́ části a záporný inverznı́ ekvivalentnı́ přenos (obr. 13.9). Průsečı́ky obou křivek určujı́ amplitudy a frekvence autooscilacı́. Jestliže
se křivky neprotı́najı́, nevznikajı́ zpravidla v reálném systému autooscilace. Toto tvrzenı́ je však třeba
brát opatrně, protože je někdy řešenı́ obvodu nepřı́pustně zjednodušeno, např. se neuvažovala některá
nelinearita. Rovněž nemusejı́ platit předpoklady pro použitı́ metody ekvivalentnı́ch přenosů (např.
lineárnı́ člen dostatečně nefiltruje vyššı́ harmonické). U naprosté většiny přı́padů však odhadneme
fyzikálnı́m názorem, zda při neprotnutı́ křivek skutečně nenastávajı́ v systému autooscilace, přı́padně
ověřı́me zı́skané výsledky simulacı́ na počı́tači.
Křivky na obr. 13.9 se protı́najı́ ve dvou bodech P a Q. Je třeba určit, který z průsečı́ků odpovı́dá
stabilnı́mu a který nestabilnı́mu limitnı́mu cyklu. Pro vyšetřenı́ stability, např. bodu P, předpokládejme
malou změnu amplitudy A o ∆A. Aby bod P odpovı́dal stabilnı́m kmitům, musı́ být při zvětšené
amplitudě A (tj. při kladném ∆A) oscilace tlumené a při zmenšené amplitudě A musı́ narůstat. Podle
rovnice (13.17) a obr. 13.9 je tedy pro stabilnı́ meznı́ cyklus zapotřebı́, aby při kladném ∆A byl vektor
odpovı́dajı́cı́ −N −1 (A) většı́ než G(jω), tj. 01 > 02. Pro záporné ∆A je pak třeba, aby −N −1 (A)
bylo menšı́ než G(jω), tj. 03 < 04. Bod P odpovı́dá tedy stabilnı́mu meznı́mu cyklu a určuje reálné
autooscilace v obvodu. Stejným způsobem zjistı́me, že bod Q odpovı́dá nestabilnı́mu meznı́mu cyklu.
Při počátečnı́ch podmı́nkách amplitud menšı́ch než A, určené bodem Q, budou tedy v obvodu tlumené
kmity. Pro většı́ počátečnı́ podmı́nky se obvod rozkmitává a kmity se ustálı́ na amplitudě a kmitočtu,
které jsou dány bodem P.
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
Obr.13.9
126
0br.13.10
Je-li ekvivalentnı́ přenos závislý na frekvenci, lze podmı́nku existence kmitů vyjádřit ve tvaru
G(jω) = −
1
N (A, ω)
(13.18)
Řešenı́ v komplexnı́ rovině je již obtı́žnějšı́. Pro určitou zvolenou frekvenci ω = ω1 je záporný inverznı́ ekvivalentnı́ přenos už jen funkcı́ amplitudy a můžeme jej vynést do komplexnı́ roviny jako
jednu křivku. Pro jinou hodnotu ω = ω2 zı́skáme dalšı́ křivku atd. K této jednoparametrické soustavě
křivek přikreslı́me frekvenčnı́ charakteristiku lineárnı́ části (obr.13.10). Autooscilace odpovı́dajı́ jen
těm průsečı́kům, ve kterých souhlası́ hodnoty frekvencı́.
c) Grafické řešenı́ v logaritmických souřadnicı́ch je méně přehledné, protože je třeba vykreslovat
dva grafy, jeden pro amplitudy a jeden pro fáze. Výhodou je snadné vynášenı́ frekvenčnı́ch charakteristik lineárnı́ části obvodu.
d) Grafické řešenı́ v Nicholsově grafu (amplituda v dB - fáze ve stupnı́ch). Tento způsob spojuje
výhody předchozı́ch metod. Řešenı́ se provádı́ v jediném obrázku a charakteristiky lineárnı́ části se
rychle vynášejı́.
13.5
Nelineárnı́ systémy s většı́m počtem nelinearit
Metodu ekvivalentnı́ch přenosů lze rozšı́řit i na vyšetřovánı́ stability autonomnı́ch obvodů s většı́m
počtem nelinearit, které jsou od sebe odděleny lineárnı́mi členy nebo kde jsou nelinearity ve zpětných
vazbách kolem lineárnı́ch členů. Uvažujme např. obvod podle obr. 13.11.
Obr. 13.11. Obvod s většı́m počtem nelinearit
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
127
Rozpojme smyčku na vstupu do prvnı́ nelinearity a přived’me na tento vstup signál e1 = A1 sin ωt,
v komplexnı́m zápisu Ê1 = A1 exp(jωt). Předpokládejme, že z periodického kmitánı́ na výstupu prvnı́
nelinearity projde na výstup lineárnı́ho členu G1 jen prvnı́ harmonická, vyššı́ harmonické budou prvkem
G1 dostatečně odfiltrovány. Na vstupu druhého nelineárnı́ho členu bude proto opět sinový kmit e3 =
A3 sin (ωt + φ). Pak platı́ obecně
Ê2 = N1 (A1 , ω)Ê1
Ê3 = G1 (jω)Ê2
Ê4 = N2 (A3 , ω)Ê3
Ê5 = G2 (jω)Ê4
Aby mohly v uzavřeném obvodu existovat autooscilace, musı́ platit
Ê5 = −Ê1
(13.19)
Dosadı́me-li z předchozı́ch vztahů, dostaneme podmı́nku
G1 (jω)G2 (jω)N1 (A1 , ω)N2 (A3 , ω) = −1.
(13.20)
Označı́me-li celkový přenos lineárnı́ části G(jω) = G1 (jω)G2 (jω), můžeme podmı́nku existence kmitů
zapsat např. ve tvaru
1
(13.21)
G(jω) = −
N1 (A1 , ω)N2 (A3 , ω)
Ekvivalentnı́ přenos N2 (A3 , ω) je funkcı́ frekvence a amplitudy A3 , která při zvolené hodnotě A1 již
nenı́ nezávislá a je třeba ji vypočı́tat podle vztahu
A3 = |G1 (jω)||N1 (A1 , ω)|A1 .
Pak
(13.22)
0
N2 (A3 , ω) = N2 (|G1 (jω)||N1 (A1 , ω)|A1 ; ω) = N2 (A1 , ω).
(13.23)
Podmı́nka harmonické rovnováhy platná pro vznik autooscilacı́ je
G(jω) = −
1
= −N −1 (A1 , ω)
0
N1 (A1 , ω)N2 (A1 , ω)
(13.24)
I v přı́padě, že obě nelinearity majı́ ekvivalentnı́ přenos závislý jen na amplitudě, bude po přepočtu
0
podle rovnice (13.22) N2 funkcı́ amplitudy i frekvence a rovněž tak i výsledné přenosy N nebo N −1 .
Řešenı́ vztahu (13.24) lze zase provést bud’ analyticky (vede však většinou na velmi komplikované
výrazy) nebo graficky. Při většı́m počtu nelinearit je postup obdobný.
13.6
Nelineárnı́ systémy s nesymetrickými vlastnı́mi kmity
V nelineárnı́ch systémech mohou kromě symetrických vlastnı́ch kmitů vznikat také kmity nesymetrické. Objevujı́ se předevšı́m při nesymetrické nelineárnı́ charakteristice (při působenı́ vnějšı́ch budı́cı́ch
signálů i bez nich), vlivem konstantnı́ho nebo pomalu se měnı́cı́ho budı́cı́ho signálu i při symetrické
nelineárnı́ charakteristice a v mnoha jiných přı́padech.
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
128
Obr.13.12
Obr.13.13
Na obr. 13.12 je zakreslena nesymetrická nelinearita, u nı́ž vznikajı́ na výstupu nesymetrické kmity i
při symetrickém vstupnı́m signálu. U symetrické nelinearity na obr. 13.13 má výstup konstantnı́ složku
jen při nesymetrickém vstupnı́m kmitu e1 .
Řešenı́ stability nelineárnı́ho systému se provádı́ obdobně jako u systému se symetrickými vlastnı́mi
kmity. Předpokládá se zase, že vlivem filtračnı́ho účinku lineárnı́ho členu G jsou potlačeny vyššı́ harmonické, takže vstup na nelinearitu můžeme uvažovat ve tvaru e1 = A0 + A sin ωt. Výstupnı́ signál
rozložı́me ve Fourierovu řadu a zanedbáme vyššı́ harmonické, konstantnı́ složku označı́me a0 . Pak
e2 ≈ a0 (A0 , A, ω) + Aa(A0 , A, ω) sin ωt + Ab(A0 , A, ω) cos ωt,
(13.25)
kde všechny tři členy jsou obecně funkcı́ A0 , A, ω. Pro výpočet Fourierových koeficientů platı́ vztahy
a0 (A0 , A, ω) =
ω
2π
Z
2π/ω
ω
πA
Z
2π/ω
ω
b(A0 , A, ω) =
πA
Z
2π/ω
a(A0 , A, ω) =
e2 (t)dt
(13.26)
e2 (t) sin ωtdt
(13.27)
e2 (t) cos ωtdt
(13.28)
0
0
0
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
129
Definujeme-li ekvivalentnı́ přenos opět vztahem
N (A0 , A, ω) = a(A0 , A, ω) + jb(A0 , A, ω),
(13.29)
představuje metoda ekvivalentnı́ch přenosů současné ověřenı́ platnosti dvou podmı́nek, a to podmı́nky
stejnosměrné a střı́davé rovnováhy.
Podmı́nka stejnosměrné rovnováhy definuje vztahy mezi konstantnı́mi složkami A0 = e10 na vstupu
a e20 na výstupu nelinearity. Složka e20 musı́ být v rovnováze s e10 přes lineárnı́ část obvodu. Podmı́nku
stejnosměrné rovnováhy lze tedy psát ve tvaru
A0 = e10 = w − Ke20 (A0 , A, ω),
(13.30)
kde K je zesı́lenı́ lineárnı́ části obvodu pro konstantnı́ signál a w je vstup zpětnovazebnı́ho obvodu.
Obsahuje-li přenos lineárnı́ části pól v počátku, musı́ být e20 rovno nule, aby e30 bylo konečné.
Podmı́nka střı́davé rovnováhy je definována stejnými vztahy jako pro symetrické oscilace, tj.
N (A0 , A, ω) G(jω) + 1 = 0.
(13.31)
Ekvivalentnı́ přenos je nynı́ obecně funkcı́ třı́ proměnných.
V jednoduššı́ch přı́padech, kdy na vstupu obvodu je nulový nebo konstantnı́ vstupnı́ signál w, je
také e10 = A0 rovno konstantě a z podmı́nky pro stejnosměrnou rovnováhu zı́skáme velikost A0 jako
funkci A, ω. Dosadı́me-li toto řešenı́ do rovnice (13.31) pro střı́davou rovnováhu, zı́skáme jejı́m řešenı́m
hodnoty A, ω přı́padných autooscilacı́. Po určenı́ A, ω je možno pak čı́selně stanovit i velikost A0 .
Pro statické nelineárnı́ prvky jsou koeficienty a0 , a, b i přenos N jen funkcemi vstupnı́ amplitudy
A a stejnosměrné složky na vstupu nelinearity A0 .
Obr. 13.14. Nesymetrická reléová charakteristika
V přı́kladu 13.2 je spočı́tán ekvivalentnı́ přenos nesymetrické nelinearity s nesymetrickým vstupnı́m
signálem a v přı́kladu 13.3 je řešen nelineárnı́ systém s touto nelinearitou. Podrobné řešenı́ systémů s
nesymetrickými vlastnı́mi kmity je uvedeno např. v [21].
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
130
Přı́klad 13.2. Na obr. 13.14a je znázorněna nesymetrická statická charakteristika dvoupolohového
prvku. Koeficienty a0 , a, b i přenos N nejsou závislé na ω. Výstupnı́ signál z tohoto nesymetrického
prvku má konstantnı́ složku e20 , a to i v přı́padě, že vstupnı́ signál by měl stejnosměrnou složku A0
nulovou.
Pro e1 = A0 + A sin ψ, (ψ = ωt) je
e20 = a0 (A0 , A) =
=
=
1
2π
Z
2π
e2 (ψ)dψ =
0
π−α
2π+α
1
(1 − m)M
(1 + m)M α
M dψ −
mM dψ =
+
=
2π α
2
π
π−α
(1 − m)M
(1 + m)M
A0
+
arcsin
2
π
A
Z
Z
(13.32)
2π
1
a(A0 , A) = N (A0 , A) =
e2 (ψ) sin ψdψ =
πA 0
Z π+α
Z 2π−α
M
=
sin ψdψ − m
sin ψdψ =
πA −α
π+α
Z
2(1 + m)M
2(1 + m)M
=
cos α =
πA
πA
b(A0 , A) = 0.
s
1−(
A0 2
)
A
(13.33)
(13.34)
Přı́klad 13.3. Určenı́ amplitudy a frekvence autooscilacı́ u systému podle obr. 13.15 s nespojitou nesymetrickou
nelinearitou. Každý signál má konstantnı́ a střı́davou složku ei = ei0 + e?i .
Obr. 13.15. Systém s nespojitou nesymetrickou nelinearitou
Rovnováha konstantnı́ch složek.
V ustáleném stavu se na vstupu nelineárnı́ho prvku objevı́ sinové kmity s konstantnı́ složkou e1 = A0 +
A sin ωt, kde A0 = e10 . Složka e20 musı́ být rovna nule, jinak by integračnı́ člen trvale integroval. Pak platı́
A0 = e10 = e60 − K3 e30 = −K1 e30 − K3 e30 = −e30 (K1 + K3 ).
Ze vztahu
a0 = e20 =
(1 − m)M
(1 + m)M
A0
+
arcsin
=0
2
π
A
plyne
e10 = A0 = −A sin
π1−m
,
2 1+m
Rozvedenı́m podle známých vztahů pro sin (α − β) je
e10 = A0 = A cos
π
.
1+m
(13.35)
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
131
Rovnováha střı́davých složek. Pro zjištěnı́ autooscilacı́ sestavı́me charakteristickou rovnici G(jω)N (A0 , A)+
1 = 0. Ekvivalentnı́ přenos je podle vztahu (13.33)
r
e10 2
2(1 + m)M
N (A0 , A) =
1−(
) .
πA
A
Obr. 13.16
Dosadı́me-li za e10 ze vztahu (13.35), bude ekvivalentnı́ přenos již funkcı́ jen vstupnı́ amplitudy A
2(1 + m)M
π
konst.
sin
=
πA
1+m
A
(13.36)
K 2 K3
K 1 K2
+
.
s(T1 s + 1)(T2 s + 1) s(T2 s + 1)
(13.37)
N (A) =
Přenos lineárnı́ části obvodu je
G(s) =
Charakteristickou rovnici je možno při volbě konkrétnı́ch čı́selných konstant řešit graficky. Tento jednoduššı́
systém můžeme ale také řešit analyticky, čı́mž zı́skáme obecné vztahy pro amplitudu a frekvenci autooscilacı́
pro různé volby konstant obvodu. Dosazenı́m lineárnı́ho přenosu do charakteristické rovnice dostaneme
T1 T2 s3 + (T1 + T2 )s2 + (1 + T1 K2 K3 N (A))s + (K1 + K3 )K2 N (A) = 0.
(13.38)
Pro s = jω je třeba simultánně řešit dvě rovnice
(K1 + K3 )K2 N (A) − (T1 + T2 )ω 2 = 0
(13.39)
(1 + T1 K2 K3 N (A))ω − T1 T2 ω 3 = 0.
(13.40)
Vyloučı́me N (A) z rovnice (13.39)
T1 T2 ω 2 − 1
.
T 1 K 2 K3
Dosazenı́m do (13.40) a úpravou zı́skáme frekvenci autooscilacı́
s
K1 + K3
ω=
.
T1 (T2 K1 − T1 K3 )
N (A) =
(13.41)
(13.42)
Dosazenı́m N (A) a ω 2 do (13.39) zı́skáme po jednoduchých úpravách amplitudu autooscilacı́
A=
2M K2 T1 (T2 K1 − T1 K3 )
π
Ac
π
(1 + m) sin
=
(1 + m) sin
,
π(T1 + T2 )
1+m
2
1+m
(13.43)
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
132
kde Ac je amplituda vlastnı́ch kmitů při symetrické nelinearitě. Tı́m jsme vyřešili vlastnosti autooscilacı́ obecně
v závislosti na všech konstantách lineárnı́ i nelineárnı́ části obvodu.
Na obr. 13.16 je vynesena amplituda A a posuv e10 v závislosti na veličině m, která charakterizuje nesymetrii
nelineárnı́ho prvku.
13.7
Ekvivalentnı́ přenos nelinearity se dvěma vstupy
Všechny jevy spojené se vznikem subharmonických nebo ultraharmonických kmitů a s otázkami stability autooscilačnı́ch nelineárnı́ch systémů buzených periodickým vstupnı́m signálem nelze již řešit
jednoduchým ekvivalentnı́m přenosem, protože vstup na nelineárnı́ prvek nenı́ v těchto přı́padech
jednoduchý sinový kmit. V literatuře byl zaveden tzv. ekvivalentnı́ přenos pro dva vstupy (v angl. literatuře ”Dual-input Describing Function, zkráceně DIDF), který umožnil vysvětlit velmi složité jevy,
vznikajı́cı́ v buzených nelineárnı́ch obvodech. Uvedeme jen stručně princip a možnosti této metody,
podrobnosti lze nalézt např. v [21,27].
Vstup na nelinearitu se uvažuje ve tvaru
e1 = A sin (ωA t + ϕA ) + B sin (ωB t + ϕB ),
(13.44)
kde amplitudy A, B a frekvence ωA , ωB se určı́ podle povahy systému a jeho vstupů. Studuje-li se
např. chovánı́ nelineárnı́ho autooscilačnı́ho systému buzeného vstupnı́m periodickým signálem, bude
ωA odpovı́dat frekvenci autooscilacı́, ωB frekvenci vstupnı́ho signálu. Při zkoumánı́ vzniku subharmonických a ultraharmonických kmitů jsou frekvence v jednoduchém násobném poměru. Pro tyto speciálnı́
přı́pady můžeme položit ωB = nωA a vstup na nelinearitu se zjednodušı́ na tvar
e1 = A sin ωt + B sin (nωt + ϕ).
(13.45)
Ekvivalentnı́ přenos pro dva vstupy je funkcı́ většı́ho počtu parametrů a jeho odvozenı́ pro různé nelinearity je složité. Ekvivalentnı́ přenos můžeme definovat jako poměr určité harmonické výstupu a
přı́slušné složky o stejné frekvenci na vstupu nelineárnı́ho prvku. Protože na vstupu jsou dvě složky,
lze definovat ekvivalentnı́ přenos pro každou z nich. Pomocı́ těchto přenosů lze pak studovat např.
problémy vzniku a odstraněnı́ subharmonických v nelineárnı́ch obvodech, vznik ultraharmonických
kmitů apod. Byly např. stanoveny oblasti v komplexnı́ rovině, do kterých nesmı́ vstoupit frekvenčnı́
charakteristika lineárnı́ části obvodu, nemajı́-li vzniknout subharmonické kmity. Pomocı́ metody ekvivalentnı́ch přenosů lze pak vkládat do obvodu vhodné korekce, které vzniku subharmonických zabránı́.
Ekvivalentnı́ přenos pro dva vstupy lze zjednodušit, je-li frekvence vstupu mnohem vyššı́ než
frekvence autooscilacı́ nebuzeného obvodu. Pak
e1 = A sin ωt + B sin βt,
β >> ω
(13.46)
Amplitudu nı́zkofrekvenčnı́ složky je pak možno považovat za konstantu v každém kmitu
vysokofrekvenčnı́ složky. Tı́mto zjednodušenı́m lze vysvětlit např. možnosti odstraněnı́ autooscilacı́
pomocı́ periodického vstupnı́ho signálu.
Dalšı́ zjednodušenı́ představuje ekvivalentnı́ přenos pro dva vstupy při malé amplitudě ε jednoho
vstupnı́ho signálu na nelinearitu. Pro e1 pak platı́
e1 = A sin ωt + ε sin (nωt + ϕ).
(13.47)
Tato aproximace se často využı́vá při studiu stability oscilacı́, vzniku skokových rezonancı́ a jiných
jevů.
Ekvivalentnı́ přenos pro dva vstupy je v literatuře důkladně rozpracován, jsou tabelovány mnohé
grafy různých přenosů pro běžně se vyskytujı́cı́ nelinearity a lze proto řešit i velmi speciálnı́ problémy
KAPITOLA 13. METODA EKVIVALENTNÍCH PŘENOSŮ
133
složitých nelineárnı́ch systémů. Musı́me mı́t ovšem stále na paměti, že metoda ekvivalentnı́ch přenosů
je určitou vı́ce či méně přesnou aproximacı́ a je třeba vždy dbát na to, aby byly splněny podmı́nky
dostatečné filtrace vyššı́ch harmonických. Zı́skané výsledky lze ovšem kontrolovat a zpřesňovat simulacı́.
Kapitola 14
Metody syntézy nelineárnı́ch řı́dı́cı́ch
systémů
Úkolem syntézy je navrhnout k dané lineárnı́ nebo nelineárnı́ soustavě vhodný lineárnı́ nebo nelineárnı́
regulátor, který by zajistil splněnı́ požadavků na žádané chovánı́ uzavřeného obvodu. Bude-li cı́lem
řı́zenı́ stabilnı́ chovánı́ a vhodná dynamika při velkých rychlostech a pracovnı́ch rozsazı́ch, je většinou
nutné nelineárnı́ řı́zenı́.
Úkoly řı́zenı́ můžeme rozdělit zhruba do dvou základnı́ch skupin. Jedná se bud’ o stabilizaci, kdy
je cı́lem stabilizovat uzavřený obvod do jednoho rovnovážného stavu nebo o sledovánı́, při kterém je
třeba navrhnout vhodný regulátor tak, aby výstup systému se pohyboval po žádané trajektorii.
Stabilizačnı́ problém.
Úkolem je nalézt pro daný nelineárnı́ systém ẋ = f (t, x, u) takový řı́dı́cı́ zákon u, aby při libovolné
počátečnı́ podmı́nce x0 v požadované oblasti Ω směřoval stav x(t) do žádaného rovnovážného stavu
a dosáhl jej v konečném nebo nekonečném čase (nebo zůstal alespoň dostatečně blı́zko). Přı́kladem
stabilizačnı́ úlohy je regulace teploty v peci na konstantnı́ hodnotu, regulace hladiny v kotli, regulace
letu letadla v konstantnı́ výšce apod.
Problém sledovánı́.
U tohoto problému je zadán systém ẋ = f (t, x, u), výstup y = h(x) a žádaná trajektorie výstupu
reprezentovaná časovým průběhem řı́dı́cı́ veličiny w(t). Úkolem je nalézt takové řı́zenı́ u, aby při
pohybu z libovolného počátečnı́ho stavu v oblasti Ω směřovala regulačnı́ odchylka e(t) = w(t) − y(t)
k nule a stav zůstal ohraničený.
Dokonalé sledovánı́ nastává, jestliže při vhodných počátečnı́ch podmı́nkách je y(t) = w(t) pro
všechna t ≥ 0. Asymptotické sledovánı́ je takové, u něhož se dosáhne dokonalého sledovánı́ asymptoticky.
U mnoha praktických problémů je pro výpočet vhodného řı́zenı́ u předem k dispozici žádaná
hodnota w(t) spolu se svými derivacemi až do dostatečně vysokého řádu. Např. u robotů je pohyb
po žádané trajektorii často předem naplánován, takže potřebné derivace w(t) lze snadno vypočı́tat.
U jiných systémů je známý sice jen žádaný průběh w(t), ale jeho derivace lze zı́skat např. pomocı́
referenčnı́ho modelu.
Problémy sledovánı́ jsou obtı́žnějšı́ než problémy stabilizace, protože při sledovánı́ musı́ řı́dı́cı́
systém udržovat nejen stabilnı́ stav systému, ale také udržovat výstup systému na požadované trajektorii.
Při návrhu řı́zenı́ se obvykle postupuje v tomto sledu:
1) fyzikálnı́ systém se modeluje pomocı́ soustavy diferenciálnı́ch rovnic;
2) specifikuje se žádané chovánı́, zvolı́ se snı́mače a akčnı́ členy a namodelujı́ se jejich vlastnosti;
134
KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ
135
3) navrhne se podle zvolené metody vhodná struktura řı́zenı́ systému a parametry tohoto řı́zenı́;
4) analýzuje se chovánı́ výsledného systému (nejčastěji simulacı́ na počı́tači). Nejsou-li vlastnosti vyhovujı́cı́, je třeba se vrátit k bodu tři a zvolit jinou metodu pro návrh řı́zenı́;
5) implementuje se řı́dı́cı́ systém pomocı́ analogového nebo čı́slicového řı́zenı́.
U nelineárnı́ch systémů je důležitá podrobná znalost fyzikálnı́ch vlastnostı́ systému. Ta umožňuje
často posoudit, které nelinearity jsou podstatné a které lze, alespoň při prvnı́m návrhu, zanedbat.
Pochopenı́ fyzikálnı́ch vlastnostı́ často umožňuje vhodný návrh i u složitých systémů s mnoha vstupy a
výstupy, např. u manipulátorů a robotů. Jejich inerčnı́ matice je pozitivně definitnı́ a může být využita
pro volbu vhodné Ljapunovovy funkce, která zajistı́ globálnı́ stabilitu a konvergenci při sledovánı́ (odst.
14.2.2).
Specifikace žádaného chovánı́ je u nelineárnı́ch systémů obtı́žnějšı́ než u systémů lineárnı́ch. Návrh
musı́ zajistit stabilitu, nejlépe globálnı́, nebo alespoň v dostatečně velké oblasti počátečnı́ch podmı́nek.
Pro zvolené typické trajektorie musı́ být zajištěna vyhovujı́cı́ rychlost a přesnost odezvy. Výsledný
systém by měl být robustnı́, tj. necitlivý na poruchy, šum, malé změny parametrů, vliv nenamodelované
dynamiky apod. Pro praxi je nezanedbatelná také cena řı́dı́cı́ho systému.
14.1
Linearizace nelineárnı́ch systémů
Fyzikálnı́, chemické a jiné systémy jsou většinou nelineárnı́ a jejich řı́zenı́ je obtı́žné. Velmi často
se proto snažı́me nějakým vhodným způsobem systém linearizovat, protože metody řı́zenı́ lineárnı́ch
systémů jsou podrobně rozpracovány a umožňujı́ relativně jednoduchý návrh řı́dı́cı́ho systému. Linearizaci lze provádět různými metodami. Jde bud’ o linearizaci v jednom pracovnı́m bodě nebo ve vı́ce
pracovnı́ch bodech, nebo o tzv. exaktnı́ (zpětnovazebnı́) linearizaci. Tyto přı́stupy si probereme dále
podrobněji.
14.1.1
Linearizace v pracovnı́m bodě
V mnoha přı́padech můžeme nelineárnı́ systém linearizovat ve zvoleném pracovnı́m bodě, lineárnı́
aproximace však dává jen lokálnı́ popis chovánı́ systému a zanedbává všechny speciálnı́ jevy, které
mohou nelineárnı́ systémy mı́t. Často to však lze tolerovat a aproximačnı́ model pak umožnı́ využı́t
všechny známé metody řı́zenı́ lineárnı́ch systémů.
14.1.2
Linearizace ve vı́ce pracovnı́ch bodech
Metoda je známa pod anglickým názvem ”gain scheduling” (programované zesı́lenı́). U této metody se
volı́ většı́ počet pracovnı́ch bodů, které dostatečně pokrývajı́ pracovnı́ oblast, a kolem nich se systém
linearizuje. Pro každou linearizaci se pak navrhne vhodný, obvykle lineárnı́ regulátor. Globálnı́ nelineárnı́ regulátor se zı́ská bud’ přepı́nánı́m přı́slušných regulátorů při pohybu v blı́zkosti odpovı́dajı́cı́ho
pracovnı́ho bodu nebo spojitou interpolacı́ parametrů regulátorů při pohybu mezi pracovnı́mi body.
Tato heuristická metoda se použı́vá v mnoha aplikacı́ch, jako přı́klad lze uvést řı́zenı́ letadla.
Jednotlivé linearizace odpovı́dajı́ různým letovým podmı́nkám, které jsou charakterizovány polohou
a rychlostı́ letadla a atmosférickými vlivy. Nadřazený regulátor pak přepı́ná jednotlivé regulátory
navržené pro dı́lčı́ linearizované soustavy.
Metoda linearizace ve vı́ce pracovnı́ch bodech je principiálně jednoduchá a je užitečná zejména při
řı́zenı́ ve velkých pracovnı́ch oblastech. Rychlé přepı́nánı́ jednotlivých regulátorů nebo rychlé spojité
změny parametrů těchto regulátorů však mohou někdy vést ke zhoršenı́ přechodných jevů nebo dokonce
k nestabilitě systému. Tyto jevy však většinou nenastanou při pomalých přechodech mezi různými
KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ
136
operačnı́mi podmı́nkami [44].
14.1.3
Exaktnı́ linearizace
Nejobecnějšı́m způsobem linearizace systému je tzv. exaktnı́ (přesná) linearizace, která se nazývá také
často zpětnovazebnı́ linearizace. Základnı́ princip metody spočı́vá ve snaze vykompenzovat nelinearity
systému jinými nelinearitami a převést jej tak na lineárnı́ systém. Kompenzace nelinearit může být
bud’ částečná nebo úplná a lze ji provést bud’ globálně v celém stavovém prostoru nebo lokálně
v určité oblasti, která však může být podstatně většı́ než je přı́pustná oblast při linearizaci kolem
pracovnı́ho bodu. Metodám exaktnı́ch linearizacı́ je v poslednı́ch letech věnována velká pozornost a
existuje množstvı́ publikacı́ na toto téma. Proto věnujeme exaktnı́m linearizacı́m samostatnou kapitolu
15.
14.2
Základnı́ metody syntézy řı́zenı́
Stejně jako pro analýzu nelineárnı́ch systémů tak i pro syntézu řı́zenı́ neexistuje univerzálnı́ metoda
pro návrh vhodného regulátoru. Bylo publikováno mnoho metod, většina z nich je však vhodná jen
pro určité typy systémů. Proto také klasifikace metod a jejich vlastnostı́ je obtı́žná.
14.2.1
Lineárnı́ nebo linearizovaná soustava s nelineárnı́m řı́zenı́m
Pokud je daná regulovaná soustava lineárnı́ nebo ji lze některou z metod čl. 14.1 linearizovat s vyhovujı́cı́ přesnostı́ v požadované pracovnı́ oblasti, můžeme použı́t k jejı́mu popisu lineárnı́ diferenciálnı́
rovnice. K této soustavě pak můžeme zvolit spojitě nebo nespojitě pracujı́cı́ regulátor.
1. Spojitě pracujı́cı́ regulátory s parazitnı́mi nelinearitami
Pro řı́zenı́ lineárnı́ soustavy volı́me nejčastěji PID-regulátor nebo stavový regulátor. Parazitnı́ nelinearity ve snı́mačı́ch, zesilovačı́ch nebo akčnı́ch členech bud’ při prvnı́m hrubém návrhu zanedbáme
nebo se je snažı́me vhodným způsobem kompenzovat. Pokud to z nějakých důvodů nelze, provedeme
syntézu regulátoru s parazitnı́mi nelinearitami některou metodou, která byla uvedena v předchozı́ch
kapitolách. Vhodné zesı́lenı́ obvodu a jeho stabilitu můžeme zajistit např. pomocı́ Ljapunovovy teorie,
Popovova nebo kruhového kritéria, nebo pomocı́ metody ekvivalentnı́ch přenosů. Dynamické vlastnosti
výsledného návrhu ověřı́me simulacı́.
Vliv nasycenı́ akčnı́ch členů
Omezenı́ výstupu akčnı́ho členu vede ke zhoršenı́ přechodných jevů nebo i k nestabilitě při většı́ch
poruchách. Má-li regulátor integračnı́ složku, pak při dosaženı́ hranice omezenı́ se nezvětšuje vstup na
regulovanou soustavu, ale integrátor může dále integrovat. Vlivem omezenı́ akčnı́ veličiny je reakce
regulátoru na změnu polarity jeho vstupnı́ho signálu zpožděna. Tento jev se označuje anglickým
termı́nem windup a je třeba jej kompenzovat. Lze např. omezit vstupnı́ signál integračnı́ složky vhodnou nelineárnı́ zpětnou vazbou kolem integrátoru, nebo se integračnı́ složka nuluje, přestoupı́-li regulačnı́ odchylka určitou velikost. Podrobnějšı́ rozbor lze nalézt např. v [44].
Nejhoršı́ vliv má nasycenı́ na vstupu nestabilnı́ soustavy. Např. zpětnovazebnı́ systém s PIregulátorem s nasycenı́m a s jednoduchou nestabilnı́ soustavou s přenosem 1/(s − 1) dává při malých
vstupnı́ch signálech w stabilnı́ odezvu, při většı́ch hodnotách w je systém silně nestabilnı́. V literatuře
je uvedeno, že tento typ selhánı́ byl jednou z přı́čin katastrofy v Černobylu.
Nepřı́jemný vliv saturace na vstupu soustavy lze snı́žit na minimum vhodným návrhem. Pokud je
to možné, je třeba se vyhnout podmı́nečně stabilnı́m regulačnı́m obvodům a velkým hodnotám žádané
KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ
137
veličiny w.
2. Nespojitě pracujı́cı́ regulátory
Tyto regulátory se použı́vajı́ tehdy, nenı́-li spojitá akčnı́ veličina z konstrukčnı́ho nebo ekonomického
hlediska výhodná. Regulátor obsahuje většinou prvek s nespojitou charakteristikou dvoupolohového,
třı́polohového nebo vı́cepolohového typu. Časté využitı́ je u jednoduchých a laciných regulacı́, např.
při regulaci teploty v chladničkách, pračkách, žehličkách a jiných domácı́ch spotřebičı́ch, při regulaci
asynchronnı́ch motorů aj.
Návrh jednoduchých nespojitě pracujı́cı́ch regulátorů lze provést např. metodou ekvivalentnı́ch
přenosů nebo simulacı́. Přı́klady syntézy řı́zenı́ s třı́polohovým regulátorem jsou uvedeny ve skriptu
[5].
Nespojité regulátory jsou často doplněny impulsovánı́m, které může být bud’ z nezávislého zdroje
nebo je realizováno pomocı́ samobuzených kmitů, které vzniknou přidánı́m vhodného lineárnı́ho členu
do zpětné vazby kolem nespojitého prvku. Impulsovánı́m se činnost nespojitého regulátoru přibližuje
činnosti regulátoru pracujı́cı́ho spojitě, protože plynulá změna akčnı́ veličiny se nahrazuje šı́řkovou
pulsnı́ modulacı́ s konstantnı́ amplitudou.
Doplněnı́m nespojitých regulátorů vhodnými nelineárnı́mi členy zı́skáme jednoduchá časově optimálnı́ řı́zenı́. Základnı́ schemata a způsoby návrhu jsou pro systémy nižšı́ho řádu uvedena ve skriptech
[5,8].
14.2.2
Nelineárnı́ soustava s lineárnı́m nebo nelineárnı́m řı́zenı́m
Pokud jsme neprovedli linearizaci soustavy některou z metod čl. 14.1, můžeme navrhnout k dané nelineárnı́ regulované soustavě vhodný regulátor pomocı́ Ljapunovovy teorie nebo simulacı́.
1. Návrh řı́zenı́ pomocı́ Ljapunovovy teorie
Pro návrh vhodného řı́zenı́ nelineárnı́ regulované soustavy můžeme použı́t přı́mou Ljapunovovu
metodu. Postupovat lze v podstatě dvojı́m způsobem. Při prvnı́m přı́stupu zvolı́me nějakou
Ljapunovovu funkci a pak hledáme řı́dı́cı́ zákon, který by potvrdil, že zvolená funkce vyhovuje. U
druhého přı́stupu volı́me nejprve určité řı́zenı́ u(x), o němž předpokládáme, že bude vyhovujı́cı́ a pak
hledáme Ljapunovovu funkci, která by ověřila stabilitu výsledného uzavřeného obvodu. Tyto přı́stupy
se často využı́vajı́ při návrhu robustnı́ho řı́zenı́, adaptivnı́ho řı́zenı́, řı́zenı́ s klouzavým režimem aj.
Přı́klad 14.1. Prvnı́ přı́stup k návrhu řı́zenı́ ilustrujme na systému
ẋ2 = −a(x2 ) − b(x1 ) + u.
ẋ1 = x2
(14.1)
V odst. 5.3.1 jsme viděli, že pro nebuzený systém tohoto typu lze zvolit Ljapunovovu funkci na základě
fyzikálnı́ analogie ve tvaru
Z x1
1 2
V (x) = x2 +
b(x1 )dx1
(14.2)
2
0
Systém je asymptoticky stabilnı́, jsou-li splněny podmı́nky
x2 a(x2 ) > 0 ∀ x2 6= 0
a
x1 b(x1 ) > 0
∀ x1 6= 0.
(14.3)
Necht’ je dán např. systém
ẋ1 = x2
ẋ2 = −α1 x32 − α2 x21 + u,
(14.4)
kde hodnoty koeficientů α1 , α2 nejsou přesně známy, platı́ však: α1 > −1 a |α2 | < 4. Uzavřený obvod
bude stabilnı́, zvolı́me-li řı́zenı́ ve tvaru
u = −x32 − 4(x1 + x31 ).
(14.5)
KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ
138
Rovnice uzavřeného obvodu jsou
ẋ2 = −(x32 + α1 x32 ) − (4x31 + α2 x21 + 4x1 )
ẋ1 = x2
(14.6)
a jsou splněny podmı́nky stability
x2 a(x2 ) = x2 (x32 + α1 x32 ) > 0
α1 > −1
pro
x1 b(x1 ) = x1 (4x31 + α2 x21 + 4x1 ) > 0
pro
|α2 | < 4.
Návrh zajišt’uje kromě stability i určitou nezávislost na změnách parametrů v odpovı́dajı́cı́ch intervalech.
Přı́klad 14.2. Druhý přı́stup ilustruje tento návrh. Je dán systém
ẋ1 = x22 − x31
ẋ2 = −x2 + x1 u.
(14.7)
Volı́me-li řı́zenı́ u = x1 − x2 , je uzavřený obvod popsán rovnicemi
ẋ1 = x22 − x31
ẋ2 = −x2 + x21 − x1 x2 .
(14.8)
Zvolme V = x21 + x22 . Derivace
V̇ = −2(x41 − x21 x2 + x22 ) = −2[(x2 − 0, 5x21 )2 + 0, 75x41 ]
je vždy záporná, takže x = 0 je asymptoticky stabilnı́ rovnovážný stav.
Přı́klad 14.3. Návrh řı́zenı́ robotu [52].
Na tomto přı́kladu můžeme ilustrovat rovněž druhý přı́stup. U průmyslových robotů se často použı́vajı́
proporcionálně derivačnı́ regulátory pro řı́zenı́ polohy ramena. Složitá dynamika robota s n pohyblivými rameny je dána soustavou n nelineárnı́ch rovnic ve tvaru
H(x)ẍ + b(x, ẋ) + g(x) = u,
(14.9)
kde x je n-dimenzionálnı́ vektor popisujı́cı́ úhlové polohy kloubů robotu, ẋ jsou rychlosti pohybu
kloubů, g je vektor gravitačnı́ch momentů, b představuje odstředivé a Coriolisovy momenty, u je
vektor vstupnı́ch (řı́dı́cı́ch) momentů a H je inerčnı́ matice rozměru n × n.
Kinetická energie robotu je T = 1/2 ẋT H(x)ẋ a musı́ být kladná pro každou polohu x a každou
nenulovou rychlost kloubu ẋ. Matice H(x) je tedy symetrická pozitivně definitnı́ matice.
Cı́lem řı́zenı́ je dosaženı́ žádané polohy xw ramen robotu. Pro řı́zenı́ polohy budeme uvažovat
proporcionálně derivačnı́ regulátory
uj = −kP j x̃j − kDj ẋj ,
(14.10)
kde x̃j = xj − xjw je odchylka polohy každého kloubu od žádané hodnoty a ẋj jsou rychlosti pohybu
v kloubech. Obecněji můžeme řı́zenı́ zapsat ve tvaru
u = −K P x̃ − K D ẋ,
(14.11)
kde K P a K D jsou konstantnı́ symetrické pozitivně definitnı́ matice (podle vztahů (14.10) by byly jen
diagonálnı́). Na K P a K D se lze dı́vat jako na konstanty, které by u obecného mechanického systému
definovaly nějaké pružiny nebo tlumiče.
KAPITOLA 14. METODY SYNTÉZY NELINEÁRNÍCH ŘÍDÍCÍCH SYSTÉMŮ
139
Uvažujme nynı́ jako Ljapunovovu funkci V virtuálnı́ mechanickou energii uzavřeného obvodu při
volbě řı́zenı́ podle rovnice (14.11) ve tvaru
1
V = [ẋT H ẋ + x̃T K P x̃],
2
(14.12)
kde prvnı́ člen představuje kinetickou energii manipulátoru a druhý člen jakousi ”umělou” potenciálnı́
energii virtuálnı́ch pružin v zákonu řı́zenı́ (14.11).
Při výpočtu derivace V̇ můžeme pro zjednodušenı́ použı́t energetický vztah platný v mechanice,
který řı́ká, že rychlost změny kinetické energie je rovný výkonu vnějšı́ch sil
d 1 T
[ ẋ H ẋ] = ẋT u.
dt 2
(14.13)
V̇ = ẋT u + ẋT K P x̃ = ẋT (u + K P x̃).
(14.14)
Pak
Při použitı́ řı́dı́cı́ho zákona (14.11) je
V̇ = −ẋT K D ẋ ≤ 0.
(14.15)
V̇ je tedy výkon disipovaný virtuálnı́mi tlumiči (podobně jako v přı́kladu odst. 5.3.1). Lze se přesvědčit,
že V̇ = 0 jen tehdy, když x̃ = 0. Proto systém konverguje do žádaného stavu a je globálně asymptoticky
stabilnı́.
2. Návrh řı́zenı́ pomocı́ počı́tačové simulace
V odst. 2.2.5 jsme uvedli některé simulačnı́ jazyky pro modelovánı́ systémů na čı́slicových
počı́tačı́ch. Některé z nich jsou výhodné i pro návrh řı́dı́cı́ch algoritmů nelineárnı́ch systémů. Pro širšı́
využitı́ ve výzkumu a v průmyslu se použı́vajı́ např. jazyky ACSL, Desire, Omola, Dymola aj. Pro
výuku je výhodný zejména systém SIMULINK, doplněný souborem programů Nonlinear Control Design Toolbox (NCD). Tento soubor umožňuje namodelovat nelineárnı́ regulovanou soustavu a zvolený
typ regulátoru v systému SIMULINK a pak pomocı́ optimalizačnı́ch programů určit nejvýhodnějšı́ konstanty regulátoru. Systém umožňuje zvolit předem určité hranice časových průběhů různých veličin
obvodu, nastavit maximálnı́ tolerované hodnoty překývnutı́, požadovanou dobu přechodu apod. Lze
optimalizovat různé zvolené veličiny (skaláry, vektory i matice) a předem nastavit jejich tolerančnı́
oblasti pro zı́skánı́ robustnı́ho řı́zenı́. Do systému lze vkládat různé nelinearity, volit deterministické i náhodné vstupnı́ signály, minimalizovat řı́dı́cı́ energii, omezovat vliv poruchových veličin,
vytvářet adaptivnı́ řı́zenı́ apod. Program neumı́ samozřejmě najı́t optimálnı́ strukturu řı́dı́cı́ho systému,
nanavrhne vhodné kompenzačnı́ nelinearity apod. Důkladné znalosti teorie nelineárnı́ho řı́zenı́ a určité
praktické zkušenosti jsou proto základnı́ podmı́nkou pro úspěšné využitı́ počı́tačové simulace.
Kapitola 15
Exaktnı́ linearizace
Exaktnı́ nebo také často nazývané zpětnovazebnı́ linearizace spočı́vajı́ na myšlence úplného nebo alespoň částečného vykompenzovánı́ nelinearit systému tak, aby výsledný systém měl bud’ menšı́ počet
nelinearit nebo aby se choval mezi zvoleným vstupem a výstupem nebo stavy jako lineárnı́. Kompenzace nelinearit může být provedena globálně v celém stavovém prostoru nebo lokálně v určité
oblasti, která však může být postačujı́cı́ pro prakticky se vyskytujı́cı́ počátečnı́ podmı́nky. Metodám
zpětnovazebnı́ linearizace je v poslednı́ch letech věnována velká pozornost a existuje množstvı́ teoretických pracı́ i aplikačnı́ch výsledků. Dvě stěžejnı́ publikace z tohoto oboru jsou [36] a [49].
15.1
Intuitivnı́ přı́stup k linearizaci
U některých jednoduchých systémů je možno velmi snadno vykompenzovat nelinearity pomocı́ jiných
nelinearit a zı́skat tak výsledný systém, který je lineárnı́. Ten je pak možno řı́dit některým ze způsobů,
které jsou vypracovány v lineárnı́ teorii řı́zenı́. Uved’me si jednoduchý přı́klad, převzatý z [52].
Přı́klad 15.1. Regulace výšky hladiny v nádrži.
Na obr. 15.1 je zakreslena rotačnı́ nádrž, u nı́ž je třeba udržovat výšku hladiny h [m] na žádané hodnotě
hw . Označme dále přı́tok kapaliny u [m3 s−1 ], průřez odpadnı́ trubky a [m2 ] a plochu nádrže ve výšce
h jako S(h) [m2 ].
Dynamický model nádrže je
p
S(h)ḣ = u − a 2gh.
(15.1)
Řı́zenı́ tohoto nelineárnı́ho systému můžeme provést různým způsobem. Zvolı́me-li např. proporcionálnı́ regulátor
u = r0 e = r0 (hw − h),
(15.2)
√
nemůžeme dosáhnout nulové regulačnı́ odchylky, protože nelineárnı́ zpětná vazba a 2gh odstranı́
integračnı́ charakter soustavy. Nulovou regulačnı́ odchylku v ustáleném stavu zı́skáme integračnı́m
regulátorem, ale i tento způsob řı́zenı́ nenı́ přı́liš vhodný. Při velkém hw bude plocha nádrže velká,
rychlost změny výšky bude malá a h bude růst velmi pomalu. Dynamika změn bude silně záviset na
okamžité hladině.
Proved’me linearizaci daného systému tak, že zvolı́me řı́zenı́
p
u = a 2gh + S(h)v,
(15.3)
kde v je nový vstup. Pak platı́ ḣ = v a mezi novým vstupem v a výstupem h je integračnı́ závislost.
Nynı́ stačı́ použı́t proporcionánı́ regulátor
v = r0 e = r0 (hw − h),
140
(15.4)
KAPITOLA 15. EXAKTNÍ LINEARIZACE
141
při kterém je regulačnı́ odchylka v ustáleném stavu nulová a dynamika výsledného systému již nezávisı́
na okamžité hladině.
Obrázek 15.1: Regulace výšky hladiny v nádrži
Z přı́kladu je patrno, že vykompenzovánı́ nelinearit lze jednoduše provést pro třı́du nelineárnı́ch
systémů popsaných ve tvaru tzv. řiditelné kanonické formy (analogie Frobeniova kanonického tvaru u
lineárnı́ch systémů)
ẋ1 = x2
ẋ2 = x3
...
ẋn−1 = xn
(15.5)
ẋn = f (x) + g(x)u.
(15.6)
1
[v − f (x)],
g(x)
(15.7)
Zvolı́me-li u ve tvaru
u=
vykompenzujı́ se nelinearity a dostaneme jednoduchý vztah mezi novým vstupem v a výstupem x1
ve tvaru n integračnı́ch členů. Při této linearizaci jsme nezavedli žádné transformace stavů, stavové
proměnné nového (lineárnı́ho) systému jsou původnı́ proměnné x.
Syntézu regulátoru můžeme nynı́ provést metodami, které jsou známy z teorie řı́zenı́ lineárnı́ch
systémů. Použijme-li např. stavový regulátor, lze řı́dı́cı́ zákon napsat ve tvaru
v = −k1 x1 − k2 x2 − ... − kn xn
(15.8)
a dosadit do vztahu (15.7).
Např. u systému
ẋ1 = x2
ẋ2 = f (x1 , x2 ) + g(x1 , x2 )u
lze volit u ve tvaru
u=−
g(x1 , x2 ) 6= 0
f (x1 , x2 )
1
+
v.
g(x1 , x2 ) g(x1 , x2 )
∀ x1 , x2
(15.9)
(15.10)
Tı́m zı́skáme řiditelný lineárnı́ systém ẋ1 = x2 , ẋ2 = v, ke kterému můžeme zvolit vhodné lineárnı́
řı́zenı́.
15.1.1
Transformace stavových proměnných
Nenı́-li zadaný nelineárnı́ systém v řiditelné kanonické formě, je linearizace již obtı́žnějšı́. Z teorie
lineárnı́ch systémů je známo, že lze provést transformaci stavu a převést zadaný lineárnı́ systém do
Frobeniova kanonického tvaru. Podobně to lze někdy udělat u nelineárnı́ho systému.
Necht’ T (x) je hladké zobrazenı́ definované na oblasti Ω z Rn . Předpokládejme, že Jacobiova
matice zobrazenı́ T je regulárnı́ v bodě x oblasti Ω. Pak T (x) definuje lokálnı́ difeomorfismus na
KAPITOLA 15. EXAKTNÍ LINEARIZACE
142
nějaké oblasti Ω0 ⊂ Ω. Jsou-li T (x) a T −1 hladká zobrazenı́ a T (x) je invertovatelné pro všechna
x ∈ Rn , pak transformace T (x) je globálnı́ difeomorfismus.
Přı́klad 15.2. Uvažujme systém
ẋ1 = x1 ln x2
ẋ2 = −x2 ln x1 + x2 u.
(15.11)
Zaved’me kolem rovnovážného stavu x = (1, 1) lokálnı́ transformace souřadnic z = T (x)
z1 = T1 (x1 , x2 ) = ln x1
Pak
z2 = T2 (x1 , x2 ) = ln x2 .
∂T1
∂T1
1
ẋ1 +
ẋ2 =
(x1 ln x2 ) = ln x2 = z2
∂x1
∂x2
x1
∂T2
∂T2
1
ż2 =
ẋ1 +
ẋ2 =
(−x2 ln x1 + x2 u) = −ln x1 + u = −z1 + u
∂x1
∂x2
x2
ż1 =
Nelineárnı́ systém (15.11) je tedy v nových souřadnicı́ch z lineárnı́
ż1 = z2
ż2 = −z1 + u.
(15.12)
Pro zadaný nelineárnı́ systém je ovšem obtı́žné určit, zda bude existovat transformace, která
převede nelineárnı́ systém na ekvivalentnı́ systém lineárnı́. Tato úloha je obecně vyřešena v literatuře,
ale věta i jejı́ důkaz jsou složité (viz např. [36]).
Ukazuje se, že pouhá transformace souřadnic se při linearizaci dá v praxi použı́t jen u velmi malého
počtu nelineárnı́ch systémů. Většina systémů je linearizovatelná nejen s použitı́m transformace, ale také
pomocı́ vhodné přı́mé a zpětné nelineárnı́ vazby.
Metody exaktnı́ch linearizacı́ můžeme rozdělit do dvou skupin. Složitějšı́ úlohu představuje linearizace vstup-stav, kdy se snažı́me linearizovat systém mezi vstupem a všemi jeho stavy. Tomuto
přı́stupu se budeme věnovat v čl. 15.3 až po zavedenı́ některých nových matematických pojmů. Druhou
skupinu tvořı́ metody linearizace vstup-výstup, které jsou teoreticky jednoduššı́ a proto si jejich princip
uvedeme již v tomto úvodnı́m článku.
15.1.2
Linearizace vstup-výstup
Dále budeme předpokládat, že nelineárnı́ systém je v afinnı́m tvaru
ẋ = f (x) + g(x)u
y = h(x)
x ∈ Rn .
(15.13)
Zadaný systém chceme linearizovat a budeme zatı́m předpokládat, že ho lze pomocı́ vhodných transformacı́ a nelineárnı́ch vazeb převést na ekvivalentnı́ lineárnı́ systém
ż = Az + bv
ỹ = h̃(z)
z ∈ Rn .
(15.14)
Tento lineárnı́ systém si můžeme zvolit v různém tvaru, nejčastěji se použı́vá sériové zapojenı́ integračnı́ch členů.
Obě reprezentace (15.13) a (15.14) budou vstupně-výstupně ekvivalentnı́ právě tehdy, když při
stejných vstupech je stejné chovánı́ výstupů, tj. když
y (i) (t) = ỹ (i) (t)
i = 0, 1, ..., n.
(15.15)
Výpočet lineárnı́ reprezentace lze provést tak, že výstup derivujeme postupně tolikrát, až se objevı́
závislost na řı́zenı́ u. Ukažme si tento postup na jednoduchých přı́kladech.
KAPITOLA 15. EXAKTNÍ LINEARIZACE
143
a) Lineárnı́ reprezentace ve tvaru sériového zapojenı́ integrátorů
Přı́klad 15.3. Nelineárnı́ systém
ẋ1 = x2 − sin x1
ẋ2 = u
y = x1
(15.16)
chceme pomocı́ vhodných nelineárnı́ch vazeb převést na ekvivalentnı́ lineárnı́ systém reprezentovaný dvěma za
sebou zapojenými integrátory
ż1 = z2
ż2 = v
ỹ = z1 .
(15.17)
Oba systémy budou ekvivalentnı́, jestliže
ẏ = ỹ˙
y = ỹ
ÿ = ỹ¨
Derivujme výstup y postupně tolikrát, až se objevı́ závislost na u.
y
ẏ
ÿ
= x1
= ẋ1 = x2 − sin x1
= −(cos x1 )ẋ1 + ẋ2 = −(cos x1 )x2 + sin x1 cos x1 + u.
(15.18)
Porovnánı́m přı́slušných derivacı́ y a ỹ je patrno, že
z2 = x2 − sin x1
z1 = x1
u = v + x2 cos x1 − sin x1 cos x1
Vytvořı́me-li tyto nelineárnı́ členy a zavedeme-li je na vstup u, zı́skáme lineárnı́ systém, který mezi novým
vstupem v a výstupem ỹ = z1 má dva sériově zapojené integračnı́ členy. Tı́m jsme vyřešili problém linearizace
a můžeme přistoupit k řı́zenı́. Pro jednoduchost budeme uvažovat pouze stabilizaci do rovnovážného stavu.
Pro zı́skaný lineárnı́ systém je vhodné navrhnout stavový regulátor
v = −k1 z1 − k2 z2 = −k1 x1 − k2 x2 + k2 sin x1 ,
(15.19)
takže v původnı́ch souřadnicı́ch je řı́zenı́ u dáno vztahem
u = −k1 x1 − k2 x2 + k2 sin x1 + x2 cos x1 − sin x1 cos x1 .
(15.20)
Touto volbou jsou kompenzovány nelinearity původnı́ho systému a volbou konstant k1 , k2 lze nastavit vhodnou
dynamiku.
Přı́klad 15.4. Je dán systém
ẋ1 = x2 − sin x1
ẋ2 = x2 cos x1 + u
y = x1
(15.21)
Proved’me linearizaci systému na ekvivalentnı́ systém
ż1 = z2
ż2 = v
ỹ = z1 .
(15.22)
stejným postupem jako v předchozı́m přı́kladě. Porovnánı́m derivacı́ výstypu zı́skáme pro vstup ekvivalentnı́ho
lineárnı́ho systému vztah
u = v − sin x1 cos x1 .
(15.23)
Je patrno, že zpětnovazebnı́ linearizace je jednoduššı́ než v předchozı́m přı́kladu, i když zadaný systém má dvě
nelinearity. Je to ovšem dáno speciálnı́m tvarem těchto nelinearit, jak je ještě lépe vidět z následujı́cı́ho přı́kladu.
Přı́klad 15.5. Je dán systém
ẋ1 = x2 − sin x1
ẋ2 = x2 cos x1 − sin x1 cos x1 + u
y = x1
(15.24)
Porovnánı́m derivacı́ výstupů daného systému a lineárnı́ ekvivalence podle (15.21) zı́skáme u = v. Nenı́ tedy
třeba žádná nelineárnı́ zpětná vazba, zadaný systém je ekvivalentnı́ lineárnı́mu systému s dvěma integrátory
pouhou transformacı́ souřadnic z1 = x1 a z2 = x2 − sin x1 .
KAPITOLA 15. EXAKTNÍ LINEARIZACE
144
Přı́klad 15.6. Je zadán systém
ẋ1 = −2x1 + ax2 + sin x1
ẋ2 = −x2 cos x1 + u cos 2x1
y = x1 ,
který chceme linearizovat na ekvivalentnı́ systém
ż1 = z2
ż2 = v
ỹ = z1 .
(15.25)
Derivujeme-li výstupy, dostaneme vztahy
y
ẏ
ÿ
=
=
=
=
x1
ẋ1 = −2x1 + ax2 + sin x1
−2ẋ1 + aẋ2 + cos x1 .ẋ1
4x1 − 2ax2 − 2 sin x1 + au cos 2x1 − 2x1 cos x1 + sin x1 cos x1
ỹ
ỹ˙
ỹ¨
= z1
= ż1 = z2 = −2x1 + ax2 + sin x1
= ż2 = v.
Porovnánı́m derivacı́ výstupů zı́skáme transformačnı́ vztahy
z2 = −2x1 + ax2 + sin x1
z1 = x1
a pro u vztah
1
(v − 4x1 + 2ax2 + 2 sin x1 + 2x1 cos x1 − sin x1 cos x1 ).
(15.26)
a cos 2x1
Je patrno, že v tomto přı́padě je linearizace dosaženo nelineárnı́ zpětnou vazbou a nelineárnı́m členem v přı́mé
větvi 1/(a cos 2x1 ). Oba členy potřebné k linearizaci lze odvodit od původnı́ho stavu x daného systému.
u=
b) Lineárnı́ reprezentace ve tvaru obecného stabilnı́ho systému
I když se nejčastěji použı́vá lineárnı́ reprezentace ve tvaru sériového zapojenı́ integrátorů, je někdy
výhodná jiná reprezentace, jak je patrno z dalšı́ho přı́kladu.
Přı́klad 15.7. Je zadán systém
ẋ1 = x2 − 2x1
ẋ2 = x3 − x32
ẋ3 = −x3 + u
y = x1 ,
(15.27)
který chceme převést vhodnými transformacemi a vazbami na lineárnı́ systém se třemi jednokapacitnı́mi členy
ż1 = z2 − 2z1
ż2 = z3 − z2
ż3 = −z3 + v
ỹ = z1 .
(15.28)
Derivovánı́m výstupů dostaneme soustavy
ẏ = ẋ1 = x2 − 2x1
y = x1
ÿ = −2x2 + 4x1 + x3 − x32
y (3) = −8x1 + 4x2 − 3x3 + u + x22 (2x2 − 3x3 + 3x32 )
a
ỹ = z1
ỹ˙ = −2z1 + z2
ỹ¨ = 4z1 − 3z2 + z3
ỹ (3) = −8z1 + 7z2 − 4z3 + v.
Porovnánı́m výstupů dostaneme transformačnı́ vztahy z = T (x)
z1 = x1
z2 = x2
z3 = x2 + x3 − x32
a vztah pro u
u = −x2 − x3 + 2x32 + 3x22 (x3 − x32 ) + v.
Řı́zenı́ můžeme zase provést např. stavovým regulátorem pomocı́ pevných zpětných vazeb od nových stavů z.
Protože je ale nynı́ ekvivalentnı́ lineárnı́ systém stabilnı́, je možno použı́t pro regulaci i jednoduchou zpětnou
KAPITOLA 15. EXAKTNÍ LINEARIZACE
145
Obrázek 15.2: Linearizovaný systém a jeho řı́zenı́
vazbu od výstupu, např. integračnı́ regulátor pro zajištěnı́ nulové trvalé regulačnı́ odchylky. Tento integračnı́
prvek můžeme také realizovat přı́mo tak, že zvolı́me ekvivalentnı́ lineárnı́ systém ve tvaru integrál plus dva
jednokapacitnı́ členy v sérii. Je patrno, že převod nelineárnı́ho systému na obecný lineárnı́ ekvivalentnı́ systém
rozšiřuje různé varianty řı́zenı́.
Z uvedených přı́kladů je patrno, že linearizaci daného systému (15.13) a tedy jeho převedenı́ na
ekvivalentnı́ lineárnı́ systém (15.14) lze provést volbou
u = α(x) + β(x)v,
(15.29)
kde v je nový vstup. Řı́zenı́ linearizovaného systému lze pak navrhnout pomocı́ některé vhodné metody,
kterou známe z teorie lineárnı́ch systémů. Použijeme-li např. regulátor odvozený od stavu systému,
potřebujeme nové stavy z = T (x). Ty jsou však zcela vyjı́mečně měřitelné na původnı́m systému a je
třeba je zkonstruovat ze stavových veličin x (často pomocı́ počı́tače). Výsledné schema linearizovaného
systému a jeho řı́zenı́ stavovým regulátorem je zakresleno na obr. 15.2.
Z dosud uvedených přı́kladů je vidět, že zpětnovazebnı́ linearizace je podstatně odlišná od linearizace pomocı́ Taylorova rozvoje kolem pracovnı́ho nebo rovnovážného stavu, která platı́ jen v malé
oblasti kolem tohoto stavu. Zpětnovazebnı́ linearizace může linearizovat daný systém bud’ globálně,
tj. v celém stavovém prostoru nebo jen v určité oblasti. Např. z výsledků přı́kladu 15.6 je vidět, že
linearizace nenı́ globálnı́, protože řı́zenı́ nenı́ definováno, jestliže x1 = (π/4 ± kπ/2), k = 1, 2... Bude-li
počátečnı́ stav v těchto singulárnı́ch bodech, nemůže regulátor převést systém do rovnovážného stavu
(0, 0).
Z uvedených jednoduchých přı́kladů je také patrno, že jsme linearizace prováděli dosud značně intuitivně, bez vymezenı́ přesných podmı́nek a za značně zjednodušených předpokladů. Přesněji budeme
úlohu formulovat v dalšı́ch článcı́ch, kde se budeme zabývat otázkou, kdy lze nelineárnı́ systém transformovat na systém lineárnı́ a jak nalézt vhodné transformace a zpětné vazby. K těmto účelům musı́me
zavést některé nové matematické pojmy a definice.
15.2
Matematické prostředky pro zpětnovazebnı́ linearizace
Definice 15.1. Lieova derivace. Je dána hladká skalárnı́ funkce h : Rn → R a hladké vektorové
pole f : Rn → Rn . Pak Lieova derivace Lf h skalárnı́ho pole h vzhledem k vektorovému poli f je
skalárnı́ funkce definovaná vztahem
Lf h = ∇h.f =
∂h
∂h
∂h
, ...,
f (x) =
f (x),
∂x1
∂xn
∂x
KAPITOLA 15. EXAKTNÍ LINEARIZACE
146
kde ∇h je gradient funkce h (řádkový vektor).
Lieova derivace je směrová derivace skalárnı́ho pole h ve směru vektoru f . Rekursivně lze definovat
vyššı́ derivace
Lf2 h = Lf (Lf h) = ∇(Lf h).f
Lf0 h = h
Lfi h = Lf (Lfi−1 h) = ∇(Lfi−1 ).f
Je-li g jiné vektorové pole, pak
Lg Lf h = ∇(Lf h)g
Pro nebuzený dynamický systém ẋ = f (x), y = h(x), jsou derivace výstupu
ẏ =
ÿ =
∂h
∂h
ẋ =
f (x) = Lf h
∂x
∂x
∂[Lf h]
∂[Lf h]
ẋ =
f (x) = Lf 2 h.
∂x
∂x
Definice 15.2. Lieova závorka (derivace vektorového pole vzhledem k vektorovému poli).
Necht’ f a g jsou dvě vektorová pole na Rn . Lieova závorka polı́ f a g je třetı́ vektorové pole definované
vztahem
∂f
∂g
f−
g,
[f , g] = (∇g)f − (∇f )g =
∂x
∂x
kde ∂f /∂x, ∂g/∂x jsou Jacobiovy matice, např.



∂f
=
∂x 

∂f1
∂x1
...
∂fn
∂x1
∂f1
∂x2
...
∂fn
∂x2
...
...
...
∂f1
∂xn
...
∂fn
∂xn






Často použı́vaný způsob zápisu Lieovy závorky je [f , g] = adf g. Rekursivnı́ vztahy lze pak psát ve
zjednodušených tvarech
adf 0 g = g
adf 1 g = adf g = [f , g]
adf 2 g = [f , [f , g]] = [f , adf g]
obecně
adf i g = [f , adf i−1 g].
Pro Lieovy závorky platı́:
a) bilinearita
[α1 f 1 + α2 f 2 , g] = α1 [f 1 , g] + α2 [f 2 , g]
[f , α1 g 1 + α2 g 2 ] = α1 [f , g 1 ] + α2 [f , g 2 ],
kde f , f 1 , f 2 , g, g 1 , g 2 jsou hladká vektorová pole a α1 a α2 jsou konstantnı́ skaláry;
b) antikomutativnost
[f , g] = −[g, f ]
c) Jacobiova identita
L[f ,g ] h = Lf Lg h − Lg Lf h,
kde h(x) je hladká skalárnı́ funkce x.
KAPITOLA 15. EXAKTNÍ LINEARIZACE
147
Definice 15.3. Distribuce. Uvažujme množinu {f 1 , f 2 , ..., f m } vektorových polı́ na Rn , m < n. Je-li
pro každé x ∈ Rn m vektorů f 1 (x), ..., f m (x) lineárně nezávislých, řı́káme, že množina vektorových
polı́ je m-dimenzionálnı́ distribuce D. Distribuce je involutivnı́ tehdy a jen tehdy, existujı́-li takové
hladké skalárnı́ funkce γijk ,že
[f i , f j ](x) =
m
X
γijk (x)f k (x)
1 ≤ i, j ≤ m,
i 6= j.
k=1
Platı́-li vztah jen lokálně, pak distribuce je lokálně involutivnı́.
Involutivita tedy znamená, že vytvořı́me-li Lieovu závorku z kterýchkoliv dvou polı́ množiny
{f 1 , ..., f m }, pak výsledné vektorové pole lze vyjádřit jako lineárnı́ kombinaci původnı́ množiny vektorových polı́. Konstantnı́ vektorová pole jsou vždy involutivnı́. Lieova závorka dvou konstantnı́ch
vektorů je vždy nulový vektor, který lze triviálně vyjádřit jako lineárnı́ kombinaci vektorových polı́.
Definice 15.4. Množina lineárně nezávislých vektorových polı́ {f 1 , f 2 , ..., f m } na Rn je úplně integrovatelná tehdy a jen tehdy, existuje-li n−m skalárnı́ch funkcı́ h1 (x), h2 (x), ..., hn−m (x) vyhovujı́cı́ch
soustavě parciálnı́ch diferenciálnı́ch rovnic
∇hi f j = 0,
kde 1 ≤ i ≤ n−m, 1 ≤ j ≤ m, a gradienty ∇hi jsou lineárně nezávislé. Počet parciálnı́ch diferenciálnı́ch
rovnic je m(n − m).
Přı́klad 15.7. Pro n = 3 jsou dány skalárnı́ funkce fi (x1 , x2 , x3 ) a gi (x1 , x2 , x3 ) , i = 1, 2, 3. Těmito
vektory f , g je jednoznačně definována soustava parciálnı́ch diferenciálnı́ch rovnic
∂h
∂h
∂h
f1 +
f2 +
f3 = 0
∂x1
∂x2
∂x3
∂h
∂h
∂h
g1 +
g2 +
g3 = 0.
∂x1
∂x2
∂x3
Existuje-li řešenı́ h(x1 , x2 , x3 ) uvedených rovnic, pak množina vektorových polı́ {f , g} je úplně integrovatelná. A priori ovšem nenı́ zřejmé, zda rovnice jsou řešitelné. Podmı́nku řešitelnosti udává
Frobeniova věta.
Věta 15.1. (Frobeniova). Množina lineárně nezávislých vektorových polı́ {f 1 , f 2 , ..., f m } je úplně
integrovatelná tehdy a jen tehdy, jestliže je involutivnı́. Důkaz je podán např. v [36].
15.3
Linearizace vstup-stav
V tomto článku se budeme zabývat linearizacı́ vstup-stav u nelineárnı́ho afinnı́ho systému s jednı́m
vstupem (bez výstupu) reprezentovaného stavovou rovnicı́
ẋ = f (x) + g(x)u,
(15.30)
kde f a g jsou hladká vektorová pole. V čl. 15.1 jsme na jednoduchých přı́kladech viděli, že exaktnı́
linearizaci lze vytvořit pomocı́ transformace stavů a nelineárnı́ přı́mé a zpětné vazby (obr. 15.2). Nynı́
se pokusı́me tyto jednoduché intuitivnı́ výsledky zobecnit. Nejprve budeme trochu detailněji definovat
linearizaci vstup-stav.
Definice 15.5. Afinnı́ nelineárnı́ systém s jednı́m vstupem ẋ = f (x) + g(x)u, kde f a g jsou hladká
KAPITOLA 15. EXAKTNÍ LINEARIZACE
148
vektorová pole na Rn , je linearizovatelný ve smyslu vstup-stav, jestliže existuje oblast Ω v Rn , difeomorfismus T : Ω → Rn a taková nelineárnı́ vazba
u = α(x) + β(x)v
(15.31)
že nové stavové proměnné z = T (x) a nový vstup v vytvářejı́ lineárnı́ t-invariantnı́ systém
ż1 = z2
ż2 = z3
...
żn−1 = zn
żn = v.
(15.32)
Linearizovaný systém je ve speciálnı́m kanonickém tvaru, který odpovı́dá sériovému zapojenı́ ideálnı́ch
integračnı́ch členů.
Nynı́ je třeba odpovědět na otázku, zda může být každý nelineárnı́ systém ve tvaru (15.30) převeden
na ekvivalentnı́ lineárnı́ systém s novým vstupem v pomocı́ (lokálnı́) transformace z = T (x) a statické
přı́mé a zpětné vazby u = α(x) + β(x)v.
Věta 15.2. Nelineárnı́ systém (15.30) s hladkými vektorovými poli f (x) a g(x) je linearizovatelný ve
smyslu vstup-stav tehdy a jen tehdy, existuje-li oblast Ω, v nı́ž platı́ podmı́nky:
a) vektorová pole {g, adf g, ..., adn−1
g} jsou lineárně nezávislá v Ω
f
b) množina {g, adf g, ..., adn−2
g} je involutivnı́ v Ω.
f
Prvnı́ podmı́nku lze jednoduše interpretovat jako zobecněnou podmı́nku řiditelnosti pro nelineárnı́
systém (15.30). Pro lineárnı́ systém ẋ = Ax + bu se vektorová pole z podmı́nky a) změnı́ na
[b, Ab, ..., An−1 b], což je známá podmı́nka řiditelnosti lineárnı́ho systému.
Důkaz věty 15.2. Podejme poněkud zkrácený důkaz této věty, důkaz se všemi podrobnostmi lze
nalézt např. v [49]. Ukažme nejprve nutnost podmı́nek věty 15.2. Předpokládejme, že existuje taková
stavová transformace z = T (x) a vstupnı́ transformace u = α(x) + β(x)v, že z a v splňujı́ rovnice
(15.32). Rozepsánı́m dostaneme
ż1 = ∇T1 ẋ =
∂T1
(f + gu) = z2 = T2 .
∂x
Podobně pro ostatnı́ složky platı́
ż2 =
∂T2
(f + gu) = T3 ,
∂x
...
żn =
∂Tn
(f + gu) = v.
∂x
To vede na množinu parciálnı́ch diferenciálnı́ch rovnic
∂T1
∂T1
f+
gu = T2
∂x
∂x
∂T2
∂T2
f+
gu = T3
∂x
∂x
∂Tn
∂Tn
f+
gu = v.
∂x
∂x
...
Složky T1 , ..., Tn jsou nezávislé na u, takže z předchozı́ch rovnic vyplývá
Lg T1 = Lg T2 = ... = Lg Tn−1 = 0
Lf Ti = Ti+1
Lg Tn 6= 0
i = 1, 2, ..., n − 1.
(15.33)
(15.34)
Všechny tyto vztahy platı́ pro všechna x ∈ Ω.
Nynı́ ukážeme, že výše uvedená soustava parciálnı́ch diferenciálnı́ch rovnic pro Ti může být komprimována do množiny rovnic závislých jen na T1 . Na základě vlastnostı́ Lieových závorek je
∇T1 [f , g] = ∇(Lg T1 )f − ∇(Lf T1 )g = 0 − Lg T2 = 0.
(15.35)
S použitı́m tohoto výsledku můžeme indukcı́ ukázat, že
∇T1 adkf g = 0
k = 0, 1, 2, ..., n − 2
∇T1 adn−1
g 6= 0.
f
(15.36)
KAPITOLA 15. EXAKTNÍ LINEARIZACE
149
Z tohoto vztahu předevšı́m vyplývá, že vektorová pole g, adf g, ..., adfn−1 g musı́ být lineárně
nezávislá. Proved’me důkaz sporem. Jesliže by pro nějaké i (i ≤ n − 1) existovaly skalárnı́ funkce
α1 (x), ..., αi−1 (x) takové, že
adif g =
i−1
X
αk adkf g
k=0
platilo by
adn−1
g=
f
n−2
X
αk adkf g.
k=n−i−1
Pak by muselo vzhledem k (15.36) platit
∇T1 adn−1
g=
f
n−2
X
αk ∇T1 .adkf g = 0,
k=n−i−1
což je ve sporu s (15.36).
Ze vztahů (15.36) vyplývá také druhý výsledek: množina vektorových polı́ je involutivnı́. To je
dáno Frobeniovou větou a existencı́ skalárnı́ funkce T1 , která vyhovuje n − 1 parciálnı́m diferenciálnı́m
rovnicı́m ze vztahu (15.36).
Nynı́ je možno ukázat, že dvě podmı́nky ve větě 15.2 jsou postačujı́cı́ pro linearizaci nelineárnı́ho
systému (15.30) ve smyslu vstup-stav, tj. že je možno nalézt stavovou transformaci a vstupnı́ transformaci tak, aby platily rovnice (15.32).
Jestliže je splněna podmı́nka involutivity, pak existuje nenulová skalárnı́ funkce T1 (x), která vyhovuje vztahům
Lg T1 = Lad g T1 = ... = Ladn−2 g T1 = 0.
(15.37)
f
f
Dále lze ukázat, že tato množina parciálnı́ch diferenciálnı́ch rovnic je ekvivalentnı́ k množině rovnic
Lg T1 = Lg Lf T1 = ... = Lg Lfn−2 T1 = 0.
(15.38)
Použijeme-li tedy transformaci T = [T1 , Lf T1 , ..., Lfn−1 T1 ]T jako novou množinu stavových proměnných,
pak prvnı́ch n − 1 stavových rovnic je
Ṫk = Tk+1
k = 1, ..., n − 1
(15.39)
a poslednı́ stavová rovnice
Ṫn = Lfn T1 + Lg Lfn−1 T1 u.
(15.40)
Dále lze ukázat, že při lineárnı́ nezávislosti vektorových polı́ {g, adf g, ..., adfn−1 g} a platnosti (15.37)
je
Lg Lfn−1 T1 6= 0
∀ x ∈ Ω.
(15.41)
Zvolı́me-li řı́zenı́ u ve tvaru
u=−
1
(Lfn T1
n−1
Lg Lf T1
+ v),
(15.42)
pak poslednı́ stavová rovnice bude Ṫn = v, jak odpovı́dá žádanému tvaru v rovnici (15.32).
Postup při návrhu linearizace vstup-stav
Na základě předchozı́ věty a různých dı́lčı́ch výsledků zı́skaných při vedenı́ důkazu, můžeme při návrhu
linearizace postupovat tı́mto způsobem:
1) Vypočteme pro zadaný systém (15.30) vektorová pole {g, adf g, ..., adn−1
g}.
f
KAPITOLA 15. EXAKTNÍ LINEARIZACE
150
2) Zjistı́me, jsou-li splněny podmı́nky řiditelnosti a involutivity.
3) Jsou-li splněny, nalezneme prvnı́ stav T1 z rovnic
∇T1 adif g = 0
∇T1 adfn−1 g 6= 0.
i = 1, 2, ..., n − 2
(15.43)
4) Vypočı́táme stavovou transformaci z = T (x) = [T1 Lf T1 ... Lfn−1 T1 ]T a vstupnı́ transformaci
u = α(x) + β(x)v, kde
α(x) = −
Lfn T1
Lg Lfn−1 T1
β(x) =
1
Lg Lfn−1 T1
(15.44)
Přı́klad 15.8. [52] Mechanický systém podle obr. 15.3 je vytvořen připojenı́m výstupnı́ho hřı́dele se
zátěžı́ přes torznı́ pružinu ke hřı́deli hnacı́ho motoru. Systém lze popsat rovnicemi
I ϕ¨1 + mgl sin ϕ1 + k(ϕ1 − ϕ2 ) = 0
J ϕ¨2 + k(ϕ2 − ϕ1 ) = u,
kde J je moment setrvačnosti motoru, I je moment setrvačnosti ramena vzhledem k ose rotace, l
vzdálenost výstupnı́ho hřı́dele od těžiště ramena, m hmotnost ramena, g gravitačnı́ zrychlenı́, k torznı́
konstanta pružiny, ϕ1 úhel natočenı́ výstupnı́ho hřı́dele (ramena), ϕ2 úhlová poloha hřı́dele motoru, u
moment motoru.
Zvolme stavový vektor x = [ϕ1 , ϕ˙1 , ϕ2 , ϕ˙2 ]T a označme mgl/I = a, k/I = b, 1/J = c a k/J = d.
Pak
ẋ1 = x2
ẋ2 = −a sin x1 − b(x1 − x3 )
ẋ3 = x4
ẋ4 = d(x1 − x3 ) + cu.
Obrázek 15.3: Mechanický systém
Jednoduchými výpočty určı́me matici řiditelnosti




[g, adf g, ad2f g, ad3f g] = 

0 0
0
−bc
0 0
bc
0 


0 −c
0
dc 
c 0 −dc 0
Matice má hodnost 4 pro k > 0 a IJ < ∞. Dále je patrno, že vektorová pole {g, adf g, ad2f g} jsou
konstantnı́ a tvořı́ proto involutivnı́ množinu. Daný systém je tedy linearizovatelný ve smyslu vstupstav.
KAPITOLA 15. EXAKTNÍ LINEARIZACE
151
Dalšı́ postup spočı́vá v nalezenı́ vhodné stavové transformace z = T (x) a nelineárnı́ch vazeb
u = α(x) + β(x)v. Podle (15.43) by prvnı́ složka T1 měla splňovat vztahy
∂T1
6= 0
∂x1
∂T1
=0
∂x2
∂T1
=0
∂x3
∂T1
=0
∂x4
Je patrno, že T1 musı́ být pouze funkcı́ x1 . Nejjednoduššı́ volba je z1 = T1 = x1 . Nové stavové proměnné
jsou pak
z1 = T1 = x1
(15.45)
∂T1
f1 +
∂x1
∂T2
f1 +
= T3 = Lf T2 =
∂x1
∂T3
= T4 = Lf T3 =
f1 +
∂x1
z2 = T2 = Lf T1 =
z3
z4
∂T1
f2 = x2
∂x2
∂T2
f2 = −a sin x1 − bx1 + bx3
∂x2
∂T3
f3 = −ax2 cos x1 − bx2 + bx4 .
∂x3
(15.46)
(15.47)
(15.48)
Podle vztahu (15.44) volı́me
u = α(x) + β(x)v = −
Lfn T1
1
+
v
n−1
n−1
Lg Lf T1 Lg Lf T1
Jednoduchými výpočty dostaneme výsledný vztah
u=
1
(v − Lf4 T1 ),
bc
kde
Lf4 T1 = a sin x1 (x22 + a cos x1 + b) + b(x1 − x3 )(b + d + a cos x1 ).
Tato linearizace vstup-stav je globálnı́, protože difeomorfismus T (x) a vstupnı́ transformace jsou
definovány všude. Pro linearizovaný systém můžeme nynı́ navrhnout vhodné řı́zenı́ pomocı́ známých
metod lineárnı́ syntézy.
15.4
Linearizace vstup-výstup
V tomto článku se budeme nejprve zabývat linearizacı́ nelineárnı́ho systému s jednı́m vstupem a jednı́m
výstupem, který lze popsat afinnı́m vztahem
ẋ = f (x) + g(x)u
y = h(x),
(15.49)
Na rozdı́l od linearizace vstup-stav je zde definována výstupnı́ funkce y a cı́lem je vytvořit náhradnı́
lineárnı́ systém mezi výstupem y a novým vstupem v. Linearizace vstup-výstup je většinou jednodušeji
realizovatelná než linearizace vstup-stav, v mnoha přı́padech však přinášı́ nové problémy např. s tzv.
vnitřnı́ dynamikou (odst. 15.4.2).
Princip linearizace vstup-výstup byl již ukázán na jednoduchých přı́kladech v čl. 15.1. Spočı́vá
v opakovaném derivovánı́ výstupnı́ funkce y, které se provádı́ tak dlouho, až se objevı́ závislost na
vstupnı́m signálu u. Prvnı́ derivace je
ẏ = ∇h ẋ = ∇h(f + gu) = Lf h(x) + Lg h(x)u.
Jestliže Lg h(x) 6= 0 pro všechna x v oblasti Ω, pak můžeme volit vstupnı́ transformaci
u=
1
(−Lf h + v)
Lg h
KAPITOLA 15. EXAKTNÍ LINEARIZACE
152
a relace mezi výstupem a vstupem v bude ẏ = v.
Jestliže Lg h(x) = 0 pro všechna x v oblasti, můžeme znovu derivovat ẏ a zı́skáme
ÿ = Lf2 h(x) + Lg Lf h(x)u.
Jestliže Lg Lf h(x) = 0, budeme derivovat dále, a to tak dlouho, než
Lg Lfr−1 h(x) 6= 0.
Pak je vstupnı́ transformace
u=
1
(−Lfr h + v)
Lg Lfr−1 h
a vztah mezi vstupem a výstupem je y (r) = v. Počet derivacı́ potřebný k tomu, aby se objevila závislost
na vstupnı́m signálu u udává relativnı́ stupeň systému. Tuto definici můžeme vyjádřit také pomocı́
Lieových derivacı́.
Definice 15.6. Nelineárnı́ systém (15.49) s jednı́m vstupem a jednı́m výstupem má relativnı́ stupeň
r v oblasti Ω, jestliže ∀x ∈ Ω je
Lg Lfi h(x) = 0
Lg Lfr−1 h(x) 6= 0.
∀ i ≤ r − 1,
(15.50)
Lze dokázat, že u řiditelného systému řádu n lze provést nejvýše n derivacı́ jakéhokoliv výstupu,
aby se ve vztahu objevil vstupnı́ signál u. To lze chápat i intuitivně. Kdyby bylo třeba vı́ce derivacı́,
systém by měl řád vyššı́ než n; neobjevı́-li se při derivovánı́ výstupu vstup nikdy, systém nenı́ řiditelný.
Relativnı́ stupeň r je tedy bud’ roven počtu stavů n nebo je menšı́. Jestliže je relativnı́ stupeň r systému
roven počtu stavů n, pak linearizace vstup-výstup je současně linearizacı́ vstup-stav.
Definice relativnı́ho stupně pro nelineárnı́ systém zcela odpovı́dá definici pro lineárnı́ systém ẋ =
Ax + bu, y = cT x, u něhož vı́me, že relativnı́ stupeň r je rovněž menšı́ nebo roven řádu systému n.
Provedeme-li operace uvedené v definici 15.6, pak u lineárnı́ho systému je relativnı́ stupeň nejmenšı́
celé čı́slo r takové, pro které platı́
cT Ak b = 0
k = 0, ..., r − 2
a
cT Ar−1 b 6= 0.
Toto čı́slo lze interpretovat jako rozdı́l mezi počtem pólů a počtem nul v přenosové funkci lineárnı́ho
systému. Každý lineárnı́ systém, u něhož r < n, má nuly v přenosové funkci.
Přı́klad 15.9. U mechanického systému z přı́kladu 15.8 definujme pomocnou výstupnı́ proměnnou
y = x1 a řešme linearizaci systému jako problém linearizace vstup-výstup. Postupným derivovánı́m
výstupu y zı́skáme vztahy
y = x1
ẏ = ẋ1 = x2
ÿ = ẋ2 = −asinx1 − b(x1 − x3 )
y
(3)
= −ax2 cos x1 − bx2 + bx4
y
(4)
= ax22 sin x1 − a cos x1 [−a sin x1 − b(x1 − x3 )] + ba sin x1 + b(x1 − x3 ) +
+bd(x1 − x3 ) + bcu = v
Z poslednı́ rovnice vyplývá vztah pro řı́zenı́ u
1
1
v − [a sin x1 (x22 + a cos x1 + b) + b(x1 − x3 )(b + d + a cos x1 )],
bc
bc
které odpovı́dá zı́skanému vztahu pro řı́zenı́ v přı́kladu 15.8, řešenı́ jsme ovšem tı́mto způsobem zı́skali
mnohem snadněji.
u=
Dalšı́ jednoduché přı́klady pro přı́pad r = n jsme uvedli již v článku 15.1.
KAPITOLA 15. EXAKTNÍ LINEARIZACE
15.4.1
153
Relativnı́ stupeň r < n. Normálnı́ formy.
Jestliže r < n, lze nelineárnı́ systém transformovat na tzv. normálnı́ formu, kde pro část nových
stavových proměnných z1 až zr zvolı́me jako v přı́padě r = n funkce [h, Lf h, ..., Lfr−1 h]. Dalšı́ n − r
proměnné zr+1 , ..., zn zvolı́me tak, aby všechny proměnné zi , i = 1, ..., n byly vzájemně nezávislé.
Dále je často možno vybrat Tr+1 (x), ..., Tn (x) takovým způsobem, aby Lg Ti (x) = 0, i = r + 1, ..., n
pro všechna x ∈ Ω. Pak pro tato i je
∂Ti
dzi
=
(f + gu) = Lf Ti (x) + Lg Ti (x)u = Lf Ti (x) = qi (z),
dt
∂x
dosadı́me-li x = T −1 (z) a označı́me-li
qi (z) = Lf Ti (T −1 (z))
i = r + 1, ..., n.
Stavový popis zadaného nelineárnı́ho systému je nynı́ v nových souřadnicı́ch z ve tvaru, který se nazývá
normálnı́ forma
ż1 = z2
ż2 = z3
...
żr+1 = qr+1 (z)
żr−1 = zr
...
żr = a(z) + b(z)u
żn = qn (z)
y = z1 .
(15.51)
(15.52)
Označı́me-li prvnı́ch r souřadnic vektoru z vektorem ζ a souřadnice zr+1 , ..., zn vektorem η, lze
normálnı́ formu zapsat ve tvaru



ζ1
ζ2
 .  
..
.  
d 
.
 . =
 
dt 
ζr
 ζr−1  
ζr
a(ζ, η) + b(ζ, η)u






η̇ = q(ζ, η)
y = ζ1 ,
(15.53)
kde
ζ = [z1 , ..., zr ]T
η = [zr+1 , ..., zn ]T .
Prvnı́ch r rovnic je v řiditelném kanonickém tvaru, n − r zbylých rovnic neobsahuje vstup systému u.
Poznámka: Někdy nenı́ snadné určit n − r funkcı́ Tr+1 (x), ..., Tn (x) tak, aby Lg Ti (x) = 0, protože to
vyžaduje řešit n − r parciálnı́ch diferenciálnı́ch rovnic. Obvykle je jednoduššı́ zvolit tyto funkce pouze
tak, aby Jacobiova matice pro T (x) byla regulárnı́ v žádaném bodě x, což je postačujı́cı́ podmı́nkou k
definovánı́ transformace souřadnic. Prvnı́ část normálnı́ formy je pak stejná jako v předchozı́m přı́padě,
druhá část, odpovı́dajı́cı́ rovnici (15.52) je dána vztahy
żr+1 = qr+1 (z) + pr+1 (z)u, ... , żn = qn (z) + pn (z)u,
(15.54)
v nichž se také objevuje vstupnı́ signál u.
Přı́klad 15.10. [52] Uvažujme nelineárnı́ systém
ẋ1 = −x1 + ex2 u
ẋ2 = x1 x2 + u
ẋ3 = x2
y = h(x) = x3
Derivace výstupu jsou
ẏ = x2
ÿ = ẋ2 = x1 x2 + u.
Systém má relativnı́ stupeň r = 2 a pro převedenı́ do normálnı́ formy zvolı́me
z1 = ζ1 = h(x) = x3
z2 = ζ2 = Lf h(x) = x2 .
(15.55)
KAPITOLA 15. EXAKTNÍ LINEARIZACE
154
Třetı́ funkce η(x) by měla vyhovovat vztahu
Lg η =
∂η x2
∂η
e +
= 0.
∂x1
∂x2
Jedno řešenı́ této rovnice je např.
z3 = η(x) = 1 + x1 − ex2 .
Stavová transformace je z = [ζ1 , ζ2 , η]T a jejı́ Jacobiova matice je regulárnı́ pro jakékoliv x. Inverznı́ transformace
je dána vztahy
x1 = −1 + η + eζ2
x2 = ζ2
x3 = ζ1 .
Stavová transformace je platná globálně. Dynamika systému je v nových souřadnicı́ch v normálnı́ formě
ζ˙1 = ζ2
15.4.2
ζ˙2 = (−1 + η + eζ2 )ζ2 + u
η̇ = (1 − η − eζ2 )(1 + ζ2 eζ2 ).
Vnitřnı́ a nulová dynamika
Pomocı́ linearizace vstup-výstup je dynamika nelineárnı́ho systému rozdělena na vnějšı́ část mezi
vstupem a výstupem a na vnitřnı́ ”nepozorovatelnou” část, která tvořı́ tzv. vnitřnı́ dynamiku.
Protože vnějšı́ část je ve tvaru řiditelné kanonické formy mezi vstupem v a výstupem y, je snadné
řı́dit v tak, aby se výstup y choval žádaným způsobem. Otázka přitom je, zda také vnitřnı́ dynamika
se bude chovat vhodným způsobem, např. zůstanou-li jejı́ stavy ohraničené nebo ne. Tato vnitřnı́
dynamika je dána poslednı́mi (n − r) rovnicemi η̇ = q(ζ, η) v normálnı́ formě a závisı́ tedy i na
vnějšı́ dynamice. Pokud je druhá část normálnı́ formy dána vztahem (15.54), pak je vnitřnı́ dynamika
závislá dokonce i na specifickém řı́dı́cı́m signálu. Je patrno, že určenı́ stability vnitřnı́ dynamiky bude
u složitějšı́ch systémů velmi obtı́žné, protože tato dynamika je obecně nelineárnı́, neautonomnı́ a závisı́
i na dynamice vnějšı́ uzavřené smyčky. Někdy se podařı́ určit stabilitu pomocı́ Ljapunovových funkcı́,
u složitějšı́ch systémů se však vhodná funkce většinou nenalezne. Přitom řı́zenı́ navržené pro vnějšı́
část je prakticky použitelné pouze v přı́padě, že vnitřnı́ dynamika je stabilnı́. V opačném přı́padě
nikoliv, protože nestabilita vnitřnı́ dynamiky vyvolá nežádoucı́ jevy, např. rozkmitánı́ systému, vibrace
mechanických členů apod. Efektivnost linearizace vstup-výstup závisı́ proto předevšı́m na stabilitě
vnitřnı́ dynamiky.
Vnitřnı́ dynamika lineárnı́ch systémů
Abychom objasnili trochu podrobněji otázky vnitřnı́ dynamiky, všimněme si nejprve této problematiky
u lineárnı́ch systémů. Uved’me pro ilustraci jednoduchý přı́klad.
Přı́klad 15.11. Lineárnı́ systém
ẋ1 = x2
ẋ2 = x3
ẋ3 = −a0 x1 − a1 x2 − a2 x3 + u
y = b0 x1 + b1 x2
má přenos
G(s) =
b 1 s + b0
s3 + a2 s2 + a1 s + a0
Úkolem je navrhnout řı́zenı́ u tak, aby bylo dosaženo asymptotického sledovánı́. Je znám požadovaný průběh
výstupu yw (t) a jeho derivace ẏw (t), ÿw (t).
Podobně jako u nelineárnı́ho systému můžeme i zde převést zadaný systém na ekvivalentnı́ reprezentaci ve
tvaru sériového zapojenı́ integrátorů mezi výstupem a vstupem. Budeme-li postupně derivovat výstup y, pak
ẏ = b0 ẋ1 + b1 ẋ2 = b0 x2 + b1 x3
ÿ = b0 ẋ2 + b1 ẋ3 = b0 x3 + b1 (−a0 x1 − a1 x2 − a2 x3 + u).
KAPITOLA 15. EXAKTNÍ LINEARIZACE
155
Protože v druhé derivaci se již objevı́ vstupnı́ signál, je relativnı́ stupeň systému r = 2. Je patrno, že je rovný
rozdı́lu mezi počtem pólů a počtem nul přenosu G(s).
Volı́me-li řı́zenı́ ve tvaru
u = (a0 x1 + a1 x2 + a2 x3 −
b0
1
x3 ) + (k1 e + k2 ė + ÿw ),
b1
b1
kde odchylka e = yw − y, pak
ÿ = k1 e + k2 ė + ÿw
tj.
ë + k2 ė + k1 e = 0.
Zvolené řı́zenı́ u vede na exponenciálně stabilnı́ odchylku, jejı́ž dynamika je 2. řádu. Vnitřnı́ dynamika bude
proto popsána rovnicı́ 1. řádu. Nakreslı́me-li blokové schéma zadaného systému, je patrno, že jako vnitřnı́
stavovou proměnnou můžeme volit x1 , protože y, ẏ, x1 vytvářejı́ novou množinu stavů (jsou svázány s původnı́mi
proměnnými x1 , x2 , x3 jednoznačnou transformacı́). Mezi ẋ1 a výstupem platı́ vztah
ẋ1 b1 + x1 b0 = y.
Internı́ dynamika je tedy dána rovnicı́
b0
1
x1 = y.
b1
b1
Protože y je ohraničené, závisı́ stabilita vnitřnı́ dynamiky na členu b0 /b1 , tj. na poloze nuly v přenosu G(s). Je-li
zadaný systém s minimálnı́ fázı́, pak b0 /b1 > 0. Nula ležı́ tedy v levé polorovině a vnitřnı́ dynamika je stabilnı́.
ẋ1 +
Výsledek uvedeného přı́kladu lze zobecnit na toto tvrzenı́. Internı́ dynamika lineárnı́ho systému je
stabilnı́, jestliže nuly přenosu ležı́ v levé polorovině, tj. je-li systém s minimálnı́ fázı́ (důkaz např. v
[36]).
Vnitřnı́ a nulová dynamika nelineárnı́ch systémů
Rozšı́řenı́ koncepce nul na nelineárnı́ systémy nenı́ jednoduché. U lineárnı́ch systémů jsou nuly přenosu
dány vlastnostmi systému, takže stabilita internı́ dynamiky nezávisı́ na vstupnı́ch signálech. U nelineárnı́ch systémů však stabilita vnitřnı́ dynamiky na konkrétnı́ch řı́dı́cı́ch vstupech záviset může.
Určitou cestu k odstraněnı́ této nesnáze představuje tzv. ”nulová dynamika”, která umožňuje učinit
některé závěry o stabilitě vnitřnı́ dynamiky.
Definice 15.7. Nulová dynamika nelineárnı́ho systému (15.49) je speciálnı́ přı́pad vnitřnı́ dynamiky,
kdy se přivádı́ takový vstupnı́ signál, při němž výstup y je identicky rovný nule pro všechna t.
Podmı́nka y(t) = 0 ∀t znamená, že všechny časové derivace y musı́ být nulové. Protože y(t) = z1 (t),
musı́ být ż1 (t) = ż2 (t) = ... = żr (t) = 0, tj. ζ(t) = 0 pro všechna t. Řı́zenı́ u(t) musı́ pak být řešenı́m
rovnice
a(0, η(t)) + b(0, η(t))u(t) = 0.
(15.56)
Řı́zenı́ u, které udržuje vektor ζ na nule, je tedy
u∗ (t) = −
a(0, η(t))
b(0, η(t))
(15.57)
a závisı́ tedy pouze na vnitřnı́ch stavech η(t). Nulová dynamika systému v normálnı́ formě je dána
rovnicemi
ζ̇ = 0
η̇ = q(0, η)
(15.58)
Má-li být výstup y(t) roven nule pro všechna t, musı́ být počátečnı́ stav nastaven na ζ(0) = 0, počátečnı́
stav η(0) může být zvolen libovolně. Časové průběhy vnitřnı́ch stavů η(t) a řı́zenı́ u∗ závisejı́ pak na
počátečnı́ch podmı́nkách η(0).
Z pohledu diferenciálnı́ geometrie je patrno, že nulová dynamika systému je jeho dynamika, při
které je pohyb omezen na r-dimenzionálnı́ hladkou varietu M ⊂ Rn definovanou vztahem
M = {x | h(x) = Lf h(x) = ... = Lfr−1 h(x) = 0}.
KAPITOLA 15. EXAKTNÍ LINEARIZACE
156
Aby se systém pohyboval pouze po této varietě, musı́ zde ležet počátečnı́ stav x(0) a ekvivalentnı́
vstup v musı́ být nulový.
Nulová dynamika je vnitřnı́ vlastnostı́ nelineárnı́ho systému, která nezávisı́ na volbě řı́zenı́ a na
požadované trajektorii. Zkoumánı́ stability nulové dynamiky je mnohem snažšı́ než studium stability
vnitřnı́ dynamiky, protože nulová dynamika zahrnuje jen vnitřnı́ stavy, zatı́m co internı́ dynamika je
svázána s externı́ dynamikou a žádanými trajektoriemi. Zjednodušenı́ vnitřnı́ dynamiky na nulovou
dynamiku umožňuje učinit některé jednoduššı́ závěry týkajı́cı́ se stability vnitřnı́ dynamiky. Např. u
stabilizačnı́ úlohy je možno ukázat, že lokálnı́ asymptotická stabilita nulové dynamiky je postačujı́cı́
pro lokálnı́ asymptotickou stabilitu vnitřnı́ dynamiky. Užitečné výsledky lze zı́skat také pro úlohy
sledovánı́.
Systém, jehož nulová dynamika je asymptoticky stabilnı́, se nazývá systém s minimálnı́ fázı́.
Nulová dynamika nám tedy umožňuje rozšı́řit pojem minimálně fázový systém i na nelineárnı́ systémy.
Přı́klad 15.11. Výsledky linearizace nelineárnı́ho systému z přı́kladu 15.10 můžeme doplnit o internı́
dynamiku, která je reprezentována rovnicı́
η̇ = (1 − η − eζ2 )(1 + ζ2 eζ2 ).
Nulovou dynamiku dostaneme, položı́me-li ζ1 = 0 a ζ2 = 0. Pak η̇ = −η. Vstupnı́ signál, který vždy
nuluje výstup je
u∗ = −(−1 + η + eζ2 )ζ2 .
15.4.3
Návrh řı́zenı́ při stabilizaci a sledovánı́
Po linearizaci nelineárnı́ho systému ve smyslu vstup-výstup je třeba navrhnout vhodný stavový
regulátor a pak zjistit, zda vnitřnı́ dynamika je stabilnı́. V dalšı́m si všimneme odděleně problémů
stabilizace a sledovánı́.
Lokálnı́ asymptotická stabilizace.
Předpokládejme, že nelineárnı́ systém (15.49) má rovnovážný stav v počátku (může být stabilnı́ nebo
nestabilnı́). Lze ukázat, že stavový regulátor navržený pro lineárnı́ vnějšı́ dynamiku může stabilizovat
celý systém za předpokladu, že nulová dynamika je asymptoticky stabilnı́.
Věta 15.3. Předpokládejme, že nelineárnı́ systém (15.49) má relativnı́ stupeň r a jeho nulová dynamika je lokálně asymptoticky stabilnı́. Necht’
d(s) = sr + αr−1 sr−1 + ... + α1 s + α0
(15.59)
je Hurwitzův polynom (jeho kořeny ležı́ v levé komplexnı́ polorovině). Pak stavová zpětná vazba
u(x) =
1
[−Lfr h(x) − αr−1 Lfr−1 h(x) − ... − α1 Lf h(x) − α0 h(x)]
Lg Lfr−1 h(x)
(15.60)
vede na lokálně asymptoticky stabilnı́ uzavřený systém. (Důkaz lze nalézt např. v [52]).
U problémů stabilizace nezáležı́ na výstupnı́ funkci a je proto možno formálně vybrat výstup
y = h(x) tak, aby odpovı́dajı́cı́ nulová dynamika byla asymptoticky stabilnı́.
Úloha sledovánı́. Stavový regulátor navržený podle věty 15.3 může být snadno rozšı́řen na úlohy
sledovánı́, jestliže se žádaný průběh výstupu a jeho derivacı́ zavede do rovnice (15.60) pro stavové
řı́zenı́. Podrobnosti tohoto řešenı́ lze nalézt např v [52].
KAPITOLA 15. EXAKTNÍ LINEARIZACE
15.4.4
157
Systémy s vı́ce vstupy a výstupy
Všechny dosud uvedené koncepce a postupy lze rozšı́řit na systémy s vı́ce vstupy a výstupy. Uvažujme
nelineárnı́ systém se stejným počtem vstupů a výstupů ve tvaru
ẋ = f (x) + g 1 (x)u1 + ... + g m (x)um
(15.61)
y1 = h1 (x)
(15.62)
...
ym = hm (x),
kde ui jsou řı́dı́cı́ vstupy a yi výstupy, f a g i jsou hladká vektorová pole a hj hladké skalárnı́ funkce.
Ve vektorovém zápisu je dán systém rovnicemi
ẋ = f (x) + G(x)u
y = h(x).
(15.63)
Linearizace vstup-výstup vyžaduje zase derivovánı́ výstupů yj tak dlouho, až se ve výrazu
objevı́ vstupnı́ signály. Pro prvnı́ derivaci dostaneme vztah
ẏj = Lf hj +
m
X
(Lg i hj )ui .
(15.64)
i=1
Jestliže je Lg i hj (x) = 0 pro všechna i, vstupy se v rovnici neobjevı́ a je třeba derivovat dále.
Předpokládejme, že rj je nejmenšı́ celé čı́slo takové, že alespoň jeden ze vstupů se objevı́ v derivaci
(r )
yj j , pak
(rj )
r
= Lf j hj +
yj
m
X
r −1
Lg i Lf j
hj u j ,
(15.65)
i=1
r −1
kde Lg i Lf j hj (x) 6= 0 alespoň pro jedno i a ∀ x ∈ Ω. Provedeme-li tento postup pro každý výstup
yj , dostaneme m rovnic, které můžeme zapsat v kompaktnı́ formě
(r )
u1
Lr1 h1 (x)
y 1



  f
 1
...
 + E(x)  ... 
 ...  = 
(r )
Lfrm hm (x)
um
ym m
(15.66)
Lg 1 Lfr1 −1 h1 ... Lg m Lfr1 −1 h1


E(x) = 
...
...
...

rm −1
rm −1
Lg 1 Lf
hm ... Lg m Lf
hm
(15.67)






kde m × m matice E(x) je


Jestliže matice E je regulárnı́ v oblasti Ω, pak vstupnı́ transformace
v1
Lfr1 h1 (x)


−1 
−1 
...
u = −E 
 + E  ... 
vm
Lfrm hm (x)




(15.68)
uskutečňuje lineárnı́ vztah mezi výstupem y a novým vstupem v
(r1 )
y1
= v1
...
(rm )
ym
= vm .
(15.69)
Mezi výstupy a novými vstupy v jsou nynı́ nejen lineárnı́ závislosti, ale jsou odstraněny i interakce
mezi původnı́mi vstupy a výstupy. To má výhodu v tom, že nynı́ lze uskutečnit řı́zenı́ jednotlivých
subsystémů se vstupem vi a výstupem yi nezávisle na sobě pomocı́ metod pro systémy s jednı́m
vstupem a jednı́m výstupem.
KAPITOLA 15. EXAKTNÍ LINEARIZACE
158
Při uvedeném postupu jsme viděli, že existuje relativnı́ stupeň pro každý výstup, takže relativnı́
stupeň celého systému je definován m celými čı́sly (r1 , ..., rm ). Celkový relativnı́ stupeň systému je
dán jejich součtem, r = r1 + ... + rm .
Relativnı́ stupeň r < n. Normálnı́ formu lze pro systém (15.63) zı́skat stejným způsobem jako
pro systém s jednı́m vstupem a jednı́m výstupem. Za souřadnice ζ i zvolı́me
ζ11 = h1 (x)
ζ21 = Lf h1 (x)
...
ζr11 = Lfr1 −1 h1 (x)
...
ζrmm = Lfrm −1 hm (x).
.....
ζ1m = hm (x)
ζ2m = Lf hm (x)
Souřadnice ζij , (j = 1, ..., m; i = 1, ..., rj ) jsou nezávislé a mohou být použity jako dı́lčı́ množina
nového stavového vektoru. Jeho doplněnı́ provedeme n−r funkcemi η 1 až η n−r (x), které jsou nezávislé
navzájem i k souřadnicı́m dřı́ve vybraným. Na rozdı́l od přı́padu s jednı́m vstupem však už nenı́ možno
zaručit, že
∀x ∈ Ω
Lg i η k (x) = 0
1≤i≤m
1≤k ≤n−r
pokud vektorová pole g 1 , ..., g m nejsou involutivnı́ v Ω. Stavové rovnice pro zbylých n − r souřadnic
budou tedy závislé na vstupnı́m vektoru u.
Rovnice systému (15.61) lze tedy transformovat do normálnı́ formy, kde externı́ dynamika je dána
vztahy
ζ̇1j = ζ2j
...
ζ̇rjj = aj (ζ, η) +
m
X
bij (ζ, η)ui
j = 1, 2, ..., m
(15.70)
i=1
a
r
aj (ζ, η) = Lf j hj (x)
r −1
bij (ζ, η) = Lg i Lf j
hj (x).
Internı́ dynamika je
η̇ = q(ζ, η) + P (ζ, η)u
qk (ζ, η) = Lf ηk (x)
Pki (ζ, η) = Lg i ηk (x)
pro k = 1, ..., n − r a i = 1, ..., m.
Vnitřnı́ a nulová dynamika. Pro stabilitu řı́zeného systému je zase třeba studovat stabilitu vnitřnı́
dynamiky. Je možno rovněž definovat zjednodušený přı́pad této dynamiky, tj.nulovou dynamiku, kdy
výstupy systému se udržujı́ na nulové hodnotě. Pak ζ(t) = 0 a řı́dı́cı́ vstupy je třeba vybrat tak, aby
u(t) = −E −1 (0, η) a(0, η),
kde η(t) je řešenı́ diferenciálnı́ rovnice
η̇(t) = q(0, η) − P (0, η)E −1 (0, η) a(0, η)
s libovolnou počátečnı́ podmı́nkou η(0).
Dynamická zpětná vazba. Linearizaci vstup-výstup lze uskutečnit pouze tehdy, jestliže matice E je
regulárnı́ v Ω. Tato podmı́nka je často nesplnitelná a E je singulárnı́. Pak je možno přidat dynamiku
do regulátoru a vytvořit dynamickou zpětnou vazbu od stavů. Jiná metoda využı́vá možnosti odvodit
novou množinu nominálnı́ch výstupů tak, aby výsledná matice E byla regulárnı́.
Problematika exaktnı́ch linearizacı́ je v současné době předmětem mnoha výzkumných úkolů a
publikacı́. Teoretické výsledky byly aplikovány v mnoha oborech, např. při řı́zenı́ elektrických motorů,
robotů, letadel, chemických výrob apod. Podrobné rozpracovánı́ teoretických problémů exaktnı́ linearizace lze nalézt předevšı́m ve vynikajı́cı́ch textech [36] a [49]. Přehled problémů globálnı́ linearizace
je uveden v [61].
Kapitola 16
Identifikace nelineárnı́ch systémů
Identifikace systému, to je určenı́ jeho struktury, stavů a parametrů může být založena na
matematicko–fyzikálnı́ analýze zkoumaného objektu, nebo na rozboru změřených vstupnı́ch a
výstupnı́ch dat, což je tzv. experimentálnı́ identifikace. V této kapitole se stručně seznámı́me
s problémy experimentálnı́ identifikace stavů, parametrů i struktury nelineárnı́ch systémů.
Nejprve se budeme zabývat deterministickými metodami identifikace, které jsou založeny
na deterministických modelech nelineárnı́ch systémů a neznámé parametry těchto modelů se hledajı́
minimalizacı́ chybových funkcı́ měřených a simulovaných dat. Uvidı́me, že tyto metody jsou sice principielně jednoduché, ale vyžadujı́ poměrně kvalitnı́ předběžné odhady, nebot’ minimalizačnı́ procedury
jinak konvergujı́ do falešných lokálnı́ch extrémů a chyba odhadu je nezanedbatelně veliká.
V dalšı́ch odstavcı́ch se budeme stručně věnovat stochastickým metodám identifikace. Proto
je nutno nejprve se stručně zmı́nit o stochastických modelech nelineárnı́ch systémů. Jednotı́cı́ základ
metod identifikace je Bayesův přı́stup k identifikaci. Aproximačnı́ metoda založená na předpokladu
normality šumu procesu a šumu měřenı́ a linearizaci nelineárnı́ho systému podél průběžných odhadů
se nazývá rozšı́řený Kalmanův filtr.
Pro řı́zenı́ systému má největšı́ význam průběžná identifikace, při které se odhady průběžně
zpřesňujı́ naměřenými daty. Jednorázová identifikace spočı́vá v rozboru celé množiny naměřených dat.
¯
Odhadu parametrů při jednorázové identifikaci budeme řı́kat interpolace.
Pokud známe několik možných alternativnı́ch struktur modelů identifikovaného objektu (až
na konečný počet neznámých parametrů), můžeme provést klasifikaci těchto modelů. Klasifikace
modelů spočı́vá v nalezenı́ jejich pravděpodobnosti podmı́něné změřenými daty. O tomto přı́stupu
pojednáme v závěrečném odstavci této kapitoly.
Protože řı́zenı́ systému i sběr dat se nynı́ realizuje téměř výhradně čı́slicovou technikou, tedy
diskrétně, budeme se převážně věnovat systémům diskrétnı́m. V této kapitole uvedeme pouze některé
metody. Výběr metod je podřı́zen rozsahu skripta a autorovou zkušenostı́.
16.1
Obecné úvahy
Při následujı́cı́ch obecných úvahách o identifikaci nelineárnı́ch systémů vycházı́me z [76]. Základnı́
problém identifikace systému je nalezenı́ vhodné struktury modelu, to je určenı́ třı́dy modelů v nı́ž
jsme schopni nalézt vyhovujı́cı́ model. Naladěnı́ modelu v dané struktuře spočı́vá obvykle v odhadu
jeho neznámých parametrů, což je již jednoduššı́ problém.
Základnı́m pravidlem je neodhadovat to, co již známe. Je tedy třeba využı́t veškerou apriornı́
informaci a znalosti o zkoumaném objektu. Rozlišujeme tři úrovně apriornı́ch znalostı́, které jsou pro
159
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
160
názornost označeny ”barvami”.
• Modely systému jako bı́lé skřı́ňky (white–box models).
V tomto přı́padě je model úplně známý, je konstruován na základě apriornı́ch znalostı́ o objektu.
To je přı́pad již zmı́něné matematicko–fyzikálnı́ analýzy zkoumaného objektu.
• Modely šedé skřı́ňky (grey–box models):
Máme pouze částečnou apriornı́ znalost a řada parametrů musı́ být určena z pozorovaných dat.
Při tom můžeme rozlišit dva přı́pady.
– Fyzikálnı́ modelovánı́. Struktura modelu je určena na základě fyzikálnı́ch znalostı́ o objektu
a z dat určujeme pouze neznámé prametry modelu.
– Částečné fyzikálnı́ modelovánı́. Naše znalosti o objektu vedou na určenı́ nelineárnı́ kombinace měřených dat. Tyto nové signály jsou potom využity ve struktuře modelu jako černé
skřı́ňky.
• Modely černé skřı́ňky (black–box models):
Zde nemáme žádnou apriornı́ znalost o zkoumaném objektu. Je třeba zvolit takové třı́dy modelů,
které jsou známé a které byly úspěšně využity v dřı́vějšı́ch aplikacı́ch.
Lineárnı́ modely typu černé skřı́ňky vlastně spočı́vajı́ v popisu či aproximaci frekvenčnı́ch či
časových charakteristik systému.
Pro diskrétnı́ systém označı́me pozorované vstupy a výstupy u(k) resp. y(k) a šum e(k). Zavedeme
operátor zpožděnı́ d (pak y(k − 1) = dy(k)). Polynom a(d) = a0 + a1 d + . . . + an dn použijeme k zápisu
lineárnı́ kombinace zpožděných signálů, pak a(d)y(k) = a0 y(k) + a1 y(k − 1) + . . . + an y(k − n). Potom
obecná třı́da lineárnı́ch diskrétnı́ch modelů je vyjádřena
a(d)y(k) =
b(d)
c(d)
u(k) +
e(k)
f (d)
h(d)
(16.1)
Specielnı́ přı́pady jsou:
při a(d) = 1 dostaneme tzv. Box–Jenkinsův model,
při f (d) = h(d) = 1 zı́skáme tzv.ARMAX model (AutoRegressive model with Mowing Average and
eXternal signal),
při a(d) = c(d) = h(d) = 1 dostaneme model s chybou výstupu (output–error model) a
při f (d) = c(d) = h(d) = 1 dostaneme tzv. ARX model.
Nelineárnı́ modely černé skřı́ňky jsou mnohem komplikovanějšı́. Obecný nelineárnı́ model černé
skřı́ňky je určen sjednocenı́m dvou zobrazenı́. Prvnı́ je zobrazenı́ minulých dat, jejichž množstvı́ v čase
stále roste, na tak zvaný regresnı́ prostor konečné dimenze a druhé je zobrazenı́ z regresnı́ho prostoru
na výstup systému.
Problém identifikace nelineárnı́ho systému je následujı́cı́:
Pozorujeme vstupy u(k) a výstupy y(k) na zkoumaném objektu
uk = [u(k), u(k − 1), . . . , u(1)]
y k = [y(k), y(k − 1), . . . , y(1)]
a hledáme vztah mezi minulými pozorovánı́mi (daty) Dk−1 = [uk−1 , y k−1 ] a budoucı́m výstupem y(k)
y(k) = g(uk−1 , y k−1 ) + v(k).
(16.2)
Aditivnı́ člen v(k) respektuje tu skutečnost, že výstup y(k) nenı́ přesnou funkcı́ minulých dat Dk−1 .
Cı́lem je, aby chyba v(k) byla co nejmenšı́. Potom g(uk−1 , y k−1 ) je dobrou predikcı́ výstupu y(k) na
základě minulých dat. Tuto predikci značı́me ŷ(k) = g(uk−1 , y k−1 ).
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
161
Problém je volba funkce g(.). Obvykle ji hledáme ve třı́dě funkcı́, které jsou parametrizovány
konečněrozměrným vektorem parametrů θ, pak
g = g(uk−1 , y k−1 , θ)
(16.3)
Tato parametrizace je většinou pouze přibližná. Pokud zvolı́me strukturu, pak nejvhodnějšı́ parametry
nalezneme z dat minimalizacı́ rozdı́lu mezi modelem a změřenými daty
θ ∗ = arg min
θ
k=N
X
||y(k) − g(uk−1 , y k−1 , θ)||2
(16.4)
k=1
Předchozı́ model g(uk−1 , y k−1 , θ) je přı́liš obecný. Proto, jak již bylo řečeno, g(.) vyjadřujeme jako
sjednocenı́ dvou zobrazenı́. Jedno rostoucı́ množinu dat Dk zobrazı́ do konečněrozměrného vektoru
ϕ(k) zvaného regresnı́ vektor a druhé zobrazı́ tento regresnı́ vektor na výstup. Pak
g(uk−1 , y k−1 , θ) = g(ϕ(k), θ)
kde
ϕ(k) = ϕ(uk−1 , y k−1 )
Při tom tento regresnı́ vektor často opět parametrizujeme.
Nelineárnı́ zobrazenı́ (16.3) se tedy dekomponuje do dvou problémů. Prvnı́m problémem je volba
regresnı́ho vektoru ϕ(k) z minulých vstupů a výstupů a druhým problémem je volba nelineárnı́ho
zobrazenı́ g(ϕ(k)) z regresnı́ho prostoru na výstup.
Poznámka: Pro lineárnı́ model ve tvaru (16.1) je prediktor ve tvaru pseudolineárnı́ regrese
ŷ(k|θ) = θ T ϕ(k, θ)
Regresor, což jsou složky vektoru ϕ(k, θ), je pro ARX model tvořen pouze starými vstupy a výstupy
u(k − i), y(k − i), pro i = 1, . . . , n.
2
U nelineárnı́ch systémů je regresor tvořen také starými vstupy a výstupy a také předchozı́mi
výstupy z modelu ŷ(k−i|θ). Změřená data můžeme předzpracovat a užı́t filtrovaná data jako regresory.
Nelineárnı́ zobrazenı́ g(ϕ(k), θ) z regresnı́ho prostoru na výstup je nejčastěji parametrizováno
souborem funkcı́
X
g(ϕ(k), θ) =
αj gj (ϕ)
kde gj (ϕ) jsou nějaké bázové funkce. Problémem je volba bázových funkcı́. Zde je celá řada možnostı́
od fourierových funkcı́, splinů, fuzzy modelů až k rekurentnı́m sı́tı́m.
Pokud zvolı́me regresory ϕ(k, θ) a nelineárnı́ zobrazenı́ g(ϕ(k), θ) je problém identifikace nelineárnı́ho systému (nelineárnı́ho modelu černé skřı́ňky) převeden na odhad parametrů θ takového
modelu. To je optimalizačnı́ úloha, která předpokládá vytvořenı́ kritéria optimalizace a volbu numerické metody řešenı́. Kritérium optimalizace je kvadratická nebo obecně nekvadratická norma chyby
predikce.
Každý ze zde uvedených kroků modelovánı́ systému jako černé skřı́ňky je složitý problém. Zde jsme
pouze chtěli naznačit jednotlivé obecné kroky postupu při řešenı́ problému identifikace nelineárnı́ho
dynamického systému.
Uvažovali jsme zde pouze modely vnějšı́ho chovánı́ systému. Stavové modely bychom mohli zařadit
do třı́dy modelů šedé skřı́ňky. Problémem je potom odhad stavů přı́padně parametrů v těchto stavových
modelech. V dalšı́ch odstavcı́ch této kapitoly se budeme převážně věnovat těmto problémům.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
16.2
162
Deterministické modely a jejich identifikace
Obecný nelineárnı́ spojitý systém je popsaný stavovými rovnicemi
ẋ(t) = f (x(t), u(t), t)
(16.5)
y(t) = g (x(t), u(t), t)
kde x(t) je stav systému v čase t, u(t) je vstup, y(t) je výstup systému a f (.) a g(.) jsou nelineárnı́
funkce svých argumentů.
Obecný diskrétnı́ nelineárnı́ systém je popsaný stavovými rovnicemi
x(k + 1) = f (x(k), u(k), k )
(16.6)
y(k) = g (x(k), u(k), k )
které se formálně lišı́ pouze diskrétnı́m časem k.
Předchozı́ stavové rovnice popisujı́ jednotným způsobem systémy jednorozměrové, což jsou systémy
s jedinou vstupnı́ i výstupnı́ veličinou (systémy SISO - single input - single output) i systémy mnoharozměrové ( systémy MIMO - multiple input - multiple output).
Mnoho nelineárnı́ch systémů je tvořeno statickou nelinearitou a dynamickým lineárnı́m modelem.
Takové systémy modelujı́ mnoho reálných objektů. Podle toho, ve kterém mı́stě je umı́stěna statická nelinearita, mluvı́me o Hammersteinově nebo Wienerově modelu, přı́padně o jejich kombinaci.
Hammersteinův model má statickou nelinearitu umı́stěnou na vstupnı́ straně systému. Tı́mto modelem můžeme popsat nelinearitu v akčnı́ch členech reálného objektu. Wienerův model má statickou
nelinearitu umı́stěnou na výstupnı́ straně systému. Tı́mto modelem můžeme popsat nelinearitu čidel
měřených veličin na reálném objektu. Kombinovaný Wiener - Hammersteinův model má statickou nelinearitu umı́stěnou uvnitř systému, to znamená, že je oddělena od vstupu i výstupu lineárnı́m dynamickým členem. Vlastnosti nelineárnı́ho systému jsou podstatně závislé na typu nelinearity. Rozlišuje
se nelinearita kvadratická, obecně polynomiálnı́, nebo obecná nelinearita nespojitá na př. reléového
typu.
Určenı́ či volba struktury nelineárnı́ho systému je velmi důležitá i z hlediska identifikace nelineárnı́ho systému. Většinou pod identifikacı́ nelineárnı́ho systému si představujeme identifikaci stavů
dynamického systému, nebo jeho parametrů, což jsou principielně shodné problémy. Struktura nelineárnı́ho systému musı́ být známá nebo je zvolena na základě znalostı́ reálného objektu. Existuje
celá řada metod identifikace struktury nelineárnı́ch systémů - viz [66]. Obecně je možno o těchto
metodách řı́cı́, že hodnotı́ a porovnávajı́ několik zvolených struktur nelineárnı́ch systémů a hodnotı́
jejich chyby odhadu výstupu. Při tom je třeba zamozřejmě odhadovat i zvolené parametry těchto
alternativnı́ch modelů. Pokud máme několik alternativnı́ch struktur modelů, můžeme na základě dat
vypočı́st jejich podmı́něnou pravděpodobnost, to je provést jejich klasifikaci.
16.2.1
Deterministické metody identifikace nelineárnı́ch systémů
V tomto odstavci ukážeme, že identifikaci neznámých parametrů nelineárnı́ho systému na základě
změřených hodnot vstupnı́ho a výstupnı́ho signálu je možno jednoduše převést na optimalizačnı́
problém.
Na reálném objektu, který je předmětem identifikace provedeme měřenı́ vstupnı́ch a výstupnı́ch
signálů. Volba vstupnı́ho signálu je velmi důležitá zvláště pro nelineárnı́ systém. Je zřejmé, že vstupnı́
signál musı́ být dostatečně frekvenčně bohatý abychom dobře mohli identifikovat dynamickou část
systému. Amplituda vstupnı́ho signálu musı́ být dostatečná, abychom byli schopni identifikovat nelinearitu v systému. Protože neznáme počátečnı́ stav systému, je třeba experiment začı́t z nějakého
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
163
rovnovážného stavu - pak můžeme dosti dobře předpokládat, že stav na počátku experimentu je známý
(na př. přibližně nulový).
Máme tedy dostatečnou množinu vstupnı́ch a výstupnı́ch dat D1N
D1N = {u(1), y(1), u(2), y(2), . . . , u(N ), y(N )}
kde jsme indexem 1, N označili počátek a konec měřenı́. Pokud identifikujeme diskrétnı́ systém vše
je v pořádku, pokud identifikujeme systém spojitý je třeba znát periodu vzorkovánı́ Ts . Čas spojitý
a diskrétnı́ spolu souvisejı́ vztahem t = k Ts . Dále je třeba učinit nějaké předpoklady o průběhu
vstupnı́ho signálu do spojitého systému. Často je měřicı́ experiment prováděn pomocı́ počı́tače a
tak vstupnı́ signál je generován počı́tačem a přes analogo–čı́slicový převodnı́k je přiváděn na vstup
identifikovaného objektu. Potom je vstupnı́ signál jednoznačně definován i mezi okamžiky vzorkovánı́.
Nynı́ je třeba si vytvořit matematický model reálného objektu, jehož struktura je zvolena, model
je tedy plně určen až na konečný počet neznámých parametrů θ, které jsou předmětem identifikace.
Pro zvolené hodnoty neznámých parametrů můžeme vypočı́tat odezvu tohoto modelu na známý vstupnı́ signál, totožný se signálem, kterým jsme budili reálný neznámý objekt. Tı́m zı́skáme výstupnı́
posloupnost dat z modelu , která označı́me na př. y m (1), . . . , y m (N ).
Je zřejmé, že budeme hledat takové parametry modelu, aby data zı́skaná na reálném objektu byla
shodná s daty simulovanými na modelu. Zvolı́me si kritérium kvality na přı́klad ve tvaru
J(θ) =
N
X
(y(k) − y m (k, θ))T W k (y(k) − y m (k, θ))
(16.7)
k=1
Kritérium může být libovolná nezáporná rostoucı́ funkce odchylky měřených a simulovaných dat. Zde
jsme zvolili kvadratickou formu s pozitivně definitnı́ váhovou maticı́ W k , která může zohledňovat
důležitost či přesnost jednotlivých dat. Nynı́ hledáme takové parametry θ ∗ , které minimalizujı́ zvolené
kritérium
θ ∗ = arg min J(θ)
(16.8)
θ
Toto je problém statické optimalizace (úloha matematického programovánı́), který je možno řešit
mnoha numerickými algoritmy. Volba numerické metody a podmı́nky na ukončenı́ iteracı́ je delikátnı́
problém, protože vždy je model pouze jistým přiblı́zenı́m k realitě. Z řady numerických optimalizačnı́ch
metod připomeneme zde Levenbergerovu–Marquardtovu metodu nelineárnı́ch nejmenšı́ch čtverců. Nelinearity v modelu, zvláště nespojité mohou podstatným způsobem zhoršit či znemožnit konvergenci
numerické metody. Proto je úplně podstatný počátečnı́ odhad parametrů, což závisı́ na apriornı́ch
znalostech experimentátora o zkoumaném objektu.
Byl vytvořen program na ověřenı́ této deterministické metody identifikace. Zı́skané zkušenosti
ukazujı́, že shoda odezev systému a modelu může být dobrá a přesto nalezené parametry se mohou
dosti lišit od parametrů skutečných. Kritérium kvality má řadu lokálnı́ch extrémů, které numerické
metody nejsou schopny překonat. Nenı́ reálný předpoklad, že měřenı́ nejsou zatı́žena chybou. Simulace
ukazujı́, že nepřesnosti měřenı́ ovlivňujı́ konvergenci metody a přesnost výsledků. Nynı́ uvedeme dva
přı́klady na ilustraci uvedené metody.
Přı́klad 1: Mějme spojitý nelineárnı́ systém popsaný stavovými rovnicemi
ẋ1 (t) = θ1 sin(θ2 x1 (t)) + θ3 x1 (t) + θ4 cos(u(t))
ẋ2 (t) = θ5 x1 (t)
y(t) = θ6 x2 (t)
Skutečné parametry systému jsou
θ=
h
−3 1 −5 1 1 1
i
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
164
Počátečnı́ odhad neznámých parametrů při startu minimalizačnı́ procedury byl
θ=
h
−3.33 2.5 −4.6 1.4 0.5 1.4
i
Počet vzorků odezvy byl N = 50. Po minimalizaci byl odhad parametrů roven
θ=
h
−3.5 0.85 −5.5 0.92 0.91 1.2
i
Rozdı́l v odezvě systému a identifikovaného modelu je zanedbatelný, přestože parametry nejsou odhadnuty přesně. Pokud měřený výstup zatı́žı́me chybou, kterou můžeme modelovat jako náhodný signál,
je přesnost odhadu zhoršena i konvergence algoritmu je pomalejšı́.
Přı́klad 2: Mějme diskrétnı́ nelineárnı́ systém popsaný stavovými rovnicemi
x1 (k + 1) = θ1 x1 (k) + θ2 x2 (k) + θ3 u(k)
x2 (k + 1) = θ4 x1 (k) + θ5 x2 (k) + θ6 u(k)
y(t) = θ7 x1 (k) + sign (θ8 x2 (k)) + θ9 u(k)
Skutečné parametry systému jsou
θ=
h
0.1 0.2 0.1 0.2 −0.1 0.2 1 3 0.5
i
Počátečnı́ odhad neznámých parametrů při startu minimalizačnı́ procedury byl
θ=
h
0.06 0.13 0.12 0.2 −0.14 0.2 0.98 2.95 0.47
i
Počet vzorků odezvy byl N = 200. Po minimalizaci byl odhad parametrů roven
θ=
h
0.08 0.2 0.084 0.21 −0.08 0.21 0.99 2.89 0.5
i
Maximálnı́ chyba mezi měřeným a simulovaným výstupem je řádu 10−5 při vstupnı́m náhodném
signálu velikosti řádově jednotky. Minimálnı́ hodnota minimalizovaného kritéria je J(θ ∗ ) = 4.4 × 10−8 .
Při minimalizaci kritéria se osvědčilo volit konstantnı́ váhovou matici W k (při jediném výstupu se
jedná o váhu Wk ) při prvnı́m běhu numerického algoritmu na minimalizaci kritéria a zı́skané výsledky
dále zpřesnit novým během minimalizace s váhou rovnou absolutnı́ hodnotě maximálnı́ chyby v datech
v přı́slušném čase. Simulace ukazujı́ na mnoho lokálnı́ch extrémů kritéria, které lze překonat pouze
dobrým počátečnı́m odhadem hledaných parametrů.
16.3
Stochastické modely nelineárnı́ch systémů
Statické nelineárnı́ modely
Statický stochastický systém je obecně popsán podmı́něnou hustotou pravděpodobnosti
p(y(t)|u(t), t) nebo p(y|u) pokud se jedná o systém časově invariantnı́. Nepodmı́něnou hustotu
pravděpodobnosti výstupnı́ho vektoru dostaneme jednoduše jako marginálnı́ hustotu
p(y) =
Z
p(y, u)du =
Z
p(y|u)p(u)du
(16.9)
Velmi často modelujeme stochastické systémy jako systémy deterministické, na které působı́ náhodné
veličiny. Stochastický charakter takových systémů jim dodá generátor těchto náhodných veličin. Určenı́
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
165
stochastických vlastnostı́ výstupu je v tomto přı́padě vlastně problém transformace náhodných veličin
nebo ve vı́cerozměrném přı́padě transformace náhodných vektorů.
Statický systém je systém bez paměti u něhož vztah mezi vstupem u(t) a výstupem y(t) je
popsán vztahem
y(t) = g(u(t), t)
(16.10)
kde čas t je spojitý nebo diskrétnı́. Pokud je systém časově invariantnı́, transformace náhodného
vstupnı́ho vektoru na vektor výstupnı́ nezávisı́ na čase a proto je možno všechny časové argumenty
vypustit a stručně popisovat vztah mezi vstupem a výstupem vztahem y = g(u).
Jednorozměrové systémy
V jednorozměrovém přı́padě je situace přehledná. Pro určité y = y1 najdeme ze vztahu mezi vstupem a
výstupem y = g(u) všechna ui pro která platı́ y1 = g(u1 ) = g(u2 ) = . . . = g(uj ). Neexistuje-li pro určité
y1 řešenı́ u pro které y1 = g(u), pak p(y1 ) = 0. Pravděpodobnost Pr{y1 < y < y1 + dy}, že náhodná
veličina y ležı́ ve ve zvoleném intervalu je rovna elementárnı́ ploše pod jejı́ hustotou pravděpodobnosti
p(y1 )dy = Pr{y1 < y < y1 + dy}
Protože ui jsou řešenı́ yi = g(ui ), pak současně platı́
p(y1 )dy = Pr{u1 < u < u1 + |du1 |; u2 < u < u2 + |du2 |; . . .}
= p(u1 )|du1 | + p(u2 )|du2 | + . . .
Uvědomme si, že přı́růstky dui nemusı́ být kladné, proto jsou přı́růstky brány v absolutnı́ hodnotě.
Přı́růstky dui nalezneme ze vztahu
dy =
dg(ui )
= g 0 (ui )dui
du
Potom platı́
p(y1 )dy = p(u1 )
dy
|g 0 (u
1 )|
+ p(u2 )
dy
|g 0 (u
2 )|
+ ...
Proto hustota pravděpodobnosti náhodné veličiny y v bodě y1 je rovna
p(y1 ) =
p(u1 )
p(u2 )
p(uj )
+ 0
+ ... + 0
0
|g (u1 )| |g (u2 )|
|g (uj )|
Pokud existuje jednoznačná inverznı́ funkce u = g −1 (y) k funkci g(y), pak platı́ následujı́cı́ obecný
vztah pro hustotu pravděpodobnosti vstupnı́ náhodné veličiny
py (y) = pu (g −1 (y))
1
= pu (u)
dg(u)
du
du
dy
u=g −1 (y)
,
(16.11)
kde jsme indexy označili o jaké hustoty pravděpodobnosti se jedná.
Střednı́ hodnota výstupu je dle definice
µy = E{y} =
Z
∞
g(u)p(u)du
−∞
Je-li hustota pravděpodobnosti vstupu soustředěna kolem své střednı́ hodnoty µu (malý rozptyl vstupu), pak přibližně platı́
Z ∞
.
µy = E{y} = g(µu )
p(u)du = g(µu )
(16.12)
−∞
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
166
Také pro rozptyl výstupu můžeme odvodit přibližný vztah
.
σy2 = E{g(u)2 } − µ2u = E[g 0 (µu )]2 σu2
Přı́klad 3: Mějme lineárnı́ statický systém jehož výstup je roven y = au. Podle předchozı́ho
vztahu je hustota pravděpodobnosti výstupu rovna py (y) = a1 pu ( ay ). Má-li náhodná veličina u normálnı́
rozdělenı́ u ∼ N (µ, σ 2 ), pak hustota pravděpodobnosti výstupu v bodě y = aµ je rovna py (aµ) =
aµ
1
1
a pu ( a ) = a pu (µ). Odtud plyne, že náhodná veličina y má také normálnı́ rozdělenı́ se střednı́ hodnotou
aµ a rozptylem a2 σ 2 . Nakreslete si průběh hustoty pravděpodobnosti výstupu pro konkrétnı́ hodnoty
zesı́lenı́ a normálnı́ho rozdělenı́ vstupnı́ veličiny.
Přı́klad 4: Odpor R je náhodná veličina s rovnoměrným rozdělenı́m v intervalu 90 ≤ R ≤ 110 Ω.
Jaká je hustota pravděpodobnosti vodivosti G tohoto odporu.
Hustota pravděpodobnosti náhodné veličiny R je p(R) = 1/20 na intervalu 90 ≤ R ≤ 110. Vodivost
1
je převrácená hodnota odporu G = . Jaká je tedy hustota pravděpodobnosti p(y) náhodné veličiny
R
a
y = známe-li hustotu pravděpodobnosti p(u)?
u
Pro každé y má vztah y = a/u jediné řešenı́ u = a/y. Derivace g 0 (u) = −a/u2 = −y 2 /a. Proto
hustota pravděpodobnosti p(y) náhodné veličiny y je rovna
py (y) =
|a|
a
pu ( )
2
y
y
kde jsme indexy opět označili o jaké hustoty pravděpodobnoti se jedná.
Pro náš přı́pad hustoty pravděpodobnosti vodivosti G při rovnoměrném rozloženı́ hustoty
pravděpodobnosti jejı́ho odporu platı́
1
1
1 1
1
1
pR ( ) = 2
pro
≤G≤ .
2
G
G
G 20
110
90
Průběh hustoty pravděpodobnosti odporu R a jeho vodivosti G je na obr. 16.1.
pG (G) =
Obrázek 16.1: Hustota pravděpodobnosti odporu R a vodivosti G
Přı́klad 5: Necht’ výstup statického systému je roven y = a sin(u + θ), kde a > 0.
Inverznı́ funkce je ui = arcsin( ay ) − θ. Derivace g 0 (ui ) = a cos(u + θ) = (a2 − y 2 )1/2 . Proto platı́
X
1
pu (ui )
py (y) = p 2
a − y2 i
pro |y| < a,
py (y) = 0
pro |y| > a.
Pokud náhodná veličina u má rovnoměrné rozdělenı́ na intervalu (−π, π), pak je zřejmě p(u) = 1/2π
na daném intervalu a vně tohoto intervalu je p(u) = 0. Funkce y = a sin(u + θ) má na daném intervalu
dvě řešenı́ a proto
py (y) = p
1
2
2
− y 2π
a2
pro |y| < a,
py (y) = 0
pro |y| > a
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
167
Průběh hustoty pravděpodobnosti náhodné veličiny u a y je na obr. 16.2.
Obrázek 16.2: Hustota pravděpodobnosti náhodné veličiny u a y z přı́kladu 5.
Mnoharozměrové statické systémy
Nejprve budeme diskutovat systémy se dvěma vstupy a jednı́m výstupem. Jedná se potom o systém
jehož výstup je určen vztahem y = g(u1 , u2 ).
Pro určenı́ pravděpodobnostnı́ch charakteristik výstupu určı́me pro zvolenou hodnotu výstupu
oblast U v rovině u1 , u2 pro kterou platı́ g(u1 , u2 ) < y. Distribučnı́ funkce Py (y) je potom určena
jednoduše pravděpodobnostı́ Pr že výstup je menšı́ než zvolená hodnota y.
Py (y) = Pr{(u1 , u2 ) ∈ U } =
Z Z
pu1,u2 (u1 , u2 )du1 du2
U
(16.13)
Hustotu pravděpodobnosti výstupu můžeme určit derivovánı́m předchozı́ho vztahu nebo podobně
jako v předchozı́m jednorozměrovém přı́padě určenı́m oblasti ∆U v rovině u1 , u2 pro kterou platı́
y < g(u1 , u2 ) ≤ y+dy. Odtud pravděpodobnost, že výstup je v uvedeném intervalu je rovna elementárnı́
ploše
Z Z
py (y)dy = Pr{(u1 , u2 ) ∈ ∆U} =
∆U
pu1,u2 (u1 , u2 )du1 du2
(16.14)
Probereme nynı́ jako přı́klady několik specielnı́ch přı́padů.
Přı́klad 6: Vztah mezi dvěma vstupy a jednı́m výstupem statického systému je určen vztahem
y = u1 + u2 . V tomto přı́padě je distribučnı́ funkce výstupu rovna
Py (y) =
Z
∞
−∞
Z
y−u2
−∞
pu1 ,u2 (u1 , u2 ) du1
du2
nebot’ pro dané y je u2 libovolné a u1 = y − u2 . Derivovánı́m předchozı́ho vztahu podle y dostaneme
hustotu pravděpodobnosti výstupu
py (y) =
Z
∞
−∞
pu1 ,u2 (y − u2 , u2 ) du2
(16.15)
Poznámka: Derivaci integrálu podle parametru provedeme podle Leibnitzova vzorce
d
dt
Z
b(t)
f (t, τ )dτ =
a(t)
Z
b(t)
a(t)
δf (t, τ )
d (b(t))
d (a(t))
dτ +
f (t, b(t)) −
f (t, a(t))
δt
dt
dt
(16.16)
2
Pokud navı́c vstupnı́ náhodné veličiny jsou nezávislé, pak hustota pravděpodobnosti jejich součtu
je rovna konvoluci jejich hustot
py (y) =
Z
∞
−∞
pu1 (y − u2 )pu2 (u2 ) du2 =
Z
∞
−∞
pu1 (u1 )pu2 (y − u1 ) du1
(16.17)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
168
Pokud navı́c vstupnı́ veličiny nabývajı́ pouze nezáporné hodnoty je jejich součet také nezáporný a
proto hustota pravděpodobnosti výstupu je rovna
Z
py (y) =
y
0
a samozřejmě py (y) = 0
pu1 (y − u2 )pu2 (u2 ) du2 ,
pro y ≥ 0
pro y < 0.
Přı́klad 7: Máme dva odpory které jsou zapojeny v serii. Odpor každého z nich je náhodná veličina
s rovnoměrným rozdělenı́m v intervalu (80, 100) ohm. Celkový odpor seriové kombinace odporů je
roven jejich součtu. Hustota pravděpodobnosti součtu je dána konvolucı́ dvou vzájemně nezávislých
obdélnı́kových hustot jednotlivých odporů. Výsledkem konvoluce je trojúhelnı́kový průběh hustoty
pravděpodobnosti součtu dvou odporů. Tato hustota je nenulová v intervalu (160, 200) - viz obr. 16.3.
Obrázek 16.3: Hustota pravděpodobnosti odporů R1,2 a jejich součtu
Rozmyslete si, jaké rozloženı́ hustoty pravděpodobnosti bude mı́t sériová kombinace třı́ a vı́ce
odporů. Uvědomte si, jak se hustota pravděpodobnosti součtu několika odporů stále vı́ce blı́žı́ průběhu
hustoty pravděpodobnosti normálnı́ho rozdělenı́.
Přı́klad 8: Necht’ dva vlaky přijedou do určité stanice v časovém intervalu (0, T ). Doba jejich
přı́jezdu je tedy náhodná veličina a obě náhodné veličiny necht’ jsou vzájemně nezávislé. Označı́me
jako u1 a u2 časy přı́jezdu jednotlivých vlaků a necht’ y je časový interval mezi jejich přı́jezdem. Pak
zřejmě platı́
y = |u1 − u2 |
Nejprve určı́me hustotu náhodné veličiny z = u1 − u2 rovné rozdı́lu vstupů. Platı́
pz (z) =
Z
∞
−∞
pu1 (z − u2 )pu2 (−u2 ) du2 ,
pro y ≥ 0
a hustota pravděpodobnosti náhodné veličiny z má trojúhelnı́kový průběh. Hustotu pravděpodobnosti
výstupu y = |z|, která je nenulová pouze pro y ∈ (0, T ), dostaneme překlopenı́m záporné části hustoty
veličiny z kolem osy y = 0, viz obr. 16.4.
Obrázek 16.4: Hustota pravděpodobnosti náhodné veličiny u1,2 a y = |u1 − u2 |
Ověřte, že střednı́ hodnota časového intervalu mezi přı́jezdy obou vlaků je rovna µy = T /3. Určete
rozptyl této náhodné veličiny.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
169
Přı́klad 9: Necht’ nynı́ je výstup statického systému určen vztahem y = min(u1 , u2 ). Pro dané y
je oblast U , pro kterou min(u1 , u2 ) ≤ y, určena zřejmě nerovnostı́ u1 ≤ y nebo u2 ≤ y. Nakreslete si
v rovině u1 , u2 oblast bodů splňujı́cı́ch omezenı́ u1 ≤ y nebo u2 ≤ y. Odtud plyne vztah pro distribučnı́
funkci Py (y)
Py (y) = Pu1 (y) + Pu2 (y) − Pu1 ,u2 (y, y)
Pokud jsou náhodné veličiny u1 a u2 nezávislé, pak zřejmě
Py (y) = Pu1 (y) + Pu2 (y) − Pu1 (y) Pu2 (y)
Hustotu pravděpodobnosti výstupu dostaneme derivovánı́m předchozı́ho výrazu
py (y) = pu1 (y) + pu2 (y) − pu1 (y) Pu2 (y) − pu2 (y) Pu1 (y) =
pu1 (y) [1 − Pu2 (y)] + pu2 (y) [1 − Pu1 (y)]
Přı́klad 10: Výstup statického systému je určen vztahem y = max(u1 , u2 ). Pro dané y je oblast
U pro kterou max(u1 , u2 ) ≤ y určena zřejmě nerovnostı́ u1 ≤ y a u2 ≤ y. Nakreslete si opět v rovině
u1 , u2 oblast bodů splňujı́cı́ch pro dané y omezenı́ u1 ≤ y a u2 ≤ y. Odtud plyne vztah pro distribučnı́
funkci Py (y)
Py (y) = Pu1 ,u2 (y, y)
Hustotu pravděpodobnosti výstupu dostaneme derivovánı́m předchozı́ho výrazu
py (y) =
dPu1 ,u2 (y, y) dPu1 ,u2 (y, y)
+
=
du1
du2
Z
y
−∞
pu1 ,u2 (y, u2 )du2 +
Z
y
−∞
pu1 ,u2 (u1 , y)du1
Pokud jsou náhodné veličiny u1 a u2 nezávislé, pak zřejmě
Py (y) = Pu1 (y) Pu2 (y)
py (y) = pu1 (y) Pu2 (y) + pu2 (y) Pu1 (y)
Přı́klad 11: Předchozı́ vztahy můžeme použı́t při vyšetřovánı́ doby bezporuchového provozu dvou
zařı́zenı́. Označme jako u1 a u2 náhodné veličiny, které jsou rovny době bezporuchového provozu dvou
systémů S1 a S2 . Pravděpodobnost, že systém S1 se porouchá v čase t (za předpokladu, že začal
pracovat v čase t = 0) je rovna distribučnı́ funkci Pu1 (t) náhodné veličiny u1 a podobně pro systém
S2 .
Necht’ složený systém S je tvořen subsystémy S1 a S2 . Označme jako y náhodnou veličinu, které
je rovna době bezporuchového provozu složeného systému S.
Nastane-li porucha složeného systému S tehdy, když alespoň v jednom subsystému nastane
porucha, pak zřejmě náhodná veličina y je dána vztahem y = min(u1 , u2 ). To nastane na přı́klad
tehdy, když subsystémy jsou zapojeny v serii.
Nastane-li porucha složeného systému S tehdy, když v obou subsystémech nastane porucha, pak
zřejmě náhodná veličina y je dána vztahem y = max(u1 , u2 ). To nastane na přı́klad tehdy, když
subsystémy jsou zapojeny paralelně, to znamená, že zařı́zenı́ je schopno pracovat, když alespoň jeden
systém je v bezporuchovém provozu.
Systém S2 může být také použit jako záskok při poruše systému S1 . Potom doba bezporuchového
provozu systému S tvořeného záskokovým zapojenı́m systémů S1 a S2 je rovna součtu bezporuchového
provozu systémů S1 a S2 . Pak zřejmě náhodná veličina y je dána vztahem y = u1 + u2 .
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
170
Předpokládejme, že náhodné veličiny u1 a u2 jsou nezávislé a majı́ exponenciálnı́ rozdělenı́
pu1 (u1 ) = aeau1 ,
pu2 (u2 ) = bebu2
pro u1 > 0, u2 > 0.
a pu1 (u1 ) = 0 pro u1 < 0 a pu2 (u2 ) = 0 pro u2 < 0 a navı́c a 6= b. Ověřte, že hustota pravděpodobnosti
náhodné veličiny y při seriovém, paralelnı́m a záskokovém zapojenı́ subsystémů je po řadě rovna
py (y) = (a + b)e(a+b)y
py (y) = aeay + beby − (a + b)e(a+b)y
ab ay
py (y) =
e − eby
b−a
Jaký je vztah pro hustotu pravděpodobnosti py (y) při záskokovém zapojenı́ subsystémů pokud a = b?
2
Pro obecný mnoharozměrový statický stochastický systém popsaný vztahem y = g(u) platı́
podobné vztahy. Omezı́me se na systémy se stejným počtem vstupů a výstupů u kterých existuje
jednoznačná inverznı́ funkce u = g −1 (y). Pokud má systém menšı́ počet výstupů než vstupů, pak
můžeme doplnit chybějı́cı́ počet výstupů některými vstupy (aby transformace byla jednoduchá). Marginálnı́ hustotu výstupu dostaneme vyintegrovánı́m uměle zavedených výstupů. Obráceně, pokud má
systém vı́ce výstupů než vstupů, pak jej můžeme rozdělit na dva paralelnı́ systémy, které vyšetřujeme
odděleně.
Mějme tedy systém se stejným počtem vstupů a výstupů, kterých necht’ je m. Jednoznačná inverznı́ funkce existuje, pokud je pro každé y nenulový determinant Jakobiho matice (jakobián
transformace g(y)). Jakobiho matice zobrazenı́ y = g(u) je rovna
dg1
. . . , du
m
dg(u) 

=  ..., ... ,... 
J=
du
dgm
dgm
du1 , . . . , dum

dg1
du1 ,

(16.18)
Abychom určili hustotu pravděpodobnosti p(y) výstupu systému ze známé vı́cerozměrové hustoty
pravděpodobnosti vstupu p(u) a vlastnostı́ zobrazenı́ y = g(u), určı́me pro každé y inverznı́ funkci
g −1 (y). Potom podle věty o substituci vypočteme vı́cerozměrnou hustotu pravděpodobnosti
výstupu podle vztahu
1
py (y) = pu (g −1 (y))
(16.19)
|det(J)|
kde |det(J)| je absolutnı́ hodnota determinantu Jakobiho matice.
Podobně určı́me globálnı́ charakteristiky výstupnı́ho vektoru. Vektor střednı́ch hodnot
výstupu je roven
Z
µy = E{y} =
∞
g(u)p(u)du
−∞
Kovariančnı́ matice výstupnı́ho vektoru je rovna
cov(y) = P y = E{(y − E{y}) (y − E{y})T }
Připomeňme, že v diagonále kovariančnı́ matice jsou rozptyly jednotlivých složek výstupu. Vzájemná
kovariančnı́ matice mezi vstupnı́m a výstupnı́m vektorem je
cov(y, u) = P y,u = E{(y − E{y}) (u − E{u})T }
Uvedené vztahy použijeme při určovánı́ stochastických vlastnostı́ dynamických systémů.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
171
Diskrétnı́ dynamické nelineárnı́ systémy
Stochastické diskrétnı́ dynamické systémy (systémy diskrétnı́ v čase ale spojité v úrovni všech veličin)
jsou obecně popsány podmı́něnými hustotami pravděpodobnosti stavu a výstupu
p(x(k + 1) | x(k), u(k))
(16.20)
p(y(k) | x(k), u(k)),
kde k je diskrétnı́ čas, x(k) je stav systému, u(k) je řı́zenı́ a y(k) je výstup systému. Prvnı́ podmı́něná
hustota pravděpodobnosti popisuje stochastické vlastnosti vývoje stavu x(k) stochastického systému.
Aby náhodný vektor x(k) byl stavem stochastického systému musı́ v sobě obsahovat veškerou informaci
o minulém vývoji systému. Tuto t.zv. Markovovu vlastnost stavu můžeme vyjádřit vztahem
p(x(k + 1)|x(k), x(k − 1), . . . , u(k), u(k − 1), . . .) = p(x(k + 1)|x(k), u(k))
Druhá podmı́něná hustota pravděpodobnosti v (16.20) popisuje stochastické vlastnosti výstupu
systému, což často popisuje nepřesnosti měřicı́ch členů - čidel.
Nelineárnı́ diskrétnı́ stochastický systém můžeme také popisovat stochastickou diferenčnı́ rovnicı́
x(k + 1) = f (x(k), u(k), v(k), k)
(16.21)
y(k) = g(x(k), u(k), e(k), k),
kde náhodný vývoj stavu je reprezentovaný náhodným vektorem v(k) a náhodný vývoj výstupu je
reprezentovaný náhodným vektorem e(k). Vývoj stavu a výstupu systému závisı́ na stochastických
vlastnostech náhodných vektorů v(k) a e(k) a stochastických charakteristikách počátečnı́ho stavu
x(0). Samozřejmě vývoj stavu ovlivňuje také řı́zenı́ u(k), které ale považujeme za deterministickou
veličinu. Aby byla zachována Markovovská vlastnost stavu, musı́ platit
p(v(k), v(k − 1), . . . , v(0), x(0)) = p(v(k)) p(v(k − 1)) . . . p(v(0)) p(x(0))
(16.22)
To znamená, že náhodný proces v(k) musı́ tvořit posloupnost nezávislých náhodných vektorů. Stejná
podmı́nka musı́ platit i pro náhodný proces e(k) a navı́c musı́ být náhodné procesy v(k) a e(k)
vzájemně nezávislé. Také náhodný vektor x(0) musı́ být nezávislý na šumu procesu a šumu měřenı́.
Řešenı́ stochastických diferenčnı́ch rovnic
Řešenı́m diferenčnı́ rovnice stochastického diskrétnı́ho systému je náhodný proces x(k), který závisı́
na počátečnı́ podmı́nce x(0), řı́zenı́ u(k) na celém intervalu a samozřejmě na vlastnostech náhodného
vektoru v(k). K úplné znalosti náhodného procesu x(k) je třeba znát libovolnou podmı́něnou
konečněrozměrnou hustotu pravděpodobnosti
p(x(k + 1), x(k), . . . , x(0)|u(k), u(k − 1), . . . , u(0))
Z Markovovy vlastnosti stavu plyne
p(x(k + 1), x(k), . . . , x(0)|u(k), u(k − 1), . . . , u(0)) =
p(x(k + 1)|x(k), u(k)) . . . p(x(1)|x(0), u(0)) p(x(0))
Zřejmě platı́
p(x(k + 1)|x(0)) =
Z
p(x(k + 1), x(i) | x(0))dx(i)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
172
a proto
p(x(k + 1)|x(0)) =
Z
p(x(k + 1)|x(i))p(x(i)|x(0))dx(i),
(16.23)
kde 0 < i < k + 1.
Tato rovnice se nazývá Chapman-Kolmogorovova rovnice. Určuje vývoj hustoty pravděpodobnosti
stavu x(k + 1). Nepodmı́něnou hustotu pravděpodobnosti stavu x(k + 1) dostaneme jednoduše
p(x(k + 1)) =
Z
p(x(k + 1)|x(0))p(x(0))dx(0)
Je-li stochastický systém popsán stochastickou diferenčnı́ rovnicı́ (16.21), pak pro přenosovou hustotu
pravděpodobnosti platı́
p(x(k + 1)|x(k), u(k) =
pv (f −1 (x(k + 1), x(k), u(k))
,
(k+1)
det δx
δ v (k)
(16.24)
(k+1)
−1 je
kde δx
δ v (k) je Jakobián transformace mezi náhodným vektorem v(k) a vektorem x(k + 1) a f
řešenı́ stochastické rovnice pro dané x(k + 1), x(k), u(k), pak v(k = f −1 (x(k + 1), x(k), u(k)) a pv je
hustota pravděpodobnosti náhodného vektoru v(k).
Poznámka: Pro častý přı́pad stochastické rovnice ve tvaru
x(k + 1) = f (x(k), u(k), k) + v(k)
(16.25)
y(k) = g(x(k), u(k), k) + e(k),
ve které šum procesu i měřenı́ vystupuje aditivně je Jakobián transformace roven jednotkové matici.
Potom ve výrazu (16.24) pro přenosovou hustotu pravděpodobnosti je jmenovatel roven jedné. Je-li
navı́c šum procesu v(k) posloupnost nezávislých vektorů (bı́lá posloupnost) s normálnı́m rozdělenı́m
v(k) ∼ N (O; Q)
je přenosová hustota pravděpobnosti také normálnı́ a je rovna
p(x(k + 1)|x(k), u(k)) ∼ N (f (x(k), u(k), k); Q)
(16.26)
Také podmı́něná hustota pravděpodobnosti výstupu je normálnı́ se střednı́ hodnotou g(x(k), u(k), k)
a kovariančnı́ matice výstupu je rovna kovariančnı́ matici šumu měřenı́.
Poznámka: Pro stochastický lineárnı́ diskrétnı́ systém popsaný stavovou rovnicı́
x(k + 1) = Ax(k) + Bu(k) + F v(k)
(16.27)
y(k) = Cx(k) + Du(k) + He(k),
kde šumy v(k), e(k) jsou nezávislé posloupnosti s normálnı́m rozdělenı́m v(k) ∼ N (O; Q) , e(k) ∼
N (O; R) jsou podmı́něné hustoty pravděpodobnosti také normálnı́, rovné
p(x(k + 1)|x(k), u(k)) ∼ N (Ax(k) + Bu(k); F QF T )
(16.28)
T
p(y(k)|x(k), u(k)) ∼ N (Cx(k) + Du(k); HRH )
Poznámka: Stochastický nelineárnı́ diskrétnı́ systém popsaný stavovou rovnicı́ (16.25) můžeme
linearizovat v nějakém pracovnı́m bodě x0 (k), u0 (k). Pak dostaneme linearizované stavové rovnice ve
tvaru
x(k + 1) =
y(k) =
df (x, u, k)
df (x, u, k)
x(k) +
u(k) + v(k)
dx
du
dg(x, u, k)
dg(x, u, k)
x(k) +
u(k) + e(k),
dx
du
(16.29)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
173
kde všechny derivace počı́táme v pracovnı́m bodě x0 (k), u0 (k). Potom pro tento linearizovaný systém
můžeme podmı́něné hustoty pravděpodobnosti přibližně počı́tat podle vztahů uvedených v předchozı́ch
dvou poznámkách.
Poznámka: V některých přı́padech je stochastický nelineárnı́ diskrétnı́ systém popsaný stavovými
rovnicemi v implicitnı́m tvaru
x(k + 1) = F (x(k + 1), x(k), u(k)) + v(k)
(16.30)
Posunutý stav x(k + 1) se vyskytuje také na pravě straně stavové rovnice. Linearizaci této stavové
rovnice provedeme opět v nějakém pracovnı́m bodě x0 (k + 1), x0 (k), u0 (k)
dF (x(k + 1), x, u, k)
x(k + 1) +
dx(k + 1)
dF (x(k + 1), x, u, k)
dF (x(k + 1), x, u, k)
x(k) +
u(k) + v(k)
dx(k)
du(k)
x(k + 1) =
Po úpravě dostaneme linearizované rovnice ve tvaru
dF (x(k + 1), x, u, k) −1
x(k + 1) = I −
dx(k + 1)
dF (x(k + 1), x, u, k)
dF (x(k + 1), x, u, k)
x(k) +
u(k) + v(k)
dx(k)
du(k)
kde všechny derivace opět počı́táme v pracovnı́m bodě x0 (k), u0 (k). Při tom předpokládáme, že
inverznı́ matice v předchozı́m výrazu existuje. Uvědomme si, že linearizace a odstraněnı́ implicitnı́ho
popisu je pouze přibližné, protože pro výpočet stavu v čase k + 1 musı́me v inverznı́ matici počı́tat
derivaci dF /dx(k+1) v bodě x0 (k+1), který ještě neznáme. To lze přibližně odstranit pouze iteračnı́m
výpočtem.
2
’
Práce se stochastickými diskrétnı́mi systémy je poměrně jednoduchá, nebot na rozdı́l od spojitých
stochastických systémů nenı́ třeba definovat derivaci a integrál stochastického procesu.
Spojité dynamické nelineárnı́ systémy
V tomto odstavci uvedeme stručně výsledky modelovánı́ a řešenı́ stochastických nelineárnı́ch systémů.
Uvedené vztahy majı́ sloužit pouze jako uvedenı́ do složité problematiky analýzy vlastnostı́ spojitých
stochastických systémů. Podrobnějšı́ rozbor této problematiky je možno nalézt v [20] a [37].
Stochastické spojité dynamické systémy jsou popsány Itovovou stochastickou diferenciálnı́ rovnicı́
dx(t) = f (x(t), u(t), t) dt + dw(t)
(16.31)
kde w(t) je tzv. Wienerův proces a dw(t) je přı́růstek tohoto procesu. Wienerův proces (nebo také
Wiener–Lévyho proces) má normálnı́ rozdělenı́ s nulovou střednı́ hodnotou a má nezávislé a stacionárnı́
přı́růstky. Wienerův proces je formálně definován následujı́cı́mi vztahy:
w(0) = O,
E{w(t)} = O,
∀t > 0
T
E{w(t)w(t) } = Q t.
Wienerův proces matematicky popisuje Brownův pohyb. Realizace Wienerova procesu má zajı́mavé
vlastnosti - je spojitá s pravděpodobnostı́ jedna a jejı́ derivace nikde neexistuje.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
174
Přı́růstek Wienerova procesu má nulovou střednı́ hodnotu, jeho kovariance je
n
E dw(t)dw(t)T
o
= Q dt
a hodnoty přı́růstků v nepřekrývajı́cı́ch se časových intervalech jsou nezávislé. Rovnici (16.31) můžeme
formálně zapsat ve tvaru
ẋ(t) = f (x(t), u(t), t) + v(t),
(16.32)
kde náhodný proces v(t) je spojitý bı́lý šum s autokovariančnı́ matici
cov {v(t1 ), v(t2 )} = Q δ(t1 − t2 ),
(16.33)
a δ(t) je Diracova funkce (Diracova distribuce). Popis stochastického systému podle (16.32) je třeba
chápat pouze jako symbolickou analogii Itovovy stochastické diferenciálnı́ rovnice (16.31), nebot’
derivace
dw(t)
v(t) =
dt
Wienerova procesu w(t) neexistuje. Přesný popis spojitého stochastického systému je uveden v [20]
nebo v [37].
Výstupnı́ rovnice spojitého stochastického systému se spojitým měřenı́m výstupu je
y(t) = g (x(t), u(t), t) + e(t),
(16.34)
kde spojitý šum měřenı́ e(t) má nulovou střednı́ hodnotu a kovariančnı́ matici Res a je nekorelovaný
se šumem procesu v(t). Index es znamená, že se jedná o šum spojitého měřicı́ho členu.
Pokud uvažujeme diskrétnı́ měřenı́ výstupu, pak je výstupnı́ rovnice
y(k) = g (x(k), u(k), k) + e(k)
(16.35)
kde diskrétnı́ čas k je svázán se spojitým časem t vztahem t = k T a T je perioda vzorkovánı́ (která
nemusı́ být nutně konstantnı́). Diskrétnı́ bı́lý šum e(k) má nulovou střednı́ hodnotu a kovariančnı́
matici Red = T1 Res a je také nekorelovaný se šumem procesu v(t). Uvědomme
si, že diskrétnı́ bı́lý
π π
šum má konstantnı́ spektrálnı́ hustotu na intervalu frekvencı́ ω ∈ − ,
a je to tedy bı́lý šum
T T
vzniklý vzorkovánı́m spojitého bı́lého šumu, který byl před vzorkovánı́m filtrován dolnofrekvenčnı́m
filtrem s frekvenčnı́m rozsahem ve stejném frekvenčnı́m pásmu - viz věta o vzorkovánı́.
Poznámka: Uvědomme si, že spojitý bı́lý šum e(t) je pouze matematickou abstrakcı́ a nenı́
fyzikálně realizovatelný. Spojitý bı́lý šum má frekvenčnı́ spektrum konstantnı́ na celém rozsahu
frekvencı́ a takový signál by měl nekonečnou energii. Naproti tomu diskrétnı́ bı́lý šum e(k) s kovariančnı́ maticı́ E(e(k1 ) e(k2 )) = R δ(k1 −k2 ), kde δ(k) = 0 ∀k 6= 0, δ(0) = 1 je fyzikálně realizovatelný.
Proto je potı́ž s diskretizacı́ nerealizovatelného spojitého bı́lého šumu. Je proto lepšı́ představit si, že
spojitý i diskrétnı́ bı́lý šum modelujı́ nepřesnosti spojitého a diskrétnı́ho měřicı́ho členu. Vlastnosti
těchto měřicı́ch členů spolu vůbec nemusejı́ souviset.
2
U spojitých stochastických systémů nás zajı́má, jak se v čase vyvı́jı́ podmı́něná hustota
pravděpodobnosti stavu x v čase t z počátečnı́ho stavu z = x(t0 ) v čase t0 , při působenı́ deterministického řı́zenı́ u(τ ) na intervalu t > τ ≥ t0 . Tuto podmı́něnou hustotu označı́me
p (x(t)|z, u(τ ), t > τ ≥ t0 ).
Vývoj této hustoty je popsán tzv. Fokker–Planckovou nebo přı́mou Kolmogorovovou
parciálnı́ diferenciálnı́ rovnicı́
∂
p(x(t)|z(t), u(τ )) = −tr
∂t
n
∂p(x(t)|z(t), u(τ ))f (x(t), u(t), t)
1 X
∂ 2 p(x(t)z(t), u(τ ))qi,j
+
∂x(t)
2 i,j=1
∂xi ∂xj
(16.36)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
175
kde qi,j je (i, j)-tý prvek matice Q. Počátečnı́ podmı́nky jsou p (x(t0 )|z, u(t0 ), t0 ) = δ (x(t0 ) − z).
Focker Planckova rovnice může být přı́mo řešena pouze ve specielnı́ch přı́padech. Zde ji uvádı́me spı́še
pro ukázku toho, jak je vývoj hustoty stavu v čase komplikovaný u spojitých systémů.
Nás ale vı́ce bude zajı́mat vývoj prvnı́ch dvou momentů - střednı́ hodnoty a kovariance stavu.
b (t) = E {x(t) | z, u(τ )}. Pro ni platı́
Označı́me tedy podmı́něnou střednı́ hodnotu stavu jako x
b (t)
∂x
= E {f (x(t), u(t), t) | x(t0 ) = z, u(τ )}
∂t
(16.37)
Poznamenejme, že obecně
b (t), u(t), t)
E {f (x(t), u(t), t) | x(t0 )z, u(τ )} =
6 f (x
n
o
b ) (x(t) − x
b )T | x(t0 ) = z, u(τ ) . Pro jejı́ vývoj je
Podmı́něná kovariance stavu je P (t) = E (x(t) − x
možno odvodit následujı́cı́ vztah
Ṗ (t) =
h n
o
i
h n
o
i
b (x, u, t)T +
b (t) . f
E x(t) . f (x(t), u(t), t)T − x
b (t)T + Q.
E f (x(t), u(t), t) . x(t)T − fb (x, u, t) . x
Předchozı́ rovnice jsou složité integro–diferenciálnı́ rovnice, protože operátor střednı́ hodnoty je integrálnı́ operátor k jehož řešenı́ je třeba znát podmı́něnou hustotu pravděpodobnosti stavu, která je
určena řešenı́m Kolmogorovovy rovnice.
Poznámka: Pro lineárnı́ stochastické systémy popsané stavovou rovnicı́
ẋ(t) = Ax(t) + Bu(t) + v(t)
je vývoj podmı́něné střednı́ hodnoty popsán jednoduše vztahem
ḃ
b (t)
x(t)
= Ax
a vývoj kovariančnı́ matice je určen řešenı́m Ljapunovovy rovnice
Ṗ (t) = P (t)AT + AP (t) + Q.
Předchozı́ diferenciálnı́ rovnice řešı́me z počátečnı́ch podmı́nek daných informacı́ o počátečnı́m stavu.
2
16.4
Stochastické metody identifikace nelineárnı́ch systémů
16.4.1
Bayesovské metody
Jednotı́cı́m základem metod identifikace jsou Bayesovské metody. V nich se neznámé stavy, parametry
či struktury považujı́ za náhodné veličiny. Našı́ subjektivnı́ představu o rozloženı́ pravděpodobnosti
těchto náhodných veličin objektivizujeme daty změřenými na identifikovaném objektu.
Předpokládejme, že pozorujeme (měřı́me) vstup u(τ ) a výstup y(τ ) v čase τ = 1, . . . , k−1 a naše
znalost stavu systému založená na množině dat
Dk−1 = {u(1), y(1), . . . , u(k−1), y(k−1)}
je popsána podmı́něnou hustotou pravděpodobnosti
p x(k)| Dk−1 .
(16.38)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
176
Problém
naši
popsanou podmı́něnou hustotou pravděpodobnosti
je, jak aktualizovat
znalost stavu
k−1
k
(p.h.p.) p x(k)|D
na p.d.f p x(k+1)|D poté, co jsou změřena nová vstupnı́ a výstupnı́ data
{u(k), y(k)}. Při tom známe pravděpodobnostnı́ model systému, který určuje pravděpodobnostnı́
vlastnosti výstupu systému
p (y(k)| x(k), u(k))
(16.39)
a pravděpodobnostnı́ vývoj stavu systému
p (x(k+1)| x(k), u(k), y(k)) .
(16.40)
Řešenı́ tohoto problému se skládá ze dvou kroků. Datový, (filtračnı́, nebo objektivnı́)
krok
je založený na vstupnı́ch a výstupnı́ch datech. Vycházı́me tedy ze známé p.h.p. p x(k)| Dk−1 .
Povšimněme si, že tato p.h.p. je založena na datech až do času k−1. Užitı́m modelu výstupu určeným
p.h.p. p (y(k)| x(k), u(k)) můžeme vzájemnou p.h.p. výstupu a stavu psát ve tvaru
p y(k), x(k)| Dk−1 , u(k) =
(16.41)


= p y(k)| x(k), u(k), Dk−1 p x(k)| Dk−1 , u(k)
= p x(k)| y(k), u(k), Dk−1  p y(k)|u(k), Dk−1 , u(k)


}
{z
|
Dk
Z předchozı́ho vztahu užitı́m tzv. přirozených podmı́nek řı́zenı́
p x(k)| Dk−1 , u(k) = p x(k)| Dk−1
(16.42)
plyne vztah pro aktualizaci p.h.p. pomocı́ nově zı́skaných dat
p x(k)| Dk =
1 p y(k)| x(k), u(k), Dk−1 p x(k)| Dk−1 , u(k)
α
(16.43)
kde normalizačnı́ konstanta α je nezávislá na datech a je rovna
p y(k)| Dk−1 , u(k) =
Z
p y(k), x(k)| Dk−1 , u(k) dx(k)
(16.44)
až na normalizačnı́
konstantu
Povšimněme si, že je datový krok součin věrohodnostnı́ funkce
p y(k)| x(k), u(k), Dk−1 a p.h.p p x(k)| Dk−1 , u(k) založené na starých datech. Předchozı́m vztahem je ukončen datový krok algoritmu.
Časový (predikčnı́ nebo subjektivnı́) krok je založen na pravděpodobnostnı́m modelu systému, který je určen známou p.h.p. (16.40). Využitı́m vztahu pro marginálnı́ hustotu
pravděpodobnosti můžeme psát prediktivnı́ hustotu pravděpodobnosti ve tvaru
p x(k+1)| Dk
=
Z
p x(k+1), x(k)| Dk dx(k)
Použitı́m vztahu pro podmiňovánı́ dostaneme konečný vztah pro prediktivnı́ p.h.p. stavu
p x(k+1)| Dk
=
Z
p x(k+1)| Dk , x(k) p x(k)| Dk dx(k)
(16.45)
Poznámka: Stejné vztahy platı́ pro spojitý systém, pouze časový krok se provádı́ obecně velmi
obtı́žně pomocı́ Fokkerovy-Planckovy difuznı́ rovnice.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
u(k)
177
y(k)
10
120
8
100
6
80
4
60
2
0
0
5
10
40
0
15
5
Skut. hod. par. a(k)
10
1
8
0.8
6
0.6
4
0.4
2
0.2
0
0
5
10
15
p(a(0))
10
0
0
15
5
10
Obrázek 16.5: Hodnoty předstihu u(k), okamžitého výkonu y(k), průběhu změn parametru a(k) i
apriornı́ hustoty p(a(0)).
Přı́klad 12: Odhad parametrů extremálnı́ charakteristiky spalovacı́ho motoru.
U spalovacı́ho motoru má závislost mezi předstihem a výkonem motoru extremálnı́ charakter, který
při velkém zjednodušenı́ lze popsat vztahem
y = b − c(u − a)2 + e
kde y je okamžitý výkon motoru, u je předstih, a, b, c jsou parametry polohy paraboly, šum e modeluje
nepřesnosti měřenı́.
p(a)
p(a)
p(a)
1.5
0.2
p(a)
p(a)
2
2
2
1
1
1
1
0.5
0
0
5
10
2
0
0
5
10
0
0
3
3
2
2
1
1
5
10
1
0
0
5
10
1.5
0
0
5
10
2
1
0
0
5
10
0
0
5
10
0
0
4
4
2
2
0
0
5
10
0
0
3
3
3
2
2
2
1
1
1
5
10
5
10
5
10
1
0.5
0
0
5
10
0
0
5
10
0
0
5
10
0
0
5
10
0
0
Obrázek 16.6: Vývoj hustoty pravděpodobnosti p(a(k)) v čase
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
178
Poloha paraboly závisı́ na mnoha činitelı́ch (kvalitě paliva, otáčkách motoru, teplotě a opotřebenı́
motoru a pod.). Předpokládáme, že známe parametr b, (b = 100)a parametr c, (c = 1) a pak pouze
parametr a je předmětem identifikace. Při tom předpokládáme, že parametr a leži v intervalu 0 ≤ a ≤
10; přesněji řečeno pouze v tomto intervalu budeme zjišt’ovat průběh hustoty pravděpodobnosti p(a)
tohoto parametru. Identifikaci parametru a převedeme na identifikaci stavu x(k) = a(k), kde stavová
rovnice má tvar
x(k + 1) = x(k) + v(k),
a kde k je diskrétnı́ čas ve kterém provádı́me měřenı́ předstihu u(k) a okamžitého výkonu y(k). Vývoj
parametru je tedy popsán jako ”náhodná procházka” a šum v(k) ∼ N (0, σv2 ) umožňuje sledovat změny
parametrů. Pro stavový model popsaný předchozı́ rovnicı́ je rovnice paraboly výstupnı́ rovnicı́ systému,
jehož stav (parametr a(k)) odhadujeme. Tuto výstupnı́ rovnici zapı́šeme ve tvaru
y(k) = 100 − (u(k) − x(k))2 + e(k)
Ladicı́ nástroje při identifikaci jsou jednak rozptyl šumu měřenı́ - tı́m vlastně modelujeme věrohodnost
dat a rozptyl šumu stavu v(k). Pokud je rozptyl tohoto šumu nulový, modelujeme tı́m, že hledaný
parametr má konstantnı́ hodnotu (což v praxi nenı́ nikdy splněno).
Na počátku předpokládáme rovnoměrné rozdělenı́ hustoty pravděpodobnosti p(a). Protože
předpokládáme normalitu šumu měřenı́, je i podmı́něná hustota výstupu normálnı́
1 1 2σ12 (y(k)−(100−u(k)−a(k|k−1))2 )2
e e
p y(k)|a(k), Dk−1 , u(k) = √
2π σe
Tato podmı́něná hustota výstupu se nazývá věrohodnostnı́ funkce l(a(k)|y(k).
l(a)
0.1
0
0
0.1
5
0.1
0
0
l(a)
10
0
0
0.1
5
0.1
5
10
0
0
l(a)
10
0
0
0.1
5
0.1
5
10
0
0
l(a)
10
0
0
0.1
5
0.1
5
10
0
0
l(a)
10
0
0
5
10
5
10
5
10
0.1
5
10
0
0
0.1
0.1
0.1
0.1
0.1
0.05
0
0
5
10
0
0
5
10
0
0
5
10
0
0
5
10
0
0
Obrázek 16.7: Nekumulovaná věrohodnostnı́ funkce l(a(k)|y(k))
Výsledky simulace jsou uvedeny na obrázcı́ch 16.5, 16.6 a 16.7. Na obr. 16.5 jsou vyneseny simulované průběhy předstihu u(k), okamžitého výkonu y(k), skutečné hodnoty parametru a(k) a apriornı́
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
179
hustoty parametru p(a(0)). Protože je reálný předpoklad, že data nejsou změřena přesně, je k simulovanému výstupu přičten náhodný šum s rovnoměrným rozdělenı́m na intervalu [−5, +5]. Na obr. 16.6 je
vynesen průběh hustoty pravděpodobnosti p(a(k|k)) pro několik prvnı́ch kroků identifikace. Skutečná
hodnota parametru byla a(k) = 5 pro 1 ≤ k ≤ 5. Tomu odpovı́dajı́ průběhy hustot pravděpodobnosti
p(a) v prvnı́m řádku obr. 16.6 postupně pro k = 1 až k = 5. Pro 6 ≤ k ≤ 10 je skutečná hodnota
parametru a(k) = 2, to znamená, že v čase k = 5 nastala skoková změna parametru a. Pro 6 ≤ k ≤ 10
jsou průběhy hustoty parametru p(a(k)) vypočtené z dat podle Bayesova vztahu vyneseny postupně
v druhém řádku obr. 16.6. Pro 11 ≤ k ≤ 15 je skutečná hodnota parametru a(k) = 7, to znamená,
že v čase k = 11 nastala dalšı́ skoková změna parametru a. Pro 11 ≤ k ≤ 15 jsou průběhy hustoty
parametru p(a(k)) vypočtené z dat podle Bayesova vztahu vyneseny postupně ve třetı́m řádku obr.
16.6.
V obr. 16.7 jsou vyneseny průběhy věrohodnostnı́ funkce l(a(k)|y(k)) po jednotlivých krocı́ch k.
Povšimněte si, že vlivem kvadratické závislosti vstupu a výstupu systému má někdy věrohodnostnı́
funkce dva extrémy na sledovaném intervalu.
Hustota pravděpodobnosti p(a(k)) i věrohodnostnı́ funkce l(a(k)|y(k) byly počı́tány v sı́ti 500
hodnot na intervalu 0 ≤ a ≤ 10. Sledovánı́ změn parametru a bylo umožněno zapomı́nánı́m (viz šum
stavu v(k) ), které zde bylo realizováno tı́m způsobem, že k hustotě p(a(k)) byla v časovém kroku
přičtena nepatrná konstanta řádu 10−7 .
V tomto přı́padě simulované výsledky estimace parametru a byly velmi uspokojivé. Uvědomte si
ale velké potı́že při identifikaci vı́ce parametrů.
16.4.2
Rozšı́řený Kalmanův filtr
Kalmanův filtr provádı́ za některých předpokladů výpočet prvnı́ch dvou momentů p.h.p stavu, jejı́ž
obecný vývoj byl popsán v předchozı́m odstavci. Pokud je systém lineárnı́ a šumy stavu a výstupu jsou
normálnı́, pak jsou také normálnı́ všechny podmı́něné hustoty pravděpodobnosti, které se vyskytovaly
v předchozı́m odstavci. Normálnı́ rozloženı́ pravděpodobnosti je plně určeno prvnı́mi dvěma momenty střednı́ hodnotou a kovariancı́. Proto lze v čase vyvı́jet pouze tyto prvnı́ dva momenty a tento problém
právě řešı́ Kalmanův filtr.
Kalmanův filtr pro diskrétnı́ systémy
Nejprve uvedeme Kalmanův filtr pro lineárnı́ diskrétnı́ systémy a potom uvedeme přibližný postup
pro nelineárnı́ diskrétnı́ systémy. Uvažujme diskrétnı́ lineárnı́ stochastický systém popsaný stavovými
rovnicemi ve tvaru
x(k + 1) = A(k)x(k) + B(k)u(k) + v(k)
(16.46)
y(k) = C(k)x(k) + D(k)u(k) + e(k)
kde k je diskrétnı́ čas, x(k), u(k) a y(k) jsou po řadě stavy, vstupy a výstupy systému a v(k) =
N (0, P v ), e(k) = N (O, P e ) jsou vzájemně nezávislé šumy stavu a výstupu. Počátečnı́ stav x(k0 ) =
N (µx0 , Rx0 ) je nezávislý na šumech stavu a výstupu.
Optimálnı́ odhad stavu x(k), podmı́něný znalostı́ dat (vstupu a výstupu systému) až do času k,
b (k|k). Prvnı́ argument znamená čas, ve kterém provádı́me odhad a druhý argument určuje
označı́me x
čas posledně zı́skaných dat. Tento odhad je roven podmı́něné střednı́ hodnotě
b (k|k) = E{x(k)|u(k), y(k), u(k − 1), y(k − 1), . . .} = E{x(k)|D k }
x
(16.47)
Predikci podmı́něné střednı́ hodnoty, která je rovna odhadu stavu x(k + 1) v čase (k + 1) založeném
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
180
b (k +1|k) = E{x(k + 1)|u(k), y(k), u(k − 1), y(k − 1), . . .}. Kona stejné množině dat Dk označı́me x
variančnı́ matice chyby odhadu je rovna podmı́něné kovarianci
Platı́ tedy
b (k|k))(x(k) − x
b (k|k))T |u(k), y(k), . . .}
Rxx (k|k) = E{(x(k) − x
p x(k)|Dk
p x(k + 1)|Dk
(16.48)
b (k|k); Rxx (k|k), )
∼ N (x
b (k + 1|k); Rxx (k + 1|k), )
∼ N (x
Rekurzivnı́ odhadovánı́ stavu dynamického systému pomocı́ Kalmanova filtru můžeme rozdělit
na dva kroky. V prvnı́m kroku provedeme filtraci (odhad) stochastické veličiny podle zı́skaných pozorovánı́. Ve druhém kroku stanovı́me predikci odhadované střednı́ hodnoty a kovariance pomocı́
stavových rovnic systému. Prvnı́ krok se nazývá objektivnı́ krok (zı́skaný na podkladě známých
hodnot), druhý krok je subjektivnı́ krok, provedený na základě modelu systému.
b (k|k − 1). Na základě známého vstupu u(k) a výstupu y(k)
Mějme tedy odhadnutou veličinu x
provedeme filtraci stavu a dostaneme
b (k|k) = x
b (k|k−1) + Rxy (k|k−1)R−1
b (k|k−1))
x
yy (k|k−1)(y(k) − y
b
b
y (k|k−1) = C(k)x(k|k−1) + D(k)u(k)
Rxx (k|k) = Rxx (k|k−1) − Rxy (k|k−1)R−1
yy (k|k−1)Ryx (k|k−1)
kde Rxy (k|k−1) = Rxx (k|k−1)C T a Ryy (k|k−1) = C(k)Rxx (k|k−1)C T + Re . Po úpravě dostaneme
vztah pro filtraci podmı́něné střednı́ hodnoty ve tvaru
b (k|k) = x
b (k|k−1)−Rxx C T (CRxx C T +Re )−1 (y(k) − C x
b (k|k−1)) + D(k)u(k)
x
(16.49)
podmı́něná kovariančnı́ matice je rovna
Rxx (k|k)=Rxx (k|k−1) − Rxx C T (CRxx C T + Re )−1 CRxx
(16.50)
kde kovariančnı́ matice stavu na pravé straně předchozı́ch rovnic je Rxx = Rxx (k|k − 1).
Predikce podmı́něné střednı́ hodnoty stavu je určena na základě stavových rovnic modelu
b (k+1|k) = Ax
b (k|k) + Bu(k)
x
(16.51)
Rxx (k+1|k) = ARxx (k|k)AT + Rv
(16.52)
Predikovaná kovariančnı́ matice je
Vztahy (16.49), (16.50), (16.51) a (16.52) jsou rekurentnı́ vztahy řešené s počátečnı́ podmı́nkou
b (k0 |k0 − 1) = µx0 a Rxx (k0 |k0 − 1) = Rx0 .
x
Všechny kovariančnı́ matice vyjadřujeme obvykle ve faktorizovaném tvaru jako součin třı́ matic
R = LDLT , kde L je dolnı́ trojúhelnı́ková matice s jednotkovou diagonálou a matice D je diagonálnı́
matice. Pro úpravu matice do faktorizovaného tvaru můžeme použı́t algoritmus dyadické redukce.
Filtraci i predikci provádı́me potom numericky výhodným algoritmem nevyžadujı́cı́ inverzi matice.
Problém odhadovánı́ stavů lze Kalmanovým filtrem řešit přibližně i pro nelineárnı́ systém, jehož
stavové rovnice jsou
x(k + 1) = f (x(k), u(k), k) + v(k)
y(k) = g(x(k), u(k), k) + e(k)
(16.53)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
181
kde nelineárnı́ funkce f a g majı́ konečné prvnı́ derivace podle stavu x(k) a v(k) i e(k) jsou stochastické
posloupnosti se stejným rozloženı́m jako v lineárnı́m přı́padě.
Problém nelineárnı́ho odhadu vzniká také při současném odhadovánı́ stavů a parametrů lineárnı́ch
systémů. Vývoj parametrů je popsán diferenčnı́mi rovnicemi, které jsou připojeny k původnı́m
stavovým rovnicı́m systému.
Nelineárnı́ problém je řešen linearizacı́ stavových rovnic na základě průběžně zı́skávaných odhadů
stavů. Opět budeme rozlišovat dva kroky odhadovánı́ - filtraci a predikci.
Filtrace stavu pomocı́ měřených hodnot vstupu a výstupu je rovna
b (k|k) = x
b (k|k − 1) +
x
(16.54)
−1
T
+Rxx C (CRxx C + Re )
b (k|k − 1), u(k), k)]
[y(k) − g(x
Rxx = Rxx − Rxx C (CRxx C + Re )−1 CRxx
T
T
kde Rxx = Rxx (k|k − 1) a kde C = C(k) je matice určená linearizacı́ výstupnı́ rovnice v bodě
b (k|k − 1):
x
∂g(x(k), u(k), k)
C(k) =
(16.55)
∂x(k)
b (k|k−1)
x
b (k|k + 1), provedeme pomocı́ nelineárnı́ stavové rovnice systému, pak
Predikci stavu, tj. určenı́ x
b (k + 1|k) = f (x
b (k|k), u(k), k)
x
(16.56)
0
Rxx (k + 1|k) = ARxx (k|k)A + Rv
b (k|k):
kde matici A = A(k) zı́skáme linearizacı́ stavové rovnice v bodě x
A(k) =
∂f (x(k), u(k), k)
∂x(k)
b (k|k)
x
(16.57)
b (k0 |k0 − 1) = µx0 , Rxx (k0 |k0 − 1) = Rx0 .
Iteračnı́ algoritmus startujeme s počátečnı́m odhadem x
Přı́klad 13: Jako přı́klad vyřešı́me problém odhadu parametrů makroekonomického modelu.
Model je převzatý z literatury [51]. Byl sestaven pro makroekonomiku USA. Tento model vycházı́
z třı́sektorové ekonomiky (neuvažuje vývoz a dovoz). Vstupnı́ proměnné modelu jsou:
G
M
Výstupnı́ proměnné modelu
Y
C
I
R
reálné vládnı́ výdaje
reálné peněžnı́ zásoby
jsou:
reálný hrubý domácı́ produkt
reálná spotřeba domácnostı́
reálné investičnı́ výdaje
úroková mı́ra
Základnı́ rovnice modelu makroekonomiky USA předpokládáme dle [51] ve tvaru
Y (k) = C(k) + I(k) + G(k)
C(k) = c0 + c1 Y (k) + c2 C(k − 1)
I(k) = i0 + i1 [Y (k − 1) − Y (k − 2)] + i2 Y (k) + i3 R(k − 4)
R(k) = r0 + r1 Y (k) + r2 [Y (k) − Y (k − 1)]
+r3 [M (k) − M (k − 1)] + r4 [R(k − 1) + R(k − 2)]
(16.58)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
182
Obrázek 16.8: Data ekonomiky USA
Jednotka diskrétnı́ho času k je čtvrtletı́. Prvnı́ rovnice vyjadřuje, že hrubý domácı́ produkt
Y (k) je součtem spotřeby domácnostı́ C(k), investičnı́ch výdajů I(k) a vládnı́ch výdajů G(k).
Druhá rovnice je rovnicı́ spotřebnı́ funkce a vyjadřuje, že spotřeba C(k) je přı́mo úměrná
hrubému domácı́mu produktu Y (k) a spotřebě v minulém čtvrtletı́ C(k − 1).
Třetı́ rovnice je rovnicı́ investičnı́ funkce a vyjadřuje závislost investičnı́ch výdajů I(k) na hrubém
domácı́m produktu Y (k), dále na rozdı́lů domácı́ch produktů v minulém čtvrtletı́ a předminulém
čtvrtletı́ [Y (k − 1) − Y (k − 2)] a investice jsou také ovlivněny ve velké mı́ře také výšı́ úrokové sazby
před rokem R(k − 4).
Čtvrtá rovnice je rovnice pro úrokovou mı́ru a popisuje, závislost úrokové mı́ry R(t) na hrubém
domácı́m produktu vytvořeném v daném obdobı́ Y (k), na rozdı́lu hrubých domácı́ch produktů
v současném a minulém čtvrtletı́ [Y (k) − Y (k − 1)], na rozdı́lu zásob peněz rovněž v současném a
minulém čtvrtletı́ [M (k) − M (k − 1)] a také na součtu úrokových měr v minulém a předminulém
čtvrtletı́ [R(k − 1) + R(k − 2)].
Neznámé parametry c0 , c1 , c2 , i0 , i1 , i2 , i3 , r0 , r1 , r2 , r3 , r4 v předcházejı́cı́ch rovnicı́ch jsou
předmětem identifikace. Parametry s indexem 0 ponecháme konstantnı́. Ostatnı́ parametry budou
proměnné v čase a jejich optimálnı́ hodnoty budeme hledat rozšı́řeným Kalmanovým filtem.
Odhady parametrů modelu makroekonomiky USA se prováděly na základě časových řad dat od 1.
čtvrtletı́ roku 1947 do 1. čtvrtletı́ roku 1988. Data byla převzata z [51]. Čı́selné hodnoty jsou graficky
zobrazeny na obr. 16.8. Povšimněte si pro nás nezvyklého měřı́tka některých veličin v řádech stovek
či tisı́ců miliard US dolarů.
Pro transformaci modelu do tvaru stavových rovnic nelineárnı́ho stochastického systému (16.53)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
183
Obrázek 16.9: Parametry a jejich konfidenčnı́ intervaly
provedeme časový posun rovnic, takže je budeme psát v následujı́cı́m tvaru
Y (k + 1) = C(k + 1) + I(k + 1) + G(k + 1)
(16.59)
C(k + 1) = c0 + c1 (k)Y (k + 1) + c2 (k)C(k)
I(k + 1) = i0 + i1 (k)[Y (k) − Y (k − 1)] + i2 (k)Y (k + 1) + i3 (k)R(k − 3)
R(k + 1) = r0 + r1 (k)Y (k + 1) + r2 (k)[Y (k + 1) − Y (k)] +
+r3 (k)[M (k + 1) − M (k)] + r4 (k)[R(k) + R(k − 1)]
Neznámé parametry c1 , c2 , i1 , i2 , i3 , r1 , r2 , r3 , r4 budeme odhadovat jako proměnné v čase, a proto
jsme i u nich zavedli časový index k. Parametry c0 , i0 , r0 předpokládáme konstantnı́ a proto u nich
časový index nezavádı́me.
V dalšı́m kroku dosadı́me rovnice (16.59b) a (16.59c) do rovnice (16.59a) a vyjádřı́me Y (k + 1)
Y (k + 1) =
c0 + i0 + i1 (k)[Y (k) − Y (k − 1)] + c2 (k)C(k) + i3 (k)R(k − 3) + G(k + 1)
1 − c1 (k) − i2 (k)
Tento vztah znovu dosadı́me do rovnic (16.59b), (16.59c) a (16.59d) a dostaneme
C(k + 1) = c0 + +c1 (k) + Y (k + 1) + c2 (k)C(k)
I(k + 1) = i0 + i1 (k)[Y (k) − Y (k − 1)] + +i2 (k)Y (k + 1) + i3 (k)R(k − 3)
R(k + 1) = r0 + +[r1 (k) + r2 (k)]Y (k + 1) − r2 (k)Y (k) +
r3 (k)[M (k + 1) − M (k)] + r4 (k)[R(k) + R(k − 1)]
(16.60)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
184
kde za Y (k + 1) dosadı́me z předchozı́ rovnice (16.60). Nynı́ zavedeme vstupnı́, výstupnı́ a stavový
vektor modelu.
Vstupnı́ vektor u(k) má složky u1 (k) = G(k), u2 (k) = M (k). Výstupnı́ vektor y(k) má složky
y1 (k) = Y (k), y2 (k) = C(k), y3 (k) = I(k), y4 (k) = R(k).
Stavový vektor x(k) má následujı́cı́ složky:
Parametry spotřebnı́ funkce x1 (k) = c0 , x2 (k) = c1 (k), x3 (k) = c2 (k).
Parametry investičnı́ funkce x4 (k) = i0 , x5 (k) = i1 (k), x6 (k) = i2 (k), x7 (k) = i3 (k).
Parametry funkce úrokové mı́ry x8 (k) = r0 , x9 (k) = r1 (k), x10 (k) = r2 (k), x11 (k) = r3 (k), x12 (k) =
r4 (k).
Proměnnné x13 (k) = Y (k), x14 (k) = Y (k − 1), x15 (k) = C(k), x16 (k) = I(k), x17 (k) = R(k), x18 (k) =
R(k − 1), x19 (k) = R(k − 2), x20 (k) = R(k − 3).
Poté, co jsme definovali všechny potřebné vektory, můžeme napsat soustavu stavových a výstupnı́ch
rovnic makroekonomického modelu. Pro přehlednost použijeme pomocnou proměnou z(t) = Y (k + 1)
- viz. (16.60).
z(k) =
x1 + x4 + x5 (k)[x13 (k) − x14 (k)] + x3 (k)x16 (k) + x7 (k)x20 (k) + u1 (k + 1)
1 − x2 (k) − x6 (k)
Stavové rovnice makromodelu majı́ následujı́cı́ tvar
x1 (k + 1)
x2 (k + 1)
x3 (k + 1)
x4 (k + 1)
x5 (k + 1)
x6 (k + 1)
x7 (k + 1)
x8 (k + 1)
x9 (k + 1)
x10 (k + 1)
x11 (k + 1)
x12 (k + 1)
x13 (k + 1)
x14 (k + 1)
=
=
=
=
=
=
=
=
=
=
=
=
=
=
x1 (k)
x2 (k) + v2 (k)
x3 (k) + v3 (k)
x4 (k)
x5 (k) + v5 (k)
x6 (k) + v6 (k)
x7 (k) + v7 (k)
x8 (k)
x9 (k) + v9 (k)
x10 (k) + v10 (k)
x11 (k) + v11 (k)
x12 (k) + v12 (k)
z(k) + v13 (k)
x13 (k)
x1 (0)
x2 (0)
x3 (0)
x4 (0)
x5 (0)
x6 (0)
x7 (0)
x8 (0)
x9 (0)
x10 (0)
x11 (0)
x12 (0)
x13 (0)
x14 (0)
=
=
=
=
=
=
=
=
=
=
=
=
=
=
x15 (k + 1) = x1 (k) + x2 (k)z(k)+
+x3 (k)x15 (k) + v15 (k)
x16 (k + 1) = x4 (k) + x5 (k)[x13 (k) − x14 (k)]+
+x6 (k)z(k) + x7 (k)x20 (k) + v16 (k)
x17 (k + 1) = x8 (k) + [x9 (k) + x10 (k)]z(k)−
−x10 (k)x13 (k) + x11 (k)[u2 (k + 1) − u2 (k)]+
+x12 (k)[x17 (k) + x18 (k)] + v17 (k)
x18 (k + 1) = x17 (k)
x19 (k + 1) = x18 (k)
x20 (k + 1) = x19 (k)
Výstupnı́ rovnice makromodelu:
y1 (k)
y2 (k)
y3 (k)
y4 (k)
=
=
=
=
x13 (k) + e1 (k)
x15 (k) + e2 (k)
x16 (k) + e3 (k)
x17 (k) + e4 (k)
ĉ0
ĉ1 (0)
ĉ2 (0)
î0
î1 (0)
î2 (0)
î3 (0)
r̂0
r̂1 (0)
r̂2 (0)
r̂3 (0)
r̂4 (0)
Y (4)
Y (3)
x15 (0) = C(4)
x16 (0) = I(4)
x17 (0) = R(4)
x18 (0) = R(3)
x19 (0) = R(2)
x20 (0) = R(1)
(16.61)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
185
Obrázek 16.10: Skutečné a predikované výstupy
Výsledky odhadu parametrů modelu makroekonomiky USA byly zpracovány v diplomové práci
[16]. Predikované hodnoty stavů (parametrů) spolu s jejich konfidenčnı́mi intervaly jsou na obr. 16.9.
Konfidenčnı́ interval vyjadřuje mı́ru nejistity odhadu parametru. Pásmo nejistoty je rovno ±k σ,
kde σ je směrodatná odchylka přı́slušného parametru a konstanta úměrnosti k se volı́ v intervalu [2, 3],
(zde k = 2). Obr. 16.10 zobrazuje skutečné a predikované hodnoty výstupů. Z uvedeného obrázku
vidı́me, že přesnost odhadu parametrů je vyhovujı́cı́. Chyby výstupů jsou na obr. 16.11. Pokud je odhad
správný, tak posloupnost chyb výstupu je bı́lá posloupnost, což zde je přibližně splněno. Neuvádı́me
zde kovariančnı́ matice šumu stavů i výstupu, na kterých podstatnou měrou závisı́ úspěšnost odhadů.
Neuvádı́me zde ani apriornı́ odhady parametrů i jejich kovariance, které také ovlivňujı́ přesnost odhadů.
Pokud zvolı́me nulové rozptyly šumů ve stavových rovnicı́ch popisujı́cı́ch vývoj parametrů, odhadujeme konstantnı́ parametry. Pro odhadované konstantnı́ parametry jsou na obr. 16.12 zobrazeny chyby
výstupů. Chyby jsou v tomto přı́padě většı́ a chybová posloupnost zřejmě nenı́ v tomto přı́padě bı́lá
posloupnost.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
186
Obrázek 16.11: Odchylky výstupů
Obrázek 16.12: Odchylky výstupů
Rozšı́řený Kalmanův filtr pro spojité systémy
Nejprve uvedeme rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ systém s diskrétnı́m měřenı́m
výstupu. Datový krok filtru je obdobný datovému kroku pro diskrétnı́ systémy. Časový krok se
přibližně provádı́ použitı́m stochastické rovnice systému. Uvědomme si, že rozšı́řený Kalmanův filtr je
pouze aproximacı́ s chybou druhého řádu.
Mějme tedy spojitý nelineárnı́ stochastický systém s diskrétnı́m měřenı́m výstupu
ẋ(t) = f (x(t), u(t), t) + v(t),
y(k) = g (x(t), u(t), t) + e(k),
(16.62)
pro
t = kT
b (0), P (0)), w(t) ∼ N (O, Q), e(k) ∼ N (O, R). Při tom předpokládáme, že v(t) a
kde x(0) ∼ N (x
e(k) jsou nezávislé bı́lé šumy nekorelované s počátečnı́ podmı́nkou x(0). Diskrétnı́ měřenı́ výstupu je
prováděno s periodou vzorkovánı́ T .
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
187
Ve shodě s předchozı́m značenı́m zavedeme podmı́něnou střednı́ hodnotu
b (t|(k − 1)T ) = E (x(t)|y(k − 1), u(t))
x
pro (k − 1)T ≤ t ≤ kT
b (t|kT ) = E (x(t)|y(k), u(t)) ,
x
pro t = kT.
Podobně budeme značit podmı́něnou kovariančnı́ matici stavu P (t|(k − 1)T ) respektive P (t|kT ).
Kalmanův filtr provádějı́cı́ aktualizaci podmı́něné střednı́ hodnoty stavu a podmı́něné kovariančnı́
matice stavu se opět skládá se dvou kroků - časového (modelového) a datového (filtračnı́ho).
Časový krok:
Vývoj podmı́něné střednı́ hodnoty stavu v čase je přibližně určen vztahem
ḃ
b (t|(k − 1)T ), u(t), t)
x(t|(k
− 1)T ) = f (x
pro (k − 1)T ≤ t ≤ kT.
(16.63)
b , t)P (t|(k − 1)T ) + P (t|(k − 1)T )AT (x
b , t) + Q,
Ṗ (t|(k − 1)T ) = A(x
(16.64)
Vývoj podmı́něné kovariančnı́ matice je
b , t) zı́skáme linearizacı́
kde matici A(x
b , t) =
A(x
∂f (x(t), u(t), t)
.
∂x
b (t|(k−1)T )
x(t)=x
Datový krok:
Aktualizace podmı́něné střednı́ hodnoty je
b (t|kT ) = x
b (t|(k − 1)T ) + K(k) [y(k) − g(x
b (t|(k − 1)T ), u(t), t)] ,
x
pro t = kT
(16.65)
a kde Kalmanovo zesı́lenı́ je rovno
h
b , k) C(x
b , k)P (t|(k − 1)T ), C T (x
b , k) + R
K(k) = P (t|(k − 1)T ), C T (x
i−1
,
pro t = kT. (16.66)
Aktualizace podmı́něné kovariančnı́ matice je
b , k)P (t|(k − 1)T )
P (t|kT ) = P (t|(k − 1)T ) − K(k)C(x
(16.67)
b , k) zı́skáme linearizacı́
a matici C(x
b , k) =
C(x
∂g (x(t), u(t), t)
∂x
b (t|(k−1)T )
x(t)=x
v bodě
t = kT.
Nynı́ opět stručně uvedeme rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ systém se spojitým
měřenı́m výstupu.
Uvědomme si, že aktualizace (datový krok) podmı́něných střednı́ch hodnot stavu a jeho kovariance se při spojitém měřenı́ výstupu provádı́ spojitě v každém časovém okamžiku. Proto se v tomto
přı́padě nerozlišuje datový a časový krok. Spojitý Kalmanův filtr můžeme odvodit limitnı́m přechodem
z diskrétnı́ho Kalmanova filtru pro periodu vzorkovánı́ T → 0.
Označı́me podmı́něnou střednı́ hodnotu stavu
b (t) = E(x(t)|y(t), u(t))
x
a podobně podmı́něnou kovariančnı́ matici stavu P (t).
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
188
Nejprve uvedeme Kalmanův filtr pro lineárnı́ spojitý systém se spojitým měřenı́m výstupu. Stochastický model tohoto systému a měřenı́ výstupu je
ẋ(t) = Ax(t) + Bu(t) + v(t),
(16.68)
y(k) = Cx(t) + Du(t) + e(t)
(16.69)
b 0 , Rx0 ), w(t) ∼ N (O, Q), e(k) ∼ N (O, R). Při tom
kde stejně jako v předchozı́m přı́padě x(0) ∼ N (x
předpokládáme, že v(t) a e(t) jsou nezávislé bı́lé šumy nekorelované s počátečnı́ podmı́nkou x(0). Při
tom musı́me předpokládat, že R > O (matice R musı́ být pozitivně definitnı́), což znamená, že všechny
složky výstupu jsou zatı́ženy šumem, žádné měřenı́ výstupu nenı́ tedy absolutně přesné. Kalmanův filtr
pro rekurzivnı́ odhadovánı́ podmı́něné střednı́ hodnoty stavu a jeho kovariance je popsán následujı́cı́mi
vztahy.
ḃ
b (t) + Bu(t) + K(t) [y(t) − C x
b (t) − Du(t)] ,
x(t)
= Ax
T
T
Ṗ (t) = AP (t) + P (t)A + Q − P (t)C R
−1
CP (t) + e(t),
b (0) = x
b0
x
(16.70)
P (0) = Rx0
Kalmanovo zesı́lenı́ je v tomto přı́padě
K(t) = P (t)C T R−1
Rovnice (16.70b) je Riccatiova rovnice, kterou při filtraci řešı́me dopředně ze známé počátečnı́
podmı́nky P (0) = Rx0 .
Rozšı́řený Kalmanův filtr pro spojitý nelineárnı́ stochastický systém se spojitým měřenı́m výstupu
popsaný stavovými rovnicemi
ẋ(t) = f (x(t), u(t), t) + v(t),
(16.71)
y(t) = g (x(t), u(t), t) + e(t)
je popsán následujı́cı́mi vztahy
ḃ
b (t), u(t), t) + K(t) [y(t) − g (x
b (t), u(t), t)] ,
x(t)
= f (x
T
T
b (0) = x
b0
x
b (t), t) P (t) + P (t)A (x
b (t), t) + Q − P (t)C (x
b (t), t) R
Ṗ (t) = A (x
−1
(16.72)
b (t), t) P (t),
C (x
Riccatiovu rovnici (16.72b) řešı́me dopředně s počátečnı́ podmı́nkou P (0) = Rx0 . Kalmanovo zesı́lenı́
je v tomto přı́padě
b (t), t) R−1
K(t) = P (t)C T (x
b (t), t) a C (x
b (t), t) zı́skáme linearizacı́ stavových rovnic stochastického systému (16.71)
Matice A (x
b (t), t) =
A (x
b (t), t) =
C(x
∂f (x(t), u(t), t)
∂x
b (t)
x(t)=x
∂g (x(t), u(t), t)
∂x
b (t)
x(t)=x
Protože zpracovánı́ dat se nynı́ stále častěji realizuje čı́slicově, je použitı́ spojitého Kalmanova filtru
omezeno pouze na speciálnı́ přı́pady.
16.4.3
Stochastické metody interpolace
V některých přı́padech máme k dispozici veškerá změřená data. Potom je výhodné provést odhad
stavu systému, který je založen na celé množině dat a ne pouze na průběžně zı́skaných měřenı́ch. Tomuto způsobu odhadu řı́káme interpolace. Pokud použı́váme přůběžně zı́skané odhady stavu k řı́zenı́
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
189
systému, nenı́ možno interpolaci použı́t. Interpolace (pokud ji můžeme provést) nám může dát lepšı́
odhady stavu, protože tyto odhady jsou založeny na většı́ množině dat. Často odhadujeme nejenom
stavy systému, ale i jeho parametry, které můžeme považovat za pomalu se měnı́cı́ stavy. Pokud
v systému nastane nějaká změna parametrů, tak tato náhlá změna vůbec nenı́ obsažena v minulých
datech a proto odhad založený na minulých datech nenı́ dobrý - viz přı́klad na konci tohoto odstavce.
Interpolace, která k odhadu využı́vá i budoucı́ data nám dá odhad mnohem přesnějšı́.
Výsledkem interpolace, to je odhadu stavu založeném na celé množině dat, je p.h.p
p
x(k)| Dkf
(16.73)
kde Dkf je celá množina dat od počátku měřenı́ až do koncového (finálnı́ho) času kf . Zde použijeme
pro data od času k do kf označenı́
k
Dkf = {u(k), y(k), . . . , u(kf ), y(kf )}
potom celá množina dat je
k
Dkf = D1 f = {u(1), y(1), . . . , u(k), y(k), . . . , u(kf ), y(kf )}
Nynı́ odvodı́me obecný vztah pro interpolaci jejı́mž výsledkem
je p.h.p.
stavu, kde vpodmı́nce je
k
celá množina dat. Předpokládáme, že známe filtrované p x(k)| D a predikované p x(k+1)| Dk
p.h.p stavu. Interpolace bude řešena zpětným během filtru, který bude založen na znalosti predikované
tedy pracovat bez dat. Budeme tedy aktualizovat p.h.p.
a filtrované
p.h.p., tento
filtr bude
p x(k+1)| Dkf na p.h.p. p x(k)| Dkf . Při tom využijeme pravděpodobnostnı́ popis systému určený
p.h.p p (x(k+1)| x(k), y(k)). Ze vztahu pro podmı́něnou hustotu pravděpodobnosti dostanene
k
k
f
f
p x(k), Dk+1
|Dk = p x(k)| Dkf p Dk+1
| Dk
(16.74)
Zavedenı́ stavu x(k+1) předchozı́ p.h.p. můžeme dostat jako marginálnı́ p.h.p.
k
f
p x(k), Dk+1
|Dk =
Z
k
f
p x(k+1), x(k), Dk+1
|Dk dx(k+1)
Dalšı́m užitı́m řetězového pravidla má předchozı́ výraz tvar
k
f
p x(k), Dk+1
|Dk
=
Z
k
f
p x(k)|x(k+1), Dk+1
, Dk
k
f
|Dk dx(k+1)
× p x(k+1)|Dkf p Dk+1
Z předchozı́ho vztahu a (16.74) plyne vztah pro interpolovanou p.h.p
p x(k)| Dkf =
Z
k
f
p x(k)|x(k+1), Dk+1
, Dk p x(k+1)|Dkf dx(k+1)
(16.75)
Abychom mohli zjednodušit předchozı́ vztah pro interpolovaný odhad, využijeme vlastnost stavu
systému. Užitı́m podmiňovánı́, můžeme zapsat p.h.p dvojı́m způsobem
k
f
p Dk+1
, x(k)|Dk , x(k+1)
k
(16.76)
f
= p Dk+1
|x(k), Dk , x(k+1) p x(k)|Dk , x(k+1)
k
k
f
f
= p x(k)|Dk+1
, Dk , x(k+1) p Dk+1
|Dk , x(k+1)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
190
Z definice stavu plyne (to je Markovova vlastnost stavu)
k
k
f
f
p Dk+1
|x(k), Dk , x(k+1) = p Dk+1
|Dk , x(k+1)
Tak z předchozı́ho je zřejmé, že
k
f
p x(k)|Dk+1
, Dk , x(k+1) = p x(k)|Dk , x(k+1)
(16.77)
Konečný vztah pro zpětný filtr má tvar
p x(k)| Dkf =
Z
p x(k)|x(k+1), Dk p x(k+1)|Dkf dx(k+1)
(16.78)
kde jsme využili vlastnost stavu popsanou v předchozı́m vztahu (16.77). Z Bayesova vztahu plyne pro
p.h.p.
p x(k+1)| x(k), Dk p x(k)| Dk
(16.79)
p x(k)|x(k+1), Dk =
p (x(k+1)| Dk)
Předchozı́ vztah je v podstatě krok velmi podobný datovému kroku, kde fiktivnı́ výstup je nynı́ stav
x(k+1). Proto v tomto kroku podobném datovému kroku je použito stavové rovnice systému. Naproti
tomu vztah (16.78) je zase podobný časovému kroku. Funkcionálnı́ procedura pro interpolovaný odhad
je popsána vztahy (16.78) a (16.79) Tı́mto postupem byl zpětný filtr rozložen do dvou kroků. Rozklad
problému interpolace do dvou kroků zpětného filtru je výhodný z numerického hlediska. Poprvé byl
popsán v [90]. Vztah pro zpětný filtr, který řešı́ problém interpolace v jednom kroku dostaneme
dosazenı́m (16.79) do (16.78)
p x(k)| Dkf
= p x(k)| Dk
Z
p x(k+1)|Dkf
p (x(k+1)|x(k), y(k))
p (x(k+1)|Dk )
dx(k+1) (16.80)
Předchozı́ vztahy použijeme pro odvozenı́ přibližného řešenı́ problému interpolace linearizacı́ - jakési
obdoby rozšı́řeného Kalmanova filtru pro zpětný běh.
Interpolace pro linearizovaný systém a normálnı́ šumy
Při lineárnı́m systému a normálnı́ch šumech předchozı́ funkcionálnı́ rekurze můžeme změnit na algebraické rekurzivnı́ vztahy pro interpolovanou střednı́ hodnotu stavu a jeho kovariančnı́ matici.
Použijeme zde stejné značenı́ jako pro rozvinutý Kalmanův filtr, to je
b (k|τ ), Rxx (k|τ ))
p (x(k)|Dτ ) = N (x
p (x(k+1)|x(k), u(k)) = N (A(k)x(k) + B(k)u(k); Rv )
Označme střednı́ hodnotu a kovarianci, které jsou výsledkem fiktivnı́ho datového kroku (16.77)
e
e (k), R(k)
p x(k)| x(k+1), Dk = N x
(16.81)
Fiktivnı́ datový krok (16.77) vede na následujı́cı́ vztahy pro aktualizaci střednı́ hodnoty a kovariance
e (k) = x
b (k|k) + F (k) (x(k+1) − x
b (k+1|k))
x
e
R(k)
= R(k|k) − F (k)R(k+1|k)F T (k)
(16.82)
kde Kalmanovo zesı́lenı́ F (k) je
F (k) = R(k| k)AT (k) [R(k+1| k)]−1
(16.83)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
191
Aktualizace střednı́ hodnoty a kovariance podle vztahu (16.78) vede na
b (k| kf ) = x
b (k| k) + F (k) [x
b (k+1| kf ) − x
b (k+1| k)]
x
e
R(k| kf ) = F (k)R(k+1| kf )F T (k) + R(k)
(16.84)
Tı́mto způsobem je zjednodušena procedura na interpolaci. Řešenı́ problému interpolace ve dvou
krocı́ch usnadňuje numerickou implementaci algoritmu. Dosadı́me-li (16.82) do (16.84) dostaneme
vztah pro interpolaci realizovanou zpětným během filtru v jediném kroku.
b (k|kf ) = x
b (k|k) + F (k) [x
b (k+1|kf ) − x
b (k+1|k)]
x
(16.85)
T
R(k|kf ) = R(k|k) − F (k) [R(k+1|k)−R(k+1|kf )] F (k)
s Kalmanovým zesı́lenı́m F (k) podle (16.83).
Vstup u(k)
Vystup y(k)
4
20
3
10
2
0
1
−10
0
0
5
10
15
20
−20
0
Stav x1(k)= x(k)
1
10
0.5
0
0
−10
−0.5
5
10
k
15
10
15
20
Stav x2(k) = a(k)
20
−20
0
5
20
−1
0
5
10
k
15
20
Obrázek 16.13: Vstup u(k), výstup y(k) a stavy x1 (k), x2 (k) systému z přı́kladu 14
Poznámka: Při přibližné interpolaci v nelineárnı́m diskrétnı́m systému popsaném stavovou rovnicı́
x(k + 1) = f (x(k), u(k), k ), musı́me provést linearizaci tohoto systému a matici A(k) ve vztahu
(16.83) pro zesı́lenı́ zpětného filtru počı́tat podle vztahu
A(k) =
∂f (x(k), u(k), k)
∂x(k)
b (k+1|kf )
x
Přı́klad 14: Mějme jednoduchý lineárnı́ systém prvnı́ho řádu
x(k + 1) = a(k) · x(k) + v(k)
y(k) = x(k) + e(k)
kde parametr a nenı́ známý.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
192
Problém současného odhadovánı́ stavu a parametru systému můžeme převést na problém
odhadovánı́ stavu rozšı́řeného systému
x1 (k + 1) = x2 (k) · x1 (k) + v1 (k)
x2 (k + 1) = x2 (k) + v2 (k)
y(k) = x1 (k) + e(k)
kde stav x1 (k) = x(k) je roven původnı́mu stavu systému prvnı́ho řádu a x2 (k) = a(k). Šumy v1 a v2
můžeme použı́t jako ladicı́ nástroje, které realizujı́ zapomı́náni a umožňujı́ sledovánı́ změny parametru.
Odhadovánı́ a interpolaci stavu rozšı́řeného nelineárnı́ho systému budeme realizovat linearizacı́. Rozvinutý Kalmanův filtr má stavovou matici A linearizovaného systému
δf
=
A=
δx
"
x2 (k) x1 (k)
0
1
#
,
Matice A je použita v predikčnı́m kroku a při interpolaci. Při predikci dosazujeme za stavy v každém
kroku x1 = x̂1 (k|k) a x2 = x̂2 (k|k). Při interpolaci dosazujeme v každém kroku x1 = x̂1 (k + 1|kf ) a
x2 = x̂2 (k + 1|kf ). Data u(k) a y(k) a skutečný průběh stavů x1 (k), x2 (k) jsou uvedeny v obr. 16.13.
Povšimněte si, že v čase k = 10 se druhý stav (parametr a) skokem měnı́. Vlivem této změny dostává
systém oscilačnı́ charakter. Výsledky simulace jsou uvedeny na obr. 16.14 a 16.15.
Odhad stavu xhat1(t|t−1)
Odhad stavu xhat2(t|t−1)
20
1
0.5
10
0
0
−0.5
−10
−20
0
−1
5
10
15
20
−1.5
0
Chyba odhadu e1=x1−xhat1
5
10
15
20
Chyba odhadu e2=x2−xhat2
10
1
0.5
0
0
−10
−0.5
−1
−20
−1.5
−30
0
5
10
k
15
20
−2
0
5
10
k
15
20
Obrázek 16.14: Predikované odhady stavů a jejich chyby z přı́kladu 14
b (k|k − 1) a jejich odchylky ep (k) = x(k) − x
b (k|k − 1)
V obr. 16.14 jsou predikované odhady stavů x
b (k|k) a
od skutečných stavů. V obr. 16.15 jsou uvedeny odchylky filtrovaných stavů ef (k) = x(k) − x
b (k|kf ).
odchylky interpolovaných stavů ei (k) = x(k) − x
Povšimněte si velmi malé chyby při interpolaci u druhého stavu (parametru a), zatı́m co při filtraci
je při náhlé změně parametru chyba estimace velká. Porovnejte také chyby při predikce a filtraci.
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
Chyba filtrace e1
193
Chyba filtrace e2
1
0.5
x2(t)−xhat2(t|t)
x1(t)−xhat1(t|t)
0.2
0
−0.2
0
0
−0.5
−1
−1.5
5
10
15
−2
0
20
Chyba interpolace e1
5
10
15
20
Chyba interpolace e2
0.2
x2(t)−xhat2(t|t_f)
x1(t)−xhat1(t|t_f)
0.06
0
−0.2
0
5
10
k
15
20
0.04
0.02
0
−0.02
−0.04
0
5
10
k
15
20
Obrázek 16.15: Chyby filtrovaných a interpolovaných odhadů a přikladu 14
16.4.4
Klasifikace systémů
Problém odhadovánı́ stavů resp. parametrů systému jsme řešili za předpokladu, že je známá struktura
systému. Často ale neznáme jednoznačně strukturu systému a k danému reálnému objektu může
existovat několik kandidátů na správnou strukturu jeho modelu. To znamená, že máme několik hypotéz
o skutečné struktuře systému. Každé struktuře budeme přiřazovat jejı́ pravděpodobnost. Klasifikace
systémů znamená aktualizaci pravděpodobnosti každé hypotézy na základě dat zı́skaných měřenı́m
na reálném objektu. Někdy také neznáme některé ladicı́ parametry procedury odhadovánı́ stavů a
parametrů systému. Přikladem mohou být kovariančnı́ matice šumů stavu i měřenı́. Také tento problém
můžeme řešit pomocı́ klasifikace.
Problém klasifikace systému zde nebudeme řešit jako rozhodovacı́ problém. Pokud bychom se
museli rozhodnout, která struktura systému je správná, volili bychom nejjednodušeji tu strukturu,
jejı́ž pravděpodobnost je nejvyššı́. Rozhodovacı́ problém vyžaduje volbu kritéria rozhodovánı́ a může
být značně komplikovaný. Pro predikci a řı́zenı́ procesů nenı́ potřeba rozhodovat, která hypotéza
o struktuře systému je správná a která je falešná. Zde budeme pouze altualizovat pravděpodobnosti
hypotéz na základě zı́skaných dat. Je samozřejmé, že vedle řešenı́ problému klasifikace (výpočtu
podmı́něných pravděpodobnostı́ hypotéz o struktuře modelu) je současně třeba v každé struktuře
odhadovat neznámé stavy a parametry.
Mějme tedy N alternativnı́ch modelů s různými strukturami. Každému alternativnı́mu modelu
s předpokládanou (hypotetickou) strukturou přiřadı́me pravděpodobnost p(H i ), i = 1, 2, . . . , N .
1
, pokud nepreferujeme některé
Apriornı́ pravděpodobnost ité hypotézy Hi můžeme volit p(Hi ) =
N
hypotézy.
Bayesovský přı́stup ke klasifikaci systému je následujı́cı́: Vstup u(τ ) a výstup y(τ ) je pozorován
v čase τ = 1, 2, · · · , k − 1. Naše znalost o pravděpodobnosti hypotéz podmı́něná množinou dat
Dk−1 = {u(1), y(1), · · · , u(k − 1), y(k − 1)}
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
194
je popsána podmı́něnou pravděpodobnostı́ hypotéz p(Hi (k)|Dk−1 ). Náš problém je aktualizace této
podmı́něné pravděpodobnosti hypotéz, to je přechod od p(Hi (k)|Dk−1 ) na p(Hi (k + 1)|Dk ) poté, co
obdržı́me nová vstupnı́ a výstupnı́ data {u(k), y(k)}. Řešenı́ opět rozdělı́me do dvou kroků - datového
a časového (filtraci a predikci).
V datovém kroku klasifikace aktualizujeme na základě dat podmı́něnou pravděpodobnost
p(Hi (k)|Dk−1 ) na p(Hi (k)|Dk ). K odvozenı́ potřebných vztahů použijeme vzorec pro podmı́něnou
pravděpodobnost.
p(y(k), u(k), Hi (k)|Dk−1 ) = p(y(k), u(k)|Hi (k), Dk−1 ) · p(Hi (k)|Dk−1 )
= p(Hi (k)|Dk−1 , y(k), u(k)) · p(y(k), u(k)|Dk−1 )
Odtud plyne Bayesův vztah pro podmı́něnou pravděpodobnost
p(Hi (k)|Dk ) =
p(y(k), u(k)|Hi (k), Dk−1 ) · p(Hi (k)|Dk−1 )
p(y(k), u(k)|Dk−1 )
Při úpravě předchozı́ho vztahu použijeme přirozené podmı́nky řı́zenı́ ve tvaru
p(u(k)|Dk−1 , Hi (k)) = p(u(k)|Dk−1 )
které vyjadřujı́ fakt, že všechna naše znalost o hypotézách je založena na datech. Datový krok klasifikace po úpravě je vyjádřen následujı́cı́m vztahem
p(Hi (k)|Dk ) =
1
p(y(k)|Hi (k), u(k), Dk−1 ) · p(Hi (k)|Dk−1 )
α
(16.86)
kde normalizačnı́ konstantu α volı́me takovou, aby součet podmı́něných pravděpodobnostı́ všech hypotéz byl roven jedné.
Časový krok klasifikace je formálně jednoduchý. Podle vztahu pro marginálnı́ pravděpodobnost
platı́
p(Hi (k + 1)|Dk ) =
=
i=N
X
i=1
i=N
X
p(Hi (k + 1), Hi (k)|Dk )
p(Hi (k + 1)|Hi (k), Dk )p(Hi (k)|Dk )
i=1
kde p(Hi (t + 1)|Hi (t), Dt ) je pravděpodobnostnı́ model vývoje hypotéz. Protože velmi často takový
model neznáme, použı́váme časový krok pouze jako určitou formu zapomı́nánı́, přı́padně vážı́me
pravděpodobnosti hypotéz nějakými alternativnı́mi pravděpodobnostmi. K tomu se přirozeně nabı́zı́
apriornı́ pravděpodobnost p(Hi ), proto
p(Hi (k + 1)|Dk ) = λp(Hi (k)|Dk ) + (1 − λ)p(Hi )
(16.87)
kde váhový koeficient λ volı́me v intervalu 0 < λ ≤ 1. Podmı́něná pravděpodobnost p(y(k)|Hi (k), D
je věrohodnost hypotéz. Pokud je normálnı́, tak
1
p(y(t)|H (i) (k), Dk−1 ) = p
r
b
− (y (t)−y
e 2
1
(2π)m det R(i)
yy
(i) T
) (
−1 (y (t)−y
b (i) )
R(i)
yy )
kde m je dimenze vektoru y a
b (i) = y
b (i) (t|t − 1) = C (i) x
b (i) (t|t − 1),
y
(i)
R(i)
xx = Rxx (t|t − 1)
k−1
)
(16.88)
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
195
Obrázek 16.16: Pravděpodobnosti modelů
Potom snadno můžeme počı́tat podmı́něné pravděpodobnosti modelů různých struktur na základě dat.
Přı́klad 15: Uvažujme nynı́ opět model a data makroekonomiky USA, viz přı́klad 13 této kapitoly.
Vytvořı́me dva alternativnı́ makroekonomické modely. Prvnı́ je model s konstantnı́mi parametry a
druhý model má časově proměnné parametry. Nejedná se tedy o různé struktury modelů, ale o dva
alternativnı́ modely, které se lišı́ pouze modelem vývoje parametrů. Tyto modely se v podstatě lišı́
pouze různými kovariančnı́mi maticemi šumu v modelu vývoje parametrů.
Model vývoje každého parametru θi (k) je často ve tvaru náhodné procházky
θi (k + 1) = θi (k) + ei (k)
kde rozptyl σi2 normálnı́ho bı́lého šumu ei (k) určuje schopnosti změny parametru θi (k) v čase. Pokud
je rozptyl σi2 = 0, pak předpokládáme, že model má přı́slušný parametr konstantnı́.
Pro daná data makroekonomiky USA, která byla uvedena v přı́kladu 13 byly počı́tány
pravděpodobnosti těchto dvou alternativnı́ch modelů - viz lit. [16]. Struktura obou modelů byla
stejná a je uvedena v přı́kladu 13. Apriornı́ pravděpodobnosti modelů byly zvoleny p(H (1) (0)) = 0.5,
p(H (2) (0)) = 0.5, to znamená, že nepreferujeme žádný model. Vývoj pravděpodobnostı́ těchto dvou
alternativnı́ch modelů makroekonomiky USA je uveden na obr. 16.16.
Z průběhů podmı́něných pravděpodobnostı́ těchto alternativnı́ch modelů můžeme vyčı́st, že v obdobı́ od roku 1952 do roku 1974, kdy vývoj ekonomiky v USA byl poměrně plynulý se stoupajı́cı́ tendencı́, má model s konstantnı́mi parametry většı́ pravděpodobnost než model s proměnnými parametry. Tento model však selhává (jeho pravděpodobnost je nižšı́), když v ekonomice dojde k náhlým
nečekaným změnám. Asi nejnázornějšı́m přı́kladem je obdobı́ dvou recesı́ v roce 1975 a 1982. V grafu
KAPITOLA 16. IDENTIFIKACE NELINEÁRNÍCH SYSTÉMŮ
196
se promı́tá i řada dalšı́ch událostı́, které zasáhly americkou ekonomiku. Jsou to napřı́klad léta po druhé
světové válce (1945-1950), na ně navazujı́cı́ Korejská válka (1950-1953), atentát na prezidenta J. F.
Kennedyho v roce 1963 a dalšı́. V těchto obdobı́ch nečekaných změn je samozřejmě výhodnějšı́ model
s proměnnými parametry, který je pružný a dokáže na tyto změny reagovat.
2
Uvedený přı́klad ukazuje, že klasifikace systémů - to je výpočet podmı́něných pravděpodobnostı́
několika alternativnı́ch modelů na základě dat - může být použita nejen k určenı́ nejpravděpodobnějšı́
struktury modelu, ale i k řešenı́ celé řady dalšı́ch problémů jako je na přı́klad detekce poruch v systému,
posouzenı́ správné činnosti čidel nebo akčnı́ch členů a pod.
Literatura
Knihy a texty české a slovenské
[1] Havlena V., Štecha J.: Modernı́ teorie řı́zenı́. Skriptum ČVUT FEL Praha, 1996.
[2] Holodniok M., Klı́č A., Kubı́ček M., Marek M.: Metody analýzy nelineárnı́ch dynamických modelů.
Academia, Praha, 1986.
[3] Horáček P., Fuka J.: Systémy a modely. Skripta FEL ČVUT, Praha, 1996.
[4] Horák J., Krlı́n L.: Deterministický chaos a matematické modely turbulence. Academia, Praha,
1996.
[5] John J.: Systémy a řı́zenı́. Skripta FEL ČVUT, Praha, 1996.
[6] Kolektiv: Oborové encyklopedie. Aplikovaná matematika I. II., SNTL, Praha, 1978.
[7] Kotek Z., Kubı́k S., Razı́m M.: Nelineárnı́ dynamické systémy. SNTL, Praha, 1973.
[8] Kotek Z., Razı́m M.: Teorie nelineárnı́ch, optimálnı́ch a adaptivnı́ch řı́dı́cı́ch systémů. Skripta FEL
ČVUT, Praha, 1982.
[9] Kubı́k S., Kotek Z., Strejc V., Štecha J.: Teorie automatického řı́zenı́ I. Lineárnı́ a nelineárnı́
systémy. SNTL, Praha, 1982.
[10] Kubı́k S., Kotek Z., Razı́m M., Hrušák J., Branžovský J.: Teorie automatického řı́zenı́ II. Optimálnı́,
adaptivnı́ a učı́cı́ se systémy. SNTL, Praha, 1982.
[11] Marek M., Schreiber I.: Stochastické chovánı́ deterministických systémů. Academia, Praha, 1984.
[12] Medved’ M.: Dynamické systémy. Veda, Bratislava, 1988.
[13] Nagy J.: Vybrané partie z modernı́ matematiky. SNTL, Praha, 1976.
[14] Nagy J.: Stabilita řešenı́ obyčejných diferenciálnı́ch rovnic. SNTL, Praha, 1980.
[15] Štecha J., Havlena V.: Teorie dynamických systémů. Skriptum ČVUT FEL Praha, 1996.
[16] Satoriová K.: Použitı́ alternativnı́ch modelů při identifikaci ekonomických systémů. Diplomová
práce, ČVUT FEL Praha, 1996.
Knihy a sbornı́ky jiné
[17] Andronov A.A., Chajkin C.E.: Těorija kolebanij. Fizmatgiz, Moskva, 1959.
[18] Arnold V.I.: Ordinary Differential Equations. M.I.T. Press, Cambridge, MA, 1973.
[19] Arnold V.I.: Geometrical Methods in the Theory of Ordinary Differential Equations. Springer
Verlag, New York, 1980.
[20] Åstrom K.: Introduction to Stochastic Control Theory. Academic Press, N.York, 1970.
[21] Atherton D.P.: Nonlinear Control Engineering. Van Nostrand Reinhold, London, 1975.
197
[22] Byrnes C.I., Lindquist A. (Eds): Theory and Application of Nonlinear Control Systems. NorthHolland, Dordrecht, 1986.
[23] Byrnes Ch.I., Kurzhanski A.(Eds.): Modelling and Adaptive Control. Springer Verlag, Berlin, 1988.
[24] Chua L.O.: Introduction to Nonlinear Network Theory. McGrawHill, New York, 1969.
[25] Desoer C.A., Vidyasagar M.: Feedback Systems: Input-Output Properties. Academic Press, New
York, 1975.
[26] Gantmacher F.R.: Theory of Matrices. Chelsea Publishing Co., New York, 1959.
[27] Gelb A., Vander Velde W.E.: Multiple-Input Describing Functions and Nonlinear System Design.
McGraw-Hill, 1968.
[28] Gibson J.E.: Nonlinear Automatic Control. McGraw-Hill, New York, 1963.
[29] Gilmore R.: Catastrophe Theory for Scientists and Engineers. John Wiley, New York, 1981.
[30] Goodwin G.C., Sin K.S.: Adaptive Filtering Prediction and Control.Prentice Hall, Englewood
Cliffs, 1984.
[31] Gőldner K., Kubı́k S.: Nichtlineare Systeme der Regelungstechnik. VEB Verlag Technik, Berlin,
1978.
[32] Hahn W.: Theory and Application of Liapunov’s Direct Method. Prentice-Hall, Englewood Cliffs,
N.J, 1963.
[33] Guckenheimer J., Holmes P.: Nonlinear Oscillations, Dynamical Systems, and Bifurcations of Vector Fields. Springer, N.Y., 1983.
[34] Haken H.: Synergetics. An Introduction. Springer-Verlag, Berlin, 1978.
[35] Hsu J.C., Meyer A.U. Modern Control Principles and Applications. McGraw-Hill, New York, 1968.
[36] Isidori A.: Nonlinear Control Systems. 3.vyd., Springer Verlag, New York, 1995.
[37] Jazwinski A.H.: Stochastic Processes and Filtering Theory. Academic Press, N.York, 1970.
[38] Jetschke G.: Mathematik der Selbstorganisation. VEB Verlag, Berlin, 1989.
[39] Khalil H.: Nonlinear Systems. 2.vyd. Upper Sadle River, NJ, Prentice-Hall, 1996.
[40] Kulhavý R.: Recursive Nonlinear Estimation, A Geometric Approach. Springer-Verlag, Berlin,
1996.
[41] La Salle J., Lefschetz S.: Stability by Lyapunov’s Direct Method. Academic Press, 1961.
[42] Lefschetz S.: Stability of Nonlinear Control Systems. Academic Press, 1962.
[43] Leven R.W., Koch B.P., Pompe B.: Chaos in dissipativen Systemen. Akademie-Verlag, Berlin,
1989.
[44] Levine W.S. (Ed.): The Control Handbook. CRC Press, USA, 1996.
[45] Lewis F.L.: Optimal Estimation. J.Wiley, New York, 1986.
198
[46] Marek M., Schreiber I.: Chaotic Behavior of Deterministic Dissipative Systems. Academia, Praha,
1991.
[47] Michel A.N., Miller R.K.: Qualitative Analysis of Large Scale Dynamical Systems. Academic Press,
New York, 1977.
[48] Narendra K.S., Taylor J.H.: Frequency Domain Criteria for Absolute Stability. New York, Academic Press, 1973.
[49] Nijmeijer H., Van der Schaft A.J.: Nonlinear Dynamical Control Systems. Springer Verlag, 1990.
[50] Papoulis A.: Probability, Random Variables and Stochastic Processes. McGraw Hill, New York,
1965.
[51] Pindyck R.S., Rubinfeld D.L.: Econometric Models and Economic Forecasts. McGraw-Hill, New
York, 1990.
[52] Slotine J.E., Li W.: Applied Nonlinear Control. Prentice-Hall, New Jersey, 1991.
[53] Vidyasagar M.: Input-Output Analysis of Large-Scale Interconnected Systems. Springer Verlag,
New York, 1981.
[54] Vidyasagar M.: Control System Synthesis: A Factorization Approach. M.I.T. Press, Cambridge,
MA.,1985.
[55] Vidyasagar M.: Nonlinear System Analysis. Second Edition. Englewood Cliffs, NJ, Prentice-Hall,
1993.
[56] Vaněček A., Čelikovský S.: Control Systems. From Linear Analysis to Synthesis of Chaos. Prentice
Hall, London, 1996.
[57] Willems J.L.: Stability Theory of Dynamical Systems. Nelson, London, 1970.
Články
[58] Anderson B.D.O.: Stability of control systems with multiple nonlinearities. J.Franklin Inst., 282,
s.155-160, 1966.
[59] Brockett R.W., Willems J.W.: Frequency domain stability criteria, IEEE Trans.on Automatic
Control, část I. AC-10, č.3, s.255-261, 1965; část II. AC-10, č.4, s.407-413, 1965.
[60] Byrnes C.I., Isidori A, Willems J.C.: Passivity, feedback equivalence and the global stabilization of
minimum phase nonlinear systems. IEEE Trans.on Automatic Control,36, č.11, s.1228-1240, 1991.
[61] Čelikovský S.: Global linearization of nonlinear systems - A survey. Geometry in Nonlinear Control
and Differential Inclusions. Banach Center Publications, vol.32. Institute of Mathematics, Polish
Academy of Sciences, Varšava, 1995.
[62] Deluca A.: Design of an exact nonlinear controller for induction motors. IEEE Trans.on Automatic
Control, AC-34, č.12, s.1304-1307, 1989.
[63] Estrada R.F.: On the stability of multiloop feedback systems. IEEE Trans.on Automatic Control,
AC-17, s.781-791, 1972.
[64] Glad S.T.: Robustness of nonlinear state feedback. A survey. Automatica, sv.23, s.425-435, 1987.
199
[65] Haddad W.M., Kapila V.: Absolute stability criteria for multiple slope-restricted monotonic nonlinearities. IEEE Trans.on Automatic Control, AC-40, č.2, s.361-365, 1995.
[66] Haber R., Unbehauen H.: Structure identification of nonlinear dynamic systems. A survey on
input/output approaches. Automatica, 26, č.4, s.651-678, 1990.
[67] Havlena V.: Simultaneous parameter tracking and state estimation. Automatica, 29, č.4, s.10411052, 1993.
[68] Havlena V.: Adaptive Kalman filter for a MIMO ARMAX system. Preprints of the 12th IFAC
World Congress,sv.9, Sydney, 1993.
[69] Hill D.J., Moylan P.J.: The stability of nonlinear dissipative systems. IEEE Trans.on Automatic
Control, sv. 21, s. 708-711, 1976.
[70] Hill D.J., Moylan P.J.: Stability results for nonlinear feedback systems. Automatica, sv.13, s.377382, 1977.
[71] Hill D.J., Moylan P.J.: Dissipative dynamical systems: Basic input-output and state properties.
J.Franklin Inst., sv. 309, s. 327-357, 1980.
[72] Hunt L.R., Su R., Meyer G.: Global transformations of nonlinear systems. IEEE Trans.on Automatic Control, AC-28, č.1, s. 24-30, 1983.
[73] Isidori A., Byrnes C.J.: Output regulation of nonlinear systems. IEEE Trans.on Automatic Control,
AC-35, č.2, s.131-140, 1990.
[74] Jakubovič V.A.: Rešenije někotorych matričnych něravěnstv vstrečajuščichsja v těorii avtomatičeskogo regulirovanija. Dokl. AN SSSR, č.6, 1958.
[75] Krzseminski Z.: Nonlinear control of induction motor. Proc. 10th IFAC World Congress, s.349-354,
Mnichov, 1987.
[76] Kwakernaak H. (ed.): Special Issue on Trends in System Identification. Automatica, sv.31, č.12,
1995.
[77] Lozano-Leal R., Joshi S.M.: Strictly positive real functions revisited. IEEE Trans.on Automatic
Control, AC-35, s.1243-1245, 1990.
[78] Mareels I.M., Bitmead R.R.: Nonlinear dynamics in adaptive control. Chaotic and periodic stabilization. Automatica, sv.22, č.6, s.641-655, 1986.
[79] Meyer G., Su R., Hunt L.R.: Application of nonlinear transformations to automatic flight control.
Automatica, 20, s.103-107, 1984.
[80] Moore J.B., Anderson B.D.O.: A generalisation of the Popov criterion. J.Franklin Inst., 285, s.
488-492, 1968.
[81] Ortega R., Canudas C., Seleme S.I.: Nonlinear control of induction motors: Torque tracking with
unknown load disturbance. IEEE Trans.on Automatic Control, AC-38, č.11, s.1675-1680, 1993.
[82] Peterka V.: Control of uncertain processes: Applied theory and algorithms. Supplement to Kybernetika 22, No.3 - 6, 1986.
[83] Popov V.M.: Ob absolutnoj ustojčivosti nělinějnych sistěm avtomatičeskogo regulirovanija. Avtomatika i Telemechanika, č.8, 1961.
200
[84] Porter D.W., Michel A.N.: Input-output stability of time-varying nonlinear multiloop feedback
systems. IEEE Trans.on Automatic Control, AC-19, s.422-427, 1974.
[85] Rae W.G.: Stability criteria for control systems with many nonlinear elements. Automatica, sv.6,
s. 463-467, 1970.
[86] Ray K.S., Majumder D.D.: Application of the circle criteria for stability analysis of linear SISO and
MIMO systems associated with fuzzy logic controller. IEEE Trans. Systems, Man, and Cybernetics,
14, s.345-349, 1984.
[87] Singh V.: A stability inequality for nonlinear feedback systems with slope-restricted nonlinearity.
IEEE Trans.on Automatic Control, AC-29, č.8, 1984.
[88] Sinha P.K.: State feedback decoupling of nonlinear systems. IEEE Trans.on Automatic Control,
AC-22, č.6, s.487-489,1977.
[89] Sontag E.D.: New characterizations of input-output stability. IEEE Trans.on Automatic Control,
AC-41, č.9, s. 1283-1294, 1996.
[90] Štecha J., Havlena V.: Smoothing in simultaneous state and parameters estimation. Proceedings
of Third European Control Conference, Roma, sv. 4, pp. 2165-2170, 1995.
[91] Utkin V.I.: Variable structure systems with sliding mode: A Survey. IEEE Trans.on Automatic
Control, AC-22, s.212-222, 1977.
[92] Vaněček A., Čelikovský S.: Wrapped eigenstructure of chaos. Kybernetika, sv.29, č.1, s.73-79, 1993.
[93] Vaněček A., Čelikovský S.: Synthesis of chaotic systems. Kybernetika, sv.30, č.5, s.537-542, 1994.
[94] Vidyasagar M.: New directions of research in nonlinear system theory. Proc.IEEE, sv.74, č.8,
s.1060-1091.
[95] Wen J.T.: Time domain and frequency domain conditions for strict positive realness. IEEE
Trans.on Automatic Control, AC-33, s.988-992, 1988.
[96] Willems J.C.: Dissipative dynamical systems. Part I: General theory. Arch. Rational Mechanics
and Analysis, sv. 45, s.321-351, 1972.
201
Download