Elementy algebry liniowej Rafał Czyż 14 września 2023 Instytut Matematyki Wydział Matematyki i Informatyki Uniwersytet Jagielloński 1 Spis treści 1 Logika i teoria mnogości 3 1.1 Logika - wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Zdania logiczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Kwantyfikatory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4 Elementy teorii zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.5 Działania uogólnione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.6 Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.7 Liczby całkowite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.8 Liczby wymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.9 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.10 Przedziały. Kresy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.11 Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2 Funkcje 25 2.1 Podstawowe własności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2 Obrazy i przeciwobrazy zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.3 Moce zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.4 Specjalne własności funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.5 Funkcje elementarne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.6 Funkcja wykładnicza i logarytmiczna . . . . . . . . . . . . . . . . . . . . . . 32 2.7 Funkcje trygonometryczne i funkcje cyklometryczne . . . . . . . . . . . . . . 34 2.8 Funkcje hiperboliczne i funkcje area . . . . . . . . . . . . . . . . . . . . . . . 36 3 Algebra liniowa 39 3.1 Macierze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.2 Cramerowskie układy równań liniowych. . . . . . . . . . . . . . . . . . . . . 48 3.3 Rząd macierzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.4 Układy równań liniowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.5 Przestrzenie wektorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 3.6 Baza przestrzeni wektorowej . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.7 Odwzorowania liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.8 Wartości i wektory własne macierzy 3.9 Specjalne typy macierzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 . . . . . . . . . . . . . . . . . . . . . . 60 3.10 Formy kwadratowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 2 1 Logika i teoria mnogości Rozpoczynamy od przeglądu najważniejszych pojęć i twierdzeń z logiki i teorii mnogości. 1.1 Logika - wprowadzenie 1.2 Zdania logiczne Definicja 1.2.1 Zdaniami logicznymi nazywać będziemy dowolne wyrażenia, najczęściej na gruncie matematyki, ale również i życia codziennego, co do których można jednoznacznie powiedzieć, czy są prawdziwe, czy fałszywe. Zdania logiczne będziemy oznaczać małymi literami p, q, r itp. Zapis p = 1 oznacza, że zdanie logiczne p jest prawdziwe, natomiast p = 0 oznacza, że zdanie logiczne p jest fałszywe. Mając do dyspozycji zdania można z nich tworzyć kolejne łącząc je spójnikami logicznymi – zwanymi logicznymi operatorami dwuargumentowymi. 1. Alternatywa p ∨ q. Alternatywa dwóch zdań jest fałszywa tylko w przypadku, gdy oba zdania są fałszywe. Czytamy p lub q. 2. Koniunkcja p ∧ q. Koniunkcja dwóch zdań jest prawdziwa tylko w przypadku, gdy oba zdania są prawdziwe. Czytamy p i q. 3. Implikacja p ⇒ q. Zdanie p nazywamy poprzednikiem, zdanie q nazywamy następnikiem implikacji. Implikacja dwóch zdań jest fałszywa tylko w przypadku, gdy poprzednik p jest prawdziwy i następnik q jest fałszywy. Czytamy p to q, z p wynika q, p implikuje q. 4. Równoważność p ⇔ q. Równoważność jest prawdziwa wtedy i tylko wtedy, gdy oba zdania p i q mają taką samą wartość logiczną. Czytamy p jest równoważne z q, p wtedy i tylko wtedy, gdy q. 5. Negacja ∼ p. Negacja zmienia wartość logiczną zdania na przeciwną. Czytamy nie p, nieprawda, że p, nie zachodzi p. Powyższe własności można zapisać w poniższej tabeli. p 0 0 1 1 q 0 1 0 1 p∨q 0 1 1 1 p∧q 0 0 0 1 p⇒q 1 1 0 1 p⇔q 1 0 0 1 ∼p 1 1 0 0 Definicja 1.2.2 Formułę logiczną, która jest zawsze prawdziwa, bez względu na prawdziwość składowych nazywamy tautologią. Poniżej podamy listę najprostszych (klasycznych) tautologii. 3 1. Prawo podwójnej negacji p ⇔∼∼ p. 2. Prawa przemienności p ∨ q ⇔ q ∨ p, p ∧ q ⇔ q ∧ p. 3. Prawa łączności p ∨ (q ∨ r) ⇔ (p ∨ q) ∨ r, p ∧ (q ∧ r) ⇔ (p ∧ q) ∧ r. 4. Prawa rozdzielności p ∨ (q ∧ r) ⇔ (p ∨ q) ∧ (p ∨ r), p ∧ (q ∨ r) ⇔ (p ∧ q) ∨ (p ∧ r). 5. Prawa de Morgana ∼ (p ∨ q) ⇔ (∼ p) ∧ (∼ q), ∼ (p ∧ q) ⇔ (∼ p) ∨ (∼ q), ∼ (p ⇒ q) ⇔ p ∧ (∼ q). 6. Reguła kontrapozycji (p ⇒ q) ⇔ (∼ q) ⇒ (∼ p). 7. Reguła odrywania (p ∧ (p ⇒ q)) ⇒ q. 8. Prawo przechodniości ((p ⇒ q) ∧ (q ⇒ r)) ⇒ (p ⇒ r). 9. p ∧ p ⇔ p, p ∨ p ⇔ p. 10. ((p ⇒ q) ∧ (q ⇒ p)) ⇔ (p ⇔ q). Tautologie są twierdzeniami w logice. Każda wymaga dowodu. Jedną z metod dowodu jest tabelka logiczna. Jako przykład udowodnimy Regułę kontrapozycji. p 0 0 1 1 q 0 1 0 1 p⇒q 1 1 0 1 ∼p 1 1 0 0 ∼q 1 0 1 0 4 (∼ q) ⇒ (∼ p) 1 1 0 1 P ⇔L 1 1 1 1 1.3 Kwantyfikatory Formułami zdaniowymi nazywamy wyrażenia, w których występują zmienne nie będące zdaniami logicznymi, a które stają się zdaniami, jeśli w miejsce zmiennych wstawimy konkretne wartości. Na przykład x > 5 jest formułą zdaniową Ψ(x). Jeśli za wszystkie zmienne wstawimy liczby dostaniemy zdanie logiczne prawdziwe (np. Ψ(10)) lub fałszywe (np. Ψ(1)). Dla każdej formuły zakres obiektów, które możemy wstawiać za zmienne jest naturalnie ograniczony i nazywany jest dziedziną formuły. W powyższym przykładzie naturalną dziedziną formuły jest zbiór liczb. Kwantyfikatory są symbolami, które pozwalają konstruować z jednych formuł inne. Wyróżniamy dwa podstawowe kwantyfikatory. 1. Kwantyfikator ogólny (duży) ∀ x : Ψ(x). Czytamy: dla każdego x zachodzi formuła Ψ(x). 2. Kwantyfikator szczegółowy (mały) ∃ x : Ψ(x). Czytamy: istnieje x, dla którego zachodzi formuła Ψ(x). Przykład 1.3.1 Zdanie ∀ x : x > 5 jest fałszywe, bo 1 < 5, natomiast zadanie ∃ x : x > 5 jest prawdziwe, bo 10 > 5. Można konstruować funkcje zdaniowe z kwantyfikatorami bazując nie tylko na zdaniach zależnych od jednej zmiennej. Dodając jeden kwantyfikator dostajemy formułę zdaniową mającą o jedną zmienną mniej. Taką pozorną zmienną nazywamy zmienną związaną w odróżnieniu od zmiennych wolnych nie mających kwantyfikatorów. Przykład 1.3.2 W zdaniu ∀ x : x2 + y 2 > 0 x jest zmienną związaną, natomiast y jest zmienną wolną. Często spotyka się zapis, w którym po kwantyfikatorze zamiast pojedynczego symbolu zmiennej wpisuje się warunek jej dotyczący. Jest to skrócony zapis zgodnie z następującą regułą ∀ Φ(x) : Ψ(x) ⇔ ∀ x : Φ(x) ⇒ Ψ(x), ∃ Φ(x) : Ψ(x) ⇔ ∃ x : Φ(x) ∧ Ψ(x), Zachodzą następujące prawa logiczne dotyczące kwantyfikatorów. 5 (∀ x : Φ(x)) ⇒ Φ(y) Φ(y) ⇒ (∃ x : Φ(x)) ∼ (∀ x : Φ(x)) ⇔ (∃ x : ∼ Φ(x)) ∼ (∃ x : Φ(x)) ⇔ (∀ x : ∼ Φ(x)) ∀ x : Φ(x) ∨ p ⇔ (∀ x : Φ(x)) ∨ p ∀ x : Φ(x) ∧ p ⇔ (∀ x : Φ(x)) ∧ p ∃ x : Φ(x) ∨ p ⇔ (∃ x : Φ(x)) ∨ p ∃ x : Φ(x) ∧ p ⇔ (∃ x : Φ(x)) ∧ p ∀ x : Φ(x) ∧ Ψ(x) ⇔ ∀ x : Φ(x) ∧ ∀ x : Ψ(x) ∀ x : Φ(x) ∨ Ψ(x) ⇐ ∀ x : Φ(x) ∨ ∀ x : Ψ(x) ∃ x : Φ(x) ∨ Ψ(x) ⇔ ∃ x : Φ(x) ∨ ∃ x : Ψ(x) ∃ x : Φ(x) ∧ Ψ(x) ⇒ ∃ x : Φ(x) ∧ ∃ x : Ψ(x) ∀ x∀ y : Φ(x, y) ⇔ ∀ y∀ x : Φ(x, y) ∃ x∃ y : Φ(x, y) ⇔ ∃ y∃ x : Φ(x, y) ∃ x∀ y : Φ(x, y) ⇒ ∀ y∃ x : Φ(x, y) Rozważa się jeszcze dwa inne kwantyfikatory. 1. Istnieje dokładnie jeden ∃! x : Φ(x). 2. Dla prawie wszystkich, tzn. dla wszystkich poza skończoną ilością ∀! x : Φ(x). Formalne zdefiniowanie powyższych kwantyfikatorów zostawiamy jako ćwiczenie. 1.4 Elementy teorii zbiorów Podstawowym pojęciem teorii mnogości jest pojęcie zbioru. Zbiory będziemy zazwyczaj oznaczać dużymi literami A, B, C itp. Zbiór będzie poprawnie zdefiniowany, jeżeli będziemy "potrafili sprawdzić", czy jakiś obiekt jest jego elementem czy nie. Innymi słowy zdanie a jest elementem zbioru A, a ∈ A, oraz zdanie a nie jest elementem zbioru A, a ∈ / A, są zdaniami logicznymi. Jednym ze sposobów opisu zbioru jest wypisanie wszystkich jego elementów, lub niektórych z nich w sposób jasno sugerujący, jakie są pozostałe, na przykład A = {1, 2, 3, ..., 2020} jest zbiorem liczb od 1 do 2020. Ogólnie, chcąc opisać zbiór elementów spełniających określoną zależność używamy następującego zapisu A = {x : Φ(x)}. 6 Teraz podamy pewne operacje i zależności między zbiorami. 1. Suma zbiorów. Sumą zbiorów A i B nazywamy zbiór składający się z elementów należących do któregokolwiek ze zbiorów A ∪ B = {x : x ∈ A ∨ x ∈ B}. Innymi słowy x ∈ A ∪ B ⇔ x ∈ A ∨ x ∈ B. 2. Przecięcie zbiorów (iloczyn, część wspólna). Przecięciem zbiorów A i B nazywamy zbiór składający się z elementów należących do obu zbiorów jednocześnie A ∩ B = {x : x ∈ A ∧ x ∈ B}. Innymi słowy x ∈ A ∩ B ⇔ x ∈ A ∧ x ∈ B. 3. Różnica zbiorów. Różnicą zbiorów A i B nazywamy zbiór składający się z elementów należących do zbioru A i nienależących do zbioru B A \ B = {x : x ∈ A ∧ x ∈ / B}. Innymi słowy x∈A\B ⇔x∈A∧x∈ / B. 4. Inkluzja zbiorów (zawieranie). Zbiór A jest podzbiorem zbioru B (lub B jest nadzbiorem zbioru A), jeżeli każdy element zbioru A jest elementem zbioru B A ⊂ B ⇔ ∀ x : x ∈ A ⇒ x ∈ B. 5. Równość zbiorów. Zbiór A jest równy zbiorowi B, jeżeli A i B mają takie same elementy A = B ⇔ ∀ x : x ∈ A ⇔ x ∈ B. 6. Dopełnienie zbioru. Niech zbiór A ⊂ X, wtedy dopełnienie zbioru A składa się z elementów, które nie należy do zbioru A A′ = {x : x ∈ / A} = X \ A. Innymi słowy x ∈ A′ ⇔ x ∈ / A. 7. Zbiór pusty. Zbiór pusty ∅ to zbiór, do którego nie należy żaden element, tzn. zdanie logiczne ∃x : x ∈ ∅ jest zdaniem fałszywym. 7 8. Zbiór potęgowy Zbiór potęgowy danego zbioru X, to zbiór wszystkich jego podzbiorów P(X) = {A : A ⊂ X}. 9. Iloczyn kartezjański Niech A i B będą dowolnymi niepustymi zbiorami. Iloczynem kartezjańskim A × B zbiorów A i B nazywamy zbiór par uporządkowanych (a, b) takich, że a ∈ A i b ∈ B, A × B := {(a, b) : a ∈ A ∧ b ∈ B}, gdzie para (a, b) formalnie może być zdefiniowana (definicja Kuratowskiego) jako (a, b) = {{a}, {a, b}}. Zachodzi następujące twierdzenie. Obserwacja 1.4.1 1. Prawo podwójnej negacji (A′ )′ = A. 2. Prawa przemienności A ∪ B = B ∪ A, A ∩ B = B ∩ A. 3. Prawa łączności A ∪ (B ∪ C) = (A ∪ B) ∪ C, A ∩ (B ∩ C) = (A ∩ B) ∩ C. 4. Prawa rozdzielności A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). 5. Prawa de Morgana (A ∪ B)′ = A′ ∩ B ′ , (A ∩ B)′ = A′ ∪ B ′ . 6. Reguła kontrapozycji A ⊂ B ⇔ B ′ ⊂ A′ . 7. Prawo przechodniości A ⊂ B ∧ B ⊂ C ⇒ A ⊂ C. 8. A = B ⇔ A ⊂ B ∧ B ⊂ A. 8 9. ∅ ⊂ A ⊂ X. 10. A ∪ A = A, A ∩ A = A, A ∩ ∅ = ∅, A ∪ ∅ = A, A ∩ X = A, A ∪ X = X. Dowód. Wykażemy pierwsze prawo rozdzielności. Mamy x ∈ A ∪ (B ∩ C) ⇔ x ∈ A ∨ x ∈ B ∩ C ⇔ x ∈ A ∨ (x ∈ B ∧ x ∈ C) ⇔ (x ∈ A ∨ x ∈ B) ∧ (x ∈ A ∨ x ∈ C) ⇔ (x ∈ A ∪ B) ∧ (x ∈ A ∪ C) ⇔ x ∈ (A ∪ B) ∩ (A ∪ C). Dowód pozostałych własności zostawiamy jako ćwiczenie. Przykład 1.4.2 Mamy X0 = P(∅) = {∅}, X1 = P(X0 ) = {∅, {∅}}, X2 = P(X1 ) = {∅, {∅}, {{∅}}, {∅ , {∅}}}. Przykład 1.4.3 Ile elementów ma zbiór potęgowy zbioru n-elementowego? 1.5 Działania uogólnione Chcąc wyznaczyć sumę lub iloczyn kilku zbiorów używa się następującej konwencji. Jeżeli mamy zbiory A1 , . . . , An to ich sumą nazwiemy zbiór, który zawiera elementy należące do przynajmniej jednego z tych zbiorów, a przecięciem nazwiemy zbiór zawierający elementy należące do każdego z tych zbiorów n [ j=1 n \ Aj = A1 ∪ · · · ∪ An = {x : ∃ j ∈ {1, . . . , n} x ∈ Aj } , Aj = A1 ∩ · · · ∩ An = {x : ∀ j ∈ {1, . . . , n} x ∈ Aj } . j=1 W analogiczny sposób postąpimy przy definiowaniu sumy i przecięcia dowolnej ilości zbiorów. Definicja 1.5.1 Niech J będzie niepustym zbiorem indeksów i niech Aj , j ∈ J, będzie rodziną zbiorów. Wtedy [ Aj = {x : ∃ j ∈ J x ∈ Aj } , j∈J \ Aj = {x : ∀ j ∈ J x ∈ Aj } . j∈J Jeżeli J = N, to wtedy piszemy S∞ j=1 Aj oraz 9 T∞ j=1 Aj . Działania uogólnione maja następujące własności. Obserwacja 1.5.2 ′ [ Aj = j∈J [ (Aj ∪ B) = j∈J j∈J [ j∈J (Aj ∪ Bj ) = [ \ j∈J \ (Aj ∪ Bj ) ⊃ \ j∈J (Aj ∩ B) = \ Aj ∪ j∈J \ [ Bj ; (Aj ∩ Bj ) ⊂ j∈J [ \ Bj ; Aj ∩ j∈J (Aj ∩ Bj ) = j∈J \ [ Bj ; j∈J Aj ∩ j∈J Przykład 1.5.3 Niech Aj = {x ∈ R : 1j ≤ x ≤ j}. Wykazać, że T∞ j=1 Aj = {1}. 1.6 Aj ∩ B; j∈J \ Aj ∩ B; j∈J j∈J (Aj ∩ B) = [ [ j∈J j∈J A′j ; Aj ∪ B; j∈J [ j∈J Aj ∪ [ j∈J Aj = j∈J (Aj ∪ B) = \ j∈J Aj ∪ B; \ A′j ; j∈J [ ′ \ \ Bj . j∈J S∞ j=1 Aj = (0, +∞) oraz Liczby naturalne Liczby naturalne (bez zera) znane były już w starożytności, w Grecji, Babilonii, Egipcie, Indiach, Chinach. Zero jako liczba naturalna pojawiła się znacznie później. Współczesny symbol zero pochodzi z Indii i jest przypisywany hinduskiemu matematykowi i astronomowi Brahmagupcie (Brahmagupta). Liczby naturalne oznaczamy N = {0, 1, 2, 3, . . .}. Z punktu widzenia algebry 0 jest elementem zbioru liczb naturalnych. W kursie analizy matematycznej bardzo często zakłada się, że zbiór liczb naturalnych (lub zbiór liczb całkowitych dodatnich) jest dany przez N = {1, 2, 3, . . .}. Wtedy zbiór N0 = {0, 1, 2, 3, . . .} = N ∪ {0} nazywamy zbiorem liczb całkowitych nieujemnych. Struktura algebraiczna liczb naturalnych. jest W liczbach naturalnych zdefiniowana jest operacja dodawania + : N × N → N, która 10 (D1) przemienna, tzn. ∀ x, y ∈ N : x + y = y + x, (D2) łączna, tzn. ∀ x, y, z ∈ N : (x + y) + z = x + (y + z), (D3) oraz posiada element neutralny 0, tzn. ∀ x ∈ N : x + 0 = 0 + x = x. Zbiór liczb naturalnych z działaniem dodawania (N, +) nazywamy półgrupą. Każdy inny zbiór z działaniem wewnętrznym spełniający warunki (D1)-(D3) nazywamy również półgrupą (np. (P(X), ∩) lub (P(X), ∪)). jest W liczbach naturalnych jest zdefiniowana operacja mnożenia · : N × N → N, która (M1) przemienna, tzn. ∀ x, y ∈ N : x · y = y · x, (M2) łączna, tzn. ∀ x, y, z ∈ N : (x · y) · z = x · (y · z), (M3) oraz posiada element neutralny 1, tzn. ∀ x ∈ N : x · 1 = 1 · x = x. Zbiór liczb naturalnych z działaniem mnożenia (N, ·) jest półgrupą. Struktura porządkowa liczb naturalnych. W liczbach naturalnych jest określona relacja porządku ≤, która jest (P1) zwrotna, tzn. ∀ x ∈ N : x ≤ x, (P2) antysymetryczna, tzn. ∀ x, y ∈ N : x ≤ y ∧ y ≤ x ⇒ x = y, (P3) przechodnia, tzn. ∀ x, y, z ∈ N : x ≤ y ∧ y ≤ z ⇒ x ≤ z, (P4) spójna, tzn. ∀ x, y ∈ N : x ≤ y ∨ y ≤ x. Relację spełniającą warunki (P1)-(P4) nazywamy liniowym porządkiem. Relacja liniowego porządku ≤ jest zgodna ze strukturą algebraiczną w N tzn. spełnia dwa poniższe warunki: (Z1) jeżeli x ≥ y, to dla wszystkich z ∈ N mamy x + z ≥ y + z, (Z2) jeżeli x ≥ y, to dla wszystkich 0 ≤ z mamy zx ≥ zy. Uwaga: (P(X), ⊂) jest porządkiem (nie liniowym porządkiem, nie spełnia warunku spójności). Aksjomatyczne definicje liczb naturalnych 1. aksjomaty Peano, tzn. aksjomaty następnika: 0 jest liczbą naturalną; każda liczba naturalna ma swój następnik, oznaczany S(a); 0 nie jest następnikiem żadnej liczby naturalnej; różne liczby naturalne mają różne następniki; jeśli 0 ma daną własność i następnik dowolnej liczby naturalnej o tej własności również ma tę własność, to każda liczba naturalna ma tę własność (zasada indukcji matematycznej). a + 0 = a, a + S(b) = S(a) + b; a · 0 = 0; a · S(b) = a · b + a. 11 2. Model von Neumanna, tzn. ∅ := 0 ∈ N, 1 = {∅}, itd. n = {0, 1, 2, · · · , n − 1}. x + y = x ∪ y, x ≤ y ↔ x ⊂ y. 3. Konstrukcja Fregego-Russella, tzn. liczby naturalne jako moce zbiorów skończonych. 1.7 Liczby całkowite Liczby całkowite oznaczamy przez Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .}. W liczbach całkowitych dodawanie ma dodatkową własność, tzn. każda liczba całkowita posiada liczbę przeciwną (odwrotną względem operacji dodawania) (D4) ∀ x ∈ Z ∃ y(=: −x) ∈ Z : x + (−x) = (−x) + x = 0. Mówimy, że liczby całkowite z operacją dodawania (Z, +) tworzą grupę przemienną (lub grupę Abelową). Każdy inny zbiór z działaniem wewnętrznym spełniający warunki (D1)(D4) nazywamy również grupą przemienną. Zauważmy, że (Z, ·) nie jest grupą, bo np. nie istnieje element odwrotny względem mnożenia do liczby 2. W zbiorze liczb całkowitych jest określona relacja liniowego porządku ≤ zgodna ze strukturą algebraiczną. Konstrukcja liczb całkowitych. Liczby całkowite można skonstruować z liczb naturalnych w następujący sposób. Liczba całkowita to para liczb naturalnych (n, m), przy czym identyfikujemy pary spełniające następującą relację (n1 , m1 ) = (n2 , m2 ) ⇔ n1 + m2 = m1 + n2 . Dokładniej liczba całkowita to klasa abstrakcji w relacji równoważności zdefiniowanej powyżej w zbiorze N × N. Wówczas dodawanie definiuje się jako (n1 , m1 ) + (n2 , m2 ) = (n1 + n2 , m1 + m2 ), a mnożenie jako (n1 , m1 ) · (n2 , m2 ) = (n1 n2 + m1 m2 , n1 m2 + m1 n2 ). 12 1.8 Liczby wymierne Liczby wymierne oznaczamy przez p Q= : p ∈ Z, q ∈ N \ {0} q to zbiór ułamków o całkowitym liczniku i niezerowym mianowniku. Konstrukcja liczb wymiernych. Liczby wymierne można skonstruować z liczb całkowitych w następujący sposób. Liczba wymierna to para liczb naturalnych (p, q) =: pq , q ̸= 0, przy czym identyfikujemy pary spełniające następującą relację p2 p1 = ⇔ p1 q2 = q1 p2 . q1 q2 Dokładniej liczba wymierna to klasa abstrakcji w relacji równoważności zdefiniowanej powyżej w zbiorze Z × (Z \ {0}). Wówczas dodawanie definiuje się jako p1 p2 p 1 q2 + q1 p 2 + = , q1 q2 q1 q2 a mnożenie jako p1 p2 p1 p2 · = . q1 q2 q1 q2 Zauważmy, że liczby wymierne z operacją dodawania (Q, +) tworzą grupę przemienną. Ponadto w zbiorze liczb wymiernych mnożenie spełnia dodatkowy warunek, tzn. każda niezerowa liczba wymierna posiada liczbę odwrotna (odwrotną względem operacji mnożenia) (M4) ∀ x ∈ Q \ {0} ∃ y(=: x1 ) : x( x1 ) = ( x1 )x = 1. Ponadto operacja mnożenia jest rozdzielna względem dodawania (R) ∀ x, y, z ∈ Q : (x + y)z = xz + yz. Mówimy, że liczby wymierne z operacjami dodawania i mnożenia (Q, +, ·) tworzą ciało. Każdy inny zbiór z działaniami wewnętrznymi spełniającymi warunki (D1)-(D4), (M1)(M4) i (R) nazywamy również ciałem. W zbiorze liczb wymiernych jest określona relacja liniowego porządku ≤ zgodna ze strukturą algebraiczną. Uwaga 1.8.1 Zbiór liczb wymiernych jest gęsty, tzn. pomiędzy dwoma dowolnymi liczbami wymiernymi leży trzecia ∀ x, y ∈ Q, x < y ∃ z ∈ Q : x < z < y. 13 1.9 Liczby rzeczywiste Zbiór liczb rzeczywistych oznaczamy przez R. Mówimy, że liczby rzeczywiste z operacjami dodawania i mnożenia (R, +, ·) tworzą ciało. W zbiorze liczb rzeczywistych jest określona relacja liniowego porządku ≤ zgodna ze strukturą algebraiczną. Zbiór liczb niewymiernych określamy jako R \ Q. Przykład 1.9.1 Już w szkole podstawowej dowiedzieliśmy się, że 0, (3) = 0, 33333 . . . = 1 . 3 Zwróćmy uwagę, że okresowe rozwinięcie dziesiętne 0, 33333 . . . wyraża nieskończoną sumę składników 3 3 3 3 1 1 1 3 1 1 3 1+ + 2 + 3 + ... = · = . 0+ 1 + 2 + 3 + 4 +... = 1 10 10 10 10 10 10 10 10 10 1 − 10 3 Przykład 1.9.2 Przypomnijmy jeszcze szkolny sposób zamiany ułamka okresowego na iloraz dwóch liczb całkowitych. Rozważmy na przykład liczbę a = 78, (1016) = 78, 10161016101610161016 . . . , która wyraża sumę nieskończonej liczby składników a = 78 + 1016 1016 1016 + + 12 + . . . . 104 108 10 Zauważmy też, że różnica 10000a − a = 781016,1016101610161016 . . . −78,1016101610161016 . . . = 780938,0000000000000000 . . . jest liczbą całkowitą. Stąd a = 780938 jest liczbą wymierną. 9999 Rozumując podobnie jak w powyższym przykładzie można wykazać ogólnie, że Uwaga 1.9.3 Liczba rzeczywista jest liczbą wymierną wtedy i tylko wtedy, gdy ma okresowe rozwinięcie dziesiętne. Przykład 1.9.4 Liczba 0, 12345678910111213141516171819202122 . . . , w której rozwinięciu dziesiętnym znajdują się kolejno cyfry wyrażające następujące po sobie liczby naturalne, nie jest wymierna, gdyż nie ma okresowego rozwinięcia dziesiętnego. 14 Konstrukcje liczb rzeczywistych. Przekroje Dedekinda. Przekrojem Dedekinda zbioru liczb wymiernych nazywamy parę niepustych zbiorów liczb wymiernych (A, B) taką, że 1. A ∩ B = ∅, 2. A ∪ B = Q, 3. ∀ a ∈ A ∀ b ∈ B a ≤ b. Możliwe są następujące przypadki 1. zbiór A nie zawiera liczby największej i zbiór B nie zawiera liczby najmniejszej. W tym przypadku przekrój (A, B) wyznacza liczbę niewymierną. 2. zbiór A nie zawiera liczby największej a zbiór B zawiera liczbę najmniejszą, lub odwrotnie zbiór A zawiera liczbę największą a zbiór B nie zawiera liczby najmniejszej. W tym przypadku przekrój (A, B) wyznacza liczbę wymierną (największą w zbiorze A lub najmniejszą w zbiorze B). Będziemy zakładali, że w przekrojach wymiernych zbiór B nie zawiera liczby najmniejszej (przerzucając ją ewentualnie do zbioru A). Przekrój (A, B), gdzie A = {x ∈ Q : x < 0 ∨ x2 < 2}, B = {x ∈ Q : x > 0 ∧ x2 > 2}, √ jest przekrojem niewymiernym i wyznacza liczbę 2. Liczby wymierne i niewymierne noszą nazwę liczb rzeczywistych R. Porządek liniowy w zbiorze liczb rzeczywistych definiujemy jako (A1 , B1 ) ≤ (A2 , B2 ) ⇔ A1 ⊂ A2 . Dodawanie określamy jako x1 + x2 = (A1 , B1 ) + (A2 , B2 ) = (A1 + A2 , B1 + B2 ), gdzie X + Y = {x + y; x ∈ X, y ∈ Y }. Wtedy −x = −(A, B) = (−B, −A). Mnożenie określamy jako x1 · x2 = (A1 , B1 ) · (A2 , B2 ) = (A1 A2 , B1 B2 ), 15 dla 0 ≤ x1 , x2 , gdzie XY = {xy; x ∈ X, y ∈ Y }. W pozostałych przypadkach x1 x2 = (−x1 )(−x2 ), dla x1 , x2 ≤ 0; x1 x2 = x1 (−x2 ), dla 0 ≤ x1 , x2 ≤ 0 oraz x1 x2 = (−x1 )x2 , dla x1 , ≤ 0, x2 ≥ 0. Z tak określonymi działaniami zbiór liczb rzeczywistych jest ciałem. Konstrukcja Cantora. Wśród ciągów liczb wymiernych wyróżniamy ciągi Cauchy’ego, tzn. ciągi {an }, an ∈ Q spełniające warunek ∀ Q ∋ ϵ > 0 ∃N ∈ N ∀ N ∋ n, m ≥ N |an − am | ≤ ϵ. Liczba rzeczywista to ciąg Cauchy’ego liczb wymiernych, przy czym identyfikujemy ciągi {an } i {bn } spełniające następującą relację ∀ Q ∋ ϵ > 0 ∃N ∈ N ∀ N ∋ n ≥ N |an − bn | ≤ ϵ. Dokładniej liczba rzeczywista to klasa abstrakcji w relacji równoważności zdefiniowanej powyżej w zbiorze ciągów Cauchy’ego liczb wymiernych. Dodawanie określamy jako a + b = {an } + {bn } = {an + bn }. Mnożenie określamy jako a · b = {an } · {bn } = {an bn }. Porządek liniowy w liczbach rzeczywistych określamy następująco a < b = {an } < {bn } ⇔ ∃ Q ∋ ϵ > 0 ∃N ∈ N ∀ N ∋ n ≥ N bn < an − ϵ. Uwaga 1.9.5 Dla dowolnej liczby rzeczywistej o znanym rozwinięciu dziesiętnym łatwo jet skonstuować ciąg wymierny zmierzający do tej liczby. Wystarczy wziąć an -rozwinięcie dziesiętne "obcięte" do n-tego miejsca po przecinku. Uwaga 1.9.6 Zbiór liczb rzeczywistych jest gęsty, tzn. pomiędzy dwoma dowolnymi liczbami rzeczywistymi leży trzecia ∀ x, y ∈ R, x < y ∃ z ∈ R : x < z < y. Uwaga 1.9.7 Zbiór liczb niewymiernych jest gęsty, tzn. pomiędzy dwoma dowolnymi liczbami niewymiernymi leży trzecia ∀ x, y ∈ R \ Q, x < y ∃ z ∈ R \ Q : x < z < y. Uwaga 1.9.8 Dla dowolnej liczby rzeczywistej x ∈ R istnieją dwa ciągi wymierny i niewymierny zbieżne do x, tzn. ∃ {an } ⊂ Q : an → x; ∃ {bn } ⊂ R \ Q : bn → x. 16 1.10 Przedziały. Kresy Definicja 1.10.1 Rozszerzonym zbiorem liczb rzeczywistych R nazywamy zbiór liczb rzeczywistych z dołączonymi elementami plus nieskończoność +∞ oraz minus nieskończoność −∞ (−∞, +∞ ∈ / R) tak, że w zbiorze liczb rzeczywistych zachowany jest naturalny porządek zadany przez relację nierówności, natomiast element plus nieskończoność następuje po każdej liczbie rzeczywistej, a element minus nieskończoność poprzedza dowolną liczbę rzeczywistą, tzn. ∀ x ∈ R : −∞ < x < +∞. Definicja 1.10.2 Niech a, b będą dowolnymi elementami zbioru R. Jeśli a < b, to każdy ze zbiorów: [a, b] (a, b) [a, b) (a, b] := := := := {x ∈ R : a ≤ x ≤ b} {x ∈ R : a < x < b} {x ∈ R : a ≤ x < b} {x ∈ R : a < x ≤ b} nazywamy przedziałem o końcach a, b, przedziałem – odpowiednio – domkniętym, otwartym, lewostronnie domkniętym, prawostronnie domkniętym. Niech A będzie dowolnym niepustym podzbiorem zbioru R. Definicja 1.10.3 Ograniczeniem górnym zbioru (majorantą) A nazywamy dowolny element zbioru R nie mniejszy od dowolnego elementu zbioru A. Definicja 1.10.4 Ograniczeniem dolnym zbioru (minorantą) A nazywamy dowolny element zbioru R nie większy od dowolnego elementu zbioru A. Definicja 1.10.5 Element zbioru a ∈ A nazywamy najmniejszym, gdy ∀ b ∈ A a ≤ b. Oznaczamy go a = min A. Element zbioru c ∈ A nazywamy największym, gdy ∀ b ∈ A b ≤ c. Oznaczamy go c = max A. Uwaga 1.10.6 1. W zbiorze A nie muszą istnieć elementy największy i najmniejszy. 2. Jeżeli x jest ograniczeniem górnym zbioru A, to dla dowolnego elementu y ≥ x, y jest ograniczeniem górnym zbioru A. 3. Jeżeli x jest ograniczeniem dolnym zbioru A, to dla dowolnego elementu y ≤ x, y jest ograniczeniem dolnym zbioru A. 4. Dla dowolnego zbioru A zbiór jego ograniczeń górnych ma element najmniejszy. 5. Dla dowolnego zbioru A zbiór jego ograniczeń dolnych ma element największy. Definicja 1.10.7 Najmniejsze ograniczenie górne zbioru A ⊂ R nazywamy kresem górnym zbioru A (lub: supremum zbioru A) i oznaczamy symbolem sup A. 17 Definicja 1.10.8 Największe ograniczenie dolne zbioru A ⊂ R nazywamy kresem dolnym zbioru A (lub: infimum zbioru A) i oznaczamy symbolem inf A. Przykład 1.10.9 Niech A = [0, 1] ∪ (2, 3). Wtedy min A = inf A = 0, max A nie istnieje i sup A = 3. 1.11 Liczby zespolone Uwaga 1.11.1 Liczby zespolone C można skonstruować algebraicznie w następujący sposób. Przypomnijmy, że w dziedzinie rzeczywistej nie wszystkie wielomiany mogą być rozłożone na czynniki liniowe, tzn. istnieją wielomiany stopnia drugiego, które są nierozkładalne (są to trójmiany kwadratowe o wyróżniku ujemnym). Zauważmy, że rozkładalność takich trójmianów jest równoważna z rozkładalnością wielomianu x2 + 1. Załóżmy, że istnieje element i, który nie jest liczbą rzeczywistą, spełniający warunek i2 = −1. Wtedy liczby zespolone możemy uważać za ciało wygenerowane przez zbiór R∪{i}, tzn. C = {a+ib : a, b ∈ R} wraz z działaniami (a + ib) + (α + iβ) = (a + α) + i(b + β), (a + ib) · (α + iβ) = (aα − bβ) + i(aβ + bα). Uwaga 1.11.2 W zbiorze liczb zespolonych nie można zdefiniować porządku, który byłby zgodny ze strukturą algebraiczną. Załóżmy dla dowodu nie wprost, że taki porządek ≤ istnieje. Wtedy i ≥ 0 (odwrotny przypadek dowodzi się analogicznie). Wtedy mnożąc przez i dostajemy i2 = −1 ≥ 0, mnożąc jeszcze dwa razy przez i dostajemy −i ≥ 0 i 1 ≥ 0 i otrzymaliśmy sprzeczność 0 = 1. Teraz podamy analityczną konstrukcję liczb zespolonych. Definicja 1.11.3 W iloczynie kartezjańskim R2 := R × R definiujemy sumę oraz iloczyn par z1 = (x1 , y1 ) oraz z2 = (x2 , y2 ) następująco z1 + z2 = (x1 + x2 , y1 + y2 ) z1 z2 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ). Definicja 1.11.4 Zbiór par liczb rzeczywistych z dodawaniem i mnożeniem określonym w powyższej definicji, nazywamy zbiorem liczb zespolonych i oznaczamy literą C. Uwaga 1.11.5 a) Suma i iloczyn liczb zespolonych jest liczbą zespoloną. b) Dodawanie i mnożenie liczb zespolonych są działaniami łącznymi i przemiennymi, tzn. z+w =w+z zw = wz z + (u + w) = (z + u) + w z(uw) = (zu)w dla dowolnych liczb zespolonych z, u, w. c) Mnożenie liczb zespolonych jest rozdzielne względem dodawania, tzn. z(u + w) = zu + zw 18 dla dowolnych liczb zespolonych z, u oraz w. Definicja 1.11.6 Jeśli z = (x, y) jest liczbą zespoloną, to pierwszy element x pary (x, y) nazywamy częścią rzeczywistą liczby z i oznaczamy symbolem ℜz (lub Rez), a drugi element tej pary – częścią urojoną liczby z i oznaczamy ℑz (lub Imz). Zauważmy, że każdej liczbie zespolonej z odpowiada dokładnie jeden punkt (ℜz, ℑz) w prostokątnym układzie współrzędnych. Tradycyjnie mówimy więc o płaszczyźnie zespolonej C. Oś odciętych na płaszczyźnie C nazywamy osią rzeczywistą, a oś rzędnych - osią urojoną. Definicja 1.11.7 Jednostką urojoną nazywamy liczbę zespoloną i = (0, 1). Uwaga 1.11.8 a) Każdą liczbę zespoloną z można zapisać w postaci sumy z = ℜz + ℑzi. b) Kwadrat jednostki urojonej wynosi −1, gdyż i2 = (0, 1)(0, 1) = (−1, 0) = −1 + 0i = −1 c) Jeśli z1 = x1 + y1 i oraz z2 = x2 + y2 i, to sumę i iloczyn liczb z1 , z2 możemy wyznaczyć tak, jak zwykliśmy przekształcać wyrażenia algebraiczne, traktując jednostkę urojoną i jak parametr i pamiętać, że i2 = −1. Mamy więc z1 + z2 = (x1 + y1 i) + (x2 + y2 i) = (x1 + x2 ) + (y1 + y2 )i = (x1 + x2 , y1 + y2 ) oraz z1 z2 = (x1 + y1 i)(x2 + y2 i) =x1 x2 + (x1 y2 + x2 y1 )i + y1 y2 i2 = (x1 x2 − y1 y2 ) + (x1 y2 + x2 y1 )i = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ). Przykład 1.11.9 (1 + i) + (5 − 2i) = 6 − i (1 + i)(5 − 2i) = 7 + 3i 1+i (1 + i)(5 + 2i) 3 7 = = + i. 5 − 2i (5 − 2i)(5 + 2i) 29 29 Definicja 1.11.10 Sprzężeniem liczby zespolonej z = x+iy nazywamy liczbę z = x−iy. Liczba z̄ = x − iy jest obrazem liczby z = x + iy w symetrii względem osi rzeczywistej. p Definicja 1.11.11 Modułem liczby zespolonej z = x+iy nazywamy liczbę |z| = x2 + y 2 . Moduł liczby zespolonej to jej odległość od początku układu współrzędnych. 19 Uwaga 1.11.12 Dowolną liczbę zespoloną z = x + iy możemy przedstawić w postaci p trygonometrycznej z = r(cos φ, sin φ) = r(cos φ + i sin φ), gdzie r = x2 + y 2 , a φ jest dowolnym kątem takim, że ( x = r cos φ y = r sin φ Wiemy, że kątów takich jest nieskończenie wiele. Obserwacja 1.11.13 Dla dowolnych liczb zespolonych z, w zachodzi 1. z̄¯ = z; 2. |z̄| = |z|; 3. z z̄ = |z|2 ; 4. (z + w) = z̄ + w̄; 5. (zw) = z̄ w̄; 6. wz = w̄z̄ , w ̸= 0; 7. |zw| = |z||w|; 8. z w |z| = |w| , w ̸= 0; 9. |z + w| ≤ |z| + |w| (nierówność trójkąta); 10. ||z| − |w|| ≤ |z − w|. Dowód. Własności (1)-(6) wynikają wprost z definicji i są łatwe do przeliczenia. (7) Mamy |zw|2 = zwzw = z z̄ww̄ = |z|2 |w|2 . Punkt (8) dowodzi się analogicznie. (9) Niech z = x+iy i w = a+ib. Podnieśmy obie strony do kwadratu, wtedy otrzymamy |z + w|2 ≤ (|z| + |w|)2 z z̄ + z w̄ + wz̄ + ww̄ ≤ z z̄ + 2|z||w| + ww̄ p p 2(xa + yb) ≤ 2 x2 + y 2 a2 + b2 x2 a2 + 2xayb + y 2 b2 ≤ x2 a2 + x2 b2 + y 2 a2 + y 2 b2 0 ≤ (xb − ya)2 Punkt (10) wynika z punktu (9). 20 Definicja 1.11.14 Każdy z kątów φ takich, że zachodzą równości x = r cos φ y = r sin φ nazywamy argumentem liczby z i oznaczamy argz. Najmniejszy nieujemny argument liczby zespolonej z nazywamy argumentem głównym tej liczby i oznaczamy Argz. Wtedy każdą liczbę zespoloną z ̸= 0 można zapisać w postaci z = |z|(cos φ + i sin φ), którą nazywamy postacią trygonometryczną liczby zespolonej. Uwaga 1.11.15 Wyrażenie cos φ + i sin φ będziemy krótko notować w postaci wykładniczej eiφ lub exp(iφ), pomijając na razie zasadność użycia symbolu funkcji wykładniczej w tej notacji. Odtąd liczbę zespoloną z o module |z| i argumencie φ można zapisywać również w postaci wykładniczej z = |z|eiφ . Obserwacja 1.11.16 Dla dowolnych liczb zespolonych z, w ̸= 0 zachodzi 1. arg(zw) = arg(z) + arg(w); 2. arg z1 = −arg(z); 3. arg wz = arg(z) − arg(w); 4. arg(z k ) = karg(z), dla k ∈ Z. Dowód. (1) Zauważmy, że zw = |z|(cos φ1 + i sin φ1 )|w|(cos φ2 + i sin φ2 ) = |z||w|[(cos φ1 cos φ2 − sin φ1 sin φ2 ) + i(sin φ1 cos φ2 + cos φ1 sin φ2 )] = |zw|(cos(φ1 + φ2 ) + i sin(φ1 + φ2 )). Pozostałe punkty dowodzi się analogicznie. □ Twierdzenie 1.11.17 (wzór de Moivre’a) Dla dowolnej liczby zespolonej z = |z|(cos φ + i sin φ) i dowolnej liczby naturalnej n = 1, 2, 3, . . . zachodzi równość: z n = |z|n (cos nφ + i sin nφ), którą można również wyrazić w postaci wykładniczej: (|z|eiφ )n = |z|n einφ . Przykład 1.11.18 √ π π 2020 2020π 2020π 2020 1010 (1 + i) = 2 cos + i sin =2 cos + i sin = 4 4 4 4 21010 (cos(π) + i sin(π)) = −21010 . 21 Teraz zajmiemy się pierwiastkowaniem liczb zespolonych. Definicja 1.11.19 Każdy z pierwiastków równania z n = w nazywamy pierwiastkiem algebraicznym stopnia n z liczby w. Wniosek 1.11.20 Jeśli w = |z|(cos φ + i sin φ) ̸= 0 jest dowolną liczbą zespoloną różną od zera, zaś n = 1, 2, 3, . . . – dowolną liczbą naturalną, to równanie z n = w spełnia dokładnie n liczb zespolonych z0 , z1 , z2 , . . . , zn−1 p φ + 2kπ φ + 2kπ k zk = , |z| cos + i sin n n gdzie k ∈ {0, 1, 2, . . . , n − 1}. Dowód. (Szkic) Korzystając ze wzoru de Moivre’a stwierdzamy, że zkn = w, a więc każda z liczb zk spełnia dane równanie. Zauważmy ponadto, że gdybyśmy nie ograniczyli zakresu parametru k do zbioru liczb całkowitych nieujemnych od 0 do n − 1, to i tak nie otrzymalibyśmy więcej pierwiastków danego równania, gdyż zk = zk+n ze względu na okresowość funkcji sinus i cosinus. □ Uwaga 1.11.21 Każdy z pierwiastków równania z n = w leży na okręgu o środku w punkp n cie 0 i promieniu |w|. Argument pierwiastka z0 jest n-tą częścią argumentu liczby w, a 2π każdy kolejny pierwiastek ma argument o większy od poprzedniego, tzn. n Argz0 = 1 Argw n Argzk+1 = Argzk + 2π , dla k = 0, 1, 2, . . . , n − 2. n Przykład 1.11.22 Każda z liczb i π4 z0 = e π π z1 = ei( 4 + 2 ) π π π π z2 = ei( 4 +2 2 ) z3 = ei( 4 +3 2 ) π π = cos + i sin 4 4 3π 3π = cos + i sin 4 4 5π 5π = cos + i sin 4 4 7π 7π = cos + i sin 4 4 jest pierwiastkiem równania z 4 + 1 = 0. 22 √ √ 2 2 =+ +i √2 √2 2 2 =− +i 2 2 √ √ 2 2 =− −i √2 √2 2 2 =+ −i 2 2 Przykład 1.11.23 Zastosujmy twierdzenie de Moivre’a do wyznaczenia wzorów funkcje trygonometryczne wielokrotności kątów. Niech z = cos α + i sin α. Wtedy z 2 = cos(2α) + i sin(2α), z 2 = cos2 α + 2i sin α cos α − sin2 α, a wtedy cos(2α) = cos2 α − sin2 α, sin(2α) = 2 sin α cos α. Podobnie z 3 = cos(3α) + i sin(3α), z 3 = cos3 α + 3i cos2 α sin α − 3 cos α sin2 α − i sin3 α, a wtedy cos(3α) = cos3 α − 3 cos α sin2 α, sin(3α) = 3 cos2 α sin α − sin3 α. Równanie kwadratowe Równanie postaci az 2 + bz + c = 0, a, b, c ∈ C, a ̸= 0, nazywamy równaniem kwadratowym. Rozwiązujemy jest w taki sam sposób, jak w dziedzinie rzeczywistej. Niech ∆ = b2 − 4ac, wtedy rozwiązaniami równania kwadratowego są liczby √ √ −b − ∆ −b + ∆ z1 = , z2 = , 2a 2a √ gdzie ∆ jednym ustalonym pierwiastkiem zespolonym z ∆. Przykład 1.11.24 Rozwiązać równanie z 2 + (1 + i)z + i = 0. Mamy z1 = −1, z2 = −i. ma Rozważmy teraz równanie kwadratowe rzeczywiste ax2 + bx + c = 0. Wtedy równanie 1. dwa różne pierwiastki rzeczywiste √ √ −b − ∆ −b + ∆ , x2 = , x1 = 2a 2a gdy ∆ > 0; 2. jeden (podwójny) pierwiastek rzeczywisty x0 = gdy ∆ = 0; 23 −b , 2a 3. dwa pierwiastki zespolone sprzężone √ √ −b − i −∆ −b + i −∆ x1 = , x2 = , 2a 2a gdy ∆ < 0. Zbiory na płaszczyźnie. Za pomocą liczb zespolonych można opisać zbiory znane z geometrii. Przykład 1.11.25 Narysować na płaszczyźnie zbiory A = {z ∈ C : |z − i + 2| = 2}; B = {z ∈ C : |z + i| = 1}; C = {z ∈ C : Re z ≥ 0}; D = {z ∈ C : Im z = −2}; E = {z ∈ C : Re(z 2 ) = 1}; n π πo F = z ∈ C : < Arg z ≤ . 4 2 24 2 Funkcje Przypomnijmy kilka pojęć z teorii mnogości dotyczących funkcji f : X 7→ Y określonych na zbiorze X o wartościach w zbiorze Y . 2.1 Podstawowe własności Definicja 2.1.1 Niech X, Y będą zbiorami niepustymi. Funkcją f : X → Y nazywamy odwzorowanie, które każdemu elementowi x zbioru X przyporządkowuje dokładnie jeden element y zbioru Y , piszemy y = f (x). Bardziej precyzyjnie funkcja jest podzbiorem iloczynu kartezjańskiego (podzbiór ten oznaczamy wyk(f ) i nazywamy wykresem funkcji) X × Y spełniającym warunek dla każdego x ∈ X istnieje dokładnie jeden y ∈ Y taki, że (x, y) ∈ wyk f . Zbiór X nazywamy dziedziną funkcji i oznaczamy Df . Przeciwdziedziną (lub zbiorem wartości) nazywamy zbiór PDf = {y ∈ Y : ∃ x ∈ X : f (x) = y}. Czasami będziemy rozważać tzw. funkcje częściowe czyli funkcje, który dziedzina Df nie jest równa całemu zbiorowi X. Na przykład będziemy mówili funkcja f (x) = x1 jest funkcją rzeczywistą, ale jej dziedzina jest równa R \ {0}. Definicja 2.1.2 Niech f, g : X → R. Wtedy możemy zdefiniować 1. sumę funkcji (f + g)(x) := f (x) + g(x), x ∈ Df ∩ Dg ̸= ∅; 2. różnicę funkcji (f − g)(x) := f (x) − g(x), x ∈ Df ∩ Dg ̸= ∅; 3. iloczyn funkcji (f · g)(x) := f (x) · g(x), x ∈ Df ∩ Dg ̸= ∅; 4. iloraz funkcji f f (x) (x) := , x ∈ Df ∩ Dg ∩ {x : g(x) ̸= 0} = ̸ ∅. g g(x) Definicja 2.1.3 Niech A ⊂ X i niech f : X 7→ Y . Zacieśnieniem (inaczej: zawężeniem lub restrykcją) funkcji f do zbioru A nazywamy funkcję f|A : A 7→ Y równą funkcji f na zbiorze A, tzn. ∀x ∈ A : f|A (x) = f (x). Definicja 2.1.4 Funkcją identycznościową nazywamy funkcję idX : X → X taką, że idX (x) = x. 25 Definicja 2.1.5 Niech f : X → Y , g : Y → Z będą funkcjami takimi, że PDf ∩ Dg ̸= ∅. Złożeniem funkcji f z funkcją g nazywamy funkcję g ◦ f : X → Z zdefiniowaną następująco (g ◦ f )(x) = g(f (x)). Przykład 2.1.6 Niech f (x) = x2 + 3x − 1 i g(x) = sin x, wtedy g ◦ f (x) = sin(x2 + 3x − 1), f ◦ g(x) = sin2 x + 3 sin x − 1. Definicja 2.1.7 Niech f : X 7→ Y będzie funkcją. Mówimy, że funkcja g : Y 7→ X jest funkcją odwrotną do funkcji f , jeśli dla dowolnego elementu x ∈ X zachodzi równość g(f (x)) = x i dla dowolnego elementu y ∈ Y zachodzi równość f (g(y)) = y, lub równoważnie g ◦ f = idX , f ◦ g = idY Funkcję odwrotną do funkcji f : X 7→ Y będziemy oznaczać często symbolem f −1 : Y 7→ X, o ile nie prowadzi to do nieporozumienia. Należy odróżniać pojęcie funkcji odwrotnej od odwrotności funkcji , gdzie przez odwrotność funkcji f : X 7→ R rozumiemy 1 1 funkcję : X ∋ x 7→ ∈ R. f f (x) Uwaga 2.1.8 Zauważmy, że wykresy funkcji f i f −1 są symetryczne względem prostej y = x, gdyż (x, y) ∈ wyk f ⇔ f (x) = y ⇔ x = f −1 (y) ⇔ (y, x) ∈ wyk f −1 . Definicja 2.1.9 Funkcję f : X 7→ Y nazywamy iniekcją zbioru X w zbiór Y , jeśli jest różnowartościowa, to znaczy, że dla dowolnych elementów x, y ∈ X z równości f (x) = f (y) wynika, że x = y. Definicja 2.1.10 Funkcję f : X 7→ Y nazywamy suriekcją zbioru X na zbiór Y , jeśli każdy element zbioru Y jest wartością funkcji f, to znaczy, że dla dowolnego elementu y ∈ Y istnieje element x ∈ X taki, że y = f (x). Definicja 2.1.11 Funkcję f : X 7→ Y nazywamy bijekcją zbioru X na zbiór Y , jeśli jest iniekcją i suriekcją. Twierdzenie 2.1.12 Funkcja f : X → Y jest odwracalna wtedy tylko wtedy, gdy jest bijekcją. Przykład 2.1.13 Niech f : R → R. Wtedy mając dany wykres funkcji można zbadać kiedy jest iniekcją, suriekcją czy bijekcją badając jego przecięcia z prostymi poziomymi. Mamy 1. f jest iniekcją wtedy i tylko wtedy, gdy dla każdego c ∈ R zbiór wyk f ∩ {(x, cx) : x ∈ R} jest co najwyżej jednelementowy; 2. f jest suriekcją wtedy i tylko wtedy, gdy dla każdego c ∈ R zbiór wyk f ∩ {(x, cx) : x ∈ R} jest co najmniej jednelementowy; 26 3. f jest bijekcją wtedy i tylko wtedy, gdy dla każdego c ∈ R zbiór wyk f ∩ {(x, cx) : x ∈ R} jest dokładnie jednelementowy; Przykład 2.1.14 Zbadać homografię f (x) = ax+b cx+d , gdzie c ̸= 0 (dla c = 0 dostajemy funkcję liniową). Dziedziną funkcji jest zbiór Df = R\{− dc }. Zbadamy iniektywność funkcji f (x1 ) = f (x2 ) ⇔ ax1 + b ax2 + b = ⇔ (ad − bc)(x1 − x2 ) = 0 ⇔ x1 = x2 , cx1 + d cx2 + d o ile ad − cb ̸= 0. Czyli homografia jest iniekcją, gdy ad − cb ̸= 0. Zauważmy również, że gdy ad − bc = 0, to funkcja f jest stała f (x) = db lub f (x) = 0 (gdy d = 0). Teraz zbadamy suriektywność funkcji. Niech y będzie dowolną liczbą szukamy x takiego, że y = f (x). Mamy y = f (x) ⇔ y = dy − b ax + b ⇔ (a − cy)x = dy − b ⇔ x = , cx + d a − cy o ile y ̸= ac . Jeżeli y = ac = ax+b cx+d to dostajemy ad − bc = 0. Podsumowując PDf = R \ { ac }, funkcja f (x) = d a ax + b : R \ {− } → R \ { } cx + d c c dx−b jest bijekcją i jest funkcja odwrotna jest równa f −1 (x) = −cx+a . 2.2 Obrazy i przeciwobrazy zbiorów Definicja 2.2.1 Niech f : X → Y będzie funkcją i niech A ⊂ X i B ⊂ Y . Wtedy 1. obrazem zbioru A przez funkcję f nazywamy zbiór f (A) = {y ∈ Y : ∃ x ∈ A f (x) = y}; 2. przeciwobrazem zbioru B przez funkcję f nazywamy zbiór f −1 (B) = {x ∈ X : f (x) ∈ B}; Mamy następujące własności obrazów i przeciwobrazów. Obserwacja 2.2.2 Niech f : X → Y będzie funkcją i niech A1 , A2 ⊂ X i B1 , B2 ⊂ Y . Wtedy 1. f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ); 2. f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ); 3. f (A1 \ A2 ) ⊃ f (A1 ) \ f (A2 ); 27 4. f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ); 5. f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ); 6. f −1 (B1 \ B2 ) = f −1 (B1 ) \ f −1 (B2 ). Przykład 2.2.3 Niech f (x) = x2 + x − 2. Znaleźć f ([−2, 2]), f (R), f −1 ({0}), f −1 ((0, 4]). Miejscami zerowymi funkcji są x = −2 i x = 1, wierzchołek paraboli ma współrzędne b ∆ (− 2a , − 4a ) = (− 21 , − 49 ). Zauważmy, że f (−2) = 0, f (2) = 4 oraz w punkcie x = − 12 jest minimum o wartości − 94 . Dlatego f ([−2, 2]) = [− 94 , 4]. Zauważmy również, że f (R) = PDf = [− 94 , ∞). Mamy x ∈ f −1 ({0}) ⇔ f (x) = 0, czyli jest to zbiór miejsc zerowych funkcji, dlatego f −1 ({0}) = {−2, 1}. Podobnie x ∈ f −1 ((0, 4]) ⇔ 0 < f (x) ≤ 4. Nierówność f (x) > 0 jest spełniona przez liczby ze zbioru (−∞, −2) ∪ (1, ∞). Natomiast nierówność x2 + x − 6 ≤ 0 jest spełniona w zbiorze [−3, 2]. W końcu f −1 ((0, 4]) = [−3, −2) ∪ (1, 2]. 2.3 Moce zbiorów Definicja 2.3.1 Mówimy, że zbiory X, Y są równoliczne, jeśli istnieje bijekcja zbioru X na zbiór Y . Mówimy też wtedy, że zbiory X, Y są tej samej mocy , co zapisujemy krótko cardX = cardY lub #X = #Y . Jeśli zbiór zawiera skończoną liczbę elementów równą n (innymi słowy: jeśli jest równoliczny ze zbiorem {1, 2, 3, . . . , n}), to mówimy, że jest zbiorem mocy n, co zapisujemy cardA = n lub #A = n. Przykład 2.3.2 a) Można wykazać, że zbiór liczb naturalnych jest równoliczny ze zbiorem liczb całkowitych i ze zbiorem liczb wymiernych. b) Również każdy nieskończony podzbiór zbioru liczb naturalnych (na przykład zbiór liczb parzystych, zbiór liczb nieparzystych, zbiór liczb pierwszych) jest równoliczny z całym zbiorem liczb naturalnych. Definicja 2.3.3 Zbiór A równoliczny ze zbiorem liczb naturalnych nazywamy zbiorem przeliczalnym. Mówimy też, że moc zbioru przeliczalnego A jest równa alef zero, co zapisujemy card A = ℵ0 lub #A = ℵ0 . Definicja 2.3.4 Zbiór nieskończony, który nie jest równoliczny ze zbiorem liczb naturalnych, nazywamy zbiorem nieprzeliczalnym. Twierdzenie 2.3.5 Zbiór liczb rzeczywistych nie jest równoliczny ze zbiorem liczb naturalnych. Przykład 2.3.6 a) Jeśli a < b są dowolnymi elementami zbioru R, to każdy z przedziałów [a, b], (a, b], [a, b), (a, b), jest równoliczny ze zbiorem liczb rzeczywistych. b) Co więcej, można również wykazać, że zbiór punktów płaszczyzny R2 = R × R jest równoliczny ze zbiorem liczb rzeczywistych. 28 Definicja 2.3.7 Zbiór A równoliczny ze zbiorem liczb rzeczywistych nazywamy zbiorem mocy continuum, co zapisujemy card A = c lub #A = c. Przykład 2.3.8 Mamy #N = #Z = #Q = ℵ0 , #(R \ Q) = #R = #C = c. 2.4 Specjalne własności funkcji Definicja 2.4.1 Mówimy, że funkcja f : R 7→ R jest ograniczona, gdy istnieją liczby rzeczywiste m, M takie, że dla dowolnego x ∈ Df mamy m ≤ f (x) ≤ M . Definicja 2.4.2 Mówimy, że funkcja f : R 7→ R jest rosnąca (odpowiednio: ściśle rosnąca) w przedziale (a, b), jeśli ∀x, y ∈ (a, b) : x < y =⇒ f (x) ≤ f (y) (odpowiednio: ∀x, y ∈ (a, b) : x < y =⇒ f (x) < f (y).) Definicja 2.4.3 Mówimy, że funkcja f : R 7→ R jest malejąca (odpowiednio: ściśle malejąca) w przedziale (a, b), jeśli ∀x, y ∈ (a, b) : x < y =⇒ f (x) ≥ f (y) (odpowiednio: ∀x, y ∈ (a, b) : x < y =⇒ f (x) > f (y).) Definicja 2.4.4 Mówimy, że funkcja jest monotoniczna w przedziale, jeśli w tym przedziale jest rosnąca albo malejąca. π π Przykład 2.4.5 Funkcja x 7→ tg x rośnie w każdym z przedziałów postaci − +kπ, + 2 2 π π π 3π ∪ , . Weźmy bowiem kπ nie jest jednak rosnąca w sumie przedziałów − , 2 2 2 2 π 3π np. argumenty x = , y = . Wówczas x < y, ale tg x = 1 > −1 = tg y. 4 4 Uwaga 2.4.6 Jeśli g : (c, d) 7→ (a, b) jest funkcją odwrotną do funkcji f : (a, b) 7→ (c, d), to a) jeśli f jest ściśle rosnąca, to g jest także ściśle rosnąca; b) jeśli f jest ściśle malejąca, to g jest również ściśle malejąca. Krótko: funkcja odwrotna do funkcji rosnącej jest rosnąca, a odwrotna do malejącej – malejąca. Definicja 2.4.7 Mówimy, że funkcja f : R 7→ R jest parzysta, gdy 1. ∀ x : x ∈ Df ⇒ −x ∈ Df ; 2. ∀ x ∈ Df : f (−x) = f (x). Definicja 2.4.8 Mówimy, że funkcja f : R 7→ R jest nieparzysta, gdy 29 1. ∀ x : x ∈ Df ⇒ −x ∈ Df ; 2. ∀ x ∈ Df : f (−x) = −f (x). Uwaga 2.4.9 Zauważmy, że wykres funkcji parzystej jest symetryczne względem osi OY , natomiast wykres funkcji nieparzystej jest symetryczny względem punktu (0, 0). Definicja 2.4.10 Mówimy, że funkcja f : R 7→ R jest okresowa, gdy istnieje liczba T > 0, zwana okresem funkcji taka ,że 1. ∀ x : x ∈ Df ⇒ x + T, x − T ∈ Df ; 2. ∀ x ∈ Df : f (x + T ) = f (x). Najmniejszy okres dodatni T0 nazywamy okresem podstawowym funkcji. Uwaga 2.4.11 Zauważmy, że istnieją funkcje okresowe bez okresu podstawowego. Klasycznym przykładem jest funkcja Dirichleta 1, x ∈ Q f (x) = 0, x ∈ R \ Q której okresem jest dowolna liczba wymierna dodatnia. 2.5 Funkcje elementarne Przypominamy własności funkcji znanych ze szkoły (funkcja liniowa, homograficzna, wielomianowa, wykładnicza, funkcje trygonometryczne). Definiujemy funkcje hiperboliczne. Rozważamy podstawowe własności funkcji odwrotnych. Funkcje liniowe Definicja 2.5.1 Niech a, b będą dowolnymi liczbami rzeczywistymi. Funkcję x 7→ ax + b nazywamy funkcją liniową (afiniczną). Uwaga 2.5.2 a) Wykresem funkcji afinicznej jest prosta. b) Funkcja f (x) = ax + b jest ściśle rosnąca, gdy a > 0 i ściśle malejąca, gdy a < 0. Jest bijekcją zbioru R na zbiór R, gdy a ̸= 0. c) Funkcja odwrotna do funkcji afinicznej jest funkcją afiniczną. d) Złożenie funkcji afinicznych jest funkcją afiniczną. Funkcje homograficzne 30 Definicja 2.5.3 Niech a, b, c, d będą dowolnymi liczbami rzeczywistymi takimi, że ad − ax + b bc ̸= 0. Funkcję x 7→ nazywamy funkcją homograficzną lub – krótko – homocx + d grafią. Uwaga 2.5.4 a) Funkcja afiniczna jest szczególnym przypadkiem funkcji homograficznej. b) Wykresem funkcji homograficznej f jest prosta (jeśli f jest afiniczna) lub hiperbola (jeśli f nie jest afiniczna). c) Funkcja odwrotna do homografii jest homografią. d) Złożenie homografii jest homografią. Wielomiany Definicja 2.5.5 Niech a będzie stałą, niech n = 0, 1, 2, 3, ... będzie liczbą całkowitą nieujemną, a x – zmienną. Wyrażenie algebraiczne axn nazywamy jednomianem zmiennej x. Jeśli a ̸= 0, to liczbę n nazywamy stopniem jednomianu axn . Sumę w(x) = a0 + a1 x + a2 x2 + ... + an xn skończonej liczby jednomianów zmiennej x nazywamy wielomianem zmiennej x. Największy ze stopni tych jednomianów, nazywamy stopniem wielomianu. Definicja 2.5.6 Funkcję x 7→ w(x) = a0 + a1 x + a2 x2 + ... + an xn nazywamy funkcją wielomianową lub – krótko – wielomianem. Uwaga 2.5.7 a) Suma oraz iloczyn wielomianów jest wielomianem. b) Złożenie funkcji wielomianowych jest funkcją wielomianową. Funkcja f (x) = xn , n-liczba nieparzysta Uwaga 2.5.8 Funkcja f (x) = xn 1. ma dziedzinę i przeciwdziedzinę równą R; 2. jest rosnąca; 3. jest nieparzysta; 4. jest iniekcją, suriekcją, czyli bijekcją; √ 5. ma funkcję odwrotną równą f −1 (x) = n x. √ Uwaga 2.5.9 Funkcja f (x) = n x 31 1. ma dziedzinę i przeciwdziedzinę równą R; 2. jest rosnąca; 3. jest nieparzysta 4. jest iniekcją, suriekcją, czyli bijekcją; 5. ma funkcję odwrotną równą f −1 (x) = xn . Funkcja f (x) = xn , n-liczba parzysta Uwaga 2.5.10 Funkcja f (x) = xn 1. ma dziedzinę równą R i przeciwdziedzinę równą [0, +∞); 2. jest rosnąca w przedziale (0, +∞) i malejąca w przedziale (−∞, 0); 3. jest parzysta; 4. nie jest iniekcją ani suriekcją. Zacieśnienie funkcji f (x) = xn do przedziału [0, ∞) xn |[0,+∞) : [0, +∞) → [0, +∞) jest rosnącą bijekcją. Funkcją odwrotną do niej jest funkcja pierwiastek stopnia n g(x) = √ n x określona na przedziale [0, ∞) o wartościach w [0, ∞). 2.6 Funkcja wykładnicza i logarytmiczna Definicja 2.6.1 Niech a > 0 będzie dowolną dodatnią liczbą rzeczywistą. Funkcję x 7→ ax określoną na zbiorze liczb rzeczywistych nazywamy funkcją wykładniczą o podstawie a. Uwaga 2.6.2 a) Jeśli a > 0, a ̸= 1, funkcja wykładnicza x 7→ ax jest bijekcją zbioru R na przedział (0, ∞). Nie zeruje się w żadnym punkcie swojej dziedziny. b) Jeśli a > 1, funkcja x 7→ ax jest ściśle rosnąca, jeśli zaś 0 < a < 1, jest ściśle malejąca. c) Jeśli a = 1, funkcja x 7→ ax jest stała. Definicja 2.6.3 Niech a ∈ (0, 1)∪(1, ∞) będzie dowolną liczbą rzeczywistą dodatnią, różną od jedności. Funkcję odwrotną do funkcji x 7→ ax nazywamy funkcją logarytmiczną o podstawie a i oznaczamy x 7→ loga x. 32 Na ogół pomija się indeks a w oznaczeniu logarytmu liczby x i pisze się krótko log x. Zwróćmy jednak uwagę na fakt, że w zależności od dziedziny nauki, czy techniki, symbol ten może oznaczać logarytmy o różnych podstawach. I tak informatycy na ogół posługują się tym symbolem mając na myśli logarytm o podstawie 2, tzn. log x = log2 x. Z kolei w naukach technicznych symbol log x = log10 x oznacza przeważnie logarytm dziesiętny. Natomiast matematycy posługują się najczęściej logarytmem o podstawie e = 2, 71828182846... (do definicji i własności tej ważnej stałej powrócimy w następnych modułach). Stąd często w pracach matematycznych symbol log x = loge x oznacza właśnie logarytm o podstawie e. My jednak, aby uniknąć nieporozumień, logarytm o podstawie e będziemy oznaczać osobnym symbolem ln x. Definicja 2.6.4 Symbolem exp x będziemy oznaczać potęgę ex . Definicja 2.6.5 Logarytmem naturalnym z liczby dodatniej x nazywamy liczbę ln x = loge x. Uwaga 2.6.6 a) Jeśli a > 0, a ̸= 1, funkcja logarytmiczna x 7→ loga x jest bijekcją przedziału (0, ∞) na zbiór R. b) Jeśli a > 1, funkcja x 7→ loga x jest ściśle rosnąca, jeśli zaś 0 < a < 1, jest ściśle malejąca. c) Jedynym miejscem zerowym funkcji logarytmicznej x 7→ loga x jest punkt x = 1. d) Jeśli a > 1, to logarytm loga x jest dodatni w przedziale (1, ∞) i jest ujemny w przedziale (0, 1). Jeśli zaś 0 < a < 1, to logarytm loga x jest ujemny w przedziale (1, ∞) i jest dodatni w przedziale (0, 1). Przypomnijmy jeszcze parę tożsamości, z których często będziemy korzystać. Uwaga 2.6.7 a) Dla a, b > 0, x, y ∈ R, n, m ∈ N zachodzą równości a x ax √ n ax 1 (ax )y = axy , ax ay = ax+y , y = ax−y , (ab)x = ax bx , = x , a−x = x , a m = m an . a b b a b) Dla dodatnich liczb a, b, c, a ̸= 1, c ̸= 1 prawdziwy jest wzór na zmianę podstawy logarytmu logc b , loga b = logc a w szczególności, gdy c = e, mamy równość loga b = ln b . ln a c) Dla dowolnej liczby b ∈ R i dodatnich a > 0, c > 0 zachodzi równość ab = cb logc a , która w szczególnym przypadku, gdy c = e, ma postać ab = exp(b ln a). 33 d) Dla dodatnich liczb a, b, c, c ̸= 1 zachodzi a logc (ab) = logc a + logc b, logc = logc a − logc b, logc ab = b logc a. b 2.7 Funkcje trygonometryczne i funkcje cyklometryczne Przypomnijmy wartości funkcji trygonometrycznych dla podstawowych kątów. x sin x cos x tg x 0 0 1 0 ctg x X π 6 1 √2 3 2 1 √ √3 3 π √4 2 √2 2 2 1 1 π √3 3 2 1 √2 π 2 3 1 0 X √1 3 0 Uwaga 2.7.1 Przypomnijmy kilka własności funkcji trygonometrycznych sinus, cosinus, tangens i cotangens. 1. Dziedziną funkcji sinus i cosinus jest zbiór liczb rzeczywistych, dziedziną funkcji tangens jest zbiór R\{kπ, k ∈ Z} a dziedziną funkcji cotangens jest zbiór R\{ π2 +kπ, k ∈ Z}. 2. Przeciwdziedziny funkcji sin x i cos x to odcinek [−1, 1], dlatego są one ograniczone i nie są suriektywne. Natomiast przeciwdziedziny funkcji tg x i ctg x to R, dlatego są suriektywne. 3. Żadna z nich nie jest różnowartościowa w swojej dziedzinie. 4. Funkcje trygonometryczne są okresowe, okres podstawowy funkcji sin x i cos x wynosi 2π, natomiast funkcji tg x i ctg x jest równy π. 5. W końcu funkcja cos x jest parzysta, pozostałe są nieparzyste. π π Uwaga 2.7.2 a) Funkcja f (x) = sin x zacieśniona do przedziału − , jest różnowar2 2 tościowa, ściśle rosnąca. b) Funkcja f (x) = cos x zacieśniona do przedziału [0, π] jest różnowartościowa, ściśle malejąca. c) Funkcja f (x) = tg x zacieśniona do przedziału ściśle rosnąca. π π − , 2 2 jest różnowartościowa, d) Funkcja f (x) = ctg x zacieśniona do przedziału (0, π) jest różnowartościowa, ściśle malejąca. 34 Pamiętamy również, że zachodzi Twierdzenie 2.7.3 Dla dowolnej liczby rzeczywistej x suma kwadratów cosinusa i sinusa jest równa jedności, tzn. ∀x ∈ R : cos2 x + sin2 x = 1. Tożsamość tę nazywamy jedynką trygonometryczną. Definicja 2.7.4 Funkcję określoną na przedziale [−1, 1] o wartościach w przedziale − π π π π , odwrotną do zacieśnienia funkcji sinus do przedziału − , , nazywamy arcu, 2 2 2 2 sem sinusem i oznaczamy symbolem x 7→ arc sin x. Definicja 2.7.5 Funkcję określoną na przedziale [−1, 1] o wartościach w przedziale [0, π], odwrotną do zacieśnienia funkcji cosinus do przedziału [0, π], nazywamy arcusem cosinusem i oznaczamy symbolem x 7→ arc cos x. Definicja w przedziale 2.7.6 Funkcję określoną na przedziale (−∞, ∞) o wartościach π π π π − , , odwrotną do zacieśnienia funkcji tangens do przedziału − , , nazy2 2 2 2 wamy arcusem tangensem i oznaczamy symbolem x 7→ arctg x. Definicja 2.7.7 Funkcję określoną na przedziale (−∞, ∞) o wartościach w przedziale (0, π), odwrotną do zacieśnienia funkcji cotangens do przedziału (0, π), nazywamy arcusem cotangensem i oznaczamy symbolem x 7→ arc ctg x. Funkcje: arcus sinus, arcus cosinus, arcus tangens i arcus cotangens nazywamy funkcjami cyklometrycznymi . Uwaga 2.7.8 Funkcje arcus sinus i arcus tangens są ściśle rosnące. Funkcje arcus cosinus i arcus cotangens – ściśle malejące. Ponadto Funkcje arcus sinus i arcus tangens są nieparzyste. Wszystkie te funkcje są ograniczone. π π Ze wzorów redukcyjnych: sin − x = cos x oraz tg − x = ctg x wynika, że 2 2 Uwaga 2.7.9 a) Dla dowolnej liczby −1 ≤ x ≤ 1 zachodzi równość arc cos x = arc sin(−x). π b) Dla dowolnej liczby −∞ < x < ∞ zachodzi równość arc ctg x = + arctg (−x). 2 π + 2 Na koniec podamy jeszcze wartości funkcji cyklometrycznych dla podstawowych argumentów. 35 x arc sin x arc cos x x arctg x arc ctg x 2.8 1 2 π 6 π 3 0 0 π 2 √ √1 3 π 6 π 3 0 0 π 2 √ 2 2 π 4 π 4 3 2 π 3 π 6 1 π 2 0 1 √ 3 π 4 π 4 π 3 π 6 Funkcje hiperboliczne i funkcje area Określimy teraz cztery funkcje, których nazwy są nieprzypadkowo zbieżne z nazwami funkcji trygonometrycznych. Definicja 2.8.1 Niech x ∈ (−∞, +∞). 1 a) Sinusem hiperbolicznym nazywamy funkcję sinh : x 7→ (ex − e−x ). 2 1 b) Cosinusem hiperbolicznym nazywamy funkcję cosh : x 7→ (ex + e−x ). 2 c) Tangensem hiperbolicznym nazywamy funkcję tgh : x 7→ sinh x . cosh x d) Cotangensem hiperbolicznym nazywamy funkcję ctgh : x 7→ 1 . tgh x Wykażmy wpierw tożsamość, którą przez analogię do znanej tożsamości trygonometrycznej, wiążącej wartości funkcji sinus i cosinus, nazwiemy jedynką hiperboliczną. Twierdzenie 2.8.2 Dla dowolnej liczby rzeczywistej różnica kwadratów funkcji hiperbolicznych cosinus i sinus jest równa jedności, tzn. zachodzi równość ∀x ∈ R : cosh2 x − sinh2 x = 1. Dowód. Z definicji funkcji sinh i cosh mamy: 4(cosh2 x − sinh2 x) = (ex + e−x )2 − (ex − e−x )2 = (e2x + 2 + e−2x ) − (e2x − 2 + e−2x ) = 4, stąd ∀x : cosh2 x − sinh2 x = 1. W podobny sposób – wprost z definicji – można wykazać, że zachodzą następujące tożsamości analogiczne do znanych tożsamości trygonometrycznych: cos(x + y) = cos x cos y − sin x sin y. sin(x + y) = sin x cos y + cos x sin y, □ 36 Twierdzenie 2.8.3 Niech x, y będą dowolnymi liczbami rzeczywistymi. Wówczas: a) sinh(x + y) = sinh x cosh y + cosh x sinh y, b) cosh(x + y) = cosh x cosh y + sinh x sinh y. Tożsamości te wykażemy w ramach ćwiczeń do tego modułu. Uwaga 2.8.4 Dla dowolnej liczby rzeczywistej mamy: cosh 2x = cosh2 x + sinh2 x = 2 cosh2 x − 1 = 1 + 2 sinh2 x, sinh 2x = 2 sinh x cosh x. Warto porównać otrzymane wzory z poznanymi w szkole analogicznymi wzorami dla funkcji trygonometrycznych: cos 2x = cosh2 x − sin2 x = 2 cos2 x − 1 = 1 − 2 sin2 x, sin 2x = 2 sin x cos x. Podkreślmy kilka własności funkcji hiperbolicznych. Uwaga 2.8.5 a) Funkcja sinus hiperboliczny jest bijekcją R na R. Jest nieparzysta, ściśle rosnąca. b) Funkcja cosinus hiperboliczny jest określona na R i przyjmuje wartości w przedziale [1, ∞). Jest funkcją parzystą. Nie jest różnowartościowa. Jej zacieśnienie do przedziału [0, ∞) jest funkcją ściśle rosnącą. c) Funkcja tangens hiperboliczny jest bijekcją R na przedział (−1, 1). Jest nieparzysta, ściśle rosnąca. d) Funkcja cotangens hiperboliczny jest bijekcją zbioru (−∞, 0)∪(0, +∞) na zbiór (−∞, −1)∪ (1, +∞). Jest nieparzysta, ściśle malejąca w przedziale (−∞, 0) i w przedziale (0, ∞) . Określmy funkcje odwrotne do funkcji hiperbolicznych. Nazywamy je funkcjami area. Definicja 2.8.6 a) Funkcję odwrotną do funkcji sinus hiperboliczny nazywamy area sinusem hiperbolicznym i oznaczamy x 7→ arsinh x. b) Funkcję odwrotną do zacieśnienia funkcji cosinus hiperboliczny do przedziału [0, ∞) nazywamy area cosinusem hiperbolicznym i oznaczamy x 7→ arcosh x. c) Funkcję odwrotną do funkcji tangens hiperboliczny nazywamy area tangensem hiperbolicznym i oznaczamy x 7→ artgh x. d) Funkcję odwrotną do funkcji cotangens hiperboliczny nazywamy area cotangensem hiperbolicznym i oznaczamy x 7→ arctgh x. Zwróćmy uwagę na tożsamości (kilka podobnych wykażemy w ramach ćwiczeń): 37 Uwaga 2.8.7 Prawdziwe są następujące równości: √ a) cos(arc sin x) = √ 1 − x2 dla |x| ≤ 1, b) cosh(arsinh x) = 1 + x2 dla −∞ < x < ∞. π π Dowód. a) Niech y = arc sin x. Wówczas dla −1 ≤ x ≤ 1 mamy − ≤ y ≤ , czyli 2 2 0 ≤ cos y ≤ 1. Z jedynki trygonometrycznej wynika, że q p cos y = 1 − sin2 y = 1 − x2 . b) Należy powtórzyć powyższe rozumowanie stosując jedynkę hiperboliczną zamiast jedynki trygonometrycznej. Funkcje area można wyrazić także za pomocą logarytmu naturalnego. Twierdzenie 2.8.8 p Zachodzą następujące tożsamości: a) arsinh x = ln(x + px2 + 1) dla −∞ < x < ∞, 2 b) arcosh x = ln(x r + x − 1) dla 1 ≤ x < ∞, 1+x dla −1 < x < 1, c) artgh x = ln r1 − x x+1 d) arctgh x = ln dla |x| > 1. x−1 Dowód. a) Wyznaczamy zmienną y z równania: x = sinh y. Mamy ey − e−y e2y − 1 = . 2 ey √ √ Stąd ey = x + x2 + 1, czyli arsinh x = ln(x + x2 + 1) dla wszystkich −∞ < x < ∞. x = b) Podobnie jak w √ punkcie a) wyznaczamy zmienną √ y z równania x = cosh y i otrzymujemy ey = x + x2 − 1, czyli arcosh x = ln(x + x2 − 1), dla x ≥ 1. 1+x , czyli 1−x r 1 1+x 1+x artgh x = ln = ln 2 1−x 1−x c) Z równania x = artgh x dostajemy e2y = dla |x| < 1. d) Pamiętając, że ctgh x = zmiennej x i otrzymujemy: 1 1 , podstawiamy w poprzedniej tożsamości w miejsce tgh x x s arctgh x = ln 1 + x1 = ln 1 − x1 dla |x| > 1. r x+1 x−1 □ 38 3 Algebra liniowa 3.1 Macierze Definicja 3.1.1 Macierzą A o n-wierszach i m-kolumnach nazywamy tablicę liczb postaci a11 a12 . . . a1m a21 a22 . . . a2m A= . .. .. . . . . . . . . an1 an2 . . . anm Wyraz aij ∈ R(C) jest elementem macierzy znajdującym się w i-tym wierszu i j-tej kolumnie. Powiemy, że macierz A jest wymiaru n × m, zbiór takich macierzy oznaczamy ¯ M(n, m). Uwaga 3.1.2 Bardziej precyzyjnie macierz A ∈ M(n, m) możemy uważać za funkcję A : {1, . . . , n} × {1, . . . , m} → R(C), wtedy A(i, j) = aij . Później wykażemy, że macierze mogą być traktowane jako odwzorowania liniowe między przestrzeniami liniowymi. Uwaga 3.1.3 1. Macierzą kwadratową nazywamy macierz, w której liczba wierszy i kolumn jest taka sama n = m. Zbiór macierzy kwadratowych oznaczamy M(n) = M(n, n). W macierzy kwadratowej wyróżniamy przekątną główną . .. .. . .. . . 2. Macierzą identyczności (jednostkową) nazywamy macierz In ∈ M(n), w której 1, i = j (symbol Kroneckera), tzn. aij = δij = 0, i ̸= j 1 0 ... 0 0 1 ... 0 In = . . . .. . . . . . . . . 0 0 ... 1 3. Macierzą diagonalną (przekątniową) nazywamy macierz D ∈ M(n), w której aij = 0 dla i ̸= j, tzn. a1 0 . . . 0 0 a2 . . . 0 D= . .. . . .. . .. . . . 0 0 39 . . . an 4. Macierzą trójkątną nazywamy macierz T ∈ M(n), w której aij = 0 dla i > j lub aij = 0 dla i < j, tzn. a11 a12 . . . a1n a11 0 . . . 0 0 a22 . . . a2n a21 a22 . . . 0 T = . lub T = . . .. . .. . . . . . . . . . . . . . . . . . 0 0 . . . ann an1 an2 . . . ann 5. Macierzą zerowa nazywamy macierz O ∈ M(n, m), w której aij = 0, tzn. 0 0 ... 0 0 0 ... 0 0= . . . . . .. .. . . .. 0 0 ... 0 Dodawanie macierzy. Definicja 3.1.4 Niech A, B ∈ M(n, m). Wtedy sumę macierzy A + B ∈ M(n, m) definiujemy jako a11 . . . a1m b11 . . . b1m a11 + b11 . . . a1m + b1m .. + .. . . .. = .. .. .. .. A + B = ... . . . . . . . . . an1 . . . anm bn1 . . . bnm an1 + bn1 . . . anm + bnm Przykład 3.1.5 1 2 3 3 4 −5 4 6 −2 0 −1 4 + 0 4 −4 = 0 3 0 . 7 5 −2 −2 0 1 5 5 −1 Obserwacja 3.1.6 Niech A, B, C ∈ M(n, m). Operacja dodawania 1. jest przemienna A + B = B + A; 2. jest łączna A + (B + C) = (A + B) + C; 3. posiada element neutrealny - macierz 0: A + 0 = 0 + A = A. 4. Każda macierz A = [aij ] posiada macierz przeciwną −A = [−aij ]: A + (−A) = (−A) + A = 0. 5. (M(n, m), +) jest grupą przemienną. Mnożenie macierzy przez liczby. 40 Definicja 3.1.7 Niech A ∈ M(n, m) i t ∈ R. Wtedy iloczyn macierzy przez liczbę t · A ∈ M(n, m) definiujemy jako ta11 . . . ta1m a11 . . . a1m .. . .. = .. .. .. t · A = t · ... . . . . . tan1 . . . tanm an1 . . . anm Przykład 3.1.8 1 2 3 4 8 12 4 0 −1 4 = 0 −4 16 . 7 5 −2 28 20 −8 Obserwacja 3.1.9 Niech A, B, C ∈ M(n, m), t, s ∈ R. Wtedy 1. t(A + B) = tA + tB; 2. (t + s)A = tA + sA; 3. s(tA) = (st)A; 4. 1 · A = A; 5. (M(n, m), +.·) jest przestrzenią wektorową (liniową). Mnożenie macierzy. Definicja 3.1.10 Niech A ∈ M(n, m), B ∈ M(m, k). Wtedy iloczyn macierzy AB = C ∈ M(n, k) definiujemy jako a11 . . . a1m b11 . . . b1k c11 . . . c1k .. · .. .. = .. .. = C, .. .. .. A · B = ... . . . . . . . . an1 . . . anm bm1 . . . bmk cn1 . . . cnk gdzie cij = ai1 b1j + ai2 b2j + · · · + aim bmj . Przykład 3.1.11 1 −1 2 0 3 1 1 2 −1 −2 2 = · 0 . −1 5 −1 −1 Obserwacja 3.1.12 Operacja mnożenia 1. nie jest przemienna A · B ̸= B · A; 41 2. jest łączna A · (B · C) = (A · B) · C; 3. posiada element neutralny macierz identyczności: A·Im = In ·A = A, A ∈ M(n, m); 4. jest rozdzielna względem dodawania A(B + C) = AB + AC, (A + B)C = AC + BC. Transponowanie macierzy. Definicja 3.1.13 Niech A ∈ M(n, m). Macierz transponowaną AT = [bij ] ∈ M(m, n) do macierzy A definiujemy jako bij = aji , tzn. a11 .. T A = . an1 T a11 . . . an1 . . . a1m .. . .. = .. .. .. . . . . . a1m . . . anm . . . anm Przykład 3.1.14 T 1 2 3 1 0 7 3 0 −1 4 4 . 7 5 −2 = 2 −1 5 3 4 −2 −5 3 4 −5 Obserwacja 3.1.15 Niech A, B będą macierzami, t ∈ R. Wtedy 1. (AT )T = A; 2. (A + B)T = AT + B T ; 3. (tA)T = tAT ; 4. (AB)T = B T AT ; 5. transponowanie macierzy kwadratowej, prowadzi do macierzy kwadratowej i polega na symetrycznym odbiciu jej wyrazów względem przekątnej głównej; 6. InT = In ; 7. jeżeli D jest macierzą diagonalną, to DT = D; 8. transponowanie macierzy trójkątnej prowadzi do macierzy trójkątnej. Wyznacznik macierzy. 42 Definicja 3.1.16 Wyznacznikiem macierzy kwadratowej A = [aij ] ∈ M(n) nazywamy liczbę X det A = sgn (σ)a1σ(1) a2σ(2) . . . anσ(n) , σ∈Σn gdzie Σn jest zbiorem permutacji n-elementowych, sgn (σ) jest znakiem permutacji σ. Metody obliczania wyzaczników Reguła Sarrusa Reguła Sarrusa ma zastosowanie tylko dla n = 1, 2, 3. n = 1 Wtedy det[a] = a. n = 2 Wtedy wyznacznik jest równy różnicy iloczynu wyrazów na przekątnej głównej i wyrazów na "innej" przekątnej a b a b = ad − bc. = det c d c d n = 3 Wtedy dopisujemy z prawej strony wyznacznika dwie pierwsze kolumny (lub dopisujemy pod spodem dwa pierwsze wiersze). W ten sposób otrzymamy trzy przekątne główne i trzy "inne" przekątne. Wyznacznik jest równy sumie iloczynów wyrazów na przekątnych wziętych ze znakiem plus na przekątnych głównych i ze znakiem minus na "innych" przekątnych. a b c a b c a b x y = (ayγ + bzα + cxβ) − (cyα + azβ + bxγ). det x y z = x y z α β γ α β γ α β Przykład 3.1.17 1 2 3 det 0 −3 3 = 1 −1 1 1 2 3 0 −3 3 1 −1 1 1 2 0 −3 = −3 + 6 + 0 − (−9 − 3 + 0) = 15 1 −1 Rozwinięcie Laplace’a Definicja 3.1.18 Niech A ∈ M(n, m) i niech 1 ≤ k ≤ min(n, m). Wybierzmy z macierzy A k kolumn i k wierszy i z wyrazów stojących na ich przecięciu utwórzmy macierz B. Wyznacznik det B nazywamy minorem stopnia k macierzy A. 43 Przykład 3.1.19 W poniższej macierzy 1 2 3 0 −3 3 A= 1 −1 1 3 4 7 wybierzmy pierwszy i trzeci wiersz oraz drugą i trzecią kolumnę. Wtedy det B = 2 3 −1 1 =2+3=5 jest minorem stopnia 2 macierzy A. Definicja 3.1.20 Niech A ∈ M(n) będzie macierzą kwadratową. Wybierzmy dowolny wyraz aij macierzy A. Skreślmy z macierzy A i-wiersz i j-ta kolumę w ten sposób otrzymamy macierz Bij . Dopełnieniem algebraicznym wyrazu aij nazywamy Aij = (−1)i+j det Bij . Twierdzenie 3.1.21 (Rozwinięcie Laplace’a) Niech A ∈ M(n). Wtedy 1. dla dowolnego i = 1, . . . , n det A = ai1 Ai1 + ai2 Ai2 + · · · + ain Ain (rozwinięcie względem i-tego wiersza); 2. dla dowolnego j = 1, . . . , n det A = a1j A1j + a2j A2j + · · · + anj Anj (rozwinięcie względem j-tej kolumny). Przykład 3.1.22 Poniższy wyznacznik rozwiniemy względem trzeciego wiersza. 1 1 1 2 1 0 0 1 2 −1 0 0 1 3 −1 0 0 · (−1)3+3 = 1 · (−1)3+1 1 1 0 1 1 −1 2 3 0 1 0 0 1 2 −1 3 −1 0 + 1 · (−1)3+4 + 0 · (−1)3+2 1 1 0 1 1 2 2 3 −1 = −1 + 0 + 0 + 2 = 1. Metoda przekształceń elementarnych Obserwacja 3.1.23 Niech A, B ∈ M(n), t ∈ R. 1. det A = det(AT ); 44 1 0 0 1 2 −1 + 2 −1 0 2. det(AB) = det A det B; 3. det(tA) = tn det A; 4. det In = 1; 5. Wyznacznik macierzy diagonalnej jest równy iloczynowi wyrazów na przekątnej głównej a1 0 . . . 0 0 a2 . . . 0 det . .. . . .. = a1 a2 . . . an . .. . . . 0 0 . . . an 6. Wyznacznik macierzy trójkątnej jest równy iloczynowi wyrazów na przekątnej głównej a11 a12 . . . a1n 0 a22 . . . a2n det . .. .. = a11 a22 . . . ann ; .. .. . . . 0 0 . . . ann 7. Przestawienie dwóch kolumn wyznacznika zmienia wartość wyznacznika na przeciwną. 8. Pomnożenie kolumny wyznacznika przez pewną liczbę powoduje pomnożenie wartości wyznacznika przez tę liczbę. 9. Jeżeli do kolumny wyznacznika dodamy a) inną kolumnę tego wyznacznika lub, b) inną kolumnę tego wyznacznika pomożoną przez pewną liczbę lub, c) dowolna kombinację liniową innych kolumn tego wyznacznika, to wartość wyznacznika nie ulegnie zmianie. 10. Jeżeli wyznacznik zawiera a) kolumnę zerową lub b) dwie identyczne kolumn, to wyznacznik jest równy zero. 11. Własności opisane w punktach (7)-(10) są również prawdziwe dla wierszy wyznacznika. 12. Metoda przekształceń elementarnych. Każdą macierz kwadratową można sprowadzić za pomocą przekształceń elementarnych opisanych w punktach (7)-(11) do macierzy diagonalnej (jeżeli det A ̸= 0, to do macierzy identyczności). 45 Przykład 3.1.24 1 1 1 2 − − 1 0 0 1 2 −1 0 0 1 3 −1 0 W2 − W1 = W3 − W1 W4 − 2W1 1 1 0 0 0 1 −1 0 0 −1 0 1 0 0 2 −1 1 0 0 0 1 0 0 1 −1 0 0 −1 1 0 0 1 W3 + W2 1 1 0 0 0 0 2 −1 0 −1 0 1 0 1 −1 0 1 0 =− 0 0 = W4 ↔ W2 1 0 0 1 −1 0 0 −1 1 0 2 −1 = W4 + 2W3 = −(1 · 1 · (−1) · 1) = 1. Odwracanie macierzy. Definicja 3.1.25 Macierz A ∈ M(n) nazywamy odwracalną, gdy posiada macierz odwrotną A−1 ∈ M(n) taką, że AA−1 = In i A−1 A = In . Jeżeli det A ̸= 0, to A nazywamy macierzą nieosobliwą, jeżeli natomiast det A = 0, to A nazywamy macierzą osobliwą. Twierdzenie 3.1.26 Niech A ∈ M(n). Macierz A jest odwracalna wtedy i tylko wtedy, gdy A jest nieosobliwa. Wtedy T A11 . . . A1n 1 . .. . .. A−1 = .. . . det A An1 . . . Ann Przykład 3.1.27 Niech 1 1 −1 0 , A= 2 1 1 −1 1 wtedy det A = 2. Mamy również A11 = (−1)1+1 1 0 −1 1 A21 = (−1)2+1 1 −1 −1 1 A31 = (−1)3+1 1 −1 1 0 = 1, A12 = (−1)1+2 = 0, A22 = (−1)2+2 = 1, A32 = (−1)3+2 46 2 0 1 1 = −2, A13 = (−1)1+3 1 −1 1 1 1 −1 2 0 2 1 1 −1 = −3, = 2, A23 = (−1)2+3 1 1 1 −1 = 2, = −2, A33 = (−1)3+3 1 1 2 1 = −1. Wtedy T 1 1 −2 −3 0 12 2 1 2 = −1 1 −1 . A−1 = 0 2 2 1 −2 −1 − 32 1 − 12 Obserwacja 3.1.28 Niech A, B ∈ M(n) będą macierzami nieosobliwymi, t ̸= 0. Wtedy 1. (A−1 )−1 = A; 2. det(A−1 ) = det1 A ; 3. (AT )−1 = (A−1 )T ; 4. (tA)−1 = 1t A−1 ; 5. (AB)−1 = B −1 A−1 ; 6. In−1 = In ; 7. jeżeli D jest macierzą diagonalną nieosobliwą, to −1 1 a1 0 . . . 0 a1 0 a2 . . . 0 0 D−1 = . .. . . .. = .. .. . . . . 0 0 . . . an 0 0 1 a2 .. . 0 ... ... .. . ... 0 0 .. . 1 an . Przykład 3.1.29 Metoda Gaussa odwracania macierzy polega na obserwacji, że te same przekształcenia elementarne, które przekształcają daną macierz A w macierz identyczności In jednocześnie przekształcają macierz identyczności In w macierz odwrotną A−1 . . . −1 .. 1 0 0 1 1 −1 .. 1 0 0 .. .. W2 − 2W1 ⇝ ⇝ [A|In ] = 2 1 0 . 0 1 0 0 −1 2 . −2 1 0 W3 − W1 W3 − 2W2 .. .. 1 −1 1 . 0 0 1 0 −2 2 . −1 0 1 .. . 1 1 1 0 0 1 − 1 1 0 . − 1 1 −1 .. 1 2 2 W1 + W2 W1 − 2 W3 .. .. W2 + W3 ⇝ 0 −1 0 . 1 −1 1 0 −1 2 . −2 1 0 ⇝ . . 0 0 −2 .. 3 −2 1 0 0 −2 .. 3 −2 1 . . 1 0 0 .. 12 0 12 1 0 0 .. 12 0 12 .. .. −1 0 −1 0 . 1 −1 1 = (−1) · (−2) 0 1 0 . −1 1 −1 = det A[In |A ]. . . 0 0 −2 .. 3 −2 1 0 0 1 .. − 23 1 − 12 1 1 47 3.2 Cramerowskie układy równań liniowych. W szkole średniej poznaliśmy następujące metody rozwiązywania równań liniowych: metoda podstawiania i metoda przeciwnych współczynników. W tym wykładzie nie będziemy omawiać tych metod. Przedtawimy metodę Cramera rozwiązywania za pomocą wyznaczników układu równań liniowych. Chcemy rozwiązać poniższy układ n równań liniowych o n zmiennych x1 , . . . , xn : a11 x1 + a12 x2 + · · · + a1n xn = b1 ................................. . (3.2.1) an1 x1 + an2 x2 + · · · + ann xn = bn Macierz A ∈ M(n) utworzoną ze współczynników powyższego układu równań nazywamy macierzą główną układu równań a11 . . . a1n .. , .. A = ... . . an1 . . . ann macierze utworzone z wyrazów wolnych bj i ze zmiennych xj nazywamy odpowiednio kolumną wyrazów wolnych i kolumną zmiennych b1 x1 B = ... , X = ... . bn xn Zauważmy, że Cramerowski układ równań liniowych (3.2.1) jest równoważny z poniższym równaniem macierzowym AX = B. Powyższe równanie możemy rozwiązać (pod warunkiem, że macierz A jest nieosobliwa) mnożąc przez macierz odwrotną A−1 z lewej strony równania X = A−1 B. Jest to pierwszy sposób rozwiązania Cramerowskiego układu równań liniowych. Metoda ta niestety nie działa dla macierzy osobliwych. Teraz podamy metodę Cramera rozwiązywania układów równań liniowych. Zdefiniujmy wyznaczniki Cramera b1 . . . a1n a11 . . . b1 .. , . . . , det A = det .. . .. det A1 = det ... . . . . n . .. . . bn . . . ann an1 . . . bn Zauważmy, że macierze Cramera A1 , . . . , An powstają poprzez zastąpienie kolejnych kolumn macierzy A kolumną wyrazów wolnych B. Poniższe twierdzenie podaje sposób rozwiązania równania liniowego za pomocą wyznaczników Cramera. 48 Twierdzenie 3.2.1 (Twierdzenie Cramera) Cramerowski układ równań liniowych (3.2.1): 1. ma dokładnie jedno rozwiązanie (jest oznaczony) wtedy i tylko wtedy, gdy det A ̸= 0. Wtedy rozwiązania tego układu są dane wzorami x1 = det A1 det An , . . . , xn = ; det A det A 2. nie ma rozwiązań (jest sprzeczny), gdy det A = 0 i istnieje k ∈ {1, . . . , n} takie, że det Ak ̸= 0; 3. ma nieskończenie wiele rozwiązań (jest nieoznaczony) lub jest sprzeczny, gdy det A = det A1 = · · · = det An = 0. Przykład 3.2.2 Rozwiążmy poniższy układ równań metodą Cramera. x + 2y + 3z = 14 3x + y + 2z = 11 . 2x + 3y + z = 11 Mamy 1 2 3 14 x A = 3 1 2 , B = 11 , X = y , 2 3 1 11 z Policzmy wyznaczniki det A = 18 i wyznaczniki Cramera det Ax = 14 2 3 11 1 2 11 3 1 = 18, det Ay = 1 14 3 3 11 2 2 11 1 = 36, det Az = 1 2 14 3 1 11 2 3 11 = 54. Rozwiązaniami są x= det Ay 18 36 det Az 54 det Ax = = 1, y = = = 2, z = = = 3. det A 18 det A 18 det A 18 Metoda Cramera jest bardzo skuteczna przy rozwiązywaniu układ równań liniowych z parametrem. Przykład 3.2.3 Rozwiążmy poniższy układ równań liniowych z parametrem k. 2x − (k + 3)y = 3 . kx + y = 5k Mamy A= 2 −k − 3 k 1 Policzmy wyznaczniki det A = k 2 + 3k + 2. 49 , B= 3 5k . 1. Jeżeli k ̸= −1 i k ̸= −2, to det A ̸= 0 i układ równań jest oznaczony, wyznaczniki Cramera są równe det Ax = 3 −k − 3 5k 1 Rozwiązaniami są x= = 5k 2 + 15k + 3, det Ay = 2 3 k 5k = 7k. 5k 2 + 15k + 3 7k , y= 2 . k 2 + 3k + 2 k + 3k + 2 2. Jeżeli k = −1, to det A = 0 i det Ay = −7 ̸= 0, czyli układ jest sprzeczny. 3. Jeżeli k = −2, to det A = 0 i det Ay = −14 ̸= 0, czyli układ jest sprzeczny. Przykład 3.2.4 Rozwiążemy teraz układ równań metodą Gaussa. x + 2y + 3z = 14 R1 + 2R3 x + 2y + 3z = 14 −5y − 7z = −31 R2 − 5R3 ⇝ 3x + y + 2z = 11 R2 − 3R1 ⇝ −y − 5z = −17 2x + 3y + z = 11 R3 − 2R1 x − 7z = −20 x − 21 = −20 x=1 18z = 54 z=3 z=3 . ⇝ ⇝ −y − 5z = −17 −y − 15 = −17 y=2 Interpretacja geometryczna układów równań. Równanie liniowe geometrycznie opisuję prostą (dla n = 2) i płaszczyznę dla n = 3 (w wyższych wymiarach jest to hiperpłaszczyzna). Układ dwóch równań z dwiema niewiadomymi 1. oznaczony odpowiada dwóm prostym przecinającym się na płaszczyźnie; 2. nieoznaczony odpowiada jednej (podwójnej prostej) na płaszczyźnie; 3. sprzeczny odpowiada dwóm prostym równoległym na płaszczyźnie. 3.3 Rząd macierzy Definicja 3.3.1 Niech A ∈ M(n, m). Rzędem macierzy A nazywamy stopień największego niezerowego minora macierz A. Rząd macierzy A oznaczamy r(A) (rank A). Przykład 3.3.2 Niech 1 2 1 4 A = 0 1 −1 3 . 2 5 1 11 50 Z macierzy A można wybrać cztery minory stopnia trzy: 2 1 4 1 −1 3 5 1 11 = 1 1 4 0 −1 3 2 1 11 = 1 2 4 0 1 3 2 5 11 = 1 2 1 0 1 −1 2 5 1 = 0, z czego wynika, że r(A) nie może być równy trzy. Łatwo jest wybrać niezerowy minor stopnia dwa 1 2 = 1 ̸= 0, 0 1 z czego wynika, że r(A) = 2. Obserwacja 3.3.3 Niech A ∈ M(n, m), t ̸= 0. Wtedy 1. 0 ≤ r(A) ≤ min(n, m); 2. r(A) = 0 wtedy i tylko wtedy, gdy A = 0; 3. r(AT ) = r(A); 4. r(tA) = r(A); 5. jeżeli A ∈ M(n), to r(A) = n wtedy i tylko wtedy, gdy det A ̸= 0. 6. Następujące operacje nie zmieniają rzędu macierzy a) przestawienie dwóch kolumn (wierszy) macierzy; b) pomnożenie kolumny (wiersza) macierzy przez liczbę różną od zera; c) dodanie do kolumny (wiersza) macierzy innej kolumny (innego wiersza); d) dodanie do kolumny (wiersza) macierzy kombinacji liniowej innych kolumn (wierszy). Przykład 3.3.4 1 2 1 4 1 2 1 4 rank 0 1 −1 3 = rank 0 1 −1 3 = 2 5 1 11 W3 − 2W1 0 1 −1 3 W3 − W2 1 2 1 4 1 2 1 4 rank 0 1 −1 3 = rank = 2. 0 1 −1 3 0 0 0 0 51 3.4 Układy równań liniowych Chcemy rozwiązać poniższy układ m równań liniowych o n zmiennych x1 , . . . , xn : a11 x1 + a12 x2 + · · · + a1n xn = b1 ................................. . (3.4.1) am1 x1 + am2 x2 + · · · + amn xn = bm Macierz A ∈ M(m, n) utworzoną ze współczynników powyższego układu równań nazywamy macierzą główną układu równań a11 . . . a1n .. , .. A = ... . . am1 . . . amn macierze utworzone z wyrazów wolnych bj i ze zmiennych xj nazywamy odpowiednio kolumną wyrazów wolnych i kolumną zmiennych b1 x1 B = ... , X = ... . bm xn Zauważmy, że układ równań liniowych (3.4.1) jest równoważny z poniższym równaniem macierzowym AX = B. Do rozwiązania tego układu równań potrzebna nam będzie macierz rozszerzona układu równań a11 . . . a1n b1 .. .. . .. D = [A|B] = ... . . . am1 . . . amn bm Zauważmy, że zawsze r(D) ≥ r(A). Twierdzenie 3.4.1 (Twierdzenie Kroneckera-Capellego) Układ równań (3.4.1) jest 1. oznaczony wtedy i tylko wtedy, gdy r(A) = r(D) = n; 2. nieoznaczony wtedy i tylko wtedy, gdy r(A) = r(D) < n, w tym przypadku rozwiązania zależą od n − r(A) liczby parametrów; 3. sprzeczny wtedy i tylko wtedy, gdy r(A) < r(D). Uwaga 3.4.2 Jeżeli w układzie równań jest więcej zmiennych niż równań, to układ nie może być oznaczony. Na przykładzie pokażemy jak rozwiązywać efektywnie układy równań korzystając z twierdzeń Cramera i Kroneckera-Capellego. 52 Przykład 3.4.3 Rozwiązać układ równań 2x − 4y + 8z − 6u = 7 . 5x − 10y + 20z = 12 Mamy A= 2 −4 8 −6 5 −10 20 0 , D= 2 −4 8 −6 7 5 −10 20 0 12 . Zauważmy, że r(A) = r(D) = 2, gdyż minor stojący na przecięciu pierwszego i drugiego wiersza oraz trzeciej i czwartej kolumny jest równy 120. Z tego wynika, że układ równań jest nieoznaczony, a rozwiązania zależą od 4 − r(A) = 2 parametrów. Aby móc zastosować twierdzenie Cramera musimy przekształcić nasz układ równań. Do wyznaczenia maksymalnego niezerowego minora wybraliśmy kolumny trzecią i czwartą. Kolumny te odpowiadają zmiennym z i u - to będą nasze nowe zmienne. Natomiast x i y będą parametrami. Dostajemy następujący układ dwóch równań z dwoma zmiennymi z, u i dwoma parametrami x, y: 8z − 6u = 7 − 2x + 4y . 20z = 12 − 5x + 10y Macierz główna i kolumna wyrazów wolnych są równe 8 −6 7 − 2x + 4y . à = , B̃ = 12 − 5x + 10y 20 0 Mamy det à = 120 oraz det Ãz = 7 − 2x + 4y −6 12 − 5x + 10y 0 = 72−30x+60y, det Ãu = 8 7 − 2x + 4y 20 12 − 5x + 10y = −44. W końcu otrzymujemy z= 72 − 30x + 60y 44 , u=− , x, y − parametry. 120 120 Uwaga 3.4.4 1. Zauważmy, że przy rozwiązywaniu poprzedniego układu równań mogliśmy wybrać inny minor, np. wybrany z drugiej i czwartej kolumny. Wtedy nowymi zmiennymi byłyby y i u, zaś x i z byłyby parametrami. W ten sposób dostaniemy "inne" rozwiązanie. Zbiór rozwiązań w tym przypadku jest taki sam, ma tylko inny opis parametryczny. 2. Jeżeli przy rozwiązywaniu jakiegoś układu równań przy znajdowaniu maksymalnego minora nie uwzględniliśmy jakiegoś wiersza, to równanie odpowiadające temu wierszowi możemy skreślić, pominąć. Ono nie wnosi żadnej nowej informacji do tego układu równań. 53 3.5 Przestrzenie wektorowe W rozdziale będziemy rozważać przestrzenie wektorowe nad ciałem R, tzn. zbiory wyposażone w dwa działania: dodawania wektorów i mnożenia wektorów przez liczby rzeczywiste. W naszych rozważaniach skupimy się na przestrzeniach euklidesowych rzeczywistych (i zespolonych) Rn (Cn ), ale większość faktów jest również prawdziwa dla dowolnych przestrzeni wektorowych. Definicja 3.5.1 W przestrzeni Rn określamy działania 1. dodawania, dla x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn x + y = (x1 + y1 , . . . , xn + yn ) ∈ Rn ; 2. mnożenia przez liczby, dla x = (x1 , . . . , xn ) ∈ Rn , t ∈ R tx = (tx1 , . . . , txn ) ∈ Rn . Przestrzeń (Rn , +, ·) jest przestrzenią wektorową. Elementem neutralnym dodawania jest wektor zerowy 0 = (0, . . . , 0). Uwaga 3.5.2 Przestrzeń Rn możemy utożsamić z przestrzenią macierzy M(1, n) lub M(n, 1) i dlatego czasami dla wygody będziemy zapisywać wektory z przestrzeni Rn w postaci x1 x = (x1 , . . . , xn ) = x1 . . . xn = ... . xn Definicja 3.5.3 Normą (długością) wektora x = (x1 , . . . , xn ) ∈ Rn nazywamy q ||x|| = x21 + · · · + x2n . Obserwacja 3.5.4 Niech x, y ∈ Rn , t ∈ R. Wtedy 1. ||x|| ≥ 0; 2. ||x|| = 0 wtedy i tylko wtedy, gdy x = 0; 3. ||tx|| = |t|||x|| (jednorodność); 4. ||x + y|| ≤ ||x|| + ||y|| (nierówność trójkąta). Uwaga 3.5.5 W dowolnej przestrzeni wektorowej X każde odwzorowanie || · || : X → [0, +∞) spełniające warunki (1)-(4) nazywamy normą. Definicja 3.5.6 Iloczynem skalarnym wektorów x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn nazywamy ⟨x, y⟩ = x1 y1 + · · · + xn yn 54 Obserwacja 3.5.7 Niech x, y, z ∈ Rn , t, s ∈ R. Wtedy 1. ⟨x, x⟩ ≥ 0; 2. ⟨x, x⟩ = 0 wtedy i tylko wtedy, gdy x = 0; 3. ⟨x, y⟩ = ⟨y, x⟩ (symetria); 4. ⟨tx + sy, z⟩ = t ⟨x, z⟩ + s ⟨y, z⟩ (liniowość). Uwaga 3.5.8 W dowolnej przestrzeni wektorowej X każde odwzorowanie ⟨·, ·⟩ : X × X → R spełniające warunki (1)-(4) nazywamy iloczynem skalarnym. Uwaga 3.5.9 Zauważmy, że w dowolnej przestrzeni wektorowej X każdy iloczyn skalarny definiuje normę p ||x|| = ⟨x, x⟩. Wszystkie warunki są oczywiste, za wyjątkiem nierówności trójkąta która wynika z nierówności Cauchy’eo-Schwarza (⟨x, y⟩)2 ≤ ⟨x, x⟩ ⟨y, y⟩ lub równoważnie | ⟨x, y⟩ | ≤ ||x|||y||. Definicja 3.5.10 Korzystając z iloczynu skalarnego można zdefiniować kąt α(x, y) między wektorami x, y ∈ Rn \ {0} jako cos(α(x, y)) = ⟨x, y⟩ . ||x||||y|| Mówimy, że wektory są prostopadłe (ortogonalne) x ⊥ y, gdy α(x, y) = π2 , tzn. ⟨x, y⟩ = 0. Mówimy, że wektory są równoległe x ∥ y, gdy α(x, y) = 0. Definicja 3.5.11 Iloczynem wektorowym wektorów u = (u1 , u2 , u3 ), v = (v1 , v2 , v3 ) ∈ R3 wektor u × v o długości ||u||||v|| sin(α(u, v)) prostopadły do płaszczyzny, w której leżą u i v i taki, że u, v, u × v jest trójką dodatnio zorientowaną. Iloczyn wektorowy jest równy e1 e2 e3 u × v = det u1 u2 u3 v1 v2 v3 = (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ), gdzie e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1). Przykład 3.5.12 Niech u = (1, 0, 2) i v = (−2, 2, 1). Wtedy ||u|| = 0, czyli wektory są prostopadłe. Ponadto e1 e2 e3 0 2 u × v = det 1 −2 2 1 √ 5, ||v|| = 3, ⟨u, v⟩ = = −4e1 − 5e2 + 2e3 = (−4, −5, 2). 55 3.6 Baza przestrzeni wektorowej Definicja 3.6.1 Mówimy, że wektory v1 , . . . , vk ∈ Rn są liniowo zależne, gdy istnieją liczby x1 , . . . , xk nie wszystkie równe zero takie, że x1 v1 + · · · + xk vk = 0. W przeciwnym razie mówimy, że wektory są liniowo niezależne, tzn. x1 v1 + · · · + xk vk = 0 ⇒ x1 = · · · = xk = 0. (3.6.1) Przykład 3.6.2 Wektory v1 = (1, 2), v2 = (1, 0), v3 = (0, −1) są liniowo zależne, bo v1 − v2 + 2v3 = 0. Niech v1 = (v11 , . . . , vn1 ), . . . , vk = (v1k , . . . , vnk ). Wtedy warunek (3.6.1) jest równoważny z układem równań v11 x1 + · · · + v1k xk = 0 ........................ . (3.6.2) vn1 x1 + · · · + vnk xk = 0 Liniowa niezależność oznacza, że układ równań (3.6.2) ma tylko rozwiązanie zerowe. Niech V będzie macierzą utworzoną z wektorów v1 , . . . , vk : v11 . . . v1k .. . .. V = [v1 . . . vk ] = ... . . vn1 . . . vnk Z Twierdzenia Kroneckera-Capellego wynika następująca obserwacja. Obserwacja 3.6.3 1. Jeżeli k > n, to wektory v1 , . . . , vk są liniowo zależne. 2. Jeżeli k ≤ n, to wektory v1 , . . . , vk są liniowo niezależne wtedy i tylko wtedy, gdy r(V ) = k. Definicja 3.6.4 Mówimy, że wektory v1 , . . . , vk ∈ Rn generują Rn , gdy dla dowolnego b ∈ Rn istnieją liczby x1 , . . . , xk takie, że x1 v1 + · · · + xk vk = b. (3.6.3) Niech v1 = (v11 , . . . , vn1 ), . . . , vk = (v1k , . . . , vnk ). Wtedy warunek (3.6.3) jest równoważny z układem równań v11 x1 + · · · + v1k xk = b1 ........................ . (3.6.4) vn1 x1 + · · · + vnk xk = bn 56 Generowanie przestrzeni Rn oznacza, że układ równań (3.6.4) ma rozwiązanie dla dowolnego b ∈ Rn . Niech V będzie macierzą utworzoną z wektorów v1 , . . . , vk : v11 . . . v1k .. . .. V = [v1 . . . vk ] = ... . . vn1 . . . vnk Z Twierdzenia Kroneckera-Capellego wynika następująca obserwacja. Obserwacja 3.6.5 1. Jeżeli k < n, to wektory v1 , . . . , vk nie generują przestrzeni Rn . 2. Jeżeli k ≥ n, to wektory v1 , . . . , vk generują Rn wtedy i tylko wtedy, gdy r(V ) = n. Definicja 3.6.6 Mówimy, że wektory v1 , . . . , vk ∈ Rn tworzą bazę Rn , gdy są liniowo niezależne i generują Rn . Obserwacja 3.6.7 Wektory v1 , . . . , vk tworzą bazę Rn wtedy i tylko wtedy, gdy n = k oraz det V ̸= 0. Definicja 3.6.8 Powiemy, że baza {v1 , . . . , vn } w Rn jest • otogonalna, gdy ⟨vj , vk ⟩ = 0, j ̸= k, • ortonormalna, gdy ⟨vj , vk ⟩ = δj,k . Przykład 3.6.9 Bazą kanoniczną w Rn nazywamy układ wektorów e1 = (1, 0, . . . , 0), e2 = (0, 1, 0 . . . , 0), . . . , en = (0, . . . , 0, 1). Zauważmy również, że In = [e1 e2 . . . en ] oraz dla dowolnego b = (b1 , . . . , bn ) ∈ Rn mamy b = b1 e1 + b2 e2 + · · · + bn en . Baza kanoniczna jest ortonormalna. Przykład 3.6.10 Wektory v1 = (1, 1, 1), v2 = (1, 1, 0) i v3 = (1, 0, 0) tworzą bazę R3 , gdyż 1 1 1 det V = det 1 1 0 = −1 ̸= 0. 1 0 0 Ponadto dla dowolnego b = (b1 , b2 , b3 ) ∈ R3 mamy b = b3 v1 + (b2 − b3 )v2 + (b1 − b2 )v3 . Ta baza nie jest ortogonalna. 57 3.7 Odwzorowania liniowe Definicja 3.7.1 Odwzorowanie f : Rm → Rn nazywamy odwzorowaniem liniowym, gdy ∀ x, y ∈ Rm : f (x + y) = f (x) + f (y); ∀ x ∈ Rm ∀ t ∈ R : f (tx) = tf (x). Innymi słowy odwzorowania liniowe zachowują strukturę przestrzeni wektorowych. Odwzorowanie g : Rm → Rn nazywamy odwzorowaniem afinicznym, gdy istnieje f odwzorowanie liniowe i v ∈ Rn takie, że g(x) = f (x) + v. Przykład 3.7.2 1. Odwzorowanie f1 : R3 → R3 dane wzorem f1 (x, y, z) = (x + y, z − 4x, 7y + 4z) jest liniowe; 2. Odwzorowanie f2 : R3 → R dane wzorem f2 (x, y, z) = 3x − 5y + 10z jest liniowe; 3. Odwzorowanie f3 : R → R4 dane wzorem f3 (x) = (2x, 4x, 0, −x) jest liniowe; 4. Odwzorowanie f4 : R2 → R2 dane wzorem f4 (x, y) = (x, 3) nie jest liniowe, jest afiniczne; 5. Odwzorowanie f5 : R3 → R3 dane wzorem f5 (x, y, z) = (x2 , z 3 − y 2 , sin(2xyz)) nie jest liniowe; 6. Każde odwzorowanie liniowe f : R → R jest postaci f (x) = ax. Pokażemy, że każde odwzorowanie liniowe f : Rm → Rn jest dane przez pewną macierz A ∈ M(n, m). Niech A ∈ M(n, m), wtedy można zdefiniować odwzorowanie liniowe fA : Rm → Rn wzorem x1 fA (x) = A · ... . xm 58 Liniowość wynika z własności dodawania i mnożenia macierzy przez liczby. Odwrotnie, niech f : Rm → Rn będzie odwzorowaniem liniowym. Niech e1 , . . . , em bazą w przestrzeni Rm . Wtedy f (x) = f (x1 e1 + · · · + xm em ) = x1 f (e1 ) + · · · + xm f (em ). Niech f (e1 ) = (a11 , . . . , an1 ), . . . , f (ej ) = (a1j , . . . , anj ), . . . , f (em ) = (a1m , . . . , anm ), wtedy Przykład 3.7.3 a11 . . . a1m .. . .. Af = f (e1 ) . . . f (em ) = ... . . an1 . . . anm 1. f1 (x, y, z) = (x + y, z − 4x, 7y + 4z) f1 (e1 ) = (1, −4, 0), f1 (e2 ) = (1, 0, 7), f1 (e3 ) = (0, 1, 4) 1 1 0 A1 = −4 0 1 . 0 7 4 2. f2 (x, y, z) = 3x − 5y + 10z f2 (e1 ) = 3, f2 (e2 ) = −5, f2 (e3 ) = 10 A2 = 3 −5 10 . 3. f3 (x) = (2x, 4x, 0, −x) f3 (e1 ) = (2, 4, 0, −1) 2 4 A3 = 0 . −1 Uwaga 3.7.4 Zauważmy, że dodawanie macierzy odpowiada dodawaniu funkcji; mnożenie macierzy przez liczby odpowiada mnożeniu funkcji przez liczby; mnożenie macierzy odpowiada składanie funkcji; odwracanie macierzy odpowiada szukaniu funkcji odwrotnej. 59 3.8 Wartości i wektory własne macierzy Definicja 3.8.1 Niech A ∈ M(n) będzie macierzą kwadratową. Mówimy, że s ∈ C jest wartością własną macierzy A a wektor v ∈ Cn \ {0} jest wektorem własnym odpowiadającym wartości własnej s, gdy (3.8.1) Av = sv. Niech A = [aij ] i v = (v1 , . . . , vn ), wtedy warunek (3.8.1) jest równoważny z równaniem macierzowym (A − sIn )v = 0, które jest z kolei równoważne z faktem, że układ równań (a11 − s)v1 + · · · + a1n vn = 0 ........................ an1 v1 + · · · + (ann − s)vn = 0 ma rozwiązanie niezerowe, tzn. det(A − sIn ) = 0. Równanie det(A − sIn ) = 0 nazywamy równaniem charakterystycznym macierzy A. Przykład 3.8.2 Niech 1 −2 2 A = 1 −1 3 0 0 1 Wtedy 1−s −2 2 1 −1 − s 3 det(A − sI3 ) = det 0 0 1−s = −(s − 1)(s − i)(s + i), czyli {1, i − i} są wartościami własnymi macierzy A. Znajdziemy teraz wektory własne odpowiadające tym wartościom własnym. Dla s1 = 1 mamy następujący układ równań 0v1 − 2v2 + 2v3 = 0 v1 − 2v2 + 3v3 = 0 , 0v1 + 0v2 + 0v3 = 0 którego rozwiązaniem jest na przykład wektor v = (−1, 1, 1). Podobnie dla s2 = i mamy następujący układ równań (1 − i)v1 − 2v2 + 2v3 = 0 v1 − (1 + i)v2 + 3v3 = 0 , 0v1 + 0v2 + (1 − i)v3 = 0 którego rozwiązaniem jest na przykład wektor v = (2, 1 − i, 0). Teraz zauważmy, że jeżeli A jest macierzą rzeczywista o wartości własnej zespolonej s i wektorze własnym v, to również s̄ jest wektorem własnym o wektorze własnym v̄. Dla tego wektorem własnym dla s = −i jest wektor v̄ = (2, 1 + i, 0). 60 Na koniec podamy twierdzenie Caleya-Hamiltona, które mówi, że każda macierz spełnia swoje równanie charakterystyczne. Twierdzenie 3.8.3 Niech A ∈ M(n) i niech det(A − sIn ) = (−1)n sn + pn−1 sn−1 + · · · + p1 s + p0 , gdzie p0 = det A będzie jej równaniem charakterystycznym. Wtedy (−1)n An + pn−1 An−1 + · · · + p1 A + p0 In = 0. W szczególności, jeżeli det A ̸= 0, to A−1 = − 3.9 1 p1 In + p2 A + · · · + (−1)n An−1 . det A Specjalne typy macierzy Definicja 3.9.1 Mówimy, że macierz kwadratowa A ∈ M(n) jest 1. macierzą symetryczną, gdy AT = A; 2. macierzą antysymetryczną, gdy AT = −A; 3. macierzą ortogonalną, gdy AAT = In . Obserwacja 3.9.2 Niech A, B ∈ M(n), t ∈ R. Wtedy 1. jeżeli A, B są macierzami symetrycznymi, to AT , tA, A + B, A−1 (o ile istnieje) są macierzami symetrycznymi; 2. jeżeli A, B są macierzami antysymetrycznymi, to AT , tA, A + B, A−1 (o ile istnieje) są macierzami antysymetrycznymi; 3. jeżeli A jest macierzą antysymetryczną i n jest liczbą nieparzystą, to det A = 0; 4. jeżeli A jest macierzą otogonalną, to det A = ±1, A−1 = AT 5. jeżeli A, B są macierzami ortogonalnymi, to AT , A−1 , AB są macierzami ortogonalnymi; 6. A = [A1 . . . An ] jest macierzą ortogonalną wtedy i tylko wtedy, gdy ⟨Aj , Ak ⟩ = δjk . Teraz podamy twierdzenia o rozkładzie dla macierzy symetrycznych, antysymetrycznych i ortogonalnych. Twierdzenie 3.9.3 Niech A będzie macierzą symetryczną. Wtedy 1. wszystkie wartości własne s1 , . . . , sn macierzy A są rzeczywiste, każdej wartości własnej odpowiada rzeczywisty wektor własny; 61 2. wektory własne odpowiadające różnym wartościom własnym są prostopadłe; 3. istnieje macierz ortogonalna C taka, że s1 . . . 0 C −1 AC = ... . . . ... . 0 . . . sn Twierdzenie 3.9.4 Niech A będzie macierzą antysymetryczną. Wtedy 1. wszystkie wartości własne macierzy A są urojone lub 0 ib1 , −ib1 , . . . , ibp , −ibp , 0, . . . , 0; 2. wektory własne odpowiadające wartością własnym urojonym są postaci w = u + iv, gdzie ⟨u, v⟩ = 0, ||u|| = ||v|| = 1; 3. istnieje macierz ortogonalna C taka, że 0 b1 −b1 . . . . . . C −1 AC = . .. . .. . .. 0 .. . .. . .. . .. . .. . 0 ... ... ... ... .. . ... .. . 0 .. . −bp .. .. . . .. .. . . ... ... ... ... ... ... 0 . . . . . . . . . . .. . . . . . . . . . . .. . bp . . . . . . .. . . 0 . . . . . . .. .. .. . 0 ... . .. .. . . .. . . . . ... ... ... 0 Twierdzenie 3.9.5 Niech A będzie macierzą ortogonalną. Wtedy 1. wszystkie wartości własne macierzy A są zespolone o module równym 1 cos α1 ± i sin α1 , . . . , cos αp ± i sin αp , 1, . . . , 1, −1, . . . , −1; 2. wektory własne odpowiadające wartością własnym urojonym są postaci w = u + iv, gdzie ⟨u, v⟩ = 0, ||u|| = ||v|| = 1; 62 3. istnieje macierz ortogonalna C taka, że cos α1 − sin α1 . . . ... ... sin α1 cos α1 . . . ... ... .. .. .. . . . ... ... .. .. .. . . . cos αp − sin αp .. .. .. . . . sin αp cos αp . . . .. .. −1 .. .. .. C AC = . . .. .. .. .. .. . . . . . . . . . .. .. .. .. .. . . . . . .. .. .. .. .. . . . . . .. .. .. .. .. . 0 ... ... ... ... 3.10 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1 ... ... .. . . . ... . .. .. . . 1 .. .. .. . . . .. .. .. . . . ... ... ... ... ... ... ... ... ... −1 . . . .. . . . . 0 .. . .. . .. . .. . .. . .. . .. . .. . .. . . . . . . . . −1 Formy kwadratowe Definicja 3.10.1 Funkcję f : Rn → R daną wzorem f (x1 , . . . , xn ) = n X n X aij xi xj , i=1 j=1 gdzie aij = aji nazywamy formą kwadratową. Istnieje wzajemna jednoznaczność między formami kwadratowymi a macierzami kwadratowymi symetrycznymi. Jeżeli A jest macierzą kwadratową symetryczną to fA (x) = Ax, x jest formą kwadratową. Zauważmy również, że macierz Af utworzona ze współczynników formy kwadratowej jest macierzą kwadratową symetryczną. Definicja 3.10.2 Mówimy, że forma kwadratowa f (macierz symetryczna A) jest – dodatnio określona f > 0, A > 0, jeśli ∀x ∈ Rn \ {0} : f (x) > 0 ( Ax, x > 0); – nieujemnie określona, dodatnio półokreślona f ≥ 0, A ≥ 0, jeśli ∀x ∈ Rn : f (x) ≥ 0 ( Ax, x ≥ 0); – ujemnie określona f < 0, A < 0, jeśli ∀x ∈ Rn \ {0} : f (x) < 0 ( Ax, x < 0); 63 – niedodatnio określona, ujemnie półokreślona f ≤ 0, A ≤ 0, jeśli ∀x ∈ Rn : f (x) ≤ 0 ( Ax, x ≤ 0); – nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie, ani nieujemnie, ani niedodatnio określona, tzn. ∃x, y ∈ Rn : f (x) > 0, f (y) < 0 ( Ax, x > 0, Ay, y < 0). Niech A = [aij ], i, j = 1, 2, . . . , n, będzie macierzą kwadratową symetryczną (tzn. aij = aji dla dowolnych i, j). Niech a11 . . . a1k .. .. Ak := det ... . . ak1 . . . akk będzie minorem głównym rzędu k macierzy A, k ∈ {1, 2, . . . , n}. Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności macierzy symetrycznych Twierdzenie 3.10.3 (twierdzenie Sylvestera) Macierz symetryczna A jest 1. A > 0 wtedy i tylko wtedy, gdy Ak > 0 dla dowolnego k ∈ {1, 2, . . . , n}; 2. A ≥ 0 wtedy i tylko wtedy, gdy AI,J ≥ 0 dla dowolnego I = J ⊂ {1, 2, . . . , n} (gdzie AI,J jest wyznacznikiem macierzy powstałej z usunięcia z A I-tych wierszy i J-tych kolumn); 3. A < 0 wtedy i tylko wtedy, gdy (−1)k Ak > 0 dla dowolnego k ∈ {1, 2, . . . , n}; 4. A ≤ 0 wtedy i tylko wtedy, gdy (−1)|I| AI,J ≥ 0 dla dowolnego I = J ⊂ {1, 2, . . . , n} (gdzie AI,J jest wyznacznikiem macierzy powstałej z usunięcia z A I-tych wierszy i J-tych kolumn); 5. nieokreślona w pozostałych przypadkach. Dowód. Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz A będzie złożona z jednej liczby [a11 ]. Należy zauważyć, że forma h 7→ a11 h2 jest dodatnio określona wtedy i tylko wtedy, gdy a11 > 0. Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz à = [aij ], i, j = 1, 2, . . . , n − 1 wobec założenia o dodatniości minora An = det[aij ], i, j = 1, 2, . . . , n, wynika dodatnia określoność formy kwadratowej zadanej przez macierz A = [aij ], i, j = 1, 2, . . . , n. Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk, Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) □ 64