Uploaded by whatever1510109109

Linear algebra pl

advertisement
Elementy algebry liniowej
Rafał Czyż
14 września 2023
Instytut Matematyki
Wydział Matematyki i Informatyki
Uniwersytet Jagielloński
1
Spis treści
1 Logika i teoria mnogości
3
1.1
Logika - wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.2
Zdania logiczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.3
Kwantyfikatory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.4
Elementy teorii zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.5
Działania uogólnione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.6
Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7
Liczby całkowite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.8
Liczby wymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.9
Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.10 Przedziały. Kresy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.11 Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Funkcje
25
2.1
Podstawowe własności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2
Obrazy i przeciwobrazy zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3
Moce zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4
Specjalne własności funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5
Funkcje elementarne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.6
Funkcja wykładnicza i logarytmiczna . . . . . . . . . . . . . . . . . . . . . . 32
2.7
Funkcje trygonometryczne i funkcje cyklometryczne . . . . . . . . . . . . . . 34
2.8
Funkcje hiperboliczne i funkcje area . . . . . . . . . . . . . . . . . . . . . . . 36
3 Algebra liniowa
39
3.1
Macierze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2
Cramerowskie układy równań liniowych. . . . . . . . . . . . . . . . . . . . . 48
3.3
Rząd macierzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.4
Układy równań liniowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5
Przestrzenie wektorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.6
Baza przestrzeni wektorowej . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7
Odwzorowania liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.8
Wartości i wektory własne macierzy
3.9
Specjalne typy macierzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
. . . . . . . . . . . . . . . . . . . . . . 60
3.10 Formy kwadratowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2
1
Logika i teoria mnogości
Rozpoczynamy od przeglądu najważniejszych pojęć i twierdzeń z logiki i teorii mnogości.
1.1
Logika - wprowadzenie
1.2
Zdania logiczne
Definicja 1.2.1 Zdaniami logicznymi nazywać będziemy dowolne wyrażenia, najczęściej na gruncie matematyki, ale również i życia codziennego, co do których można jednoznacznie powiedzieć, czy są prawdziwe, czy fałszywe. Zdania logiczne będziemy oznaczać
małymi literami p, q, r itp. Zapis p = 1 oznacza, że zdanie logiczne p jest prawdziwe,
natomiast p = 0 oznacza, że zdanie logiczne p jest fałszywe.
Mając do dyspozycji zdania można z nich tworzyć kolejne łącząc je spójnikami logicznymi – zwanymi logicznymi operatorami dwuargumentowymi.
1. Alternatywa p ∨ q. Alternatywa dwóch zdań jest fałszywa tylko w przypadku, gdy
oba zdania są fałszywe. Czytamy p lub q.
2. Koniunkcja p ∧ q. Koniunkcja dwóch zdań jest prawdziwa tylko w przypadku, gdy
oba zdania są prawdziwe. Czytamy p i q.
3. Implikacja p ⇒ q. Zdanie p nazywamy poprzednikiem, zdanie q nazywamy następnikiem implikacji. Implikacja dwóch zdań jest fałszywa tylko w przypadku, gdy
poprzednik p jest prawdziwy i następnik q jest fałszywy. Czytamy p to q, z p wynika
q, p implikuje q.
4. Równoważność p ⇔ q. Równoważność jest prawdziwa wtedy i tylko wtedy, gdy
oba zdania p i q mają taką samą wartość logiczną. Czytamy p jest równoważne z q,
p wtedy i tylko wtedy, gdy q.
5. Negacja ∼ p. Negacja zmienia wartość logiczną zdania na przeciwną. Czytamy nie
p, nieprawda, że p, nie zachodzi p.
Powyższe własności można zapisać w poniższej tabeli.
p
0
0
1
1
q
0
1
0
1
p∨q
0
1
1
1
p∧q
0
0
0
1
p⇒q
1
1
0
1
p⇔q
1
0
0
1
∼p
1
1
0
0
Definicja 1.2.2 Formułę logiczną, która jest zawsze prawdziwa, bez względu na prawdziwość składowych nazywamy tautologią.
Poniżej podamy listę najprostszych (klasycznych) tautologii.
3
1. Prawo podwójnej negacji
p ⇔∼∼ p.
2. Prawa przemienności
p ∨ q ⇔ q ∨ p,
p ∧ q ⇔ q ∧ p.
3. Prawa łączności
p ∨ (q ∨ r) ⇔ (p ∨ q) ∨ r,
p ∧ (q ∧ r) ⇔ (p ∧ q) ∧ r.
4. Prawa rozdzielności
p ∨ (q ∧ r) ⇔ (p ∨ q) ∧ (p ∨ r),
p ∧ (q ∨ r) ⇔ (p ∧ q) ∨ (p ∧ r).
5. Prawa de Morgana
∼ (p ∨ q) ⇔ (∼ p) ∧ (∼ q),
∼ (p ∧ q) ⇔ (∼ p) ∨ (∼ q),
∼ (p ⇒ q) ⇔ p ∧ (∼ q).
6. Reguła kontrapozycji
(p ⇒ q) ⇔ (∼ q) ⇒ (∼ p).
7. Reguła odrywania
(p ∧ (p ⇒ q)) ⇒ q.
8. Prawo przechodniości
((p ⇒ q) ∧ (q ⇒ r)) ⇒ (p ⇒ r).
9.
p ∧ p ⇔ p, p ∨ p ⇔ p.
10.
((p ⇒ q) ∧ (q ⇒ p)) ⇔ (p ⇔ q).
Tautologie są twierdzeniami w logice. Każda wymaga dowodu. Jedną z metod dowodu
jest tabelka logiczna. Jako przykład udowodnimy Regułę kontrapozycji.
p
0
0
1
1
q
0
1
0
1
p⇒q
1
1
0
1
∼p
1
1
0
0
∼q
1
0
1
0
4
(∼ q) ⇒ (∼ p)
1
1
0
1
P ⇔L
1
1
1
1
1.3
Kwantyfikatory
Formułami zdaniowymi nazywamy wyrażenia, w których występują zmienne nie będące zdaniami logicznymi, a które stają się zdaniami, jeśli w miejsce zmiennych wstawimy
konkretne wartości. Na przykład x > 5 jest formułą zdaniową Ψ(x). Jeśli za wszystkie
zmienne wstawimy liczby dostaniemy zdanie logiczne prawdziwe (np. Ψ(10)) lub fałszywe
(np. Ψ(1)).
Dla każdej formuły zakres obiektów, które możemy wstawiać za zmienne jest naturalnie ograniczony i nazywany jest dziedziną formuły. W powyższym przykładzie naturalną
dziedziną formuły jest zbiór liczb.
Kwantyfikatory są symbolami, które pozwalają konstruować z jednych formuł inne.
Wyróżniamy dwa podstawowe kwantyfikatory.
1. Kwantyfikator ogólny (duży)
∀ x : Ψ(x).
Czytamy: dla każdego x zachodzi formuła Ψ(x).
2. Kwantyfikator szczegółowy (mały)
∃ x : Ψ(x).
Czytamy: istnieje x, dla którego zachodzi formuła Ψ(x).
Przykład 1.3.1 Zdanie ∀ x : x > 5 jest fałszywe, bo 1 < 5, natomiast zadanie ∃ x : x > 5
jest prawdziwe, bo 10 > 5.
Można konstruować funkcje zdaniowe z kwantyfikatorami bazując nie tylko na zdaniach
zależnych od jednej zmiennej. Dodając jeden kwantyfikator dostajemy formułę zdaniową
mającą o jedną zmienną mniej. Taką pozorną zmienną nazywamy zmienną związaną w
odróżnieniu od zmiennych wolnych nie mających kwantyfikatorów.
Przykład 1.3.2 W zdaniu
∀ x : x2 + y 2 > 0
x jest zmienną związaną, natomiast y jest zmienną wolną.
Często spotyka się zapis, w którym po kwantyfikatorze zamiast pojedynczego symbolu
zmiennej wpisuje się warunek jej dotyczący. Jest to skrócony zapis zgodnie z następującą
regułą
∀ Φ(x) : Ψ(x) ⇔ ∀ x : Φ(x) ⇒ Ψ(x),
∃ Φ(x) : Ψ(x) ⇔ ∃ x : Φ(x) ∧ Ψ(x),
Zachodzą następujące prawa logiczne dotyczące kwantyfikatorów.
5
(∀ x : Φ(x)) ⇒ Φ(y)
Φ(y) ⇒ (∃ x : Φ(x))
∼ (∀ x : Φ(x)) ⇔ (∃ x : ∼ Φ(x))
∼ (∃ x : Φ(x)) ⇔ (∀ x : ∼ Φ(x))
∀ x : Φ(x) ∨ p ⇔ (∀ x : Φ(x)) ∨ p
∀ x : Φ(x) ∧ p ⇔ (∀ x : Φ(x)) ∧ p
∃ x : Φ(x) ∨ p ⇔ (∃ x : Φ(x)) ∨ p
∃ x : Φ(x) ∧ p ⇔ (∃ x : Φ(x)) ∧ p
∀ x : Φ(x) ∧ Ψ(x) ⇔ ∀ x : Φ(x) ∧ ∀ x : Ψ(x)
∀ x : Φ(x) ∨ Ψ(x) ⇐ ∀ x : Φ(x) ∨ ∀ x : Ψ(x)
∃ x : Φ(x) ∨ Ψ(x) ⇔ ∃ x : Φ(x) ∨ ∃ x : Ψ(x)
∃ x : Φ(x) ∧ Ψ(x) ⇒ ∃ x : Φ(x) ∧ ∃ x : Ψ(x)
∀ x∀ y : Φ(x, y) ⇔ ∀ y∀ x : Φ(x, y)
∃ x∃ y : Φ(x, y) ⇔ ∃ y∃ x : Φ(x, y)
∃ x∀ y : Φ(x, y) ⇒ ∀ y∃ x : Φ(x, y)
Rozważa się jeszcze dwa inne kwantyfikatory.
1. Istnieje dokładnie jeden
∃! x : Φ(x).
2. Dla prawie wszystkich, tzn. dla wszystkich poza skończoną ilością
∀! x : Φ(x).
Formalne zdefiniowanie powyższych kwantyfikatorów zostawiamy jako ćwiczenie.
1.4
Elementy teorii zbiorów
Podstawowym pojęciem teorii mnogości jest pojęcie zbioru. Zbiory będziemy zazwyczaj
oznaczać dużymi literami A, B, C itp. Zbiór będzie poprawnie zdefiniowany, jeżeli będziemy
"potrafili sprawdzić", czy jakiś obiekt jest jego elementem czy nie. Innymi słowy zdanie
a jest elementem zbioru A, a ∈ A, oraz zdanie a nie jest elementem zbioru A, a ∈
/ A, są
zdaniami logicznymi.
Jednym ze sposobów opisu zbioru jest wypisanie wszystkich jego elementów, lub niektórych z nich w sposób jasno sugerujący, jakie są pozostałe, na przykład
A = {1, 2, 3, ..., 2020}
jest zbiorem liczb od 1 do 2020. Ogólnie, chcąc opisać zbiór elementów spełniających określoną zależność używamy następującego zapisu
A = {x : Φ(x)}.
6
Teraz podamy pewne operacje i zależności między zbiorami.
1. Suma zbiorów. Sumą zbiorów A i B nazywamy zbiór składający się z elementów
należących do któregokolwiek ze zbiorów
A ∪ B = {x : x ∈ A ∨ x ∈ B}.
Innymi słowy
x ∈ A ∪ B ⇔ x ∈ A ∨ x ∈ B.
2. Przecięcie zbiorów (iloczyn, część wspólna). Przecięciem zbiorów A i B nazywamy zbiór składający się z elementów należących do obu zbiorów jednocześnie
A ∩ B = {x : x ∈ A ∧ x ∈ B}.
Innymi słowy
x ∈ A ∩ B ⇔ x ∈ A ∧ x ∈ B.
3. Różnica zbiorów. Różnicą zbiorów A i B nazywamy zbiór składający się z elementów należących do zbioru A i nienależących do zbioru B
A \ B = {x : x ∈ A ∧ x ∈
/ B}.
Innymi słowy
x∈A\B ⇔x∈A∧x∈
/ B.
4. Inkluzja zbiorów (zawieranie). Zbiór A jest podzbiorem zbioru B (lub B jest
nadzbiorem zbioru A), jeżeli każdy element zbioru A jest elementem zbioru B
A ⊂ B ⇔ ∀ x : x ∈ A ⇒ x ∈ B.
5. Równość zbiorów. Zbiór A jest równy zbiorowi B, jeżeli A i B mają takie same
elementy
A = B ⇔ ∀ x : x ∈ A ⇔ x ∈ B.
6. Dopełnienie zbioru. Niech zbiór A ⊂ X, wtedy dopełnienie zbioru A składa się z
elementów, które nie należy do zbioru A
A′ = {x : x ∈
/ A} = X \ A.
Innymi słowy
x ∈ A′ ⇔ x ∈
/ A.
7. Zbiór pusty. Zbiór pusty ∅ to zbiór, do którego nie należy żaden element, tzn. zdanie
logiczne
∃x : x ∈ ∅
jest zdaniem fałszywym.
7
8. Zbiór potęgowy Zbiór potęgowy danego zbioru X, to zbiór wszystkich jego podzbiorów
P(X) = {A : A ⊂ X}.
9. Iloczyn kartezjański Niech A i B będą dowolnymi niepustymi zbiorami. Iloczynem
kartezjańskim A × B zbiorów A i B nazywamy zbiór par uporządkowanych (a, b)
takich, że a ∈ A i b ∈ B,
A × B := {(a, b) : a ∈ A ∧ b ∈ B},
gdzie para (a, b) formalnie może być zdefiniowana (definicja Kuratowskiego) jako
(a, b) = {{a}, {a, b}}.
Zachodzi następujące twierdzenie.
Obserwacja 1.4.1
1. Prawo podwójnej negacji
(A′ )′ = A.
2. Prawa przemienności
A ∪ B = B ∪ A,
A ∩ B = B ∩ A.
3. Prawa łączności
A ∪ (B ∪ C) = (A ∪ B) ∪ C,
A ∩ (B ∩ C) = (A ∩ B) ∩ C.
4. Prawa rozdzielności
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C),
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
5. Prawa de Morgana
(A ∪ B)′ = A′ ∩ B ′ ,
(A ∩ B)′ = A′ ∪ B ′ .
6. Reguła kontrapozycji
A ⊂ B ⇔ B ′ ⊂ A′ .
7. Prawo przechodniości
A ⊂ B ∧ B ⊂ C ⇒ A ⊂ C.
8.
A = B ⇔ A ⊂ B ∧ B ⊂ A.
8
9.
∅ ⊂ A ⊂ X.
10.
A ∪ A = A, A ∩ A = A, A ∩ ∅ = ∅, A ∪ ∅ = A, A ∩ X = A, A ∪ X = X.
Dowód. Wykażemy pierwsze prawo rozdzielności. Mamy
x ∈ A ∪ (B ∩ C) ⇔ x ∈ A ∨ x ∈ B ∩ C ⇔
x ∈ A ∨ (x ∈ B ∧ x ∈ C) ⇔ (x ∈ A ∨ x ∈ B) ∧ (x ∈ A ∨ x ∈ C) ⇔
(x ∈ A ∪ B) ∧ (x ∈ A ∪ C) ⇔ x ∈ (A ∪ B) ∩ (A ∪ C).
Dowód pozostałych własności zostawiamy jako ćwiczenie.
Przykład 1.4.2 Mamy
X0 = P(∅) = {∅},
X1 = P(X0 ) = {∅, {∅}},
X2 = P(X1 ) = {∅, {∅}, {{∅}}, {∅ , {∅}}}.
Przykład 1.4.3 Ile elementów ma zbiór potęgowy zbioru n-elementowego?
1.5
Działania uogólnione
Chcąc wyznaczyć sumę lub iloczyn kilku zbiorów używa się następującej konwencji. Jeżeli
mamy zbiory A1 , . . . , An to ich sumą nazwiemy zbiór, który zawiera elementy należące do
przynajmniej jednego z tych zbiorów, a przecięciem nazwiemy zbiór zawierający elementy
należące do każdego z tych zbiorów
n
[
j=1
n
\
Aj = A1 ∪ · · · ∪ An = {x : ∃ j ∈ {1, . . . , n} x ∈ Aj } ,
Aj = A1 ∩ · · · ∩ An = {x : ∀ j ∈ {1, . . . , n} x ∈ Aj } .
j=1
W analogiczny sposób postąpimy przy definiowaniu sumy i przecięcia dowolnej ilości
zbiorów.
Definicja 1.5.1 Niech J będzie niepustym zbiorem indeksów i niech Aj , j ∈ J, będzie
rodziną zbiorów. Wtedy
[
Aj = {x : ∃ j ∈ J x ∈ Aj } ,
j∈J
\
Aj = {x : ∀ j ∈ J x ∈ Aj } .
j∈J
Jeżeli J = N, to wtedy piszemy
S∞
j=1 Aj oraz
9
T∞
j=1 Aj .
Działania uogólnione maja następujące własności.
Obserwacja 1.5.2
′

[

Aj  =


j∈J
[
(Aj ∪ B) = 
j∈J
j∈J
[
j∈J
(Aj ∪ Bj ) = 

[
\
j∈J
\
(Aj ∪ Bj ) ⊃ 
\
j∈J
(Aj ∩ B) = 
\
Aj  ∪ 
j∈J

\
[
Bj  ;
(Aj ∩ Bj ) ⊂ 
j∈J

[
\
Bj  ;

Aj  ∩ 
j∈J
(Aj ∩ Bj ) = 
j∈J

\

[
Bj  ;
j∈J


Aj  ∩ 
j∈J
Przykład 1.5.3 Niech Aj = {x ∈ R : 1j ≤ x ≤ j}. Wykazać, że
T∞
j=1 Aj = {1}.
1.6
Aj  ∩ B;
j∈J

\
Aj  ∩ B;

j∈J

j∈J
(Aj ∩ B) = 

[

[
j∈J
j∈J

A′j ;

Aj  ∪ B;
j∈J

[
j∈J
Aj  ∪ 

[

j∈J

Aj  =

j∈J
(Aj ∪ B) = 
\
j∈J
Aj  ∪ B;

\
A′j ; 
j∈J
[
′

\

\
Bj  .
j∈J
S∞
j=1 Aj = (0, +∞) oraz
Liczby naturalne
Liczby naturalne (bez zera) znane były już w starożytności, w Grecji, Babilonii, Egipcie,
Indiach, Chinach.
Zero jako liczba naturalna pojawiła się znacznie później. Współczesny symbol zero pochodzi z Indii i jest przypisywany hinduskiemu matematykowi i astronomowi Brahmagupcie
(Brahmagupta).
Liczby naturalne oznaczamy
N = {0, 1, 2, 3, . . .}.
Z punktu widzenia algebry 0 jest elementem zbioru liczb naturalnych. W kursie analizy
matematycznej bardzo często zakłada się, że zbiór liczb naturalnych (lub zbiór liczb całkowitych dodatnich) jest dany przez N = {1, 2, 3, . . .}. Wtedy zbiór N0 = {0, 1, 2, 3, . . .} =
N ∪ {0} nazywamy zbiorem liczb całkowitych nieujemnych.
Struktura algebraiczna liczb naturalnych.
jest
W liczbach naturalnych zdefiniowana jest operacja dodawania + : N × N → N, która
10
(D1) przemienna, tzn. ∀ x, y ∈ N : x + y = y + x,
(D2) łączna, tzn. ∀ x, y, z ∈ N : (x + y) + z = x + (y + z),
(D3) oraz posiada element neutralny 0, tzn. ∀ x ∈ N : x + 0 = 0 + x = x.
Zbiór liczb naturalnych z działaniem dodawania (N, +) nazywamy półgrupą. Każdy
inny zbiór z działaniem wewnętrznym spełniający warunki (D1)-(D3) nazywamy również
półgrupą (np. (P(X), ∩) lub (P(X), ∪)).
jest
W liczbach naturalnych jest zdefiniowana operacja mnożenia · : N × N → N, która
(M1) przemienna, tzn. ∀ x, y ∈ N : x · y = y · x,
(M2) łączna, tzn. ∀ x, y, z ∈ N : (x · y) · z = x · (y · z),
(M3) oraz posiada element neutralny 1, tzn. ∀ x ∈ N : x · 1 = 1 · x = x.
Zbiór liczb naturalnych z działaniem mnożenia (N, ·) jest półgrupą.
Struktura porządkowa liczb naturalnych.
W liczbach naturalnych jest określona relacja porządku ≤, która jest
(P1) zwrotna, tzn. ∀ x ∈ N : x ≤ x,
(P2) antysymetryczna, tzn. ∀ x, y ∈ N : x ≤ y ∧ y ≤ x ⇒ x = y,
(P3) przechodnia, tzn. ∀ x, y, z ∈ N : x ≤ y ∧ y ≤ z ⇒ x ≤ z,
(P4) spójna, tzn. ∀ x, y ∈ N : x ≤ y ∨ y ≤ x.
Relację spełniającą warunki (P1)-(P4) nazywamy liniowym porządkiem.
Relacja liniowego porządku ≤ jest zgodna ze strukturą algebraiczną w N tzn. spełnia
dwa poniższe warunki:
(Z1) jeżeli x ≥ y, to dla wszystkich z ∈ N mamy x + z ≥ y + z,
(Z2) jeżeli x ≥ y, to dla wszystkich 0 ≤ z mamy zx ≥ zy.
Uwaga: (P(X), ⊂) jest porządkiem (nie liniowym porządkiem, nie spełnia warunku
spójności).
Aksjomatyczne definicje liczb naturalnych
1. aksjomaty Peano, tzn. aksjomaty następnika: 0 jest liczbą naturalną; każda liczba
naturalna ma swój następnik, oznaczany S(a); 0 nie jest następnikiem żadnej liczby
naturalnej; różne liczby naturalne mają różne następniki; jeśli 0 ma daną własność
i następnik dowolnej liczby naturalnej o tej własności również ma tę własność, to
każda liczba naturalna ma tę własność (zasada indukcji matematycznej). a + 0 = a,
a + S(b) = S(a) + b; a · 0 = 0; a · S(b) = a · b + a.
11
2. Model von Neumanna, tzn. ∅ := 0 ∈ N, 1 = {∅}, itd. n = {0, 1, 2, · · · , n − 1}.
x + y = x ∪ y, x ≤ y ↔ x ⊂ y.
3. Konstrukcja Fregego-Russella, tzn. liczby naturalne jako moce zbiorów skończonych.
1.7
Liczby całkowite
Liczby całkowite oznaczamy przez
Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .}.
W liczbach całkowitych dodawanie ma dodatkową własność, tzn. każda liczba całkowita
posiada liczbę przeciwną (odwrotną względem operacji dodawania)
(D4) ∀ x ∈ Z ∃ y(=: −x) ∈ Z : x + (−x) = (−x) + x = 0.
Mówimy, że liczby całkowite z operacją dodawania (Z, +) tworzą grupę przemienną (lub
grupę Abelową). Każdy inny zbiór z działaniem wewnętrznym spełniający warunki (D1)(D4) nazywamy również grupą przemienną.
Zauważmy, że (Z, ·) nie jest grupą, bo np. nie istnieje element odwrotny względem
mnożenia do liczby 2.
W zbiorze liczb całkowitych jest określona relacja liniowego porządku ≤ zgodna ze
strukturą algebraiczną.
Konstrukcja liczb całkowitych.
Liczby całkowite można skonstruować z liczb naturalnych w następujący sposób. Liczba
całkowita to para liczb naturalnych (n, m), przy czym identyfikujemy pary spełniające
następującą relację
(n1 , m1 ) = (n2 , m2 ) ⇔ n1 + m2 = m1 + n2 .
Dokładniej liczba całkowita to klasa abstrakcji w relacji równoważności zdefiniowanej powyżej w zbiorze N × N.
Wówczas dodawanie definiuje się jako
(n1 , m1 ) + (n2 , m2 ) = (n1 + n2 , m1 + m2 ),
a mnożenie jako
(n1 , m1 ) · (n2 , m2 ) = (n1 n2 + m1 m2 , n1 m2 + m1 n2 ).
12
1.8
Liczby wymierne
Liczby wymierne oznaczamy przez
p
Q=
: p ∈ Z, q ∈ N \ {0}
q
to zbiór ułamków o całkowitym liczniku i niezerowym mianowniku.
Konstrukcja liczb wymiernych.
Liczby wymierne można skonstruować z liczb całkowitych w następujący sposób. Liczba
wymierna to para liczb naturalnych (p, q) =: pq , q ̸= 0, przy czym identyfikujemy pary
spełniające następującą relację
p2
p1
=
⇔ p1 q2 = q1 p2 .
q1
q2
Dokładniej liczba wymierna to klasa abstrakcji w relacji równoważności zdefiniowanej powyżej w zbiorze Z × (Z \ {0}).
Wówczas dodawanie definiuje się jako
p1 p2
p 1 q2 + q1 p 2
+
=
,
q1
q2
q1 q2
a mnożenie jako
p1 p2
p1 p2
·
=
.
q1 q2
q1 q2
Zauważmy, że liczby wymierne z operacją dodawania (Q, +) tworzą grupę przemienną.
Ponadto w zbiorze liczb wymiernych mnożenie spełnia dodatkowy warunek, tzn. każda
niezerowa liczba wymierna posiada liczbę odwrotna (odwrotną względem operacji mnożenia)
(M4) ∀ x ∈ Q \ {0} ∃ y(=: x1 ) : x( x1 ) = ( x1 )x = 1.
Ponadto operacja mnożenia jest rozdzielna względem dodawania
(R) ∀ x, y, z ∈ Q : (x + y)z = xz + yz.
Mówimy, że liczby wymierne z operacjami dodawania i mnożenia (Q, +, ·) tworzą ciało.
Każdy inny zbiór z działaniami wewnętrznymi spełniającymi warunki (D1)-(D4), (M1)(M4) i (R) nazywamy również ciałem.
W zbiorze liczb wymiernych jest określona relacja liniowego porządku ≤ zgodna ze
strukturą algebraiczną.
Uwaga 1.8.1 Zbiór liczb wymiernych jest gęsty, tzn. pomiędzy dwoma dowolnymi liczbami wymiernymi leży trzecia
∀ x, y ∈ Q, x < y ∃ z ∈ Q : x < z < y.
13
1.9
Liczby rzeczywiste
Zbiór liczb rzeczywistych oznaczamy przez R. Mówimy, że liczby rzeczywiste z operacjami dodawania i mnożenia (R, +, ·) tworzą ciało. W zbiorze liczb rzeczywistych jest
określona relacja liniowego porządku ≤ zgodna ze strukturą algebraiczną.
Zbiór liczb niewymiernych określamy jako R \ Q.
Przykład 1.9.1 Już w szkole podstawowej dowiedzieliśmy się, że
0, (3) = 0, 33333 . . . =
1
.
3
Zwróćmy uwagę, że okresowe rozwinięcie dziesiętne 0, 33333 . . . wyraża nieskończoną sumę
składników
3
3
3
3
1
1
1
3
1
1
3
1+
+ 2 + 3 + ... =
·
= .
0+ 1 + 2 + 3 + 4 +... =
1
10
10
10
10
10
10 10
10
10 1 − 10
3
Przykład 1.9.2 Przypomnijmy jeszcze szkolny sposób zamiany ułamka okresowego na
iloraz dwóch liczb całkowitych. Rozważmy na przykład liczbę
a = 78, (1016) = 78, 10161016101610161016 . . . ,
która wyraża sumę nieskończonej liczby składników
a = 78 +
1016 1016 1016
+
+ 12 + . . . .
104
108
10
Zauważmy też, że różnica
10000a − a = 781016,1016101610161016 . . .
−78,1016101610161016 . . .
= 780938,0000000000000000 . . .
jest liczbą całkowitą. Stąd a =
780938
jest liczbą wymierną.
9999
Rozumując podobnie jak w powyższym przykładzie można wykazać ogólnie, że
Uwaga 1.9.3 Liczba rzeczywista jest liczbą wymierną wtedy i tylko wtedy, gdy ma okresowe rozwinięcie dziesiętne.
Przykład 1.9.4 Liczba
0, 12345678910111213141516171819202122 . . . ,
w której rozwinięciu dziesiętnym znajdują się kolejno cyfry wyrażające następujące po sobie
liczby naturalne, nie jest wymierna, gdyż nie ma okresowego rozwinięcia dziesiętnego.
14
Konstrukcje liczb rzeczywistych.
Przekroje Dedekinda.
Przekrojem Dedekinda zbioru liczb wymiernych nazywamy parę niepustych zbiorów
liczb wymiernych (A, B) taką, że
1. A ∩ B = ∅,
2. A ∪ B = Q,
3. ∀ a ∈ A ∀ b ∈ B a ≤ b.
Możliwe są następujące przypadki
1. zbiór A nie zawiera liczby największej i zbiór B nie zawiera liczby najmniejszej. W
tym przypadku przekrój (A, B) wyznacza liczbę niewymierną.
2. zbiór A nie zawiera liczby największej a zbiór B zawiera liczbę najmniejszą, lub
odwrotnie zbiór A zawiera liczbę największą a zbiór B nie zawiera liczby najmniejszej.
W tym przypadku przekrój (A, B) wyznacza liczbę wymierną (największą w zbiorze
A lub najmniejszą w zbiorze B). Będziemy zakładali, że w przekrojach wymiernych
zbiór B nie zawiera liczby najmniejszej (przerzucając ją ewentualnie do zbioru A).
Przekrój (A, B), gdzie
A = {x ∈ Q : x < 0 ∨ x2 < 2}, B = {x ∈ Q : x > 0 ∧ x2 > 2},
√
jest przekrojem niewymiernym i wyznacza liczbę 2.
Liczby wymierne i niewymierne noszą nazwę liczb rzeczywistych R.
Porządek liniowy w zbiorze liczb rzeczywistych definiujemy jako
(A1 , B1 ) ≤ (A2 , B2 ) ⇔ A1 ⊂ A2 .
Dodawanie określamy jako
x1 + x2 = (A1 , B1 ) + (A2 , B2 ) = (A1 + A2 , B1 + B2 ),
gdzie X + Y = {x + y; x ∈ X, y ∈ Y }. Wtedy
−x = −(A, B) = (−B, −A).
Mnożenie określamy jako
x1 · x2 = (A1 , B1 ) · (A2 , B2 ) = (A1 A2 , B1 B2 ),
15
dla 0 ≤ x1 , x2 , gdzie XY = {xy; x ∈ X, y ∈ Y }. W pozostałych przypadkach x1 x2 =
(−x1 )(−x2 ), dla x1 , x2 ≤ 0; x1 x2 = x1 (−x2 ), dla 0 ≤ x1 , x2 ≤ 0 oraz x1 x2 = (−x1 )x2 , dla
x1 , ≤ 0, x2 ≥ 0.
Z tak określonymi działaniami zbiór liczb rzeczywistych jest ciałem.
Konstrukcja Cantora.
Wśród ciągów liczb wymiernych wyróżniamy ciągi Cauchy’ego, tzn. ciągi {an }, an ∈ Q
spełniające warunek
∀ Q ∋ ϵ > 0 ∃N ∈ N ∀ N ∋ n, m ≥ N |an − am | ≤ ϵ.
Liczba rzeczywista to ciąg Cauchy’ego liczb wymiernych, przy czym identyfikujemy ciągi
{an } i {bn } spełniające następującą relację
∀ Q ∋ ϵ > 0 ∃N ∈ N ∀ N ∋ n ≥ N |an − bn | ≤ ϵ.
Dokładniej liczba rzeczywista to klasa abstrakcji w relacji równoważności zdefiniowanej
powyżej w zbiorze ciągów Cauchy’ego liczb wymiernych.
Dodawanie określamy jako
a + b = {an } + {bn } = {an + bn }.
Mnożenie określamy jako
a · b = {an } · {bn } = {an bn }.
Porządek liniowy w liczbach rzeczywistych określamy następująco
a < b = {an } < {bn } ⇔ ∃ Q ∋ ϵ > 0 ∃N ∈ N ∀ N ∋ n ≥ N bn < an − ϵ.
Uwaga 1.9.5 Dla dowolnej liczby rzeczywistej o znanym rozwinięciu dziesiętnym łatwo
jet skonstuować ciąg wymierny zmierzający do tej liczby. Wystarczy wziąć an -rozwinięcie
dziesiętne "obcięte" do n-tego miejsca po przecinku.
Uwaga 1.9.6 Zbiór liczb rzeczywistych jest gęsty, tzn. pomiędzy dwoma dowolnymi liczbami rzeczywistymi leży trzecia
∀ x, y ∈ R, x < y ∃ z ∈ R : x < z < y.
Uwaga 1.9.7 Zbiór liczb niewymiernych jest gęsty, tzn. pomiędzy dwoma dowolnymi
liczbami niewymiernymi leży trzecia
∀ x, y ∈ R \ Q, x < y ∃ z ∈ R \ Q : x < z < y.
Uwaga 1.9.8 Dla dowolnej liczby rzeczywistej x ∈ R istnieją dwa ciągi wymierny i niewymierny zbieżne do x, tzn.
∃ {an } ⊂ Q : an → x;
∃ {bn } ⊂ R \ Q : bn → x.
16
1.10
Przedziały. Kresy
Definicja 1.10.1 Rozszerzonym zbiorem liczb rzeczywistych R nazywamy zbiór liczb
rzeczywistych z dołączonymi elementami plus nieskończoność +∞ oraz minus nieskończoność −∞ (−∞, +∞ ∈
/ R) tak, że w zbiorze liczb rzeczywistych zachowany jest
naturalny porządek zadany przez relację nierówności, natomiast element plus nieskończoność następuje po każdej liczbie rzeczywistej, a element minus nieskończoność poprzedza
dowolną liczbę rzeczywistą, tzn.
∀ x ∈ R : −∞ < x < +∞.
Definicja 1.10.2 Niech a, b będą dowolnymi elementami zbioru R. Jeśli a < b, to każdy
ze zbiorów:
[a, b]
(a, b)
[a, b)
(a, b]
:=
:=
:=
:=
{x ∈ R : a ≤ x ≤ b}
{x ∈ R : a < x < b}
{x ∈ R : a ≤ x < b}
{x ∈ R : a < x ≤ b}
nazywamy przedziałem o końcach a, b, przedziałem – odpowiednio – domkniętym,
otwartym, lewostronnie domkniętym, prawostronnie domkniętym.
Niech A będzie dowolnym niepustym podzbiorem zbioru R.
Definicja 1.10.3 Ograniczeniem górnym zbioru (majorantą) A nazywamy dowolny
element zbioru R nie mniejszy od dowolnego elementu zbioru A.
Definicja 1.10.4 Ograniczeniem dolnym zbioru (minorantą) A nazywamy dowolny
element zbioru R nie większy od dowolnego elementu zbioru A.
Definicja 1.10.5 Element zbioru a ∈ A nazywamy najmniejszym, gdy ∀ b ∈ A a ≤ b.
Oznaczamy go a = min A. Element zbioru c ∈ A nazywamy największym, gdy ∀ b ∈
A b ≤ c. Oznaczamy go c = max A.
Uwaga 1.10.6
1. W zbiorze A nie muszą istnieć elementy największy i najmniejszy.
2. Jeżeli x jest ograniczeniem górnym zbioru A, to dla dowolnego elementu y ≥ x, y
jest ograniczeniem górnym zbioru A.
3. Jeżeli x jest ograniczeniem dolnym zbioru A, to dla dowolnego elementu y ≤ x, y
jest ograniczeniem dolnym zbioru A.
4. Dla dowolnego zbioru A zbiór jego ograniczeń górnych ma element najmniejszy.
5. Dla dowolnego zbioru A zbiór jego ograniczeń dolnych ma element największy.
Definicja 1.10.7 Najmniejsze ograniczenie górne zbioru A ⊂ R nazywamy kresem górnym zbioru A (lub: supremum zbioru A) i oznaczamy symbolem sup A.
17
Definicja 1.10.8 Największe ograniczenie dolne zbioru A ⊂ R nazywamy kresem dolnym zbioru A (lub: infimum zbioru A) i oznaczamy symbolem inf A.
Przykład 1.10.9 Niech A = [0, 1] ∪ (2, 3). Wtedy min A = inf A = 0, max A nie istnieje
i sup A = 3.
1.11
Liczby zespolone
Uwaga 1.11.1 Liczby zespolone C można skonstruować algebraicznie w następujący sposób. Przypomnijmy, że w dziedzinie rzeczywistej nie wszystkie wielomiany mogą być rozłożone na czynniki liniowe, tzn. istnieją wielomiany stopnia drugiego, które są nierozkładalne
(są to trójmiany kwadratowe o wyróżniku ujemnym). Zauważmy, że rozkładalność takich
trójmianów jest równoważna z rozkładalnością wielomianu x2 + 1. Załóżmy, że istnieje element i, który nie jest liczbą rzeczywistą, spełniający warunek i2 = −1. Wtedy liczby zespolone możemy uważać za ciało wygenerowane przez zbiór R∪{i}, tzn. C = {a+ib : a, b ∈ R}
wraz z działaniami
(a + ib) + (α + iβ) = (a + α) + i(b + β), (a + ib) · (α + iβ) = (aα − bβ) + i(aβ + bα).
Uwaga 1.11.2 W zbiorze liczb zespolonych nie można zdefiniować porządku, który byłby
zgodny ze strukturą algebraiczną. Załóżmy dla dowodu nie wprost, że taki porządek ≤
istnieje. Wtedy i ≥ 0 (odwrotny przypadek dowodzi się analogicznie). Wtedy mnożąc
przez i dostajemy i2 = −1 ≥ 0, mnożąc jeszcze dwa razy przez i dostajemy −i ≥ 0 i 1 ≥ 0
i otrzymaliśmy sprzeczność 0 = 1.
Teraz podamy analityczną konstrukcję liczb zespolonych.
Definicja 1.11.3 W iloczynie kartezjańskim R2 := R × R definiujemy sumę oraz iloczyn
par z1 = (x1 , y1 ) oraz z2 = (x2 , y2 ) następująco
z1 + z2 = (x1 + x2 , y1 + y2 )
z1 z2 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).
Definicja 1.11.4 Zbiór par liczb rzeczywistych z dodawaniem i mnożeniem określonym w
powyższej definicji, nazywamy zbiorem liczb zespolonych i oznaczamy literą C.
Uwaga 1.11.5 a) Suma i iloczyn liczb zespolonych jest liczbą zespoloną.
b) Dodawanie i mnożenie liczb zespolonych są działaniami łącznymi i przemiennymi, tzn.
z+w =w+z
zw = wz
z + (u + w) = (z + u) + w
z(uw) = (zu)w
dla dowolnych liczb zespolonych z, u, w.
c) Mnożenie liczb zespolonych jest rozdzielne względem dodawania, tzn.
z(u + w) = zu + zw
18
dla dowolnych liczb zespolonych z, u oraz w.
Definicja 1.11.6 Jeśli z = (x, y) jest liczbą zespoloną, to pierwszy element x pary (x, y)
nazywamy częścią rzeczywistą liczby z i oznaczamy symbolem ℜz (lub Rez), a drugi
element tej pary – częścią urojoną liczby z i oznaczamy ℑz (lub Imz).
Zauważmy, że każdej liczbie zespolonej z odpowiada dokładnie jeden punkt (ℜz, ℑz) w
prostokątnym układzie współrzędnych. Tradycyjnie mówimy więc o płaszczyźnie zespolonej C. Oś odciętych na płaszczyźnie C nazywamy osią rzeczywistą, a oś rzędnych - osią
urojoną.
Definicja 1.11.7 Jednostką urojoną nazywamy liczbę zespoloną i = (0, 1).
Uwaga 1.11.8 a) Każdą liczbę zespoloną z można zapisać w postaci sumy z = ℜz + ℑzi.
b) Kwadrat jednostki urojonej wynosi −1, gdyż i2 = (0, 1)(0, 1) = (−1, 0) = −1 + 0i = −1
c) Jeśli z1 = x1 + y1 i oraz z2 = x2 + y2 i, to sumę i iloczyn liczb z1 , z2 możemy wyznaczyć
tak, jak zwykliśmy przekształcać wyrażenia algebraiczne, traktując jednostkę urojoną i jak
parametr i pamiętać, że i2 = −1. Mamy więc
z1 + z2 = (x1 + y1 i) + (x2 + y2 i)
= (x1 + x2 ) + (y1 + y2 )i
= (x1 + x2 , y1 + y2 )
oraz
z1 z2 = (x1 + y1 i)(x2 + y2 i)
=x1 x2 + (x1 y2 + x2 y1 )i + y1 y2 i2
= (x1 x2 − y1 y2 ) + (x1 y2 + x2 y1 )i
= (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).
Przykład 1.11.9
(1 + i) + (5 − 2i) = 6 − i
(1 + i)(5 − 2i) = 7 + 3i
1+i
(1 + i)(5 + 2i)
3
7
=
=
+ i.
5 − 2i
(5 − 2i)(5 + 2i)
29 29
Definicja 1.11.10 Sprzężeniem liczby zespolonej z = x+iy nazywamy liczbę z = x−iy.
Liczba z̄ = x − iy jest obrazem liczby z = x + iy w symetrii względem osi rzeczywistej.
p
Definicja 1.11.11 Modułem liczby zespolonej z = x+iy nazywamy liczbę |z| = x2 + y 2 .
Moduł liczby zespolonej to jej odległość od początku układu współrzędnych.
19
Uwaga 1.11.12 Dowolną liczbę zespoloną z = x + iy możemy przedstawić
w postaci
p
trygonometrycznej z = r(cos φ, sin φ) = r(cos φ + i sin φ), gdzie r = x2 + y 2 , a φ jest
dowolnym kątem takim, że
(
x = r cos φ
y = r sin φ
Wiemy, że kątów takich jest nieskończenie wiele.
Obserwacja 1.11.13 Dla dowolnych liczb zespolonych z, w zachodzi
1. z̄¯ = z;
2. |z̄| = |z|;
3. z z̄ = |z|2 ;
4. (z + w) = z̄ + w̄;
5. (zw) = z̄ w̄;
6. wz = w̄z̄ , w ̸= 0;
7. |zw| = |z||w|;
8.
z
w
|z|
= |w|
, w ̸= 0;
9. |z + w| ≤ |z| + |w| (nierówność trójkąta);
10. ||z| − |w|| ≤ |z − w|.
Dowód. Własności (1)-(6) wynikają wprost z definicji i są łatwe do przeliczenia.
(7) Mamy
|zw|2 = zwzw = z z̄ww̄ = |z|2 |w|2 .
Punkt (8) dowodzi się analogicznie.
(9) Niech z = x+iy i w = a+ib. Podnieśmy obie strony do kwadratu, wtedy otrzymamy
|z + w|2 ≤ (|z| + |w|)2
z z̄ + z w̄ + wz̄ + ww̄ ≤ z z̄ + 2|z||w| + ww̄
p
p
2(xa + yb) ≤ 2 x2 + y 2 a2 + b2
x2 a2 + 2xayb + y 2 b2 ≤ x2 a2 + x2 b2 + y 2 a2 + y 2 b2
0 ≤ (xb − ya)2
Punkt (10) wynika z punktu (9).
20
Definicja 1.11.14 Każdy z kątów φ takich, że zachodzą równości x = r cos φ y = r sin φ
nazywamy argumentem liczby z i oznaczamy argz. Najmniejszy nieujemny argument
liczby zespolonej z nazywamy argumentem głównym tej liczby i oznaczamy Argz. Wtedy
każdą liczbę zespoloną z ̸= 0 można zapisać w postaci
z = |z|(cos φ + i sin φ),
którą nazywamy postacią trygonometryczną liczby zespolonej.
Uwaga 1.11.15 Wyrażenie cos φ + i sin φ będziemy krótko notować w postaci wykładniczej eiφ lub exp(iφ), pomijając na razie zasadność użycia symbolu funkcji wykładniczej w
tej notacji.
Odtąd liczbę zespoloną z o module |z| i argumencie φ można zapisywać również w
postaci wykładniczej z = |z|eiφ .
Obserwacja 1.11.16 Dla dowolnych liczb zespolonych z, w ̸= 0 zachodzi
1. arg(zw) = arg(z) + arg(w);
2. arg z1 = −arg(z);
3. arg wz = arg(z) − arg(w);
4. arg(z k ) = karg(z), dla k ∈ Z.
Dowód. (1) Zauważmy, że
zw = |z|(cos φ1 + i sin φ1 )|w|(cos φ2 + i sin φ2 )
= |z||w|[(cos φ1 cos φ2 − sin φ1 sin φ2 ) + i(sin φ1 cos φ2 + cos φ1 sin φ2 )]
= |zw|(cos(φ1 + φ2 ) + i sin(φ1 + φ2 )).
Pozostałe punkty dowodzi się analogicznie.
□
Twierdzenie 1.11.17 (wzór de Moivre’a)
Dla dowolnej liczby zespolonej z = |z|(cos φ + i sin φ) i dowolnej liczby naturalnej n =
1, 2, 3, . . . zachodzi równość:
z n = |z|n (cos nφ + i sin nφ),
którą można również wyrazić w postaci wykładniczej:
(|z|eiφ )n = |z|n einφ .
Przykład 1.11.18
√ π π 2020
2020π
2020π
2020
1010
(1 + i)
=
2 cos
+ i sin
=2
cos
+ i sin
=
4
4
4
4
21010 (cos(π) + i sin(π)) = −21010 .
21
Teraz zajmiemy się pierwiastkowaniem liczb zespolonych.
Definicja 1.11.19 Każdy z pierwiastków równania z n = w nazywamy pierwiastkiem algebraicznym stopnia n z liczby w.
Wniosek 1.11.20 Jeśli w = |z|(cos φ + i sin φ) ̸= 0 jest dowolną liczbą zespoloną różną od
zera, zaś n = 1, 2, 3, . . . – dowolną liczbą naturalną, to równanie z n = w spełnia dokładnie
n liczb zespolonych z0 , z1 , z2 , . . . , zn−1
p
φ + 2kπ
φ + 2kπ
k
zk =
,
|z| cos
+ i sin
n
n
gdzie k ∈ {0, 1, 2, . . . , n − 1}.
Dowód. (Szkic)
Korzystając ze wzoru de Moivre’a stwierdzamy, że zkn = w, a więc każda z liczb zk spełnia
dane równanie. Zauważmy ponadto, że gdybyśmy nie ograniczyli zakresu parametru k do
zbioru liczb całkowitych nieujemnych od 0 do n − 1, to i tak nie otrzymalibyśmy więcej
pierwiastków danego równania, gdyż zk = zk+n ze względu na okresowość funkcji sinus i
cosinus.
□
Uwaga 1.11.21 Każdy
z pierwiastków równania z n = w leży na okręgu o środku w punkp
n
cie 0 i promieniu |w|. Argument pierwiastka z0 jest n-tą częścią argumentu liczby w, a
2π
każdy kolejny pierwiastek ma argument o
większy od poprzedniego, tzn.
n
Argz0 =
1
Argw
n
Argzk+1 = Argzk +
2π
, dla k = 0, 1, 2, . . . , n − 2.
n
Przykład 1.11.22 Każda z liczb
i π4
z0 = e
π
π
z1 = ei( 4 + 2 )
π
π
π
π
z2 = ei( 4 +2 2 )
z3 = ei( 4 +3 2 )
π
π
= cos + i sin
4
4
3π
3π
= cos
+ i sin
4
4
5π
5π
= cos
+ i sin
4
4
7π
7π
= cos
+ i sin
4
4
jest pierwiastkiem równania z 4 + 1 = 0.
22
√
√
2
2
=+
+i
√2
√2
2
2
=−
+i
2
2
√
√
2
2
=−
−i
√2
√2
2
2
=+
−i
2
2
Przykład 1.11.23 Zastosujmy twierdzenie de Moivre’a do wyznaczenia wzorów funkcje
trygonometryczne wielokrotności kątów. Niech z = cos α + i sin α. Wtedy
z 2 = cos(2α) + i sin(2α),
z 2 = cos2 α + 2i sin α cos α − sin2 α,
a wtedy
cos(2α) = cos2 α − sin2 α, sin(2α) = 2 sin α cos α.
Podobnie
z 3 = cos(3α) + i sin(3α),
z 3 = cos3 α + 3i cos2 α sin α − 3 cos α sin2 α − i sin3 α,
a wtedy
cos(3α) = cos3 α − 3 cos α sin2 α, sin(3α) = 3 cos2 α sin α − sin3 α.
Równanie kwadratowe
Równanie postaci az 2 + bz + c = 0, a, b, c ∈ C, a ̸= 0, nazywamy równaniem kwadratowym. Rozwiązujemy jest w taki sam sposób, jak w dziedzinie rzeczywistej. Niech
∆ = b2 − 4ac, wtedy rozwiązaniami równania kwadratowego są liczby
√
√
−b − ∆
−b + ∆
z1 =
, z2 =
,
2a
2a
√
gdzie ∆ jednym ustalonym pierwiastkiem zespolonym z ∆.
Przykład 1.11.24 Rozwiązać równanie z 2 + (1 + i)z + i = 0. Mamy z1 = −1, z2 = −i.
ma
Rozważmy teraz równanie kwadratowe rzeczywiste ax2 + bx + c = 0. Wtedy równanie
1. dwa różne pierwiastki rzeczywiste
√
√
−b − ∆
−b + ∆
, x2 =
,
x1 =
2a
2a
gdy ∆ > 0;
2. jeden (podwójny) pierwiastek rzeczywisty
x0 =
gdy ∆ = 0;
23
−b
,
2a
3. dwa pierwiastki zespolone sprzężone
√
√
−b − i −∆
−b + i −∆
x1 =
, x2 =
,
2a
2a
gdy ∆ < 0.
Zbiory na płaszczyźnie.
Za pomocą liczb zespolonych można opisać zbiory znane z geometrii.
Przykład 1.11.25 Narysować na płaszczyźnie zbiory
A = {z ∈ C : |z − i + 2| = 2};
B = {z ∈ C : |z + i| = 1};
C = {z ∈ C : Re z ≥ 0};
D = {z ∈ C : Im z = −2};
E = {z ∈ C : Re(z 2 ) = 1};
n
π
πo
F = z ∈ C : < Arg z ≤
.
4
2
24
2
Funkcje
Przypomnijmy kilka pojęć z teorii mnogości dotyczących funkcji f : X 7→ Y określonych
na zbiorze X o wartościach w zbiorze Y .
2.1
Podstawowe własności
Definicja 2.1.1 Niech X, Y będą zbiorami niepustymi. Funkcją f : X → Y nazywamy
odwzorowanie, które każdemu elementowi x zbioru X przyporządkowuje dokładnie jeden
element y zbioru Y , piszemy y = f (x). Bardziej precyzyjnie funkcja jest podzbiorem iloczynu kartezjańskiego (podzbiór ten oznaczamy wyk(f ) i nazywamy wykresem funkcji)
X × Y spełniającym warunek dla każdego x ∈ X istnieje dokładnie jeden y ∈ Y taki, że
(x, y) ∈ wyk f .
Zbiór X nazywamy dziedziną funkcji i oznaczamy Df . Przeciwdziedziną (lub
zbiorem wartości) nazywamy zbiór PDf = {y ∈ Y : ∃ x ∈ X : f (x) = y}.
Czasami będziemy rozważać tzw. funkcje częściowe czyli funkcje, który dziedzina Df
nie jest równa całemu zbiorowi X. Na przykład będziemy mówili funkcja f (x) = x1 jest
funkcją rzeczywistą, ale jej dziedzina jest równa R \ {0}.
Definicja 2.1.2 Niech f, g : X → R. Wtedy możemy zdefiniować
1. sumę funkcji
(f + g)(x) := f (x) + g(x), x ∈ Df ∩ Dg ̸= ∅;
2. różnicę funkcji
(f − g)(x) := f (x) − g(x), x ∈ Df ∩ Dg ̸= ∅;
3. iloczyn funkcji
(f · g)(x) := f (x) · g(x), x ∈ Df ∩ Dg ̸= ∅;
4. iloraz funkcji
f
f (x)
(x) :=
, x ∈ Df ∩ Dg ∩ {x : g(x) ̸= 0} =
̸ ∅.
g
g(x)
Definicja 2.1.3 Niech A ⊂ X i niech f : X 7→ Y . Zacieśnieniem (inaczej: zawężeniem
lub restrykcją) funkcji f do zbioru A nazywamy funkcję f|A : A 7→ Y równą funkcji f na
zbiorze A, tzn. ∀x ∈ A : f|A (x) = f (x).
Definicja 2.1.4 Funkcją identycznościową nazywamy funkcję idX : X → X taką, że
idX (x) = x.
25
Definicja 2.1.5 Niech f : X → Y , g : Y → Z będą funkcjami takimi, że PDf ∩ Dg ̸=
∅. Złożeniem funkcji f z funkcją g nazywamy funkcję g ◦ f : X → Z zdefiniowaną
następująco (g ◦ f )(x) = g(f (x)).
Przykład 2.1.6 Niech f (x) = x2 + 3x − 1 i g(x) = sin x, wtedy
g ◦ f (x) = sin(x2 + 3x − 1), f ◦ g(x) = sin2 x + 3 sin x − 1.
Definicja 2.1.7 Niech f : X 7→ Y będzie funkcją. Mówimy, że funkcja g : Y 7→ X jest
funkcją odwrotną do funkcji f , jeśli dla dowolnego elementu x ∈ X zachodzi równość
g(f (x)) = x i dla dowolnego elementu y ∈ Y zachodzi równość f (g(y)) = y, lub równoważnie
g ◦ f = idX , f ◦ g = idY
Funkcję odwrotną do funkcji f : X 7→ Y będziemy oznaczać często symbolem f −1 :
Y 7→ X, o ile nie prowadzi to do nieporozumienia. Należy odróżniać pojęcie funkcji odwrotnej od odwrotności funkcji , gdzie przez odwrotność funkcji f : X 7→ R rozumiemy
1
1
funkcję : X ∋ x 7→
∈ R.
f
f (x)
Uwaga 2.1.8 Zauważmy, że wykresy funkcji f i f −1 są symetryczne względem prostej
y = x, gdyż
(x, y) ∈ wyk f ⇔ f (x) = y ⇔ x = f −1 (y) ⇔ (y, x) ∈ wyk f −1 .
Definicja 2.1.9 Funkcję f : X 7→ Y nazywamy iniekcją zbioru X w zbiór Y , jeśli jest
różnowartościowa, to znaczy, że dla dowolnych elementów x, y ∈ X z równości f (x) = f (y)
wynika, że x = y.
Definicja 2.1.10 Funkcję f : X 7→ Y nazywamy suriekcją zbioru X na zbiór Y , jeśli
każdy element zbioru Y jest wartością funkcji f, to znaczy, że dla dowolnego elementu
y ∈ Y istnieje element x ∈ X taki, że y = f (x).
Definicja 2.1.11 Funkcję f : X 7→ Y nazywamy bijekcją zbioru X na zbiór Y , jeśli jest
iniekcją i suriekcją.
Twierdzenie 2.1.12 Funkcja f : X → Y jest odwracalna wtedy tylko wtedy, gdy jest
bijekcją.
Przykład 2.1.13 Niech f : R → R. Wtedy mając dany wykres funkcji można zbadać
kiedy jest iniekcją, suriekcją czy bijekcją badając jego przecięcia z prostymi poziomymi.
Mamy
1. f jest iniekcją wtedy i tylko wtedy, gdy dla każdego c ∈ R zbiór wyk f ∩ {(x, cx) :
x ∈ R} jest co najwyżej jednelementowy;
2. f jest suriekcją wtedy i tylko wtedy, gdy dla każdego c ∈ R zbiór wyk f ∩ {(x, cx) :
x ∈ R} jest co najmniej jednelementowy;
26
3. f jest bijekcją wtedy i tylko wtedy, gdy dla każdego c ∈ R zbiór wyk f ∩ {(x, cx) :
x ∈ R} jest dokładnie jednelementowy;
Przykład 2.1.14 Zbadać homografię f (x) = ax+b
cx+d , gdzie c ̸= 0 (dla c = 0 dostajemy
funkcję liniową). Dziedziną funkcji jest zbiór Df = R\{− dc }. Zbadamy iniektywność funkcji
f (x1 ) = f (x2 ) ⇔
ax1 + b
ax2 + b
=
⇔ (ad − bc)(x1 − x2 ) = 0 ⇔ x1 = x2 ,
cx1 + d
cx2 + d
o ile ad − cb ̸= 0. Czyli homografia jest iniekcją, gdy ad − cb ̸= 0. Zauważmy również, że
gdy ad − bc = 0, to funkcja f jest stała f (x) = db lub f (x) = 0 (gdy d = 0).
Teraz zbadamy suriektywność funkcji. Niech y będzie dowolną liczbą szukamy x takiego,
że y = f (x). Mamy
y = f (x) ⇔ y =
dy − b
ax + b
⇔ (a − cy)x = dy − b ⇔ x =
,
cx + d
a − cy
o ile y ̸= ac . Jeżeli y = ac = ax+b
cx+d to dostajemy ad − bc = 0.
Podsumowując PDf = R \ { ac }, funkcja
f (x) =
d
a
ax + b
: R \ {− } → R \ { }
cx + d
c
c
dx−b
jest bijekcją i jest funkcja odwrotna jest równa f −1 (x) = −cx+a
.
2.2
Obrazy i przeciwobrazy zbiorów
Definicja 2.2.1 Niech f : X → Y będzie funkcją i niech A ⊂ X i B ⊂ Y . Wtedy
1. obrazem zbioru A przez funkcję f nazywamy zbiór
f (A) = {y ∈ Y : ∃ x ∈ A f (x) = y};
2. przeciwobrazem zbioru B przez funkcję f nazywamy zbiór
f −1 (B) = {x ∈ X : f (x) ∈ B};
Mamy następujące własności obrazów i przeciwobrazów.
Obserwacja 2.2.2 Niech f : X → Y będzie funkcją i niech A1 , A2 ⊂ X i B1 , B2 ⊂ Y .
Wtedy
1. f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 );
2. f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 );
3. f (A1 \ A2 ) ⊃ f (A1 ) \ f (A2 );
27
4. f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 );
5. f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 );
6. f −1 (B1 \ B2 ) = f −1 (B1 ) \ f −1 (B2 ).
Przykład 2.2.3 Niech f (x) = x2 + x − 2. Znaleźć f ([−2, 2]), f (R), f −1 ({0}), f −1 ((0, 4]).
Miejscami zerowymi funkcji są x = −2 i x = 1, wierzchołek paraboli ma współrzędne
b
∆
(− 2a
, − 4a
) = (− 21 , − 49 ). Zauważmy, że f (−2) = 0, f (2) = 4 oraz w punkcie x = − 12
jest minimum o wartości − 94 . Dlatego f ([−2, 2]) = [− 94 , 4]. Zauważmy również, że f (R) =
PDf = [− 94 , ∞).
Mamy x ∈ f −1 ({0}) ⇔ f (x) = 0, czyli jest to zbiór miejsc zerowych funkcji, dlatego
f −1 ({0}) = {−2, 1}.
Podobnie x ∈ f −1 ((0, 4]) ⇔ 0 < f (x) ≤ 4. Nierówność f (x) > 0 jest spełniona przez
liczby ze zbioru (−∞, −2) ∪ (1, ∞). Natomiast nierówność x2 + x − 6 ≤ 0 jest spełniona w
zbiorze [−3, 2]. W końcu f −1 ((0, 4]) = [−3, −2) ∪ (1, 2].
2.3
Moce zbiorów
Definicja 2.3.1 Mówimy, że zbiory X, Y są równoliczne, jeśli istnieje bijekcja zbioru
X na zbiór Y . Mówimy też wtedy, że zbiory X, Y są tej samej mocy , co zapisujemy
krótko cardX = cardY lub #X = #Y . Jeśli zbiór zawiera skończoną liczbę elementów
równą n (innymi słowy: jeśli jest równoliczny ze zbiorem {1, 2, 3, . . . , n}), to mówimy, że
jest zbiorem mocy n, co zapisujemy cardA = n lub #A = n.
Przykład 2.3.2 a) Można wykazać, że zbiór liczb naturalnych jest równoliczny ze zbiorem
liczb całkowitych i ze zbiorem liczb wymiernych.
b) Również każdy nieskończony podzbiór zbioru liczb naturalnych (na przykład zbiór liczb
parzystych, zbiór liczb nieparzystych, zbiór liczb pierwszych) jest równoliczny z całym
zbiorem liczb naturalnych.
Definicja 2.3.3 Zbiór A równoliczny ze zbiorem liczb naturalnych nazywamy zbiorem
przeliczalnym. Mówimy też, że moc zbioru przeliczalnego A jest równa alef zero, co
zapisujemy card A = ℵ0 lub #A = ℵ0 .
Definicja 2.3.4 Zbiór nieskończony, który nie jest równoliczny ze zbiorem liczb naturalnych, nazywamy zbiorem nieprzeliczalnym.
Twierdzenie 2.3.5 Zbiór liczb rzeczywistych nie jest równoliczny ze zbiorem liczb naturalnych.
Przykład 2.3.6 a) Jeśli a < b są dowolnymi elementami zbioru R, to każdy z przedziałów
[a, b], (a, b], [a, b), (a, b), jest równoliczny ze zbiorem liczb rzeczywistych.
b) Co więcej, można również wykazać, że zbiór punktów płaszczyzny R2 = R × R jest
równoliczny ze zbiorem liczb rzeczywistych.
28
Definicja 2.3.7 Zbiór A równoliczny ze zbiorem liczb rzeczywistych nazywamy zbiorem
mocy continuum, co zapisujemy card A = c lub #A = c.
Przykład 2.3.8 Mamy #N = #Z = #Q = ℵ0 , #(R \ Q) = #R = #C = c.
2.4
Specjalne własności funkcji
Definicja 2.4.1 Mówimy, że funkcja f : R 7→ R jest ograniczona, gdy istnieją liczby
rzeczywiste m, M takie, że dla dowolnego x ∈ Df mamy m ≤ f (x) ≤ M .
Definicja 2.4.2 Mówimy, że funkcja f : R 7→ R jest rosnąca (odpowiednio: ściśle rosnąca) w przedziale (a, b), jeśli
∀x, y ∈ (a, b) : x < y =⇒ f (x) ≤ f (y)
(odpowiednio: ∀x, y ∈ (a, b) : x < y =⇒ f (x) < f (y).)
Definicja 2.4.3 Mówimy, że funkcja f : R 7→ R jest malejąca (odpowiednio: ściśle
malejąca) w przedziale (a, b), jeśli
∀x, y ∈ (a, b) : x < y =⇒ f (x) ≥ f (y)
(odpowiednio: ∀x, y ∈ (a, b) : x < y =⇒ f (x) > f (y).)
Definicja 2.4.4 Mówimy, że funkcja jest monotoniczna w przedziale, jeśli w tym przedziale jest rosnąca albo malejąca.
π
π
Przykład 2.4.5 Funkcja x 7→ tg x rośnie w każdym z przedziałów postaci − +kπ, +
2
2
π π
π 3π
∪
,
. Weźmy bowiem
kπ nie jest jednak rosnąca w sumie przedziałów − ,
2 2
2 2
π
3π
np. argumenty x = , y =
. Wówczas x < y, ale tg x = 1 > −1 = tg y.
4
4
Uwaga 2.4.6 Jeśli g : (c, d) 7→ (a, b) jest funkcją odwrotną do funkcji f : (a, b) 7→ (c, d),
to
a) jeśli f jest ściśle rosnąca, to g jest także ściśle rosnąca;
b) jeśli f jest ściśle malejąca, to g jest również ściśle malejąca.
Krótko: funkcja odwrotna do funkcji rosnącej jest rosnąca, a odwrotna do malejącej –
malejąca.
Definicja 2.4.7 Mówimy, że funkcja f : R 7→ R jest parzysta, gdy
1. ∀ x : x ∈ Df ⇒ −x ∈ Df ;
2. ∀ x ∈ Df : f (−x) = f (x).
Definicja 2.4.8 Mówimy, że funkcja f : R 7→ R jest nieparzysta, gdy
29
1. ∀ x : x ∈ Df ⇒ −x ∈ Df ;
2. ∀ x ∈ Df : f (−x) = −f (x).
Uwaga 2.4.9 Zauważmy, że wykres funkcji parzystej jest symetryczne względem osi OY ,
natomiast wykres funkcji nieparzystej jest symetryczny względem punktu (0, 0).
Definicja 2.4.10 Mówimy, że funkcja f : R 7→ R jest okresowa, gdy istnieje liczba T > 0,
zwana okresem funkcji taka ,że
1. ∀ x : x ∈ Df ⇒ x + T, x − T ∈ Df ;
2. ∀ x ∈ Df : f (x + T ) = f (x).
Najmniejszy okres dodatni T0 nazywamy okresem podstawowym funkcji.
Uwaga 2.4.11 Zauważmy, że istnieją funkcje okresowe bez okresu podstawowego. Klasycznym przykładem jest funkcja Dirichleta
1, x ∈ Q
f (x) =
0, x ∈ R \ Q
której okresem jest dowolna liczba wymierna dodatnia.
2.5
Funkcje elementarne
Przypominamy własności funkcji znanych ze szkoły (funkcja liniowa, homograficzna, wielomianowa, wykładnicza, funkcje trygonometryczne). Definiujemy funkcje hiperboliczne.
Rozważamy podstawowe własności funkcji odwrotnych.
Funkcje liniowe
Definicja 2.5.1 Niech a, b będą dowolnymi liczbami rzeczywistymi. Funkcję x 7→ ax + b
nazywamy funkcją liniową (afiniczną).
Uwaga 2.5.2 a) Wykresem funkcji afinicznej jest prosta.
b) Funkcja f (x) = ax + b jest ściśle rosnąca, gdy a > 0 i ściśle malejąca, gdy a < 0. Jest
bijekcją zbioru R na zbiór R, gdy a ̸= 0.
c) Funkcja odwrotna do funkcji afinicznej jest funkcją afiniczną.
d) Złożenie funkcji afinicznych jest funkcją afiniczną.
Funkcje homograficzne
30
Definicja 2.5.3 Niech a, b, c, d będą dowolnymi liczbami rzeczywistymi takimi, że ad −
ax + b
bc ̸= 0. Funkcję x 7→
nazywamy funkcją homograficzną lub – krótko – homocx + d
grafią.
Uwaga 2.5.4 a) Funkcja afiniczna jest szczególnym przypadkiem funkcji homograficznej.
b) Wykresem funkcji homograficznej f jest prosta (jeśli f jest afiniczna) lub hiperbola (jeśli
f nie jest afiniczna).
c) Funkcja odwrotna do homografii jest homografią.
d) Złożenie homografii jest homografią.
Wielomiany
Definicja 2.5.5 Niech a będzie stałą, niech n = 0, 1, 2, 3, ... będzie liczbą całkowitą nieujemną, a x – zmienną. Wyrażenie algebraiczne axn nazywamy jednomianem zmiennej x. Jeśli a ̸= 0, to liczbę n nazywamy stopniem jednomianu axn . Sumę w(x) =
a0 + a1 x + a2 x2 + ... + an xn skończonej liczby jednomianów zmiennej x nazywamy wielomianem zmiennej x. Największy ze stopni tych jednomianów, nazywamy stopniem
wielomianu.
Definicja 2.5.6 Funkcję x 7→ w(x) = a0 + a1 x + a2 x2 + ... + an xn nazywamy funkcją
wielomianową lub – krótko – wielomianem.
Uwaga 2.5.7 a) Suma oraz iloczyn wielomianów jest wielomianem.
b) Złożenie funkcji wielomianowych jest funkcją wielomianową.
Funkcja f (x) = xn , n-liczba nieparzysta
Uwaga 2.5.8 Funkcja f (x) = xn
1. ma dziedzinę i przeciwdziedzinę równą R;
2. jest rosnąca;
3. jest nieparzysta;
4. jest iniekcją, suriekcją, czyli bijekcją;
√
5. ma funkcję odwrotną równą f −1 (x) = n x.
√
Uwaga 2.5.9 Funkcja f (x) = n x
31
1. ma dziedzinę i przeciwdziedzinę równą R;
2. jest rosnąca;
3. jest nieparzysta
4. jest iniekcją, suriekcją, czyli bijekcją;
5. ma funkcję odwrotną równą f −1 (x) = xn .
Funkcja f (x) = xn , n-liczba parzysta
Uwaga 2.5.10 Funkcja f (x) = xn
1. ma dziedzinę równą R i przeciwdziedzinę równą [0, +∞);
2. jest rosnąca w przedziale (0, +∞) i malejąca w przedziale (−∞, 0);
3. jest parzysta;
4. nie jest iniekcją ani suriekcją.
Zacieśnienie funkcji f (x) = xn do przedziału [0, ∞)
xn |[0,+∞) : [0, +∞) → [0, +∞)
jest rosnącą bijekcją. Funkcją odwrotną do niej jest funkcja pierwiastek stopnia n g(x) =
√
n
x określona na przedziale [0, ∞) o wartościach w [0, ∞).
2.6
Funkcja wykładnicza i logarytmiczna
Definicja 2.6.1 Niech a > 0 będzie dowolną dodatnią liczbą rzeczywistą. Funkcję x 7→ ax
określoną na zbiorze liczb rzeczywistych nazywamy funkcją wykładniczą o podstawie a.
Uwaga 2.6.2 a) Jeśli a > 0, a ̸= 1, funkcja wykładnicza x 7→ ax jest bijekcją zbioru R
na przedział (0, ∞). Nie zeruje się w żadnym punkcie swojej dziedziny.
b) Jeśli a > 1, funkcja x 7→ ax jest ściśle rosnąca, jeśli zaś 0 < a < 1, jest ściśle
malejąca.
c) Jeśli a = 1, funkcja x 7→ ax jest stała.
Definicja 2.6.3 Niech a ∈ (0, 1)∪(1, ∞) będzie dowolną liczbą rzeczywistą dodatnią, różną od jedności. Funkcję odwrotną do funkcji x 7→ ax nazywamy funkcją logarytmiczną
o podstawie a i oznaczamy x 7→ loga x.
32
Na ogół pomija się indeks a w oznaczeniu logarytmu liczby x i pisze się krótko log x.
Zwróćmy jednak uwagę na fakt, że w zależności od dziedziny nauki, czy techniki, symbol
ten może oznaczać logarytmy o różnych podstawach. I tak informatycy na ogół posługują
się tym symbolem mając na myśli logarytm o podstawie 2, tzn. log x = log2 x. Z kolei w naukach technicznych symbol log x = log10 x oznacza przeważnie logarytm dziesiętny. Natomiast matematycy posługują się najczęściej logarytmem o podstawie e = 2, 71828182846...
(do definicji i własności tej ważnej stałej powrócimy w następnych modułach). Stąd często
w pracach matematycznych symbol log x = loge x oznacza właśnie logarytm o podstawie
e. My jednak, aby uniknąć nieporozumień, logarytm o podstawie e będziemy oznaczać
osobnym symbolem ln x.
Definicja 2.6.4 Symbolem exp x będziemy oznaczać potęgę ex .
Definicja 2.6.5 Logarytmem naturalnym z liczby dodatniej x nazywamy liczbę ln x =
loge x.
Uwaga 2.6.6 a) Jeśli a > 0, a ̸= 1, funkcja logarytmiczna x 7→ loga x jest bijekcją
przedziału (0, ∞) na zbiór R.
b) Jeśli a > 1, funkcja x 7→ loga x jest ściśle rosnąca, jeśli zaś 0 < a < 1, jest ściśle
malejąca.
c) Jedynym miejscem zerowym funkcji logarytmicznej x 7→ loga x jest punkt x = 1.
d) Jeśli a > 1, to logarytm loga x jest dodatni w przedziale (1, ∞) i jest ujemny w
przedziale (0, 1). Jeśli zaś 0 < a < 1, to logarytm loga x jest ujemny w przedziale (1, ∞) i
jest dodatni w przedziale (0, 1).
Przypomnijmy jeszcze parę tożsamości, z których często będziemy korzystać.
Uwaga 2.6.7 a) Dla a, b > 0, x, y ∈ R, n, m ∈ N zachodzą równości
a x ax
√
n
ax
1
(ax )y = axy , ax ay = ax+y , y = ax−y , (ab)x = ax bx ,
= x , a−x = x , a m = m an .
a
b
b
a
b) Dla dodatnich liczb a, b, c, a ̸= 1, c ̸= 1 prawdziwy jest wzór na zmianę podstawy
logarytmu
logc b
,
loga b =
logc a
w szczególności, gdy c = e, mamy równość
loga b =
ln b
.
ln a
c) Dla dowolnej liczby b ∈ R i dodatnich a > 0, c > 0 zachodzi równość
ab = cb logc a ,
która w szczególnym przypadku, gdy c = e, ma postać
ab = exp(b ln a).
33
d) Dla dodatnich liczb a, b, c, c ̸= 1 zachodzi
a
logc (ab) = logc a + logc b, logc
= logc a − logc b, logc ab = b logc a.
b
2.7
Funkcje trygonometryczne i funkcje cyklometryczne
Przypomnijmy wartości funkcji trygonometrycznych dla podstawowych kątów.
x
sin x
cos x
tg x
0
0
1
0
ctg x
X
π
6
1
√2
3
2
1
√
√3
3
π
√4
2
√2
2
2
1
1
π
√3
3
2
1
√2
π
2
3
1
0
X
√1
3
0
Uwaga 2.7.1 Przypomnijmy kilka własności funkcji trygonometrycznych sinus, cosinus,
tangens i cotangens.
1. Dziedziną funkcji sinus i cosinus jest zbiór liczb rzeczywistych, dziedziną funkcji tangens jest zbiór R\{kπ, k ∈ Z} a dziedziną funkcji cotangens jest zbiór R\{ π2 +kπ, k ∈
Z}.
2. Przeciwdziedziny funkcji sin x i cos x to odcinek [−1, 1], dlatego są one ograniczone i
nie są suriektywne. Natomiast przeciwdziedziny funkcji tg x i ctg x to R, dlatego są
suriektywne.
3. Żadna z nich nie jest różnowartościowa w swojej dziedzinie.
4. Funkcje trygonometryczne są okresowe, okres podstawowy funkcji sin x i cos x wynosi
2π, natomiast funkcji tg x i ctg x jest równy π.
5. W końcu funkcja cos x jest parzysta, pozostałe są nieparzyste.
π π
Uwaga 2.7.2 a) Funkcja f (x) = sin x zacieśniona do przedziału − ,
jest różnowar2 2
tościowa, ściśle rosnąca.
b) Funkcja f (x) = cos x zacieśniona do przedziału [0, π] jest różnowartościowa, ściśle
malejąca.
c) Funkcja f (x) = tg x zacieśniona do przedziału
ściśle rosnąca.
π π
− ,
2 2
jest różnowartościowa,
d) Funkcja f (x) = ctg x zacieśniona do przedziału (0, π) jest różnowartościowa, ściśle
malejąca.
34
Pamiętamy również, że zachodzi
Twierdzenie 2.7.3 Dla dowolnej liczby rzeczywistej x suma kwadratów cosinusa i sinusa
jest równa jedności, tzn. ∀x ∈ R : cos2 x + sin2 x = 1.
Tożsamość tę nazywamy jedynką trygonometryczną.
Definicja 2.7.4 Funkcję określoną na przedziale [−1, 1] o wartościach w przedziale −
π π
π π
, odwrotną do zacieśnienia funkcji sinus do przedziału − ,
, nazywamy arcu,
2 2
2 2
sem sinusem i oznaczamy symbolem x 7→ arc sin x.
Definicja 2.7.5 Funkcję określoną na przedziale [−1, 1] o wartościach w przedziale [0, π],
odwrotną do zacieśnienia funkcji cosinus do przedziału [0, π], nazywamy arcusem cosinusem i oznaczamy symbolem x 7→ arc cos x.
Definicja
w przedziale
2.7.6 Funkcję określoną na przedziale (−∞, ∞) o wartościach
π π
π π
− ,
, odwrotną do zacieśnienia funkcji tangens do przedziału
− ,
, nazy2 2
2 2
wamy arcusem tangensem i oznaczamy symbolem x 7→ arctg x.
Definicja 2.7.7 Funkcję określoną na przedziale (−∞, ∞) o wartościach w przedziale
(0, π), odwrotną do zacieśnienia funkcji cotangens do przedziału (0, π), nazywamy arcusem cotangensem i oznaczamy symbolem x 7→ arc ctg x.
Funkcje: arcus sinus, arcus cosinus, arcus tangens i arcus cotangens nazywamy funkcjami cyklometrycznymi .
Uwaga 2.7.8 Funkcje arcus sinus i arcus tangens są ściśle rosnące. Funkcje arcus cosinus i arcus cotangens – ściśle malejące. Ponadto Funkcje arcus sinus i arcus tangens są
nieparzyste. Wszystkie te funkcje są ograniczone.
π
π
Ze wzorów redukcyjnych: sin
− x = cos x oraz tg
− x = ctg x wynika, że
2
2
Uwaga 2.7.9 a) Dla dowolnej liczby −1 ≤ x ≤ 1 zachodzi równość arc cos x =
arc sin(−x).
π
b) Dla dowolnej liczby −∞ < x < ∞ zachodzi równość arc ctg x = + arctg (−x).
2
π
+
2
Na koniec podamy jeszcze wartości funkcji cyklometrycznych dla podstawowych argumentów.
35
x
arc sin x
arc cos x
x
arctg x
arc ctg x
2.8
1
2
π
6
π
3
0
0
π
2
√
√1
3
π
6
π
3
0
0
π
2
√
2
2
π
4
π
4
3
2
π
3
π
6
1
π
2
0
1
√
3
π
4
π
4
π
3
π
6
Funkcje hiperboliczne i funkcje area
Określimy teraz cztery funkcje, których nazwy są nieprzypadkowo zbieżne z nazwami funkcji trygonometrycznych.
Definicja 2.8.1 Niech x ∈ (−∞, +∞).
1
a) Sinusem hiperbolicznym nazywamy funkcję sinh : x 7→ (ex − e−x ).
2
1
b) Cosinusem hiperbolicznym nazywamy funkcję cosh : x 7→ (ex + e−x ).
2
c) Tangensem hiperbolicznym nazywamy funkcję tgh : x 7→
sinh x
.
cosh x
d) Cotangensem hiperbolicznym nazywamy funkcję ctgh : x 7→
1
.
tgh x
Wykażmy wpierw tożsamość, którą przez analogię do znanej tożsamości trygonometrycznej, wiążącej wartości funkcji sinus i cosinus, nazwiemy jedynką hiperboliczną.
Twierdzenie 2.8.2 Dla dowolnej liczby rzeczywistej różnica kwadratów funkcji hiperbolicznych cosinus i sinus jest równa jedności, tzn. zachodzi równość
∀x ∈ R : cosh2 x − sinh2 x = 1.
Dowód. Z definicji funkcji sinh i cosh mamy:
4(cosh2 x − sinh2 x) = (ex + e−x )2 − (ex − e−x )2
= (e2x + 2 + e−2x ) − (e2x − 2 + e−2x ) = 4,
stąd
∀x : cosh2 x − sinh2 x = 1.
W podobny sposób – wprost z definicji – można wykazać, że zachodzą następujące tożsamości analogiczne do znanych tożsamości trygonometrycznych:
cos(x + y) = cos x cos y − sin x sin y.
sin(x + y) = sin x cos y + cos x sin y,
□
36
Twierdzenie 2.8.3 Niech x, y będą dowolnymi liczbami rzeczywistymi. Wówczas:
a) sinh(x + y) = sinh x cosh y + cosh x sinh y,
b) cosh(x + y) = cosh x cosh y + sinh x sinh y.
Tożsamości te wykażemy w ramach ćwiczeń do tego modułu.
Uwaga 2.8.4 Dla dowolnej liczby rzeczywistej mamy:
cosh 2x = cosh2 x + sinh2 x = 2 cosh2 x − 1 = 1 + 2 sinh2 x,
sinh 2x = 2 sinh x cosh x.
Warto porównać otrzymane wzory z poznanymi w szkole analogicznymi wzorami dla
funkcji trygonometrycznych:
cos 2x = cosh2 x − sin2 x = 2 cos2 x − 1 = 1 − 2 sin2 x,
sin 2x = 2 sin x cos x.
Podkreślmy kilka własności funkcji hiperbolicznych.
Uwaga 2.8.5 a) Funkcja sinus hiperboliczny jest bijekcją R na R. Jest nieparzysta, ściśle
rosnąca.
b) Funkcja cosinus hiperboliczny jest określona na R i przyjmuje wartości w przedziale
[1, ∞). Jest funkcją parzystą. Nie jest różnowartościowa. Jej zacieśnienie do przedziału
[0, ∞) jest funkcją ściśle rosnącą.
c) Funkcja tangens hiperboliczny jest bijekcją R na przedział (−1, 1). Jest nieparzysta,
ściśle rosnąca.
d) Funkcja cotangens hiperboliczny jest bijekcją zbioru (−∞, 0)∪(0, +∞) na zbiór (−∞, −1)∪
(1, +∞). Jest nieparzysta, ściśle malejąca w przedziale (−∞, 0) i w przedziale (0, ∞) .
Określmy funkcje odwrotne do funkcji hiperbolicznych. Nazywamy je funkcjami area.
Definicja 2.8.6 a) Funkcję odwrotną do funkcji sinus hiperboliczny nazywamy area sinusem hiperbolicznym i oznaczamy x 7→ arsinh x.
b) Funkcję odwrotną do zacieśnienia funkcji cosinus hiperboliczny do przedziału [0, ∞)
nazywamy area cosinusem hiperbolicznym i oznaczamy x 7→ arcosh x.
c) Funkcję odwrotną do funkcji tangens hiperboliczny nazywamy area tangensem
hiperbolicznym i oznaczamy x 7→ artgh x.
d) Funkcję odwrotną do funkcji cotangens hiperboliczny nazywamy area cotangensem hiperbolicznym i oznaczamy x 7→ arctgh x.
Zwróćmy uwagę na tożsamości (kilka podobnych wykażemy w ramach ćwiczeń):
37
Uwaga 2.8.7 Prawdziwe
są następujące równości:
√
a) cos(arc sin x) = √
1 − x2 dla |x| ≤ 1,
b) cosh(arsinh x) = 1 + x2 dla −∞ < x < ∞.
π
π
Dowód. a) Niech y = arc sin x. Wówczas dla −1 ≤ x ≤ 1 mamy − ≤ y ≤ , czyli
2
2
0 ≤ cos y ≤ 1. Z jedynki trygonometrycznej wynika, że
q
p
cos y =
1 − sin2 y =
1 − x2 .
b) Należy powtórzyć powyższe rozumowanie stosując jedynkę hiperboliczną zamiast jedynki trygonometrycznej.
Funkcje area można wyrazić także za pomocą logarytmu naturalnego.
Twierdzenie 2.8.8 p
Zachodzą następujące tożsamości:
a) arsinh x = ln(x + px2 + 1) dla −∞ < x < ∞,
2
b) arcosh x = ln(x
r + x − 1) dla 1 ≤ x < ∞,
1+x
dla −1 < x < 1,
c) artgh x = ln
r1 − x
x+1
d) arctgh x = ln
dla |x| > 1.
x−1
Dowód. a) Wyznaczamy zmienną y z równania: x = sinh y. Mamy
ey − e−y
e2y − 1
=
.
2
ey
√
√
Stąd ey = x + x2 + 1, czyli arsinh x = ln(x + x2 + 1) dla wszystkich −∞ < x < ∞.
x =
b) Podobnie jak w
√ punkcie a) wyznaczamy zmienną
√ y z równania x = cosh y i otrzymujemy ey = x + x2 − 1, czyli arcosh x = ln(x + x2 − 1), dla x ≥ 1.
1+x
, czyli
1−x
r
1 1+x
1+x
artgh x = ln
= ln
2 1−x
1−x
c) Z równania x = artgh x dostajemy e2y =
dla |x| < 1.
d) Pamiętając, że ctgh x =
zmiennej x i otrzymujemy:
1
1
, podstawiamy w poprzedniej tożsamości
w miejsce
tgh x
x
s
arctgh x = ln
1 + x1
= ln
1 − x1
dla |x| > 1.
r
x+1
x−1
□
38
3
Algebra liniowa
3.1
Macierze
Definicja 3.1.1 Macierzą A o n-wierszach i m-kolumnach nazywamy tablicę liczb postaci


a11 a12 . . . a1m
 a21 a22 . . . a2m 


A= .
..
..  .
.
.
.
 .
.
.
. 
an1 an2 . . . anm
Wyraz aij ∈ R(C) jest elementem macierzy znajdującym się w i-tym wierszu i j-tej kolumnie. Powiemy, że macierz A jest wymiaru n × m, zbiór takich macierzy oznaczamy
¯
M(n, m).
Uwaga 3.1.2 Bardziej precyzyjnie macierz A ∈ M(n, m) możemy uważać za funkcję A :
{1, . . . , n} × {1, . . . , m} → R(C), wtedy A(i, j) = aij . Później wykażemy, że macierze mogą
być traktowane jako odwzorowania liniowe między przestrzeniami liniowymi.
Uwaga 3.1.3
1. Macierzą kwadratową nazywamy macierz, w której liczba wierszy
i kolumn jest taka sama n = m. Zbiór macierzy kwadratowych oznaczamy M(n) =
M(n, n). W macierzy kwadratowej wyróżniamy przekątną główną
 .
..

..



.
..
.

.

2. Macierzą identyczności
(jednostkową) nazywamy macierz In ∈ M(n), w której
1, i = j
(symbol Kroneckera), tzn.
aij = δij =
0, i ̸= j


1 0 ... 0
 0 1 ... 0 


In =  . . .
..  .
.
.
.
 . .
. . 
0 0 ... 1
3. Macierzą diagonalną (przekątniową) nazywamy macierz D ∈ M(n), w której
aij = 0 dla i ̸= j, tzn.


a1 0 . . . 0
 0 a2 . . . 0 


D= .
.. . .
..  .
 ..
.
.
. 
0
0
39
. . . an
4. Macierzą trójkątną nazywamy macierz T ∈ M(n), w której aij = 0 dla i > j lub
aij = 0 dla i < j, tzn.




a11 a12 . . . a1n
a11 0 . . . 0
 0 a22 . . . a2n 
 a21 a22 . . . 0 




T = .
lub T =  .

.
..
.
..  .
.
.
.
.
.
.
.
.
 .
 .
.
.
.
.
. 
. 
0
0 . . . ann
an1 an2 . . . ann
5. Macierzą zerowa nazywamy macierz O ∈ M(n, m), w której aij = 0, tzn.


0 0 ... 0
 0 0 ... 0 


0= . . .
. .
 .. .. . . .. 
0 0 ... 0
Dodawanie macierzy.
Definicja 3.1.4 Niech A, B ∈ M(n, m). Wtedy sumę macierzy A + B ∈ M(n, m) definiujemy jako
 
 


a11 . . . a1m
b11 . . . b1m
a11 + b11 . . . a1m + b1m


..  +  .. . .
..  = 
..
..
..
..
A + B =  ...
.
.
.
.
.   .
.  
.
.
an1 . . . anm
bn1 . . . bnm
an1 + bn1 . . . anm + bnm
Przykład 3.1.5

 
 

1 2
3
3 4 −5
4 6 −2
 0 −1 4  +  0 4 −4  =  0 3 0  .
7 5 −2
−2 0 1
5 5 −1
Obserwacja 3.1.6 Niech A, B, C ∈ M(n, m). Operacja dodawania
1. jest przemienna A + B = B + A;
2. jest łączna A + (B + C) = (A + B) + C;
3. posiada element neutrealny - macierz 0: A + 0 = 0 + A = A.
4. Każda macierz A = [aij ] posiada macierz przeciwną −A = [−aij ]: A + (−A) =
(−A) + A = 0.
5. (M(n, m), +) jest grupą przemienną.
Mnożenie macierzy przez liczby.
40
Definicja 3.1.7 Niech A ∈ M(n, m) i t ∈ R. Wtedy iloczyn macierzy przez liczbę
t · A ∈ M(n, m) definiujemy jako

 

ta11 . . . ta1m
a11 . . . a1m

..  .
..  =  ..
..
..
t · A = t ·  ...
.
.
. 
.   .
tan1 . . . tanm
an1 . . . anm
Przykład 3.1.8

 

1 2
3
4
8 12
4  0 −1 4  =  0 −4 16  .
7 5 −2
28 20 −8
Obserwacja 3.1.9 Niech A, B, C ∈ M(n, m), t, s ∈ R. Wtedy
1. t(A + B) = tA + tB;
2. (t + s)A = tA + sA;
3. s(tA) = (st)A;
4. 1 · A = A;
5. (M(n, m), +.·) jest przestrzenią wektorową (liniową).
Mnożenie macierzy.
Definicja 3.1.10 Niech A ∈ M(n, m), B ∈ M(m, k). Wtedy iloczyn macierzy AB = C ∈
M(n, k) definiujemy jako

 
 

a11 . . . a1m
b11 . . . b1k
c11 . . . c1k

..  ·  ..
..  =  ..
..  = C,
..
..
..
A · B =  ...
.
.
.
.   .
.   .
. 
an1 . . . anm
bm1 . . . bmk
cn1 . . . cnk
gdzie
cij = ai1 b1j + ai2 b2j + · · · + aim bmj .
Przykład 3.1.11
1 −1 2
0 3 1


1
2
−1
−2
2 =
· 0
.
−1 5
−1 −1
Obserwacja 3.1.12 Operacja mnożenia
1. nie jest przemienna A · B ̸= B · A;
41
2. jest łączna A · (B · C) = (A · B) · C;
3. posiada element neutralny macierz identyczności: A·Im = In ·A = A, A ∈ M(n, m);
4. jest rozdzielna względem dodawania A(B + C) = AB + AC, (A + B)C = AC + BC.
Transponowanie macierzy.
Definicja 3.1.13 Niech A ∈ M(n, m). Macierz transponowaną AT = [bij ] ∈ M(m, n)
do macierzy A definiujemy jako bij = aji , tzn.

a11
 ..
T
A = .
an1

T 
a11 . . . an1
. . . a1m
..  .
..  =  ..
..
..
 .
.
.
. 
. 
a1m . . . anm
. . . anm
Przykład 3.1.14
T


1 2
3
1
0
7
3
 0 −1 4 



4 .
 7 5 −2  = 2 −1 5
3 4 −2 −5
3 4 −5

Obserwacja 3.1.15 Niech A, B będą macierzami, t ∈ R. Wtedy
1. (AT )T = A;
2. (A + B)T = AT + B T ;
3. (tA)T = tAT ;
4. (AB)T = B T AT ;
5. transponowanie macierzy kwadratowej, prowadzi do macierzy kwadratowej i polega
na symetrycznym odbiciu jej wyrazów względem przekątnej głównej;
6. InT = In ;
7. jeżeli D jest macierzą diagonalną, to DT = D;
8. transponowanie macierzy trójkątnej prowadzi do macierzy trójkątnej.
Wyznacznik macierzy.
42
Definicja 3.1.16 Wyznacznikiem macierzy kwadratowej A = [aij ] ∈ M(n) nazywamy
liczbę
X
det A =
sgn (σ)a1σ(1) a2σ(2) . . . anσ(n) ,
σ∈Σn
gdzie Σn jest zbiorem permutacji n-elementowych, sgn (σ) jest znakiem permutacji σ.
Metody obliczania wyzaczników
Reguła Sarrusa
Reguła Sarrusa ma zastosowanie tylko dla n = 1, 2, 3.
n = 1 Wtedy det[a] = a.
n = 2 Wtedy wyznacznik jest równy różnicy iloczynu wyrazów na przekątnej głównej i
wyrazów na "innej" przekątnej
a b
a b
= ad − bc.
=
det
c d
c d
n = 3 Wtedy dopisujemy z prawej strony wyznacznika dwie pierwsze kolumny (lub dopisujemy pod spodem dwa pierwsze wiersze). W ten sposób otrzymamy trzy przekątne
główne i trzy "inne" przekątne. Wyznacznik jest równy sumie iloczynów wyrazów na
przekątnych wziętych ze znakiem plus na przekątnych głównych i ze znakiem minus
na "innych" przekątnych.


a b c
a b c
a b
x y = (ayγ + bzα + cxβ) − (cyα + azβ + bxγ).
det  x y z  = x y z
α β γ
α β γ α β
Przykład 3.1.17


1 2 3
det  0 −3 3  =
1 −1 1
1 2 3
0 −3 3
1 −1 1
1 2
0 −3 = −3 + 6 + 0 − (−9 − 3 + 0) = 15
1 −1
Rozwinięcie Laplace’a
Definicja 3.1.18 Niech A ∈ M(n, m) i niech 1 ≤ k ≤ min(n, m). Wybierzmy z macierzy
A k kolumn i k wierszy i z wyrazów stojących na ich przecięciu utwórzmy macierz B.
Wyznacznik det B nazywamy minorem stopnia k macierzy A.
43
Przykład 3.1.19 W poniższej macierzy


1 2 3
 0 −3 3 

A=
 1 −1 1 
3 4 7
wybierzmy pierwszy i trzeci wiersz oraz drugą i trzecią kolumnę. Wtedy
det B =
2 3
−1 1
=2+3=5
jest minorem stopnia 2 macierzy A.
Definicja 3.1.20 Niech A ∈ M(n) będzie macierzą kwadratową. Wybierzmy dowolny wyraz aij macierzy A. Skreślmy z macierzy A i-wiersz i j-ta kolumę w ten sposób otrzymamy
macierz Bij . Dopełnieniem algebraicznym wyrazu aij nazywamy
Aij = (−1)i+j det Bij .
Twierdzenie 3.1.21 (Rozwinięcie Laplace’a) Niech A ∈ M(n). Wtedy
1. dla dowolnego i = 1, . . . , n
det A = ai1 Ai1 + ai2 Ai2 + · · · + ain Ain (rozwinięcie względem i-tego wiersza);
2. dla dowolnego j = 1, . . . , n
det A = a1j A1j + a2j A2j + · · · + anj Anj (rozwinięcie względem j-tej kolumny).
Przykład 3.1.22 Poniższy wyznacznik rozwiniemy względem trzeciego wiersza.
1
1
1
2
1 0
0
1 2 −1
0 0
1
3 −1 0
0 · (−1)3+3
= 1 · (−1)3+1
1 1 0
1 1 −1
2 3 0
1 0
0
1 2 −1
3 −1 0
+ 1 · (−1)3+4
+ 0 · (−1)3+2
1 1 0
1 1 2
2 3 −1
= −1 + 0 + 0 + 2 = 1.
Metoda przekształceń elementarnych
Obserwacja 3.1.23 Niech A, B ∈ M(n), t ∈ R.
1. det A = det(AT );
44
1 0
0
1 2 −1 +
2 −1 0
2. det(AB) = det A det B;
3. det(tA) = tn det A;
4. det In = 1;
5. Wyznacznik macierzy diagonalnej jest równy iloczynowi wyrazów na przekątnej głównej


a1 0 . . . 0
 0 a2 . . . 0 


det  .
.. . .
..  = a1 a2 . . . an .
 ..
. . 
.
0
0
. . . an
6. Wyznacznik macierzy trójkątnej jest równy iloczynowi wyrazów na przekątnej głównej


a11 a12 . . . a1n
 0 a22 . . . a2n 


det  .
..
..  = a11 a22 . . . ann ;
..
 ..
.
.
. 
0
0
. . . ann
7. Przestawienie dwóch kolumn wyznacznika zmienia wartość wyznacznika na przeciwną.
8. Pomnożenie kolumny wyznacznika przez pewną liczbę powoduje pomnożenie wartości
wyznacznika przez tę liczbę.
9. Jeżeli do kolumny wyznacznika dodamy
a) inną kolumnę tego wyznacznika lub,
b) inną kolumnę tego wyznacznika pomożoną przez pewną liczbę lub,
c) dowolna kombinację liniową innych kolumn tego wyznacznika, to
wartość wyznacznika nie ulegnie zmianie.
10. Jeżeli wyznacznik zawiera
a) kolumnę zerową lub
b) dwie identyczne kolumn, to
wyznacznik jest równy zero.
11. Własności opisane w punktach (7)-(10) są również prawdziwe dla wierszy wyznacznika.
12. Metoda przekształceń elementarnych. Każdą macierz kwadratową można sprowadzić za pomocą przekształceń elementarnych opisanych w punktach (7)-(11) do
macierzy diagonalnej (jeżeli det A ̸= 0, to do macierzy identyczności).
45
Przykład 3.1.24
1
1
1
2
−
−
1 0
0
1 2 −1
0 0
1
3 −1 0
W2 − W1
=
W3 − W1
W4 − 2W1
1 1
0
0
0 1 −1 0
0 −1 0
1
0 0
2 −1
1
0
0
0
1 0 0
1 −1 0
0 −1 1
0 0 1
W3 + W2
1 1
0
0
0 0
2 −1
0 −1 0
1
0 1 −1 0
1
0
=−
0
0
=
W4 ↔ W2
1 0
0
1 −1 0
0 −1 1
0 2 −1
=
W4 + 2W3
= −(1 · 1 · (−1) · 1) = 1.
Odwracanie macierzy.
Definicja 3.1.25 Macierz A ∈ M(n) nazywamy odwracalną, gdy posiada macierz odwrotną A−1 ∈ M(n) taką, że
AA−1 = In
i A−1 A = In .
Jeżeli det A ̸= 0, to A nazywamy macierzą nieosobliwą, jeżeli natomiast det A = 0, to
A nazywamy macierzą osobliwą.
Twierdzenie 3.1.26 Niech A ∈ M(n). Macierz A jest odwracalna wtedy i tylko wtedy,
gdy A jest nieosobliwa. Wtedy

T
A11 . . . A1n
1  .
..  .
..
A−1 =
 ..
.
. 
det A
An1 . . . Ann
Przykład 3.1.27 Niech


1 1 −1
0 ,
A= 2 1
1 −1 1
wtedy det A = 2. Mamy również
A11 = (−1)1+1
1 0
−1 1
A21 = (−1)2+1
1 −1
−1 1
A31 = (−1)3+1
1 −1
1 0
= 1, A12 = (−1)1+2
= 0, A22 = (−1)2+2
= 1, A32 = (−1)3+2
46
2 0
1 1
= −2, A13 = (−1)1+3
1 −1
1 1
1 −1
2 0
2 1
1 −1
= −3,
= 2, A23 = (−1)2+3
1 1
1 −1
= 2,
= −2, A33 = (−1)3+3
1 1
2 1
= −1.
Wtedy

T  1

1 −2 −3
0 12
2
1
2  =  −1 1 −1  .
A−1 =  0 2
2
1 −2 −1
− 32 1 − 12
Obserwacja 3.1.28 Niech A, B ∈ M(n) będą macierzami nieosobliwymi, t ̸= 0. Wtedy
1. (A−1 )−1 = A;
2. det(A−1 ) = det1 A ;
3. (AT )−1 = (A−1 )T ;
4. (tA)−1 = 1t A−1 ;
5. (AB)−1 = B −1 A−1 ;
6. In−1 = In ;
7. jeżeli D jest macierzą diagonalną nieosobliwą, to
−1  1
a1 0 . . . 0
a1
 0 a2 . . . 0 
 0



D−1 =  .
.. . .
..  =  ..
 ..

 .
.
.
.
0 0 . . . an
0

0
1
a2
..
.
0
...
...
..
.
...
0
0
..
.
1
an



.

Przykład 3.1.29 Metoda Gaussa odwracania macierzy polega na obserwacji, że te same przekształcenia elementarne, które przekształcają daną macierz A w macierz identyczności In jednocześnie przekształcają macierz identyczności In w macierz odwrotną A−1 .



.
.
−1 .. 1 0 0
1 1 −1 .. 1 0 0




..
..
 W2 − 2W1 ⇝ 

⇝
[A|In ] = 
2
1
0
.
0
1
0
0
−1
2
.
−2
1
0




W3 − W1
W3 − 2W2
..
..
1 −1 1 . 0 0 1
0 −2 2 . −1 0 1




..
.
1
1
1
0 0
1
−
1
1
0
.
−
1 1 −1 .. 1
2
2  W1 + W2

 W1 − 2 W3

..
..


 W2 + W3 ⇝ 
 0 −1 0 . 1 −1 1 
 0 −1 2 . −2 1 0 
⇝
.
.
0 0 −2 .. 3 −2 1
0 0 −2 .. 3 −2 1




.
.
1 0
0 .. 12 0 12
1 0 0 .. 12 0 12




..
..
−1




 0 −1 0 . 1 −1 1  = (−1) · (−2)  0 1 0 . −1 1 −1  = det A[In |A ].
.
.
0 0 −2 .. 3 −2 1
0 0 1 .. − 23 1 − 12

1
1
47
3.2
Cramerowskie układy równań liniowych.
W szkole średniej poznaliśmy następujące metody rozwiązywania równań liniowych: metoda podstawiania i metoda przeciwnych współczynników. W tym wykładzie nie będziemy
omawiać tych metod. Przedtawimy metodę Cramera rozwiązywania za pomocą wyznaczników układu równań liniowych. Chcemy rozwiązać poniższy układ n równań liniowych o
n zmiennych x1 , . . . , xn :

 a11 x1 + a12 x2 + · · · + a1n xn = b1
................................. .
(3.2.1)

an1 x1 + an2 x2 + · · · + ann xn = bn
Macierz A ∈ M(n) utworzoną ze współczynników powyższego układu równań nazywamy
macierzą główną układu równań


a11 . . . a1n

..  ,
..
A =  ...
.
. 
an1 . . . ann
macierze utworzone z wyrazów wolnych bj i ze zmiennych xj nazywamy odpowiednio kolumną wyrazów wolnych i kolumną zmiennych




b1
x1




B =  ...  , X =  ...  .
bn
xn
Zauważmy, że Cramerowski układ równań liniowych (3.2.1) jest równoważny z poniższym
równaniem macierzowym
AX = B.
Powyższe równanie możemy rozwiązać (pod warunkiem, że macierz A jest nieosobliwa)
mnożąc przez macierz odwrotną A−1 z lewej strony równania
X = A−1 B.
Jest to pierwszy sposób rozwiązania Cramerowskiego układu równań liniowych. Metoda ta
niestety nie działa dla macierzy osobliwych.
Teraz podamy metodę Cramera rozwiązywania układów równań liniowych. Zdefiniujmy
wyznaczniki Cramera




b1 . . . a1n
a11 . . . b1

..  , . . . , det A = det  ..
. 
..
det A1 = det  ... . . .
 .
n
. ..  .
. 
bn . . . ann
an1 . . . bn
Zauważmy, że macierze Cramera A1 , . . . , An powstają poprzez zastąpienie kolejnych
kolumn macierzy A kolumną wyrazów wolnych B.
Poniższe twierdzenie podaje sposób rozwiązania równania liniowego za pomocą wyznaczników Cramera.
48
Twierdzenie 3.2.1 (Twierdzenie Cramera) Cramerowski układ równań liniowych (3.2.1):
1. ma dokładnie jedno rozwiązanie (jest oznaczony) wtedy i tylko wtedy, gdy det A ̸=
0. Wtedy rozwiązania tego układu są dane wzorami
x1 =
det A1
det An
, . . . , xn =
;
det A
det A
2. nie ma rozwiązań (jest sprzeczny), gdy det A = 0 i istnieje k ∈ {1, . . . , n} takie, że
det Ak ̸= 0;
3. ma nieskończenie wiele rozwiązań (jest nieoznaczony) lub jest sprzeczny, gdy det A =
det A1 = · · · = det An = 0.
Przykład 3.2.2 Rozwiążmy poniższy układ równań metodą Cramera.

 x + 2y + 3z = 14
3x + y + 2z = 11 .

2x + 3y + z = 11
Mamy




 
1 2 3
14
x
A =  3 1 2  , B =  11  , X =  y  ,
2 3 1
11
z
Policzmy wyznaczniki det A = 18 i wyznaczniki Cramera
det Ax =
14 2 3
11 1 2
11 3 1
= 18, det Ay =
1 14 3
3 11 2
2 11 1
= 36, det Az =
1 2 14
3 1 11
2 3 11
= 54.
Rozwiązaniami są
x=
det Ay
18
36
det Az
54
det Ax
=
= 1, y =
=
= 2, z =
=
= 3.
det A
18
det A
18
det A
18
Metoda Cramera jest bardzo skuteczna przy rozwiązywaniu układ równań liniowych z
parametrem.
Przykład 3.2.3 Rozwiążmy poniższy układ równań liniowych z parametrem k.
2x − (k + 3)y = 3
.
kx + y = 5k
Mamy
A=
2 −k − 3
k
1
Policzmy wyznaczniki det A = k 2 + 3k + 2.
49
, B=
3
5k
.
1. Jeżeli k ̸= −1 i k ̸= −2, to det A ̸= 0 i układ równań jest oznaczony, wyznaczniki
Cramera są równe
det Ax =
3 −k − 3
5k
1
Rozwiązaniami są
x=
= 5k 2 + 15k + 3, det Ay =
2 3
k 5k
= 7k.
5k 2 + 15k + 3
7k
, y= 2
.
k 2 + 3k + 2
k + 3k + 2
2. Jeżeli k = −1, to det A = 0 i det Ay = −7 ̸= 0, czyli układ jest sprzeczny.
3. Jeżeli k = −2, to det A = 0 i det Ay = −14 ̸= 0, czyli układ jest sprzeczny.
Przykład 3.2.4 Rozwiążemy teraz układ równań metodą Gaussa.


 x + 2y + 3z = 14 R1 + 2R3
 x + 2y + 3z = 14
−5y − 7z = −31 R2 − 5R3 ⇝
3x + y + 2z = 11 R2 − 3R1 ⇝


−y − 5z = −17
2x + 3y + z = 11 R3 − 2R1



 x − 7z = −20
 x − 21 = −20
 x=1
18z = 54
z=3
z=3 .
⇝
⇝



−y − 5z = −17
−y − 15 = −17
y=2
Interpretacja geometryczna układów równań.
Równanie liniowe geometrycznie opisuję prostą (dla n = 2) i płaszczyznę dla n = 3 (w
wyższych wymiarach jest to hiperpłaszczyzna).
Układ dwóch równań z dwiema niewiadomymi
1. oznaczony odpowiada dwóm prostym przecinającym się na płaszczyźnie;
2. nieoznaczony odpowiada jednej (podwójnej prostej) na płaszczyźnie;
3. sprzeczny odpowiada dwóm prostym równoległym na płaszczyźnie.
3.3
Rząd macierzy
Definicja 3.3.1 Niech A ∈ M(n, m). Rzędem macierzy A nazywamy stopień największego
niezerowego minora macierz A. Rząd macierzy A oznaczamy r(A) (rank A).
Przykład 3.3.2 Niech


1 2 1
4
A =  0 1 −1 3  .
2 5 1 11
50
Z macierzy A można wybrać cztery minory stopnia trzy:
2 1
4
1 −1 3
5 1 11
=
1 1
4
0 −1 3
2 1 11
=
1 2 4
0 1 3
2 5 11
=
1 2 1
0 1 −1
2 5 1
= 0,
z czego wynika, że r(A) nie może być równy trzy. Łatwo jest wybrać niezerowy minor
stopnia dwa
1 2
= 1 ̸= 0,
0 1
z czego wynika, że r(A) = 2.
Obserwacja 3.3.3 Niech A ∈ M(n, m), t ̸= 0. Wtedy
1. 0 ≤ r(A) ≤ min(n, m);
2. r(A) = 0 wtedy i tylko wtedy, gdy A = 0;
3. r(AT ) = r(A);
4. r(tA) = r(A);
5. jeżeli A ∈ M(n), to r(A) = n wtedy i tylko wtedy, gdy det A ̸= 0.
6. Następujące operacje nie zmieniają rzędu macierzy
a) przestawienie dwóch kolumn (wierszy) macierzy;
b) pomnożenie kolumny (wiersza) macierzy przez liczbę różną od zera;
c) dodanie do kolumny (wiersza) macierzy innej kolumny (innego wiersza);
d) dodanie do kolumny (wiersza) macierzy kombinacji liniowej innych kolumn (wierszy).
Przykład 3.3.4




1 2 1
4
1 2 1 4
rank  0 1 −1 3 
= rank  0 1 −1 3 
=
2 5 1 11
W3 − 2W1
0 1 −1 3
W3 − W2


1 2 1 4
1 2 1 4


rank 0 1 −1 3 = rank
= 2.
0 1 −1 3
0 0 0 0
51
3.4
Układy równań liniowych
Chcemy rozwiązać poniższy układ m równań liniowych o n zmiennych x1 , . . . , xn :

 a11 x1 + a12 x2 + · · · + a1n xn = b1
.................................
.
(3.4.1)

am1 x1 + am2 x2 + · · · + amn xn = bm
Macierz A ∈ M(m, n) utworzoną ze współczynników powyższego układu równań nazywamy
macierzą główną układu równań


a11 . . . a1n

..  ,
..
A =  ...
.
. 
am1 . . . amn
macierze utworzone z wyrazów wolnych bj i ze zmiennych xj nazywamy odpowiednio kolumną wyrazów wolnych i kolumną zmiennych




b1
x1




B =  ...  , X =  ...  .
bm
xn
Zauważmy, że układ równań liniowych (3.4.1) jest równoważny z poniższym równaniem
macierzowym
AX = B.
Do rozwiązania tego układu równań potrzebna nam będzie macierz rozszerzona układu
równań


a11 . . . a1n b1

..
..  .
..
D = [A|B] =  ...
.
.
. 
am1 . . . amn bm
Zauważmy, że zawsze r(D) ≥ r(A).
Twierdzenie 3.4.1 (Twierdzenie Kroneckera-Capellego) Układ równań (3.4.1) jest
1. oznaczony wtedy i tylko wtedy, gdy r(A) = r(D) = n;
2. nieoznaczony wtedy i tylko wtedy, gdy r(A) = r(D) < n, w tym przypadku rozwiązania zależą od n − r(A) liczby parametrów;
3. sprzeczny wtedy i tylko wtedy, gdy r(A) < r(D).
Uwaga 3.4.2 Jeżeli w układzie równań jest więcej zmiennych niż równań, to układ nie
może być oznaczony.
Na przykładzie pokażemy jak rozwiązywać efektywnie układy równań korzystając z
twierdzeń Cramera i Kroneckera-Capellego.
52
Przykład 3.4.3 Rozwiązać układ równań
2x − 4y + 8z − 6u = 7
.
5x − 10y + 20z = 12
Mamy
A=
2 −4 8 −6
5 −10 20 0
, D=
2 −4 8 −6 7
5 −10 20 0 12
.
Zauważmy, że r(A) = r(D) = 2, gdyż minor stojący na przecięciu pierwszego i drugiego
wiersza oraz trzeciej i czwartej kolumny jest równy 120. Z tego wynika, że układ równań
jest nieoznaczony, a rozwiązania zależą od 4 − r(A) = 2 parametrów. Aby móc zastosować
twierdzenie Cramera musimy przekształcić nasz układ równań. Do wyznaczenia maksymalnego niezerowego minora wybraliśmy kolumny trzecią i czwartą. Kolumny te odpowiadają
zmiennym z i u - to będą nasze nowe zmienne. Natomiast x i y będą parametrami. Dostajemy następujący układ dwóch równań z dwoma zmiennymi z, u i dwoma parametrami x,
y:
8z − 6u = 7 − 2x + 4y
.
20z = 12 − 5x + 10y
Macierz główna i kolumna wyrazów wolnych są równe
8 −6
7 − 2x + 4y
.
à =
, B̃ =
12 − 5x + 10y
20 0
Mamy det à = 120 oraz
det Ãz =
7 − 2x + 4y −6
12 − 5x + 10y 0
= 72−30x+60y, det Ãu =
8
7 − 2x + 4y
20 12 − 5x + 10y
= −44.
W końcu otrzymujemy
z=
72 − 30x + 60y
44
, u=−
, x, y − parametry.
120
120
Uwaga 3.4.4
1. Zauważmy, że przy rozwiązywaniu poprzedniego układu równań mogliśmy wybrać inny minor, np. wybrany z drugiej i czwartej kolumny. Wtedy nowymi
zmiennymi byłyby y i u, zaś x i z byłyby parametrami. W ten sposób dostaniemy
"inne" rozwiązanie. Zbiór rozwiązań w tym przypadku jest taki sam, ma tylko inny
opis parametryczny.
2. Jeżeli przy rozwiązywaniu jakiegoś układu równań przy znajdowaniu maksymalnego
minora nie uwzględniliśmy jakiegoś wiersza, to równanie odpowiadające temu wierszowi możemy skreślić, pominąć. Ono nie wnosi żadnej nowej informacji do tego
układu równań.
53
3.5
Przestrzenie wektorowe
W rozdziale będziemy rozważać przestrzenie wektorowe nad ciałem R, tzn. zbiory wyposażone w dwa działania: dodawania wektorów i mnożenia wektorów przez liczby
rzeczywiste. W naszych rozważaniach skupimy się na przestrzeniach euklidesowych
rzeczywistych (i zespolonych) Rn (Cn ), ale większość faktów jest również prawdziwa
dla dowolnych przestrzeni wektorowych.
Definicja 3.5.1 W przestrzeni Rn określamy działania
1. dodawania, dla x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn
x + y = (x1 + y1 , . . . , xn + yn ) ∈ Rn ;
2. mnożenia przez liczby, dla x = (x1 , . . . , xn ) ∈ Rn , t ∈ R
tx = (tx1 , . . . , txn ) ∈ Rn .
Przestrzeń (Rn , +, ·) jest przestrzenią wektorową. Elementem neutralnym dodawania
jest wektor zerowy 0 = (0, . . . , 0).
Uwaga 3.5.2 Przestrzeń Rn możemy utożsamić z przestrzenią macierzy M(1, n) lub M(n, 1)
i dlatego czasami dla wygody będziemy zapisywać wektory z przestrzeni Rn w postaci


x1


x = (x1 , . . . , xn ) = x1 . . . xn =  ...  .
xn
Definicja 3.5.3 Normą (długością) wektora x = (x1 , . . . , xn ) ∈ Rn nazywamy
q
||x|| = x21 + · · · + x2n .
Obserwacja 3.5.4 Niech x, y ∈ Rn , t ∈ R. Wtedy
1. ||x|| ≥ 0;
2. ||x|| = 0 wtedy i tylko wtedy, gdy x = 0;
3. ||tx|| = |t|||x|| (jednorodność);
4. ||x + y|| ≤ ||x|| + ||y|| (nierówność trójkąta).
Uwaga 3.5.5 W dowolnej przestrzeni wektorowej X każde odwzorowanie || · || : X →
[0, +∞) spełniające warunki (1)-(4) nazywamy normą.
Definicja 3.5.6 Iloczynem skalarnym wektorów x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈
Rn nazywamy
⟨x, y⟩ = x1 y1 + · · · + xn yn
54
Obserwacja 3.5.7 Niech x, y, z ∈ Rn , t, s ∈ R. Wtedy
1. ⟨x, x⟩ ≥ 0;
2. ⟨x, x⟩ = 0 wtedy i tylko wtedy, gdy x = 0;
3. ⟨x, y⟩ = ⟨y, x⟩ (symetria);
4. ⟨tx + sy, z⟩ = t ⟨x, z⟩ + s ⟨y, z⟩ (liniowość).
Uwaga 3.5.8 W dowolnej przestrzeni wektorowej X każde odwzorowanie ⟨·, ·⟩ : X × X →
R spełniające warunki (1)-(4) nazywamy iloczynem skalarnym.
Uwaga 3.5.9 Zauważmy, że w dowolnej przestrzeni wektorowej X każdy iloczyn skalarny
definiuje normę
p
||x|| = ⟨x, x⟩.
Wszystkie warunki są oczywiste, za wyjątkiem nierówności trójkąta która wynika z nierówności Cauchy’eo-Schwarza
(⟨x, y⟩)2 ≤ ⟨x, x⟩ ⟨y, y⟩
lub równoważnie
| ⟨x, y⟩ | ≤ ||x|||y||.
Definicja 3.5.10 Korzystając z iloczynu skalarnego można zdefiniować kąt α(x, y) między
wektorami x, y ∈ Rn \ {0} jako
cos(α(x, y)) =
⟨x, y⟩
.
||x||||y||
Mówimy, że wektory są prostopadłe (ortogonalne) x ⊥ y, gdy α(x, y) = π2 , tzn. ⟨x, y⟩ =
0. Mówimy, że wektory są równoległe x ∥ y, gdy α(x, y) = 0.
Definicja 3.5.11 Iloczynem wektorowym wektorów u = (u1 , u2 , u3 ), v = (v1 , v2 , v3 ) ∈
R3 wektor u × v o długości ||u||||v|| sin(α(u, v)) prostopadły do płaszczyzny, w której leżą
u i v i taki, że u, v, u × v jest trójką dodatnio zorientowaną. Iloczyn wektorowy jest równy
e1 e2 e3
u × v = det u1 u2 u3
v1 v2 v3
= (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ),
gdzie e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1).
Przykład 3.5.12 Niech u = (1, 0, 2) i v = (−2, 2, 1). Wtedy ||u|| =
0, czyli wektory są prostopadłe. Ponadto
e1 e2 e3
0 2
u × v = det 1
−2 2 1
√
5, ||v|| = 3, ⟨u, v⟩ =
= −4e1 − 5e2 + 2e3 = (−4, −5, 2).
55
3.6
Baza przestrzeni wektorowej
Definicja 3.6.1 Mówimy, że wektory v1 , . . . , vk ∈ Rn są liniowo zależne, gdy istnieją
liczby x1 , . . . , xk nie wszystkie równe zero takie, że
x1 v1 + · · · + xk vk = 0.
W przeciwnym razie mówimy, że wektory są liniowo niezależne, tzn.
x1 v1 + · · · + xk vk = 0 ⇒ x1 = · · · = xk = 0.
(3.6.1)
Przykład 3.6.2 Wektory v1 = (1, 2), v2 = (1, 0), v3 = (0, −1) są liniowo zależne, bo
v1 − v2 + 2v3 = 0.
Niech v1 = (v11 , . . . , vn1 ), . . . , vk = (v1k , . . . , vnk ). Wtedy warunek (3.6.1) jest równoważny z układem równań

 v11 x1 + · · · + v1k xk = 0
........................ .
(3.6.2)

vn1 x1 + · · · + vnk xk = 0
Liniowa niezależność oznacza, że układ równań (3.6.2) ma tylko rozwiązanie zerowe. Niech
V będzie macierzą utworzoną z wektorów v1 , . . . , vk :


v11 . . . v1k

..  .
..
V = [v1 . . . vk ] =  ...
.
. 
vn1 . . . vnk
Z Twierdzenia Kroneckera-Capellego wynika następująca obserwacja.
Obserwacja 3.6.3
1. Jeżeli k > n, to wektory v1 , . . . , vk są liniowo zależne.
2. Jeżeli k ≤ n, to wektory v1 , . . . , vk są liniowo niezależne wtedy i tylko wtedy, gdy
r(V ) = k.
Definicja 3.6.4 Mówimy, że wektory v1 , . . . , vk ∈ Rn generują Rn , gdy dla dowolnego
b ∈ Rn istnieją liczby x1 , . . . , xk takie, że
x1 v1 + · · · + xk vk = b.
(3.6.3)
Niech v1 = (v11 , . . . , vn1 ), . . . , vk = (v1k , . . . , vnk ). Wtedy warunek (3.6.3) jest równoważny z układem równań

 v11 x1 + · · · + v1k xk = b1
........................ .
(3.6.4)

vn1 x1 + · · · + vnk xk = bn
56
Generowanie przestrzeni Rn oznacza, że układ równań (3.6.4) ma rozwiązanie dla dowolnego b ∈ Rn . Niech V będzie macierzą utworzoną z wektorów v1 , . . . , vk :


v11 . . . v1k

..  .
..
V = [v1 . . . vk ] =  ...
.
. 
vn1 . . . vnk
Z Twierdzenia Kroneckera-Capellego wynika następująca obserwacja.
Obserwacja 3.6.5
1. Jeżeli k < n, to wektory v1 , . . . , vk nie generują przestrzeni Rn .
2. Jeżeli k ≥ n, to wektory v1 , . . . , vk generują Rn wtedy i tylko wtedy, gdy r(V ) = n.
Definicja 3.6.6 Mówimy, że wektory v1 , . . . , vk ∈ Rn tworzą bazę Rn , gdy są liniowo
niezależne i generują Rn .
Obserwacja 3.6.7 Wektory v1 , . . . , vk tworzą bazę Rn wtedy i tylko wtedy, gdy n = k
oraz det V ̸= 0.
Definicja 3.6.8 Powiemy, że baza {v1 , . . . , vn } w Rn jest
• otogonalna, gdy ⟨vj , vk ⟩ = 0, j ̸= k,
• ortonormalna, gdy ⟨vj , vk ⟩ = δj,k .
Przykład 3.6.9 Bazą kanoniczną w Rn nazywamy układ wektorów
e1 = (1, 0, . . . , 0), e2 = (0, 1, 0 . . . , 0), . . . , en = (0, . . . , 0, 1).
Zauważmy również, że
In = [e1 e2 . . . en ]
oraz dla dowolnego b = (b1 , . . . , bn ) ∈ Rn mamy
b = b1 e1 + b2 e2 + · · · + bn en .
Baza kanoniczna jest ortonormalna.
Przykład 3.6.10 Wektory v1 = (1, 1, 1), v2 = (1, 1, 0) i v3 = (1, 0, 0) tworzą bazę R3 ,
gdyż
1 1 1
det V = det 1 1 0 = −1 ̸= 0.
1 0 0
Ponadto dla dowolnego b = (b1 , b2 , b3 ) ∈ R3 mamy
b = b3 v1 + (b2 − b3 )v2 + (b1 − b2 )v3 .
Ta baza nie jest ortogonalna.
57
3.7
Odwzorowania liniowe
Definicja 3.7.1 Odwzorowanie f : Rm → Rn nazywamy odwzorowaniem liniowym,
gdy
∀ x, y ∈ Rm : f (x + y) = f (x) + f (y);
∀ x ∈ Rm ∀ t ∈ R : f (tx) = tf (x).
Innymi słowy odwzorowania liniowe zachowują strukturę przestrzeni wektorowych.
Odwzorowanie g : Rm → Rn nazywamy odwzorowaniem afinicznym, gdy istnieje f
odwzorowanie liniowe i v ∈ Rn takie, że
g(x) = f (x) + v.
Przykład 3.7.2
1. Odwzorowanie f1 : R3 → R3 dane wzorem
f1 (x, y, z) = (x + y, z − 4x, 7y + 4z)
jest liniowe;
2. Odwzorowanie f2 : R3 → R dane wzorem
f2 (x, y, z) = 3x − 5y + 10z
jest liniowe;
3. Odwzorowanie f3 : R → R4 dane wzorem
f3 (x) = (2x, 4x, 0, −x)
jest liniowe;
4. Odwzorowanie f4 : R2 → R2 dane wzorem
f4 (x, y) = (x, 3)
nie jest liniowe, jest afiniczne;
5. Odwzorowanie f5 : R3 → R3 dane wzorem
f5 (x, y, z) = (x2 , z 3 − y 2 , sin(2xyz))
nie jest liniowe;
6. Każde odwzorowanie liniowe f : R → R jest postaci f (x) = ax.
Pokażemy, że każde odwzorowanie liniowe f : Rm → Rn jest dane przez pewną macierz
A ∈ M(n, m).
Niech A ∈ M(n, m), wtedy można zdefiniować odwzorowanie liniowe fA : Rm → Rn
wzorem


x1


fA (x) = A ·  ...  .
xm
58
Liniowość wynika z własności dodawania i mnożenia macierzy przez liczby.
Odwrotnie, niech f : Rm → Rn będzie odwzorowaniem liniowym. Niech e1 , . . . , em bazą
w przestrzeni Rm . Wtedy
f (x) = f (x1 e1 + · · · + xm em ) = x1 f (e1 ) + · · · + xm f (em ).
Niech
f (e1 ) = (a11 , . . . , an1 ), . . . , f (ej ) = (a1j , . . . , anj ), . . . , f (em ) = (a1m , . . . , anm ),
wtedy
Przykład 3.7.3

a11 . . . a1m

..  .
..
Af = f (e1 ) . . . f (em ) =  ...
.
. 
an1 . . . anm

1.
f1 (x, y, z) = (x + y, z − 4x, 7y + 4z)
f1 (e1 ) = (1, −4, 0), f1 (e2 ) = (1, 0, 7), f1 (e3 ) = (0, 1, 4)


1 1 0
A1 =  −4 0 1  .
0 7 4
2.
f2 (x, y, z) = 3x − 5y + 10z
f2 (e1 ) = 3, f2 (e2 ) = −5, f2 (e3 ) = 10
A2 =
3 −5 10
.
3.
f3 (x) = (2x, 4x, 0, −x)
f3 (e1 ) = (2, 4, 0, −1)


2
 4 

A3 = 
 0 .
−1
Uwaga 3.7.4 Zauważmy, że dodawanie macierzy odpowiada dodawaniu funkcji; mnożenie macierzy przez liczby odpowiada mnożeniu funkcji przez liczby; mnożenie macierzy
odpowiada składanie funkcji; odwracanie macierzy odpowiada szukaniu funkcji odwrotnej.
59
3.8
Wartości i wektory własne macierzy
Definicja 3.8.1 Niech A ∈ M(n) będzie macierzą kwadratową. Mówimy, że s ∈ C jest
wartością własną macierzy A a wektor v ∈ Cn \ {0} jest wektorem własnym odpowiadającym wartości własnej s, gdy
(3.8.1)
Av = sv.
Niech A = [aij ] i v = (v1 , . . . , vn ), wtedy warunek (3.8.1) jest równoważny z równaniem
macierzowym (A − sIn )v = 0, które jest z kolei równoważne z faktem, że układ równań

 (a11 − s)v1 + · · · + a1n vn = 0
........................

an1 v1 + · · · + (ann − s)vn = 0
ma rozwiązanie niezerowe, tzn. det(A − sIn ) = 0.
Równanie det(A − sIn ) = 0 nazywamy równaniem charakterystycznym macierzy
A.
Przykład 3.8.2 Niech

1 −2 2
A =  1 −1 3 
0 0 1

Wtedy
1−s
−2
2
1
−1 − s
3
det(A − sI3 ) = det
0
0
1−s
= −(s − 1)(s − i)(s + i),
czyli {1, i − i} są wartościami własnymi macierzy A. Znajdziemy teraz wektory własne
odpowiadające tym wartościom własnym. Dla s1 = 1 mamy następujący układ równań

 0v1 − 2v2 + 2v3 = 0
v1 − 2v2 + 3v3 = 0 ,

0v1 + 0v2 + 0v3 = 0
którego rozwiązaniem jest na przykład wektor v = (−1, 1, 1).
Podobnie dla s2 = i mamy następujący układ równań

 (1 − i)v1 − 2v2 + 2v3 = 0
v1 − (1 + i)v2 + 3v3 = 0 ,

0v1 + 0v2 + (1 − i)v3 = 0
którego rozwiązaniem jest na przykład wektor v = (2, 1 − i, 0). Teraz zauważmy, że jeżeli A
jest macierzą rzeczywista o wartości własnej zespolonej s i wektorze własnym v, to również
s̄ jest wektorem własnym o wektorze własnym v̄. Dla tego wektorem własnym dla s = −i
jest wektor v̄ = (2, 1 + i, 0).
60
Na koniec podamy twierdzenie Caleya-Hamiltona, które mówi, że każda macierz spełnia
swoje równanie charakterystyczne.
Twierdzenie 3.8.3 Niech A ∈ M(n) i niech
det(A − sIn ) = (−1)n sn + pn−1 sn−1 + · · · + p1 s + p0 , gdzie p0 = det A
będzie jej równaniem charakterystycznym. Wtedy
(−1)n An + pn−1 An−1 + · · · + p1 A + p0 In = 0.
W szczególności, jeżeli det A ̸= 0, to
A−1 = −
3.9
1
p1 In + p2 A + · · · + (−1)n An−1 .
det A
Specjalne typy macierzy
Definicja 3.9.1 Mówimy, że macierz kwadratowa A ∈ M(n) jest
1. macierzą symetryczną, gdy AT = A;
2. macierzą antysymetryczną, gdy AT = −A;
3. macierzą ortogonalną, gdy AAT = In .
Obserwacja 3.9.2 Niech A, B ∈ M(n), t ∈ R. Wtedy
1. jeżeli A, B są macierzami symetrycznymi, to AT , tA, A + B, A−1 (o ile istnieje) są
macierzami symetrycznymi;
2. jeżeli A, B są macierzami antysymetrycznymi, to AT , tA, A + B, A−1 (o ile istnieje)
są macierzami antysymetrycznymi;
3. jeżeli A jest macierzą antysymetryczną i n jest liczbą nieparzystą, to det A = 0;
4. jeżeli A jest macierzą otogonalną, to det A = ±1, A−1 = AT
5. jeżeli A, B są macierzami ortogonalnymi, to AT , A−1 , AB są macierzami ortogonalnymi;
6. A = [A1 . . . An ] jest macierzą ortogonalną wtedy i tylko wtedy, gdy ⟨Aj , Ak ⟩ = δjk .
Teraz podamy twierdzenia o rozkładzie dla macierzy symetrycznych, antysymetrycznych i ortogonalnych.
Twierdzenie 3.9.3 Niech A będzie macierzą symetryczną. Wtedy
1. wszystkie wartości własne s1 , . . . , sn macierzy A są rzeczywiste, każdej wartości własnej odpowiada rzeczywisty wektor własny;
61
2. wektory własne odpowiadające różnym wartościom własnym są prostopadłe;
3. istnieje macierz ortogonalna C taka, że


s1 . . . 0


C −1 AC =  ... . . . ...  .
0 . . . sn
Twierdzenie 3.9.4 Niech A będzie macierzą antysymetryczną. Wtedy
1. wszystkie wartości własne macierzy A są urojone lub 0
ib1 , −ib1 , . . . , ibp , −ibp , 0, . . . , 0;
2. wektory własne odpowiadające wartością własnym urojonym są postaci w = u + iv,
gdzie ⟨u, v⟩ = 0, ||u|| = ||v|| = 1;
3. istnieje macierz ortogonalna C taka, że
0
b1

 −b1
 .
 .
 .
 .
 .
 .
C −1 AC =  .
 ..

 .
 ..

 .
 ..
0
..
.
..
.
..
.
..
.
..
.

0
...
...
... ...
..
. ...
..
.
0
..
. −bp
..
..
.
.
..
..
.
.
... ... ...

... ... ... 0
. 
. . . . . . . . . .. 
. 

. . . . . . . . . .. 
. 

bp . . . . . . .. 
. .
0 . . . . . . .. 

..
.. 
.
0 ... . 

..
.. . . .. 
. . 
.
.
... ... ... 0
Twierdzenie 3.9.5 Niech A będzie macierzą ortogonalną. Wtedy
1. wszystkie wartości własne macierzy A są zespolone o module równym 1
cos α1 ± i sin α1 , . . . , cos αp ± i sin αp , 1, . . . , 1, −1, . . . , −1;
2. wektory własne odpowiadające wartością własnym urojonym są postaci w = u + iv,
gdzie ⟨u, v⟩ = 0, ||u|| = ||v|| = 1;
62
3. istnieje macierz ortogonalna C taka, że

cos α1 − sin α1 . . .
...
...

 sin α1 cos α1 . . .
...
...

..
..

..
.

.
.
...
...

..
..
..


.
.
. cos αp − sin αp

..
..
..

.
.
. sin αp cos αp


.
.
.
..
..
−1

..
..
..
C AC = 
.
.

..
..
..
..
..

.
.
.
.
.


.
.
.
.
..

..
..
..
..
.


.
.
.
.
..
..
..
..
..

.


.
.
.
.
..
..
..
..
..

.
0
...
...
...
...
3.10
... ... ... ... ...
... ... ... ... ...
... ... ... ... ...
... ... ... ... ...
... ... ... ... ...
1 ... ...
.. . .
. ...
.
..
..
.
.
1
..
..
..
.
.
.
..
..
..
.
.
.
... ... ...
... ...
... ...
... ...
−1 . . .
.. . .
.
.
0
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.













.












. . . . . . −1
Formy kwadratowe
Definicja 3.10.1 Funkcję f : Rn → R daną wzorem
f (x1 , . . . , xn ) =
n X
n
X
aij xi xj ,
i=1 j=1
gdzie aij = aji nazywamy formą kwadratową.
Istnieje wzajemna jednoznaczność między formami kwadratowymi a macierzami kwadratowymi symetrycznymi. Jeżeli A jest macierzą kwadratową symetryczną to
fA (x) = Ax, x
jest formą kwadratową. Zauważmy również, że macierz Af utworzona ze współczynników
formy kwadratowej jest macierzą kwadratową symetryczną.
Definicja 3.10.2 Mówimy, że forma kwadratowa f (macierz symetryczna A) jest
– dodatnio określona f > 0, A > 0, jeśli
∀x ∈ Rn \ {0} : f (x) > 0 ( Ax, x > 0);
– nieujemnie określona, dodatnio półokreślona f ≥ 0, A ≥ 0, jeśli
∀x ∈ Rn : f (x) ≥ 0 ( Ax, x ≥ 0);
– ujemnie określona f < 0, A < 0, jeśli
∀x ∈ Rn \ {0} : f (x) < 0 ( Ax, x < 0);
63
– niedodatnio określona, ujemnie półokreślona f ≤ 0, A ≤ 0, jeśli
∀x ∈ Rn : f (x) ≤ 0 ( Ax, x ≤ 0);
– nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie, ani nieujemnie, ani niedodatnio
określona, tzn.
∃x, y ∈ Rn : f (x) > 0, f (y) < 0 ( Ax, x > 0, Ay, y < 0).
Niech A = [aij ], i, j = 1, 2, . . . , n, będzie macierzą kwadratową symetryczną (tzn.
aij = aji dla dowolnych i, j). Niech


a11 . . . a1k

.. 
..
Ak := det  ...
.
. 
ak1 . . . akk
będzie minorem głównym rzędu k macierzy A, k ∈ {1, 2, . . . , n}.
Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności macierzy symetrycznych
Twierdzenie 3.10.3 (twierdzenie Sylvestera) Macierz symetryczna A jest
1. A > 0 wtedy i tylko wtedy, gdy Ak > 0 dla dowolnego k ∈ {1, 2, . . . , n};
2. A ≥ 0 wtedy i tylko wtedy, gdy AI,J ≥ 0 dla dowolnego I = J ⊂ {1, 2, . . . , n} (gdzie
AI,J jest wyznacznikiem macierzy powstałej z usunięcia z A I-tych wierszy i J-tych
kolumn);
3. A < 0 wtedy i tylko wtedy, gdy (−1)k Ak > 0 dla dowolnego k ∈ {1, 2, . . . , n};
4. A ≤ 0 wtedy i tylko wtedy, gdy (−1)|I| AI,J ≥ 0 dla dowolnego I = J ⊂ {1, 2, . . . , n}
(gdzie AI,J jest wyznacznikiem macierzy powstałej z usunięcia z A I-tych wierszy i
J-tych kolumn);
5. nieokreślona w pozostałych przypadkach.
Dowód. Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz A będzie złożona z jednej liczby [a11 ]. Należy zauważyć, że forma h 7→ a11 h2 jest dodatnio określona wtedy i tylko
wtedy, gdy a11 > 0. Następnie dowodzi się implikacji, że z dodatniej określoności formy
zadanej przez macierz à = [aij ], i, j = 1, 2, . . . , n − 1 wobec założenia o dodatniości minora
An = det[aij ], i, j = 1, 2, . . . , n, wynika dodatnia określoność formy kwadratowej zadanej
przez macierz A = [aij ], i, j = 1, 2, . . . , n. Szczegóły (które pomijamy) można znaleźć w
podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów,
spinorów, algebr Liego i kwadryk, Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.)
□
64
Download