Uploaded by Dawid Pawliczek

Matematyka konkretna 1000 DPI

advertisement
Wydawnictwo Naukowe PWN
Ronald L. Graham, Donald E. Knuth
Oren Patashnik
Matematyka
konkretna
Matematyka
konkretna
Ronald L. Graham, Donald E. Knuth
Oren Patashnik
Matematyka
konkretna
Wydanie trzecie
Z języka angielskiego przełożyli
P. Chrząstowski, A. Czumaj, L. Gąsieniec, M. Raczunas
Wydawnictwo Naukowe PWN Warszawa 2001
Dane oryginału:
R on ald L. G raham , AT&T Bell Laboratories
D on a ld E. K n u th , Stanford University
O ren P atash n ik , Center for Communications Research
Concrete Mathematics. A Foundation fo r Computer Science
Copyright © 1994 by Addison-Wesley Publishing Company, Inc.
First published by Addison-Wesley Publishing Company,
One Jacob Way, Reading, Massachusetts, 01867 USA
Okładka i strony tytułowe
B o k iew icz &; F reud en reich
Redaktor
M a łg o rza ta K op czy ń sk a
Redaktor techniczny
B e a ta S telęgow sk a
Copyright © for the Polish edition by
Wydawnictwo Naukowe PWN Sp. z o.o.
Warszawa 1996
Copyright © for the Polish edition by
Wydawnictwo Naukowe PWN SA
Warszawa 1998
ISBN 83-01-12124-6
Spis treści
P rzed m ow a
N o ta c ja
.....................................................................................................
7
............................................................................................................... 13
1. P ro b lem y rek u ren cyjn e
...................................................................... 15
1 . 1 . Wieże z Hanoi
....................................................................................... 15
1.2. Proste na płaszczyźnie ........................................................................ 19
1.3. Problem Józefa Flawiusza ................................................................... 23
Ćwiczenia
................................................................................................... 32
2 . Sum y
.............................................................................................................. 37
2 . 1 . Notacja
.................................................................................................... 37
2 .2 . Sumy i rekurencje
............................................................................... 41
2.3. Przekształcenia sum ............................................................................ 46
2.4. Sumy wielokrotne ............................................................................... 51
2.5. Metody ogólne ....................................................................................... 59
2.6. Rachunek różnicowy i różniczkowy .................................................. 65
2.7. Sumy nieskończone .............................................................................. 75
Ćwiczenia
................................................................................................... 81
3. Funkfcje całk ow itoliczb ow e ................................................................ 87
3.1. Funkcje podłoga i sufit ...................................................................... 87
3.2. Użycie funkcji podłoga i sufit ........................................................... 90
3.3. Rekurencje z podłogą i sufitem .......................................................100
3.4. Działanie dwuargumentowe ‘mod’ .....................................................103
3.5. Sumy podłogi i sufitu ........................................................................... 108
Ćwiczenia
....................................................................................................117
4. T eoria liczb ..................................................................................................124
4.1. Podzielność ..............................................................................................124
4.2. Liczby pierwsze ...................................................................................... 128
4.3. Pierwsze przykłady ............................................................................... 130
4.4. Współczynniki rozkładu silni .......................................................... 135
4.5. Liczby względnie pierwsze ................................................................ 139
4.6. Relacja kongruencji ‘mod’ ................................................................ 148
4.7. Niezależne reszty ................................................................................... 151
4.8. Dalsze zastosowania ........................................................................... 154
4.9. Fi oraz mi ................................................................................................158
Ćwiczenia
....................................................................................................171
5.
W sp ó łc zy n n ik i d w um ianow e ............................................................. 180
5.1. Podstawowe tożsamości ........................................................................ 180
5 .2 . Podstawowe ćwiczenia, .......................................................................... 201
5.3. Podstawowe techniki ............................................................................. 215
5.4. Funkcje tworzące ................................................................................... 226
5.5. Funkcje hip ergeometryczne ................................................................ 234
5.6. Przekształcenia hip ergeometryczne ...................................................247
5.7. Częściowe sumy hipergeometryczne ................................................. 253
5.8. Sumowanie mechaniczne ...................................................................... 260
Ćwiczenia
....................................................................................................273
6 . L iczby szczególn e
.................................................................................... 288
6.1. Liczby Stirlinga ...................................................................................... 288
6 .2 . Liczby Eulera .......................................................................................... 299
6.3. Liczby harmoniczne : ............. ............................................................... 304
6.4. Sumowanie harmoniczne ...................................................................... 311
6.5. Liczby Bernoulliego ............................................................................... 316
6 .6 . Liczby Fibonacciego
..............................................................................324
6.7. Kontynuanty ...........................................................................................336
Ćwiczenia
....................................................................................................345
7. Funkcje tw orzące ..................................................................................... 356
7.1. Teoria domina i rozmieniania .............................................................356
7.2. Podstawowe techniki ............................................................................. 368
7.3. Rozwiązywanie rekurencji ....................................................................374
7.4. Szczególne funkcje tworzące ................................................................ 389
7.5. Sploty ........................................................................................................392
7.6. Wykładnicze funkcje tworzące ...........................................................404
7.7. Funkcje tworzące Dirichleta ................................................................ 410
Ćwiczenia
....................................................................................................412
8 . P raw d op o d ob ień stw o d y sk retn e
......................................................423
8 . 1. Definicje ................................................................................................... 423
8 .2 . Wartość oczekiwana i wariancja ........................................................ 429
8.3. Funkcje tworzące prawdopodobieństwa ........................................... 437
8.4. Rzucanie monetą ................................................................................... 444
8.5. Haszowanie .............................................................................................. 455
Ćwiczenia
....................................................................................................472
9. A sy m p to ty k a ............................................................................................. 485
9.1. Hierarchia ................................................................................................ 486
9.2. Notacja O ................................................................................................ 489
9.3. Przekształcenia typu O ........................................................................497
9.4. Dwie sztuczki asymptotyczne .............................................................512
9.5. Wzór sumacyjny Eulera ...................................................................... 518
9 .6 . Końcowe sumowania ............................................................................. 525
Ćwiczenia
....................................................................................................540
A . O dp ow ied zi do ćw iczeń ........................................................................ 547
B . B ibliografia ................................................................................................. 672
C. Ź ródła ćw iczeń ..........................................................................................694
Skorow idz
.......................................................................................... ...............700
W ykaz t a b e l ....................................................................................................
718
Przedm ow a
Książka ta powstała na podstawie wykładu o tej samej nazwie prowadzonego
na Uniwersytecie Stanforda od 1970 r. Zazwyczaj przedmiot ten wybierało
około 50 studentów, głównie magistrantów i doktorantów, choć zdarzali się
również studenci starszych i młodszych lat. Ci, którzy zaliczyli ten przedmiot,
zaczęli prowadzić podobne wykłady na innych uczelniach. Wygląda na to, że
nadszedł czas, kiedy powinno się zaprezentować materiał wykładu szerszej
publiczności (włączając w to studentów pierwszego roku).
Matematyka konkretna powstała w czasie burzliwej dekady. Zaczęto kwe­
stionować wtedy nie podważane do tej pory wartości, przy czym kolebkę
niepokojów stanowiły uniwersytety. Rewidowano programy studiów uniwer­
syteckich, i matematyka nie uniknęła znalezienia się pod lupą. John Hammersley napisał wtedy prowokujący artykuł „O osłabieniu umiejętności ma­
tematycznych przez ‘Matematykę Współczesną’ i przez jej podobne papki in­
telektualne serwowane w szkołach i na uniwersytetach” [176]. Inni przerażeni
matematycy [333] pytali wręcz „Czy można uratować matematykę?” Jeden
z autorów tej książki (DEK) wplątał się w pisanie serii książek pod tytułem
The A rt of Computer Programming (Sztuka programowania komputerów)
i w trakcie przygotowywania pierwszego tomu zorientował się, że brakuje
mu narzędzi matematycznych. Te, których potrzebował w celu gruntownego
zrozumienia programów komputerowych, różniły się znacznie od tych, które
poznał w czasie, kiedy odbywał klasyczne studia matematyczne. Wprowa­
dził więc nowy przedmiot, aby uczyć tego, czego jemu samemu brakowało w
czasie jego studiów.
Tytuł wykładu „Matematyka Konkretna” miał początkowo stanowić an­
tidotum na coś, co się wtedy nazywało „Matematyka Abstrakcyjna”, jako że
ta druga na fali mody nazwanej „Nową Matematyką” została wyprana nagle
ze wszystkich konkretnych wyników stanowiących rdzeń matematycznej kla­
syki. Matematyka abstrakcyjna jest wspaniałym przedmiotem i nie ma w niej
niczego złego: jest piękna, ogólna i użyteczna. Niestety, jej promotorzy doszli
do wniosku, że cała reszta matematyki jest nic nie warta. Uogólnianie stało się
tak modne, że całe pokolenie matematyków nie było w stanie docenić piękna
„Czytelnik, poziom
przedstawienia —
tego typu rzeczy
powinny znaleźć się
w przedmowie.”
P. R. Halmos [173]
„Ludzie używający
odpowiedniego
żargonu dość
szybko zdobywają
powierzchowny
autorytet: mogą
wygłaszać
górnolotne,
a pozbawione
wartości opinie.
Liczy się jednak nie
umiejętność
mielenia jęzorem,
ani nawet
brylowania
znajomością
aktualnego stanu
wiedzy
matematycznej, lecz
raczej zdolność
wykorzystania tego,
czego się nauczyło
i zastosowania
posiadanej wiedzy
do rozwiązywania
praktycznych
problemów
matematycznych.
W skrócie chodzi
nam nie o słowa,
a o czyny.”
J. Hammersley [176]
[W tym miejscu i
wielokrotnie później
autorzy bawią się
nieprzetłumaczalną
grą słów. Słowo
„concrete” po
angielsku oznacza
również beton.
Tłumacze]
„ Jest to z gruntu
niesłuszne, aby
uczyć abstrakcji
przed konkretem.”
Z. A. Melzak [267]
„Rdzeń matematyki
stanowią konkretne
przykłady
i konkretne
problemy.”
RR.Halm os [172]
[Znowu
nieprzetłumaczalna
gra słów. „C iągły”
po angielsku,
to continuous,
a „ dyskretny’, to
discrete, co daje
po zlepieniu
c o n c r e te —
konkretny.]
Matematyka
konkretna jest
pomostem
do matematyki
abstrakcyjnej.
przypadków szczególnych, ani podjąć wyzwania rozwiązywania konkretnych
problemów ilościowych, czy nawet dostrzec wartość w tym, że ktoś posiada
sprawność rachunkową. Upojona sukcesami matematyka abstrakcyjna zaczęła
tracić kontakt z rzeczywistością. Potrzeba było konkretnej przeciwwagi, aby
przywrócić wykształceniu matematycznemu zdrową równowagę.
Wykładając po raz pierwszy Matematykę Konkretną na Uniwersytecie
Stanforda, DEK wyjaśniał ten cokolwiek dziwny tytuł wykładu mówiąc, że
jest to próba przedstawienia matematycznego wykładu kursowego w sposób
twardy, a nie miękki. Zapowiedział, że wbrew oczekiwaniom niektórych jego
kolegów nie zamierza uczyć teorii wiązek, ani twierdzenia Stone’a o wło­
żeniu, ani nawet uzwarcenia Stone’a-Ćecha. (Kilku studentów z wydziału
inżynieryjnego wstało i po cichu opuściło salę)
Choć Matematyka Konkretna powstała w reakcji na inne trendy, rzeczy­
wiste przyczyny jej powstania były pozytywne, a nie negatywne. W miarę, jak
wykład ten stawał się w trakcie studiów popularnym przedmiotem, jego treść
„utwardzając się” okazywała się użyteczna w wielu nowych zastosowaniach.
Tymczasem nadeszło nowe potwierdzenie trafności nazwy tej dziedziny, gdy
Z. A. Melzak opublikował dwuczęściową książkę pod tytułem Companion to
Concrete Mathematics [267].
Materiał matematyki konkretnej zdaje się na pierwszy rzut oka być wor­
kiem przypadkowych chwytów, jednak praktykowanie ich przetwarza go w
zorganizowany warsztat z gotowymi narzędziami. W rzeczywistości przed­
stawione w tej książce techniki charakteryzują się pewną jednorodnością i na
wielu wywierają duże wrażenie. Kiedy inny z autorów (RLG) po raz pierwszy
prowadził ten przedmiot w 1979 r., studentom tak się wykład spodobał, że
wielu z nich zobaczył jeszcze raz rok później.
Czym dokładnie jest Matematyka Konkretna? Jest to mieszanina ma­
tematyki ciągłej i dyskretnej. Konkretniej, w jej zakres wchodzi usyste­
matyzowane przetwarzanie wzorów matematycznych oparte na zestawie od­
powiednich technik rozwiązywania problemów. Gdy opanujesz, Czytelniku,
materiał zawarty w tej książce, wówczas wszystko, czego będziesz potrzebo­
wał, to niezmącony umysł, trochę papieru i całkiem niemało pisania, aby
wyliczać wartości jakichś horrendalnie wyglądających sum, rozwiązywać zło­
żone relacje rekurencyjne i odkrywać subtelne wzorce w danych. Będziesz
na tyle biegły w stosowaniu technik algebraicznych, że często będziesz wolał
znajdywać wartości dokładne, niż ich oszacowania.
Podstawowe zagadnienia ujęte w tej książce zawierają sumy, rekurencje, elementarną teorię liczb, współczynniki dwumianowe, funkcje tworzące,
prawdopodobieństwo dyskretne i metody asymptotyczne. Główny nacisk jest
położony nawet nie na twierdzenia egzystencjalne, czy myślenie kombinatoryczne, a na techniki rachunkowe. Celem książki jest bowiem zaznajomienie
czytelnika z działaniami dyskretnymi (takimi jak część całkowita, czy sumo­
wanie skończone) w podobnym stopniu, w jakim studiujący analizę matema­
tyczną zapoznają się z działaniami ciągłymi (takimi jak wartość bezwzględna
czy całkowanie).
Warto zauważyć, że przedstawiona lista zagadnień różni się zasadniczo od
tego, co zwyczajowo jest wykładane pod nazwą „Matematyki Dyskretnej”.
Potrzebujemy więc odrębnej nazwy, a „Matematyka Konkretna” okazała się
nazwą równie wygodną, jak pozostałe powszechnie używane dla określenia
innych dziedzin.
Początkowo podręcznikiem do stanfordzkiego wykładu był rozdział „Mathematical Preliminaries” z książki The A rt of Computer Programming [207].
Materiał zawarty na 110 stronach tego rozdziału był jednak zbyt zwięzły, więc
trzeci z autorów (OP) wpadł na pomysł opracowania notatek uzupełniają­
cych, które przyjęły całkiem spore rozmiary. Książka ta stanowi rozwinięcie
tych notatek. Jest to więc uzupełnienie wspomnianego rozdziału i bardziej
przystępne wprowadzenie do materiału w nim zawartego. Niektóre znajdu­
jące się tam zbyt zaawansowane części pominięto w tej książce, inne z kolei
zagadnienia dodano dla pełności wywodu.
Autorzy mieli dużo satysfakcji przy tworzeniu tej książki, gdyż jej te­
mat krzepł przed ich oczyma i zaczynał żyć swoim własnym życiem; w czasie
pracy nad nią książka ta zdawała pisać się sama. Co więcej, przyjęte przez
nas dość niekonwencjonalne metody przedstawienia materiału tak dobrze za­
częły do siebie pasować, że — po latach doświadczeń— nie możemy oprzeć się
wrażeniu, że książka ta jest rodzajem manifestu na temat tego, w jaki sposób
powinno się uprawiać matematykę. Z naszego punktu widzenia książka ta jest
bajką o matematycznym pięknie i przypadku. Mamy nadzieję, że czytelnicy
podzielą z nami choć e tej przyjemności, którą mieliśmy w trakcie tworzenia
tej książki.
Książka ta powstała w środowisku uniwersyteckim, staraliśmy się więc
oddać ducha współcześnie prowadzonych zajęć za pomocą nieformalnego
stylu prezentacji materiału. Niektórzy uważają, że matematyka to przedsię­
wzięcie poważne i że musi w związku z tym być zimna i sucha. My jednak
sądzimy, że matematyka jest zabawą i nie wstydzimy się tego ujawnić. W
imię czego mielibyśmy oddzielać grubą kreską pracę od zabawy? Matematyka
konkretna jest pełna pociągających wzorców; przekształcenia nie zawsze są
łatwe, ale uzyskiwane odpowiedzi bywają zaskakująco atrakcyjne. Radości
i smutki naszej matematycznej pracy są oddane tu wprost, gdyż są częścią
naszego życia.
Studenci zawsze wiedzą lepiej od swoich nauczycieli, więc poprosiliśmy
kilku z nich o wyrażenie szczerych opinii w postaci „graffiti” na margine­
sach. Niektóre z nich są banalne, inne głębokie, niektóre ostrzegają o niejed­
„Czytelnik
zaawansowany
przeskakując części,
które wydają mu się
zbyt elementarne,
często traci więcej,
niż czytelnik
początkujący,
przeskakujący
części, które wydają
się mu zbyt
złożone” .
G. Pólya [298]
„ . . . betonowa
kamizelka
ratunkowa rzucona
studentom tonącym
w morzu
abstrakcji.”
W. Gottschalk
[Zobaczcie, ile jest
w tej książce
Deńnicji, Lematów,
Twierdzeń ...]
Graffiti
matematyczne:
Uwolnić grupę!
Domknąć pierścień!
Zbadać przestrzeń
nad ciałem.
N = 1 => P = N P .
Szczerze mówiąc,
mało mnie to
interesuje.
To był najfajniejszy
wykład, na ja k i
kiedykolwiek
chodziłem. Ale
dobrze jest czasami
podsumowywać
przerobiony
materiał.
Rozumiem,
matematyka
konkretna, to po
prostu zaćwiczanie.
Ćwiczenia domowe
były trudne, ale
dały m i dużo.
Każda godzina się
opłaciła.
Domowe zadania
egzaminacyjne są
niezbędne— tak
trzymać!
Egzaminy były
trudniejsze niż to,
czego się
spodziewałem
po ćwiczeniach
domowych.
noznacznościach i niezręcznościach, inne są typowymi komentarzami czynio­
nymi przez zdolnych gości z ostatnich rzędów; niektóre są pozytywne, inne
są negatywne, a jeszcze inne są zerowe. Wszystkie jednak wynikły z prawdzi­
wych odczuć powstałych w trakcie czytania, co powinno ułatwić przyswoje­
nie tego materiału. (Pomysł ubarwienia tekstu książki takimi komentarzami
pochodzi z podręcznika dla studentów Wstępując na Stanford , w którym ofi­
cjalne teksty są kontrowane przez komentarze studentów kończących studia.
Na przykład Stanford pisze: „Jest parę rzeczy, których nie możesz nie za­
uważyć w tym amorficznym tworze, jaki stanowi Stanford”, a na marginesie
czytamy: „Amorficzny . . . o co tu, kurczę, chodzi? Typowy pseudointelektualizm panoszący się tutaj”. Stanford: „Nie ma granic dla potencjału, jaki
stanowi grupa wspólnie żyjących studentów.” Graffito: „Akademiki Stan­
forda to coś w rodzaju ZOO bez dozorcy.”)
Na marginesach pojawią się także dokładne cytaty z prac znanych ma­
tematyków minionych pokoleń, przytaczające oryginalne słowa, których uży­
wali ^anonsując niektóre z ich fundamentalnych odkryć. Niemniej jednak,
uznaliśmy za właściwe przemieszać nazwiska takie jak Leibniz, Euler czy
Gauss z nazwiskami tych, którzy po nich kontynuowali pracę. Matematyka
jest ciągłym wyzwaniem dla ludzi na całym świecie. Ta bogata tkanina utkana
jest z wielu wątków.
•
Książka ta zawiera ponad 500 ćwiczeń podzielonych na sześć kategorii:
R ozgrzew k ę stanow ią ćw iczenia, które w s z y s c y c z y t e l n i c y pow inni
spróbować rozw iązać przy p ierw szym czytaniu.
•
•
•
•
•
P od staw y, to ćwiczenia, które pozwalają wprowadzić fakty najłatwiej
przyswajalne za pomocą próby ich samodzielnego odkrycia.
Ć w iczen ia d om ow e, to zadania mające pogłębić zrozumienie przero­
bionego w danym rozdziale materiału.
Z adania egzam in acyjn e zazwyczaj dotyczą materiału z dwóch lub
więcej rozdziałów. Stanowiły one najczęściej domowe zadania zalicze­
niowe, a nie zadania do rozwiązania w czasie egzaminu tradycyjnego,
przeprowadzanego we wspólnej sali pod presją czasu.
Ć w iczen ia d od atk ow e wykraczają poza materiał, który przewidziany
został dla średniego studenta uczącego się matematyki konkretnej według
tej książki. Rozszerzają one materiał w różnych ciekawych kierunkach.
P ro b lem y badaw cze dadzą się, albo się nie dadzą rozwiązać przez czło­
wieka, ale te, które tu proponujemy są warte zastanowienia się i próby
podejścia do rozwiązania (nie pod presją czasu).
Odpowiedzi do wszystkich ćwiczeń są w Dodatku A, często z informacją o po­
wiązanych z nimi wynikach. (Oczywiście „odpowiedzi” na problemy badaw­
cze są niepełne, jednakże nawet w takich przypadkach podajemy wskazówki
P rzed m ow a
L łłZ
lub wyniki częściowe, które mogą być użyteczne przy rozwiązywaniu tych pro­
blemów). Zachęcamy Czytelników do zaglądania do odpowiedzi, szczególnie
do odpowiedzi do zadań rozgrzewkowych, ale tylko p o dokonaniu rzetelnej
próby rozwiązania danego zadania bez podglądania.
W Dodatku C próbowaliśmy dla każdego ćwiczenia określić źródła, gdyż
uważamy, że wymyślenie dobrego zadania wymaga często ogromnego nakładu
energii i (lub) szczęścia. Niestety matematycy wprowadzili zwyczaj zapoży­
czania ćwiczeń bez cytowania źródeł. Uważamy, że przeciwna taktyka, zacho­
wywana np. w książkach i czasopismach szachowych (gdzie zwykle podaje się
nazwiska twórców, daty i miejsca pierwszych publikacji cytowanych zadań
szachowych) jest znacznie lepsza. Nie udało się nam jednak zlokalizować źró­
deł wielu zadań, które stały się częścią folkloru matematycznego. Będziemy
wdzięczni za wskazanie każdego nie znanego nam lub niedokładnie podanego
źródła któregokolwiek z przedstawionych ćwiczeń lub zadań. Chcielibyśmy
poznać jak najwięcej szczegółów i poprawić niedoróbki w następnych wyda­
niach tej książki.
Matematyczne czcionki, których używamy w tej książce, zostały zapro­
jektowane przez Hermanna Zapfa [227] na zlecenie AMS (American Mathematical Society— Amerykańskiego Towarzystwa Matematycznego) i opraco­
wane przez komitet, w skład którego wchodzili: B. Beeton, R. P. Boas, L. K.
Durst, D.E. Knuth, P. Murdock, R. S. Palais, P. Renz, E. Swanson, S.B.
Whidden, i W. B. Woolf. Pomysłem, który legł u podstaw projektu Zapfa,
było uchwycenie stylu, jakim mógłby się posługiwać matematyk dysponujący
przepięknym charakterem pisma. Pismo ręczne ma tę przewagę nad mecha­
nicznym, że matematycy zwykle pracują z długopisem, ołówkiem lub kredą.
(Jednym z przykładów rozwiązań tego projektu jest znak zero, ‘0’, który
jest lekko zaostrzony na górze, ponieważ rzadko kiedy pisząc zero udaje się
je precyzyjnie zaokrąglić domykając na górze.) Symbole są pisane pionowo,
a nie kursywą, tak więc indeksy i akcenty układają się bardziej naturalnie.
Ta nowa rodzina czcionek została nazwana AMS Euler, na cześć wielkiego
matematyka szwajcarskiego Leonharda Eulera (1707-1783), który tak dużo
odkrył w matematyce, którą się dziś posługujemy. Pośród czcionek można
wyodrębnić takie zbiory, jak Euler Text (A aB b C c aż do X x Y y Z z), Euler
Fraktur (21a
£c aż do
2}t) 33) i Euler Script Capitals (A ¥> 6 aż do X y Z),
jak również Euler Greek (AaB|3 Ty aż do X xAł/4, ^ a>) i symbole szczególne
takie jak jp lub K. Szczególnie cieszy nas to, że możemy zainaugurować ro­
dzinę czcionek Eulera w tej właśnie książce, ponieważ duch Eulera przenika
tu każdą stronę: Matematyka konkretna jest matematyką eulerowską.
Autorzy są szczególnie wdzięczni Andreiowi Broderowi, Ernstowi Mayrowi, Andrew Yao i Frances Yao, którzy mieli znaczny wpływ na tę książkę w
latach, gdy wykładali Matematykę Dyskretną na Stanfordzie. Ponadto kierummm-
Ci, którzy będą
oszukiwali, mogą
zaliczyć ten
materiał przepisując
odpowiedzi,
ale oszukają tylko
siebie samych.
Przypadkowem u
studentowi
zaleciłbym
trzymanie się z dala
od tego wykładu.
Nie widzę, jak to,
czego się do tej
pory nauczyłem,
mogłoby mi
w czymkolwiek
pomóc.
Miałem sporo
kłopotów z tym
przedmiotem, ale
wiem, że wyostrzył
moją sprawność
matematyczną
i umysłową.
[Uwaga o błędach
typograficznych
odnosi się niestety
tylko do
angielskiego
oryginału.]
jemy 1024 podziękowania tym asystentom, którzy twórczo przetworzyli to,
co działo się w czasie ćwiczeń w latach, kiedy je prowadzili i którzy poma­
gali w opracowywaniu zadań egzaminacyjnych. Ich lista zamieszczona jest w
dodatku C. Książka ta, która w dużej części wyrosła z prowadzonych przez
nich w ciągu 16 lat notatek, byłaby nie powstała bez ich wspaniałej pracy.
Wiele innych osób przyczyniło się do tego, że książka ta ujrzała światło
dzienne. Chcielibyśmy dla przykładu odnotować wkład studentów Uniwer­
sytetów Browna, Columbia, CUNY, Princeton, Rice i Stanforda, którzy do­
pomogli w wyborze graffiti i w poprawianiu pierwszych maszynopisów. Kon­
takty z wydawnictwem Addison-Wesley były bardzo pomocne i efektywne. W
szczególności chcielibyśmy wyrazić naszą wdzięczność wydawcy — Peterowi
Gordonowi, redaktorowi technicznemu— pani Bette Aaronson, projektan­
towi— Royowi Brownowi i redaktorowi— Lynowi Dupre. National Science
Foundation i Office of Naval Research wspomogły nas nieocenionymi gran­
tami. Cheryl Graham była niezwykle pomocna przy opracowywaniu skoro­
widza. Przede wszystkim jednak chcielibyśmy podziękować naszym żonom
(Jill, Fan i Amy) za ich cierpliwość, pomoc, zachęty i pomysły.
Obecne, drugie wydanie tej książki, zawiera nowy rozdział 5.8, który
przedstawia pewne ważne pomysły odkryte przez Dorona Zeilbergera krótko
po tym, jak pierwsze wydanie poszło do druku. Prawie na każdej stronie tego
wydania można znaleźć poprawki w stosunku do wydania pierwszego.
Próbowaliśmy stworzyć książkę bezbłędną, ale jesteśmy autorami omyl­
nymi. Apelujemy więc gorąco o poprawianie wszelkich błędów przez nas po­
czynionych. Wyznaczamy nagrodę w wysokości 2,56 dolara, którą wypłacimy
z wdzięcznością każdemu pierwszemu odkrywcy jakiegokolwiek błędu mate­
matycznego, historycznego lub typograficznego.
Murray Hill, New Jersey
i Stanford, Kalifornia
maj 1988 i październik 1993
— RLG
DEK
OP
N otacja
Niektóre^pomysły notacyjne użyte w tej książce nie stały się (jeszcze ?) stan­
dardem. Poniżej przedstawiamy listę tych symboli, które mogą być nie znane
czytelnikom, czytającym o podobnych rzeczach w innych książkach. Obok
podajemy numery stron, na których pojawiają się ich objaśnienia. W celu
uzyskania odnośników do innych, częściej spotykanych oznaczeń, zajrzyj też
do skorowidza na końcu książki.
O zn aczen ie
N azw a
ln x
logarytm naturalny: loge x
309
lg x
logarytm dwójkowy: log 2 x
90
log x
logarytm dziesiętny: log10x
496
w
podłoga: m ax{n | n ^ x, całkowite n }
87
M
sufit: m in {n | n ^ x, całkowite n }
87
x mod y
reszta: x —y [x /y j
103
m
część ułamkowa: x mod 1
90
y f (x) óx
sumowanie nieoznaczone
67
V" f (x) óx
Ł— a
sumowanie oznaczone
68
x^
potęga ubywająca: x !/(x —n)!
66,241
X*
potęga przyrastająca: V(x + tl)/F (x)
66,241
n\
podsilnia: rt!/ 0 ! —n ! / l ! H------- b (—1)nrt!/n!
223
mz
część rzeczywista: x, jeśli z = x + iy
83
3z
część urojona: y, jeśli z = x + iy
83
Stron a
H,ln
liczba harmoniczna: 1/1 H-------h 1/ n
46
[(*)
uogólniona liczba harmoniczna: 1/ 1X H-------b 1/ n x
310
m-ta pochodna funkcji f w z
518
cykliczna liczba Stirlinga ( „pierwszego rodzaju”)
290
rt
m
podzbiorowa liczba Stirlinga („drugiego rodzaju”)
289
n
m
liczba Eulera
299
liczba Eulera drugiego rodzaju
302
(am . . . a 0)b
pozycyjny zapis liczby Y.™=o
26
K( a i , . . . , an )
wielomiany kontynuant
337
Q>k
c
funkcja hipergeometryczna
234
#A
moc zbioru: liczba elementów w zbiorze A
57
fcn]f(z)
współczynnik przy zn w rozwinięciu f (z)
226
[ a .. |3]
przedział domknięty: zbiór {x | oc ^ x ^ (3}
94
[m = n]
1 jeśli m = u, w przeciwnym razie 0 *
40
[m \n]
1 jeśli m dzieli n, w przeciwnym razie 0 *
124
[m\\n]
1 jeśli m dokładnie dzieli n, w przeciwnym razie 0 *
173
[m_Ln]
1 jeśli m jest względnie pierwsze z n,
Tl
m_
w przeciwnym razie 0 *
139
*W ogólności, jeśli S jest dowolnym stwierdzeniem, które może być prawdą
lub fałszem, to nawiasowa notacja [S] oznacza 1, jeśli S jest prawdą, a 0 w
przeciwnym razie.
W tekście książki używamy pojedynczych cudzysłowów (*...*) w celu
oznaczenia tekstu samego w sobie, tak jak został napisany , a podwójnych
(„... ”)—tak jak ma zostać przeczytany . W związku z tym słowo ‘słowo’ jest
czasami nazywane „słowem.”
Wyrażenie postaci ‘a /b c ’ ma to samo znaczenie, co ‘a /(b c )\ Ponadto
logx/log-y = (logx)/(logy) oraz 2 rt! = 2 (rt!).
| i | P roblem y rekurencyjne
W rozdziale tym zajmujemy się trzema przykładowymi problemami, które
będą stanowiły przedsmak tego, co nas czeka. Problemy te mają dwie wspólne
cechy: wszystkie były wielokrotnie badane przez matematyków, a ich rozwią­
zanie opiera się na pojęciu rekurencji. Rekurencja polega na tym, że roz­
wiązanie badanego problemu wyraża się za pomocą rozwiązań tego samego
problemu dla danych o mniejszych rozmiarach.
1.1. W ieże z H anoi
Przyjrzyjmy się na początek zgrabnej łamigłówce zwanej Wieżami z Hanoi.
Łamigłówkę tę wymyślił francuski matematyk Edouard Lucas w roku 1883.
Mamy wieżę złożoną z 8 krążków ułożonych jeden na drugim i nadzianych
na jeden z 3 prętów malejącymi średnicami ku górze:
Zadanie polega na przeniesieniu całej wieży krążków na jeden z pozosta­
łych prętów, przy czym w każdym ruchu można brać tylko jeden krążek i nie
wolno położyć większego krążka na mniejszym.
Lucas [260] ubarwił swoje zadanie legendą o znacznie wyższej Wieży
Brahmy, która miała mieć 64 krążki z czystego złota spoczywające na 3 dia­
mentowych igłach. U zarania czasu Bóg umieścił te złote krążki na pierwszej
z igieł i polecił grupie mnichów, aby przełożyli je na igłę trzecią zgodnie z po­
Ci, którzy jeszcze
tego nie znają,
niech podniosą rękę.
OK, a teraz cała
reszta może
spokojnie
przeskoczyć do
równania ( 1 .1 ).
Z łoto— o rany!
Nasze krążki są
pewnie z czegoś
konkretniejszego?
danymi regułami. Mnisi pracują bez wytchnienia dzień i noc. Kiedy skończą,
wieża rozsypie się i nastąpi koniec świata.
Wcale nie jest oczywiste, że łamigłówka ta ma jakiekolwiek rozwiązanie.
Chwila zastanowienia (lub wcześniejsza znajomość problemu) pozwala nam
być jednak dobrej myśli. Powstaje teraz pytanie: jaki jest najszybszy spo­
sób wykonania zadania? Ściślej: ile co najmniej ruchów trzeba wykonać, aby
przenieść wieżę?
Najlepszą metodą zaatakowania problemu tego typu jest pewne jego
uogólnienie. Wieża Brahmy zawiera 64 krążki, wieża z Hanoi — 8 . Zasta­
nówmy się, co się dzieje w przypadku n krążków.
Jedną z zalet takiego podejścia jest to, że możemy wejść w nasz problem
nieco głębiej. W rzeczywistości, jak to jeszcze wielokrotnie w tej książce zo­
baczymy, warto r o z w a ż a ć d r o b n e p r z y p a d k i najpierw. Łatwo jest prze­
łożyć wieżę składającą się z jednego lub dwóch krążków. Po paru próbach
znajdziemy też bez trudu metodę dla trzech.
Następnym krokiem przy rozwiązywaniu problemu będzie wprowadze­
nie odpowiedniej notacji: n a z w ij i z w y c i ę ż a j . Niech
będzie minimalną
liczbą ruchów konieczną do przeniesienia n krążków z jednego pręta na drugi
zgodnie z zasadami Lucasa. Oczywiście Ti jest równe 1, a Tz = 3.
Możemy też natychmiast otrzymać dodatkową wartość, gdy rozważymy
przypadek najdrobniejszy ze wszystkich. Oczywiście To = 0, ponieważ żadne
ruchy nie są potrzebne, aby przenieść zero krążków! Sprytni matematycy nie
wstydzą się myśleć detalicznie ( think sm ali), gdyż przypadki ogólne są ła­
twiejsze do ogarnięcia, gdy dokładnie zrozumiemy sytuacje krańcowe (nawet
gdy są trywialne).
Spójrzmy na to z innej strony i postarajmy się myśleć z rozmachem ( think
big)\ jak można przenieść dużą wieżę? Próby z trzema krążkami pokazują, że
do celu prowadzi przeniesienie 2 górnych krążków na pręt środkowy, następ­
nie przeniesienie trzeciego krążka na pręt docelowy i w końcu przeniesienie
na ten pręt pozostałych dwóch krążków. Pomysł ten dostarcza nam ogólnej
metody dla n krążków: najpierw przenieś n — 1 wierzchnich krążków na pręt
pomocniczy (to wymaga Tn_i ruchów), następnie przenieś największy krą­
żek na pręt docelowy (1 ruch) i w końcu przenieś położone na pomocniczym
pręcie n — 1 krążków na pręt docelowy (znów T^-i ruchów). Możemy zatem
przenieść n krążków (dla n > 0) w co najwyżej 2Tn_i + 1 ruchach:
Tn ^ 2Ta_i + 1 ,
dla n > 0.
W powyższym wzorze występuje ‘ ^ ’ zamiast ‘ = *, gdyż jak na razie poka­
zaliśmy, że 2Tn_i + 1 ruchów wystarcza. Nie pokazaliśmy jeszcze tego, że
konieczne jest użycie co najmniej 2Tn_i + 1 ruchów. Nietrudno jest jednak
dojść do tego.
1.1. W ieże z H anoi I
Czy może istnieć lepsze rozwiązanie? Okazuje się, że nie. W którymś
momencie musimy przecież ruszyć największy krążek i wtedy pozostałe n —1
musi leżeć na pręcie pomocniczym. Aby je tam przenieść, musimy wykonać
co najmniej Tn-i ruchów. Oczywiście gdybyśmy byli rozrzutni, moglibyśmy
największy krążek jeszcze poprzekładać sobie tam i z powrotem, ale po doko­
naniu tego po raz ostatni musimy znowu przenieść rt — 1 krążków (z których
wszystkie w tym momencie muszą się znaleźć na jednym pręcie) na najwięk­
szy z nich znajdujący się już na pręcie docelowym, a to wymaga znów Tn_i
ruchów. Zatem
n —1 + i
dla n > 0 .
Większość
publikowanych
„ rozwiązań”
problemu Lucasa,
takich jak na
przykład podane
przez Allardice’a
i Frasera [7], nie
zawiera
uzasadnienia tego,
że Tu musi być nie
mniejsze niż
2Tn—1 + 1 .
Te dwie nierówności wraz z trywialnym rozwiązaniem dla rt = 0 dają
To = 0;
Tn = 2Tn_i + 1 ,
(i-i;
dla rt > 0 .
Zauważmy, że te wzory są zgodne ze znanymi nam już wartościami Ti = 1
i T2 = 3. Doświadczenie z małymi liczbami pomogło nam nie tylko znaleźć
ogólny wzór, lecz także pozwoliło nam sprawdzić, czy nie popełniliśmy jakie­
goś głupiego błędu. Takie weryfikacje będą bardzo użyteczne, gdy napotkamy
bardziej skomplikowane obliczenia w późniejszych rozdziałach.
Zestaw równości takich jak ( 1 .1 ) nazywany jest rekurencją (używa się też
na nie określenia relacji rekurencyjnej lub rekursywnej). Rekurencją składa
się z podania wartości brzegowej i z równania wyrażającego ogólną wartość
za pomocą wartości wyrazów wcześniejszych. Czasami nazywamy rekurencją
samo równanie ogólne, choć z technicznego punktu widzenia potrzeba tam
jeszcze wartości brzegowej.
Wyprowadzona rekurencją pozwala na obliczenie Tn dla każdego n. Nikt
jednak nie lubi wyliczać wartości z zależności rekurencyjnej: dla dużych n jest
to zbyt pracochłonne. Rekurencją dostarcza nam jedynie informacji lokalnej.
R ozwiązanie rekurencji zadowalałoby nas znacznie bardziej. Chcielibyśmy
więc uzyskać zgrabną „zwartą postać” na T n, za pomocą której moglibyśmy
szybko dostawać żądane wartości nawet dla dużych rt. Mając taką zwartą
postać możemy lepiej zrozumieć, czym w rzeczywistości jest Tn .
Jak zatem rozwiązuje się taką rekurencję? Można oczywiście zgadnąć
wynik i pokazać, że mieliśmy rację. Najlepiej w tym celu jest znowu przyjrzeć
się drobnym przypadkom. Liczymy więc kolejno: T3 = 2 -3 + 1 = 7; T4 =
2 * 7 + 1 =1 5; T5 = 2*15 + 1 = 31; Tg = 2 * 3 1 +1 = 6 3 . Aha! To niewątpliwie
wygląda, jak gdyby
Tn = 2n - 1 ,
dla rt >. 0 .
( 1 .2 )
W każdym razie działa przynajmniej dla n ^ 6 .
I I P JL
Tak, ta k .. .ja już
to gdzieś widziałem.
1 . P ro b lem y
reku rencyjn e
Indukcja
matematyczna
pozwala dowieść, że
możemy wspiąć się
na drabinę tak
wysoko jak chcemy
przez wykazanie, że
możemy wspiąć się
na najniższy
szczebel (baza),
a następnie,
że z każdego
szczebla możemy
wspiąć się
na następny
(krok indukcyjny).
Indukcja m atem atyczn a stanowi ogólne narzędzie dowodzenia, że pew­
ne stwierdzenie o liczbie naturalnej rt jest prawdziwe dla wszystkich n
noNajpierw wykazujemy prawdziwość dla możliwie małego n 0 — nazywamy to
bazą indukcji. Następnie dowodzimy stwierdzenia dla rt > rto, zakładając, że
zostało ono już udowodnione dla wszystkich wartości pomiędzy no i n — 1
włącznie — tę fazę nazywamy krokiem indukcyjnym. Dowód taki dostarcza
nam nieskończonej liczby wyników za pomocą skończonego nakładu pracy.
Definicje rekurencyjne wyśmienicie nadają się do dowodów indukcyjnych.
W naszym przypadku na przykład wzór ( 1 .2 ) wynika bezpośrednio z ( 1 . 1 ):
Baza jest oczywista, gdyż To = 2° — 1 = 0 . Krok indukcyjny wynika dla
n > 0 natychmiast, gdy założymy, że wzór ( 1 .2 ) zachodzi dla n zastąpionego
przez n — 1 :
Tn = 2Tn_ , + 1 = 2(2 n _ 1 - 1) + 1 = 2n - 1 .
Okazuje się więc, że wzór ( 1 .2 ) zachodzi również dla n. Świetnie! Nasze po­
szukiwania wzoru na Tn zostały zakończone sukcesem.
Oczywiście nie oznacza to końca pracy mnichów: wciąż sumiennie prze­
kładają krążki i jeszcze zajmie im to trochę czasu, gdyż dla n = 64 trzeba
wykonać 264—1 ruchów (około 18 trylionów). Nawet z niemożliwą do zrealizo­
wania prędkością jednego ruchu na mikrosekundę przełożenie wieży Brahmy
zajęłoby im ponad 5000 wieków. Oryginalna łamigłówka Lucasa była nieco
bardziej realna: wymagała jedynie 2 8 — 1 = 255 ruchów, co wprawnej ręce
zajmuje około 4 minut.
Rekurencją wież z Hanoi jest typowa dla wielu przypadków, z którymi
spotykamy się w zastosowaniach najprzeróżniejszych rodzajów. Znalezienie
postaci zwartej dla pewnej wielkości takiej jak Tn będzie przebiegało w na­
stępujących fazach:
1.
2.
3.
Przypatrz się małym przypadkom. To daje wyobrażenie o problemie i
pomaga w fazach 2 i 3.
Zgadnij postać wyrażenia matematycznego opisującego szukaną wartość
i udowodnij jego poprawność. W przypadku wież z Hanoi jest to rekurencja ( 1 . 1 ), która pozwala nam wyliczyć wartość Tn.dla każdego n.
Znajdź i udowodnij zwartą postać naszego wyrażenia matematycznego.
Dla wież z Hanoi będzie to rozwiązanie rekurencji ( 1 .2 ).
W książce tej będziemy się przede wszystkim zajmowali fazą trzecią. Istotnie,
będziemy często przeskakiwali fazy 1 i 2 , gdyż wyrażenie matematyczne bę­
dzie nam dane na starcie. Nawet wtedy jednak, przy badaniu pojawiających
się podproblemów, będziemy wracali do faz 1 i 2 .
Analizując wieże z Hanoi doszliśmy do poprawnego rozwiązania, ale po
drodze wykonaliśmy „indukcyjny skok” — musieliśmy w pewnym momencie
polegać trochę na szczęściu, że uda się nam zgadnąć wynik. Jednym z głów­
1.2. P r o ste n a p łaszczyźn ie
nych celów tej książki jest wyjaśnienie, jak można rozwiązywać rekurencje
bez bycia jasnowidzem. Zobaczmy dla przykładu, w jaki sposób rekurencją
( 1 . 1 ) może się uprościć przez dodatnie 1 do obu stron równości:
To + 1 = i ;
Tn + 1 = 2Tn_i + 2 ,
r
dla rt > 0.
(^
'
1
'
!i
Teraz jeśli przyjmiemy Un = Tn + 1, to otrzymamy
U 0 = 1;
Un = 2 Un_,
dla n > 0 .
(i-3)
Interesujące:
pozbywamy się +1
w ( 1.1) przez
dodanie jedynki,
a nie odjęcie!
Nie trzeba być geniuszem, aby odkryć, że rozwiązanie tej rekurencji, to po
prostu Un = 2n ; zatem Tn = 2n — 1. Nawet komputer by to zauważył.
1.2. P ro ste na p łaszczyźnie
Drugi z naszych przykładów będzie miał charakter geometryczny. Ile kawał­
ków pizzy można uzyskać za pomocą rt prostoliniowych cięć nożem? Albo,
ściślej, jaka jest największa liczba Lu obszarów wyznaczonych przez n pro­
stych na płaszczyźnie? Problem ten został rozwiązany przez szwajcarskiego
matematyka Jacoba Steinera w 1826 roku [339].
Jak zwykle, rozważymy na początku drobne przypadki, pamiętając aby
zacząć od najdrobniejszego z nich. Płaszczyzna bez prostych ma jeden obszar,
płaszczyzna z jedną prostą — 2 obszary, z dwiema— 4.
Lo = 1
Li = 2
(Każda prosta przedłuża się w obu kierunkach w nieskończoność).
A zatem, myślimy, Ln = 2n . Oczywiście! Dodanie nowej prostej po­
dwaja po prostu liczbę obszarów. Niestety, nie jest to prawdą. Tak byłoby,
gdyby ri-ta prosta mogła podzielić każdy zastany obszar na dwa. Niewąt­
pliwie można za pomocą tej prostej podzielić taki obszar na co najwyżej
dwa kawałki, gdyż każdy z zastanych obszarów jest wypukły. (Prosta może
podzielić obszar wypukły na co najwyżej dwa obszary, każdy z nich znów
wypukły). Kiedy jednak dodamy trzecią prostą— pogrubioną na rysunku
poniżej— przekonamy się, że może ona podzielić co najwyżej 3 spośród 4
(Pizza z serem
szwajcarskim?)
Obszar jest
wypukły, jeśli
zawiera wszystkie
odcinki łączące
dowolne dwa z jego
punktów. (To nie
jest dokładnie to, co
na ten temat można
przeczytać w
słowniku, ale to jest
coś, w co wierzą
matematycy.)
1 . P ro b lem y
rekurencyj
20
obszarów, niezależnie od tego, jak poprowadziliśmy poprzednie 2 proste:
Zatem nie możemy uzyskać więcej niż L3 = 4 + 3 = 7 obszarów.
Po krótkim zastanowieniu się dostrzeżemy właściwe uogólnienie: n-ta
prosta (dla n > 0 ) zwiększa liczbę obszarów o k wtedy i tylko wtedy, gdy
przecina k spośród zastanych obszarów. Dzieje się tak z kolei wtedy i tylko
wtedy, gdy przecina zastane proste w k — 1 różnych punktach. Dwie proste
mogą przeciąć się w co najwyżej jednym punkcie, a więc nowa prosta może
przeciąć co najwyżej n — 1 zastanych prostych w co najwyżej n — 1 różnych
punktach, zatem musi być k ^ n. Udało sięnam znaleźć ograniczenie górne:
Ln ^ Ln_i + t l ,
dla n > 0.
Co więcej, za pomocą indukcji można łatwo pokazać, że w powyższym wzo­
rze możemy uzyskać równość. Wystarczy tak poprowadzić n-tą prostą, żeby
nie była równoległa do żadnej innej (zatem wszystkie je będzie przecinać) i
tak, żeby nie przechodziła przez żaden z istniejących już punktów przecięcia
(zatem wszystkie proste będzie przecinać w różnych punktach). Uzyskana
rekurencją przedstawia się następująco:
' 1-0 = 1 ;
Ln = Ln_i + rt, ,
Rozwijając?
Raczej nazwałbym
to wtykaniem
w siebie.
dla rt > 0.
(i-4)
Znane już wartości L i, L2 i L3 zgadzają się,więc ją akceptujemy.
Przystąpmy teraz do poszukiwań postaci zwartej. Moglibyśmy zacząć
bawić się w zgadywanie, tak jak poprzednio, ale ciąg 1, 2, 4, 7, 11, 16, . . .
niczego nie przypomina. Spróbujmy więc inaczej. Rekurencję często można
zrozumieć „rozwijając” ją tak jak poniżej:
Ln — Ln_i + Tl
= Lrt- 2 + (n — 1) + n
= ' Ln _ 3 + (n - 2 ) + (n -
1) + n
— Lo + 1 + 2 H------- 1- (rt —2 ) + (n — 1 ) + n
= 1 +
Sn ,
gdzie Sn = 1 + 2 + 3 H------- 1- (rt — 1 ) + n .
1.2. P r o ste na p łaszczyźn ie
Innymi słowy, Ln jest o 1 większe od sumy Sn początkowych rt liczb natu­
ralnych.
Liczby Sn pojawiają się na tyle często, że warto zrobić zestawienie paru
początkowych wartości. Będziemy mogli łatwiej skojarzyć te liczby, gdy zo­
baczymy je następnym razem.
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
sn
1
3
6
10
15
21
28
36
45
55
66
78
91
105
Liczby te są także zwane liczbami trójkątnym i, gdyż Sn jest liczbą kul bilar­
dowych ułożonych w trójkąt o n rzędach. Na przykład, przy n = 4 trójkątne
ustawienie ’v X wymaga S4 = 10 kul.
Aby wyliczyć Sn , możemy skorzystać z pomysłu Gaussa, do którego do­
szedł w roku 1786, mając zaledwie 9 lat [8 8 ] (zobacz także Euler [114, część 1 ,
§415]):
=
1
+
+ sn =
rt
+ (n — 1 ) + (rt —2 ) +
Sn
2
+
3
+
+ (rt — 1 ) +
+
2
+
2Sr,, —' (n + 1) + (tl + I) + (ti + 1) + ••• + (n + 1) + (n + 1)
Dodajemy po prostu ciąg Sn do niego samego w odwrotnej kolejności, tak
żeby każda z rt kolumn po prawej stronie sumowała się do n + 1. Po uprosz­
czeniu otrzymujemy
Wygląda na to, że
Gaussowi przypisuje
się kupę rzeczy —
albo rzeczywiście
był niezły, albo
miał świetnego
agenta prasowego.
A może miał
po prostu
magnetyzującą
osobowość?
n(n+ 1
(i-5)
S r, =
Dobrze, mamy więc rozwiązanie
Ln ,
2 l2 ± ! !
+ 1,
( 1 .6 )
Jako eksperci moglibyśmy być zadowoleni z uzyskanego wyprowadzenia
i uznać je za dowód, choć trochę machaliśmy rękami przy rozwijaniu i od­
wracaniu ciągu. Studenci matematyki powinni jednak móc sprostać wyższym
wymaganiom; nie jest więc złym pomysłem przedstawić precyzyjny dowód
przez indukcję. Kluczowym przejściem indukcyjnym jest
Ln = Ln_i + n = ( j { n - l ) n + 1) + n = j n { n + 1) + 1 .
W tym momencie bez wątpienia mamy już postać zwartą ( 1 .6 ).
Od pewnego czasu mówimy o postaciach zwartych bez precyzowania, co
to takiego. Zwykle wiadomo, o jaką postać chodzi. Rekurencje takie jak ( 1 . 1 )
czy ( 1 .4 ) nie są w postaci zwartej — wyrażają pewną wielkość odwołując się
Bogiem a prawdą
Gauss jest często
nazywany
największym
matematykiem
wszechczasów.
Dobrze jest więc
zrozumieć
przynajmniej jedno
z jego odkryć.
W końcu rt! może
być całkiem
sensownie
przybliżane wzorem
Stirlinga, w którym
występują tylko
„ przyzwoite”
operacje, o czym
później w tej
książce.
Czy „nieskończona
litera V” jest
pojęciem ścisłym?
do niej samej. Z kolei rozwiązania takie jak ( 1 .2 ) lub ( 1 .6 ) są zwarte. Sumy
typu 1 + 2 H------- b tl nie są w postaci zwartej — oszustwa dokonuje się przez
użycie notacji ‘ ’— za to wyrażenia typu n (n -b 1 ) / 2 mają postać zwartą.
Zgrubna definicja mogłaby wyglądać następująco: Wyrażenie na wartość f (n)
jest w postaci zwartej, jeśli możemy je wyliczyć stosując skończoną, nieza­
leżną od n, liczbę „dobrze znanych” działań standardowych. Na przykład,
2n — 1 i n ( n + l ) / 2 są w postaci zwartej, gdyż wykorzystują i to w jawny
sposób jedynie dodawanie, odejmowanie, mnożenie, dzielenie i potęgowanie.
Liczba wszystkich prostych postaci zwartych jest ograniczona. Na do­
miar złego istnieją rekurencje nie mające zwartych odpowiedników. Kiedy
takie rekurencje napotykamy odpowiednio często, uzupełniamy arsenał pod­
stawowych operacji; manewr ten zwiększa wydatnie zakres problemów mają­
cych swe rozwiązanie w „prostych” postaciach zwartych. Przykładem takiej
operacji jest iloczyn początkowych rt liczb naturalnych, n!, który okazał się
tak ważny, że obecnie uznajemy go za operację podstawową. Przyjmujemy
więc, że wzór n! jest w postaci zwartej, choć jego odpowiednik ‘ 1 *2 *... -n*
nie jest.
A teraz, króciutko, pewien wariant problemu prostych na płaszczyźnie.
Załóżmy, że zamiast prostych mamy załamane linie tworzące coś w rodzaju
nieskończonej litery V. Jaka jest maksymalna liczba Vn obszarów możliwych
do uzyskania przez ułożenie takich n nieskończonych V na płaszczyźnie?
Spodziewamy się, że Vn powinno być tak ze dwa-trzy razy większe od Ln .
Zobaczmy:
Zi = 2
. . . oraz chwili
zamyślenia . . .
Z2 = 7
Przyjrzawszy się tym drobnym przypadkom, po chwili namysłu zauwa­
żamy, że zagięte linie przypominają parę przecinających się prostych, z tym
że niektóre obszary zlewają się po tej stronie, po której „podwójne” proste
nie przedłużają się poza punkt spotkania.
4
1.3. P ro b lem Józefa F law iu sza i
Obszary 2 , 3 i 4, które byłyby rozłączne w przypadku dwóch prostych, stają
się jednym obszarem, jeśli dopuścimy załamanie jednej prostej. Tracimy więc
2 obszary. Niemniej jednak, zawsze tak możemy przesunąć to załamanie, żeby
punkt załamania leżał „poza” rejonem przecięć z innymi prostymi; w tym
przypadku te 2 obszary to będzie wszystko, co stracimy. Ubędą nam zatem
tylko dwa obszary dla każdej załamanej prostej. Mamy więc
Z n = I_2 n — 2n = 2 n ( 2 n + 1 ) / 2 + 1 — 2n
= 2u2 —n + 1 ,
W ćwiczeniu 18
znajdziecie dalsze
szczegóły.
(i-7)
Porównując zwarte postacie wzorów ( 1 .6 ) i ( 1 .7 ), dochodzimy do wniosku, że
dla dużych n mamy
Ln ~
5u2 ,
Zn -
2n2 ;
dostajemy więc 4 razy tyle obszarów w przypadku linii załamanych, niż w
przypadku normalnych prostych. W późniejszych rozdziałach dokładnie omó­
wimy, jak analizować przybliżone zachowanie się funkcji całkowitoliczbowych
dla dużych n. (Symbol *~ł zdefiniowany jest w rozdziale 9.1.)
1.3. P rob lem Józefa Flaw iusza
Ostatni z wprowadzających przykładów będzie wariantem starożytnego pro­
blemu nazwanego tak od znanego historyka pierwszego wieku naszej ery Jó­
zefa Flawiusza. Legenda głosi, że Flawiusz nie byłby dziś znany, gdyby nie
jego talent matematyczny. W trakcie wojny rzymsko-żydowskiej został wraz
z grupą 41 żydowskich powstańców otoczony przez Rzymian w jaskini. Wo­
ląc samobójstwo od pojmania, powstańcy zdecydowali się utworzyć krąg i
zabijać co trzecią osobę, aż nikt nie pozostanie przy życiu. Flawiusz jednak
wraz ze swoim przyjacielem nie zgadzał się na to nonsensowne samobójstwo
i szybko wyliczył, gdzie on i jego przyjaciel powinni stanąć w kręgu, aby
uniknąć śmierci.
W naszej wersji załóżmy, że mamy n ludzi ponumerowanych od 1 do n
ustawionych w kręgu. Eliminować będziemy co drugą osobę, aż pozostanie
tylko jeden człowiek żywy. Niech na przykład początkowa konfiguracja dla
u = 10 wygląda następująco:
r
v
'
'I
(Ahrens [6, tom 2]
oraz Herstein
i Kaplansky [187]
omawiają
interesującą historię
tego problemu. Sam
Flawiusz jest zbyt
pobieżny [197].)
. . . dając nam tym
samym szansę
usłyszenia tej
historii.
Oto mamy
przypadek, gdzie
n = 0 nie ma
sensu.
Nawet zły strzał ma
swoją wartość:
pozwala nam
wciągnąć się
w problem.
Tu leży pies
pogrzebany. Mamy
przecież ] [ 2 n ) =
nowaliczba[]{n)),
przy czym
nowaliczba(k) =
2 k —1 .
Porządek eliminowania jest taki: 2, 4, 6 , 8 , 10, 3, 7, 1, 9, tak więc numer
5 przeżywa. Nasz problem polega teraz ogólnie na wyliczeniu przeżywającego
numeru J(n ).
Wiemy już, że J( 10) = 5 . Pierwszy pomysł: J(rt) = n /2 dla parzystych
n; przypadek n = 2 zgadza się: J(2) = 1. Kilka następnych wartości jest już
jednak innych — hipoteza upada dla n = 4 i n = 6 .
rt
1 2
J(n)
1 1 3
3
4
5
6
1
3
5
Przyjrzyjmy się tym wartościom i spróbujmy lepiej strzelić. Hmmm . . . wy­
gląda na to, że J(n) zawsze jest nieparzyste. Faktycznie, są po temu powody:
Pierwsza runda wokół okręgu eliminuje wszystkie numery parzyste. Co wię­
cej, jeśli n jest liczbą parzystą, to dochodzimy po niej do sytuacji podobnej,
tyle że mamy do czynienia z połową ludzi, a ich numery się tylko trochę
zmieniły.
Załóżmy więc, że zaczęliśmy z 2n osobami. Po pierwszej rundzie wokół
okręgu zostaniemy z
i kolejny obrót zaczniemy od numeru 3. Mamy sytuację taką, jak gdybyśmy
zaczęli z n osobami, których numery zostały podwojone i zmniejszone o 1 .
Mamy więc,
J(2n) = 2J(n) — 1 ,
dlau^l.
Możemy teraz od razu przejść do dużych rt. Jeżeli, na przykład, J(10) = 5,
to
J(20) = 2J(10) — 1 = 2 - 5 - 1
= 9.
Podobnie, J(40) = 17, i teraz już możemy stąd wywnioskować, że J(5 • 2m) =
2m+1 + 1.
Jak w takim razie będzie to wyglądało z liczbami nieparzystymi? W przy­
padku 2 rt + 1 osób widać, że osoba o numerze 1 odpada zaraz po osobie o
numerze 2 n i zostajemy wtedy z
2n + 1
3
2n — 1
5
7
9
Znowu otrzymaliśmy tak jakby n osób, lecz tym razem ich numery są po­
dwojone i powiększone o 1. W związku z tym
J(2n + 1) = 2J(n) + 1 ,
dla u ^ 1.
Łącząc te dwa równania z J(1) = 1 otrzymujemy rekurencję obejmującą
wszystkie przypadki:
1( 1) = 1 ;
J(2tl) = 2 J(n) — 1 ,
dla n ^ 1;
J(2n + 1) = 2J(n) + 1 ,
dlari^l.
(1 .8 )
Tym razem nasza rekurencja jest bardziej „wydajna”, ponieważ za każdym
razem, gdy korzystamy z tej rekurencji, zamiast otrzymywania J(n) z J(tl—1)
mamy mniej więcej dwukrotne zmniejszenie argumentu n. Możemy zatem ob­
liczyć np. J(1000000) za pomocą zaledwie 19 kroków wynikających z ( 1 .8 ).
Wciąż jednak brakuje nam postaci zwartej; dawałoby to szybszą metodę wy­
liczania J(n), a ponadto byłoby bardziej pouczające. W końcu posiadanie
postaci zwartej może być często na wagę życia i śmierci.
Otrzymana rekurencja pozwala na szybkie skonstruowanie tabeli małych
wartości. Być może pozwoli nam to uchwycić regułę i w rezultacie zgadnąć
odpowiedź.
n
1
2 3
4 5 6 7
8 9 10 11 12 13 14 15
J(n)
1
1 3
1 3 5 7
1 3 5
7
9 11 13 15
16
1
Voila\ Wygląda na to, że możemy zgrupować wartości według kolejnych potęg
dwójki (zaznaczonych pionowymi przegrodami w tabeli). J(n) jest zawsze
jedynką na początku grupy, a wewnątrz grupy zwiększa się o 2. Jeśli więc
przedstawimy n w postaci n = 2 m + l, gdzie 2 m jest największą potęgą
dwójki nie przekraczającą n, a l jest tym co zostaje, to rozwiązaniem naszej
rekurencji będzie
J(2m + 1) = 21 + 1 ,
(Warto zauważyć, że jeśli 2m ^ n < 2m+1, to reszta l = n — 2m spełnia
zależność 0 ^ l < 2m+1 —2 m = 2 m.)
Pozostało zatem udowodnić równanie ( 1.9 ). Tak jak dotychczas, użyjemy
indukcji, ale tym razem indukcji ze względu na m. Gdy m = 0, wówczas
musi być 1 = 0, więc baza ( 1 .9 ) sprowadza się do J(1) = 1, co jest prawdą.
Krok indukcyjny składa się z dwóch części, zależnie od tego, czy liczba l jest
parzysta, czy nieparzysta. Jeśli m > 0, a przy tym 2m + l = 2n, to l jest
parzysta i
J(2m + l) = 2J(2m- ' + l / 2 ) - 1 =2(21/2 + 1) - i
metoda! Kluczowe
jest zauważenie,
że J(2m )= 1 dla
wszystkich m ,
a to wynika
bezpośrednio
z pierwszego
równania,
J(2n ) = 2 J (n }- 1.
Wiemy więc, że
osoba nr 1 przeżyje,
gdy n jest potęgą
dwójki.
Ogólnie jeśli tylko
n = 2m + l,
to liczba ludzi
redukuje się do
potęgi dwójki po l
egzekucjach. W tym
momencie osobą
numer 1 , czyli
uratowaną jest ktoś,
kto stał
na początku
na pozycji 21 + 1.
=21+1,
ze względu na ( 1.8 ) oraz na założenie indukcyjne; jest to dokładnie to, czego
nam potrzeba. Podobny manewr stosujemy i w przypadku nieparzystym,
kiedy 2m + 1 = 2ri + 1. Można było też zauważyć, że z równania ( 1.8) wynika
wzór
J (2 n + 1 )-J (2 n ) = 2.
Tak czy owak, indukcja została zakończona i równanie ( 1.9 ) jest udowod­
nione.
Aby zilustrować postać rozwiązania ( 1 .9 ), obliczmy J(100). W tym przy­
padku mamy 100 = 2 6 + 36, więc J(100) = 2 - 3 6 + 1 = 73.
Teraz, kiedy mamy już za sobą tę harówkę (rozwiązanie problemu), mo­
żemy sobie pozwolić na trochę luzu. Każde rozwiązanie problemu może być
uogólnione tak, żeby zastosować je do szerszej klasy problemów. Gdy tylko
poznamy metodę, warto jest przyjrzeć się jej z bliska i zobaczyć, do jakiego
stopnia możemy ją wykorzystać. W pozostałej części rozdziału zbadamy roz­
wiązanie ( 1.9 ) oraz uogólnimy strukturę, która związana jest z rozwiązaniem
tego typu problemów.
Potęgi dwójki odegrały ważną rolę przy znalezieniu rozwiązania, natu­
ralne jest zatem przebadanie rozwinięcia dwójkowego n oraz J(n). Załóżmy,
że n w układzie dwójkowym ma następujące przedstawienie:
n =
(bm b m—1
• bi b0);
czyli
n = bm2m + b m—1 >m—1
• + b i 2 + bo ,
gdzie każde bt jest albo 0 , albo 1, przy czym najbardziej znaczący bit b-,
jest równy 1. Pamiętając, że n = 2m + 1, otrzymujemy kolejno
n = ( 1 b m_ i b m_ 2 . . . b i b 0 )2 >
l = (0 bm_i b m_ 2 .. .b i b 0)2 ,
1.3. JProb lem J ó z e fa F law iusza j
21
= (bm_i b m _ 2 . . . bi b 0 0 ) 2 ,
21+1
= (bm_i bm_ 2 . . . b i b 0 1 ) 2 ,
J(n) = (bm_-| b m _ 2 . . . bi b 0 b m ) 2 .
Ostatni krok wynika stąd, że J ( n ) = 21+ 1, a przy tym bm = 1. Pokazaliśmy
zatem, że
J(( bm bra—1 • • • bi b o)2) — ( bm—1 • • • bi bo b m );
( 1 .1 0 )
co w żargonie informatycznym można wyrazić jako cykliczne przesunięcie
o bit w lewo — to wystarcza, aby z rt otrzymać J(n)! Magia. Na przykład
jeśli n = 10 0 = ( 1 1 0 0 1 0 0 )2 , to J(n) = J((1100100)2) = ( 1 0 0 1 0 0 1 )2, co jest
równe 64 + 8 + 1 = 73. Gdybyśmy używali na co dzień notacji binarnej,
zauważylibyśmy zapewne tę zależność natychmiast!
Zaczynając od rt i iterując m + 1 razy funkcję J, wykonujemy m + 1
jednobitowych przesunięć cyklicznych. Skoro rt jest liczbą (m + 1)-bitową,
moglibyśmy się spodziewać, że w końcu powrócimy do rt. Tak jednak oczy­
wiście nie jest. Weźmy np. rt = 13. Mamy wtedy j((l 1 0 1 )2 ) = ( 1 0 1 1 )2 , ale
J(( 1 0 1 1 ) 2 ) = ( 1 1 1 ) 2 i proces przesuwania załamuje się: zero znika, gdy tylko
stanie się najbardziej znaczącym bitem. W rzeczywistości J(rt) musi być za­
wsze mniejsze lub równe n z definicji; jest w końcu numerem przeżywającej
osoby. Jeśli więc tylko J(rt) < rt, to nigdy nie będziemy już w stanie wrócić
do n iterując J.
Powtarzane stosowanie J tworzy malejący ciąg wartości, który w końcu
stabilizuje się na pewnym „punkcie stałym”, dla którego J(rt) = n. Własność
cyklicznego przesunięcia ułatwia nam zgadnięcie, co będzie takim punktem
stałym: iterowanie funkcji odpowiednią liczbę razy zawsze zakończy się na
wzorcu złożonym z samych jedynek o wartości 2
— 1 , gdzie ~v(n) jest
liczbą jedynek w przedstawieniu dwójkowym liczby n. Skoro ^(13) = 3, więc
otrzymamy
2 lub więcej J-ów
J 0 U I(1 3 )...))
= 23 - 1
= 7.
Podobnie
8 lub więcej
jauj((101101101101011)2)...)) = 210 —1 = 1023.
Dziwne, ale prawdziwe.
Wróćmy do naszej pierwszej hipotezy, że J(n) = n /2 , gdy n jest parzyste.
Rzecz jasna, nie jest ona prawdziwa w ogólności, ale możemy teraz dokładnie
(„Iteracja” oznacza
tu zastosowanie
funkcji do siebie.)
Ciekawe, że jeśli M
jest zwartą C°°
n-rozmaitością
( n > ]) , to istnieje
różniczkowalne
zanurzenie M
W R 2 n -v (n ) _
ale niekoniecznie
W
.
Zastanawia mnie,
czy Flawiusz był
kryptotopologiem.
określić, kiedy jest prawdziwa:
J(n) = n / 2 ,
21 + 1 = (2m + l)/2 ,
l = j ( 2 m —2 ).
Jeżeli zatem liczba l = 5 (2 ™ — 2) jest całkowita, to n = 2m + l będzie rozwiązaniem, gdyż l będzie mniejsze niż 2m. Nietrudno zauważyć, że liczba
2 m — 2 jest wielokrotnością 3 wówczas, gdy m jest nieparzyste, natomiast
nie jest wielokrotnością 3 wówczas, gdy m jest parzyste (tego typu zależno­
ściami zajmiemy się w rozdziale 4). Otrzymaliśmy zatem nieskończenie wiele
rozwiązań równania J(n) = ri/2, których kilka początkowych przedstawia się
następująco:
m
Wygląda mi to
na grekę!
l
n = 2m + 1
J(u) = 21 + 1 = n / 2
n (dwójkowo)
1
0
2
1
10
3
2
10
5
1010
5
10
42
21
101010
7
42
170
85
10101010
•Zobaczmy, jaki wzorzec powstaje w skrajnie prawej kolumnie. Znajdują się
tam liczby w przedstawieniu dwójkowym, które ma tę własność, że cykliczne
przesunięcie w lewo daje ten sam efekt, co zwykłe przesunięcie w lewo (po­
łowienie).
OK, rozumiemy już funkcję J całkiem dobrze. Następnym krokiem będzie
jej uogólnienie. Co by było, gdyby jakiś problem doprowadził nas do reku­
rencji mniej więcej postaci ( 1.8 ), lecz z innymi stałymi? Wtedy mogłoby się
nam tak nie poszczęścić ze zgadnięciem wzoru, ponieważ takie rozwiązanie
mogłoby się okazać naprawdę dziwaczne. Rozważmy tę sytuację w ogólności,
wprowadzając stałe a, |3 oraz y i próbując znaleźć zwartą postać ogólniejszej
rekurencji
1
i
f ( 1) = « ;
f(2n) = 2f(n) + |3 ,
dlan^l;
f (2n + 1) = 2 f (n) + y ,
dla n ^ 1.
f1-11)
(W naszej oryginalnej rekurencji było <x' = 1, p = —1, y = 1.) Zaczynając
od f(l) = oc i postępując zgodnie z tym, co robiliśmy dotychczas, możemy
^
'™5™ ™ !ISK 1.3. P ro b lem Józefa F law iu szaj
ułożyć sobie następującą tabelkę małych wartości rt:
n
f(n)
1
oc
2
2oc +
2oc
3
4
5
6
7
8
9
|3
+
y
4 oc + 3|3
4oc + 2|3 + y
4 a + |3 + 2y
4 oc
+ 3y
8oc —
|—7 13
Soc + 6(3 +
y
Wygląda na to, że współczynnik przy oc jest najwyższą potęgą dwójki nie
przekraczającą n. Co więcej, w ramach tej samej potęgi dwójki współczynniki
przy |3 maleją o 1 do zera, współczynniki zaś przy y rosną o 1 , poczynając
od zera. Jeśli więc wyrazimy f (rt) w postaci
f(rt) = A(n) oc + B(n)|3 + C (n )y ,
( 1 .1 3 )
i wykorzystamy zauważone prawidłowości, to wygląda na to, że
A(rt) = 2m ;
B (n) = 2 - - 1 - 1 ;
( 1 .1 4 ) ‘
C(n) = l .
Jak zwykle, przyjmujemy tu, że n = 2m + l oraz 0 ^ l < 2m, dla n ^ 1.
Nie jest tak trudno udowodnić przejście z ( 1 . 1 3 ) do ( 1 . 1 4 ) za pomocą
indukcji, ale rachunki są zagmatwane i techniczne. Na szczęście mamy lepszą
metodę postępowania przez wybranie odpowiednich wartości i lekką nimi
manipulację. Zilustrujmy to przy założeniu, że oc = 1, |3 = y = 0, czyli f (n)
ma być równe A(n). Rekurencją ( 1 . 1 1 ) przybiera teraz postać
A(1) = 1;
A(2n) = 2 A ( n ) ,
dla n is 1;
A(2n + 1) = 2 A ( n ) ,
dla n ^ 1.
Bez trudu można pokazać, przez indukcję ze względu na m, że A(2m + 1) =
2yn.
Podejdźmy teraz do rekurencji ( 1 . 1 1 ) oraz rozwiązania równania ( 1 . 1 3 )
z drugiej strony. Zacznijmy od jakiejś prostej funkcji f (rt) i sprawdźmy, czy
Trzymajcie się
mocno krzeseł.
Ten kawałek,
to zupełna nowość!
Fajny pomysł!
istnieją stałe (a, |3,y), które mogą ją określić. Po podstawieniu do równania.
( 1. 11) funkcji stałej f(n) = 1 uzyskamy
1 = oc;
1 = 2-1 + P;
1 = 2-1+y;
zatem wartości (a,|3,y) = (1,—1, —1) wyznaczone przez te równania będą
spełniały A(n) — B(n) — C(n) = f(n) = 1. W podobny sposób możemy
spróbować z funkcją f (n) = n:
1 = OC] ,
2n = 2 -n 4- (3;
2n + 1 = 2 -n + y.
Równania te są spełnione dla każdego n, gdy oc= 1, |3 = 0 oraz y = 1. Nie
potrzeba więc nawet indukcji, żeby pokazać, że te parametry odpowiadają
funkcji f (n) = n. My ju ż wiem y , że f (n) = n będzie rozwiązaniem w tym
przypadku, gdyż rekurencja ( 1 . 11) jednoznacznie określa f (n) dla każdego n.
I to już wystarczy! Pokazaliśmy, że funkcje A(tl), B(n) oraz C(n) z równa­
nia ( 1. 13), które rozwiązują rekurencję ( 1. 11) w ogólności, spełniają równania
Uwaga! Autorzy
zamiast przedstawić
nam systematycznie
metodę repertuaru
chcą, żebyśmy
zrozumieli ją
za pomocą
przerobienia paru
przykładów.
Metoda ta działa
w przypadku
rekurencji, które są
„liniowe,” w tym
sensie, że ich
rozwiązanie wyraża
się przez sumę
pewnych bazowych
funkcji zmiennej n
przemnożonych
przez stale
parametry, tak ja k
to jest w ( 1 .13 ).
Równanie ( 1 .13 )
stanowi klucz do
wszystkiego.
A(n) = 2 m ,
gdzie n = 2 m + 1 i 0 ^ l < 2 m;
A (n)-B(n)-C (n) = 1;
A(n) + C(n) = n .
Nasza hipoteza ( 1. 14) wynika z nich natychmiast, gdyż rozwiązując te równa­
nia dostajemy właśnie C(n) = n —A(n) = l oraz B(tl) = A(n) — 1 — C(n) =
2m -
1 - l.
Podejście to ilustruje zaskakująco użyteczną przy rozwiązywaniu reku­
rencji metodę repertuaru. Zaczynamy od ustalenia parametrów, dla któ­
rych znamy rozwiązanie— to daje nam repertuar przypadków specjalnych,
które umiemy rozwiązać. Następnie otrzymujemy uogólnienie przez połącze­
nie przypadków szczególnych. Potrzebujemy tylu niezależnych przypadków
szczególnych, ile mamy niezależnych parametrów (w omawianym przykła­
dzie trzech ze względu na a, |3, i y). Ćwiczenia 16 i 20 dostarczają nam
dalszych przykładów stosowania metody repertuaru.
Wiemy już, że oryginalna J-rekurencja ma tajemnicze rozwiązanie w sys­
temie dwójkowym:
I((bm bm _i ...bi boh) = (bm -i •••bib0bm )2 ,
gdzie bm = 1.
1.3. P ro b lem Józefa F law iu sza
Czy uogólniona rekurencją Flawiusza też będzie miała podobnie tajemnicze
własności?
Dlaczegóż by nie? Możemy przepisać uogólnioną rekurencję ( 1 . 1 1 ) jako
f ( 1) = <x;
f( 2n + j ) = 2 f(n) +
dla j = 0 , 1
,
i
(i 1 5 )
u ^ 1,
jeśli tylko przyjmiemy po = |3 oraz (31 = y. Nasza rekurencją zaś rozwija się
następująco:
f ((bm bm_i . . . bi b oh) =: 2 f ((bm bm_i . . . bi ) 2 ) + |3b0
= 4f ((bm bm_i . . . b 2 k ) + 2|3bl + |3bo
— 2 mf ((bm)2 ) + 2 m 1 |3bm_1H------ h2|3b1 +P b 0
— 2moc + 2 m 1
+ • • • + 2(3b! + Pb0 •
Odejdźmy teraz od notacji dwójkowej i dopuśćmy dowolne cyfry w miejsce
zer i jedynek. Z dokonanego wyprowadzenia wynika, że
f ( ( ^ m b m _ i . . . b i bo)2) — ( ^ | 3bm_i Pbm„2 • • • Pbi Pbo) 2 •
( lodchodzimy’ =
‘niszczymy’)
( 1 .1 6 )
Świetnie! Wzorzec ten zobaczylibyśmy wcześniej, gdybyśmy nieco inaczej
przedstawili sobie tabelę ( 1 . 1 2 ):
n
f(n)
1
oc
2
2 oc + (3
2oc + y
3
4
5
6
7
Wydaje mi się, że w
końcu to złapałem:
Przedstawienia
dwójkowe A(rt),
B(rt) i C(rt) mają
1 na różnych
pozycjach.
4 a + 2|3 + (3
4oc + 2|3 + y
4<x + 2y + (3
4 a + 2y + y
Na przykład, gdy n = 100 = ( 1 1 0 0 1 0 0 )2 , nasze flawiuszowe wartości
oc = 1, (3 = —1 oraz y = 1 pociągają za sobą
n=
f (n) =
=
(1
0
(1
0
1 - 1 - 1
+64 +32
-16
-8
=
1
0
0 )2
100
1
-1
-1
)2
+4
-2
-1
= 73
tak jak przedtem. Właściwość cyklicznego przesunięcia wynika z tego, że
każdy blok cyfr (10 . . . 00)2 w dwójkowej reprezentacji n przechodzi na
( 1 - 1 . . . - 1 - 1)2 = (0 0 . . . 0 1 )2 .
„Mamy dwa
rodzaje uogólnień.
Są uogólnienia
proste i uogólnienia
wartościowe.
Łatwo jest
uogólniać,
rozwadniając
pomysł dużymi
słowami. Znacznie
trudniej jest
stworzyć dokładny
i skondensowany
ekstrakt z paru
dobrych
składników
G. Pólya [298]
To chyba musiało
być okropne
szczęście.
Wprowadzona zmiana notacji doprowadziła w końcu do zwartego rozwią­
zania (1.16) ogólnej rekurencji (1.15). Jeżeli to nas nie przeraża, to możemy
pójść nawet dalej. Rekurencja
f(j) = o j ,
f(dn + j) = cf(n) + Pj ,
dla 1 ^ j < d;
dla 0 ^ j < d i
n^l,
1 ^
jest taka sama, jak poprzednio, z tym że zaczynamy z liczbami zapisanymi
przy podstawie d, a w wyniku dostajemy liczby zapisane przy podstawie c.
Otrzymujemy zatem rozwiązanie zmieniające podstawę zapisu:
f ((b-m. b m _ l
. . .b i b o ) d )
—
(^ b m
P b m _i
P b m _2**-I^bi
P b o )c •
Załóżmy, że przez jakieś niebywałe szczęście dostajemy do rozwiązania taką
rekurencję:
f ( 1)
f( 2 )
—34,
= 5,
f(3rt)
=
f(3n+l)
=
10f(n) —2 ,
dlan^l,
f(3n + 2)
=
10f(n) + 8 ,
dlan^l,
10f(n)+ 76, dla n ^ 1,
i załóżmy, że chcemy obliczyć f(19). Mamy tutaj d = 3 i c = 10. Ze względu
na to, że 19 = (201 ) 3, rozwiązanie zmieniające podstawę każe nam zamieniać
zapis liczby cyfra po cyfrze z podstawy 3 do podstawy 10. Początkowa dwójka
stanie się więc piątką, a 0 i 1 staną się odpowiednio 76 i —2, ostatecznie więc
f (19) = f ((201 )3 ) = (5 76 —2) 10 = 1258,
Ale tak w ogóle, to
jestem przeciwny
rekurencjom wojen.
Prosimy o robienie
wszystkich zadań
rozgrzewkowych
we wszystkich
rozdziałach!
Autorzy
co stanowi odpowiedź.
Józef Flawiusz i wojna rzymsko-żydowska doprowadziły nas w końcu do
całkiem ogólnych rekurencji.
Ć w iczenia
R ozgrzew ka
1 . Wszystkie konie są tego samego koloru. Możemy to udowodnić przez in­
dukcję ze względu na liczbę koni w rozważanym zbiorze. Oto w jaki
sposób: „Jeśli mamy do czynienia z jednym koniem, to ma on ten sam
kolor co on sam. Baza więc zachodzi trywialnie. W celu pokazania kroku
indukcyjnego załóżmy, że w n-elementowym zbiorze koni są one ponume­
rowane od 1 do n. Na mocy założenia indukcyjnego konie od 1 do n — 1
mają ten sam kolor, podobnie konie o numerach od 2 do n. Ale środ­
kowe konie o numerach od 2 do n — 1 nie są kameleonami, więc nie mogą
zmieniać koloru, kiedy przyznają się do różnych grup. Zatem konie od 1
do n muszą mieć ten sam kolor, czyli wszystkie n koni jest tego samego
koloru; QED.” Co, jeśli cokolwiek, jest błędne w tym rozumowaniu?
2. Znajdź najkrótszą sekwencję ruchów przekładających wieżę u krążków
z lewego pręta A na prawy pręt B, jeśli bezpośrednie ruchy między A
i B są zabronione. (Każdy ruch musi dotyczyć środkowego pręta. Tak jak
poprzednio, większego krążka nie można położyć na mniejszym.)
3 . Pokaż, że podczas przenoszenia wieży z ograniczeniami z poprzedniego
zadania napotkamy każde dopuszczalne ułożenie krążków na 3 prętach.
4. Czy istnieje początkowa i końcowa konfiguracja n krążków na 3 prętach,
tak aby z jednej do drugiej trzeba było wykonać więcej niż 2 n —1 ruchów
zgodnie z oryginalnymi zasadami Lucasa?
5. „Diagram Venna” z 3 zachodzącymi na siebie kołami jest często używany
dla zilustrowania 8 podzbiorów związanych z 3 danymi zbiorami
Czy można zilustrować 16 możliwych podzbiorów związanych z 4 danymi
zbiorami za pomocą 4 zachodzących na siebie kół?
6 . Niektóre obszary określone przez n prostych na płaszczyźnie są nieskoń­
czone, podczas gdy inne są ograniczone. Jaka jest maksymalna liczba
obszarów ograniczonych?
7. Niech H(n) = J(n + 1) — J(rt). Z równania ( 1.8) wynika, że H(2n) = 2 i
H (2n+1) = J (2 n + 2 )-J (2 n + l) = ( 2 J ( n + 1 ) - l ) - ;(2 J (n )+ l) = 2 H (n )-2 ,
dla wszystkich n ^ 1. Wygląda na to, że przez indukcję ze względu na n
można udowodnić, że H(n) = 2 dla wszystkich n. Gdzie tkwi błąd?
Ć w iczen ia d om ow e
8 . Rozwiąż rekurencję
Qo = <x;
Qn
=
Qi = |3;
(1 “1“ Qn—1 ) / Qn—2 ,
d l a Tl > 1.
Załóżmy, że Qn ^ 0 dla każdego n ^ 0. Wskazówka: Q4 = (1 + <x)/p.
... tu mamy tego
konia innego koloru.
9. Czasami można użyć indukcji działającej wstecz, dowodząc kroku od rt
do n — 1 zamiast na odwrót! Rozważmy na przykład stwierdzenie
P(n) :
Jest to niewątpliwie prawdą, gdy n = 2, ponieważ (xi + x z ) 2 — 4xi x 2 =
(x i -
x 2 )2
^ 0.
a) Przyjmując xn = (xi + • • • + xn_i ) / (n — 1), udowodnij, że z P(n)
wynika P (rt — 1) dla n > 1.
b) Pokaż, że z P(rt) i P(2) wynika P(2n).
c) Objaśnij, dlaczego wystarcza to do pokazania prawdziwości P(n) dla
każdego n.
1 0 .Niech Qn będzie minimalną liczbą ruchów konieczną do przełożenia wieży
złożonej z n krążków z A na B przy założeniu, że wszystkie ruchy należy
wykonywać zgodnie ze wskazówkami zegara — czyli z A na B, z B na
trzeci pręt oraz z trzeciego pręta na A. Niech Rn będzie minimalną liczbą
ruchów potrzebną, aby przy tych samych ograniczeniach przenieść krążki
z powrotem z B na A. Pokaż, że
0,
Qn + Qn--| + 1 ,
gdy n = 0 ;
gdy n > 0 .
(Nie potrzebujesz rozwiązywać tych rekurencji; nauczymy się to robić w
rozdziale 7.)
11. Podwójna wieża z Hanoi składa się z 2n krążków n różnych rozmiarów,
po 2 krążki każdego rozmiaru. Jak zwykle, wymagamy, aby przenosić w
jednym ruchu jeden krążek i nie kłaść większego na mniejszym.
a) Ile ruchów trzeba co najmniej wykonać, aby przenieść wieżę z jednego
pręta na drugi, jeśli krążki równej wielkości są nierozróżnialne?
b) Co by było, gdybyśmy zażądali odtworzenia oryginalnego ułożenia
krążków? ( Wskazówka: To jest rzeczywiście trudne, na dobrą sprawę
powinno się znaleźć w następnej grupie problemów.)
1 2 . Uogólnijmy nieco ćwiczenie l l a zakładając, że mamy n różnych rozmia­
rów krążków i że mamy m * krążków rozmiaru k. Oblicz minimalną liczbę
ruchów A ( m i , . . . , m n ), potrzebnych do przeniesienia wieży, kiedy nie
rozróżniamy krążków tego samego rodzaju.
13. Jaka jest największa liczba obszarów wydzielonych przez rt zygzaków,
gdzie każdy zygzak składa się z dwóch równoległych półprostych połą­
czonych odcinkiem?
14. Ile kawałków sera można uzyskać z pojedynczego grubego kawałka za
pomocą 5 cięć? (Ser musi być utrzymany na swoim miejscu w czasie, gdy
dokonywane są cięcia i każde cięcie musi odpowiadać pewnej płaszczyźnie
w przestrzeni 3-wymiarowej.) Znajdź rekurencję dla Pn., maksymalnej
liczby 3-wymiarowych obszarów określonych przez rt różnych płaszczyzn.
15. Flawiusz miał przyjaciela, który został uratowany, gdy był na przedostat­
niej pozycji. Ile wynosi I(rt), numer przedostatniej pozycji, gdy co druga
osoba jest eliminowana?
16. Za pomocą metody repertuaru rozwiąż 4-parametrową ogólną rekurencję
Powodzenia w
utrzymaniu sera
na swoim miejscu!
g(i) = <*;
g(2rt + j) = 3 g ( r t ) + y r t + P j ,
dlaj=0,1
i
rt^l.
Wskazówka: Spróbuj wykorzystać funkcję g (n) = rt.
Z adania egzam in acyjn e
17. Niech W n będzie minimalną liczbą ruchów koniecznych do przeniesienia
wieży złożonej z rt krążków, przy założeniu że mamy łącznie 4 pręty
zamiast 3. Pokaż, że
W n(n+ 1)/2 ^ 2W n (n_ !)/2 + Ttl ,
dla U > 0.
(Tn = 2n — 1 jest określone jak w klasycznym przypadku 3 prętów.)
Korzystając z tej rekurencji znajdź zwartą postać funkcji f(n) takiej, że
Wn (n+i ) / 2 ^ f (tl) dla wszystkich rt ^ 0 .
18. Pokaż, że następujący zbiór rt załamanych linii wyznacza Zn obszarów,
gdzie Zu zdefiniowane jest jak we wzorze ( 1.7 ): j-ta linia załamana dla
1 ^ j ^ rt ma swój wierzchołek w {n 2 \ 0 ) i przechodzi przez punkty
(n2>- n > , 1) i (n2> -rt* - n - n ,l).
19. Czy można otrzymać Zn obszarów za pomocą rt załamanych linii, gdy
wszystkie kąty przy załamaniach są równe 30°?
20. Korzystając z metody repertuaru rozwiąż poniższą 5-parametrową reku­
rencję:
h(1) = oc;
h(2n + j) = 4 H (rt)+ y jn + P j,
dla j = 0,1
i
rt^l.
Wskazówka: Spróbuj wykorzystać funkcje H(n) = rt i H(n) = rt2.
2 1 . Załóżmy, że w kręgu stoi 2n osób. Pierwsze rt stanowią „dobrzy”, a drugie
rt— „źli”. Pokaż, że zawsze można dobrać liczbę naturalną m (zależną od
rt) tak, aby przy eliminowaniu co m-tej osoby wszystkie złe osoby zostały
Czy to rodzaj
pięciogwiazdkowej
ogólnej rekurencji?
wyeliminowane jako pierwsze. (Dla przykładu, gdy rt = 3, wówczas m =
5, gdy n = 5, wówczas m = 30.)
Zadania d odatkow e
2 2 . Pokaż, że można skonstruować diagram Venna dla każdej z 2n kombina­
cji danych rt zbiorów za pomocą n wypukłych wielokątów powstających
przez obroty jednego z nich wokół pewnego środka.
23. Załóżmy, że Flawiusz spostrzegł, że znajduje się na pozycji j, ale ma
możliwość wybrania parametru eliminacji q, tak aby co q-ta osoba była
eliminowana. Czy zawsze może się uratować?
P ro b lem y badaw cze
24. Znajdź wszystkie rekurencje postaci
yr
_
n _
Tak, i moje
gratulacje, jeśli taki
zbiór znajdziesz!
1 + aiXn_i H--- h akXn-Tc
b!Xn_i + . . . + b kXn_ k
’
których rozwiązania są okresowe niezależnie od początkowych wartości
Xo, . . . , Xic_i.
25. Rozwiąż problem wież z Hanoi z 4 prętami przez pokazanie, że we wzorze
w zadaniu 17 zachodzi równość.
26. Uogólniając zadanie 23, załóżmy, że podzbiór Flawiusza (albo „zbiór
flawiuszowy”) zbioru {1 , 2 , . . . , rt} to zbiór takich k liczb, że dla pewnego q
osoby spoza tego zbioru zostaną wyeliminowane jako pierwsze. (To są te
k pozycji „dobrych osób”, które Flawiusz chce uratować.) Okazuje się,
że dla rt = 9 trzy spośród 2 9 możliwych podzbiorów są nieflawiuszowe,
a mianowicie { 1, 2, 5, 8 ,9}, {2 , 3 , 4 , 5 , 8} i { 2 ,5 , 6 ,7 , 8}. Dla n = 12 mamy
13 zbiorów niefławiuszowych. Co ciekawsze, są to jedyne nieflawiuszowe
podzbiory dla n ^ 12. Czy zbiory nieflawiuszowe są rzadkie dla dużych n?
Sumy występują w całej matematyce, musimy więc mieć podstawowe na­
rzędzia do radzenia sobie z nimi. W tym rozdziale wprowadzamy notację i
przedstawiamy ogólne techniki, które sprawiają, że sumy stają się bardziej
przyjazne.
2.1. N o ta cja
W rozdziale 1 napotkaliśmy sumę początkowych rt liczb naturalnych, którą
oznaczyliśmy przez 1 + 2 + 3 H------ b (n — 1) + n. Notacja ‘
’ w takich wzo­
rach nakazuje nam wypełnić kropki liczbami zgodnymi z wzorcem ustalonym
przez okalające elementy. Oczywiście musimy uważać z sumami takimi, jak
1 + 7 H-------b 41,7, których znaczenie jest niejasne ze względu na zbyt ubogi
opis. Z drugiej strony, obecność elementów takich jak 3 i (n — 1) jest lekką
przesadą; wzprzec zapewne byłby jasny również wtedy, gdybyśmy napisali
1 + 2-1-------b n. Z czasem ośmielimy się pisać wręcz 1 H-------bn.
Będziemy mieli do czynienia z sumami ogólnej postaci
cii + a.2 + • • • + clu ,
(2.1)
gdzie każde z a k jest liczbą, która została jakoś określona. Notacja ta ma
tę zaletę, że przy odrobinie wyobraźni możemy „ujrzeć” całą sumę tak, jak
gdyby została napisana w całości.
Każdy element a k sumy będziemy nazywali w yrazem lub składnikiem.
Wyrazy podane w odpowiedniej liczbie zwykle powinny układać się w łatwo
przyswajalny wzorzec i dlatego jesteśmy zmuszeni niekiedy wypisać je w
postaci bardziej skomplikowanej, tak aby ogólne znaczenie stało się jasne.
Jeśli na przykład wyrażenie
1 + 2 + -----b 2 n _ 1
ma przedstawiać sumę n składników, a nie 2 n_1, to powinniśmy zapisać je
precyzyjniej jako
2 ° + 2 ' + -----b 2 n_1.
„Le signe
indiąue que
Fon doit donner au
nombre entier i
toutes ses valeurs
1, 2, 3, ..., et
prendre la somme
des termes.”
J. Fourier [127]
Moment! Nie
chciałbym używać
a lub n na
określenie zmiennej
indeksowej
zamiast k w (2 .2);
te litery są
„zmiennymi
wolnymi”, które
mają w tym
przypadku
znaczenie poza
•
Notacja wielokropkowa ma wiele zastosowań, ale czasem bywa niejedno­
znaczna i jest nieco przegadana. Dostępne są inne możliwości, w szczególności
notacja
n
(2.2)
k=1
nazywana notacją Sigma, ze względu na grecką literę Y. (duże sigma). No­
tacja ta każe włączyć do sumy dokładnie te wyrazy a^, których indeks k
jest liczbą całkowitą zawierającą się pomiędzy 1 a rt włącznie. Wyrażając
to słowami, „sumujemy względem k od 1 do rt.” Joseph Fourier wprowadził
tę notację sumy oznaczonej w roku 1820 i wkrótce została ona powszechnie
przyjęta w świecie matematycznym.
Zmienna indeksowa k nazywana jest zmienną związaną ze znakiem sumy
Y_ w (2.2), ponieważ k w ą jest oderwane od czegokolwiek, co znajduje się
poza sumą. Każda inna litera mogłaby tutaj pełnić rolę k bez wpływu na
wartość (2.2). Litera i jest też często używana (być może jako zaczynająca
słowo „indeks” sumy), ale będziemy przede wszystkim używali k, zachowując
i na oznaczenie \ f —\.
Okazuje się, że uogólniona notacja Sigma jest nawet bardziej użyteczna
niż jej forma oznaczona. W celu określenia zakresu indeksów, które zmienna k
może przyjąć, możemy, po prostu napisać jeden lub więcej warunków pod
znakiem
Sumy w przypadku (2.1) i (2.2) można zapisać także jako
<*k .
(2-3)
I^ k ^ n
W tym konkretnym przypadku nie ma dużej różnicy między nową notacją
i notacją (2.2), ale postać uogólniona pozwala nam rozważać sumy wzglę­
dem zbiorów indeksów niekoniecznie będących kolejnymi liczbami całkowi­
tymi. Możemy na przykład wyrazić sumę kwadratów wszystkich nieparzy­
stych liczb naturalnych mniejszych niż 100 w następujący sposób:
L
l^ k c lO O
k nieparzyste
*2 -
Oznaczona postać tej sumy
49
2k + n 2
k=0
wygląda dziwacznie i jest mniej przejrzysta. Podobnie, suma odwrotności
wszystkich liczb pierwszych pomiędzy 1 a N przedstawia się następująco:
p pierwsza
postać oznaczona zaś wymagałaby zastosowania notacji
gdzie pic oznacza k-tą liczbę pierwszą, a tt(N) jest liczbą liczb pierwszych nie
przekraczających N. (Ciekawe, że suma ta daje przybliżoną średnią liczbę
dzielników pierwszych losowej liczby bliskiej N, gdyż około 1/p spośród
tych liczb dzieli się przez p. Wartość tej sumy dla dużych N wynosi około
l nl nN + M, gdzie M w 0,2614972128476427837554268386086958590515666
jest stałą Mertensa [271]; ln x oznacza logarytm naturalny z x, a ln ln x ozna­
cza ln(lnx).)
Największą zaletą uogólnionej notacji Sigma jest to, że jest ona wygod­
niejsza przy przekształcaniu niż postać oznaczona. Przypuśćmy, że chcemy
na przykład zmienić zmienną indeksową k na k + 1. W postaci uogólnionej
mamy
^
ak =
Y i
Qk+i ;
l^k^n
1^k+1^n
i łatwo jest dostrzec, o co chodzi; możemy dokonywać podstawień niemal w
ciemno. Natomiast w postaci oznaczonej mamy
n
n —1
i nie jest tak łatwo dostrzec, co się stało, a ponadto możemy łatwiej popełnić
błąd.
Z drugiej strony postać oznaczona nie jest znowu tak zupełnie bezuży­
teczna. Jest ładna i zgrabna, możemy ją zapisać szybko, gdyż ( 2 .2) ma 7
symboli, podczas gdy ( 2 .3 ) ma ich 8 . W związku z tym będziemy używali
często Y. z dolnymi i górnymi ograniczeniami przy określaniu problemu lub
przedstawianiu wyniku, natomiast w trakcie przekształcania sum, których
zmienne indeksowe podlegają zmianom, będzie nam łatwiej pracować z rela­
cjami umieszczonymi pod
To jeszcze nic.
Zobaczcie, ile razy
H występuje
w Iliadzie!
Znak Y. występuje ponad 1000 razy w tej książce, więc chcemy być
pewni, że dokładnie wiemy, o czym mówimy. Formalnie będziemy pisali
Y . ak
( 2 '4)
p(k)
jako skrót na sumę wszystkich wyrazów a k takich, że k jest liczbą całkowitą
spełniającą pewną własność P(k). (Własność P(k) jest dowolnym zdaniem
o k, które może być albo prawdziwe, albo fałszywe.) Na razie założymy, że
tylko dla skończenie wielu liczb całkowitych k spełniających P(k) zachodzi
ak 7^ 0 ; w przeciwnym razie bylibyśmy zmuszeni dodać nieskończenie wiele
liczb niezerowych i musielibyśmy być ostrożniejsi. Z drugiej strony, jeśli P(k)
jest fałszywe dla każdego k, to mamy do czynienia z sumą „pustą”, a wartość
pustej sumy definiujemy jako zero.
Wewnątrz akapitu będziemy używali nieco zmienionej wersji ( 2 .4 ): pi­
sząc T P(k) dic’, umieścimy własność P(k) jako indeks w taki sposób, żeby
wzór nie rozpychał zanadto wiersza. Podobnie, zapis ‘X k = i a k* jes^ dobrym
pomysłem na ( 2 .2), gdy chcemy zmieścić taką notację w jednym wierszu.
Często nas korci, aby napisać
rt—1
rt
k(k — 1) (n —k)
k = 2
Hej! Delta
Kroneckera, którą
widziałem ju ż w
innych książkach
(mam na myśli
6icn,równa 1,jeśli
k = n, a 0 w
przeciwnym razie),
jest szczególnym
przypadkiem
konwencji Iversona:
możemy po prostu
napisać [k = n].
zamiast
k(k — 1) (rt —k ) ,
k = 0
gdyż wyrazy dla k = 0, 1 i u w tym wzorze są zerami. Może to się nam
wydać bardziej ekonomiczne, żeby zamiast rt + 1 składników dodać rt — 2
składniki. Takie kuszące uproszczenia powinny być jednak odrzucane; efek­
tywność obliczeń to nie to samo, co efektywność zrozumienia! Przekonamy
się, że utrzymywanie możliwie prostej postaci dolnych i górnych ograniczeń
powoduje, że sumy mogą być przekształcane łatwiej. W rzeczywistości postać
m°że być niebezpiecznie dwuznaczna, ponieważ jejznaczenie nie jest
jasne dla n = 0 lub rt = 1 (zob. ćwiczenie 1). Składniki zerowe niepowodują
szkód, a często ułatwiają nam znacznie zadanie.
Jak dotąd, przedstawione notacje były dość standardowe, ale teraz do­
konamy radykalnego odejścia od tradycji. Kenneth E. Iverson w stworzonym
przez siebie języku programowania APL [191, str. 11; zob. także 220] wpadł
na świetny pomysł, i jak się przekonamy, notacja ta wspaniale upraszcza wiele
rzeczy, o których będziemy w tej książce pisali. Pomysł polega po prostu na
ujęciu zdań logicznych w nawiasy i przyjęciu, że jeżeli zdanie jest prawdziwe,
to wartością tego wyrażenia będzie 1, natomiast jeśli zdanie jest fałszywe,
to wartością wyrażenia będzie 0. Na przykład
[p pierwsza] = ( ’ • ^
P jest Uc^ ą PierWSZą:
1 0 , jeśli p me jest liczbą pierwszą.
Konwencja Iversona pozwala nam wyrażać sumy w ogóle bez jakichkolwiek
ograniczeń na zmienne indeksowe, ponieważ sumę (2 .4 ) możemy zapisać w
postaci
3
£ a k [P(k)].
k
(2 .5 )
Jeśli P(k) jest fałszywe, to składnik a.k[P(k)] jest zerem, więc można bez
obawy włączyć go do sumy. Znacznie upraszcza to manipulacje na indeksach
sumowania, gdyż nie musimy się męczyć z wartościami ograniczającymi.
Trzeba tu wspomnieć o drobnym szczególe technicznym: ak niekiedy
bywa nie zdefiniowane dla pewnych liczb całkowitych k. Ominiemy tę trud­
ność przez przyjęcie, że [P(k)] jest „bardzo silnym zerem”; gdy P(k) jest
fałszem, wówczas czyni z a k zero nawet wtedy, gdy
jest nie zdefiniowane.
Jeśli na przykład użyjemy konwencji Iversona do zapisania sumy odwrotności
liczb pierwszych nie przekraczających N w taki sposób,
„Często zaskakują
mnie nowe, ważne
zastosowania tej
notacji.”
B. de Finetti [123]
Y [P pierwsza] [p ^ N ]/p ,
p
to nie będzie problemu z dzieleniem przez zero, gdy p = 0 , gdyż przyjęta
konwencja gwarantuje, że [0 pierwsza][0 ^ N]/ 0 = 0.
Podsumujmy to, co do tej pory powiedzieliśmy o sumach. Istnieją dwa*
dobre sposoby wyrażania sumy zadanych wyrazów. Jeden z nich używa no­
tacji ‘
drugi używa notacji ‘ ’• Postać wielokropkowa często podsuwa
użyteczne przekształcenia, w szczególności kombinacje sąsiadujących składni­
ków. Bywa bowiem tak, że zauważymy upraszczający pomysł dopiero wtedy,
gdy zobaczymy przed oczyma całą sumę. Zbyt wiele szczegółów może być
jednak denerwujące. Notacja Sigma jest zwarta, robi wrażenie na rodzinie i
przyjaciołach, a zarazem podsuwa przekształcenia, których z kolei nie widać
w postaci wielokropkowej. Kiedy pracujemy z notacją Sigma, wyrazy zerowe
nie są szkodliwe, przeciwnie, zera często upraszczają dokonywane przekształ­
cenia.
2.2. Sum y i rekurencje_________________________
No dobrze, rozumiemy już, jak wyrazić sumę w zgrabnej notacji. Jak jednak
wyliczyć wartość takiej sumy? Jedną z metod jest zauważenie subtelnego
związku między sumami i rekurencjami. Suma
n
=
^ &k
k= 0
. . . i masz mniej
szans na utratę
punktów
na egzaminie
za „brak precyzji” .
(Myśl o Sn nie
jako o pojedynczej
liczbie, lecz jako
o ciągu określonym
dla wszystkich
jest równoważna rekurencji
So = Q° ;
Sn = Sn_i + an ,
/
dla rt > 0 .
(2 .6 )
rt ^ 0 .)
Możemy więc wyliczać wartości sum w postaci zwartej używając metod po­
znanych w rozdziale 1.
Na przykład, jeśli au jest równe stałej plus pewna wielokrotność rt, to
odpowiednia rekurencja przybiera następującą ogólną postać:
R° = a ;
Ru = Rn_i + (3 + yrt,
dla n > 0.
2'7
- Postępując jak w rozdziale 1, otrzymujemy, że Ri = oc+ |3+y, R2 = <x+2p+3y,
itd. W ogólności rozwiązanie tej rekurencji przedstawia się w postaci
Rn = A (rt)a+ B (rt)|3 + C(rt)y ,
( 2 .8 )
gdzie A(rt), B(tl) i C(rt) są współczynnikami zależącymi od ogólnych para­
metrów a, |3 oraz y.
Metoda repertuaru każe nam spróbować wykorzystać jako R(tl) w tej
rekurencji proste funkcje zmiennej rt w nadziei, że uda się nam znaleźć stałe
parametry oc, |3 oraz y w przypadkach, w których rozwiązanie jest szczególnie
łatwe. Przyjęcie R^ = 1 wymusza oc = 1, |3 = 0, y = 0, więc
A( tl) = 1 .
Przyjęcie Rn = rt wymusza oc = 0, |3 = 1, y = 0, więc
B(n) = n .
Przyjęcie Rn = rt2 wymusza oc = 0, |3 = —1, y = 2; więc
2 C(rt) — B ( t l ) = rt2 ,
skąd ostatecznie C(rt) = (rt2 + n ) / 2 . Proste jak drut.
Jeśli więc chcemy wyliczyć
^ ( a + b k ),
k = 0
to odpowiednia rekurencja ( 2 .6 ) sprowadza się do ( 2 .7 ) z o c = | 3 = a, y = b,
a rozwiązaniem jej jest aA(rt) + aB(rt) + bC(n) = a(rt + 1) + b(rt + 1)rt/2.
Na odwrót, wiele rekurencji można sprowadzić do sum. Specyficzne me­
tody wyliczania sum, które poznamy w tym rozdziale, pomogą nam rozwią­
zywać rekurencje, których ruszenie w inny sposób byłoby trudne. Wieża z
Hanoi jest taką właśnie rekurencją:
T0 = 0 ;
Tn = 2Tn_i + 1 ,
dla rt > 0.
Można ją przedstawić w szczególnej postaci ( 2 .6 ) przez podzielenie obu stron
przez 2n :
To/2° = 0;
Tn/ 2 n = Tn_ i / 2 n _ 1 + 1/2n ,
dla n > 0.
Teraz dla Sn = Tn/ 2 n otrzymamy
So
=
0;
Sn = Sn.-! + 2~n ,
dla n > 0 .
Stąd wynika
Sn
=
f_ 2 ~ \
k=1
(Zauważ, że wyraz odpowiadający k = 0 nie został uwzględniony w tej su­
mie.) Suma ciągu geometrycznego 2 _1 + 2 _ 2 H------ h2-TL = (^)1+ ( ^ ) 2 H------ b
(^)n będzie wyprowadzona później w tym rozdziale; jest ona równa 1 —(^)n .
A zatem Tn = 2nSn = 2 n — 1 .
W powyższym wyprowadzeniu zastąpiliśmy
przez Sn na mocy prostej
obserwacji, że to równanie rekurencyjne można z powodzeniem podzielić obu­
stronnie przez 2n . Chwyt ten jest szczególnym przypadkiem ogólnej metody,
która pozwala uprościć dowolną rekurencję postaci
O-nTn — bnTn —1 H" Cn
( 2 .9 )
do sumy. Pomysł polega na przemnożeniu obu stron przez czynnik sumacyjny sn :
Sn ^ n .T u =
S n ^ n T n —1 -j-
.
Czynnik sn jest tak sprytnie dobrany, aby spełnić
Srubn — Sn—1 d n —1
W tym przypadku, jeśli uwzględnimy, że Sn = sn anTn, to otrzymamy reku­
rencję
Sn. — Sn—1 H- Sn Cn *
Zatem
n
Sn
=
ąoapTo +
y ~ SkCk
rt
=
sib iT p +
k=l
s^Ck >
k=1
a rozwiązaniem wyjściowej rekurencji ( 2 .9 ) będzie
Tn = —-— (sibTTo + ^ s i c C k ) .
(Wartość si ma się
uprościć, więc może
być wszystkim
oprócz zera.)
( 2 . 10)
Na przykład gdy n = 1, otrzymujemy Ti = (sibiTo + siCi )/si ai = (biTo +
Ci ) / a i .
Jak jednak znaleźć właściwe sn? Nie ma problemu: wystarczy rozwinąć
wzór sn == s n—1ctn—1A>n> aby upewnić się, że iloraz
t t n —1Cln- 2 . . . ai
Sn = -7- T---------------------------------------------------------------------7— ,(2 .11 )
D n b n -1
(Sortowanie szybkie
zostało wymyślone
przez Hoare’a w
roku 1962 [189].)
• • • t> 2
lub jego dowolna wygodna dla nas wielokrotność będzie odpowiednim czynni­
kiem sumacyjnym. Dla przykładu, w rekurencji wieży z Hanoi mamy an = 1
i bn = 2. Zgodnie z ogólną metodą, którą właśnie wyprowadziliśmy, przeko­
nujemy się, że sn = 2 _n jest właściwą liczbą, przez którą należy pomnożyć
rekurencję wieży z Hanoi, jeśli chcemy ją wyrazić w postaci sumy. Nie po­
trzeba nam błysku geniuszu, aby dojść do tego czynnika.
Jak zwykle trzeba uważać, aby nie dzielić przez zero. Metoda czynnika
sumacyjnego działa wówczas, gdy wszystkie a oraz b są różne od zera.
Zastosujmy przedstawione pomysły do rozwiązania rekurencji, która po­
jawia się przy analizie sortowania szybkiego („ąuicksortu”), jednej z najważ­
niejszych metod sortowania danych w pamięci wewnętrznej. Średnia liczba
porównań wykonywanych przez sortowanie szybkie dla n losowych elementów
spełnia rekurencję
C0 = 0 ;
2 V -1
Cn = n ł l ł - V Ck)
n ĆTo
dla n > 0.
( 2 . 12)
Hm mm. To wygląda znacznie gorzej niż rekurencje, z którymi mieliśmy do
tej pory do czynienia. Po prawej stronie znajdujemy tu sumę wszystkich po­
przednich wartości i dzielenie przez n. Przegląd małych wartości (Ci = 2 ,
Cz = 5 , C3 =
dostarcza nam pewnych danych, ale nie napawa optymi­
zmem.
Możemy jednak uprościć równanie ( 2 . 1 2 ) krok po kroku, pozbywając się
najpierw dzielenia, a potem znaku
Pomysł polega na przemnożeniu obu
stron przez rt, co prowadzi do
n —1
riCn = n 2 + n + 2
Ck ,
dla n > 0;
k=0
i teraz zastępując rt przez n — 1 uzyskujemy
n-2
(n — 1)Cn_i = ( r t - l ) 2 + ( n - 1 ) + 2
Ck ,
d lan -l> 0.
k=0
Możemy teraz odjąć drugie równanie od pierwszego i znak Y zniknie:
riCn — ( u — 1)Cn_i = 2rt + 2Cn_i ,
dla rt > 1.
Okazuje się, że relacja ta zachodzi także dla n = 1, gdyż Ci = 2. Wyjściowa
rekurencją uprościła się więc do znacznie prostszej:
Co =
0 ;
riCn = ( n + 1 ) C n_ i + 2 n ,
dla n > 0 .
Postęp. Doprowadziliśmy wzór do stanu, w którym można zastosować metodę
czynnika sumacyjnego; rekurencją jest bowiem postaci ( 2 .9 ) z an = n, bn =
rt + 1 i cn = 2tl. Ogólna metoda opisana na poprzedniej stronie wymaga
teraz przemnożenia rekurencji obustronnie przez pewną wielokrotność liczby
Sn —
fln-1 CLn—2 • • • a l
bnbn_ - | . . . b 2
(n - 1 ) • (n - 2 ) • . . . • 1
( n + 1 ) - n * . . . -3
(n + 1)n
Zgodnie z równaniem (2 . 1 0 ), rozwiązanie przedstawia się tak:
Cn = 2 ( n + 1) £ .
k=1
k+1
Suma, która pozostała, jest bardzo podobna do wartości, która często
pojawia się w zastosowaniach. Spotykamy ją na tyle często, że nadamy jej
specjalną nazwę i notację:
H „ = 1 + 1 + .. . + 1 = £ l .
2
n
( 2 1 3)
Zaczęliśmy
z symbolem Y
w rekurencji,
pracowaliśmy
ciężko, żeby się tego
symbolu pozbyć,
a teraz,
po zastosowaniu
czynnika
sumacyjnego, znów
mamy przed sobą
symbol Y • To jak
w końcu, czy sumy
są dobre, czy złe,
czy co?
Litera H pochodzi od słowa „harmoniczny”, Hn jest liczbą harm oniczną,
zwaną tak ze względu na to, że k-ta harmoniczna wytwarzana przez strunę
skrzypcową jest tonem podstawowym wytwarzanym przez strunę o długości
równej 1 /k-tej długości struny wyjściowej.
Dokończymy teraz rozważania dotyczące rekurencji ( 2 . 1 2 ) sortowania
szybkiego przedstawiając Cn w postaci zwartej; wyrazimy Cn za pomocą Hn .
Suma w naszym wzorze na Cn wynosi
y
—— =
y
—
więc bez kłopotu możemy odnieść ją do Hn przez zamianę k na k —1 i zmianę
wartości ograniczających:
Y— k—
+ 1
l^k^n
=
y
kl ^k - l ^n
- X i
2 ^k^n +1
(
V
^
kj
l^k^n 7
1
1
1
n +1
|1
U
tl + 1
Świetnie! Znaleźliśmy sumę kończącą poszukiwania rozwiązania równania
( 2 . 1 2 ): Średnia liczba porównań dokonywanych przez sortowanie szybkie na
losowych danych równa jest więc
Cn = 2(n + 1)Hn —2 n .
(2 . 1 4 )
Jak zwykle, sprawdzamy wzór dla małych wartości n: Co = 0, Ci = 2 ,
C2 = 5.
2.3. P rzek szta łcen ia sum _______________________
Kluczem do sukcesu przy działaniu na sumach jest zdolność zamiany jed­
nej Y na inną prostszą lub bliższą celu. Nietrudno jest do tego dojść, jeśli
poznamy pewne podstawowe prawa transformacji i przećwiczymy ich wyko­
rzystanie.
Niech K będzie dowolnym skończonym podzbiorem zbioru liczb całkowi­
tych. Sumę elementów zbioru K można przekształcać za pomocą 3 następu-
jących prostych praw:
Y cak =
keK
c 2 2 ak 5
keK
X .(a k + bk) = ^ _ a k + ^ bic;
k€K
keK
k€K
y aic =
IcGK
^
ap(k) •
p(k)GK
(prawo rozdzielności)
(2 . 1 5 )
(prawo łączności)
(2 . 1 6 )
(prawo przemienności)
(2 .1 7 )
Prawo rozdzielności pozwala wyciągać stałe przed znak Y lub wprowa­
dzać je pod ten znak. I^rawo łączności pozwala rozbić Y na dwie części, prawo
przemienności zaś gwarantuje nam możliwość przegrupowywania składników
w dowolny sposób; tutaj p(k) oznacza dowolną permutację zbioru wszystkich
liczb całkowitych.
Jeśli na przykład K = {—1,0, +1}, natomiast p(k) = —k, to nasze 3 prawa
^gwarantują nam odpowiednio:
ca_i + cao + cai = c(a_i + ao + a i );
Czemu więc nie
nazwać go prawem
permutacji zamiast
przemienności?
(prawo rozdzielności)
(a_i + b _ i ) + (a 0 + b0) + (ai + b i )
= (a_i + do + a i ) + (b_i + b 0 + b i );
(prawo łączności)
a_! + ao + ai = ai + ao + a_i .
(prawo przemienności)
Chwyt Gaussa z rozdziału 1 można postrzegać jako zastosowanie tych 3
podstawowych praw. Załóżmy, że mamy obliczyć sumę ciągu a rytm etycz­
nego,
s=
(a + bk).
O^k^n
Na mocy prawa przemienności możemy zastąpić k przez n —k, otrzymując
S =
(a + b (n —k)) =
O^n—k^n
2 2 (a + bn —bk).
O^k^n
Te dwa równania można teraz dodać i dzięki prawu łączności otrzymu­
jemy
2S =
22
((o. + bk) + (a + bn —bk)) =
O^k^n
^
(2 a + b n ).
0 <Ck^n
Możemy teraz zastosować prawo rozdzielności i wyliczyć trywialną sumę
2S
= (2 a + bn)
2 ^ ^ — (2 a + b n ) ( n + 1 ).
O^k^n
To mi przypomina
zamianę zmiennych
przy całkowaniu,
tyle że jest prostsze.
„Ile to jest jeden i
jeden i jeden i jeden
i jeden i jeden i
jeden i jeden i jeden
i jeden?”
„Nie wiem,”
powiedziała Alicja.
„Straciłam
rachubę.”
„Ona nie potrafi
dodawać.”
Lewis Carroll [54]
Dzieląc przez 2 pokazujemy, że ostatecznie
rt
^ ( a + bk) = ( a + jb n ) { n + 1 ).
( 2 .1 8 )
k=0
Prawą stronę można^łatwo zapamiętać jako średnią z pierwszego i ostat­
niego wyrazu, czyli \ (a + ( a + b n ) ) , przemnożoną przez liczbę wyrazów, czyli
( n + 1 ).
Ważne jest, aby pamiętać, że funkcja p(k) w prawie przemienności ( 2 . 1 7 )
musi być permutacją wszystkich liczb całkowitych. Innymi słowy: dla każdej
liczby całkowitej rt ma istnieć dokładnie jedna liczba całkowita k taka, że
p(k) = n. W przeciwnym ^azie prawo przemienności może nie zachodzić;
ćwiczenie 3 dobitnie to ilustruje. Przekształcenia typu p(k) = k + c lub
p(k) = c — k, gdzie c jest stałą całkowitą, są zawsze permutacjami, więc
wolno je zawsze stosować.
Z drugiej strony, możemy nieco osłabić wymaganie o permutacji: wystar­
czy, jeśli będzie istniało dokładnie jedno k spełniające p(k) = rt dla każdego
n będącego elementem zbioru indeksowego K. Jeśli n i K (czyli jeśli liczby
n nie ma w zbiorze K), to nie jest istotne, dla ilu k zachodzi p(k) = n, gdyż
to k nie bierze udziału w badanej sumie. Możemy więc np. twierdzić, że
y
ak =
y_
an =
y_
a2k =
k£K
neK
2keK
k parzyste
n parzyste
2 k parzyste
y _ a 2 k>
( 2 .1 9 )
2keK
gdyż istnieje dokładnie jedno k takie, że 2k = n dla n £ K oraz rt parzystego.
Konwencja Iversona, która ze zdań logicznych pozwala nam uzyskiwać
wewnątrz wzoru wartości 0 i 1 , może być używana wspólnie z prawami roz­
dzielności, łączności i przemienności do wyprowadzania dodatkowych wła­
sności sum. Dla przykładu, mamy tu ważną regułę łączenia dwóch zbiorów
indeksów: Jeśli K i K' są dowolnymi zbiorami liczb całkowitych, to
y_dk + y_ak =
keK
keK'
keKnK'
Qk + x. Qk•
keKuK'
(2-2°)
Wynika to z ogólnych wzorów
Y _ ak
keK
=
y _ ak [k € K]
k
(2.21)
oraz
[k€ K] + [k€ K'] = [k<GKnK/] + [ k e K U K /].
(2.22)
Zwykle stosujemy wzór (2.20) albo po to, żeby połączyć dwa prawie roz­
łączne zbiory, tak jak w
Y_ ak +
Y . Qk
k=1
k= m
=
am +
21
ak ,
dla 1 ^ m ^ n;
k=1
albo po to, żeby wydzielić pojedynczy element z sumy, tak jak we wzorze
ak
=
a0 +
O^k^n
Y .
“k >
dla n ^ 0 .
( 2 .2 3 )
l^k^n
(Dwie strony
równania (2 .20)
zostały tu
zamienione.)
Operacja wydzielenia wyrazu poza sumę stanowi podstawę metody za­
burzania , która często pozwala wyliczyć sumę w postaci zwartej. Pomysł
polega na oznaczeniu niewiadomej wartości sumy przez Sn :
Sn —
'y
&k •
O^k^n
(Nazwij i zwyciężaj!) Następnie przepisujemy Sn+ 1 na dwa sposoby: wydzie­
lając pierwszy i ostatni wyraz sumy:
Sn + G-n+1 =
}
G-k =
O^k^n+1
0-0 ~ł“
= a0 +
<10 +
)
O-k
l^k^n +1
^
ak+i
l ^k+l^n +1
2 Z ak+1 *
O^k^n
( 2 .2 4 )
Teraz możemy popracować nad ostatnią sumą i postarać się wyrazić ją za po­
mocą Sn - Jeśli się nam to uda, to otrzymamy równanie, którego rozwiązanie
jest szukaną sumą.
Zastosujmy to podejście na przykład do znalezienia sumy ciągu geome­
trycznego,
Sn =
y_
axk .
O^k^n
Ogólny schemat zaburzania przedstawiony we wzorze (2.24) pozwala wy­
wnioskować, że
Sn + ax n+1 = a x ° +
Y _ ax k+l
O^k^n
przy czym suma po prawej stronie jest równa x ^ 0<k<n axk = xSn na mocy
prawa rozdzielności. W związku z tym Sn + axn+1 = a + xSn i możemy
Jeśli jest
geometryczny;
to powinien mieć
geometryczny
dowód.
rozwiązać to równanie ze względu na Sn . Uzyskujemy
n
Z ax
k
a — ax n+1
= — ----------
(2.25)
k=0
Faktycznie!
Ten wzór został
wwiercony we mnie
w szkole średniej.
(Dla x = 1 suma ta oczywiście wynosi (n + l )a.) Prawą stronę można
zapamiętać jako pierwszy wyraz należący do sumy minus pierwszy wyraz
poza sumą podzielone przez 1 minus iloraz ciągu geometrycznego.
To było proste, może nawet trochę zbyt proste. Spróbujmy zastosować
metodę zaburzeń do nieco bardziej skomplikowanej sumy:
sn = y _ k2kO^k^n
Mamy tutaj So = 0, Si = 2, S2 = 10, S3 = 34, S4 = 98; jak może wyglądać
ogólny wzór? Zgodnie ze wzorem ( 2 .2 4 ) mamy
Sn + ( n + 1 ) 2 n+1 =
Y_ 0<+1)2k+1 I
O^k^n
będziemy więc dążyli do wyrażenia sumy z prawej strony równania za pomocą
Sn.. W porządku, możemy rozbić ją na 2 sumy za pomocą prawa łączności
k 2k+1
O^k^n
+
Y .
2k+’ >
O^k^n
i teraz pierwsza z tych sum równa jest 2Sn . Druga z nich natomiast jest
ciągiem geometrycznym, równym ( 2 — 2 n + 2 ) / ( 1 — 2 ) = 2 n + 2 — 2 na mocy
(2.25). W takim razie mamy Sn + (ri+1)2 n +1 = 2Sn + 2 n + 2 — 2 i elementarne
przekształcenia algebraiczne dają nam
k 2 k = (n — 1)2n+1 + 2 .
O^k^n
Rozumiemy już, dlaczego S3 = 34: to jest po prostu 32 + 2, a nie 2*17.
Analogicznie przeprowadzone rachunki dla x zamiast 2 dałyby nam ogól­
ny wzór Sn + (tl + 1)x n+1 = xSn + (x — xn+2)/ (l — x); możemy zatem
wydedukować, że
r , k
x — (n + 1 )x n+1 + nx n+2
> kx = ------------ r- -------------------- ,
to
n -*)2
J1
d l a x ^ 1.
.
( 2 .26 )
Ciekawe, że można otrzymać tę zwartą postać w zupełnie inny sposób,
po zastosowaniu podstawowych technik rachunku różniczkowego. Jeżeli za­
czniemy od równania
Zn
k
x
i —x TL+ 1
1
y
= — 1i---—X
k=0
i weźmiemy po obu stronach pochodną ze względu na x, to otrzymamy
k_!
y-
“
k=0
(1—x )(—(n+1 )xu ) + 1—xn+1- _
(l-x )2
~
1 - ( n + l ) x n + n xn+1
(1-x)2
ponieważ pochodna sumy jest sumą pochodnych jej wyrazów. W następnych
rozdziałach poznamy jeszcze wiele innych związków między rachunkiem róż­
niczkowym a matematyką dyskretną.
2.4. Sum y w ielokrotne_____ ___________________
Składniki sum mogą być indeksowane niekoniecznie jedną, ale również dwoma
lub więcej zmiennymi. Przyjrzyjmy się dla przykładu sumie dziewięciu skład­
ników, określanych przez dwie zmienne indeksowe j oraz k:
Y
cijbic = ai bi + a i b 2 + a i b 3
iscj,k^3
_l_ CL2'\Dl _|_ a 2 b 2 + a 2b 3
+ a 3b! + a 3b 2 + a 3b 3 .
Stosujemy tu te same konwencje notacyjne i metody, jak w przypadku
sum indeksowanych pojedynczo. Jeśli więc P(j,k) jest własnością zależną od
j i k, to suma wszystkich wyrazów aj>k takich, że P(j,k) jest prawdziwe,
może być zapisana w dwojaki sposób. W drugim z nich używamy konwencji
Iversona i sumujemy względem w szystkich par liczb całkowitych j i k:
Y
CLj,k = X.CLj,k [P(j,k)] .
P(j,k)
3,Tc
Jeden znak ^ wystarcza, nawet wówczas, gdy mamy więcej indeksów sumo­
wania; znak
oznacza sumę wszystkich kombinacji indeksów, które dotyczą
danego przypadku.
Gdy jest mowa o sumie sum, wówczas możemy użyć także dwóch znaków
przykład
£ £ a jilc [P(j,k)]
j
k
Warto zwrócić
uwagę, że nie chodzi
tu o sumowanie po
wszystkich j ^ 1
i wszystkich
k^3.
jest skrótem dla
Sumy wielokrotne
wylicza się
od prawej do lewej
(od wewnątrz
na zewnątrz).
j
v k
przy czym należy to rozumieć jako sumę względem wszystkich liczb całkowi­
tych j z k a i% P5(j >k)] • Ostatnia suma to z kolei suma względem wszystkich
liczb całkowitych k, dla których P(j,k) jest prawdą. W takich przypadkach
mówimy, że suma podwójna „wyliczana jest najpierw względem k.” Sumę
względem więcej niż jednego indeksu można wyliczać najpierw względem
dowolnego z nich.
Mając to na uwadze, wprowadzimy podstawowe prawo nazywane zm ianą
porządku sum owania , które uogólnia wspomniane już wcześniej prawo łącz­
ności (2 . 16):
£
j
Kto tu panikuje?
Moim zdaniem ta
zasada jest całkiem
zrozumiała,
przynajmniej w
porównaniu z tym,
co się działo
w rozdziale 1.
k
««
-
P ( j,k)
L L
fc
Oj,k[P(j,lc)].
( 2 .27)
j
W środku mamy sumę względem dwóch indeksów. Z lewej strony
oznacza sumowanie najpierw względem k, a potem względem j, natomiast
po prawej stronie X.k^Lj oznacza sumowanie najpierw względem j, a po­
tem względem k. W praktyce, jeśli będziemy chcieli wyrazić podwójną sumę
w postaci zwartej, to zazwyczaj jeden z indeksów będzie miał tę własność,
że łatwiej jest sumować najpierw względem niego. Zgodnie z tym prawem
możemy zatem wybrać do sumowania najpierw ten indeks, dla którego su­
mowanie okaże się wygodniejsze.
Z powodu sumy sum nie ma co wpadać w panikę, ale u nowicjusza mogą
one spowodować zamęt. Zacznijmy więc od paru przykładów. Dziewięcioskładnikowa suma, od której zaczęliśmy, jest dobrym punktem wyjścia do
przedstawienia pewnych technik przekształcania podwójnych sum. Sumę tę
można bowiem uprościć, a uproszczenia to jest właśnie to, co robimy zazwy­
czaj z X. L :
Y_
l^j,k^3
ajbk = ]T
= £_Ojbk[1^K3][1^1cO]
j >k
j,k
= L L ajbk[1 ^j^ 3] [l ^ k ^ 3 ]
j
ic
= X a; [1 ^
3] Z
j
k
j
'
b* [1^ k ^ 3]
k
'
= ( 2 1 a j [ l ! S K 3 ] ) ( ^ b k[ K l c $ 3 ]
-
(£ < ■> )(!> )•
Xj=l
7 Vk=1
7
Pierwszy wiersz oznacza tu sumę 9 składników bez żadnego specjalnego po­
rządku. W drugim wierszu grupujemy je trójkami: (aibi + a-\\)2 + a-|b3) +
(a.2bi + a2b2 + 0 ^ 3 ) + (a^bi + a^bz + ci3b3). W trzecim wierszu korzy­
stamy z prawa rozdzielności, aby wyłączyć wszystkie wyrazy a^, gdyż aj
oraz [1 ^ j ^ 3] nie zależą od k; to daje nam a-[ (bi+ b 2 + b3)+ a.2(bi + b2 +
t>3) + a3(bi + b2 + b3). Czwarty wiersz jest taki sam,jak trzeci, z tym że
wzbogacamy się o nadmiarową parę nawiasów tak, aby piąty wiersz nie wy­
glądał zbyt tajemniczo. W wierszu piątym wyłączamy poza nawias wyrażenie
(bi + b 2 + b3), które dotyczy każdej wartości j: (ai +a.2 + ci3)(bi + b 2 + b3).
Ostatni wiersz, to po prostu inaczej zapisany wiersz poprzedni. Powyższa me­
toda wyprowadzania może być użyta do udowodnienia uogólnionego prawa
rozdzielności ,
y _ djbk = ( y _ a >) ( Y . bk) jej
keK
Mej
7 VkeK
(2-28)
7
zachodzącego dla wszystkich zbiorów indeksów J i K.
Podstawowe prawo (2.27) zmiany kolejności sumowania ma wiele wa­
riantów pojawiających się, gdy zamiast sumować względem wszystkich liczb
całkowitych j i k chcemy ograniczyć zakres indeksów. Warianty te są o dwóch
smakach: waniliowym i bakaliowym. Najpierw wersja waniliowa:
Z H
j e j keK
a >.k =
Y - a >.k =
jej
k€K je j
keK
(2-29)
Jest to po prostu inna wersja zapisania (2.27), gdyż iversonowskie [j 6 J, k G K]
rozkłada się na [j € J][k 6 K]. Prawo waniliowe stosuje się wtedy, gdy j i k są
od siebie niezależne.
Wzór o smaku bakaliowym jest cokolwiek sprytniejszy. Stosuje się go
wtedy, gdy dziedzina sumy wewnętrznej zależy od wartości zmiennej ze­
wnętrznej :
£_ H
a i-k = H
H
ai ’k j e j ke«(j)
keK' je j'(k )
(2-3°)
Zbiory J, K(j), K' i J'(k) muszą być tu tak określone, żeby zachodziło
Bej][keK(j)] = [keK'] [je j'(k)]
Rozkład taki jak ten jest zawsze możliwy, gdyż możemy określić J = K;
jako zbiór wszystkich liczb całkowitych, a K(j) (równe J'(k)) może stać się
podstawową własnością P(j, k), która określa zakres podwójnej sumy. Są jed­
nak przypadki szczególne, gdy J, K(j), K' oraz J'(k) mają prostą postać.
Przypadki te spotykamy często w zastosowaniach. Mamy na przykład taki
użyteczny rozkład:
[1 ^ j ^ n ] [ j ^ k ^ n ] = [ l ^ j ^ k ^ r t ] = [1 ^ k ^ n][l ^ j ^ k ] .
(2.31)
Powyższe równanie przedstawione w konwencji Iyersona można zapisać w
postaci tradycyjnej w następujący sposób:
n
rt
n
X . H a i.k =
j=l k=j
Któraś z tych 2 sum jest zazwyczaj łatwiejsza do policzenia. Równania ( 2 .3 2 )
możemy używać do przełączania się z trudniejszej postaci na łatwiejszą.
Zilustrujmy te pomysły użytecznym skądinąd przykładem. Rozważmy
tablicę
"ai ai
a2ai
a3a-i
1----P
? ..
P
(Ałbo sprawdzić,
czy w lodówce nie
został jeszcze jakiś
baton Snickers.)
(2-32)
k=1 j = 1
Cli0-2 ai a3 .... a! an "
CL20-2 a2a3 .
Q2dn
a3a2 a3a3 .
CL3CLti
P
?
P
3
_____
1
Teraz nadszedł
dobry moment, aby
zrobić ćwiczenia
rozgrzewkowe 4 i 5.
k
dj.k =
ancl2
składającą się z n 2 iloczynów. Naszym zadaniem będzie znaleźć prosty wzór
na
S^i =
Szczególnie, gdy
tablica ma postać
diagonalną!
ajak ,
l^j^k^n ^
czyli sumę wszystkich wyrazów leżących na i powyżej głównej przekątnej. Po­
nieważ djCiic = a kcij, tablica jest symetryczna względem głównej przekątnej,
i w związku z tym
będzie mniej więcej równe połowie sumy wszystkich
elementów (z dokładnością do tych drobiazgów z głównej przekątnej).
Rozważania te pozwalają nam zapisać
ajQk =
a kGj =
21.
ajQk =
gdyż zawsze możemy zamienić (j,k) na (k, j). Dalej, ze względu na to, że
[1 ^ j ^ k ^ n ]
+ [1 ^ k ^ j ^ n ] =
[1 ^ j , k ^ n ]
+ [1 ^ j = k ^ n ] ,
rrrw
tu
i m
«
i
i
......... 1
*
mamy
y~
2S\| = S^q + S^ =
Gj ak +
l^j.k^n
y~~ Gj Clk
1<Cj=k<Cu
Pierwsza z tych sum na mocy uogólnionego prawa rozdzielności ( 2 .2 8 ) jest
rów na
(HjLi
0 == ( Z k = f ak)2>a d r u g a s u m a w y n o s i £ £ =1 aj;.
( L ^ i ai)(L k = il Q
ak)
Zatem w wyniku otrzymujemy
S<q =
Y_
Qi ak = ^ ( ( i l ak ) + 1 1 4 ) -
l^ j^ k ^ n
V 'k= 1
(2-33)
7k=1)
co jest przedstawieniem górnej sumy trójkątnej za pomocą prostszych poje­
dynczych sum.
Zachęceni takim sukcesem przyjrzyjmy się innej podwójnej sumie:
S =
(G k-G j)(b k - b j ) .
1^ j<k^rt
Podobnie jak poprzednio, zamiana j oraz k daje nam sytuację symetryczną:
S =
(Gj - Gk ) ( b j - b k ) =
Y .
l^kcj^n
(ak — a j ) ( b k — b j ) .
Y_
1^k<j^n
Możemy więc dodać S do siebie i czyniąc użytek z tożsamości
[1 ^ j < k ^ n ]
+ [1 ^ k < j ^ n ] =
[1 ^ j , k ^ n ] — [1 ^ j = k ^ ri]
wywnioskować, że
2S =
Y _ (aj — a k)(bj —bk) -
l^j.k^n
Y_
(a i ~ a k)(bj - b k) .
1^j=k^n
Druga z sum jest równa 0, co się więc dzieje z pierwszą? Możemy ją rozbić
na 4 oddzielne sumy, każda z nich o smaku waniliowym:
y Gjbj 1<Cj,k^rt
y_ cijbk l^j,k^n
Y_
= 2 2 1 Gkbk 1^j.k^u
2 Y_ a>bk
l^j.k^n
=
l( V
2n
Y_
IsCk^n
a kbk
-
'k=1
akbj +
1^j,k^n
a k^ f J~ bk
'
k=l
y_
1^j,k^n
akbk
W ostatnim kroku obie sumy zostały uproszczone zgodnie z uogólnionym
prawem rozdzielności ( 2 .2 8 ). Przekształcenie pierwszej sumy może wyglądać
tajemniczo, podajemy je więc jeszcze raz w zwolnionym tempie:
2
Y_
a kbk = 2 n
y _ akbk
1^k^n l^j^n
= 2 Y_
=
2
akK
H
^
o
1
Y _ a kbkTX = 2n Y
a kbk .
I^k^n
l^k^rt
Zmienną indeksową, która nie występuje w składniku (w tym przypadku ))
można wyeliminować, przemnażając całą resztę przez wielkość zbioru indek­
sowego (w tym przypadku n).
Wracając do tematu, możemy teraz wszystko podzielić przez 2 i przegru­
pować wyrazy tak, aby otrzymać interesujący wzór:
(Tak naprawdę
Czebyszew [74]
udowodnił
analogiczny rezultat
dla całek, nie dla
sum
(Ja f M dx)
• (Ja 9M dx)
^ (b - a)
*(Jaf Ws W d x ) ,
jeśli f(x) i g(x)
są funkcjami
niemalejącymi.)
Z tożsamości tej wynikają m onotoniczne nierówności Czebyszewa :
( y ~ a k) ( 5 ~ b k ) ^ n y " a kbk ,
\ k=1 / \ k=1 /
k=1
jeśli cm ^
^ an i bi ^
( H ak) ( H bk) ^ n ^ c i i c b i c ,
jeśli ai ^
^ an i b i ^
Sc=1
7 'k=1
'
•O n i
^ b n.
k=1
(W ogólności, jeżeli cm ^ ^ an, a p jest permutacją zbioru {1, . . . , rt}, to
można łatwo udowodnić, że największa wartość ^ k=1 a kbp(k) jest osiągana,
gdy bp(1) ^
^ bp(n), a najmniejsza, gdy bp(1) ^
^ bp(n).)
Sumowanie wielokrotne ma interesujący związek z ogólną operacją zmia­
ny indeksu sumowania w pojedynczych sumach. Na mocy prawa przemien­
ności wiemy, że
Y_ Qk = Y. ap(k) >
k€K
p(k)€K
dla dowolnej permutacji p(k) liczb całkowitych. Co jednak się stanie, gdy
zastąpimy k przez f(j), gdzie f jest dowolną funkcją
f : J —> K,
która zamienia liczbę całkowitą j G J na liczbę całkowitą f(j) G K? Ogólny
wzór na zamianę indeksów przedstawia się następująco:
H a f(j) = X . a k # f - (k' ’
je j
(2-35)
keK
gdzie # f “ (k) oznacza liczbę elementów zbioru
f “ (k) = { j |f(j) = k } ,
czyli liczbę takich wartości j G J, dla których f(j) jest równe k.
Równanie (2.35) można łatwo udowodnić zmieniając porządek sumowa­
nia
=
je j
2 1 cik [f (j)= k ] =
Y
jej
keK
qk Y [f(j) = k ] ,
keK
je j
gdyż H j€j [f(j) =k] = # f “ (k). W przypadku szczególnym, gdy f jest od­
wzorowaniem różnowartościowym między J i K, dostajemy # f - (k) = 1 dla
wszystkich k, a ogólny wzór (2.35) sprowadza się do
=
jej
Y. af<j) = H
f(j)eK
a,c-
k€K
Mój nauczyciel
matematyki
nazywał to
„bijekcją” ; może
kiedyś uda mi się
polubić to słowo.
Otrzymaliśmy nieco zamaskowane prawo przemienności (2.17).
W dotychczas rozważanych przykładach sum wielokrotnych występowały
wyłącznie wyrazy typu a k lub bk. Książka ta jednak ma być konkretna,
zobaczmy więc, jak się będzie pracowało z sumą wielokrotną zawierającą
konkretne liczby:
=
Z
k -j
Na przykład Si = 0; S2 = 1; S3 = j z j + jr y + j z j = T
Typową metodą obliczania podwójnej sumy jest sumowanie najpierw
względem j lub najpierw względem k. Sprawdźmy obie możliwości:
s« -
L
L t h
l ^ k ^ r t 1 ^ j< k
sumujemy najpierw względem j
J
zastępujemy j przez k —j
= l ^Zk ^ n 1^ kZ—-j< k T
}
upraszczamy ograniczenia n a )
Uwaga!
Autorzy wydają się
być przekonani,
że j , k oraz n
są „konkretnymi
liczbami.”
=
=
=
Y
H* -i
Y
Hk
l^k+ l^n
na mocy definicji Hk_i ( 2 . 1 3 )
zastępujemy k przez k + 1
Y Hk-
upraszczamy ograniczenia na k
0^k<n
I tyle! Nie wiemy, jak wyrazić sumę liczb harmonicznych w postaci zwartej.
Jeżeli spróbujemy wy sumować najpierw względem k, to otrzymamy
s- = l ^Lj ^ n j<k<^u
I q
^ ^ i
=L Y l
= Y H"-s
-
sumujemy najpierw względem k
zastępujemy k przez k + j
l ^ j ^ n j < k + j^ r t
upraszczamy ograniczenia na k
l ^ j ^ u 0 < k ^ n —j
=
L
na mocy definicji H u _ j ( 2 . 1 3 )
zastępujemy j przez n —j
Hj
1 ^ n —j ^ n
= Y H,.
upraszczamy ograniczenia na j
I jesteśmy w tym samym miejscu.
Jest jednak jeszcze jedn a droga postępowania. Zamieńmy k na k + j
przed decyzją o sprowadzeniu Sn do sumy sum:
1
Sn
=
Y
kopiujemy zadaną sumę
fc -j
zastępujemy k przez k + j
- l^k^rt
L l^j^TL—
L ki
Z
l^k^n
Całkiem sprytne
było uwzględnianie
k ^ n zamiast
k ^ n —1. Proste
ograniczenia
oszczędzają energię.
n —k
v
suma względem j jest trywialna
= l^k^ir
I M l^k^n ’
—n
= tiHt, —n .
sumujemy najpierw względem j
na mocy prawa łączności
no jasne!
na mocy ( 2 . 1 3 ), definiującego Hn .
M e to d y ogóln e]
No tak! Znaleźliśmy Sn . W zestawieniu z poprzednimi falstartami uzyskali­
śmy w nagrodę dodatkową tożsamość:
Y
Hk = nH n —n
O^kcrt
( 2 .36 )
Postaramy się zrozumieć zastosowany tu chwyt za pomocą dwóch spo­
sobów: algebraicznego i geometrycznego. ( 1 ) Algebraicznie: jeśli mamy po­
dwójną sumę, której wyrazy zawierają k+f ( j ) , gdzie f jest pewną funkcją, to
przykład powyższy podpowiada, że niezłym pomysłem może być zastąpienie
k przez k —f(j), a następnie sumowanie względem j. ( 2 ) Geometrycznie: mo­
żemy spojrzeć się na tę konkretną sumę Sn dla n = 4 w następujący sposób:
k=1
k= 2 k= 3 k= 4
j=1
T +
)= 2
2
+ 3
ł
+
i = 3
j= 4
{
T
Nasze pierwsze próby sumowanianajpierw względem j (kolumny) lub
najpierw względem k (wiersze) dały nam Hi + H2 + H3 = H3 + H 2 + H i.
Kluczem do sukcesu było natomiast sumowanie względem przekątnych, co
dawało y + § + j •
2.5. M e to d y ogólne
Utrwalmy to, co poznaliśmy do tej pory, przyglądając się jednemu przykła­
dowi z różnych stron. Na kolejnych kilku stronach będziemy się starali znaleźć
postać zwartą dla sumy kwadratów początkowych n liczb naturalnych, którą
oznaczymy przez Dn□ n =
X
k2 ,
dla n ^ 0 .
( 2 .3 7 )
Jak się przekonamy, istnieje co najmniej 7 różnych sposobów rozwiązania
tego zadania. W miarę ich odkrywania będziemy przy okazji starali się poznać
użyteczne metody obliczania sum w ogólności.
Najpierw, jak zwykle, przyglądamy się drobnym przypadkom.
n
0
1 2
3
4
5
6
7
8
9
10
11
12
n2
0
1 4
9
16 25
36
49
64
81
100
121
144
□u
0
1 5
14 30
91
140
204
285
385
506
650
55
Nie widać na pierwszy rzut oka postaci zwartej dla [Hn , lecz gdy ją znaj­
dziemy, będziemy mogli z tych wartości skorzystać przy jej sprawdzaniu.
A także na str. 202
„Poradnika
encyklopedycznego”
Bronsztejna i
Siemiendiajewa [42].
Trudniejsze sumy
można znaleźć w
przystępnej książce
Hansena.
A przynajmniej do
problemów, które
mają te same
odpowiedzi, jak
problemy; które inni
byli łaskawi
rozważyć.
M e to d a 0 : Z naleźć gd zieś rozw iązan ie
Problem sumy początkowych n kwadratów liczb naturalnych jest już za­
pewne rozwiązany, więc możliwe, że znajdziemy to rozwiązanie w jakimś
poręcznym poradniku. Faktycznie, na str. 36 w CRC Standard Mathematical
Tables [28] znajdujemy odpowiedź:
n (n + 1)( 2n + 1)
□ n = -----------t-----------,
,,
dla u ^ 0 .
,
*
( 2 .38 )
Tak tylko dla pewności, że odpowiedź przeczytaliśmy poprawnie, wyli­
czamy kilka wartości, np. EI5 = 5- 6-11/6 = 55. Ciekawe, że na str. 36 CRC
Tables znajdziemy dalsze wzory na sumę sześcianów, . . . , dziesiątych potęg.
Rozwiązania wielu problemów związanych ze wzorami matematycznymi
można znaleźć w Handbook of Mathematical Functions, pod redakcją Abramowitza i Stegun [2]. Na stronach 813-814 znajdziemy wartości Dn dla
n ^ 100, a strony 804 i 809 zawierają wzory równoważne ( 2 .38 ), wraz z
analogicznymi wzorami na sumy sześcianów, . . . , 15-tych potęg zawierające
naprzemienne znaki, albo ich nie zawierające.
Najlepszym jednak źródłem odpowiedzi na pytania dotyczące ciągów jest
zadziwiająca mała książeczka Sloane’a [331], Handbook oflnteger Seąuences,
która zawiera tysiące ciągów posortowanych według ich wartości liczbowych.
Jeżeli wpadniesz na rekurencję i masz podejrzenie, że ktoś już ją mógł rozwią­
zać, to wystarczy, abyś policzył wystarczająco dużo początkowych wartości,
aby odróżnić ją od pozostałych już znanych. Masz wtedy duże szanse na to,
że znajdziesz w książeczce Sloane’a swój ciąg i dotyczące go odpowiednie
odnośniki. Ciąg 1, 5, 14, 30, . .. na przykład okazuje się u Sloane’a ciągiem
numer 1574 „kwadratowych liczb piramidalnych” (ponieważ w piramidzie o
podstawie kwadratu złożonego z n 2 kul znajduje się U n kul). Sloane podaje
3 odnośniki, wśród nich wspomnianą już książkę Abramowitza i Stegun.
Jeszcze innym miejscem poszukiwań w światowym magazynie zakumu­
lowanej mądrości matematycznej może być program komputerowy (taki jak
Axiom, MACSYMA, Mapie czy Mathematica), dostarczający narzędzi prze­
kształcania symbolicznego. Takie programy są nieodzowne, szczególnie dla
ludzi, którzy mają do czynienia z dużymi wzorami.
Dobrze jest znać standardowe źródła informacji, gdyż mogą się one oka­
zać bardzo pomocne. Metoda 0 nie jest tak do końca zgodna z duchem tej
książki, chcemy się bowiem dowiedzieć, jak można samemu dojść do takich
rezultatów. Metoda znajdowania gdzieś rozwiązania ogranicza się do proble­
mów, które ktoś już rozwiązał; nowego problemu tam nie znajdziemy.
2.5. M etody ogólnej
M e to d a 1 : Zgadnij o d p ow ied ź, udow odnij ją przez indukcję
Może to jakiś krasnoludek nam tę odpowiedź podpowiedział, a może doszli­
śmy do niej za pomocą innych, nie tak precyzyjnych metod. Wtedy wystarczy,
jeśli pokażemy, że mamy rację.
Moglibyśmy zauważyć, że wartości
rozkładają się na niewielkie sto­
sunkowo liczby pierwsze, więc moglibyśmy wpaść na wzór ( 2 .38 ) jako coś, co
działa dla małych wartości rt. Moglibyśmy też wpaść na równoważny wzór
n ( n + ł ) ( n + 1)
dla rt ^ 0 ,
□ n. =
( 2 .39)
o tyle zgrabniejszy, że łatwiejszy do zapamiętania. Wzór ( 2 .39 ) przemawia
do wyobraźni, ale musimy udowodnić nasze przypuszczenia, aby uwolnić się
od jakichkolwiek wątpliwości. Właśnie po to została wymyślona indukcja
matematyczna.
„Zatem dobrze, mój Panie, wiemy, że Do = 0 = 0(0 + ^)(0 + 1)/3, czyli
baza jest prosta. Dla pokazania kroku indukcyjnego załóżmy, że n > 0 i że
wzór (2 .39) zachodzi, kiedy n zastąpimy przez rt — 1. Ponieważ
D rt
— D n - 1 “I" Tl >
więc mamy
3Dn = (n — l ) ( n — ^)(n)
+
3n 2
= (rt3 — |r t 2 + j n )
+
3rt2
= (n 3 + |r t 2 + j n )
=
n ( n + \ ) { n + 1).
Zatem ( 2 .39 ) rzeczywiście zachodzi poza wszelkimi wątpliwościami dla wszys­
tkich u ^ 0.” Sędzia Wapner, w swojej nieskończonej mądrości, zgadza się z
tym.
Doceniamy wartość indukcji, ale jest coś defensywnego w tym, że czasami
musimy polegać na zgadnięciu rozwiązania. To ciągle nie jest to, czego szu­
kamy. Jak dotąd wszystkie inne sumy, które udało się nam wyliczyć w tym
rozdziale, pokonaliśmy bez pomocy indukcji. Powinniśmy sobie poradzić od
zera także z sumą taką jak Dn . Nie będziemy wymagać błysku geniuszu.
Sumy powinny się dawać wyliczyć również podczas mniej twórczych dni.
M e to d a 2: Zaburz su m ę
Wróćmy więc do metody zaburzania, która tak dobrze działała przy ciągu
geometrycznym ( 2 .25 ). W celu otrzymania równania na Dn , wyodrębnijmy
pierwszy i ostatni wyraz sumy Dn-u
□ n + ( n + 1)2 =
Y. (k + 1 )2 = Y (k2 + 2k + 1)
O^ksCn
O^k^n
=
Y
O ^k^n
k2 + 2 Y _
k+
Y .
O^k^n
= Dn + 2 Y _ k +
1
O^k^n
( n + 1).
O^k^u
Wygląda mi to
raczej na remis.
Niestety! Symbole mn kasują się nawzajem. Czasami, mimo naszych naj­
szczerszych chęci, metoda zaburzania doprowadza nas do czegoś w rodzaju
□ n = On. i przegrywamy.
Z drugiej strony, to wyprowadzenie nie jest taką znowu kompletną po­
rażką; odkrywa przed nami metodę obliczenia sumy początkowych rt liczb
naturalnych,
k = (rt + 1)2 — (n + 1),
2
0< ; k < ; n
jakkolwiek spodziewaliśmy się dostać sumę kwadratów początkowych liczb
naturalnych. To może aby dostać wyrażenie na sumę kwadratów, trzeba za­
cząć od sumy sześcianów liczb naturalnych, którą oznaczymy przez CSPn ?
Spróbujmy:
® n + (n +1) 3 =
Y (k + T)3 = Y (k3 + 3 k 2 + 3 k + 1 )
O ^k^rt
O^k^n
= Wn + 3Dn + 3
Metoda 2 ':
Zaburz swojego
asystenta.
^ + (n+1) ■
No tak, ® tl c o prawda się upraszcza, ale pozostaje wystarczająco dużo in­
formacji, aby otrzymać D n bez uciekania się do indukcji:
3 d n = (n + 1)3 —3(n + 1)n / 2 — (n + 1)
= (n+1)(n2 + 2 n + 1 —§ n —1) = (n+1)(n+-jjn.
M e to d a 3: Skonstruuj rep ertu ar
Drobna modyfikacja rekurencji ( 2 .7) wystarczy, aby poradzić sobie również
ze składnikami zawierającymi rt2. Rozwiązanie rekurencji
R0 = oc;
o
Rn = R n - i + |3 + y n + 6 n 2 ,
dla n > 0 ,
( 2 -4o)
będzie miało ogólną postać
Rn = A ( n ) a + B(n)p + C (n )y + D(n)ó;
( 2 .41 )
przy czym wartości A(rt), B(rt) i C(rt) zostały już określone, gdyż (2.40)
jest identyczne z (2.7) dla 6 = 0. Jeśli teraz włączymy funkcję Rn = rt3, to
przekonamy się, że rt3 jest rozwiązaniem, gdy a = 0, |3 = 1, y = —3, 6 = 3.
W związku z tym
3D ( n ) - 3C (n )+ B (n ) = n 3 ;
co określa już D (n).
Interesuje nas obliczenie sumy IHn , która się równa D n -1 + rt2. Otrzy­
mujemy więc U n = Rn , jeśli przyjmiemy o c = | 3 = y = 0, a 6 = 1 w (2.41).
W związku z tym mamy Dn = D(rt). Nie musimy się więc męczyć z prze­
kształceniami, żeby wyliczyć D (n) z B(n) i C(n), gdyż wiemy, jaki będzie
wynik. Ci, którzy jeszcze w to wątpią, mogą się tych wątpliwości pozbyć po
zaakceptowaniu, że
3D(rt) = n 3 + 3C(rt) —B(rt) = n 3 + 3 -^—
rt = r t(n + ^ )(n + l).
M etoda 4: Zamień sumy na całki
Ci z nas, którzy byli wychowani raczej na rachunku różniczkowym niż na
matematyce dyskretnej, są bardziej zaznajomieni ze znakiem J niż ze znakiem
Y , będzie więc dla nich łatwiej przejść od Y do J. Jednym z celów tej książki
jest uczynienie z Y tak przystępnego narzędzia, że dojdziemy do wniosku,
iż J jest trudniejsza od Y (przynajmniej jeśli idzie o dokładne obliczenia).
Niemniej jednak dobrze jest zbadać relację pomiędzy Y a J, gdyż sumowanie
i całkowanie wyrastają z tych samych korzeni.
W rachunku różniczkowym całka może być przedstawiona jako pole pod
krzywą.
Skala pozioma jest
tu 10 razy rzadsza
niż pionowa.
Pole to przybliżamy dodając pola długich i cienkich prostokątów dotykają­
cych krzywą od spodu. Gdy taki ciąg smukłych prostokątów jest dany, mo­
żemy spojrzeć się na tę konstrukcję również z drugiej strony. Ponieważ IHn
jest sumą prostokątów o bokach 1 x 1, 1 x 4, . . . , 1 x n 2, to suma ta jest w
przybliżeniu równa polu pod krzywą f(x) = x2 między 0 a n. Pole pod tą
krzywą jest równe J q X 2 dx = n 3/ 3; wiemy więc już, że [Hn w przybliżeniu
będzie równe ^n3.
Jedną z metod wykorzystania tego faktu jest ocenienie błędu aproksy­
macji, En = □ n — -jri3. Ponieważ Dn spełnia rekurencję
= Dn-1 + n 2,
więc dochodzimy do wniosku, że En spełnia prostszą rekurencję
En = D n - ^ n 3 = D n - i + n 2 - ^ u 3 = En_! + ^ (rt-1 )3 + rt2 - ^ rt3
= t n_i + rt — ^ .
Inną metodą wykorzystania podejścia całkowego jest znalezienie wzoru
na En przez wysumowanie krzywoliniowych trójkącików składających się na
błąd. Mamy tu
X
” 2
-
L
x2 dx
( k'
k=1 N
7
k=1
W obu przypadkach z łatwością znajdujemy En , a następnie II]n .
M etoda 5: Skomplikuj i uprość
Jeszcze jednym sposobem wyliczenia zwartej postaci dla Du jest zamiana
wyjściowej sumy na trochę bardziej z wyglądu skomplikowaną^sumę po­
dwójną, która może być potem uproszczona, jeśli odpowiednio ją wymasujemy:
□n
=
£_
l^k^n
k2 =
Y .
1^ j^k^n
k
Przejście od sumy pojedynczej do podwójnej może wydawać się na pierw­
szy rzut oka krokiem wstecz. Jest to jednak krok naprzód, gdyż uzyskujemy
sumy, z którymi łatwiej jest pracować. Nie możemy rozwiązywać wszystkich
problemów ciągle tylko upraszczając. Nie można pokonać najwyższych szczy­
tów górskich bezustannie podchodząc do góry.
M etoda 6: Zastosuj rachunek skończony
M etoda 7: Wykorzystaj funkcje tworzące
Przygotuj się na jeszcze bardziej ekscytujące obliczenia Dn =
tym jak w nadchodzących rozdziałach poznamy nowe techniki.
P°
2.6. R achunek różnicow y i różniczkowy
Poznaliśmy wiele sposobów postępowania z sumami. Teraz nadszedł moment,
kiedy możemy dokładniej poznać istniejące możliwości, przyglądając się temu
problemowi z szerszej perspektywy. Matematycy rozwinęli „rachunek róż­
nicowy” będący odpowiednikiem tradycyjnego rachunku różniczkowego. Za
pomocą tego narzędzia będziemy mogli wyliczać sumy w sposób zgrabny i
systematyczny.
Rachunek różniczkowy opiera się na właściwościach operatora pochod­
n ej D, zdefiniowanego jako
D f(x) = lim f(* + h ) - f (x) .
H->0
Tl
Rachunek różnicowy oparty jest na własnościach operatora różnicy A, zde­
finiowanego jako
Af(x) = f(x + 1) —f ( x ) .
(2-42)
Jest to skończony odpowiednik pochodnej, w którym ograniczamy się do
dodatnich całkowitych wartości h. W związku z tym H = 1 jest najbliższe
temu, co moglibyśmy otrzymać, gdyby rozważać „granicę” przy h —> 0, a
Af (x) jest wartością (f (x + H) —f (x)) /H dla h = 1.
Symbole D oraz A są nazywane operatorami , gdyż operując funkcjami
dają nowe funkcje, są więc funkcjami funkcji produkującymi funkcje. Jeśli f
jest odpowiednio gładką funkcją ze zbioru liczb rzeczywistych w zbiór liczb
rzeczywistych, to D f jest również funkcją ze zbioru liczb rzeczywistych w
zbiór liczb rzeczywistych. Tak samo, jeśli f jest jakąkolwiek funkcją z liczb
rzeczywistych w liczby rzeczywiste, to Af też będzie taką funkcją. Wartości
funkcji D f i Af w punkcie x są określone przez podane wyżej definicje.
Jednym z pierwszych kroków podczas poznawania rachunku różniczko­
wego jest zbadanie, jak operator D działa na funkcje potęgowe f(x) = xm.
Ostatni krok tutaj
jest czymś
w rodzaju metody
zaburzania,
ponieważ dostajemy
równanie z szukaną
wielkością po obu
stronach.
W takich przypadkach Df (x) = mxm 1. Możemy to samo napisać nieformal­
nie opuszczając symbol f:
D(xm) = mxm_1 .
Miło by było, gdyby operator różnicowy A dawał podobnie eleganckie wyniki.
Niestety nie daje; na przykład
A(x3) = ( x + I)3 - x 3 = 3x2 + 3 x + 1 .
Jest jednak wersja „m-tej potęgi”, która zachowuje się bardzo ładnie, gdy
zadziała na nią operator A, i to jest właśnie to, co czyni rachunek różnicowy
interesującym. Takie różnicowe potęgi definiuje się za pomocą wyrażenia
m czynników
x— = x(x —1) . . . ( x —m + 1 ),
całkowite m ^ 0 .
(2 .43 )
Zwróćmy uwagę na małe podkreślenie pod m; wynika z niego, że kolejne
czynniki będą się krok po kroku zmniejszały. Istnieje też dualna definicja, w
której czynniki zwiększają się krok po kroku:
m czynników
_
,--------------*---------------- s
xm = x(x + 1 ) . . . (x + m —1 ),
Notacja
matematyczna jest
jednak pokręcona:
Pochhammer [294]
w rzeczywistości
używał
notacji (x)m dla
oznaczenia
współczynników
dwumianowych
(m) , * nie potęg
kroczących.
/
całkowite m ^ 0 .
(2 .44 )
Dla m = 0 mamy x- = x° = 1, gdyż przyjmujemy zwykle, że iloczyn zera
czynników jest równy 1 (podobnie jak suma zera składników jest równa 0 ).
Wartość x— czytamy jako „x do m-tej ubywającej,” podobnie xm czy­
tamy „x do m-tej przyrastającej.” Funkcje te nazywane są również potęgami
kroczącymi lub dolnymi silniami i górnymi silniami , gdyż z silniami mają
trochę wspólnego. W istocie tl! = n—= 1n.
W literaturze matematycznej istnieje wiele różnych notacji dla wyraże­
nia potęg kroczących, w szczególności symbol Pochhammera (x)m na xm
lub x—; spotyka się też notacje typu x^m^lub X(m) dla oznaczenia x—. Pod­
kreślenie i nadkreślenie ma jednak istotne przewagi; jest łatwe do zapisania,
zapamiętania i nie ma zbędnych nawiasów.
Ubywające potęgi x— współdziałają w szczególnie atrakcyjny sposób z
operatorem A. Mamy bowiem
A(x—) = ( x + i p - x 2Ł
= (x + 1 ) x... (x —m + 2 ) — x ... (x —m + 2 ) (x —m + 1 )
= mx(x —1 ) . . . (x —m + 2 ).
Jest to wygodny wzór, analogiczny do wzoru D(xm) = mxm_1:
A(x^) = mx2^ i .
Jest to podstawowa zależność rachunku różnicowego.
(2.45)
Operator D rachunku różniczkowego ma operator odwrotny— antypochodną (lub całkę) oznaczaną przez J. Podstawowe równanie rachunku róż­
niczkowego wiąże operatory D i J:
g(X) = Df(x)
<£>
g(x) dx = f(x) + C
We wzorze tym J g(x) dx, całka nieoznaczona z g(x), jest klasą funkcji, któ­
rych pochodna jest równa g(x). Podobnie dla operatora A istnieje operator
odwrotny, antyróżnica (albo suma) JI, a odpowiednie twierdzenie podsta­
wowe wyraża się następująco:
g(x) = Af(x)
O
^ g ( x ) 6 x = f(x) + C .
(2.46)
Rolę sumy nieoznaczonej dla funkcji g(x) pełni tu wyrażenie X^9(x )6x,
oznaczające klasę funkcji, dla których różnica wynosi g(x). (Zwróć uwagę
na to, że symbol 6 ma się tak do A, jak symbol d do D.) Symbol „C” dla całek
nieoznaczonych oznaczał dowolną stałą, tutaj, w przypadku sum nieoznaczo­
nych, oznacza dowolną funkcję okresową p(x) taką, że p ( x + 1) = p(x). Na
przykład C mogłoby być okresową funkcją a + b s in 27tx; takie funkcje zni­
kają, gdy działamy na nie operatorem różnicy, tak jak stałe znikają przy
różniczkowaniu. Dla całkowitych argumentów x funkcja C jest stała.
Dochodzimy już prawie do sedna. W rachunku różniczkowym znajdziemy
również całki oznaczone : jeśli g(x) = D f(x), to
[ g(x) dx = f(x)
Ja
= f(b) — f ( a ) .
Q
W związku z tym rachunek różnicowy—zawsze starający się naśladować swo­
jego sławnego kuzyna— zawiera też sumy oznaczone : jeśli g(x) = Af(x), to
»Y—n g(x)óx = f(x) i-i = f(b) —f (a ) .
Wzór ten nadaje znaczenie notacji
(2.47)
g(x) óx, podobnie jak poprzedni wzór
definiował J a g(x) dx.
Co znaczy jednak intuicyjnie rzecz biorąc zapis
g(x) 6x? Zdefiniowa­
liśmy ten obiekt przecież na zasadzie analogii, a nie konieczności. To, że ana­
logia taka zachodzi, pozwala nam łatwo zapamiętywać zasady rachunku róż­
nicowego, ale sama notacja jest bezużyteczna, jeśli nie będziemy rozumieli jej
znaczenia. Spróbujmy je wydedukować, przyglądając się najpierw paru szcze­
gólnym przypadkom. Załóżmy przy tym, że g(x) = Af(x) = f(x + 1) —f(x).
Jeśli b = a, to
„Quemadmodum ad
differentiam
denotandam usi
sumus signo A , ita
summam
indicabimus
signo I . ... ex quo
aeąuatio z = A y , si
inveńatur, dabit
quoque
y = Iz + C .”
L. Euler [110]
Dalej, jeśli b = a + 1, to w wyniku dostajemy
Y a+1 g { x ) 5x = f(a + 1 ) —f(a) = g ( a ) .
L— a
Ogólnie, jeśli b zwiększa się o 1, to
2 2 ^+ 1 g(x)Sx -
] T * g ( x ) 6 x = (f(b + 1) — f(a)) — (f(b) — f(a))
= f(b + 1 ) - f ( b ) = g(b).
Na podstawie powyższych obserwacji i indukcji matematycznej możemy wydedukować, co dokładnie oznacza w ogólności ]T £ g(x)
całkowitych a
oraz b spełniających warunek b ^ a:
b
Y _
b_1
g(x)5x
=
^ g (k )
k=a.
=
Y .
g(k),
c a łk o w i t e b ^ cl.
( 2 . 48)
a^kcb
Innymi słowy, suma oznaczona to to samo co zwykła suma, tyle że pomijamy
składnik odpowiadający górnemu ograniczeniu.
Spróbujmy spojrzeć się na to w nieco inny sposób. Załóżmy, że dostali­
śmy do policzenia nie znaną nam sumę, której postać zwartą mamy znaleźć.
Załóżmy też, że możemy ją zapisać w postaci H a<k<b 9 (k) = Z a 9 M 5 x .
Teoria rachunku różnicowego podpowiada nam, że możemy dostać rozwiąza­
nie w postaci f(b) —f(a), jeśli tylko uda się nam znaleźć nieoznaczoną sumę
(czyli antyróżnicę) f, taką że g(x) = f(x + 1) — f(x). Dobrą metodą zrozu­
mienia tego jest wypisanie sumy H a<ck<b 90 0 w całości przy użyciu notacji
wielokropkowej:
Y_ (f(k + 1) —f(k)) = ( f ( a + T ) - f ( a ) ) + ( f ( a + 2 ) - f ( a + 1 ) ) + • • •
a^kcb
+ (f ( b - 1 ) - f ( b - 2 ) ) + (f(b) - f ( b - 1 ) ) .
A ja cały czas
myślałem, że to się
nazywa
teleskopowe,
bo bardzo długie
wyrażenie składa się
tak jak teleskop
do bardzo
krótkiego.
Wszystkie wyrazy po prawej stronie kasują się nawzajem poza f(b) — f(a);
wartością naszej sumy jest więc f(b) — f(a). (Sumy postaci H a<k<b(f(k. +
1 ) —f (k)) często nazywane są teleskopowym i przez podobieństwo ze składa­
nym teleskopem, gdyż grubość obudowy złożonego teleskopu zależy jedynie
od zewnętrznego promienia najbardziej zewnętrznej tuby i od wewnętrznego
promienia tuby najbardziej wewnętrznej.)
Prawo (2.48) stosuje się tylko wtedy, gdy b ^ a. Co się jednak stanie,
jeżeli b < a? Wszystko będzie w porządku, równanie (2.47) gwarantuje, że
zachodzi
Jest to równanie analogiczne do odpowiedniego równania dla całkowania
oznaczonego. Podobnie rozumując, dowodzimy, że
+
= Ha> co ^aje
nam sumacyjny odpowiednik tożsamości J Q +
= J^. W pełnej krasie:
V h g(x)óx + y ~ % (x ) 6x = V Cg(x)óx,
^— a
z—b
z— a
(2 4 9 )
dla wszystkich liczb całkowitych a, b oraz c.
Niewątpliwie w tym momencie niektórzy zastanawiają się zapewne, jak
możemy wykorzystać te analogie i paralele. Mamy niewątpliwie jeden atut w
ręku: sumowanie oznaczone dostarcza nam prostej metody sumowania uby­
wających potęg: z podstawowych równań (2.45), (2.47), i (2.48) wynika ogólne
prawo
]cm ±i
k- =
O^kcn
m+ 1
n ra+1
m+ 1
dla całkowitych m ,n ^ 0. (2.50)
Wzór ten łatwo zapamiętać, gdyż bardzo przypomina doskonale znany wzór
Jo x m dx = n m+l/ ( m + 1 ) .
W szczególności, gdy m = 1 dostajemy k - = k, więc zasady rachunku
różnicowego dają nam prostą metodę zapamiętania, że
Y
k = T
O^kcn
= n{-n ~ ' V 2 -
Metoda sum oznaczonych podpowiada nam, że nieco łatwiej jest liczyć sumy
względem 0 ^ k < rt, niż względem 1 ^ k ^ rt, gdyż te pierwsze są równe
po prostu f(n) —f(0), podczas gdy te drugie muszą być wyliczone jako f(n +
D -f(i).
Zwykłe potęgi też można sumować tym nowym sposobem, najpierw trze­
ba je jednak wyrazić jako kombinację ubywających potęg, na przykład:
k2 = k - + k - ,
więc
Y _ k2 = ' T + T
0^k<n
= 3 n (n _ 1) ( n - 2 + §) = ± n ( n - ^ ) ( n , - 1).
Zamieniając teraz rt na rt + 1 dostajemy kolejną metodę policzenia wartości
naszej starej znajomej sumy Dn = L o^ k ^ n ^ 2 w postaci zwartej.
W porządku, to było całkiem proste. Na dobrą sprawę to było to prost­
sze niż którakolwiek z dotychczasowych metod, które na śmierć zamęczyły
Pozostali
zastanawiają się
nad tym już
od pewnego czasu.
tę biedną sumę już w poprzednim podrozdziale. Spróbujmy więc trochę am­
bitniej policzyć sumę sześcianów. Proste rachunki dają nam
k 3 = k^ + 31cż + lcl.
(Zawsze można dokonać konwersji między potęgami zwykłymi a ubywają­
cymi za pomocą liczb Stirlinga, którymi zajmiemy się w rozdziale 6.) Zatem
CL^iv\ u
Ubywające potęgi są więc bardzo poręczne dla sum. Czy mają one jeszcze
jakieś inne przyjemne własności? Czy zanim zabierzemy się do sumowania
musimy zawsze dokonywać konwersji naszych zwykłych potęg do potęg uby­
wających, a potem, dokonawszy sumowania, znowu męczyć się z konwersją
wyniku? Okazuje się, że nie. Możemy od razu zabrać się do pracy z potęgami
ubywającymi, gdyż mają one dodatkowe własności. Na przykład, podobnie
jak w przypadku potęg normalnych, gdzie mamy (x + y )2 = x2 + 2xy + y 2}
tak tutaj zachodzi (x + y ) - = x - + 2x - y - + y 2. Analogiczne wzory zachodzą
też dla (x + ij)m i (x + ij)— (ten „wzór dwumianowy” zostanie udowodniony
w ćwiczeniu 5.37).
Do tej pory rozważaliśmy jedynie potęgi ubywające z nieujemnymi wy­
kładnikami. Aby rozszerzyć naszą analogię do ujemnych wykładników, mu­
simy dobrze określić, co rozumiemy przez x— dla m < 0. Przyglądając się
ciągowi
zauważamy, że aby przejść z x - do x - do x - do x-, dzielimy kolejno przez x —2,
następnie przez x — 1 i w końcu przez x. Wydaje się rozsądne (jeśli nie konieczne), aby teraz w celu otrzymania x— z x - dokonać dzielenia tego
ostatniego przez x + 1. Idąc tak dalej, dostaniemy kolejne wykładniki uby­
wających potęg ujemnych:
x+ 1
(x + 1)(x + 2 ) ’
1
(x + 1)(x + 2)(x + 3)
a nasza ogólna definicja ujemnych potęg ubywających przedstawia się nastę­
pująco:
x ^ = ------ —----- ■!----- ---------- ,
( x + 1)(x + 2 ) . . . ( x + m)
dla m > 0 .
(2 .51 )
v 0 '
(Ubywające potęgi można również określić dla m rzeczywistych, a nawet
zespolonych, odłóżmy to jednak do rozdziału 5.)
Tak zdefiniowane potęgi ubywające mają dalsze przyjemne własności.
Być może najważniejszą z nich jest ogólne prawo wykładników, analogiczne
do prawa
xm+n _
zachodzącego dla potęg zwykłych. Analogiczny wzór dla potęg ubywających
wygląda tak:
xm+n _ xm jx _ mjn ^
dla rn i rt całkowitych.
(2 .52 )
Na przykład x^±^- = x -(x —2)-, a dla ujemnego n mamy
xiz3 = x—(x
2 )—
= - J - = x=±.
= x ( x - 1 ) 7----- 1
(x - 1)x(x + 1)
X+1
Gdybyśmy zdefiniowali x— jako 1/x zamiast 1/ (x + l), to prawo wykładników
(2.52) nie byłoby spełnione dla przypadków takich jak m = —1 i rt = 1. Na
dobrą sprawę mogliśmy użyć równania (2.52) do wymuszenia odpowiedniej
definicji ujemnych potęg ubywających przez podstawienie m = —n. Kiedy
istniejąca notacja ma objąć większą liczbę przypadków, dobrze jest ją tak
uogólnić, aby ogólne prawa nadal zachodziły.
Przekonajmy się jeszcze, że podstawowa własność dla różnicy ubywają­
cych potęg zachodzi także w przypadku dopiero co zdefiniowanych ujemnych
potęg ubywających. Czy rzeczywiście Ax— = m x^^l dla m < 0? Jeśli np.
m = —2 , to różnica wynosi
Ax— =
_
1
1
(x + 2)(x + 3)
(x + 1)(x + 2)
(x + 1) —(x + 3)
(x + 1) (x + 2) (x + 3)
= —2 x— .
Tak— to działa! Podobne wyprowadzenie można przeprowadzić dla każdego
m < 0.
Własność (2.50) zachodzi więc także dla ujemnych potęg ubywających.
I wszystko jest w porządku, pod warunkiem, że unikniemy dzielenia przez 0:
>
b
—a
.m+1
x— óx =
dla m ^ - 1
m+ 1
Co jednak będzie, gdy m = —1? Gwoli przypomnienia, w przypadku
całek mamy dla m = —1
: 1 dx = ln x
Chcielibyśmy zatem znaleźć skończony odpowiednik dla lnx. Innymi słowy,
szukamy funkcji f(x) takiej, że
x= I =
X+1
= Af (x) = f (x + 1) —f ( x ).
Nietrudno jest zauważyć, że
+
f(x) - J + 2 +
0,577 dokładnie?
Może oni mają
na myśli 1/y/3 ?
1
jest taką właśnie funkcją dla x będącego liczbą całkowitą. Dostaliśmy więc
po prostu liczbę harmoniczną Hx z równania (2.13). Liczba Hx jest zatem
dyskretnym odpowiednikiem ciągłej funkcji lnx. (W rozdziale 6 zdefiniu­
jemy Hx dla niecałkowitych x, ale całkowite wartości wystarczają nam do
bieżących potrzeb. Jak się o tym przekonamy w rozdziale 9, dla dużych x
wartość Hx —ln x jest w przybliżeniu równa 0,577 +1 / ( 2x ). Funkcje Hx oraz
ln x są nie tylko analogiczne, lecz także ich wartości różnią się zazwyczaj o
mniej niż 1.)
Możemy już przedstawić pełny wzór na sumowanie ubywających potęg:
.m+1
£
6x =
m
1
jeśli m ^ - 1 ;
(2-53)
b
Hx
jeśli m = —1
Wzór ten wyjaśnia, dlaczego liczby harmoniczne ukazują się tak często w roz­
wiązaniach problemów dyskretnych, takich jak analiza algorytmu sortowania
szybkiego. Podobnie zresztą logarytmy naturalne pojawiają się w naturalny
sposób w rozwiązaniach problemów ciągłych.
Skoro znaleźliśmy odpowiednik funkcji lnx, może zastanówmy się, co
powinno odpowiadać funkcji ex? Która z funkcji f(x) ma tę własność, że
Af(x) = f(x), tak jak D ex = ex? Proste:
f(x + T ) — f(x) = f(x)
<= $
f ( x + 1 ) = 2 f(x );
mamy więc do czynienia z prostą rekurencją i możemy przyjąć, że funkcja
f(x) = 2X jest dyskretnym odpowiednikiem funkcji ex.
Różnica dla funkcji cx jest także prosta, a mianowicie dla każdego c:
A(cx ) = cx+I - cx = ( c - 1)cx .
W związku z tym antyróżnicą funkcji cx jest cx/(c — 1), dla c ^ 1. Fakt
ten wraz z podstawowymi prawami (2.47) i (2.48) daje nam zręczną metodę
zrozumienia ogólnego wzoru na sumę ciągu geometrycznego:
cb - c a
Z
ck =
a^kcb
=
Ilekroć napotkamy funkcję f, której postać zwarta mogłaby być uży­
teczna, możemy policzyć jej różnicę Af = g uzyskując funkcję g, taką że
suma nieoznaczona Y 9 (x ) ^x Jes^ znana. Tabela 74 zawiera kilka najprost­
szych, użytecznych przy sumowaniu par różnica-antyróżnica.
Pomimo wielu analogii między matematyką ciągłą a dyskretną, niektóre
z pojęć ciągłych nie mają swojego dyskretnego odpowiednika. Na przykład
reguła różniczkowania funkcji złożonej nie ma odpowiadającego jej wzoru w
rachunku różnicowym; nie istnieje żaden sensowny wzór na Af (g (x )). Podob­
nie zamiana zmiennych w przypadku dyskretnym jest trudna, poza paroma
konkretnymi podstawieniami w stylu zamiany x n a c ± x .
Na szczęście A (f (x) g(x)) m a całkiem zgrabną postać i dostarcza nam re­
guły na sumowanie przez części. Jest to dyskretny odpowiednik całkowania
przez części. Przypomnijmy, że wzór
D(uv) = u D v + v D u
w rachunku różniczkowym prowadzi po scałkowaniu i uporządkowaniu zmien­
nych do wzoru na całkowanie przez części,
[ u Dv = uv —| v D u .
Podobny wzór możemy wyprowadzić w rachunku różnicowym.
*
Zaczynamy od zastosowania operatora różnicowego do iloczynu dwóch
funkcji u(x) i v(x):
A (u(x)v(x)) = u (x + 1) v (x + l) —u(x) v(x)
= u ( x + l ) v(x + 1 ) —u(x) v ( x + l)
+ u(x) v (x+ 1) - u(x) v(x)
= u(x) Av(x) + v (x + 1) A u (x ).
(2 .5 4 )
Tabela 74 jest
na stronie 74.
Tabela 74. Jaka to różnica?
f = Igą
Af = g
f
0'
*;iv
| X1 = X
1
m r»
{^X- = x(x — 1) •*;; 2x
'j"\ e)'! {ff x—
mx!.-a-125^1
x 22± i / ( m + 1)
xm
H,
x = i = 1/(x + 1) ' r;-V
l H*
U M
: C'
‘ cx/ ( c - 1) r| , c’
3
*• cf
f+ g
fg _
cAf
Af + Ag
fAg + EgAf
Wzór ten można wyrazić w dogodnej postaci za pomocą operatora prze­
sunięcia E, zdefiniowanego jako
Ef(x) = f ( x + 1).
Po podstawieniu Ev(x) w miejsce v(x+1) otrzymujemy zwartą postać wzoru
na różnicę iloczynu:
A(uv) = u A v + Ev Au
Rachunek
różniczkowy unika
operatora E
przyjmując, że
1 -> 0.
(Operator E jest nieco przykrym zaskoczeniem, ale nic nie możemy poradzić,
bez niego wzór nie byłby prawdziwy.) Biorąc teraz sumę nieoznaczoną po
obu stronach równania i przenosząc odpowiednie składniki na jedną stronę,
uzyskujemy zapowiedziany wzór na sumowanie przez części:
y~ u Av = uv —
Domyślam się, ie
ex = 2X, d/a
małych wartości 1 .
( 2 .55 )
^v
(2 .56 )
Tak jak w rachunku całkowym, można zastąpić węzystkie.składniki wzoru
ich granicami, dostając wzór na sumowanie oznaczone.
Wzór ten jest użyteczny wtedy, gdy lewa strona jest trudniejsza do wy­
liczenia niż prawa. Przyjrzyjmy się przykładowi. Funkcja J xex dx stanowi
typowy przykład, kiedy stosujemy całkowanie przez części. Jej dyskretnym
odpowiednikiem jest funkcja
*2 Xóx, którą już rozważaliśmy w tym roz­
dziale w postaci
k 2 k. Aby przesumować ją przez części, przyjmujemy
u(x) = x i Av(x) = 2X; w takim razie Au(x) = 1, v(x) = 2X i Ev(x) = 2X+1.
Po podstawieniu do zależności ( 2 .56 ), otrzymujemy
^ x 2 x Sx = x 2 x - J 2 2X+1 8x = x2-X ~ 2X+1 + c *
Możemy zastosować tę postać do wyliczenia rozważanej już sumy, wprowa-
dzając granice przedziału:
rt+l
Y_ k2k = Y 0
x2* bx
k=0
n+1
= x T - 2 X+1
0
= ( ( n + 1 ) 2 n+1 - 2 n+2) —(0-2° —21) = ( n - 1 ) 2 n+1+ 2
Ta metoda jest o tyle prostsza od zastosowania metody zaburzania, że nie
musimy tu w ogóle wysilać umysłu.
Wcześniej w tym rozdziale natknęliśmy się na problem znalezienia wzoru
Z^osck<n
1 szcz?śliwie udało się nam sobie z nim poradzić. Czy mogli­
byśmy jednak znaleźć wzór ( 2 .3 6 ) w systematyczny sposób, gdybyśmy zasto­
sowali sumowanie przez części? Zademonstrujmy to wyliczając sumę, która
wygląda nawet na nieco trudniejszą, Ho^kcn^Hk- Rozwiązanie nie jest ta­
kie trudne, jeśli przypomnimy sobie, jak postępuje się z całką J x ln x d x .
Przyjmujemy u(x) = Hx i Av(x) = x = x-, więc Au(x) = x— , v(x) = x -/2 ,
Ev(x) = (x + 1) - /2 i dostajemy
x2
^ x H x 6 x = — Hx -
= f» ,
--
—
2 HH >
(* + l £ X—
-1
óx
^ x i 8x
+ C
(przejście z pierwszego wiersza do drugiego polegało na zastosowaniu prawa
wykładników ( 2 .5 2 ) do dwóch ubywających potęg (x + 1 ) - x — z m = —1
oraz n = 2). Możemy teraz wprowadzić ograniczenia górne i dolne i ostatecz­
nie dochodzimy do wniosku, że
Y _ kHk = ^ x H x 5x = ^ ( H n - l ) .
O^kcn
( 2 -57)
2.7. Sum y nieskończone
Kiedy zdefiniowaliśmy notację Y_ na początku tego rozdziału, pytanie o sumy
nieskończone zbyliśmy mówiąc, że zajmiemy się tym później i że na razie mo­
żemy przyjąć, iż w rozważanych sumach jedynie skończona liczba wyrazów
przybiera wartości niezerowe. Nadeszła jednak pora prawdy i musimy przy­
Ostatecznym celem
matematyki jest
eliminacja
jakiejkolwiek
potrzeby używania
umysłu.
znać, że sumy mogą być nieskończone. Co ciekawe, sumy nieskończone niosą
ze sobą zarówno złe, jak i dobre wieści.
Najpierw złe wieści. Okazuje się, że nie wszystkie metody przetwarzania
sum są poprawne, gdy stosujemy je do sum nieskończonych. A teraz do­
bre wieści. Istnieje spora klasa sum nieskończonych, które można bez obawy
przekształcać za pomocą wszystkich wprowadzonych operacji. Powody, które
stoją za oboma tymi spostrzeżeniami, staną się jasne, gdy tylko przyjrzymy
się z bliska temu, czym naprawdę jest sumowanie.
Jest powszechnie wiadome, czym jest suma skończona. Dodajemy po pro­
stu parę wyrazów jeden po drugim, aż wszystkie będą dodane. Nieskończona
suma musi być jednak zdefiniowana precyzyjniej, ażeby nie dojść do para­
doksalnych sytuacji.
Wydaje się na przykład naturalne określenie naszych działań tak, że nie­
skończona suma
S = 1 + 2 + i + g + n + 3i + --będzie równa 2 , gdyż po jej podwojeniu otrzymamy
2 S = 2 + 1 + -j + ^ + £ + ^ + -- - = 2 + S .
Z drugiej strony, to samo rozumowanie pozwala nam dojść do wniosku, że
T = 1 + 2 + 4-1-8 + 16 + 32-1----No jasne!
1 + 2 + 4 + 8 H---jest reprezentacją
liczby —1 w kodzie
uzupełnieniowym
o nieskończonej
długości słowa.
równe jest —1. Jeśli bowiem podwoimy tę sumę, to dostaniemy
2T = 2 + 4 + 8 + 1 6 + 32 + 64 + --- = T - 1 .
Dzieje się tu coś podejrzanego; jak można dostać liczbę ujemną przez sumo­
wanie wielkości dodatnich?
Chyba lepiej pozostawić wyrażenie T nie zdefiniowane. A może warto
uznać, że T = oo, gdyż dodawane wyrazy kumulują się w T do czegoś więk­
szego od dowolnej liczby skończonej? (Zauważmy, że oo jest „rozwiązaniem”
równania 2T = T—1, podobnie jak jest „rozwiązaniem” równania 2S = 2+S. )
Spróbujmy sformułować dobrą definicję wartości ogólnej sumy H kęK a^,
gdzie K może być nieskończone. Na początek przyjmijmy, że wszystkie wyrazy
a k są nieujemne. Odpowiednia definicja nie jest trudna do znalezienia. Jeśli
istnieje stała A taka, że
X .ak ^ A
k 6F
dla każdego skończonego podzbioru F C K, to zdefiniujemy ]Tk6K
najmniejsze takie A (z właściwości liczb rzeczywistych wynika, że zbiór
2.7. S um y n ieskoń czone
wszystkich takich A musi mieć najmniejszy element). Jeśli jednak takiej ogra­
niczającej stałej A nie ma, to mówimy, że ]Tk€K ak = oo, co oznacza, że jeśli
A jest liczbą rzeczywistą, to zawsze można dobrać taki skończony podzbiór
wyrazów ak, których suma przekroczy A.
Jag#
Definicja z poprzedniego akapitu została sformułowana precyzyjnie; war­
tość sumy nie zależy więc od porządku, który mógłby istnieć w zbiorze indek­
sów K. W związku z tym wnioski, które zaraz wyciągniemy, będą prawdziwe
również dla sum wielokrotnych z wieloma indeksami k i , k2 , . . . , a nie tylko
dla sum względem zbioru liczb całkowitych.
W przypadku szczególnym, kiedy K jest zbiorem liczb naturalnych, z
naszej definicji dla nieujemnych wyrazów ak wynika, że
V_ a k =
• —
tl—
lim V~ O-k
•■
k=0
Oto dlaczego: Każdy niemalejący ciąg liczb rzeczywistych ma granicę (być
może oo). Jeśli granicą jest liczba A i jeśli F jest dowolnym skończonym zbio­
rem liczb naturalnych, którego żaden element nie przekracza ri, to H kGF ak ^
£ k=o ak ^ A. Zatem A = oo lub A jest stałą ograniczającą tę sumę. Jeśli A'
jest jakąkolwiek liczbą mniejszą niż założona granica A, to istnieje takie n, że
H k=o a k > A', i skończony zbiór F = { 0 ,1 ,... ,n} staje się przyczyną tego,
że A' nie może być uznane za stałą ograniczającą.
Przy użyciu wprowadzonej właśnie definicji możemy policzyć wartości
pewnych nieskończonych sum. Na przykład, gdy a k = xk, otrzymujemy
V xk =
L—
k^O
i _ •vn+l
lim — --------
u-*oo
I —X
f 1 / ( 1 —x),
\ oo,
jeśli 0 ^ x < 1 ;
jeśli x ^ 1 .
W szczególności dwie dopiero co rozważane sumy nieskończonej liczby niezerowych elementów S i T mają odpowiednie wartości równe 2 i oo, tak jak
przypuszczaliśmy. Innym ciekawym przypadkiem jest
E
kSO ( k + 1 ) ( k + 2)
k^O
=
lim > k— =
k=0
n —^no ■
k—
lim —
tl—
>-oo
—
=
1.
Rozważmy teraz sytuację, kiedy w sumie występują także wyrazy ujemne.
Czemu na przykład powinna być równa suma
] T ( - 1 )k =
k^O
1 — 1 + 1 —1 + 1
— 1 H-----?
Zbiór K mógłby
być nawet
nieprzeliczalny, ale
tylko przeliczalna
liczba wyrazów
mogłaby być
niezerowa, jeżeli
chcielibyśmy
utrzymać stalą A ,
która ogranicza
sumę z góry. Jeśli
taka stała istnieje,
to co najwyżej nA
wyrazów może być
większe lub równe
l/n.
„Aggregatum
ąuantitatum
a —a + a —a + a —a
etc. nunc est = a,
nunc = O, adeoąue
continuata in
infinitum serie
ponendus = a/2,
fateor acumen et
veritatem
animadversionis
tuae.”
G. Grandi [163]
Jeśli pogrupujemy wyrazy parami, to dostaniemy
( 1 — 1) + ( 1 — 1) + ( 1 — 1)H----- = 0 + 0 + 0 + • • • ,
suma więc będzie równa 0. Jeśli jednak zaczniemy parować wyrazy poczyna­
jąc od drugiego, to dostaniemy
1 — (1 — 1 ) — (1 — 1 ) — (1 — 1 ) ------=
1 — 0 —0 — 0 -------- ;
i suma wychodzi równa 1 .
Możemy też we wzorze
k > 0 xk = 1/{I —x) przyjąć x = —1, gdyż poka­
zaliśmy, że wzór ten zachodzi, gdy 0 ^ x < 1 ; w takim razie bylibyśmy jednak
zmuszeni do przyjęcia, że ta nieskończona suma składająca się z samych liczb
całkowitych równa jest \ \
Jeszcze jednym interesującym przypadkiem jest podwójnie nieskończona
suma
a k) gdzie ak = 1 /(k + 1 ) dla k ^ 0 i a k = 1 / ( k — 1 ) dla k < 0 .
Możemy zapisać ją jako
----- 1- (~ J ) + (—5 ) + (—j ) +
l + l +
-----•
( 2 *58)
Jeśli teraz wyliczymy tę sumę zaczynając od wyrazu „środkowego” i bę­
dziemy sumowali na zewnątrz w taki sposób:
•• • + ( - * + (“ i + ( - i + 0 ) + 1 ) + i ) + i ) h
>
to otrzymamy wartość 1. Tę samą wartość dostaniemy, gdy przesuniemy
wszystkie nawiasy o jeden wyraz w lewo:
• " + H
+ H
+ (—3 + ( - l ) + D + ł ) + l ) + " - >
gdyż suma wszystkich liczb wewnątrz środkowych rt nawiasów jest równa
1
1
1
,
1
1
--------------------------1--------7
n +—1 -----------------n
2
2
n —1 —
,
1
1
-----------n
n +T1T '
Podobne rozumowanie doprowadzi nas do wniosku, że otrzymamy 1, gdy na­
wiasy przesuniemy o dowolną ustaloną wartość w lewo lub w prawo. Upraw­
nia nas to do przypuszczenia, że wartością tej sumy jest 1. Nieoczekiwanie
jednak, gdy pogrupujemy wyrazy w nieco inny sposób:
• • • + ( - 5 + ( - i + ( - i + 1 + i ) + i + ?) + 5 + i ) + *‘ * »
to n-ta para nawiasów, licząc od środka, zawiera liczby
Udowodnimy w rozdziale 9, że limn^ 00 (H 2 n — Hn+i ) = ln2, zatem to prze­
grupowanie pozwala nam przypuszczać, że nasza suma o zbiorze indeksów
nieograniczonym z obu stron może być w istocie równa 1 + ln 2 .
Jest coś niepokojącego w sumie, która daje różne wartości w zależności
od tego, jak pogrupujemy wyrazy. Zaawansowane książki z analizy matema­
tycznej dostarczają wielu definicji pozwalających nadać sensowne wartości
takim patologicznym sumom, ale zaakceptowanie tych definicji oznaczałoby
dla nas rezygnację z operowania notacją Y z taką swobodą, z jaką robiliśmy
to dotychczas. Nie potrzebujemy w naszych rozważaniach subtelnego pojęcia
zbieżności warunkowej. Przyjęta przez nas definicja jest na tyle prosta, że
zachodzą wszystkie omówione do tej pory operacje, pozostaniemy więc przy
tej uproszczonej wersji definicji sumy nieskończonej.
W rzeczywistości nasza definicja sumy nieskończonej jest bardzo pro­
sta. Niech K będzie dowolnym zbiorem, natomiast a k—wartością rzeczywistą
określoną dla każdego k G K. (Tutaj ‘k’ może oznaczać kilka indeksów k i ,
k2 , . . . , więc K można postrzegać jako indeks wielowymiarowy). Każdą liczbę
rzeczywistą x można przedstawić jako różnicę jej części dodatniej i ujemnej:
x = x+ —x_ ,
gdzie x+ = x • [x > 0 ] oraz x_ = —x • [x < 0 ].
(Albo x+ = 0, albo x _ = 0.) Wyjaśniliśmy właśnie, jak określić wartości sum
nieskończonych postaci ^ keK a£ i Y keK a k , dla nieujemnych
i a^. W
związku z tym, definicja ogólna wygląda następująco:
^ ak = 2 K
k€K
keK
- H ak>
(2-59)
keK
chyba że obie sumy po prawej stronie są równe oo. W tym przypadku przyj­
mujemy, że wartość ^ keK a k jest nieokreślona.
Niech A + = X,keK a ic >za^
~ HkeK a ić• Jeżeli zarówno A+ , jak i Asą skończone, to mówimy, że suma 21 keK
jes^ zbieżna bezwzględnie do
wartości A = A+ —A - . Jeśli A + = oo, a jednocześnie A- jest skończone, to
mówimy, że suma Y k eK a k rozbiega do +oo. Podobnie, jeśli A - = oo, a A +
jest skończone, to mówimy, że Y kek ak rozbiega do —oo. Jeśli natomiast,
A + = A - = oo, to nie ma co się męczyć ze zgadywaniem.
Zaczęliśmy od definicji, która działała dla wyrazów nieujemnych, potem
rozszerzyliśmy ją na wyrazy rzeczywiste. Dla liczb zespolonych kolejnego roz­
szerzenia dokonamy w naturalny sposób. Sumę Y keK
definiujemy przez
LkeK * akH-iLkeK ^ak»&dzie ;?tak oraz 3 a k są odpowiednio częścią rzeczy­
wistą i urojoną liczby a k— przy założeniu, że obie są określone. W przeciw­
nym razie przyjmujemy, że H keK ak jest nieokreślone (zob. ćwiczenie 18).
Złe wieści, to, jak już mówiliśmy, nieokreśloności niektórych nieskończo­
nych sum; bardziej nam bowiem zależy na zachowaniu poprawności wprowa­
dzonych przekształceń, niż na ogólności definicji (zob. ćwiczenie 34). Dobre
Innymi słowy,
zbieżność
bezwzględna
oznacza, że suma
wartości
bezwzględnych jest
zbieżna.
F s - - , y ...........
Czytając to po raz
pierwszy lepiej jest
odpuścić sobie
następną stronę.
Twój przyjazny
asystent
*
m
.
m
. ____________________ _____ w
wieści to te, że gdy mamy do czynienia z sumami zbieżnymi bezwzględnie,
tak jak je zdefiniowaliśmy, wówczas wszystkie przekształcenia wprowadzone
w tym rozdziale zachowują swoją poprawność.
Zweryfikujemy te dobre wieści pokazując, że każde z naszych przekształ­
ceń zachowuje wartości wszystkich sum zbieżnych bezwzględnie. Ściślej ozna­
cza to, że musimy udowodnić prawa rozdzielności, łączności i przemienności,
a ponadto prawo niezależności wyniku sumowania od wyboru kolejności in­
deksów; wszystko inne wynika z tych czterech podstawowych praw.
Prawo rozdzielności ( 2 . 15) może być ściślej sformułowane w następujący
sposób: Jeśli ^ keK &k zbiega bezwzględnie do A i jeśli c jest liczbą zespoloną,
to H k6K ca k zbiega bezwzględnie do cA. Możemy to udowodnić rozbijając
naszą sumę na część rzeczywistą i urojoną, a każdą z nich dodatkowo na do­
datnią i ujemną. Dokonawszy tego rozbicia otrzymujemy prawo rozdzielności
osobno dla każdej z tych sum, jako że każda z nich składa się z wyrazów
nieujemnych, przy c > 0. Ze względu na to, że
kGF CCLk = c HkeF ak ^la
każdego zbioru skończonego F, prawo rozdzielności dla tych 4 części wynika
z indukcji ze względu na rozmiar zbioru F.
Prawo łączności (2 . 16) może być wyrażone następująco: Jeżeli J IkeK ak i
Hic<ek
s3 b ieżn e bezwzględnie odpowiednio do A i B, to suma HkeK(a k+
bk) jest zbieżna bezwzględnie do A + B. Fakt ten okazuje się szczególnym
przypadkiem ogólniejszego twierdzenia, którego szkic dowodu podamy.
Prawo przemienności ( 2 . 17) nie wymaga tu dowodu, gdyż na dobrą spra­
wę pokazaliśmy w trakcie dyskusji, jak otrzymać je jako szczególny przypadek
zasady zamieniania kolejności sumowania. Dyskusja ta nastąpiła po przed­
stawieniu tożsamości ( 2 .35 ).
Głównym faktem, który wymaga dowodu, jest podstawowe prawo sum
wielokrotnych: sumy zbieżne bezwzględnie względem dwóch lub więcej indek­
sów mogą być sumowane najpierw względem dowolnego indeksu. Formalnie
rzecz ujmując, udowodnimy, że jeśli J oraz {Kj | j e J} są dowolnymi zbiorami
indeksów takimi, że
y~
aj }k
zbiega bezwzględnie do A ,
jej
k £ K j
to dla każdego j E J istnieje liczba zespolona Aj taka, że
y~ aj,k
zbiega bezwzględnie do Aj
i
kGKj
y~ Aj
zbiega bezwzględnie do A .
jej
Wystarczy udowodnić ten fakt dla przypadku, gdy wszystkie wyrazy są
nieujemne, gdyż, jak już wiemy, ogólny przypadek można rozbić na część
rzeczywistą i urojoną, dodatnią i ujemną. Załóżmy więc, że a.j)k ^ 0 dla
wszystkich par (j,k) E M., gdzie M jest nadrzędnym zbiorem indeksowym
{(j,k) | j e J .k e K ,} .
Wiemy, że suma
k)eM
jes^ skończona, czyli że
y
O-jyk. ^
(j,lc)GF
dla wszystkich skończonych podzbiorów F C M, i że A jest najmniejszym
takim ograniczeniem (kresem górnym). Dla dowolnego j E J każda suma po­
staci ^ kGf. cl^ic, gdzie Fj jest skończonym podzbiorem zbioru Kj, jest ogra­
niczona z góry przez A. Wszystkie takie skończone sumy mają zatem kres
górny Aj ^ 0 i jednocześnie, na mocy definicji, YkeK=
Wciąż jeszcze pozostaje do udowodnienia, że A jest kresem górnym sum
^ j GG Aj dla wszystkich skończonych podzbiorów G C J. Załóżmy, że G jest
skończonym podzbiorem zbioru }, przy czym XjeG
~ ^ ' > A- Możemy
wtedy znaleźć skończone podzbiory Fj C Kj takie, że ^ kGF. ajłk > (A /A 7)Aj
dla każdego j E G spełniającego Aj > 0. Istnieje co najmniej jedno takie j.
Wtedy jednak H jGG kGF. a.j,k > (A /A 7) ^ j GG Aj = A, co przeczy faktowi, że
dla wszystkich skończonych podzbiorów F C A/l zachodzi Y_{j k)eF ai,^ ^ A.
Zatem ^ j GG Aj ^ A dla wszystkich skończonych podzbiorów G C J.
W końcu niech A 7 będzie dowolną liczbą rzeczywistą mniejszą od A. Nasz
dowód dobiegnie końca, jeśli pokażemy, że istnieje skończony zbiór G C J taki,
że X,jGG Aj > A 7. Wiemy, że istnieje skończony zbiór F C M. spełniający
^ ( j k)GFa.j>k > A 7; niech więc G będzie zbiorem indeksów j ze zbioru F i
przyjmijmy, że Fj = {k | (j,k) € F}. Wtedy £ j6G A,- > £ jgG LkgF, ai,k =
^(i,k)eF a i>k >
W porządku. Nasze wzory są już dowiedzione. Wszystko, co do tej pory
wyprawialiśmy z sumami nieskończonymi, jest uzasadnione, pod warunkiem,
że istnieje skończone ograniczenie na wszystkie skończone sumy wartości bez­
względnych wyrazów. Ponieważ podwójnie nieskończona suma ( 2 .5 8 ) dała
nam dwie odpowiedzi, zależne od porządku sumowania, więc jej dodatnie
wyrazy 1 + \ + -j H-----muszą rozbiegać do 0 0 ; w przeciwnym razie dostali­
byśmy tę samą odpowiedź niezależnie od metody grupowania wyrazów.
Ć w iczenia______________________________________
R ozgrzew ka
1 . Co oznacza notacja
o
Y _ qk?
k=4
2 . Uprość wyrażenie x • ([x > 0] — [x < 0]).
3. Zademonstruj zrozumienie notacji Y przez wypisanie wszystkich wyra­
zów sum
Y_ ak
0^ks$5
i
Y_
a k2 •
0 ^k2^ 5
(Uwaga— druga suma jest podchwytliwa.)
4. Wyraź potrójną sumę
y
°-ijk
jako trzykrotne sumowanie (z trzema znakami Y )
a) sumując najpierw względem k, potem względem j, oraz i;
b) sumując najpierw względem i, potem względem j, oraz k.
Wypisz również tę sumę wyraz po wyrazie, bez użycia notacji Y - Za
pomocą nawiasów pokaż, co będzie sumowane i w jakiej kolejności.
5. Jaka jest wartość sumy £ k[1 ^ j ^ k ^ rt], w zależności od j i rt?
6 . Gdzie tkwi błąd w następującym przekształceniu?
7. Niech V f(x) = f(x) —f(x —1). Czemu jest równe V (xm)?
8 . Czemu jest równe 0—, dla danej liczby całkowitej m?
9. Jak powinno wyglądać prawo wykładników dla przyrastających potęg
analogiczne do ( 2 .5 2 )? Zdefiniuj x -n tak, aby to prawo zachodziło także
dla wykładników ujemnych.
10. Wyprowadziliśmy następujący wzór na różnicę iloczynu funkcji:
A(uv) = u A v + E v A u .
Jak to jest możliwe, żeby ten wzór był poprawny, skoro jego lewa strona
jest symetryczna ze względu na u i v, a prawa strona symetryczna nie
jest?
Podstawy
1 1 . Ogólny wzór ( 2 .5 6 ) na sumowanie przez części jest równoważny następu­
jącemu wzorowi:
y
(cik+i —ak)bk = anbn —aobo
O^kcn
-
ak+i(b k+ 1 - b k),
O^kcn
d la n ^ O .
Udowodnij ten wzór wprost opierając się na prawach rozdzielności, łącz­
ności i przemienności.
12. Pokaż, że funkcja p(k) = k + (—1 )kc jest permutacją zbioru wszystkich
liczb całkowitych dla każdej liczby całkowitej c.
13. Znajdź postać zwartą sumy 2Ik=o(—1)kk 2 za pomocą metody repertu­
aru.
14. Oblicz sumę 2Zk=i k2k wyrażając ją jako sumę podwójną ^ i ^ j ^ k<cn 2k.
15. Oblicz sumę
= X!k=i k 3 za pomocą metody 5 w następujący sposób:
Zauważywszy, że
+ D-a =
jk, zastosuj równanie ( 2 .33).
16. Udowodnij, że x—/ [ x — n ) — = x—/ { x — m )—, pod warunkiem, że żaden z
mianowników nie jest zerem.
17. Pokaż, że przy konwersji między potęgami przyrastającymi i ubywają­
cymi dla każdej liczby całkowitej m można stosować następujące wzory:
x m = (—",)m(—x)— = (x + m - i p
= 1/ ( x - 1) ^ ;
0x— = ( - 1)m(-x)™ = ( x - m + i r
= 1/ ( x + l f ^ .
(W odpowiedzi do ćwiczenia 9 jest zdefiniowane x- m .)
18. Niech
oraz 3z będą odpowiednio częścią rzeczywistą i urojoną liczby
rzeczywistej z. Wartość bezwzględną \z\ określamy jako ^ { 9 \z ) 2 + (3z)2.
Suma Y-keK Qk wyrazów zespolonych a k jest zbieżna bezwzględnie, gdy
sumy rzeczywistych wyrazów ^ keK 9^0.^ oraz
^a k są zbieżne bez­
względnie. Pokaż, że suma HkeK Qk jes^ zbieżna bezwzględnie wtedy i
tylko wtedy, gdy istnieje stała B taka, że 2 IkGF la kl ^ B dla wszystkich
skończonych podzbiorów F C K .
Ć w iczen ia dom ow e
19. Korzystając z czynnika sumacyjnego rozwiąż rekurencję
T0 = 5;
02Tn =
u Ttl- i + 3 • n ! ,
dla n > 0.
20. Spróbuj obliczyć sumę £lk=o
za pomocą metody zaburzania, ale tym
razem wyprowadź wzór na X-k=o Hic2 1 . Oblicz za pomocą metody zaburzania sumy Sn = ^ k=0(—1)n-1c, Tn =
^ k=0( - l )TL_kk i Un = ^ £ = 0 (—1)TX~ kk 2 przy założeniu, że rt ^ 0 .
2 2 . Udowodnij tożsamość Lagrange’a (bez pomocy indukcji):
Y_
1^ j < k ^ n
(cijbk —
cikbj
)2 =
( X . a M
(
'k = 1
' k=1
X
.
b k )
'
_
( H
k=1
a k b *
Trudno jest
udowodnić
tożsamość kogoś,
kto nie żyje
od prawie 200 lat.
A tak naprawdę, udowodnij tożsamość dla ogólniejszej sumy podwójnej
^
(ciebie
cif cb j) ( A j B k
A icB j).
1<:j <k^n
23. Oblicz sumę J I k=1 (2k + 1)/k(k + 1) na dwa sposoby:
Notację tę
wprowadził Jacobi
wr. 1829 [192].
a) Wyraź 1/k (k + 1) przez „ułamki proste” 1/k — 1/(k + 1).
b) Zsumuj przez części.
24. Czemu jest równa suma H 0<ck<T1 Hk/(k + 1 )(k+2)? Wskazówka: Uogólnij
wyprowadzenie wzoru ( 2 .57 ).
25. Notacja flkeK ak oznacza iloczyn liczb a k dla wszystkich k G K. Za­
łóżmy dla prostoty, że a k ^ 1 jedynie dla skończenie wielu k. Nie bę­
dziemy więc zmuszeni definiować znaczenia iloczynów nieskończonych.
Jakie prawa analogiczne do praw rozdzielności, łączności i przemienności
zachodzące dla sum spełnia notacja ]^[?
26. Wyraź podwójny iloczyn Eli ^j<ck<cn a)a k za pomocą pojedynczego ilo­
czynu rik = i Qk> stosując przekształcenia notacji
(Ćwiczenie to daje
nam iloczynowy wzór analogiczny do tożsamości górnego trójkąta ( 2 .33 ).)
27. Oblicz A (c-) i wykorzystaj wynik do wyliczenia wartości X k = i (—2)—/k .
28. W którym miejscu poniższe wyprowadzenie zwodzi nas na manowce?
Zadania egzam in acyjn e
29. Oblicz sumę X.k=i (—^)kk /(4k 2 — 1).
30. Jak łatwo sprawdzić, liczba 15 daje się przedstawić na 4 różne sposoby
jako suma kolejnych liczb naturalnych, włączając w to samą liczbę 15
jako jeden z nich (znający karcianą grę cribbage niewątpliwie to wiedzą):
15 = 7 + 8 = 4 + 5 + 6 = 1 + 2 + 3 + 4 + 5 . Znajdź liczbę sposobów, na które
można przedstawić liczbę 1050 jako sumę kolejnych liczb naturalnych.
Ustalmy, tak jak powyżej, że trywialne przedstawienie 1050 jako samej
siebie liczy się za jedno z nich. (Uwaga: znajomość reguł cribbage’a nie
pomaga w rozwiązaniu zadania!)
31. Funkcja zeta Riemanna £(k) jest zdefiniowana jako nieskończona suma
1 1
v— 1
F + 3^ + " ' = E ł k •
)3=i 1
Udowodnij, że~ 1) = 1- Czemu jest równe XLk^i
32. Niech a —b = max(0, a —b). Udowodnij, że
—"0?
Y min(k, x —k) = ^ (x — (2 k + 1 ))
k^O
k^O
dla wszystkich rzeczywistych x ^ 0. Wyraź wartość tej sumy w postaci
zwartej.
Zadania premiowane
33. Niech AkeK
oznacza minimum z liczb a k (albo ich kres górny, gdy K
jest nieskończony). Przyjmijmy, że każde z a k jest albo liczbą rzeczywistą,
albo dboo. Które z praw analogicznych do praw działających dla notacji
i n zachodzą także dla notacji Ą? (Zobacz ćwiczenie 25.)
34. Udowodnij, że jeśli suma 21 keK a k jes^ zgodnie z zasadą ( 2 .5 9 ) nie zdefi­
niowana, to jest bardzo wrażliwa na zmianę kolejności sumowania w na­
stępującym sensie: Jeśli A - i A + są dowolnymi liczbami rzeczywistymi,
to można znaleźć taki ciąg Fi C F2 C F3 c • • • skończonych podzbio­
rów K, że
y
ak ^ A - , gdy n jest nieparzyste;
ak ^ A+ , gdy rt jest parzyste.
kGF^
35. Udowodnij twierdzenie Goldbacha
_ 1
1
1
1
1
1
1
1
_ ^ - 1
“ 3 + 7 + 8 + T5 + 24 + 26 + 3T + 35 + " ' -
kep
lc — 1 ’
gdzie P jest zbiorem „potęg doskonałych” zdefiniowanym rekurencyjnie:
P = { m n I m ) 2, n ^ 2 , m ^ P}.
36. Samoopisujący się ciąg S. Golomba (f (1), f (2), f ( 3 ) , . . . ) jest jedynym nie­
małej ącym ciągiem liczb całkowitych dodatnich spełniających warunek,
Prawa dżungli.
że ciąg ten zawiera dokładnie f(k) wystąpień liczby k dla każdego k.
Chwila namysłu odsłania nam początek ciągu:
n
1
2
3
4
5
6
7
S
9
10
11
12
f(n)
1
2
2
3
3
4
4
4
5
5
5
6
Niech g(rt) będzie największą liczbą całkowitą m taką, że f(m ) = n.
Pokaż, że
a) 9(n) = L £ = , f(k).
b) g(g(n)) = E k = i kfWc) g(g(g(n))) = ±ng(n)(g(n) + 1) - ^
g(k)(g(k) + 1).
Problem badawczy
37. Czy wszystkie prostokąty l / k na l / ( k + 1 ) , dla k
1, mogą pokryć
kwadrat o boku 1? (Przypominamy, że suma ich pól jest równa 1.)
i
i
i
!■
3 Funkcje całkowitoliczbowe
Liczby całkowite są duszą matematyki dyskretnej. Często jesteśmy zmuszeni
przekształcać liczby wymierne lub rzeczywiste na liczby całkowite. Naszym
celem w tym rozdziale będzie zaznajomienie się z tymi przekształceniami,
nauczenie się czegoś o ich godnych uwagi własnościach i osiągnięcie biegłości
w stosowaniu tych przekształceń.
3.1. Funkcje p o d ło g a i sufit
Poznajmy funkcje podłoga (najbliższa z dołu liczba całkowita) i sufit (naj­
bliższa z góry liczba całkowita), które dla wszystkich liczb rzeczywistych x
zdefiniowane są następująco:
|_xj = największa liczba całkowita mniejsza lub równa x ;
|Y| = najmniejsza liczba całkowita większa lub równa x .
(3 .i)
Notację-tę, jak również nazwy „podłoga” i „sufit,” wprowadził na początku
lat sześćdziesiątych Kenneth E. Iverson [191, s. 1 2 ]. Zauważył, że zecerzy
mogą uzyskać te symbole przez obcięcie górnych lub dolnych części nawia­
sów ‘ [’ i ‘] ’. Jego notacja stała się wkrótce powszechnie używana, tak że
nawiasów podłogi i sufitu używa się w artykułach bez wyjaśniania ich zna­
czenia. Do niedawna oznaczało się największą liczbę całkowitą nie przekra­
czającą x przez *[x]\ Niestety nie było dobrego odpowiednika dla funkcji
sufit. Niektórzy autorzy próbowali stosować ‘]x[*— bez powodzenia, co było
do przewidzenia.
Nie tylko oznaczano różnorodnie te funkcje, lecz także różnie je definio­
wano. Na przykład w niektórych kalkulatorach kieszonkowych znajdziemy
funkcję INT zdefiniowaną dla x dodatnich jako |x_|, a. dla x ujemnych jako
\x\. Projektanci tych kalkulatorów prawdopodobnie chcieli, by ich funkcja
miała własność INT(—x) = —INT(x). My pozostaniemy wierni naszym funk­
cjom podłoga i sufit, zwłaszcza że mają one ładniejsze własności niż funkcja
INT.
)Au!(
Dobrą metodą zaznajomienia się z funkcjami podłoga i sufit jest sporzą­
dzenie ich. wykresów. Tworzą one wzorce podobne do schodów, leżące powyżej
i poniżej prostej f (x) = x:
Z wykresu widzimy, że na przykład dla e = 2, 71828.. .
[ej = 2 ,
L -e J ----- 3 ,
rei = 3 , [—e| = —2 .
Przyglądając się temu wykresowi możemy zaobserwować kilka faktów o funk­
cjach podłoga i sufit. Na przykład wykres funkcji podłoga leży poniżej prostej
f (x) = x, zatem [x\ ^ x. Z podobnej przyczyny zachodzi nierówność [x] ^ x.
(Wynika to też bezpośrednio z definicji.) Obie funkcje są sobie równe dokład­
nie w punktach całkowitych:’
|_xj = x
<ś=>
x jest liczbą całkowitą
<=>
[x*| = x .
(Używamy notacji ‘<ś=>’ w znaczeniu „wtedy i tylko wtedy, gdy”). Co więcej,
gdy te funkcje się różnią, wówczas wartość funkcji sufit jest dokładnie o
1 większa niż podłogi:
|Y| — [xj = [x nie jest liczbą całkowitą].
( 3 .2 )
Jeśli przekątną układu współrzędnych przesuniemy o jedną jednostkę w dół,
to znajdzie się ona poniżej wykresu funkcji podłoga, stąd x — 1 < [x j. Z
podobnego powodu zachodzi nierówność x + 1 > |Y |. Łącząc te obserwacje
otrzymujemy nierówności:
( 3 -3 )
Funkcje podłogi i sufitu są ponadto wzajemnie symetryczne względem środka
układu współrzędnych:
L-*J = - M ;
r-*l = -W ■
(3 4 )
Stąd każda z nich może być wyrażona za pomocą drugiej funkcji. Fakt ten
może wyjaśniać, czemu w przeszłości funkcja sufit nie miała swojej własnej
notacji. Funkcję sufit napotykamy jednak dostatecznie często, by usprawiedli­
wiło to stworzenie dla niej szczególnego oznaczenia, podobnie jak zrobiliśmy
to dla potęg przyrastających i ubywających. Matematycy od dawna znają i
stosują takie pary funkcji jak sinus i cosinus, tangens i cotangens, secans i cosecans, maximum i minimum. Od teraz będziemy mieli parę funkcji podłoga
i sufit.
Ponieważ chcemy dowodzić własności funkcji podłoga i sufit, a nie tylko
obserwować ich wygląd graficzny, bardzo przydadzą się nam cztery następu­
jące reguły:
|_xj = rt
<ś=>
n ^ x < rt + 1 ,
(a)
x-
(b)
4=*
rt — 1 < x ^ r t,
(c)i3 ‘5j
x ^ n < x+ 1.
(d)
|xj = n
[x] = rt
Wkrótce pojawią się
ściany.
|Y| = n
1 < n ^ x ,
(We wszystkich przypadkach zakładamy, że n jest liczbą całkowitą, x zaś jest
liczbą rzeczywistą.) Reguły (a) i (c) wynikają bezpośrednio z definicji (3 . 1 ).
Reguły (b) i (d) otrzymamy z reguł (a) i (c) po przestawieniu nierówności
tak, by n znalazło się w środku.
Składnik będący liczbą całkowitą możemy przesunąć do nawiasów pod­
łogi (lub sufitu) lub na zewnątrz:
[x + nj = |_xj
n,
gdy rt jest liczbą całkowitą.
( 3 .6 )
(Wiemy przecież z reguły (3 -5 (a)), że ta równość jest równoważna nierówno­
ściom [x\ + rt ^ x + n < |_xj + n + 1.) Niestety dla mnożenia nie możemy
wykonać podobnych operacji. Na przykład dla n = 2 i x = 1/2 otrzymamy
[nxj / n|_xj. Oznacza to, że nawiasy podłogi i sufitu nie mają tak dobrych
właściwości jak zwykłe nawiasy. Jeśli wystąpią one we wzorach, zwykle bę­
dziemy szczęśliwi, gdy uda się nam albo je usunąć, albo cokolwiek udowodnić.
Okazuje się, że istnieje wiele sytuacji, gdy nawiasy podłogi i sufitu są
zbędne. Możemy je zatem wstawiać lub usuwać wedle uznania. Na przy­
kład dowolna nierówność pomiędzy liczbą rzeczywistą a całkowitą jest równo-
W
3« Funkcje całk ow itoliczb ow e
90;
ważna nierówności pomiędzy liczbami całkowitymi:
x < n
4=^
TL < X
x ^ rt
TL ^ X
< u ,
(a)
n < W .
M ^ n,
(b)
|x j
. n
L*J •
(c)
( 3 .7 )
(d)
Reguły te są łatwe do udowodnienia. Na przykład, ze względu na to iż za­
chodzi |xj ^ x wiemy, że jeśli x < n, to |_xj < n. Na odwrót, jeśli |xj < n,
to zachodzi x < n, ponieważ x < |_xj + 1 i [xj + 1 ^ n.
Byłoby wspaniale, gdyby reguły (3 .7 ) byłyby równie łatwe do zapamięta­
nia jak są łatwe do udowodnienia. Każda z nierówności bez nawiasów podłogi
i sufitu odpowiada pewnej nierówności z tymi nawiasami, ale musimy się dwa
razy zastanowić, zanim zdecydujemy, którego z nawiasów należy użyć.
Różnicę pomiędzy x i [ x j nazywamy częścią ułamkową x . Pojawia
się ona w zastosowaniach dostatecznie często, by zasłużyła na swą własną
notację:
Hmmm. Lepiej nie
używać {x} dla
oznaczenia części
ułamkowej, gdy
może być ono
pomylone
ze zbiorem
jednoelementowym
zawierającym x.
M =
W-
(3 .8 )
Ponieważ x = [xj + {x}, więc [xj nazywamy też częścią całkowitą x. Jeśli
liczbę rzeczywistą zapiszemy w postaci x = n + 0 , gdzie rt jest liczbą całkowitą
i 0 ^ 0 < 1 , to z reguły ( 3 -5 (a)) wnioskujemy, że rt = |_xj i 0 = {x}.
Gdy rt jest dowolną liczbą rzeczywistą, równość (3 .6 ) nie jest prawdziwa.
Dla |x + y j zachodzą jednak tylko dwa przypadki. Jeśli zapiszemy x = |x J + M
i V = [v\ + {y}, wtedy otrzymamy | x + y j = |_XJ + lv\ + I M + M J- Ponieważ
0 ^ {x} + {y} < 2 , to [x + y \ równa się albo [xj + [y\ , albo |xj + [y\ + 1 .
3.2. U życie funkcji p o d ło g a i sufit
Mamy już podstawowe narzędzia do posługiwania się funkcjami podłoga i su­
fit. Użyjmy ich zaczynając od nietrudnego zadania: Czemu równa się fig 35]?
(Zgodnie z sugestią Edwarda M. Reingolda logarytm o podstawie 2 ozna­
czamy przez „Ig”.) Cóż, ponieważ 2 5 < 35 ^ 26, więc logarytmując obie
strony nierówności otrzymamy 5 < lg 35 ^ 6 . Zatem z reguły ( 3 -5 (c)) wy­
nika, że [lg 35] = 6 .
Zauważmy, że liczba 35 w zapisie dwójkowym ma długość 6 bitów: 35 =
( 1 0 0 0 1 1 )2 . Czy zawsze jest prawdą, że długość liczby n zapisanej dwójkowo
równa się [lgn ]? Nie zawsze. Liczbę 32 = ( 1 0 0 0 0 0 ) 2 zapisujemy również za
pomocą 6 bitów. Stąd [lgrt] nie jest właściwą odpowiedzią na nasze pytanie.
(Odpowiedź jest błędna, co prawda, tylko dla n będących potęgami 2, ale ten
błąd popełniamy nieskończenie wiele razy.) Prawidłową odpowiedź możemy
znaleźć uświadamiając sobie, że za pomocą m bitów możemy zapisać każdą
liczbę rt taką, że 2 m _ 1 ^ n < 2m. Stąd z reguły (3 -5 (a)) wynika, że m — 1 =
[lgrij. Zatem m = Lig txJ + 1. Tak jest! Dla wszystkich n > 0 potrzebujemy
[lgnj +1 bitów by zapisać n w systemie dwójkowym. Podobne rozumowanie
doprowadzi nas do odpowiedzi |’lg(n + 1)]. Jeśli przyjmiemy, że liczba zero
zapisana dwójkowo zajmuje zero bitów, to wzór ten jest również prawdziwy
dla rt = 0 .
Rozważmy kolejne wyrażenie z nawiasami podłogi i sufitu. Czemu równa
się [L*J1? Proste— ponieważ [x \ jest liczbą całkowitą, więc |~[xj~| równa się
właśnie [xj. Tyle też równa się dowolne wyrażenie składające się z dowolnej
liczby nawiasów podłogi i sufitu otaczających |_xj.
Teraz trudniejsze zadanie. Czy prawdziwe jest stwierdzenie:
U /W J = IV*J >
rzeczywiste x ^ 0 .
( 3 .9 )
Równość zachodzi wtedy, gdy x jest liczbą całkowitą, ponieważ w tym przy­
padku x = |xj. Równość zachodzi również w kilku szczególnych przypadkach, jak n = 3, 14 1 5 9 . . . , e = 2, 71828.. . i <t> = (1 + V 5 )/2 = 1, 61803. . . ,
gdyż otrzymamy 1 = 1 . Niepowodzenie w znalezieniu kontrprzykładu suge­
ruje, że równość zawsze zachodzi. Spróbujmy zatem ją udowodnić.
Nawiasem mówiąc, gdy napotykamy pytanie „czy prawdą jest, że,” z
dwóch powodów lepiej zrobimy próbując najpierw znaleźć kontrprzykład.
Obalenie dowodu jest potencjalnie łatwiejsze (potrzebujemy tylko kontrprzy­
kładu), a szukanie dziury w całym działa inspirująco. Nawet jeśli stwierdzenie
jest prawdziwe, nasze poszukiwania kontrprzykładu często doprowadzają nas
do dowodu, gdy tylko zauważymy, czemu znalezienie kontrprzykładu sprawia
nam trudność. Poza tym, dobrze jest być sceptycznym.
Jeśli spróbujemy udowodnić równość [ \ / |_xj J = |_\/xj poznanymi w szkole
metodami rachunku różniczkowego, możemy zacząć od przedstawienia x jako
sumy części całkowitej i ułamkowej liczby x: [xj + {x} = rt + 0 i rozpisa­
nia pierwiastka kwadratowego za pomocą wzoru dwumianowego Newtona:
(n + 0 ) 1//2 = n 1 /2 + n - 1//2 0 /2 —n - 3 //2 02/8 H-----. To podejście sprawi nam
nielichy kłopot.
Lepiej jest użyć metod właśnie przez nas odkrytych. Oto możliwy plan
postępowania: pozbądźmy się jakoś zewnętrznych nawiasów i pierwiastka
kwadratowego z wyrażenia |_vT*T] • Następnie usuńmy wewnętrzne nawiasy.
Dodajmy z powrotem pierwiastek i nawiasy zewnętrzne, by otrzymać [y /x \.
Dobrze. Niech m = LVTaTJ • Z reguły ( 3 -5 (a)) wynika, że m ^ vT*T < nH -l •
Usunęliśmy właśnie zewnętrzne nawiasy nie tracąc przy tym jakiejkolwiek
informacji. Ponieważ wszystkie trzy wyrażenia są nieujemne, więc po pod­
niesieniu do kwadratu otrzymamy nierówności m 2 ^ |xj < ( m + 1 ) 2. Po­
zbyliśmy się pierwiastka kwadratowego. By usunąć nawias podłogi stosu­
(Z pewnością n , e
i ej) są pierwszymi
liczbami
rzeczywistymi,
które musimy
wypróbować,
nieprawdaż?)
Sceptycyzm jest
dobry tylko
w ograniczonym
zakresie. Bycie
sceptycznym
względem dowodów
i programów
(zwłaszcza swoich)
pozwoli
prawdopodobnie
zachować pracę
i dobrą markę.
Duża dawka
sceptycyzmu
zmienia człowieka
w pracusia, który
kosztem
odpoczynku spędza
czas w pracy.
Zbyt wiele
sceptycyzmu
doprowadza
do paraliżu,
gdyż wiecznie
zamartwiając się
o poprawność nigdy
nic nie skończysz.
Sceptyk
[3. Funkcje całkow itoliczbow c
jemy regułę ( 3 .7 ( 01)) dla lewej nierówności, a regułę (3 -7 (a)) dla prawej:
m2
x < ( m + 1 ) 2. Odtwórzmy teraz nasze kroki. Najpierw pierwiastku­
jemy, otrzymując m ^ y/x < m + 1 , a potem stosujemy regułę(3 -5 (a)), by
uzyskać m = |_a/xJ . Stąd |_\/LXJ] = v n = |_a/xJ . Stwierdzenie jest prawdziwe.
Podobnie możemy dowieść, że
[a /M 1 — IV* 1 >
dla liczb rzeczywistych x ^ 0 .
Znaleziony dowód nie zależy istotnie od własności pierwiastka kwadra­
towego. Gdy przyjrzymy się bliżej dowodowi, zauważymy, że możemy go
uogólnić. Niech f (x) będzie dowolną rosnącą, ciągłą funkcją, o własności
f(x) = liczba całkowita
=£>
x = liczba całkowita.
(Symbol ‘= > ’ oznacza „jeśli . . . to”.) Stąd otrzymujemy
(Zauważył to R. J.
McEliece.)
LfMj = i f ( W ) j
1
r f w i = rf(M)i>
( 3 -1 0 )
wszędzie gdzie f (x), f ( [xj) i f ( |Y |) są zdefiniowane. Udowodnijmy tę ogólną
własność tym razem dla nawiasów sufitu, ponieważ poprzedni dowód doty­
czył nawiasów podłogi i ponieważ dowód dla tych nawiasów jest prawie taki
sam. Jeśli x = [x], to nie mamy nic do dowodzenia. W przeciwnym razie,
ponieważ f jest funkcją rosnącą, zachodzi x < |Y| i f(x) < f(|Y |). Ponieważ
funkcja |”| jest niemalejąca, stąd [f(x)"| ^ [f([x])]. Jeśli ff (x)~| < ff( f7c"| )"|, to
ponieważ f jest ciągła, istnieje liczba y, taka że x y < M i f (y) = rfWlZ powodu szczególnej własności funkcji f, liczba y jest liczbą całkowitą. Nie
istnieje jednak liczba całkowita leżąca pomiędzy x i [x \. Z tej sprzeczności
wynika, że ff(x)] = [f( 1* 1 )1 Zwróćmy uwagę na pewien ważny przypadek tego twierdzenia:
x + m.
n
|_xj + m
n
"x + m"
rt
' M + m~
n
(3 -n )
gdzie m i n są liczbami całkowitymi, a mianownik n jest liczbą dodatnią.
Niech na przykład m = 0 i n = 10. Wtedy |_[|_x/10j/10j/10j = [x/1000j.
Trzykrotne dzielenie przez 10 i pozbywanie się cyfr jest tym samym co po­
dzielenie przez 1 0 0 0 i odrzucenie reszty z dzielenia.
Czy prawdą jest, że:
I7 W 1 = IV * 1 ,
gdzie x ^ 0 jest liczbą rzeczywistą?
Równość jest prawdziwa dla x = n i x = e, ale niestety nie dla x = ({>. Stąd
wiemy, że nie jest prawdziwa w ogólności.
Zanim pójdziemy dalej, zróbmy krótką dygresję na temat różnych rodza­
jów zadań, które to zadania mogą pojawiać się w książkach matematycznych.
R od zaj 1 . Mając dany obiekt x i własność P(x), udow odnij, że P(x) jest
prawdziwa. Na przykład, „Udowodnij, że [7tJ = 3.” Tutaj zadanie wymaga
znalezienia dowodu pewnego sensownego faktu.
R od zaj 2 . Mając dany zbiór X i własność P(x) udowodnij, że P(x) jest praw­
dziwa dla wszystkich x G X. Na przykład, „Udowodnij, że dla wszystkich
liczb rzeczywitych x zachodzi |_*J ^ x.” Znowu, zadanie wymaga znalezie­
nia dowodu, ale dowód musi być tym razem ogólny. To czego tym razem
potrzebujemy jest algebrą, a nie arytmetyką.
R od zaj 3. Mając dany zbiór X i daną własność P(x) udowodnij lub za ­
przecz zdaniu: ,,P(x) jest prawdziwa dla wszystkich x G X”. Na przykład:
„Czy prawdą jest, że dla wszystkich liczb rzeczywistych x ^ 0 zachodzi
W LXJ1 = \ y f r V Mamy tu dodatkowy poziom niepewności — nie znamy
z góry odpowiedzi. Jest to bliższe prawdziwej sytuacji, z którą matematycy
stale się spotykają— stwierdzenia, które znajdziemy w książkach są zwykle
prawdziwe, lecz na najnowsze z nich powinniśmy patrzeć podejrzliwie. Jeśli
stwierdzenie jest fałszywe, musimy znaleźć kontrprzykład. Jeśli stwierdzenie
jest prawdziwe, musimy znaleźć dowód, tak jak w zadaniu rodzaju 2 .
R o d zaj 4. Mając dany zbiór X i własność P(x) znajdź warunek konieczny
i dostateczny Q(x) taki, że własność P(x) jest prawdziwa. Na przykład:
„znajdź warunek konieczny i dostateczny, taki że |xj ^ [ x ] P r o b l e m e m
jest znalezienie Q takiego, że P(x)
Q(x). Oczywiście, zawsze ist­
nieje trywialna odpowiedź — możemy wziąć Q(x) = P(x), ale chcemy zna­
leźć możliwie jak najprostszy warunek. Znalezienie prostego i prawdziwego
warunku wymaga trochę twórczej pracy. (Na przykład, w tym przypadku,
,,[xj ^ |Y| <ś=> x jest liczbą całkowitą.”) Dodatkowy wysiłek sprawia,
że ten rodzaj problemów jest trudniejszy, ale też bardziej przypomina to, z
czym matematycy spotykają się w „prawdziwym świecie”. Ostatecznie trzeba
udowodnić, że P(x) jest prawdziwe wtedy i tylko wtedy, gdy Q(x) jest praw­
dziwe.
R o d za j 5. Mając dany zbiór X, znajdź interesującą w łasność P(x) jego ele­
mentów. Teraz znajdujemy się w przeraźliwej krainie czystej nauki gdzie, jak
mogą myśleć studenci, panuje totalny chaos. To jest prawdziwa matematyka.
Autorzy książek rzadko ośmielają się zadawać pytanie piątego rodzaju.
Koniec dygresji. Przekształćmy pytanie, które padło przy omawianiu za­
dań rodzaju 3, na pytanie rodzaju 4. Jaki jest konieczny i dostateczny wa­
runek na to, by |V |x J 1 = IV* 1? Zauważyliśmy, że równość zachodzi dla
x = 3,142, ale nie dla x = 1,618. Dalsze eksperymenty pokażą, że równość
jest fałszywa także dla x pomiędzy 9 i 10. Aha, Tak! Widzimy, że równość
nie zachodzi, gdy tylko m 2 < x < m 2 + 1 , ponieważ z lewej strony równości
W innych moich
tekstach pytanie
„czy prawdą jest,
że” oznacza to samo
co „udowodnij”
w około 99,44%
przypadków.
Nie jest to prawdą
w tej książce.
Ałe nie prostszy.
A. Einstein
3. Funkcje całk ow itoliczb ow e
(Lub, przez
pesymistów—
jednostronnie
domkniętymi.)
mamy m, a z prawej m + 1. W innych przypadkach, gdzie ^/x jest określony,
mianowicie gdy x = 0 lub m 2 + 1 ^ x
( m + 1 )2, otrzymujemy równość.
Dlatego następujące zdanie jest koniecznym i dostatecznym warunkiem rów­
ności: Albo x jest liczbą całkowitą, albo ^/\x\ nią nie jest.
Dla potrzeb naszego następnego zadania rozważmy wygodną notację,
zasugerowaną przez C.A.R. Hoare’a i Lyle’a Ramshawa, dla przedziałów
prostej rzeczywistej: [oc.. |3] oznacza zbiór liczb rzeczywistych x takich, że
oc ^ x ^ |3. Zbiór ten jest zwany przedziałem d om kniętym , ponieważ za­
wiera oba końce oc i |3. Przedział nie zawierający żadnego z końców, ozna­
czany przez {oc.. |3), składa się ze wszystkich x takich, że oc < x < (3. Jest on
nazywany przedziałem otwartym. Podobnie definiujemy przedziały [oc.. |3)
i (a..|3] zawierające jeden ze swoich końców i nazywamy je przedziałami
jednostronnie otwartymi.
Jak dużo liczb całkowitych jest zawartych w tych przedziałach? Prze­
działy jednostronnie otwarte są łatwiejsze, więc zacznijmy od nich. Faktycz­
nie, przedziały jednostronnie otwarte są prawie zawsze przyjemniejsze od
przedziałów domkniętych lub otwartych. Na przykład, są one addytywne —
możemy połączyć jednostronnie otwarte przedziały [a. . (3 ) i [|3 . . y ) w je­
den jednostronnie otwarty przedział [oc..y). Nie możemy tego zrobić ani z
przedziałami otwartymi, ponieważ pominiemy punkt (3, ani z przedziałami
domkniętymi, ponieważ punkt |3 policzymy dwukrotnie.
Wróćmy do zadania. Odpowiedź jest prosta, gdy oc i |3 są liczbami całko­
witymi. Wtedy jeśli założymy, że oc ^ |3, to przedział [oc. . |3) zawiera |3 — oc
liczb całkowitych a, oc + 1, . . . , |3 — 1. Przy tym samym założeniu przedział
{oc.. |3] zawiera również |3 — a liczb całkowitych. Nasze zadanie jest jednak
trudniejsze, gdyż oc i |3 mogą być dowolnymi liczbami rzeczywistymi. Mimo
to, możemy przekształcić ten problem do łatwiejszego, ponieważ zgodnie z
regułami (3 .7 )
[al
m ,
La J
LPJ,
gdzie rt jest liczbą całkowitą. Przedziały po prawej stronie kończą się w punk­
tach całkowitych i zawierają dokładnie tyle samo liczb całkowitych, co prze­
działy po lewej stronie kończące się w punktach rzeczywistych. Stąd przedział
[<x..| 3 ) zawiera dokładnie [|3] — [cc] liczb całkowitych, a przedział (a. .| 3]
zawiera ich L|3J — L<xJ. W tym przypadku zamiast wyrzucać— wprowadzamy
nawiasy podłogi i sufitu.
Przy okazji, istnieje prosty sposób zapamiętania, w którym przypadku
użyć nawiasów podłogi, a w którym nawiasów sufitu. Przedziały jednostron­
nie otwarte, które zawierają lewy koniec, ale nie prawy (takie, że 0 ^ 0 < 1 )
są troszkę częściej spotykane od tych, które zawierają prawy koniec, ale nie
zawierają lewego. Podobnie nawiasy podłogi są częściej spotykane niż na­
wiasy sufitu. Stąd, zgodnie z prawem Murphy’ego, właściwą zasadą będzie
odwrotność tego, czego się spodziewaliśmy— nawias sufitu dla [o c . . |3 ) i pod­
łogi dla ( a . . |3].
Podobnie rozumując możemy pokazać, że domknięte przedziały [oc.. |3]
zawierają dokładnie [|3J — \oć\ + 1 liczb całkowitych, a otwarte przedziały
[oc.. |3) dokładnie f(3~| — [aj — 1. Do ostatniej formuły dodamy jednak zało­
żenie oc ^ |3, by nie kłopotać się stwierdzeniem, że pusty przedział [oc.. a )
zawiera w sumie —1 liczb całkowitych. Podsumowując, wywnioskowaliśmy
następujące fakty:
przedział
liczba liczb całkowitych
ograniczenia
[ a . . p]
LPJ - W + 1
oc^ (3
[a ..|3 )
m - w
oc^ |3
(a ..|3 ]
LPJ - L«J
oc^ 13
( a .. |3 )
TPl-W -1
oc < |3
Następnego zadania nie możemy pominąć. Klub Konkretnej Matmy po­
siada kasyno (dostępne tylko dla nabywców tej książki), w którym znajduje
się ruletka z kołem o liczbach ponumerowanych od 1 do 100Ó. Jeżeli wylo­
sowana liczba rt będzie podzielna przez część całkowitą swego pierwiastka
sześciennego, to znaczy gdy
[v/nj \ n ,
wówczas wygrywamy i kasyno płaci nam 5 dolarów, w przeciwnym razie prze­
grywamy i płacimy kasynu dolara. (Notacja a \b , którą czytamy „a dzieli b,”
oznacza, że b jest wielokrotnością a. W rozdziale 4 zajmiemy się dokładnie
tą relacją.) Czy możemy się wzbogacić grając w te grę?
Możemy wyliczyć średnią wygraną— to znaczy, ilość pieniędzy, jaką wy­
gramy (lub stracimy) przeciętnie w jednej grze — licząc wpierw liczbę W liczb
wygrywających i liczbę P = 1000 —W liczb przegrywających. Jeżeli każdą
liczbę wylosujemy jednokrotnie w ciągu 1 0 0 0 gier, to wygramy 5W dolarów
i przegramy P dolarów. Stąd średnia wygrana wynosi
5W -P
1000
_ 5 W — (1000 —W) _ 6 W - 1 0 0 0
”
1Ó0 Ó
"
1Ó0 0
’
Jeśli zatem liczb wygrywających jest 167 lub więcej, to zarobimy, w przeciw­
nym razie zarobi kasyno.
Jak możemy policzyć liczbę wygrywających liczb pomiędzy 1 i 1000?
Nie jest trudno zauważyć pewną regularność. Liczby od 1 do 2 3 — 1 = 7 są
wygrywające, gdyż dla każdej z nich zachodzi [y/n \ = 1. Pomiędzy liczbami
(Przeprowadzone
na zajęciach
głosowanie
wykazało,
że 28 studentów
nie grałoby,
13 wzięłoby udział
w grze, reszta nie
była zdecydowana.)
(Zaciekawiliśmy ich
Klubem Konkretnej
Matmy.)
2 3 = 8 i 3 3 — 1 = 26 tylko liczby parzyste wygrywają. Pomiędzy 3 3 = 27 i
4 3 — 1 = 63 wygrywają tylko liczby podzielne przez 3 itd.
Szukaną liczbę W otrzymamy, gdy użyjemy techniki sumowania z roz­
działu 2 i skorzystamy z zalet konwencji Iversona przyporządkowującej zda­
niom logicznym wartości 0 lub 1 :
1000
W = ^
[n jest liczbą wygrywającą]
n=1
[Lv^J\n] = Y [k=[^/nJl[k\n][1 ^rt^lOOO]
=
l^n^lOOO
=
k,n
[k3 ^ rt < (k + 1)3] [n = km] [1 ^ rt
1000]
k,m ,n
= H - ^ [ k 3 ^ k m < ( k + 1}3][1 ^k<10]
k,m
= 1 + 2 1 [ m e [k2 . . ( k + 1 ) 3/k)][1 ^k<10]
k,m
= 1+^2
(T^2 + 3k + 3 + 1/k] — fk2l)
1^k<10
= 1+21
(3k + 4) = 1 + ^ y ^ - 9 = 172.
Kk<10
Prawda!
Zaraz, zaraz, gdzie
jest to kasyno?
Powyższe wyprowadzenie zasługuje na dokładne przestudiowanie. Zauważmy,
że wiersz 6 wykorzystuje nasz wzór ( 3 . 1 2 ) na liczbę liczb całkowitych w prze­
dziale jednostronnie domkniętym. Jedynym „trudnym” manewrem jest de­
cyzja podjęta pomiędzy wierszami 3 i 4 by traktować rt = 1000 jako szcze­
gólny przypadek. (Nierówność k 3 ^ rt < ( k + 1 ) 3 nie współgra z nierównością
1 ^ rt ^ 1000 dla k = 10.) Ogólnie, graniczne warunki okazują się najbardziej
krytyczną częścią ^-przekształceń.
W ostatnim wierszu napisaliśmy, że W = 172. Zatem nasz wzór na średnią
wygraną redukuje się do (6-172— 1000)/1000 dolarów, czyli 3 ,2 centów. Po
zrobieniu 100 zakładów, każdy po dolarze, spodziewamy się być bogatsi o 3,20
dolarów. (Oczywiście, jeżeli kasyno nie uczyni pewnych liczb „równiejszymi”
od innych.)
Zadanie o kasynie, które właśnie rozwiązaliśmy, jest ubarwioną wersją
bardziej przyziemnego pytania: „Jak wiele liczb całkowitych rt, gdzie 1 ^
rt ^ 1000, spełnia relację [y/n\ \ n?” Matematycznie oba pytania są tym
samym, ale czasami dobrym pomysłem jest ubarwić zadanie. Mamy do dys­
pozycji bogatsze słownictwo (jak „wygrywający” i „przegrywający”), które
pomaga nam w zrozumieniu istoty zadania.
Uogólnijmy zadanie. Załóżmy, że zamieniamy 1000 na 1000000, lub nawet
na większą liczbę N. (Zakładamy, że kasyno ma znajomości i może załatwić
większe koło.) Ile jest wygrywających liczb? Stosujemy to samo rozumowanie,
ale musimy być bardziej ostrożni postępując z największą wartością k, którą
dla wygody oznaczymy przez K:
K = L^NJ •
(Poprzednio K wynosiło 10.) Całkowita liczba wygrywających liczb dla ogól­
nego N jest
w =
Y_ (3Tc + 4) + ]T [K3 ;gKm^N]
1^k<K
m
= i ( 7 + 3K + 1)(K-1) + L [ m e [K2 ..N/K]]
m
= §K2 + |K —4 + 2 2 [ m e [ K 2 ..N/K]] .
Wiemy, że suma z ostatniego wiersza równa się [N/KJ — [K2] + 1 = |_N/KJ
K2 + 1. Zatem wzór
W = [N/Kj + ^K2 + | K - 3 ,
K = [\/NJ
(3-13)
daje ogólną odpowiedź dla koła z N liczbami.
Pierwsze dwa składniki tego wzoru równają się w przybliżeniu N 2//3 +
I N 2/ 3 = § N 2/3. Dla dużych N pozostałe składniki w porównaniu z pierw­
szymi są znacznie mniejsze. W rozdziale 9 nauczymy się, jak wyprowadzać
wyrażenia podobne do
W = f N 2/ 3 + 0 ( N 1/ 3 ) )
gdzie O f N 1/ 3) oznacza wielkość nie większą niż N 1/ 3 razy pewna stała. Ja­
kakolwiek by ta stała była, wiemy, że jest ona niezależna od N. Stąd dla du­
żych N udział O-składnika w W będzie bardzo mały w porównaniu z | N 2^3.
Następująca tablica pokazuje na przykład, o ile różni się W od | N 2/ 3:
N
| N 2/3
W
% błędu
1000
150,0
696,2
3231,7
15000,0
69623,8
323165,2
1500000,0
172
746
3343
15247
70158
324322
1502497
12,791
6,670
3,331
1,620
0,761
0,357
0,166
10000
100000
1000000
10000000
100000000
1000000000
Jest to bardzo dobre przybliżenie.
■W ttC Y ' ff ~
Przybliżone wzory są pożyteczne, ponieważ są prostsze niż wzory z na­
wiasami podłogi i sufitu. Dokładne wyniki jednakże są często również ważne,
zwłaszcza dla mniejszych wartości N pojawiających się w zastosowaniach
praktycznych. Na przykład właściciel kasyna może fałszywie założyć, że dla
N = 1000 jest tylko | N 2//3 = 150 liczb wygrywających (w którym to przy­
padku kasyno wygrywałoby 10 centów).
W ostatnim problemie poruszanym w tej części zbadajmy tak zwane
widma (spectrum). Definiujemy widmo liczby rzeczywistej a jako nieskoń­
czony zbiór liczb całkowitych z powtórzeniami,
Spec (a) = {[aj, [2aJ, |3aJ, . . . } .
„Jeżeli x jest liczbą
niewymierną
mniejszą od
jedności, to dla
danych dwóch
kolejnych liczb
całkowitych
znajdziemy między
nimi dokładnie
jeden wyraz jednego
z ciągów m /x,
m/(l —x), gdzie
m jest liczbą
całkowitą.”
Rayleigh [305]
Racja! Ponieważ
musi wzrosnąć
dokładnie jeden
z liczników, gdy n
powiększy się o 1 .
(Zbiór z powtórzeniami jest podobny do zbioru, z tym że może on zawierać
powtarzające się elementy.) Na przykład, widmo liczby 1/2 rozpoczyna się
od liczb {0 , 1, 1 , 2 , 2 , 3 , 3 , . . . } .
Łatwo udowodnimy, że widma są wzajemnie różne— to znaczy, że jeśli
oc 7^ |3, to Spec (a) ^ Spec(|3). Bez straty ogólności możemy założyć, że
oc < |3. Istnieje wtedy dodatnia liczba całkowita m taka, że m((3 — oc) ^ 1.
(Faktycznie, może to być dowolna liczba m ^ [1/(13 — cc)], ale nie musimy
się cały czas popisywać naszą wiedzą o funkcjach podłoga i sufit.) Zatem
m|3 —moc ^ 1 i [m|3J > [m aj. Stąd Spec(|3) ma mniej niż m elementów nie
większych niż [m aj, podczas gdy Spec(a) ma ich co najmniej m.
Widma mają dużo pięknych własności. Rozważmy na przykład dwa zbio­
ry z powtórzeniami
Spec(V2) = { 1, 2, 4, 5, 7, 8, 9, 11, 12, 14, 15, 16, 18, 19, 21, 22, 24, . . . } ,
Spec(2 + V 2) = { 3, 6, 10, 13, 17, 20, 23, 27, 30,34, 37,40, 44,47, 51,. .. }.
Łatwo wyliczymy Spec(\/2) za pomocą kieszonkowego kalkulatora. Wtedy
z równości ( 3 .6 ) wynika, że ri-ty element zbioru z powtórzeniami Spec(2 +
y / l ) jest dokładnie o 2rt większy niż ri-ty element zbioru z powtórzeniami
Spec(\/2). Gdy przyjrzymy się dokładnie obu zbiorom z powtórzeniami,
wówczas spostrzeżemy, że są one również związane w jeszcze bardziej za­
dziwiający sposób— wydaje się, że brakujące liczby z jednego widma znaj­
dziemy w drugim i żadna liczba nie występuje równocześnie w obu wid­
mach! Jest to prawda. Zbiór dodatnich liczb całkowitych jest rozłączną sumą
Spec(\/2) i Spec(2 + y / l ) . W takim przypadku mówimy, że widma tworzą
podział zbioru dodatnich liczb całkowitych.
Aby udowodnić to twierdzenie, musimy policzyć, ile elementów zbiorów
S p ec(\/2 ) i Spec(2 + \ / l ) jest nie większych niż rt. Jeśli dla każdego rt suma
będzie równa rt, to te dwa widma rzeczywiście są podziałem zbioru dodatnich
liczb całkowitych.
3.2. Użycie funkcji podłoga i sufit
Niech oc będzie liczbą dodatnią. Liczba elementów Spec(a) nie większych
niż n wynosi
Y [ LkocJ ^ n 1
k>0
N (c x ,n ) =
=
<TL + 1]
k>0
= ^ [ k a < n + 1]
k>0
Y
k
=
(rt + 1 ) / cx]
= r(n+n/cci - i .
( 3 *1 4 )
Wyprowadzenie to ma dwa interesujące miejsca. Po pierwsze, używa reguły
m < rt+ 1 ,
m i n liczby całkowite
( 3 *1 5 )
by zmienić
na '< ’. Stąd można usunąć dzięki regule ( 3 .7 ) nawias podłogi.
Po drugie — i jest to bardziej subtelne — zakresem sumowania jest k > 0
zamiast k ^ 1 , ponieważ dla pewnych n i oc iloraz (n + l ) / a może być
mniejszy niż 1. Jeśli zamiast wyznaczyć liczbę liczb całkowitych w przedziale
(0 . . ( n + 1 )/oc), spróbowalibyśmy zastosować wzory ( 3 . 1 2 ), by wyznaczyć
liczbę liczb całkowitych w przedziale [1 .. (n + 1 )/a ), to otrzymalibyśmy dobrą
odpowiedź, ale nasze wyprowadzenie byłoby błędne.
Dobrze, otrzymaliśmy wzór na N(cx,n). Teraz musimy stwierdzić, czy
S pec(\/2) i Spec(2 + y / l ) dzielą dodatnie liczby całkowite, sprawdzając za
pomocą wzoru ( 3 . 1 4 ), czy dla wszystkich liczb całkowitych n > 0 zachodzi
N ( x / 2 , n ) + N ( 2 + v/2 , n ) = n :
n+ 1
n +1
+
-1
V2
1
2 + a/ 2
n + 1
~7T
+
= n
n +1
2 + y/l,
wzór ( 3 .2 );
= n >
n +1
n + 1 .+
n+ 1
V2
l V2 J
2+V2
{2 +^}
Wszystko upraszcza się z powodu zgrabnej równości
i
J_
1
y /l
2 + y /l
=
1.
n,
wzór ( 3 .8 ).
Wystarczy teraz sprawdzić, czy dla wszystkich rt > O zachodzi
rt + 1
=
1.
V2
Równość to jest prawdziwa, gdyż jest to suma części ułamkowych dwóch
liczb, które po dodaniu dają liczbę całkowitą rt + 1. Zatem jest to podział.
3.3. R ekurencje z p o d ło g ą i sufitem ____________
Funkcje podłoga i sufit nadają nowy wymiar badaniom nad relacjami rekurencyjnymi. Spójrzmy najpierw na rekurencję
Ko = 1 ;
Kn+1 = 1 + min(2KLn/2 j,3 K Ln/3j ) ,
dla n > 0.
(3 -1 6 )
Stąd na przykład Ki równa się 1 + min(2Ko,3Ko) = 3 i ciąg zaczyna się od
liczb 1, 3, 3, 4, 7, 7, 7, 9, 9, 10, 13, . . . . Jeden z autorów tej książki skromnie
zadecydował nazwać te liczby liczbami Knutha.
W ćwiczeniu 25 zostaniemy zapytani, czy prawdą jest, że dla wszyst­
kich rt ^ 0 zachodzi Kn ^ rt. Kilka właśnie wyliczonych pierwszych wartości
ciągu K spełnia tę nierówność. Mamy zatem duże szanse na to, by była ona
zawsze prawdziwa. Spróbujmy dowodu indukcyjnego. Baza dla rt = 0 wy­
nika bezpośrednio z definicji rekurencji. W kroku indukcyjnym zakładamy,
że nierówność jest spełniona dla wszystkich liczb naturalnych nie większych
od rt i próbujemy udowodnić, że Kn+i ^ rt + 1. Z rekurencji wiemy, że
Kn+i = 1 + min(2KLn/ 2j ,3K|_n/ 3j). Z założenia indukcyjnego wiemy też, że
2KLn /2J ^ 2 [rt/2 J i 3Klu/3j ^ 3|rt/3j. Jednakże 2 |rt/ 2 J i 3[n/3J mogą być
równe odpowiednio rt — 1 i tl — 2. Z założenia indukcyjnego możemy co naj­
wyżej wywnioskować, że Kn+i
1 + (tl —2). Trochę brakuje do nierówności
Kn+i ^ rt + 1 .
Mamy teraz powód, by martwić się o prawdziwość nierówności Kn ^ rt.
Spróbujmy może znaleźć kontrprzykład. Jeżeli znaleźlibyśmy takie rt, że albo
2 K^n/ 2j < rt, albo 3Klti/3j < rt, czyli innymi słowy
K[n/2J < n /2
lub
KLn/3j < n /3 ,
to mielibyśmy K^+i < n + 1. Czy jest to możliwe? Będzie lepiej, jeśli nie
podamy teraz odpowiedzi, ponieważ zepsuje nam przyjemność rozwiązania
ćwiczenia 25.
W informatyce często pojawiają się rekurencje, w których używamy na­
wiasów podłogi i sufitu, ponieważ algorytmy, które opierają się na ważnej
technice „dziel i rządź,” redukują zazwyczaj problem rozmiaru n do podob­
nych problemów o rozmiarach będących ułamkami n. Jedna z metod sorto­
wania zbioru n elementowego (rt > 1 ) polega na przykład na podzieleniu tego
zbioru na dwie możliwie równe części: jedna rozmiaru [ n / 2 ] , druga rozmiaru
[n/2J. (Zauważmy, że
n = [ n /2] + [ n /2 J ;
( 3 .1 7 )
wzór ten przydaje się dość często.) Po posortowaniu z osobna każdej z tych
części (tą samą metodą, zastosowaną rekurencyjnie) możemy połączyć oba
podzbiory w jedną całość dokonując co najwyżej n — 1 dalszych porównań.
Stąd całkowita liczba dokonanych porównań jest równa co najwyżej f(n),
gdzie
f(1) = 0 ;
(3 .1 8 )
f (n) = f ( [ n / 2 ] ) + f ( [ n / 2 J) + n — 1 ,
dla n > 1 .
Rozwiązanie tej rekurencji znajdziemy w ćwiczeniu 34.
Problem Flawiusza z rozdziału 1 prowadzi do podobnej rekurencji, która
może być wyrażona w postaci
l(i) = i ;
J(ruj = 2J([n/2J) — (—1)n ,
dla n > 1.
Znamy teraz więcej metod, niż znaliśmy w rozdziale 1 . Rozważmy więc
autentyczny problem Flawiusza. Eliminowana jest nie co druga, lecz co trze­
cia osoba. Jeśli zastosujemy skuteczne w pierwszym rozdziale metody do roz­
wiązania tego trudniejszego problemu, to dojdziemy do ciekawej rekurencji
postaci
hM
= [ f J3 (Lfnj) + anj mod n + 1 ,
gdzie „mod” jest funkcją, którą zajmiemy się wkrótce, oraz au równa się
—2, +1, lub —j w zależności od tego, czy n mod 3 równa się 0, 1 czy 2. Ta
rekurencją jest zbyt skomplikowana, by się nią zajmować.
Istnieje inne podejście do problemu Flawiusza, które daje znacznie lepsze
rezultaty. Każdej ocalonej (chwilowo) osobie nadajemy nowy numer. Stąd 1
i 2 staje się n + 1 i n + 2, następnie 3. osoba jest eliminowana; 4 i 5 staje się
n + 3 i n + 4, następnie eliminowana jest 6 . osoba; . . . ; 3k + 1 i 3k + 2 staje
się n + 2 k + 1 i n + 2 k + 2 , a 3 k + 3 osoba jest eliminowana; . . . w końcu osoba
3n zostanie wyeliminowana (lub pozostawiona przy życiu). Na przykład, dla
rt = 10 numeracja osób wygląda następująco:
1
2
11
12
3
18
4
5
13
14
19
20
23
24
6
7
8
15
16
9
21
10
17
22
25
27
26
28
29
30
W chwili śmierci k-ta eliminowana osoba ma numer 3k. Dowiemy się zatem,
kto przeżyje, jeśli będziemy potrafili odnaleźć początkowy numer osoby o
końcowym numerze 3 rt.
Osoba o numerze N (gdzie N > rt) musiała mieć mniejszy numer, który
znajdziemy w następujący sposób: niech N = rt + 2k + 1 lub N = rt + 2k + 2.
Wtedy k = [(N — rt — 1)/2J. Osoba ta poprzednio miała numer 3k + 1 lub
3k + 2, tzn. 3k + (N —u — 2k) = k + N — rt. Zatem numer Js(n) ocalonej
osoby wyliczymy następującą metodą:
N := 3rt;
w h ile N > tl do N :=
h (n )
„Nie za wolno,
nie za szybko.”
L. Armstrong
N —TL — 1
+ N —tl ;
:= N .
Nie jest to postać zwarta J3 (tl). Nie jest to nawet rekurencją. Możemy za to
dosyć szybko wyliczyć odpowiedź dla dużych rt.
Szczęśliwie algorytm ten można uprościć, gdy podstawimy w miejsce N
liczbę D. = 3rt + 1 — N. (Ta zmiana w notacji odpowiada numerowaniu osób
od 3rt do 1, zamiast od 1 do 3rt, czyli odliczaniu wstecz.) Uprości to skom­
plikowane obliczenie N:
D :— 3tl
1—
= rt + D
(3rt+ 1 — D) —rt — 1
2rt —D
2
= D—
Algorytm przybierze postać
D := 1;
w h ile D ^ 2rt do D := [ f D] ;
I3 W
•= 3rt + 1 — D .
+ (3 rt + 1 — D) —Tt
—D
"D"
= D+
= [fol.
_ 2 _
~1
3.4. Działanie dwuargumentowe ‘m od ’j
Aha! Wygląda to lepiej, gdyż liczby n używamy w obliczeniach w bardzo
prosty sposób. Podobnie rozumując, możemy wyliczyć numer ocalonej osoby
Jq(n), gdy co q-ta osoba jest eliminowana:
D := 1;
w h ile D
(q — 1)n do D := |"-^ryD] ;
(3-19)
Jq(n) := qn + 1 — D .
Jeśli q = 2, wiemy, że D rośnie do 2m+1, gdzie n = 2m + 1. Zatem
=
2(2m + 1) + 1 - 2 m+1 = 21 + 1. Zgadza się!
Algorytm ( 3 . 1 9 ) wylicza ciąg liczb całkowitych zdefiniowanych następu­
jącą rekurencją:
D i q) = 1 :
(3 2 0 )
dla n > 0 .
Liczby te nie wydają się bezpośrednio spokrewnione z żadną znajomą funkcją,
z wyjątkiem gdy q = 2 ; zatem prawdopodobnie nie mają ładnej postaci
zwartej. Jeśli zaakceptujemy ciąg D ^ jako „znany,” to rozwiązanie ogólnego
problemu Flawiusza przedstawimy w prosty sposób: numer Jq(n) ocalałej
osoby równa się q n + 1 —D^q\ gdzie k jest najmniejszą liczbą taką, że d { ^ >
(q - 1 )n.
„Znany”
powiedzmy jak
liczby harmoniczne.
A.M. Odlyzko
i H. S. Wilf
pokazali [284], że
,(3)
= L(f)ncj,
C « 1,622270503
3.4. D ziałan ie dw uargum entow e ‘m o d ’
Ilorazem dzielenia n przez m jest | n / m j , gdzie m i n są dodatnimi liczbami
całkowitymi. Wygodnie jest mieć prostą notację na resztę z tego dzielenia.
Oznaczymy ją ”n mad m ”. Z podstawowego wzoru
\
^
1 ) 5 sv, vj\ ' <vevł
n = m [ n / mJ + n mod m
iloraz
r ii
reszta
i
- '“U -
wynika, że możemy wyrazić n mod m jako n — m |_n/m j. Możemy uogólnić
n mod m na wszystkie liczby całkowite, a nawet na dowolne liczby rzeczywi­
ste:
x mod y = x - y [x/yj ,
dla y ^ 0 .
(3-2i)
To definiuje „mod” jako działanie dwuargumentowe, gdyż jest ono sumą i
różnicą innych działań dwuargumentowych. Matematycy od dłuższego czasu
używali funkcji mod w ten sposób i liczyli różne wartości mod 1 0 , mod 2n
1
»i j h
Dlaczego ten
podrozdział
nazwano „‘mod’:
działanie
dwuargumentowe ?”
Dowiesz się tego
w następnym,
fascynującym
rozdziale!
3. Funkcje całk ow itoliczb ow e
Strzeżcie się
języków
programowania
używających innej
definicji.
itp., ale dopiero w ciągu ostatnich dwudziestu lat ujęto to formalnie. Stare
pojęcie, nowa notacja.
Łatwo możemy uchwycić intuicyjne znaczenie x m o d y , gdy x i y są
dodatnimi liczbami rzeczywistymi. Wyobraźmy sobie okrąg o obwodzie y ,
którego punktom przyporządkowano liczby rzeczywiste z przedziału [0 .. y ).
Jeżeli przejdziemy wzdłuż okręgu drogę długości x, zaczynając od 0, to skoń­
czymy naszą wędrówkę w punkcie x mod ij. (I w czasie spaceru liczbę 0 na­
potkamy [x /y \ razy.)
Gdy x lub y są ujemne, musimy przyjrzeć się dokładnie definicji, by
ustalić, co to właściwie znaczy. Oto kilka przykładów:
5 mod 3 = 5 —3 L5/3J
5 mod —3 = 5 —
' (—3) |5/(—3)J
—5 mod 3 = —5 —3 L—5/3J
=
2;
=-1;
=
1;
-5 mod —3 = —5 — (—3) [—5 /(—3)J = - 2 .
Może nazwać ją
moduiną?
Liczba za ‘mod’ jest nazywana modulnikiem. Nikt do tej pory nie zdecy­
dował, jak nazwać liczbę przed ‘mod’. W zastosowaniach modulnik jest z
reguły dodatni, ale definicja jest bez zarzutu również wtedy, gdy modulnik
jest ujemny. W obu przypadkach wartość x mod y znajdziemy pomiędzy 0 i
modulnikiem:
dla y > 0 ;
dla y < 0 .
Co jednak będzie, gdy y = 0? Definicja ( 3 .2 1 ) zostawia ten przypadek niezde­
finiowany, by uniknąć dzielenia przez zero, ale dla pełności możemy określić,
że
x mod 0
x.
( 3 -2 2 ;
Konwencja ta zachowuje własność stwierdzającą, że x mod y zawsze różni
się od x o wielokrotność y . (Może wydawać się bardziej naturalne określenie
funkcji mod tak, by była ciągła w 0 , definiując x mod 0 = lim ^ o x mod y =
0. W rozdziale 4 zobaczymy, że to podejście jest mniej użyteczne. Ciągłość
nie jest ważną cechą operacji mod.)
Użyliśmy już raz niejawnie działania mod, gdy napisaliśmy x jako sumę
części całkowitej i ułamkowej: x = [_xj + {x}. Część ułamkowa może być
zapisana jako x mod 1 , ponieważ
x
=
|x j
+ * mod 1 .
Zauważmy, że nie potrzebujemy nawiasów w tym wzorze, jeśli przyjmiemy,
że mod wiąże mocniej niż dodawanie i odejmowanie.
Funkcja podłoga została użyta w definicji operacji mod. Funkcja sufit
nie jest traktowana równorzędnie. Może moglibyśmy użyć funkcji sufit do
zdefiniowania podobnej do mod operacji
x antymod y = y \x /y ] —x .
W naszym przykładzie z okręgiem byłby to dystans, który należałoby przejść
po minięciu punktu x, by wrócić z powrotem do 0. Oczywiście potrzebujemy
lepszej nazwy niż ‘antymod’. Jeśli pojawi się wystarczająca liczba prac, to
właściwa nazwa prawdopodobnie sama się znajdzie.
Prawo rozdzielności jest jedną z najważniejszych algebraicznych własno­
ści działania mod:
c(x m odij) = (cx) mod (cy)
Wiatach 70.
działanie ‘mod’
było w modzie.
Może funkcję
antymod nazwać
‘punk’ ?
Nie— Ja wole
‘antymod’.
( 3 -2 3 )
gdzie c, x i y są liczbami rzeczywistymi. (Ci, którzy uważają, że mod wiąże
słabiej niż mnożenie, mogą usunąć nawiasy z prawej strony równości.) Tożsa­
mość tę łatwo jest udowodnić wprost z definicji ( 3 .2 1 ), ponieważ, jeśli cy ^ 0 ,
to
c( xmodi j ) = c[x —y [ x / y \ ) = cx —c y [c x /c y \ = cx mod c y .
Przypadek z zerowymi modulnikami jest trywialnie prawdziwy. W naszym
przykładzie zilustrowaliśmy prawo rozdzielności dwukrotnie używając ±5,
±3 i c = —1. Tożsamości takie jak ( 3 .2 3 ) uspokajają, ponieważ dają powód,
by wierzyć, że operacja ‘mod’ nie została zdefiniowana nieprawidłowo.
W pozostałej części tego podrozdziału rozważymy problem, w którym
‘mod’ będzie pomocne, choć nie odegra głównej roli. To zadanie pojawia się
często w różnych sytuacjach: Chcemy podzielić rt przedmiotów na m możliwie
równych grup.
Przypuśćmy, na przykład, że w m kolumnach chcemy ustawić n krótkich
wierszy. Z powodów estetycznych chcemy, by kolumny były ustawione w ma­
lejącym porządku długości (dokładniej, w porządku nierosnącym) i długości
kolumn powinny być w przybliżeniu te same — żadne dwie kolumny nie po­
winny się różnić o więcej niż jeden wiersz tekstu. Z dwóch ustawień 37 wierszy
tekstu w pięciu kolumnach będziemy woleli ustawienie z prawej strony:
8
8
8
8
5
8
8
7
7
7
w iersz 1
w iersz 2
w iersz 3
wiersz 4
w iersz 5
w iersz 6
w iersz 7
w iersz 8
w iersz 9
w i e r s z 10
w i e r s z 11
w i e r s z 12
w i e r s z 13
w ier sz 14
w i e r s z 15
w i e r s z 16
w i e r s z 17
w i e r s z 18
w i e r s z 19
w i e r s z 20
w i e r s z 21
w i e r s z 22
w i e r s z 23
w i e r s z 24
w i e r s z 25
w iersz 26
w iersz 27
w ier sz 28
w i e r s z 29
w iersz 30
w i e r s z 31
w ier sz 32
w i e r s z 33
w iersz 34
w ier sz 35
w iersz 36
w iersz 37
w iersz 1
w iersz 2
wiersz 3
wiersz 4
wiersz 5
w iersz 6
w iersz 7
w iersz 8
w iersz 9
w i e r s z 10
w i e r s z 11
w i e r s z 12
w i e r s z 13
w i e r s z 14
w i e r s z 15
w i e r s z 16
w i e r s z 17
w i e r s z 18
w i e r s z 19
w iersz 20
w i e r s z 21
w i e r s z 22
w iersz 23
w i e r s z 24
w i e r s z 25
w ier sz 26
w iersz 27
w ier sz 28
w i e r s z 29
w iersz 30
w i e r s z 31
w ier sz 32
w i e r s z 33
w iersz 34
w i e r s z 35
w i e r s z 36
w iersz 37
Co więcej, chcemy rozmieścić kolejne porcje wierszy w kolejnych kolum­
nach— najpierw decydując, ile wierszy powinno znaleźć się w pierwszej ko­
lumnie, potem w drugiej i w trzeciej, itd .— ponieważ jest to sposób, w jaki
ludzie czytają. Umieszczając, rząd po rzędzie, kolejne wiersze w kolejnych ko­
lumnach, otrzymamy poprawną liczbę wierszy w każdej kolumnie. Niestety,
wiersze będą źle uporządkowane. (Otrzymalibyśmy coś jak uporządkowanie
po prawej stronie, ale kolumna 1 zawierałaby wiersze 1, 6 , 11, . . . , 36 zamiast
wierszy 1, 2, 3, . . . , 8 , jak byśmy tego chcieli.)
Nie możemy użyć strategii rozmieszczania rząd po rzędzie, lecz dzięki
niej dowiemy się, ile wierszy umieścić w każdej kolumnie. Jeśli rt nie jest
wielokrotnością m, to dłuższe kolumny powinny zawierać [n /m ] wierszy, a
krótsze |n /m j wierszy. Dokładnie n mod m kolumn będzie długich (i jak się
okazuje rt antymod m krótkich).
Uogólnijmy terminologię i mówmy o ‘przedmiotach’ i ‘grupach’, zamiast
mówić o ‘wierszach’ i ‘kolumnach’. Zdecydowaliśmy właśnie, że pierwsza
grupa powinna zawierać [n /m ] przedmiotów, dlatego powinna działać nastę­
pująca metoda rozmieszczania przedmiotów: By rozmieścić n przedmiotów w
m grupach, gdzie m > 0 , włóżmy [n /m ] przedmiotów do pierwszej grupy i
użyjmy tej samej metody rekurencyjnie, by włożyć pozostałe n ' = n —[n /m ]
przedmioty do m / = m — 1 pozostałych grup.
Na przykład, dla liczb n = 314 i m = 6 , rozdzielanie przedmiotów prze­
biega następująco:
pozostałe przedmioty
314
261
208
156
104
52
pozostałe grupy
[przedmioty / grupy]
6
53
53
52
52
52
52
5
4
3
2
1
Działa! Otrzymujemy grupy tej samej wielkości, mimo zmieniającego się
dzielnika.
Dlaczego to działa? Załóżmy, że n = qm + r, gdzie q = [n /m j i r =
n mod m. Gdy r = 0, proces jest prosty: Wkładamy [n /m ] = q przedmiotów
do pierwszej grupy i zastępujemy n przez n ' = n —q, pozostawiając n ' = qm/
przedmiotów do włożenia w pozostałe m / = m — 1 grup. Jeśli r > 0, to
wkładamy [n /m ] = q + 1 przedmiotów do pierwszej grupy i zastępujemy n
przez n f = n — q — 1 , pozostawiając n ' = qm/ + r — 1 przedmiotów do
rozmieszczenia w następnych grupach. Nową resztą jest r ' = r — 1, ale q nie
zmienia się. Z tego wynika, że r grup z q + l przedmiotami będzie poprzedzało
m —r grup z q przedmiotami.
3.4. Działanie dwuargumentowe ‘m od’j
Jak wiele przedmiotów jest w k-tej grupie? Chcielibyśmy mieć wzór,
który daje liczbę [n/m] dla k ^ n mod m, i |n/m j w przeciwnym razie.
Jeśli zapiszemy jak w poprzednim akapicie n = qm + r, gdzie q = [n /m j, to
nietrudno będzie sprawdzić, że wyrażenie
n —k + 1
m
ma żądane własności, ponieważ skraca się do q + [(r —k + 1)/m]. Mamy
bowiem [(r —k + l)/m ] = [k^r], jeśli 1 O ^ m i 0 ^ r < m . Dlatego
możemy zapisać tożsamość, która wyraża podział liczby n na m możliwie
równych części w porządku nierosnącym:
m
n
"n — 1 "
~n —m + 1 "
"n"
— +
+ ••• +
m
m
m
(3-24)
Tożsamość ta jest prawdziwa dla wszystkich dodatnich liczb całkowitych m
i dla każdej liczby całkowitej n (obojętnie czy jest dodatnia, ujemna, czy
zerem). Wzór (3 .17 ) jest szczególnym przypadkiem powyższej identyczności,
(gdy m = 2 ), chociaż zapisaliśmy go w nieco innej postaci, n = [n / 2 ] + |_n/2 J.
Jeśli chcemy uporządkować grupy w niemałejącym porządku, małe przed
większymi, moglibyśmy postępować w ten sam sposób, ale tym razem umie­
ścilibyśmy w pierwszej grupie [n/mj przedmiotów. Stąd moglibyśmy wypro­
wadzić odpowiednią tożsamość
n
n
m
—
+
n +1
+ ...+
m
n + m —1
m
( 3 -2 5 )
Możliwe jest przekształcenie wzoru ( 3 .2 5 ) we wzór ( 3 .2 4 ) za pomocą albo
równości (3 .4 ), albo tożsamości z ćwiczenia 1 2 .
Jeśli zastąpimy teraz n we wzorze ( 3 .2 5 ) przez [m xj, i zastosujemy regułę
( 3 . 1 1 ) do usunięcia wewnętrznych nawiasów, otrzymamy tożsamość praw­
dziwą dla wszystkich liczb rzeczywistych x:
|_mxj =
[xj +
1
x + — + •■■• +
m —1
x + -------rrt
( 3 -2 6 )
Jest to zadziwiające, gdyż funkcja podłoga jest całkowitoliczbowym przybli­
żeniem wartości rzeczywistej, ale pojedyncze przybliżenie z lewej strony jest
równe sumie całej gromady przybliżeń z prawej strony. Jeśli założymy, że [ x j
wynosi średnio x —\ , to lewa strona równa się w przybliżeniu m x —\ , pod­
czas gdy prawa strona ( x — j ) + ( x — \ +
H---------1- ( x — \ + II^ - ) = m x —
Suma wszystkich tych zgrubnych przybliżeń okazuje się dokładna!
(
3.5. Sum y p o d ło g i i sufitu
Równanie ( 3 .2 6 ) pokazuje, że możliwe jest uzyskanie postaci zwartej dla przy­
najmniej jednego rodzaju sum z nawiasami [ J • Czy są inne? Tak! Dobrym
pomysłem, który zazwyczaj pomaga w takich przypadkach, jest usunięcie
nawiasów podłogi lub sufitu przez wprowadzenie nowej zmiennej.
Na przykład, zobaczmy, czy jest możliwe przedstawienie sumy
L
O^kcu
w zwartej postaci. Dobrym pomysłem jest wprowadzenie zmiennej m =
[\/kJ. Następnie postępujemy „mechanicznie,” podobnie jak w zadaniu o ru­
letce:
L
L^J =
y
m [ k < n ] [ m = [\/kJ]
k,m^ 0
O^kcn
m[k < rt] [m ^ \/k < m + 1 ]
k,m^ 0
y
m [k < n ] [m 2 ^ k < (m + l ) 2]
k,m^ 0
/'
y
m [m 2 ^ k < ( m + l ) 2 ^rt]
k,m^ 0
+ ^
m [m 2 ^ k < r t < ( m + l ) 2] .
k,m^ 0
Znowu musimy ostrożnie postępować z warunkami granicznymi. Załóżmy
najpierw, że n = a2 jest kwadratem liczby naturalnej. Wtedy druga suma
jest równa zeru, a pierwsza może być przekształcona niemalże rutynowo:
m [ m 2 ^ k < ( m + 1 ) 2 ^ a2]
k.m^O
= ^ m ( ( m + 1 ) 2 ^ m 2) [ m + K a ]
m^O
=
Y
m( 2 m + 1) [ m < a]
m^O
=
y _ (2m - + 3ra-) [m < a]
m.^0
= § a ( a — 1 )(a —2 ) + | a ( a — 1 ) = ^(4a + l ) a ( a — 1 ).
W ogólnym przypadku podstawmy a = [y/n \. Następnie, dla a 2 ^ k <
n, dodajmy składniki drugiej sumy — wszystkie równe a — które sumują się
do (rt — a 2 )a. To daje poszukiwaną postać zwartą
[Vk\ = n a — j<r
?a,
a = |y i\|.
(3-27)
O^kcn
Innym sposobem podejścia do takich sum jest zastąpienie wyrażenia po­
staci [xj wyrażeniem HjH ^ j
Jest to dozwolone, gdy x ^ 0. Zobaczmy,
jak ta metoda skutkuje dla sumy [pierwiastków kwadratowych]. Dla wygody
założymy, że rt = a 2:
L
= Z n
O ^kcn
j ,k
=
Y_
l^ j< a
^ \/k ][0 ^ k < a2]
V [j2 ^ Tc< CŁ2]
k
= X . (a 2 _ i2) = a3 - j a ( a + 2 ) ( a + 1) •
1^j<a
W następnym przykładzie zobaczymy, jak zmiana zmiennej prowadzi do
przekształcenia sumy. W roku 1909 trzech matematyków— Bohl [34], Sier­
piński [327] i Weyl [369]— mniej więcej w tym samym czasie i niezależnie
od siebie odkryło znakomite twierdzenie: jeśli oc jest liczbą niewymierną, to
części ułamkowe {na} są jednostajnie rozłożone pomiędzy 0 a 1 , gdy n —» 0 0 .
Można to stwierdzić, gdyż wzór
1
r1
lim — V" f ({ka}) =
f(x) dx
n-"°° n Os$k<n
Jo
( 3 -2 8 )
jest prawdziwy dla wszystkich liczb niewymiernych a, i wszystkich ograni­
czonych, prawie wszędzie ciągłych funkcji f. Na przykład, wartość średnia
ciągu {na} może być wyliczona przez podstawienie f(x) = x. Otrzymamy
(Dokładnie tego mogliśmy oczekiwać, ale dobrze jest wiedzieć, że można ten
fakt udowodnić, niezależnie od tego jak bardzo niewymierna jest liczba a.)
Twierdzenie Bohla, Sierpińskiego i Weyla można udowodnić przez przy­
bliżanie funkcji f(x) z góry i z dołu „funkcjami schodkowymi,” które są
liniowymi kombinacjami funkcji prostych
fv (x) = [0 ^ x < v ] ,
gdzie 0 ^ v ^ 1. Nie jest naszym celem udowodnienie tego twierdzenia.
Jest to robota dla podręcznika rachunku różniczkowego. Ale spróbujmy sobie
wyobrazić podstawowy powód tego, że jest ono prawdziwe. Zobaczmy, jak
Ostrzeżenie: Trudny
tekst! Podczas
pierwszego czytania
lepiej pominąć
następne dwie
strony. Nie są one
istotne.
Twój przyjazny
asystent
Skocz
„ stąd
dobrze się sprawdza w szczególnym przypadku f(x) = fv (x). Innymi słowy,
sprawdźmy jak blisko „idealnej” wartości rtv znajduje się suma
Y_
[{ka}< v] ,
0 ^k<Tl
gdy rt jest duże i oc jest liczbą niewymierną.
W tym celu zdefiniujmy funkcję niezgodności D(a, rt) jako największą
z wartości bezwzględnych sum
s(«,n,v) =
([{k a l < v] ~ v ) .
(3-29)
0 ^k<n
dla v przyjmującego wartości z przedziału 0 ^ v ^ 1. Naszym celem jest
pokazanie, że D (a, n) w porównaniu z rt nie jest „zbyt duże” przez wykazanie,
że | s(a,n,v)| jest zawsze sensownie małe, gdy a jest liczbą niewymierną.
Zapiszmy najpierw funkcję s(cx,n,v) w prostszej postaci, a następnie
wprowadźmy nową zmienną j:
y~
^[{ka}< v] —
^
( [kaj — [ka —vj —v)
0 ^k<n
0^k<n
= —n v +
^
0 <Jk<n
= —rtv +
y
[ka —v < j ^ ka]
j
y~ r^ - 1
0
+v) a-~i i •
O^j < [noc] k < n
Racja! Nazywaj
i zwyciężaj.
Istotna jest zamiana
zmiennej k na j .
Twój przyjazny
asystent
Przy odrobinie szczęścia znajdziemy sumę względem k. Wprowadźmy nowe
zmienne, by nieco uporządkować ten wzór. Bez utraty ogólności, możemy
założyć, że 0 < oc < 1. Przyjmijmy
a = La 1 J >
b = rv«_li.
oc 1 = a + oc' ;
v a - 1 = b —v'
— J/v-l
Stąd oc'' =
{a } jest częścią ułamkową oc 1, a v' jest anty7częścią ułamkową
-1
voc
Po raz kolejny warunki graniczne przysparzają nam kłopotów. Zapo­
mnijmy chwilowo o ograniczeniu ‘k < rt’ i przekształćmy sumę:
X [ k e [ja - 1 . . ( j + v ) a - 1 )] = [ ( j + v ) ( a + a ' } ] - |"j(a + a')]
"i-:c‘i
•V
J
:,iy
'
3.5* Sumy podłogi i su fitu 1
To było proste. Wstawmy wyliczoną sumę:
s ( a , n, v) = —rtv+ [n a]b +
£_
([ j a ' - v ' ] - [ j a ' ] ) - S ,
( 3 .3 0 )
0 ^ j < fna"l
gdzie S jest poprawką reprezentującą sumę składników k
rt, których nie
wyłączyliśmy. Wartość ja' będzie liczbą całkowitą tylko wtedy, gdy j = 0,
ponieważ a (zatem i a') jest liczbą niewymierną. Tak samo ja ' —v' będzie
liczbą całkowitą dla co najwyżej jednej wartości j. Możemy zatem zamienić
nawiasy sufitu otaczające składniki sumy na nawiasy podłogi:
s( a , n, v) = —rtv + [n a]b — ^
([ja'J — [jo 7 —v'J) —S + { 0 lub 1 }.
0^j<[noc]
(Wyrażenie
Interesujące. Zamiast wzoru w postaci zwartej, otrzymaliśmy sumę, która wy­
gląda raczej jak s ( a , n, v), ale z innymi parametrami: a ' zamiast a, [na] za­
miast n i v' zamiast v. Dla s( a , n, v) otrzymaliśmy wzór rekurencyjny, który
(na szczęście) doprowadzi nas do rekurencji dla funkcji niezgodności D ( a , n) .
Ponieważ
s ( a ', | n a | , v ' ) =
^
{0 lub 1} oznacza
coś, co jest równe
albo 0, albo 1 .)
( | J a 'J - [j oc' - v ' J - v ' ) ,
O ^ jc [not]
więc
s ( a , n, v) = —n v + [n a]b — [n a]v' — s(a', [n a ],v ') — S + {0 lub 1}.
Gdy przypomnimy sobie, że b —v' = v a _1, wszystko pięknie się uprości, gdy
podstawimy n a (b —v') = nv zamiast [na] (b —v'):
s ( a , n, v) = —s(a ', [n a ],v ') —S + e + { 0 lub 1}.
Pojawiający się we wzorze składnik e jest dodatnią liczbą mniejszą od v a _1.
W ćwiczeniu 18 zostaniemy poproszeni o wykazanie, że S znajduje się gdzieś
pomiędzy 0 i [va- 1 ]. Usuwamy ostatni wyraz sumy (j = [na] — 1 = [n a j),
ponieważ jest on równy albo v', albo v' —1. Zatem jeśli policzymy największą
wartość bezwzględną, jaką przybiera funkcja s dla jakiegoś v, otrzymamy
D ( a , n ) ^ D(a' , [an j) + a
1+2.
(3 -3 1 )
Dzięki metodom, które poznamy w następnych rozdziałach, możemy wy­
wnioskować z postaci tej rekurencji, że dla wystarczająco dużych n funkcja
D ( a , n ) jest zawsze znacznie mniejsza od n. Stąd twierdzenie ( 3 .2 8 ) jest
prawdziwe, chociaż zbieżność do granicy nie jest szybka. (Spójrz do ćwiczeń
9.45 i 9.61.)
Dotąd
3. Funkcje całk ow itoliczb ow e
Czy to będzie
cięższa suma
podłóg, czy suma
cięższych podłóg?
Uwaga! Tutaj
autorzy wpadają w
manierę kończenia
rozdziału cokolwiek
przydługim,
trudnym
problemem
nie mającym innego
uzasadnienia niż
jego dziwaczność.
Studenci
Trafiony! Ale, moja
bando, czy musicie
być informowani
o zastosowaniach,
zanim się czymś
zainteresujecie? Ta
suma,, na przykład,
pojawia się podczas
badań nad
generowaniem liczb
losowych.
Matematycy
zajmowali się nią,
zanim powstały
komputery,
ponieważ
interesowało ich,
czy istnieje sposób
policzenia sumy
„opodłogowanego”
ciągu
arytmetycznego.
Wasz nauczyciel
112
Uff! Było to solidne zadanie w operowaniu sumami, nawiasami podłogi
i sufitu. Czytelnicy, którzy nie są przyzwyczajeni do „dowodzenia, że niedo­
kładności są niewielkie” mogą się dziwić, że ktokolwiek miał odwagę zmie­
rzyć się z tak dziwacznie wyglądającymi sumami. Gdy dokładniej przyjrzymy
się wywodowi, dostrzeżemy pewną ideę towarzyszącą obliczeniom. Głównym
pomysłem jest zredukowanie pewnej sumy s ( a , n, v) o n składnikach do po­
dobnej sumy o co najwyżej |"ocn"| składnikach. Prawie wszystko znika poza
małymi resztkami składników bliskich granicom.
Odpocznijmy sobie i zajmijmy się jeszcze jedną sumą, co prawda nie
trywialną, lecz mającą duże zastosowania (w porównaniu z tą, którą zajmo­
waliśmy się przed chwilą). Suma ta ma postać zwartą, będziemy więc mogli
sprawdzić odpowiedź. Naszym celem jest uogólnienie sumy ( 3 .2 6 ) przez zna­
lezienie wzoru na
nk + x
Z
O^kcm
całkowite m > 0 ,
m
całkowite n.
Znalezienie postaci zwartej dla tej sumy jest trudniejsze od wszystkiego, co
do tej pory robiliśmy (z wyjątkiem, może, problemu niezgodności). Jest
jednak pouczające, więc będziemy się nim zajmować do końca rozdziału.
Jak zwykle, zwłaszcza przy trudnych zadaniach, przyjrzyjmy się małym
przypadkom. Przypadek dla n = 1 okazuje się wzorem (3 .2 6 ), gdzie x zastą­
piono przez x/m :
1— 1 +
LmJ
1+ x
m
+ ••• +
m —1 + x
m
=
w
Sprawdźmy też przypadek n = 0:
1— 1 + 1— 1 + • • • + 1— 1 = m l — I .
LmJ
LmJ
LmJ
LmJ
W naszym zadaniu występują dwa parametry: m i n. Przyjrzyjmy się
przypadkom z małym m. Gdy m = 1, suma składa się tylko z jednego wy­
razu |x_|. Gdy m = 2, mamy już dwa wyrazy [x/2\ + |_(x + n)/2J. Możemy
usunąć teraz n ze środka nawiasów, ale musimy rozważyć z osobna dwie sy­
tuacje, gdy n jest albo parzyste, albo nieparzyste. Jeśli n jest parzyste, to
n / 2 jest liczbą całkowitą i możemy ją usunąć poza nawias:
n
+ 2 '
Jeśli n jest nieparzyste, to (n — l ) / 2 jest liczbą całkowitą. Stąd
LjJ
+
X + 1
n —1
n —1
= M +
Ostatnia równość wynika ze wzoru (3 .2 6 ), gdzie m = 2.
Wzory, które otrzymaliśmy, są podobne do wzorów z rt = 0 i 1, ale nie
możemy dostrzec jeszcze żadnego przejrzystego wzorca, więc lepiej zrobimy
badając większą liczbę małych przypadków. Dla m = 3 otrzymamy sumę
x + rt
+
3
l!J
x + 2 rt
3
Musimy teraz rozważyć trzy sytuacje. Albo liczba n jest wielokrotnością 3,
albo jest o 1 lub o 2 większa od takiej wielokrotności. Ściślej, n mod 3 = 0,
1 lub 2. Jeśli rt mod 3 = 0, to rt/3 i 2 u /3 są liczbami całkowitymi i
+ T1.
+
Jeśli tl mod 3 = 1, to (n — 1)/3 i (2n —2)/3 są liczbami całkowitymi, stąd
[jj
x+1
3
+ n 7 1W
3 )
x+ 2
3
\
2 n —2 \
, .
+ — 3— J =
Ostatnia równość znów wynika ze wzoru (3 .2 6 ). Tym razem musimy podsta­
wić m = 3. W końcu, gdy n mod 3 = 2 , wówczas
UJ+
x+ 2
3
2 rt — 1 .
H------^— I = [xj + n — 1 .
X+1
3
)V
3
Lewa półkula naszego mózgu skończyła z przypadkiem m = 3, ale prawa
wciąż nie może rozpoznać wzoru. Zajmijmy się więc przypadkiem m = 4:
x + rt
i ? H
+
x + 2n
4
+
x + 3n
4
Wiemy chociaż tyle, że należy zajmować się przypadkami zależnymi od tl mod
m. Jeśli n mod 4 = 0, to
UMUKWUI+ t M M - 1 5 ]
3n
Natomiast, gdy rt mod 4 = 1, wówczas mamy
[?j
x+ 1
4
+ n ; 1) + f
4 )
V
x+ 2
4
+ 2"^ f j) + (\
x+3
3 n -3 \
4
4
)
. . 3n
3
- W + T - 2 -
Tę samą odpowiedź otrzymamy, gdy rt mod 4 = 3. Jeżeli rt mod 4 = 2, to
1x 1
( x+ 2
[?M —.
n —2 \
{1 x 1
2n\
( x+ 2 I
3 rt—2 \
—]+— )
-1 .
„Inventive genius
reąuires pleasurable
mental activity as
a condition for its
vigorous exercise.
‘Necessity is the
mother of invention’
is a silly proverb.
(Necessity is the
mother of futile
dodges’ is much
nearer to the truth.
The basis of the
growth of modern
invention is science,
and science is
almost wholly the
outgrowth of
pleasurable
intellectual
curiosity.”
A.N. Whitehead
[372]
.111
|3 . Funkcje całk ow itoliezb ow e
W ostatnim kroku upraszczamy coś postaci |_y/2J + |_(y + 1)/2J, będącej znów
szczególnym przypadkiem wzoru (3 .2 6 ).
Wypiszmy znalezione sumy dla małych m:
n mod m = 0
m
n mod m = 1
n mod m = 2
1
W
2
2Ll J + f
3
3L U + U
W +S -j
|_xj + n — 1
|_xj + n — 1
4
4L?J + ¥
W + 4f-§
n u + ¥ - i
n mod m = 3
w + ^ - §
Otrzymaliśmy coś postaci
a l_aJ + bn + C’
gdzie a, b i c jakoś zależą od m i n. Nawet krótkowidz dostrzeże, że b prawdo­
podobnie jest równe ( m — 1)/2. Trudniej jest zauważyć wzór na a, ale przy­
padek n mod 4 = 2 daje nam wskazówkę, że a równa się prawdopodobnie
N W D ( m , n ) , największemu wspólnemu dzielnikowi liczb m i n. Ma to sens,
ponieważ N W D ( m , n ) jest usuwanym czynnikiem z liczb m i n podczas re­
dukcji ułamka n /m do ułamka właściwego i nasza suma używa ułamka n /m .
(Zajmiemy się operacją NWD w rozdziale 4.) Wartość c wydaje się bardziej
tajemnicza, ale prawdopodobnie wyniknie z dowodów na a i b.
Wyliczając sumę dla małych m, każdy ze składników zapisywaliśmy jako
x + kn
m
x + kn mod m
m
kn
kn mod m
H------------------------m
m
Ponieważ (kn —kn mod m )/m jest liczbą całkowitą, może być ona usunięta
poza nawiasy podłogi. Zatem oryginalna suma może być rozwinięta tak, jak
pokazano poniżej:
L=J
+
x + n mod m
m
+
x + 2 n mod m
m
+
x + (m — 1 )n mod m
m
+
0_
m
0 mod m
n
m
n mod m
m
2n
2 n mod m
m
m
(m — 1 )n
m
(m — 1 )n mod m
m
m
Gdy eksperymentowaliśmy z małymi wartościami m, trzy kolumny dopro­
wadzały nas do wzorów na a[_x/aj, bn i c.
W szczególności, wyprowadźmy wzór na b. Druga kolumna jest ciągiem
arytmetycznym, którego sumę potrafimy policzyć— jest to średnia arytme­
tyczna pierwszego i ostatniego wyrazu ciągu pomnożona przez długość ciągu:
1 (
(m —1
ń
2 V0 + ------m
m =
(m — 1)n
Nasz strzał b = ( m — l ) / 2 okazał się celny.
Pierwsza i trzecia kolumna wyglądają gorzej. By ustalić wartość a i c,
musimy się przyjrzeć ciągowi liczb
0 mod m,
n mod m,
2 n mod m,
...,
(m — 1 )n mod m.
Załóżmy na przykład, że m = 12 i n ■= 5. Pomyślmy o ciągu, jak o godzi­
nach na zegarze. Ciąg zaczyna się od godziny 0 (przyjmujemy, że 12 godzina
jest godziną 0), potem mamy 5 godzinę, 10 godzinę, 3 godzinę (= 15 godzi­
nie), 8 godzinę, itd. Okazuje się, że każda godzina w naszym ciągu pojawia
się tylko raz.
Teraz przyjmijmy m = 12 i n = 8 . Wyrazami ciągu są kolejno godziny
0 , 8 , 4 (= 16 godzinie), a potem znowu 0, 8 i 4. Ponieważ obie liczby 8 i 12
są wielokrotnościami 4, i ponieważ ciąg rozpoczyna się od 0 (też wielokrot­
ność 4), nie mamy szansy wyłamać się ze wzoru— wszystkie liczby muszą
być wielokrotnościami 4.
W tych dwóch przypadkach mamy NWD(12,5) = 1 i NWD(12,8) = 4.
Ogólna reguła, którą udowodnimy w następnym rozdziale, mówi, że jeśli
d = N W D (m, n) to otrzymamy liczby 0, d, 2d, . . . , m —d w jakimś porządku,
za którymi to liczbami znajdziemy kolejne d —1 kopii tego samego ciągu. Na
przykład, gdy m = 12 i n = 8 , liczby 0, 8 , 4 pojawiają się czterokrotnie.
Pierwsza kolumna nabiera teraz sensu. Zawiera ona d kopii składników
[ x / m j , [_(x + d ) / m j , . . . , [(x + m — d ) / m j , w jakimś porządku, stąd suma
równa się
X
— +
Lm.
x+ d
Ix + m — d
+ •••+ --m
L
m
d (1 x/d +
\,Lm /d.
, 1X I
=
d [zJ-
x/d + 1
m/d
x/d + m/d — 1
m/d
Ostatni krok jest jeszcze jednym zastosowaniem wzoru ( 3 .2 6 ).
Teraz lemat,
potem dylemat.
3. Funkcje całk ow itoliezb ow e
Wzór na a też zgadliśmy poprawnie:
a = d = NWD(m,n).
Tak jak przypuszczaliśmy, możemy wyliczyć teraz c, ponieważ trzecia
kolumna jest łatwa do ogarnięcia. Zawiera ona d kopii ciągu arytmetycznego
O/m, d /m , 2d /m , . . . , (m — d )/m . Stąd jej suma równa się
m
m
"d
m —d
d( K o+ m
Trzecia kolumna jest odejmowana, nie dodawana, stąd
c =
d —m
Koniec tajemnicy, koniec wyzwania. Oto szukana postać zwarta:
E
0 ^k<m
nk + x
m
= d
LJ
5
m —1
d —m
+ —
n + --- -—
gdzie d = NWD(m,rt). Sprawdźmy, czy nasz wzór daje prawidłowe wyniki
w przypadku, gdy n = 0 lub n = 1. Gdy rt = 0, mamy d = N W D (m , 0) =
m. Ostatnie dwa składniki we wzorze równają się zeru i wzór prawidłowo
przybiera postać m | x / m j . Dla rt = 1 mamy d = N W D (m , 1) = 1. Ostatnie
dwa składniki redukują się wzajemnie i otrzymujemy |_xj.
Jeśli poprzekształcamy troszkę wzór, uzyskamy jego symetryczną wersję:
Z
O^kcm
nk + x
m
-
, ,x i
m —1
d —m
d|s i + —
n + ~
-*iu
- lii
f m —1 ) f n —1)
m—1
d —m
+ --------- ^------- - + —TT— + —TT—
2
(m — 1)(n — 1)
+
d —1
( 3 -3 2 )
Zadziwiające! Nie ma żadnych algebraicznych powodów, dla których ta suma
miałaby być symetryczna. Niemniej jednak dowiedliśmy „prawa dualności,”
Z
0 ^k<m
rtk + x
m
0
Z
^k<n
mk + x
TL
całkowite m, n > 0 .
Na przykład, gdy m = 41 i n = 127, lewa suma ma 41 składników, a
prawa 127, ale dla dowolnej liczby rzeczywistej x sumy te są sobie równe.
Ć w iczenia
Rozgrzewka
1. Gdy analizowaliśmy problem Flawiusza w rozdziale 1 , przedstawialiśmy
dowolną dodatnią liczbę całkowitą n w postaci n = 2 m + 1, gdzie 0 ^ l <
2m. Przedstaw l i m jako funkcje n. We wzorach możesz użyć nawiasów
podłogi i sufitu.
2 . Znajdź wzór wyliczający dla danej liczby rzeczywistej x najbliższą do niej
liczbę całkowitą. W przypadku gdy x znajduje się dokładnie w połowie
drogi pomiędzy dwoma liczbami całkowitymi, podaj wyrażenie, które
zaokrągla liczbę x (a) w górę— do [x]; (b) w dół — do |xj.
3. Oblicz wyrażenie [ [ m a j n /a j , gdy m i n s ą dodatnimi liczbami całkowi­
tymi i oi jest liczbą niewymierną większą niż n.
4. W tekście opisano zadania rodzajów od 1 do 5. Co jest zadaniem ro­
dzaju 0 ? (To zadanie, nawiasem mówiąc, nie jest zadaniem rodzaju 0 .)
5. Znajdź warunek konieczny i dostateczny, by dla dodatnich liczb całko­
witych n zachodziła równość [uxj = n|_xj. (Twój warunek powinien
zawierać {x}.)
6 . Czy możemy powiedzieć coś ciekawego o [f (x)J, gdy f (x) jest ciągłą i m a ­
lejącą funkcją o wartościach całkowitych tylko dla całkowitych liczb x?
7. Rozwiąż rekurencję
Xn = n ,
dla 0 ^ n < m;
Xn = Xn_ m + 1 ,
dla n ^ m.
8 . Udowodnij zasadę
szufladkową Dirichleta: jeśli wkładamy do m pude­
łek n przedmiotów, to wtedy pewne pudełko zawiera co najmniej [n /m ]
przedmiotów i pewne pudełko zawiera ich co najwyżej '[n/m j.
9. Egipscy matematycy w roku 1800 p.n.e zapisywali ułamki właściwe jako
sumy ułamków egipskich (prostych) 1 /x \ H------ h 1 /xic, gdzie x są różnymi
liczbami całkowitymi. Na przykład | zapisywali jako | +
Udowodnij,
że można zrobić to systematycznie: Jeśli 0 < m /n < 1, to
(Jest to algorytm Fibonacciego, podany przez Leonarda Fibonacciego w
roku 1 2 0 2 .)
Podstawy
10.
Wykaż, że wyrażenie
jest zawsze równe albo | x j , albo |Y |. W jakich okolicznościach zachodzą
poszczególne równości?
11. Uzupełnij podany w tekście dowód faktu, że otwarty przedział ( a . . |3),
gdzie a < |3, zawiera dokładnie |~|3] —[aj —1 liczb całkowitych. Dlaczego,
aby uczynić dowód poprawnym, musimy wykluczyć przypadek oc = |3?
12. Udowodnij, że równość
zachodzi dla wszystkich liczb całkowitych n i dla wszystkich dodatnich
liczb całkowitych m. [Dzięki tej tożsamości możemy przekształcać funkcję
podłoga na funkcję sufit i na odwrót nie korzystając ze wzoru ( 3 .4 ).]
13. Niech a i |3 będą dodatnimi liczbami rzeczywistymi. Udowodnij, że zbiory
z powtórzeniami Spec (a) i Spec(|3) tworzą podział zbioru liczb całko­
witych dodatnich wtedy i tylko wtedy, gdy a i |3 są niewymierne i
l / a + 1 / 0 = 1.
14. Czy prawdą jest, że
(x mod n y) mod y = x m o d y ,
gdzie n jest liczbą całkowitą?
15. Czy istnieje podobna do ( 3 .2 6 ) równość używająca nawiasów sufitu za­
miast nawiasów podłogi?
16. Udowodnij, że rt mod 2 = (1 — (—l ) n )/2. Znajdź i udowodnij podobne
wyrażenie dla rt mod 3, gdzie prawa strona jest postaci aH-bo>rLH-ca>2'a, a
cu jest liczbą zespoloną (—1 + iV 3 )/2. Wskazówka: cu3 = 1 i 1 H-cu+cu2 =
0.
17. Wylicz sumę Xo<ck<mLx + V mJ, gdzie x ^ 0, przez wstawienie sumy
k/m ] zamiast |_x + k/m j i wysumowanie najpierw wzglę­
dem k. Czy wzór ( 3 .2 6 ) daje identyczną odpowiedź?
18. Udowodnij, że błąd przybliżenia S z wyrażenia ( 3 .3 0 ) jest równy co naj­
wyżej [a - 1 v ]. Wskazówka: Pokaż, że we wzorze nie występują małe war­
tości j.
Ćwiczenia domowe
19. Znajdź warunek konieczny i dostateczny na to, by liczba rzeczywista b >
1
spełniała równość
|logb xJ = [logb |xJJ
dla wszystkich liczb rzeczywistych x ^ 1 .
20. Znajdź dla x > 0 sumę wszystkich wielokrotności x znajdujących się w
przedziale domkniętym [ a . . (3].
2 1 . Jak wiele
liczb postaci 2m, gdzie 0 ^ m ^ M., zaczyna się w zapisie
dziesiętnym od cyfry 1 ?
2 2 . Oblicz sumy Sn =
Ln / 2k + W 1
= I k ^ i 2k |_n/2k + \ \ 2.
23. Pokaż, że n-ty wyraz ciągu
1,2,2,3,3,3,4,4,4,4,5,5,5,5,5,...
jest równy [\/2 n +
. (Ciąg zawiera dokładnie m wystąpień liczby m.)
24. W zadaniu 13 dowiedziono interesującą własność dwóch zbiorów z po­
wtórzeniami Spec(a) i Spec(a/(<x— 1)), gdzie a jest dowolną liczbą nie­
wymierną większą niż 1. Jaką ciekawą własność (znajdź i udowodnij)
spełniają zbiory z powtórzeniami Spec(a) i Spec(cx/(cx+l)), gdzie a jest
dowolną dodatnią liczbą niewymierną?
25. Czy prawdą jest, że liczby Knutha zdefiniowane za pomocą rekuren­
cji ( 3 . 1 6 ) spełniają dla wszystkich liczb naturalnych nierówność* Kn ^ rt?
26. Pokaż, że liczby Flawiusza ( 3 .2 0 ) spełniają nierówność
27. Udowodnij, że nieskończenie wiele liczb
zdefiniowanych rekurencją
( 3 .2 0 ) jest parzystych i nieskończenie wiele jest nieparzystych.
28. Rozwiąż rekurencję
ao = 1 ;
a n = an_i + lyarL-iJ,
gdzie n > 0 .
29. Pokaż, że oprócz nierówności (3 .3 1 ), zachodzi nierówność
D(<x,n) ^ D(cx'> L^nJ) —cc-1 —2.
30. Wykaż, że dla m większego niż 2 rozwiązaniem rekurencji
X0 = m ,
"
Xn = X2 _, —2,
gdy n > 0,
jest Xn = [a 2"”!, gdzie oc + a - 1 = m i oc > 1. Na przykład gdy m = 3,
rozwiązaniem jest
Xn =
r ^ 2 TL+1 n
1>
x
1 +
= ----2 ---- ’
2
Ot =($> .
‘31. Czy prawdą jest, że |xj + [y\ + |x + yj ^ [2x\ + [2yJ?
Widzę niezgodność
pomiędzy tą
nierównością
a (3-3i)-
|3 . Funkcje*całkow itolłczbow e
32. Niech ||x|| = min(x — [xj, [x] —x) oznacza odległość dzielącą x od naj­
bliższej liczby całkowitej. Jaka jest wartość sumy
X
2l
*/2
k il2
(Zauważ, że suma ta może być podwójnie nieskończona. Jeśli na przykład
x = 1 / 3 , to wyrazy sumy są niezerowe zarówno, gdy k —» —oo, jak i gdy
k —> + 0 0 .)
Zadania egzaminacyjne
33. Na szachownicy 2 n x 2 n został narysowany symetrycznie okrąg o średnicy
2n — 1. Dla n = 3 otrzymamy następujący rysunek:
Uprość, lecz nie
zmieniaj wartości
a) Ile pól szachownicy zawiera fragment okręgu?
b) Znajdź funkcję f (tl, k) taką, że dokładnie
^(n >
pól szachow­
nicy jest w całości zawarte w kole.
34. Niech f(n) = ££=1 \ lgk\.
a) Znajdź postać zwartą dla f (n), gdy n ^ 1.
b) Udowodnij,"że^ówność f(n) = n — 1 + f(|"n/2~|) + f([n/ 2J) zachodzi
dla wszystkich n ^ 1 .
35. Uprość wyrażenie [ ( n + 1 ) 2 n! ej mod n.
36. Zakładając, że n jest liczbą naturalną, znajdź postać zwartą sumy
1
L
2L
1gKl4 L
1g 1g lcJ
1 < k < 2 21
37. Udowodnij tożsamość
m +k
n ;j - a )
L
-
m2
n _
m in(m mod n, (—m) mod n)
n
dla wszystkich dodatnich liczb całkowitych m i n .
38. Niech x i , . . . , xn będą takimi liczbami rzeczywistymi, że równość
Y
k =1
Lm *kJ =
m )
Xk
■ l^k^n
jest spełniona dla wszystkich dodatnich liczb całkowitych m. Udowodnij
coś interesującego o x-|, . . . , xn .
39. Udowodnij, że podwójna suma Z o ^ i o g ^ Ho<j<i>
)/t'lc+11 jest
równa (b — 1 ) ( Llogb xj + 1 ) + [Y| — 1 , gdzie x 5: 1 jest liczbą rzeczywistą,
a b > 1 liczbą całkowitą.
40. Spiralna funkcja a(n), pokazana na poniższym rysunku, przyporządko­
wuje liczbie naturalnej rt parę liczb całkowitych (x(rt),'y(rt)) . Na przy­
kład liczbie rt = 9 przyporządkowuje parę (1,2).
Ludzie na
południowej półkuli
używają innej
spirali.
0
7
5
6
a) Udowodnij, że dla m = |_V^J zachodzi
x (n ) = (—
—m (m + 1 )) • [[ 2 v/tiJ jest parzyste] +
Znajdź podobny wzór dla y (n ). Wskazówka: Podziel spiralę na seg­
menty Wic, Sic, t k, Nk określone równościami |_2 A/rtJ = 4k—2 , 4k—1 ,
4k, 4 k + 1 .
b) Udowodnij, że mając a(rt), możemy wyliczyć rt wzorem
rt = (2 k ) 2 ± (2 k + x(n) H -(tl)) ,
k = max(|x(n)|, |-y(rt)|).
Podaj, kiedy używamy + , a kiedy —.
Z adania d odatkow e
41. Niech f i g będą rosnącymi funkcjami takimi, że zbiory {f (1), f ( 2 ) ,...}
i
{g(1), g ( 2 ) ,...} są podziałem zbioru dodatnich liczb całkowitych. Za­
łóżmy, że dla wszystkich rt > 0 funkcje f i g są związane warunkiem
g(rt) = f(f(rt)) + 1 . Udowodnij, że f(rt) = |_rLct>J i g(rt) = |tu|)2 J, gdzie
4> = (1 + V '5 )/2 .
42. Czy istnieją liczby rzeczywiste oc, |3 i y takie, że Spec(a), Spec(|3) i
Spec(y) tworzą podział zbioru dodatnich liczb całkowitych?
43. Znajdź interesującą własność liczb Knutha, przez rozwinięcie rekurencji
(3-i6).
...... .
13. Funkcje całkow itoliczbow e
W
,£
^
*v
i
*
W
s
7
*
i
122\
44. Pokaż, że istnieją liczby całkowite o ^ i dj^ takie, że
Q(q) = DP (q)
n - . +, ddu(q)
q-i
= nD(c,)
n ++ dr i(q)
n
q
d la n > 0
gdzie D ^ ' jest rozwiązaniem rekurencji ( 3 .2 0 ). Zastosuj ten fakt, by
przedstawić rozwiązanie uogólnionego problemu Flawiusza w postaci:
Jq(n) = 1 + d jcq) + q ( n —a{,q)),
dla a[q) ^ n < a [ ^ , .
45. Zastosuj metodę z ćwiczenia 30, by znaleźć rozwiązanie rekurencji
Yo = m ,
Yn = 2Y2
n - 1! - 1 ,
dla n > 0,
gdzie m jest dodatnią liczbą całkowitą.
46. Udowodnij, że jeśli rt = [(a/2 + a/2
) m j , gdzie m i l są liczbami natu­
ralnymi, to [y / 2n {n + 1 )J = [ ( \ / 2 l+1 + \ / 2 l )rnj. Użyj tej zadziwiającej
własności, by znaleźć postać zwartą rekurencji
Lo = a ,
a > 0 jest liczbą całkowitą;
u
dla n > 0 .
= [ y 2 L n—i(L n —1 + 1 )J ,
Wskazówka: [ y /2 n (n + 1 )J = \_\/2{n + jlJ •
47. O funkcji f(x) powiemy, że jest pow ielająca, jeśli dla każdej dodatniej
liczby całkowitej m spełniona jest równość
f(mx) — f(x) + f (x +
H-------h f (x +
•
Znajdź warunek konieczny i dostateczny, który musi spełniać liczba rze­
czywista c, by następujące funkcje były funkcjami powielającymi:
a) f(x) = x + c.
b) f(x) = [x + c jest liczbą całkowitą].
c)
f(x) =max(|_x_|,c).
d) f(x) = x + c|_xj — j[ x nie jest liczbą całkowitą].
48. Udowodnij tożsamość
x 3 = 3x[x|_x_|J + 3{x}{x|_xJ} + {x}3 —3|_xJ |x [xj J + |_xj3 ,
i
pokaż, jak osiągnąć podobne wzory dla xn , gdy rt > 3.
49. Jakie liczby rzeczywiste O ^ a < 1 i p ^ O da się jednoznacznie wyzna­
czyć ze zbioru z powtórzeniami
{ [naj + |n|3j | rt > 0 } ?
P ro b lem y badaw cze
50. Znajdź warunek konieczny i dostateczny spełniany przez liczby rzeczywi­
ste oc i |3 dające się jednoznacznie wyznaczyć ze zbioru z powtórzeniami
postaci
{ |_|uaj Pj | ti > 0 } .
51. Niech x będzie liczbą rzeczywistą nie mniejszą niż <f) = ^(1 + y/5). Roz­
wiązanie rekurencji
Z 0 (x)
x,
Zn (x) — Z-tl—i (x ) 2 — 1 ,
dla n > 0,
można zapisać jako Zn (x) = [f(x)2n] , jeśli x jest liczbą całkowitą i
f(x) =
lim Zn (x)1/2" ,
n —t^oo
ponieważ w tym przypadku Zn (x) — 1 < f(x )2n < Zn (x). Jakie inne
ciekawe własności ma funkcja f(x)?
52. Niech zbiór z powtórzeniami
Spec(a;|3) = {|_a + |3J,|_2 a + |3J, |3 a + |3J, . . . }
będzie uogólnieniem zbioru Spec(a) = Spec(a;0) dla danych nieujem­
nych liczb rzeczywistych oc i p. Czy prawdą jest, że jeśli m ^ 3, to zbiory z
powtórzeniami S p ec(a i; P i), Spec(a 2 ; P2 ), . . . , Spec(am; pm) są podzia­
łem zbioru dodatnich liczb całkowitych i jeśli liczby ai < a 2 < • • • < a m
są wymierne, to
<*k =
2m - 1
2 k -i
’
dla 1 ^ k ^ m ?
53. Algorytm Fibonacciego (ćwiczenie 9) jest „zachłanny” w tym sensie, że
wybiera w każdym kroku najmniejsze możliwe q. Jest znany bardziej
skomplikowany algorytm, w którym każdy ułamek m /n o nieparzystym
mianowniku n może być przedstawiony jako suma różnych ułamków egip­
skich 1/qi + • • • + l/qic o nieparzystych mianownikach. Czy dla takiej
reprezentacji zachłanny algorytm zawsze się zatrzyma?
f 4 ] Teoria liczb
\ Innymi słowy: bądź
gotów na zatonięcie.
Liczby całkowite stanowią podstawę matematyki dyskretnej, której w tej
książce poświęcamy szczególną uwagę. Zrozumiałe więc jest, że chcemy skupić
się nieco na teorii liczb, ważnej gałęzi matematyki, związanej z własnościami
liczb całkowitych.
Na wody teorii liczb wpłynęliśmy już w poprzednim rozdziale, gdy ba­
daliśmy działania binarne ‘mod’ i ‘NW D’. Zanurzmy się teraz na serio w ten
dział matematyki.
4.1. P od zieln ość________________________________
Mówimy, że m dzieli n (albo n jest podzielne przez m), gdy m > 0 i iloraz
m /n jest liczbą całkowitą. Zależność ta stanowi podstawę całej teorii liczb,
zatem warto wprowadzić specjalną notację na jej oznaczenie. Piszemy zatem
m \n
żadna liczba nie
jest podzielna
przez —1 (ściśle
rzecz ujmując).”
Graham, Knuth
i Patashnik [161]
m >
0
i n = mk dla pewnego całkowitego k .
(4 . 1 )
(Na dobrą sprawę częściej stosowana w literaturze jest notacja ‘m |n \ Pionowe
kreski mają jednak zbyt wiele znaczeń— oznaczają wartości bezwzględne,
prawdopodobieństwa warunkowe, są używane przy definicjach zbiorów itd. —
tymczasem znak „\” jest prawie nie używany. Co więcej, notacja ‘m \n ’ wy­
wołuje wrażenie, że m jest mianownikiem rozważanego ilorazu. Będziemy
więc śmiało pochylali nasz symbol podzielności do tyłu. Będziemy też pisali
‘mXn’, jeśli m nie dzieli n.
Istnieje również podobna relacja, „n jest wielokrotnością m,” która ozna­
cza prawie to samo, z tym, że m nie musi być dodatnie. W takim przypadku
mamy na myśli po prostu to, że istnieje liczba całkowita k taka, że n = mk.
W związku z tym na przykład istnieje tylko jedna wielokrotność liczby 0,
mianowicie samo 0, ale nic nie jest podzielne przez 0. Każda liczba jest wie­
lokrotnością —1 , ale żadna liczba nie jest podzielna przez — 1 (ściśle rzecz
ujmując). Definicje te można zastosować do dowolnych liczb rzeczywistych,
np. 2n jest podzielne przez n. Niemniej jednak będziemy ich używali prawie
zawsze w sytuacjach, w których zarówno m, jak i n są liczbami całkowitymi.
W końcu zajmujemy się teorią liczb.
Największy wspólny dzielnik (NWD) dwóch liczb całkowitych m i n jest
to największa liczba całkowita, która dzieli obie liczby:
N W D (m ,n ) = m ax{k | k \m
i
k \u } .
( 4 .2 )
Na przykład NW D (12,18) = 6 . To pojęcie jest znane— już czwartoklasiści
uczą się wyciągać wspólny dzielnik z licznika i mianownika ułamka m /n ,
w celu przedstawienia go w postaci nieskracalnej: 12/18 = (1 2 /6 )/(1 8 /6 ) =
2/3. Zauważmy, że dla n > 0 zachodzi N W D (0,n ) = n, ponieważ każda
liczba dodatnia dzieli 0 , a liczba n jest największym dzielnikiem samej siebie.
Wartość NW D (0,0) pozostawiamy nie zdefiniowaną.
Innym spotykanym pojęciem jest najmniejsza wspólna wielokrotność
(NWW),
N W W (m ,n ) = m in{k | k > 0,
m \k
i
n \k } ,
( 4 .3 )
którą pozostawiamy nie zdefiniowaną dla m ^ 0 lub n ^ 0. Znający aryt­
metykę z łatwością rozpoznają tu najmniejszy wspólny mianownik, spoty­
kany przy dodawaniu dwóch ułamków z mianownikami odpowiednio m i n.
Na przykład NW W (12,18) = 36, a czwartoklasiści wiedzą, żg jz + jg =
§£ + jg = | | . Pojęcie NWW odpowiada w pewnym sensie pojęciu NWD, ale
nie poświęcimy mu równej uwagi, gdyż NWD ma ładniejsze własności.
Jedną z najładniejszych własności NWD jest łatwość jego obliczania za
pomocą metody liczącej sobie 2300 lat i nazywanej algorytmem Euklidesa.
Aby obliczyć N W D (m ,n ) dla zadanych 0 ^ m < n, algorytm Euklidesa
korzysta z następującej rekurencji:
N W D (0,n ) = n ;
N W D (m ,n ) = NW D (n mod m, m ) ,
<*§%
dla m > 0.
(4 .4 )
Tak więc, na przykład, N W D(12,18) = NW D (6,12) = N W D (0,6) = 6 .
Przedstawiona rekurencją jest prawidłowa, gdyż każdy wspólny dzielnik m
oraz n musi być także dzielnikiem zarówno m, jak i n mod m, które z kolei
jest równe n — [n /m jm . Nie wygląda na to, aby istniała jakakolwiek rekurencja opisująca N W W (m ,n ), a zarazem będąca choćby w przybliżeniu tak
prosta, jak dla NWD (por. ćwiczenie 2 ).
Algorytm Euklidesa daje nam jeszcze więcej. Możemy rozszerzyć go tak,
aby znalazł liczby całkowite m / i n / spełniające równość
m /m + n ' n = N W D (m ,n ).
(4 -5 )
W Anglii nazywa
się go ‘hcf’ (highest
common factor),
a w USA ‘gcd’
(greatest common
divisor).
Tylko proszę nie
pomylić jej z
największą wspólną
wielokrotnością.
msMmmmmmKmmmĘHHiKm
|4 . Teoria liczb
(Rzecz jasna m/
oraz n ' mogą być
ujemne.)
Oto w jaki sposób. Jeśli m = 0, to bierzemy po prostu m / = 0 i n ' = 1.
W przeciwnym przypadku przyjmujemy r = n mod m i stosujemy tę metodę
rekurencyjnie dla r i m zamiast m i n , wyliczając f i r n takie, że
rr + m m = N W D (r,m ).
Ze względu na to, żer = n —[n /m jm , a zarazem NW D(r, m) = N W D (m ,n ),
równanie powyższe daje nam
r ( n — [n /m jm ) + m m = N W D (m , n ) .
Lewą stronę tego równania można tak zapisać, aby od razu było widać zależ­
ność między m i n:
(m — [n /m jr ) m + r n = N W D (m ,n );
zatem m/ = m — [n /m jr i n ' = r są tymi liczbami, których poszukujemy w
celu spełnienia równania (4.5). W naszym ulubionym przykładzie, gdzie m =
12, n = 18, metoda ta daje nam 6 = 0-0 + 1- 6 = 1*6 + 0-12 = (—1)*12 + 1 -18.
Czemu jednak istnienie liczb spełniających równanie (4.5) miałoby być
takim ładnym wynikiem? Przede wszystkim dlatego, że w istocie liczby m/
i n ' dowodzą, że algorytm Euklidesa dostarcza prawidłowej odpowiedzi w
każdym przypadku. Załóżmy, że nasz komputer po żmudnych obliczeniach
da nam odpowiedź, że N W D (m ,n ) = d i że m /m + n ' n = d. My jednak
jesteśmy sceptyczni i podejrzewamy, że istnieje większy, pominięty przez nas
wspólny dzielnik liczb m i n . Tak jednak zdarzyć się nie może, ponieważ
każdy dzielnik liczb m i n musi jednocześnie dzielić liczbę m /m + n 'n , więc
także liczbę d. Skoro tak, to dzielnik ten nie może przekraczać d. Idąc dalej,
możemy bez trudu sprawdzić, że d dzieli zarówno m, jak i n. (Algorytmy,
które same podają swoje uzasadnienie, nazywają się samouzasadniającymi.)
Równanie (4.5) będzie wielokrotnie wykorzystywane w pozostałej części
tego rozdziału. Jednym z jego ważnych wniosków jest następujące minitwierdzenie:
k \m
i
k \n
k \N W D (m ,n ).
(4 .6 )
(Dowód: Jeśli k dzieli zarówno m, jak i n, to dzieli również m /m + n 7n, a
zatem dzieli także N W D (m ,n ). Na odwrót, jeśli k dzieli N W D (m ,n ), to
dzieli któryś z dzielników m oraz któryś z dzielników n, zatem musi dzielić
także m i n. Nigdy nie było dla nas niespodzianką, że każdy wspólny dzielnik
m i n musi być mniejszy lub równy ich największemu wspólnemu dzielni­
kowi; wynikało to wprost z definicji NWD, teraz jednak wiemy, że każdy ich
wspólny dzielnik jest dodatkowo dzielnikiem ich NWD.
Będziemy czasami wykonywali sumowanie względem wszystkich dzielni­
ków liczby n. W takim przypadku wygodniej jest użyć poręcznego wzoru
całkowite n > 0 .
m \n
(4 .7 )
rn\n
który zachodzi ze względu na to, że kiedy m przebiega przebiega wszystkie
wartości dzielników liczby n, to n /m także przebiega ten zbiór wartości. Na
przykład jeśli n = 1 2 , to cii + 0.2 + 0 3 + 0 4 + 0.6 + 0 1 2 = clm + <*6 + 0 4 +
a3 + a2 + a i .
Możemy przytoczyć tu nieco ogólniejszą tożsamość
Y
=
m \n
Y Y a m [n = m k ],
k
(4 .8 )
m>0
którą można bezpośrednio wyprowadzić z definicji ( 4 . 1 ). Jeśli n jest dodat­
nie, to prawa strona (4 .8 ) wynosi
on/k i z tożsamości (4 .8 ) wynika
wzór ( 4 .7 ). Równanie ( 4 .8 ) jest przy tym także spełnione dla n ujemnych.
(W takim przypadku niezerowe wyrazy po prawej stronie występują wówczas,
gdy k jest przeciwne do pewnego dzielnika liczby n.)
Co więcej, sumę podwójną względem dzielników można „przestawić”,
zgodnie z prawem
I I
Clk >m —
m \n k \m
z z
(4-9)
O k .k l •
k \n l\(n /k )
Na przykład prawo to przybiera następującą postać dla n = 12:
0 -1,1 +
(cl 1,2 + 0 -2 , 2 ) +
( 0 + 3 + 0 3 ,3 )
+ (di }ą + 0-2,4 + 0 4 ,4 ) + (di
+
+ <12,6 + 0-3,6 + 06,e]
( 0 1 , 1 2 + 0 2 , 1 2 + 0 3 , 1 2 + O4 1 2 + 0 6 , 1 2 + 0 1 2 , 1 2 )
= ( 0 -1,1 + Oi,2 + Oi}3 + 0-1,4 + 0 .1,6 + 0 1 ,12 )
+
( 0 2 ,2 + 0 2 ,4 + 0 2 ,6 + 0 2 ,1 2 ) +
+
( 0 4 , 4 + O4 J 2 ) +
( 0 3 ,3 + 0 3 ,6 + 0 3 ,1 2 )
(06,6 + 06,12) +
012,12 •
Równanie ( 4 .9 ) możemy udowodnić za pomocą notacji Iversona. Lewa strona
jest równa
j,l
k,m > 0
j
k ,l> 0
a prawa
j,m k ,l> 0
m k ,l> 0
co daje to samo, z dokładnością do przemianowania indeksów. Przykład ten
pokazuje, że metody, których nauczyliśmy się w rozdziale 2 , będą użyteczne
także w trakcie badań nad teorią liczb.
4.2. Liczby pierw sze
A co z p w słowie
‘pierwsza’ ?
Dodatnia liczba naturalna p nazywana jest liczbą pierw szą, gdy ma dokład­
nie dwa dzielniki, a mianowicie 1 oraz p. W pozostałej części tego rozdziału
rezerwujemy symbol p dla oznaczenia liczby pierwszej. Symbolu tego bę­
dziemy używali bez przypominania za każdym razem, że chodzi nam o liczbę
pierwszą. Umawiamy się, że 1 nie jest liczbą pierwszą. Ciąg liczb pierwszych
zaczyna się więc następująco:
2 ,3 ,5 , 7, 11, 13, 17, 19, 23, 29, 31,37, 41, . . . .
\
Niektóre liczby wyglądają, jak pierwsze, ale nimi nie są, np. 91 (= 7 -1 3 ) lub
161 (= 7*23). Liczby te oraz wszystkie inne mające 3 lub więcej dzielników
nazywamy liczbami złożonymi. Każda liczba większa niż 1 jest albo pierwsza,
albo złożona.
Liczby pierwsze mają ogromne znaczenie. Stanowią podstawowe cegiełki,
z których są zbudowane liczby naturalne. Każda dodatnia liczba naturalna rt
może być przedstawiona jako iloczyn liczb pierwszych:
n = pi . . . p n
= flv .
Pi <
.
<
(4-io]
k =1
Na przykład 12 = 2-2 -3 ; 11011 = 7-11-11-13; 11111 = 41 -271. (Iloczyny
oznaczane za pomocą notacji Yl są analogiczne do sum przedstawianych w
notacji Y_} jak to było wyjaśnione w ćwiczeniu 2.25.) Jeśli m = 0, to rozwa­
żany iloczyn, jako pusty, przybiera wartość 1 na mocy definicji. Wyjaśnia to,
jak możemy otrzymać liczbę rt = 1 reprezentowaną w postaci ( 4 . 1 0 ). Roz­
kład na czynniki pierwsze jest zawsze możliwy, ponieważ jeśli n > 1 nie jest
liczbą pierwszą, to ma dzielnik rti taki, że 1 < rti < rt; możemy więc napi­
sać n = u i -ri2 , a dalej, na mocy indukcji wiemy, że rti i rtz mogą zostać
przedstawione jako iloczyny liczb pierwszych.
Co więcej, rozwinięcie (4 . 1 0 ) jest jednoznaczne. Istnieje tylko jeden spo­
sób, w jaki liczbę rt możemy zapisać jako iloczyn liczb pierwszych w niemalejącym porządku. Stwierdzenie to nazywane jest podstawowym twierdzeniem
arytmetyki i wygląda tak naturalnie, że nie wiadomo, co tu w ogóle jest do do­
wodzenia. W jaki sposób mogłyby istnieć dwa różne zbiory liczb pierwszych
o tym samym iloczynie? W istocie nie mogą, ale bynajmniej nie wynika
to wprost „z definicji liczb pierwszych.” Na przykład, jeśli rozważymy zbiór
wszystkich liczb rzeczywistych postaci m + nVTO dla całkowitych m i u, to
iloczyn dowolnych dwóch takich liczb jest znów liczbą z tego zbioru. Mo­
żemy więc wprowadzić pojęcie „liczby pierwszej” w tym zbiorze, nazywając
tak każdą liczbę, która nie może być rozłożona w nietrywialny sposób. Liczba
6 ma dwie reprezentacje, 2-3 = (4 + VTÓ)(4 —a/10 ); co więcej, ćwiczenie 36
pokazuje, że liczby 2, 3, 4 + y/TÓ i 4 — vTÓ są „pierwsze” w tym zbiorze.
Widać więc, że powinniśmy przeprowadzić precyzyjny dowód tego, że
rozkład (4 . 1 0 ) jest jednoznaczny. Oczywiście dla rt = 1 mamy niewątpliwie
jedyną możliwość rozkładu, gdyż iloczyn musi być w tym przypadku pusty.
Załóżmy więc, że rt > 1 oraz że wszystkie liczby mniejsze od rt rozkładają
się w jednoznaczny sposób. Przypuśćmy, że istnieją dwa rozkłady
n = Pi-.-Pm =
qi . . . q k ,
Pi^***^Pm
i
qi^--*^qk,
gdzie wszystkie liczby p i q są pierwsze. Udowodnimy, że pi = q i. Gdyby
tak nie było, wówczas ze względu na symetrię moglibyśmy założyć, że pi <
-qi, co oznaczałoby, że pi jest mniejsze od wszystkich q. Ponieważ jednak
pi oraz qi są pierwsze, więc ich NWD musi być równy 1. W takim razie
samouzasadniający się algorytm Euklidesa znajdzie liczby a i b takie, że
api + b q i = 1 . Zatem
apiq2 ...qk + bqiq2 ...qk =
q2 . . . q k .
Liczba p 1 dzieli oba składniki po lewej stronie (drugi z nich ze względu na to,
że dzieli qi . . . qk = rt), jest więc także dzielnikiem prawej strony, q2 . . . qkW związku z tym liczba q 2 . . . qk/Pi jest całkowita, a jako mniejsza od rt ma
jednoznaczny rozkład (założenie indukcyjne), w którym pi musi wystąpić.
Sprzeczność, do której doszliśmy, oznacza, że p 1 musi być w końcu równe
q i . Możemy zatem podzielić oba rozkłady przez pi otrzymując p 2 .. .p m =
q2 . . . qk < rt. Na mocy założenia indukcyjnego pozostałe dzielniki muszą
być sobie równe, co kończy nasz dowód jednoznaczności.
Czasami wygodnie jest podać Podstawowe Twierdzenie Arytmetyki w
nieco innej postaci:
Każda liczba naturalna może być jednoznacznie przedstawiona jako
rt
=
]^ [p np ,
gdzie każde rtp ^ 0 .
( 4 -11)
p
Prawa strona to iloczyn wyliczony względem nieskończonej liczby liczb pierw­
szych, ale dla dowolnego rt prawie wszystkie wykładniki będą równe zeru,
więc odpowiadające im czynniki będą równe 1. Jest to więc w istocie iloczyn
skończony, podobnie jak wiele spośród rozważanych przez nas sum „nieskoń­
czonych” okazywało się skończonymi, gdyż prawie wszystkie ich wyrazy były
równe zeru.
Wzór (4 . 1 1 ) przedstawia n jednoznacznie, możemy więc myśleć o ciągu
(1x2 , 1x3 , 1x5 , . . . ) jako o system ie liczbowym dla zbioru liczb naturalnych.
Taka reprezentacja wykładników liczb pierwszych dla liczby 12, to na przy­
kład ( 2 ,1 ,0 ,0 ,...) , a dla liczby 18 to ( 1 ,2 ,0 ,0 ,...) . Aby przemnożyć dwie
liczby, dodajemy ich reprezentacje wektorowo. Innymi słowy,
k = mn
<ś=>
kp = m p + n p
dla każdego p.
(4 . 1 2 )
W reprezentacji tej mamy też
m \n
mp ^ n v
dla każdego p,
U -^ )
z czego od razu wynika, że
k - N W D (m ,n )
<ś=>
kp = min(mp ,rtp )
dla każdego p;
(4 . 1 4 )
k = N W W (m ,n)
<=>
kp = max(mp ,rtp )
dla każdego p. (4 . 1 5 )
Weźmy na przykład 12 = 2 2 -3 1 i 18 = 2 1 -32. Możemy uzyskać ich najwięk­
szy wspólny dzielnik i najmniejszą wspólną wielokrotność biorąc minimum i
maksimum po ich wspólnych wykładnikach:
NWD(12,18) = 2” ” '2-1' - 3 min(1’2) = 21 -31 = 6;
NWW(12,18) = 2m“ (2'1>-3m“ (1’2) = 22 -32 = 36.
Jeśli liczba pierwsza p dzieli iloczyn m n, to dzieli albo-liczbę m, albo n,
albo obie z nich, na mocy twierdzenia o jednoznacznym rozkładzie. Liczby
złożone nie mają jednak tej własności. Na przykład liczba złożona 4 dzieli
60, ale nie dzieli ani 6 , ani 1 0 . Z prostej przyczyny: dwa czynniki pierwsze
z rozkładu 4 = 2 - 2 znalazły się w różnych częściach iloczynu 60 = 6 • 10 =
(2-3) (2-5), więc 4 nie dzieli żadnej z nich. Liczba pierwsza jest jednak nie­
podzielna, stąd musi dzielić któryś z zadanych czynników.
„Oi npcóroi
a p iO iio l 7r\e to v ę
4.3. P ierw sze przykłady________________________
elcrl n a u r b ę t o v
npoTeOei/Toę
n\f)Q ovę
'KpUTUV
apiOiiCoi'”
Euklides [98]
Tłumaczenie:
„Jest więcej liczb
pierwszych niż
w każdym danym
zbiorze liczb
pierwszych
Ile jest liczb pierwszych? Dużo. W rzeczywistości nieskończenie wiele. Eukli­
des udowodnił to dawno temu jako Twierdzenie 9: 20, w następujący sposób:
Załóżmy, że liczb pierwszych jest tylko skończenie wiele, dajmy na to k —
2, 3, 5, . . . , Pic- W takim razie, rozumował Euklides, powinniśmy przyjrzeć
się liczbie
U
M
= 2 - 3 - 5 - . . . - Pi c
+
1.
Żadna z k liczb pierwszych nie jest dzielnikiem M., gdyż każda dzieli M — 1.
Musi więc istnieć inna liczba pierwsza, która dzieli M; być może samo M jest
liczbą pierwszą. Jest to sprzeczne z założeniem, że 2, 3, . . . , Pk są jedynymi
liczbami pierwszymi, musi ich być więc nieskończenie wiele.
Dowód Euklidesa nasuwa pomysł zdefiniowania liczb Euklidesa za po­
mocą następującej rekurencji:
= e ie 2 . . . e n_i + 1 ,
g d y n ^ l.
(4 . 1 6 )
Początek ciągu wygląda tak:
ei = 1 + 1 = 2;
e 2 = 2 + 1 = 3;
e 3 = 2 - 3 + 1 = 7;
e4 = 2 -3 -7 + 1 = 43.
Są to wszystko liczby pierwsze, ale kolejna liczba Euklidesa, es, jest równa
1807 = 13-139. Okazuje się, że co prawda liczba e& = 3263443 jest pierwsza,
ale liczby
e 7 = 547-607-1033-31051;
e 8 = 29881-67003-9119521-6212157481
są złożone. Wiadomo, że liczby eę, . . . , e w są złożone i zapewne pozostałe
liczby en są również złożone. Niemniej jednak liczby Euklidesa są parami
względnie pierw sze, czyli
N W D (em,e n ) = 1,
gdym ^n.
Algorytm Euklidesa (i co jeszcze?) gwarantuje nam to w trzech krótkich
krokach, ponieważ en mod em = 1 dla rt > m, a zatem:
N W D (em,e n ) = N W D (1 ,em) = N W D (0,1) = 1.
W związku z tym, jeśli przyjmiemy, że q3- jest najmniejszym czynnikiem
pierwszym liczby ej dla każdego j ^ 1 , to wszystkie liczby qi, q2, q3 , . ..
będą różne. Jest to ciąg nieskończenie wielu liczb pierwszych.
Zatrzymajmy się, aby rozważyć liczby Euklidesa z punktu widzenia roz­
działu 1?. Czy możemy wyrazić en w postaci zwartej? Rekurencją ( 4 . 1 6 ) może
być uproszczona przez usunięcie trzech kropek: Jeśli rt > 1, to
Sn = e-| . . . en_ 2 eTL_i + 1 = (en_i — 1 )e-n._i + 1 = e 2 _-| — e ^ -i + 1 .
Liczba en ma mniej więcej dwa razy tyle cyfr, co en_ i. W ćwiczeniu 37
dowodzimy, że istnieje stała E « 1,264 taka, że
ń
V
Natomiast ćwiczenie 60 dostarcza nam podobnego wzoru, który generuje wy­
łącznie liczby pierwsze:
Vn =
[P 3nJ ,
( 4 - 18 )
dla pewnej stałej P. Równości takie jak ( 4 . 1 7 ) i (4 . 1 8 ) nie mogą być niestety
uznane za napisane w postaci zwartej, ponieważ stałe E i P są wyliczone z
ciągów* liczb en i pn w podejrzany sposób. Nie jest znany (ani podejrzewany
0 istnienie) żaden wzór wiążący te stałe z innymi znanymi stałymi matema­
tycznymi.
Tak naprawdę nikt nie wie, czy istnieje jakikolwiek wzór generujący
dowolnie duże liczby pierwsze i tylko liczby pierwsze. Informatycy z konsor­
cjum Chevron Geosciences dokopali się do matematycznej ropy w r. 1984. Za
pomocą programu stworzonego przez Davida Słowińskiego odkryli testując
superkomputer Cray X-MP największą znaną wtedy liczbę pierwszą
2216091 _ 1
Albo nawet więcej
w chwili,
gdy to czytasz.
Liczbę tę łatwo jest wyliczyć na dowolnym mikrokomputerze w ciągu paru
milisekund. Wszystkie bowiem komputery używają do reprezentacji liczb za­
pisu dwójkowego, a ta liczba, w zapisie dwójkowym, to po prostu ciąg jedy­
nek: (11 . . . 1) 2 - Wszystkie 216091 bitów tej liczby to jedynki. Dużo trudniej
natomiast pokazać, ze względu na jej wielkość, że liczba ta jest pierwsza. Na­
wet wyrafinowane algorytmy potrzebują bowiem paru minut, aby wyrazić tę
liczbę w postaci dziesiętnej na komputerze klasy PC. Wydrukowana składa
się z 65050 cyfr dziesiętnych, a wysłanie takiego wydruku pocztą kosztowa­
łoby w USA 78 centów.
Nawiasem mówiąc 2 216091 —1 jest liczbą ruchów niezbędną do przełożenia
216091 krążków wieży z Hanoi. Liczby postaci
2P —1 ,
gdzie p jest liczbą pierwszą, nazywane są liczbami M ersen n e’a, upamiętnia­
jąc w ten sposób Ojca Marina Mersenne’a, który badał niektóre ich własności
w XVII wieku [269]. Liczby pierwsze Mersenne’a znane przed r. 1998 odpo­
wiadają wykładnikom p = 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607,
1279, 2203, 2281, 3217, 4253, 4423, 9689, 9941, 11213, 19937, 21701, 23209,
44497, 86243, 110503, 132049, 216091, 756839, 859433, 1257787, 1398269
1 2976221.
Liczba 2n — 1 nie może być pierwsza, jeśli rt jest liczbą złożoną, gdyż
2 km — 1 jest podzielne przez 2 m — 1 :
2 km — i
=
( 2 m — l) ( 2 m (k- 1 ^ + 2 m (k-2) -1______b - 1 ) .
Jednak nie zawsze liczba 2P — 1 jest pierwsza dla pierwszego wykładnika p;
2 11 — 1 = 2047 = 23*89 jest najmniejszą ze znanych takich liczb. (Mersenne
wiedział o tym.)
Szukanie rozkładów liczb lub sprawdzanie czy są pierwsze, są dziś gorą­
cymi" tematami. Podsumowanie tego, co było wiadome do r. 1981, można zna­
leźć w rozdziale 4.5.4 książki [208]; później pojawiło się jeszcze wiele nowych
rezultatów. Na stronach 391-394 wspomnianej książki znajdziemy konkretną
metodę sprawdzania, czy liczba Mersenne’a jest pierwsza.
W ciągu ostatnich 2 wieków największa znana liczba pierwsza była zawsze
liczbą Mersenne’a. Niezależnie od tego, że znanych jest raptem niespełna 40
liczb pierwszych Mersenne’a. Wiele ludzi szuka następnych, ale jest to coraz
trudniejsze. Ci więc, którzy są naprawdę zainteresowani zdobyciem sławy
(jeśli nie fortuny) i znalezieniem się w Księdze rekordów Guinessa, mogą
popróbować liczb postaci 2nk + 1, dla małych wartości k w rodzaju 3 lub 5.
To, czy liczby tej postaci są pierwsze, czy nie, daje się sprawdzać równie
łatwo, jak w przypadku liczb Mersenne’a; ćwiczenie 4.5.4-27 z [208] zawiera
odpowiednie szczegóły.
Nie odpowiedzieliśmy jeszcze w pełni na nasze początkowe pytanie, ile
jest tak naprawdę liczb pierwszych. Oczywiście jest ich nieskończenie wiele,
ale wiemy, że niektóre zbiory nieskończone są „gęstsze” niż inne. Na przy­
kład pośród liczb naturalnych mamy nieskończenie wiele liczb parzystych
oraz nieskończenie wiele liczb będących kwadratami innej liczby naturalnej,
tzw. pełnych kwadratów, niemniej jednak pod pewnymi względami liczb pa­
rzystych jest więcej niż takich pełnych kwadratów. Jeden z takich względów
może dotyczyć wielkości n-tej wartości rozważanego ciągu. W naszym przy­
padku n-t a liczba parzysta, to 2u, a ri-ty pełny kwadrat, to u 2. Ponieważ
2n jest znacznie mniejsze niż rt2 dla dużych n, więc możemy powiedzieć,
że wśród liczb naturalnych znacznie więcej jest liczb parzystych niż pełnych
kwadratów.
Z podobnego punktu widzenia można rozważać liczbę wartości nie prze­
kraczających x. Istnieje [x / 2\ takich liczb parzystych i [\/xJ takich pełnych
kwadratów, a ponieważ x / 2 jest znacznie większe dla dużych x od ^/x, więc i
z tego punktu widzenia możemy twierdzić, że liczb parzystych jest znacznie
więcej.
Co możemy powiedzieć o liczbach pierwszych ze względu na te dwa po­
dejścia? Okazuje się, że ri-ta liczba pierwsza Pn jest równa mniej więcej n
razy logarytm naturalny z rt:
Dziwne. Zdawało
mi się, że jest tyle
samo liczb
parzystych, co
pełnych kwadratów,
gdyż istnieje
odpowiedniość 1-1
między tymi
zbiorami.
Pn ~ n l n n .
(Symbol
może być odczytany jako „jest asymptotyczne do”. Oznacza on,
że granica ilorazu Pn/rt lnrt jest równa 1 przy n dążącym to nieskończoności.)
i
Podobnie, dla określenia liczby tc( x ) liczb pierwszych nie przekraczają­
cych x mamy coś, co się nazywa twierdzeniem o liczbach pierwszych:
7T(x) ~
ln x
Udowodnienie tych dwóch faktów wykracza poza zakres tej książki, jakkol­
wiek z łatwością można wykazać, że każdy z nich pociąga za sobą drugi.
W rozdziale 9 omówimy szybkości, z jakimi funkcje dążą do nieskończono­
ści i przekonamy się, że funkcja rtln n , będąca przybliżeniem P(n), zawiera
się asymptotycznie pomiędzy 2n a n 2. Liczb pierwszych jest więc mniej niż
parzystych, ale więcej niż pełnych kwadratów.
Wzory te zachodzą jedynie asymptotycznie przy rt lub x dążących do
oo, ale można podać dokładniejsze oszacowania. Rosser i Schoenfeld [313]
wyprowadzili na przykład poręczne nierówności
ln x — |
< ln x — ^ ,
dla x ^ 67; (4 . 1 9 )
n (ln n + l n l n n — | ) < Pn < n(lnrt + l n l n n — ^), dla u ^ 20. ( 4 .2 0 )
Jeśli przyjrzymy się „losowej” liczbie rt, to szanse na to, że będzie ona
pierwsza, mają się mniej więcej jak jeden do Inn. Na przykład jeśli weź­
miemy liczby bliskie 1016, to średnio po I6ln10 « 36,8 próbactrtrafimy
na liczbę pierwszą. (Okazuje się, że istnieje dokładnie 10 liczb pierwszych
w przedziale od 10 16 — 370 do 10 16 — 1.) Wciąż jednak występowanie liczb
pierwszych wykazuje wiele nieregularności. Na przykład wszystkie liczby po­
między Pi P2 . . . Pn + 2, a Pi P2 . . . Pn + Pn+i —1 włącznie są złożone. Istnieje
wiele przykładów bliźniaczych liczb pierwszych p oraz p + 2: (5 i 7, 11 i 13,
17 i .19, 29 i 31, . . . , 9999999999999641 i 9999999999999643, . . . ), ale jeszcze
nikt nie wie, czy takich par jest nieskończenie wiele (zob. Hardy i Wright [181,
§1.4 i §2.8]).
Jedną z prostszych metod obliczenia wszystkich 7t(x) liczb pierwszych
nie większych od x jest skonstruowanie tzw. sita Eratostenesa. Wypisujemy
najpierw wszystkie liczby naturalne od 2 do x. Zakreślamy 2, jako pierw­
szą, i skreślamy wszystkie wielokrotności 2. Następnie, kolejno, zakreślamy
najmniejszą nietkniętą liczbę i znów skreślamy wszystkie jej wielokrotności.
Kiedy każda liczba będzie zakreślona lub skreślona, wówczas zakreślone liczby
będą szukanymi liczbami pierwszymi. Na przykład jeżeli x = 10, to wypisu­
jemy wszystkie liczby od 2 do 1 0 , zakreślamy 2 , skreślamy wielokrotności 2 :
4, 6 , 8 i 10. Teraz 3 jest najmniejszą nietkniętą liczbą, więc zakreślamy ją
i skreślamy 6 i 9. Teraz już liczba 5 jest najmniejsza, więc zakreślamy ją i
skreślamy 10. W końcu zakreślamy 7. Zakreślone liczby, to 2, 3, 5 i 7, jest
więc 7t( 1 0 ) = 4 liczb pierwszych nie przekraczających 10.
135
llfef
't~
.(t 4.4. W sp ó łczy n n ik i rozkład u silni j
4.4. W sp ółczyn n ik i rozkładu silni
Przyjrzyjmy się teraz rozkładowi pewnych ciekawych bardzo dużych liczb,
niewątpliwie złożonych, a mianowicie silni:
rt
n! = 1-2
(4-ai;
= n * .
k=1
Zgodnie z naszą konwencją pusty iloczyn określa 0! jako 1. W związku z
tym rt! = (n — l ) ! n dla każdej liczby całkowitej dodatniej n. Jest to liczba
permutacji u różnych obiektów. Innymi słowy, chodzi tu o liczbę sposobów,
na które można ułożyć rt elementów w ciąg. Mamy n możliwości wybrania
pierwszego elementu; dla każdej z nich mamy n — 1 możliwości wybrania
drugiego; dla każdej z tych rt(n—1 ) możliwości mamy n —2 możliwości wyboru
trzeciego itd. co daje ostatecznie n (n — 1 ) (rt —2 ) . . . ( 1 ) ułożeń wszystkich n
elementów. Oto kilka początkowych wartości funkcji silnia:
“Je me sers de la
notation tres simple
n! pour designer le
produit de nombres
decroissans depuis
n jusqu’a 1’unite,
savoir n (n —1)
n
0
1
2
3
4
5
6
7
8
9
10
( n - 2 ) . . . . 3.2.1.
n!
1
1
2
6
24
120
720
5040
40320
362880
3628800
U emploi continuel
de 1’analyse
combinatoire que je
fais dans la plupart
de mes
demonstrations, a
rendu cette
ńotation/
indispensable.”
Ch. Kramp [228]
Warto znać kilka podstawowych faktów dotyczących silni, takich jak choćby
wartości pierwszych mniej więcej sześciu silni, lub to, że 1 0 ! to nieco więcej niż
3 j miliona. Innym interesującym faktem jest to, że liczba cyfr dziesiętnych
rt! przekracza n, gdy u ^ 25.
Możemy pokazać, że wartość tl!jest całkiem duża za pomocą pomysłu
Gaussa z rozdziału 1 :
n
n!2 = (1 - 2 -. . . - rt)(rt • - 2 -1) = J } k ( n + 1 - k ) .
k=1
Zachodzą przy tym następujące nierówności: n ^ k(rt + 1 —k) ^ | ( n + 1)2,
ponieważ wielomian drugiego stopnia k (n + l —k) = \ (n + 1 )2—(k—\ (n + 1 ) ) 2
przybiera najmniejszą wartość w punkcie k = 1 , a największą wartość w
punkcie k = j (n + 1). Zatem
(n + 1 ):
k=1
k=1
innymi słowy,
n n/2
nl <
( n + 1 )'
Relacja ta pokazuje nam, że silnia rośnie wykładniczo!!
(4 .22;
W celu uzyskania lepszego przybliżenia wartości rt! dla dużych rt możemy
posłużyć się wzorem Stirlinga, który zostanie wyprowadzony w rozdziale 9 :
n! ~ V 2n n (J ^ j
.
(4*23)
Dokładniejsze przybliżenie obejmuje jeszcze asymptotyczny błąd względny:
wzór Stirlinga daje wartość mniejszą od rt! o czynnik rzędu 1/(12rt). Nawet
dla małych wartości rt to ściślejsze przybliżenie jest całkiem dobre. Na przy­
kład wzór Stirlinga ( 4 .2 3 ) daje wartość bliską 3598696 dla rt = 10, co jest o
ok. 0,83% « 1/120 za małe. Niezła rzecz, ta asymptotyka.
Wróćmy jednak do liczb pierwszych. Chcielibyśmy dla danej liczby pierw­
szej p określić jej największą potęgę, która dzieli rt!, czyli chcemy uzyskać
wykładnik przy p w jednoznacznym rozkładzie liczby rt!. Oznaczmy ten wy­
kładnik przez ep (rt!) i zacznijmy nasze badania od małych wartości p = 2 i
rt = 10. Ponieważ 10! jest iloczynem 10 liczb, więc 6 2 ( 1 0 !) może być wyli­
czone przez zsumowanie potęg dwójki, które występują w rozkładach tych 10
liczb. Rachunki te odpowiadają przesumowaniu kolumn następującej tabeli:
1 2 3 4 5 6 7 8 9 10
podzielne przez 2
X
podzielne przez 4
X
podzielne przez 8
potęgi 2
X
0
X
X
X
potęgi 2
5 = |_1 0 / 2 J
X
2 = L10/4J
X
1 - L10/8J
10201030
1
8
(s]imy w kolumnach mają formę czegoś, co się czasem nazywa funkcją calówki
"p(k), ze względu na podobieństwo do calowych linijek ‘
’, w
których coraz krótsze odcinki wyznaczają kolejne ułamki cala.) Suma tych
dziesięciu sum wynosi 8 , więc 2 8 dzieli 1 0 !, ale 2 9 już nie dzieli.
Jest jeszcze jeden sposób. Możemy zsumować to, co uzyskaliśmy w wier­
szach. W pierwszym wierszu sumujemy te przypadki, które wnoszą jedną
potęgę dwójki (i w związku z tym są podzielne przez 2 ); takich liczb jest
[ 1 0 / 2 J = 5. W drugim zaznaczamy te, które wnoszą dodatkową potęgę 2,
takich liczb jest |_1 0/4J = 2. W trzecim wierszu mamy zaznaczone te liczby,
które wnoszą jeszcze jedną potęgę dwójki, jest ich [10/8J = 1 . To już jest
wszystko, co mogliśmy uwzględnić, więc otrzymujemy 6 2 ( 1 0 !) = 5 + 2 + 1 = 8 .
Ogólnie, dla dowolnej liczby rt metoda ta daje nam wzór
k^l
Suma ta jest w rzeczywistości skończona, gdyż wyrazy odpowiadające takim
k, dla których 2k > rt, są zerami. Mamy tu więc jedynie [lgrtj wyrazów
4 .4 . W sp ó łczy n n ik ! rozkład u silni
niezerowych, co sprawia, że suma ta z obliczeniowego punktu widzenia jest
prosta. Na przykład gdy rt = 100, wówczas
e 2 (100!) = 50 + 25 + 12 + 6 + 3 + 1 = 97.
Każdy wyraz to po prostu podłoga z połowy poprzedniego. Jest to prawdziwe
dla każdego rt, gdyż jako przypadek szczególny równania ( 3 . 1 1 ) dostajemy
|_n/2k+1J = |_|_n/2 k] / 2 j . Szczególnie w zapisie dwójkowym łatwo jest zoba­
czyć, co się dzieje:
100 = (1100100)2 = 100
[100/2J =
(110010)2= 50
[100/4J =
(11001)2= 25
[100/8J =
(1100)2= 12
[100/16J =
(110)2 =
6
[100/32J =
(11)2 =
3
[100/64J =
(1)2 =
1
W celu otrzymania kolejnego wyrazu po prostu odrzucamy od jego poprzed­
nika najmniej znaczący bit.
Zapis dwójkowy daje nam możliwość wyprowadzenia kolejnego wzoru:
e2(n!) = n - ^ 2( n ) ,
(4.24)
gdzie ^ ( n ) , to liczba jedynek w zapisie dwójkowym liczby rt. Uproszczenie
to jest poprawne z tego względu, że każda jedynka, która wnosi 2 m do liczby
rt, wnosi również 2 m _1 + 2 m - 2 H-------b 2 ° = 2 m — 1 do wartości e 2 (n!).
Uogólniając nasze odkrycia do dowolnej liczby p, na mocy analogicznego
rozumowania otrzymujemy
ep (n!)
(4-25)
Jak duże jest mniej więcej ep (rt!)? Możemy otrzymać łatwe i jednocześ­
nie niezłe ograniczenie, jeżeli zaniechamy brania podłóg z każdego wyrazu, a
następnie przesumujemy nieskończony ciąg geometryczny:
rt
p - i •
}
Dla p = 2 i n = 100 nierówność ta sprowadza się do 97 < 100. Górne
ograniczenie, równe w tym przypadku także 1 0 0 , jest nie tylko prawidłowe,
ale również bardzo bliskie dokładnej wartości 97. W rzeczywistości dokładna
wartość rt —v 2(tl) wynosi w ogólnym przypadku
n, gdyż t 2 (u) ^ flgn ]
jest asymptotycznie znacznie mniejsze niż n.
Dla
2 i 3 nasze wzory dają e 2(n!) ~ rt i 6 3 (11!) ~ n /2 , jest więc
zrozumiałe, że raz na jakiś czas 63 (n!) powinno być równe dokładnie połowie
6 2 (n!). Dzieje się tak na przykład dla n = 6 i n = 7, ponieważ zachodzi
6 ! = 2 4 -32 *5 = 71/7. Nie wiadomo jednak, czy dzieje się tak w nieskończenie
wielu przypadkach.
Ograniczenie na funkcję ep (n!) daje nam również ograniczenie na funk­
cję
która oznacza wkład czynnika p w rozkład n! :
p £ p ( tl! )
^
^
Możemy teraz uprościć ten wzór (ryzykując znaczne pogorszenie górnego
ograniczenia) zauważając, że p ^ 2 P_1 iw związku z tym zachodzi nierówność
pTt/(p-1 ) <; (2 ? - 1
) = 2n . Innymi słowy, wkład, jaki wnosi jakakolwiek
liczba pierwsza do rozkładu u!, jest mniejszy niż 2 n .
Możemy wykorzystać to spostrzeżenie w celu uzyskania innego dowodu
na to, że liczb pierwszych jest nieskończenie wiele. Gdyby bowiem istniało
jedynie k liczb pierwszych 2, 3 ,..., P^, to mielibyśmy n! < (2n )k = 2nk
dla wszystkich n > 1 , ponieważ każda liczba pierwsza wnosi wkład równy
co najwyżej 2n — 1. Prowadzi to jednak do sprzeczności, gdyż nierówność
n! < 2 7lk może być obalona przez wzięcie dostatecznie dużego n, na przykład
n = 2 2k; wtedy
n! <
2 nk
=
2 22kk
= n u /2 ,
co jest sprzeczne z nierównością n! ^ n ^ 2 wyprowadzoną w (4 .2 2 ). Mamy
więc znowu nieskończenie wiele liczb pierwszych.
Możemy wykorzystać ten rezultat także dla uzyskania zgrubnego ograni­
czenia na 7t(n), liczbę liczb pierwszych nie przekraczających n. Każda liczba
pierwsza wnosi w n! wkład mniejszy niż 2n , więc, podobnie jak przedtem,
n
,
<
2 TL7r( 'n ')
.
Jeśli teraz zastąpimy n! przez przybliżenie Stirlinga (4 .2 3 ), które ogranicza
n! z dołu, to po zlogarytmowaniu otrzymamy
n 7t(n) > n lg (n /e ) + jlg (2 7 tn );
czyli
7t(n)
> lg (n /e ).
4 .5 . L iczby w zględ n ie p ierw sze
139
To dolne ograniczenie jest dosyć słabe, w porównaniu z faktyczną równością
asymptotyczną 7t(n) ~ n /ln n , ponieważ dla dużych n wartość lo g n jest
znacznie mniejsza niż rt/log n. Ale w końcu zbytnio się nie napracowaliśmy,
a ograniczenie jest ograniczeniem.
4.5. Liczby w zględnie pierw sze
O dwóch liczbach m, n mówimy, że są względnie p ierw sze, gdy m i n nie
mają wspólnych dzielników pierwszych, czyli gdy N W D(m ,rt) = 1.
P o ję c ie to je st n a ty le u ż y te c z n e w p r a k ty c e , że p o w in n iś m y m ie ć n a
n ie s p e c j a l n e o z n a c z e n i e . N ie s t e t y ! T e o r i o l ic z b o w c y n ie u z g o d n i l i t a k d o ­
b r e g o o z n a c z e n i a , j a k t o , k t ó r e m a m y z a m ia r z a p r o p o n o w a ć . Z a t e m w o ­
ła m y : U s ł y s z c i e
n as, o
M atem atycy
całego
Ś w i a t a ! N ie
c zek a jm y
a n i c h w il i d ł u ż e j ! M o ż e m y u p r o ś c ić w ie l e w z o r ó w p r z e z p r z y j ę c ie
teraz
now ej
n o t a c ji!
Zgódźm y
s ię
na
n o ta cję
‘m
_L n ’, c z y t a n ą
JAKO “ m PIERWSZE WZGLĘDEM Tl,” JEŚLI TTl I Tl SĄ WZGLĘDNIE PIERWSZE.
Innymi słowy, ustalmy, że
m
m ,n są całkowite i N W D (m ,n ) — 1.
n
( 4 .2 6 )
Ułamek m /n jest nieskracalny wtedy i tylko wtedy, gdy m _L n. Ponie­
waż upraszczamy ułamki wyciągając największy wspólny dzielnik z licznika
i mianownika, więc wolno nam podejrzewać, że w ogólności
m /N W D (m , n)
_L n/N W D (m , n ) ;
Podobnie, jak
proste prostopadłe
nie mają wspólnego
kierunku, tak
prostopadłe liczby
nie mają wspólnego
dzielnika
pierwszego.
( 4 -2 7 )
i rzeczywiście tak jest. Wynika to z ogólniejszego prawa NW D (km, kn) =
k N W D (m ,n ), udowodnionego w ćwiczeniu 14.
Relacja _L wyraża się łatwo, jeżeli korzystamy z reprezentacji wykładni­
czej liczb, z uwagi na regułę NWD (4 . 1 4 ):
m _L n
<£=>
min(mp ,n p) = 0
dla każdego p.
( 4 *2 8 )
Co więcej, ponieważ m p i n p są nieujemne, możemy zapisać to następująco:
m ± n
<==>
m pn p =
0
dla każdego p .
( 4 *2 9 )
Jesteśmy gotowi udowodnić teraz ważny fakt, który pozwala rozdzielać i łą­
czyć dwie różne relacje _L o tej samej lewej stronie:
k 1 m ik
1
n
k _L m n
(4 -3 0 )
Iloczyn skalarny
wynosi zero, tak jak
w przypadku
wektorów
prostopadłych.
W świetle równania (4 .2 9 ) prawo to jest innym sposobem powiedzenia, że
kpm p = 0 i kpTtp = 0 wtedy i tylko wtedy, gdy kp (mp + rtp) = 0 , dla
nieujemnych m p i n p.
Ciekawe,
że matematycy tak
lubią mówić
,odkrycie”^podczas
gdy wszyscy inni
powiedzieliby
„wynalazek”
Istnieje piękna metoda konstrukcji wszystkich nieujemnych ułamków po­
staci m /rt spełniających m _L n, nazywana drzewem Sterna-B rocota za
względu na jej odkrycie dokonane niezależnie przez matematyka niemiec­
kiego, Moritza Sterna [340] oraz przez francuskiego zegarmistrza Achille Brocota [41]. Pomysł polega na rozpoczęciu od dwóch ułamków ( y , 5 ) i następnie
na wykonywaniu następującej czynności tak długo, jak długo tego potrzebu­
jemy:
Wprowadź m
u + n'
między dwa sąsiadujące ze sobą ułamki — i
.
n
w
Nowo powstały ułamek (m + vnf) / { n + n f) nazywa się m ediantem ułamków
m /n i v n '/n f. Na przykład pierwszy krok daje nam jeden nowy ułamek
pomiędzy f i l ,
0 1 1
1 > 1 >0 •
W kolejnym kroku dostajemy 2 następne:
0 1 1 2 1
1 >2 ’ 1 » 1 >0 *
a krok później 4 kolejne:
0 1 1 2 1 3 2 3 1 .
1> 3’ 2> 3’ 1’ 2’ 1’ 1’ 0 ’
Wydaje mi się, że
1/0 to w postaci
nieskracalnej
po prostu
nieskończoność.
a dalej uzyskamy 8,16 itd. nowych ułamków. Całą tę strukturę można sobie
wyobrazić jako nieskończone drzewo binarne, którego górne poziomy wyglą­
dają następująco:
2
/ V
l\
1
5
2
7
3
8
i\
3
7
4
7
i\
5
8
5
7
/\
4
5
5
4
i\
7
5
8
5
/\
7
4
./ \
7
3
i\
8
3
7
2
/\
5
1
Każdy ułamek jest postaci
, gdzie ^ jest najbliższym przodkiem na
lewo, a
jest najbliższym przodkiem na prawo. (Przodek jest to tu ułamek,
który może zostać osiągnięty za pomocą przechodzenia po gałęziach do góry.)
Drzewo to ma wiele ciekawych właściwości.
Dlaczego ta konstrukcja w ogóle działa? Czeaaurna przykład każdy mediant (m + m /J /fn + n ') okazuje się w postaci nieskracalnej w tym drzewie?
(Gdyby np. tl, m, rt', m ' były nieparzyste, wówczas otrzymalibyśmy mediant
typu parzyste/parzyste; jednak jakoś tak się dzieje, że ułamki z nieparzystymi
licznikami i mianownikami nigdy w tym drzewie obok siebie nie występują.)
Dlaczego wszystkie możliwe ułamki występują w drzewie dokładnie raz? Dla­
czego jakiś ułamek nie mógłby wystąpić 2 razy, albo w ogóle nie wystąpić?
Na wszystkie te pytania są zaskakująco proste odpowiedzi, wynikające
z następującego podstawowego faktu: Jeśli m /n i m ' / n f są sąsiadującymi
ułamkami na dowolnym etapie konstrukcji, to zachodzi
m /n —mn' =
1 .
(4.3 u.)
Równanie to jest spełnione na samym początku konstrukcji (1-1—0-0 = 1), a
kiedy wstawimy nowy mediant { m + v n ' ) / ( n + n f), to przypadki, które trzeba
sprawdzić, są następujące:
(m + m /)n —m (n + n ') =
m ,(n + n ' ) - ( m + m ,)n / =
1;
1.
Oba te równania są równoważne wyjściowemu równaniu ( 4 .3 1 ), które mają
zastąpić. W związku z tym równanie ( 4 .3 1 ) jest spełnione na wszystkich
etapach konstrukcji.
Co więcej, jeśli m /n < raZ/n' i jeśli wszystkie wartości są nieujemne, to
łatwo można sprawdzić, że
m /n < (m + m /) /( n + n /) < m ' / n ' .
Mediant nie leży dokładnie w połowie między swoimi rodzicami, ale leży
gdzieś pośrodku. Konstrukcja ta zachowuje więc porządek i nie jest możliwe
uzyskanie jednego ułamka w dwóch różnych miejscach.
Ostatnim problemem jest stwierdzenie, czy przypadkiem jakiś ułamek
postaci a /b dla a l b nie jest w drzewie Sterna-Brocota pominięty. Odpo­
wiedź brzmi nie. Możemy bowiem zawęzić pole widzenia do bezpośredniego
sąsiedztwa liczby a /b , a jest to rejon łatwo poddający się analizie. Mamy na
początku
m
rt
___
1
0
Vb /
0
^
Tt7
/ a.\ ^
J_ ______
m/
*
przy czym nawiasy naokoło ^ oznaczają, że ułamka ^ tam w rzeczywistości
jeszcze nie ma. Jeżeli zatem na pewnym etapie konstrukcji mamy
^ <(t) <
to konstrukcja wymusi powstanie ułamka (m + m /)/(n + n ') i mamy 3 przy­
padki. Albo (m + m ')/(n + n ') = a /b i wygrywamy, albo (m + m ')/(n + n ') <
a /b i możemy dokonać podstawienia m
m + m', rt f - u + u'; albo
(m \ m ')/(n + rt') > a /b i możemy dokonać podstawienia m' f - m + m/,
rt' <— n + n '. Proces ten nie może trwać w nieskończoność, ponieważ warunki
a _ rtm > o
i1
b
n'
^ >
b
0
powodują, że
a n —bm ^
zatem
i
1
^
bm ' — an' ^
1;
.
—bm) + (-nfc}(bm' — an') ^ m ' + n ' + m + n ;
co jest tym samym, co a + b ^ m ' + n ' + m + n na mocy równania (4 .3 1 ). Ze
względu na to, że w każdym kroku musimy zwiększyć albo m, albo n, albo
m ', albo n ', wygramy po co najwyżej a + b krokach.
Ciąg Fareya rzędu N, oznaczany przez jFn, definiuje się jako posorto­
wany rosnąco ciąg wszystkich uproszczonych ułamków z przedziału [0 , 1],
których mianowniki są równe co najwyżej N. Dla przykładu, ^ przedstawia
się następująco:
nr
—
~
0 1 1 1 1 2 1 3 2 3 4 5 1
1 > 6 ’ 5> 4> 3> 5 ’ 2 ’ 5 ’ 3> 4 ’ 5> 6> 1 *
Ciąg jFn możemy uzyskać zaczynając od 3 ^ = y , j , a następnie wstawia­
jąc medianty wszędzie tam, gdzie mianownik nie stanie się zbyt duży. Nie
pominiemy w ten sposób żadnych ułamków, gdyż wiemy, że konstrukcja
Sterna-Brocota nie pomija żadnego z nich, i dlatego jeszcze, że mediant z
mianownikiem mniejszym lub równym N nie może powstać z ułamka, któ­
rego mianownik jest większy niż N. (Innymi słowy, 3 ^ określa poddrzewo
drzewa Sterna-Brocota powstałe przez odcięcie wszystkich niechcianych ga­
łęzi.) Wynika stąd, że gdy m /n i m ,'/n' są kolejnymi elementami ciągu Fa­
reya, wówczas m 'n —m n ' = 1 .
Podana metoda konstrukcji sugeruje, że jFn można łatwo uzyskać z IFn-i •
po prostu wkładamy (m + m ')/N między te kolejne ułamki m /n , m '/n ' ciągu
jF n-i, których mianowniki sumują się do N. Na przykład ciąg J 7 otrzymu­
jemy z ciągu $6 wstawiając y, y, . . . , | zgodnie z podaną regułą:
nr
—
J J
~
0 1 1 1 1 2 1 2 3 1 4 3 2 5 3 4 5 6 1
1 > 7 ’ 6 ’ 5> 4> 7> 3> 5 ’ 7> 2 ’ 7> 5 ’ 3> 7> 4> 5> 6 ’ 7 ’ 1 *•
W przypadku gdy liczba N jest pierwsza, pojawi się N —1 nowych ułamków,
w przeciwnym razie będzie ich mniej niż N — 1, ponieważ podana metoda
tworzy tylko takie liczniki, które są względnie pierwsze z N.
Dawno temu, w równaniu ( 4 .5 ), wykazaliśmy, choć inaczej to wyrażali­
śmy, że jeśli m JL rt oraz 0 < m ^ rt, to można tak dobrać liczby całkowite a
i b, że
m a —nb — 1 .
( 4 *3 2 )
(Tak naprawdę twierdziliśmy, że m /m + n /r i — NW D (m ,rt), możemy jednak
podstawić 1 w miejsce N W D (m ,n ), a w miejsce m /, b zaś w miejsce —rt'.)
Ciąg Fareya dostarcza nam nowego dowodu wzoru (4 .3 2 ), ponieważ możemy
przyjąć, że b /a jest ułamkiem, który bezpośrednio poprzedza m /n w ciągu
SFtl. Wzór (4 .5 ) staje się wtedy równaniem (4 .3 1 ). Na przykład jednym z roz­
wiązań równania 3 a —7b = 1 jest a = 5, b = 2, ze względu na to, że | poprze­
dza | w ciągu 3^7. Zastosowana konstrukcja gwarantuje dodatkowo istnienie
takiego rozwiązania równania (4 .3 2 ), że 0
b < a < n, jeśli 0 < m ^ n.
Podobnie, jeśli 0 ^ n < m i m 1 u, to możemy rozwiązać równanie ( 4 .3 2 )
za pomocą 0 < a ^ b ^ m przyjmując, że a /b jest ułamkiem, który w ciągu
jFm następuje po n /m .
Każde trzy kolejne wyrazy ciągu Fareya mają zadziwiającą własność udo­
wodnioną w ćwiczeniu 61. Nie będziemy jednak zatrzymywali się dłużej nad
ciągami Fareya, gdyż całe drzewo Sterna-Brocota wydaje się jeszcze bardziej
interesujące.
Ze względu na to, że każdy uproszczony dodatni ułamek występuje w
drzewie Sterna-Brocota tylko raz, możemy w rzeczywistości potraktować to
drzewo jako system pozycyjny reprezentujący liczby wymierne. Użyjmy liter
L i P do oznaczenia zejścia w lewo lub w prawo na drodze od korzenia drzewa
do szukanego ułamka. Wtedy ciąg symboli L i P jednoznacznie określi nam
pozycję w drzewie. Na przykład LPPL oznacza, że od -j- zamierzamy pójść
w lewo do
potem w prawo do | , następnie w prawo do
i w końcu
w lewo do j . Możemy więc przyjąć, że LPPL reprezentuje liczbę
Każdy
dodatni ułamek może być w ten sposób reprezentowany jako jednoznaczny
ciąg symboli L i P.
Na dobrą sprawę mamy tu jeden mały problem. P ustem u ciągowi od­
powiada ułamek y, więc też musimy go jakoś oznaczyć. Umówmy się, że bę­
dziemy go oznaczali jako I, bo wygląda to trochę jak 1 i jednocześnie oznacza
„identyczność”.
Reprezentacja ta skłania do sformułowania dwóch problemów: ( 1 ) Dla
danych liczb całkowitych dodatnich m i n takich, że m _L n, znaleźć ciąg zło­
żony z L i P odpowiadający wartości m /n . ( 2 ) Dla zadanego ciągu złożonego
z L i P stwierdzić, jaki ułamek jest przez niego reprezentowany. Problem ( 2 )
wygląda na prostszy, więc przyjrzyjmy mu się najpierw. Określamy
f (S) = ułamek odpowiadający S
4. T eoria liczb
.Jifj
dla S będącego ciągiem złożonym z symboli L i P. Na przykład dla ciągu
LPPL otrzymamy f(LPPL) = | .
Zgodnie z podaną konstrukcją f(S) = (m + m ')/(n + rt'), jeśli m /n i
m '/n ' są ułamkami najbliżej S z lewej i prawej strony w wyższych poziomach
drzewa. Początkowo m /n = 0/1, a następnie sukcesywnie zastępujemy albo
m /n , albo m '/n ' ich mediantem (m + m ')/(n + n '), w zależności od tego,
czy w drzewie schodzimy w prawo, czy w lewo.
Jak można wyrazić to zachowanie w postaci wzoru matematycznego,
który byłby wygodny w użyciu? Chwila prób wystarcza, aby przekonać się,
że najwygodniej jest utworzyć macierz 2 x 2
M(S) = ( U
\m
n ', V
m /y
zawierającą cztery wartości pochodzące od rodzicielskich ułamków otaczają­
cych S: m /n i m '/n '. Moglibyśmy równie dobrze umieścić m i m / na górze,
a n i n ' na dole, ale proponowana organizacja macierzy jest naturalniejsza,
gdyż na początku całego procesu mamy M(I) = (J°), a macierz (J°) jest
tradycyjnie nazywana macierzą jednostkową I.
Krok w lewo zamienia n ' na u + n ' oraz m/ na m + m /, więc
» ™ - ( : ; ' ) ( J
: ) - M,s)0 :)•
Jest to szczególny przypadek ogólniejszej reguły mnożenia dwu macierzy roz­
miaru 2 x 2 :
/ a
\c
Jeżeli macierze cię
przerażają, nie
denerwuj się:
występują one w tej
książce tylko tutaj.
b\ / w
x \ _ / aw + by
z J ~ \ cw + dy
ax + b z \
cx + dz ) '
Podobnie, okazuje się, że
»<*■> - u : » -
m’0 = Mis,(! ? )■
Jeśli więc zdefiniujemy L i P jako macierze 2 x 2
L= (o !) ’ P= (i i) ’
(4'33)
to stosując indukcję ze względu na długość ciągu S otrzymamy prosty wzór
M(S) = S. Czyż nie jest to ładne? (Symbole L i P pełnią podwójną rolę: jako
macierze i jako elementy alfabetu użytego do budowy S.) Na przykład
M(LPPL) = LPPL = Q Q ( ] ? ) a
= (?!)(!!) = (Is)-
I***'"
^
m
W. /y
Ł ł ź L m ______ — —
Rodzicielskie ułamki, które otaczają LPPL =
cja daje odpowiedź na pytanie 2 :
«»>-'((:
K:- w
.— „ ____ 3B flL ....... .....
to | i
4.5. L iczby w zg lęd nie p ierw sze
Powyższa konstruk­
S ) ) - S £ -
,ł34)
Jak wygląda sprawa z pytaniem 1 ? Teraz, gdy już rozumiemy podsta­
wowy związek między węzłami drzewa i macierzami 2 x 2 , jest to proste.
Mając parę liczb całkowitych dodatnich m i n takich, że m 1 n, możemy
określić pozycję ułamka m /n w drzewie Sterna-Brocota za pomocą „prze­
szukiwania binarnego” w następujący sposób:
S := I;
w h ile m /n
if m /n
^ f(S) do
< f(S) th en
(wypisz(L); S := SL)
else
(wypisz(P); S := S P ).
Wynikiem jest żądany ciąg złożony z symboli L i P.
Ten sam efekt można osiągnąć w inny sposób, modyfikując liczby m i
n zamiast zmieniać stan S. Jeśli S jest dowolną macierzą rozmiaru 2 x 2, to
zachodzi
f (PS) = f(S) + 1,
ponieważ macierz PS różni się tym od S, że górny wiersz macierzy S został
dodany do dolnego. Przyjrzyjmy się temu dokładniej, w nieco zwolnionym
tempie:
S =
(\ vnn m/
n' V
) ’
PS =
( n
n'
\m + n
V
m/ - h n ' ) ’
zatem f(S) = (m + m /)/(n + n ;), a jednocześnie f(PS) = ((m + n) + (m/ +
n ') ) /( n + n ') .) Jeśli będziemy wykonywali algorytm binarnego wyszukiwania
dla ułamka m /n przy m > n, to pierwszą wypisaną wartością będzie P,
więc następujące po tym działania algorytmu będą miały do czynienia z
wartością f(S) dokładnie o 1 większą, niż gdybyśmy zaczęli z liczbą (m —n ) / n
zamiast m /n . Podobna własność zachodzi dla L, mamy więc
— = f (PS)
n
<ś=>
—— n
=
f (S ),
gdy m > n;
— = f(LS)
n
<ś=>
—m
=
n —m
f(S ),
gdy m < n.
Oznacza to, że algorytm wyszukiwania binarnego może zostać przekształcony
do następującej bezmacierzowej postaci:
w h ile
m / n do
if m < u then
(wypisz(L); rt := u —m)
else (wypisz(P); m := m —n) .
Na przykład przy danych m /n = 5/7, otrzymujemy w uproszczonym algo­
rytmie kolejno
m =
5 5
3
1
1
n =
7 2
2
2
1
wypisz
L P P L .
Liczby niewymierne nie występują w drzewie Sterna-Brocota, ale wszyst­
kie „bliskie” im co do wartości liczby wymierne występują. Na przykład je­
śli wypróbujemy działanie algorytmu wyszukiwania binarnego z liczbą e =
2 ,7 1 8 2 8 ... na wejściu zamiast ułamka m /n , to otrzymamy nieskończony
ciąg symboli L, P zaczynający się od
PPLPPLPLLLLPLPPPPPPLPLLLLLLLLPLP . . . .
Hermann
Minkowski
przedstawił tę
zadziwiającą
reprezentację
dwójkową na
międzynarodowym
Kongresie
Matematyków
w Heidelbergu,
w roku 1904.
Możemy uznać ten ciąg za reprezentację liczby e w systemie Sterna-Brocota,
podobnie jak reprezentujemy liczbę e w dziesiętnym systemie liczbowym za
pomocą ciągu cyfr dziesiętnych 2,718281828459... lub też za pomocą nie­
skończonego dwójkowego ułamka (10,101101111110.. .)2 * Interesujące, że
reprezentacja Sterna-Brocota liczby e ma regularne przedstawienie
e = PL°PLP2 LPL4 PLPfiLPL8 PLP10 LPL12PL . . . ;
jest to równoważne szczególnemu przypadkowi czegoś, co odkrył Euler [105]
w wieku 24 lat.
Z reprezentacji tej wnioskujemy, że ułamki
P
P
L
P
P
L
P
L
L
L
L
P
L
P
P
P
P
1 2 3 5 8 1 1 1 9 3 0 4 9 6 8 8 7
106 193 299 492 685 878
1 ’ 1 ’ 1 > 2 ’ 3 > 4 ’ 7 > 11 > 18 ’ 25 ’ 32 > 39 > 71 > 110 > 181 > 252 > 323 > * * *
są najprostszymi z możliwych górnymi i dolnymi przybliżeniami wymiernymi
liczby e. Dzieje się tak dlatego, że jeśli m /n nie występuje na tej liście, to
wartość pewnego ułamka z tej listy, którego licznik jest nie większy od m, a
mianownik nie większy od n znajduje się pomiędzy m /n , a e, będzie to więc
lepsze przybliżenie liczby e. Na przykład ułamek y^, którego na tej liście nie
znajdziemy, nie jest tak prostym przybliżeniem, jak występujący na tej liście
i lepiej przybliżający e ułamek y- = 2 ,7 1 4 ___
Dzieje się tak dlatego, że drzewo Sterna-Brocota nie dość, że zawiera
wszystkie liczby wymierne, to jeszcze występują one w specyficznym po­
rządku, w którym wszystkie ułamki o małych licznikach i mianownikach po­
jawiają się powyżej wszystkich ułamków bardziej złożonych. W związku z
tym
= PPLPPLL jest mniejsze niż y- = PPLPPL, co z kolei jest mniejsze
niż e = PPLPPLP___Sposób ten daje nam wyśmienite przybliżenia liczby e.
Liczba §|§ & 2,718266 w 0,999994e na przykład zgadza się z e dla począt­
kowych sześciu cyfr dziesiętnych, a otrzymaliśmy ją za pomocą zaledwie 16
symboli reprezentacji Sterna-Brocota; taką samą mniej więcej dokładność
uzyskalibyśmy używając 16 bitów klasycznej reprezentacji dwójkowego przy­
bliżenia liczby e.
Nieskończoną reprezentację Sterna-Brocota dowolnej liczby niewymier­
nej oc możemy uzyskać nieznacznie modyfikując algorytm uściślania binar­
nego:
if oc < 1 th en (wypisz(L); oc := oc/{ 1 — a))
else
(wypisz(P); oc
a —1).
(Kroki te trzeba powtarzać nieskończoną liczbę razy albo aż uznamy, że już
nam wystarczy.)
Gdyby liczba oc była wymierna, wówczas otrzymalibyśmy nieskończoną
reprezentację, która przypominałaby poprzednią, z tym że na prawo od tej
skończonej reprezentacji oc zostałby dołączony ciąg PL°°. Jeżeli na przy­
kład oc = 1, to otrzymamy PLLL. . . , odpowiadający nieskończonemu ciągowi
ułamków y, y, §, | , | , . . . , który jest zbieżny do 1. Sytuacja ta jest ana­
logiczna do zwykłej reprezentacji dwójkowej, jeżeli przedstawimy symbole L
jako 0, a P jako 1. Podobnie jak w przypadku liczb rzeczywistych, gdzie
każda liczba x z przedziału [0 .. 1 ) ma nieskończoną reprezentację dwójkową
(0 , bi b 2 b 3 . . . )z nie zakończoną samymi jedynkami, tak każda liczba oc z
prze­
działu [0 .. 1) ma nieskończoną reprezentację Sterna-Brocota Bi B2 B3 . . . nie
zakończoną samymi symbolami P. Mamy więc zachowującą porządek wza­
jemnie jednoznaczną odpowiedniość między przedziałem [0 .. 1 ), a przedzia­
łem [0 .. 0 0 ), jeśli tylko przyjmiemy, że 0 <-» L i 1 <-> P.
Istnieje także bliski związek między algorytmem Euklidesa a reprezenta­
cją Sterna-Brocota. Dla zadanego oc = m /n otrzymujemy [rnAkl symboli P,
następnie [rt/(m mod ru)J symboli L, potem |_(m mod rt)/ (rt mod (m mod
rt))J symboli P, i tak dalej. Liczby m mod rt, rt mod (m mod rt), . . . są po
prostu liczbami, które kolejno pojawiają się przy wykonywaniu algorytmu.
(Trzeba tu trochę sprytu, żeby upewnić się, że na końcu rzeczywiście nie
dostaniemy nieskończenie wielu symboli P.) Zbadamy głębiej ten związek w
rozdziale 6 .
4, T eoria liczb
4.6. R elacja kongruencji ‘m o d ’
Arytmetyka modulo jest jednym z podstawowych narzędzi dostarczanych
przez teorię liczb. Pojęcie dzielenia modulo mignęło nam już w rozdziale 3,
gdzie używaliśmy binarnego działania ‘mod’, zazwyczaj jako jednego z wy­
stępujących w bardziej złożonym wyrażeniu. Tutaj będziemy stosowali dzia­
łanie ‘mod’ również w pełnych równaniach, wprowadzimy więc notację nieco
bardziej do tego celu użyteczną:
a
„Numerorum
congruentiam hoc
signo, = , in
posterum
denotabimus,
modulum ubi opus
erit in clausulis
adiungentes,
-16 = 9
(mod. 5), —7 =
15 (mod. 11).”
C. F. Gauss [142]
=b
(mod m)
a mod m = b mod m .
(4 -3 5 )
Mamy więc na przykład 9 = —16 (mod 5), ze względu na to, że 9 mod
5 = 4 = (—16) mod 5. Wyrażenie ‘a = b (mod m )’ można odczytać jako
„a przystaje do b modulo m.” Definicja ta ma sens również dla dowolnych
liczb rzeczywistych a, b oraz m. My jednak będziemy jej używali prawie
wyłącznie dla liczb całkowitych.
Ze względu na to, że x mod m różni się od x o wielokrotność m, możemy
spojrzeć na kongruencje z innej strony:
a
=b
(mod m)
a —b jest wielokrotnością m.
( 4 *3 6 )
Jeśli bowiem a mod m = b mod m, to definicja działania ‘mod’ zawarta w
równaniu (3 .2 1 ) gwarantuje, że a —b = a mod m + k m — (b mod m + lm) —
(k —l)m dla pewnych liczb całkowitych k i l. Na odwrót, jeśli a —b = km,
to a = b dla m = 0 , a w przeciwnym razie
a mod m = a — [a /m jm = b + km — [(b + k m )/m jm
= b — [b /m jm = b mod m .
„Czuję się dziś
nieźle modulo lekki
ból głowy.”
The Hackefs
Dictionary [338]
Przedstawienie działania ‘mod’ za pomocą równania (4 .3 6 ) jest często wy­
godniejsze niż za pomocą równania ( 4 .3 5 ). Zachodzi na przykład 8 = 23
(mod 5), ponieważ 8 —23 = —15 jest wielokrotnością 5; nie musimy wyliczać
ani 8 mod 5, ani 23 mod 5.
Znak kongruencji ‘ = ’ przypomina znak ‘ = ’ nie bez przyczyny, ponieważ
kongruencje to nieomal równości. Kongruencja jest na przykład relacją rów­
noważności, czyli ma trzy własności: jest zwrotna (a = a), symetryczna
(a = b
b = a) i przechodnia (a = b = c =£■ a = c). Wszystkie
te własności są łatwe do udowodnienia, gdyż każda relacja *=’ spełniająca
‘a = b
f(a) = f(b )’ dla pewnej funkcji f jest relacją równoważności
(w naszym przypadku f(x) = x m o d m ). Co więcej, elementy przystające
możemy dodawać i odejmować bez utraty własności przystawania:
a = b
i
c = d
=>
a+ c = b+ d
(mod m ) ;
a = b
i
c = d
==£•
a —c = b — d
(mod m ) ,
4.6. R elacja kongruencji ‘m o d ’
ponieważ jeżeli liczby a —b i c —d są wielokrotnościami m, to będą nimi także
liczby ( a + c ) —(b + d) = ( a —b) + (c —d) i ( a —c) —(b —d) — (a —b) —(c—d).
Na marginesie, nie jest konieczne pisanie ‘(mod m )’ za każdym razem, gdy
wystąpi znak ‘ = jeżeli modulnik jest stały, to wystarczy, że zaznaczymy go
tylko raz, aby ustalić kontekst. Jest to jedna z większych zalet notacji ‘mod’.
Analogiczne wzory zachodzą także dla mnożenia, pod warunkiem, że
mamy do czynienia z liczbami całkowitymi:
a = b
i
c = d
=>
ac = bd
(mod m ) ,
całkowite b ,c.
Dowód: ac —bd = (a —b)c + b(c —d). Wielokrotne zastosowanie powyższego
wzoru daje nam odpowiedni wzór dla potęgowania:
a = b
an = bn
(mod m ) ,
całkowite a, b;
całkowite rt ^ 0 .
Na przykład ponieważ zachodzi 2 = —1 (mod 3), więc mamy również 2n =
(—1 )n (mod 3), co oznacza, że 2n — 1 jest wielokrotnością 3 wtedy i tylko
wtedy, gdy n jest parzyste.
Większość przekształceń algebraicznych, których zwykle dokonywaliśmy
z równościami, może być wykonana także z kongruencjami. Większość, ale
nie wszystkie. Działanie dzielenia świeci swoją nieobecnością. Jeśli ad = bd
(mod m), to bynajmniej nie możemy twierdzić, że zawsze a = b. Zachodzi
bowiem na przykład 3*2 = 5-2 (mod 4), ale 3 ^ 5 .
Możemy częściowo uratować tę własność skracania dla kongruencji, ale
tylko wtedy, gdy d oraz m są względnie pierwsze:
ad = bd
<£=£•
a = b
(mod m ) ,
(4 -3 7 )
całkowite a, b, d, m oraz d J_ m.
Jest więc na przykład uprawomocnione wyciągnięcie wniosku, że skoro 15 =
35 (mod m), to 3 = 7 (mod m), chyba że modulnik m byłby wielokrotno­
ścią 5.
Do dowodu tej własności ponownie skorzystamy z rozszerzonego prawa
NWD ( 4 .5 ). Znajdziemy takie liczby d' i m ', że d'd + m /m = 1. Jeżeli
w takim przypadku ad = bd, to wolno nam obie strony tej kongruencji
pomnożyć przez d', uzyskując ad'd = bd'd. Ponieważ d'd = 1, więc ad'd =
a i b d ' d = b ; a c o z a tym idzie, a = b. W dowodzie tym wykorzystujemy
fakt, że gdy rozważamy kongruencje (mod m), liczba d' zachowuje się niemal
jak 1 /d , nazwiemy ją więc „odwrotnością d modulo m.”
f
4. Te
150
Jeszcze jedną metodą zastosowania dzielenia do kongruencji jest podzie­
lenie modulnika wraz z pozostałymi liczbami:
ad = bd (mod md)
a = b (mod m ) ,
dla d ^ 0 .
( 4 .3 8 )
Prawo to zachodzi dla wszystkich liczb rzeczywistych a, b, d oraz m, po­
nieważ zależy jedynie od prawa rozdzielności (a m o d m )d = ad mod md:
Ze względu na to, że a mod m = b mod m
(a mod m )d = (b mod
m )d
ad mod m d = bd mod md. W takim razie, na przykład, z tego
że 3 -2 = 5 -2 (mod 4) możemy wywnioskować, że 3 = 5 (mod 2).
W celu uzyskania ogólnego prawa dotyczącego możliwie małej zmiany
modulnika, możemy połączyć równania (4 .3 7 ) i (4 .3 8 ):
ad = bd
(mod m)
a = b
(mod
m
^,
N W D (d,m )
całkowite a, b, d, m. ( 4 .3 9 )
Wolno nam bowiem pomnożyć kongruencję ad = bd przez d', gdzie d'd +
m /m = N W D (d,m ). Daje to kongruencję a -N W D (d ,m ) = b -N W D (d ,m )
(mod m), którą można podzielić przez N W D (d, m).
Przyjrzyjmy się z bliska pomysłowi zamiany modulnika. Wiedząc, że a =
b (mod 1 0 0 ) wnioskujemy, że a musi przystawać do b również modulo 1 0 , jak
i modulo dowolny dzielnik 100. Zdanie „a —b jest podzielne przez 100” jest
mocniejsze niż zdanie „ a —b jest podzielne przez 10”. W ogólnym przypadku
natomiast zachodzi
a = b
(mod md)
=>
a = b
(mod m ) ,
całkowite d, (4 .4 0 )
gdyż każda wielokrotność liczby m d jest również wielokrotnością liczby m.
Na odwrót, czy wiedząc że a = b względem dwóch małych modułów,
możemy dojść do wniosku, że a = b względem jakiegoś większego modułu?
Tak jest! A odpowiedni wzór przedstawia się następująco:
a = b (mod m)
<=>
i
a = b (mod rt)
a = b (mod N W W (m ,n )),
całkowite m ,n > 0.
(4 .4 1 )
Jeżeli na przykład wiemy, że a = b modulo 12 i 18, to możemy z całą
pewnością utrzymywać, że a = b (mod 36). Dzieje się tak dlatego, że jeśli
a —b jest wspólną wielokrotnością liczb m oraz n, to jest też wielokrotnością
liczby N W W (m ,n). Wynika to z twierdzenia o jednoznacznym rozkładzie.
Szczególny przypadek powyższego prawa, gdy m J_ n, jest wyjątkowo
ważny, gdyż wtedy N W W (m ,n) = m n. Wyraźmy to wprost:
a = b (mod m n)
<ś==>
a = b (mod m) i a = b (mod n ) ,
jeśli m i n .
(4 4 2 )
^ ,^ 4 .7 . N ieza leżn e reszty
Na przykład a = b (mod 100) wtedy i tylko wtedy, gdy a = b (mod 25) i
a = b (mod 4). Wyrażając to w inny sposób, jeśli wiemy, czemu jest równe
x mod 25 oraz x mod 4, to mamy wystarczająco dużo informacji, żeby określić
x mod 100. Jest to szczególny przypadek chińskiego twierdzenia o resztach
(por. ćwiczenie 30), nazwanego tak z uwagi na Sun Tsu, który w Chinach
odkrył je około 350 roku n.e.
Modulniki m i n w równaniu (4 .4 2 ) mogą być dalej rozkładane na mniej­
sze czynniki pierwsze, aż wszystkie czynniki pierwsze zostaną odizolowane
od siebie. Zachodzi więc równoważność
a = b (mod m)
<ś==>
a = b (mod p mp) dla wszystkich p ,
jeżeli rozkład na czynniki pierwsze ( 4 . 1 1 ) liczby m jest równy J^[ p mp. Kon­
gruencje modulo potęgi liczb pierwszych są cegiełkami, z których buduje się
kongruencje modulo wszystkie inne liczby całkowite.
4.7. N iezależn e reszty
Ważnym zastosowaniem kongruencji jest system niezależnych reszt, w któ­
rym liczba całkowita x przedstawiana jest jako ciąg reszt względem modułów
parami względnie pierwszych:
Res(x) = (x mod m i , . . . ,x mod m r) , jeśli rrij _L rrik dla 1 ^ j < k ^ r.
Znając x mod m i , . . . ,x mod m r, nie wiemy jeszcze wszystkiego o samym x,
ale możemy stwierdzić, ile wynosi x mod m, dla m = mi . . . m r. W praktyce
będziemy zazwyczaj wiedzieli, w jakim przedziale można spodziewać się x.
W takim przypadku, jeżeli tylko będziemy znali wszystkie wartości reszt i
jeśli m będzie wystarczająco duże, aby objąć ten przedział, to o x będziemy
wiedzieli wszystko.
Przyjrzyjmy się na przykład niewielkiemu systemowi niezależnych reszt
opartemu na dwóch modułach, 3 oraz 5:
x mod 15
x mod 3
x mod 5
0
0
0
1
1
1
2
2
2
3
4
5
0
1
3
4
2
0
6
0
1
7
1
2
Na przykład liczba
Mersenne’a
231 — 1
świetnie się do tego
nadaje.
0
3
4
10
1
0
11
2
1
12
0
2
13
14
1
2
3
4
8
2
9
Każda uporządkowana para (x mod 3 ,x mod 5) jest różna od każdej innej,
gdyż x mod 3 = y mod 3 i zarazem x mod 5 = y mod 5 wtedy i tylko wtedy,
gdy x mod 15 = y mod 15.
Dodawanie, odejmowanie i mnożenie dla dwóch składników możemy wy­
konywać niezależnie, dlatego że pozwalają nam na to prawa kongruencji.
Gdybyśmy na przykład chcieli przemnożyć 7 = (1,2) przez 13 = (1,3) mo­
dulo 15, wówczas wystarczyłoby wyliczyć 1 -1 mod 3 = 1 oraz 2-3 mod 5 = 1.
Odpowiedź brzmi (1,1) = 1 i w związku z tym 7-13 mod 15 musi być równe 1.
No i oczywiście jest równe.
Przedstawione prawo niezależności ma ważne zastosowania w informa­
tyce, ponieważ różne składniki mogą być przetwarzane niezależnie (na przy­
kład na różnych komputerach). Jeśli każdy modulnik rriic jest inną liczbąpierwszą p k, wybraną tak, aby jej wartość była nieco mniejsza niż 2 31,
to komputer wykonujący działania na liczbach całkowitych o wartościach z
przedziału [—2 31 . . 2 31) może łatwo wyliczać sumy, różnice i iloczyny mo­
dulo pic. Zbiór takich r liczb pierwszych umożliwia dodawanie, odejmowanie
i mnożenie „liczb wielokrotnej precyzji” reprezentowanych przez 31 r bitów, a
system niezależnych reszt umożliwia robienie tego w przypadku dużych liczb
szybciej niż za pomocą innych znanych metod.
Przy pewnych założeniach możemy także wykonywać dzielenie. Załóżmy,
że mamy obliczyć wartość dużego wyznacznika macierzy liczb całkowitych.
Wynik będzie liczbą całkowitą D, a ograniczenie na |D| może być znale­
zione na podstawie wielkości elementów macierzy. Ale wszystkie znane me­
tody szybkiego obliczania wyznaczników wymagają dzielenia, a to prowadzi
do ułamków (i straty dokładności, jeśli weźmiemy pod uwagę przybliżenia
dwójkowe). Remedium na to może być znalezienie wartości D mod
= D^,
dla różnych dużych liczb pierwszych p^. Możemy śmiało podzielić elementy
macierzy modulo p^, chyba że któryś z nich okazałby się być wielokrotnością
jakiejś liczby p^. Jest to mało prawdopodobne, ale nawet gdyby się tak zda­
rzyło, możemy wybrać inną liczbę pierwszą. W końcu, znając wartości D k
dla wystarczająco wielu liczb pierwszych, mamy dostatecznie dużo informa­
cji, aby wyliczyć D.
Nie wyjaśniliśmy jeszcze, w jaki sposób z zadanego ciągu reszt (x mod
m i , . . . ,x mod m T) otrzymać z powrotem wartość x mod m. Pokazaliśmy,
że taka konwersja może zostać w ogólności dokonana, ale rachunki mogłyby
być tak upojne, że cały pomysł prawdopodobnie w praktyce ległby w gru­
zach. Na szczęście istnieje stosunkowo prosta metoda poradzenia sobie z tym
problemem. Możemy ją zilustrować na przykładzie par (x mod 3 ,x mod 5),
które pojawiają się w naszej tabelce. Kluczowym pomysłem jest rozwiązanie
problemu dla przypadków bazowych ( 1 , 0 ) i (0 , 1 ), gdyż jeśli ( 1 , 0 ) = a, nato­
miast (0,1) = b, to (x,y) = (cnc + by) mod 15, ponieważ kongruencje można
dodawać i mnożyć.
W naszym przypadku zajrzawszy do tabeli znajdujemy jednym rzutem
oka odpowiednie wartości a = 10 i b = 6 . Jak jednak je znaleźć, gdy moduły
są ogromne? Innymi słowy, jak znaleźć liczby a i b w przypadku, gdy m _L n,
tak aby wszystkie równania
a mod m =
1,
a mod n =
0,
b mod m =
0,
b mod n =
1
były spełnione? Raz jeszcze wynik ( 4 .5 ) przychodzi nam z pomocą. Wyko­
rzystując algorytm Euklidesa znajdujemy takie m / i n ', że
rn/m + n/n = 1 .
W związku z tym możemy przyjąć, że a = n 'n i b = m /m, dzieląc je w razie
potrzeby modulo mn.
W przypadku dużych modułów będą potrzebne kolejne chwyty w celu
zminimalizowania obliczeń. Szczegóły wykraczają poza zakres tej książki, ale
można je znaleźć np. w książce [208, str. 274]. Konwersja z układów reszt do
odpowiadających im oryginalnych liczb jest wykonalna, ale jest na tyle wolna,
że opłaca się z niej korzystać tylko wtedy, gdy wszystkie potrzebne działania
możemy wykonać w systemie niezależnych reszt, dokonując konwersji jedynie
raz na końcu obliczeń.
Utrwalmy pomysły dotyczące kongruencji, rozwiązując mały problem. Ile
jest rozwiązań kongruencji
x2 =
1
(mod m ) ,
(4 .4 3 )
jeśli utożsamimy wszystkie te rozwiązania x oraz x', dla których zachodzi
x mod x'? r;
Zgodnie z ogólnymi zasadami wyjaśnionymi wcześniej, powinniśmy naj­
pierw rozważyć przypadek m będącego potęgą liczby pierwszej, równego za­
tem p k dla k > 0. Kongruencja x 2 = 1 może być wtedy zapisana jako
( x —1 ) ( x + 1 ) =
0
(mod p k) ,
więc p musi dzielić albo x —1, albo x + 1 , albo obie te liczby. Liczba p nie może
jednak dzielić jednocześnie x —1 i x + 1 , chyba że p równa się 2 ; zostawmy ten
przypadek na później. Jeśli p > 2 , to alb o p k\( x —1 ) ( x + 1 )
p k\ ( x —1 ),
albo p k\( x + 1 ); mamy więc tu dokładnie dwa rozwiązania: x = + 1 oraz
X EE —1.
Przypadek, kiedy p równa się 2 jest nieco inny. Jeśli 2k\ ( x — 1 ) ( x + 1),
to albo x —1, albo x + 1 jest podzielne przez 2, ale nie jest podzielne przez 4,
więc jedna z tych liczb musi być podzielna przez 2k_1. Oznacza to, że istnieją
4 rozwiązania gdy k ^ 3, a mianowicie x = ±1 i x = 2 k_1 ± 1. (Na przykład
jeśli p k = 8 , to te cztery rozwiązania wynoszą 5, 7 (mod 8 ). Czasami warto
jest wiedzieć, że kwadrat każdej nieparzystej liczby naturalnej jest postaci
8 n -f- 1 .)
Wiemy już, że x 2 = 1 (mod m) wtedy i tylko wtedy, gdy x 2 = 1
(mod p mp) dla wszystkich liczb pierwszych p takich, że m p > 0 w roz­
kładzie na czynniki pierwsze liczby m. Każda liczba pierwsza jest niezależna
od innych, więc dla każdego układu x mod p mp otrzymujemy 2 rozwiązania,
poza przypadkiem p = 2. Jeśli więc m ma dokładnie r różnych dzielników
pierwszych, to całkowita liczba rozwiązań kongruencji x 2 = 1 wynosi 2 T, z
poprawką w przypadku gdy m jest parzyste. Dokładna liczba rozwiązań jest
równa
2 T+[ 8\ m ] + [4\m ]-[2\m J
^
Dla przykładu istnieją 4 „pierwiastki kwadratowe z jedności modulo 12,” a
mianowicie 1, 5, 7 i 11. Dla m = 15 te 4 pierwiastki to są liczby, których reszty
modulo 3 i modulo 5 wynoszą ±1. Chodzi tu oczywiście o liczby (1,1), (1,4),
(2,1), i (2,4) w systemie niezależnych reszt. Ich rozwiązania w zwykłym
zapisie dziesiętnym wynoszą odpowiednio 1,4, 11 i 14.
4.8. D alsze zastosow ania
Pozostało nam jeszcze kilka niedokończonych zagadnień z rozdziału 3. Chcie­
libyśmy na przykład udowodnić, że ciąg następujących m liczb
0
mod m, n mod m, 2n mod m, . . . ,
(m — 1 )tl mod m
(4 -4 5 )
składa się z dokładnie d kopii ciągów liczb m /d w pewnej ustalonej kolejności
0,
d,
2 d,
...,
m —d,
przy czym d = N W D (m ,n ). Jeśli na przykład m = 12 i n = 8 , to d = 4,
a omawiane liczby układają się w następujący ciąg: 0, 8 , 4, 0, 8 , 4, 0, 8 , 4,
0, 8 , 4.
Pierwsza część dowodu— wykazanie, że otrzymujemy d kopii m /d po­
czątkowych wartości— jest teraz trywialna. Mamy bowiem
jn = kn (mod m)
<ś=>
j(n /d ) = k (n /d ) (mod m /d )
na mocy (4 .3 8 ); otrzymamy więc d kopii wartości, które wystąpią, gdy 0 ^
k < m /d .
Pozostało do wykazania, że te m /d liczb to {0, d, 2d , . . . , m —d} w pew­
nym porządku. Przyjmijmy m = m /d i n = n'd. W takim razie kn mod m =
d (k n /m o d m /), ze względu na prawo rozdzielności (3.23), więc wartości,
które wystąpią, gdy 0 ^ k < m/, są d razy większe niż liczby
0
mod m /, n ' mod m /,
2 n ' mod m /,
...,
(m/ — 1 )n' mod m ' .
Wiemy jednak, że m ' _L n ' na mocy (4.27); wyciągnęliśmy przed nawias ich
NWD. Pozostał więc już tylko przypadek d = 1, czyli sytuacja, w której m i
n są względnie pierwsze.
Załóżmy więc, że m _L n. Na podstawie zasady szufladkowej Dirichleta
łatwo jest teraz zauważyć, że liczby (4 .4 5 ), to po prostu {0 , 1 , . . . , m — 1 }
ustawione w pewnym porządku. Zasada ta mówi nam, że jeśli m przedmiotów
włożymy do m szufladek, to istnieje pusta szufladka wtedy i tylko wtedy, gdy
w którejś szufladce znajduje się więcej niż jeden przedmiot (zob. wariant tej
zasady udowodniony w ćwiczeniu 3.8). To, że liczby występujące w ciągu
(4 .4 5 ) są różne, jest dość oczywiste, za względu na to, że
jn = kn (mod m)
<=>
) = k (mod m)
dla m 1 n, ze względu na równanie ( 4 .3 7 ). W związku z tym nasze m różnych
liczb musi wpaść do m różnych szufladek 0 , 1, . . . , m — 1 , co oznacza, że
zakończyliśmy uzupełnianie rozdziału 3.
Przedstawiony dowód jest pełny, ale moglibyśmy udowodnić jeszcze wię­
cej, jeśli użylibyśmy metody wprost, zamiast polegać na działaniu nie wprost
zasady szufladkowej. Jeżeli m _L n, a jednocześnie znamy wartość j e [0 .. m),
to możemy wyliczyć wprost wartość takiego k e [0 .. m), że kn mod m = j.
W tym celu rozwiążemy kongruencję
kn = j
(mod m)
ze względu na k. Wystarczy pomnożyć obie strony przez n ', gdzie m /m +
n rn — 1 , aby otrzymać
k = jn'
(mod m ) .
Ostatecznie k = jn' mod m.
Matematycy
uwielbiają mówić,
że coś jest
trywialne.
Wykorzystując pokazane właśnie własności, udowodnimy ważny rezultat
odkryty w 1640 r. przez Pierre’a de Fermat. Fermat był wielkim francuskim
matematykiem, który wniósł istotny wkład w powstanie rachunku różnicz­
kowego i całkowego, jak również wielu innych gałęzi matematyki. Pozostawił
notatniki zawierające dziesiątki twierdzeń bez dowodów, a kolejne lata po­
kazały, że nie pomylił się w żadnym przypadku. Późniejsi matematycy udo­
wodnili wszystkie jego stwierdzenia z jednym może wyjątkiem. Chodzi tu o
słynne „ostatnie twierdzenie Fermata”, zwane też „wielkim”, które mówi, że
+ bn ^ cn
KĄCIK
CIEKAWOSTEK
Euler [115]
podejrzewał, że
a4+ b 4 + c4 # d 4,
ale Noam Elkies
[92] znalazł
w sierpniu 1987 r.
nieskończenie wiele
rozwiązań.
Natomiast Roger
Frye za pomocą
przebadania
wszystkich
przypadków
wykazał (po ok. 110
godzinach obliczeń
na komputerze
Connection
Machinę),
■ że jedynym
rozwiązaniem, dla
którego
d < 1000000, jest:
958004 + 2175194
+ 4145604
= 4224814 .
(4 4 6 )
dla wszystkich liczb całkowitych dodatnich a, b, c oraz n, z zastrzeżeniem, że
rt > 2. (Oczywiście istnieje mnóstwo rozwiązań równań a + b = c i a 2 + b 2 =
c2.) Matematyk angielski, Andrew Wiles, po latach pracy ogłosił niedawno
wiekopomny dowód twierdzenia Fermata ( 4 .4 6 ) w Annals of Mathematics,
maj 1995.
Twierdzenie Fermata z r. 1640 jest znacznie łatwiejsze do sprawdzenia.
Nazywamy je dziś małym twierdzeniem Fermata (albo po prostu twierdze­
niem Fermata), a głosi ono, że
rtp - i = 1
(mod p ) ,
jeśli ri_Lp.
(447 )
Dowód: Jak zwykle zakładamy, że symbolu p używamy do oznaczenia liczby
pierwszej. Wiemy, że p —1 liczb rt mod p, 2rt mod p, . . . , (p —1)n mod p, to
liczby 1,2, . . . , p — 1 ustawione w pewnym porządku. Jeśli przemnożymy je
przez siebie, to otrzymamy
n • (2 n) • . . . • ((p -
1 )n)
= (n mod p) • (2 n mod p) • . . . • ((p — 1 )n mod p)
= (P —1)«,
przy czym kongruencje brane są modulo p. Oznacza to, że
(p — 1 )!n p —1 = (p — 1 )!
(mod p ) ,
i możemy usunąć (p —1)!, ponieważ liczba ta nie jest podzielna przez p. QED.
Często wygodniej jest używać innej postaci twierdzenia Fermata:
nv = n
(mod p)
całkowite rt.
(4 .4 8 )
Kongruencja ta zachodzi dla wszystkich liczb całkowitych rt. Jeśli n i p , to
możemy po prostu pomnożyć kongruencję obustronnie przez n. Natomiast w
przeciwnym razie, p\rt, więc rtp = 0 = n.
4 .8 . D a lsze zastosow an ia
Tego samego lata, kiedy odkrył swoje twierdzenie ( 4 .4 7 ), Fermat napisał
list do Mersenne’a informujący go o przypuszczeniu, że dla każdego rt ^ 0
liczba
fn
=
22n+1
miałaby być pierwsza. Wiedział, że początkowych pięć liczb tej postaci, to
liczby pierwsze:
2’+1 = 3; 22+1 = 5; 24+1 = 17; 2S+1 = 257; 216+1 = 65537;
ale nie mógł dojść do tego, jak sprawdzić, czy kolejna liczba, 2 32 + 1 =
4294967297, jest pierwsza.
Interesujące, że Fermat za pomocą właśnie co udowodnionego swojego
twierdzenia mógłby zauważyć, że liczba 2 32 +1 nie jest liczbą pierwszą. Wy­
starczyło wykonać trochę mnożeń. Przyjmijmy, że rt = 3 w równaniu ( 4 .4 7 ),
skąd od razu mamy, że
32
= 1
(mod 2 32 + 1),
jeśli 2 32 + 1 jest pierwsza.
To, czy ta relacja zachodzi, można sprawdzić ręcznie. Zaczynamy od 3 i pod­
nosimy kolejne liczby do kwadratu 32 razy, biorąc pod uwagę jedynie reszty z
dzielenia modulo 2 32 + 1 . Otrzymujemy kolejno 3 2 = 9, 3 2 = 81, 3 2 = 6561,
itd., aż dochodzimy do
3 2 ' 2 = 3029026160
(mod 2 32 + 1).
Niewątpliwie nie jest to równe 1, więc liczba 2 32 + 1 nie może być liczbą
pierwszą. Ta metoda obalenia przypuszczenia, że interesująca nas liczba jest
pierwsza, nie daje żadnych podpowiedzi co do tego, czemu mogłyby być
równe jej dzielniki, ale ponad wszelką wątpliwość dowodzi, że takie dzielniki
istnieją. (Wynoszą one 641 i 6700417, a zostały po raz pierwszy znalezione
przez Eulera w r. 1732 [1 0 2 ].)
Gdyby 3 2 okazało się być równe 1 modulo 2 32 + 1, wówczas rachunki
nasze nie dowiodłyby niczego, po prostu nie obaliłyby naszego przypusz­
czenia. W ćwiczeniu 47 znajdziemy omówienie twierdzenia odwrotnego do
małego twierdzenia Fermata. Materiał tam zawarty pozwala nam udowod­
nić, że pewne duże liczby są pierwsze, bez odwoływania się do ogromnych
ilości żmudnych obliczeń arytmetycznych.
Udowodniliśmy twierdzenie Fermata, kasując czynnik (p—1)! po obu stro­
nach kongruencji. Okazuje się, że (p — 1)! zawsze przystaje do —1 modulo p.
Jest to część klasycznego wyniku, znanego jako twierdzenie Wilsona:
„... laąuelle
proposition, si elle
est vraie, est de tres
grand usage.”
P. de Fermat [121]
W jedną stronę twierdzenie to jest trywialne: jeśli rt > 1 nie jest liczbą pierw­
szą, to istnieje jej czynnik pierwszy p, który jako że jest mniejszy od rt, musi
dzielić (rt—1)!, zatem ( n —1)! nie może przystawać do —1 modulo rt. (Gdyby
(rt — 1)1 przystawało do — 1 modulo rt, przystawałoby także do — 1 modulo
p, a nie przystaje.)
W drugą stronę twierdzenie Wilsona stwierdza, że (p —1)! = —1 (mod p).
Możemy to wykazać, układając w pary liczby wraz z ich antymodułami wzglę­
dem p. Jeżeli rt _L p, to wiemy, że istnieje liczba rt' taka, że
rt'rt =
(mod p ) .
1
Liczba rt' jest tu odwrotnością rt, także liczba rt jest odwrotnością rt'. Każde
dwie odwrotności liczby rt muszą być przystające do siebie, gdyż rtrt' = rtrt"
pociąga za sobą rt' = rt".
Przypuśćmy teraz, że każdą liczbę pomiędzy 1 a p —1 stawiamy w parze z
jej odwrotnością. Ponieważ iloczyn każdej liczby z jej odwrotnością przystaje
do 1 modulo p, więc iloczyn wszystkich liczb z tak utworzonych par również
przystaje do 1. Wygląda na to, że na tej samej zasadzie (p—1)! przystaje do 1.
Sprawdźmy to dla, powiedzmy, p = 5. Oczywiście 4! = 24; ale to przystaje
do 4, a nie do 1, modulo 5. Hmm! — coś tu nie gra! Przyjrzyjmy się bliżej
odwrotnościom:
1' = 1 ,
2' = 3 ,
3' = 2 ,
4' = 4 .
No tak! Liczby 2 i 3 są nawzajem ze sobą w parze, ale 1 i 4 nie są— stanowią
swoje własne odwrotności.
Musimy więc w celu kontynuowania analizy określić, które liczby x są
swoimi własnymi odwrotnościami. Dla takich liczb zachodzi x 2 = 1 (mod p),
a dopiero co pokazaliśmy, że taka kongruencja ma dokładnie 2 rozwiązania,
gdy p > 2. (Jeśli p = 2, to jest oczywiste, że (p — 1)! = —1, więc o ten
przypadek martwić się nie musimy.) Rozwiązaniami są 1 i p — 1, a pozostałe
liczby (między 1, a p — 1) stoją w parach. Ostatecznie więc
(p - U !
=
W
p -
1) = - i ,
tak jak tego chcieliśmy. Niestety nie znamy żadnej efektywnej metody wyli­
czania silni, więc twierdzenie Wilsona nie ma praktycznego zastosowania jako
test na złożoność liczby. Jest po prostu zwykłym twierdzeniem.
4.9. Fi oraz mi
Ile jest liczb całkowitych {0, 1, . . . ,rrt — 1} względnie pierwszych z rrt? Ta
ważna wielkość oznaczana przez <p(m), została nazwana „tocjentem” z m
przez angielskiego matematyka J. J. Sylvestra [348], który lubił wymyślać
nowe słowa. Wiemy, że cp(1) = 1, cp(p) = p — 1, a także cp(m) < m — 1 dla
wszystkich liczb złożonych m.
Funkcja cp nazywana jest funkcją Eulera, gdyż Euler ją badał jako pierw­
szy. Odkrył na przykład, że małe twierdzenie Fermata (4 .4 7 ) może zostać
uogólnione do złożonych liczb m w następujący sposób:
n cp(m) = -|
(mo d m ) ,
jeśli rt _L m.
(4 -5 °)
Ćwiczenie 32 polega na udowodnieniu tego twierdzenia Eulera.
Jeśli m jest potęgą liczby pierwszej p k, to łatwo jest wyliczyć cp(m),
ponieważ rt _L p k
p \n . Wielokrotności liczby p w ciągu { 0 , 1 , . . . , p k—1}
t o { 0 , p , 2 p , . . . , p k—p}; mamy więc i chpk_1, a cp(pk) oblicza to, co pozostaje,
czyli
„Si fuerit N ad x
numerus primus et
n numerus partium
ad N primarum,
tum potestas xn
unitate minuta
semper per
numerum N erit
divisibi]is.”
L. Euler [111]
cp(pk) - Plc- P lc" 1 .
Warto zauważyć, ze wzór ten daje nam właściwą odpowiedź <p(p) = p — 1 w
przypadku, gdy k = 1 .
Jeśli m > 1 nie jest potęgą liczby pierwszej, to możemy ją zapisać jako
m = mi rri2 , przy czym mi _L rri2 . Liczby 0 ^ n < m mogą być wtedy
reprezentowane w systemie niezależnych reszt jako (rt mod mi ,rt mod mz).
Zachodzi tutaj zależność
n ± m
rt mod m i 1 m i
i
n mod m 2 _L rri2
na mocy (4 .3 0 ) i (4 .4 ). Jeżeli względna pierwszość jest zaletą, to liczba
rt mod m jest „dobra” wtedy i tylko wtedy, gdy obie liczby rt mod mi i
rt mod m.2 są „dobre.” Ogólną liczbę dobrych wartości modulo m można wy­
liczyć rekurencyjnie: wynosi ona (p(mi )(p{m2)} ponieważ mamy (p(rrti) do­
brych sposobów wybrania pierwszego czynnika rt mod mi i <p{vnz) dobrych
sposobów wybrania drugiego czynnika rt mod rri2 w systemie reszt.
Rozważmy na przykład (p(12) — cp(4)cp(3) = 2 -2 = 4, ponieważ n jest
względnie pierwsze z 12 wtedy i tylko wtedy, gdy n mod 4 = (1 lub 3) i
rt mod 3 = (1 lub 2). Cztery wartości względnie pierwsze z 12 to (1,1), (1,2),
(3,1), (3 , 2 ) w systemie niezależnych reszt; odpowiadają one liczbom 1, 5 , 7 i
11 w notacji dziesiętnej. Twierdzenie Eulera mówi nam, że rt4 = 1 (mod 12)
gdy n _L 12.
Dowolna funkcja f (m) o dziedzinie całkowitej dodatniej nazywana jest
m ultiplikatywną, jeśli f ( 1 ) = 1 i
f ( m i m 2) = f ( m i ) f ( m 2)
g d y m i _ L m 2.
(4 *51 )
Udowodniliśmy właśnie, że funkcja cp(m) jest multiplikatywna. Widzieliśmy
już wcześniej w tym rozdziale inny przykład funkcji multiplikaty wnej, a mia­
„Si sint A et B
numeri inter se
primi et numerus
partium ad A
primarum sit = a,
numerus vero
partium ad B
primarum sit = b,
tum numerus
partium ad
productum AB
primarum erit
= a b .”
L. Euler [ 111]
|4 . T eoria liczb
-Jl0
nowicie liczbę nie przystających, rozwiązań kongruencji x 2 = 1 (mod m).
Jeszcze jednym przykładem może być funkcja f(m ) = m a dla każdej po­
tęgi a.
Funkcja multiplikatywna jest jednoznacznie określona przez swoje war­
tości dla liczb pierwszych, gdyż zawsze jej argument m możemy rozłożyć na
potęgi liczb pierwszych nawzajem pierwsze względem siebie. Ogólny wzór
f(tn) = f ^ [ f ( p mp),
jeśli m = ]~ Jp m»
P
( 4 .5 2 )
P
zachodzi wtedy i tylko wtedy, gdy funkcja f jest multiplikaty wna.
W szczególności wzór ten pozwala nam wyliczyć wartość funkcji Eulera
dla każdego m:
<p(rn) = n (Pmp - Pmp- ' ) = m n
p\m
(i
- - ) •(4 .53)
p\m
^
Na przykład, cp(12) = (4 —2)(3 — 1) = 12(1 — ^)(1 — ^).
Przyjrzyjmy się teraz pewnemu zastosowaniu funkcji Eulera cp w bada­
niu liczb wymiernych mod 1. Powiemy, że ułamek m /n jest w łaściw y, jeśli
0 ^ m < n. W związku z tym, cp(n) jest liczbą uproszczonych ułamków wła­
ściwych z mianownikiem równym co najwyżej n. Pamiętamy, że ciąg Fareya
3ri zawiera wszystkie ułamki właściwe z mianownikiem równym co najwy­
żej n, a także jedyny niewłaściwy ułamek y.
Zbiór wszystkich ułamków właściwych z mianownikiem równym 12 przed
uproszczeniem wygląda następująco:
_0_ J _
12’ 12’
_2_ _3_ _4_ _5_ _6_ _7_ _8_ _9_
1_0
1 2 ’ 1 2 ’1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’
TJ_
12’
Po uproszczeniu otrzymujemy ciąg
0 J _ 1 1 1 _ 5 _ 1 _ 7 _ 2 3 5 1 1
1’
1 2 ’6 ’ 4 ’ 3 ’ 1 2 ’ 2 ’ 1 2 ’ 3 ’ 4 ’ 6> 12
1 możemy teraz pogrupować te ułamki ze względu na mianowniki:
o.
1»
i.
2’
1 2 .1 3 .
3 ’ 3» 4 ’ 4»
15.
6’ 6’
j _ _5_ _Z_
12’ 12’ 12’
11
12*
Do czego może nam się to przydać? Proszę bardzo! Każdy dzielnik d liczby
1 2 występuje jako mianownik z wszystkimi cp(d) możliwymi jego licznikami.
W mianownikach z kolei możemy ujrzeć tylko dzielniki liczby 12. W związku
z tym
<P(1) + <p(2) + cp(3) + <p(4) + <p(6) + <p(12) = 12.
Podobnie będzie to wyglądało, gdy zaczniemy od nie uproszczonych, ułamków
, Ir^ - w przypadku dowolnej liczby m, zatem
Y_ <p(d) = m
( 4 -5 4 )
d \m
Gdzieś na początku tego rozdziału napomknęliśmy, że często trzeba brać
sumy względem wszystkich dzielników danej liczby. Jak widzimy, we wzorze
(4 .5 4 ) mamy taką sumę, więc nasze stwierdzenie znalazło pierwsze potwier­
dzenie (a zobaczymy też inne przykłady).
Oto zaskakujący fakt: jeśli f jest dowolną funkcją, taką że suma
g(m) = Y _ f (d)
d\m
jest multiplikaty wna, to sama funkcja f też jest multiplikaty wna. (Wynik ten
wraz z równaniem ( 4 .5 4 ) i z oczywistym założeniem, że funkcja g(m) = m jest
multiplikatywna, dostarcza nowego argumentu na rzecz multiplikatywności
funkcji Eulera.) Udowodnimy ten zadziwiający rezultat przez indukcję ze
względu na m. Baza jest prosta, bo f (1) = g(1) = 1. Niech m > 1, a ponadto
załóżmy indukcyjnie, że f(rrtirri2 ) = f(Trvi)f(m2 ), gdy mi ± rri2 i m i m 2 <
m. Jeśli m = m im .2 i mi _L rrt2 , to
g ( m i m 2) =
f(d) =
d \m i m 2
Z
L
di \ m i
d 2 \ m .2
f ( d i d 2),
a ponadto di _L d2 , gdyż wszystkie dzielniki liczby mi są względnie pierw­
sze ze wszystkimi dzielnikami liczby rri2 . Na mocy założenia indukcyjnego
f ( d i d 2 ) = f ( di ) f ( d 2 ), poza możliwym przypadkiem, gdy di = mi i d2 =
IU2 . Mamy więc
L
f(d, )
di \ m i
Y.
f(d 2)^ - f ( m i ) f ( m 2) + f ( m 1m 2)
d2 \m.2
= g ( m i ) g ( m 2 ) - f ( m i ) f ( m 2 ) + f ( m i m 2).
Jest to wszakże równe g(m i IU2 ) = g ( m i ) g(m 2 ), więc zachodzi także związek
f ( m i m 2) = f ( m i ) f ( m 2).
Na odwrót, jeśli f(m ) jest multiplikatywna, to odpowiadająca jej suma
względem dzielników g(m) =
mus^ kyć multiplikatywna. W rze­
czywistości, jak przekonamy się o tym w ćwiczeniu 33, prawdziwe jest nawet
twierdzenie mocniejsze. Ten zadziwiający rezultat zachodzi więc w obu kie­
runkach.
Funkcja M obiusa p.(m), nazwana na cześć dziewiętnastowiecznego ma­
tematyka Augusta Mobiusa, który wymyślił także swoją znaną wstęgę, jest
zdefiniowana dla wszystkich liczb całkowitych
1 za pomocą równania
Y _ M-(d.) = [m = 1].
(4.55)
d \m
Nawiasem mówiąc, równanie to jest rekurencyjne, ponieważ po lewej stronie
mamy sumę składającą się z fx(m) oraz pewnych wartości p,(d) dla d < m.
Jeśli na przykład będziemy kolejno podstawiali m = 1, 2, . . . , 12, to możemy
wyliczyć 12 początkowych wartości:
m
jx(m)
2
3 4 5 6 7
1 - 1 - 1 0 - 1 1
-1
1
8 9 10 11
0 0 1 -1
12
0
Richard Dedekind [78] i Joseph Liouville [251] zauważyli w r. 1857 na­
stępującą ważną „regułę odwracania”
g(m )
= Y _ f(d)
4=^
f(m ) =
d \m
Nadszedł właściwy
czas, aby rozgrzać
się za pomocą
ćwiczenia 11.
^(d)g(^).
( 4 .5 6 )
d \m
Zgodnie z tą regułą, funkcja Mobiusa pozwala nam zrozumieć każdą funkcję
f(m), dla której znamy wartości H d\ m f(d). W dowodzie równoważności
( 4 .5 6 ) wykorzystamy dwa chwyty opisane wzorami (4 .7 ) i (4 .9 ) na początku
tego rozdziału: Jeśli g(m) = H d\ m f(d), to
H(d)g(^) = Y . M-(-j)g(d)
d \m
d \m
= L ^ i L m
d \m
k \d
- Z Z <)<«
k \m d \(m /k )
= L
Z
k \m d \(m /k )
=
Y [m /k = 1 ]f(k) = f( m) .
k \m
W drugą stronę dowód przebiega podobnie (zob. ćwiczenie 1 2 ).
Relacja ( 4 .5 6 ) obrazuje użyteczną własność funkcji Mobiusa i za jej po­
mocą udało się nam wypisać pierwszych 12 wartości tej funkcji. Jak sobie
jednak poradzić z obliczeniem fJ-(m), gdy m jest duże? Jak rozwiązać re­
kurencję ( 4 .5 5 )? Rzecz jasna, funkcja g(m) = [ m = l ] jest multiplikatywna,
w końcu jest ona zerem poza przypadkiem, gdy m = 1. Funkcja Mobiusa
zdefiniowana równaniem (4 .5 5 ) także musi być multiplikatywna na mocy cie­
kawego faktu, który minutę czy dwie temu został udowodniony. Możemy więc
wywnioskować, czym jest |x(m) na podstawie znajomości |j.(pk).
W przypadku gdy m = p k, równanie (4 .5 5 ) gwarantuje, że
M-(1) + M-(P) + H(P2) + • • • + M-(pk) = 0
dla wszystkich k ^ 1, ponieważ dzielniki liczby p k, to 1, . . . , p k. Stąd otrzy­
mujemy
n(p) = - 1 ;
^(pk) = 0
dla k > 1 .
Zatem na mocy (4 .5 2 ) otrzymujemy ogólny wzór
r \
TT
S
1 m „i
| ' ( - ' | )r> jeśli m = p ,p 2 . . . p T;
:
jeśli 3p p2\m .
.
.
(łW)
I to jest \x.
W przypadku, gdy równanie (4 .5 4 ) potraktujemy jako rekurencję definiu­
jącą funkcję Eulera cp(m), wówczas można tę rekurencję rozwiązać stosując
regułę Dedekinda-Liouville’a (4 .5 6 ). Otrzymamy wtedy
<p(m) =
M-(d) -j
•
(4-58)
d \m
Na przykład
<p(12) = n(1) *12 + |x(2) - 6 + |x(3) -4 + 1^(4) *3 + jx(6 ) -2 + |x(12) • 1
= 1 2 - 6 - 4 + 0 + 2 + 0 = 4.
Jeśli liczba m jest podzielna przez r różnych liczb pierwszych, na przykład
{ p i , . . . , p r}, to suma (4 .5 8 ) ma tylko 2 r niezerowych wyrazów, ponieważ
funkcja \i często przybiera wartość zero. Widzimy więc, że równanie (4 .5 8 )
jest zgodne ze wzorem ( 4 .5 3 ), który można zapisać jako
<p(m) =
Jeśli przemnożymy każdy z r czynników przez (1 — 1/pj), to dostaniemy
dokładnie 2r niezerowych wyrazów w (4 .5 8 ). Zaletą funkcji Mobiusa jest to,
że stosuje się także w wielu innych przypadkach.
To zależy od tego,
jak szybko się
czyta.
Spróbujmy dla przykładu wywnioskować, ile ułamków znajduje się w
ciągu Fareya Sn- Liczba takich ułamków to liczba ułamków z przedziału
[0 .. 1], których mianowniki nie przekraczają n, jest więc ona o 1 większa od
wartości 0 (n), którą definiujemy następująco:
$ (* ) =
y_
<po<).
(4 -5 9 )
(Musimy dodać jedynkę do O (rt), ponieważ ostatnim ułamkiem ciągu jest
zawsze y.) Suma w (4 .5 9 ) wygląda skomplikowanie, ale możemy obliczyć
0 (x) nie wprost, zaobserwowawszy, że
(To rozszerzenie
do wartości
rzeczywistych jest
użytecznym
chwytem, który
stosujemy w wielu
rekurencjach
napotykanych przy
analizie
algorytmów.)
( 4 .6 0 )
= lW Li+*J
dj-s1
dla wszystkich liczb rzeczywistych x. Dlaczego zachodzi ten wzór? Wygląda
dość przeraźliwie, ale wciąż jest w zasięgu naszych możliwości. Mamy bowiem
\ LXJ D + XJ ułamków właściwych m /n , 0 ^ m < n ^ x, licząc zarówno te
uproszczone, jak i te nie uproszczone. To czyni prawą stronę. Liczba ułamków
właściwych, dla których N W D ( m , n ) = d, wynosi 0 (x /d ), ponieważ ułamki
takie są postaci m ' /n ' dla 0 ^ m ' < n ' ^ x / d po zamianie m na m /d oraz
n na n 'd . Lewa strona równania zlicza te same ułamki w inny sposób, więc
tożsamość musi zachodzić
Przyjrzyjmy się z bliska temu przypadkowi, aby równania (4 .5 9 ) i (4 .6 0 )
stały się bardziej zrozumiałe. Z definicji funkcji <D(x) wynika, że 0 (x ) =
0 ( [ x j ) . Wydaje się teraz sensowne uogólnić 0 (x ) tak, ażeby jej dziedziną
stał się zbiór liczb rzeczywistych, a nie tylko całkowitych. Stablicujmy w
punktach całkowitych parę wartości funkcji <D(x):
n
0
1
2
3
4
5
6
7
8
9
10
11
12
<p(n)
—
1
1
2
2
4
2
6
4
6
4
10
4
<D(n)
0
1
2
4
6
10
12
18
22
28
32
42
46
i możemy sprawdzić wzór ( 4 .6 0 ) dla x = 1 2 :
0 ( 1 2 ) + 0 (6 ) + <D(4) + 0(3) + 0 (2 ) + 0 (2 ) + 6 - 0 ( 1 )
= 46 + 12 + 6 + 4 + 2 + 2 + 6 = 78 = i -12 -13.
Zadziwiające.
Tożsamość ( 4 .6 0 ) może być postrzegana jako rekurencją wprost dla 0 (x ).
Widzieliśmy na przykład, jak można było jej użyć w celu obliczenia 0(12) z
wybranych wartości 0 (m ) dla m < 12. Rekurencje takie możemy rozwiązy­
wać używając innej własności funkcji Mobiusa:
g(*) =
^
= L ^ (d )g (x /d ).
d^1
(4-61)
d^1
Przedstawiona reguła odwracania zachodzi dla wszystkich funkcji f takich,
że Z k ,f ó i l f (x/ kd)| < 00. Możemy wykazać ją następująco. Załóżmy, że
9(x) = L d ^ i f(x/d). Wtedy
Z . M-(d)g(x/d) = Y _ M-(d) Y _ f(x/kd)
d js l
d^l
= ^
k ^1
H ^ /m )
m^l
=
^
p.(d)[m = kd]
d ,k ^ 1
Y f(*Ari) Y H-W = Y f(x /m )[m = 1 ] = f ( x ) .
m^1
d \m
m^l
Dowód w drugą stronę jest w istocie taki sam.
Jesteśmy już gotowi do rozwiązania rekurencji (4.60) określającej 0 (x):
=
l Y. M-(d)L*/dJ LI + */dJ .
(4-62)
d^ 1
Suma po prawej stronie jest zawsze skończona, na przykład
0(12) = ^(12-13 — 6-7 —4-5 + 0 —2-3 + 2-3
— 1-2 + 0 + 0 + 1 - 2 — 1-2 + 0 )
= 78-21 - 1 0 - 3 + 3 - 1 +1 - 1
=
46.
W rozdziale 9 zobaczymy, w jaki sposób wykorzystać równanie (4.62) w celu
uzyskania dobrego przybliżenia funkcji 0 (x). W istocie udowodnimy wzór
odkryty przez Mertensa w r. 1874 [270],
= - 4 x 2 + 0 (x lo g x ).
71
Widać więc, że funkcja 0 (x) rośnie w sposób „gładki”, wyrównując kaprysy
funkcji cp(k).
Pozostając w duchu tradycji wprowadzonej w ostatnim rozdziale, za­
kończmy ten rozdział analizą problemu ilustrującego wiele z tego, co właśnie
badaliśmy, a zarazem stanowiącego dobre wprowadzenie do rozdziału następ­
nego. Załóżmy, że mamy n paciorków różnych kolorów i że chcemy policzyć,
na ile sposobów można z nich utworzyć naszyjnik o długości m, nanizując je
na okrągły sznurek. Zaatakujemy ten problem metodą „nazwij i zwyciężaj”,
oznaczając liczbę takich naszyjników przez N(m ,rt).
Tak naprawdę
Móbius [273]
wymyślił swoją
funkcję nie ze
względu na (4 .56),
a właśnie ze
względu na (4 .61).
Jeżeli na przykład mamy do czynienia z dwoma kolorami paciorków R i
B, to naszyjników złożonych z 4 paciorków możemy ułożyć N(4,2) = 6 :
r R^
R R
^-R^
r R^
R R
^B-^
r R~>>
R B
^B^
r R~^
B B
^R-^
r R^
B B
^B-^
B B
^B^
Wszystkie pozostałe sposoby są równoważne któremuś z nich, ze względu
na to, że obroty naszyjnika nie zmieniają układu paciorków. Jednak odbicia
symetryczne uznajemy za różne, jak na przykład w przypadku m = 6 :
R
R
I
|
'R B
jest różny od
R
R
I I .
B R
^-B -7
Problem policzenia szukanej liczby konfiguracji został po raz pierwszy roz­
wiązany przez P. A. MacMahona w r. 1892 [264].
Nie ma żadnej oczywistej rekurencji na N( m, n) , ale możemy policzyć
liczbę naszyjników, rozrywając każdy z nich w m różnych punktach i ba­
dając powstałe kawałki. W rozważanym przypadku, gdy m = 4, a rt = 2,
otrzymamy
RRRR
RRRR
RRRR
RRRR
RRBR
RRRB
BRRR
RBRR
RBBR
RRBB
BRRB
BBRR
RBRB
BRBR
RBRB
BRBR
RBBB
BRBB
BBRB
BBBR
BBBB
BBBB
BBBB
BBBB
Każdy z rtm możliwych układów wystąpi co najmniej raz w takiej tabeli
składającej się z mN( m, n ) słów, a niektóre słowa wystąpią więcej niż raz.
Ile razy wystąpi tam słowo ao . . . a m_i ? To proste! Jest to oczywiście liczba
cyklicznych przesunięć a^ . . . a m_i ao . . . a ^ - i , które układają się w ten sam
wzorzec co wyjściowe ao . . . a m_ i . Słowo BRBR występuje na przykład dwu­
krotnie, ponieważ przerywając naszyjnik BRBR cyklicznie w czterech różnych
miejscach (BRBR, RBRB, BRBR, RBRB) uzyskujemy powtórzenie układu wyj­
ściowego BRBR. Na mocy tego rozumowania wnioskujemy, że
m N (m ,n ) =
ia° • *• a™-i = Qk .. . am_! a 0 . . . ak_i]
ao,...,CLm-i eSn. 0 ^ k < m
=
Y .
Y .
[ a ° **• a m —i = Q k • •• a m —i a o . . . a k—i ] .
0 ^ k < m a 0 , . . . , a m_ i e S n
Symbol Sn oznacza tu zbiór różnych kolorów. Zastanówmy się, dla ilu wzor­
ców spełnione będzie równanie ao . . . a m_i = a k . . . a m_i ao . . . a ^ - i , przy
ustalonym k. Jeśli dla przykładu m = 12 przy k = 8 , a my chcemy policzyć
liczbę różnych rozwiązań równania
ao a-\ ci2a 3 clą as ag a 7 ag a<?ai o &i i = a s a 9 a i o a n aoai a 2 a 3 a 4 a s a 6 a 7 .
Oznacza to, że ao = ag = 0 4 , cii = ac; = as, a 2 = aio = ag i 0 3 = a n = a 7.
W związku z tym wartości ao, a i , a 2 , oraz as można wybrać na rt4 sposobów,
a pozostałe już od nich zależą. Czy nie wygląda to znajomie? W ogólności
rozwiązanie równania
CLj = a (j+k) mod rn ,
dla 0 ^ j < m
zrównuje aj z a(j+lcl) mod m dla l = 1 , 2 , . . . , a wiemy przecież, że wie­
lokrotnościami liczby k modulo m
są {0 , d, 2 d , . . . , m — d}, gdzie d =
NW D(k, m). A zatem ogólne rozwiązanie można otrzymać wybierając nieza­
leżnie ao, . . . , a d- i , a następnie ustalając aj = aj_d dla d ^ j < m. Takich
rozwiązań jest rtd.
Udowodniliśmy właśnie, że
m N (m ,n ) =
£
n NWD<k’m>.
O^kcm
Ponieważ suma ta zawiera jedynie wyrazy postaci rtd, gdzie d \m , więc można
ją uprościć. Po podstawieniu d = N W D (k,m ) dostajemy
N ( m, n ) = — Y _ n d
[d = N W D (k,m )]
d\m
0 ^k<m
= 1 Y_
d\m
=
L
nd
d\m
[k/d X m /d]
0 ^k<m
H
[k-Lm/d] .
0 ^k<m/d
(Wolno nam zamienić k /d przez k, ponieważ k musi być wielokrotnością d.)
Suma z ostatniego wiersza to z definicji ^ 0 ^k<Tny d[kJLm/d] = cp(m/d),
więc natychmiast otrzymujemy wzór MacMahona:
N( m, n ) = ~m X
(P(d) Tim/d •
z— n<1 <p(\ T
a /) = ~ mY .z—
d\m
d\m
( 4 -6 3 )
Sprawdźmy go np. dla przypadku m = 4 i n = 2: liczba naszyjników równa
się 1 ( 1 -2 4 + 1 -2 2 + 2 -2 1) = 6 , tak jak przypuszczaliśmy.
Bynajmniej nie jest oczywiste, że wartość N(m ,ri) określona wzorem
MacMahona jest liczbą całkowitą. Spróbujmy udowodnić wprost, bez odwo­
ływania się do naszyjników, że
Y
cp(d)nm/d =
0
(mod m ) .
( 4 *6 4 )
d \m
W szczególnym przypadku, gdy m jest liczbą pierwszą, kongruencja ta re­
dukuje się do rtp + (p — 1)n = 0 (mod p), czyli do n v = n. Jak już to
spostrzegliśmy wyprowadzając wzór (4 .4 8 ), kongruencja ta jest wersją ma­
łego twierdzenia Fermata. W związku z tym wzór (4 .6 4 ) jest prawdziwy dla
m = p. Możemy go więc potraktować jako uogólnienie twierdzenia Fermata
w przypadku, gdy moduł przystawania nie jest liczbą pierwszą. (Uogólnienie
Eulera ( 4 .5 0 ) jest inne.)
Udowodniliśmy wzór (4 .6 4 ) dla wszystkich modułów przystawania będą­
cych* liczbami pierwszymi. Przyjrzyjmy się więc najmniejszemu przypadkowi
złożonemu, gdy m = 4. Musimy pokazać, że
n 4 + n 2 + 2n = 0
(mod 4 ).
Dowód staje się prosty, gdy rozważamy osobno przypadki n parzystych i
nieparzystych. Jeśli rt jest parzyste, to wszystkie trzy czynniki pod sumą po
lewej stronie przystają do 0 modulo 4. Jeśli n jest nieparzyste, to zarówno rt4,
jak i n 2 przystają do 1, natomiast 2n przystaje do 2. Lewa strona przystaje
więc do 1 + 1 + 2, co daje 0 modulo 4. Gotowe.
Ośmielmy się teraz rozważyć przypadek m = 12. Taka wartość dla m,
choć niewielka, powinna być interesująca, ponieważ ma sporo dzielników,
wliczając w to kwadrat liczby pierwszej. (Widzimy też szansę, że dowód dla
m = 12 da się uogólnić dla dowolnego m.) Kongruencja, którą mamy pokazać,
jest następująca:
rt12 + rt6 + 2n 4 + 2 u 3 + 2rt2 + 4ri = 0
(mod 12).
I co teraz? Ze względu na własność (4 .4 2 ), kongruencja ta zachodzi wtedy i
tylko wtedy, gdy zachodzi również modulo 3 i modulo 4. Pokażemy najpierw,
że zachodzi modulo 3. Kongruencja (4 .6 4 ) zachodzi dla liczb pierwszych, więc
mamy ri3 + 2n = 0 (mod 3). Właściwe pogrupowanie składników pozwala
nam użyć tego faktu dla wyjściowej sumy w takiej postaci:
n 12 + n 6 + 2n 4 + 2n 3 + 2n 2 + 4 n
= (rt12 + 2 n 4) + (rt6 + 2 n 2) + 2 (n 3 + 2n)
= 0 + 0 + 2-0 = 0
(mod 3 ).
Czyli modulo 3 wszystko się zgadza.
Jesteśmy w połowie drogi. W celu pokazania, że kongruencja ta zachodzi
dla m = 4, zastosujemy ten sam chwyt. Pokazaliśmy, że rt4 + n 2 + 2n = 0
(mod 4), użyjmy więc tego wzorca, jako wskazówki przy przegrupowaniu
naszej sumy:
rt12 + rt6 + 2n 4 + 2n 3 + 2n 2 + 4n
= (n 1 2 + u 6 + 2 n 3 ) + 2 (u 4 + n 2 + 2 ri)
= 0 + 2-0 = 0
(mod 4 ).
QED dla przypadku m = 12.
Do tej pory udało się nam udowodnić naszą kongruencję dla m będących
liczbami pierwszymi oraz dla m = 4 i dla m = 12. Spróbujmy teraz naszych
sił dla potęg liczb pierwszych. Aby zbytnio nie uogólniać od razu, załóżmy, że
m = p 3 dla pewnej liczby pierwszej p. Lewa strona wzoru ( 4 .6 4 ) przybiera
wtedy postać
n p3 + cp(p)np2 + (p(p2 )np + cp(p3)n
= n p3 + (p -
1 )n p2 +
(p 2 - p )n p + (p 3 - p 2)n
= (n p3 - u p2<) + p (n p2 - n p) + p 2 (np - n) + p 3 u .
Otrzymane wyrażenie przystaje do 0 modulo p 3, jeżeli n p3 — n p2 jest po­
dzielne przez p 3, n v — n v jest podzielne przez p 2 i n v — n jest podzielne
przez p, ponieważ cała suma będzie wtedy podzielna przez p 3. Z alternatyw­
nej postaci małego twierdzenia Fermata wnioskujemy, że n v = n (mod p),
więc p dzieli n v —n. Istnieje zatem liczba całkowita q taka, że
rtp = rt + pq .
Podnieśmy teraz obie strony do p-tej potęgi i rozwińmy prawą stronę zgod­
nie ze wzorem dwumianowym (który napotkamy w rozdziale 5), a następnie
przegrupujmy wynik:
n ?2 = ( n + V ą )v = n * + (pq) 1n ” - 1 ( ^
+ (pq) 2n * - 2 Q
+ •••
= n p + p 2Q
dla pewnej liczby całkowitej Q. Wspólny czynnik p 2 wolno nam było wy­
ciągnąć przed nawias dlatego, że w drugim składniku (^) = p, a w dodatku
czynnik (pq ) 2 występuje we wszystkich kolejnych wyrazach. Wiemy już, że
7
2
p z dzieli n p —n p.
QED: Quite Easily
Done.
Znów podnosimy obie strony do p-tej potęgi, rozwijamy i przegrupowujemy, otrzymując
u p3 = (n p + p 2 Q )p
-= u p2 +
+ (p 2 Q) 2 n p(p_2'
+ ••'
= n p2 + p3Q
dla jakiejś innej liczby całkowitej Q. Liczba p 3 dzieli więc n p3 —n p2, co
kończy dowód dla m = p 3; pokazaliśmy przecież, że p 3 dzieli lewą stronę
wzoru (4 .6 4 ).
Co więcej, możemy pokazać przez indukcję, że dla pewnej końcowej liczby
całkowitej £2 (końcowej, bo braknie nam już czcionek) zachodzi
n Pk = rtPk_1 + p k£
i w związku z tym
n pk = n pk 1
( mo d p k),
dla k > 0 .
( 4 *6 5 )
Lewa strona równania (4 .6 4 ), która równa się
(rtpk—rtpk ^ + p (n pk
npk 2) + ••• + p k - 1 (np —n) + p kn ,
jest podzielna przez p k, czyli przystaje do 0 modulo p k.
Już prawie kończymy. Skoro udowodniliśmy wzór (4 .6 4 ) dla potęg liczb
pierwszych, to został jeszcze do udowodnienia przypadek, gdy m = m.im.2 ,
gdzie mi _L rri2 , przy założeniu, że kongruencja zachodzi dla mi i m 2 . Przy
naszej próbie z m = 12 korzystaliśmy z rozkładu na m = 3 i m = 4; podobnie
powinno dziać się i w ogólnym przypadku.
Wiemy, że funkcja cp jest multiplikatywna, więc wolno nam stwierdzić,
że
^cp(d)nm/d=
d\m
Y .
<p(d1d2 ) n mim 2/d' d2
di \rai ,d2\rri2
=
Y <P(di)( £
di\mi
‘P(d2){nm’ / d' ) m2/d2) .
d2\m2
Wewnętrzna suma przystaje do 0 modulo rri2 — założyliśmy przecież, że wzór
( 4 .6 4 ) zachodzi dla r a z — zatem i cała suma przystaje do 0 modulo m 2 . Ze
względu na symetrię, dochodzimy do wniosku, że cała suma przystaje do 0
także modulo m i, więc zgodnie ze wzorem ( 4 .4 2 ) przystaje również do 0
modulo m. QED.
*
Ć w iczenia______________________________________
Rozgrzewka
1 . Jaka jest najmniejsza liczba naturalna mająca dokładnie k dzielników,
dla 1 ^ k ^ 6 ?
2 . Udowodnij, że N W D (m , n)-NW W (m , rt) = m-n i korzystając z tej tożsa­
mości wyraź NW W (m , n) za pomocą N W W (n mod m, m), w przypadku
gdy rt mod m / 0 . Wskazówka: Skorzystaj ze wzorów (4 . 1 2 ), ( 4 . 1 4 ) oraz
(4 -1 5 )3. Niech n[x) oznacza liczbę liczb pierwszych nie przekraczających x. Czy
prawdą jest, że zachodzi równość n(x) —n{x — 1 ) = [x jest pierwsza]?
4. Co by się zmieniło, gdybyśmy konstrukcję Sterna-Brocota zaczęli od pię-
ciu ułamków (f, i , Ą , =1, 2), zamiast od
5. Znajdź proste wzory na Lk i Pk, gdy L i P są macierzami 2 x 2 z równa­
nia (4 .3 3 ).
6 . Co oznacza ‘a = b (mod 0)’?
7. Dziesięciu ludzi ponumerowanych od 1 do 10 staje w kręgu, tak jak w
problemie Flawiusza, i eliminujemy co m-tą osobę. (Wartość m może
być znacznie większa niż 10.) Udowodnij, że nie jest możliwe, aby dla
jakiegokolwiek k jako pierwsze zostały wyeliminowane osoby o numerach
1 0 , k i k + 1 (w tej kolejności).
8 . Rozważany w tekście system niezależnych reszt (x mod 3 ,x mod 5) ma
ciekawą własność, a mianowicie liczba 13 odpowiada w tym systemie
parze (1,3), co wygląda prawie tak samo jak w zapisie dziesiętnym. Wy­
jaśnij, jak można znaleźć wszystkie przypadki takiej zgodności bez prze­
glądania wszystkich piętnastu par reszt. Innymi słowy, znajdź wszystkie
rozwiązania kongruencji
10x + -y = x
(mod 3 ),
10x + y = y
(mod 5 ).
Wskazówka: Zauważ, że 10u + 6 v = u (mod 3) i 1 0 u + 6 v = v (mod 5).
9. Pokaż, że liczba (377—1)/2 jest nieparzysta i złożona. Wskazówka: Czemu
jest równe 3 77 mod 4?
10. Oblicz cp(999).
1 1 . Znajdź funkcję cr(n) mającą własność
g(n) =
f (k)
O^k^n
^
f (n ) =
Y. o W g t u - k ) .
O^k^n
(Jest to funkcja analogiczna do funkcji Mobiusa, por. równanie ( 4 .5 6 ).)
12. Uprość wzór £ dXm L kXd n(k) g(d/k).
13. Całkowita liczba dodatnia n nazywa się liczbą bezkwadratową, jeśli nie
jest podzielna przez m 2 dla jakiegokolwiek m > 1. Znajdź warunek ko­
nieczny i dostateczny na to, aby liczba n była bezkwadratowa:
a) używając reprezentacji wykładniczej (4 . 1 1 ) liczby n;
b) używając |Lt(n).
P o d sta w y
14. Udowodnij albo podaj kontrprzykład:
a) NW D (km, kn) — kN W D (m, n ) ;
b) N W W (km ,kn) = k N W W (m ,n ).
15. Czy każda liczba pierwsza występuje jako czynnik pewnej liczby Eukli­
desa en ?
16. Ile wynosi suma odwrotności początkowych u liczb Euklidesa?
17. Oznaczmy przez f n n-tą „liczbę Fermata” 2 + 1. Udowodnij, że f m _L
f n , jeśli m < n.
18. Wykaż, że jeśli 2n + 1 jest liczbą pierwszą, to n musi być potęgą 2.
19. Pokaż, że dla każdej liczby całkowitej dodatniej n zachodzą następujące
tożsamości:
cp(k+ 1
Z
1 ^k<n
=
y_
L
[(m A )/r m /k ] j
1<m^n _ X1^k<m
= n - l - £
(k — 1 )! + 1
k=1
W skazówka: Jest tu ukryta pułapka, a odpowiedź jest całkiem prosta.
20. Dla każdej liczby całkowitej dodatniej n istnieje liczba pierwsza p taka,
że n < p ^ 2n. (W istocie jest to tzw. „postulat Bertranda”, postawiony
i sprawdzony dla rt < 3000000 przez Josepha Bertranda w r. 1845, a
udowodniony dla wszystkich n przez Czebyszewa w r. 1850.) Za pomocą
postulatu Bertranda pokaż, że istnieje stała b « 1,25 taka, że wszystkie
liczby
L2bJ,
L22bJ,
L222bJ, ...
są pierwsze.
2 1 . Niech Pn oznacza n-tą liczbę pierwszą. Znajdź stałą K taką, że
[(10n2K ) m o d 10nJ = Pn .
2 2 . Liczba
1111111111111111111 jest pierwsza.'Udowodnij, że dla każdej
podstawy systemu liczbowego b, liczba (11 . . . 1 )b może być pierwsza
tylko wtedy, gdy liczba jedynek jest pierwsza.
23. Znajdź rekurencję na p(k), funkcję calówki, którą zajmowaliśmy się przy
okazji omawiania 6 2 (11!). Pokaż, że istnieje związek pomiędzy p(k) oraz
krążkiem, który w kroku k został przeniesiony przy przenoszeniu n-krążkowej wieży Hanoi za pomocą 2n — 1 ruchów, dla 1 ^ k ^ 2n — 1.
24. Wyraź ep (n!) za pomocą Tp (n), sumy cyfr w systemie reprezentacji przy
podstawie p uogólniając tym samym wzór ( 4 .2 4 ).
25. Powiemy, że m dokładnie dzieli n, co zapisujemy jako m \\n , jeśli m \n i
m ! l n /m . Przykładem może tu służyć wyrażenie p ep^n!^\\n! napotkane
przy okazji omawiania czynników typu silnia. Czy prawdą jest, że
a) k \\n i m \\n
k m \\n , dla k _L m.
b) Dla wszystkich m ,n > 0 , N W D (m ,n )\\m , albo N W D (m ,n )\\n .
26. Rozważ ciąg S n wszystkich nieujemnych ułamków właściwych m /n ta­
kich, że m n ^ N. Na przykład
G _0J_111111121213253456789J_0
^10 ~ 1»10 >9>8>7’6’5 >4 >3»5 >2>3’1>2 >1>2’1>1>1M >1>1>1> 1 *
Czy rzeczywiście tak jest, że m 'n —m n ' = 1, jeżeli m /n jest bezpośred­
nim poprzednikiem m '/n ' w ciągu S n ?
27. Podaj prostą regułę porównywania liczb wymiernych w reprezentacji sys­
temu liczbowego Sterna-Brocota.
28. Początek reprezentacji Sterna-Brocota liczby n wygląda następująco:
7i = P3L7P ,5 LP292LPLP2LP3LP14L2P . . . .
Wykorzystaj to do znalezienia możliwie prostych wymiernych przybliżeń
liczby 7i, których mianowniki są mniejsze niż 50. Czy 22/7 będzie wśród
nich?
29. W tym rozdziale została przedstawiona zależność między dwójkowymi
reprezentacjami liczb rzeczywistych x = (0 , b i b 2 b 3 . . . )2 z przedziału
[0.. 1) i liczbami rzeczywistymi zapisanymi w systemie Sterna-Brocota
oc = Bi B2 B3 . . . z przedziału [0.. 0 0 ). Jeśli liczba x odpowiada liczbie oc
i
x 7^ 0 , to jaka liczba odpowiada liczbie 1 —x?
30. Udowodnij następujące twierdzenie (zwane chińskim twierdzeniem o resztach): Niech m i , . . . , m r będą liczbami naturalnymi spełniającymi rrij _L
mic dla 1 ^ j < k ^ r. Przyjmijmy, że m = mi . . . m r; niech a i , . . . , ar,
A będą liczbami całkowitymi. Istnieje wtedy dokładnie jedna liczba cał­
kowita a taka, że
a = aic (mod mk) dla l ^ k ^ r
i
A ^ a < A + m.
31. Liczba naturalna zapisana w systemie dziesiętnym jest podzielna przez 3
wtedy i tylko wtedy, gdy suma jej cyfr jest podzielna przez 3. Udowodnij
i
uogólnij tę powszechnie znaną regułę.
3
/ó g
^
/ '^ 0
Dlaczego „Euler”
wymawia się
„O jler” podczas
gdy na „Euklidesa”
mówi się
„Elklides” ?
32. Udowodnij twierdzenie Eulera ( 4 .5 0 ) uogólniając dowód wzoru (4 .4 7 ).
33. Pokaż, że jeśli f(m ) i g(m) są funkcjami multiplikatywnymi, to multipli­
katywna jest też funkcja h(m) = X d \ m f(d) g(m /d ).
34. Udowodnij, że wzór ( 4 .5 6 ) jest szczególnym przypadkiem wzoru ( 4 .6 1 ).
Ć w iczen ia d om ow e
35. Załóżmy, że funkcja I(m,n) spełnia równanie
I(m ,n )m + I(n ,m )n = N W D ( m , n ) ,
dla każdych nieujemnych liczb całkowitych m i n takich że m / n. W
związku z tym we wzorze (4 .5 ) I(m,n) = m / i I(n, m) = n ', czyli
wartość I(m ,n) jest odwrotnością liczby m ze względu na n. Znajdź
rekurencję, która zdefiniuje I(m ,n ).
36. Rozważmy zbiór Z(\/TÓ) = (m + nVTÓ | m ,n całkowite}. Liczbę m +
nVTÓ nazwiemy jed n o ścią, jeśli m 2 — 1 0 n 2 = ± 1 , gdyż istnieje dla niej
liczba odwrotna (to sformułowanie bierze się stąd, że (m-|-n\/TÓ) -zb(m—
n y /TÓ) = 1 ). Na przykład liczba 3^ł- \/TÓ jest jednością, podobnie jak
19 — 6y/10. Nie ma sensu włączać do rozkładu na czynniki par znoszą­
cych się jedności, po prostu będziemy je ignorowali. Liczby nie będące
jednościami w zbiorze Z ( \ / l 0 ) nazywamy pierwszymi, jeśli nie mogą być
przedstawione jako iloczyn dwóch^licjb ^ie będących jednościami. Po­
każ, że liczby 2, 3 i 4 ± a/10 są jefinośaąmi w Z( v/1_0 ). Wskazówka: Jeśli
2 = (k + l v ^ ) ( m + n\/TÓ), to 4 = (k2 — 1 0 l 2 )(m 2 — 1 0 n 2). Co wię­
cej, kwadrat każdej liczby naturalnej modulo 10 może być równy 0 , 1,4,
5, 6 lub 9.
37. Udowodnij wzór ( 4 . 1 7 ). Wskazówka: Pokaż, że en -~- = (en_i —\ ) 2j r \
i
rozważ 2 _TLlog (en — \ ).
38. Udowodnij, że jeśli a 1 b i a > b, to N W D (am — bm, au — b71) =
a NWD(m,n) _ ^NWD(m,-a)^ gfefe 0
m < n. (Wszystkie zmienne są
liczbami całkowitymi.) Wskazówka: Wykorzystaj algorytm Euklidesa.
39. Niech S(m) będzie najmniejszą liczbą całkowitą dodatnią n, dla której
istnieje rosnący ciąg liczb całkowitych
m = ai < ci2 < • • • < a t = n
taki, że a i a 2 . . . a t jest kwadratem liczby całkowitej. (Jeśli m samo w
sobie jest kwadratem liczby całkowitej, to możemy przyjąć, że t = 1 i
n = m.) Na przykład S(2) = 6 , ponieważ najlepszym takim ciągiem jest
cii = 2. Mamy więc
n
1
2
3
4
5
6
7
8
9
10
11
12
S(n)
1
6
8
4
10
12
14
15
9
18
22
20
Udowodnij, że S(m) ^ S(m '), jeśli tylko 0 < m < m '.
40. Załóżmy, że liczba rt ma w systemie pozycyjnym o podstawie p przed­
stawienie (am . . . ai ao)p. Udowodnij, że
n !/ p €„(nn = ( - l ) M " 0 Qmt . . . a , ! Qo!
(mod p ) .
(Lewa strona, to po prostu n! z usuniętymi wszystkimi czynnikami p.
Dla n = p ten wzór to twierdzenie Wilsona.)
41. a) Pokaż, że jeśli p mod 4 = 3, to nie ma liczby całkowitej n takiej, że p
dzieli n 2 + 1. Wskazówka: Wykorzystaj małe twierdzenie Fermata,
b) Jednocześnie wykaż, że jeśli p mod 4 = 1, to takiej liczby całkowi­
tej nie ma. W skazówka: Zapisz (p — 1)! jako ( n l S 1
~ k)) i
przypomnij sobie twierdzenie Wilsona.
42. Pokaż, że jeśli ułamki m /n i m //n ' są w postaci nieskracalnej, to ich
suma m /n + m //r t ' wyrażona w postaci nieskracalnej będzie miała mia­
nownik równy n n ' wtedy i tylko wtedy, gdy n _L n '. (Innymi słowy, uła­
mek (m n' H -m /n j/n n' jest w postaci nieskracalnej wtedy i tylko wtedy,
gdy n i n ' nie mają wspólnych dzielników.)
43. W drzewie Sterna-Brocota na poziomie k mamy 2k węzłów. Odpowiadają
one macierzom Lk, Lk_1 P, . . . , Pk. Pokaż, że ciąg ten możemy otrzymać
zaczynając od macierzy Lk, a następnie sukcesywnie mnożąc ją przez
(i
2p(n) + l )
dla 1 ^ n < 2 k, gdzie p(n) jest funkcją calówki.
44. Pokazać, że jeśli średnia liczba orłów uzyskanych w rzutach pewną niewyważoną monetą wynosi 0,316, to musiano wykonać co najmniej 19 rzu­
tów. (Zakładamy tu, że jeśli wyrzucono m orłów w n rzutach rozważaną
monetą, to m /n E [0,3155.. 0,3165).)
45. Liczba 9376 ma ciekawą własność samoreprodukcji przy podnoszeniu do
kwadratu:
93762 '= 87909376.
Ile spośród 4-cyfrowych liczb x spełnia równanie x 2 mod 10000 = x? Ile
spośród n-cyfrowych liczb x spełnia równanie x 2 mod 1 0 n = x?
46. a) Udowodnij, że jeśli n* = 1 i n k = 1 (mod m), to TtNWD^*»kJ = 1 .
b) Pokaż, że 2^ ^ 1 (mod n) dla n > 1.
W skazówka: Rozważ najmniejszy pierwszy czynnik liczby n.
47. Pokaż, że jeśli n m _ 1 = 1 (m odm ), a jednocześnie n (m_1)//p ^ 1 (m odm )
dla wszystkich liczb pierwszych p takich, że p \ ( m — 1 ), to m jest liczbą
pierwszą. Wskazówka: Pokaż, że jeśli ten warunek jest spełniony, to
wszystkie liczby n k mod m są różne dla 1 ^ k < m.
48. Uogólnij twierdzenie Wilsona( 4 4 9 ) przez rozważenie wartości wyrażenia
( r ii^ n < m , n im n ) m odm , dla m > 1.
4» T eoria liczb
176
49. Oznaczmy przez R(N) liczbę par liczb całkowitych (m^n), takich że 1 ^
m ^ N, 1
im ln .
a) Wyraź R(N) za pomocą funkcji
b) Udowodnij, że R(N) = Y.d.^1 [ N / d J ^ l d ) .
50. Niech m będzie liczbą całkowitą dodatnią i niech
cu =
e27rx/m _
cos ( 27t / m ) + i s i n ( 27r / m ) .
Mówimy, że cu jest m-tym pierw iastkiem z jedności ze względu na to,
że cum = e2ni = 1. Ogólniej, każda z m liczb zespolonych cu°, cu1 ,
. . . , cum _ 1 jest m-tym pierwiastkiem z jedności, ponieważ (cuk ) m =
e2n\cx _ -j y j związku z tym wielomian z — cuk jest dzielnikiem wie­
lomianu z m — 1 dla 0 ^ k < m. Ponieważ pierwiastki te są różne, więc
pełny rozkład wielomianu z m — 1 w dziedzinie liczb zespolonych musi
wyglądać następująco:
0 ^k<m
a) N i e c h z ) = rio^k<m,
a,k)* (
zdefiniowany wielomian
stopnia cp(m) nazywamy w ielom ianem cyklotom icznym rzędu m.)
Pokaż, że
zm - i
=
d \m
b) Udowodnij, że ¥ m(z) = r id \m (zd - l ) ^(m/d).
Zadania egzaminacyjne
51. Udowodnij twierdzenie Fermata (4 .4 8 ) rozwijając wyrażenie (1 +1 H------ b
1
)p zgodnie z twierdzeniem multimianowym.
52. Załóżmy, że rt oraz x są takimi liczbami całkowitymi dodatnimi, że x
nie ma dzielników mniejszych lub równych n (poza 1 ), p zaś jest liczbą
pierwszą. Udowodnij, że co najmniej |_rt/pj spośród liczb { x — 1 , x 2 —
1 , . . . , x n _ 1 — 1} jest wielokrotnościami liczby p .
53. Znajdź wszystkie liczby całkowite u takie, że u \ |"(n — 1)!/(rt + 1)"|.
54. Oblicz bez pomocy komputera 1000! mod 10250.
55. Oznaczmy przez Pn iloczyn n początkowych silni, n L i
P°każ, że dla
wszystkich liczb całkowitych dodatnich P2 n /P i jest liczbą całkowitą.
V
56. Pokaż, że
jest potęgą 2 .
57. Przyjmijmy, że S(m ,n) jest zbiorem wszystkich liczb całkowitych k takich, że
m mod k + n mod k ^ k .
Na przykład: S(7,9) = {2,4,5,8,10,11,12,13,14,15,16}. Udowodnij, że
IcGStm^n)
Wskazówka: Pokaż, że L 1sSmsSn L d\ m cp(d) = £ d;sl <p(d)|n/dj, a następnie rozważ [(Ta + rt)/dj — Lm/dJ — [n/d_|.
58. Przyjmijmy, że f(m ) = Hd \ m
Znajdź warunek konieczny i dostateczny
na to, żeby funkcją f (m) była potęgą 2 .
Zadania dodatkowe
59. Udowodnij, że jeśli x -\, . . . , xn są liczbami całkowitymi dodatnimi speł­
niającymi 1/x-\ H-------[-1 A-a = 1, to max( xi , . . . ,x Tl) < en . Wskazówka:
Udowodnij indukcyjnie następujący mocniejszy wynik: „Jeśli 1/x-\ H------ h
1/x n + 1 /<x = 1 , gdzie x i , . . . , xn są całkowitymi liczbami dodatnimi, oc
zaś jest liczbą wymierną nie mniejszą niż max( xi , . . . , xn ), to <x+ 1 ^ en+i
i x i . . . xn (cx + 1) ^ e-i . . . en en+i ( D o w ó d nie jest oczywisty.)
60. Udowodnij, że istnieje stała P taka, że wzór ( 4 . 1 8 ) daje tylko liczby pierw­
sze. Możesz skorzystać z (dalece nietrywialnego) faktu, że jeśli 0 > ^-,
to dla wszystkich odpowiednio dużych liczb p istnieje liczba pierwsza
zawarta pomiędzy p i p + p 0.
61. Pokaż, że jeśli m /n , m '/n ', i m " /n " są kolejnymi wyrazami ciągu jFn,
to
m" = [(n + NJ/ n/Jm/ —m ,
n" = |_(n + N )/n'J n ' —n .
(Rekurencją ta pozwala na wyliczanie kolejnych elementów ciągu Fareya
J N, poczynając od f i ^-.)
62. Jaka liczba w systemie dwójkowym odpowiada rozwinięciu liczby e w sys­
temie Sterna-Brocota? (Wyraź swoją odpowiedź w postaci nieskończonej
sumy, niekoniecznie przedstawiając ją w postaci zwartej.)
63. Tylko na podstawie materiału zawartego w tym rozdziale pokaż, że gdyby
(4 .4 6 ) okazało się nieprawdziwe, to najmniejsze n, dla którego istniałby
kontrprzykład, musiałoby być liczbą pierwszą. (Możesz założyć, że rów­
nanie (4 .4 6 ) zachodzi dla n = 4.) Dodatkowo, pokaż, że jeśli av + b p = cp
jest najmniejszym kontrprzykładem, to
a+ b =
mp,
jeśli p\c,
pp _ 1m p , jeśli p\c,
dla pewnej liczby całkowitej m. Wynika stąd, że liczba c ^ m p/2 musi
być rzeczywiście ogromna. Wskazówka: Przyjmij, że x = a + b, i zauważ,
że NW D (x, (ap + (x - a)v )/x) = N W D (x ,p a p- 1).
64. 3^ rzędu N jest to nieskończony ciąg ułamków oddzielonych znakami
*<’ lub *=’ i zawierający wszystkie nieujemne ułamki m /n dla m ^ 0 i
n ^ N (zawierający także ułamki w postaci skracalnej). Definiuje się go
rekurencyjnie zaczynając od
Dla N ^ 1 , tworzymy ^Pn+i z CPn przez wstawienie bezpośrednio przed
wyrazem kN ciągu
dwóch symboli:
k —1
N+ 1
jeśli kN jest nieparzyste;
k —1
N + -j ,
^N,kN
jeśli kN jest parzyste.
W poniższym zestawieniu T n j oznacza j-ty wyraz ciągu ? n , który może
być albo ‘<* albo l— dla j parzystego i jest ułamkiem właściwym dla j
nieparzystego. Na przykład
m
_
0 _0^1^2_ 1^3^4_2 ^5^6_3^ 7^8_4
2 —2
<T)_ _
—
1 2
2
1 2
2
1 2
2
1 2
2
.9^T0_5^
1 2
2
1
0 _ 0 _ 0 .1 .1 .2 . 2 _ 3 _ 1 .4 .3 .5 . 4 _ 6 _ 2 .7 .5 .
2
3 1 3 2
3 2
3
1 3 2
3 2
3
1 3
2
_
—
0 _ 0 _ 0 _ 0 </ l
2
4 3
1 4
. 2 _ 1 .2 . 3 ^ 2 _ 4 _ 3 _ 1 ^ 5 ^ - 4 . 6 _
3 4
2
3 4 2
4
3
1 4 3
4
rn
_
—
0_0_0_0_0
2
4 5 3
1
/ 1 / 1 / 2 ^ 2_1/,>
5 4
3
5 4 2
5
rn
_
—
0 _ 0 _ 0 _ 0 _ 0 _ 0 ^ 1 ^ 1 ^ 1 ^ 2 _ 1 ^ 2 ^ 2 _ 3 _ 1 ^ 3 ^ 4 _
2
4 6 5
3
16
5
4 6 3
5 4
6
2 5
6
2 . 3^-4 . 2 _ 4 _
3 4
5 2
4
**
'
(Elementy równe występują w cokolwiek dziwnym porządku.) Udowod­
nij, że znaki *<’ i ‘= ’ zdefiniowane przez podane wyżej reguły właściwie
określają porządek między sąsiadującymi ułamkami w ciągu Peirce’a.
Problem y badawcze
65. Czy wszystkie liczby Euklidesa en są bezkwadratowe?
6 6 . Czy wszystkie liczby Mersenne’a 2P — 1 są bezkwadratowe?
67. Czy prawdą jest, że maxi^j<ic^n aic/NW D(aj, a^) ^ n, dla wszystkich
ciągów liczb całkowitych 0 < ai < • • • < an?
6 8 . Czy istnieje stała Q taka, że |_Q J Jes^ pierwsze dla wszystkich n ^ 0 ?
69. Oznaczmy przez Pn n-tą liczbę pierwszą. Czy prawdą jest, że Pn+i —Pn =
0 (logPn )2?
70. Czy dla nieskończenie wielu n £ 3 (11!) = £ 2 (n !)/ 2 ?
71. Czy prawdą jest, że jeśli k ^ 1, to istnieje n > 1 takie, że 2n = k (mod n).
Czy jest nieskończenie wiele takich rt?
72. Czy prawdziwe jest stwierdzenie, że dla każdej liczby całkowitej a istnieje
nieskończenie wiele liczb rt takich, że ( p ( n ) \ ( n + a)?
73. Gdyby <D(n) + 1 wyrazów ciągu Fareya
= (yn(0),3'n(1),...,3'u(<!>(n))>
było rozmieszczonych jednorodnie, to spodziewalibyśmy się, że S^nik) «
k /® (n ). W związku z tym suma D (n) =
l^nfk) —
okre­
śla „odchylenie 5FU od jednorodności.” Czy prawdą jest, że D (n) =
0 (rt1//2+e) dla każdego e > 0 ?
74. Ile różnych wartości znajduje się w zbiorze {0! mod p, 1! mod p , . . . , (p —
1 )! mod p}, gdy p —t 0 0 ?
Całe szczęście!
Odpocznijmy. W poprzednim rozdziale zmagaliśmy się z sumami zawiera­
jącymi funkcje podłoga, sufit, mod, fi i mi. Teraz zajmiemy się współczyn­
nikami dwumianowymi, które okażą się (a) ważniejsze w zastosowaniach i
(b) łatwiejsze w przekształcaniu od tych funkcji.
5.1. P odstaw ow e tożsam ości
Zwane również:
kombinacją bez
powtórzeń z
u elementów po k.
Symbol (£) nazywamy współczynnikiem dwumianowym (albo symbolem
Newtona), ze względu na ważne twierdzenie zwane wzorem dwumianowym.
Twierdzenie to poznamy później. Symbol ten czytamy „n po k.” Ma on kombinatoryczną interpretację— jest to liczba sposobów, na które można wybrać
k-elementów ze zbioru n-elementowego. Na przykład ze zbioru {1,2,3,4} mo­
żemy wybrać dwa elementy na sześć sposobów:
{1,2},
{1,3},
{1,4},
{2,3},
{2,4},
{3,4};
stąd (2 ) = 6 .
^ Aby wyrazić liczbę (£) w sposób bardziej zrozumiały, zamiast liczyć
liczbę podzbiorów ustalmy liczbę k elementowych podciągów wybranych z
n elementowego zbioru. Dla podciągów ważny jest porządek, w jakim wy­
stępują elementy. Używamy takiej samej argumentacji, jakiej używaliśmy w
rozdziale 4, by pokazać, że n! jest liczbą permutacji rt obiektów. Pierwszy
element ciągu możemy wybrać na rt sposobów, drugi na tl —1 sposobów, itd.
k-ty na n —k + 1 sposobów. To daje rt(rt —1 ) . . . ( n —k + 1 ) = rt- możliwych
wyborów. Ponieważ każdy k-elementowy podzbiór można uporządkować na
dokładnie k! różnych sposobów, to każdy podzbiór został policzony dokład­
nie k! razy. Stąd by otrzymać odpowiedź na nasze pytanie, wystarczy po
prostu podzielić liczbę podciągów przez k!:
fn \
W
_ n ( n - 1 ) . . . ( n —k + 1 )
“
k(k-i)...(i)
Na przykład,
1)
= ± 1 =
2-1
6 -
co zgadza się z naszym poprzednim wyliczeniem.
Liczbę rt nazywamy górnym indeksem , a liczbę k dolnym indeksem.
Ze względu na kombinatoryczną interpretację, indeksy są nieujemnymi licz­
bami całkowitymi, ponieważ zbiory nie mają ujemnej lub ułamkowej liczby
elementów. Współczynniki dwumianowe mają jednak zbyt wiele zastosowań,
dlatego usuniemy te ograniczenia. Najbardziej użyteczne będzie przyzwole­
nie na to, by górny indeks był dowolną liczbą rzeczywistą (lub zespoloną),
a dolny był dowolną liczbą całkowitą. Nasza formalna definicja przybierze
zatem następującą postać:
( T*fT*_ 11
fT _ V —
I—1 1
k(k-D...(D
0 ,
-r»fc
= id’
llc z b a c a łk 0 W lta k ^ 0; (5.1)
.liczba całkowita k < 0 .
Definicja ta ma kilka cech godnych naszej uwagi. Po pierwsze, górny in­
deks jest oznaczony symbolem r, nie rt. Ma to uwydatnić fakt, że współczyn­
niki dwumianowe mają sens dla dowolnej liczby rzeczywistej r pojawiającej
się w tym miejscu. Na przykład, mamy (“^) = (—1)(—2)(—3)/(3 *2 *1) = —1.
Nie potrafimy podać żadnej sensownej kombinatorycznej interpretacji tego
współczynnika dwumianowego, ale r = —1 jest ważnym, szczególnym przy­
padkiem. Takim przypadkiem jest również r = —1/2.
Po drugie, możemy traktować (£) jako wielomian stopnia k zmiennej r.
Ten punkt widzenia będzie nam często pomocny.
Po trzecie, nie zdefiniowaliśmy współczynnika dwumianowego dla dol­
nych indeksów innych niż liczby całkowite. Można to uczynić, ale obecne
zastosowania są raczej rzadkie, stąd odłożymy to uogólnienie na później.
Uwaga końcowa: po prawej stronie definicji wymieniliśmy ograniczenia
‘liczba całkowita k ^ 0 ’ i ‘liczba całkowita k < 0 ’. Aby zakres stosowania był
jasny, takie ograniczenia pojawią się we wszystkich tożsamościach, którymi
będziemy się zajmować. Ogólnie, im mniej ograniczeń, tym lepiej. Choć tożsa­
mości bez ograniczeń są najbardziej przydatne, to jednak każde ograniczenie
pojawiające się w tożsamości jest jej ważną częścią. Kiedy przekształcamy
współczynniki dwumianowe, łatwiej jest tymczasowo ignorować trudne do
spamiętania ograniczenia i tylko później sprawdzić, czy nic nie popsuliśmy.
Sprawdzić jednak trzeba.
Niemal zawsze, na przykład, usłyszymy, że (£) równa się 1, więc my­
ślimy uspokojeni, że ta równość jest prawdziwa. Gdy jednak przyjrzymy się
definicji ( 5 . 1 ), spostrzeżemy, że (£) równa się 1 tylko wtedy, gdy rt ^ 0 (za­
5. W spółczynniki dwumianowe
kładamy, że rt jest liczbą całkowitą). Gdy natomiast rt < 0, wówczas (£) = 0.
Pułapki takie jak ta czynią życie pełnym przygód.
Zanim dojdziemy do tożsamości, w których będziemy obłaskawiać współ­
czynniki dwumianowe, zerknijmy jeszcze na drobne wartości. Liczby w ta­
beli 182 tworzą początek trójkąta Pascala, nazwanego tak na cześć Blaise’a
T abela 182. Trójkąt Pascala
Współczynniki
dwumianowe były
dobrze znane w Azji
na k iM stuleci
narodzinami
Pascala [90].
Pascala (1623-1662), który napisał o nich znakomitą rozprawę [286]. Puste
miejsca w tabeli są równe 0, ponieważ licznik jest równy zeru. Na przykład,
(2 ) = 0 • 0)/(2 -1) = 0. Miejsca te zostały zostawione puste, by uwydatnić
resztę tabeli.
Warto jest zapamiętać wzory na trzy pierwsze kolumny tabeli:
(r\ = r
We Włoszech
trójkąt ten jest
nazywany trójkątem
Tartaglii.
=
(5 -2 ;
gdzie r jest dowolną liczbą rzeczywistą. (Przypomnijmy, że (""J ) = ^n (n + 1)
jest wyprowadzonym w rozdziale 1 wzorem na liczby trójkątne. Liczby trój­
kątne znajdziemy w kolumnie (™) tabeli 182.) Dobrym pomysłem jest zapa­
miętanie pierwszych pięciu rzędów trójkąta Pascala. Jeśli w jakimś zadaniu
zobaczymy ciąg 1, 4, 6 , 4, 1, będzie to niechybny znak, że prawdopodobnie
gdzieś w pobliżu przyczaiły się współczynniki dwumianowe.
Liczby w trójkącie Pascala, prawdę mpwiąc, spełniają nieskończenie
wiele równości. Nie bądźmy więc zdziwieni, gdy po bliższym się im przyj­
rzeniu znajdziemy zadziwiające wzory. Rozważmy na przykład ciekawą „wła­
sność sześciokąta,” spełnianą przez sześć liczb 56, 28, 36,120, 210,126 otacza­
jących 84 w lewej dolnej części tabeli 182. Mnożąc na dwa sposoby co drugą
liczbę z tego sześciokąta otrzymamy zawsze ten sam iloczyn: 56-36-210 =
28-120-126 = 423360. Tę samą własność ma dowolny inny sześciokąt z trój­
kąta Pascala.
Czas na tożsamości. Naszym celem jest nauczenie się kilku prostych
reguł, za pomocą których rozwiążemy ogromną większość praktycznych za­
dań, w których pojawiają się współczynniki dwumianowe.
Gdy górny indeks r jest liczbą całkowitą n, nie mniejszą od dolnego in­
deksu k, wówczas możemy przedstawić współczynnik dwumianowy w postaci:
T l\
Tl!
k)
k! (n —k)!
całkowite n ^ k ^ 0 .
( 5 .3 )
Aby otrzymać ten wzór, wystarczy przemnożyć licznik i mianownik w de­
finicji ( 5 . 1 ) przez (n — k)!. Czasami dobrze jest przedstawić współczynnik
dwumianowy za pomocą silni (na przykład przy dowodzie własności sześcio­
kąta). Często postępujemy odwrotnie, zamieniając silnie na współczynniki
dwumianowe.
Reprezentacja za pomocą silni pokazuje, że trójkąt Pascala jest syme­
tryczny. Każdy wiersz czytany z lewa na prawo lub z prawa na lewo wy­
gląda tak samo. Równość odzwierciedlającą ten fakt — nazywaną regułą sy­
m e tr ii— wyprowadzamy przez zamianę k n a n - k :
/n \
lk /
_
/ n \
Vn —k / ’
całkowite n ^ 0 ,
,
całkowite k.^
Wzór ten ma sens kombinatoryczny, gdyż wyróżniając k przedmiotów ze
zbioru u elementowego, wybieramy albo k wyróżnionych przedmiotów, albo
j n —k nie wyróżnionych przedmiotów.
Oczywiste jest ograniczenie we wzorze ( 5 .4 ) mówiące, że n i k są liczbami
całkowitymi, ponieważ dolny indeks musi być liczbą całkowitą. Ale dlaczego n
nie może być liczbą ujemną? Załóżmy, na przykład, że n = —1. Czy zachodzi
równość:
Nie. Gdy, na przykład, k = 0, otrzymamy po lewej stronie 1, a po prawej 0.
Faktycznie, dla dowolnej liczby całkowitej k ^ 0 lewa strona równa się
(_ ,)
_
K
ą
a
.
ale ponieważ dolny indeks jest ujemny, więc prawa strona zawsze równa się 0 .
„ C’est une chose
estrange combien il
est fertile en
proprietez.”
B. Pascal [286]
Dla ujemnych k lewa strona równa się 0, a prawa
- . " - 0
Byle nie wpaść
na egzaminie!
-
czyli albo 1, albo —1. Zatem równanie
= (jj"lk) ’ jest zawsze fałszywe!
Reguła symetrii zawodzi również dla pozostałych liczb ujemnych n. Na
nieszczęście bardzo łatwo się zapomina o tym ograniczeniu, zwłaszcza gdy
wyrażenie w górnym indeksie jest funkcją, która tylko czasami przybiera
ujemne wartości dla nieznanych (ale poprawnych) argumentów. Każdy, kto
wielokrotnie przekształcał współczynniki dwumianowe, wpadł w tę pułapkę
co najmniej trzy razy.
Reguła symetrii ma jedną, rehabilitującą ją cechę. Jest ona prawdziwa
dla wszystkich wartości k, nawet wtedy gdy k < 0 lub k > n (ponieważ obie
strony równości są wówczas równe zeru). W przeciwnym razie 0 ^ k ^ n i
symetria zachodzi bezpośrednio ze wzoru ( 5 .3 ):
n\ _
rt!
_
k
£!(ti —k)t
J
rt!
( u - ( u - k ) ) ! (n —k)!
/ n \
\n -k y
Następna ważna tożsamość pozwala przesuwać liczby ze współczynnika
dwumianowego i do niego:
(5-5)
D - »
Ograniczenie na k zapobiega dzieleniu przez 0. Tożsamość ( 5 .5 ) nazywamy
regułą pochłaniania, ponieważ często używamy jej do wchłonięcia zmiennej
pozostawionej na zewnątrz współczynnika dwumianowego. Równanie wynika
z definicji ( 5 . 1 ), gdyż r - = r(r — 1
oraz k! = k(k — 1)! dla k > 0. Obie
strony zerują się, gdy k < 0 .
Jeśli przemnożymy obie strony równości ( 5 .5 ) przez k, to otrzymamy
regułę pochłaniania, prawdziwą nawet wówczas, gdy k = 0 :
k(k ) = T( k - l ) ’
całkowitek-
(5-6)
Równość ta ma partnera zachowującego dolny indeks:
(r - k) f M = r ( T k 1 ) >
całkowite k.
( 5 .7 )
,? odstawowe tożsamości
Równość ( 5 .7 ) możemy wyprowadzić wstawiając wzór ( 5 .6 ) pomiędzy dwie
reguły symetrii:
( r - O
= (r-lc)
= r
= r
r —1
r -k -1
( V )
(symetria)
(wzór ( 5 .6 ))
(sym etria).
Chwileczkę! Twierdziliśmy, że tożsamość ta jest prawdziwa dla w szyst­
kich liczb rzeczywistych r, a dowód, który przed chwilą przeprowadziliśmy,
jest prawdziwy tylko wtedy, gdy r jest dodatnią liczbą całkowitą. (Górny
indeks r — 1 musi być nieujemną liczbą całkowitą, jeśli chcemy bezkarnie
zastosować regułę symetrii ( 5 .4 ).) Oszukiwaliśmy? Nie! Co prawda, wypro­
wadzenie to jest prawdziwe tylko dla dodatnich liczb całkowitych r, ale mo­
żemy twierdzić, że równość zachodzi dla wszystkich wartości r, ponieważ obie
strony równania ( 5 .7 ) są wielomianami zmiennej r stopnia k + 1 . Niezerowy
wielomian stopnia co najwyżej d może mieć co najwyżej d miejsc zerowych.
Stąd różnica dwóch wielomianów stopnia co najwyżej d, jeśli nie jest tożsamościowo równa zeru, nie może być zerowa w więcej niż d punktach. Innymi
słowy, jeśli dwa wielomiany co najwyżej stopnia d równają się w więcej niż
d punktach, to są sobie równe we wszystkich punktach. Pokazaliśmy, że dla
dowolnej dodatniej liczby całkowitej r zachodzi (r — k)(£) = t ^ 1). Stąd
oba wielomiany równają się sobie w nieskończenie wielu punktach, czyli są
identyczne.
Technika dowodzenia z poprzedniego akapitu, którą nazywamy argumen­
tem w ielom ianow ym , jest użyteczna przy rozszerzaniu wielu tożsamości z
liczb całkowitych na liczby rzeczywiste. Będziemy z niej korzystać wiele razy.
Niektóre równości, takie jak reguła symetrii ( 5 .4 ), nie są równościami pomię­
dzy wielomianami, stąd nie zawsze tę metodę można zastosować. Na szczęście
wiele równości ma odpowiednią postać.
Inną wielomianową równością, być może najważniejszą z tożsamości dwu­
mianowych, jest ta, która jest znana pod nazwą reguły dodawania:
) - ( V )
+
r —1
k —1
całkowite k.
(5-8)
Gdy r jest dodatnią liczbą całkowitą, reguła dodawania mówi nam, że każda
liczba z trójkąta Pascala jest sumą dwóch liczb z poprzedniego wiersza. Pierw­
sza z nich znajduje się bezpośrednio nad naszą liczbą, druga po lewej stronie
pierwszej. Reguła pozostaje prawdziwa również wówczas, gdy r jest liczbą
(No, może. Ale
akurat nie tutaj.)
ujemną, rzeczywistą lub zespoloną. Jedynym ograniczeniem jest to, że k musi
być liczbą całkowitą, gdyż tak jest zdefiniowany współczynnik dwumianowy.
Jeśli założymy, że r jest dodatnią liczbą całkowitą, to regułę tę mo­
żemy udowodnić za pomocą interpretacji kombinatorycznej. Przypomnijmy,
że (£) jest liczbą możliwych wyborów k-elementowych podzbiorów zbioru
r-elementowego. Jeśli mamy zbiór r jajek zawierający jedno zepsute jajko,
to na (£) sposobów możemy wybrać k jajek. Dokładnie (rk1) razy wybie­
rzemy tylko dobre jajka, a (kZi) razy wśród wybranych jaj będzie jedno
zepsute, ponieważ tak naprawdę wybieramy k — 1 z r — 1 dobrych jaj. Do­
dając te dwie liczby do siebie otrzymamy równość ( 5 .8 ). W wyprowadzeniu
tym założyliśmy, że k ^ 0 i r jest dodatnią liczbą całkowitą. Dla k < 0 obie
strony równości są równe zeru. Argument wielomianowy załatwia nam resztę
przypadków.
Równość ( 5 .8 ) możemy także udowodnić dodając do siebie tożsamości
(5-7) i (5-6):
Lewa strona równa się t (£), stąd obie strony możemy podzielić przez r. Do­
wód jest prawdziwy dla wszystkich r, z wyjątkiem łatwego do sprawdzenia
przypadku r = 0 .
Ci, którzy nie zamierzają znajdować tak zręcznych dowodów, i nie zamie­
rzają się przemęczać, będą woleli wyprowadzenie wzoru ( 5 .8 ) bezpośrednio z
definicji. Jeśli k > 0, to
(V )C ) =
(r —1)— ( r - l ) Ł n l
k!
+
( k — 1)1
(r —1)— - (r —k)
(r —1
ki
+
ki
(t-I)Ł z It _
_
ki
ki" “ \k
Lk
(r
Przypadek k ^ 0 i tym razem nie sprawia kłopotu.
Zobaczyliśmy trzy różne dowody reguły dodawania. Nie ma w tym nic
dziwnego. Współczynniki dwumianowe mają wiele użytecznych właściwości,
z których kilka zmusza nas do dowodzenia tożsamości od ręki.
Reguła dodawania jest w istocie rekurencją liczb z trójkąta Pascala, stąd
będzie ona szczególnie użyteczna w indukcyjnych dowodach innych tożsa­
mości. Jedną z nich otrzymamy natychmiast przez rozwinięcie tej rekurencji.
Ponieważ (J-,) = 0, to składnik ten znika i możemy się zatrzymać. Ta metoda
daje ogólny wzór
Zauważmy, że nie potrzebujemy ograniczać liczby k z dołu, gdyż dla k < 0
wszystkie wyrazy sumy są równe zeru.
Wzór ten wyraża współczynnik dwumianowy jako sumę współczynni­
ków dwumianowych, których górne i dolne indeksy pozostają w tej samej
odległości. Otrzymaliśmy go poprzez wielokrotne rozpisanie współczynnika
dwumianowego o najmniejszym dolnym indeksie: najpierw (|) , potem ( 2 ),
(^) i na końcu (^). Co się stanie, gdy będziemy postępować inaczej, wielokrot­
nie rozbijając współczynnik dwumianowy o największym dolnym indeksie?
Otrzymamy
Teraz (3 ) jest zerem (jak również (2 ) i (2 ), ale obecność obu współczynników
pozwoli nam zgrabniej zapisać tożsamość):
L V 7
O^k^TL
- (m)
\ / + (m
\ / )+ '" + (m
\ .
m
1J >
całkowite m, n ^ 0 .
(5 . 1 0 )
Tożsamość ta, którą nazwiemy sum ow aniem po górnym indeksie, określa
współczynnik dwumianowy jako sumę współczynników o stałym dolnym in­
deksie. Tym razem musimy zachować ograniczenie k ^ 0, gdyż składniki
sumy dla k < 0 nie są równe zeru. Także m i n nie mogą być ujemne.
Tożsamość ( 5 . 1 0 ) ma interesującą interpretację kombinatoryczną. Jeśli
chcemy ze zbioru n + 1 biletów numerowanych od 0 do n wybrać m + 1
biletów, to na (^ ) sposobów wybierzemy tak, by biletem o największym
numerze był bilet k.
Oba wzory ( 5 .9 ) i ( 5 . 1 0 ) możemy udowodnić przez indukcję na podsta­
wie reguły dodawania. Możemy je też wyprowadzić jeden z drugiego. Do­
wiedźmy na przykład ( 5 .9 ) z ( 5 . 1 0 ). Nasz dowód zilustruje pewne, zwy­
kłe przekształcenia współczynników dwumianowych. Będziemy chcieli prze­
kształcić lewą stronę
C kk) wzoru ( 5 -9 ) tak, by wyglądała jak lewa strona
Y_ (^ ) wzoru ( 5 . 1 0 ). Wtedy zastosujemy ten wzór, zastępując sumę poje­
dynczym współczynnikiem dwumianowym, by ostatecznie przekształcić ten
współczynnik w prawą stronę wzoru ( 5 .9 ).
Załóżmy dla wygody, że r i n są nieujemnymi liczbami całkowitymi.
Ogólny przypadek ( 5 .9 ) wynika z argumentu wielomianowego. Piszmy m za­
miast r, gdyż zmienna ta bardziej kojarzy się z liczbą całkowitą. Wykonujemy
teraz systematycznie nasz plan:
^— f m + k \
k^n
y
—m^k^n
7
(m + k
k
T- ( T )
—m^k^n
L
0 ^k<m+n
_
-
/ m + n + 1\
V m +i ;
_
”
/ m + n + 1\
V
n
;
Przyjrzyjmy się temu wyprowadzeniu krok po kroku. Kluczowym miejscem
jest drugi wiersz, w którym zastosowaliśmy regułę symetrii ( 5 .4 ) zastępując
(m+k) przez ( ^ k ) . Wolno nam to zrobić tylko wtedy, gdy m + k ^ 0. Z tego
5.1. P od staw ow e tożsam ości
,w-.
powodu w pierwszym kroku ograniczyliśmy zakres k, odrzucając wszystkie
wyrazy, dla których k < —m. (Możemy to zrobić, gdyż te wyrazy są równe
zeru.) Teraz prawie jesteśmy gotowi zastosować wzór (5 .10 ). Umożliwia to
trzeci wiersz, w którym podstawiliśmy k —m w miejsce k i doprowadziliśmy
do porządku zakres sumowania. Ten krok, podobnie jak pierwszy, wykorzy­
stuje tylko notację
Teraz k pojawia się tylko w górnym indeksie, a przy
tym zakres sumowania jest we właściwej postaci, stąd w czwartym wierszu
możemy zastosować równanie (5 .10 ). Praca zostanie zakończona, gdy jeszcze
raz skorzystamy z reguły symetrii.
Pewne sumy z rozdziałów 1 i 2 są szczególnymi przypadkami równania
(5 ;io). Na przykład, dla m = 1 otrzymujemy sumę kolejnych nieujemnych
liczb całkowitych nie większych od n:
= 0 + 1 + ---+TI =
+ ••• +
+
( n + 1)n
n+ 1
2
Wzór ogólny jest równoważny równości z rozdziału drugiego
(y, _|_ 1 )m+1
y~
k— = ----———|— ,
m +1
’
O^k^n
całkowite m, n ^ 0 ,
jeśli podzielimy obie strony przez m!. Faktycznie, gdy zastąpimy r i k odpo­
wiednio przez x + 1 i m, to z reguły dodawania (5 .8 ) mamy
x+ 1
x
m
rrt —
m
Metody z rozdziału drugiego dają nam zatem poręczny wzór na sumę nie­
oznaczoną
Z
óx =
x
m +1
C.
Współczynniki dwumianowe wzięły swą nazwę od wzoru dwumiano­
wego, który dotyczy potęg wyrażenia x + y. Przyjrzymy się początkowym
przypadkom tego wzoru:
(x + y)° =
1x°y°
(x + y ) 1 =
1x V
(x + y )2 =
1x 2y° + 2 x’y 1 + 1x°y 2
+ 1x V
(x + y )3 = 1x3y ° + 3 x V + 3 x V + 1x°y3
(x + y )4 = 1x4y ° + 4 x 3y 1 + 6x2y 2 + 4x'y 3 + 1x°y4 •
„W wieku 21 lat
napisał
on [Moriarty]
traktat o wzorze
dwumianowym.
Dzięki temu objął
katedrę matematyki
na jednym
z mniejszych
naszych
uniwersytetów.”
S. Holmes [85]
Nietrudno jest zauważyć, dlaczego te współczynniki są takie same jak w trój­
kącie Pascala. Jeśli rozwiniemy iloczyn
rt czynników
(x + y )n = (x + y ) ( x + y ) . . . ( x + y ) ,
to każdy ze składników jest iloczynem rt czynników, z których każdy jest
równy albo x, albo y. Liczba takich składników, w których x występuje k
razy, a y występuje n —k razy, jest współczynnikiem przy xkt(TL_k. Jest ona
równa dokładnie liczbie wyborów k z rt czynników, w których znajduje się
x, tzn. jest równa (£).
Niektóre podręczniki pozostawiają wartość 0° nie zdefiniowaną, ponieważ
gdy x maleje do 0 , funkcje x° i 0 X mają różne granice,
Jest to błąd. Jeśli wzór dwumianowy ma być prawdziwy dla x = 0, y = 0
oraz dla x = —y , to musimy zdefiniować
x° =
1 ,
dla wszystkich x.
Wzór ten jest zbyt ważny, by jakkolwiek go ograniczać! Dla kontrastu, funkcja
0X jest całkiem nieistotna. (Zobacz [220] dalsze informacje.)
Jak dokładnie wygląda wzór dwumianowy? Jest to następująca tożsa­
mość:
/■
%
r
vv _ i,
(« + v )’ = z y « v - k ,
całkowite r > 0
lu b lx /u l< ^
,
fa .= )
Sumujemy po wszystkich liczbach całkowitych k, ale tak naprawdę, gdy r jest
nieujemną liczbą całkowitą, to jest to suma skończona. Wszystkie wyrazy są
równe zeru z wyjątkiem tych, dla których 0 ^ k ^ r. Z drugiej strony,
wzór jest prawdziwy, gdy r albo jest ujemne, albo jest liczbą rzeczywistą lub
nawet zespoloną. W tym przypadku suma jest nieskończona i by szereg był
bezwzględnie zbieżny, musi zachodzić warunek \x/y \ < 1 .
Dwa szczególne przypadki wzoru dwumianowego są warte naszej uwagi,
nawet jeśli są one niezwykle proste. Jeśli x = y = 1 i r = rt jest liczbą
nieujemną, to
2U
=
H-------b
,
całkowite n ^ 0 .
Z tej równości wynika, że sumą elementów n-tego wiersza trójkąta Pascala
jest 2n . Jeśli w miejsce x podstawimy —1 zamiast +1, otrzymamy
0n
-
H-------b ( — 1 )n
,
całkowite n ^ 0 .
5.1. P od staw ow e to żsa m o ści |
T abela 191. Trójkąt Pascala, skierowany w górę
f--3
r .- 2
Ą
4U;.
l-
1
-1
*
1
1
;
-4
-3
«f ,*■
^
10 - 2 0 ' . 35 "-56 t 84 -1 2 0
6 --10
15 - 2 1
28 - 3 6
3 -4
5 -6
7
-8
-2
1
0
-1
0
0
-1
0
1
0
-1
0
1
0
-1
0
^
,I
165 -2 2 0 '* 286
45
9
1
0
-55
-10
-1
0
66
11
1
0
Mi
Na przykład, 1 —4 + 6 —4 + 1 = 0. Sumą elementów każdego wiersza, gdy
kolejne elementy mają przeciwne znaki, jest zero, z wyjątkiem pierwszego
wiersza (gdy rt = 0 i 0 ° = 1 ).
Często używamy wzoru dwumianowego w szczególnym przypadku y = 1,
jeśli r nie jest nieujemną liczbą całkowitą. Przyjrzyjmy się temu przypadkowi.
Napiszmy z zamiast x, by podkreślić fakt, że poniższa równość jest spełniona
przez dowolną liczbę zespoloną:
(1 + Z ) r
=
ę ( £ ) z \
M <
1•
( 5 - 13 )
Wzór ( 5 . 1 2 ) wynika z powyższego, jeśli podstawimy z = x / y i przemnożymy
obie strony przez y r .
Wzór dwumianowy udowodniliśmy posługując się interpretacją kombinatoryczną tylko dla przypadków, w których r jest nieujemną liczbą całkowitą.
Nie możemy uzasadnić ogólnego przypadku posługując się argumentem wie­
lomianowym, gdyż wtedy pojawia się suma nieskończona. Dla ustalonego r
możemy użyć szeregu Taylora i teorii funkcji zespolonych:
k^O
k!
Łatwo wyliczymy pochodne funkcji f(z) = (1 + z)r. Wynoszą one f ^ ( z ) =
r—(1 + z ) r_k. Po podstawieniu z = 0 otrzymamy ( 5 . 1 3 ).
Musimy również udowodnić zbieżność sumy nieskończonej dla |z| < 1 .
Jest to prawdą, ponieważ z równania ( 5 .8 3 ) wynika, że (£) = 0 ( k - 1 - r ).
Przyjrzyjmy się teraz dokładniej wartościom (£), gdy n jest ujemną
liczbą całkowitą. Wyliczając te wartości możemy skorzystać z reguły do­
dawania ( 5 .8 ). Wypełnimy w ten sposób miejsca, które leżą powyżej liczb
(Znaczenie
symbolu O jest
omówione
w rozdziale 9.)
192
|S . W spółczynniki dwum ianowe
w tabeli 182 i otrzymamy tabelę 191. Na przykład, ( g ) = 1, ponieważ
O = Co') + t t ) i C l) =
P“
ż (?) =
+ Co1).
(-,’) = -1 itd.
Wszystkie te liczby są nam znajome. Rzeczywiście, wiersze i kolumny
tabeli 191 pojawiają się jako przekątne tabeli 182 (z wyjątkiem znaku mi­
nus). Stąd musi istnieć związek pomiędzy wartościami (£) dla ujemnych u z
wartościami dla dodatnich rt. Ogólny wzór
= ( - 1 )k ( k
*
całkowite k
(5 .1 4 )
jest łatwy do udowodnienia, ponieważ gdy k ^ 0 ,
rŁ = r(r — 1 ) . . . ( r —k + 1 )
=
(Nadszedł właściwy
czas na czwarte
ćwiczenie
rozgrzewkowe.)
( — 1 )k(—r )(1 —r ) . . . (k — 1 —r)
( - 1 )k(k -
r-
1 )Ł,
oraz obie strony równają się zeru, gdy k < 0 .
Tożsamość ( 5 . 1 4 ) jest szczególnie wartościowa, gdyż zachodzi bez żad­
nych ograniczeń. (Oczywiście, poza tym, że dolny indeks musi być, zgodnie
z definicją współczynnika dwumianowego, liczbą całkowitą.) Przekształce­
nie we wzorze ( 5 . 1 4 ) jest zwane negowaniem górnego indeksu lub „górną
negacją.”
Jak możemy zapamiętać ten ważny wzór? Inne reguły, które już spo­
tkaliśmy— symetrii, pochłaniania, dodawania itd. — są proste. Ta wygląda
nieciekawie. Mimo to nie jest tak źle. By zanegować górny indeks, napiszmy
najpierw (—1)k, gdzie k jest dolnym indeksem. (Dolny indeks się nie zmie­
nia.) Następnie natychmiast zapiszmy k, dwa razy, raz na górze, raz na dole.
Teraz zanegujmy początkowy górny indeks przez odjęcie go od nowego gór­
nego indeksu. Pracę zakończymy odejmując jeszcze 1 (zawsze odejmowanie,
nie dodawanie, przecież negujemy górny indeks).
Zanegujmy górny indeks dwa razy z rzędu, dla praktyki. Otrzymamy
= H
)1
= f - i i2 k
Szkoda tyłko, że w
ten sposób nigdzie
nie dotrzemy.
=
k -r -1
k
k — (k —r — 1 ) — 1
k
czyli wróciliśmy do punktu wyjściowego. Prawdopodobnie nie o to chodziło
twórcom tej reguły, ale dobrze jest wiedzieć, że nie pobłądziliśmy.
Inne zastosowania równości ( 5 . 1 4 ) są, oczywiście, bardziej pożyteczne od
tego. Możemy na przykład zastosować górną negację do przemieszczania war­
tości pomiędzy górnym, a dolnym indeksem. Tożsamość ta ma symetryczną
postać
^
^
1),
całkowite m ,n ^ 0, (5.15)
i zachodzi, gdyż obie strony są równe' (m+m
n )
Górna negacja może być użyta do wyprowadzenie następującej sumy:
= (—1 )m ^T
całkowite m.
( 5 -1®)
Wystarczy zanegować górny indeks, zastosować ( 5 .9 ) i wynik ponownie za­
negować:
Ł © ( - » “ - k<Cm
L (v
k^rn v 7
k-r-1
k
-er)
Równość ta daje wzór na sumę częściową r-tego wiersza trójkąta Pascala,
przy założeniu, że kolejne liczby w wierszu mają przeciwne znaki. Jeśli na
przykład r = 5 i m = 2, to otrzymamy 1 —5 + 10 = 6 = (—'1) 2 (^).
Zauważmy, że jeśli m ^ r, to wzór ( 5 . 1 6 ) daje nam naprzemienną sumę
całego wiersza. Suma ta jest równa zeru, gdy r jest dodatnią liczbą całkowitą.
Udowodniliśmy już to, gdy rozwijaliśmy (1 — l ) r za pomocą wzoru dwumia­
nowego. Dobrze jest wiedzieć, że sumy częściowe tego wyrażenia też mogą
być przedstawione w postaci zwartej.
Co możemy powiedzieć o prostszych sumach częściowych:
£ 0 Wydaje się, że jeśli potrafimy wyliczyć odpowiednie naprzemienne sumy,
to będziemy w stanie policzyć i te. Niestety, nie. Nie ma zwartej postaci
na częściową sumę liczb z wiersza w trójkącie Pascala. Możemy sumować
kolumny— korzystając ze wzoru ( 5 . 1 0 ) — ale nie wiersze. Niezwykłe jest to,
że istnieje sposób policzenia częściowej sumy elementów wiersza, jeżeli są one
(Tu podwójna
negacja nie
sprowadzi nas
do punktu wyjścia,
gdyż między
pierwszym a drugim
negowaniem
wykonaliśmy inną
operację.)
5. Współczynniki dwumianowe
194
przemnożone przez ich odległość od środka:
=
Y
m+ 1/
całkowite m.
TTl+ 1
k^m ' '
(Cóż, prawa całka
jest równa
5 V^tO + erf a),
stała plus „funkcja
błędu” ot.
Wyrażenie to
można by uważać
za postać zwartą.)
r
T -V
(5 1 8 )
(Wzór ten jest prosty do sprawdzenia przez indukcję względem m.) Związek
pomiędzy tymi sumami częściowymi z czynnikiem i bez czynnika (r/2 — k)
jest podobny do związku pomiędzy całkami
f
xe *2dx = —\ e 0(2
J—OO
i
f
e x2dx.
J—OO
Pozornie bardziej skomplikowana całka po lewej z czynnikiem x ma zwartą
postać, podczas gdy prościej wyglądająca całka bez tego czynnika nie ma.
Wygląd może zmylić. Prawie pod koniec tego rozdziału poznamy metodę,
która pozwoli nam ustalić, czy istnieje postać zwarta dowolnej sumy częścio­
wej zawierającej współczynniki dwumianowe. Metoda ta umożliwia odkrycie
takich tożsamości jak (5.16) i (5.18), jak również powie nam, że (5.17) jest
przypadkiem beznadziejnym.
Częściowe sumy szeregów dwumianowych prowadzą do zadziwiających
związków innego rodzaju:
k, , m —k
z (T )k<m
( - x ) k(x + y) m —k
= Z
k<m
całkowite m.
( 5 -1 9 )
Tożsamości tej nietrudno jest dowieść przez indukcję. Obie strony są równe
zeru, gdy m < 0 i równe 1, gdy m = 0. Niech Sm oznacza sumę z lewej
strony. Po zastosowaniu reguły dodawania (5.8) otrzymamy
s m = y_
m — 1 + r x ky m-k
k^m
+ z
('m k
r—
\ 1+ T ' ) * v a- k k<m
a dla m > 0
-1
V
+r
k^m
Zatem
Sm — (x + y )Sm_i +
—r
(-X ) 1
m
TTl
+r
Rekurencją jest spełniona także przez prawą stronę równania ( 5 . 1 9 ). Na mocy
założenia indukcyjnego obie strony muszą się sobie równać. QED.
Istnieje zgrabniejszy dowód. Gdy r jest liczbą całkowitą z zakresu 0 ^
r ^ —m, wówczas ze wzoru dwumianowego wiemy, że obie strony ( 5 . 1 9 ) są
równe (x + 'y)m+r'y- r . Ponieważ są one wielomianami zmiennej r stopnia co
najwyżej m, więc ich równość w m + 1 miejscach gwarantuje (ledwo, ledwo!)
równość dla wszystkich r.
Przykro jest mieć tożsamość, w której jedna suma równa się drugiej, a
żadna ze stron nie jest w postaci zwartej. Czasami jednak jedna ze stron oka­
zuje się łatwiejsza w przekształcaniu od drugiej. Jeśli przyjmiemy na przy­
kład x = — 1 i y = 1 , to otrzymamy alternatywną postać wzoru ( 5 . 1 6 )
Y
( m ^ T^j ( — 1 )k = f
,
k^m ^
'
Vm /
całkowite rrO 0 .
Jeżeli przyjmiemy x = y = ) i r = m + 1, to
‘
z p t 1) = £
Lewa strona jest sumą połowy współczynników dwumianowych o górnym
indeksie 2 m + 1 , która jest równa sumie swych odpowiedników z drugiej
połówki trójkąta Pascala. Wynika to z symetrii tego trójkąta. Zatem jest ona
równa j 2 Zrn+1 = 22m. To daje całkiem nieoczekiwany wzór
Y
( X
k<Cm '
ky
=
’
całkowite m ^ 0 .
( 5 *2 0 )
'
Sprawdźmy dla m = 2: (2) + j (^) + ^ (*) = 1 + \ + f = 4. Zdumiewające!
Do tej pory zajmowaliśmy się albo samymi współczynnikami dwumia­
nowymi, albo sumami, w których na każdy wyraz przypadał tylko jeden
współczynnik dwumianowy. W wielu ambitnych zadaniach napotkamy ilo­
czyny dwóch lub więcej współczynników dwumianowych, zatem przez resztę
tego podrozdziału zajmiemy takimi właśnie sumami.
Oto wygodna reguła często pomagająca w upraszczaniu iloczynu dwóch
współczynników dwumianowych:
J \k J
=
( A ( T~ k
\ k j \ m -k
całkowite m, k.
( 5 -21)
Dla k = 1 otrzymamy znaną nam regułę pochłaniania ( 5 .6 ). Chociaż obie
strony równości ( 5 .2 1 ) są iloczynami współczynników dwumianowych, jedna
ze stron może być łatwiejsza do sumowania z powodu swego wpływu na po­
zostałą część wyliczanego wyrażenia. Na przykład po lewej zmienna m wy-
(Bardzo przyjemny
kombinatoryczny
dowód można
znaleźć w [247].)
stępuje dwa razy, po prawej tylko raz. Dlatego zazwyczaj podczas sumowania
po m zastąpimy ( J (™) przez (£) ( £ 1 ^).
Równanie ( 5 .2 1 ) zachodzi głównie dlatego, że znoszą się czynniki m!, gdy
rozpiszemy
i (™) za pomocą silni:
r!
m!
m! (r —m)! k! (m —k)!
r!
k! ( m - k ) l ( r - m ) !
r!
(r —k)!
k! (r —k ) ! (m —k ) ! (r — m ) !
W porządku.
gdzie wszystkie zmienne są nieujemnymi liczbami całkowitymi i r ^ m ^
k ^ 0. To było łatwe. Co więcej, jeśli m < k lub k < 0, to obie strony
równości ( 5 .2 1 ) są równe zeru, zatem równość zachodzi dla wszystkich liczb
całkowitych m i k . Resztę załatwia argument wielomianowy.
Współczynnik dwumianowy (£) = r!/(r —k)! k! po odpowiedniej zmianie
nazw zmiennych można zapisać w postaci (a + b)!/a! b!. Podobnie wyrażenie
ze środka powyższego wyprowadzenia r!/k! (m —k}! (r—m)!, możemy zapisać
w postaci (a + b + c)!/a! b! c!. Ten „współczynnik trójmianowy” pojawia się
w „trójmianowym wzorze”:
{x + y + z ) n =
„ Excogitavi autem
olim mirabiłem
regulam pro
numeris
coefficientibus
potestatum, non
tantum a binomio
x + y , sed et a
trinomio x + y + z,
imo a polynomio
quocunque, ut data
potentia gradus
cujuscunque v. gr.
decimi, et potentia
in ejus valore
comprehensa,
ut x 5y 3 z2 , possim
statim assignare
numerum
coefficientem, quem
habere debet, sine
ulla Tabula jam
calculata.”
G. W. Leibniz [245]
r-k
m - k , 1’
Y_
0 ^a,b,c^n
(a + b + c)!
a!b! c!
V
b
(a+ b+ c
^
a + b + c —n
y-
V b+ c
0 ^a,t>,c^n
x ay b Zc
a+b+c=n
Stąd, tak naprawdę, (^ ) (^ ) jest ukrytym współczynnikiem trójmianowym.
Trójmianowe współczynniki pojawiają się czasami w zastosowaniach, dlatego
dla podkreślenia symetrii wygodnie jest je zapisać w postaci
a+ b+ c
a, b, c
(a + b + c)!
a! b! c!
Dwumianowe i trójmianowe współczynniki można uogólnić do m ultim ianowych współczynników, które zawsze można wyrazić jako iloczyn współ­
czynników dwumianowych:
(ai + a 2 + -----h a m)!
a ! ! a 2! .. . a m !
ai + a2 + • • • + am
- ( a2 -1------ 1- am
a")
T ab ela 197. Sumy iloczynów współczynników dwumianowych.
Dlatego, gdy napotykamy taką bestię, możemy ją poskromić naszymi stan­
dardowymi metodami.
Przyjrzyjmy się teraz tabeli 197, w której wymieniono najważniejsze ze
znanych standardowych tożsamości. Na nich właśnie będziemy polegać pod­
czas naszych zmagań z sumami zawierającymi iloczyny dwóch współczynni­
ków dwumianowych. Każda z tych równości jest sumą względem k, z jednym
wystąpieniem k w każdym współczynniku dwumianowym. W każdym z in­
deksów znajdziemy po jednej zmiennej m, n, r, itd. Mnogość wzorów wynika
z tego, że k pojawia się raz w górnym, a raz w dolnym indeksie ze znakiem
plus lub minus. Czasami pojawia się dodatkowy czynnik (—1)k, bez którego
nie dałoby się przedstawić sumy w postaci zwartej.
Tabela 197 jest zbyt skomplikowana, by spamiętać ją w całości. Będzie
nam służyć tylko jako ściągawka. Jednak pierwsza z równości w tej tabeli,
która jest najłatwiejsza do zapamiętania, powinna być zapamiętana. Dowia­
dujemy się z niej, że suma (względem wszystkich liczb całkowitych k) iloczy­
nów dwóch współczynników dwumianowych, których górne indeksy są stałe,
a dolne mają stałą sumę, jest współczynnikiem dwumianowym uzyskanym
przez zsumowanie obu dolnych i górnych indeksów. Tożsamość ta jest znana
jako tożsam ość C auchy’ego lub splot Vandermonde’a, ponieważ Alexandre
Vandermonde napisał o niej ważną pracę pod koniec osiemnastego wieku
[358]. Jednakże równość ta była znana w Chinach przez Chu Shih-Chieh już
w roku 1303. Wszystkie inne równości z tabeli 197 otrzymamy z tożsamo­
ści Cauchy’ego, jeśli zastosujemy ostrożnie negowanie górnego indeksu, regułę
symetrii itd. Dlatego tożsamość Cauchy’ego jest najbardziej podstawową toż­
samością z nich wszystkich.
Zagnij róg tej
strony. Później
będziesz ją mógł
szybko odnaleźć.
Będziesz tego
potrzebował!
Udowodnimy tożsamość Cauchy’ego podając jej zgrabną interpretację
kombinatoryczną. Zastąpmy k przez k — m i n przez rt —m lub załóżmy, że
m = 0, co na jedno wychodzi. Wystarczy zatem udowodnić równość
zk.fNki// )Vrt
\/ w V\r:Ti s).
—k /
\L
Kobiety mają
pierwszeństwo,
proszę panów.
(b->7)
Niech r i n będą nieujemnymi liczbami całkowitymi. Ogólny przypadek wy­
nika z zastosowania argumentu wielomianowego. Po prawej stronie (T^s) jest
liczbą sposobów wybrania n osób spośród r mężczyzn i s kobiet. Po lewej,
każdy ze składników sumy jest liczbą sposobów wyboru k mężczyzn i n —k ko­
biet. Sumując względem wszystkich k zliczamy każdą możliwość dokładnie
raz.
Najczęściej używamy tych równości w celu przekształcenia lewej strony
w prawą, gdyż taki jest kierunek upraszczania. Od czasu do czasu opłaca się
pójść w odwrotnym kierunku, tymczasowo komplikując sumę. Skutkuje to w
sytuacjach, gdy zmiana porządku sumowania pozwoli na uproszczenie sumy.
Zanim pójdziemy dalej, dowiedźmy kolejne dwie tożsamości z tabeli 197.
Łatwo jest udowodnić równość (5.23). Wystarczy zastąpić pierwszy współ­
czynnik dwumianowy przez (x_
i następnie skorzystać z tożsamości Cauchy’ego (5.22).
Następna równość (5.24) jest troszkę trudniejsza. Możemy albo ją zredu­
kować kilkoma przekształceniami do tożsamości Cauchy’ego, albo udowodnić
za pomocą starej i pewnej metody, jaką jest indukcja matematyczna. Indukcja
jest zwykle pierwszą metodą, której próbujemy, gdy opuściło nas natchnienie.
W tym przypadku pięknie działa indukcja względem l.
Dla 1 = 0 baza indukcji jest oczywista, gdyż wszystkie składniki są zerami
z wyjątkiem k = —m. Stąd obie strony tożsamości równają się (—1 )m (s~ m).
Załóżmy teraz, że równość zachodzi dla wszystkich wartości mniejszych od
pewnego, ustalonego l > 0. Stosując regułę dodawania zastąpmy (m+k) przez
( m + k ) + ( m + k —1) * Suma wyjściowa rozpada się teraz na dwie sumy, do któ­
rych z osobna stosujemy założenie indukcyjne:
Jeśli teraz zastosujemy regułę dodawania jeszcze raz, to otrzymamy prawą
stronę równości (5.24).
Zwróćmy uwagę na dwie sprawy związane z powyższym dowodem. Po
pierwsze, bardzo wygodnie jest sumować po wszystkich liczbach całkowi-
! 199
J*.
*«w
*&.
-
5.1. Podstawowe tożsam ości
tych k, a nie tylko po pewnej ich części, ponieważ unikamy problemu z
warunkami brzegowymi. Po drugie, reguła dodawania sprawdza się dobrze
w zestawieniu z indukcją matematyczną, ponieważ jest ona rekurencją dla
współczynników dwumianowych. Współczynnik dwumianowy o górnym in­
deksie l jest wyrażany za pomocą dwóch innych współczynników dwumiano­
wych o górnych indeksach l —1 i jest to dokładnie to, czego potrzebujemy,
by zastosować założenie indukcyjne.
To tyle na temat tabeli 197. Co powiemy o sumach z trzema lub więcej
współczynnikami dwumianowymi? Jeżeli zmienna indeksowa pojawia się we
wszystkich współczynnikach, to nasze szanse znalezienia zwartej postaci nie
są wielkie. Dla sum takiego rodzaju znamy tylko kilka wzorów. Jednym z
tych rarytasów, dowiedzionych w ćwiczeniu 43, jest
L /m —r + s \ / n + r —s\ / r + k
. I
k
yv
/V m + n
m) (n ) ’
całkowite m, n ^ 0 .(5 .28 )
A oto inny, bardziej symetryczny przykład:
+^
^ +
+ ky
.
CV VC
,
aV - 1)'
+
k / Vb
c+
+k
(a + b + c)!
a! b! c!
całkowite a, b, c ^ 0 .
(5 *29 )
Ma on swój odpowiednik z dwoma współczynnikami dwumianowymi
z (a + 9 ( £ + k) M )k =
’
całkowite a’b ^ °- (5-30)
który nie pojawia się w tabeli 197. Analogiczna czterowspółczynnikowa suma
nie ma postaci zwartej, ale podobna suma ma:
y ^ ^^k f cl + b \ fb + c^ ( c + d^\ ( d + a \ / ( 2 a + 2 b + 2 c + 2 d
a + ky yb + kJ yc + k y \ vd + ky/ y a + b + c + d + k
_ (a+b+c+d)! (a+b+c)! (a+b+d)! (a+c+d)! (b+c+d)!
=
(2 a + 2 b + 2 c + 2 d)! (a+c)! (b+d)! a! b! c! d!
’
całkowite a, b, c, d ^ 0 .
Wynika to z pięcioparametrowej tożsamości odkrytej przez Johna Dougalla
na początku dwudziestego wieku [83].
\
Czy tożsamość Dougalla jest sumą z największą liczbą współczynników
dwumianowych? Nie! Rekordzistą jest, jak dotąd
Oj + O-n.
H (-D z
j
on “H2-x<jktj
Jest to suma względem (TL2 1) zmiennych indeksowych k^-, gdzie 1 ^ i <
j < rt. Gdy n = 3, otrzymujemy równanie ( 5 .2 9 ). Przypadek n = 4 może
być zapisany następująco: jeśli użyjemy (a, b, c, d) zamiast (ai >0-2, 0 3 , 0 4 ) i ■
(i,j,k ) zamiast (ki 2 >k 1 3 ,k 23):
/ a + b \ f a + c \ A > + c\ / a + d \ / b + d \ / c + d \
\ b + i y \ c + j / \c + k y ^d—i —y \ d + i —ky \d + j + k y
(a + b + c + d)!
a! b! c! d!
całkowite a, b, c, d ^ 0 .
Lewa strona tożsamości ( 5 .3 1 ) jest współczynnikiem jednomianu z®z® .. .z®
powstałego po przemnożeniu n [n — 1 ) ułamków
i pełnym rozwinięciu dodatnich i ujemnych potęg zmiennych z. Prawa strona
równości ( 5 .3 1 ) została wymyślona przez Freemana Dysona w 1962 roku i
udowodniona przez kilka osób wkrótce potem. W ćwiczeniu 86 znajdziemy
„prosty” dowód tej równości.
Inną, wartą uwagi sumą mającą wiele współczynników dwumianowych
jest
Suma ta, dowiedziona w ćwiczeniu 83, ma nawet szansę użycia w praktycz­
nych zastosowaniach. Oddaliliśmy się jednak od naszego tematu „podstawo­
wych tożsamości,” zatem lepiej zatrzymajmy się i oceńmy wartość tego, czego
się do tej pory nauczyliśmy.
Widzimy, że współczynniki dwumianowe spełniają oszałamiającą różno­
rodność tożsamości. Niektóre z nich szczęśliwie są łatwe do zapamiętania
5 . 2 . P od staw ow e ćw iczen ia!
i możemy je wykorzystać do wyprowadzenia większości pozostałych równości
w kilku krokach. Tabela 202 gromadzi w jednym miejscu dziesięć najbardziej
pożytecznych tożsamości. Warto je znać!
5.2. Podstaw ow e ćw iczenia
W poprzednim podrozdziale wyprowadziliśmy kilka tożsamości przekształ­
cając sumy i stosując je w innych tożsamościach. Wymyślenie dowodów nie
było zbyt trudne— wiedzieliśmy, co chcemy udowodnić. Mogliśmy więc sfor­
mułować ogólny plan, który wypełnialiśmy potem szczegółami bez większych
kłopotów. Jednak zazwyczaj w prawdziwym świecie trudzimy się, nie z do­
wodzeniem wzorów, lecz z upraszczaniem sum. W dodatku nie wiemy, jak
może wyglądać suma po uproszczeniu, ani czy da się ją w ogóle uprościć.
Zmagając się z wieloma takimi sumami w tym i następnych podrozdziałach,
nabierzemy wprawy w radzeniu sobie z nimi. Na początek, policzmy kilka
sum z pojedynczym współczynnikiem dwumianowym.
Algorytm uczenia
się samemu:
1 przeczytaj
zadanie
2 spróbuj rozwiązać
3 przeskocz
książkowe
rozwiązanie
4 i f próba zawiodła
goto 1
else goto
następne zadanie
Z adanie 1 : S um a ilorazów
Chcielibyśmy uzyskać postać zwartą dla
Z
lc=0
(;)•
W pierwszym momencie możemy wpaść w panikę, ponieważ jak do tej pory
nie spotkaliśmy tożsamości z ilorazem współczynników dwumianowych. (Co
więcej, suma zawiera dwa współczynniki dwumianowe, co przeczy zdaniu
poprzedzającemu to zadanie.) Podobnie jak zrobiliśmy przy dowodzie tożsa­
mości ( 5 .2 1 ), możemy zapisać iloraz za pomocą silni. Możemy też podstawić
we wzorze ( 5 .2 1 ) r = n i podzielić obie jego strony przez (£) (™). Otrzymamy
n —k \
m —k )
/ / rt
\m
Niestety,
powyższy algorytm
wpada w
nieskończoną pętlę.
Sugerowane
poprawki:
set c j— 0
3a set c ( - c + 1
3b if c = N
goto Twój
asystent.
0
Jeśli zatem zastąpimy lewy iloraz, który pojawia się w naszej sumie, prawym
ilorazem, to rozważana suma stanie się równa
Z
L— (\ n_lc
m—
E. W. Dijkstra
k=0
Ciągle mamy iloraz, lecz mianownik nie zawiera zmiennej indeksowej k.
Możemy go zatem wyciągnąć poza sumę.
Możemy również uprościć warunki graniczne, sumując względem k ^ 0,
ponieważ wszystkie wyrazy k > m są zerami. Suma, która nam pozostała,
. . . Ale ten
podrozdział
nazwany został
PODSTAWOWE
ćwiczenia.
|5 . Współczynniki dwumianowe
^ .............
^
^
^^2
T abela 2 0 2 . Najważniejsze tożsamości ze współczynnikami dwumianowymi
n!
k! ( n - k ) !
n
r t-k
ii:- ■
\
.....
\k /
.
fj*
caj^owj|;e ) ę ^ o ,
-^s-ń *
k \k — 1
.
.
W j
(
całkowite
n ^ k ^ 0.
i i ; « łk o w ite n > 0 ,
W fW
całkowite k.
symetria
‘ B ( r \ ^ r f r -1
y>
...
t
i,.
pochłanianie
*
...
dodawanie
indukcja
całkowite k.
górna negacja"
•^ fW y A
/m\ ▼ / r \ / r - k \
'*»
»'-aS ( wJ\lcJ- VVVm—V
^
/t \ v _ v .* \ r
\k /
lc= ( x + y ) r
r + k’
Z
V + n + lV '
Ti
k^n
całkowite m ,Ł
iiw i
całkowite r ^ 0 ,
l u b |x /y |< 1 .
>•
^f
jł o -e r ,)
L*
całkowite u.
wzor
■ •
-,;
dwumianowy
^ ^ w S o l e g ł e 'tl'.
sumowanie
całkowite
górne*
sumowanie
■>,*
całkowite n,
tozsamosc -yg
Cauchy}ego
:
**»
j*
"
nie jest już tak straszna:
Z
k^O
n-k'
m
Jest ona podobna do tożsamości ( 5 .9 ), ponieważ zmienna indeksowa k poja­
wia się dwukrotnie z tym samym znakiem. Ale tu mamy —k, a w ( 5 .9 ) nie.
Następny krok jest oczywisty. Można zrobić tylko jedną sensowną rzecz:
£ ( ; : k') =
k^O v
n — (m —k)
m — (m —k)
t .
m -k ^ 0
n —m + k
k
L(v
k^m
Następnie zastosujmy regułę równoległego sumowania (5.9):
(u —m) + m + 1
m
11L
Na końcu wstawmy z powrotem do mianownika wyrzucone z niego (£ ) i
zastosujmy równość ( 5 .7 ). Otrzymamy postać zwartą:
To wyprowadzenie jest prawidłowe dla dowolnej liczby rzeczywistej n dopóty,
dopóki nie dzielimy przez zero, tzn. dopóki rt nie jest jedną z liczb całkowitych
0 , 1, . .., m - 1.
Im bardziej skomplikowany jest dowód, tym ważniejsze jest sprawdze­
nie odpowiedzi. To wyprowadzenie nie było zbyt skomplikowane, mimo to
sprawdźmy. Dla małych m = 2 i n = 4 mamy
+
Tak! Doskonale zgadza się z naszym wzorem (4 + 1 )/ (4 + 1 —2).
Zadanie 2: Z literatury o sortowaniu
Nasza kolejna suma pojawiła się w starożytnych czasach (początek lat siedemdziesiątych), zanim ludzie zaczęli się biegle posługiwać współczynnikami
dwumianowymi. Artykuł, w którym przedstawiono poprawioną metodę sca­
lania [196], kończył się następującą uwagą: „Można pokazać, że oczekiwana
liczba przesunięć . . . dana jest wzorem
gdzie m i n s ą zdefiniowane powyżej, natomiast symbol ^C n oznacza liczbę
kombinacji bez powtórzeń z m elementów po n. . . . Autor jest wdzięczny re­
cenzentowi za zredukowanie bardziej skomplikowanego równania na wartość
oczekiwaną przesunięć do postaci tutaj podanej.”
Zobaczymy, że nie jest to ostateczna odpowiedź na problem autora. Nie
zasługuje ona nawet na miano odpowiedzi częściowej.
Na początku przekształćmy sumę w coś, z czym będziemy mogli pra­
cować. Okropna notacja m_ r- i Cm_n _i może zniechęcić każdego. Ułatwmy
życie entuzjastycznie nastawionemu recenzentowi. W naszym języku wzór
przybierze postać:
całkowite m > rt ^ 0.
Współczynnik dwumianowy w mianowniku nie zawiera zmiennej indeksowej,
zatem usuńmy go i dalej pracujmy z sumą
Co dalej? Zmienna indeksowa pojawia się w górnym indeksie współczyn­
nika dwumianowego, ale nie w dolnym. Jeśli nie byłoby we wzorze innych k,
to moglibyśmy zastosować sumowanie względem górnego indeksu ( 5 . 1 0 ). Z
dodatkowym k nie możemy. Jeśli w jakiś sposób udałoby się nam wchłonąć
k do środka współczynnika dwumianowego, używając jednej z naszych reguł
pochłaniania, to moglibyśmy sumować względem górnego indeksu. Niestety,
reguł tych nie można tu zastosować. Ale gdyby zamiast k było m — k, to
moglibyśmy użyć reguły pochłaniania ( 5 .6 ):
(m —k)
m —k — 1
m —rt — 1
(m —n)
m —k
m —rt
Oto klucz: zapiszmy k jako m —(m —k) i rozbijmy sumę S na dwie części:
rrt —k — 1
m —rt — 1
— rrtA — (m —rt)B ,
gdzie
Sumy A i B są naszymi starymi przyjaciółkami — górny indeks się zmie­
nia, podczas gdy dolny jest niezmienny. Zajmijmy się wpierw B, ponieważ
wygląda prościej. Po prostych przekształceniach osiągniemy lewą stronę toż­
samości ( 5 .1 0 ):
m — (m —k)'
m —rt
"'"
O^m—k<
k^rt
£ C:‘) = z (
O^k^n V
/
=
L
m—n^k^m
k
m —u
k
m —u
O^k^m
W ostatnim kroku dołączyliśmy do sumy składniki z 0 ^ k < m —n. Wszyst­
kie one są zerami, gdyż górny indeks jest mniejszy od dolnego. Teraz sumu­
jemy względem górnego indeksu stosując tożsamość ( 5 . 1 0 ) i otrzymujemy
O^k^m \
/
\
/
Suma A jest podobna do B, z tym że m trzeba zastąpić przez m —1. Zatem
otrzymaliśmy zwartą postać danej sumy S, którą możemy jeszcze uprościć:
S = m A — (m —n)B = m ( m ^ — (m —n ) ( m _^
\ m —n )
\ m —n + 1
(
,
,
m + 1\ ( m
=
m — (m —n)
m —n + 1 J Vm —n
= (\ m —nn + JV\ m m
—n V
)
1
Stąd zwarta postać początkowej sumy:
T = S
C)
Ti
/ m \ / /m
m
m —n + 1
Nawet recenzent nie może tego uprościć.
Ponownie sprawdzamy wynik dla małych wartości. Gdy m = 4 i n = 2,
mamy
T =
0- ( M
+ ! • ( ? ) / © + 2 -(!)/©
co zgadza się z naszym wzorem 2 /(4 —2 + 1).
=0 + 1+ 1 =
2
3 >
Zadanie 3: Ze starego egzaminu
Czy stare egzaminy
już wymarły?
Stare egzaminy nie
umierają, idą do
piekła się przebrać.
Policzmy jeszcze jedną sumę, w której pojawi się tylko jeden współczynnik
dwumianowy. Suma ta tym razem, w przeciwieństwie do poprzedniej urodzo­
nej w murach uniwersyteckich, była zadaniem z testu domowego. Chcemy
wyliczyć wartość Qioooooo, gdzie
Qn =
\
*i
](—1 )k ,
całkowite n ^ 0.
Jest ona trudniejsza od poprzednich. Nie możemy zastosować żadnej z po­
znanych już tożsamości. Ta suma ma 21000000+1 wyrazów, więc nie możemy
ich po prostu dodać. Zmienna indeksowa k pojawia się w obu indeksach, gór­
nym i dolnym, ale z przeciwnymi znakami. Zanegowanie górnego indeksu w
niczym nie pomoże. Co prawda usunie czynnik (—1)k, ale wprowadzi 2k do
górnego indeksu.
Kiedy nic oczywistego nie da się zrobić, najlepiej jest, jak wiemy, przyj­
rzeć/się małym przypadkom. Jeśli nie dostrzeżemy jakichś regularności i nie
udowodnimy ich przez indukcję, to przynajmniej będziemy mieli trochę da­
nych do sprawdzenia naszych wyników. Mamy tu dla pierwszych czterech
wartości n niezerowe składniki i ich sumy.
n
Qn
0
G)
= 1
= 1
1
© - (?)
= 1-1
= 0
2
(o) - (?) + ®
=1-3+1
= -1
3
(S) - (D + (D - © + 0 = 1 - 7 + 1 5 - 10 + 1 = 0
Lepiej nie sprawdzajmy następnego przypadku n = 4. Szansa zrobienia błędu
w rachunkach jest zbyt duża. (Zostawmy desperatom ręczne wyliczenie skład­
ników (Y ) i ( 51) i dodanie ich do siebie.)
Wzór zaczyna się od 1, 0, —1, 0. Nawet gdybyśmy znali jedną lub dwie
następne liczby, postać zwarta nie byłaby oczywista. Jeśli moglibyśmy zna­
leźć i udowodnić wzór rekurencyjny na Qu , prawdopodobnie moglibyśmy
odgadnąć i udowodnić jej zwartą postać. By znaleźć rekurencję, musimy po­
wiązać Qn z Qn_i (lub z Q mniejsze liczb y ), ale by to zrobić, musielibyśmy
powiązać składnik jak ( 12^3 13), który otrzymamy dla n = 7 i k = 13, np. ze
składnikiem (641“313) . Nie wygląda to obiecująco. Nie znamy żadnych zgrab­
nych związków pomiędzy liczbami trójkąta Pascala odległymi od siebie o
64 wiersze. Reguła dodawania, nasze główne narzędzie w dowodach induk­
cyjnych, wiąże tylko liczby z sąsiednich wierszy.
To prowadzi nas do kluczowej obserwacji: Nie potrzebujemy zajmować się
liczbami odległymi od siebie o 2 n _ 1 wierszy. Zmienna n nigdy nie pojawia się
sama, lecz tylko jako wykładnik w potędze 2n. Zatem 2n jest tylko zmyłką!
Jeśli zastąpimy 2TLprzez m, to wszystko, co musimy zrobić, to znaleźć postać
zwartą ogólniejszej (lecz łatwiejszej) sumy
Rm =
^
y 1ir
k<Cm '
/
^
’
Ach, ci podstępni
egzaminatorzy!
całkowite m ^ 0.
7
Wtedy uzyskamy postać zwartą dla Qn = R2 ^. Mamy dużą szansę na to, że
reguła dodawania da nam rekurencję dla Rm.
Wartości Rm dla małych wartości m odczytamy z tabeli 182, jeśli na
przemian dodamy i odejmiemy liczby pojawiające się na przekątnej biegnącej
z południowego zachodu na północny wschód. Oto otrzymane wyniki:
m
0
1 2
3
4
5
6
7
8
9
Rm
1
1
-1
-1
0
1
1
0
- 1 -1
0
10
Wygląda na to, że dużo rzeczy się uprościło.
Przyjrzyjmy się teraz wzorowi na Rm i zobaczmy, czy nie definiuje on
rekurencji. Nasza strategia polega na zastosowaniu reguły dodawania ( 5 .8 ) i
na znalezieniu w wynikowym wyrażeniu sum postaci R^, podobnie jak zro­
biliśmy w metodzie zaburzeń z rozdziału 2 :
m —k
= L
(-o 1
k^m
m —1 —
,_- j jic +
=■ z
k^m
= L
k^m
m — 1 —k
(- i)k +
k
y
( m —1
k-1
k<m
m —2 —k
y_
-1
< - i) k +
k^m—1
-
„
u
1<
k+1
m — 1 —k
= L
*
H )k
) ( - 1 ) k+1
( - 1)"
m
-
u - j ' - " - ’
= Rm_! + ( - 1 )2m - Rm - 2 - (—1 )2(m_1) = Rm - 1 - Rm- 2 (W przedostatnim kroku użyliśmy prawdziwego dla m ^ 0 wzoru ( m ) =
(—1)m.) Wyprowadzenie to jest prawdziwe dla m ^ 2.
Wiedzą o tym ci
z nas, którzy zrobili
już rozgrzewkowe
ćwiczenie 4.
5. W spółczynniki dwum ianowe
Dzięki rekurencji możemy wygenerować szybko kolejne wartości Rm i
szybko spostrzeżemy, że ciąg jest okresowy. Rzeczywiście:
1
0
1
1
0
—
-1
jeśli m mod 6 = <
-1
o
2
3
4
5
Dowód indukcyjny przeprowadzamy przez sprawdzenie. Gdyby żądano od nas
bardziej uczonego dowodu, moglibyśmy rozwinąć rekurencje, o jeden krok.
Otrzymamy wtedy
Rm — (Rm—2
Rm—3 )
Rm—2 —
Rm—3 >
dla m ^ 3. Zatem dla m ^ 6 mamy Rm = Rm-6Ponieważ Qu = R2 ti, wyliczymy Qn , jeśli policzymy 2n mod 6 i użyjemy
wzoru na Rm. Dla rt = 0 wiemy, że 2° mod 6 = 1. Następnie mnóżmy przez 2
(mod 6 ). Otrzymamy na przemian liczby 2 i 4. Wzór 2, 4 powtarza się. Stąd
( Rt = 1 ,
Qn = R2^ = < R2 = 0 ,
[ R4 = —1 ,
gdy rt = 0 ;
gdy rt jest nieparzyste;
gdy u > 0 jest parzyste.
Postać zwarta dla Qn zgadza się z pierwszymi czterema wartościami poli­
czonymi przez nas, gdy zajęliśmy się tym zadaniem. Wnioskujemy stąd, że
Qi 000000 = R4 = —1.
Z adanie 4: S um a zaw ierająca dw a w sp ó łczy n n ik i d w um ianow e
Naszym następnym zadaniem będzie znalezienie zwartej postaci dla
całkowite m > n > 0 .
k=0
Chwileczkę! Gdzie jest obiecany w tytule drugi współczynnik dwumianowy
Dlaczego musimy upraszczać sumę, którą już upraszczaliśmy? (Jest to suma S
z zadania 2 .)
Cóż, tę sumę jest łatwiej uprościć, jeśli spojrzymy na nią jak na iloczyn
dwóch współczynników dwumianowych i użyjemy jednej z ogólnych tożsa­
mości z tabeli 197. Drugi współczynnik dwumianowy zmaterializuje się, gdy
zapiszemy k jako (^):
k=0
O^k^n
m —k — 1
m —r t — 1
Tożsamość ( 5 .2 6 ) jest jedyną, którą możemy zastosować, ponieważ zmienna
indeksowa pojawia się w obu górnych indeksach, w dodatku z przeciwnym
znakiem.
Nasza suma nie jest jeszcze w prawidłowej postaci. Jeśli chcemy mieć
idealną zgodność ze wzorem ( 5 .2 6 ), to górną granicą sumowania powinno
być m — 1. Nie ma problemu. Składniki n < k ^ m — 1 są równe zeru.
Możemy zatem je dołączyć, podstawiając równocześnie (l, m >nyq) <— (m —
1, m —n — 1,1,0). Otrzymamy odpowiedź
V
S = (
m
\vn —n + 1 )
Jest ona przejrzystsza od znalezionej poprzednio. Możemy ją przekształcić
do poprzedniej za pomocą wzoru ( 5 .7 ):
Podobnie, możemy otrzymać interesujące wyniki podstawiając szczególne
wartości do ogólnych wzorów. Przypuśćmy, że wstawimy m = n = 1 i q = 0
do wzoru ( 5 .2 6 ). Wtedy
Lewa strona równa się l ( ( l + 1)l/2 ) —( l 2 + 2 2 H------ hi2), co daje nam całkiem
nową metodę policzenia sumy kolejnych kwadratów, z którym to zadaniem
zmagaliśmy się na śmierć i życie w rozdziale 2 .
Morał z tej powieści jest następujący: szczególne przypadki bardzo ogól­
nych sum jest lepiej przekształcać w ogólnej postaci. Gdy poznaliśmy ogólną
postać, mądrze jest poznać jej proste przypadki.
Zadanie 5: Suma z trzem a mnożnikami
Oto następna, niezbyt groźna suma. Życzymy sobie uprościć
k
Zmienna indeksowa k pojawia się w obu dolnych indeksach z tym samym
znakiem. Dlatego tożsamość ( 5 .2 3 ) w tabeli 197 najbardziej przypomina to,
co jest nam potrzebne. Po drobnych przekształceniach powinniśmy móc ją
zastosować.
Nasza suma różni się od sumy z tożsamości ( 5 .2 3 ) dodatkowym k. Mo­
żemy na szczęście wchłonąć k do jednego ze współczynników dwumianowych
używając jednej z reguł pochłaniania:
Nie interesuje nas to, że po zniknięciu k pojawiło się s, ponieważ jest ono
stałe. Teraz jesteśmy gotowi zastosować tożsamość (5.23). Otrzymamy nastę­
pującą postać zwartą:
Gdybyśmy w pierwszym kroku wchłonęli k do (£), zamiast do (£), nie mo­
glibyśmy zastosować bezpośrednio tożsamości (5.23), gdyż rt — 1 może być
liczbą ujemną. Tożsamość ta wymaga bowiem co najmniej jednej nieujemnej
wartości w co najmniej jednym górnym indeksie.
Zadanie 6: Groźna suma
Następna suma stanowi pewne wyzwanie. Szukamy postaci zwartej dla
Użyteczną miarą trudności sumy jest liczba wystąpień zmiennej indeksowej
we wzorze. Wedle tej miary jesteśmy w poważnym kłopocie — k pojawia się
tam aż sześć razy. Co więcej, kluczowy pomysł, który był skuteczny w poprzednim zadaniu— wchłonąć coś z zewnątrz do jednego ze współczynników
dwumianowych— w tym przypadku się nie sprawdza. Jeśli wchłoniemy k + 1,
to otrzymamy w zamian inne wystąpienie k. Nie tylko to sprawia nam kłopot.
Nasz indeks k jest podwójnie sprzęgnięty z liczbą 2 wewnątrz współczynnika
dwumianowego. Multiplikatywne stałe są zwykle trudniejsze do usunięcia od
addytywnych.
Jednak tym razem mamy szczęście. Liczby 2k są dokładnie w tych miej­
scach, gdzie powinny być, by można było zastosować tożsamość (5.21):
Obie dwójki znikają razem z jednym k. Jednego nie ma, pozostało pięć.
Najbardziej kłopotliwy jest mianownik k + 1, ale możemy go wchłonąć
do (£) na podstawie tożsamości (5 .6 ):
(Przypominamy, że rt ^ 0.) Drugie k zniknęło, pozostały cztery.
Mamy dwie obiecujące drogi eliminujące następne k. Możemy użyć reguły
symetrii względem (n£ k) , albo zanegować górny indeks n + k , eliminując przy
okazji mnożnik (—1)k. Zbadajmy obie możliwości, zaczynając od symetrii:
Trzecie k odeszło, trzy pozostały. Możemy teraz wiele zyskać przez użycie
tożsamości ( 5 .2 4 ): zastępując
s) przez (n + 1 ,1 , n, n) , otrzymamy
O, jak dobrze!
A już myślałem,
że trzeba będzie
zgadywać!
Zero, hmmm? Po takiej pracy? Sprawdźmy dla n = 2: (2) Q \ — (2) (2) \ +
(4) Q 3 = 1 - f + f =
Z sadza si?-
Tak dla hecy, zbadajmy drugą możliwość negując górny indeks (TXkk):
Teraz stosujemy tożsamość ( 5 .2 3 ), dla (l,m,rt,s) <— (rt + 1 , 1 , 0 , —rt — 1), i
otrzymujemy
Hej, stop! Jest to zero dla rt > 0, ale 1, gdy n = 0. W pierwszej wersji
rozwiązania otrzymaliśmy zero we wszystkich przypadkach! Co jest grane?
Suma okazuje się równa 1 dla u = 0, więc prawidłową odpowiedzią jest
‘[n = 0 ]\ Musieliśmy zrobić błąd w poprzednim dowodzie.
Przejrzyjmy ponównie dowód, wstawiając wszędzie 0 zamiast u, by zna­
leźć pierwsze miejsce, w którym powstaje niezgodność. Ach, tak! Wpadliśmy
w znaną już pułapkę. Próbowaliśmy zastosować regułę symetrii dla ujem­
nego górnego indeksu! Nie możemy zastąpić (nkk) przez (n^k), gdy k jest
Wykorzystaj
przeszukiwanie
binarne:
Spróbuj najpierw
w środku dowodu,
by sprawdzić,
czy błąd wystąpił
wcześniej,
czy później.
dowolną liczbą całkowitą, ponieważ dla k < —rt zamiast zera otrzymamy
wartość niezerową. (Bardzo nam przykro.)
Drugi czynnik sumy, (£+ ]), jest równy zeru, gdy k < —n, z wyjątkiem
rt = 0 i k = —1. Dlatego nie zauważyliśmy błędu sprawdzając przypadek
rt = 2. W ćwiczeniu 6 możemy zobaczyć, jak powinno się postąpić.
Zadanie 7: Nowa przeszkoda
Ten przypadek jest jeszcze trudniejszy. Chcemy wzoru w postaci zwartej dla
V"
(— ^^ ,
> (^ ^ L
------^ -o ym + 2 k J \ \ c ) k + - i
n > 0*4.-a
całkowite m, rt
Gdyby m równało się 0, wówczas otrzymalibyśmy dopiero co policzoną sumę.
Ale się nie równa i jesteśmy teraz w prawdziwym kłopocie — niczego, co
zastosowaliśmy w zadaniu 6 , nie możemy użyć tutaj. (Zwłaszcza pierwszego,
krytycznego kroku.)
Jednakże, gdyby udało się nam jakoś pozbyć m, moglibyśmy skorzystać
z dopiero co otrzymanego wyniku. Stąd nasz plan: Zastąpmy (T1^ klc) sumą
składników postaci (l^ °) dla pewnej nieujemnej liczby całkowitej l. Składniki
będą wyglądać jak składniki sumy z zadania 6 . Następnie zmieńmy kolejność
sumowania.
Co powinniśmy podstawić za (^ + 2 k)?
starannym przejrzeniu toż­
samości wyprowadzonych w tym rozdziale znajdziemy tylko jednego odpo­
wiedniego kandydata, mianowicie tożsamość ( 5 .2 6 ) z tabeli 197. Jest jedna
metoda użycia jej przez odpowiednie przypisanie zmiennym ( l , m, n , q,k)
wartości (rt + k — 1 , 2 k, m — 1 , 0 , j):
L
k^O
U + k \ / 2 k \ ( - l ) ik
m + 2 ky \ k / k + 1
- zk^O 0 ^j^n+k
z -1 v
-
z
j^O x
(
7
z
k^j—n +1
7
v
)(? )£ &
'
/ \
' • ł l 2'k 1 H M
V k1 /' kH+|1
1
k>0
W ostatnim kroku zmieniliśmy porządek sumowania, manipulując warun­
kami poniżej £ 1 , zgodnie z zasadami przedstawionymi w rozdziale 2 .
Nie możemy całkowicie zastąpić wewnętrznej sumy, używając wyniku z
zadania 6 , z powodu dodatkowego warunku k j —rt + 1. Ale ten warunek
jest zbyteczny dopóty, dopóki nie zachodzi warunek j — rt + 1 > 0 ; tzn.
jeśli jest j < rt. Gdy j ^ rt, wówczas pierwszy współczynnik dwumianowy
z wewnętrznej sumy jest równy zeru, ponieważ jego górny indeks zawiera
się pomiędzy 0 i k — 1 , czyli jest ostro mniejszy od dolnego indeksu 2 k.
Dlatego możemy dołożyć w zewnętrznej sumie dodatkowy warunek j < n,
nie usuwając przy okazji niezerowych wyrazów sumy. To czyni warunek k ^
j —n + 1 niepotrzebnym i możemy zastosować wynik z zadania 6 . Podwójna
suma zaczyna się teraz zwijać:
k^O
Wewnętrzne sumy znikają, z wyjątkiem przypadku gdy j = n — 1, zatem w
rezultacie otrzymaliśmy prosty wzór w postaci zwartej.
Zadanie 8 : Inna przeszkoda
od zadania 6 w inny sposób, rozważając sumę
całkowite m, u ^ 0 .
Znowu, gdyby było m = 0, wówczas otrzymalibyśmy sumę z zadania 6 . Tym
razem m pojawia się w innym miejscu. To zadanie jest trochę trudniejsze od
zadania 7, ale (na szczęście) jesteśmy coraz lepsi w znajdowaniu rozwiązań.
Zacznijmy, jak w zadaniu 6
Teraz (tak jak w zadaniu 7) spróbujmy część zależącą od m przedstawić jako
sumę składników, z którymi będziemy umieli postępować. Gdy m było równe
zeru, wchłonęliśmy k + 1 do (£). Jeśli m > 0, możemy zrobić to samo, gdy
rozwiniemy 1/ ( k + 1 + m ) w sumę składników dających się wchłonąć. Ciągle
dopisuje nam szczęście. Udowodniliśmy już w zadaniu 1 właściwą równość
(5-33)
|,5. Współczynniki dwumianowe
Po zastąpieniu r przez —k —2 otrzymamy właściwą sumę
-1 )k y
n + k\ fn
=L
W k +1 frA i
k^O
He, he i co, ktoś się
spodziewa, że
wykażemy ten wzór
licząc na skrawku
papieru?
f m \ f —k —2
Teraz, zgodnie z planem, możemy wchłonąć czynnik ( k + 1 ) - 1 do (£). W rze­
czywistości może on być wchłonięty również przez ( - k _ 2 ) _1 • Dwie możliwo­
ści wchłonięcia sugerują, że możliwe są i inne uproszczenia, które pozostaną
poza polem naszej uwagi. Tak— przedstawienie wszystkiego w naszym skład­
niku za pomocą silni i zamiana z powrotem na współczynniki dwumianowe
da nam wyrażenie, które możemy sumować względem k:
Tn!tl!
j/m + T i + 1 \
fn + 1 + j
^ n + l+ j/^ ljc + j+ l
.
(m + n + 1 )! —
—n — 1
k
m! n!
(m + n +
Ze wzoru ( 5 .2 4 ) wynika, że suma ta względem wszystkich liczb całkowitych
j jest równa zeru. Stąd suma względem j < 0 jest równa —Sm.
By obliczyć —Sm dla ) < 0, zastąpmy j przez —k —1 i sumujmy po k ^ 0:
Sm =
m! u!
Z M
(m + n + 1 )!
k^O
m !n!
(m + n + 1 )!
jkfm + n + 1
V u —k
n
’)
/ m + n + 1 \ f k —n — 1
ZM )
Tl
k<TL
m! n!
'm + n + 1 )! I M ) '
k^n
m + n + 1 \ / 2 n —k
n
__ ^
/ m + n + 1 \ f2 n —k
—
y
)C
(-1 )k(
( m + n + 1 ) ! k^2n 1 J V
J-
Tl
W końcu po zastosowaniu wzoru ( 5 .2 5 ) otrzymamy
Sm = ( - 1 ) 1
m! n!
fm\
—rt—1
= (—1 )nm—ttv
(rn + n + 1 )! Vn /
Uff! Lepiej go sprawdźmy. Gdy n = 2, mamy
Sm =
1
6
6
m+1
m+ 2
m+ 3
m ( m —1
(m + 1)(m + 2)(m + 3) *
Nasz dowód wymaga, by m było liczbą całkowitą, ale rezultat jest praw­
dziwy dla wszystkich liczb rzeczywistych m, ponieważ (m + 1) n + 1 Sm jest
wielomianem zmiennej m stopnia nie większego niż rt.
5.3. P odstaw ow e techniki
Przyjrzyjmy się trzem technikom, które istotnie wzbogacają poznane już
przez nas metody.
Chwyt 1: Połow ienie
W wielu naszych tożsamościach występują dowolne ustalone liczby rzeczy­
wiste r. Gdy r ma szczególną postać „liczba całkowita minus jedna druga,”
wówczas współczynnik dwumianowy (£) można zapisać jako całkiem inaczej
wyglądający iloczyn współczynników dwumianowych. Prowadzi to do nowej
rodziny tożsamości, które mogą być przekształcane z zadziwiającą łatwością.
Żeby sprawdzić jak to działa, zacznijmy od reguły podwajania
t- (r -
\ )“ = (2r)—/ 22k ,
całkowite k Js 0.
to^być^zwan
Chwyt 1/2.
(5-34)
Tożsamość ta jest oczywista, gdy rozwiniemy ubywające potęgi i przeple­
ciemy czynniki po lewej stronie:
r ( r — l ) ( r — 1 )(r — f ) ... ( r — k+1)(r — k + I )
(2r) (2r — 1 ) . . . (2t —2k + 1)
2 • 2 •... •2
Gdy podzielimy obie strony przez k!2, otrzymamy
całkowite k.
(5-35)
Jeśli wstawimy k = r = n, gdzie n jest liczbą całkowitą, to teraz
całkowite n.
(5-36)
Negując górny indeks, otrzymamy inny pożyteczny wzór
całkowite n.
Na przykład, gdy n = 4 mamy
(5-37)
... połowimy...
i możemy teraz
wyprowadzić
formułę jedną,
drugą...
•1 \ 4 1-3-5-7
1 -2-3-4
■1\ 4 1 - 3- 5-7-2-4- 6-8
1- 2- 3- 4- 1- 2- 3- 4
(-1 \ 4 /8
Zauważ, że zmieniliśmy iloczyn nieparzystych liczb na silnię.
Z tożsamości ( 5 .3 5 ) wynika zadziwiający wniosek. Przesumujmy ją wzglę­
dem wszystkich liczbach całkowitych k dla r = ^n. Otrzymamy
2kMk7
, 2_2k == y+y 1 / V 2V ( n - 1)/2
1
n - 1/2
[n /2\ ) ’
całkowite n ^ °-
(5-38)
Skorzystaliśmy ze wzoru ( 5 .2 3 ), ponieważ albo n /2 , albo (n — 1)/2 jest nie­
ujemną liczbą całkowitą równą (_ix/2 J.
Możemy też zastosować tożsamość Cauchy’ego ( 5 .2 7 ), by wywnioskować,
że
L (“I/2) ( ” -k ) = ( n ) = M ^ ’
Całk°Wite n ^ °-
Po wstawieniu wartości ze wzoru ( 5 .3 7 ) otrzymamy coś, co sumuje się do
nra - (=?)*(?)
a
r
(
2t
:
]
( - 1 )n / 2 k \ / 2 n - 2 k
4U \ k / \ n —k
Stąd mamy godną odnotowania własność „środkowych” elementów trójkąta
Pascala:
2k \ / 2n - 2k \
„n
k)( n - k I = 4 '
„
całkowite n ^ 0.
.
(5.39)
Na przykład, (g) ( |) + ( ? ) © + 0 ) (?) + (D (g) = 1 -20 + 2-6 + 6-2 + 20-1 =
64 = 4 3.
Ta ilustracja naszego pierwszego chwytu wskazuje, że mądrze jest spróbo­
wać zamienić współczynnik dwumianowy postaci (2^) na współczynnik dwu­
mianowy postaci (TL-1^/2 ), gdzie n jest odpowiednią liczbą całkowitą (zwykle
0, 1 lub k). Wzór końcowy może okazać się dużo prostszy.
C h w yt 2 : R ó żn ice w y ższy ch rzędów
Widzieliśmy wcześniej, że możliwe jest wyliczenie sum częściowych szeregu
(£)(—1)k, ale nie szeregu (£). Okazuje się, że jest wiele ważnych zastoso­
wań współczynników .dwumianowych z naprzemiennymi znakami (£ )(—1 )kJedną z przyczyn tego stanu rzeczy jest to, że takie współczynniki dwu­
mianowe są stowarzyszone ze zdefiniowanym w podrozdziale 2 .6 operatorem
różnicowym A .
Różnicą Af funkcji f w punkcie x jest
Af(x) = f ( x + 1 ) - f ( x ) .
Jeśli ponownie zastosujemy A, otrzymamy drugą różnicę
A2 f(x) = Af (x + 1) —Af (x) = (f(x+2) —f(x+ 1)) — (f(x+1) —f(x))
= f (x + 2 ) —2 f (x + 1 ) + f ( x ) ,
która jest odpowiednikiem drugiej pochodnej. Podobnie mamy
A 3 f (x)
= f (x + 3)
—3f (x + 2) + 3f (x + 1) —f ( x ) ;
A4 f (x)
= f (x + 4) —4f (x + 3) + 6 f (x + 2) —4f (x + 1) + f (x)
i tak dalej. Współczynniki dwumianowe pojawiają się w tych wzorach z na­
przemiennymi znakami.
Ogólnie, n-t różnica jest równa
An f(x) = ^
(—1)rL_kf(x + k ) ,
całkowite n ^ 0.
( 5 -4 o)
k ^ '
Wzór ten można łatwo udowodnić przez indukcję, ale istnieje również piękny
dowód oparty na elementarnej teorii operatorów. Przypominamy, że w pod­
rozdziale 2 .6 zdefiniowaliśmy operator przesunięcia E wzorem
Ef(x) = f ( x + l ) .
Operator A równa się E — 1, gdzie 1 jest operatorem identyczności, zdefinio­
wanym wzorem lf(x) = f(x). Ze wzoru dwumianowego Newtona mamy
Jest to równanie, którego elementami są operatory. Jest ono równoważne
tożsamości ( 5 .4 0 ), ponieważ operator Ek zamienia f(x) na f(x + lc).
Interesujący i ważny przypadek dotyczy ujemnych potęg ubywających.
Niech f(x) = (x — 1)— = 1/x . Wtedy na podstawie wzoru ( 2 .4 5 ) mamy
Af(x) = (—1)(x — 1)— , A 2 f(x) = (—1)(—2)(x — 1)— i w ogólności
Z równania ( 5 .4 0 ) wynika, że
n!
x(x + 1 ) . . . (x + rt)
Na przykład
x
x+1
x+ 2
x+ 3
x+ 4
4!
x(x + 1)(x + 2)(x + 3)(x + 4)
Suma we wzorze ( 5 .4 1 ) jest rozwinięciem na ułamki proste funkcji n !/(x (x +
Ciekawe rezultaty można wyprowadzić również dla dodatnich potęg uby­
wających. Jeżeli f(x) jest wielomianem stopnia d, to różnica Af(x) jest wie­
lomianem stopnia d — 1. Stąd Ad f(x) jest stałą i An f(x) = 0, gdy rt > d.
Ten niezwykle ważny fakt upraszcza wiele wzorów.
Przyjrzyjmy się temu bliżej. Zdefiniujmy
f(x) = a dx d + a d- i x d_1 H-------h a ^ 1 + a 0 x°
jako wielomian stopnia d. W rozdziale 6 zobaczymy, że możemy wyrazić
zwykłe potęgi jako sumy potęg ubywających (na przykład x 2 = x - + x-).
Istnieją zatem współczynniki b d, b d_ i , . . . ,
, bo takie, że
f(x) = b dx - + b d_ i x ^ - H ------- b b - | X - + b 0 x - .
(Okazuje się, że b d = a d i bo = ao, ale współczynniki pośrednie są powiązane
w znacznie bardziej skomplikowany sposób.) Niech Cic = k! b^ dla 0 ^ k ^ d.
Wtedy
f(x) = c d
Zatem każdy wielomian może być przedstawiony jako suma wielokrotności
współczynników dwumianowych. Takie przedstawienie jest nazywane szere­
giem Newtona funkcji f (x), gdyż szereg ten był bardzo intensywnie używany
przez Isaaca Newtona.
Zauważyliśmy wcześniej w tym rozdziale, że reguła dodawania daje nam
równość
Stąd, przez indukcję, n-ta różnica szeregu Newtona jest bardzo prosta:
A"fW - c a d—
fA
n j W . f ,\ d—1—n J
Xrt
V—
V1—rt /
Jeśli wstawimy teraz x = 0, to wszystkie składniki Cic(1c^TL) po prawej stronie
będą równe zeru, z wyjątkiem składnika k —rt = 0. Zatem
An f (0) = i" Ctv ł S d y n ^ d ;
\ 0,
gdy rt > d.
Dlatego szereg Newtona dla f(x) jest równy:
f(x) = Ad f (0) Q
+ Ad_1 f (0) ( d * ^ + • • • 4- Af(0) ^
+ f (0) Q
.
Załóżmy na przykład, że f(x) = x3. Z łatwością wyliczymy, że
f( 0 ) = 0 ,
f(1) = 1,
Af (0) = 1,
f{2 )= 8 ,
Af (1) = 7,
A2 f(0) = 6,
f (3) = 27';
Af (2) = 19;
A2 f(1) = 12;
A3 f(0) = 6 .
Zatem szereg Newtona dla x 3 jest równy 6(3) + 6 (2) +1 (*) + 0(o)Nasz wzór An f(0) = cn można również wyliczyć za pomocą równości
( 5 .4 0 ), gdy podstawimy x = 0 :
L ( k ) ( - 1 )k ( c o Q + c i ę ) + C 2 Q
+ ...)
= (-d -c,
całkowite rt ^ 0 .
Dla dowolnego ciągu (c 0 , c i , c 2 , . . . ) nieskończona suma Co(q) + c i (*) +
c 2 (k) H
-----staje się skończona dla wszystkich k ^ 0 , zatem nie ma problemu
ze zbieżnością. W szczególności, możemy udowodnić ważną równość
y_
( ^ ) ( - 1)1c(a ° + a i k + " - + a n1<n ) = (—1)nn! a n ,
całkowite rt ^ 0 ,
(5 4 2 )
ponieważ wielomian ao + a ik + -----b ankn może być zawsze zapisany jako
szereg Newtona c 0 (£) + ci (*) H------------------------- h cu (£), gdzie cn = nl an .
Wiele sum, które w pierwszym momencie wydają się beznadziejnie trudne
do wyliczenia, można wyliczyć bardzo prosto używając n-tej różnicy. Roz­
ważmy, na przykład, równość
Y_
( T n Sk) ( _ 1 )k =
,
całkowite n ^ 0 .
( 5 .4 3 )
Wygląda bardzo imponująco, ponieważ jest całkiem różna od tego, co do­
tychczas widzieliśmy. Ale jest dosyć łatwa do zrozumienia, gdy zauważymy
w składniku wiele mówiący czynnik (£ )(—1 )k, ponieważ funkcja
fM
-
( r ; !l)
-
jest wielomianem zmiennej k i stopnia u z głównym współczynnikiem (przy
kn ) równym (—l ) n s^/nl. Zatem wzór ( 5 .4 3 ) jest niczym więcej, jak zastoso­
waniem tożsamości ( 5 .4 2 ).
Zajmowaliśmy się szeregami Newtona przy założeniu, że funkcja f (x) jest
wielomianem. Zauważyliśmy również, że nieskończone szeregi Newtona
mają sens, gdyż są zawsze skończone, gdy x jest nieujemną liczbą całkowitą.
Nasz dowód wzoru An f(0) = cn jest prawdziwy także dla nieskończonej
sumy, podobnie jak w przypadku wielomianów. Zatem mamy ogólną równość
f (X) = f (0) ( * ) + Af (0) ( * ) + A 2 f (OJ Q
+ A 3 f (0) ( 3 ) + • • • >
całkowite x ^ 0 .
( 5 -4 4 )
Wzór ten jest prawdziwy dla dowolnej funkcji f (x) określonej dla nieujemnych
liczb całkowitych x. Co więcej, jeżeli prawa strona jest zbieżna dla innych
wartości x, mamy zdefiniowaną funkcję, która „interpoluje” f (x) w naturalny
sposób. (Można na nieskończenie wiele sposobów przybliżać wartości funkcji,
zatem nie możemy twierdzić, że wzór ( 5 .4 4 ) jest prawdziwy dla wszystkich x,
w których nieskończona suma jest zbieżna. Na przykład, jeśli f (x) = sin( 7tx),
mamy f(x) = 0 we wszystkich punktach całkowitych. Stąd prawa strona
równości ( 5 .4 4 ) jest tożsamościowo równa zeru, ale lewa strona jest niezerowa
dla wszystkich liczb x nie będących liczbami całkowitymi.)
Szereg Newtona jest różnicowym odpowiednikiem szeregu Taylora. Po­
dobnie jak szereg Taylora może być zapisany w postaci
9 ( 0 + x) _ +
+
...,
(Ponieważ
E = 1+A,
tak i szereg Newtona funkcji f (x) = g(a + x) można zapisać jako
,(«ł ,) = !|!« * + 4f l , l +
i Exg ( a ) =
g(a + x).j
+ ^ * 1 + ••• . (6.46)
(Jest to to samo co wzór ( 5 .4 4 ), ponieważ An f(0) = A71 g(a) dla wszystkich
rt ^ 0, gdzie f(x) = g(a + x).) Oba szeregi, Taylora i Newtona, są skończone,
gdy g jest wielomianem lub gdy x = 0. Dodatkowo szereg Newtona jest
skończony, gdy x jest dodatnią liczbą całkowitą. W przeciwnym razie sumy
mogą być, albo nie być zbieżne dla poszczególnych wartości x. Jeśli szereg
Newtona jest zbieżny dla nieujemnej liczby całkowitej x, to może on być
zbieżny do wartości różnej od g(a + x), ponieważ szereg Newtona ( 5 .4 5 )
zależy tylko od rozstrzelonych wartości funkcji g(a), g ( a + 1 ), g(a + 2 ), . . . .
Jednym z przykładów zbieżnego szeregu Newtona jest wzór dwumianowy
Newtona. Niech g(x) = (1 + z )x , gdzie z jest ustaloną liczbą zespoloną taką, że
|z| < 1. Wtedy Ag(x) = (1 + z ) x+1 —(1 + z )x = z(1 + z )x i An g(x) = zn (1 + z )x.
W tym przypadku nieskończony szereg Newtona
x
g(a + x) = X A n 9 ( aH n ) = ( 1 + z)QH ( n j z
zbiega dla wszystkich x do „prawidłowej” wartości (1 + z ) a+x.
James Stirling próbował zastosować szeregi Newtona do uogólnienia funk­
cji silnia na liczby niecałkowite. Wpierw znalazł współczynniki Sn, dla któ­
rych wzór
= m
;
^
0
;
+ s i ;
+ s2
(s.46)
n
jest tożsamością, gdy x = 0, x = 1, x = 2 itd. Ale odkrył, że otrzymał
szereg rozbieżny poza nieujemnymi liczbami całkowitymi x. Spróbował zatem
jeszcze raz, pisząc tym razem
lnx! = £
sn Q
= s0 Q
+ si ( * ) + s 2 ( * ) + • • ■ .
( 5 -4 7 )
„Forasmuch as
these terms increase
very fast, their
differences will
make a diverging
progression, which
hinders the ordinate
of the parabola
from approaching to
the truth; therefore
in this and the like
cases, I interpolate
the logarithms of
the terms, whose
differences
constitute a series
swiftly converging.”
J. Stirling [344]
|5 . W spółczynniki dwum ianowe
Teraz A(lnx!) = ln(x + 1)! —lnx! = ln(x + 1), stąd dzięki ( 5 .4 0 )
sn = An (ln x ! ) | x = 0
= A n—1 (in(x + 1 )) |x = 0
=L
(Dowód zbieżności
został znaleziony
dopiero
w dziewiętnastym
wieku.)
n —1
n —1—k l n ( k + 1
( - 1)
k
Szukanymi współczynnikami są więc so = Si = 0, s 2 = ln2, S3 = ln3 —
21n2 = ln | , S4 = ln4 — 31n3 + 31n2 = ln
itd. W ten sposób Stirling
otrzymał zbieżny szereg (choć nie umiał tego udowodnić). Faktycznie szereg
zbiega dla wszystkich x > —1. Mógł zatem policzyć !. W ćwiczeniu 8 8
odnajdziemy resztę tej historii.
Chwyt 3: Odwracanie (inwersja)
Szczególny przypadek wzoru ( 5 .4 5 ), który właśnie wyprowadziliśmy dla sze­
regu Newtona, można zapisać w następującej postaci:
g(n) = X. (v ) (— 1)1Cf(1c)
Odwróć to:
(zmb ppo’.
■1 )kg(k). (5 .4 8 )
Ten podwójny związek pomiędzy f i g jest nazywany regułą odwracania.
Jest on podobny do podanych przez Mobiusa reguł odwracania (4 .5 6 ) i (4 .6 1 ).
Reguła odwracania wyjaśnia nam, jak rozwiązywać „uwikłane rekurencje,”
z występującym w sumie nieznanym ciągiem.
Na przykład, w przeciwieństwie do f(n) funkcja g(rt) może być znana.
Chcemy znaleźć sposób pokazania, że g(n) =
^)kf M ' Wtedy wzór
( 5 .4 8 ) pozwoli nam wyrazić f (u) w postaci sumy znanych wartości.
Równość ( 5 .4 8 ) możemy udowodnić korzystając z podstawowych metod
poznanych na początku tego rozdziału. Jeżeli dla wszystkich n ^ 0 zachodzi
9 ( t i ) = L i c ( k ) ( - 1 )kf(k), to
Ze względu na symetrię związku pomiędzy f i g dowód w drugą stronę jest
taki sam.
Zademonstrujmy wzór ( 5 .4 8 ) stosując go do rozwiązania „problemu pod­
rzucanych kapeluszy”: grupa n kibiców wygrywającej drużyny piłkarskiej
podrzuciła wysoko w powietrze swoje kapelusze. Kapelusze spadły przypad­
kowo, z tym że każdy z n kibiców złapał jeden kapelusz. Na ile sposobów
h(n, k) dokładnie k kibiców złapało swój własny kapelusz?
Jeśli przyjmiemy, że n = 4 oraz kapelusze i kibice nazwani są A, B, C i D,
to kapelusze mogą spaść na 4! = 2 4 możliwych sposobów (obok podajemy,
ilu kibiców odzyskało swój kapelusz):
4
AB CD
ABDC
ACBD
ACDB
ADBC
ADCB
2
2
1
1
2
BACD
BADC
BCAD
BCDA
BDAC
BDCA
CABD
CADB
CBAD
CBDA
CDAB
CDBA
2
0
1
0
0
1
1
0
2
1
0
0
DABC
DACB
DBAĆ
DBCA
DC AB
DCBA
0
1
1
2
0
0
d H(4,4) = i; H ( 4 , 3) = 0 ; H(4,2) = 6 ; h(4, l ) = 8 ; H(4,0) = 9 .
Możemy wyliczyć H(n, k), jeśli zauważymy, że jest to liczba wyborów
k szczęśliwych właścicieli kapeluszy, mianowicie (£), razy liczba sposobów
takich upadków pozostałych n —k kapeluszy, by żaden z nich nie wrócił do
swego właściciela, czyli h (n —k, 0). Permutacja jest zwana nieporządkiem , je­
śli przemieszcza każdy element. Liczba nieporządków rt obiektów jest czasami
oznaczana symbolem ‘rij’, czytanym „rt podsilnia.” Stąd H(ri—k, 0) = ( n —k)j
oraz ogólny wzór
h.(n,k) = ( ^ ) h ( n - k , 0 ) = ( k ) ( n ~ k)i(Notacja dolnej silni nie jest powszechnie używana. Może nie jest ona naj­
lepsza, ale spróbujmy się do niej przyzwyczaić. Jeśli się „nj” nie przyjmie,
zawsze będziemy mogli wrócić do „Dn”.)
Nasz problem byłby rozwiązany, gdybyśmy znali postać zwartą nj. Zo­
baczmy zatem, co się da zrobić. Łatwo otrzymamy rekurencję, ponieważ suma
względem wszystkich k liczb H(n, k) jest liczbą permutacji n kapeluszy:
n! = ^ h ( n , k ) =
k
( v V n ~ k)'
k
'
7
k
' '
=
»
całkowite n ^ 0 .
( 5 -4 9 )
(W ostatnim wierszu zamieniliśmy k na n — k i
na (£).) Dzięki tej
uwikłanej rekurencji możemy policzyć wszystkie wartości H(n, k):
5. W spółczynniki dwumianowe
n
M n, 0 )
h(n, 1 )
M n, 2 )
h(n, 3)
M n, 4)
h(n, 5)
0
1
1
0
1
2
1
0
1
3
4
5
2
9
44
265
3
0
1
8
6
0
1
45
264
20
10
0
1
135
40
15
0
6
Sztuką
w matematyce, jak
i w życiu jest mieć
wyczucie, które
prawdy są
bezużyteczpe.
224!
M n, 6 )
1
Oto przykład, w jaki sposób liczymy wiersz n = 4: Dwie skrajnie prawe liczby
są oczywiste — na tylko jeden sposób wszystkie kapelusze wylądują na gło­
wach swych właścicieli i nie ma sposobu, by swoje kapelusze odzyskało tylko
trzech z nich. (Kto odzyskałby czwarty kapelusz?) Dla k = 2 i k = 1, gdy
zastosujemy nasz wzór na H(n,k), otrzymamy H(4,2) = (^)h{2}0) = 6 -1 = 6
i H(4,1) = ({)H (3,0) = 4 - 2 = 8 . Nie możemy zastosować tego wzoru do wy­
liczenia H(4,0)— gdy spróbujemy, otrzymamy równość H(4,0) = (q)H(4,0),
niewątpliwie prawdziwą, lecz bezużyteczną. Gdy spróbujemy inaczej i za­
stosujemy równość h(4 , 0) + 8 + 6 + 0 + l = 4 ! , otrzymamy 4j = h ( 4 , 0) = 9.
Podobnie nj zależy od wartości kj, gdzie k < rt.
Jak możemy rozwiązać rekurencję ( 5 .4 9 )? Łatwo. Jest ona postaci ( 5 .4 8 ),
gdzie g(n) = n! i f(k) = (—1)kkj. Zatem rozwiązaniem jest
nj = (-1)n X r ) ( - l ) kk!.
Dobrze, ale nie jest to dobre rozwiązanie. Jest to suma, która o ile to moż­
liwe, powinna być przedstawiona w postaci zwartej. Mimo to rozwiązanie to
jest lepsze od rekurencji. Sumę można uprościć, ponieważ k! upraszcza się z
ukrytym k! w (£). Spróbujmy. Otrzymamy
-i=
u!
L
(n-k)!
OsCk^ru
- 1 i n + k _= n! Z
OsCksCn
-I) 1
k!
Otrzymana suma zbiega bardzo szybko do liczby Yic^o(~^ )k/W
Składnikami wykluczonymi z sumy są
. V
■■f-
k>rt
h ll!
k!
=
V r - n u— (n+1)!
_____ —
n + 1 g - ( ) (k + n + 1 )i
( ~ 1 ) n+1
k^O
(5-5o)
i wielkość w nawiasach leży pomiędzy liczbami 1 i 1 —
= S+ 2 * Dlatego
wartość bezwzględna różnicy rtj i rt!/e jest równa w przybliżeniu l / u — do­
kładniej, jest większa niż liczba l / ( n + 2) i mniejsza niż 1/(rt + 1). Ale rtj
jest liczbą całkowitą. Dla rt > 0 uzyskamy ją zaokrąglając n !/e do najbliższej
liczby całkowitej. Stąd otrzymujemy szukaną przez nas postać zwartą:
rtj =
n!
1
T + 2
+ [n = 0].
(5 .51)
Jest to liczba rzutów, w których żaden z kibiców nie odzyska swojego ka­
pelusza. Gdy rt jest duże, istotniejsze jest znać prawdopodobieństwo takiego
zdarzenia. Jeśli założymy, że każde z rt! losowań jest jednakowo prawdopo­
dobne— ponieważ kapelusze zostały podrzucone bardzo wysoko— to praw­
dopodobieństwo to równa się
nj
n!/e + 0 (1)
1
— = ---------;------- ------ ---- 0,367... .
n!
tl!
e
Zatem jeśli liczba rt jest bardzo duża, to prawdopodobieństwo przemieszcze­
nia wszystkich kapeluszy jest równe prawie 37%.
Nawiasem mówiąc, rekurencją ( 5 .4 9 ) dla dolnych silni jest identyczna z
rozważaną przez Stirlinga pierwszą rekurencją ( 5 .4 6 ). Zatem
= kj. Te
współczynniki są tak duże, że nic dziwnego, że nieskończony szereg ( 5 .4 6 )
dla x nie będących liczbami całkowitymi jest rozbieżny.
Zanim przestaniemy zajmować się tym problemem, przyjrzyjmy się jesz­
cze dwóm regularnościom, które znajdziemy w tablicy z małymi wartościami
H(rt,k). Po pierwsze, wydaje się, że liczby 1, 3, 6 , 10, 15, . . . leżące poniżej
przekątnej wypełnionej zerami są liczbami trójkątnymi. Łatwo tego dowieść,
ponieważ te elementy tabeli są równe H (n ,n —2 ), stąd
Mn, n - 2) = ( n ^ 2) 2| =
Po drugie, wydaje się, że liczby z dwóch pierwszych kolumn różnią się
o ±1. Czy jest to zawsze prawdą? Tak:
H(n, 0 ) —H(n, 1 ) = rtj—n ( n —1)j
-(■* E
x
O ^k^n
ilcx
7
/
-(■'(■'-•i'
x
E
0<Jk<Cn—1
( - i )1
^
= n!Lf -_1 }n
L = (_ i r .
Innymi słowy, rtj = rt(rt — 1)j + (—1)TL. Jest to rekurencją znacznie prostsza
od poprzedniej rekurencji ( 5 .4 9 ).
Odwróćmy coś jeszcze. Jeśli zastosujemy metodę odwracania do wzoru ( 5 .4 1 )
v
=
[k j x + k
lfx + n V
xV n
)
r
’
to otrzymamy
Jest to interesujące, lecz nie całkiem nowe. Jeśli zanegujemy górny indeks w
(x£ k), znowu otrzymamy odkrytą już wcześniej tożsamość ( 5 .3 3 ).
5.4. Funkcje tw orzące
Przechodzimy teraz do najważniejszej w całej książce idei, pojęcia funkcji
tworzącej. Nieskończony ciąg (ao, a-|, a.2 , . . . ) , którym chcemy się zajmować,
może być wygodnie przedstawiony jako szereg potęgowy zmiennej z
A(z) = a 0 + ai z + a 2 z 2 H----- = ^ a^z1.
k^O
(Jeśli interesuje cię
historia
i użyteczność tej
notacji, spójrz do
[223].)
( 5 -5 2 )
Zmienną oznaczamy literką ‘z ’, ponieważ często będziemy myśleć o z jako
liczbie zespolonej. W teorii funkcji zespolonych zwykle używa się ‘z’ we wzo­
rach. Szeregi potęgowe (znane też pod nazwą funkcji analitycznych lub funkcji
holomorficznych) są sercem tej teorii.
W kolejnych rozdziałach zobaczymy dużo funkcji tworzących. Jest im po­
święcony, faktycznie, cały rozdział 7. Naszym obecnym celem jest po prostu
wprowadzenie podstawowych pojęć i zademonstrowanie użyteczności funkcji
tworzących w badaniach nad współczynnikami dwumianowymi.
Funkcja tworząca jest pożyteczna, ponieważ jest to pojedyncza wielkość
reprezentująca cały nieskończony szereg. Często rozwiązujemy zadania przez
skonstruowanie jednej lub więcej funkcji tworzących. Po przyjrzeniu się funk­
cji i po ewentualnych przekształceniach wracamy z powrotem do współczyn­
ników. Przy odrobinie szczęścia będziemy wiedzieć dostatecznie dużo o funk­
cji, by orzec coś o współczynnikach.
Niech A(z) będzie dowolnym szeregiem potęgowym 2Zks>o a ^ - P o j ­
mijmy wygodną (naszym zdaniem) notację
[zn] A (z) = an .
Innymi słowy, [zn] A (z) oznacza współczynnik przy zn w A(z).
(5 -53 )
Niech A (z) i B(z) będą funkcjami tworzącymi dla ciągów (ao, a i ,
i (bo,
, t>2 , . . . ) . Iloczyn A(z)B(z) jest szeregiem potęgowym
...)
(a 0 + ai z + a 2 Z2 H-----)(b 0 + b iz + b 2 z 2 H------)
= a 0 b 0 + (a0bi + a^b0)z + (a 0 b 2 + aibi + a 2 b 0 )z2 + • • • .
Współczynnik stojący przy zn w tym iloczynie jest równy
n
a 0 bn + a-i bn- i + • • • + anb 0
a kbn -k •
k= 0
Dlatego jeśli chcemy przekształcać dowolną sumę postaci
n
cn = Y .
k= 0
,
(5-54)
i znamy funkcje tworzące A(z) i B(z), to otrzymamy
Cn = [zn]A(z)B(z).
Ciąg (cn ) zdefiniowany wzorem ( 5 .5 4 ) jest nazywany splotem ciągów
(an ) i (bn ). Dwa ciągi są „splecione” tworząc sumę wszystkich iloczynów, dla
których dolne indeksy sumują się do ustalonej wartości. Możemy powiedzieć,
że splot ciągów odpowiada mnożeniu ich funkcji tworzących.
Funkcje tworzące dają nam skuteczną metodę odkrywania i dowodzenia
nowych równości. Na przykład, ze wzoru dwumianowego Newtona wiemy, że
(1 + z ) T jest funkcją tworzącą ciągu ((J), (J), Q ) , . . . >:
Jeśli przemnożymy obie funkcje, to otrzymamy inną funkcję tworzącą:
(1 + z ) r (1 + z ) s
=
(1 + z ) r + s .
Porównując współczynniki przy zn po obu stronach równania, otrzy­
mamy
Odkryliśmy tożsamość Cauchy’ego ( 5 .2 7 )!
(5-27)!=
(5.27X4.27)
(3.27X2.27)
(1.27X0.27)1
Było to piękne i łatwe. Spróbujmy jeszcze raz. Tym razem użyjmy funkcję
( 1 - z ) r, która jest funkcją tworzącą ciągu ( ( - 1 )n (^)) = (G)>~(i)> 6 )> • • • )•
Po przemnożeniu przez (1 + z ) r otrzymamy inną funkcję tworzącą o znanych
nam współczynnikach:
o -z n i+ z r
= ( 1 - z 2)r .
Po porównaniu współczynników przy zn otrzymujemy równanie
r O U * ) '- '1* - '-" " " O * -
parzyste].
( 5 .5 5 )
Sprawdźmy je dla jednego lub dwóch drobnych przypadków. Na przykład,
gdy n = 3, otrzymamy
O G M O M G K )© -Każdy dodatni składnik znosi się z odpowiadającym mu składnikiem ujem­
nym. To samo stanie się dla dowolnej liczby nieparzystej n. Nie jest to in­
teresujący przypadek. Ale gdy n jest liczbą parzystą, powiedzmy n = 2,
otrzymamy różniącą się od tożsamości Cauchy’ego nietrywialną sumę:
Zatem wzór ( 5 .5 5 ) dla n = 2 jest prawdziwy. Okazuje się, że wzór ( 5 .3 0 ) jest
szczególnym przypadkiem naszej nowej równości ( 5 .5 5 ).
Współczynniki dwumianowe pojawiają się również w pewnych funkcjach
tworzących, szczególnie w następujących ważnych tożsamościach, w których
dolny indeks pozostaje stały, a górny się zmienia:
Jeśli masz
fluoryzujący
flamaster, zaznacz
te dwa równania.
=
) zk >
n -*)n+1
t-0 \ n
(1 —z ) n + 1
= ^ ( k ) zk>
\n
k^O x ■
K
J
całkowite u > o
całkowite n ^ 0 .
( 5 -5 6 )
( 5 -5 7 )
Druga tożsamość jest przemnożoną przez zn pierwszą tożsamością, czyli jest
„przesunięta w prawo” o n miejsc. Pierwsza tożsamość jest ukrytym przy­
padkiem wzoru dwumianowego. Rozwijając za pomocą wzoru ( 5 . 1 3 ) funk­
cję (1 —z ) _1x_1 otrzymujemy przy zk współczynnik (_Tjc_1) ( — 1 )k, który po
zanegowaniu górnego indeksu jest równy (k£ n) lub (n^k) . Te szczególne
przypadki są warte wyraźnego zapisania, gdyż często są one używane w za­
stosowaniach.
Dla n = Ow szczególnym przypadku szczególnego przypadku otrzymamy
szereg geometryczny:
k^O
Jest to funkcja tworząca ciągu ( 1 , 1 , 1 , . . . ) . Jest ona bardzo pożyteczna,
ponieważ splot tego ciągu z dowolnym ciągiem jest ciągiem sum. Gdy dla
wszystkich k zachodzi
= 1 , wzór ( 5 .5 4 ) redukuje się do równości
n
Dlatego jeśli A(z) jest funkcją tworzącą ciągu (ao, a i , a 2 , . . . ) , to A (z)/(1 —z)
jest funkcją tworzącą dla ciągu sum (co, c i , C2 , . . . ) .
Zadanie o nieporządkach rozwiązane przez nas za pomocą odwracania
przy okazji zadania o kibicach i podrzucanych kapeluszach, może być w in­
teresujący sposób rozwiązane za pomocą funkcji tworzących. Rekurencję
możemy otrzymać w postaci splotu, jeśli przedstawimy (£) za pomocą silni
i podzielimy obie strony przez n!:
Funkcją tworzącą ciągu ((jp jp 5 7 , • • •) jest ez. Zatem jeśli oznaczymy
ki
k^O
to ze splotu i rekurencji otrzymamy
1 —z
= ez D (z ).
Stąd
D(z) = ------ e " z 1 —z
------1 —z
Porównanie współczynników przy zn daje
Jest to wzór, który wyprowadziliśmy już wcześniej za pomocą metody od­
wracania.
Dotychczas nasze badania nad funkcjami tworzącymi dały nam zgrabne
dowody poznanych już wcześniej faktów, wyprowadzonych za pomocą bar­
dziej nieporęcznych metod. Jak do tej pory, za pomocą funkcji tworzących
nie uzyskaliśmy żadnych nowych wyników, z wyjątkiem wzoru ( 5 .5 5 ). Te­
raz jesteśmy gotowi na coś nowego i bardziej zadziwiającego. Istnieją dwie
rodziny szeregów potęgowych, które generują szczególnie bogatą klasę tożsa­
mości ze współczynnikami dwumianowymi. Zdefiniujmy uogólniony szereg
dwum ianowy !Bt (z) i uogólniony szereg wykładniczy £t(z) wzorami:
® t(2) =
£t(z) = L (tk+1)k'1 zk
k!
k^O
(5-58)
k^O
Dowiedziemy w podrozdziale 7.5, że te funkcje spełniają tożsamości
:Bt (z)1 _ t - : B t ( z ) _t = z;
£t (z)- t l n £ t (z) = z.
( 5 .5 9 )
W szczególnym przypadku t = 0, otrzymamy
!B0(z) = 1 + z;
Uogólnione szeregi
dwumianowe £ t (z)
zostały odkryte
w 1750 roku przez
J. H. Lamberta
[236, §38], który
kilka lat później
zauważył [237], że
ich potęgi spełniają
pierwszą
z tożsamości (5 .60).
W ćwiczeniu 84
dowiemy się jak
wyprowadzić wzór
(5-fo)
£ 0(z) = ez ;
co wyjaśnia, dlaczego szeregi z parametrem t są nazywane „uogólnionymi”
szeregami dwumianowymi lub wykładniczymi.
Następujące pary tożsamości są prawdziwe dla wszystkich liczb rzeczy­
wistych r:
® t(z)r = Y .
k^O
tk + r
,k .
k 7 tk + r
Z
k^O
Bt (zY
(tk + r) k —1 X .
k!
( 5 -6 o)
(tk + r)k ^k
k!
(5.6i)
X .
k^O
St(z ) 1
1 — zt£ t (z)
= y
k^O
z tożsamości (5 .60).
(Jeśli tk + r = 0 , to przy interpretacji współczynnika przy zk musimy za­
chować ostrożność— każdy z nich jest wielomianem zmiennej r. Na przykład
wyrazem wolnym sumy £ t (z)r jest r (0 + r)_1 , i równa się on 1 nawet wtedy,
gdy r = 0 .)
;H?I .
5: f ■. funkcje tw?rz^CG
Ponieważ równania (5 .6 0 ) i ( 5 .6 1 ) są prawdziwe dla wszystkich r, otrzy­
mamy bardzo ogólne tożsamości, gdy przemnożymy przez siebie szeregi od­
powiadające różnym potęgom r i s. Na przykład
/ tk +
® t ( *v
1 - t + t2t(z)-'
tj + S
t
2— V k
kSO
/tk + r
tk + r \
r
/ t ( n —k) + s
) tk + r V n - k
= £ « " £ fV k
n^O
k^O
Ten szereg potęgowy musi być równy
1-
<
B t {z)r+s
_
t + t^tfz) - 1 _
y- (\n + r + s
rt
n^O
2 _
Po porównaniu współczynników przy zn , otrzymamy tożsamość
y
^tk +
^t(n —k) + s
n
tk + r
tn + r + s
n
całkowite rt,
prawdziwą dla wszystkich r, s i t. Jeśli t = 0, tożsamość ta redukuje się do
tożsamości Cauchy’ego. (Jeśli przypadkiem zdarzy się, że we wzorze liczba
tk + r będzie równa zeru, to mianownik tk + r powinien skrócić się z tk + r
znajdującym się w liczniku współczynnika dwumianowego. Obie strony toż­
samości są wielomianami zmiennych r, s i t.) Podobne równości otrzymamy
mnożąc 33-t(z)r przez !Bt (z)s itd. W tabeli 232 możemy znaleźć rezultaty.
Nauczyliśmy się, że dobrym pomysłem jest sprawdzenie szczególnych
przypadków ogólnych wyników. Co się stanie, gdy wstawimy t = 1? Uogól­
niony szereg dwumianowy 231 (z) jest bardzo prosty— jest równy
®,(z) = £ z k =
k^O
dlatego korzystając z 231 (z) nie dowiemy się niczego więcej, czego byśmy już
nie wiedzieli z tożsamości Cauchy’ego. Ale £1 (z) jest ważną funkcją
Elz) = Z ( k + ^ k~1$
k^O
= ' + z + b 2 + h 3 + ]S - z4 + -
( 5 .6 6 )
Aha! Jest to
iterowana potęga
£ ( l n z ) = z 2*
której jeszcze nie widzieliśmy. Spełnia ona podstawową tożsamość
ZZZz
£(z) = ez£<*>.
(5.67)
Funkcja ta, wpierw badana przez Eulera [117] i Eisensteina [91], pojawia się
w wielu zastosowaniach [193, 204].
zz. . .
232
fs . W spółczynniki dwumianowe
-
T ab ela 232. Sploty prawdziwe dla liczb całkowitych u ^ 0
>*+■ kWW**rł;ii
r \ / t n — tk + s \ *. r
/ t u + r + s"
|X -(^
^
J ^
u —k
/tk + r
| y - / t k + r \ /t u —tk + s\ ^ r
j
\
k
/ \
n —k
_.
/tk + r
.
tu —tk + s t
tu + r + s \
u
-(
(
fy " (
f
\
) ( t k + r ) k ( t n — t k + s)
/
^
/tn + r + s
(tU + T + s}n .
tk + r
( t k + r ) k ( t u - t k + s)
V
/
=
tk + r
tu — tk + s \ 5
( t n + r + s)'
I
Szereg potęgowy
fy§ £ Ę rlin ^ ^ ^ '
r + $
r + s
tn + r + s
' ( 5 -6 5 )
■b <«7;
I
Szczególne przypadki t = 2 i t = —1 uogólnionego szeregu dwumianowego
są bardzo interesujące, ponieważ ich współczynniki pojawiają się bez ustanku
w zadaniach o rekurencyjnej strukturze. Dlatego dobrze jest je zapisać z
myślą o przyszłych zastosowaniach:
3 i / 2 ( z)t =
( V ^ + 4 + z)2r/4r
jest też warty
napisania.
® 2 (z)
1 - VI - 4 z
- £ ( \ 2Vk ' ) 1 + 2 k
2z
( 5 .6 8 )
B - i (z)
2 k - 1 \ (-z)
- £
1 —2 k
2k + r
®2 W r = £
2k + r
® _ , ( Zr = X ^ , r ~k ,0/' r^ - :-k Z,C•
k
1 +
v
T + 4z
( 5 -6 9 )
(5-70)
(5-7i)
®2(2)T = Z f 2V T) z,C-
(5^)
S - ' (z)r+' = Z f T; kV k -s/ T + 4 z
^ V k
(5-73)
Współczynniki (2T[l) + r z ® 2 (z) są nazywane liczbami Catalana CU| ponieważ francuski matematyk Eugene Catalan napisał o nich ważną pracę w
latach trzydziestych dziewiętnastego stulecia [56]. Ciąg ten zaczyna się od
liczb:
rt
0
1 2
3
4
5
6
7
8
9
10
Cn
1
1 2
5
14
42
132
429
1430
4862
16796
Współczynniki 2>_i (z) są tymi samymi liczbami, z tym że znajdziemy na
początku dodatkową liczbę 1 , a pozostałe liczby mają naprzemienne znaki:
( 1 , 1 1 , 2 , —5 , 1 4 , . . . ) . Stąd 23_i (z) = 1 + z^Bzi—z). Również zachodzi rów­
ność 23_i (z) = ‘B zi—z)- 1 .
Zakończmy ten podrozdział wyprowadzając ze wzorów ( 5 .7 2 ) i ( 5 .7 3 )
tożsamość, która pokazuje inne związki między funkcjami *B_i (z) i"Bzi—z):
B _ ,(z)n+1 - ( - z ) n+1B2( - z ) n+1
V-
------------ --------------------' k S
k
*
u
Jest ona prawdziwa, ponieważ w (—z ) n+1 ‘B zi—z)n+1/ V l + 4z współczynni­
kiem przy zk jest liczba
VT+~4 z
Vl +4z
=
( _ 1)T v + l(_ 1) k - ^ - 1[z k - n - 1] ® 2(z)n+1
a/ 1 —4z
k —rt — 1
’)ŁCkn-k\
k S - i ( s )" +1
W
vT+4z
gdzie k > n. Składniki znoszą się wzajemnie. Możemy teraz skorzystać ze
wzorów ( 5 .6 8 ) i ( 5 .6 9 ), by uzyskać postać zwartą
V- / n - k \ k
1
Ę-S * >
( ( \ + s / U Ź i \ n+'
—
2—
J
-
/ l - v T + 4 i V +1
(—
5—
)
całkowite n ^ 0 .
( 5 .7 4 )
(Szczególny przypadek z = —1 pojawił się w zadaniu 3 w podrozdziale 5 .2 .
Ponieważ liczby ^ 0 ± V ~ 3 ) są pierwiastkami szóstego stopnia z jedności,
więc sumy
(nk1c) (—1)k są okresowe.) Podobnie, po połączeniu wzorów
( 5 .7 0 ) i ( 5 .7 1 ) znikną duże współczynniki i otrzymamy
/n-k \
t
n
) —
k
e
(1 + V T 4 4 z Y l , p - V U 4 z \ n
= H
ż —
)
■
całkowite rt > 0 .
( 5 -7 5 )
5.5. Funkcje hipergeom etryczne
One są nawet
bardziej zmienne
niż kameleony:
możemy je rozkroić
i potem złożyć do
kupy razem
na różne sposoby.
Cokolwiek,
co ocalało przez
stulecia z tak
straszliwą notacją,
musi być bardzo
pożyteczne.
Metody, które zastosowaliśmy do współczynników dwumianowych Newtona,
jeśli skutkują, to są bardzo efektywne. Musimy jednak przyznać, że często
wydają się być bardziej sztuczkami magicznymi niż porządnymi metodami.
Jeśli pracujemy nad zadaniem, często możemy pójść w różnych kierunkach,
i stąd może się zdarzyć, że zamiast posuwać się naprzód, krążymy w kółko.
Współczynniki dwumianowe są jak kameleony— łatwo zmieniają swą postać.
Dlatego naturalne jest pytanie, czy nie istnieje jakaś jedna metoda, która
pozwoliłaby zająć się wielką liczbą sum ze współczynnikami dwumianowymi.
Odpowiedź na szczęście brzmi: tak. Ta metoda opiera się na teorii pewnych
nieskończonych sum zwanych szeregami hipergeometrycznymi.
Studia nad szeregami hipergeometrycznymi zostały rozpoczęte wiele lat
temu, przez Eulera, Gaussa i Riemanna. Szeregi te, prawdę mówiąc, są ciągle
przedmiotem poważnych badań. Szeregi hipergeometryczne mają straszną
notację, do której przyzwyczajenie się zajmie trochę czasu.
Ogólne szeregi hipergeometryczne są szeregami potęgowymi zmiennej z
z-m + n parametrami i są zdefiniowane za pomocą przyrastających potęg:
Ql,
b!,.
-
x
= y
^ _ .
Ś - 0 ' b f . . . b * k!
( 5 .7 6 )
Liczby a nazywamy górnym i param etram i; pojawiają się one w liczni­
kach składników F. Liczby b nazywamy dolnymi param etram i; pojawiają
się one w mianownikach. Wielkość z jest nazywana argumentem. Aby unik­
nąć dzielenia przez zero, żaden z dolnych parametrów nie może być zerem
ani ujemną liczbą całkowitą. Poza tym ograniczeniem górne i dolne parame­
try mogą przybierać dowolne wartości. Notacji *F(cli , . . ., am; b i , . . . , b^; z)’
używamy również jako notacji alternatywnej do dwuwierszowej postaci toż­
samości ( 5 . 7 6 ), ponieważ jednowierszowa postać czasami lepiej się sprawdza
typograficznie.
W podręcznikach często znajdziemy ‘mFn ’ zamiast lF jako oznaczenie
szeregu hipergeometrycznego z m górnymi i z u dolnymi parametrami. Ale
dodatkowe indeksy zapełniają wzory i zabierają nam czas, jeśli jesteśmy zmu­
szeni ciągle je pisać. Możemy policzyć, ile mamy parametrów, stąd nie po­
trzebujemy dodatkowych symboli.
Wiele ważnych funkcji okazuje się szczególnymi przypadkami szeregów
hipergeometrycznych. Jest to powód, dla którego są one tak ważne. W naj­
prostszym przypadku, na przykład, gdy m = n = 0 , tzn. nie ma żadnych
parametrów, otrzymujemy znajomy szereg
Gdy m lub rt są równe zeru, ten zapis wygląda nieco dziwnie. By tego unik­
nąć, możemy wstawić dodatkowe ‘T do górnego i dolnego wiersza:
Nie zmienimy funkcji, jeśli wykreślimy lub wstawimy takie same parametry
z/do licznika i mianownika.
Następnym z najprostszych przypadków jest m = 1, ai = 1 i rt = 0.
Zmienimy parametry na m = 2, a-\ = a 2 = J , n = 1 i bi = 1, by mieć
rt > 0. Jest to też znajomy nam szereg, gdyż l k = ki:
To nasz stary przyjaciel, szereg geometryczny. F (a i, . . . , a m; b i , . . . , bn ; z)
jest zwany szeregiem hipergeometrycznym, ponieważ zawiera w sobie, jako
bardzo szczególny przypadek, szereg geometryczny F(1,1; 1; z).
Jeśli skorzystamy ze wzoru ( 5 .5 6 ), ogólny przypadek m = 1 i rt = 0 jest
łatwy do przedstawienia w postaci zwartej
Jeśli zastąpimy a przez —a i z przez —z, otrzymamy wzór dwumianowy
Newtona,
-a, 1
1
-Z
= (1 + Z ) Q
Ujemna liczba całkowita jako górny parametr powoduje, że szereg nieskoń­
czony staje się sumą skończoną, ponieważ dla liczb całkowitych a takich, że
k > a ^ 0 , zachodzi (—a)k = 0 .
Przypadek m = 0, rt = 1 jest innym słynnym szeregiem, choć może nie
jest zbyt dobrze znany w matematyce dyskretnej:
1
\
b ,1 r )
v~ Z
( b - 1 )! zk
( b - 1 +k) ! k! ~
,
b- ’ (
( b - 1 )!
z (b - i ) / 2 •
,
x
(5-78)
Funkcja I^-i jest zwana „zmodyfikowaną funkcją Bessela” rzędu b — 1. Gdy
b = 1, otrzymamy F ( 111 |z) = lo{2y/z), który jest interesującym szeregiem
HkJsO zVk!2.
Inny szczególny przypadek, m = n = 1, jest zwany „szeregiem hipergeometrycznym konfluentnym” i często oznaczany literą M:
a
%
~k ~k
= Y - h z T = M (a >b >z )k^O ^ |C‘
(5-79)
Funkcja ta, ważna w zastosowaniach inżynierskich, była wprowadzona przez
Ernsta Kummera.
Niektórzy z nas dziwią się zapewne, czemu do tej pory nic nie powie­
dzieliśmy o zbieżności szeregu nieskończonego ( 5 .7 6 ). Odpowiemy, że można
ignorować zbieżność, jeśli traktujemy zmienną z jako symbol formalny. Nie
jest trudne sprawdzenie, że formalne sumy nieskończone postaci Xlk$m 0i^
tworzą ciało, jeśli współczynniki oc^ są elementami jakiegoś ciała. Możemy
dodawać, odejmować, mnożyć, dzielić, różniczkować i składać takie formalne
sumy, nie martwiąc się o ich zbieżność. Każda równość, jaką uzyskamy, będzie
formalnie prawdziwa. Na przykład, hipergeometryczny szereg F ( 1 ,] ,1 |z) =
Xk^o k!
nie jest zbieżny dla żadnej niezerowej wartości z, ale jak zoba­
czymy w rozdziale 7, możemy z niego korzystać przy rozwiązywaniu zadań.
Z drugiej strony, jeśli zastąpimy z konkretną liczbą, musimy być pewni, że
nieskończona suma jest dobrze zdefiniowana.
Następny w kolejce jest najsłynniejszy z szeregów hipergeometrycznych.
Faktycznie to on był nazywany szeregiem hipergeometrycznym do około roku
1870, kiedy to został uogólniony do dowolnych m i n . Ma on dwa górne i jeden
m
dolny parametr:
a, b
c
akbk zk
= / — —rk
=----V| •
( 5 -8 o)
k^O c
Ponieważ wiele subtelnych własności było udowodnionych po raz pierwszy
przez Gaussa w jego pracy doktorskiej z roku 1812 [143], jest też często
nazywany szeregiem hipergeometrycznym Gaussa, pomimo że Euler [118] i
Pfaff [293] zajmowali się tym szeregiem wcześniej. Jednym z jego szczególnych
przypadków jest
ln (1 + z) = zF ( ^
Tc! Tc!
(—z)k
z3
z4
~ ZI
z2
=
Z~ T + T ~ T + " ' '
Zauważmy, że z - 1 ln(1 + z) jest funkcją hipergeometryczną, ale ln(l + z) nie
jest, ponieważ szeregi hipergeometryczne zawsze mają wartość 1 , gdy z = 0.
Do tej pory szeregi hipergeometryczne nic nie zrobiły dla nas, z wy­
jątkiem usprawiedliwienia dla swej nazwy. Ale zobaczyliśmy kilka bardzo
różnych funkcji, które wszystkie mogą być uważane za szeregi hipergeome­
tryczne. Zobaczymy, że olbrzymia klasa sum może być zapisana jako szereg
hip ergeometryczny w „kanoniczny” sposób, stąd możemy stworzyć dobry sys­
tem gromadzenia faktów o współczynnikach dwumianowych.
Jakie szeregi są hipergeometryczne? Łatwo odpowiemy^ na to pytanie,
jeśli przyjrzymy się ilorazowi dwóch kolejnych składników:
bi,...,^
k> 0
bk . . . b k k!
Pierwszy składnik to = 1, a ilorazy pozostałych składników są dane wzorem
t k+1
a k+T. . . a k+T
tfc
a J f . . . akt
-
bk . . . b k
k!
bk+ 1 . . . b k+1 ( k + 1 )!
(Tc + d i ) . . . (Tc + Qm ) z
(k + b i ) . .. (k + bn ) ( k + 1 )
z k+1
zł
(5-8i)
Jest to funkcja w ym ierna zmiennej k, tzn. iloraz wielomianów zmiennej k.
Zgodnie z podstawowym twierdzeniem algebry, każdy wielomian zmiennej k
może być przedstawiony jako iloczyn wielomianów liniowych (o współczyn­
nikach zespolonych). Górne parametry a są negacjami pierwiastków wielo­
mianu w liczniku, a dolne parametry b są negacjami pierwiastków wielomianu
„There must be
many universities
to-day where 95 per
cent, if not 100 per
cent, of the
functions studied by
physics,
engineering, and
even mathematics
students, are
covered by this
single symbol
F(a,b;c;x).”
W. W. Sawyer [319]
w mianowniku. Jeżeli mianownik nie zawiera szczególnego czynnika ( k + 1 ) ,
możemy dopisać ( k + 1 ) równocześnie do licznika i mianownika. Stały czynnik
pozostaje i nazywamy go z. Dlatego szeregami hipergeometrycznymi są do­
kładnie te szeregi, których pierwszym składnikiem jest 1 i dla których iloraz
składników tic+i / t k jest funkcją wymierną zmiennej k.
Załóżmy na przykład, że mamy dany nieskończony szereg o ilorazie skład­
ników
tk+i
k 2 + 7k + 1 0
" tT =
4k 2 + 1
’
będącym funkcją wymierną zmiennej k. Wielomian w liczniku rozbija się
prosto na iloczyn (k+2)( k+5), a w mianowniku 4 (k + i/2 )(k —i/2 ). Ponieważ
w mianowniku nie ma czynnika (k + 1 ), więc zapisujemy iloraz składników
w postaci
tic+ i =
tk
(k + 2)(k + 5 ) ( k + l ) ( 1 / 4 )
(k + i / 2 ) (k —i / 2 ) (k + 1 ) ’
i możemy odczytać wynik: danym szeregiem jest
x> = *»fGA-J2I,/4
(Teraz jest dobry
czas na ćwiczenie
rozgrzewkowe 11.)
Mamy zatem ogólną metodę znajdowania hipergeometrycznej postaci da­
nej wielkości S, jeśli tylko jest to możliwe: na początku zapiszmy S jako nie­
skończony szereg o niezerowym pierwszym składniku. Zapiszmy ten szereg
jako H k^ 0 tic, gdzie t 0 ^ 0. Policzmy teraz t k+i / t k. Jeśli iloraz składników
nie jest funkcją wymierną, nie mamy szczęścia. W przeciwnym razie wy­
raźmy go w postaci ( 5 .8 1 ). Otrzymamy parametry d i , . . . , a m, b i , . . . , bn ,
i argument z, taki że S = to F( a i , . . . , am; b i , . . . , b^; z).
Szereg hipergeometryczny Gaussa możemy zapisać w postaci rekursywnego iloczynu
a, b
c
f
f
ab
a+1b+1
a+2b+2
= i + -r
ó-----r
1 + —5--------r r z 1 +
1~
c z V1 + “ 2
c +r 1z V
3 c+2
Spróbujmy przeformułować napotkane wcześniej tożsamości ze współ­
czynnikami dwumianowymi, tak by je przedstawić jako szeregi hipergeome­
tryczne. Na przykład, spróbujmy wykombinować, jak wygląda prawo równo­
ległego sumowania,
^ (T)/ = (T
+n+1)/ ’
\
k<$n \
Całk0Wlte n ’
w notacji hipergeometrycznej. Musimy zapisać sumę jako nieskończony szereg
zaczynający się od k = 0 , zatem zastąpmy k przez rt —k:
Szereg ten, choć formalnie nieskończony, faktycznie jest skończony, ponieważ
wielkość (tl—Tc)! w mianowniku powoduje, że
= 0, gdy k > n. (Zobaczymy
później, że 1 /x! jest zdefiniowane dla wszystkich x i że jeżeli x jest ujemną
liczbą całkowitą, to 1/x! = 0. Ale na razie ignorujmy takie drobiazgi dopóty,
dopóki nie nabędziemy więcej hipergeometrycznego doświadczenia.) Iloraz
składników wynosi
tic+i
(r + n —k — l)!r! (rt —k)!
tl —k
t k ~ r! ( n - k - 1 )! (r + n - k ) ! _ r + n - k
= ( k + 1 )(k —n ) ( 1 )
(k —n —r ) ( k + 1 ) ‘
Co więcej, to — C
• Zatem prawo równoległego sumowania jest równo­
ważne hipergeometrycznej równości
Po podzieleniu przez (r* n) otrzymamy nieco prostszą wersję
Przekształćmy jeszcze jedną równość. Iloraz składników tożsamości ( 5 .1 6 ),
całkowite m,
wynosi (k—m ) / ( r —m + k + 1 ) = (k + 1 )(k—m )(1 ) / ( k —m + r + 1 ) ( k+T), jeśli
zastąpimy k przez m —k. Stąd ze wzoru ( 5 . 1 6 ) uzyskujemy postać zwartą
dla
Jest to ta sama funkcja, co funkcja hipergeometryczna z lewej strony równości
( 5 .8 2 ), z tym że m zastąpiło n, a r+ 1 zastąpiło —r. Dlatego tożsamość ( 5 . 1 6 )
może być wyprowadzona z ( 5 .8 2 ) — hipergeometrycznej wersji równości ( 5 .9 ).
(Nie dziwmy się zatem, że tak łatwo udowodniliśmy ( 5 . 1 6 ) używając równości
( 5 .9 ).)
5. W spółczynniki dwum ianowe
(Dowodziliśmy
równości dla
całkowitych r
i używaliśmy
argumentu
wielomianowego by
pokazać, że są one
prawdziwe dla
dowolnych liczb
rzeczywistych.
Teraz dowodzimy
równość dla
niecałkowitych
wartości r by
używając następnie
granicy pokazać,
że są one prawdziwe
dla wartości
całkowitych!)
Zanim pójdziemy dalej, powiniśmy pomyśleć o przypadkach zdegenerowanych, ponieważ szeregi hipergeometryczne nie są zdefiniowane, gdy dolny
parametr jest zerem lub ujemną liczbą całkowitą. Zwykle stosujemy tożsa­
mość równoległego sumowania dla dodatnich liczb całkowitych r i rt, ale
wtedy —rt —r jest ujemną liczbą całkowitą i szereg hipergeometryczny ( 5 .7 6 )
jest nieokreślony. Co możemy zrobić, by móc używać wzoru ( 5 .8 2 )? Odpo­
wiedzią jest, że możemy wziąć granicę funkcji
gdy e —» 0 .
Zajmiemy się tym jeszcze później w tym rozdziale, ale teraz musimy sobie
zdawać sprawę, że niektóre mianowniki mogą sprawiać kłopot. Interesujące
jest, że pierwsza suma, jaką próbowaliśmy wyrazić hipergeometrycznie, oka­
zała się zdegenerowana.
Innym słabym miejscem naszego wyprowadzenia wzoru ( 5 .8 2 ) jest to, że
wyraziliśmy (T^ kk) jako (r + rt —k)!/r! (rt —k)!. Wzór ten jest błędny, gdy
r jest ujemną liczbą całkowitą, ponieważ (—rrt)! musi równać się 0 0 , jeśli ma
być spełnione prawo
0!
=
0 • (—1 ) • (—2 )
-m + 1
-m)!
Znowu, aby uzyskać wynik dla liczb całkowitych, musimy rozważyć granicę
wyrażenia r + e, gdy e —» 0 .
Ależ wzór (£) = r!/k! (r — k)! obowiązuje tylko wtedy, gdy r jest liczbą
całkowitą! Jeśli chcemy efektywnie pracować z funkcjami hipergeometrycz­
nymi, potrzebujemy zdefiniować funkcję silnia dla wszystkich liczb zespolo­
nych. Szczęśliwie taka funkcja istnieje. Może być zdefiniowana na wiele spo­
sobów. Oto jedna z najbardziej pożytecznych definicji funkcji z!, właściwie
definicja 1 /z!:
1
z!
=
lim ( n + z )n ~ *
tx—^00 V n
(5 -8 3 )
(Zobacz ćwiczenie 2 1 . Euler [99, 1 0 0 , 76] odkrył ten wzór w wieku 22 lat.)
Granica istnieje dla wszystkich liczb zespolonych z i jest równa zeru tylko
wtedy, gdy z jest ujemną liczbą całkowitą. Inną ważną definicją jest
t ze * d t ,
j - rJo
gdy
> -1
( 5 -8 4 )
Całka istnieje tylko wówczas, gdy część rzeczywista z jest większa niż —1.
Możemy jednak użyć wzoru
z! = z (z — 1 )!
( 5 -8 5 )
by rozszerzyć definicję na wszystkie liczby zespolone (z wyjątkiem ujemnych
liczb całkowitych). Inną definicję otrzymamy z przybliżenia Stirlinga lnz! we
wzorze ( 5 .4 7 ). Wszystkie te definicje dają tę samą funkcję uogólnionej silni.
Istnieje też bardzo podobna funkcja, zwana funkcją gam m a , która jest
związana ze zwykłymi silniami, podobnie jak ubywające potęgi są związane z
przyrastającymi potęgami. Standardowe podręczniki często używają równo­
cześnie silni i funkcji gamma. Dobrze jest móc w razie potrzeby przekształcać
wzajemnie te funkcje. Oto potrzebne wzory:
(5 -86 )
T ( z + 1 ) = z!;
(- z )i r(z) =
7T
(5 -87 )
s m 7tz
Możemy użyć uogólnionych silni do zdefiniowani uogólnionych potęg
monotonicznych, gdy z i w są dowolnymi liczbami zespQlonymi:
z— =
Z
=
z!
(5-88)
Jak zapiszemy z do
potęgi w , gdzie w
jest liczbą
sprzężoną z w ?
(5 -89 )
r{z)
Jedynym zastrzeżeniem jest to, że musimy użyć właściwych wartości gra­
nicznych, gdy w tych wzorach otrzymamy 00/00. (We wzorach nigdy nie
otrzymamy 0/0, ponieważ funkcje gamma i silnia nigdy nie są równe zeru.)
Współczynnik dwumianowy może być zapisany w postaci
WJ
a
= lim lim - , , r
£— cu-Kn> CU! ((_, cu)!
( 5 -9 0 )
gdzie z i w są dowolnymi liczbami zespolonymi.
Wyposażeni w uogólnione silnie możemy powrócić do naszego celu, jakim
jest zredukowanie wyprowadzonych wcześniej równości do ich postaci hiper­
geometrycznej. Wzór dwumianowy Newtona (5.13) okazuje się ni mniej, ni
więcej wzorem (5.77), czego mogliśmy się spodziewać. Spróbujmy teraz prze­
kształcić tożsamość Cauchy’ego (5.27):
L
A
r+ s
n
całkowite n.
Składnikiem k-tym jest
tk =
r!
S!
(r —k )! k! (s —rt + k)! (rt —k)! y
i nie obawiajmy się więcej używać uogólnionych silni w tych wyrażeniach.
Jeśli tk zawiera czynnik (a + k )!, ze znakiem plus przed k, to dzięki równości
(5.85) w ilorazie składników ti<+ i/t^ otrzymamy (<x+ k + 1 ) ! / ( cx + k.)! = k +
Rozumiem. Liczymy
granicę najpierw
względem dolnego
indeksu. Dlatego
(*) jest równe
zeru, gdy w jest
ujemną liczbą
całkowitą.
Wartość granicy
jest nieskończona,
gdy w nie jest
liczbą całkowitą,
a z jest ujemną
liczbą całkowitą.
a + 1 . Jeśli (a+ k)! jest w liczniku tk, to w odpowiednim szeregu hipergeometrycznym ‘a + 1 ’ pojawi się jako górny parametr. W przeciwnym razie, jeśli
(a + k )! jest w mianowniku tk, to ‘a + 1’ będzie dolnym parametrem. Podob­
nie czynnik ( a —k)! prowadzi do równości ( a —k—1} !/(a —k)! = (—1)/(k —a),
co powoduje że ‘—a ’ jest dolnym (górnym) parametrem szeregu hipergeometrycznego, gdy czynnik (a —k)! jest w liczniku (mianowniku) tk- Czynniki
niezależne od k, jak r! idą do to, ale znikają z ilorazu składników. Stosując ta­
kie chwyty, możemy bez dalszych obliczeń przewidzieć, że iloraz składników
wzoru (5.27) jest równy
k -r
k-n
k + 1 k + s —n + 1
tk+i
tk
razy (—1)2 = 1. Zatem tożsamość Cauchy’ego przybierze postać
- r , -r t
s —n + 1
rt
1
=
r+ s
n
( 5 -9 1 )
Możemy stosować ten wzór do wyliczenia F(a,b;c;z), gdy z = 1 i b jest
ujemną liczbą całkowitą.
Zapiszmy nieco inaczej wzór (5.91). Otrzymamy
a ,b
c
Kilka tygodni temu
badaliśmy to,
co Gauss zrobił
w przedszkolu.
Teraz zajmujemy
się tym, co robił
po doktoracie.
Czy ktoś chce nas
przestraszyć?
całkowite b ^ 0
lub 9t e > m a + mb.
=
1
( 5 -9 2 )
Tożsamość Cauchy’ego (5.27) odpowiada przypadkowi, gdy jeden z górnych
parametrów, powiedzmy b, jest niedodatnią liczbą całkowitą. Gauss udowod­
nił, że równość (5.92) jest prawdziwa także wtedy, gdy a, b, c są liczbami
zespolonymi spełniającymi warunek *Kc >
+ *Rb. W innych przypad­
kach szereg nieskończony F (a(ib |l) nie jest zbieżny. Gdy b = —n, równość
może być zapisana w wygodniejszy sposób za pomocą potęg monotonicznych
zamiast funkcji gamma:
a, —n
1
=
(c — a)n
(a —c):
całkowite n ^ 0.
(5.93)
(—c):
Okazuje się, że wszystkie pięć tożsamości w tabeli 197 są szczególnymi przy­
padkami tożsamości Cauchy’ego. Wzór (5.93) uogólnia je wszystkie, gdy pra­
widłowo postępujemy w sytuacjach zdegenerowanych.
Zauważmy, że wzór (5.82) jest szczególnym przypadkiem (a = 1) wzoru
(5.93). Dlatego nie potrzebujemy pamiętać wzoru (5.82). Nie musimy też
pamiętać wzoru (5.9), który prowadzi nas do równości (5.82), nawet gdy ta­
bela 202 mówi, że ten wzór należy zapamiętać. Program komputerowy prze­
kształcający wzory, poproszony o uproszczenie wzoru ^ k<n Cic*)* Przed-
stawi sumę jako funkcję hipergeometryczną i skorzysta z uogólnionej tożsa­
mości Cauchy’ego.
W zadaniu 1 podrozdziału 5.2 upraszczaliśmy sumę
U*
Jest to zadanie typowe dla funkcji hip ergeometryczny ch. Każdy hipergeometra z małą praktyką od razu odczyta te parametry i otrzyma F(1, —m; —n; 1).
Hmm, to zadanie jest znów przypadkiem szczególnym tożsamości Cauchy’ego.
Suma z zadań 2 i 4 odpowiada funkcji F(2 , *1 —n ;2 —m; 1}. (Musimy za­
stąpić wpierw k przez k + 1.) „Groźna” suma z zadania 6 jest tylko funkcją
F(n + 1, —rt; 2; 1). Czy nie ma już sum, nie będących ukrytą wersją przepo­
tężnej tożsamości Cauchy’ego?
Cóż, zadanie 3 lekko się różni od pozostałych. Suma w tym zadaniu jest
szczególnym przypadkiem ogólnej sumy
(n~ k)z k rozważanej w (5.74), z
której to sumy otrzymamy zwarty wzór dla
F ( 1+ 2 rV 2 ’
""I-274)
Czegoś nowego dowiedliśmy we wzorze (5.55), gdzie wyliczyliśmy współ­
czynniki wielomianu (1 —z )r (1 + z) r :
P . 1—c—2n, —2n
- 1 | = (~ 1)n ^
rt!
! . (C 1)!
(c + n — 1j!
całkowite n
0.
Po uogólnieniu na dowolne liczby zespolone wzór ten jest zwany wzorem
K u m m era :
FI
a’ b
1 + b -a
.
(b /2 )!
b/2
- 1 ) = —gj— (h — a )
(5-94)
(Ernst Kummer [229] udowodnił go w roku 1836.)
Interesujące jest porównanie obu wzorów. Zastępując c przez 1 —2n — a
otrzymamy, że wyniki są zgodne wtedy i tylko wtedy, gdy
=
1
j
n!
Um
M U
b ^ -2 n
b!
=
Um
*—
>—-* (2x)!
(5.95)
yó;
gdzie u jest dodatnią liczbą całkowitą. Załóżmy na przykład, że n = 3.
Wtedy powinniśmy otrzymać —6!/3! = limx^_3 x !/(2x)!. Wiemy, że obie
liczby (—3)! i (—6)! są nieskończone. Gdybyśmy zignorowali tę trudność i wy­
obrazili sobie, że (—3)! = (—3)(—4)(—5)(—6)!, wtedy oba wystąpienia (—6)!
by się skróciły. Musimy się jednak oprzeć tej pokusie, ponieważ zwodzi nas
Kummer mussial
tto nieźźle kummać.
dając złą odpowiedź! Granicą x!/(2x)!, gdy x —> —3, nie jest (—3) (—4) (—5),
ale zgodnie ze wzorem ( 5 .9 5 ) jest —6!/3! = (—4)(—5) (—6 ).
By prawidłowo uprościć granicę we wzorze ( 5 .9 5 ), musimy użyć równo­
ści ( 5 .8 7 ), która wiąże silnie o ujemnych argumentach z funkcjami gamma o
dodatnich argumentach. Zastąpmy x przez —n — e i niech e —» 0. Po zasto­
sowaniu dwa razy równości ( 5 .8 7 ) otrzymamy
(—n —e)!
r (n + e)fc
sin(2n + 2 e) 7r
sin(rt + e)n
(—2rt —2e)! F(2n + 2e)
Ponieważ sin(x+'y) = sin x cos'y+cosx siny, to korzystając z metod rozdziału
9 otrzymamy
cos2rt7r sin2e7t
= (—i r (2 + 0 (e)).
cos ri7Tsm en
Stąd i ze wzoru ( 5 .8 6 ) uzyskujemy pożądaną równość
(-n -e)l
lim
=
e-^o (—2 u —2e)i
„
, m r(2n)
=
r(u)
2 ( - 1)
, , n ( 2 n - 1 ) l _ f i m (2n)!
2 (—1 )
=
(- 1 ) 1
n!
Przejrzyjmy pozostałe napotkane w tym rozdziale tożsamości i przeksz­
tałćmy je do postaci hipergeometrycznej. Sumę (5 .2 9 ) z trzema współczyn­
nikami dwumianowymi zapiszemy jako
1—a —2n, 1—b —2n, —2n
a, b
= ( - 1 )’
(2 n)! (a + b + 2 rt — 1 )'
rt!
au bn
Po uogólnieniu do liczb zespolonych jest ona zwana w zorem Dixona:
a, b, c
1 + c —a, 1 + c —b
(Historyczna
notatka:
Saalschutz [316]
odkrył ten wzór
prawie 100 lat
później po tym, jak
Pfaff [293]
opublikował go po
raz pierwszy. Po
obliczeniu granicy
n —>oo
otrzymamy wzór
(5-94)
(c/2)! (c —a)— (c —b)—
-)■
C!
( c - a —b)—
(5-96)
SHa + 5Kb < 1 + 9tc/2.
Jednym z najbardziej ogólych wzorów, jaki napotkaliśmy, jest suma z ilo­
czynem trzech współczynników dwumianowych (5 .2 8 ), która daje nam to ż­
sam ość $aalschutza:
a, b, - n
c, a + b —c —n +1
1
=
_
(c — a)n (c —b)n
cn (c — a —b)n
(a -c )Ł (b -c fi
(—c )^ (a + b —c)S-
(5-97)
całkowite n ^ 0 .
5*5. Funkcje h ip ergeo m etryczn ej
Wzór ten daje nam dla z = 1 wartość szeregów hipergeometrycznych z
trzema górnymi i dwoma dolnymi parametrami, przy założeniu, że jeden
z górnych parametrów jest niedodatnią liczbą całkowitą i zachodzi bi + b2 =
ai + a.2 + a.3 + 1. (Jeśli suma dolnych parametrów przekracza sumę górnych
parametrów o 2 zamiast o 1, to na podstawie wzoru z ćwiczenia 25 możemy
wyrazić F (a i, a2, 0.3; bi ,b 2; 1) za pomocą dwóch funkcji hipergeometrycz­
nych spełniających warunki tożsamości Saalschiitza.)
Nasza, tak ciężko wywalczona równość z zadania 8 w podrozdziale 5.2
redukuje się do wzoru
1+ x
x + 1 , n + 1 , —n
1, x + 2
-rt—1
Cóż, jest to szczególny przypadek c = 1 tożsamości Saalschiitza (5.97). Zaosz­
czędzilibyśmy dużo pracy korzystając od razu z funkcji hipergeometrycznych!
Co z zadaniem 7? Ta supergroźna suma daje nam wzór
/ n + 1 , m - n , 1, \
całkowite n > m > 0.
y ^ m + l, j m + j , 2
który jest pierwszym przypadkiem z trzema dolnymi parametrami. Wygląda
na nowy wzór. Ale nim naprawdę nie jest — lewą stronę równości można
zastąpić przez wielokrotność
n, m —n —1,
\ m y j m —j
i
-
1
jeśli zastosujemy ćwiczenie 26. Tożsamość Saalschiitza wygrywa jeszcze raz.
Dobrze. Jeszcze jedno dołujące doświadczenie, które pozwoli nam doce­
nić siłę metod hipergeometrycznych.
Tożsamości z tabeli 232 nie mają hipergeometrycznych odpowiedników,
ponieważ ich ilorazy składników są funkcjami wymiernymi zmiennej k tylko
wtedy, gdy t jest liczbą całkowitą. Równości (5.64) i (5.65) nie są „hiper­
geometryczne” nawet gdy t = 1. Przyjrzyjmy się, co uzyskamy z równości
(5.62), gdy t jest małą liczbą całkowitą:
l 2 r>I r + 2 ’ - n ’ - T i- s
V r+1, - n — j s , —n — \s + j
\
_
)
( J r> 5t+ 3’ J T + f ’ “—nn,- —n — j s y
V7T+7, ir+l, — n — is, -
(' r + s + 2n
n
V
s + 2n
n
1„ 1 1
r + s + 3n
n
s + 3n
n
(Historyczna
notatka: George
Andrews w 1974
roku [9, rozdział 5].
pierwszy wskazał
na ważność
szeregów hiperge­
ometrycznych dła
równości ze
współczynnikami
dwumianowymi.)
Z pierwszego z tych wzorów otrzymujemy znowu rozwiązanie zadania 7, jeśli
wielkości (r, s, rt) zastąpimy odpowiednio przez (1 , m —2 ri —1 , rt —m).
W końcu, „nieoczekiwana” suma (5 .20 ) daje nam nieoczekiwaną, lecz
pouczającą tożsamość hipergeometryczną. Przekształćmy tę sumę:
2m - k \ 2lc = 2lm
k^m v
,
'
k^O
. m —k
Iloraz składników (2m —Tc)! 2^/rrt! (m —k)! równa się 2(k —m)/(k —2m),
zatem uzyskaliśmy hipergeometryczną tożsamość dla z = 2 :
2)
= 2 2m,
całkowite m ^ 0 .
(5 *98 )
Spójrzmy na dolny parametr ‘—2m }. Ujemne liczby całkowite są zabronione,
zatem ta równość jest nieokreślona!
Ponieważ zdegenerowaną funkcję hipergeometryczną możemy wyliczyć
osiągając ją z pobliskich niezdegenerowanych punktów, najwyższy już czas —
jak obiecaliśmy wcześniej— przyjrzeć się z uwagą tym granicznym przypad­
kom. Musimy bardzo uważać, ponieważ zależnie od sposobu policzenia gra­
nicy możemy otrzymać różne wyniki. Na przykład, otrzymamy dwie różne
granice, gdy jeden z górnych parametrów zwiększymy o e:
UmFl _ 1 + e ’ _ 3
V —2 + e
e —>0
II
1
- lim (1 I M + e H - 3 ) , ( -1 + e )( e ) ( -3 ) (- 2 )
(—2
+ e ) 1! +1 (—2 + e ) ( —1 + e ) 2!
“ ei-inU
2+e)
* 0 ' + (—
+
=
lim F
e->0
1 - f + 0 + 1
( - 2 + e I’) =
(-1+ e)(e)(1+ e)(-3)(-2)(-1)
(_2+ e)(-l+ e)(e)3!
=
0;
+ ( - 2 + e n i + 0 + °)
Podobnie, zdefiniowaliśmy (“ ]) = 0 = lime^o
Nie jest to to samo, co
lime_>o (Z]+e) —1 • Aby prawidłowo obejść się z (5 .98 ), musimy uświadomić
sobie, że górny parametr —m powoduje zerowanie się wszystkich składników
szeregu Lkzo (2r - t ) 2 k. gdy k > m. Chcemy udowodnić, że
( 2: )
F ( —2 m + e
12) = 22m ’
całk0wite m ^ ° - (5'99)
Każdy wyraz w tej granicy jest dobrze określony, gdyż czynnik w mianow­
niku (—2m)k dopóty nie staje się zerem, dopóki k ^ 2m. Dlatego w granicy
otrzymamy dokładnie sumę (5 .20 ), od której zaczęliśmy.
5.6. P rzek ształcen ia hipergeom etryczn e
Powinno być jasne, że baza znanych postaci zwartych funkcji hipergeometrycznych jest użytecznym narzędziem dla wyliczenia sum ze współczynni­
kami dwumianowymi. Przekształcamy, po prostu, daną sumę do kanonicznej
postaci hipergeometrycznej i następnie sprawdzamy w tabeli. Jeśli jest tam,
wspaniale — mamy odpowiedź. Jeśli nie ma, to możemy ją dodać do bazy,
jeśli suma okaże się mieć postać zwartą. Moglibyśmy także dołączyć wiersze
do tabeli postaci „ta suma nie ma prostej postaci zwartej”. Na przykład,
suma YLk<m (k) odpowiadająca funkcji hipergeometrycznej
ma postać zwartą tylko wtedy, gdy m jest bliskie 0 , \ n lub n.
Nie jest to koniec historii, ponieważ funkcje hipergeometryczne mogą
spełniać swe własne równości. To znaczy, że każda postać zwarta funkcji hi­
pergeometrycznej prowadzi do innej postaci zwartej i do dodatkowego wiersza
w bazie. Na przykład równości w ćwiczeniach 25 i 26 pozwalają nam prze­
kształcić jedną funkcję hipergeometryczną w dwie inne z podobnymi, lecz
różnymi parametrami. Te funkcje z kolei można przekształcić ponownie.
W 1797 r. J. F. Pfaff [293] odkrył zadziwiające prawo odbicia,
¥ f a }b
1
(1 - z ) a
—z \
1 —z )
_
[ a, c —b
\( “ ■ c
(5 .1 0 1 )
które jest przekształceniem innego typu. Jest to formalna równość szeregów
potęgowych, otrzymana przez zastąpienie wielkości (—z)k/(1 —z)k+a z lewej
strony równości szeregiem nieskończonym (—z)k (l + (k^a) z + (k+2 + 1)z 2 +
•••) (zobacz ćwiczenie 50). Gdy z ^ 1, możemy na podstawie tego prawa
wyprowadzić nowe wzory ze znanych już nam tożsamości.
Na przykład, wzór Kummera ( 5 .9 4 ) można przekształcić przez prawo
odbicia ( 5 . 1 0 1 ), gdy dobierzemy odpowiednio parametry:
2 - a F(
a ! ) = ? ( a’ b
2
l 1 + b —a
1 + b —a
-1
M H f(hb --na )) ^V i 2- .
b!
( 5 -1 0 2 ;
Jeśli podstawimy a = —rt i przekształcimy to równanie do postaci sumy ze
współczynnikami dwumianowymi, uzyskamy równość, która być może przyda
się nam któregoś dnia:
y
k$sO
(-ri)k (1+rt)k 2~~k _ y
( 1 +b + rt)k
(t )
k!
( T ) / ( n+r
_ , - n (b / 2 )! (b+n)!
b! (b / 2 +n)! ’
całkowite
n ^ 0.
k)
( 5 -1 0 3 )
Na przykład, gdy rt = 3, otrzymamy:
1- 3
4
2(4 + b)
.
4 -5
4(4 + b)(5 + b)
_
“
Żaden z nich nie
interesuje się takimi
bzdetami.
4-5-6
8(4 + b)(5 + b ) ( 6 + b)
(b + 3)(b + 2 )(b + 1)
(b + 6 )(b + 4 )(b + 2 ) *
Niewiarygodne, ale prawdziwe dla wszystkich b. (Chyba, że znika któryś z
czynników w mianowniku.)
Zabawne, spróbujmy jeszcze raz. Może znajdziemy sumę, która zadziwi
naszych przyjaciół. Co zrobi prawo odbicia Pfaffa, jeśli zastosujemy go do
dziwnego wzoru ( 5 .9 9 ), gdy z = 2? W tym przypadku podstawiamy a = —m,
b .= 1 , c = —2 m + e i uzyskujemy
(—1)m lim F
£—>•0
( - m ,1
\ - 2m +i
21 = lim F
e—>0
—m, —2 m —1 + e
—2 m + e
= lim Y
e—>0 L—
k^O
k)
k^m
(Histeryczna
notatka: Zobacz
ćwiczenie 51, jeśli
otrzymałeś inny
wynik.)
(—m )k ( - 2 m - l + e ) k 2 ^
- 2 m + e)k
k!
(2 m )—
ponieważ żadne z granicznych wyrażeń nie jest bliskie zera. Uzyskujemy inny
cudowny wzór:
k^m
2m + 1
(_ 2 )k =
k / 2 m + l —k
H ) m22m/ ( 2^
-
1/2
m
Na przykład gdy m = 3, suma wynosi
1_7+ ^ -14 = - y ,
i (" Y 2) jest rzeczywiście równe —j$-
całkowite m ^ 0 . ( 5 . 1 0 4 )
Gdy przeglądaliśmy nasze tożsamości dwumianowe i przekształcaliśmy je
do postaci hipergeometrycznej, pominęliśmy wzór ( 5 . 1 9 ), ponieważ nie jest
to równość sumy i jej postaci zwartej, lecz jest to równość dwóch sum. Za to
teraz możemy uważać wzór ( 5 . 1 9 ) za równość dwóch szeregów hipergeome­
trycznych. Jeśli zróżniczkujemy ją rt razy względem zmiennej y i zastąpimy
k przez m —n —k, otrzymamy
L m
k^O
m+ r
n —k
rt
x,m - n - k y k
rt
—r
n+ k
= z L m:—rt
-X)
TL
k^O
m—tl—k
(x+ u )1
Prowadzi to do następującego przekształcenia hipergeometrycznego:
a, —n
(a — c)—
( c)—
a, —u
1 —n + a —c
1 —z
całkowite
( 5 -1 0 5 )
n ^ 0.
Zauważmy, że dla z = 1 równość ta redukuje się do tożsamości Cauchy’ego
(5 -9 3 )Różniczkowanie wydaje się być pożyteczne, jeśli mielibyśmy sugerować
się tym przykładem. Przydało się nam w rozdziale 2 przy sumowaniu x +
2x 2 + • • • + rtxTL. Sprawdźmy, co się stanie, gdy zróżniczkujemy względem
zmiennej z szereg hipergeometryczny:
d
/ cii, . . . , ctm
dz
V b l>--->bn
k+1
=
z—
Z
™
k+1
= L
k+1 ~k
... a
m ^
—
1 k+1
H + ' .. .bu +1 k!
ai ( a i + 1 )k . . . a m(a m + 1 )k z k
k^O bi (bi + 1 )k . . . b-ajb^+l )k k!
Ql
F
bi . . . bti
( 5 -1 0 6 )
Parametry przesunęły się na zewnątrz i powiększyły o jeden.
Możemy zróżniczkować tak, by zmienić tylko jeden z parametrów, nie
ruszając przy tym innych. Do tego celu używamy operatora
d = z T z'
Jak wymawiać d ?
(Nie wiem, ale T^jK
nazywa go
‘vartheta’.)
który zróżniczkowaną funkcję mnoży przez z. Otrzymamy równość
p / cn , . . . , a m \
\b i,...,b n
;
= z y
a
zk
= y - k a j . . <g j l zk
j ^ b f . . . b * ( k - 1 )l
4 -0
bf...b£k!
która sama w sobie nie jest zbyt użyteczna. Ale jeśli przemnożymy F przez
jeden z parametrów, powiedzmy a-[, i dodamy to do #F, uzyskamy
( k + a 1 ) a 1k . . . a ^ t zk
(S + a , ) F
= k^O
L
bk . .. bk k!
a i ( a i + 1 ) lc 0-2 • • • a j l z k
= kL^ 0
bk . . . b k k!
a i + 1 , Q2, . . . , a m
= aiF
bi, . . . , b.
Tylko jeden z parametrów jest powiększony o jeden.
Podobny chwyt można zastosować z dolnym parametrem, ale wtedy uzy­
skamy parametr pomniejszony, zamiast powiększony o jeden:
(fl + b! - 1 ) F '
a u . . . } a,
b!,...,bn
= kZ> 0
(k + b, -
1 )a*. .. < 4
zk
bk . . . b * k !
y (hi - l X - . . a ^ z lc
S 5 (b, - 1) k b f ...b * k !
(bi —1) F T
\ b j - 1 , b2>
bn
z).
y
Możemy połączyć wszystkie te operacje tworząc matematyczny „kalam­
bur”, otrzymując tę samą wielkość na dwa różne sposoby. Mianowicie, mamy
($ + ai ) . . . ( # + am)F = ai ... am F
z) ’
dl , . . • , dm
b i- 1,
bn — 1
gdzie F = F(di , . . . , am; b i , . . . , bn ; z). Ze wzoru ( 5 . 1 0 6 ) wiemy, że górny
wzór jest pochodną dolnego wzoru. Stąd ogólna funkcja hipergeometryczną
F spełnia równanie różniczkowe
D (£ + bi — 1) . . . (-&+ bn — 1)F = (-&+ a 1) . . . ( ^ + a m)F,
(5*107)
gdzie D jest operatorem
Czas na przykład. Znajdźmy równanie różniczkowe spełniane przez szereg
hipergeometryczny F(z) = F(a,b;c;z). Zgodnie ze wzorem (5.107), mamy
D(-& + c — 1)F = (S + a)(£ + b)F.
Co to oznacza w zwykłej notacji? Cóż, (# + c —1)F to zF'(z) + (c — 1)F(z), a
po zróżniczkowaniu otrzymamy
F ^ + z F ^ z H fc -l^ z ).
Po prawej stronie mamy
(-&+ a) (zF7(z) + bF (z)) = z ^ (z F '(z )+ b F (z )) + a(zF'(z)+bF(z))
= zF/ (z )+ z 2F//(z)+bzF'(z) + azF/ (z) + abF (z).
Przyrównując obie strony otrzymamy
z (1 —z)F"(z) + (c —z(a + b + 1))F'(z) — abF(z) = 0 .
(5*108)
Równanie to jest równoważne iloczynowej postaci (5.107).
Na odwrót, możemy z równania różniczkowego uzyskać szereg potęgowy.
Załóżmy, że F(z) = ^ k>o tkZk jest szeregiem potęgowym spełniającym rów­
nanie (5.107). Bezpośrednie obliczenia pokażą nam, że
tk+i
tk
(k + a i ) . . . (k + a m)
(Tc + b i ) . . . (Tc + bn )(k + 1 ) ’
zatem F(z) musi być równe to F (a i, . . . , a m; b i , . . . , b^; z). Udowodniliśmy,
że szereg hipergeometryczny (5.76) jest jedynym szeregiem formalnym z wy­
razem wolnym równym 1 i spełniającym równanie różniczkowe (5.107).
Byłoby dobrze, gdyby funkcje hipergeometryczne rozwiązywały wszyst­
kie równania różniczkowe świata, ale tak nie jest. Prawą stronę równania
(5.107) zawsze można przedstawić jako sumę składników postaci
(z),
gdzie F(k)(z) jest k-tą pochodną D kF(k). Lewą stronę można zapisać jako
sumę składników postaci p ^ z ^ ^ ^ ^ z ) , gdzie k > 0. Zatem równanie róż­
niczkowe (5.107) zawsze ma szczególną postać
z " - 1( P n -z < x u )F(n)(2 ) + --- + (p 1 - z a 1) F ' ( z ) - a 0F(z) = 0 .
Funkcja
H z) = 0 - z ) r
spełnia
-&F = z(d —r)F.
To daje inny dowód
wzoru
dwumianowego.
Równanie ( 5 . 1 0 8 ) ilustruje to dla przypadku rt = 2. Na odwrót, udowodnimy
w ćwiczeniu 6.13, że dowolne różniczkowe równanie w tej postaci może być
przedstawione jako iloczyn operatorów $ i otrzymujemy równanie podobne
do ( 5 . 1 0 7 ). Są to równania różniczkowe, których rozwiązania są szeregami
potęgowymi z wymiernym ilorazem składników.
Mnożąc obie strony równości ( 5 . 1 0 7 ) przez z uwalniamy się od operatora
D i otrzymujemy pouczający wzór
W + b! - 1 ) . . . ( f l + bn - 1 ) F = z(£ + a 1) . . . ( £ + am)F.
( 5 -1 0 9 )
Pierwszy po lewej stronie czynnik $ = (#+1 —1) odpowiada ( k + 1) w ilorazie
składników (5 .8 1 ), który to odpowiada k! w mianowniku k-tego składnika
ogólnego szeregu hip ergeometrycznego. Inne czynniki (-&+bj —1) odpowiadają
czynnikowi w mianowniku (k + bj), który odpowiada bk we wzorze ( 5 .7 6 ).
Po prawej stronie z odpowiada zk, i (-&+ aj) odpowiada ak.
Stosując teorię równań różniczkowych możemy znaleźć i udowodnić nowe
przekształcenia. Na przykład możemy z łatwością sprawdzić, że obie funkcje
hipergeometryczne
/ 2 a ,2b
Va + b + 4
(Uwaga: Nie
możemy stosować
bezpiecznie wzoru
(5 -no), gdy
\z\ > 1/2, chyba
że obie strony są
wielomianami.
Zobacz
ćwiczenie 53.)
a, b
?(V &+b + 4- 4z(1 —z)
spełniają to samo równanie różniczkowe
z(1 —z)F"(z) + (a + b + ^)(1 —2z)F/(z) —4abF(z) = 0;
zatem jest spełniona tożsam ość Gaussa [143, równanie 1 0 2 ]
p ( 2 a, 2 b
hU + b + i
=
f (
a, b
4z(1 —z)
\ a+b + ^
( 5 -iio)
r(
a’ b
\ a+b + ^
(5-iii
W szczególności
/
2 a ,2b
U +b+i
W rzeczywistości
obie sumy są
zbieżne poza
zdegenerowanym
przypadkiem, gdy
a + b + \ jest
niedodatnią liczbą
całkowitą.
=
gdy obie nieskończone sumy są zbieżne.
\
Każda nowa tożsamość hipergeometryczną ma swoje konsekwencje dla
współczynników dwumianowych. Ta też nie jest wyjątkiem. Rozważmy sumę
m —k \ / m + n + 1 \ / —l xlc
n / \
k
VT
J
Składniki są niezerowe, gdy 0 ^ k ^ m —rt, i biorąc granicę, jak już robiliśmy
poprzednio, możemy wyrazić sumę jako funkcję hipergeometryczną
elim
—>-0 \ n )
n - m , —rt—m — 1 + a e
—m + e
)■
Wartość oc nie wpływa na granicę, ponieważ niedodatni górny element n —m
ucina sumę dosyć wcześnie. Jeśli podstawimy oc = 2, to możemy zastosować
wzór ( 5 . 1 1 1 ). Możemy wyliczyć teraz grsinicę, ponieważ prawa strona jest
szczególnym przypadkiem wzoru ( 5 .9 2 ). Jak pokazano w ćwiczeniu 54, wynik
może być wyrażony w prostej postaci
L ( V ) ( m+r ' X
k^m v
7
v
/
(m + n ) / 2 \
TL
J
\
t
)'
/
2n m[m + n parzyste],
całkowite
m ^ Tl
u.
(5-112)
Na przykład gdy m = 5 i n = 2, otrzymamy (|) (®) - (*) (*)/2 + ( 2 ) © / 4 ~
(2 ) ( 3 ) /# = 10 —24 + 21 —7 = 0. Gdy m = 4 i n = 2, obie strony są równe
W pewnych przypadkach wzór ( 5 . 1 1 0 ) da sumy dwumianowe dla z =
—1, ale są one bardzo dziwaczne. Jeśli podstawimy a = \ — j i b = —rt,
otrzymamy potworny wzór
2 _ 1
3
3
-
1
1
=
F
l
a3 - i3n
-8
Funkcje te są niezdegenerowanymi wielomianami, gdy n ^ 2 (mod 3) i pa­
rametry są tak sprytnie dobrane, że możemy lewą stronę przekształcić za
pomocą wzoru ( 5 .9 4 ). Stąd otrzymujemy wzór
2n\
n) / \
n
) ’
całkowite n > 0 ,
n ^ 2 (mod 3).
To najbardziej wstrząsająca tożsamość ze współczynnikami dwumianowymi,
jaką kiedykolwiek widzieliśmy. Nawet dla małych liczb nie jest łatwa do
ręczńego sprawdzenia. (Okazuje się, że obie strony dają
gdy n = 3.)
Oczywiście, tożsamość ta jest kompletnie bezużyteczna. Z pewnością nigdy
nie znajdzie zastosowania w praktycznym problemie.
Zobaczyliśmy, że szeregi hipergeometryczne pomagają nam w oblicze­
niu sum ze współczynnikami dwumianowymi. Wiele dodatkowych informacji
znajdziemy w książce Baileya [18] i w książce Gaspera i Rahmana [141].
5.7. C zęściow e sum y hipergeom etryczn e_______
W większości z wyliczonych w tym rozdziale sum zmienna indeksowa k prze­
biegała zbiór liczb całkowitych nieujemnych. Czasami znajdowaliśmy postać
zwartą sumy o zakresie sumowania z przedziału a ^ k < b. Na przykład,
Jedyny pożytek
z równania (5 .113)
to zademonstrowa­
nie istnienia
niezwykle
bezużytecznych
tożsamości.
5. Współczynniki dwumianowe
wiemy z równości (5 .16 ), że
Z
rt
całkowite m.
( - i ) k = ( - 1)
(5-114)
k<m
Teoria z rozdziału 2 dała nam piękną metodę rozumienia takich wzorów:
Przyjmijmy f(k) = Ag(k) = g (k + 1) — g(k). Umówiliśmy się zapisywać
£ f ( k ) ók = g(k) + C i
^ N ( k ) 5 k = g(k)|^ = g(b) —g (a ).
Co więcej, gdy a i b są liczbami całkowitymi takimi, że a ^ b, mamy
£ ^ f ( k ) 6k =
Y. W
a^kcb
= 9(b ) “ 9(a)-
Dlatego tożsamość (5 .114 ) odpowiada wzorowi sumowania nieoznaczonego
1 )k Sk =
I +<=
1 wzorowi rozmcowemu
A
ik i'n
=
-1
1k+1
n +1
k+1
Łatwo jest zacząć od funkcji g(k) i wyliczyć funkcję Ag(k) = f (k), której
suma nieoznaczona będzie równa g(k) + C. O wiele trudniej jest zacząć od
funkcji f(k) i odnaleźć jej nieoznaczoną sumę Y f(k)
= 9 (k) + C. Funk­
cja g może nie mieć prostej postaci. Na przykład nie istnieje prosta postać
sumy Y ©
w przeciwnym razie moglibyśmy upraszczać sumy postaci
H k ^ i r / 3 ( k ) - A m ° ż e istnieje prosta postać sumy Y ( k )
tylko jej nikt do
tej pory nie wymyślił? Jak możemy być tego pewni?
W roku 1977 R. W. Gosper [154] odkrył piękną metodę odszukiwania nie­
określonych sum Y f(k) 6k —g (Tc) H-C, jeśli tylko f i g należą do ogólnej klasy
funkcji zwanych wyrazami hipergeometrycznymL^Zapiszmy k-ty składnik
O-l > • • • > G-m
bi, ... , bn
ik
z 1 = —L------ — —
b \ ... b£ k!
k
(5-ii5)
szeregu hipergeometrycznego F( a i , . . . , a m; b i , . . . , bn ; z). Będziemy uważać
F( ai , . . . , a m; b i , . . . jbn.;z)k za funkcję zmiennej k, a nie jak dotychczas
zmiennej z. W wielu przypadkach okazuje się, że dla danych a i , . . . , a m,
b i , ..., bn, z istnieją stałe c, A i, ... , A m , Bi , . .., Bn , Z takie, że zachodzi
równość
........ a ’
U l ........ bi
z]
k
6k =
cF
A i, . .. , A m
Z) + C .
k
\ di , . .. , dn
(5.116)
Będziemy mówić, że dana funkcja F (a i, . . . , a m; b i , . . . , bn ; z)* jest sumowalna za pomocą wyrazów hipergeometrycznych , jeżeli istnieją takie stałe
c, A i , . . . , Am, Bi , . . . , Bn, Z. Za pomocą algorytmu Gospera albo znaj­
dziemy te stałe, albo udowodnimy, że one nie istnieją.
W ogólności powiemy, że t(k) jest wyrazem hipergeometrycznym , je­
żeli t ( k + 1)/t(k) jest funkcją wymierną zmiennej k nietożsamościowo równą
zeru. Oznacza to, że w istocie t(k) jest wielokrotnością wyrażeń podobnych
do (5.115). (Problem sprawiają zera w mianowniku, ponieważ chcemy, by
t(k) było określone dla liczb k ujemnych lub gdy jedna lub więcej z dolnych
liczb b we wzorze (5.115) jest zerem lub ujemną liczbą całkowitą. Ściślej, uzy­
skamy najbardziej ogólny wyraz hipergeometryczny, jeśli pomnożymy (5.115)
przez niezerową stałą razy pewna potęga 0, a następnie uprościmy zera w licz­
niku z zerami w mianowniku. Przykłady w ćwiczeniu 12 powinny pomóc w
wyjaśnieniu tej generalnej zasady.)
Chcemy znaleźć Y. t(k) Sk, gdy t(k) jest wyrazem hipergeometrycznym.
Algorytm Gospera wykonujemy w dwóch etapach, z których każdy jest dość
prosty. W etapie 1 przedstawiamy iloraz składników w specjalnej postaci
t(k + 1 ) _ p (k + 1 )
q(k)
t(k)
“
p(k) r(k + 1 ) ’
l5'117;
gdzie p, q, r są wielomianami spełniającymi następujący warunek:
(k + a )\q (k )
i
(k + a)\q(k)
( k + ( 3)\r(k)
=4- oc — P nie jest dodatnią liczbą całkowitą.
(5*118)
Warunek ten jest łatwo osiągnąć. Na początku tymczasowo przyjmujemy,
że p(k) = 1, a za q(k) i r(k + 1) podstawiamy licznik i mianownik ilorazu
składników rozłożony na iloczyn wielomianów liniowych. Na przykład, jeśli
wyraz t(k) ma postać (5.115), to zaczynamy od rozłożenia go na iloczyn
q(k) = ( k + a 1) . . . ( k + a m)z i r(k) = (k + bi - 1) . . . (k + b^ - 1)k. Wtedy
sprawdzamy, czy warunek (5.118) jest spełniony. Jeśli q i r ma czynniki
(Tc+a) i (k + |3), gdzie a — |3 = N > 0, to usuwamy je z wielomianów q i r i
zastępujemy p(k) przez
p(k)(kH-a—1)^ ^ - = p (k )(k + a —1)(k+cx.—2 ) . . . (k + p + 1 ).
(5*119)
Nowe p, q, r ciągle spełniają równość (5.117). Następnie powtarzamy te czyn­
ności dopóty, dopóki warunek (5.118) nie będzie spełniony. Za chwilę zrozu­
miemy, dlaczego warunek (5.118) jest taki ważny.
Etap 2 jest ostatnim etapem algorytmu Gospera. Znajdziemy, o ile to
możliwe, wyraz hipergeometryczny T (k) taki, że
t(k) = T(k + 1) —T (k ).
(Podzielność
wielomianów
przypomina
podzielność liczb
całkowitych.
Na przykład
(5.120)
oznacza, że iloraz
q(k)/(k+ a) jest
wielomianem.
Nietrudno jest
sprawdzić, że
zachodzi warunek:
(k + a)\q(k)
wtedy i tylko
wtedy, gdy
q ( - a ) = 0.)
Nie jest oczywiste, jak to zrobić. Musimy rozwinąć najpierw pewną teorię,
zanim będziemy wiedzieli, jak postępować. Po przestudiowaniu wielkiej ilości
szczególnych przypadków Gosper zauważył, że mądrze jest zapisać nieznaną
funkcję T(k) w postaci
r(k) s(k) t(k)
= — ?(k)----- ’
T(k)
(Ćwiczenie 55 może
nam wyjaśnić,
czemu chcielibyśmy
wykonywać takie
magiczne
podstawienia.)
..
(5'121)
gdzie s(k) jest nieznaną funkcją, którą jakoś musimy odkryć. Wstawiając
(5.121) do (5.120) i stosując (5.117), otrzymamy
, n l _ T( k + 1 ) s ( k + 1 )t(k + 1 )
1
J
_
~
zatem musi
p(k)
r(k)s(k)t(k)
p(k + l)
P(k)
q(k )s (k + 1 )t(k) _ r(k)s(k)t(k)
p(k)
p(k)
zachodzić
= q (k )s(k + 1)—r (k )s(k ).
(5*122)
Jeśli znajdziemy s(k) spełniającą tę rekurencję, to znajdziemy ^ t ( k ) ók. W
przeciwnym razie takie T nie istnieje.
Zakładamy, że T(Tc) jest wyrazem hipergeometrycznym, co oznacza, że
T (k + 1)/T(k) jest funkcją wymierną zmiennej k. Dlatego, dzięki wzorom
(5.121) i (5.120) wiemy, że r(k)s(k)/p(k) = T (k )/(T (k + 1) — T(k)) jest
funkcją wymierną zmiennej k i s(k) musi być ilorazem wielomianów:
s(k) = f( k )/g (k ).
W rzeczywistości możemy udowodnić, że s(k) jest wielomianem. Załóżmy, że
g(Tc) nie jest funkcją stałą oraz że f (k) i g(k) nie mają wspólnego dzielnika.
yNFiech N będzie największą liczbą całkowitą taką, że (k + (3) i (k + p + N —1)
są dzielnikami wielomianu g(k), dla pewnej zespolonej liczby |3. Wartość N
jest dodatnia, ponieważ N = 1 zawsze spełnia ten warunek. Możemy teraz
zapisać równanie (5.122) w postaci
p(k)g(k+1)g(k) = q(k)f(k+1 )g(k) - r(k)g(k+T)f(k)
i jeśli podstawimy k = —13 i k = —(3 — N, uzyskamy
T( - P ) g ( 1 - P ) f ( - P ) = 0 -
q(-p_N )f(1-p-N )g(-P -N ).
Ponieważ f i g nie mają wspólnych pierwiastków, więc f (—P) ^ 0 i f (1 — P —
N) ^ 0, Także g(l — P) ± 0 i g(—P —N) ^ 0, gdyż w przeciwnym razie g(k)
zawierałoby jeden z czynników (k + P — 1) lub (k + p + N), co przeczyłoby
maksymalności N. Dlatego
t(-P) = q ( - P ~ N ) = 0 .
Ale to przeczy warunkowi ( 5 . 1 1 8 ). Zatem s(k) musi być wielomianem.
Nasze zadanie sprowadza się do znalezienia wielomianu s(k) spełniają­
cego równość ( 5 . 1 2 2 ), gdzie p(k), q(k), r(k) są danymi wielomianami, lub
udowodnienia, że taki wielomian nie istnieje. Łatwo jest to zrobić, gdy znamy
stopień wielomianu s(k). Napiszmy
s(k) = <xdkd + a d- i k d_1 H-------b oc0 ,
ocd ^
0
( 5 -1 2 3 )
gdzie d jest stopniem wielomianu s(k) i ( a d ł . . . , ao) S3Lnieznanymi współ­
czynnikami. Wstawmy to wyrażenie do podstawowej rekurencji ( 5 . 1 2 2 ). Wie­
lomian s(k) będzie spełniał rekurencję wtedy i tylko wtedy, gdy współczyn­
niki oc spełniają liniowe równania, które otrzymamy przyrównując współ­
czynniki przy każdej potędze k w równaniu ( 5 . 1 2 2 ).
Jak wyznaczyć stopień wielomianu s? Są dwie możliwości. Zapiszmy rów­
nanie (5 . 1 2 2 ) w postaci
2p(k) = Q ( k ) ( s ( k + 1 ) + s(k)) + R ( k ) ( s ( k + l ) - s ( k ) ) ,
gdzie
Q(k) = q ( k ) —r(k)
i
(5 .1 2 4 )
R(k) = q ( k ) + r ( k ) .
Jeśli s(k) jest stopnia d, wtedy suma s(k + 1) + s(k) = 2 a dk d H-----także
jest stopnia d, podczas gdy różnica s(k-ł-1) —s(k) = As(k) = dcxdk d_1 H---jest stopnia d —1. (Zakładamy, że wielomian zerowy jest stopnia —1.) Niech
deg(P) oznacza stopień wielomianu P. Jeśli deg(Q) ^ deg(R), wtedy stopniem
prawej strony równości ( 5 . 1 2 4 ) jest deg(Q) -1- d, zatem d = deg(p) —deg(Q).
Z drugiej strony, jeśli deg(Q) < deg(R) = d', wtedy możemy napisać, że
Q(k) = A'kd _1 + • • • i R(k) = Akd’ + • • •, gdzie A / 0. Prawa strona
równości ( 5 . 1 2 4 ) jest postaci
(2A'cxd + Ad a d)k d + d ' “ 1 + • • • .
Stąd dwie możliwości: albo 2A'+ Ad ^ 0 i d = deg(p) —deg(R) + 1 , albo 2A' +
Ad = 0 i d > deg(p) —deg(R) + 1. Drugi przypadek musimy sprawdzić tylko
wtedy, gdy —2A'/A jest liczbą całkowitą d większą niż deg(p) —deg(R) + 1 .
Znamy już dostatecznie wiele faktów, by dokończyć etap 2 algorytmu
Gospera. Jeśli równanie ( 5 . 1 2 2 ) ma wielomianowe rozwiązanie, to sprawdza­
jąc co najwyżej dwie wartości d, możemy znaleźć s(k). Jeśli s(k) istnieje, to
po wstawieniu go do wzoru ( 5 . 1 2 1 ) uzyskamy nasze T. W przeciwnym razie
udowodnimy, że t(k) nie jest sumowalne za pomocą wyrazów hipergeome­
trycznych.
Rozumiem. Gosper
by przeprowadzić
ten dowód musiał
założyć warunek
(5.118).
Czas na przykład. Spróbujmy policzyć sumę częściową (5.114). Posługu­
jąc się metodą Gospera powinniśmy wyliczyć wartość
k
dla dowolnego, ustalonego n. Szukamy zatem sumy nieoznaczonej wyrazów
k! ( n - k ) ! '
W etapie 1 przedstawiamy iloraz składników w wymaganej postaci (5.117).
Otrzymamy
t ( k + 1)
k -n
t(k)
” k+1
Dlaczego r(k)
nie równa się
k+1 ?
Och! Rozumiem.
”
p ( k + 1 )q(k)
p(k)r(k + 1 ) ’
stąd p(k) = 1, q(k) = k —n i r(k) = k. Ten wybór p, q i r spełnia warunek
(5.118), chyba że n jest ujemną liczbą całkowitą. Przypuśćmy, że nie jest.
Teraz etap 2. Zgodnie z równością (5.124), powinniśmy rozważyć wielo­
miany Q(k) = —n i R(k) = 2k —n. Ponieważ R jest większego stopnia niż Q,
musimy rozważyć dwa przypadki. Albo d = deg(p) — deg(R)+ 1, które jest
równe 0, albo d = —2A'/A, gdzie A' = —n i A= 2, stąd d= n. Pierwszy
przypadek jest przyjemniejszy, ponieważ nie wymaga, żeby n było dodat­
nią liczbą całkowitą. Zatem pójdźmy wpierw tą drogą. Będziemy zmuszeni
sprawdzić drugą możliwą wartość dla d tylko wtedy, gdy zawiedzie pierwsza
z możliwości. Jeżeli d = 0, wartością s(k) jest po prostu ao i równanie (5.122)
redukuje się do
1 = (k —n)cxo —kao .
Stąd ao = —1/n . Wartość ta spełnia równanie i otrzymujemy
T (u _ r(k) s(k) t(k)
T(k) - — F(ió
^ _ 1) ( ^ 1)k_1 >
Jeśli n ^ O ,
odpowiedź, jaką mieliśmy nadzieję uzyskać.
Jeśli zastosujemy tę samą metodę, by odnaleźć wzór na sumę nieozna­
czoną Y ©
tym razem bez (—1)k, otrzymamy to samo, z wyjątkiem tego,
że q(k) będzie równe n —k. Zatem Q(k) = n —2k będzie większego stopnia
niż R(k) = n, i wnioskujemy, że d ma niemożliwą wartość deg(p) —deg(Q) =
—1. (Wielomian s(k) nie może być ujemnego stopnia, ponieważ nie może
być tożsamościowo równy zeru.) Dlatego funkcja (£) nie jest sumą wyrazów
hipergeometrycznych.
Jednakże, gdy wyeliminujemy to co niemożliwe, wówczas to co pozo­
stanie— chociaż nieprawdopodobne — musi być prawdziwe (według S. Hol­
mesa [84]). Kiedy zdefiniowaliśmy p, q i r w etapie 1 , zdecydowaliśmy zigno­
rować możliwość, że rt może być ujemną liczbą całkowitą. A jeśli jest? Niech
rt = —N, gdzie N jest liczbą dodatnią. Wtedy iloraz składników
(£) ók
jest równy
t(k+1)
t(k)
- ( k + N)
( k + 1)
p(k+1)
q (Tc)
p(k) r(k + 1 )
i zgodnie ze wzorem ( 5 . 1 1 9 ) powinien być reprezentowany przez wielomiany
p(k) = (k + 1)N_1, q(k) — —1, r(k) = 1. W etapie 2 algorytmu Gospera
szukamy wielomianu s(k) stopnia d = N — 1. Może nam się to uda. Jeżeli
na przykład N = 2, to z rekurencji ( 5 . 1 2 2 ) wynika, że powinniśmy rozwiązać
równanie
k+1
= —( ( k + 1 )oc-\ + ao) — (koti + oco).
Po przyrównaniu współczynników przy k i 1 uzyskamy układ równań
1
= —oci - o c 1 ;
1
—
OC] - oco - oc0)
zatem rozwiązaniem jest s(k) = —j k — \ i
'- 2
1- ( - ł * - 1) ■ (V )
T«
,
------- ----------- I-')
4
Czy jest to szukana suma? Tak! Sprawdźmy to:
_ 1 )lc2 k + 3 _ ( _ i )k_ 1 21c+2 = (_ 1 )ie( k + 1 )
(-* )■
Nawiasem mówiąc, możemy zapisać ten wzór sumacyjny w innej postaci
przez dołączenie górnego ograniczenia:
~2\ =
v
*k /
k<m
1 m
4
0
m—1
2
= ( - 1)
2
\
m—1 m
2
„Genialne,
Holmesie!”
„Elementarne, mój
drogi Watsonie
Reprezentacja ta ukrywa fakt, że (~j^) jest sumowalne za pomocą wyrazów hi­
pergeometrycznych, ponieważ fm / 2 ] nie jest wyrazem hipergeometrycznym.
(Zobacz ćwiczenie 1 2 .)
Problem pojawia się w mianowniku wzoru ( 5 . 1 2 1 ) jeśli p(k) = 0 dla
pewnych liczb całkowitych k. Ćwiczenie 97 daje nam pewne pojęcie o tym,
co można zrobić w takich sytuacjach.
Zauważmy, że nie musimy się kłopotać katalogiem sum nieoznaczonych
wyrazów hipergeometrycznych, analogicznym do bazy sum hipergeometrycz­
nych wspomnianej wcześniej w tym rozdziale, ponieważ algorytm Gospera
dostarcza nam szybkiej, jednolitej metody działającej we wszystkich sumowalnych przypadkach.
Marko Petkovśek [292] uogólnił algorytm Gospera dla bardziej skompli­
kowanego problemu odwracania, pokazując, jak należy wyliczyć składniki
hipergeometryczne T(k), które spełniają rekurencję l-tego rzędu
t(k) = p l (k)T(k+t) + . . - + p 1 ( k ) T ( k + l ) + p 0 (lc)T(k),
(5 .1 2 5 )
gdzie dany jest składnik hipergeometryczy t(k) i wielomiany p i ( k ) , . . . ,pi (k),
PoM-
5.8. Sum ow anie m echaniczne
Algorytm Gospera, jakkolwiek piękny, znajdzie nam postać zwartą tylko nie­
wielu sum ze współczynnikami dwumianowymi Newtona. Ale nie poprze­
staniemy na nim. Doron Zeilberger [384] pokazał, jak rozszerzyć algorytm
Gospera tak, by można go było zastosować do ogromnej liczby sum. Dzięki
rozszerzeniu Zeilbergera poradzimy sobie nie tylko z częściowymi sumami,
lecz również z sumowaniem względem wszystkich k. Stąd mamy alternatywę
dla hipergeometrycznych metod podrozdziałów 5.5 i 5.6. Co więcej, tak jak
w oryginalnym algorytmie Gospera obliczenia mogą być dokonane prawie na
ślepo przez komputer. Nie musimy więc polegać na własnych zdolnościach i
szczęściu.
Pomysł polega na tym, że uważamy składnik, który chcemy sumować,
za funkcję t(n ,k ) dwóch zmiennych n i k. (W algorytmie Gospera pisali­
śmy po prostu t(k).) Zeilberger zauważył, że gdy t(n ,k ) nie jest nieskończe­
nie sumowalne względem zmiennej k za pomocą wyrazów hipergeometrycz­
nych— prawdę mówiąc dla niewielu przypadków jest— możemy zmodyfiko­
wać t(rt,k) tak, by uzyskać inny nieskończenie sum owalny składnik. Na
przykład, często okazuje się w praktyce, że |3o(n)t(n,k) + |3i(n )t(n + l ,k)
jest dla odpowiednich wielomianów Po(n) and |3i(n) nieskończenie sumo­
walne względem zmiennej k. Gdy wyliczymy sumę względem k, otrzymamy
rozwiązującą nasz problem rekurencję względem n.
.261
Sum ow anie m ech an iczn ej
By zapoznać się z ogólną metodą, zacznijmy od prostego przypadku.
Załóżmy, że nie znamy wzoru dwumianowego i chcemy wyliczyć
(£) zk.
Jak moglibyśmy odkryć odpowiedź bez daru jasnowidzenia lub natchnionego
przepowiadania? Wcześniej w tym rozdziale, na przykład w zadaniu 3 pod­
rozdziału 5.2, dowiedzieliśmy się, jak zastąpić (£) przez
+ (£Z]) i jak
wykorzystać ten wynik. Istnieje jednak bardziej systematyczna metoda po­
stępowania.
Niech t(n ,k ) = (£) zk będzie wielkością, którą chcemy sumować. Z al­
gorytmu Gospera wiemy, że z wyjątkiem przypadku z = —1 nie możemy
wyliczyć dla dowolnego rt sumy częściowej L k^m t(n ,k ) za pomocą hiper­
geometrycznych składników. Rozważmy, w zamian, bardziej ogólną postać
t(n ,k ) = p 0 (n )t(n ,k ) + Pt (n ) t ( n + 1 , k ) .
( 5 *1 2 6 )
Będziemy szukać wartości po(n) i Pi (tl), dzięki którym skutecznie zastosu­
jemy algorytm Gospera. Wpierw uprośćmy równość ( 5 . 1 2 6 ), korzystając ze
związku pomiędzy t ( n + 1 , k) i t(n , k) tak, by usunąć t ( n + 1 , k) z wyrażenia.
Ponieważ
t(n + 1 , k) _
t(n ,k )
(n + 1 )!zk ( n - k ) ! k !
( n + 1 —k)!k!
n !z k
n +1
n +1 - k ’
otrzymujemy
t(n ,k ) = p (n ,k )
t(n , k)
n + 1-k ’
gdzie
p(n,k) = ( n + 1 —k)Po(n) + ( n + 1 ) P i ( n ) .
Zastosujmy teraz algorytm Gospera do t(n,k), gdzie n jest ustaloną liczbą,
i podobnie jak we wzorze ( 5 . 1 1 7 ) napiszmy
t ( n , k + 1) = p ( n , k + 1) q(n,k)
t(n,k) p(n,k) r ( n , k + 1) '
Metoda Gospera powinna znaleźć odpowiednie wielomiany zaczynając od
p (n, k) = 1, ale zgodnie z pomysłem Zeilbergera lepiej jest zacząć od p(n, k) =
p(n,k). Zauważmy, że jeśli podstawimy t(n,k) = t ( n, k) /p (n ,k ) i p(n,k) =
p( n, k)/ p( n, k) , to równanie ( 5 . 1 2 7 ) będzie równoważne równości
t ( n , k + 1) = p ( n , k + 1) q(n,k)
t(n,k) p(Tv,k) r ( n , k + 1)"
Lub bez zaglądania
na stronę 202.
Zatem możemy znaleźć p, q i r spełniające równanie ( 5 . 1 2 7 ) przez znalezienie
p, q i r spełniających równość ( 5 . 1 2 8 ), rozpoczynając od p(rt, k) = 1. Uprości
nam to życie, gdyż t(n , k) nie zawiera nieznanych wielkości |3o(n) i |3i (rt),
które pojawiają się w t(n , k). W naszym przypadku t(n ,k ) = t ( n , k ) / ( n +
1 —k) = rt! zk/ ( n + 1 —k )! k!, zatem uzyskujemy
t(n , k + 1)
(rt + 1 —k) z
t ( n ,k )
=
k+1
’
Tym razem
pamiętam, dlaczego
r(n, k) nie jest
równe k + 1 .
czyli możemy przyjąć, że q(n,k) = (n + 1 —k)z i r(n,k) = k. Zakładamy,
że te wielomiany zmiennej k spełniają warunek ( 5 . 1 1 8 ). W przeciwnym ra­
zie moglibyśmy usunąć czynniki z q i r i dołączyć odpowiednie czynniki
( 5 . 1 1 9 ) do p(n,k). Powinniśmy tak uczynić tylko wtedy, gdy wartość oc — [3
w warunku ( 5 . 1 1 8 ) jest dodatnią liczbą całkowitą niezależną od n, ponieważ
chcemy, by nasze wyliczenia były prawidłowe dla dowolnego n. (Jeśli użyjemy
uogólnionej silni ( 5 .8 3 ), to wyprowadzane przez nas wzory będą prawdziwe,
nawet gdy rt i k nie będą liczbami całkowitymi.)
Nasz pierwszy wybór wielomianów q i r spełnia warunek ( 5 . 1 1 8 ), zatem
możemy przejść do etapu 2 algorytmu Gospera. Chcemy rozwiązać odpo­
wiednik równości ( 5 . 1 2 2 ), korzystając ze wzoru ( 5 . 1 2 7 ) zamiast z równania
( 5 . 1 1 7 ). Chcemy zatem rozwiązać równanie
P(n,k) = q ( n , k ) s ( n , k + 1 ) —r(n, k)s(n,k)
( 5 -1 2 9 )
gdzie
s(rt, k) = a d(rt)kd + ad - 1 (rt)k d_1 H-------hao(n)
( 5 -3-3 0 )
jest nieznanym wielomianem. (Współczynniki wielomianu s nie są stałymi,
lecz są funkcjami zmiennej n.) W naszym przypadku równanie( 5 . 1 2 9 ) przy­
biera postać
( n + 1 - k J P o M + fn + I J M n )
= ( n + 1 —k ) z s ( n , k + 1) —k s ( n , k ) ,
Stopień funkcji
deg(Q) odpowiada
tutaj stopniowi
wielomianu
zmiennej k.
Traktujemy n jako
stałą.
i uważamy je za równość wielomianów zmiennej k, gdzie współczynniki tych
wielomianów są funkcjami zmiennej n. Jak poprzednio, ustalamy stopień d
wielomianu s przez porównanie stopni wielomianów Q(n,k) = q(n,k) —
r(n,k) i R(n,k) = q(n,k) + r ( n , k ) . Ponieważ deg(Q) = deg(R) = 1 (zakła­
damy, że
±1), otrzymujemy d — deg(p) —deg(Q) = 0 i s(n,k) = <xo(n)
jest niezależne od k. Nasze równanie przybiera postać
(n + 1 —k)Po(n) + (n + 1)|3i (n) = (n + 1 —k )zao(n) —k a 0 ( n ) ;
i po przyrównaniu współczynników przy k i 1 otrzymamy wolny od k układ
równań
( r t + 1) po(n) + (n + 1) 0 i (n) - ( n + 1)zcx0 ( n ) = 0 ,
- ( 30(ti)
+ ( z + 1)cxo(n)= 0 .
Zatem mamy rozwiązanie równania (5.129), gdzie
|3o(n) = z + 1 ,
Pi(rt) = —1 ,
cxo(n) = s(n ,k ) = 1 .
(Przypadkiem pozbyliśmy się n.)
Odkryliśmy, czysto mechaniczną metodą, że t(n ,k ) = (z + 1)t(n,k ) —
t ( n + 1, k) jest sumowalnym hipergeometrycznym składnikiem. Innymi słowy,
t ( n , k ) = T ( n , k + 1) — T ( n , k ) ,
(5-131)
gdzie T (n, k) jest hipergeometrycznym składnikiem zmiennej k. Czemu jest
równe T (n,k)? Zgodnie z równościami (5.121) i (5.128) uzyskujemy
,
' ( a
w
. y
i
,
r(„ ik|J(„ ik ]; |n i k |i
( M ia )
p (n , kj
ponieważ p (n ,k ) = 1. (Rzeczywiście, p(n, k) prawie zawsze w praktyce oka­
zuje się być równe 1.) Zatem
k
.,
^
k
A i\ v
T(* ' k) = ^ T T ^ t ( n 'k) =
/
n \
) zK = U - i . , z
k
•
Dla pewności, sprawdźmy— równanie (5.131) jest prawdziwe:
n\
v
(z+1)W z
A i+A
l
ic
r
v
k+1
= Ur
(
n
U -ir
■
Tak naprawdę, to nie potrzebujemy znać dokładnej wartości T(rt,k),
ponieważ zamierzamy sumować t(n, k) względem wszystkich liczb całkowi­
tych k. Wystarczy nam wiedzieć, że gdy n jest dowolną ustaloną nieujemną
liczbą całkowitą, wtedy T(n,k) jest niezerowe tylko dla skończonej liczby
wartości k. Suma T (n, k + 1) —T (rt, k) po wszystkich k musi się zredukować
do 0.
Niech Sn = ^ t f n , k) = ^Tk (k)z k. Jest to suma, od której zaczęliśmy
nasze rozważania. Jesteśmy teraz gotowi ją policzyć, ponieważ dużo wiemy
o t(n ,k ). Z metody Gospera-Zeilbergera wnioskujemy, że
^ ( ( z + 1) t( n ,k ) —t ( n + 1,k)) = 0 .
W rzeczywistości
lim T(n,k) = 0 ,
k—>00
gdy |z| < 1
i n jest dowolną
liczbą zespoloną.
Zatem wzór (5 . 133)
jest prawdziwy dla
wszystkich rt
i w szczególności
Sn = (z + 1 ) n ,
gdzie rt jest
ujemną liczbą
całkowitą.
Ta suma spełnia równość (z+ 1) ^ k
Zatem otrzymujemy
k )~ 21 k t f a + l , k) = (z+1 )Sn —Sn+i .
Sn+i = ( z + l ) S n .
(5 .1-33 )
Aha! Jest to rekurencją, którą wiemy jak rozwiązać, jeśli znamy So- Oczy­
wiście So = 1. Zatem wnioskujemy, że Sn = (z + l ) n dla wszystkich liczb
całkowitych rt ^ 0, QED.
Przyjrzyjmy się ponownie przeprowadzonym rachunkom i podsumujmy
nasze dokonania w postaci, którą możemy zastosować do innych składników
t(n,k). Algorytm Gospera-Zeilbergera dla danego t(n,k) można sformuło­
wać następująco:
0. Niech l := 0. (Szukamy rekurencji rzędu l względem zmiennej rt.)
1. Niech t(n,k) = |3o(rt)t(rt,k) H------- (- pifrtjtfrt + l,k), gdzie 0o(n), . . . ,
Pi (u) są nieznanymi funkcjami. Użyjmy własności t(rt,k), by znaleźć
liniową kombinację p(rt,k) wielomianów Po(tv), . . . , Pi(rt), której współ­
czynniki są wielomianami zmiennych n i k. Stąd t(rt,k) zapiszemy w po­
staci p(n,k)t(n, k), gdzie t(rt, k) jest hipergeometrycznym składnikiem
zmiennej k. Znajdujemy wielomiany p(rt,k), q(n,k), r(n,k) takie, że
iloraz składników t(rt,k) jest postaci ( 5 . 1 2 8 ), gdzie q(rt,k) i r(rt,k) speł­
niają warunek Gospera ( 5 . 1 1 8 ). Podstawiamy p(rt, k) = p(rt,k)p(rt,k).
2 .a) Niech dQ := deg(q - r), dR := deg(q + r) i
d :=
2 .b) Jeśli
f deg(p) - dQ,
\ deg(p) - dR + 1 ,
gdy dQ ^ dR;
gdy dQ < dR.
d ^ 0, to zdefiniujmy s(rt, k) wzorem ( 5 . 1 3 0 ) i rozważmy otrzy­
many przez przyrównanie współczynników przy potęgach zmiennej k w
głównym równaniu ( 5 . 1 2 9 ) liniowy układ równań zmiennych a o , . . . , a d ,
Po, . .. Pi- Jeśli te równania mają rozwiązanie, w którym nie wszystkie
P o , . . . , P i są zerami, przejdźmy do kroku 4. W przeciwnym razie jeśli
dę> < dR i —2A'/A jest liczbą całkowitą większą niż d, gdzie A jest współ­
czynnikiem przy kdR w wielomianie q + r, a A' jest współczynnikiem przy
k dR_1 w wielomianie q —r, to podstawiamy d := —2A'/A i powtarzamy
krok 2 b.
3. (Składnik t(rt, k) nie jest sumowalny hipergeometrycznie.) Zwiększmy l
o 1 i wróćmy do kroku 1 .
4. (Sukces.) Podstawmy T(rt, k) := r(rt,k)s(rt, k)t(rt,k)/p(rt,k). Otrzyma­
liśmy t(rt,k) = T(rt,k + 1) —T (n, k).
Udowodnimy później, że algorytm zawsze się zakończy, gdy t(rt,k) należy do
dużej klasy składników zwanych składnikami właściwymi.
Zabierzmy się teraz do tożsamości Cauchy’ego. Czy możemy za pomocą
algorytmu Gospera i Zeilbergera wywnioskować, że
k (£) (n^k) ma postać
zwartą? Rozpoczynamy algorytm od l = 0, dla której to wartości jest to pier­
wotny algorytm Gospera, i próbujemy sprawdzić, czy (£) (n^k) jest sumo­
walne za pomocą składników hipergeometrycznych. Niespodzianka: Składnik
ten jest sumowalny, gdy a + b jest specyficzną nieujemną liczbą całkowitą
(zobacz ćwiczenie 94). Jesteśmy jednak zainteresowani ogólnymi wartościami
a i b i dzięki algorytmowi szybko odkryjemy, że nieskończona suma nie jest
składnikiem hipergeometrycznym. Zatem powiększamy l z 0 do 1 i próbu­
jemy zastosować algorytm do t(n,k) = Po(n)t(n,k) + pi ( n ) t ( n + l,k). Na­
stępnie zapiszemy, podobnie jak w wyprowadzeniu wzoru dwumianowego, że
t(ri,k) = p (n,k)t( n, k) , gdzie p(n,k) otrzymaliśmy po wyrzuceniu wspól­
nych czynników z t(n + 1 , k )/t(n , k ). W tym przypadku— czytelnik jest pro­
szony o sprawdzenie samemu wszystkich obliczeń— nie są one tak trudne na
jakie wyglądają, wszystko wykonujemy w podobny sposób, lecz tym razem
uzyskujemy
p(n,k) = (n + 1 —k)Po(n) + (b —n + k)Pi(n) = p ( n , k ) ,
t(n,k) = t (n ,k )/ (n + 1—k) = a!b!/(a-k)!k! (b-n+k)! (n + 1- k ) ! ,
q(n,k) = (tl + 1 — k)(a — k ) ,
r(n,k) = (b —n + k)k.
W etapie 2 a otrzymujemy, że deg(q —r) < deg(q + r ) i d = deg(p) —deg(q +
r) + 1 = 0, zatem s(n,k) jest znowu niezależne od k. Podstawowe równanie
Gospera ( 5 . 1 2 9 ) jest równoważne układowi dwóch równań z trzema niewia­
domymi,
( n + l ) p 0 (n) + ( b - r t ) P i ( n )
— Po (ti)
- (rt + 1 ) a a 0 (n )= 0 ,
+ P i(rt) + (a + b + 1)cxo(ti)= 0,
który ma rozwiązanie
Po(n) = a + b —n ,
pi (rt) = —n —1,
oc0{n) = 1.
Stąd (a + b —n )t(n , k) —(rt + 1 ) t(rt + 1 , k) jest sumowalne względem k, czyli
jeśli Sn = ]Tk (k) (n^k)j to spełniona jest rekurencją
_ a + b -rt
- —n + -j..
Ponieważ So = 1, więc Sn = (a^b)- Kaszka z mlekiem.
Co możemy powiedzieć o równości Saalschiitza (5 .2 8 ) z trzema współ­
czynnikami dwumianowymi? Dowód wzoru ( 5 .2 8 ), który znajdziemy w ćwi­
czeniu 43, jest interesujący, lecz wymaga natchnienia. Spróbujmy spraw­
dzić, czy metoda Gospera-Zeilbergera pomoże nam znaleźć i udowodnić wzór
( 5 .2 8 ) w czysto mechaniczny sposób. Dla wygody podstawmy m = b + d,
Istotne jest to, że
algorytm GosperaZeilbergera zawsze
prowadzi do układu
równań liniowych z
nieznanymi liczbami
oc i p , ponieważ
lewa strona
równości (5-i2g)
jest liniowa
względem liczb P,
a prawa względem
liczb oc.
n = a, r = a + b + c + d, s = a + b + c, stąd wzór ( 5 .2 8 ) przybierze bardziej
symetryczną postać
(a + b + c + d + k)!
k)! (b —k )! (c + k )! ( d + k )! k!
Zadecydowanie,
którą ze zmiennych
nazwać n, jest
jedyną
niemechaniczną
czynnością.
(a + b + c + d)!(a + b + c)!(a + b + d)!
a! b! (a + c)! (a + d)! (b + c)! (b + d)!
( 5 -1 3 4 )
Aby suma była skończona załóżmy, że a lub b jest nieujemną liczbą całkowitą.
Niech t ( n ,k ) = (n + b + c + d + k )! /( n —k)! (b —k)! (c + k)! (d + k)!k!
i t( n ,k ) = P o (n )t(n ,k ) + P i ( n ) t ( n + l,k ) . Postępując w już dobrze nam
znany sposób, podstawiamy
p (n ,k ) = (rt + 1 -k)P o(T t) + ( r t + 1 + b + c + d + k ) p 1 (n) = p ( n , k ) ,
i^ _
"t(n, k)
^
(n + b + c + d + k)!
i n ’ J “ n + 1 - k “ (n + 1 - Tc)! (b - k)! (c + k)! (d + k)! k! ’
q (n ,k ) = (n + b + c + d + k + 1 ) ( n + 1 —k)(b —k ) ,
r( n ,k ) = (c + k)(d + k)k
Zauważmy, że A'
nie jest głównym
współczynnikiem
wielomianu Q,
chociaż A jest
głównym
współczynnikiem
wielomianu R.
W wielomianie Q
liczba A' jest
współczynnikiem
^deg(R)—1
i próbujemy rozwiązać równanie ( 5 . 129 ) dla s (n ,k ). Znowu deg(q — r) <
deg(q + r), ale tym razem deg(p) —deg(q + r) + 1 = —1 . Jednakże, w kroku
2 b możemy wybrać jako stopień wielomianu s liczbę d = —2A'/A. Zanim
się poddamy, spróbujmy pójść tą drogą. Teraz R(n,k) = q (n ,k ) + r ( n ,k ) =
2k 3 H-----, zatem A = 2, podczas gdy wielomian Q (n ,k ) = q (n ,k ) —r ( n ,k )
prawie cudownie okazuje się stopnia 1 względem zmiennej k — współczynnik
przy k 2 znika! Dlatego A' = 0 i możemy podstawić d = 0 i s(n, k) = oco(n).
Wystarczy teraz rozwiązać układ równań
(n + 1 ) Po (tl) + (n + 1 + b + c + d)pi (n)
— (n + 1 ) ( n + 1 + b + c + d)b ocq(n) = 0 ,
- P o ( n ) + P i(n )
— ((n + 1)b — (n + 1 + b) (n + 1 + b + c + d) —cd) ocq(n) = 0 .
A oto wynik:
Po (ti) — ("rt + 1 + b + c)(n + 1 + b + d )(n + 1 + b + c + d ),
Pi (*rt) — —(n + 1 ) (n + 1 + c) (n + 1 + d ) ,
oto (t^) = 2 n + 2 + b + c + d .
Bezpośrednio z tego wynika równość ( 5 . 134 ).
Uzyskamy podobny dowód równości ( 5 . 134 ), jeśli podstawimy n = d
zamiast n = a. (Zobacz ćwiczenie 99.)
Podejście Gospera-Zeilbergera pozwala nam przekształcać sumy okre­
ślone zarówno dla ograniczonego, jak i dla całego zakresu k. Rozważmy sumę:
Sn(z) = Y . f U V k) z k '
(5-135)
k=0
Gdy z = j , otrzymamy „nieoczekiwany” wzór ( 5 .2 0 ). Czy Gosper i Zeilberger
mogliby go oczekiwać? Po podstawieniu t(n , k) = (nkk)z k dojdziemy do
równań
p(n,k) = (n + 1) |30 (rt) + (n + 1 +k)|3i (n) = p ( n ,k ) ,
t(n,k) = t ( r t , k ) / ( n + 1 ) = (rt + k)!zk/k! (rt+ 1 )!,
q(n,k) = ( n + 1 + k ) z ,
r(n,k) = k,
i deg(s) = deg(p) — deg(q — r) = 0. Rozwiązaniem równania ( 5 . 1 2 9 ) jest
Po(tl) — 1, Pi (n) = z — 1, s(n,k) = 1. Zatem
t(n , k) + (z — 1 )t(rt + 1,k) -
T(n,k + 1) —T ( n , k ) ,
( 5 *1 3 6 )
gdzie T(n,k) = r t r t j k J s t ^ k J t ^ k J / p ^ k ) = ( k^^)zk. Dla 0 ^ k
teraz możemy wysumować ( 5 . 1 3 6 ). Uzyskamy
Sn (z) + t ( n , n + 1) + ( z - 1)Sn+ 1 (z)
rt + 1
T (rt, rt + 2) - T (rt, 0 )
= C ::? y2
- < 2nn+ > “ł i Ale t ( n , n + 1) = C^
1) ^
1 =
(2nn+1) zn+’ >st3d
Sn +1 (z) = T- ^ ( S n ( z ) + ( 1 - 2 z ) ( 2 n + 1 ) Z’l+ 1j .
(5*137)
Dostrzegamy natychmiast, że z = \ jest szczególnym przypadkiem oraz że
Sn + 1 [■%) = 2Sri{ j ). Co więcej, rekurencją ( 5 . 1 3 7 ) może być uproszczona przez
zastosowanie czynnika sumacyjnego (1 —z ) 71+1 po obu stronach równania. To
prowadzi nas do ogólnej tożsamości
c i ("t'
> “=1-leii (?)w
k=0 v
7
k=l
v
7
■ <B«8)
której stosunkowo niewielu ludzi mogło oczekiwać, zanim zajęli się nią Gosper
i Zeilberger. Teraz produkcja takich tożsamości jest rutynowa.
Co powiemy o podobnej sumie
S n (z) =
X .
k) zk ’
k= 0 '
'
(5-139)
na którą się natknęliśmy we wzorze (5 .74 )? Ufając w swe siły, podstawiamy
t(n,k) = (nkk)zk i zaczynamy rachunki
p(n,k) =
t(n,k) =
q(n,k) =
r(n,k) =
Sn (—J) równa się
(n + 1 )/ 2 n .
(n + 1 - 2 k)p 0 (n) + (n + 1 - k) Pi ( n ) = p(n,k),
t(n ,k )/(n + 1 —2 k) = (n —k)! zk/k! (n + 1 —2 k)!,
(n + 1 —2 k)(n —2 k)z,
(n + 1 —k)k.
Zaraz, zaraz — nie można rozwiązać równania (5 .129 ), jeśli założymy że
—^, ponieważ stopień wielomianu s będzie równy deg(p) —deg(q —r) = —1 .
Żaden problem. Dodajmy po prostu parametr p2 (n) i spróbujmy w za­
mian t(n, k) = Po (n)t(n, k) + p 1 (n)t(n + 1 , k) + p2 (n)t(n + 2 , k):
p(n,k) = (n + 1 —2 k)(n + 2 —2 k)po(n)
+ (n + 1 —k)(n + 2 —2k)Pi(n)
+ (n + 1 —k )(n + 2 —k )P i(n ) = p ( n , k ) ,
t( n ,k ) = t ( n , k ) / ( n + 1 —2 k )(n + 2 —2k) = (n —k)! zk/k ! (n + 2 —2 k )!,
q (n ,k ) = (n + 2 —2 k ) ( n + 1 —2k)z,
r ( n ,k ) = ( n + 1 —k )k .
Niech teraz s(n, k) = cto(n) i rozwiązaniem równania (5 .129 ) jest:
Po(n) = z,
Pi(n) = 1 ,
p2 (n) = -1 ,
cx0 (n) = 1 .
Odkryliśmy, że
zt(n, k) + t(n + 1 , k) —t(n + 2 , k) = T(n, k + 1 ) —T(n, k ),
gdzie T(n,k) równa się r(n,-k)s(n,k)t(n,k)/p(n,k) = (n + 1 —k)kt(n,k) =
(TLk^yk)zk. Sumując od k = 0 do k = n, otrzymamy
zSn (z) + (Sn+1 (Z) - (n° ,)zn+') - (Sn+2(Z) - (n+2)z n + 2 - (n+,)zn+')
= T( n, n+ 1) —T(n,0).
Zatem dla wszystkich n ^ 0 zachodzi (n+ 1)z n+1 = (°)z u+1 = T( n, n+ 1),
skąd uzyskujemy
Sn+2 (z) = S-a-f-i (z) + zSrt(z),
n ^ 0.
(5 *140 )
Zajmiemy się rozwiązaniem takich rekurencji w rozdziałach 6 i 7. Metody
z tych rozdziałów prowadzą nas bezpośrednio od ( 5 . 1 4 0 ) do postaci zwartej
( 5 .7 4 ), gdzie S0 (z) = S, (z) = 1.
Jeszcze jeden przykład— bardzo znany— dopełni obrazu. Francuski ma­
tematyk Roger Apery rozwiązał w roku 1978 długo nie rozwiązany problem,
gdy udowodnił, że liczba C(3) = 1 + 2 - 3 + 3 - 3 + 4 ~ s H-----jest niewymierna
[14]. W jednej z głównych części jego dowodu znajdowały się sumy ze współ­
czynnikami dwumianowymi
a-
l
C H T ) 1-
< ->
Apery podał dla tych sum wzory rekurencyjne, których żaden inny matema­
tyk nie był w stanie w tym czasie sprawdzić. (Od tego czasu liczby An są
znane jako liczby Apery’ego. Wiemy, że Ao = 1, Ai = 5, A 2 = 73, A 3 = 1445,
A ą = 33001.) W końcu [357] Don Zagier i Henri Cohen znaleźli dowód hipo­
tezy Apery’ego. Pomysły zawarte w ich dowodzie tej szczególnej (lecz trud­
nej) sumy doprowadziły Zeilbergera do odkrycia przedstawionej przez nas
metody.
Do tej pory, w rzeczywistości, widzieliśmy już dość przykładów, by suma
( 5 .1 4 1 ) wydała się nam trywialna. Po podstawieniu t(n,k) = ( £ ) 2 ( n £ k ) 2
i t(n,k) = |30 (n )t(n ,k ) + 0 i ( n ) t ( n + l ,k) + £ 2 (11)t(n + 2 ,k), próbujemy
rozwiązać równanie ( 5 . 1 2 9 ), gdzie
p(n,k) = ( n + 1 —k)2(n + 2 - k ) 2|30(n)
+ ( n + 1 + k ) 2(n + 2 - k ) 2 |3i(n)
+ (n + 1 + k)2(n + 2 + k)202(n) = p(n,k),
t(n,k) = t ( n ,k ) / ( n + 1—k)2(rt+2—k)2 = (ri-|-k)!2/k!4 (ri+2—k)!2 ,
q(n,k) = ( n + 1 + k)2(n + 2 - k )2 ,
r(n,k) = k4 .
(Nie martwmy się o to, że w q występuje czynnik (k + n + 1), podczsis gdy w
r znajdziemy czynnik k. Nie psuje to warunku ( 5 . 1 1 8 ), ponieważ u uważamy
za zmienną, a nie stałą liczbę.) Ponieważ q(rt,k) — r(n,k) = —2k 3 + • • •,
możemy podstawić deg(s) = —2A'/A = 2, zatem
s(n,k) = a 2(rt)k2 + ai (r t ) k + a 0( n ) .
Przy takim wyborze s, rekurencją ( 5 . 1 2 9 ) sprowadza się do układu pięciu rów­
nań z sześcioma niewiadomymi Po(ti), Pi(n), P2 (n), ao(n), ai (n ), a 2 (n).
Na przykład, po porównaniu współczynników przy k° otrzymamy równanie
Po + Pi + |32 - cx0 - ai - cx2 = 0 ;
(Najpierw
próbowaliśmy nie
używać $ 2, a/e się
nie udało.)
a po porównaniu współczynników przy k4 otrzymamy
Po + Pi + 02 + ft-i + (6 + 6n + 2n2)oc2 = 0.
Pozostałe trzy równania są bardziej skomplikowane. Istotne jest to, że te li­
niowe równania— podobnie jak wszystkie równania uzyskane za pomocą al­
gorytmu Gospera-Zeilbergera— są. jednorodne (ich prawe strony są równe 0).
Zatem zawsze istnieje niezerowe rozwiązanie. Rozwiązaniem w naszym przy­
padku będzie
3 o(n) = ( n + 1 ) 3 ,
P i(n ) = —(2n + 3 )(17u 2 + 51n + 39),
|32(n) = (n + 2 )3 ,
ao(n) = —16(n + 1)(n + 2)(2n + 3 ),
a i(n ) = —12(2n + 3) ,
0C2{n) — 8(2n + 3 ).
Zatem
( n + l ) 3t(n ,k ) — (2n + 3)(17n 2 + 51n + 39)t(n + 1,k)
+ (n + 2) 3 t(n + 2, k) = T ( n , k + 1 ) —T(tL,k),
„Profesor
Littlewood, kiedy
używa tożsamości
algebraicznej,
zawsze zaoszczędza
sobie kłopotu jej
dowodzenia.
Zakłada, że
tożsamość, jeśli jest
prawdziwa, może
być sprawdzona
w kilku wierszach
przez każdego, kto
czuje potrzebę jej
zweryfikowania.
Moim celem jest
zaprzeczyć temu
przekonaniu.”
F. J. Dyson [89]
gdzie T(n,k) = k4 s(n,k)t(n,k) = (2 n + 3 )( 8 k 2 — 1 2 k — 16(n + 1 ) (n + 2 )) x
(n+k) !2/ ( k —1) !4 (n + 2 —k) !2. Sumując po k otrzymamy „nieprawdopodobną”
rekurencję Apery’ego
(n + 1)3An + (n + 2)3A-a+2 — (2n + 3)(17n 2+ 51n + 39)ArL+i . (5.142)
Czy metoda Gospera-Zeilbergera jest skuteczna dla wszystkich sum na­
potkanych w tym rozdziale? Nie. Nie można jej zastosować, gdy t(n,k) jest
wyrazem (£) (k + 1 ) k_1 (n — k + 1 ) n - k - ' 1 we wzorze ( 5 .6 5 ), ponieważ iloraz
składników t(n , k + 1)/t(n , k) nie jest funkcją wymierną zmiennej k. Zawodzi
również w takich przypadkach, jak t(n , k) = (k)n k, ponieważ iloraz skład­
ników t(n + 1 , k)/ t(n, k) również nie jest funkcją wymierną zmiennej k. (Tę
sumę możemy uzyskać, gdy wpierw wysumujemy (£)zk, a potem podstawimy
z = n .) Metoda ta również zawodzi w stosunkowo łatwych przypadkach, jak
t(n,k) = 1 / ( n k + 1 ), nawet gdy t ( n , k + 1 )/ t( n, k) i t ( n + 1 ,k)/ t(n, k) są
wymiernymi fukcjami zmiennych n i k (zobacz ćwiczenie 107).
Jednak algorytm Gospera-Zeilbergera zapewnia sukces w ogromnej licz­
bie przypadków. Mianowicie zawsze wtedy, gdy składnik t(n , k) jest tak zwa­
nym składnikiem w łaściw ym — składnikiem, który możemy zapisać w po­
staci
u
^
u
, J a m + a j k + a ," ) ! . . . (apn + a £ k + a £ ) !
t ( n ’k) = ^n> ^ (bi n + b jk + b " )! . . . (bqn + b 'k + b " ) ! W Z ’ (5'14S)
We wzorze tym f(n,k) jest wielomianem zmiennych n i k, współczynniki
a i, a j , . . . , ap, ap, bi, bj, . . . , b q, b£, są specyficznymi całkowitymi sta­
łymi, parametry w i z są niezerowe, a wielkości aj', . . . , a " , b", . . . , b" są
dowolnymi liczbami zespolonymi. Udowodnimy, że kiedykolwiek t(n , k) jest
składnikiem właściwym, wówczas istnieją wielomiany Po(rt), . . . , |3i(rt), nie
wszystkie równe zeru, i istnieje składnik właściwy T(n,k), taki że
Po(Ti)t(n,k) H-------h Pi(rt)t(n + l,k) = T ( n , k + 1) —T ( n , k ) .
(5 . 1 4 4 )
Poniższy dowód podajemy za Wilfem i Zeilbergerem [375].
Niech N będzie operatorem zwiększającym n o 1, a K będzie operato­
rem zwiększającym k o l . Stąd na przykład N 2 K3 t(n , k) = t(n + 2, k + 3).
Zajmiemy się liniowymi operatorami różnicowymi zmiennych N, K i n , mia­
nowicie wielomianami operatorowymi postaci
1
J
H(N, K,n) =
( 5 .1 4 5 )
i=0 j=0
gdzie każde o c (rt) jest wielomianem zmiennej rt. Naszym pierwszym spo­
strzeżeniem jest następujący fakt: jeśli t(n , k) jest dowolnym składnikiem
właściwym i H(N,K,n) jest dowolnym liniowym operatorem różnicowym,
to H(N, K,n)t( n, k) jest składnikiem właściwym. Załóżmy, że t i H są dane
wzorami odpowiednio ( 5 . 1 4 3 ) i ( 5 . 1 4 5 ). Zdefiniujmy „podstawowy składnik”
wzorem
n Ł i (<UTt+ a { k + aJtai CO] + a ( J [ a { < 0 ] + a[')l
t(n , k)i j = -------------------------------- --------------------------------------- w nz k .
r i i =1 (bin + b(k + b il [bi > 0 ] + b ' J[b{ > 0 ] + b ")!
Na przykład, jeśli t(n,k) jest równe (^"k210) = (n — 2k)!/k! (rt — 3k)!, to
podstawowym składnikiem odpowiadającym liniowemu operatorowi różnico­
wemu stopni I i J jest t ( n , k ) i j = (rt—2k—2J)!/(k+J)! ( n—3k+I)!. Kluczowe
jest to, że a i >j(n)N 1KH(n, k) jest równe t ( n , k ) i j razy wielomian zmiennych
n i k, jeśli tylko O ^ i ^ I i O ^ j ^ J . Ponieważ skończona suma wielo­
mianów jest wielomianem, to H(N, K,n)t(n, k) jest w wymaganej przez nas
postaci danej wzorem ( 5 . 1 4 3 ).
W następnym kroku pokażemy, że jeśli kiedykolwiek t(n , k) jest właści­
wym składnikiem, to zawsze istnieje niezerowy liniowy operator różnicowy
H(N,K,n) taki, że
H( N, K,n)t( n, k) = 0.
Jeśli O ^ i ^ I i O ^ j ^ J , przesunięty składnik N xKU(n,k) jest równy
* t ( n , k ) i j razy wielomian zmiennych n i k o stopniu (względem zmiennej k)
Co się stanie, gdy
t(n,k) nie zależy
od n ?
równym co najwyżej
D ij — deg(f) + |ai|I + \a\\ JH-------f- |ap|I + \a^\J
+ |b1|I + |b1,|J + . .. H- |bq|I + |b;iJ.
Zatem poszukiwane H istnieje, jeśli możemy rozwiązać jednorodny układ
D i j + 1 równań liniowych z (I + 1 )(J + 1 ) zmiennymi atj (n) , o współczyn­
nikach będących wielomianami zmiennej rt. Na przykład możemy przyjąć
I = 2A' + 1 i J = 2A + deg(f), gdzie
A = |olt| H-------h|ap| + |bi|H------H b q|;
A' = lajl H-------b |a^| + |b{|H------f- |bq| .
Chwyt polega
na uznaniu H
za wielomian
zmiennej K
i zastąpieniu K
przez A + 1 .
W ostatnim kroku dowodu przechodzimy od H(N, K, n)t( n, k) = 0 do
rozwiązania równości ( 5 . 1 4 4 ). Wybierzmy H tak, by J było najmniejsze, tzn.
by H było najmniejszego stopnia względem zmiennej K. Możemy napisać
H(N,K,n) = H ( N , 1 łn ) - ( K - - 1 ) G ( N , K ł Ti)
gdzie G(N,K,rt) jest jakimś liniowym operatorem różnicowym. Załóżmy, że
H( N, 1, n) = M n ) + M n ) N + . . . + |3l (n )N l i T(n,k) = G(N, K,n)t(n, k).
Wtedy T(n,k) jest składnikiem właściwym spełniającym wzór ( 5 .1 4 4 ).
Prawie zakończyliśmy nasz dowód. Musimy jeszcze udowodnić, że opera­
tor H ( N , l , n ) nie jest operatorem zerowym. Jeśli jest, to T(rt,k) nie za­
leży od k. Wtedy istnieją wielomiany |3o(rt) i pi (rt) takie, że (po(n) +
Pi (nJNjTtrijk) = 0. Ale wtedy (Po(ti) + Pi (n)N)G(N,K, n) jest niezerowym operatorem różnicowym stopnia J — 1 zerującym t(n,k), co przeczy
minimalności J. Teraz nasz dowód równości ( 5 .1 4 4 ) jest kompletny.
Skoro już wiemy, że dla pewnego składnika właściwego T zachodzi wzór
( 5 . 1 4 4 ), możemy być pewni, że algorytm Gospera zakończy się sukcesem
i znajdzie T (lub T plus stała liczba). Chociaż udowodniliśmy algorytm
Gospera tylko dla przypadku hipergeometrycznych składników t(k) jednej
zmiennej k, nasz dowód może być rozszerzony do przypadku o dwóch zmien­
nych jak następuje: Istnieje nieskończenie wiele liczb zespolonych n, dla któ­
rych warunek (5 . 1 1 8 ) jest spełniony, gdy q(rt,k) i r(rt,k) są wielomianami
zmiennych k i dla których obliczenia z etapu 2 są identyczne z obliczeniami
algorytmu Gospera dla jednej zmiennej. Dla takich n nasz poprzedni dowód
pokazuje, że istnieje odpowiedni wielomian s(n,k) zmiennej k. Stąd istnieje
odpowiedni wielomian s(rt,k) zmiennych n i k. QED.
Udowodniliśmy, że algorytm Gospera-Zeilbergera znajdzie nam rozwią­
zanie równania ( 5 .1 4 4 ) dla możliwie najmniejszego l. W rozwiązaniu otrzy­
mujemy rekurencję zmiennej rt przekształcającą sumę względem k dla dowol­
nego składnika właściwego t(k,rt), przy założeniu, że t(rt,k) jest niezerowy
dla skończonej liczby wartości k. Role zmiennych rt i k mogą być, oczywiście,
odwrócone, ponieważ definicja właściwego składnika ( 5 . 1 4 3 ) jest symetryczna
ze względu na rt i k.
W ćwiczeniach 98-108 znajdziemy dodatkowe przykłady zastosowania
algorytmu Gospera-Zeilbergera ilustrujące jego wszechstronność. Wilf i Zeil­
berger [375] ogromnie rozszerzyli swe rezultaty, tak że możemy je stosować
do uogólnionych współczynników dwumianowych i sum wielokrotnych.
Ć w iczenia
R ozgrzew k a
1 . Czemu jest równe II 4 ? Dlaczego ta liczba jest łatwa do wyliczenia dla
osoby, która zna współczynniki dwumianowe?
2 . Niech rt będzie daną dodatnią liczbą całkowitą. Dla jakich wartości k
liczba (£) jest największa? Odpowiedź uzasadnij.
3. Udowodnij własność sześciokąta,
( r O W t r )
=
4. Oblicz (“ ^ negując górny indeks.
5. Niech p będzie liczbą pierwszą. Udowodnij, że dla 0 < k < p zachodzi
(£) mod p = 0. Co z związku z tym możemy powiedzieć o współczynniku
dwumianowym (p“ 1)?
6 . Popraw wyprowadzenie zadania 6 , z podrozdziału 5 .2 , stosując poprawnie
regułę symetrii.
7. Czy wzór ( 5 .3 4 ) jest prawdziwy również wtedy, gdy k < 0?
8 . Oblicz
ę ( k ) (- | ) k ( 1 - 1 c / u ) n '
Jaka jest przybliżona wartość sumy dla bardzo dużych u? Wskazówka:
Suma jest równa An f (0) dla pewnej funkcji f .
9 . Pokaż, że uogólnione szeregi wykładnicze zdefiniowane wzorem ( 5 .5 8 )
spełniają zależność
£ t (z) =
10.
g d y t # 0.
Pokaż, że —2(ln(1 —z) + z ) /z 2 jest funkcją hipergeometryczną.
5, Współczynniki dwumianowe
1 1 . Przedstaw obie funkcje
z3
z5
z7
sm z = z -------- 1-------------- 13!
5!
71
1 •z 3
1 •3 •z 5
1 •3 •5 •z7
arcsin z = z + — — + — — _ +
+
2-3
2-4-5
2-4-6-7
12.
(Funkcje t / T nie
są powiązane
wzorem (5 .120).)
jako szeregi hipergeometryczne.
Która z następujących funkcji zmiennej k jest zdefiniowanym w podroz­
dziale 5.7 wyrazem hipergeometrycznym? Wyjaśnij, dlaczego nim jest
lub nie jest.
a) n k.
b) kn .
c) (k! + ( k + 1 )!)/ 2 .
d) Hic tzn. j + j -i-------h
e)
f)
g)
h)
i)
V(ic)*
t(k)T(k), gdzie t i T są hipergeometrycznymi składnikami.
t(k) + T(k), gdzie t i T są hipergeometrycznymi składnikami.
t(n —k), gdzie t jest hipergeometrycznym składnikiem.
a t(k) + b t(k + 1 ) 4 - c t(k + 2 ), gdzie t jest hipergeometrycznym skład­
nikiem.
j)
pc/2].
k) k [ k > 0 ].
Podstawy
13. Znajdź związek między funkcją Pn = FTv-i k! z ćwiczenia 4.55, funkcją
Qn = T I L , v-k i iloczynem Rn = I l L o (£)•
14. Udowodnij wzór ( 5 .2 5 ) za pomocą negowania górnego indeksu w tożsa­
mości Cauchy’ego ( 5 .2 2 ). Następnie pokaż, że powtórne zanegowanie daje
wzór ( 5 .2 6 ).
15. Czemu równa się
16. Wylicz sumę
Z
2a
a+ k
(£)S(—1)k ? Wskazówka: Zobacz wzór ( 5 .2 9 ).
2b
b+ k
2c N
( - 1 )'
c + k,
gdzie a , b , c są nieujemnymi liczbami całkowitymi.
17. Znajdź prost]
prosty związek między (2n n1^2) i (2 lX2 n^2)*
18. Dla iloczynu
1/3
k
) \
2/3
k
znajdź wzór podobny do równości ( 5 .3 5 ).
19. Pokaż, że uogólnione szeregi dwumianowe ( 5 .5 8 ) spełniają równość
B t (z) =
•
20. Zdefiniujmy szereg
G
0-1 > • • • > O-m ^
( b i , . . . , bn
używając we wzorze ( 5 .7 6 ) potęg ubywających, zamiast przyrastających.
Wyjaśnij, jak są powiązane funkcje G i F.
21. Wykaż, że podana przez Eulera definicja silni jest zgodna ze zwykłą de­
finicją. Pokaż, że granica we wzorze ( 5 .8 3 ) jest równa 1/m!, gdy z = m
jest dodatnią liczbą całkowitą.
2 2 . Użyj wzoru ( 5 .8 3 ), by udowodnić równość
Przy okazji,
( - i ) ! = Vń23. Jak jest wartość F(—rt, 1;; 1)?
24. Wylicz ^Ik (m+k) (TT^kk)4 k za pomocą szeregów hipergeometrycznych.
25. Pokaż, że
GLi , d 2 , . . . , a m
t>1 >b2>
bn y
Znajdź podobną relację pomiędzy funkcjami hipergeometrycznymi
26. Przedstaw funkcję G(z)
jako wielokrotność szeregu hipergeometrycznego.
'
27. Udowodnij, że
j. / a.1 , ai + ^ , . . . , am, am + 2
\ b i , bi + 2 > • • • >
m —tl—1
t>n. + 2 ) 2
2
28. Udowodnij w zór Eulera
F
stosując dwukrotnie prawo odbicia ( 5 . 1 0 1 ) Pfaffa.
29. Pokaż, że konfluentny szereg hipergeometryczny spełnia równość
30. Jaki szereg hipergeometryczny F spełnia równanie różniczkowe zF'(z) +
F(z) = 1/(1 —z)?
31. Pokaż, że jeśli f (k) jest dowolną funkcją sumowalną za pomocą skład­
ników hipergeometrycznych, to f jest również składnikiem hipergeome­
trycznym. Jeśli np.
fM
= cF(Ai , . . . , A m ; B i , . . . , B n ; Z)* + C, to
istnieją stałe a i , . . . , a m, b i , ...., bn i z takie, że f (k) jest wielokrotnością
(5-115)32. Znajdź ][_ k 2 ók za pomocą algorytmu Gospera.
33. Użyj algorytmu Gospera, by wyliczyć ]T 6 k/( k 2 — 1).
34. Pokaż, że częściowa suma hipergeometryczną może być przedstawiona
jako granica zwykłej funkcji hipergeometrycznej:
0-1 > • • • >
b i , . . . , bn
gdzie c jest nieujemną liczbą całkowitą. (Zobacz wzór ( 5 . 1 1 5 ).) Wyko­
rzystaj ten pomysł, by wyliczyć H k<cm G ) ( - D k
Ćwiczenia domowe
35. Notacja ^ k<n (k)2k~ n jest niejasna bez znajomości kontekstu. Oblicz
tę sumę
a) jako sumę względem k;
b) jako sumę względem rt.
36. Niech m i rt będą dowolnymi nieujemnymi liczbami całkowitymi oraz p k
będzie największą potęgą liczby pierwszej p dzielącą (mTJ[n)- Udowodnij,
że k jest liczbą przeniesień, które się pojawią, gdy dodamy m do rt w
systemie liczbowym o podstawie p. Wskazówka: Zajrzyj do ćwiczenia
4.24.
37. Pokaż, że dla potęg monofonicznych zachodzi odpowiednik wzoru dwu­
mianowego:
rt
( x + d ) ł = X U h Ły— <
k
(X+ i , r = I I
gdzie rt jest nieujemną liczbą całkowitą.
38. Pokaż, że wszystkie nieujemne liczby całkowite rt mogą być jednoznacznie
przedstawione w postaci rt = (^) + Q) + ( 3 ), gdzie a, b, c są liczbami
całkowitymi spełniającymi warunek 0 ^ a < b < c.
39. Pokaż, że jeśli xy = ax + b y , to dla każdego n > 0 zachodzi
=
(2 n ~ ]
£
k=l ^
+
'
U
Znajdź podobny wzór dla ogólniejszego iloczynu xvriy Ti. (Wzory te po­
zwalają rozwinąć częściowe ułamki, na przykład, gdy x = 1 /( z — c) i
y = 1/ ( z - d ) . )
40. Znajdź postać zwartą dla sumy
^ ( —1 ) * +1
^
^ ^ 4 "rk. +
^
całkowite m,rt ^ 0 .
41. Oblicz
( k ) W ( n + ^ k)!, gdzie n Jest nieujemną liczbą całkowitą.
42. Znajdź sumę nieoznaczoną ^ ( ( —1)x/(™)) 6 x. Użyj jej do przedstawienia
L k = o(- 1 )V(k) w P°staci zwartej43. Udowodnij potrójnie-dwumianową równość ( 5 .2 8 ). W skazówka: Wpierw
zastąp ( £ * ) przez Z , L + n - M f ) 44. Użyj wzoru ( 5 .3 2 ), by znaleźć zwartą postać podwójnych sum
j*'
v
j,k^ 0
gdzie m ^ a ^ O i r t ^ b ^ O s ą danymi liczbami całkowitymi.
45. Znajdź postać zwartą dla Yic^n ( ? ) 4 - K
46. Przedstaw następującą sumę w postaci zwartej, gdy rt jest dodatnią liczbą
całkowitą:
— 1\ /4 n . — 21c — 1\
ę (V )C
k
x
..
„ N 2n —k
(—I)14-1
; (2k-1)(4n-2k-1)
Wskazówka: Zastosuj funkcje tworzące.
47. Suma
/r k + s \ fr n —rk — s \
Z
V
^
y V
n -k
)
jest wielomianem zmiennych r i s. Pokaż, że nie zależy ona od s.
48. Równość Xlic^-a (nn k)2 k = 2U skojarzona z równością
1 / ( 1 - z ) 71+1 da nam
=
Jaka jest hipergeometryczną postać tego wzoru?
49. Użyj funkcji hipergeometrycznych do przekształcenia sumy
50. Udowodnij prawo odbicia Pfaffa ( 5 . 1 0 1 ) przez porównanie współczynni­
ków zn po obu stronach równania.
51. W wyprowadzeniu wzoru ( 5 . 1 0 4 ) pokazujemy, że
lime-^o F(—m, —2m — 1 + e; —2m + e;2) = l / ( ^ 2) .
W tym zadaniu zobaczymy, jak obliczanie granicy dla lekko zmienionej
funkcji prowadzi do kompletnie różnych rezultatów dla zdegenerowanego
szeregu hipergeometrycznego F(—m, —2m — 1; —2m; 2).
a) Pokaż, że lime_*o F(—m + e, —2 m — 1; —2m + 2e; 2) = 0. Korzystając
z prawa odbicia Pfaffa udowodnij dla wszystkich m ^ 0 równość
F(a, —2m — 1; 2a; 2) = 0 .
b) Czemu równa się lime->o F(—m + e, —2m — 1; —2m + e; 2)?
52. Udowodnij, że jeśli N jest nieujemną liczbą całkowitą, to
M )nf (
1—b i - N , . . . , 1 —bn—N , —N (-1 )m+1v
1—a i—N , . .. , 1—am—N
z
5 3 . Jeśli podstawimy w tożsamości Gaussa ( 5 . 1 1 0 ) b =
—j i z = 1, to lewa
strona zredukuje się do —1 , podczas gdy prawa strona będzie równa + 1 .
Dlaczego stąd nie wynika, że —1 = +1?
5 4 . Wyjaśnij, jak można otrzymać prawą stronę równości ( 5 . 1 1 2 ).
55. Niech wyrazy hipergeometryczne t(k) = F( ai , . . . , a m; b i , . . . , bn ; z)* i
T(k) = F(Ai , . . . , A m ; B i , . . . , Bn ; Z)* dla wszystkich k ^ 0 spełniają
zależność t(k) = c( T ( k + 1) —T(k)). Pokaż, ż e z = Z i m —rt = M — N.
56. Stosując algorytm Gospera znajdź ogólny wzór dla sumy Y ("jf) Sic. Udo­
wodnij, że wyrażenie (—1 ) k - 1 —J także jest rozwiązaniem.
57. Stosując algorytm Gospera znajdź stałą 0, dla której
zk(k + 0) 6k
jest sumowalna za pomocą wyrazów hipergeometrycznych.
58. Niech m i rt będą liczbami całkowitymi spełniającymi nierówność 0 ^
m ^ rt oraz
Znajdź związek między T i Tm_ i >n_i, następnie rozwiąż otrzymaną
rekurencję stosując czynnik sumacyjny.
Z adania eg zam in acyjn e
59. Znajdź postać zwartą dla
gdzie m i n są dodatnimi liczbami całkowitymi.
60. Użyj przybliżenia Stirlinga (4 .2 3 ), by oszacować dla dużych m i r t współ­
czynnik dwumianowy (m7^TL) • Co otrzymamy, gdy m = n?
61. Udowodnij, że jeśli p jest liczbą pierwszą, to dla wszystkich nieujemnych
liczb całkowitych m i n zachodzi
(mod p ) .
62. Zakładamy, że p jest liczbą pierwszą, a m i n są dodatnimi liczbami
całkowitymi. Ustal wartość w yrażen ia(^ ) m o d p 2. W skazówka: Można
użyć następującego uogólnienia tożsamości Cauchy’ego:
+1C2H
bkm—Tl
63. Znajdź postać zwartą dla
gdzie n ^ 0 jest liczbą całkowitą.
k+1
64. Oblicz
, gdzie n ^ 0 jest liczbą całkowitą.
k=0
65. Udowodnij, że
(k + 1 )! = n
6 6 . Oblicz „podwójną sumę Harry’ego,”
m^O,
OsCj^k
jako funkcję zmiennej m. (Sumujemy po j i k.]
67. Znajdź postać zwartą dla
y
k=0
^ ( 2 )^ f 2 n ~ k
n
6 8 . Znajdź postać zwartą dla
y~ ( ™j min(k, u —k)
69. Znajdź postać zwartą dla
mm
kt ,. . . , k m ^ 0
ki -\-----bkm = n
L
i=1
jako funkcję zmiennych m i n .
70. Znajdź postać zwartą dla
^
(k) ( ? ) ( t ) •
calkowite n ^ a
71. Dla m i n nieujemnych liczb całkowitych przyjmijmy
sn = £ ' n + k ) « * ,
m + 2k
k^O
i niech A (z) = Y k ^ o a k^k będzie funkcją tworzącą dla (ao, a i , a 2 , ..
a) Przedstaw funkcję tworzącą S(z) = ^ n > 0 Snzn za pomocą A(z).
b) Użyj tej metody do rozwiązania zadania 7 z podrozdziału 5 .2 .
72. Udowodnij, że jeśli m, n, k są całkowite i rt > 0, to
'm / n \
.
* r
2k-'v(k)
jest całkowite,
gdzie ^(k) jest liczbą jedynek w dwójkowej reprezentacji liczby k.
3
73. Użyj metody repertuaru do rozwiązania rekurencji
Xo = oc;
X] = |3;
Xn = (rt — 1)(Xn_i + Xn_ 2 ) ,
dla rt > 1.
Wskazówka: Zarówno rt!, jak i rtj spełniają rekurencję.
74. W tym zadaniu rozważamy wersję trójkąta Pascala. Na krawędziach trój­
kąta zamiast samych jedynek znajdują się kolejne liczby naturalne. We
wnętrzu trójkąta ciągle obowiązuje reguła dodawania
2
3
4
5
2
4
7
11
3
7
14
4
11
5
Niech dla 1 ^ k ^ n symbol ((£)) oznacza k-tą liczbę w wierszu n.
Przyjmujemy, że ((^)) = ((£)) = rt oraz dla 1 < k < u zachodzi ((£)) =
(O^k1))
((k—I)) ’ w yraź wartość ((£)) w zwartej postaci.
75. Znajdź relację pomiędzy funkcjami
-
£ ( 3")
k
x '
i liczbami [2n/3 J , [2n/3 ].
76. Rozwiąż następującą rekurencję dla n, k ^ 0:
Qn,,o — 1 j
Qo,k — [ k — 0 ];
gdzie n, k > 0 .
77. Czemu równa się
jeśli m > 1 ?
7 8 . Znajdź zwartą postać dla poniższej sumy, jeśli m jest dodatnią liczbą
całkowitą:
2y"
^
(
k m°d m
\ ( 2 k + 1 ) mod (2 m + 1 )
79.
Dobrze wiedzieć.
a) Co jest największym wspólnym dzielnikiem (2n), (2^ ), . . . , ( 2 2 - i ) ?
Wskazówka: Rozważ sumę tych rt liczb,
b) Pokaż, że najmniejsza wspólna wielokrotność liczb (£), (^), . . . , (™)
jest równa L(rt + 1)/(n + 1), gdzie L(n)= NW W( 1, 2 , . . . ,rt).
80. Udowodnij, że dla wszystkich liczbcałkowitych k ,n ^ 0zachodzi (£)
(ert/k)k.
81. Niech 0 < 9 < 1 i 0 ^ x ^ 1 , oraz l,m,rt są nieujemnymi liczbami
całkowitymi spełniającymi warunek m < n. Udowodnij nierówność
> o.
Wskazówka: Zróżniczkuj względem zmiennej x.
Zadania dodatkowe
82. Udowodnij, że trójkąt Pascala spełnia bardziej zaskakującą własność sześciokąta od cytowanej już uprzednio w rozdziale 3 :
NW D ( ( r ] ) . u , ) - r n )
= n w d ((V ), o
,
(,-0 ) ■
gdzie 0 < k < n. Na przykład NW D (56,36,210) = N W D (28,120,126) =
2.
83. Udowodnij zadziwiającą, pięcioparametrową równość ( 5 .3 2 ).
84. Pokaż, że druga para wzorów (5 .6 1 ) wynika z pierwszej pary ( 5 .6 0 ).
Wskazówka: Zróżniczkuj względem zmiennej z.
85. Udowodnij, że
^
m=1
1
/kf+k^H
bk^ + 2n\
< k 2<-"<lcm ^ n ^
/
= (- , ) " " |3 - ( 2„n
(Lewa strona jest sumą o 2n —1 wyrazach.) Wskazówka: Prawdziwe jest
coś ogólniejszego.
8 6 . Niech a i , . . . , an będą nieujemnymi liczbami całkowitymi, i niech liczba
C(a-|, . . . , an ) będzie współczynnikiem przy wyrazie wolnym z° . . . z^
w rozwinięciu iloczynu
ai
n (i -j
a) Udowodnij, że C ( di , . . . , an ) jest równe lewej stronie wzoru ( 5 .3 1 ).
b) Udowodnij, że jeśli Zi, . . . , z^ są wzajemnie różnymi liczbami zespo­
lonymi, to wielomian
Z — Zi
k=1
Zk
Z)
jest tożsamościowo równy 1 .
c) Przemnóż pierwszy iloczyn przez f(0) i dowiedź, że C (d i , d2 ł . . . , an )
jest równe
C(d! - 1, d2,..., dn)+ C(d!,d2 - 1,..., dn)
H--- h C(di,d2,...,d-n,— 1) .
(Ponieważ ta rekurencją definiuje multimianowe współczynniki, to
liczba C(di,..., dn) musi być równa prawej stronie równości ( 5 .3 1 ).)
87. Niech m będzie dodatnią liczbą całkowitą oraz £ = en i/m . Pokaż, że
k^n/m
B _ m(zm ) n + 1
(1 + m ) $ _ m (zm ) —m
y-
(C2>+ , z ® 1+1/m(C2i+ ,z )1/m) n+1
( m + 1 ) ® 1+1/mU 2H - z ) - ’ - 1 •
(Gdy m = 1, równość ta redukuje się do równości ( 5 .7 4 ).)
8 8 . Udowodnij, że współczynniki s^ we wzorze ( 5 .4 7 ) dla wszystkich k > 1
są równe
(-l)k [
1
Jo
Zatem |sid < 1/ ( k — 1).
89. Udowodnij, że równość ( 5 . 1 9 ) ma swój nieskończony odpowiednik
y~ f m ^"T>) xk‘yTll_lc =
k>m
'
'
^
k>m
'
(~ x )k(x +'y)m-k ł
'
całkowite m
gdzie |x| < |y| i |x| < |x + -y|. Zróżniczkuj tę równość rt razy względem
zmiennej y i wyraź wynik jako funkcję hipergeometryczną. Jaką tożsa­
mość otrzymamy?
90. W zadaniu 1 z podrozdziału 5.2 rozważaliśmy sumę X k ^ o (k) / (k)> g d z i e
r i s były liczbami całkowitymi oraz s ^ r ^ 0. Czemu równa się suma,
gdy r i s nie są liczbami całkowitymi?
91. Udowodnij tożsam ość W hipple’a
pokazując, że obie strony równości spełniają to samo równanie różnicz­
kowe.
92. Udowodnij równości iloczynowe Clausena
Jakie otrzymamy równania po przyrównaniu współczynników przy zn ?
93. Pokaż, że dla dowolnej funkcji f i stałej oc nieskończona suma
ma (względnie) prostą postać zwartą.
94. Znajdź
(£) (ul alc) 5k, gdy rt jest dodatnią liczbą całkowitą.
95. Jakie warunki trzeba dodać do ( 5 . 1 1 8 ), by można było jednoznacznie
wyznaczyć wielomiany p, q, r?
96. Udowodnij, że jeśli dla danego składnika hipergeometrycznego t(k) algo­
rytm Gospera nie znajdzie żadnego rozwiązania równości ( 5 . 1 2 0 ), to nie
istnieje rozwiązanie ogólniejszego równania
t(k) = (Ti(k + 1) H-------bTm(k-Hi)) — (Ti(k) H------- 1-Tm( k ) ) ,
gdzie Ti (k), . . . , Tm(k) są składnikami hipergeometrycznymi.
97. Znajdź wszystkie liczby zespolone z, takie że k!2/ n j L i (j2 + jz + 1) jest
sumowalne za pomocą składników hipergeometrycznych.
98. Jaką rekurencję otrzymamy za pomocą metody Gospera-Zeilbergera dla
sumy Sn = £ k ( 2nJ ?
99. Przyjmijmy, że a jest nieujemną liczbą całkowitą. Znajdź za pomocą
metody Gospera-Zeilbergera postać zwartą dla sumy ^ k t(n,k), gdzie
t(n,k) = ( n + a + b + c + k)!/(rt + k)! (c + k)! (b —k )! (a —k)!k!.
100.
Znajdź rekurencję dla sumy
Następnie użyj tej rekurencji do znalezienia innego wzoru dla Sn .
101. Znajdź rekurencję spełnianą przez sumy
Dla tej sumy
(i kilku następnych)
lepiej użyć
komputera
ze specjalnym
programem.
1 0 2 . Zastosuj
metodę Gospera-Zeilbergera do uogólnionej „bezużytecznej”
tożsamości ( 5 . 1 1 3 ). Dla jakich wartości a, b, z
ma postać zwartą?
103. Niech t(n,k) będzie składnikiem właściwym ( 5 . 1 4 3 ). Jakiego stopnia
względem zmiennej k będą wielomiany p(n,k), q(n,k) i r(rt,k), gdy
zastosujemy metodę Gospera-Zeilbergera do t(n,k) = Po W t( n , k) +
-----h |3x(n)t(n + l,k)? (Zignoruj rzadkie, wyjątkowe przypadki.)
104. Zastosuj metodę Gospera-Zeilbergera do zweryfikowania godnej uwagi
tożsamości
1
r —n —k + 1
r —2 rt + 1 *
Wyjaśnij, dlaczego tą metodą nie znaleźliśmy dla tej sumy najprostszej
rekurencji.
105. Pokaż, że jeśli cu = e27tl//3, to
całkowite rt ^ 0 .
106. Udowodnij zadziwiającą tożsamość ( 5 .3 2 ). Podstaw t(r, j,k) pod wyrazy
sumy podzielonę przez wyrażenie z prawej strony równości i następnie
pokaż, że istnieją funkcje T(r, j,k) i U(r, j,k) takie, że
t(r + 1, j,k) —t(r, j,k) = T(r, j + 1,k ) - T ( r , j,k)
+ U(r,j,k + 1) - U ( r , j , k ) .
107. Udowodnij, że 1 / ( n k + 1) nie jest składnikiem właściwym.
108. Pokaż, że liczby Apery’ego An ( 5 . 1 4 1 ) są elementami przekątnej An>n
macierzy zdefiniowanej wzorem
^
r ( 7 ) 2( : ) ! (2™+ L - ’- k)-
Udowodnij, że jest to macierz symetryczna i że zachodzi
A -.. =
r ( mT k)!(m: r k2k)2
= z ( 3 0 ( \ +k)(":k)109. Udowodnij, że liczby Apery’ego An ( 5 . 1 4 1 ) spełniają dla wszystkich liczb
pierwszych p i nieujemnych liczb całkowitych rt kongruencję
An — Ajn/pj An modp
(mod p ) .
Problemy badawcze
110. Dla jakich wartości n zachodzi ( ^ = (—1)n (mod ( 2 n + 1))?
1 1 1 . Niech q(rt) będzie najmniejszym, nieparzystym dzielnikiem współczyn­
nika dwumianowego ( 2rJx) . Zgodnie z zadaniem 36, jeśli zapiszemy liczbę
rt w systemie pozycyjnym o podstawie p i wszystkie cyfry będą co naj­
wyżej równe (p —1)/2, t o p nie dzieli (2^ )- Eksperymenty komputerowe
wykazały, że dla 1 < rt < 10 10000 zachodzi q(rt) ^ 1 1 , z wyjątkiem
q (3160) = 13.
a) Czy dla wszystkich rt > 3160 zachodzi nierówność q(n) ^ 11 ?
b) Czy równość q(rt) = 11 jest prawdziwa dla nieskończenie wielu rt?
Nagroda 7-11-13 dolarów jest oferowana za rozwiązanie albo (a), albo (b).
1 1 2 . Czy dla wszystkich rt > 4 ,
z wyjątkiem n = 64 i n = 256, liczba ( ^
jest podzielna przez 4 lub 9?
113. Załóżmy, że t(rt + 1,k)/t(rt,k) i t(rt,k + 1)/t(rt,k) są funkcjami wy­
miernymi zmiennych rt i k oraz że istnieje niezerowy, liniowy operator
różnicowy H(N,K,rt) taki, że H(N,K,rt)t(rt,k) = 0. Czy t(n,k) jest
składnikiem właściwym?
114. Niech m będzie liczbą całkowitą. Zdefiniujmy ciąg c ! ^ rekurencją
Czy wszystkie liczby c ^
są całkowite?
fisi Liczby szczególne
Niektóre ciągi liczbowe tak często występują w matematyce, że rozpozna­
jemy je bez trudu. Ciągom tym nadajemy szczególne nazwy. Na przykład
każdy, kto uczył się arytmetyki, poznał ciąg kwadratów kolejnych liczb natu­
ralnych ( 1 , 4 , 9 , 1 6 , . . . ) . W rozdziale 1 zajmowaliśmy się liczbami trójkątnymi
( 1, 3, 6 , 1 0 , . . . ) , a w rozdziale 4 liczbami pierwszymi ( 2 , 3 , 5 , 7 , . . . ) . W roz­
dziale 5 przyjrzeliśmy się w skrócie liczbom Catalana ( 1, 2 , 5, 1 4 , . . . ) .
W tym rozdziale poznamy kilka innych ważnych ciągów liczbowych. Na
początku zajmiemy się liczbami Stirlinga {£ } i [£] oraz liczbami Eulera
(£ ). Tworzą one trójkątne wzorce współczynników podobnie jak współczyn­
niki dwumianowe (£) w trójkącie Pascala. Potem przyjrzymy się dokładniej
liczbom harmonicznym Hn oraz liczbom Bernoulliego B^. Różnią się one
od wcześniej przez nas poznanych ciągów tym, że są ułamkami, a nie licz­
bami całkowitymi. Pod koniec rozdziału zbadamy fascynujące liczby Fibo­
nacciego Fn i ich niektóre ważne uogólnienia.
6.1. Liczby Stirlinga
.. par cette
notation, les
formules deviennent
plus symśtriąues.”
J. Karamata [199]
Zaczniemy od liczb Stirlinga, bliskich kuzynów współczynników dwumiano­
wych, nazwanych tak na cześć Jamesa Stirlinga (1692-1770). Liczby te wystę­
pują w dwóch odmianach, zwykle nazywanych „liczbami Stirlinga pierwszego
i drugiego rodzaju.” Chociaż mają one szacowną historię i wiele zastosowań,
ciągle cierpią na brak standardowej notacji. Zgodnie z notacją wprowadzoną
przez Jovana Karamatę, liczby Stirlinga drugiego rodzaju będziemy ozna­
czać { £} , a liczby Stirlinga pierwszego rodzaju [£]. Symbole te wydają się
bardziej przyjazne niż wiele innych, których próbowano w przeszłości.
Tabele 289 i 290 pokazują, jak wyglądają liczby {£ } i [£] dla małych
rt i k. Zagadnienie, dotyczące liczb: „1, 7, 6 , 1” prawdopodobnie wiąże się
z { £} , „6 , 1 1 , 6 , 1 ” związane jest z [£], tak jak przyjmujemy, że zagad­
nienie dotyczące „1, 4, 6 , 4, 1” odpowiada (£). Te charakterystyczne liczby
pojawiają się przy n = 4.
T abela 289. Trójkąt Stirlinga dla podzbiorów
Liczby Stirlinga drugiego rodzaju pojawiają się częściej niż liczby pierw­
szego rodzaju, a zatem tym razem zaczniemy od końca. Symbol { £ } oznacza
liczbę sposobów podziału zbioru rt elementowego na k niepustych podzbio­
rów. Na przykład, istnieje siedem sposobów podziału zbioru czteroelementowego na dwie części:
{1,2,3}U{4},
{1,2} U {3,4},
{1,2,4} U {3},
{1,3,4} U {2},
(Sam Stirling
rozważał ten rodzaj
jako pierwszy
w swojej
książce [344].)
{2,3,4}U{1},
{1,3} U{2,4}, {1,4}U
czyli { 2 } = 7. Zauważmy, że nawiasy klamrowe oznaczają zarówno zbiory, jak
i liczby { £} . To notacyjne pokrewieństwo pozwoli nam zapamiętać znaczenie
symbolu { £} , który można odczytać jako „k podzbiorów rt.”
Przyjrzyjmy się małemu k. Jest tylko jeden sposób na umieszczenie rt
elementów w jednym niepustym zbiorze. Stąd
= 1 dla wszystkich n > 0.
Z drugiej strony, {^} = 0, ponieważ zbiór 0-elementowy jest tylko jeden—
pusty.
Przypadek dla k = 0 wymaga nieco zręczności. Najlepiej będzie, jeśli
zgodzimy się, że jest tylko jeden sposób podziału pustego zbioru na zero nie­
pustych części. Mamy więc {^} = 1. Ponieważ niepustego zbioru nie można
podzielić na zero niepustych części, więc { o } = 0 d l a n > 0 .
Co się dzieje przy k = 2? Oczywiście
= 0. Jeśli zbiór n > 0 obiektów
dzielimy na dwie niepuste części, to jedna z nich zawiera ostatni obiekt i jakiś
podzbiór pierwszych n — 1 obiektów. Istnieje 2 n _1 sposobów na wybranie
powyższego podzbioru, ponieważ każdy z pierwszych n —1 obiektów jest albo
w nim, albo poza nim. Jednak nie wolno nam włożyć wszystkich obiektów
do tego podzbioru, ponieważ chcemy uzyskać dwie niepuste części. Zatem
{2,3};(6 .1)
T abela 290. Trójkąt Stirlinga dla cykli
n
| 1
i
40320
r
Tl
TL
TL
M
.7
8
M
4536
546
36
Tg
W 3 11 ^
f 11
lĘ 6 l ||n
50
35
10
274
225
85
1764
1624
735
13068
13132
6769
109584 118124 67284
1
22449
1
odejmujemy 1
dla całkowitych n > 0 .
( 6 .2;
(Zgadza się to z naszym powyższym wyliczeniem
= 7 = 2 3 — 1.)
Modyfikacja tego rozumowania prowadzi do wzoru rekurencyjnego, za
pomocą którego możemy wyliczyć {£ } dla wszystkich k: Dzieląc zbiór rt > 0
obiektów na k niepustych części, ostatni obiekt umieszczamy w zbiorze jednoelementowym (na { £ z { } sposobów) albo umieszczamy go razem z jakimś
niepustym podzbiorem pierwszych n —1 obiektów. W tym drugim przypadku
daje to k {nk 1} możliwości, ponieważ każdy z { n“ 1} sposobów na rozłożenie
pierwszych n — 1 obiektów na k niepustych części daje k podzbiorów, do
których n-ty obiekt może dołączyć. Stąd
= k
rt — 1
k
M
n —1
k —1
dla całkowitych n > 0.
(6-3)
Wzór ten generuje tabelę 289. Bez czynnika k zredukowalibyśmy go do wzoru
sumacyjnego ( 5 .8 ) generującego trójkąt Pascala.
Zajmiemy się teraz liczbami Stirlinga pierwszego rodzaju. Przypominają
one poprzednie, przy czym [£] oznacza liczbę sposobów na rozmieszczenie
rt obiektów w k cyklach zamiast w podzbiorach. *[£]* wyrażamy słowami
„k cykli n.”
Cykle to cykliczne ustawienia, takie jak naszyjniki, które rozważaliśmy
w rozdziale 4. Cykl
D
B
^ -c y
możemy zapisać krócej jako ‘[A, B, C, D]’ rozumiejąc, że
[A, B, C, D] = [B, C, D, A] = [C,D,A,B] = [D.A.B.C];
Cykl „zapętla się”, ponieważ jego koniec łączy się z początkiem. Z dru­
giej strony, cykl [A,B,C,D] nie jest równoważny cyklowi [A, B,D,C] ani
[D, C, B, A].
Istnieje jedenaście różnych sposobów na stworzenie dwóch cykli z czte­
rech elementów:
[1,2,3] [4],
[1,2,4] [3],
[1,3,4] [2],
[2,3,4] [1],
[1.3.2] [4],
[1,4,2] [3],
[1,4,3] [2],
[2,4,3] [1],
[1.2]
[1,3] [2,4],
[1,4] [2,3];
[3,4],
( 6 .4 )
stąd [2] = 1 1 .
Cykl singletowy (tzn. cykl składający się tylko z jednego elementu) zasad­
niczo odpowiada zbiorowi singletowemu (zbiór z tylko jednym elementem).
Podobnie, 2-cykl odpowiada 2-zbiorowi, ponieważ mamy [A, B] = [B,A], tak
jak {A, B} = {B,A}. Ale istnieją dwa różne 3-cykle: [A,B,C] i [A, C,B]. Za­
uważmy, na przykład, że jedenaście par cykli w ( 6 .4 ) można uzyskać z siedmiu
par zbiorów w ( 6 . 1 ) poprzez stworzenie dwóch cykli z każdego 3 -elementowego
zbioru.
W ogólności, z każdego n-elementowego zbioru można stworzyć n !/n =
(n — 1)! różnych n-cykli, o ile rt > 0. (Istnieje rt! permutacji, a każdy n-cykl
występuje rt razy, ponieważ każdy z jego elementów może być wypisany jako
pierwszy.) Zatem otrzymujemy
= (n — 1 )!,
dla całkowitych rt > 0 .
( 6 .5 )
Jest to dużo więcej niż wartość
} = 1, którą otrzymaliśmy w przypadku
liczb podzbiorowych Stirlinga. Łatwo zauważyć, że liczba cykli musi być co
najmniej tak duża, jak liczba podzbiorów
^ \ ^ }►,
dla całkowitych rt, k ^ 0 ,
( 6 .6 )
ponieważ każdy podział na niepuste podzbiory prowadzi do co najmniej jed­
nego ustawienia w cykl.
W wyrażeniu ( 6 .6 ) równość zachodzi wyłącznie wtedy, gdy wszystkie
cykle są albo singletonami, albo dubletonami, ponieważ wówczas cykle są
równoważne podzbiorom. Przypadek ten zachodzi dla k = rt i k = rt — 1.
Stąd
„ Istnieje dziewięć
i sześćdziesiąt
sposobów
na. ułożenie pieśni
plemiennej,
i-każdy-z-nich-jestdobry
Rudyard Kipling
Nie mylić
z rowerem.
Łatwo zauważyć, że
(Liczba sposobów ustawienia n obiektów w rt —1 cykli lub podzbiorów odpo­
wiada liczbie sposobów wybrania dwóch obiektów, które będą w tym samym
cyklu lub podzbiorze.) Liczby trójkątne (£) = 1, 3, 6 , 10, . . . są wyraźnie
obecne zarówno w tabeli 289, jak i w tabeli 290.
Wzór rekurencyjny na liczby [£] wyprowadzamy modyfikując rozumo­
wanie przeprowadzone dla {£}. Każde ustawienie n obiektów w k cykli albo
umieszcza ostatni obiekt w 1-cyklu (na [£z]] sposobów), albo wstawia ten
obiekt w jeden z [n
cykli ustawień pierwszych u — 1 obiektów. W ostat­
nim przypadku można to zrobić na rt — 1 różnych sposobów. (Wymaga to
chwili zastanowienia, ale nie jest trudno sprawdzić, że istnieje j sposobów na
włożenie nowego elementu do j-cyklu, aby utworzyć (j +1 )-cykl. Na przykład
dla j = 3 z cyklu [A, B, C] otrzymujemy
[A, B, C, D ] ,
[A,B,D,C]
lub
[A,D,B,C],
gdy wstawiamy nowy element D, i są to jedyne możliwości. Sumowanie po
wszystkich j daje nam rt—1 sposobów na wstawienie n-tego obiektu do cyklu
złożonego z n —1 obiektów.) Żądany wzór rekurencyjny przedstawia się zatem
następująco:
=
(n-1)
n -1
k
n -1
k —1
dla całkowitych n > 0 .
( 6 .8 )
Jest to odpowiednik wzoru sumacyjnego generującego tabelę 290.
Jeśli porównamy wzory ( 6 .8 ) i ( 6 .3 ), to przekonamy się, że pierwszy skład­
nik prawej strony jest pomnożony przez górny indeks, rt — 1 , w przypadku
liczb cyklicznych Stirlinga, a przez dolny indeks, k, w przypadku liczb pod­
zbiorowych Stirlinga. Możemy zatem przeprowadzać proces „pochłaniania”
w wyrazach takich, jak rt [£] oraz k {£}, kiedy dowodzimy za pomocą indukcji
matematycznej.
Każda permutacja jest równoważna zbiorowi cykli. Rozważmy, na przy­
kład, permutację, która zamienia 123456789 w 384729156. Dla wygody mo­
żemy przedstawić ją w dwóch wierszach:
123456789
384729156.
Widzimy, że 1 staje się 3, 2 staje się 8 , i tak dalej. Wyłania się teraz struktura
cyklu, ponieważ 1 przechodzi w 3, które przechodzi w 4, które przechodzi
w 7, które przechodzi z powrotem w 1. Otrzymujemy cykl [1,3,4,7]. Innym
cyklem w tej permutacji jest [2,8 ,5], jeszcze jednym [6 ,9]. Zatem permutacja
384729156 jest równoważna następującemu układowi cykli:
[1,3,4,7] [2,8,5] [6,9].
Jeżeli mamy dowolną permutację 7T| 7t2 . . . 7tn elementów zbioru { 1 , 2 , . . . , rt},
każdy element jest w tylko jednym cyklu. Albowiem jeśli zaczniemy od trio =
m i przejrzymy mi = 7tmo, rrt2 = 7im i , i tak dalej, musimy ostatecznie
wrócić do
= rrio. (Liczby muszą się powtórzyć wcześniej lub później, a
pierwszą liczbą, która się ponownie pojawi, musi być mo, ponieważ znamy
jedynych poprzedników pozostałych liczb m i , m.2 , . . . , m ic_i.) Zatem każda
permutacja definiuje układ cykli. I oczywiście odwrotnie, każdy układ cykli
definiuje permutację, jeśli odwrócimy powyższą konstrukcję, a odpowiedniość
jeden-na-jeden pokazuje, że permutacje i układy cykli są zasadniczo tym
samym.
Zatem [£]
jest liczbą permutacji n obiektów, które zawierają dokładnie
.kJ
k cykli.
[£] po wszystkich k, musimy otrzymać całkowitą
ykli. Jeżeli zsumujemy
zsui
liczbę permutacji:
= rt!,
L
dla całkowitych u £ 0 .
(6 .9 )
k=0
Na przykład, 6 + 11 + 6 + 1 = 24 = 4!.
Rekurencyjne relacje (6 .3 ) oraz (6 .8 ), związane z liczbami Stirlinga, przy­
dają się w rozwiązaniach wielu problemów. Jeśli, na przykład, chcemy wyra­
zić potęgi xri przez ubywające potęgi x—, zauważamy, że w pierwszych paru
przypadkach otrzymujemy:
x° = x -;
X1 = x - ;
x2 = x - + x - ;
= x - + 3x - + x - ;
x
6 x - + 7x- + x - .
Współczynniki te wyglądają podejrzanie tak samo, jak odbicie lustrzane liczb
w tabeli 289. Zatem możemy się spodziewać, że wzór ogólny wygląda nastę­
pująco:
xn = ^
{ k | X~ ’
dla całkowitych rt ^ 0 .
(6 . 1 0 )
Lepiej założyć, że
G} = [a = °
dla k < 0 i
n ^ 0.
Prosty dowód przez indukcję utwierdza nas w tym przekonaniu. Mamy x-x- =
xk+i _|_
p0 niewa2 x]£±l = x—(x —k). Stąd x*xn_1 wynosi
n -1
• Ę l W
- Ę r r j ^ t Z
kx-
-£{:=<V+S { V
Innymi słowy, liczby podzbiorowe Stirlinga są współczynnikami potęg kro­
czących, za pomocą których otrzymujemy zwykłe potęgi.
Można również pokazać, że liczby cykliczne Stirlinga są współczynnikami
zwykłych potęg, za pomocą których otrzymujemy potęgi kroczące:
x° = x ° ;
=
X1 ;
x2 = x2 + X 1 ;
= x3 + 3x2 + 2y} ;
xT =
x 4 + 6 x 3 + 11x2 + 6 x 1 .
Mamy (x + n —1) -xk = x k+1 + (n —1)xk, zatem dowód podobny do poprzed­
niego pokazuje, że
(x + n - 1 )xn “ 1 = (x + n - 1 )]T
n - 1‘
xk = ^
Przez indukcję możemy udowodnić ogólny wzór
=L
dla całkowitych n ^ 0 .
(6 . n ;
(Jeżeli podstawimy x = 1, dostaniemy ponownie (6 .9 ).)
Chwileczkę, ktoś zaprotestuje. Ta równość zawiera potęgi przyrastające
xTL, podczas gdy (6 .10 ) zawiera potęgi ubywające x—. Co zrobić, jeśli chcemy
przedstawić x—za pomocą zwykłych potęg lub jeśli chcemy przedstawić xn
za pomocą potęg przyrastających? To proste, dorzucamy kilka znaków minus
i dostajemy
n—k^k
( - 1)
dla całkowitych n ^ 0 ;
(6 .1 2 )
( - 1) n - kx \
dla całkowitych n ^ 0 .
(6 -13)
Łatwo się o tym przekonać, ponieważ, na przykład, wzór
x— = x(x —1) (x —2) (x —3) = x4 —6x3 + 11 x2 —6x
odpowiada wzorowi
x4 = x(x + 1)(x + 2)(x + 3) =
x4
+ 6 x 3 + 11x2 + 6 x ,
tyle że z przeciwnymi znakami. Ogólna tożsamość
( 6 .1 4 )
z ćwiczenia 2.17 zamienia wyrażenia ( 6 . 1 0 ) w ( 6 . 1 2 ) i ( 6 . 1 1 ) w ( 6 . 1 3 ), jeśli
zanegujemy x.
Możemy zapamiętać, kiedy wstawić czynnik (—1 )n k do wzoru takiego
jak ( 6 . 1 2 ), ponieważ istnieje naturalny porządek potęg dla dużych x:
xu > xu > x—,
dla wszystkich x > n > 1 .
( 6 -3 0 )
Liczby Stirlinga [£] i {£ } są nieujemne, zatem musimy użyć znaków minus,
kiedy wyrażamy „małe” potęgi poprzez „duże”.
Kiedy podstawimy wzór ( 6 . 1 1 ) do (6 . 1 2 ), dostaniemy podwójną sumę:
n ~lcx1c
Powyższa równość zachodzi dla wszystkich x, więc wszystkie współczynniki
przy x°, X 1 , . . . , X7 1 - 1 , x 11+1, xTL+2, . . . z prawej strony muszą być równe
zeru i otrzymujemy tożsamość
dla całkowitych m, n ^ 0 . ( 6 .3 1 )
Liczby Stirlinga, tak jak współczynniki dwumianowe, spełniają wiele zas­
kakujących tożsamości. Są one jednak mniej uniwersalne niż te, z którymi
spotkaliśmy się w rozdziale 5, więc nie są tak często stosowane. Zatem naj­
lepiej będzie wypisać najprostsze z nich, żeby w przyszłości móc się do nich
odwołać, gdy będziemy zmuszeni rozgryźć twardy orzech liczb Stirlinga. Ta­
bele 296 i 297 zawierają najczęściej używane wzory. Wyprowadzone przez nas
główne tożsamości pojawiają się tam ponownie.
Kiedy badaliśmy współczynniki dwumianowe w rozdziale 5, odkryliśmy,
że korzystnie było zdefiniować (£) dla ujemnych n w taki sposób, że tożsamość (k) = (nk 1) + (£_]) jest prawdziwa bez żadnych ograniczeń. Po
zastosowaniu tej tożsamości do rozszerzenia (£) poza jego kombinatoryczne
T ab ela 296. Podstawowe tożsamości liczb Stirlinga, dla całkowitych
[Wzory inwersji:
£0{mK'r" = Im- nl;
ł {;}
iiiS
':y.r*ł 'Vv V
i
-1
/4
M
0
Liczby S tirlin ga]
T abela 297. Inne tożsamości liczb Stirlinga, dla całkowitych l, m, n ^ 0
nm( _ i r — [£]
i r a t
k
mv k
Również,
□
(n-D -m
L K IO ,
uogólnienie (6.9).
T ab ela 298. Trójkąty Stirlinga w tandemie
znaczenie, odkryliśmy (w tabeli 191), że trójkąt Pascala istotnie odtwarza
się w obróconej formie, gdy rozszerzymy go w górę. Spróbujmy zrobić to
samo z trójkątami Stirlinga: Co się stanie, jeśli zdecydujemy, że podstawowe
rekurencje
TL — 1
{;m v w
Tl"
k
n -T
= (tl — 1 )
k
k —1
“n - 1 "
+
k—1
są prawdziwe dla wszystkich całkowitych n i k? Przy dodatkowym założeniu:
= [k = 0 ]
©
i
= [n = 0 ],
(6.32)
otrzymujemy jednoznaczne rozwiązanie. Ukazuje nam się zadziwiająco ładny
wzór. Trójkąt Stirlinga dla cykli pojawia się powyżej trójkąta Stirlinga dla
podzbiorów, i odwrotnie! Oba rodzaje liczb Stirlinga powiązane są wyjątkowo
prostą zależnością [2 2 0 , 2 2 1 ]:
-k
-n
dla całkowitych k, n.
(6.33)
Otrzymaliśmy „dualność,” podobną do relacji pomiędzy min i max, pomiędzy
[xj i |Y |, pomiędzy x—i xn oraz pomiędzy NWD i NWW. Łatwo sprawdzić,
że obie rekurencje [£] = (n — 1 ) [ \ ] + [£_-|] oraz {£ } = k{ v }+{£=;}
stają się tym samym, przy takiej odpowiedniości.
T abela 299. Trójkąt Eulera
6.2. Liczby Eulera
Od czasu do czasu pojawia się jeszcze jeden trójkąt wartości. Jego odkrycie
przypisujemy Eulerowi [104, §13; 110, strona 485]. Elementy trójkąta Eulera
oznaczamy przez (£). Nawiasy kątowe w tym przypadku sugerują znaki
„mniejszy niż” i „większy niż”. (£) jest liczbą permutacji 7ti tcz . . . 7rn zbioru
{1,2, . . . , n } mających k w zniesień, tzn. k pozycji, na których 7tj < 7tj+ -|.
(Uwaga: Notacja ta jest mniej standardowa niż nasze notacje [£] oraz {£ }
dla liczb Stirlinga. Wkrótce zobaczymy, że ma swoje uzasadnienie.)
Na przykład, jedenaście permutacji {1,2,3,4} ma dwa wzniesienia:
1324,
1243,
1423 ,
1342,
2314 ,
2341;
2413 , 3412;
2134, 3124,
4123.
(W pierwszym wierszu są permutacje typu
< 712 > 713 < 714, w drugim
typu 7ti < 7i 2 < 713 > 7T4 i 7ti > 7X2 < 7i 3 < ^ 4 -) Stąd
. Tabela 299
zawiera najmniejsze liczby Eulera. Zauważmy, że w tym przypadku charak­
terystycznym ciągiem jest 1, 11, 11, 1. Jeżeli n > 0, może być co najwyżej
n — 1 wzniesień, zatem mamy
= [n = 0 ] na przekątnej trójkąta.
Trójkąt Eulera, tak jak trójkąt Pascala, ma w każdym wierszu elementy
ułożone symetrycznie. Ale w tym przypadku zasada symetrii wygląda nieco
inaczej:
n
n — 1 —k
dla całkowitych rt > 0 .
( 6 .3 4 )
(Knuth [209,
pierwsze wydanie]
używał
(k^ ) zamiast
Permutacja 711712 . . . 7Tn ma n — 1 —k wzniesień wtedy i tylko wtedy, gdy jej
symetryczne „odbicie” 7tn . . . 7t27ti ma k wzniesień.
Spróbujmy znaleźć wzór rekurencyjny dla liczb (£). Każda permutacja
p = pi . . . pn_ 1 zbioru { 1 , . . . , n — 1} prowadzi do rt permutacji { 1 , 2 , . . . , u},
jeśli wstawimy nowy element n na wszystkie możliwe sposoby. Załóżmy, że rt
wstawiamy na pozycji j, otrzymując permutację 7t = pi . . . pj_i rt Pj . . . pn_ i .
Liczba wzniesień w 7r jest taka sama jak w p, je ś li) = 1 lub jeśli pj_i < pj, a
jest o jeden większa niż liczba w p, jeśli Pj_i > p^ lub jeśli j = n. Zatem n ma
k wzniesień ustawionych na (k + 1)(TL^ 1) sposobów uzyskanych z permutacji
p, które mają k wzniesień, i dodatkowo na ((n — 2) — (k — 1) + l ) ( £ z ] )
sposobów uzyskanych z permutacji p mających k —1 wzniesień. Poszukiwany
wzór rekurencyjny wygląda następująco:
^
= (k + 1)^n k ^ + (rL-lc) ^ _
> całkowite rt > 0. ( 6 .3 5 )
Jeszcze raz zaczynamy rekurencję od ustalenia
r0
>
= [k = 0 ],
dla całkowitych k,
(6 .3 6 )
i zakładamy, że (£} = 0 , gdy k < 0 .
Liczby Eulera są użyteczne przede wszystkim dlatego, że dostarczają wy­
godnych zależności pomiędzy zwykłymi potęgami a kolejnymi współczynni­
kami dwumianowymi:
xn =
Zachodni uczeni
dowiedzieli się
ostatnio o ważnej
chińskiej pracy
autorstwa Li ShanLan [249; 265, strony
320-325],
opublikowanej
w 1867 roku, która
zawiera pierwsze
znane pojawienie
się wzoru ( 6.37).
^
>
dla całkowitych n ^ 0 .
(6 .3 7 )
(Nazywamy ją „tożsamością Worpitzky’ego” [379].) Na przykład mamy
x2 =
m27 + V
' x+1
2
X3 =
G W T M * :2).
x4 = {x\ + n ( x V ] + n rx + A ■ (x + i
4
V 4 /
V 4 7 V 4
i tak dalej. Łatwo udowodnić ( 6 .3 7 ) przez indukcję (ćwiczenie 14).
Na marginesie, wzór ( 6 .3 7 ) odpowiada jeszcze jednemu sposobowi obli­
czenia sumy kwadratów pierwszych n liczb naturalnych. Zachodzi równość
T abela 301. Trójkąt Eulera drugiego rzędu
r??r
m ®
1
2
' .:*• -i • f " i,
i
*K'
1^ 1I
3 jlr 1
» 4 li i
1
5
6
*1
¥■
ftp:#«f*f_- > ł ; j r
ih
1
Ijf; ]
0
2
0
8
Z 6
58
328
1452
5610
19950
22
52
114
240
494
|f f i"lt
f -T
0
^ | § p ;S
ad|43;|!#S
/? \s
o
24
444
4400
120
0
3708
720
33984
0
5040
k2 = o © + < ? ) ( ,cn = © + ( kr ) . « t e “
i 2 + 2z -i
+ ti 2 = ( G ) + ( i ) + - + Q ) ) + ( © + @ + - + m )
=
(n ^ ) + (n3 2) =
| ( n + 1 ) n ( ( n - 1 ) + (n + 2 ) ) .
Rekurencją Eulera (6.35) jest trochę bardziej skomplikowana niż reku­
rencje Stirlinga (6.3) i (6.8), więc nie spodziewamy się, że liczby (£} będą
spełniać aż tak wiele prostych tożsamości. Niemniej jednak jest ich kilka:
(6.38)
k
rt —m
m!
rt
=z
(6 .39 )
M)
m
n — k —m
(6.40)
k!.
Jeżeli pomnożymy wzór (6.39) przez z11-711 oraz zsumujemy jego kolejne kopie
względem m, to otrzymamy 21 m {m }m *zn_Ta = H k ( k ) ( z + ^)k- Zastępu­
jąc z przez z — 1 i zrównując współczynniki przy zk, dostajemy (6.40). Za­
tem ostatnie dwie tożsamości są w zasadzie równoważne. Pierwsza tożsamość
(6.38) daje nam wartości szczególne, gdy m jest małe:
=
1;
=
21
rt
= 31
(tl+ 1)2n +
n+ 1
Nie musimy tutaj rozwodzić się dłużej nad liczbami Eulera. Wystarczy po
prostu wiedzieć, że istnieją, oraz mieć listę ich podstawowych tożsamości, aby
poratować się nią, gdy zaistnieje potrzeba. Jednakże, zanim zakończymy ten
temat, powinniśmy wspomnieć o jeszcze jednym trójkątnym wzorcu współ­
czynników, przedstawionym w tabeli 301. Nazywamy je „liczbami Eulera
drugiego rzędu” ((£)), ponieważ spełniają równanie rekurencyjne podobne
do ( 6 .3 5 ), ale z jednym n zastąpionym przez 2n — 1 :
( ( £ ) ) = ( k + 1 ) ( ( n k 1) ) + ( 2 n _ 1 “ ,c)( ( k - i ) ) -
(6-4l)
Liczby te mają ciekawą interpretację kombinatoryczną, pierwszy raz zapropo­
nowaną przez Gessela i Stanleya [147]. Jeżeli stworzymy permutacje zbioru
z powtórzeniami { 1 , 1 , 2 , 2 , . . . ,n ,n } o takiej własności, że wszystkie liczby
występujące pomiędzy dwoma pojawieniami się m są większe niż m, dla
1 ^ m ^ n, wówczas ((£)) jest liczbą tych permutacji, które mają k wznie­
sień. Na przykład, istnieje osiem odpowiednich permutacji z jednym wznie­
sieniem zbioru z powtórzeniami { 1 , 1 , 2 , 2 ,3 , 3 }:
113322, 133221, 221331, 221133, 223311, 233211, 331122, 331221.
Oznacza to, że ((3)) = 8 . Zbiór z powtórzeniami { 1 , 1 , 2 , 2 , . . . ,n ,n } ma w
sumie
L ( ( k ) ) = (2n-1)(2n-3)...(1) =
(6 .42 )
odpowiednich permutacji, ponieważ dwa wystąpienia n muszą ze sobą sąsia­
dować oraz istnieje 2 rt — 1 pozycji na umieszczenie ich wewnątrz permutacji
dla n — 1. Gdy n = 3, permutacja 1221, mająca pięć pozycji do wypeł­
nienia, generuje 331221, 133221, 123321, 122331 i 122133. Rekurencję ( 6 .4 1 )
można udowodnić wzmacniając argumentację, jaką zastosowaliśmy dla zwy­
kłych liczb Eulera.
Liczby Eulera drugiego rzędu są ważne, ponieważ są związane z liczbami
Stirlinga [148]. Można wykazać (przez indukcję względem n ), że
x
! n} = L((£)) (x+V
x
x —n
= H ( ( k ) ) (* 2 0 ^ ’
k) > całkowiten>0;
(6-43)
całkowite n ^ O .
(6 .44)
Na przykład,
(Rozważaliśmy już przypadek dla rt = 1 w ( 6 .7 ).) Tożsamości te zachodzą,
gdy x jest całkowite, a rt jest całkowite nieujemne. Ponieważ prawe strony
są wielomianami zmiennej x, więc możemy na podstawie wzorów ( 6 .4 3 ) i
( 6 .4 4 ) zdefiniować liczby Stirlinga { xZrL} i [x *n]
dowolnej rzeczywistej
(lub zespolonej) wartości.
Jeżeli rt > 0, wielomiany {*}* i [*] są zerowe dla x = 0, x = 1, . . . ,
x. Zatem są one podzielne przez (x — 0), (x — 1), .. .i (x). Przyjrzyjmy się,
co zostało po podzieleniu przez powyższe czynniki. Definiujemy w ielom iany
Stirlinga crrL(x) zgodnie z regułą
X
OnM =
x —rt
/ (x(x — 1 } . . . (x —n ) ) .
(6-45)
(Stopień wielomianu crn M wynosi rt — 1.) Pierwszych kilka przypadków to:
oo(x) = l / x ;
di(x) = 1 / 2 ;
Czyli l/x jest
wielomianem?
0 2 (x)
= (3x — 1) /2 4 ;
(Sorry, tak wyszło.)
0-3 (x)
= (x 2 —x ) /4 8 ;
a 4 (x) = (15x3 —30x2 + 5x + 2 )/5 7 6 0 .
Można je generować używając liczb Eulera drugiego rzędu. Na przykład,
03M
= ((x—4)(x—5 ) + 8 (x—4 ) ( x + 1 ) + 6 (x+ 2 )(x + 1 ) ) / 6 L
Okazuje się, że wielomiany te spełniają dwie bardzo wygodne tożsamości:
T abela 304. Wzory splotu Stirlinga
A w ogólności, jeśli §t(z) jest szeregiem potęgowym, który spełnia
l n O - z S t f z ) 1- 1)
=
-zS tfz)1 ,
(6.52)
St (z)x = x^S” 0Yl(x + tn ) zn .
n
( 6 .53 )
to
Możemy zatem uzyskać ogólne wzory splotu
dla liczb Stirlinga, tak jak to
zrobiliśmy dla współczynników wielomianów
w tabeli 232. Wynikiumiesz­
czone są w tabeli 304. Gdy suma liczb Stirlinga nie pasuje do tożsamości z
tabeli 296 lub 297, podpowiedzi należy szukać w tabeli 304. (W tym rozdziale
odpowiedni przykład pojawia się później, zaraz za równaniem ( 6 . 1 0 0 ). Ćwi­
czenie 7.19 omawia ogólne reguły splotów oparte na tożsamościach takich,
jak (6.50) oraz (6 .5 3 ).)
6.3. Liczby harm oniczne________________________
Przyszedł czas, aby przyjrzeć się bliżej liczbom harmonicznym, z którymi
spotkaliśmy się po raz pierwszy w rozdziale 2 :
H-n. =
1+
1 1
1
n 1
- + - H--------- 1— = y~ - ,
1 5 n
dla całkowitych n ^ 0 .
( 6 .54 )
k=ik
Liczby te pojawiają się tak często w analizie algorytmów, że informatycy po­
trzebują dla nich specjalnej notacji. Używamy Hn , gdzie symbol ‘H’ oznacza
„harmoniczny,” ponieważ ton fali o długości 1 /rt jest nazywany n-tą harmo­
niczną tonu fali o długości 1. Pierwszych kilka wartości wygląda następująco:
n
Hn
0
0
1
2
3
4
5
6
7
8
9
10
1
3
2
11
6
25
12
137
60
49
20
363
140
761
280
7129
252 0
7381
252 0
Ćwiczenie 21 pokazuje, że Hn nigdy nie jest liczbą naturalną dla n > 1.
A oto sztuczka karciana, oparta na pomyśle R. T. Sharpa [326], która
ilustruje, jak często liczby harmoniczne pojawiają się w codziennych sytu­
acjach. Mając n kart na stole, chcielibyśmy stworzyć największy możliwy
nawis poprzez układanie kart jedna na drugą nad krawędzią stołu, uwzględ­
niając prawa grawitacji:
karta 1
|— d2 —
stół
dn+i
Definiując ten problem precyzyjniej, żądamy, aby brzegi kart były równoległe
do krawędzi stołu. W przeciwnym razie moglibyśmy poprzez obrócenie kart
powiększyć nawis. Dla uproszczenia obliczeń zakładamy, że każda karta ma
długość 2 jednostek.
Jeżeli mamy jedną kartę, największy nawis otrzymujemy wtedy, gdy jej
środek ciężkości leży dokładnie nad krawędzią stołu. Karta ma środek ciężko­
ści w swoim środku geometrycznym, więc możemy stworzyć nawis długości
połowy karty, czyli 1 jednostki.
W przypadku dwóch kart, nie jest się trudno przekonać, że największy na­
wis osiągniemy wtedy, gdy środek ciężkości górnej karty leży nad wystającą
krawędzią dolnej, a wspólny środek ciężkości obu kart leży nad krawędzią
stołu. Środek ciężkości dwóch kart razem znajduje się w środku ich części
wspólnej, otrzymujemy więc dodatkowe pół jednostki nawisu.
Wzór ten sugeruje ogólną metodę, zgodnie z którą układamy karty tak,
aby środek ciężkości k górnych kart leżał nad krawędzią (k + 1 )-szwej karty
(która podtrzymuje górne k kart). Stół pełni rolę (n + l)-szej karty. Spró­
bujmy wyrazić ten warunek algebraicznie. Niech d^ będzie odległością mię­
dzy krawędzią karty leżącej na wierzchu, a odpowiadającą jej krawędzią k-tej
karty od góry. Wówczas di = 0, a dk+i odpowiada środkowi ciężkości pierw­
szych k kart:
dk+i =
(di + 1 ) + (d 2 + 1 ) H-------b (dk + 1 )
k
!
(Środek ciężkości k obiektów, ważących odpowiednio w i , . . . , w k i mających
środki ciężkości w punktach p i , . . . p k, znajduje się w punkcie (w ip i H------ b
wicpic)/(wi H-------l-wk).) Nasz wzór rekurencyjny możemy wyrazić w dwóch
równoważnych postaciach
kdic-i-i = k + diH------ b d ic-i+ d ic,
k^O;
(k — 1 ) dk = k — 1 + di H-------h dic_i ,
k ^ 1.
Po odjęciu równań stronami otrzymujemy
kdk+i - (k -
1 )dk
=
1 + dk ,
k ^ 1;
stąd dk+i = dk + 1/k. Druga karta wystaje pół jednostki poza trzecią. Ta
wystaje o jedną trzecią jednostki poza czwartą, i tak dalej. Ogólny wzór
dk+i = Hk
( 6 .5 6 )
otrzymujemy przez indukcję. Jeżeli k = rt, wartość dn+i = Hn odpowiada
całkowitemu nawisowi n kart ułożonych zgodnie z powyższym opisem.
Czy moglibyśmy osiągnąć większy nawis, nie wysuwając każdej karty
do jej ekstremalnego wychylenia, tylko magazynując „potencjalną energię
grawitacyjną” w celu jej późniejszego wykorzystania? Nie, ponieważ każde
dobrze zbalansowane ułożenie karty spełnia warunek
z (1 + d i ) + (1 + d2) + • • ■ + (1 + dk)
dk+i ^ ----------------------- ------------------------ ,
Każdy, kto
faktycznie próbuje
osiągnąć
maksymalny nawis
z 52 kartami,
prawdopodobnie nie
ma do czynienia
z pełną talią— albo
jest prawdziwym
szulerem.
1 ^ k ^ n.
Ponadto di = 0. Indukcyjnie otrzymujemy, że dk+i ^ Hk.
Zauważmy, iż nie musimy użyć zbyt wielu kart, aby górna karta znala­
zła się całkowicie poza krawędzią stołu. Potrzebujemy nawisu większego niż
długość jednej karty, czyli 2 jednostek. Pierwszą liczbą harmoniczną przekra­
czającą 2 jest H4 = y |, a zatem wystarczą tylko cztery karty.
Używając 52 kart otrzymamy Hs 2 -jednostkowy nawis, który okazuje
się odpowiadać długości H5 2 / 2 « 2 , 27 kart. (Wkrótce poznamy wzór, który
powie nam, jak obliczyć przybliżoną wartość Hn dla dużych rt, bez dodawania
całego pęku ułamków.)
Zabawny problem znany pod nazwą „robaczek na gumowej taśmie” uka­
zuje liczby harmoniczne w innym świetle. Powolny, lecz wytrwały robaczek R
rozpoczyna wędrówkę od początku metrowej gumowej taśmy i pełznie jeden
centymetr na minutę w kierunku jej końca. Pod koniec każdej minuty równie
wytrwały właściciel taśmy W, którego wyłącznym celem w życiu jest po­
krzyżowanie planów R, rozciąga taśmę równomiernie o jeden metr. Zatem po
jednej minucie pełznięcia R jest odległy o 1 centymetr od początku swojej
drogi i o 99 centymetrów od jej końca. Wówczas W rozciąga taśmę o jeden
307
L iczby harm oniczne'
metr. Podczas operacji rozciągania R zachowuje swą względną pozycję, 1%
od startu i 99% do finiszu. Zatem R znajduje się 2 cm od punktu wyjścia i
198 cm do celu. Po następnej minucie pełznięcia R osiąga 3 cm taśmy, mając
jeszcze przed sobą 197 cm do przejścia. Teraz W rozciąga taśmę i odpowied­
nie odległości osiągają wartości 4,5 oraz 295,5. I tak dalej. Czy robaczek
kiedykolwiek dobrnie do końca taśmy? Cały czas posuwa się do przodu, ale
cel wydaje się oddalać coraz szybciej. (Zakładamy, że W i R są nieskończenie
długowieczni, taśma jest nieskończenie elastyczna, a robaczek nieskończenie
mały.)
Zapiszmy teraz kilka wzorów. W czasie, gdy W rozciąga gumową ta­
śmę, ułamek drogi, którą przepełznął R, pozostaje ten sam. A zatem pełznie
1/100-tną w pierwszej minucie, 1/200-tną w drugiej, 1/300-tną w trzeciej, i
tak dalej. Po n minutach R pokonuje
1 / 1 1 1
1\
Hn
TÓ0 V^ + 2 + 3 + ' " + n J _ TÓ0
x
^ '57^
długości gumowej taśmy. A zatem osiągnie metę w momencie, gdy Hn prze­
kroczy wartość 1 0 0 .
Wkrótce zobaczymy, jak oszacować Hn dla dużych n. Na razie jednak
sprawdźmy nasze rozumowanie rozpatrując, jak zachowałby się „Superrobaczek” w tej samej sytuacji. Superrobaczek, w przeciwieństwie do R, potrafi
pełznąć 50 cm na minutę. A zatem po n minutach przepełznie Hn/2 długości
taśmy, zgodnie z naszą wcześniejszą argumentacją. Jeżeli nasze rozumowanie
jest poprawne, superrobaczek powinien finiszować, zanim n osiągnie war­
tość 4, ponieważ Hą > 2. I owszem, z prostych rachunków wynika, że po
trzech minutach superrobaczek ma przed sobą tylko 3 3 cm drogi. Finisz
następuje dokładnie po 3 minutach i 40 sekundach.
Liczby harmoniczne pojawiają się również w trójkącie Stirlinga. Spróbuj­
my znaleźć postać zwartą dla [J] - liczby permutacji n obiektów mających
dokładnie dwa cykle. Zgodnie z wzorem rekurencyjnym ( 6 .8 )
n + 1"
2
= n
= n
Ti
2_
n"
2
+
n
1
+ (n -
jeśli n > 0 ,
a rekurencją ta jest naturalnym kandydatem do użycia techniki czynnika
sumacyjnego z rozdziału 2 :
1 "n+ 1
n!
2
"
n
1
( n - 1 )! _2 _
Użycie jednostek
metrycznych czyni
ten problem
bardziej naukowym.
Rozwijając ten wzór rekurencyjny, otrzymujemy
= Hn . Stąd
= n!Hu .
1
( 6 .5 8 )
W rozdziale 2 udowodniliśmy, że szereg harmoniczny
1/Tc jest roz­
bieżny, co oznacza, że Hn staje się dowolnie duże przy rt —> 0 0 . Ale nasz
dowód był przeprowadzony metodą „nie wprost”. Odkryliśmy, że pewna nie­
skończona suma ( 2 .5 8 ) daje różne wyniki, gdy ją poprzestawiamy, zatem
1/k nie może być ograniczony. Fakt, że
—> 0 0 , wydaje się niezgodny
z intuicją, gdyż między innymi wynikałoby z niego, że wystarczająco duży
stos kart będzie tworzył nawis nad stołem na kilometr lub więcej oraz że
robaczek R ostatecznie osiągnie koniec taśmy. Przyjrzyjmy się zatem bliżej
wielkości Hn dla bardzo dużego rt.
Prawdopodobnie najprostszym sposobem sprawdzenia tego, że Hn —> 0 0 ,
jest pogrupowanie jego wyrazów w ten sposób, że rozmiar grupy odpowiada
kolejnym potęgom 2. Umieszczamy jeden składnik w grupie o numerze 1,
dwa w grupie o numerze 2 , cztery w grupie o numerze 3 , osiem w grupie o
numerze 4 itd.:
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
, T + 2 + 3, + 4 + 5 + 6 + 7, + 8 + 9 + iÓ + TT+ T2 + 13+ T4+ T5, + '' ‘ '
grupa 1 grupa 2
grupa 3
grupa 4
Oba składniki w grupie o numerze 2 są pomiędzy | a | , więc suma skład­
ników tej grupy mieści się pomiędzy 2 - | = | a2* ^ = 1. Wszystkie cztery
składniki w grupie o numerze 3 są pomiędzy ^ a
więc ich suma jest rów­
nież pomiędzy \ a 1. W rzeczywistości, każdy z 2 k_1 składników w grupie
o numerze k jest zawarty pomiędzy 2_k a 2 1_k. Stąd suma składników w
każdej grupie mieści się pomiędzy \ a 1 .
Ten sposób podziału mówi nam, że jeśli rt jest w grupie o numerze k, to
prawdą jest, iż Hn > k /2 oraz Hn ^ k (przez indukcję względem k). Zatem
Hn —> oo, i istotnie
^lgTj! + 1 < Hn sC [!gn J + 1 -
Powinniśmy je
nazwać liczbami
żółwiowymi,
są tak powolne.
(6-59)
Znamy już wartość Hn z dokładnością do czynnika 2. Chociaż liczby har­
moniczne osiągają nieskończoność, osiągają ją logarytmicznie szybko — czyli
dosyć wolno.
Lepsze ograniczenie można znaleźć, wydłużając nieco nasze obliczenia.
W rozdziale 2 dowiedzieliśmy się, że Hn jest dyskretnym odpowiednikiem
funkcji ciągłej lnrt. Logarytm naturalny definiujemy jako powierzchnię pod
krzywą. Przyjrzyjmy mu się zatem od strony geometrycznej:
Pole powierzchni pod krzywą między punktami 1 a n, jest równe całce
d x /x = In n i jest ono mniejsze niż suma pól powierzchni n prostokątów
wynosząca Jlk=i V k = Hn . Zatem In n < Hn . Uzyskaliśmy dokładniejszy
rezultat w porównaniu z ( 6 .5 9 ). Biorąc nieco inne prostokąty, dostaniemy
podobne dolne ograniczenie:
Tym razem pole powierzchni n prostokątów Hn jest mniejsze niż pole po­
wierzchni pierwszego prostokąta oraz powierzchni pod krzywą. Udowodnili­
śmy wcześniej, że
Inn < Hn < l n n + 1 ,
dlan>1.
( 6 .6 0 )
Znamy teraz wartość Hn z błędem co najwyżej 1.
f2)
Liczby harmoniczne „drugiego rzędu”
tworzymy przez zsumowa­
nie odwrotności kwadratów kolejnych liczb całkowitych, zamiast sumowania
zwykłych odwrotności:
H® =
n
1+ 1
4
+ 1 + --- + -L =
9
n2
k=l
k2
Podobnie definiujemy liczby harmoniczne rzędu r przez zsumowanie odwrot­
ności r-tych potęg:
= I p k=l
( 6 -6 i)
„I now see a way
too how ye
aggregate ofye
termes of Musicali
progressions may
bee found (much
after y e same
manner) by
Logarithms, but y e
calculations for
ńnding out those
rules would bee still
more troublesom.”
I. Newton [281]
Jeżeli r > 1, to liczby te osiągają granicę przy rt —> oo. W ćwiczeniu 2.31
dowiedzieliśmy się, że granica ta jest zwyczajowo nazywana funkcją zeta Riemanna:
(6.62)
k^1
Euler [103] pokazał zgrabny sposób wykorzystania uogólnionych liczb
harmonicznych w celu przybliżania zwykłych liczb harmonicznych H ^1 ^. Roz­
ważmy nieskończony szereg
ln
k —1
- 1 _L _L _L
~ k + 21? + 31? + 41? +
(6.63)
który jest zbieżny dla k > 1. Lewa strona wynosi lnk —ln(k — 1), zatem jeśli
zsumujemy obie strony po 2 ^ k ^ rt, suma z lewej strony składa się, a my
otrzymujemy
1 n
V- ( —+ ^1 -7 + 1 + 1
ln rt —ln
1 — /
2k2
3k3
4k 4
k=2
= (H n -1 ) + 1(h!v2 )- 1 ) + 1 ^ (3)
- 1 ) + l ^ i(4)
- l ) +
Po przekształceniu otrzymujemy wyrażenie opisujące różnicę między Hn a
Inn:
Hn —ln n = l - l ( H ‘121- l ) - l ( H i(3)
v3,- l ) - l ( H ti (4)
l4,- l ) Gdy n - ) o o , prawa strona osiąga wartość graniczną
1 - K C P ) - 1) - 3 W 3) - 1) - ? ( « 4 ) - l ) - . . . ,
„Huius igitur
qua.ntita.tis
constantis C
valorem deteximus,
quippe est
C = 0,577218.”
L. Euler [103]
znaną obecnie jako stała Eulera i standardowo oznaczaną grecką literą y .
Wartość £(r) —1 wynosi w przybliżeniu 1/2 r, zatem ten szereg nieskończony
zbiega dosyć szybko, a my możemy obliczyć rozwinięcie dziesiętne
y = 0,5772156649.. ..
( 6 .6 4 )
Rozumowanie Eulera ustala związek graniczny
lim (Hn, —Inn) = y ,
n — ¥00
( 6 .6 5 )
zatem Hu umieszczone jest w około 58% drogi pomiędzy dwoma skrajnymi
wielkościami we wzorze ( 6 .6 0 ). Stopniowo zbliżamy się do jego dokładnej
wartości.
Dalsze poprawianie jest możliwe, co zobaczymy w rozdziale 9, Udowod­
nimy, na przykład, że
Hn = ln n + Y +
^ - T^ I + T^
0 < e n <1.
?,
(6.66)
Korzystając z tego wzoru możemy obliczyć milionową liczbę harmoniczną
Hioooooo ~ 14,3927267228657236313811275,
nie sumując miliona ułamków. Między innymi oznacza to, że stos utworzony
z miliona kart będzie tworzył nawis o długości ponad siedmiu kart.
Czego dowiadujemy się z ( 6 .6 6 ) o robaczku na gumowej taśmie? Ponieważ
Hn jest nieograniczone, robaczek ostatecznie dotrze do końca taśmy, gdy Hn
przewyższy 100. Z naszego przybliżenia Hn wnioskujemy, że stanie się to,
gdy rt wyniesie mniej więcej
e 100-y
_
e 99,42 3
W rzeczywistości, ćwiczenie 9.49 dowodzi, że krytyczna wartość n wynosi
l^ioo-yj
['e100-'*']. Możemy sobie tylko wyobrazić radość R, kiedy w
końcu przekracza linię mety, ku wielkiemu zmartwieniu W, ok. 287 decylionów wieków od rozpoczęcia swojego pełznięcia. (Gumowa taśma rozciągnie
się na więcej niż 1 0 27 lat świetlnych, a jej cząsteczki będą położone daleko
od siebie.)
6.4. Sum ow anie harm oniczne___________________
Przyjrzyjmy się teraz niektórym sumom zawierającym liczby harmoniczne,
rozpoczynając od przypomnienia kilku pomysłów przedstawionych wcześniej
w rozdziale 2 . Udowodniliśmy w ( 2 .3 6 ) oraz ( 2 .5 7 ), że
Y_ ^
O^kcn.
Za to będzie ważył
dobrze ponad tonę!
= nH u —n ;
£
(6 .6 7 )
.
(6 .68)
O^kcrt
Podejmiemy się teraz wyliczyć bardziej ogólną sumę zawierającą obie powyż­
sze sumy jako swoje szczególne przypadki. Jaka jest wartość
z (kK.
OsCkCTL Vm /
gdy m jest nieujemną liczbą całkowitą?
Tak naprawdę,
to nie mają aż tak
dużo czasu. Świat
skończy się dużo
wcześniej, gdy
Wieża Brahmy
zostanie całkowicie
przeniesiona.
W rozdziale 2 najbardziej skutecznym podejściem do obliczenia zależno­
ści (6 .6 7 ) oraz ( 6 .6 8 ) okazało się sumowanie przez części. Każdy ze składni­
ków przedstawialiśmy w postaci u(k)Av(k) i stosowaliśmy ogólną tożsamość
u(x)Av(x) 6x = u(x)v(x)|^ — ^
v(x + 1)Au(x) ó x .
(6.69)
Pamiętacie? Suma, z którą mamy w tej chwili do czynienia H 0<k<n, (m )^ >
znakomicie pasuje do tej metody, ponieważ bierzemy
u(k) =
H k,
Au(k) =
H k+1 -
V(,C) =
1m + l ) *
Av(k) =
( m + l ) - ( m + l ) = (m
1
Hk =
k+1 ’
(Innymi słowy, liczby harmoniczne mają prostą A, a współczynniki dwu­
mianu mają prostą A- 1 , czyli interes się kręci.) Na podstawie wzoru (6.69)
otrzymujemy
y
OsCkcu
( kV
= W XV 5 * = ( \ V
n- 5 ~ n ( x+V)—
« > • 7
L
P
0^k<TL X
7
i
Pozostała część sumy nie przedstawia trudności, ponieważ możemy się po­
zbyć kłopotliwego wyrazu ( k + 1 ) -1 używając naszego starego rezerwowego
równania (5.5):
y
('k+1N) _ ! _ =
W+lJk+l
y
f k ) — !—
J b - W
m+1
=
rt
\
1
Oznacza to, że otrzymaliśmy poszukiwaną odpowiedź:
Ł
O
s
i
r
)
-
(Odpowiada to równaniom (6.67) i (6.68) dla m = 0 oraz m = 1.)
W następnym przykładzie mamy do czynienia z dzieleniem zamiast mno­
żeniem: Spróbujmy obliczyć
s
"
f S t
h
k
'
Jeśli rozwiniemy Hk zgodnie z definicją, to otrzymamy podwójną sumę
s-
I
r
Teraz inna metoda z rozdziału 2 przychodzi nam z pomocą. Równanie ( 2 .3 3 )
mówi nam, że
+
V V=1
7
= j ( H ł + H !? ).
k=1
(6-71)
/
Okazuje się, że mogliśmy uzyskać tę odpowiedź również w inny sposób, gdy­
byśmy zastosowali sumowanie przez części (zobacz ćwiczenie 26).
Zmierzmy się teraz z trudniejszym problemem [355], który nie poddaje
się sumowaniu przez części:
Un =
( i" ) “— t ------(n —k)n ,
dla całkowitych n ^ 1.
k^1
(W sumie tej liczby harmoniczne nie pojawiają w sposób jawny. Ale któż
wie, może się jeszcze pojawią?)
Rozwiążemy ten problem na dwa sposoby. Pierwszy, przy dużym nakła­
dzie sił, a drugi, korzystając z pomocy intelektu i/lub szczęścia. Najpierw
podejście siłowe. Rozwijamy (n —k ) 71 przy użyciu twierdzenia dwumianowego
tak, aby kłopotliwe k z mianownika związać z licznikiem:
k^l
Nie jest to aż taki bałagan, na jaki wygląda, ponieważ k ]_1 w wewnętrznej
sumie jest wielomianem zmiennej k, a tożsamość ( 5 .4 0 ) mówi nam, że bie­
rzemy po prostu n-tą różnicę tego wielomianu. Zaczniemy jednak od wstęp­
nego uporządkowania naszej wiedzy. Po pierwsze, k i_ 1 nie jest wielomianem,
gdy j = 0 , co oznacza, że będziemy musieli przyjrzeć się temu wyrazowi
osobno. Poza tym, brakuje nam wyrazu z k = 0, ze wzoru na n-tą różnicę.
(Grunt to nie
zdradzić
odpowiedzi.)
Wyraz ten jest niezerowy przy j = 1, zatem dobrze byłoby go dodać (a potem
odjąć).
W wyniku przekształceń otrzymujemy
i - i
OK, teraz górny wiersz (jedyna pozostająca podwójna suma) jest równa zeru.
Jest to suma wielokrotności ri-tych różnic wielomianów stopnia mniejszego
niż n, a takie n-te różnice są zerami. Drugi wiersz jest równy zeru, wyłączając
przypadek z j = 1, kiedy to równa się —n /1. Zatem pozostał nam kłopot
wyłącznie z trzecim wierszem. Zredukowaliśmy początkowy problem do dużo
prostszej sumy:
U 3 = 27(Ts — 1 ), tak jak twierdziliśmy.
W jaki sposób możemy obliczyć Tn? Możemy, na przykład, zastąpić (£)
przez (n“ 1) + (£“ ]), uzyskując prostą rekurencję na Tn w zależności od Tn_ i .
Ale istnieje również bardziej kształcący sposób. Podobne wyrażenie mieliśmy
w równaniu ( 5 .4 1 ), mianowicie
Jeżeli odejmiemy wyraz z k = 0 i podstawimy x = 0, otrzymamy —Tn.
Zróbmy tak:
(Skorzystaliśmy tu z rozwinięcia (6.11) do (x + 1) . . . (x + n) = xri+^/x. Mo­
żemy teraz wydobyć x z licznika, ponieważ [n^J’1] = rt!.) Ale wiemy z (6.58),
że [U2 ^ —n! Hn.. Stąd Tn = HT1 i otrzymujemy odpowiedź:
Un = n n (Hn — 1).
(6.73)
To był pierwszy sposób. Drugie podejście opiera się na policzeniu ogól­
niejszej sumy,
Un (x,y) =
^X+
’
całkowite n ^ 0 -(6.74)
k^1 ^ '
Wartość początkowego Un jest szczególnym przypadkiem Un (rt, —1). (Po­
nieważ poprzednie wyprowadzenie „zgubiło” większość szczegółów naszego
zagadnienia, odważyliśmy się na większe uogólnienie. Tak czy inaczej, szcze­
góły te muszą być nieistotne, ponieważ n-ta różnica je wymazuje.)
Moglibyśmy powtórzyć poprzednie wyprowadzenie z małymi zmianami
odkrywając wartość UTL(x,'y). Albo moglibyśmy zastąpić (x + Taj)1'1 przez
(x + ky)n _1(x + ky) oraz (£) zastąpić przez (^j^1) + (£l{)» co prowadzi do
rekurencji
Un (*,-y) = xUn_ i ( x , y ) + x 7 n + -yxrL_1 ,
(6.75)
której rozwiązanie otrzymujemy, korzystając z techniki czynnika sumacyj­
nego (ćwiczenie 5).
Ale najłatwiej będzie zastosować sztuczkę, która przyniosła nam pożytek
w rozdziale 2 — różniczkowanie. Pochodna Un (x,'y) względem y dostarcza
k, które upraszcza się z k występującym w mianowniku i otrzymana suma
jest już trywialna:
^ U u (x ,T j) =
ę ) ( - 1 )k- , n (x + k y r - 1
nxn_1 — V" ( y ) ( - 1 ) kn(x + lcy)n-1 = nxn- ’ .
k^O '
7
(Po raz kolejny zniknęła n-ta różnica wielomianu stopnia < n.)
Udowodniliśmy, że pochodna Un (x,'y) względem y wynosi n xn_1 i jest
ona niezależna od y. W ogólności, jeśli f'(y ) = c, to f (-y) = f (0) + cy. Zatem
musimy otrzymać Un (x,'y) = Un (x ,0) + n x TX_1'y.
Pozostało nam jeszcze ustalenie Un (x, 0). Ale Un (x, 0) to właśnie xu
pomnożone przez sumę Tn = Hn., którą już rozważaliśmy w (6.72). Zatem
ogólna suma w (6 .7 4 ) ma postać zwartą
Un (x,y) = xTLHn + n x rL~ 1y .
( 6 .7 6 )
W szczególności, rozwiązaniem początkowego problemu jest Un (n, —1) =
Tin (Hn — 1).
6.5. Liczby B ernoulliego________________________
Następnym ważnym ciągiem liczbowym na naszej liście jest ciąg nazwany
imieniem Jakuba Bernoulliego (1654-1705), który odkrył ciekawą zależność
podczas prac nad wzorami dla sum m-tych potęg [26]. Zapiszmy
n —1
Sm (n) = 0m + 1m + --- + ( n —1)m = ^ k m = X o x m 5 x - (6‘77)
k=0
(Zatem, gdy m > 0, mamy Sm(n) =
w notacji uogólnionych liczb har­
monicznych.) Bernoulli przyjrzał się poniższemu ciągowi formuł i zauważył
następujący wzorzec:
S 0 (n) =
n
51 (n) =
\n 2 —
5 2 (ti) =
|r t 3 — j n 1 + \ n
S 3 (n )=
\n Ą —jn 3 +
S4(n) =
- K
S5(n) =
—j t l 5
±n2
+ l3n 3 - 30 n
+ "fen4 - - ^ 2
S6(n) =
l n 7 - l n 6 + l n 5 --
S7(n) =
+ Ju- nit2
2n 3 _
-—
ł * 9 - l n 8 + K 15nri5 + 9
i n 8 _- ^ T l 6 +
J _ n io
+
l n 4 -4 11
ion
10Tl
S8(n)
S9(n) =
X
Sio(n) = 11 11
-ln 7 + ^
- l n 10 +
+ T2 n
6 -
5 n 9 _6 11
n7+
n 5 --
^
2
ł - 3
Czy też go spostrzegacie? Współczynnik przy n m +1 w Sm(n) to zawsze
1/ ( m + 1). Współczynnik przy n m to zawsze —1/2 . Współczynnik przy n m _ 1
to zawsze . . . popatrzmy . . . m /l 2. Współczynnik przy n m - 2 jest zawsze ze­
rowy. Współczynnik przy n m _ 3 to zawsze . . . popatrzmy . . . hmm . . . tak,
—m (m —1)(m—2)/720. Współczynnik przy rtm _ 4 jest zawsze zerowy. Wyglą­
da na to, że zgodnie z powyższym wzorcem, współczynnik przy n m-k będzie
zawsze iloczynem pewnej stałej oraz m -.
Tego właśnie empirycznego odkrycia dokonał Bernoulli. (Nie podał jed­
nak formalnego dowodu.) We współczesnej notacji współczynniki zapisujemy
w postaci
S m (n )
=
— V r f B o Ti m + ' +
m+ 1 \
f m + 1
f m i+ l N ) B i n m + - - +
1
/
V
\
m
)B m n
m
Liczby Bernoulliego definiujemy za pomocą niejawnej rekurencyjnej za­
leżności
m.
/
y~ (
j=o
.
m +1
. jB j = [m = 0 ] ,
dla wszystkich m ^ 0 .
( 6 .7 9 )
fi \ t> +, a( t) B i = 0. Kilka pierwszych wartości wygląda nastę­
Na przykład, (0)Bo
pująco:
U
0
1
2
1
1
2
1
6
3
4
0
-i
30
5
6
0
1
42
7
8
0
-1
30
9
10
0
5
66
11
12
0
-691
273 0
(Wszystkie oczekiwania co do prostej postaci zwartej dla Bu spełzają na
niczym w obliczu dziwnego ułamka —691 /2730.)
Możemy udowodnić wzór Bernoulliego ( 6 .7 8 ) przez indukcję względem m
korzystając z metody zaburzeń (jeden ze sposobów, za pomocą którego zna­
leźliśmy S2 (ti) = Dn w rozdziale 2 ):
n —1
S m + l (TV) + TVm+1
=
X
( k + 1 ) m+1
k=0
T l— 1
= Z
k=0
T Tt+ 1 /
, -1 \
Z C t V
j=0 '
}
'
TTL+ 1 /
=
. 1 \
L ( m ,+ ) s S(n). (6 .8 0 )
j=0
'
J 7
Niech Sm(n) będzie prawą stroną (6 .7 8 ). Chcielibyśmy pokazać,że Sm(rt) =
Sm(n ) Przy założeniu, że Sj(rt) = Sj(ri), dla 0 ^ j < m. Zaczniemy tak
jak w rozdziale 2 , od m = 2, odejmując Sm+i (n) od obu stron (6 .8 0 ). Potem
rozwiniemy każde Sj (rt) zgodnie z wyrażeniem ( 6 .7 8 ) i pogrupujemy tak, aby
połączyć i uprościć współczynniki rt-tych potęg po prawej stronie:
= L ( m i+ 1 ) i T T Z ^ r )Bkn H ’--c + ( m + 1 ) A
j= 0 ' ' '
1—A
k
=0
+ ( tti + 1) A
j+ 1
1 T l + 1 \ / j + 1 \ B j —k
=
Z
=
Z
j - k/ j + 1
n k+1 + (m + 1) A
m + 1\ ( ) + 1 \ B ,_k
k + 1/ j +1
n k+1
O^k^m
=
v—
k+1 / m + 1
7
—
k +1 x
O^k^m
k^j
rt
= O^k^m
Z k
rt'm +1
k+1
/' m
rn.-r
+ 1i \
k
v—
( m + 1 —1c\
i
(
i»>+(™+')a
O^j^mk '
k+i
m+ 1
+1
7m + 1
m +1 \
m
[m —k = 0] + (m + 1) A
+ (m + 1) A
= n m+1 + (m + 1) A
Zacznij
kartkować.
/ m + 1\ / j
k^j^m.
^— ii
L
O^k^m
A oto trochę więcej
smutnych
kawałków, które
prawdopodobnie
będziecie chcieli
wyłącznie
przekartkować
podczas pierwszego
czytania.
Twój przyjazny
asystent
-nk+1 + (m + 1) A
gdzie A = Sm(n) - Sm(n).
(Powyższe wyprowadzenie jest dobrym przypomnieniem rutynowych prze­
kształceń, o których mówiliśmy w rozdziale 5.) A zatem A = 0 oraz Sm(n) =
Sm(n), QED.
W rozdziale 7 otrzymamy prostszy dowód (6 .78 ), używając funkcji two­
rzących.
Kluczowym pomysłem będzie pokazanie, że liczby Bernoulliego są współ­
czynnikami szeregu potęgowego
z
rr = TZ
B>rt!
L^O
ez — 1
(6 .81 )
Na razie załóżmy, że równość (6 .81 ) zachodzi, możemy zatem wyprowadzić
kilka jej zadziwiających następstw. Jeśli do obu stron dodamy j z, tym samym
6.5. L iczby B ern ou lliego
/pozbywając się wyrazu B iz /1! = ~ \ z z prawej strony, otrzymamy
z ez/2 + e' -z/2
2 ez/ 2 - e_z/ 2
z
z _ z ez + 1
ez - 1 + 2 = 2 ez —1
(6 .82 )
Oznaczenie ctgh odpowiada funkcji „cotangens hiperboliczny,” znanej rów­
nież jako coshz/sinh z. Mamy
sinhz =
cosh z =
ez + e'
(6 .8 3 )
Zamieniając z na —z otrzymujemy ( - f ) ctgh ( ^ ) = | ctgh | . A zatem
każdy współczynnik z nieparzystym indeksem funkcji § ctgh § musi być ze­
rowy, a my otrzymujemy
B3 = B5 = B7 = B9 = Bn = Bi3 = ••• = 0 .
(6.84)
Ponadto, na podstawie (6.82) mamy postać zwartą współczynników ctgh:
2z
2z
v—
(2z)2n
z ctgh z = - I— - + - = Y_ B2,
=
(2n)!
rt^O
n^O
r2 n
2n
(2 n)!
.(6.85)
Ale popyt na funkcje hiperboliczne jest niewielki. Ludzie są bardziej zain­
teresowani „rzeczywistymi” funkcjami trygonometrycznymi. Zwykłe funkcje
trygonometryczne możemy wyrażać korzystając z ich hiperbolicznych kuzy­
nów, zgodnie z wzorami
sin z = —isin h iz,
(6.86)
cos z = coshiz.
Odpowiadające im szeregi potęgowe to:
z1
1!
z°
z3
3!
z2
z5
5!
z4
sm z = ------------- 1------COS z = ------------- 1------0!
2!
4!
z1
z3
z5
S1DhZ = 7 T + 3 ! + 5! +
Z°
c o sh z
=
z 2
z4
_ + - + - +
Stąd ctg z = cos z/sin z = i cosh iz / sinh iz = i ctgh iz i otrzymujemy
ctg Z = Y _ B2i
n^O
(2iz) 2 n
(2n)!
v '
,2n
= X ( - 4 )n B2l
(2n)! •
n^O
(6.87)
Euler odkrył inny godny uwagi wzór na z ctg z (ćwiczenie 73):
ctg z = i —2 y~
k27t2
k^1
(6.88)
No proszę,
otrzymujemy
„rzeczywiste”
funkcje używając
liczb urojonych.
Rozwijając wzór Eulera względem z2, uzyskujemy
__ / z2
z4
+ ^
z c tg z =
z^
+ ^
\
+
y
k^1 x
= -' \ - 2 1( ^—
+ —
+ —
2 H(2)
00 ^
rj^r H(4)
n °0 ^
n 6 ^OO T+
i*
Jeśli przyrównamy współczynniki przy z 2vi w powyższym wyrażeniu ( 6 .8 7 ),
• dostaniemy niemalże cudowną postać zwartą dla nieskończenie wielu nieskoń­
czonych sum:
o 2 u —1 _ 2 n i 5
C(2 n) = H g n) = ( - 1 T ” 1 ------
2,t ,
całkowite n > 0 . (6.89)
Na przykład,
t(2) = H™ = 1 + * + ? + ••• = 7t2B2 = 7t2/6 ;
(6.90)
C(4) = H S ) = 1 + ^ + ^ + -- - =
(6.91)
-7 i4B4/3 = 7^ / 9 0 .
Wzór (6.89) nie jest wyłącznie postacią zwartą H ^ n), możemy z niego rów­
nież otrzymać przybliżoną wartość 6 2 ,, , ponieważ
jest bardzo bliskie 1
dla dużego n. Możemy z niego również wywnioskować, że (—1 )u _ 1 B2 n > 0,
dla wszystkich n > 0. A zatem niezerowe liczby Bernoulliego zmieniają znaki
na przemian.
Ale to jeszcze nie wszystko. Liczby Bernoulliego pojawiają się także we
współczynnikach funkcji tangens,
n^O
Zacznij
pomijać.
v
;
jak i w innych funkcjach trygonometrycznych (ćwiczenie 72). Wzór ( 6 .9 2 )
prowadzi do następnej ważnej własności liczb Bernoulliego, a mianowicie
4T1 (4n _ 1)
T2n - i
=
(—1 ) n
------------------B 2 n
jest dodatnie oraz całkowite. (6 .9 3 )
Na przykład mamy:
n
1 3
5
7
9
11
13
1
16
272
7936
353792
22368256
2
(Liczby T są nazywane liczbami tangens owymi.)
Jednym ze sposobów na udowodnienie wzoru ( 6 .9 3 ), zgodnie z pomysłem
B. F. Logana, jest rozpatrzenie szeregu potęgowego
sinz + x c o s z
cos z —x sin z
_
3
^ , z2
_ „ „ •? _ z 3
2 6
=
( 6 -94)
n>0
gdzie TTt(x) jest wielomianem względem x. Biorąc x = 0 , dostajemy Tn (0) =
Ta, n-tą liczbę tangensow^. Jeśli zróżniczkujemy (6.94) po x, otrzymamy
z 71
1
(cos z —x sin z )2
v
'
n^O
Natomiast jeżeli zróżniczkujemy po z, otrzymamy
1 4- x 2
. ,2
7-------(cos z —x s m z F
v
'
z n— 1
=
n^1
~n
------ TTT = H Tn + i ( x ) - r .
( n —1 )
z—
rt
vJn ^O
(Spróbuj sam — napotkasz ciekawe uproszczenia.) Mamy zatem
Tn+ 1 (x) = ( 1 + x 2 )T ;(x),
To(x) = x ,
( 6 .9 5 )
czyli prostą rekurencję, z której wynika, że współczynniki Tn (x) są nieujem­
nymi liczbami całkowitymi. Ponadto możemy łatwo udowodnić, że Tn (x) ma
stopień n + 1 i że jego współczynniki są na przemian zerowe oraz dodatnie.
Zatem T2 n+i (0) = T2 n+i jest dodatnią liczbą całkowitą, co odpowiada (6.93).
Wzór rekurencyjny (6.95) daje nam prosty sposób obliczania liczb Berno­
ulliego, via liczby tangensowe, na podstawie wyłącznie prostych operacji na
liczbach całkowitych. Dla porównania, definiujący wzór rekurencyjny (6.79)
wymusza użycie skomplikowanych rachunków na ułamkach.
Jeżeli chcemy obliczyć sumę n-tych potęg od a do (b — 1), zamiast od 0
do (n — 1 ), twierdzenie z rozdziału 2 daje nam
b- 1
Y
b
km = X a xm 6x = Sm( b ) - S m(a ).
(6.96)
k—a
Tożsamość ta ma interesujące konsekwencje, gdy rozważymy ujemne war­
tości k. Mamy
-1
Y_
k = —n + 1
n -1
km = (—1 )m X
k=0
km >
gdy m > 0 ,
Gdy x = tg w,
odpowiada to
tg(z + w ) . Stąd,
zgodnie
z twierdzeniem
Taylora, n-ta
pochodna tg w
wynosi Tn(tgw).
stąd
Sm( 0 ) - S m( - n + 1) = (—1)m (Sm(n) — Sm( 0 ) ) .
Ale Sm(0) = O, więc otrzymujemy tożsamość
Johann Faulhaber
niejawnie użył
( 6.97) w 1635
roku [119] w celu
znalezienia prostych
wzorów na Sm(n)
będących
wielomianami
n [ n + 1)/ 2 , gdy
m ^ 17; zobacz
[222].)
Sm(l —rt) = (—1)m+1Sm( n ) ,
v n > 0.(6.97)
Zatem Sm(l) = 0. Jeśli zapiszemy wielomian Sm(rt) w formie iloczynowej,
zawsze będą występowały w nim czynniki rt oraz (rt—1), ponieważ wielomian
ten ma pierwiastki 0 oraz 1. W ogólności, Sm(rt) jest wielomianem stopnia
m + 1 z wyrazem wiodącym -J —j-nm+1. Ponadto możemy podstawić rt = \
w (6.97) i wywnioskować, że Sm(^) = (—1)m+1 Sm(^). Jeśli m jest parzyste,
otrzymujemy Sm( | ) = 0, czyli dodatkowy czynnik (rt — j ) . Spostrzeżenia te
wyjaśniają, dlaczego w rozdziale 2 znaleźliśmy prosty rozkład na iloczyn
S2 (n) = | n ( n - | ) ( n - 1).
Mogliśmy na podstawie tego rozumowania otrzymać wartość S2(rt) unikając
obliczeń! Ponadto z równania (6.97) wnioskujemy, że wielomian z pozostają­
cymi czynnikami, Śm(rt) = Sm( n ) / ( n — j ) } zawsze spełnia
ŚmO —n ) — Ś m (n ),
m parzyste,
m > 0.
Wynika z tego, że Sm(n) możemy zawsze zapisać w formie iloczynowej:
m
S tu (ti) =
1
rm/2]
7 f i C71 — i — cxTc)(rt — ^ H- ocic),
+
-
m nieparzyste;
k = i
^
(6.98)
(n _ 1 ) m / 2
----- ~ r r TT ( n - A - ock) ( r t - A + a k) ,
m + 1 -L
k=1
m parzyste,
przy czym oc-i = j , i 0C2, . . . , <xpm/2l sai odpowiednimi liczbami zespolonymi,
których wartości zależą od m. Na przykład,
S3(n) = n 2( n - 1 ) 2/ 4 |
S4 (n) = n ( n - l ) ( n - 1) ( n - I + v/ 7 T T 2 ) ( n - i - v ^ 7 i 2 ) / 5 ;
S5(n) = n 2( n - 1)2( n - \ + ^ / 3 / 4 ) ( n - \ S6(n) = n ( n - i ) ( n - 1 ) ( n - i + a ) ( n - l - a ) ( n - l + a ) ( n - i - a )/7 ,
gdzie oc = 2 - 3/2 3 - 1/4 3 1 1/4 ^ V T \ + V 2 7 + i y / V f \ - V 2 7 ) .
Jeżeli m jest nieparzyste oraz większe od 1, mamy Bm = 0. Stąd Sm(n) jest
podzielne przez rt2 (i przez (n —l ) 2). W przeciwnym razie pierwiastki Sm(n)
nie podlegają takiej prostej regule.
Podsumujmy nasze badania dotyczące liczb Bernoulliego\poprzez przyj­
rzenie się ich powiązaniom z liczbami Stirlinga. Jednym ze sposobów na obli­
czenie Sm(n) jest zamienienie zwykłych potęg na ubywające, ponieważ sumy
ubywających potęg są prostsze. Po wykorzystaniu tych prostych sum możemy
wrócić do potęg zwykłych:
n— 1
zz
T l— 1
S m W = X . k'
n n —1
m
{I i
ki
k=0 j^O
k=0
kl
J k= 0
rt-j+i
m
= Z j •1J 3 +
1
ml
=Z
j^o
f l H F
k^O
1
i Ji +
j+ 1—k 'j + 1 n
k
A zatem, przyrównując współczynniki w ( 6 .7 8 ) z powyższymi, uzyskujemy
tożsamość
£{7
’
i3=o
'j + 1'
k
1 )i+i - k
j+ 1
1
m +1
/m +1
Bm +l-k ,
k >
0.
( 6 .9 9 )
Dobrze byłoby udowodnić powyższy związek wprost, odkrywając liczby Ber­
noulliego na nowo. Ale tożsamości w tabeli 296 oraz 297 nie prowadzą nas w
oczywisty sposób do dowodu przez indukcję tego, że lewostronna suma rów­
nania ( 6 .9 9 ) jest stałą wymnożoną przez m ^ - . Jeżeli k = m + 1 , lewostronna
suma odpowiada dokładnie {™} [™ +]]/(m + 1 ) = 1 / (m + 1 ), więc ten przypa­
dek jest łatwy. Gdy k = m, lewa strona sumuje się do { ^ 1 } [m] m _ 1 —
{m} l?71^ 1] (m + l ) - 1 —
1) —
Zatem przypadek ten również
jest dosyć prosty. Ale jeśli k < m, lewostronna suma wygląda wyjątkowo
nieprzyjemnie. Bernoulli prawdopodobnie nie odkryłby swoich liczb, gdyby
wybrał tę drogę.
Jedyne, co możemy zrobić, to zastąpić {™} przez
} — (j + 1){j™ }•
Wówczas (j + 1) upraszcza się z niewygodnym mianownikiem, a lewa strona
równania wygląda następująco:
Z
m +1
j + 1
j + 1 ( - D i+1 -k
k
j+ i
(_ 0 H1
Druga suma jest zerowa przy k < m, zgodnie z ( 6 .3 1 ). A zatem zostaje nam
tylko pierwsza suma dopraszająca się zmiany notacji. Przemianujmy wszyst-
Przestań
pomijać.
kie zmienne tak, aby otrzymać indeks sumacyjny k oraz dwa inne parametry
m oraz rt. Tożsamość (6.99) jest równoważna
M )
k—m
1 fn
Bn—m + [m = U — 1]
n \m
m >
0.
(6.100]
Dobrze, dostaliśmy teraz coś przyjemniejszego — chociaż w dalszym ciągu z
tabeli 297 nie wynika jasno, co robić dalej.
Na ratunek przychodzą nam wzory splotu z tabeli 304. Możemy zasto­
sować zależności (6.49) oraz (6.48), aby wyrazić każdy składnik za pomocą
wielomianów Stirlinga:
=
n!
in—k+1
(-1
(— l ) k - m
M
r -
0 "n—
k(
k)
k!
(m —1 )!
crk- m ( k ) ;
.pi
=
Sytuacja poprawia się. Wykorzystując regułę splotu (6.46), przy t = 1 otrzy­
mujemy
Tl
Tl—Ta
Y O n-k(-k) <k_ m(k) =
cru_ m_ k ( - n + ( n - m - k ) ) ak(m + k)
7
k=0
k=0
m —n
(m )(—n)
o-n_ T a ( m - n + (n -m )) .
W ten sposób wzór (6.100) uzyskał potwierdzenie, a my dowiedzieliśmy się,
że liczby Bernoulliego są związane ze stałymi wyrazami w wielomianach Stir­
linga:
Przestań
kartkować.
Bm
m!
/-A\
(6.101)
6.6. Liczby Fibonacciego
Dochodzimy teraz do szczególnego ciągu liczb, zapewne najbardziej przyjem­
nego ze znanych nam, ciągu Fibonacciego (Fn):
u
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Fn
0
1
1
2
3
5
8
13
21
34
55
89
144
233
377
W przeciwieństwie do liczb harmonicznych, oraz liczb Bernoulliego, liczby
Fibonacciego są zwykłymi liczbami całkowitymi. Definiujemy je wzorem rekurencyjnym
F0 = 0;
F, = 1;
Fu = Fn_! + Fn - 2 ,
dla n > 1 .
(6 .1 0 2 )
Prostota tej reguły— najprostsza możliwa rekurencją, w której każda liczba
zależy od dwóch poprzednich— powoduje, że liczby Fibonacciego pojawiają
się w bardzo wielu sytuacjach.
„Drzewa pszczół” dostarczają dobrego przykładu na to, w jak naturalny
sposób pojawiają się liczby Fibonacciego. Rozważmy rodowód samca pszczo­
ły. Każdy samiec (znany także jako truteń) jest spłodzony bezpłciowo z sa­
micy (znanej również jako królowa). Jednak każda samica ma dwoje rodziców,
samca i samicę. Oto kilka pierwszych poziomów drzewa:
c?—j—ę
ę
c^-y-9
9
— |— 9
d--------1-------- ę
9
&
Truteń ma jednego dziadka i jedną babcię, jednego pradziadka i dwie pra­
babcie. Ma dwóch prapradziadków i trzy praprababcie. W ogólności, ła­
two sprawdzić przez indukcję, że ma dokładnie F^+i pran-dziadków i Fn + 2
pra^-babć.
Liczby Fibonacciego spotykamy często w przyrodzie, zapewne z powodów
podobnych do reguł w drzewie pszczół. Na przykład, typowy słonecznik ma
dużą głowę zawierającą spirale ciasno upakowanych nasion, zwykle z 34 zwo­
jami w jednym kierunku oraz z 55 w drugim. Mniejsze głowy mają 21 oraz 34
spiral albo 13 oraz 2 1 . Pewien gigantyczny słonecznik z 89 i 144 spiralami
był raz eksponatem na wystawie w Anglii. Podobne wzory odnajdujemy w
niektórych gatunkach szyszek sosnowych.
A oto przykład odmiennej natury [278]. Przypuśćmy, że kładziemy dwie
szyby, jedna na drugiej. Na ile sposobów an promienie świetlne przechodzą
Naturalistyczny
charakter tego
przykładu jest
szokujący. Książka
ta powinna być
zakazana.
iWM
6 , L iczby szczeg ó ln e 43
M M H
H M
ś S ifM
.™
albo odbijają się po zmianie kierunku rt razy? Pierwszych kilka przypadków
wygląda następująco:
a0 = 1
„La suitę de
Fibonacci possede
des proprietes
nombreuses fort
interessantes.”
E. Lucas [259]
ai = 2
0-2 = 3
0-3 = 5
Gdy n jest parzyste, mamy parzystą liczbę odbić, a promień przechodzi przez
szyby. Gdy n jest nieparzyste, promień odbija się i pojawia po tej samej
stronie, z której przybył. Kolejne wyrazy ciągu a n wydają się odpowiadać
liczbom Fibonacciego, a krótkie przyjrzenie się rysunkowi mówi nam, jaki jest
tego powód. Dla rt ^ 2, promień o u odbiciach albo odbija się od dolnej po­
wierzchni, kontynuując bieg na an_i sposobów, albo zaczyna od odbicia od
środkowej powierzchni, a później od górnej, kontynuując na a n _ 2 sposobów.
A zatem otrzymujemy rekurencję Fibonacciego an = an_i + an_ 2. Warunki
początkowe różnią się nieco, ponieważ mamy ao = 1 = F2 oraz ai = 2 = F3 .
Oznacza to, że oba ciągi są przesunięte względem siebie o dwie pozycje, czyli
O-Ti = Fn+2 Leonardo Fibonacci przedstawił swoje liczby w roku 1 2 0 2 . Matematycy
stopniowo zaczęli odkrywać coraz więcej interesujących własności liczb Fi­
bonacciego. Edouard Lucas, twórca łamigłówki Wieże z Hanoi omawianej w
rozdziale 1 , prowadził szeroko zakrojone badania nad tymi liczbami w drugiej
połowie dziewiętnastego wieku (to właśnie Edouard Lucas spopularyzował
nazwę „liczby Fibonacciego”). Jednym ze zdumiewających rezultatów jego
prac było wykorzystanie własności liczb Fibonacciego do udowodnienia, że
39-cyfrowa liczba Mersenne’a 2 127 — 1 jest liczbą pierwszą.
Jednym z najstarszych twierdzeń dotyczących liczb Fibonacciego, po raz
pierwszy opublikowanym przez włoskiego astronoma Jean-Dominique Cassiniego w 1680 roku [55], jest tożsamość
Fn+1Fn_ , - F 2 = (-1)
dla rt > 0 .
(6 .1 0 3 )
Na przykład, gdy n = 6 , tożsamość Cassiniego poprawnie stwierdza, że 135 — 8 2 równa się 1. (Johannes Kepler znał to prawo już w 1608 roku [202].)
Wzór wielomianowy zawierający liczby Fibonacciego w postaci Tn±}c, dla
małych wartości k, możemy przekształcić we wzór zawierający wyłącznie Fn
oraz Fn+i, jeśli zastosujemy regułę
Fm
=
Fm + 2
Fm + i ,
(6 .1 0 4 )
aby wyrazić Fm za pomocą większych liczb Fibonacciego, kiedy m < n, oraz
Fm
~
F m _ 2 H- F m _ i
(6 .IO 5 )
. 6 . L iczby F ib on acciego
aby zastąpić Fm mniejszymi liczbami Fibonacciego, gdy m > n + 1. Oznacza
to, że liczbę F^-i możemy zastąpić przez Fn+i —Fn w ( 6 . 1 0 3 ), aby otrzymać
tożsamość Cassiniego w następującej postaci:
(6 .1 0 6 )
F2 +1 - F 11+ 1 Fn - F 2 = ( - 1 ) n .
Ponadto tożsamość Cassiniego zamienia się w
Fn+ 2 Fn - F 2 + 1 = ( - 1 ) n+\
kiedy n zastąpimy przez ( n + 1 ) . Odpowiada to (F^+i + Fn )Fu — F2 +1 =
(—1)n+1, co jest równoważne ( 6 . 1 0 6 ). A zatem Cassini(rt) jest prawdziwe
wtedy i tylko wtedy, gdy Cassini(rt+1) jest prawdziwe. Równanie ( 6 . 1 0 3 )
zachodzi dla wszystkich n przez indukcję.
Tożsamość Cassiniego jest podstawą geometrycznego paradoksu będą­
cego jedną z ulubionych łamigłówek Lewisa Carrolla [64], [320], [365]. Dzie­
limy szachownicę na cztery części zgodnie z poniższym rysunkiem, a następ­
nie składamy je tworząc prostokąt:
Presto! Początkowa powierzchnia składająca się z 8 x 8 = 64 kwadratów
została przekształcona do powierzchni złożonej z 5 x 13 = 65 kwadratów!
Podobna konstrukcja dzieli dowolny kwadrat Fn x Fr,. na cztery części, przy
czym wymiary Fn+i, F^, F^-i oraz Tn-2 odpowiadają wymiarom 13, 8 , 5
i 3 na rysunku. W wyniku otrzymujemy prostokąt Fn- i x Fn+ i . Zgodnie z
( 6 . 1 0 3 ), zyskujemy lub tracimy kwadrat jednostkowy, w zależności od tego,
czy rt jest parzyste, czy nieparzyste.
Ściśle mówiąc, nie możemy stosować redukcji ( 6 . 1 0 5 ), chyba że m ^ 2 , po­
nieważ nie zdefiniowaliśmy liczb Fu dla ujemnych wartości rt. Wiele naszych
działań stanie się prostszych, kiedy wyeliminujemy ten wiążący warunek wy­
korzystując wzory ( 6 . 1 0 4 ) oraz ( 6 . 1 0 5 ) do zdefiniowania liczb Fibonacciego
z ujemnymi indeksami. Na przykład, F_i okazuje się być Fi —Fo = 1. Stąd
F_ 2 wynosi Fq —F_i = —1. W ten sposób otrzymujemy kolejne wartości
n
0
-1
-2
-3
-4
-5
-6
-7 .
-8
-9
-1 0
-1 1
Fn
0
1
-1
2
-3
5
-8
13
-2 1
34
-5 5
89
Paradoks bierze się
stąd, że ... cóż,
magiczne sztuczki
nie są po to, aby je
wyjaśniać.
i szybko staje się jasne (przez indukcję), że
F_n = (—1)TV—1
,
dla całkowitych n. (6.107)
Tożsamość Cassiniego (6.103) jest prawdziwa dla wszystkich liczb całkowi­
tych ri, a nie tylko dla n > 0, gdy rozszerzymy w ten sposób ciąg Fibonac­
ciego.
Proces redukcji Fn±k do kombinacji F^ oraz Fn+i za pomocą (6.105) oraz
(6.104) prowadzi nas do ciągu formuł
Frt+2 =
Fn+1 -f- Fn ,
F-a—i = Fu_|_i
Fn ,
Frt+3 = 2Ftl_|_i + Fn,
Fn_2 = Fn+1
“1“ 2Fn ,
Frt+4
= 3Fn _|_i + 2Fn ,
FrL—3
=
2F t x + \
Fn+5
— 5Fn + ] + 3Fn ,
Fn _ 4
=
3F n .+ i
^F^ ,
~F 5 F n
w którym pojawia się nowa zależność:
Fn+k
=
F^Fn-i-i + F ^ —i F n .
( 6 .1 0 8 )
Tożsamość ta, łatwo dowodzona przez indukcję, zachodzi dla wszystkich liczb
całkowitych k i rt (dodatnich, ujemnych oraz zerowych).
Jeżeli podstawimy k = rt w (6.108), zobaczymy, że
F2n = Ftt.Ftl+ 1 + Fn_iFn .
(6.109)
A stąd F2n jest wielokrotnością F^. Podobnie
F3n = F2nFn+1 ~FF2n—1Fn. ,
i możemy teraz wywnioskować, że F3U jest również wielokrotnością Fn . Przez
indukcję,
Fkn jest wielokrotnością Fn ,
(6.110)
dla wszystkich liczb całkowitych k i rt. Tłumaczy to, dlaczego F15 (którego
wartość wynosi 610) jest wielokrotnością obu liczb F3 oraz F5 (wynoszących
odpowiednio 2 i 5). W rzeczywistości możemy udowodnić jeszcze więcej (ćwi­
czenie 27):
NW D(Fm,Fn ) = F]sjYVD(m,n) •
(6.111)
Na przykład, NW D(F12,F i8) = N W D (144, 2584) = 8 = F6.
Możemy teraz udowodnić odwrotność (6.110). Jeżeli rt > 2 oraz Fm
jest wielokrotnością Fn , wówczas m jest wielokrotnością rt. Jeśli Fn\F m, to
Fn\N W D (F m,Fn ) — Fnwd(m,n) ^ Fn . Jest to możliwe wyłącznie wtedy,
gdy FMWD(m,u) = Fn- Przy naszym założeniu, że rt > 2, musi zachodzić
N W D (m ,n ) = tl. Stąd n \m .
Rozszerzenie powyższej idei podzielności było wykorzystane przez Ju­
rija Matijasiewicza w jego słynnym dowodzie [266], że nie istnieje algorytm
rozstrzygający, czy dane równanie wielomianowe z wieloma zmiennymi oraz
współczynnikami całkowitymi posiada rozwiązanie w liczbach całkowitych.
Lemat Matijasiewicza stwierdza, że jeśli n > 2, liczba Fibonacciego Fm jest
wielokrotnością F2 wtedy i tylko wtedy, gdy m jest wielokrotnością nFu .
Udowodnijmy to przyglądając się ciągowi (F^n mod F2) dla k = 1, 2,
3, . . . , patrząc, kiedy F^n mod F2 = 0. (Wiemy, że m musi miećpostać kn,
jeśli Fm mod Fn = 0 .) Na początku mamy Fn mod F2 = Fn .Wartość ta jest
niezerowa. Następnie
F2 n = FnJn+i H- Fn—iFn — 2FnFn+i
(mod Fn ) ,
zgodnie z ( 6 . 1 0 8 ), ponieważ Fn+i = F^-i (mod Fn ). Podobnie
F2 n +1 = Fn+1 + F n = ^n+1
(mod F2 ) .
Powyższa kongruencja pozwala nam na obliczenie
F3n = F2 n +1 Fn H- F2 nFn—1
= F2 + 1 Fn + (2FnFn + 1 }Fn+) = 3F2 + 1Fn
F3n+1 = F2 n +1 Fn+1 + F2 nFn
= F* +1 + (2FnFn + 1 )Fn = F" +1
(mod F2 ) ;
(mod F2) .
W ogólności, korzystając z indukcji po k zauważamy, że
Fkn = kFnF £ ]
i
Fkn + 1 = F i +1
(mod F2 ) .
Liczby F^+i oraz Fn są względnie pierwsze, więc
Fkn = o
(mod F*)
kFn =
k =
0
(mod F.£)
0
(mod Fn ) •
Udowodniliśmy właśnie lemat Matijasiewicza.
Jedną z najważniejszych własności liczb Fibonacciego jest sposób, w jaki
można je zastosować do reprezentacji liczb całkowitych. Zapiszmy
j> k
j ^ k + 2.
(6.112)
Wówczas każda dodatnia liczba całkowita ma jednoznaczną reprezentację w
postaci
ti = Fkl + Fk2 + • • • + Fkr ,
ki > k2 > • • • > kr » 0.
(6.113)
(Jest to „twierdzenie Zeckendorfa” [246], [382].) Na przykład, reprezentacja
jednego miliona wygląda następująco
1000000 = 832040 + 121393 + 46368 + 144 + 55
—
F30
+
^26
+
F24 + F i 2 + F i o .
Zawsze możemy znaleźć taką reprezentację używając metody zachłannej, wy­
bierając Fkl jako największą liczbę Fibonacciego ^ rt, następnie wybierając
Fk2 jako największą liczbę będącą ^ (rt — Fk l), i tak dalej. (Dokładniej,
przypuśćmy, że Fk ^ rt < Fk+1. Wówczas mamy 0 ^ rt — Fk < Fk+i —
Fk = Fk_ i. Jeśli rt jest liczbą Fibonacciego, to warunek (6.113) zachodzi
dla r = 1 oraz ki = k. W przeciwnym razie (rt — Fk) ma reprezentację
Fibonacciego Fk2 H------- hFkr, przez indukcję względem tl. A (6.113) zachodzi,
jeśli podstawimy ki = k, ponieważ z nierówności Fk2 ^ rt — Fk < Fk_i
wynika, że k » k2.) I odwrotnie, z każdej reprezentacji w postaci (6.113)
wynika, że
Fkl <C rt < Fkl+1 ,
ponieważ największa możliwa wartość Fk2 H-------b Fkr przy k
kr
0, wynosi
Fk-2 + Fk-4 H-------F Fkmod2+2 = Fk_! — 1 ,
k2 ^> • • • ^>
jeśli k ^ 2.
(6.114)
(Wzór ten łatwo udowodnić przez indukcję względem k. Lewa strona jest
zerowa, gdy k wynosi 2 lub 3.) Zatem ki jest zachłannie wybraną wartością
opisaną wcześniej, czyli reprezentacja musi być jednoznaczna.
Każdy jednoznaczny system reprezentacji jest systemem liczbowym. Za­
tem twierdzenie Zeckendorfa prowadzi do system u liczbowego Fibonacciego.
Możemy reprezentować każdą nieujemną liczbę całkowitą rt jako sekwencję 0
oraz 1, pisząc
m
rt = (bmbm_i . .. b2)F
\ /
ti — ^ t>kFk .
(6.115)
k=2
Powyższy system liczbowy przypomina notację dwójkową (system 2) uzu­
pełnioną o dodatkowy warunek, że dwie 1 nigdy nie występują obok siebie.
Poniżej liczby od 1 do 20, w reprezentacji Fibonacciego:
1 = ( 0 0 0 0 0 1 )F
6 = (0 0 1 0 0 1 )f
11 =
(0 1 0 1 0 0 )F
16 = ( 1 0 0 1 0 0 )?
2 =
7 = (001010)f
1 2=( 010101) f
17 = (100101)f
(00001 0)f
Hf.
6.6. L iczby F ib o n acciego]
3 = ( 0 0 0 1 0 0 )T
8 = (010000)]=
13 = (100000),:
18 = (101000)f
4 = (000101 )r
9 =( 010001)F
14 = (100001 )F
19 = (101001 )F
5 = (0 0 1 0 0 0 ) F
1 0 = (010010)i=
15 = (100010)f
20 = (10101 0)f
Porównajmy, dla kontrastu, reprezentację jednego miliona w systemie Fibo­
nacciego, pokazaną przed chwilą, z jego reprezentacją dwójkową 2 19 + 2 18 +
217+ 216 + 214 + 29 + 26:
(1000000) 10 =
=
(10001010000000000010100000000) F
(11110100001001000000)2.
Reprezentacja Fibonacciego potrzebuje kilka bitów więcej, ponieważ sąsiadu­
jące 1 nie są w niej dozwolone. Niemniej obie reprezentacje są analogiczne.
Chcąc dodać 1 w systemie liczbowym Fibonacciego, napotykamy dwa
przypadki: Jeśli „cyfrą jednostkową” jest 0, to zmieniamy ją na 1. W ten
sposób dodajemy F2 = 1 > ponieważ cyfra jednostkowa odpowiada F2 . W
przeciwnym razie dwie najmniej znaczące cyfry to 01 i zamieniamy je na 10
(a tym samym dodajemy F3 —¥2 = 1)- Jesteśmy zmuszeni „przenosić” 1 tak
długo, jak to jest potrzebne, zamieniając sekwencję cyfr ‘011 ’ na ‘1 0 0 ’, aż nie
będzie dwóch 1 z rzędu. (Reguła ta jest równoważna zastępowaniu Fm+i +F m
przez Fm+2.) Na przykład, aby przejść od 5 = (1000)F do 6 = (1001 )F lub od
6 = (1001 )F do 7 = (1010)f niepotrzebne są przenoszenia. Ale aby przejść od
7 = ( 1 0 1 0 )f do 8 = ( 1 0 0 0 0 )f musimy przenieść I dwa razy.
Do tej pory wiele mówiliśmy o własnościach liczb Fibonacciego, ale nie
znaleźliśmy jeszcze ich postaci zwartej. Nie mamy również postaci zwartych
dla liczb Stirlinga, liczb Eulera oraz liczb Bernoulliego. Niemniej byliśmy
w stanie odkryć postać zwartą Fln =
dla liczb harmonicznych.
Czy istnieje związek pomiędzy Fn i innymi znanymi nam wielkościami? Czy
możemy „rozwiązać” rekurencję definiującą Ftl?
Odpowiedź brzmi: tak. W rzeczywistości, istnieje prosty sposób na roz­
wiązanie rekurencji poprzez użycie metody funkcji tw orzących, której przyj­
rzeliśmy się krótko w rozdziale 5. Rozważmy szereg nieskończony
V(z) = -F0 + h z + h z 2 + --- =
(6-116)
Tt^O
Jeżeli możemy znaleźć prosty wzór na F(z), mamy spore szanse na znalezienie
prostego wzoru dla jego współczynników Fn .
W rozdziale 7 skoncentrujemy się szczegółowo na funkcjach tworzących,
ale wygodnie będzie mieć poniższy przykład pod ręką, zanim tam dotrzemy.
„S it
1 -f-x -f- 2xx -f- 3x3 -I5x4 + 8x5 + 13xe +
21 x7 + 34x8 &c
Series nata ex
divisione Unitatis
per Trinomium
1 — x — XX.”
A. de Moivre [275]
„Wielkości r , s, t,
które wykazują
powiązania
wyrazów,
są takie same,
jak te
w mianowniku
ułamka. Własność
tę, jakkolwiek
oczywista może się
nam ona wydawać,
jako pierwszy
wykorzystał
M. DeMoivre,
w rozwiązywaniu
problemów
z szeregami
nieskończonymi,
które w przeciwnym
razie byłyby bardzo
zawiłe.”
J. Stirling [344]
Szereg potęgowy F(z) ma przyjemną własność uwidaczniającą się, gdy po­
mnożymy go przez z oraz przez z2:
F(z)
= F0 + F ,z
+ F2z 2 + F3z 3 + F4 z 4 + F5z 5 + • • • ,
zF(z)
=
+ Fi z 2 + F2Z3 + F3z 4 + F4 z 5 + • • • ,
z 2 F(z)
=
F0z
F0z 2 + F ,z 3 + F 2 z 4 + F3 z 5 + • • • .
Jeżeli teraz odejmiemy dwa ostatnie równania od pierwszego, wyrazy zawie­
rające z2, z 3 oraz wyższe potęgi z znikną zgodnie z rekurencją Fibonacciego.
Ponadto stały składnik Fo faktycznie nie pojawi się w ogóle, ponieważ Fo = 0.
Zatem wszystko, co zostało po odjęciu, wynosi (Fi — Fo)z i jest równe z.
Innymi słowy,
F(z) —zF(z) —z 2 F ( z ) = z ,
a rozwiązując to równanie względem F(z) otrzymujemy wzór bezpośredni
=
(6 - 7 )
Skondensowaliśmy zatem całą informację o ciągu Fibonacciego w pros­
tym (aczkolwiek mało mówiącym) wyrażeniu z/(1 —z —z2). Jest to, wierzcie
lub nie, krok do przodu, ponieważ możemy przedstawić mianownik w postaci
iloczynu, a następnie użyć ułamków częściowych, aby otrzymać wyrażenie,
które możemy łatwo rozwinąć w szereg potęgowy. Współczynniki w tym sze­
regu potęgowym będą odpowiadały postaci zwartej liczb Fibonacciego.
Właśnie naszkicowany plan ataku zapewne łatwiej będzie zrozumieć, jeśli
przyjrzymy mu się od końca. Gdybyśmy mieli prostszą funkcję tworzącą, po­
wiedzmy 1 / ( 1 —<xz), gdzie a jest stałą, znalibyśmy współczynniki wszystkich
potęg z, ponieważ
1 — OLZ
=
1 + ocz + oc2z 2 + a 3 z 3 Ą-----.
Podobnie, gdybyśmy mieli funkcję tworzącą w postaci A/(1 —<xz)+B/(1 —|3z),
nadal nie byłoby trudno wyznaczyć współczynniki, ponieważ
A
az
B
1 —6 z
= A ^ ( « z ) n + BjT(Pz)n
n>0
=
n>0
£ _ ( A a T1 + B|3T') z Tl.
rt^O
Zatem pozostało tylko obliczenie stałych A, B, oc oraz |3 takich, że
A
B
1 — ocz
1 — |3z
_
z
1 —z —z 2 ’
( 6 . 118 )
333
. L iczb y F ib on acciego
a znajdziemy wówczas postać zwartą A a u + B(3n dla współczynnika Fn przy
zn w F(z). Lewą stronę możemy zapisać jako
A
B
_ A —A( 3 z +B —Bocz
1 — ocz ~*~ 1 — |3z
(1 — az)(1 — |3z)
czyli cztery stałe, których szukamy, są rozwiązaniami dwóch równań wielo­
mianowych:
(1 — ocz)(1 — |3z) = 1 —z —z2 ;
(6 .1 1 9 )
(A + B) — (A|3 + B a)z = z .
(6 .1 2 0 )
Chcielibyśmy przedstawić mianownik F(z) w postaci iloczynu (1 —<xz)(1 —(3z).
Wówczas będziemy mogli wyrazić F(z) jako sumę dwóch ułamków, w których
czynniki (1 — ocz) oraz (1 — |3 z) nie będą występować razem.
Zauważmy, że czynniki w mianowniku w równaniu ( 6 . 1 1 9 ) zostały za­
pisane w postaci (1 — ocz) (1 — |3 z), zamiast w częściej używanej postaci
c ( z —p i ) (z —P2 ), gdzie pi i p2 są pierwiastkami. Przyczyną tego jest fakt, iż
(1 — ocz)(1 — (3 z) prowadzi do wygodniejszych rozwinięć w szeregi potęgowe.
Stałe oc i (3 możemy znaleźć na wiele sposobów. W jednym z nich posłu­
żymy się zręcznym chwytem. Wprowadzamy nową zmienną w i próbujemy
znaleźć rozkład na czynniki
Jak zwykle, autorzy
nie mogą oprzeć się
trikom.
w 2 —wz —z2 = (w —ocz) (w — (3z ) .
Następnie możemy po prostu podstawić w = 1 i dostaniemy czynniki 1 —
z — z2. Pierwiastki równania kwadratowego w 2 — w z — z 2 = 0 wyglądają
następująco:
Z dz ~\JZ2 + 4z 2
2
1 d= \/5
=
2
Z
‘
Zatem
2
2
(
1+^5 \ /
1 — V5 \
w —w z —z = I w ------- -— z 1 I w --------— z I
i otrzymujemy stałe oc oraz (3, których szukaliśmy.
Liczba (1 + y/5 )/2 « 1,61803 występuje w wielu działach matematyki,
jak również w świecie sztuki, gdzie już w starożytności była uważana za naj­
bardziej zadowalający stosunek, w wielu różnych projektach. Dlatego też nosi
szczególne miano— złotego podziału. Oznaczamy ją grecką literą (f>, na cześć
Fidiasza, o którym mówi się, że świadomie używał jej w swoich rzeźbach.
Drugi pierwiastek równania kwadratowego (1 — >/5)/2 = —1/4> « —0,61803
Stosunek wysokości
człowieka do
wysokości położenia
jego pępka wynosi
w przybliżeniu
l , 618, zgodnie
z obszernymi
empirycznymi
obserwacjami
prowadzonymi
przez europejskich
uczonych [136].
ma wiele własności 4>, a zatem ma szczególną nazwę $ , „fi z daszkiem.” Obie
liczby są pierwiastkami równania kwadratowego w 2 —w — 1 = 0 , mamy więc
cf>2 = 4> + 1 ;
$2 = $ + 1.
(6.121)
(Więcej o c() i $ później.)
Znaleźliśmy stałe oc = ej) oraz |3 = $ potrzebne w równaniu (6.119). Wy­
starczy teraz znaleźć A i B w (6.120). Podstawiając z = 0 do tego równania,
otrzymujemy B = —A, zatem (6.120) skondensowaliśmy do
- $ A + 4>A = 1 .
Otrzymujemy rozwiązanie A = 1/(<t> — $ ) = 1/ \ / 5, czyli rozbicie na ułamki
proste (6.117) wynosi
F(z) = 7
i
G
(6'122)
Dobrze, dostaliśmy F(z) dokładnie tam, gdzie chcieliśmy. Rozwijając ułamki
w szereg potęgowy, tak jak w (6.118), dostaniemy postać zwartą współczyn­
nika przy zn :
^
(6 . 1 2 3 )
(Wzór ten był po raz pierwszy opublikowany przez Daniela Bernoulliego w
roku 1728, ale został zapomniany i powtórnie odkryty przez Jacąuesa Bineta
[31] w roku 1843.)
Zanim zaczniemy podziwiać nasze wyprowadzenie, powinniśmy najpierw
sprawdzić jego ścisłość. Dla u = 0 ze wzoru poprawnie otrzymujemy Fo = 0 .
Dla rt = 1, dostajemy Fi = (4> — $ ) / \ / 5, rzeczywiście odpowiadające 1. Dla
wyższych potęg, równania (6.121) mówią nam, że liczby zdefiniowane przez
(6.123) spełniają rekurencję Fibonacciego, a zatem przez indukcję muszą być
liczbami Fibonacciego. (Moglibyśmy także rozwinąć <j)n oraz $ n korzysta­
jąc z twierdzenia dmumianowego, wyławiając w ten sposób różne potęgi y/5 .
Zaczynamy się powoli gubić. Sednem postaci zwartej nie jest koniecznie do­
starczenie nam szybkiej metody obliczania, ale raczej pokazanie powiązań
pomiędzy Fn oraz innymi wielkościami w matematyce.)
Posiadając dar jasnowidzenia, moglibyśmy zgadnąć wzór (6.123) oraz
udowodnić go przez indukcję. Metoda funkcji tworzących jest bardzo sil­
nym mechanizmem, umożliwiającym nam wyprowadzenie tego wzoru. W roz­
dziale 7 zobaczymy, że ta sama metoda doprowadzi nas do rozwiązania znacz­
nie trudniejszych wzorów rekurencyjnych. Nawiasem mówiąc, nigdy nie mar­
twiliśmy się, czy sumy nieskończone w naszym wyprowadzeniu (6.123) były
zbieżne. Okazuje się, że większość działań na wpółczynnikach szeregów po­
tęgowych może być całkowicie uzasadniona, niezależnie od tego, czy sumy
faktycznie są zbieżne [182]. Sceptyczni czytelnicy, ciągle podejrzewający błęd­
ność rozumowania z sumami nieskończonymi, mogą uspokoić się faktem, że
równanie (6 . 1 2 3 ), raz odkryte przy użyciu szeregu nieskończonego, może być
potwierdzone rzetelnym dowodem przez indukcję.
Jednym z ciekawszych wniosków płynących z równania ( 6 . 1 2 3 ) jest fakt,
że całkowite Fn jest niewiarygodnie bliskie wymiernej liczby Ą)n/V 5 dla du­
żych n. (Ponieważ wartość bezwzględna $ jest mniejsza niż 1,
staje się
wykładniczo małe i jego znaczenie jest właściwie pomijalne.) Na przykład,
F10 = 5 5 oraz Fn = 89 są bardzo bliskie
cb10
« 55,00364
y/5
i
cb1^
^
V5
« 88,99775.
Możemy użyć tego spostrzeżenia do wyprowadzenia jeszcze jednej postaci
zwartej,
Ft. =
^
1
V5 + 2
(b71
= —■= zaokrąglone do liczby całkowitej,
V5
(6 . 1 2 4 )
ponieważ | $ n/\ /5 | ^ 2 j dla wszystkich tl ^ 0. Grdy tl jsst parzystej
j^st
nieco mniejsze niż 4>TVv^5. W przeciwnym razie jest nieco większe.
Tożsamość Cassiniego ( 6 . 1 0 3 ) można zapisać w następujący sposób:
Fn+i
F„rt
F^
Fr,_
' t l —1
( - 1 )*
' n —1 i n
Dla dużego n, 1/F n -i F^, jest bardzo małe, więc iloraz Fn+i /Fn musi być
bardzo bliski Fn/FrL_i, a równanie ( 6 . 1 2 4 ) mówi nam, że stosunek ten osiąga
4>. Istotnie, mamy
n+1
(Prawdziwość tej tożsamości sprawdzamy dla n = 0 oraz rt = 1 i dowodzimy
przez indukcję dla rt > 1. Możemy również udowodnić ją bezpośrednio przez
podstawienie do ( 6 . 1 2 3 ).) Stosunek F^+t/F^ jest bardzo bliski ej), osiąga­
jąc na przemian wartości większe i mniejsze niż (f>. Nawiasem mówiąc, (f>
jest również bardzo bliskie liczbie kilometrów w mili. (Dokładna wartość tej
liczby wynosi 1,609344, ponieważ 1 cal odpowiada 2,54 centymetrom.) Daje
nam to wygodny sposób przeliczania w pamięci kilometrów na mile, ponie­
waż odległość Fn+i wyrażona w kilometrach odpowiada niemalże dokładnie
odległości Fn wyrażonej w milach.
Jeśli USA
kiedykolwiek
przejdą na system
metryczny; ich znak
ograniczenia
prędkości zmieni się
z 55 m il/h na 89
km/h. No chyba,
że ludzie z drogówki
będą
wspaniałomyślni
i pozwolą im
jeździć 90.
Reguła
„przesunięcia-wdół” zmienia n w
f (n/(J)), a reguła
„przesunięcia-wgórę” zmienia n w
f (tl4>) , gdzie
f(x) =
+
Przypuśćmy, że chcemy zamienić liczbę kilometrów, nie będącą liczbą
Fibonacciego, na mile. Jakiej odległości odpowiada 30 km w standardzie
amerykańskim? To proste: zamieniamy w pamięci 30 na jego reprezentację
w systemie liczbowym Fibonacciego 2 1 + 8 + 1 używając metody zachłannej, wyjaśnionej wcześniej. Możemy teraz przesunąć każdą liczbę w dół o
jedną pozycję, otrzymując 13 + 5 + 1. (Poprzednie *1* odpowiadało F2 , po­
nieważ kr > 0 w (6 . 1 1 3 ). Nowe ‘1’ odpowiada Fi .) Przesunięcie w dół dzieli
mniej więcej przez (f>. Stąd otrzymujemy 19 mil. (Całkiem blisko, ponie­
waż właściwa odpowiedź to około 18,64 mili.) Podobnie, aby przejść od mil
do kilometrów, używamy odwrotnego przesunięcia. 30 mil to w przybliżeniu
34 + 13 + 2 = 49 kilometrów. (Już nie tak dokładnie, ponieważ poprawna
odpowiedź to mniej więcej 48,28.)
Okazuje się, że reguła przesunięcia-w-dół daje poprawnie zaokrągloną
liczbę mil odpowiadającą rt kilometrom dla wszystkich rt ^ 1 0 0 , z wyjątkiem
rt = 4, 12, 54, 62, 75, 83, 91, 96 i 99, kiedy to niedokładność przybliżenia
nie przekracza 2/3 mili. Reguła przesunięcia w górę daje albo poprawnie
zaokrągloną liczbę kilometrów odpowiadającą rt milom, albo o 1 km za dużo,
dla wszystkich rt ^ 113. (Jedyny naprawdę żenujący przypadek pojawia się
przy rt = 4, kiedy to oba błędy zaokrągleń, dla rt = 3 + 1 , sumują się zamiast
nawzajem się znosić.)
6.7. K ontyn uanty_______________________________
Liczby Fibonacciego mają ciekawe powiązania z drzewem Sterna-Brocota,
które poznaliśmy w rozdziale 4, oraz równie ważne uogólnienia do ciągu wie­
lomianów gruntownie badanych przez Eulera. Wielomiany te noszą miano
kontynuant i są one kluczem do badań nad ułamkami łańcuchowymi takimi,
jak
(6 . 1 2 6 )
a0 +
a-i +
a2 +
a3 +
&4 +
G-6 H-----
0-7
Wielomian kontynuant Kn (xi ,X2 , . . . , xn ) ma rt parametrów i definiu­
jemy go za pomocą następującego schematu rekurencyjnego:
I tak wielomiany występujące po Ki ( x i ) odpowiadają kolejno
K2 ( x t ,x 2 ) =
* 1*2 + 1 ;
K3 (x-|,x 2 ,x3) = x 1x 2 x 3 + x 1 + x 3 ;
K 4 (x i , x 2 , x 3 , x 4 ) =
X ! X 2 X3 X4 + X ! X 2 + X ! x 4 + X3 X4 + 1 .
Łatwo zauważyć (indukcyjnie), że liczba wyrazów jest liczbą Fibonacciego:
Kn ( l , 1 , . . . , 1 ) = Fn + 1 .
(6 . 1 2 8 )
Jeżeli kontekst jednoznacznie określa liczbę parametrów, możemy po pro­
stu zastąpić ‘K’ przez
tak jak mogliśmy pominąć liczbę parametrów
zajmując się funkcjami hipergeometrycznymi F w rozdziale 5 . Na przykład,
K(xi ,x2) = K2(xi , x 2 ) = x ix 2 + 1. Indeks dolny rt jest oczywiście niezbędny
w takich wzorach, jak ( 6 . 1 2 8 ).
Euler zauważył, że K(xi ,x2, . .. , xn ) można uzyskać rozpoczynając od
iloczynu x ix 2 .. .x n i skreślając sąsiadujące pary xicxk+i na wszystkie moż­
liwe sposoby. Graficzna reprezentacja reguły Eulera odpowiada konstrukcji
wszystkich ciągów kropek i kresek „kodu Morse'a” o długości rt, gdzie każda
kropka zwiększa długość o 1, a każda kreska o 2. Poniżej wszystkie ciągi kodu
Morse’a o długości 4:
Powyższe sekwencje kropkowo-kreskowe interpretujemy jako kolejne wyrazy
K(xi ,x 2 ,x 3 , x4), gdzie kropka odpowiada zmiennej użytej, a kreska odpo­
wiada usuniętej parze zmiennych. Na przykład, — to x i x 4.
Ciąg kodu Morse’a o długości rt posiadający k kresek ma (u —2k) kropek
oraz w sumie (rt—k) symboli. Kropki i kreski mogą być poukładane na (n^k)
sposobów. Zatem jeśli zastąpimy każdą kropkę przez z, a każdą kreskę przez 1,
otrzymamy
(6.129)
k=0
Wiemy również, że całkowita liczba wyrazów w kontymiancie jest liczbą Fibo­
nacciego. Stąd otrzymujemy tożsamość
(6.130)
(Postać zwarta dla (6.129), uogólniająca wzór Eulera-Bineta (6.123) dla liczb
Fibonacciego, pojawia się w (5.74).)
Powiązanie między wielomianami kontynuant a ciągami kodów Morse’a
podpowiada nam, że kontynuanty mają symetrię lustrzaną:
K(xn , . . . , x 2, xi ) = K(xi , x2, . . . , xn ) .
(6 .1 3 1 )
Zatem rekurencją rządząca parametrami po lewej jest uzupełnieniem analo­
gicznej reguły dla parametrów po prawej, w definicji (6.127):
Kn(^l >• • • >^n) —
Krt—1 (^-2 >• • • >^n) “F ^n—2 (^3 >• • • >^n) •( 6 . 1 3 2 )
Obie rekurencje są szczególnymi przypadkami ogólniejszego prawa:
(6 .1 3 3 )
Prawo to jest łatwo zrozumieć, posługując się analogią do kodu Morse’a.
Pierwszy iloczyn KmKn dostarcza wyrazy Km+U, w których nie ma kreski
stojącej na pozycji [m ,m + 1], podczas gdy drugi iloczyn dostarcza wyrazy
zawierające kreskę na tej właśnie pozycji. Jeżeli na wszystkie x podstawimy 1,
z powyższej tożsamości dowiadujemy się, że Fm+n+i = Fm+iFn+i + FmFTL.
Zatem zależność (6.108) jest szczególnym przypadkiem (6.133).
Euler [112] odkrył, że kontynuanty podlegają jeszcze bardziej godnemu
uwagi prawu, które uogólnia tożsamość Cassiniego:
Km+nl^l , . . . , 'X.m_)-TL) Kic(xm+1 , • • ♦ >^m+k)
— Km+kl^l , . . . , XTrL-|_ic) KTL(xm+i , . . . ,Xm-|_u )
+ ( 1) Km_i (X-| , . . . , Xm_ i ) Kn—k—1(^m+k+2) • • • >^m+n.) • (6-134)
Prawo to (udowodnione w ćwiczeniu 29) zachodzi zawsze wtedy, gdy dolne
indeksy przy wszystkich K są nieujemne. Dla k = 2 , m = 1 oraz n = 3 mamy
K(X1,X2,X3,X4)K(X2)X3) = K(X1,X2,X3)K(X2,X3,X4) + 1 .
Wielomiany kontynuant są silnie powiązane z algorytmem Euklidesa. Na
przykład przypuśćmy, że obliczenie NW D(m ,rt) kończy się w czterech kro­
kach:
N W D ( n o , ni )
N W D ( m , n 2)
NW D(rt 2 ,rt3)
ni = ti ;
no = m )
n 2 = rt0 mod ni = n 0 -- f l i T i ! ;
n 3 = Tl! mod n 2 = Tli -- q2 rt2 ;
n 4 = ti 2 mod n 3 = n 2 -- q3Ti3 ;
N W D (n 4 ,0) = Uą 0 = n 3 mod n 4 = ti 3 -- q4 rt4 .
N W D (n 3 , n 4)
Wówczas mamy
= n4
=
K()tl4 ;
n 3 = q4 Ti4
=
K(q 4 )n4 ;
n 2 = q3n 3 + n 4
=
K(q 3 )q4 )n4 ;
uą
n-i
= q 2 Ti2 + n 3
=
K(q2 )q 3 , q 4 )n 4 ;
no
=q in ,+ n 2
=
K( q, , q 2 , q 3 >q4 )n4 .
W ogólności, jeżeli algorytm Euklidesa znajduje największy wspólny dziel­
nik d po k krokach, obliczając ciąg ilorazów q i , . . . , qk, oznacza to, że liczby
początkowe odpowiadają K(qi , q2, . . . , qic)d oraz K(q2, . . . , qic)d. (Fakt ten
zauważony został na początku osiemnastego wieku przez Thomasa Fantet de
Lagny [232], który, jak się wydaje, był pierwszą osobą jawnie rozważającą
kontynuanty. Lagny zwrócił uwagę, że kolejne liczby Fibonacciego wystę­
pujące jako kontynuanty, osiągające minimalne wartości wraz z kolejnymi
q, odpowiadają najmniejszym liczbom wejściowym w algorytmie Euklidesa
wymuszającym zadaną liczbę kroków.)
Kontynuanty są również ściśle związane z ułamkami łańcuchowymi. Za­
chodzi następujący związek:
1
K(a0, a , , a 2, a 3)
“ " + ------------ i---------------K ( « „ « 2 , a s ) '
« , + -------- j a2 H-----
<6 ‘ 35>
a3
Ten sam wzór zachodzi dla ułamków łańcuchowych dowolnej głębokości. Mo­
żemy to łatwo udowodnić przez indukcję. Na przykład, mamy
K ta^a^a^c^ + I M )
K ( a i , a 2>a3 + 1/04)
zgodnie z tożsamością
= K(a0, ^ , a2, a3, a4)
K (a i , a2, a 3, a4)
Kn (*1 >• • • , ^n- 1 >
+ V)
= Kn(xi >• • • )^ n -l »^n) H" ^ n —1 (Xi >• • • >XrL—1 )U •
( 6 *136 )
(Dowód oraz uogólnienie powyższej tożsamości pojawia się w ćwiczeniu 30.)
Ponadto istnieje ścisłe powiązanie kontynuant z drzewem Sterna-Brocota
omówionym w rozdziale 4. Każdy węzeł w tym drzewie może być przedsta­
wiony jako ciąg L i P, powiedzmy
paoLai pa2La3
p aTl_2I_a1x_ 1 ^
(6.137)
gdzie ao ^ 0, ^ ^ 1, a2 ^ 1, a3 ^ 1, . . . , an_ 2 ^ 1,
^ 0 i n jest
parzyste. Korzystając z dwóch macierzy 2 x 2 L oraz P z (4.33), nietrudno
dowieść przez indukcję, że macierz
Kn-2(cii, . . . , an_ 2)
Kn_i ( a i , . . . , an_ 2, a ^ - i ) \
Kn_i (ao, a i , . . . , an_ 2)
Knfao, a i , . . . , arL_ 2, an_ i ) y
^
jest równoważna macierzy z (6.137). (Dowód jest częścią ćwiczenia 87.) Na
przykład
aybDCjd
P•aL
PCL = (
bc + 1
abc + a + c
bcd + b + d
abcd + ab + ad + cd + 1 J
Zatem możemy, w końcu, zastosować (4.34), aby otrzymać postać zwartą dla
ułamka w drzewie Sterna-Brocota reprezentowanego przez ciąg L-P (6.137):
f ( Pa° . . . L a— ') = Kn+l (nO, <H, ---. On-1, 1)
K-nlO-l >• • • >O-n—1 >1 J
( g i 39j
(Jest to „twierdzenie Halphena” [174].) Na przykład, aby znaleźć ułamek dla
LPPL, bierzemy ao = 0, ai = 1, a 2 = 2, a 3 = 1 i rt = 4. Wtedy równanie
(6.139) daje nam
K(0, 1 , 2 , 1 , 1 ) = K(2,1,1) = K(2 , 2) = 5
K(1,2,1,1)
K(1, 2, 1,1)
K(3,2) '7 '
(Użyliśmy reguły Kn (x i, . . . , xn_ ! , xn + 1 ) = Kn+1 (xt , . . . , xn_ ! , xu , 1) w celu
wchłonięcia początkowych oraz końcowych 1 na liście parametrów. Regułę tę
otrzymujemy przez podstawienie y = 1 w (6.136).)
Porównanie (6.135) i (6.139) pokazuje, że ułamek odpowiadający ogólne­
mu węzłowi (6.137) w drzewie Sterna-Brocota ma przedstawienie w postaci
ułamka łańcuchowego
f ( Pa° . . . Lan_I) = a0 + -------------------------------------- .
-
(6.140)
a i + ------------------- ------------
Cl2 H----------
1
+ -------
Możemy zatem dokonywać bezpośrednich, obustronnych przejść pomię­
dzy ułamkami łańcuchowymi a odpowiadającymi im wierzchołkami w drze­
wie Sterna-Brocota. Na przykład,
f(LPPL) = 0 + ------
1
W rozdziale 4 zauważyliśmy, że liczby niewymierne definiują nieskończo­
ne ścieżki w drzewie Sterna-Brocota oraz mogą być reprezentowane jako nies­
kończony ciąg L i P. W przypadku, gdy nieskończony ciąg odpowiadający oc
jest równy P aoLai p a2^a3 _ } istnieje odpowiadający mu nieskończony uła­
mek łańcuchowy
1
oc = ao H----------------------------------------------.
ai H--------------------------------------
(6.141)
Cl2 4ci3
CLą +
1
0-5 H--------
Ten nieskończony ułamek łańcuchowy można również otrzymać bezpośred­
nio: Niech ao = oc i dla k ^ 0 niech
ak = La kJ ;
oc]c = a ic H------------------------------------------------------ — .(6.142)
^k+1
Liczby a nazywamy „ilorazami częściowymi” oc. Jeżeli oc jest wymierne, po­
wiedzmy m /n , powyższy proces napotyka ilorazy generowane przez algorytm
Euklidesa i zatrzymuje się (przy ock + i = 0 0 ) .
Czy stała Eulera y Jest liczbą wymierną? Nikt tego nie wie. Możemy
próbować uzyskać częściową informację o tym słynnym otwartym problemie
A jeśli nawet ktoś
wie, to się tym nie
chwali.
szukając y w drzewie Sterna-Brocota. Jeżeli y jest wymierne, to je znaj­
dziemy, a jeśli jest niewymierne, to znajdziemy jego wszystkie najbliższe wy­
mierne przybliżenia. Ułamek łańcuchowy dla y zaczyna się od następujących
ilorazów częściowych:
Cóż, y musi być
niewymierne,
zgodnie z mało
znanym
powiedzeniem
Einsteina:
„Bóg nie rzuca
we wszechświat
wielkich
mianowników” .
k
0
1
2
3
4
5
6
7
8
ak
0
1
1
2
1
2
1
4
3
Zatem reprezentacja Sterna-Brocota dla stałej Eulera rozpoczyna się od
ciągu LPLLPLLPLLLLPPPI___ Żaden wzór nie jest oczywisty. Obliczenia
Richarda Brenta [39] pokazały, że jeśli y jest liczbą wymierną, to jej mianow­
nik musi mieć więcej niż 10 0 0 0 cyfr dziesiętnych. Dlatego nikt nie wierzy,
że y jest wymierne. Ale jak dotąd nikt nie był w stanie udowodnić, że nie
jest.
Podsumujmy ten rozdział poprzez udowodnienie godnej uwagi tożsamości
wiążącej wiele z powyższych wzorów w jedną całość. W rozdziale 3 wprowa­
dziliśmy pojęcie widma. Widmo stałej oc jest zbiorem z powtórzeniami liczb
postaci [n a j. O szeregu nieskończonym
Y
z Ln<t>J = z + z 3 -H z 4 + z 6 + z 8 + z 9 H-----
n^l
możemy zatem powiedzieć, że jest funkcją tworzącą dla widma 4 >, gdzie
4> = (1 + y /5 )/2 jest złotym podziałem. Tożsamość, którą udowodnimy, od­
kryta w 1976 roku przez J.L. Davisona [77], jest nieskończonym ułamkiem
łańcuchowym wiążącym powyższą funkcję tworzącą z ciągiem Fibonacciego:
zFi
--------- = ( l - z ) £ z L ™ W .
Z2
n£l
1 + -ZF3
1+
(6.143)
1+ ^
Obie strony tożsamości (6.143) wyglądają interesująco. Przyjrzyjmy się
najpierw liczbom [nĄ)\. Jeżeli reprezentacja Fibonacciego (6.113) liczby n
wynosi Fkl + • • • + Fkr, spodziewamy się, że rtcj) odpowiada w przybliżeniu
F-ic1+i -t- • • • + Fkr+i , czyli liczbie otrzymanej po przesunięciu reprezentacji
Fibonacciego w lewo (zamiana mil na kilometry). Rzeczywiście, wiemy z
(6.125), że
nc(> = F|c1+i H--------b FkT+i — ( $ k' H--------1- $ kr) •
Teraz $ = —1/(J> oraz ki >• • • •
l $ ki + . •. +
kr
0, mamy więc
| < c r kr + < r k r _ 2 + c r k r ~ 4 + • • •
i na podstawie podobnego rozumowania $ kl H------- b $ kr ma ten sam znak,
co (—l ) kr. Stąd
= Fkl+1 H-------bFkr+1 -
[kr (n) jest parzyste] .
(6-144)
Powiemy, że liczba n jest nieparzystą liczbą Fibonacciego (w skrócie F-nieparzysta), jeśli jej najmniej znaczący bit Fibonacciego wynosi 1. To tak samo,
jakbyśmy powiedzieli, że kr(rt) = 2 . W przeciwnym razie rt jest parzystą
liczbą Fibonacciego (F-parzysta). Na przykład, najmniejsze liczby F-nieparzyste to 1, 4 , 6, 9, 12, 14, 17 i 19. Jeżeli kr (rt) jest parzyste, wówczas (n —
1) jest F-parzyste, zgodnie z (6.114). Podobnie, gdy kT(rt) jest nieparzyste,
wówczas (n — 1) jest F-nieparzyste. Zatem
kr(n) jest parzyste
n — 1 jest F-parzyste.
Ponadto, jeśli kr(rt) jest parzyste, z (6.144) otrzymujemy, że kr (Ln4>J) = 2 .
Gdy kr(rt) jest nieparzyste, (6.144) mówi nam, że kr ([nc()J) = kr(rt) + 1.
Zatem kr (Ln(|)J) jest zawsze parzyste i udowodniliśmy, że
|ri<j)J — 1 jest zawsze F-parzyste.
I odwrotnie, jeśli m jest dowolną liczbą F-parzystą, możemy odwrócić to rozu­
mowanie znajdując takie rt, że m + 1 = |ncf>J. (Rozpoczynamy od dodania 1
w notacji Fibonacciego. Jeżeli nie ma przeniesienia, n odpowiada (m + 2)
przesuniętemu raz w prawo. W przeciwnym razie rt jest równe (m + 1) prze­
suniętemu w prawo.) Prawostronną sumę w (6.143) możemy zatem zapisać
(6.145)
m^O
Co się dzieje z ułamkiem po lewej stronie? Przepiszmy (6.143) tak, aby
ułamek wyglądał jak w (6.141), ze wszystkimi licznikami równymi 1:
(Przekształcenie to jest dosyć trudne! Licznik oraz mianownik początkowego
ułamka, mającego w liczniku zFn, musimy podzielić przez zFn- 1.) Jeżeli za­
kończymy ten nowy ułamek łańcuchowy na 1 / z ~ Fti , jego wartość będzie od­
powiadać stosunkowi kontynuant,
Kn+1 (z- F ° , Z—F' .................................................................................. Z“ F" ) Kn + l ( z - F° , Z - F' ) . . . , Z - F' ') ’
podobnie, jak w ( 6 . 1 3 5 ). Przyjrzyjmy się najpierw mianownikowi w nadziei,
że nie będzie z nim kłopotów. Po podstawieniu Qn = Kn+i (z~F° , . . . , z-F n)
zauważamy, że Q 0 = 1, Qi = 1 + z - 1 , Q 2 = 1 + z - 1 + z- 2 , Q 3 = 1 + z - 1 +
z - 2 + z - 3 + z- 4 , a w ogólności wszystko pięknie pasuje i dostajemy szereg
geometryczny
Qn = i + 2 : - 1 + z ~ 2 + . . . + z - ( f tv+2 - i ) ^
Odpowiadającym licznikiem jest Pn = Kn (z~Fl, . . . , z _Fn). Odnajdujemy
duże podobieństwo do szeregu Qn , jednak szereg Pn ma mniejszą liczbę wy­
razów. Na przykład mamy
P5 = Z- 1 + Z- 2 + z - 4 + z - 5 + z - 7 + z ~9 + z - 1 0 + z - 1 2 ,
w porównaniu z Qs = 1 + z - 1 + ••• + z-1 2 . Po bliższym przyjrzeniu się
zauważamy wzór rządzący powstawaniem formuł. Mamy
1+ z 2 + z 3 + z 5 + z 7+ z 8 + z l 0+ z n
_ 12
P5 = -------------------- J2------------------- = z
l _ z
z
[m F-parzysta],
m =0
i w przypadku ogólnym możemy udowodnić przez indukcję, że
Fn+2 -1
Pn
=
zm [m jest F-parzysta].
z 1_Ftv+2
rrv=0
Zatem
Pn
Lm =o
1
Im Jest ^-parzysta]
L Fn+2 1 _m
m =0
Z
Teraz biorąc granicę przy rt —> 0 0 , dostajemy ( 6 . 1 4 6 ), zgodnie z ( 6 . 1 4 5 ).
Ć w iczenia
Rozgrzewka
1 . Które z [ 2 ] =
11 permutacji zbioru {1,2,3,4} mają dokładnie dwa cykle?
(Rozwiązanie w postaci cyklowej występuje w ( 6 .4 ). Wymagamy rozwią­
zania w postaci nie-cyklowej, czyli np. 2314.)
2 . Liczba funkcji ze zbioru rt elementowego w zbiór m elementowy wynosi
m-rL. Jak wiele z nich ma więcej niż k różnych wartości?
3 . Każdy, kto kiedykolwiek układał karty, wie, że mądrze jest zostawić pe­
wien zapas tak, aby karty nie rozsypały się, gdy nadejdzie powiew wiatru.
Przypuśćmy, że wymagane jest, aby środek ciężkości górnych k kart był
położony przynajmniej e jednostek od krawędzi (k+1 )-szej karty. (Zatem,
na przykład, pierwsza karta może wystawać poza drugą co najwyżej o
(1 —e) jednostek.) Czy możemy nadal uzyskać dowolnie duży nawis, jeśli
mamy wystarczającą ilość kart?
4. Zapisz 1/1 + 1/3 H------- 1- 1 / ( 2 n +1 ) przy użyciu liczb harmonicznych.
5. Wytłumacz, jak otrzymać rekurencję ( 6 .7 5 ), korzystając z definicji funk­
cji UTL(x,'y) w ( 6 .7 4 ). Rozwiąż powyższą rekurencję.
6 . Badaczowi na wyspie została jedna para młodych królików. Jeżeli młode
króliki dorastają w ciągu jednego miesiąca, a każda para dorosłych króli­
ków produkuje jedną parę młodych co miesiąc, to ile par królików będzie
miał badacz na wyspie po upływie rt miesięcy? (Po dwóch miesiącach
będą dwie pary, z których jedna jest nowo narodzona.) Znajdź powiąza­
nie pomiędzy tym problemem a „drzewem pszczół” przedstawionym w
tekście tego rozdziału.
7. Pokaż, że tożsamość Cassiniego ( 6 . 1 0 3 ) jest szczególnym przypadkiem
( 6 . 1 0 8 ) oraz szczególnym przypadkiem ( 6 . 1 3 4 ).
8 . Zastosuj system liczb Fibonacciego do zamiany 65 m il/h na przybliżoną
wartość wyrażoną w km/h.
9. Ile mniej więcej kilometrów kwadratowych mieści się w 8 milach kwadra­
towych?
10. Jaki ułamek łańcuchowy reprezentuję liczbę cf>?
Podstaw y
1 1 . Ile wynosi H k(—1)k [£], będąca sumą elementów w wierszu, ze zmienia­
jącymi się znakami, w trójkącie Stirlinga dla cykli, gdy n jest nieujemną
liczbą całkowitą?
1 2 . Udowodnij, że dla liczb Stirlinga słuszne jest prawo inwersji analogiczne
do (5 .4 8 ):
Jeśli liczby
harmoniczne
są liczbami
żółwiowymi, liczby
Fibonacciego
są liczbami
królikowymi.
13. O operatorach różniczkowych D =
rozdziałach 2 oraz 5. Mamy
oraz £ = zD wspominaliśmy w
z 2 D 2 + zD
d2 =
ponieważ -&2f(z) = # z f /(z) = z^ zf'(z) = z2 f"(z) +zf'(z), które wynosi
(z2 D 2 +zD)f(z). Podobnie możemy pokazać, że&3 = z 3 D 3 +3z 2 D 2 +zD.
Udowodnij wzory ogólne:
n
= L
.k
znDTL
zkDk
( - 1 )n- ke k
= L
dla wszystkich rt ^ 0. (Można je wykorzystać do zamiany pomiędzy
wyrażeniami różniczkowymi postaci
ak2:kf^k^(z) oraz
Pk^kf(z)
podobnie jak w (5 .109 ).)
14. Udowodnij tożsamość potęgową (6 .37 ) dla liczb Eulera.
15. Udowodnij tożsamość Eulera (6 .39 ) biorąc m-tą różnicę (6 .37 ).
16. Jak wygląda rozwiązanie ogólne podwójnej rekurencji
-A-rijO — O-ri [n ^ 0 ] |
Ao?k
^TL,k = kATV_ i >ic + An_] ,k—1
0,
jeśli k > 0 ;
dla całkowitych k, n,
gdy zakres k i n odpowiada wszystkim liczbom całkowitym?
17. Rozwiąż następującą rekurencję przy założeniu, że
jest równe zeru
dla n < 0 lub k < 0 :
b)
n =z n —1
n —1
+n
+ [n = k = 0 ],
k
k
k —1
dla n, k > 0 .
n
n -1
= (n -k )
k
k
+
dla n, k >. 0 .
n
n -1
= k
k
k
ń -1
+ [n = k = 0 ],
k —1
+k
n —1
+ [n = k = 0 ] ,
k —1
dla n, k ^ 0 .
18. Udowodnij, że wielomiany Stirlinga spełniają
(x + 1 ) an ( x + 1 ) = ( x - n ) a u (x )+ x a n_](x).
19. Udowodnij, że uogólnione liczby Stirlinga spełniają
x+k
Z
k=0
n
Z
k=0
X
x+ k
x
x
n+k
x
x —n + k
■i ) 1
x+k
Tl + 1
= 0,
całkowite n > 0 .
całkowite n > 0 .
20. Zaproponuj postać zwartą dla X k =i
2 1 . Pokaż, że jeśli Hn = an /b n , gdzie an i bn są liczbami całkowitymi,
mianownik bn jest wielokrotnością 2 Llgn-l. Wskazówka: Rozważ liczbę
postaci 2 Llg —1 Hn — j .
22. Udowodnij, że nieskończona suma
jest zbieżna dla wszystkich liczb zespolonych z, poza przypadkiem, gdy z
jest ujemną liczbą całkowitą. Pokaż, że powyższa suma równa się Hz , gdy
z jest nieujemną liczbą całkowitą. (Gdy z jest liczbą zespoloną, możemy
użyć tego wzoru do zdefiniowania liczb harmonicznych Hz.)
23. Z równania ( 6 .8 i) otrzymujemy współczynniki funkcji z / ( e z —1) pojawia­
jące się przy potęgach z po jej rozwinięciu. Jak wyglądają współczynniki
funkcji z / ( e z + 1)? Wskazówka: Rozważ tożsamość (ez + 1)(ez — 1) =
e2z — 1 .
24. Udowodnij, że liczba tangensowa T2 n+i jest wielokrotnością 2n . W ska­
zówka: Udowodnij, że wszystkie współczynniki T in M oraz T2 n+i(x) są
wielokrotnościami 2 n .
25. Równanie ( 6 .5 7 ) dowodzi, że robaczek ostatecznie osiągnie koniec gumo­
wej taśmy po pewnym czasie N. Musi zatem przyjść taki moment rt, w
którym robaczek jest bliżej końca taśmy po rt minutach niż był po (rt —1 )
minutach. Pokaż, że rt < ^N.
26. Oblicz sumując przez części Su =
H^/k. Wskazówka: Rozważ rów­
nież podobną sumę X!k=i Hk- i / k.
27. Udowodnij prawo NWD ( 6 . 1 1 1 ) dla liczb Fibonacciego.
28. Liczbę Lucasa Ln, definiujemy jako
+ F n- i • Zatem, zgodnie z zależ­
nością ( 6 . 1 0 9 ), mamy F2 n = Fn Ln . Oto tabela kilku pierwszych wartości:
Tl
0
1
2
3
4
5
6
7
8
9
10
11
12
13
U
2
1
3
4
7
11
18
29
47
76
123
199
322
521
a) Użyj metody repertuaru, aby pokazać, że rozwiązanie
cego ogólną rekurencję
Qo = oc j
Q 1 =
(3 J
Qn
— Q t l —1 "F Q n —2 >
spełniają­
tl > 1
może być wyrażone przy użyciu Fn i Ln .
b) Zapisz Ln. w postaci zwartej używając <J) i $ .
29. Udowodnij tożsamość Eulera dla kontynuant, równanie ( 6 . 1 3 4 ).
30. Uogólnij ( 6 . 1 3 6 ) w celu znalezienia wyrażenia dla powiększonej kontynu­
anty K(x 1 , . . . , x m_ 1 , xm + y , x m+ 1 , . . . , x n ), gdy 1
n.
Ć w iczen ia dom ow e
31. Zapisz w postaci zwartej współtzynniki |£| użyte w przedstawieniu potęg
przyrastających poprzez potęgi ubywające:
xu = L
k
x -,
dla całkowitych rt ^ 0 .
(Na przykład, x 4 = x - + 12x- + 36x- + 24x1, stąd l^l = 36.).
32. W rozdziale 5 otrzymaliśmy wzory
V-
f ti + k \
/ r t + TTt + 1 \
.
v—
( k\
m +1
z ( k /)= ( \ m )/ 1 O^k^m
l \y/ = n +
V -m \
k^m
1
rozwijając rekurencję (£) = (TV^ 1) + ( £ lj ) na dwa sposoby. Jakie toż­
samości pojawiają się przy rozwinięciu analogicznej rekurencji {£ } =
Ach! Stare dobre
czasy!
33. Tabela 296 zawiera wartości [™] oraz
Jakie są postacie zwarte (nie
używające liczb Stirlinga) dla następnych przypadków, [3 ] i { 3 }?
34. Czemu odpowiadają
i (~k2), jeżeli założymy, że podstawowa zależ­
ność rekurencyjna ( 6 .3 5 ) zachodzi dla wszystkich liczb całkowitych k i rt
oraz jeśli (£) = 0 dla wszystkich k < 0 ?
35. Udowodnij, że dla każdego e > 0 istnieje liczba całkowita n > 1 (zależna
od e) taka, że Hn mod 1 < e.
36. Czy jest możliwe ułożenie sterty n cegieł tak, aby górna cegła nie leżała
nad żadnym punktem dolnej cegły, a dodatkowo osoba ważąca równowar­
tość 1 0 0 cegieł mogła balansować na środku górnej cegły nie powodując
zawalenia się sterty?
37. Przedstaw ^ ^ ( k m o d m ) / k ( k + 1) za pomocą liczb harmonicznych,
zakładając, że m oraz n są dodatnimi liczbami całkowitymi. Jaka jest
graniczna wartość przy rt —» 0 0 ?
38. Oblicz sumę nieoznaczoną Y
(—1
61c.
39. Przedstaw Y\c=i ^k za. pomocą tl otb.z
.
40. Udowodnij, że 1979 dzieli licznik sumy
1)k_1/k oraz zapropo­
nuj podobną sumę dla 1987. W skazówka: Użyj sztuczki Gaussa, aby
uzyskać sumę ułamków, których liczniki wynoszą 1979. Zobacz również
ćwiczenie 4.
41. Przekształć sumę
r(l",+]
t
k,/2J)
do postaci zwartej, gdy n jest liczbą całkowitą (również ujemną).
42. Jeżeli S jest zbiorem liczb całkowitych, niech S + 1 będzie „przesuniętym”
zbiorem {x + 1' | x e S}. Ile podzbiorów { 1, 2, . . . , n } ma następującą
własność S U (S + 1) = { 1 , 2 , . . . , n + 1}?
43. Udowodnij, że nieskończona suma
0,1
+ 0,01
+ 0,002
+ 0,0003
+ 0,00005
+ 0,000008
+ 0,0000013
zbiega do liczby wymiernej.
44. Udowodnij odwrotność tożsamości Cassiniego (6 .1 0 6 ): jeżeli k oraz m są
liczbami całkowitymi takimi, że |m 2 — km — k2| = 1 , wówczas istnieje
liczba całkowita rt taka, że k = ± f ri i m = ±Fn+i •
45. Użyj metody repertuaru do rozwiązania ogólnej rekurencji
Xo = <x;
X] = (3 ;
Xn = Xn_ i + X n _ 2 + y n + 6 .
46. Ile wynoszą cos 36° oraz cos 72°?
47. Pokaż, że
i użyj tej tożsamości do wyprowadzenia wartości Fp mod p i Fp+i mod p,
gdzie p jest liczbą pierwszą.
48. Udowodnij, że w wielomianie kontynuant można usunąć parametry o war­
tości zerowej spajając ich sąsiadów:
(Xi , . . . , X TrL_ 1,0,X-rrL_|_i , . . . , X-n.)
Xm—2>Xm —1+xm+1 ,xm+2,••.,xn), 1 < m < rt.
49. Przedstaw liczbę Y n > 1 2- Ltl4>J w postaci ułamka łańcuchowego.
50. Definiujemy f (u) dla wszystkich liczb całkowitych dodatnich n za po­
mocą rekurencji
f(1) =
1;
f( 2 n) = f [ n ) ;
f( 2 n + 1 ) = f(n) + f ( n + 1 ).
a) Dla jakich rt wartość f (rt) jest parzysta?
b) Pokaż, że f (rt) można wyrazić przy użyciu kontynuant.
Zadania egzaminacyjne
51. Niech p będzie liczbą pierwszą.
a) Udowodnij, że {£ } = [£] = 0 (mod p), dla 1 < k < p.
b) Udowodnij, że p5^ 1] = 1 (mod p), dla 1 ^ k < p.
c)
Udowodnij, że { 2v~2} = [2 Pp~2] = 0 (mod p), jeśli p > 2.
d) Udowodnij, że jeśli p > 3, to [1J] = 0 (mod p 2). Wskazówka: Rozważ
PE52. Zapiszmy Hn jako an / b n , gdzie an oraz bn są względnie pierwsze.
. a) Udowodnij, że p \b n 4= ^ vXa ln/v}> S^y p jest liczbą pierwszą,
b) Wyszukaj wszystkie tl > 0 takie, że
jest podzielne przez 5.
53. Przedstaw UkLo (k) 1 (—^)lcHk w postaci zwartej, gdy 0 ^ m ^ rt.
Wskazówka: Ćwiczenie 5.42 zawiera powyższą sumę bez czynnika H^.
54. Załóżmy, że rt > 0. Celem tego ćwiczenia jest pokazanie, że mianow­
nik liczby B2 n jest iloczynem wszystkich liczb pierwszych p takich, że
( p - l ) \ ( 2 n).
a) Pokaż, że Sm(p) + [(p—1)\m ] jest wielokrotnością p, gdy p jest liczbą
pierwszą oraz m > 0 .
b) Zastosuj wynik z części (a) do pokazania, że
B2 n +
[(P— 1 ) \ ( 2 rt)l
------------------ = l 2 n
—
p
p pierwsza
/
jest liczbą całkowitą.
Wskazówka: Wystarczy dowieść, że jeśli p jest dowolną liczbą pierw­
szą, mianownik ułamka B2 n + [(p — 1 ) \( 2 rt)]/p nie jest podzielny
przez p.
c) Udowodnij, że mianownik liczby B2 n jest zawsze nieparzystą wielok­
rotnością 6 oraz że odpowiada dokładnie 6 dla nieskończenie wielu n.
55. Udowodnij ( 6 .7 0 ) jako wniosek z bardziej ogólnej tożsamości, sumując
ł
0 ^k<n
Q
(x T
x
7
oraz różniczkując względem x.
56. Podaj
(k) 1)kkn+ 1/ ( k —m ) w postaci zwartej, jako funkcję liczb
całkowitych m oraz n. (Suma liczona jest po wszystkich całkowitych k z
pominięciem k = m.)
57. „Zawinięte współczynniki dwumianu 5 -tego rzędu” definiujemy jako
oraz ((£)) = [k = 0]. Niech Qn będzie różnicą pomiędzy największą i
najmniejszą z tych liczb w n-tym wierszu:
Q" = o f £ 5( ( k ) )
“
0 ^ 5 fk )) '
Wyszukaj i udowodnij powiązania między Qn a liczbami Fibonacciego.
58. Wyznacz postacie zwarte dla Y n ^ o ^tlzU oraz Y-n^o ^nzTL* Co m°żna
powiedzieć o wielkości F^ +1 —4F^ —F^ _ 1 ?
5 9 . Udowodnij, że jeśli m oraz rt są dodatnimi liczbami całkowitymi, istnieje
liczba całkowita x taka, że Fx = m (mod 311).
60. Wyszukaj wszystkie dodatnie liczby całkowite rt takie, że Fu + 1 albo
Fn — 1 jest liczbą pierwszą.
61. Udowodnij tożsamość
V~ —— =
t
3 —
b
,
dla całkowitych n ^ 1 .
Fzn
Ile wynosi Hk=o ^/^ 3 -2 k?
62. Niech Au = ^ + 4>-u oraz Bn =
a) Wyznacz stałe oc oraz |3 takie, że Au — aA n_i + |3An _ 2 oraz Bn =
(xBn_i + pBn_ 2, dla wszystkich rt ^ 0 .
b) Przedstaw An oraz Bn przy użyciu Fn oraz
(patrz ćwiczenie 28).
c) Udowodnij, że £ £ =1 V (F 2 k+i + 1) = Bn / A u +i .
d) Wyznacz postać zwartą Y h = i V (F 2 k+i — 1)•
Zadania dodatkowe
63. Ile permutacji 7ti 7t2 . . . 7tn zbioru { 1 , 2 , . . . , n} ma dokładnie k indeksów j
takich, że
a) 7tt < 7tj dla wszystkich i < j? (Takie j nazywamy „maksimami od-lewej-do-prawej.” )
b) 7tj > j? (Takie j nazywamy „przewyższeniami.”)
64. Ile wynosi mianownik względnie pierwszy z licznikiem w ułamku prostym
odpowiadającym
65. Udowodnij tożsamość
^
^ f ( | x , + • • • + xnJ) d x , . . . dxn = Y _ ( k ) ^ T ■
6 6 . Czemu odpowiada X k ( —^ )k (k)> będąca n-tą wierszową sumą elementów
ze zmieniającymi się na przemian znakami w trójkącie Eulera?
Zeznania
podatkowe.
67. Udowodnij, że
n +1
vk+1JVTn — k/v
\m
’J
6 8 . Pokaż, że ((Y)) — 2(Y) oraz wyznacz postać zwartą dla ((5))-
69. Wyznacz postać zwartą dla Y-k=i ^2 ^n+k70. Pokaż, że zespolone liczby harmoniczne z ćwiczenia 2 2 mają rozwinięcie
w szereg potęgowy Hz =
^ H ^ z 71-1 .
71. Udowodnij, że uogólnioną silnię z równania ( 5 .8 3 ) możemy zapisać jako
Z
k$;1
rozważając granicę przy n
00 pierwszych n czynników tego nieskończo­
nego iloczynu. Pokaż, że ^ ( z ! ) jest powiązana z uogólnionymi liczbami
harmonicznymi z ćwiczenia 2 2 .
72. Udowodnij, że funkcja tangens ma szereg potęgowy ( 6 .9 2 ) oraz wyznacz
odpowiednie szeregi dla z/sin z oraz ln ((tg z )/z ).
73. Udowodnij, że z ctg z jest równe
Z
L
2^
Z
Z i
Z
z / , z + k?t
2 V—- 1
2 ^ " 2 ^ tg 2 ^ +
2^{ '
k=1
g ~1 F ~ +
z —k7r
g ~ 1F ~
dla wszystkich liczb całkowitych n ^ 1 oraz pokaż, że granica k-tych
składników, dla ustalonego k, wynosi 2 z 2/( z 2 —k 2 7t2), przy n —» 0 0 .
74. Ustal powiązanie między liczbami Tn (1) oraz współczynnikami 1 /cos z.
75. Udowodnij, że liczby tangensowe oraz współczynniki 1/cos z pojawiają się
na krawędziach nieskończonego trójkąta zaczynającego się następująco:
1
1
0
1
1
0
5
0
61
4
5
5
61
0
2
1
14
10
56
2
2
46
0
16
32
16
16
0
Każdy wiersz zawiera sumy częściowe poprzedniego wiersza, idąc na przemian z lewej na prawo i z prawej na lewo. Wskazówka: Rozważ współ­
czynniki szeregu potęgowego (sin z + cos z ) / cos (w + z).
76. Wyznacz postać zwartą sumy
-
t - T f
2 n' kk!,
k
oraz pokaż, że jest ona równa zeru, gdy n jest liczbą parzystą.
77. Jeżeli m i rt są liczbami całkowitymi, gdzie n ^ 0, wartość c n (m) otrzy­
mujemy ze wzoru (6 .4 8 ), gdy m < 0 , ze wzoru ( 6 .4 9 ), gdy m > rt oraz
( 6 . 1 0 1 ), gdy m = 0. Pokaż, że w pozostałych przypadkach zachodzi wzór
całkowite rt
m > 0.
78. Udowodnij następującą zależność łączącą liczby Stirlinga, liczby Berno­
ulliego oraz liczby Catalana:
79. Pokaż, że cztery kawałki szachownicy pojawiające się w paradoksie 64 =
65 można również użyć do udowodnienia, że 64 = 63.
80. Ciąg zdefiniowany rekurencyjnie Ai = x, A 2 = y, oraz An = An_i +
An —2 osiąga Am = 1000000 dla pewnego m. Dla jakich dodatnich całko­
witych x oraz y wartość m jest największa z możliwych?
81. W tekście tego rozdziału przedstawiliśmy sposób zmiany wyrażenia za­
wierającego
na formułę zawierającą wyłącznie Fn oraz FrL+1. Zatem
pojawia się naturalne pytanie, czy dwa takie „zredukowane” wyrażenia
mogą być równoważne, jeśli nie mają identycznych postaci. Niech P(x,'y)
będzie wielomianem zmiennych x i y , ze współczynnikami całkowitymi.
Zaproponuj warunek konieczny i wystarczający na to, aby P(Fn+i ,J=n) =
0 , dla wszystkich rt ^ 0 .
82. Wytłumacz, jak się dodaje dodatnie liczby całkowite, pracując wyłącznie
w systemie liczb Fibonacciego.
83. Czy jest możliwe, aby ciąg (An ) spełniający wzór rekurencyjny Fibonac­
ciego An = An_i + A n _ 2 nie zawierał liczb pierwszych, jeśli Ao oraz Ai
są względnie pierwsze?
84. Niech m oraz n będą nieparzystymi, dodatnimi liczbami całkowitymi.
Wyprowadź postać zwartą dla
Wskazówka: Sumy w ćwiczeniu 62 wynoszą S^ 3 — S| 2tx+3 oraz S 7 3 —
85. Scharakteryzuj wszystkie N takie, że reszty Fibonacciego Fn mod N dla
rt ^ 0 tworzą cały zbiór { 0 , 1 , . . . , N — 1}. (Patrz ćwiczenie 59.)
8 6 . Niech Ci, C2 , . . . będzie ciągiem niezerowych liczb całkowitych takich,
ze
N W D (C m , Cn ) =
C isiW D (m ,n )
dla wszystkich dodatnich liczb całkowitych m oraz n. Udowodnij, że
uogólnione współczynniki dwumianu
f
C n . C n —1 • ♦ • C n —k+1
\k y q C icC ic—i ... C i
są całkowite. (W szczególności, „współczynniki Fibomianowe” otrzymane
w powyższy sposób z liczb Fibonacciego są liczbami całkowitymi, zgodnie
z ( 6 . 1 1 1 ).)
87. Pokaż, że wielomian kontynuant pojawia się w iloczynie macierzowym
oraz w wyznaczniku
/ xi
1
0
0
. . . 0\
-1
x2
1
0
0
0
0
...
1
-1
Xn/
8 8 . Uogólniając
( 6 . 1 4 6 ), wyznacz ułamek łańcuchowy powiązany z funkcją
tworzącą 2 Zn^i zLnaJ, gdy oc jest dowolną dodatnią liczbą wymierną. .
89. Niech oc będzie niewymierną liczbą z przedziału ( 0. . 1 ) oraz niech a i,
ci2,CI3,. . . będzie ciągiem ilorazów częściowych w ułamku łańcuchowym
odpowiadającym oc. Pokaż, że |D (a,rt)| < 2, gdy rt = K( a i , . . . , a m),
gdzie D jest niezgodnością zdefiniowaną w rozdziale 3.
90. Niech Qn będzie największym mianownikiem na poziomie rt w drzewie
Sterna-Brocota. (Stąd ciąg (Qo> Qi >Q 2 >Q 3 >Q4 >• •.} = ( 1 , 2 , 3 , 5 , 8 , . . . )
zgodnie z diagramem w rozdziale 4.) Udowodnij, że Qn = Fn+2 -
P ro b lem y badaw cze
91. Jaki jest najlepszy sposób rozszerzenia definicji {£ } na dowolne liczby
rzeczywiste n oraz k?
92. Zapiszmy Hn w postaci ułamka prostego an/b n , postępując podobnie
jak w ćwiczeniu 52.
a) Czy istnieje nieskończenie wiele liczb n spełniających p \ a n , dla pew­
nej ustalonej liczby pierwszej p?
b) Czy istnieje nieskończenie wiele liczb n, dla których wartość bn =
N W W ( 1 , 2 >. . . , n ) ? (Dwie takie wartości to n = 250 oraz rt = 1000.)
93. Udowodnij, że y oraz eY są liczbami niewymiernymi.
94. Rozwiń ogólną teorię rozwiązań dwuparametrowej rekurencji
= (<xn+ |3k + y) U
^
IV
+ {oc'n + |3'k + y ')
n —1
+ [n = k = 0 ],
k-1
d lan ,k^ 0,
zakładając, że |£| = 0, d i a n < 0 lub k < 0. (Współczynnikidwumianowe,
liczby Stirlinga, liczby Eulera oraz ciągi z ćwiczenia 17 i 31 są szczegól­
nymi przypadkami powyższej rekurencji.) Dla jakich szczególnych war­
tości (a, p,y, a', P ^ y 7) otrzymujemy „rozwiązania fundamentalne”, w
których możemy wyrażać rozwiązania ogólne?
95. Zaproponuj efektywny sposób na rozszerzenie algorytmu Gospera-Zeil­
bergera z wyrazów hipergeometrycznych do wyrazów mogących zawierać
liczby Stirlinga.
m
Funkcje tworzące
Najskuteczniejszą obecnie znaną metodą analizy ciągów liczb jest manipulo­
wanie nieskończonymi szeregami, które „tworzą” te ciągi. Dużo już wiemy o
ciągach oraz poznaliśmy kilka funkcji tworzących. Jesteśmy więc przygoto­
wani do głębokiej analizy funkcji tworzących oraz do poznania ich prawdziwej
użyteczności.
7.1. Teoria dom ina i rozm ieniania
„Let me count the
ways.”
—E.B. Browning
Funkcje tworzące są wystarczająco ważne, i dla wielu z nas wystarczająco
nowe, żeby uzasadnić uproszczone podejście na początku naszej wnikliwej
analizy. Zacznijmy więc ten rozdział od zabaw i gier, żeby wyrobić sobie
intuicje na temat funkcji tworzących. Będziemy się zajmowali dwoma zasto­
sowaniami tej metody: jednym dotyczącym domina, a drugim dotyczącym
monet.
Na ile'sposobów Tn można całkowicie pokryć prostokąt rozmiaru 2 x n
kamieniami domina rozmiaru 2 x 1 ? Założymy tutaj, że kamienie domina są
identyczne (albo dlatego, że są odwrócone górą do dołu, albo dlatego, że ktoś
sprawił, że stały się nierozróżnialne, powiedzmy, malując je na czerwono).
Tak więc tylko ich sposoby ułożenia— poziomy lub pionowy— mają dla nas
znaczenie i możemy sobie wyobrazić, że zajmujemy się układaniem płytek w
kształcie kamieni domina. Na przykład, są trzy ułożenia prostokąta rozmiaru
2 x 3, a mianowicie UD, CB i HI. Tak więc T3 = 3.
Żeby znaleźć zwartą postać dla dowolnego Tn, robimy pierwszy krok,
rozważając małe wartości u. Dla n = 1 mamy oczywiście tylko jedno ułoże­
nie, 0 , ale dla n = 2 są już dwa, ID i B.
Jak wygląda przypadek dla rt = 0? Ile jest sposobów pokrycia prostokąta
2 x 0 ? Nie od razu jest jasne, co ma oznaczać to pytanie, ale widzieliśmy
już podobne sytuacje: Istnieje jedna permutacja zera obiektów (mianowicie
pusta permutacja), tak więc 0! = 1. Istnieje jeden sposób na wybranie zera
elementów spośród n elementów (wybranie niczego), tak więc (£) = 1 . Ist­
nieje jeden sposób podziału zbioru pustego na zero niepustych zbiorów, ale
nie ma takiego podziału dla niepustego zbioru, tak więc {£} = [n = 0]. Na
podstawie takiego rozumowania wnioskujemy, że jest tylko jeden sposób uło­
żenia prostokąta 2 x 0 z kamieni domina, a mianowicie nie położenie żadnego
kamienia. Dlatego To = 1. (Burzy to prosty wzorzec Tn. = n, który zachodzi
dla n = 1 , 2 i 3 , ale i tak ten wzorzec wyglądał bezsensownie, skoro To po­
winno być równe 1 zgodnie z logiką danej sytuacji.) Właściwe zrozumienie
przypadku zerowego okazuje się użyteczne przy rozwiązywaniu problemów
ilościowych.
Spójrzmy na następny przypadek, dla rt = 4. Są dwie możliwości ułożenia
lewej krawędzi prostokąta— położymy tam albo pionowy kamień, albo dwa
poziome. Jeśli wybierzemy pionowy, to częściowym rozwiązaniem jest O i
pozostały prostokąt 2 x 3 może być pokryty na T3 sposoby. Jeśli weźmie­
my dwa kamienie poziome, to pozostałe częściowe rozwiązanie HU można
zakończyć na T2 sposobów. Tak więc T4 = T3 + T2 = 5. (Tych pięć ułożeń
wygląda tak: [UD, UH, O , BU i B3.)
Znamy już pierwszych pięć wartości Tn.:
TL
0
1
2
Tn
1
1
2
3 4
3 5
Wyglądają one podejrzanie podobnie do liczb Fibonacciego i nie jest tak
trudno zobaczyć dlaczego: Podejście użyte do pokazania, że T4 = T3 + T2 ,
można łatwo uogólnić do Tn = T^-i + Tn- 2 >dla n ^ 2 . Uzyskujemy więc
takie samo równanie rekurencyjne jak dla liczb Fibonacciego, poza tym, że
początkowe wartości To = 1 i Ti = 1 są odrobinę różne. Ale te początkowe
wartości są liczbami Fibonacciego Fi i F2 , tak więc T jest ciągiem liczb Fi­
bonacciego przesuniętym o jedno miejsce:
Tn. = Fn+1 ,
dla n ^ 0.
(Uważamy to za postać zwartą dla Tn, ponieważ liczby Fibonacciego są na
tyle ważne, że możemy je uważać za znane. Samo Fn ma również zwartą
postać (6 .123 ) wyrażoną za pomocą operacji algebraicznych.) Zauważmy, że
ten wzór potwierdza sensowność naszego podstawienia To = 1 .
Ale co to wszystko ma wspólnego z funkcjami tworzącymi? Jesteśmy
już blisko tego— wyraźmy Tn inaczej. Ten nowy sposób opiera się na dość
zuchwałym pomyśle. Spójrzmy na „sumę” wszystkich możliwych pokryć pro­
stokąta 2 x n, dla wszystkich rt ^ 0 , i nazwijmy ją T:
T = l+ D+ m+ B + m] + [B + B ]+-
(Pierwszy składnik ‘I’ po prawej stronie równania oznacza puste pokrycie
prostokąta 2 x 0 .) Suma T niesie ze sobą bardzo dużo informacji. Użyteczność
takiej sumy polega na tym , że pozwala nam ona udowodnić pewne rzeczy o T
jako o całości, natom iast nie zmusza do dowodzenia ich (np. przez indukcję)
na podstawie analizy pojedynczych składników T^.
Składniki tej sumy oznaczają pokrycia prostokątów, które są obiektami
kombinatorycznymi. Nie będziemy tu ta j grymasić na tem at legalności sytu­
acji, gdy nieskończenie wiele pokryć dodaje się do siebie. Wszystko można
zrobić bardzo formalnie, ale naszym celem jest rozszerzenie świadomości po­
nad konwencjonalne wzory algebraiczne.
Dodaliśmy już wzorce do siebie, możemy je również pom nożyć— przez
dopisanie. Na przykład możemy pomnożyć pokrycia 0 i 0 , żeby otrzymać
nowe pokrycie IB. Ale zauważmy, że mnożenie nie jest przemienne, to znaczy,
że porządek jest ważny przy mnożeniu: IB różni się od E0.
Patrząc w ten sposób na mnożenie, nie jest już trudno zauważyć, że
puste pokrycie spełnia specjalną rolę— jest to element neutralny mnożenia.
Na przykład, I x B = B x I = B.
Możemy teraz zastosować arytm etykę domin do operacji na nieskończonej
sumie T:
T = l + D+ m + B + C[D+ [B + B ] + - - = l + D(l + D+ Q] + B + - - - ) + B ( l + D+ m + B + - - - )
= I+ D T + B T .
Mam wrażenie, że
te sumy muszą być
zbieżne, jeśli tylko
domina są
wystarczająco małe.
( 7 .2 )
Każde poprawne pokrycie występuje dokładnie w jednym składniku prawej
strony, tak więc to, co robimy, wydaje się sensowne, nawetmimo ostrzeżeń
z rozdziału 2 o „zbieżności bezwzględnej.” O statni wiersz w tym wzorze
mówi nam, że wszystko w T jest albo pustym pokryciem, albo pionowym
kamieniem domina i następującym po nim czymś z T, albo dwoma poziomymi
kamieniami domina i następującym po nich czymś z T.
Spróbujmy teraz rozwiązać równanie dla T. Zastępując T po lewej stronie
przez IT i odejmując dwa ostatnie składniki z prawej strony od obydwu stron
równości, otrzymujemy
(I —□ —B) T = I .
Sprawdźmy. Rozwinięta wersja powyższej równości wygląda tak:
i + D + m + B + cm + [B + B ] + - - *
— □ — □ — cm — cb — mu — h b — n=n — . • •
— h — Fn — rti — m — R m — f t h — m i — . . .
( 7 .3 )
Każdy składnik z najwyższego wiersza, poza pierwszym, jest kasowany przez
składniki z drugiego i trzeciego wiersza, tak więc nasze równanie jest po­
prawne.
Jak dotąd łatwo było znajdować kombinatoryczną interpretację dla wyra­
żeń, z którymi pracowaliśmy. Teraz jednakże, by otrzymać zwarte wyrażenie
na T, musimy wykonać „kombinatoryczne” dzielenie. Pełni wiary w to, że nie
zawsze trzeba się kurczowo trzymać algebraicznych formalizmów, dzielimy
obie strony równania ( 7 .3 ) przez I—□ —B , żeby otrzymać
(Ponieważ mnożenie nie jest przemienne, więc jesteśmy na krawędzi oszu­
stwa, nie rozróżniając pomiędzy lewym i prawym dzieleniem. W naszym
przypadku nie ma to jednak znaczenia, ponieważ I komutuje ze wszystkim.
Ale nie grymaśmy za bardzo, dopóki nasze dzikie pomysły nie prowadzą do
paradoksów.)
Następnym krokiem jest rozwinięcie tego ułamka w szereg potęgowy, za
pomocą wzoru
1
-----= ,1 + z + z 2 + z 3 H-----.
1 —z
Puste pokrycie I, które jest elementem neutralnym w naszej arytmetyce,
pełni rolę standardowej, multiplikaty wnej jedynki. 0 + B pełni rolę z. Tak
więc uzyskujemy rozwinięcie
=
i + { d + b ) + ( d + b )2 + ( d + b )3 + ---
I — U — bd
= 1+ (D + B) -f~ (CD-I-IB~ł~BU + HH)
+ ([H]+ [rB + [B]+ [ffl+ HD + H B + ffl]+ ^ B ) + --- .
Jest to też T, ale pokrycia występują teraz w innym porządku niż poprzednio.
Każde pokrycie pojawia się w tej sumie dokładnie jeden raz. I tak na przykład
i h h i h i występuje w rozwinięciu (D + B ) 7.
Możemy uzyskać ciekawą informację z tej nieskończonej sumy poprzez jej
skompresowanie, ignorując nieinteresujące nas detale. Na przykład, możemy
sobie wyobrazić, że wzorce się rozklejają i że pojedyncze domina nawzajem
komutują. Wówczas składnik taki jak II-hihi staje się D4 i=i6, ponieważ za­
wiera cztery kamienie pionowe i sześć poziomych. Składając w ten sposób,
otrzymujemy następujący szereg:
T =
1 + □ + O2 + o 2 + O3 + 2 D o 2 + D4 + 3 D 2 n 2 + i=i4 H-------.
Tutaj 2 Ucd2 reprezentuje dwa składniki w starym rozwinięciu, [B i B], które
mają jeden kamień pionowy i dwa poziome. Podobnie 3D2 a 2 reprezentuje
trzy składniki HB, CBD i BU. Tak naprawdę, to traktujemy tutaj 0 i o jako
zwykłe (przemienne) zmienne.
Możemy znaleźć postać zwartą dla współczynników w wersji przemiennej
T za pomocą wzoru dwumianowego Newtona:
I— (D + o 2)
= ! + ( □ + o 2) + (0 + o 2 ) 2 + ( □ + a 2 ) 3 +
= J j 0 + o 2)k
k^O
= j ,zk ^ 0 v /r 'j + m
j.m^O
Już-jestem całkiem
zdezorientowany.
(W ostatnim kroku k —j jest zastąpione przez m. Jest to poprawne, ponie­
waż dla 0 ^ k < j zachodzi (k) = 0.) Wnioskujemy stąd, że (,' *m) jest liczbą
sposobów, na ile można pokryć prostokąt 2 x (j + 2 m) używając j pionowych i
2m poziomych kamieni domina. Na przykład, przyglądaliśmy się poprzednio
pokryciom LH-i U-ll prostokąta 2 x 1 0 , które używają czterech kamieni piono­
wych i sześciu poziomych. W sumie jest (4 J 3) = 35 takich pokryć, tak więc
jednym ze składników w przemiennej wersji T jest 3 5D4 o 6.
Możemy ukryć jeszcze więcej szczegółów zaniedbując orientacje kamieni,
Przypuśćmy, że nie interesuje nas to, czy dany kamień ułożony jest pionowo,
czy poziomo. Jedyne co chcemy wiedzieć, to jaka jest liczba pokryć 2 x n
(tak naprawdę, to jest to liczba Tn, którą na samym początku chcieliśmy
obliczyć). Możemy uzyskać konieczną informację przez proste podstawienie
pojedynczej zmiennej z za D i □ . Moglibyśmy również zastąpić I przez 1,
otrzymując
Jest to funkcja tworząca (6 . 1 1 7 ) dla liczb Fibonacciego, tylko że w liczniku
brak jest zmiennej z. Stąd wnioskujemy, że Fn+i jest współczynnikiem przy
zn w rozwinięciu T.
Zwarte postacie 1/(1—D—B), 1/(1—□ —o 2) i 1/(1 —z —z2), które znaleźli­
śmy dla T, nazywane są. funkcjam i tw orzącym i, ponieważ tworzą (generują)
interesujące nas współczynniki.
Tak się akurat składa, że z naszego wyprowadzenia wynika, że liczba
pokryć kamieniami domina prostokąta 2 x n przy użyciu dokładnie m par
poziomych kamieni wynosi (n^m) . (Wynika to stąd, że jest j = n — 2m
pionowych kamieni i dlatego mamy
CY*)
- CY")
- (n ; m )
sposobów pokrycia według naszego wzoru.) Widzieliśmy już w rozdziale 6 ,
że (TL^nm) jest liczbą kodów Morse’a długości n zawierających dokładnie m
kresek. W rzeczywistości łatwo zobaczyć, że pokrycia prostokąta 2 x n kamie­
niami domina odpowiadają jednoznacznie kodom Morse’a. (Pokrycie i h h i h i
odpowiada ‘---------- ’.) Tak więc problem pokrycia kamieniami domina jest
bardzo blisko związany z wielomianami kontynuant, które analizowaliśmy w
rozdziale 6 . Jaki ten świat jest mały.
Rozwiązaliśmy problem Tn na dwa sposoby. Pierwszy sposób, łatwiejszy,
polegał na zgadnięciu odpowiedzi i udowodnieniu jej przez indukcję. Drugi
sposób, ciekawszy, polegał na użyciu nieskończonej sumy wzorców domina
i wydobyciu z niej potrzebnych nam współczynników. Ale czy użyliśmy tej
drugiej metody tylko dlatego, że zabawniej jest grać dominem niż zmiennymi
algebraicznymi? Nie! Prawdziwą przyczyną jej stosowania jest to, że podejście
z nieskończonymi sumami jest znacznie bardziej skuteczne. Drugi sposób ma
zastosowanie dla dużo szerszego zakresu problemów, gdyż nie wymaga od nas
zgadywania niczego w żaden magiczny sposób.
Uogólnijmy teraz nasze zadanie do problemu, w którym zgadywanie bę­
dzie dla nas dużo za trudne. Na ile sposobów Un. możemy pokryć kamieniami
domina prostokąt 3 x rt?
Początkowe wartości Un mówią nam niewiele: Puste pokrycie daje Uo =
1. Nie ma poprawnego pokrycia dla rt = 1, ponieważ domino 2 x 1 nie wypeł­
nia prostokąta 3 x 1 i nie ma miejsca dla dwóch kamieni. Następną wartość,
rt = 2, możemy łatwo obliczyć ręcznie. Są trzy pokrycia H, H i §, tak więc
U.2 = 3. (Zauważmy, że my już to wiedzieliśmy, ponieważ poprzedni problem
dał nam T3 = 3, a liczba pokryć prostokąta 3 x 2 jest taka sama jak liczba
pokryć prostokąta 2 x 3.) Dla rt — 3, podobnie jak i dla rt = 1, nie ma
żadnego pokrycia. Możemy się o tym przekonać albo robiąc krótkie przeszu­
kanie wszystkich możliwości, albo spoglądając na ten problem z wyższego
poziomu: Pole prostokąta 3 x 3 jest nieparzyste, tak więc nie ma żadnego po­
krycia kamieniami domina, których pole jest parzyste. (Oczywiście taki sam
argument można zastosować do każdego nieparzystego rt.) Dalej, dla n = 4
wydaje się, że jest około dwunastu pokryć. Trudno jednak być pewnym co
do dokładnej liczby, bez poświęcenia czasu na upewnienie się, że otrzymana
lista jest kompletna.
Tak więc spróbujmy podejścia z nieskończonymi sumami, z którym pra­
cowaliśmy poprzednim razem:
u = | + H + E + § + E!B + H 3 + 0 eI + E 9 + 5 0 +
(7-7)
Każde niepuste pokrycie zaczyna się albo od Ł, albo od ff, albo od §. Ale nie­
stety, pierwsze dwa z tych przypadków nie rozkładają się dobrze i nie dają
w rozkładzie U. Sumę wszystkich składników w U zaczynających się od ^
można jednakże przedstawić jako ^ V, gdzie
r
v = o + cg + [g + [g + g + ...
jest sumą wszystkich pokryć kamieniami domina wyszczerbionego prostokąta
3 x rt, w którym brakuje dolnego lewego rogu. Podobnie, składniki w U
zaczynające się od ff mogą być zapisane jako ff A, gdzie
a = o + [B + [ 0 + [f=3 + ś ] + - - -
składa się ze wszystkich pokryć z brakującym górnym lewym rogiem. Sze­
reg A jest odbiciem lustrzanym V. To rozłożenie na czynniki pozwala nam
napisać
u = | + ł v + F a + @u.
Możemy również rozłożyć V i A, ponieważ ich pokrycia mogą się zaczynać
tylko na dwa sposoby:
V = ou + f t v ,
A = gU + f f A .
Otrzymaliśmy teraz trzy równania z trzem a niewiadomymi (U, V i A). Mo­
żemy je rozwiązać w dwóch krokach: najpierw rozwiązujemy je dla V i A jako
funkcji od U i wstawiamy potem wynik do równania na U:
Słyszałem na
innych zajęciach
o „wyrażeniach
regularnych” Jeśli
się nie mylę,
to możemy zapisać
U = (Łft*o
+ Pś’*d+ B)*
w języku wyrażeń
regularnych; musi
więc istnieć jakieś
powiązanie
pomiędzy
wyrażeniami
regularnymi
a funkcjami
tworzącymi.
V = ( | - Ę Ł ) _10U,
A = ( | - f f ) - , Du ,
U = I + Ł ( l - % r ,Qu + F d - ś T ^ u + SU.
Końcowe równanie można rozwiązać ze względu na U. Otrzymujemy postać
zwartą
u =
i-
ł u - %
)-^
-
r
(7-8)
To wyrażenie definiuje nieskończoną sumę U, podobnie jak (7 .4 ) definiuje
T.
Znajdźmy teraz przemienną wersję tego wzoru. Wszystko się pięknie
upraszcza, gdy rozłożymy domina i będziemy używać tylko potęg □ i □ :
1 - 02[=>(1 - a 3) - ' - 02o(1 - o 3) - 1 - a 3
1- o 3
(1 - a 3 )2 - 2 0 2 a
(1 - - 3) - 1
1 - 2 0 2 a (1 -
o 3) - 2
(To wyprowadzenie wymaga dokładnego zbadania. W ostatnim kroku korzy­
stamy ze wzoru (1 —w )_2k_1 =
(mm2k)wm>tożsamość (5 .56 ).) Przyjrżyjmy, się teraz dokładniej ostatniemu wierszowi. Widać, że po pierwsze,
każde pokrycie 3 x n wykorzystuje parzystą liczbę pionowych kamieni do­
mina. Co więcej, jeśli jest 2k kamieni pionowych, to musi być co najmniej
k poziomych i całkowita liczba kamieni poziomych musi być równa k + 3 m,
dla pewnego m ^ 0. Całkowita liczba pokryć z 2k kamieniami pionowymi i
k + 3 m poziomymi wynosi ostatecznie (m^2k) 2 k.
Możemy teraz przeanalizować pokrycia prostokąta 3 x 4, co wydawało
się beznadziejne przy wstępnej analizie problemu pokrycia prostokąta 3 x rt.
Dla n = 4 pole wynosi 12, tak więc potrzebujemy w sumie sześciu kamieni
domina. Jest więc 2k pionowych i k + 3m poziomych, dla pewnych k i m.
Stąd 2k + k + 3m = 6 . Innymi słowy, k + m = 2. Jeśli nie używamy kamieni
pionowych, to k = 0 i m = 2. Liczba takich możliwości jest (2 2 °) 2 ° = 1
(jest to pokrycie
). Jeśli użyjemy dwóch kamieni pionowych, to k = 1 i
m = 1, i wówczas otrzymujemy ( 1^2 )2 1 = 6 pokryć. A jeśli użyjemy czterech
kamieni pionowych, tok = 2 im = 0 i mamy (°J 4)2 2 = 4 pokrycia. W sumie
mamy więc U4 = 11 dominowych pokryć prostokąta 3 x 4. W ogólności, dla
parzystego rt ta metoda pokazuje, że k + m = \ n i stąd (m^n21c) = (^/2-k )’
a całkowita liczba pokryć prostokąta 3 x rt wynosi
U,
= z
n /2 + k
2k =
n / 2 —k
n —m 2 ~n./2—m
m
(7-9)
Tak jak poprzednio, możemy również podstawić z za obydwa □ i □ , otrzy­
mując funkcję tworzącą, która nie określa, czy używamy kamieni pionowych,
czy poziomych. Wynikiem jest
1
1 —z3
u = 1 - z 3(1 - z 3 ) - 1 - z 3(1 - z 3) - 1 - z 3 = 1 —4z 3 + z 6 •
(7' 10)
Jeśli rozwiniemy to wyrażenie w szereg potęgowy, to otrzymamy
U = 1 + U 2 Z3 + U 4 Z6 + U 6 Z9 + U 8 Z12 + -- - ,
Tak, tak, pamiętam,
. że kiedyś w USA
były półdolarówki.
czyli funkcję tworzącą dla liczb Un . (Istnieje pewna zależność pomiędzy inde­
ksami i wykładnikami w tym wzorze. Można ją łatwo wyjaśnić. Na przykład,
współczynnikiem przy z9 jest Ug, które jest liczbą pokryć prostokąta 3 x 6 .
Jest tak dlatego, że każde takie pokrycie zawiera dziewięć kamieni.)
Moglibyśmy iść dalej w analizie (7 .10 ) i otrzymać zwartą postać współ­
czynników, ale będzie lepiej, jeśli pozostawimy to dalszym podrozdziałom,
kiedy będziemy już mieli większe doświadczenie. Skończymy więc na razie z
dominem i przejdziemy do kolejnego zapowiedzianego problemu, „rozmienia­
nia.”
Na ile sposobów możemy wydać 50 centów? Załóżmy, że opłata musi być
dokonana za pomocą jednocentówek ©, pięciocentówek ®, dziesięciocentówek ©, ćwierćdolarówek © i półdolarówek @ . George Pólya [299] spopula­
ryzował ten problem, pokazując, że można go rozwiązać w pouczający sposób
przy użyciu funkcji tworzących.
Rozważmy nieskończone sumy reprezentujące wszystkie możliwe sposoby
rozmieniania, podobnie jak zaatakowaliśmy problem domina przy użyciu
nieskończonych sum reprezentujących wszystkie możliwe wzorce kamieni do­
mina. Łatwiej pójdzie nam z mniej różnorodnymi monetami, zaczniemy więc
od przypadku, gdy nie mamy nic poza jednocentówkami. Suma wszystkich
sposobów, na ile możemy wydać resztę w jednocentówkach, może być zapi­
sana
P = / + © + © © + © © © + © © © © + •••
= / + ® + © 2 + @ 3 + ©4 + - - - .
Pierwszy składnik oznacza liczbę sposobów, na ile możemy wydać zero jedno­
centówek, drugi oznacza jedną jednocentówkę reszty, trzeci dwie, następny
trzy jednocentówki i tak dalej. Jeśli pozwolimy teraz na wydawanie zarówno
jednocentówkami, jak i piątkami, to sumą wszystkich sposobów jest
N
=
P + © P + © ® P + © ® ® P + © © © © P H -------
= ( / + ® + ® 2 + ® 3 + ® 4 + • • •) P >
ponieważ każda rozmiana ma pew ną liczbę piątek z pierwszego czynnika i
pewną liczbę centówek wziętą z P. (Zauważ, że N n ie jest sumą / + © + © +
(© + ® ) 2 + (© + ® ) 3 H---- , ponieważ taka suma zawiera niektóre rozmiany
więcej niż jeden raz. Na przykład, składnik (© + ® ) 2 = © © + © © + © © +
® ® traktuje © © i © © tak, jak gdyby były one różne, a my chcemy każdej
możliwej reszty tylko raz, bez względu na jej porządek.)
Podobnie, gdy dodamy dziesięciocentówki, otrzymamy:
D = (^ + © + © 2 + © 3 + © 4 H---- ) N ,
która przy pełnym rozwinięciu zawiera takie składniki jak © 3® 3 © 5 = ©
© 0 ® ® ® © © © © © . Każdy z tych składników odpowiada innemu sposo­
bowi rozmiany. Dodanie ćwierćdolarówek i potem półdolarówek do zakresu
możliwych rozmian daje
Q =
+ © + © 2 + ® 3 + ® 4 H---- )D ,
C = (fi + @ + @ 2 + 0
3 + 0 4 h---- ) Q .
Naszym celem jest teraz znalezienie liczby składników w C o wartości 50
centów.
Ładne rozwiązanie otrzymamy stosując prostą sztuczkę: Zastąpmymy
przez zZi) i (53) przez z . Wów­
© przez z, © przez z5, © przez z 10
czas każdy składnik jest zastąpiony przez zn, gdzie n jest monetarną war­
tością oryginalnego składnika. Na przykład, składnik @ © © @ © staje się
z 5 0 + i 0 + 5 + 5 + i _ z 7i Wszystkie cztery sposoby wydania 13 centów, a mia­
nowicie @©3, ® ® 8, ® 2 © 3 i ® 13, redukują się do z13. Tak więc, po zasto­
sowaniu podstawienia, współczynnikiem przy z 13 będzie 4.
Niech Pn, Nn, Dn, Qn i Cn będą liczbami sposobów, na ile można roz­
mienić rt centów, gdy pozwolimy na użycie monet o wartości, kolejno, co
najwyżej 1,5, 10, 25 i 50 centów. Nasza analiza pokazuje nam, że są to
współczynniki przy zn w odpowiednich szeregach potęgowych:
P = 1 + z + z 2 + z 3 + z4 + • • •
N = (1 + z 5 + z 1 0 + z 15 + z 20 + - -0 P.
, 40
H---- ) N ,
D = (1 + z 10 + z20 + z30 + zw
25
Q = (1+ z, z:,+
z 50 + z7 5 + z 100
C = ( 1 + z 50 + z 100 + z 150 + z 200
)Q .
Oczywiście, Pu = 1 dla wszystkich n ^ 0. Odrobina więcej wysiłku daje
Nn = [n/5J + 1 : Żeby otrzymać n centów z centówek i piątek, musimy
wybrać albo 0 , albo 1 , albo ... albo
piątek, po czym jest tylko jeden
sposób na wybranie centówek. Tak więc Pn i Nn są łatwe. Wartości,D^, Qn
i Cn stają się jednak coraz bardziej skomplikowane.
Ile jest tych monet,
ale tak naprawdę?
Jeśli n jest większe
niż, powiedzmy,
10 10, to założę się,
że?n = 0
w „prawdziwym
świecie” .
Rozwiązwiążemy ten problem jeśli zauważymy, że 1 + zm + z2m + • • •
wynosi dokładnie 1/(1 —zm). Możemy więc zapisać
P = 1/(1- z ) ,
N = P / ( 1 - z 5),
D = N / ( 1 - z 10),
Q = D /( 1 —z25) ,
C = Q /(1 — z50) .
Mnożąc przez mianowniki otrzymujemy
( 1 - z ) P = 1,
(1 - z 5)N
= P,
(1 —z10) D = N ,
( 1 - z25)Q = D,
(1 —z50) C = Q.
Porównując w tych równaniach współczynniki przy zn , otrzymujemy równa­
nie rekurencyjne, z którego szybko możemy obliczyć potrzebne współczyn­
niki:
Pn — Pn—1 “t"[TV= 0 ] ,
N n — ^ n —5 + Pn >
— D n -1 0
>
Q tl = Q tl—25 “1“ D n >
Cn = Cn—50 “1“ Qn •
Na przykład współczynnik przy zn w D = (l —z25)Q jest równy Qn~ Qn- 25 i
musi więc zachodzić Qn —Qn-2 5 = Dn, tak jak tego oczekiwaliśmy.
Moglibyśmy rozwinąć te rekurencje i stwierdzić na przykład, że Qn =
Dn + D n —25 + Dn-so + D n -7 5 H---- , kończąc, gdy indeksy stają się ujemne.
Ale rekurencyjna postać ma tę zaletę, że każdy współczynnik oblicza się przy
użyciu tylko jednego dodawania, tak jak w trójkącie Pascala.
Użyjmy powyższych rekurencji do obliczenia C50. Po pierwsze, C50 =
Co + Qso, chcemy więc znaleźć Q50. Dalej, Q50 = Q25 + D 50 i Q25 =
Qo + D 25 ; chcemy więc znaleźć też D 50 i D 25 . Wartości Dn zależą z kolei od
D40, D30, D20, D15, D io, D5 i od N50, N45,. . . , N5. Dlatego do wyznaczenia
wszystkich potrzebnych współczynników wystarczają proste obliczenia:
7.1. T eoria d om in a i rozm ien ian ia!
n
0
5
10
15
20
25 30 35 40 45 50
Pn
Nn
1
1
1
1
1
1
1
1
1
1
1
1
2
4
9
25
10
11
2
7
16
8
1
5
9
6
Dn
Qn
Cn
3
4
6
12
13
1
1
36
49
50
Ostatnia wartość w tabeli daje nam rozwiązanie C5o: Jest dokładnie 50
sposobów dania 50 centów napiwku.
A jaka jest zwarta postać Cn? Mnożąc przez siebie równania, otrzymamy
zwarte wyrażenie
C =
1
1
1 —z 1 —z5 1 —z 10 1 —z25 1 —z50 ’
(7-11
ale nie widać jeszcze, jak wyliczyć stąd współczynniki przy zn. Na szczęście
jest na to sposób. Wrócimy do niego dalej w tym rozdziale.
Wyrażenia w zgrabniejszej postaci otrzymamy wówczas, gdy rozważymy
problem rozmieniania dla kraju, który bije monety o każdym całkowitym
dodatnim nominale (©, © , ® , ... ), a nie tylko w pięciu nominałach, które
rozważaliśmy dotychczas. Odpowiednia funkcja tworząca jest nieskończonym
iloczynem ułamków
1
(1 - z )(1 - z 2 )(1 - z3) . . .
a współczynnik przy zn po całkowitym wymnożeniu wszystkich ułamków
oznaczany jest przez p(rt), liczbę podziałów liczby rt. Podziałem liczby n na­
zywamy reprezentację n w postaci sumy dodatnich liczb całkowitych, gdzie
kolejność składników nie jest istotna. Na przykład, jest siedem różnych po­
działów liczby 5, a mianowicie
5 - 4 + 1 = 3+2 = 3+1+1 = 2 + 2 + 1 = 2 + 1 + 1 + 1 = 1 + 1 + 1 + 1 + 1 .
Stąd p(5) = 7. (Również p(2) = 2, p (3) = 3, p(4) = 5 i p(6 ) = 11; za­
czyna wyglądać tak, jak gdyby p(rt) było zawsze liczbą pierwszą, jednakże
p( 7 ) = 15 niszczy ten pomysł.) Nie jest znana postać zwarta dla p(rt), ale
teoria podziałów jest fascynującą gałęzią matematyki, w której osiągnięto
znaczące wyniki. Na przykład Ramanujan pokazał za pomocą pomysłowej
transformacji funkcji tworzących, że p(5rt + 4) = 0 (mod 5), p(7rt + 5) = 0
(mod 7) i p (117i + 6 ) = 0 (mod 11) (patrz Andrews [11 , rozdział 10]).
(Nie wliczając
możliwości płacenia
napiwku kartą
kredytową.)
7.2. Podstawowe techniki
Przyjrzyjm y się teraz bliżej technikom, które czynią szeregi potęgowe tak
silnym narzędziem.
Najpierw kilka słów o terminologii oraz notacji. Nasza ogólna funkcja
tworząca ma postać
G(z) =
go + g i z + 9 2 Z2 H------=
gnzU
(7*12)
n^O
Jeśli fizycy mogą
,patrzeć na światło
czasem jako na falę
i czasem jako na
cząstkę, to również
matematycy
powinni móc
patrzeć na funkcje
tworzące na dwa
różne sposoby.
i mówimy wtedy, że G (z), lub w skrócie G, jest funkcją tworzącą dla ciągu
(9o, gi >g 2 >***), który oznaczamy również (gn ). W spółczynnik g^ przy zn w
G(z) jest często oznaczany przez [zn] G(z), tak jak w rozdziale 5.4.
Suma w wyrażeniu ( 7 . 12 ) jest wyliczana względem wszystkich n ^ 0,
ale często wygodniejsze będzie rozszerzenie zbioru indeksów do wszystkich
całkowitych rt. Możemy to zrobić za pomocą prostego podstawienia g_i =
g _2 = • • ■ = 0. Wówczas możemy nadal mówić o ciągu (go, g i , g2 , • • •), tak
jak gdyby gn nie istniały dla ujemnych rt.
Pracując z funkcjami tworzącymi mamy do czynienia z dwiema różnymi
„postaciami zwartymi.” Możemy mieć albo postać zw artą dla G (z) wyrażoną
jako funkcję zmiennej z, albo postać zw artą dla g^ wyrażoną jako funkcję
zmiennej rt. Na przykład, funkcja tworząca dla liczb Fibonacciego m a postać
zw artą z /(1 —z —z 2 ), ale same liczby Fibonacciego m ają postać zw artą (cf)11 —
$ n )/\/5. Z kontekstu będzie wynikało, którą postać zw artą mamy w danym
momencie na myśli.
Teraz kilka słów o punktach widzenia. Funkcja tworząca G(z) wystę­
puje w dwóch różnych bytach, zależnie od tego, jak na nią patrzeć. Czasem
traktujem y ją jako funkcję zmiennej zespolonej z, spełniającą wszystkie stan­
dardowe własności znane z analizy matem atycznej. Czasem jednak będzie to
dla nas po prostu formalny szereg potęgowy, gdzie z jest czymś, co może
reprezentować dowolną rzecz, czy też dowolną własność. W poprzednim roz­
dziale korzystaliśmy z drugiej interpretacji. W kilku przypadkach zmienną z
zastępowaliśmy pew ną własność obiektu kombinatorycznego w „sumie” ta ­
kich obiektów. W spółczynnik przy z71 był liczbą obiektów kombinatorycznych
mających n wystąpień tej własności.
Gdy traktujem y szereg G(z) jako funkcję zmiennych zespolonych, jego
zbieżność zaczyna być istotna. Powiedzieliśmy w rozdziale 2, że nieskoń­
czony szereg ^ n>0 gnZ 71 zbiega (bezwzględnie) wtedy i tylko wtedy, gdy
istnieje stała A taka, że skończone sumy
\9 nZ r i \ nigdy nie przekra­
czają A dla dowolnego N. Łatwo zauważyć, że jeśli funkcja X n > o 9 n^n jest
zbieżna dla pewnej wartości z — z o, to jest ona również zbieżna dla każdego
z spełniającego |z| < |zo|. Co więcej, musi zachodzić lim^^oo |gn ZQ | = 0.
Zgodnie z oznaczeniami z rozdziału 9, jeśli nasza funkcja jest zbieżna w zo,
to gn = O (| 1/zo |n ). I odwrotnie, jeśli gn = 0 (M n ), to szeregi L n ^o 9 n^n
są zbieżne dla wszystkich |z| < 1/M.. Są to podstawowe fakty o zbieżności
szeregów potęgowych.
Dla naszych celów zbieżność jest jednak z reguły zupełnie nieistotna,
chyba że próbujem y analizować asymptotyczne zachowanie się współczynni­
ków. Prawie każda operacja, którą wykonujemy na funkcjach tworzących,
może być uzasadniona rygorystycznie jako operacja na formalnych szere­
gach potęgowych i takie operacje są poprawne nawet wtedy, gdy ciąg nie
jest zbieżny. (Stosowne wyniki teoretyczne można znaleźć na przykład u
Bella [23], Nivena [283] i Henriciego [182, rozdział 1].)
Co więcej, nawet gdy zrezygnujemy z całej naszej ostrożności i wypro­
wadzimy wzory bez rygorystycznego uzasadnienia, możemy w końcu wziąć
wynik naszych obliczeń i udowodnić go przez indukcję. Na przykład, funkcja
tworząca dla liczb Fibonacciego jest zbieżna tylko dla |z| < 1/4> w 0,618,
ale my nie potrzebowaliśmy tego wiedzieć, żeby dowieść wzoru
= ( 4)™—
$ Tt)/v/5. Ten wzór, raz znaleziony, można sprawdzić bezpośrednio, nawet jeśli
nie dowierzamy teorii potęgowych szeregów formalnych. Dlatego będziemy w
tym rozdziale ignorować kwestię zbieżności szeregów. Stanowi ona bardziej
przeszkodę niż pomoc.
Tyle o punktach widzenia. Zajmiemy się teraz naszymi głównymi na­
rzędziami przekształcania funkcji tworzących — dodawaniem, przesuwaniem,
zamienianiem zmiennych, różniczkowaniem, całkowaniem i mnożeniem. Bę­
dziemy odtąd zakładali, że F(z) i G(z) są funkcjami tworzącymi dla ciągów
(fn) i (gn)- Założymy również to, że wartości f n i g^ są równe zeru dla
ujemnych n . Zaoszczędzi nam to kłopotów przy ustalaniu granic sumowania.
Jest dość jasne, co się stanie, gdy dodamy do siebie stałe wielokrotności
F i G:
aF(z) + |3G(z) = a y f n zn +
n
=
^ t a f n
|3 Y gn zn
n
+ P g n )^ .
( 7 - 13 )
Tl
Daje nam to funkcję tworzącą dla ciągu (<xfn + |3gn ).
Przesuwanie funkcji tworzącej nie je^t wiele trudniejsze. Żeby przesunąć
G(z) o m miejsc na prawo, czyli podać funkcję tworzącą dla ciągu (0 , . . . , 0 ,
g0, g i , ♦ ♦ • ) = (gn- m ) z m zerami na początku, funkcję wyjściową mnożymy
po prostu przez zm :
zm G(z) = Y
gn zn+m = Y
n
rt
g n -m Z u ,
całkowite m ^ 0 . ( 7 . 14 )
Tej operacji używaliśmy już dwukrotnie, wraz z dodawaniem, w celu uzyska­
nia równania (1 — z — z2 )F(z) = z, gdy znajdowaliśmy postać zw artą liczb
Fibonacciego w rozdziale 6 .
W celu przesunięcia G(z) w lewo o m pozycji — to znaczy znalezienia
funkcji tworzącej dla ciągu (gm , gm+1, gm+2, . . . > = (gn+m) z usuniętym i
pierwszymi m elem entam i— odejmujemy pierwszych m składników, a po­
tem dzielimy przez z m :
G (z )-g 0-
'9 m - 1Z
m —1
= Z
QnZ
(7-15)
n^m
n^O
(Nie możemy rozszerzyć tej ostatniej sumy na wszystkie n , chyba że go =
~ gm —1 = o.)
Zamiana z przez jego (stałą) wielokrotność jest naszą następną sztuczką:
G(cz) = ^ g n (cz)n = ^
n
cTtgn zTL,
( 7 . 16 )
n
co daje funkcję tworzącą dla ciągu (cn gTt). Szczególnie użyteczny jest przy­
padek szczególny c = —1.
Często tak się składa, że chcemy otrzymać czynnik rt jako współczynnik
w szeregu. Różniczkowanie jest tym , co pozwala nam to zrobić:
G '(z) = gi + 2 g2z + 3 g 3Z2 + • • •= ^ ( n + 1)g n+1 zn .
( 7 . 17 )
n
Przesuwając tę sumę w prawo o jeden składnik, otrzymujemy bardziej przy­
datny wzór:
zG '(z) = ^ n g n zn .
( 7 . 18 )
n
Jest to funkcja tworząca dla ciągu (n g n ). Powtarzając różniczkowanie mo­
glibyśmy otrzym ać funkcję tworzącą dla iloczynu gn i dowolnego wielomianu
zmiennej n.
Całkowanie, odwrotność różniczkowania, pozwala nam dzielić składniki
przez n:
fzG ( t ) d t = g z + ^1g i z 21 + - g 2z3 H---- =
Jo
0
2
3
Y
1
- g n_ i z n .
n
( 7 . 19 )
(Zauważ, że stały składnik jest zerem.) Jeśli potrzebujem y funkcji tworzącej
dla (g tl/ ti), a nie dla (gn _ i/ri), to powinniśmy przesunąć najpierw o jedno
miejsce w lewo, zamieniając w całce G(t) przez (G(t) — g o )/t.
T abela 371. Operacje na funkcjach tworzących
<xF(z) +
Na koniec pokazujemy, jak można mnożyć przez siebie funkcje tworzące:
F (z )G (z ) =
( f 0 + f i z + f 2z2 H------) (go + g i z + g2Z2 H------- )
— ("fogo) + (fogi + f i g o ) z + (fog2 + fi gi + f 2 go)z2 + • • •
=
H
( L
n
k
f k g n - k) 2n .
(7-20)
Jak już zaobserwowaliśmy w rozdziale 5, daje to nam funkcję tworzącą dla
ciągu (hn.) — s p lo tu ciągów (fn ) i (gn)- Sumę Kn = 2 I k f kg n -k można także
zapisać jako h n = Z!k=o fk 9 n - k , ponieważ f k = 0 dla k < 0 i gn- k = 0
dla k > rt. M nożenie/splot jest odrobinę bardziej skomplikowane niż inne
operacje, ale jest bardzo użyteczne — tak użyteczne, że cały podrozdział 7.5
poświęcimy analizie jego zastosowania.
T a b e la 372. Proste ciągi i ich funkcje tworzące
Ciąg IBKiiliM
f' Funkcja tworząca
I Postać zw arta
(1 , 0 , 0 , 0 , 0 , 0 ™ .
{0 ,...,0 ,1 ,0 ,0 ,...}
| ^ o fu=m]zn |
<1,1,1,1,1,1,...)
Z ,* ,* *
y
( 1 , - 1 , 1 , - 1, 1 , - 1 , . . . )
-
-
‘Ii
( 1 ,0 ,1,0,1,0 ,...)
L «n^O
> J 2\ n w
A—
(1,0 ,...,0 ,1,0,...,0,1,0,...)
r nSoEmXTv]:
(1 ,2 ,3,4,5,6 ,...)
Z
(1,2,4,8,16,32,...)
5”
2n z <
£ —-n>o
McVUct%-)
i
z.__
V
\
\ u > *>2 * 3 » 4 1 ** */
f m + n ) zn
If' '
m
f;
n
L n
1
1 —cz
-Ł—n^O \
/o 1 I I 1
(1 + z ) c
r Tl^O ( c+n_1
1z U
< 1 ,C ,C 2 ,C 3 , . . . )
(1 - z F
0 + z )4
\n .
O.c,
1
1
1 — 2z
Zti^ o
* Z
u^O \Ti
(1 ,4 ,6 ,4,1,0,0 ,...)
(i
J n + 1)
1 — Zm
J
1
(1 - z ) m+1
ln -i1 —z
;
^
? ; ‘
■
■
r>: -> 0
0 >1>i ’ h j 4 ^ i b >; *•)
T
l
: :,
4
z n ^ O Tl!
-V
ln(l + z)
Mnożenie m a kilka szczególnych przypadków, które warte są uznania ich
za oddzielne operacje. Już widzieliśmy jeden z nich: Gdy F(z) = zm , wówczas
otrzymujemy operację przesunięcia ( 7 . 14 ). W tym przypadku suma Hn staje
się pojedynczym składnikiem gn _ m , ponieważ wszystkie f k są równe 0 poza
fm = 1 .
Inny przydatny przypadek szczególny otrzym amy wtedy, gdy F(z) jest
znajom ą funkcją 1 / ( 1 —z) = 1 + z + z 2 + • • •. Wówczas wszystkie f k są
równe 1 (dla k ^ 0 ) i otrzymujemy ważny wzór
—
G(z) = Z ( L f n - l c V
z
n
^k^O
=
'
9 kV U '
n
(7'21)
Mnożenie funkcji tworzącej przez 1/(1 — z) daje nam funkcję tworzącą dla
sum częściowych ciągu wyjściowego.
Tabela 371 podsumowuje omówione do tej pory operacje na funkcjach
tworzących. Ażeby skutecznie używać wszystkich tych operacji, należy mieć
pod ręką jak najpełniejszy repertuar funkcji tworzących. Tabela 372 pokazuje
najprostsze funkcje tworzące. Ich użycie pozwala rozwiązać całkiem sporo
trudnych problemów.
Każda z funkcji tworzących w tabeli 372 jest wystarczająco ważna, żeby
ją zapamiętać. Kilka z nich jest szczególnym przypadkiem innych funkcji i
można je wyprowadzić szybko z innych przy użyciu prostych operacji z tabeli
371. Dlatego zapam iętanie ich nie powinno być zbyt trudne.
Rozważmy na przykład ciąg ( 1 , 2 , 3 , 4 , . . . ) , którego funkcja tworząca jest
szczególnie użyteczna. Ta funkcja tworząca znajduje się w środku tabeli 372
i jest również szczególnym przypadkiem ciągu ( 1 ,
, (m^ 2) , (™^3) >•••),
dla m = 1, który znajduje się poniżej. Jest ona również szczególnym przy­
padkiem dla c = 2 funkcji tworzącej ciągu (1, c, (° 2 1) , C 3 2) >•••)• Możemy
wyprowadzić ją z funkcji tworzącej dla ( 1 , 1 , 1 , 1 , . . . ) przez wzięcie sum czę­
ściowych, jak w ( 7 .21 ), to znaczy przez podzielenie funkcji 1/(1 — z) przez
(1 —z). Możemy też wyprowadzić j ą z ( 1 , 1 , 1 , ! , . . . ) przez zróżniczkowanie,
zgodnie ze wzorem ( 7 . 17 ).
Ciąg ( 1 , 0 , 1 , 0 , . . . ) jest następnym ciągiem, którego funkcję tworzącą
można uzyskać na wiele sposobów. Możemy ją oczywiście uzyskać ze wzoru
Y n z2rL — 1/(1 — z2) przez podstawienie z 2 za z w tożsamości
=
1/(1 —z). Możemy też zastosować sumy częściowe do ciągu (1, —1,1, —1 , . . . ) ,
którego funkcją tworzącą jest 1/(1 + z), żeby otrzymać 1/(1 + z )(1 — z) =
1/(1 —z2). Jest jeszcze trzeci sposób, który jest oparty na ogólnej metodzie
dla wyodrębnienia parzystych składników (go, 0 , g 2 , 0 , g4 , 0 , . . . ) z d o w o ln e g o
ciągu: Jeśli dodamy G(—z) do G (+z), to otrzym amy
G(z) + G(—z) = ^ T g ^ O + ( - l ) 71) ^
n
=
gn [n parzyste]zn ;
n
Wskazówka: Jeśli
ciąg składa się
ze współczynników
dwumianowych,
to jego funkcja
tworząca używa
z reguły dwumianu
1 ± z.
OK, OK. Już
jestem przekonany.
dlatego
G(z) + G(—z)
=
Y
( 7 -22 )
g2nz2n-
n
Nieparzyste składniki można uzyskać w podobny sposób,
G {z)-G {-z)
_ y
2
—
/
„2n+1
9 2 rt+ 1
2
.
( 7 - 2 3 )
rt
W szczególnym przypadku, gdy gn = 1 i G(z) = 1/(1 —z), funkcją tworzącą
dla (1,0,1,0,... >jest 1 (G (z) + G(-z)) = \
^
^
Wypróbujmy tę sztuczkę na funkcji tworzącej dla liczb Fibonacciego.
Wiemy, że ]Tn
= z/(l —z —z2). Dlatego
Y ^ n Z 2n =
U 1 _ zZ_ z2 + 1 +zl
z2
1 / z + z2 —z 3 —z + z 2 + z3 \
2\
( 1 - z 2 )2 - z 2
/
T
z2
3z2 + A *
Definiuje to nam ciąg (F0 , 0, F2 , 0, F4)...). Stąd ciąg parzystych elementów
F, (F0, F2, F4) Fć, ...) = (0,1,3, 8 ,.. .), ma prostą funkcję tworzącą:
£ F 2n z - = —
( 7 .24 )
7.3. R ozw iązyw anie rekurencji_________________
Skoncentrujmy teraz uwagę na jednym z najważniejszych zastosowań funkcji
tworzących: rozwiązywaniu równań rekurencyjnych.
Dla danego ciągu (gn) spełniającego zadane równanie rekurencyjne, szu­
kamy zwartej postaci wyrażającej gn jako funkcję n. Rozwiązanie takiego
problemu za pomocą funkcji tworzących składa się z czterech kroków, które
są prawie na tyle mechaniczne, że mogłyby być zaprogramowane na kompu­
terze:
1. Napisz jedno równanie, które wyraża gn jako funkcję od innych elemen­
tów w tym ciągu. Równanie to powinno być spełnione dla wszystkich
całkowitych n, przy założeniu że g_i = g_ 2 = • • • = 0 .
2. Pomnóż obydwie strony równania przez zn i zsumuj po wszystkich rt. Po
lewej stronie otrzymasz sumę Y_n 9 nZn>która jest funkcją tworzącą G (z).
Prawa strona powinna być przekształcona tak, żeby stała się wyrażeniem
zawierającym G(z).
3. Rozwiąż otrzymane równanie, otrzymując postać zwartą dla G (z).
4. Rozwiń G(z) w szereg potęgowy i weź współczynnik przy zu ; jest to
zwarta postać dla g^.
Ta m etoda działa, ponieważ pojedyncza funkcja G(z) reprezentuje cały ciąg
(gn ) w sposób umożliwiający wykonywanie wielu przekształceń.
P rzy k ła d 1: L iczby F ib on acciego je szcz e raz
W ykonajmy dla przykładu jeszcze raz nasze przekształcenia dla liczb Fibo­
nacciego z rozdziału 6 . W tam tym rozdziale poruszaliśmy się po omacku i
uczyliśmy się nowej metody. Teraz chcemy być bardziej systematyczni. Daną
rekurencją jest
90 = 0 ;
9n =
gi = 1 ;
9 n —i +
9 u —2 ,
dla n >
2.
Znajdziemy zw artą postać dla gn przy użyciu powyższych czterech kroków.
Krok 1 nakazuje nam zapisać równanie rekurencyjne jako „pojedyncze
równanie” dla gn . Moglibyśmy napisać
{ 0,
jeśli n ^ 0 ;
jeśli n = 1 ;
1,
g n -i + 9 n - 2 y jeśli n > 1 ;
ale to jest oszukiwanie. Krok 1 wymaga wzoru, który nie zawiera instrukcji
warunkowej. Pojedyncze równanie
gn = gn —1 H- gn —2
działa dla n ^ 2 i zachodzi ono również wówczas, gdy n ^ 0 (ponieważ mamy
g o = 0 i g Uje m n e = 0). Ale dla n = 1 otrzymujemy 1 po lewej stronie i 0 po
prawej. Szczęśliwie można to łatwo obejść, ponieważ możemy dodać [n = 1]
do prawej strony. W ten sposób dodamy 1, gdy n = 1 i nic nie zmienimy,
gdy n / 1. Tak więc mamy
gn — g-n-1 + g-n- 2 + Itl= 1] >
co daje nam równanie dla kroku 1 .
Krok 2 nakazuje nam przekształcić równanie dla (gn ) w równanie dla
G(z) = Y -n 9 n zTi- Zadanie nie jest zbyt trudne:
G(z) = Y _ g n ^ = Y
n
=
g n -1 Zn + y~ gn - 2 Zn +
n
n
Y
9 n * n+1 + Y
[n = 1 ] z u
n
9 n Z n+2
n
n
= zG(z) + z 2 G ( z ) + z .
Krok 3 jest również prosty w tym przypadku. Mamy
co oczywiście nie jest żadnym zaskoczeniem.
+
Z
Krok 4 jest rozstrzygający. W rozdziale 6 wykonaliśmy go po nagłym
błysku olśnienia. Teraz zrobimy to znacznie wolniej, aby bezpiecznie wykonać
krok 4 także później, gdy napotkamy trudniejsze problemy. Ile wynosi
[zT
1- z - z 2 ’
czyli współczynnik przy zn, gdy rozwiniemy z/( 1 —z—z2) w szereg potęgowy?
Ogólniej, gdy mamy daną dowolną funkcję wymierną
-
PW
QM
gdzie P i Q są wielomianami, ile wynosi wówczas współczynnik [zu] R(z)?
Istnieje grupa funkcji wymiernych, której współczynniki są szczególnie
przyjemne, a mianowicie
iT T ^ -z C \r y .--
<«>
(Przypadek p = 1 wystąpił w tabeli 372 i możemy otrzymać ogólne wyrażenie
podstawiając pz za z.) Skończona suma funkcji, podobnie jak w (7 .25 ),
Q(~\
1
a2
1 1
^
{z> = (1 - Plz)™'+' + (1 - p 2z)"^+' + '" + (1
/
c\
’ (7'26)
ma także ładne współczynniki,
+ai{ mi jPi- (7-27)
Pokażemy, że każda funkcja wymierna R(z) taka, że R(0) /
wyrażona jako
R(z) = S(z) + T(z),
00 , może być
(7 .28 )
gdzie S(z) jest postaci (7 .26 ), T(z) zaś jest wielomianem. Dlatego też współ­
czynniki [zn] R(z) mają postać zwartą. Znalezienie S(z) i T(z) jest równo­
ważne znalezieniu „rozwinięcia na ułamki proste” dla R(z).
Zauważmy, że S(z) = 00 , gdy z przybiera wartości 1/ p i ,..., 1/ę>\. Dla­
tego liczby pic, które musimy znaleźć, jeśli chcemy wyrazić R(z) w żądanej
postaci S(z) + T(z), muszą być odwrotnościami liczb otic, gdzie Q(ctic) = 0 .
(Przypomnijmy, że R(z) = P(z)/Q(z), gdzie P i Q są wielomianami, a stąd
R(z) = 0 0 tylko dla Q(z) = 0 .)
Przypuśćmy, że Q(z) jest postaci
przy czym q0 ± 0 i qm ^ 0.
Q(z) = q0 + q i z + • • • + qmzm ,
„Lustrzany” wielomian.
ą0zm+ ąiz™--' + -----b q m
QR(z) =
znajduje się w następującej ważnej relacji do Q(z):
QR(z) = C|o(z P l ) . . . ( z Pm)
4=» Q(z) = q0(l —P iz )... (1 —pmz ) .
Tak więc pierwiastki QR są odwrotnościami pierwiastków Q, i vice versa,
dlatego możemy znaleźć szukane liczby pk rozkładając na czynniki proste
lustrzany wielomian QR(z).
Na przykład, w przypadku liczb Fibonacciego mamy
Q(z) = 1 —z —z2 ;
Qr (z) = z2 —z —1 .
Pierwiastki QR można znaleźć przez podstawienie (a,b,c) = (1,—1,—1) we
wzorze (—b ± V b 2 —4ac)/2a. Otrzymujemy stąd
i+V5
=
.
*
^-V5
* $ = - j - .
Tak więc QR(z) = (z —<J>)(z —$) i Q(z) = (1 —4>z)(l —$z).
Jeśli znamy już wszystkie p, to możemy iść dalej, znajdując rozbicie na
ułamki proste. Najłatwiej jest wówczas, gdy wszystkie pierwiastki są różne,
rozważmy więc ten szczególny przypadek najpierw. Podamy tutaj i udowod­
nimy formalnie następujący wynik:
T w ie rd z e n ie o ro z w ija n iu fu n k c ji w y m ie rn y c h o p ie rw ia s tk a c h je d ­
n o k ro tn y c h
J e ś li R(z) = P(z)/Q(z), g d z i e Q(z) = qo(1 — piz)...(1 — piz) i l i c z b y
(pi,...,pi) s ą r ó ż n e , t o w p r z y p a d k u g d y P(z) j e s t w ie lo m ia n e m s t o p n i a
m n i e js z e g o n i ż l , z a c h o d z i
[zn] R(z) = a, p? H-----+ cnpj1 ,
gdzie a k =
(7-29)
Dowód: Niech a i, . .., ai będą powyższymi stałymi. Wzór ( 7 . 2 9 ) jest speł­
niony, jeśli R(z) = P(z)/Q(z) jest równe
C ( \ = ----------ai
1
S(z)
1------ 1h
1
Pi z
Ql
1-P lZ
Zaimponuj swoim
rodzicom
zostawiając książkę
otwartą na tej
stronie.
Udowodnimy, że R(z) = S(z), pokazując, że funkcja T(z) = R(z) —S(z) nie
jest nieskończona, gdy z —>1/ pk- W tym celu pokażemy, że funkcja wymierna
T(z) nie jest nigdy nieskończona. Stąd będzie wynikało, że T(z) musi być
wielomićinem. Ponieważ pokażemy również, że T(z) —> 0 dla z —> oo, więc
otrzymamy ostatecznie, że T (z) musi być zerem.
Niech aic = 1/pk- Żeby pokazać, że limz_».ak_T(z) ± oo, wystarczy udo­
wodnić, że limz-*ak (z —aic)T(z) = 0, ponieważ T(z) jest wymierną funkcją
zmiennej z. Chcemy więc pokazać, że
lim (z—aic)R(z) =
z—
fctic
lim (z —cx.k)S(z).
Z—MXic
Granica po prawej stronie wynosi limz->ock a-k[z —ctk)/(1 —Pk*) = —cik/Pk,
ponieważ (1 —pkz) = —Pk(z—otk) i (z—(Xk)/0 —Pjz) —» 0, dla j ^ k. Granica
po lewej stronie wynosi
Um ( z - « k) ^ l = p(«k) Urn
Q(z)
z - > a k Q(z)
z->cxk
P(a^
Q'(ak)
z reguły de 1’Hospitala. To kończy dowód twierdzenia.
Powracając do przykładu z liczbami Fibonacciego, mamy P(z) = z i
Q(z) = 1 —z —z2 = (1 —4>z)(1 —$z). Zatem Q'(z) = —1 —2z i
-pP(1/p)
Q'(1/p)
-1
-1-2/p
p
p + 2*
Zgodnie z ( 7 . 2 9 ) , współczynnik przy ^ w [z^] R(z) wynosi dlatego
+
2) = 1/V5, a współczynnik przy $ 1Xwynosi $ / ( $ + 2 ) = —1/y/5. Tak więc na­
sze twierdzenie mówi nam, że Fn = (4>n —<pn)/V5, tak samo jak w równćmiu
(6.123).
Gdy Q(z) ma pierwiastki wielokrotne, wówczas obliczenia stają się bar­
dziej skomplikowane, ale możemy wzmocnić dowód twierdzenia i dowieść
następującego ogólniejszego wyniku:
Ogólne twierdzenie o rozwijaniu wymiernych funkcji tworzących
Jeśli R(z) = P(z)/Q(z), gdzie Q(z) = qo(1 — piz)dl ...(1 — p;z)dl i liczby
( pi , . . . , pi) są różne, to w przypadku gdy P(z) jest wielomianem stopnia
mniejszego niż l, zachodzi
[zn] R(z) = fi (n)p? + ••• + f i Mp^
dla wszystkich n ^ 0, ( 7 . 3 0 )
gdzie każdy wielomian fk(ti) jest wielomianem stopnia dk —1 z najbardziej
znaczącym współczynnikiem
=
(-P icl^Pd/pO dfc
Q (dk)0 / P k )
___________ P(1/pfc)___________
(dic —1)! q 0
—P i/P k ) d)
(’
Można tego dowieść przez indukcję względem m a x ( d i , . . . , di), korzystając z
faktu, że
a i (d! — 1 )!
a x(dL- 1 )!
R(z)(1 - Pi z) dl
(1 - P!Z)dl
jest funkcją wymierną, której mianownik nie jest podzielny przez (1 — pkz)dk,
dla żadnego k.
P r z y k ła d 2 : M n ie j-lu b -b a rd z ie j losow a re k u r e n c ją
Po poznaniu ogólnej metody, jesteśm y gotowi rozwiązać nowe zadania. Spró­
bujm y znaleźć zw artą postać dla rekurencji
9o = 9i = 1 ;
9n
=
9 n - 1 + 2 gn - 2 + ( - 1 r
,
dla n ^ 2 .
( 7 .32 )
Zawsze jest dobrze zacząć od zrobienia tabeli z wartościami dla m ałych liczb
i dla naszej rekurencji mamy:
rt
0
1
2
3
4
5
M )n
1
-1
1
-1
1
9n
1
1
4
5
6
7
-1
1
-1
14 23
52
97
Nie widać jednak stąd natychm iast postaci zwartej i taki ciąg nie jest nawet
wymieniony w P o d rę c z n ik u Sloane’a [331]; tak więc musimy przejść przez
wszystkie cztery kroki, żeby znaleźć rozwiązanie.
Krok 1 jest prosty, ponieważ musimy tylko wstawić odpowiednie czynniki
tak, aby wszystko działało dla rt < 2: Równanie
9-n. =
9 n —1 + 2 g n _ 2 + ( - 1 ) n [ n ^ 0 ] + [ n = 1]
jest spełnione dla wszystkich całkowitych rt. Teraz możemy przejść do kroku 2
G(z) = £ g „ z n = ^ g n - 1z - + 2 ^ g n - 2 z - + ^ ( - 1 )n zn + ^ z n
1x
i
x
=
rt
n^o
n=i
zG(z) +2z2G(z) + — |---hz .
1+ z
(Moglibyśmy również użyć (^11) zamiast (—1)n [rt^0] , otrzym ując równość
Łn (n V = ^
ze wzoru dwumianowego Newtona.) Po elementarnych
przekształceniach algebraicznych kończymy krok 3:
n(
,
G(z) =
1 + z(1 + z )
1 + Z + Z2
(1 + z )(1 —z —2 z2)
(1 —2 z )(1 + z )2 *
nie
jest wcale zgubiony!
Czas na krok 4. Kwadratowy czynnik w mianowniku jest odrobinę kłopo­
tliwy, ponieważ wiemy, że pierwiastki wielokrotne są bardziej skomplikowane
niż pierwiastki jednokrotne; ale go mamy i nic na to nie poradzimy. Mamy
dwa pierwiastki, pi = 2 i p2 = —1. Ogólne twierdzenie o rozwijaniu (7 .30 )
daje nam
Qn = a i 2 n + (a2rt + c ) ( - 1 )n
dla pewnej stałej c, gdzie
fll -
1 + 1 / 2 + 1/4
(1 + 1 / 2 )2
7
9’
1-1+1
az ~ 1 —2 / ( —1 ) -
1
3'
(Drugi wzór dla ak w (7 .31 ) jest łatwiejszy w użyciu niż pierwszy, gdy mia­
nownik ma ładny rozkład na czynniki. Podstawiamy po prostu z = 1/pk
wszędzie w R(z) poza czynnikami, w których to da zero, i dzielimy przez (dk—
1)!. To daje współczynniki przy rtdk_1 p£.) Podstawiając rt = 0 widzimy, że
wartość c powinna wynosić | . Tak więc naszą odpowiedzią jest
= |2n + ( in + f)(-1)n .
(7-33)
Nic nie kosztuje sprawdzenie tego dla rt = 1 i 2, tak żebyśmy mieli pewność,
że nigdzie się nie pomyliliśmy. Może i powinniśmy nawet sprawdzić rt = 3,
ponieważ nasz wzór wygląda trochę podejrzanie. Ale jest on poprawny, wszy­
stko jest w porządku.
Czy moglibyśmy znaleźć (7 .33 ) poprzez zgadywanie? Być może po wy­
pisaniu większej liczby wartości zaobserwowalibyśmy, że gn+i « 2 gn dla
dużych rt. Z dobrym węchem i odrobiną szczęścia moglibyśmy nawet jakoś
wyniuchać stałą Ale z całą pewnością jest znacznie łatwiej i pewniej mieć
pod ręką funkcje tworzące.
Przykład 3: W zajemnie zależne równania rekurencyjne
Czasem mamy dwie lub więcej rekurencje, które zależą od siebie nawzajem.
Możemy wówczas znaleźć funkcje tworzące dla obydwu rekurencji i rozwiązać
je potem przez proste rozszerzenie naszej metody czterech kroków.
Na przykład, powróćmy do analizowanego wcześniej w tym rozdziale pro­
blemu pokrycia prostokąta 3 x rt kamieniami domina. Jeśli chcemy znać tylko
całkowitą liczbę Un pokryć prostokąta 3 x rt kamieniami domina, bez dziele­
nia tej liczby na kamienie pionowe i poziome, to nie potrzebujemy wgłębiać
się w szczegóły tak głęboko jak poprzednio. Weźmy rekurencje
U 0 = 1,
Ui = 0;
Un = 2 Vn_! + U n _ 2 ,
Vo = 0,V1 = 1;
Vn = Un _! + Vn _ 2 ,
dla rt ^ 2 .
Vn oznacza tutaj liczbę pokryć wyszczerbionego prostokąta 3 x n (bez rogu)
z użyciem (3rt—1)/2 kamieni. Możemy łatwo uzyskać te równania, jeśli prze­
analizujemy, tak jak poprzednio, wszystkie możliwe konfiguracje kamieni na
lewej krawędzi prostokąta. Oto wartości Un i Y-n. dla małych u:
rt
0
1
2
3
4
5
6
7
un
1
0
3
0
11
0
41
0
0
1
0
4
0
15
0
56
(7-34)
Znajdźmy teraz postacie zwarte w czterech krokach. Najpierw otrzymu­
jemy (krok 1)
Un =
2 Vn_i + Un _2 + [t i = 0] ,
V tl =
Un_i + Vn _2 ,
dla wszystkich rt. Stąd (krok 2 ),
U(z) = 2zV(z) + z 2U(z) + 1 ,
V(z) = z U ( z ) + z 2V(z).
Teraz (krok 3 ) musimy rozwiązać dwa równania z dwiema niewiadomymi.
Jest to proste, ponieważ drugie równanie daje Y(z) = zll(z)/(1 —z2). Otrzy­
mujemy więc
u (z ) = i - 4y + Z 4 ;
= i _ 4 z 2 + z4 •
(7-35)
(Wzór (7 .10 ) jest podobny do naszego wzoru na U(z), tyleże teraz mamy
z3 zamiast z2. W tamtym przypadku n było liczbą kamieni, a teraz jest to
szerokość prostokąta.)
Mianownik 1 —4z2 + z4 jest funkcją z2. To właśnie daje lizn+i = 0 i
V2n = 0, tak; jak być powinno. Możemy skorzystać z tej przyjemnej własności
funkcji z2, gdy będziemy rozkładać mianownik. Nie musimy brać 1 —4z2 + z 4
jako iloczynu czterech czynników (1 — pkz), ponieważ dwa z nich postaci
(1 —picZ2) będą wystarczające do znalezienia współczynników. Innymi słowy,
jeśli rozważymy funkcję tworzącą
w (z ) =
a \
2 = Wo + W ,z + W 2 z 2 + -- -' ,
I —4z H~z^
1
( 7 .36 )
to będziemy mieli V(z) = zW(z2) i U(z) = (1 —z2 )W(z2). Tak więc V2n+i =
W n i U.2n = w n —Wn_ i . Zaoszczędzimy więc czasu i energii pracując z
prostszą funkcją W (z).
Rozkład 1 —4z + z2 daje nam (z —2 —\ / 3 ) i (z —2 + V 3 ), które mogą
być również przedstawione jako (l —(2+\/3)z) i (l —(2—\/3)z), ponieważ
ten wielomian jest sam swoim odbiciem. Otrzymujemy więc
V2 n + 1 = w n = ł ^ ł ( 2 + V 3 )n + ^ j ^ - ( 2 - V 3 ) n -,
U in = Wn - W n_, = ł t ^ I ( 2 + v £ ) n + 2 = ^ I ( 2 - > / 3 ) u
_
(2 + y ^ r
(2 - y i r
3-y /l
3 + V3
.
'
.
U '37J
Jest to szukana postać zwarta na liczbę pokryć prostokąta 3 x rt.
Możemy uprościć wzór na U2n zauważając, że drugi składnik leży zawsze
pomiędzy 0 i 1. Liczba U2n jest zawsze całkowita, tak więc otrzymujemy
U2n =
(2 + 7 3 )1
dla n Js 0 .
3 —\/3
( 7 .38 )
Tak naprawdę to drugi składnik (2 —\ / 3 )'V(3 + V 3 ) jest bardzo mały dla
dużych n, ponieważ 2 a / 3 » s 0,268. Należy to wziąć pod uwagę, gdybyśmy
chcieli zastosować wzór (7 .38 ) przy obliczeniach numerycznych. Na przykład,
dość drogi „firmowy” kalkulator podręczny otrzymał 413403,0005 podczas
obliczania (2+ \/3) 10/(3—y/3). Jest to poprawne z dokładnością do dziewięciu
cyfr znaczących, ale prawdziwa wartość jest trochę mniejsza niż 413403, a
nie trochę większa! Dlatego błędem by było wziąć sufit z liczby 413403,0005.
Poprawną odpowiedź, U20 = 413403, uzyskuje się przez zaokrąglenie do
najbliższej liczby całkowitej. Sufity mogą być niebezpieczne.
—
Znałem także śliskie
podłogi.
P r z y k ła d 4: P o s ta ć z w a r ta d la ro z m ie n ia n ia
Gdy przerwaliśmy rozważania problemu rozmieniania pieniędzy, potrafiliśmy
już obliczyć liczbę sposobów płacenia 50 centów. Spróbujmy teraz obliczyć
liczbę sposobów rozmienienia jednego dolara, lub też miliona dolarów— na­
dal używając tylko jednocentówek, piątek, dziesiątek, ćwierćdolarówek i półdolarówek.
Wyprowadzona wcześniej funkcja tworząca
r , ,
C(z) =
1
1 —z ł
1
1
1
1
—z5 1 —z 10 1 —z25 1 —z50
jest funkcją wymierną zmiennej z z mianownikiem stopnia 91. Możemy więc
rozłożyć mianownik na 91 czynników i otrzymać 91-składnikową „postać
zwartą” dla Cn, liczby sposobów, na które można wydać rt centów. Ale jest
to zbyt straszne, żeby nawet zacząć myśleć o tym. Czy możemy zasugerować
lepszą metodę dla tego szczególnego przypadku?
Promyczkiem nadziei może być to, że mianownik jest prawie funkcją od
z5. Sztuczka, której poprzednio użyliśmy do uproszczenia obliczeń, zauwa-
żając, że 1 — 4z 2 + z 4 jest funkcją z2, może być teraz użyta do C(z), jeśli
zastąpim y 1/(1 —z) przez (1 + z + z 2 + z 3 + z 4 )/ (1 —z5):
1 + z + z2 + z 3 + z 4
C(z) = —
1 —z 5
1
1
1
1
1 —z 5 1 —z 10 1 —z 25 1 —z 50
= (1 + Z + Z2 + z 3 + z 4 )Ć(z5) ,
C(z) =
1
1
1
1
1
1 —z 1 —z 1 —z 2 1 —z 5 1 —z 10 *
Ta skompresowana funkcja Ć(z) m a mianownik stopnia tylko 19, tak więc
nadaje się już znacznie lepiej do naszych celów niż początkowa funkcja. To
nowe wyrażenie na C(z) pokazuje nam w szczególności, że C5U = Csn+i =
C5TL+2 = Csn +3 = C5n + 4 i że faktycznie, równania te są oczywiste z retrospekcji: Liczba sposobów dania napiwku 53 centów jest taka sama jak liczba
sposobów dania napiwku 50 centów, ponieważ liczba centówek jest określona
modulo 5.
Ale Ć(z) nadal nie m a wystarczająco prostej postaci zwartej, jeśli chcemy
użyć pierwiastków mianownika. Uprościmy obliczenia współczynników przy
Ć(z), gdy zauważymy, że każdy czynnik w mianowniku jest dzielnikiem 1 —
z 10. Stąd możemy napisać
Ć(z ) =
A (z)
j-| _ z i 0)5 » gdzie A(z) = Ao + Ai z H-------I-A 31Z31.
(7-39)
Dla zainteresowanych: wartość A(z) wynosi
(1 + z + - - - + z9)2(1 + z2 + --- + z8)(1 + z 5)
= 1 + 2z + 4z2 + 6z3 + 9z4 + 13z5 + 18z6 + 24z7
+ 31 z8 + 39z9 + 45z'0 + 5 2 Z 1 1 + 57z’2 + 63z’3 + 67z’4 + 69Z15
+ 69z16 + 67z17 + 63z18 + 57z'9 + 52z20 + 45z21 + 39z22 + 31z23
+ 24z24 + 18z25 + 13z26 + 9z27 + 6z28 + 4z29 + 2z30 + z31 .
W końcu, ponieważ 1/(1 —z 10)5 = ^ k>0 (k 4 4) z 10Ic, więc możemy wyznaczyć
współczynnik
= [zn] Ć(z), tak że gdy rt = 10 q + r i 0 ^ r < 10 , wówczas
Ćioq+r = ^
Ai ( kD n 0 q + r = 1 0 k + j]
j,k
~ A.r (q4 4) + Ar+ io (C|J 3) + Ar+ 2o (q4 2) + Ar+3o(C,4 1) . ( 7 *40 )
Daje nam to dziesięć przypadków, po jednym dla każdego r. Ale jest to
Nasze myślenie
zaczyna teraz być
zwarte
i skondensowane.
już całkiem zwarta postać w porównaniu z alternatywną postacią używającą
potęg liczb zespolonych.
Możemy na przykład zastosować to wyrażenie do otrzymania wartości
C5oq = Ćioq. Wówczas r = 0 i mamy
C” « = ( , : > < fl: 3) + < ‘,: 2) + 2(fl; ') Liczba sposobów rozmienienia 50 centów wynosi (4) + 45(4) = 50. Liczba
sposobów rozmienienia 1 dolara wynosi (4) +45 (4) + 52(4) = 292, a ponadto
istnieje
(2 000004\„r / 2000003\
( 4 m
4
r„ /2000002\
j +H(
m
4
„ /2000001 \
4
)
= 66666793333412666685000001
sposobów rozmienienia miliona dolarów.
Przykład 5: Szeregi rozbieżne
Spróbujmy teraz uzyskać zwartą postać dla liczb gu zdefiniowanych przez
90 = i ;
9 n = n g n _! ,
dla n > 0 .
Już w kilka nanosekund po przyjrzeniu się tym równaniom zauważamy, że
gn jest dokładnie n!. Istotnie, metoda czynników sumacyjnych opisana w
rozdziale 2 natychmiast sugeruje taką odpowiedź. Ale spróbujmy rozwiązać
to równanie rekurencyjne przy użyciu funkcji tworzących, tak żeby zobaczyć,
co się stanie. (Silna technika powinna być też w stanie rozwiązać łatwe re­
kurencje takie jak ta równie dobrze jak i inne, dla których nie potrafimy dać
odpowiedzi tak szybko.)
Równanie
9n = rig n -i + [n = 0 ]
spełnione jest dla wszystkich n i prowadzi nas do
G(z) = 2 ^ g n Z n = Y ng-n - 1 Zn + Y
rt
n
zn .
n=0
Żeby zakończyć krok 2 , musimy wyrazić
n 9 n -i
jako funkcję od G(z).
Gdy spojrzymy do tabeli 371, to dostrzeżemy, że można by skorzystać ze
wzoru na pochodną G'(z) = ^ TIn 9 n 2TV 1. Spróbujmy:
G(z) = 1 + Y ( n + 1 )gn z n+1
n
= 1 + ^ n g u z " + 1 + ^ g n z " +1
rt
n
= 1 + z2 G'(z) + zG(z).
Sprawdźmy to równanie, używając wartości gn dla m ałych n . Ponieważ
G = 1 + z + 2z2 +
G' =
6 z 3 + 24z4 H
---- ,
1 + 4z + 18z2 + 96z3 + • • • ,
więc otrzymujemy
z2 G ' =
z 2 + 4 z 3 + 18z4 + 96z5+ • • • ,
zG =
z + z 2 + 2z 3 + 6z 4 + 24z5 H-----,
1 =
1.
Te trzy wiersze dodane do siebie d ają w sumie do G, tak więc jak dotąd
wszystko jest w porządku. W szczególności, będziemy często uważali za wy­
godniejsze pisanie ‘G’ zamiast ‘G(z)\ Gdy nie zamierzamy zmieniać z, dla
przejrzystości wyrażenia opuszczamy dodatkowe ‘(z)’.
Następny jest krok 3 i jest on różny od tego, co robiliśmy do tej pory,
ponieważ musimy teraz rozwiązać równanie różniczkowe. Ale takie równanie
różniczkowe możemy rozwiązać przy użyciu technik szeregów hipergeome­
trycznych, które stosowaliśmy w podrozdziale 5.6. Tamte techniki nie są wcale
takie złe. (Czytelnik nie znający hipergeometrii nie powinien się niepokoić —
to będzie szybkie.)
Po pierwsze, musimy się pozbyć stałej ‘1’, tak więc różniczkujemy oby­
dwie strony:
G' = (z2 G' + zG + l)' = (2zG' + z2 G") + (G +
zG')
= z2 G" + 3zG' + G.
Rozdział 5 mówi nam, żebyśmy to przepisali używając operatora
z ćwiczenia 6.13, że
$G = z G \
$ 2G = z 2 G" + z G ' .
i wiemy
Dlatego wymaganą postacią równania różniczkowego jest
»G =
z$2G + 2 z$G + z G =
z(d + 1) 2 G.
Zgodnie z równaniem ( 5 . 109 ), rozwiązaniem z go = 1 jest szereg hipergeometryczny F(1,1;;z).
Krok 3 był trudniejszy niż się spodziewaliśmy, ale teraz wiemy, czym jest
nasza funkcja G. Krok 4 jest łatw y — definicja ( 5 .76 ) daje nam rozwinięcie
w szereg potęgowy:
G(z) = F '
n^O
n^O
Tak więc potwierdziliśmy to, co wiedzieliśmy już wcześniej, że zw artą postacią
dla gn jest n!.
Zauważmy, że nasza technika dała nam poprawne rozwiązanie, mimo tego
że szereg G(z) jest rozbieżny dla wszystkich niezerowych z. Ciąg wartości rt!
rośnie tak szybko, że składnik \n\ zn | zawsze rośnie do 00 przy u —> 00 , z
wyjątkiem przypadku, gdy z = 0. Umacnia to nas w przekonaniu, że mo­
żemy operować algebraicznie szeregami formalnymi bez m artwienia się o ich
zbieżność.
P r z y k ła d 6 : R e k u re n c ją , k tó r a p o w ra c a całk o w icie do p o c z ą tk u
Skończmy ten podrozdział stosując funkcje tworzące do problemu z teorii
grafów. W a c h la rz e m rzędu n jest graf o wierzchołkach {0 , 1, . . . , n} z 2 n — 1
krawędziami zdefiniowanymi następująco: Wierzchołek 0 połączony jest kra­
wędzią z każdym z pozostałych wierzchołków i wierzchołek k jest połączony
krawędzią z wierzchołkiem k + 1, dla każdego 1 ^ k < rt. Na przykład
wachlarz rzędu 4, który m a pięć wierzchołków i siedem krawędzi, wygląda
następująco:
Problem, który nas interesuje: czemu się równa liczba f n drzew rozpina­
jących w takim grafie? D rz e w o ro z p in a ją c e jest podgrafem zawierającym
wszystkie wierzchołki i m ającym wystarczająco dużo krawędzi, żeby podgraf
był spójny, ale nie aż tyle, żeby m iał cykl. Okazuje się, że każde drzewo
rozpinające grafu o n + 1 wierzchołkach m a dokładnie rt krawędzi. Z mniej
niż n krawędziami podgraf nie byłby spójny, a z więcej niż rt m iałby cykl.
Podręczniki z teorii grafów dowodzą tego bardziej formalnie.
Jest ( 2rx~^) sposobów na wybór rt krawędzi spośród 2rt—1 występujących
w wachlarzu rzędu rt, ale te wybory nie zawsze dają drzewo rozpinające. Na
przykład podgraf
m a cztery krawędzie, ale nie jest drzewem rozpinającym; m a on cykl z 0 do
4 do 3 do 0 i nie m a połączenia pomiędzy {1,2} a innymi wierzchołkami.
Chcemy obliczyć, ile spośród ( 2ri~^) wyborów daje nam drzewo rozpinające.
Spójrzmy najpierw na małe wartości. Jest całkiem łatwo wyliczyć drzewa
rozpinające dla rt = 1 , 2 i 3:
A
A
fl = 1
f2 = 3
A
A
A
A
f3=8
A
A
(Nie potrzebujem y podawać etykiet na wierzcnoiKacn, jesn zawsze rysujemy
wierzchołek 0 po lewej stronie.) Co jest dla n = 0? Na pierwszy rzut oka
wydaje się rozsądne podstawić f 0 = 1 , ale my przyjmiemy jednak f 0 = 0 ,
ponieważ istnienie wachlarza rzędu 0 (który powinien mieć 2 n — 1 = —1
krawędzi) wydaje się podejrzane.
Nasza czterokrokowa procedura mówi nam, że mamy znaleźć rekurencję
na f n , która jest spełniona dla wszystkich rt. Możemy otrzymać rekurencję
analizując, jak najwyższy wierzchołek (wierzchołek rt) połączony jest z resztą
drzewa rozpinającego. Jeśli nie jest on połączony z wierzchołkiem 0, to musi
być połączony z wierzchołkiem rt —1 , ponieważ musi jakoś łączyć się z resztą
grafu. W takim przypadku dowolne z f n - i drzew rozpinających dla pozo­
stałego wachlarza (o wierzchołkach od 0 do rt — 1) będzie pełnym drzewem
rozpinającym dla całego grafu. W przeciwnym razie wierzchołek rt je s t po­
łączony z 0 i istnieje pewna liczba k ^ rt, taka że wierzchołki rt, rt —1 , . . . , k
są połączone między sobą, ale krawędź pomiędzy k i k — 1 nie występuje.
Wówczas nie może być żadnej krawędzi pomiędzy 0 i {rt — 1 , . . . , k}, ponie­
waż dawałoby to cykl. Jeśli k = 1, to drzewo rozpinające jest już określone
całkowicie. A jeśli k > 1, to dowolny z fk -i sposobów utworzenia drzewa roz­
pinającego dla wierzchołków {0 , 1 , . . . , k —1} będzie dawał drzewo rozpinające
dla całego grafu. Oto na przykład analiza dla rt = 4:
^3
U
k= 4
k= 3
k= 2
k= l
^3
^2
h
1
Ogólny wzór, prawdziwy dla rt ^ 1, wygląda następująco:
fn — fn - 1 + fn —1 + fn - 2 + fn —3 + **' + fl + 1 •
(W ygląda to prawie tak, jak gdyby T , która występuje na samym końcu,
była fo i powinnibyśmy wybrać f 0 = 1. Ale my będziemy uparcie trzym ać
się naszego wyboru.) Kilka zmian wystarczy, żeby przekształcić to równanie
tak, żeby było ono prawdziwe dla wszystkich całkowitych rt:
fn = fn —1 +
X
fk
+
[ t l > 0] .
( 7 .41 )
k<n
Jest to rekurencją która „powraca całkowicie do początku” od f n _i do wszy­
stkich poprzednich wartości, więc jest ona inna niż rekurencje, które do tej
pory widzieliśmy w tym rozdziale. W rozdziale 2 zastosowaliśmy specjalną
m etodę, aby się pozbyć podobnej sumy po prawej stronie równania, gdy roz­
wiązywaliśmy rekurencje dla sortowania szybkiego ( 2 . 12 ); to znaczy, odejmu­
jemy jeden poziom rekurencji od drugiego (fn +i —fn)- Ta sztuczka pozwala
nam pozbyć się
także teraz, tak samo jak i poprzednio, ale zobaczymy, że
funkcje tworzące pozwalają pracować nam również bezpośrednio z tą sumą. (I
bardzo dobrze, ponieważ wkrótce będziemy widzieli znacznie bardziej skom­
plikowane rekurencje.)
Krok 1 jest skończony. W kroku 2 musimy zrobić nową rzecz:
F(z) =
Y
fnzn
=
Y fn-1 zn + y ~ fk^n [k<rt] + Y
n
[ t l > 0]z1
n
= zF(z) +
^
f kz k I I [n > lc ]zn “ ,C +
n
= zF(z) + F(z) Y zm +
m-----/x
>0
= zF(z) + F f z ) ^
+
'_
Z
TZ Z
k ,n rt
Cała sztuczka polegała na tym, żeby zamienić zn na z k zn ~ k , co umożli­
wia nam wyrażenie wartości podwójnej sumy jako funkcji od F(z), tak jak
wymaga od nas krok 2 .
Proste przekształcenia algebraiczne dają nam w kroku 3
Ci z nas ze świetnym zmysłem pamięci rozpoznają w tym funkcję tworzącą
( 7 .24 ) dla parzystych liczb Fibonacciego. Tak więc nie potrzebujem y wyko­
nywać kroku 4 i otrzymujemy dosyć zaskakującą odpowiedź dla problemu
drzew rozpinających:
fn = ^ 2n ,
dla rt ^ 0 .
(7 4 2 )
7.4. Szczególne funkcje tw orzące
Krok 4 w naszej czterokrokowej procedurze jest znacznie prostszy, gdy znamy
współczynniki wielu różnych szeregów potęgowych. Rozwinięcia w tabeli 372
są dość użyteczne, na tyle na ile mogą, ale jest wiele innych możliwych ro­
dzajów postaci zwartych. Dlatego powinniśmy tam tą tabelę uzupełnić nową,
przedstawiającą szeregi potęgowe odpowiadające „liczbom szczególnym” wy­
stępującym w rozdziale 6 .
Tabela 390 jest bazą danych, której nam właśnie potrzeba. Tożsamo­
ści w tej tabeli nie są trudne do udowodnienia, nie musimy się więc nad
nimi rozwodzić. Ta tabela m a służyć głównie jako źródło, do którego można
się odwołać, gdy napotkam y nowy problem. Ale istnieje zgrabny dowód dla
pierwszej tożsamości ( 7 .43 ), który zasługuje na wzmiankę: Zaczynamy od
tożsamości
1
(1 —z )x+1
którą różniczkujemy względem x. Po lewej stronie, (1 — z ) _x_1 jest równe
e (x+i)in(i/(i-z))^ j-gk więC d /d * dodaje czynnik ln(l/(1 — z)). Po prawej
stronie, (x + r t ) . . . (x + 1 ) jest mianownikiem w (X^ TL) i d /d x rozbija to na
n czynników, których sum a jest równoważna pomnożeniu (x* n ) przez
x+ n +
x+ 1
— Hx+n
.
Zamieniając x na m , otrzymujemy tożsamość ( 7 .43 ). Zauważmy tu ta j, że
różnica Hx+n — Hx m a sens, nawet wówczas, gdy x nie jest całkowite.
T a b e la 390. Funkcje tworzące dla liczb szczególnych
Swoją drogą, zróżniczkowanie skomplikowanego iloczynu — i pozostawie­
nie go jako iloczyn— jest zwykle lepsze niż wyrażenie tego samego jako po­
chodnej sumy. Na przykład prawa strona w
i ( ( x + n ) " . . . l , + !)') - (x+ n
(
j Ł. +. - . +j L )
byłaby znaczniej bardziej zawiła, gdyby została zapisana jako suma.
Ogólne tożsamości w tabeli 390 zawierają wiele ważnych przypadków
szczególnych. Na przykład wzór ( 7 .43 ) upraszcza się do funkcji tworzącej dla
Hn , gdy m = 0:
r b
lnr b
= L
n
( 7 -57 )
H^ n -
Tę równość można również otrzymać na inne sposoby, na przykład możemy
wziąć szereg potęgowy dla ln ( 1/(1 —z)) i w celu uzyskania sum częściowych
podzielić go przez 1 —z.
We wzorach ( 7 .51 ) i ( 7 .52 ) w ystępują odpowiednio ułam ki {m™n }/
* [m—rJ / (mn ]) »^ ó r e m ają niezdefiniowaną postać 0/0 dla n ^ m. Jednakże
istnieje sposób, żeby nadać im właściwe znaczenie za pomocą wielomianów
Stirlinga z (6 .45 ), ponieważ zachodzi
{m -n}
/
0
= H ) n + 1* ‘™ n ( n - m ) ;
( 7 .58 )
= n ! m o ^ ( m )-
(7-59)
m
m —rt / ( ™ n 0
Tak więc przypadek m = 1 w ( 7 .51 ) powinien być rozważany nie jako szereg
potęgowy I n JO(I,l/ n ! ) { , l n } / 0 , lecz raczej jako
ln(l + z, = - X .( - z )n<Jn(n ~ ^ = 1 + \ z ~ T l7-2 H---- •
v
' ■
n^O
Tożsamości ( 7 .53 ), ( 7 *54 ), ( 7 -55 ) i ( 7 *56 ) są „funkcjami podwójnie tworzą­
cymi” lub „funkcjami supertworzącymi” , ponieważ są one postaci G(w,z) =
9 m,nWmzn . W spółczynnik przy w m jest funkcją tworzącą ze zmienną
z, a współczynnik przy z 71 jest funkcją tworzącą ze zmienną w. Równanie
( 7 .56 ) można przedstawić w bardziej symetrycznej postaci
e vv — e"
w e z — zew =
/m
Z ^ (\
m,n ^0
+ TL + 1 \
rn
m
TVm Zn
f n i+l nn -+u 1l )!
ll’
// (m
^ 6 o)
7.5. Sploty
Zawsze myślałem,
że splot jest stanem
mojego umysłu, gdy
próbuję coś
udowodnić.
S p lo te m dwóch ciągów
<fo »f i , — > = (fn) i <go» 9 i »— > = (9n) jest ciąg
(fogo, fogi + f i g o > . . . ) = ( Z ! ic ^ 9 n - k ) - Zaobserwowaliśmy już w podroz­
działach 5.4 i 7.2, że splot ciągów odpowiada mnożeniu ich funkcji tworzą­
cych. Ta cecha umożliwia nam operowanie pewnymi sumami, które bez tej
własności byłyby trudne do przeanalizowania.
P r z y k ła d 1 : S p lo t F ib o n a c c ie g o
Spróbujmy, na przykład, przekształcić ]T £ =0 Fk^n-k do postaci zwartej. Jest
to splot (Fn ) samego z sobą, tak więc ta suma musi być współczynnikiem przy
zn w F(z)2, gdzie F(z) jest funkcją tworzącą dla (Fn ). Nasze zadanie polega
na znalezieniu tych współczynników.
Funkcją tworzącą dla F(z) jest z/(1 — z — z2), czyli iloraz wielomianów.
Ogólne twierdzenie o rozwijaniu funkcji wymiernych mówi nam, że rozwią­
zanie może być uzyskane z reprezentacji ułamkowej. Możemy użyć ogólnego
twierdzenia o rozwijaniu ( 7 .30 ) i zaplątać się w obliczenia lub możemy sko­
rzystać z faktu, że
1
\
(1 -<j>z)(1 - $ z ) + (1 - $ z ) 2 j
/ 1
2
~5V (1-cł>zP
1
= I y . (n +1)*n*n - \ l f"+i *n+ 1 z (n + 1)$n*n •
rt^O
n^O
n^O
Zamiast wyrażać odpowiedź jako funkcję zmiennych ej) i $ , spróbujmy znaleźć
postać zw artą jako funkcję od liczb Fibonacciego. Pam iętając, że (f>+ $ = 1,
otrzymujemy
<\>n + $ n =
[zu ] ■
1
1 — 4>Z
1
1 —$ z
= lznl ^ ~ ^
^ z
[ ] (1 — <t>^)(1 — $z)
— \zn ] 2 —z— ?F
[ 1 —z —z2
Zatem
F^ 2 =
n^O
n^O
i —F
n+1
1 otrzymujemy odpowiedź, której szukaliśmy:
V“ t r
^ F ^ - i c
— (rt + 1 )Fn
------------------^------------------.
=
f a \
(7-61)
k=0
Na przykład dla rt = 3 wzór ten daje F0F3 + F 1F2 + F 2 F1 + F 3 F0 = 0+1 +1 + 0 =
2 po lewej stronie i (6 F4 —4 F3 ) / 5 = (18 —8 )/5 = 2 po prawej.
P r z y k ła d 2 : S p lo ty h a rm o n ic z n e
Efektywność pewnego algorytmu komputerowego zwanego „samplesort” za­
leży od wartości sumy
Tm n =
V
L—
O ^kcn
( k ) — 'l~ r ,
\ v n j n —k
całkowite m, n ^ 0 .
W ćwiczeniu 5.58 uzyskaliśmy wartość tej sumy za pomocą dość zawiłej po­
dwójnej indukcji stosując czynniki sumacyjne. Możemy znacznie łatwiej zna­
leźć rozwiązanie, gdy zauważymy, że Tm>Tl jest n-tym składnikiem w splocie
ciągu <(£), O , ( £ ) , . . . ) z ciągiem (
0
,
Obydwa ciągi m ają proste
funkcje tworzące z tabeli 372:
T t^O
X
7
TL>0
Dlatego na mocy ( 7 .43 ) otrzymujemy
W
zm
1
1
1
------^ T T l n l----- = [zTL—m] 7^------r - r r l n
(1 —z )m+1
1 —z
(1 —z ) m+1
1 —z
=
= (Hn - H m ) (
n
V
\n —my
W rzeczywistości jest dużo więcej sum, które redukują się do tego samego
rodzaju splotów, ponieważ mamy
1
(1 —z )r+1
1
1
1
1
,
1
l n - ----- • ~rz-----:—TT- = TZ-------. . . ln
1 —z
( 1 —z ) s+1
(1 —z )r+s+2
1 —z
dla wszystkich r i s. Porównując współczynniki przy zn otrzymujemy ogólną
tożsamość
(^r+ s+ n+ l
Hr+s+l)*
( 7 -^2)
Ponieważ jest to
takie harmoniczne.
W ydaje się to być prawie zbyt dobre, żeby było prawdziwe. Ale sprawdźmy,
przynajm niej dla n = 2 :
c ; ' ) c ; ' ) ^ + (r a 2) c r ) (r +^ 2+ r + 1
r + s + 3\ (
1
2
J \ r + s+ 3
1
r + s + 2/'‘
Przypadki szczególne, takie jak s = 0, tak samo zasługują na uwagę jak
przypadek ogólny.
Ale zachodzi nawet więcej. Możemy użyć tożsamości dla splotów
y- /r + k \ / s + n —k\ _ /r + s + n + 1
2- {
k
) {
n - k
)
~
{
n
żeby przenieść Hr na drugą stronę, ponieważ Hr jest niezależne od k:
ę c : k) c r _ ; > =
^
n
^ (H -r+s+n+l — H r + s + i + H r ) .
( 7 -6 3 )
Możemy jeszcze więcej: Jeśli r i s są nieujemnymi liczbami całkowitymi l i m ,
to możemy zastąpić (r^ k) przez (l+k) i (s^ ^ k) przez (m+T^ _k). Wówczas
możemy zmienić k n a k —l i n na u —m —l i otrzymujemy
n
'k\/n-k \
.
(
n+1
k=0
całkowite l, m , n ^ 0 .
( 7 .64 )
Nawet szczególny przypadek l = m = 0 tej tożsamości był dla nas jeszcze
trudny w rozdziale 2 (patrz ( 2 .36 ).) Przeszliśmy długą drogę.
P r z y k ła d 3: S p lo t ze s p lo tu
Jeśli mamy sploty (fn ) i (gn ) i weźmiemy ich splot z trzecim ciągiem (Hn ),
to otrzym amy ciąg, którego n-tym składnikiem jest
Y
fj S k b a -
j+k+l=n
Funkcją tworzącą dla takiego potrójnego splotu jest oczywiście potrójny ilo­
czyn F(z)G(z)H(z). Podobnie, m -krotny splot ciągu (gn ) samego z sobą ma
ri-ty składnik równy
2_
9k! gk2 • • • 9km
k i +k2H----- hkm = n
i jego funkcją tworzącą jest G(z)m.
Możemy wykorzystać tę obserwację do omawianego poprzednio problemu
drzew rozpinających dla wachlarzy (przykład 6 w podrozdziale 7.3). Okazuje
się, że jest jeszcze inny sposób na obliczenie fn, liczby drzew rozpinających w
n-wachlarzu, oparty na konfiguracjach krawędzi drzewowych łączących wierz­
chołki {1,2,..., rt}: Krawędź pomiędzy wierzchołkiem k i k + 1 może być lub
nie być wybrana do drzewa. Każdy ze sposobów wybrania takich krawędzi
łączy ze sobą pewne bloki sąsiednich wierzchołków. Na przykład gdy rt = 10,
możemy połączyć ze sobą wierzchołki {1,2}, {3}, {4,5, 6 ,7} i {8 ,9,10}:
7
6
5
4
•3
o*
T2
*1
Ile drzew rozpinających możemy uzyskać, dodając krawędzie do wierzchołka
0? Musimy połączyć 0 z każdym z czterech bloków i mamy dwa sposoby na
połączenie 0 z {1,2 }, jeden na połączenie z {3}, cztery sposoby na połączenie
z {4,5,6 ,7} i trzy sposoby na połączenie z {8 ,9,10}. W sumie 2 •1 *4 •3 = 24
sposoby. Sumując po wszystkich możliwych sposobach utworzenia bloków
otrzymujemy następujące wyrażenie na całkowitą liczbę drzew rozpinających:
*n= Z
Z
ki k2 ... km .
(7 .65 )
m >0 k 1 + k 2 H hkm=Ti
ki ,k2,...,km>0
Na przykład f 4 = 4 + 3 - 1+2- 2+ 1-3+ 2- 1- 1+1-2-1+1-1-2+ 1-1-1-1 =21.
Jest to suma m-krotnego splotu ciągu (0,1,2,3,...) ze sobą, dla m = 1,2,
3 , __ Stąd funkcją tworzącą dla (fn) jest
Hz) = G(z) + G(z) 2 + G(z)3 H---- =
I — b(zj
gdzie G(z) jest funkcją tworzącą dla ( 0 , 1 , 2 , 3 , . . . ) , tzn. z /( l —z)2. O trzym u­
jemy więc
tak jak poprzednio. Takie podejście do ciągu (fn ) jest bardziej symetryczne
i pociągające niż skomplikowana rekurencją, którą mieliśmy poprzednio.
P rzy k ła d 4 : S p lotow a rekurencją
Nasz następny przykład jest szczególnie ważny. Jest to „klasyczny przykład”
pokazujący, dlaczego funkcje tworzące są użyteczne w rozwiązywaniu równań
rekurencyjnych.
Przypuśćmy, że mamy rt + 1 zmiennych x 0, x i , . . . , xn , których iloczyn
mamy obliczyć za pomocą rt mnożeń. Ile jest sposobów Cn postawienia na­
wiasów w iloczynie xo -xi •... -xn , tak, żeby porządek mnożenia był całkowicie
określony? Na przykład dla rt = 2 są dwa sposoby, x 0 • (xi -x2) i (x0 - x i ) • x2.
A dla rt = 3 mamy pięć sposobów,
*o-(xi *(x2 -x3) ) , x 0 - ((xi -x 2 )-x3) , (x0 - xi )- (x 2 *x3) ,
(x0 -(xi ' x2)) •x 3 , ((x 0 -x 1)-x 2 )-x 3 .
Tak więc C2 = 2, C3 = 5. Mamy również Ci = 1 i Co = 1.
Zastosujmy czterokrokową procedurę z podrozdziału 7.3. Jaka jest rekurencja dla C? Kluczową obserwacją jest to, że gdy rt > 0, wówczas istnieje
dokładnie jedna operacja ‘ • ’ poza wszystkimi nawiasami. Jest to końcowe
mnożenie, które daje ostateczny wynik. Jeśli ten ‘ • ’ wystąpi pomiędzy Xk i
xic+i, to istnieje Ck sposobów, żeby ująć w nawiasy xo •... *xk oraz C ^ -k -i
sposobów, żeby ująć w nawiasy Xk+i •.. . *xn . Tak więc otrzymujemy
Cn = CoCu —i + Ci Cn —2 + • • • + Cn—i Co ,
dla rt > 0 .
Od razu rozpoznajemy w tym wyrażeniu splot i wiemy, jak to równanie uzu­
pełnić, żeby było spełnione dla wszystkich całkowitych rt:
( 7 .66 )
k
Krok 1 jest więc zrobiony. Krok 2 nakazuje nam pomnożyć Cn przez zn
i zsumować:
TV
n
CkCn - i _ k ^ n + y~ zn
=
k,TL
n=0
= L
CkzkL
k
n
c«-'-kzn_k + 1
= C(z) • zC(z) + 1 .
O dziwo, splot stał się iloczynem, w świecie funkcji tworzących. Życie jest
pełne niespodzianek.
Krok 3 jest również prosty. Rozwiązujemy równanie kwadratowe i otrzy­
mujemy:
C(z) =
1 ± -y/ 1 - AZ
2z
Ale jaki znak powinniśmy wziąć, + czy — ? Obydwa wybory dają funkcję
spełniającą C(z) = zC (z )2 + 1 , ale tylko jeden z nich jest właściwy w naszym
problemie. Moglibyśmy wybrać znak + zakładając, że pozytyw ne/dodatnie
myślenie jest najlepsze, ale wkrótce byśmy zauważyli, że ten wybór daje
C(0) = oo, zaprzeczając faktom. (Poprawna funkcja C(z) powinna spełniać
C(0) = Co = 1.) Dlatego
CU, .
I na koniec krok 4. Ile wynosi [zn] C(z)? Ze wzoru dwumianowego New­
tona mamy:
k .
k^O v
7
k^1
x
7
stąd zgodnie z równaniem ( 5 .37 ),
->i
kv^1
\
/
y - / - 1/ 2 \ (—4z)n =
V Tl
TL^O V
7J n + 1
y
/ 2r t \
z"
TL^O lXn 7J u + 1
Całkowita liczba sposobów nawiasowania Cn wynosi więc ( ^ )
.
Dowcip autorów.
•d«Mi
Tak więc splotowa
rekurencją
doprowadziła nas
do często
występującego
splotu.
Odgadliśmy ten wynik w rozdziale 5, gdy wprowadziliśmy ciąg lic zb
C a ta la n a ( 1 , 1 , 2 , 5 , 1 4 , . . . ) = (Cn ). Ten ciąg pojawia się w dziesiątkach pro­
blemów, które w ydają się ze sobą zupełnie nie związane [48]. Wiele sytu­
acji m a bowiem strukturę rekurencyjną odpowiadającą równaniu rekurencyjnemu ( 7 .66 ).
Rozważmy na przykład następujący problem: Ile jest ciągów (cii,<12 ,
• • • >0-2n ) o elementach +1 i —1 mających własność
ai + a 2 H-------b a 2n = O
takich, że wszystkie sumy częściowe
&1 ,
0-1 + 0-2 > • • • > di + 0-2 H------- b 02n
są nieujemne? Musi być n wystąpień +1 i n wystąpień —1. Możemy przed­
stawić ten problem graficznie rysując ciąg sum częściowych sn = J 2 k=i
jako funkcję zmiennej n: Pięć rozwiązań dla n = 3 wygląda następująco:
Są to „pasma górskie” szerokości 2n, które mogą być narysowane odcin­
kami postaci / i \ . Okazuje się, że jest dokładnie Cn sposobów na zrobie­
nie tego i te ciągi są związane z problemem nawiasowania w następujący
sposób: Dodajm y dodatkową parę nawiasów wokół całego wyrażenia, tak
że uzyskujemy dokładnie u nawiasów odpowiadających n mnożeniom. Za­
stąpm y teraz każde *•’ przez +1 i każde *)’ przez —1 i usuńm y wszystko
poza tym. Na przykład wyrażenie xo • ((xi *X2 ) • (x 3 -X4 )) odpowiada ciągowi
(+1, +1, —1, +1, +1, —1, —1, —1) zgodnie z naszą konwencją. Pięć sposobów
nawiasowania xq • xi • X2 • x 3 odpowiada pięciu pasmom górskim dla n = 3
pokazanym powyżej.
Co więcej, drobne przeformułowanie naszego problemu prowadzi do za­
skakująco prostego kombinatorycznego rozwiązania, które unika funkcji two­
rzących: Ile jest ciągów (ao, a i , a 2 , . . . , a.2n) o elementach +1 i —1 takich,
że
ao + ai + a 2 + • • • + &2n — 1 >
gdzie wszystkie sumy częściowe
in s
fl-O)
i*:*?**?!
cio + a i ,
ao + ai + a 2,
...,
ao + a-j + • • • + a 2n
są d o d a t n i e ? Oczywiście są to dokładnie ciągi z poprzedniego problemu,
z dodatkowym elementem ao = +1 na początku. Ale ciągi w tym proble­
mie mogą być wyliczone przy użyciu prostego argumentu ilościowego za po­
mocą pięknego lematu podanego w 1959 r. przez George’a Raneya [303]: J e ś li
(x1,x2,...,xm ) j e s t d o w o l n y m c ią g ie m c a ł k o w i t o l i c z b o w y m , k t ó r e g o s u m a
w y n o s i +1, t o d o k ł a d n i e j e d n o je g o c y k l i c z n e p r z e s u n ię c ie
), (x2>...,
))
•••> (^m >X ] ,...,Xm — 1)
m a w s z y s t k ie s u m y c z ę ś c io w e d o d a t n i e . Rozważmy na przykład ciąg (3,-5,
2,— 2,3,0). Ma on przesunięcia cykliczne
{3,-5,2,-2,3,0}
(-5,2,-2,3,0,3)
(2,-2,3,0,3,-5}
(-2,3,0,3,-5,2}
(3,0,3,-5,2,-2) y
(0,3,-5,2,-2,3)
i tylko zaznaczony ciąg ma wszystkie sumy częściowe dodatnie.
Lemat Raneya można udowodnić za pomocą prostego argumentu geome­
trycznego. Rozszerzmy zadany ciąg okresowo, uzyskując ciąg nieskończony
(X!,X2,...,
>X ] >X 2,•••jXm ,%-j ,X2,...)J
dokonaliśmy więc podstawienia xm+ic= x^ dla wszystkich k ^ 0. Jeśli nary­
sujemy teraz sumy częściowe s n = x i H--- h xn jako funkcję zmiennej n, to
wykres dla
ma „średni wzrost” 1/m, ponieważ sm+rL = sn + 1. Na przy­
kład wykres odpowiadający naszemu ciągowi (3,— 5,2, — 2,3,0,3, — 5,2,...)
zaczyna się następująco:
Cały wykres zawiera się pomiędzy prostymi o nachyleniu 1/m, tak jak widać
na rysunku; wzięliśmy dla ilustracji m = 6. W ogólności, te proste ograni­
czające wykres dotykają go tylko jeden raz w każdym z cykli złożonym z
Och, gdyby akcje
na giełdzie zawsze
szły tak w górę.
tw orzące
(Uwaga
informatycy: Sumy
częściowe
reprezentują w tym
zadaniu rozmiar
stosu jako funkcji
czasu, gdy
obliczany jest
iloczyn n + 1
czynników,
ponieważ każda
operacja „push”
(wstawienia)
zmienia rozmiar
stosu o + 1 ,
a każde mnożenie
zmienia go o —1 .J
m punktów, ponieważ proste o nachyleniu 1/ m mogą mieć całkowite współ­
rzędne co najwyżej raz na m jednostek. Ten jedyny dolny punkt wspólny
w cyklu jest zarazem jedynym miejscem, od którego wszystkie sumy czę­
ściowe będą dodatnie, ponieważ najbliższy punkt wspólny znajduje się o m
jednostek na prawo.
Mając lemat Raneya możemy łatwo policzyć liczbę ciągów ( a o , . . . , a 2U)
0 elementach +1 i —1 , których wszystkie sumy częściowe są dodatnie i których
całkowita suma wynosi +1. Istnieje (2r^ł’1) ciągów z n elementami —1 i n + 1
elementami +1, tak więc lemat Raneya mówi nam, że dokładnie 1/( 2 n + 1)
część spośród wszystkich tych ciągów m a dodatnie wszystkie sumy częściowe.
(Wypisz wszystkie N =
takie ciągi i wszystkie 2 n + 1 ich przesunięć
cyklicznych w tabeli N x (2n + 1). Każdy wiersz zawiera dokładnie jedno
rozwiązanie. Każde rozwiązanie występuje dokładnie raz w każdej kolumnie.
Tak więc istnieje N / ( 2 n + 1) różnych rozwiązań w tabeli, każde powtarzające
się ( 2 n + 1) razy.) Całkowita liczba ciągów z dodatnim i sumami częściowymi
wynosi więc
/2n + 1 \ _ l _
v n ) 2 n +1
/2 n \_ !_ =
Vn/n+1
P r z y k ła d 5: R e k u re n c ją z m -k ro tn y m s p lo te m
Uogólnijmy właśnie rozważany problem, przyglądając się ciągom (ao, a-|, . . . ,
Gran) o elementach +1 i (1 —m ), których wszystkie sumy częściowe są dodat­
nie i które sum ują się do +1. Będziemy nazywali takie ciągi m - t y m i c ią g a m i
R a n e ya . Jeśli mamy k wystąpień (1 — m) i m n + 1 — k wystąpień +1, to
zachodzi
k (1 - m ) + (m n + l - k ) = 1
(Uwaga
informatycy:
Interpretowany
teraz stos jest
używany
do operacji o m
argumentach,
w odróżnieniu od
dwuargumentowego
mnożenia
rozważanego
wcześniej.)
1 stąd k = n . Mamy (miJL+1) ciągów o n elementach (1 — m ) i m n + 1 —n
wystąpieniach +1, tak więc lemat Raneya mówi nam, że całkowita liczba
takich ciągów o dodatnich wszystkich sumach częściowych wynosi dokładnie
(mr ) ^
(t )<^w
(i*.
Jest to więc liczba m -tych ciągów Raneya. Nazwijmy ją liczbą Fussa-C atalana
C ^ , na cześć N. I. Fussa [135], który (na wiele lat przed Catalanem ) w 1791
r. badał ciąg ( C ^ ) . Zwykłe liczby C atalana wynoszą Cn = C ^ \
Teraz, ponieważ znamy już odpowiedź, pójdźm y na całość i spróbuj­
my odpowiedzieć na pytania, które prowadzą do tego wyniku. W przypadku
m = 2 pytaniem było: „Jakie liczby spełniają równanie rekurencyjne Cn =
Y_\c CicC^-i _ k + [n = 0]?” Będziemy próbowali znaleźć podobne pytanie (po­
dobne równanie rekurencyjne) w ogólnym przypadku.
Trywialny ciąg (+1) długości 1 jest oczywiście m -tym ciągiem Raneya.
Jeśli wstawimy liczbę (1 — m ) na końcu dowolnego ciągu m-elementowego,
który jest m -tym ciągiem Raneya, to otrzym amy m -ty ciąg Raneya; sumy
częściowe pozostają dodatnie, rosnąc do +2, potem +3, . . . , + m i +1. I na
odwrót, możemy pokazać, że jeśli n > 0, to wszystkie m -te ciągi Raneya
( a o , . . . , a -mn) pow stają tylko w taki sposób, że ostatnim składnikiem a mn
musi być (1 — m ). Sumy częściowe s, = ao + • • • + aj_i są dodatnie dla
wszystkich 1 ^ j ^ m n , tak więc smTL = m , ponieważ smn + a mn = 1. Niech
ki będzie największym indeksem ^ m n takim , że siCl = 1 ; niech k 2 będzie
największym indeksem takim , że s k2 = 2; i tak dalej. Tak więc sk. = j i
sic > h dla kj < k ^ m n i 1 ^
^ m. Stąd wynika, że km = m n i mo­
żemy sprawdzić bez żadnych kłopotów, że każdy z ciągów ( a o , . . . , a kl _i),
(a k l , . . . , a k2_i), . . . , ( akm_ 1, . . . , a km_ i) jest m -tym ciągiem Raneya. Mu­
simy więc mieć ki = m u i + 1 , k2— = m n 2 + 1 , . . . , k m—k m_-| = m n m+ l ,
dla pewnych nieujemnych liczb całkowitych n i , n 2, . . . , n m .
Dlatego (mT^+1) mn+i j es^ odpowiedzią na następujące dwa ciekawe pyta­
nia: „Czemu są równe liczby
zdefiniowane przez równanie rekurencyjne
+
[n = 0]
(7.68)
dla wszystkich całkowitych n ? ” i „Jeśli G(z) jest szeregiem potęgowym speł­
niającym
G(z) = z G ( z) m + 1
( 7 -69 )
to jaka jest wartość [zn ] G(z)?”
Zauważmy, że nie są to wcale łatwe pytania. Przy zwykłych liczbach
Catalana (m = 2) rozwiązaliśmy ( 7 .69 ) dla G(z) i jego współczynników ko­
rzystając z równań kwadratowych i wzoru dwumianowego Newtona, ale gdy
m = 3, żadna ze standardowych m etod nie da podpowiedzi, jak rozwiązać
równanie trzeciego stopnia G = zG3 + 1. Wyszło na to, że łatwiej jest odpo­
wiedzieć na pytanie, zanim się je zada.
Teraz jednakże wiemy już wystarczająco dużo, żeby zadać nawet tru ­
dniejsze pytania oraz wywnioskować odpowiedzi na nie. Co jest na przykład
z pytaniem: „Jakie jest [:z a] G(z)1, jeśli l jest dodatnią liczbą całkowitą i G(z)
jest szeregiem potęgowym zdefiniowanym przez ( 7 .69 )?” Argument użyty
poprzednio wystarcza teraz do pokazania, że [zn]G(z)1 jest liczbą ciągów
długości m n + l spełniających następującą własność:
•
•
•
Każdy element ciągu jest albo +1 albo (1 —m ).
Wszystkie sumy częściowe są dodatnie.
Całkowita suma wynosi l. Składając razem ze sobą l m -tych ciągów Ra­
neya otrzymujemy wszystkie takie ciągi w jednoznaczny sposób. Liczba
sposobów, na które możemy to zrobić, wynosi
C ^ C ^ .-.C ^
= k n ]G( z)1 .
tli + tl2H
--- Mxi=n
Raney udowodnił uogólnienie swojego lem atu, które mówi, jak można
zliczać takie ciągi: Jeśli (x-\ } x 2y • • • >*m) je s t d o w o ln y m ciągiem lic z b c a łk o ­
w ity c h z Xj ^ 1 d la w szys tkich ) i s p e łn ia ją c y c h x i + x 2 H-------b x m = l > 0 ,
to is tn ie je d o k ła d n ie l p rze sun ięć c yk lic z n y c h
'
(xi,x2)...,
Xi),
...,
(xm>
^m —1)
m a ją c y c h w szystkie s u m y częściowe d o d a tn ie .
Możemy sprawdzić ten lemat na przykładzie ciągu (—2,1, —1,0,1,1, —1,
1,1,1). Przesunięciami cyklicznymi są
(-2,1 ,- 1,0 ,1 ,1, -1 ,1, 1,1 )
<1,-1,1,1,1,-2,1,-1,0,1)
(1,-1 ,0 ,1, 1,- 1, 1,1 ,1 ,-2 )
( -1 .1 .1 .1, -2 ,1, -1 ,0, 1,1 )
(-1,0, 1 ,1 ,- 1, 1, 1 ,1 ,- 2 ,1 )
(1,1, 1, -2 ,1 ,-1 ,0 ,1 ,1 ,-1 ) V
(0,1,1,-1,1,1,1, - 2 , 1 , - 1 )
( 1, 1 ,- 2,1 ,- 1,0 ,1 ,1, -1 ,1)
(1,1,- 1 ,1 ,1 ,1 ,- 2 ,1 ,- 1 ,0 ) V
( 1 ,- 2, 1,- 1, 0,1 ,1 ,-1 ,1 ,1)
i tylko dwa przykłady zaznaczone V ’ m ają dodatnie wszystkie sumy częścio­
we. Ten uogólniony lemat udowodnimy w ćwiczeniu 13.
Ciąg o elementach +1 i (1 — m) długości m n + 1 i o sumie całkowitej l
musi mieć dokładnie n wystąpień (1 —m ). Uogólniony lemat Raneya mówi
nam, że l / ( m n + l ) spośród tych (mit!L+l) ciągów m a dodatnie wszystkie sumy
częściowe. Tak więc nasze trudne pytanie m a zaskakująco prostą odpowiedź:
[zn ] G (Z)1 = ( m n + 1 ) - ± — ,
\
n
/ mn + l
(7.70)
dla wszystkich całkowitych l > 0 .
Czytelnik, który nie zapom niał jeszcze rozdziału 5, może się spytać: „To
wyrażenie wydaje się znajome. Czy nie widzieliśmy go już wcześniej?” Rze­
czywiście, widzieliśmy, wzór Lam berta ( 5 .60 ) mówi, że
f c - u y .r -
; t n + ''
n
J tn + r
Dlatego funkcja tworząca G(z) w ( 7 .69 ) musi być uogólnionym szeregiem
dwumianowym (Bm (z). Wzór ( 5 .59 ) daje
= Z,
co jest równoważne
!Bm (z) - 1 =
z £ m (z )m .
Powróćmy do oznaczeń z rozdziału 5, wiedząc teraz, że zajmujemy się
uogólnionymi dwumianami. Podaliśmy w rozdziale 5 cały zestaw tożsamości
bez dowodu. W ypełniliśmy teraz tam tą lukę dowodząc, że szereg wykładniczy
!Bt (z) zdefiniowany wzorem
®t(z) =
y - / t n + 1\
zn
\
n
/
t
n
+ 1
TL
7
2-
m a istotną własność:
't n + r \
r z 11
r
gdy t i r są dodatnie oraz całkowite.
Czy możemy rozszerzyć ten wynik do d o w o ln y c h wartości t i r? Tak,
ponieważ współczynniki (tT1^~r) tnr+r są wielomianami względem t i r . r-ta
potęga zdefiniowana wzorem
3 t (z)r = er l n S , (z» =
Y ^Tl n ^ (z)^ = Y_^ Y ^
-n
^
n^O
n^O " ^v -t-r*
m ^11
n "■> A
TTL X TL
^
m a współczynniki, które są wielomianami zmiennych t i r, i te współczynniki
są równe (tT^ T) tnrf T: dla nieskończenie wielu wartości t i r. Tak więc te dwa
ciągi wielomianów muszą być identycznościowo równe sobie.
Rozdział 5 wspomina także o uogólnionych szeregach potęgowych
c
(-}
V
=
(t n + 1 ) n _ l
2_ —
rt^O
^ —
n
Z ’
które, jak to wyraża wzór (5 .60 ), m ają równie interesującą własność:
fcn]£ t l z ) T =
r ( t n + r )n_1
(7-71)
rt!
Tożsamość ta może być traktow ana jako graniczny przypadek wzorów dla
23t (z), ponieważ nie jest trudno pokazać, że
£ t {z)r =
lim $ x t(z/x ):
x —>00
7.6. W yk ład n icze funkcje tw orzące_____________
Czasem ciąg (gn ) m a funkcję tworzącą, której własności są dość skompliko­
wane, podczas gdy pokrewny ciąg (gn /Tt!) m a funkcję tworzącą, która jest
dość prosta. W takich przypadkach wolelibyśmy w naturalny sposób praco­
wać z (gn /n !) i pomnożyć wszystko na samym końcu przez n!. Ta sztuczka
działa na tyle często, że mamy dla niej specjalną nazwę. Szereg potęgowy
G(z) = Y . 9' n!
(7-72)
nazywamy w y k ła d n ic z ą fu n k c ją tw o rz ą c ą lub „wft” ciągu (go>9 i , g 2 >.--)Nazwa ta wywodzi się z faktu, że funkcja wykładnicza ez jest wykładniczą
funkcją tworzącą ciągu ( 1 , 1 , . . . ) .
Wiele z funkcji tworzących w tabeli 390 jest tak naprawdę wft. Na przy­
kład wzór ( 7 .50 ) mówi, że ciąg ([£],
, [ ^ ] , . . . ) m a wykładniczą funkcję
tworzącą (ln y ^ ) m/rri!. Zwykła funkcja tworząca dla tego ciągu jest znacznie
bardziej skomplikowana (i jest rozbieżna).
W ykładnicze funkcje tworzące m ają swoje własne operacje, analogiczne
do operacji, które poznaliśmy w rozdziale 7.2. Na przykład jeśli mnożymy
wft dla (gn ) przez z, to otrzymujemy
,ti+1
Z*
n >0
Czy już się dobrze
bawimy?
u!
y
gn—1
( n - 1 )!
co jest wft dla (0 , g 0 , 2 g i , . . . ) = (n g n _-|).
Po zróżniczkowaniu wft dla (go,gi»g 2 »-*-) względem z otrzymujemy
rn —1
n>0
rn — 1
n ^1
( n - 1 )!
t
= n^O
Z 9n+1 Z,
uf
(7-73)
jest to wft dla ( g i , g 2 >• • • )• Tak więc różniczkowanie wft odpowiada operacji
lewego przesunięcia (G(z) — go)/ z dla zwykłej ft. (Użyliśmy już tej własno­
ści lewego przesunięcia wft, kiedy analizowaliśmy szeregi hipergeometryczne,
( 5 . 106 ).) Całkowanie wft daje
Pz
0Z
tn
JU n >0
9^
zn
dt =
n^O
v
TTH
;
=
n^l
(7.74)
jest to prawe przesunięcie, wft dla (0 , go, g i , . . . ) .
Najciekawszą operacją dla wft, tak jak dla zwykłych ft, jest mnożenie.
Jeśli F(z) i G(z) są wft dla (fn ) i (gn ), to F(z)G(z) = H(z) jest wft dla ciągu
(Hn ) nazywanego d w u m ia n o w y m s p lo te m dla (fn ) i (gn ) ‘
g^-ic -
K. =
k
^
( 7 -75 )
'
Pojaw iają się tu ta j współczynniki dwumianowe, ponieważ (£) = n l / k l (n —
Tc)! i dlatego
V" fk gn—k
k! (rt —k)!
-Z
n!
k=0
v
J
Innymi słowy, (hn /ri!) jest zwykłym splotem dla (fu /n !) i (gn /rt!).
Sploty dwumianowe m ają wiele zastosowań. Na przykład zdefiniowaliśmy
liczby Bernoulliego w ( 6 .79 ) za pom ocą ukrytej rekurencji
m /m + 1\
Y_[
•
j=o '
5
)Bj = [m = 0 ] ,
dla wszystkich m ^ 0 .
'
Można to zapisać jako splot dwumianowy, jeśli podstawim y n za m + 1 i
dodam y składnik Bn do obydwu stron:
Y
f ^ J Bic = Bn + [n = 1],
k
^ '
dla wszystkich rt ^ 0.
( 7 .76 )
Możemy tę rekurencję powiązać z szeregami wykładniczymi (jak obiecali­
śmy w rozdziale 6 ) biorąc wft dla liczb Bernoulliego, B(z) = Y .n ^ o Bn ^n/n !.
Lewa strona ( 7 .76 ) jest splotem dwumianowym dla (Bn ) ze stałym ciągiem
( 1 , 1 , 1 , . . . ) . Zatem wft po lewej stronie wynosi B(z)ez. W ft po prawej stro­
nie jest równa H n ^ 0 O^n. + [n = 1])zrL/n ! = B(z) + z. Dlatego musimy mieć
B(z) = z /( e z — 1 ), co dowodzi wzoru ( 6 .81 ), który znalazł się również w
tabeli 390 jako wzór ( 7 .44 ).
Spójrzmy teraz jeszcze raz na sumę, która była już wiele razy analizowana
w tej książce,
Sm(n) = 0m + 1m + 2m + --- + ( n - 1 ) m =
£
lc
i^m
O^kcn
Tym razem będziemy próbowali przeanalizować ten problem za pom ocą funk­
cji tworzących m ając nadzieję, że będzie to prostsze. Niech rt będzie ustalone
i m będzie zmienną. Tak więc naszym celem jest znalezienie współczynników
w szeregu potęgowym
S(z) = S0 (n) + Si (n) z + S2 (rt) z 2 H---------
Sm ( n ) z m .
rrt^O
Wiemy, że
1
=
1 —kz
Y _ k m zm
m^O
jest funkcją tworzącą dla ( 1 , k, k2, . . . ) i dlatego
S(z) =
£
£
k -z - =
y .
r^ T z
m^O O^kcrt
0^k<n
przez zamianę kolejności sumowania. Możemy przedstawić tę sumę w postaci
zwartej
s(z) = i(z=^
0 + :
z:-1
— 1r + "'+ z -1 —n + 1
rTl—
^ ( H z-i
H z- i _ n ) ,
( 7 -7 7 )
ale nie wiemy, jak rozwinąć taką postać zw artą w potęgi z.
Z pomocą przychodzą nam teraz wykładnicze funkcje tworzące. W ft dla
naszego ciągu (S 0 (n ), Si (u ), S2 (rt), . . . ) jest
ry
S(z,n) = S0(n) +Si (n ) — + S2(n) — + ••• =
^
m
/yTTL
Sm(n) — .
ra^O
Aby otrzymać współczynniki Sm (n) możemy wziąć wft dla (1, k , k 2, . . . ) , to
znaczy
m
ekz =
vn>0
m!
i mamy
Ponieważ ta suma jest szeregiem geometrycznym, otrzymujemy postać zw artą
enz — 1
(7-78)
Eureka! Wszystko, co musimy teraz zrobić, to znaleźć współczynniki dla tej
relatywnie prostej funkcji i będziemy już znali Sm (n), ponieważ Sm (rt) =
m ![zm]S (z,u).
T utaj właśnie pojaw iają się liczby Bernoulliego. Zauważyliśmy przed
chwilą, że
k^O
jest wft dla liczb Bernoulliego. Możemy więc zapisać
enz — 1
S (z,n ) = B (z )----------
Suma Sm (rt) jest równa m! razy współczynnik przy zm w tym iloczynie. Na
przykład,
So(n) = 0 ! ( BoTT3T)
Wyprowadziliśmy więc już po raz n -ty wzór □ u = S2 (tl) = -|n (n — \ ) { n —
1) i było to wyprowadzenie ze wszystkich najprostsze: W kilku wierszach
przeanalizowaliśmy ogólne zachowanie się Sm (n) dla wszystkich m.
Ogólny wzór można więc zapisać w postaci
(7-79)
gdzie Bm(x) jest wielomianem Bernoulliego zdefiniowanym wzorem
Bm(x) = H ( ? ) B k X m- k .
( 7 .80 )
A oto dlaczego: Wielomian Bernoulliego jest dwumianowym splotem ciągu
(B0, Bi ,B2, . . . ) z (1 , x , x 2, . . . ) ; dlatego wykładnicza funkcja tworząca dla
(Bq(x),Bi (x),B 2 (x), . . . ) jest iloczynem ich wft,
^
__
B (z,x) =
Y_
rm
7
__
L
m^O
rm
7Pxz
xm ^ [ =
m^O
•( 7 .81 )
Wzór ( 7 .79 ) wynika stąd, że wft dla (0, So(n),2Si (rt),. . . ) wynosi, na mocy
( 7 -78 ),
z
enz — 1
^
~— =- = B(z,n) —B(z, 0).
ez — 1
Przejdźmy teraz do innego problemu, dla którego wft są jak gdyby stwo­
rzone: Ile jest możliwych drzew rozpinających w grafie pełnym o rt wierzchoł­
kach {1,2,... ,rt}? Oznaczmy tę liczbę przez t n . Graf pełny m a j n ( n — 1)
krawędzi, po jednej łączącej każdą parę różnych wierzchołków. Tak więc tak
naprawdę to szukamy, na ile sposobów można połączyć rt danych punktów
rysując pomiędzy nimi rt — 1 połączeń.
Mamy ti = t 2 = 1. Z kolei t 3= 3,ponieważ graf pełny otrzech wierz­
chołkach jest wachlarzem rzędu 2iwiemy że f 2 = 3 . Mamy też szesnaście
drzew rozpinających dla rt = 4:
k
x
MU
s
n / i n
KX
CZ
n m n j
U
(,s„
Stąd t 4 = 16.
Nasze doświadczenie z analogicznym problemem dla wachlarzy sugeruje,
że najlepszym sposobem na zaatakowanie tego problemu jest wyodrębnienienie jednego wierzchołka i rozważenie bloków lub składowych pozostałych
w drzewie rozpinającym po usunięciu wszystkich krawędzi sąsiadujących z
wybranym wierzchołkiem. Jeśli pozostałe wierzchołki tworzą rrt składowych
o rozmiarach k i, k2, . . . , km , to możemy je połączyć z wybranym wierz­
chołkiem na ki k 2 . . . k m sposobów. Na przykład dla n — 4 możemy wybrać
lewy dolny wierzchołek na rysunku ( 7 .82 ) . Wówczas w górnym rzędzie w
(7 .82 ) mamy 3t3 przypadków, w których pozostałe trzy wierzchołki połą­
czone są pomiędzy sobą na t 3 sposobów, następnie połączone są z lewym
dolnym wierzchołkiem na 3 sposoby. Dolny rząd pokazuje 2 • 1 x t2ti x Q
rozwiązań, w których pozostałe wierzchołki zawierają się w składowych roz­
miarów 2 i 1 na Q sposobów. Jest tam także przypadek [ / , gdy pozostałe
trzy wierzchołki nie są zupełnie połączone ze sobą.
To rozumowanie prowadzi nas do równania rekurencyjnego
tix = ^
m>0
rnJ
^
(ki k?
’ ki H-----t-km=ri—1 ^ U
k ) klkl ‘' ,kmtkl tk2 **,tk™
2»*“ > m /
dla wszystkich rt > 1. A oto dlaczego: Istnieje (ki k^ _1 k ) sposobów na przy­
pisanie n —1 elementów do ciągu m składowych o rozmiarach odpowiednio
k i, k2, ..., km. Jest tkl tic2 ... ticm sposobów na połączenie wszystkich tych
składowych w drzewo rozpinające. Dzielimy tę wartość przez m!, ponieważ
nie interesuje nas porządek składowych. Na przykład dla rt = 4, rekurencją
ta daje nam
t 4 = 3t3 + ^((^ 2)2tit 2 + (2 j)2 t 2 ti) + ^ ( ( 1j
= 3t3 + 6 t2ti + .
Uzyskana rekurencją dla
wygląda na pierwszy rzut oka strasznie. Ale
nie jest tak źle, trzeba to tylko rozplątać. Możemy zdefiniować
U-n — Tl t n
i wszystko się upraszcza:
Un
1
V "
U k i U k 2
w
Z
kTTl^r*"
m > 0 k 1+ k 2 H
hkm = n —1
u k m
,,
-
dlan> 1-
,
o
\
(7-83)
Suma wewnętrzna jest współczynnikiem przy zn_1 w wft U(z), podniesionym
do m-tej potęgi; także dla rt = 1 otrzymujemy poprawne wyrażenie, jeśli
dodamy składnik U(z)°, który odpowiada przypadkowi m = 0. Tak więc
^ =
n
rt!I
ru ~ M z )
y JLu (z) m = [z11-1] e11^* = [z-ize
^—
L—m^O
m! m I
dla wszystkich rt > 0 i otrzymujemy równanie
U(z) = z e Q(z).
(7-84)
Spójrzmy jaki postęp! Równanie ( 7 .84 ) wygląda prawie jak
£(z) = ez£{z),
które definiuje uogólniony szereg potęgowy £(z) = £1 (z) we wzorach ( 5 .59 )
i ( 7 .71 ). Istotnie, mamy bowiem
U(z) = z 8 (z ) .
Tak więc otrzymujemy odpowiedź:
ta = ^
= ^ [ z n]U(z) = ( n - 1)![z— ' ]£ (z) = n n ~2 .
( 7 .85 )
Graf pełny o {1,2,... ,n} wierzchołkach m a dokładnie rt 11-2 drzew rozpina­
jących, dla wszystkich n > 0 .
7.7. Funkcje tw orzące D irichleta_______________
Istnieje wiele innych możliwych sposobów na tworzenie ciągów z szeregów.
Można użyć dowolnego systemu funkcji Kn (z) takiego, że
gn Kn (z) = 0
=^>
g-n = 0 dla wszystkich n .
n
Zwykłe funkcje tworzące używają Kn (z) = zu , a wykładnicze funkcje two­
rzące korzystają z Kn (z) = zn/ n \ . Możemy również próbować potęg ubywa­
jących z—, lub współczynników dwumianowych z—/ n \ = (*).
Najpoważniejszą kontrkandydaturą dla ft i wft jest użycie funkcji 1/ n z .
Jest ona użyteczna dla ciągów ( g i , g 2, . . . ) , które zaczynają się od u = 1, a
nie od n = 0 :
G(z) = £ g .
n^l
( 7 .86 )
Są to fu n k c je tw o rz ą c e D ir ic h le t a (ftd), nazwane tak, gdyż intensywnie zaj­
mował się nimi niemiecki m atem atyk Gustav Lejeune Dirichlet (1805-1859).
Na przykład funkcją tworzącą Dirichleta dla ciągu stałego ( 1 , 1 , 1 , . . . )
jest
Jest to f u n k c ja z e ta Riemanna, którą nazywaliśmy również uogólnioną liczbą
harmoniczną
dla z > 1 .
Iloczyn funkcji tworzących Dirichleta odpowiada specjalnemu rodzajowi
splotu:
F(z)G(z) =
Z
Z
l,m ^1
ru^l
fi g m [ l - m = n ] .
l,m ^1
Tak więc F(z)G(z) = H(z) jest ftd dla ciągu
hn
f d 9n /d •
— ^
( 7 *^8 )
d\rt
Na przykład wiemy z (4 .55 ), że J l d \ n hW) = [ t l = 1]. Jest to splot Diri­
chleta dla ciągu Mobiusa (|x(l), |x(2), |x(3),. . . ) z ( 1 , 1 , 1 , . . . ) , tak więc
M (z)£(z) = Y _
^
n
^ = 1.
( 7 -89 )
Innymi słowy, C(z) -1 jest ftd dla <^(1), (i(2), |x(3),. . . ) .
Funkcje tworzące Dirichleta są bardzo użyteczne, gdy ciąg ( g i , 9 2 , • ■ - )
jest fu n k c ją m u lt ip lik a t y w n ą , to znaczy gdy
9 ran
=
9 m 9 ri
d l a TU J_ Tl.
W takich przypadkach wartości g n dla wszystkich n są wyznaczone przez
wartości gn dla n będących potęgą liczby pierwszej i możemy rozłożyć ftd
na następujący iloczyn indeksowany liczbami pierwszymi:
n
0 +
liczby pierwsze p '
S
+
S
+
S
+
7
<
™
°
>
Jeśli, na przykład, podstawim y g ^ = 1 dla wszystkich n , to otrzymamy
iloczynową reprezentację funkcji zeta Riemanna:
^ = n (r=W)•
liczby pierwsze p
(r‘9i)
Funkcja Mobiusa m a fx(p) = —1 i fx(pk) = 0 dla k > 1, tak więc jej ftd jest
równa
M(z) =
fi
( 1 - P ~ Z),
(7-92)
liczby pierwsze p
mmmmmmmmmmmmmmmmmmmmrnmmmkmmmmmmmm
co się oczywiście zgadza z ( 7 .89 ) i ( 7 .91 ). Funkcja cp Eulera m a (p(pk) =
p k —p k_1, tak więc jej ftd m a postać
*<4- n 0 ^ ) liczby pierwsze p x
7
n
liczby pierwsze p
Wnioskujemy stąd, że O (z) = C(z —1)/£(z).
Ć w iczenia
R ozgrzew ka
1 . Ekscentryczny kolekcjoner domina rozmiaru 2 x n płaci 4 dolary za każdy
pionowy kamień domina i 1 dolara za każdy kamień poziomy. Na ile
sposobów można ułożyć domino, żeby dostać dokładnie m dolarów? Na
przykład dla m = 6 są trzy rozwiązania: E , ED i F F P .
2 . Podaj w postaci zwartej funkcję tworzącą oraz wykładniczą funkcję two­
rzącą dla ciągu ( 2 , 5 ,1 3, 3 5, . .. ) = (2n + 3n ).
3. Ile wynosi
Hn /1 0 n ?
4. Ogólne twierdzenie o rozwijaniu funkcji wymiernych P(z)/Q(z) nie jest
zupełnie ogólne, ponieważ zakłada ono, że stopień P jest mniejszy niż
stopień Q. Co się stanie, jeśli P m a stopień większy?
5. Znajdź funkcję tworzącą S(n) taką, że
P o d sta w y
6 . Pokaż, że rekurencję ( 7 .32 ) można rozwiązać za pom ocą m etody reper­
tuaru, bez użycia funkcji tworzących.
7. Rozwiąż równanie rekurencyjne
9o = 1 ;
9 n = g n -i + 2 g n - 2 + • • • + n g 0 ,
dla rt > 0 .
8 . Ile wynosi [zn] (ln(1 —z ))2/(1 —z)m+1?
9. Policz sumę Y_k=o HkHn _ k. W tym celu wykorzystaj wynik z poprzed­
niego ćwiczenia.
10. Dla r = s = - 1 / 2 w tożsamości ( 7 .62 ) usuń wszystkie wystąpienia 1/2 ,
używając chwytu w rodzaju wzoru ( 5 .36 ). Jaką zaskakującą tożsamość
możesz wywnioskować ?
1 1 . Ten problem, którego trzy części są rozłączne, da nam doświadczenie w
manipulowaniu funkcjami tworzącymi. Zakładamy, że A(z) == Y n a nZn ,
B(z) — Y -n
C(z) = ]Tn cu zn i że dla ujemnych rt współczynniki
są zerowe.
a) W yraź C jako funkcję A i B, gdy cn = H j+ 2k<ę;n a ?'b k *
b) W yraź A jako funkcję B, gdy n b n =
2ka k/ ( n - Tc)!.
c) W yraź A jako funkcję B, gdy a n = X k=o (r£ k)t>n-k a r jest liczbą
rzeczywistą. Zastosuj otrzym any wzór do znalezienia współczynników
f k (r) takich, że b n = Y k = o f kM a n -k*
1 2 . Na ile sposobów można umieścić liczby {1, 2,. .. ,2n} w tabeli 2 x n , tak
żeby wiersze i kolumny były w porządku rosnącym od lewej do prawej i
z góry do dołu ? Na przykład jednym z takich ułożeń dla n = 5 jest
/I
2
4 5
7 9
6
8 \
lOy
13. Udowodnij uogólniony lemat Raneya, który jest podany tuż przed ( 7 .70 ).
14. Rozwiąż rekurencję
9o = 0 ,
gi = 1 ,
dla rt > 1 ,
za pom ocą wykładniczych funkcji tworzących.
15. L ic z b a B e l l a © n oznacza liczbę sposobów podziału zbioru n przedmio­
tów na podzbiory. Na przykład CD3 = 5 , ponieważ możemy podzielić
{1 , 2 ,3} następującym i sposobami:
{1,2,3};
{1,2} U {3};
{1,3}U{2};
{1}U{2,3};
{1}U{2}U{3}.
Udowodnij, że © n+i = H k (k) ® n - k i korzystając z tej rekurencji znajdź
zw artą postać dla wykładniczej funkcji tworzącej P(z) = Y n Q n z TL/ n l .
16. Dwa ciągi (an ) i (bn ) są związane wyrażeniem splotowym
bn
ki + 2 k 2 H— n k n = n
i ao = 0 oraz bo = 1. Udowodnij, że odpowiednie funkcje tworzące speł­
niają lnB (z) = A(z) + ^A (z2) + ^A (z3) H-----.
17. Pokaż, że wykładnicza funkcja tworząca G(z) dowolnego ciągu jest po­
wiązana ze zwykłą funkcją tworzącą G(z) za pom ocą równania
J-OO
G(zt)e- t d t = G(z),
o
jeśli tylko taka całka istnieje.
18. Znajdź funkcje tworzące Dirichleta dla ciągów
a) g-a = y /ń ;
b) gTl= l n n ;
c) 9 n = [tu jest bezkwadratowe].
W yraź swoje rozwiązanie za pomocą funkcji zeta (bezkwadratowość jest
zdefiniowana w ćwiczeniu 4.13.)
19. Każdy szereg potęgowy F(z) =
z warunkiem początkowym
f 0 = 1 , definiuje ciąg wielomianów f n (x) w następujący sposób:
W = I f « ( x ) t ł ,
n^O
Jak należy rozumieć
„w ogólności” ? Jeśli
f i = f2 = • •• =
fm—1 —0 ,
to stopień f n (x)
wynosi co najwyżej
|n/m j.
przy czym f n (1) = f n i f n (0) = [ t l = 0]. W ogólności, f u (x) m a stopień rt.
Pokaż, że takie wielomiany zawsze spełniają wzory splotowe
n
^ fk M fn -k (y )
=
fn (x + y );
k=0
n
(x + v) Y
k f k (x)fn _ k (ij) = x n f n (x + y ) .
k=0
(Tożsamości w tabelach 232 i 304 są szczególnymi przypadkami tego
chwytu.)
2 0 . Szereg potęgowy G(z) nazywany jest s k o ń c z e n ie ró ż n ic z k o w a ln y m , jeśli
istnieje skończenie wiele wielomianów Po (z), . . . , Pm (z), nie wszystkich
zerowych, takich że
Po(z)G(z) + P 1(z)G'(z) + --- + Pm (2 ) G ' m>(z) = 0.
Ciąg liczb (go, g i , g 2 , • • •) jest w ie lo m ia n o w o r e k u r e n c y jn y , jeśli istnieje
skończenie wiele wielomianów V o { z ) , . . . , p m (z), nie wszystkich zerowych,
takich, że
P o( n) gn + p i ( n ) g n + i + • • • + p m ( n) g u+m = 0
dla wszystkich całkowitych n ^ 0. Udowodnij, że funkcja tworząca jest
skończenie różniczkowalna wtedy i tylko wtedy, gdy jej ciąg współczyn­
ników jest wielomianowo rekurencyjny.
Ć w ic z e n ia do m o w e
2 1 . Złodziej napadł na bank i zażądał 500 dolarów w dziesięcio- i dwudziestodolarówkach. Domagał się również liczby sposobów, na ile kasjer inoże
dać mu pieniądze. Znajdź funkcję tworzącą G(z), dla której ta liczba
jest równa [z500] G(z) i bardziej zw artą funkcję tworzącą G(z), dla której
ta liczba jest równa [z50] G(z). Wyznacz żądaną liczbę sposobów stosując
(a) ułam ki proste; (b) m etodę jak w ( 7 .39 ).
22. Niech P będzie sumą możliwych „triangulacji” wielokątów:
p = —+ A +
+ ^ /
+ ^
+ \/^ / + ^
+ ^
+ ••••
(Pierwszy składnik reprezentuje zdegenerowany wielokąt zawierający tyl­
ko dwa wierzchołki; każdy następny składnik pokazuje wielokąt podzie­
lony na trójkąty. Na przykład pięciokąt może być striangulowany na pięć
sposobów.) Zdefiniuj operację mnożenia AAB dla striangulowanych wie­
lokątów A i B tak, żeby zachodziło równanie
P =
_
+
PAP.
Zamień potem każdy trójkąt na ‘z ’. Co ci to mówi o liczbie sposobów
dekompozycji n -k ąta na trójkąty?
23. Na ile sposobów można zbudować kolumnę rozmiaru 2 x 2 x n z cegieł
rozmiaru 2 x 1 x 1?
24. Ile drzew rozpinających jest w n-gwieździe (graf z n „zewnętrznymi”
wierzchołkami połączonymi w cykl, każdy połączony z n + 1 wierzchoł­
kiem centralnym), dla n ^ 3?
25. Niech m ^ 2 będzie całkowite. Znajdź zw artą postać funkcji tworzącej dla
ciągu (n m od m ), jako funkcji zmiennych z i m. Użyj tej funkcji tworzącej
do wyrażenia ‘n m od m ’ jako funkcji liczb zespolonych cu = e27rL//m. Na
przykład dla m = 2 mamy cu = —1 i n m od 2 = \ — \ (—1 )n .
26. Liczby Fibonacciego drugiego rodzaju (ffn ) są zdefiniowane za pom ocą
następujących równań rekurencyjnych:
#0 = 0 ;
=
W yraź
^
f f n —1 "F
= 1;
2 H- "Fn >
d l a Tl > 1.
jako funkcję normalnych liczb Fibonacciego Fn i Fn + i .
Czy będzie on może
chciał też rozwiązać
zadanie pokrycia
kamieniami
domina?
27. Pokrycia prostokąta 2 x rt kamieniami domina mogą być również rozwa­
żane jako sposoby rysowania n rozłącznych odcinków w tabeli punktów
2
x rt:
I “
“
! Z
1 1
Jeśli nałożymy dwa takie wzorce, to otrzymamy zbiór cykli, ponieważ
każdy punkt będzie końcem dwóch odcinków. Na przykład jeśli powyż­
sze odcinki nałożymy na odcinki
to otrzym amy
orrm
;
□
.
Taki sam zbiór cykli uzyskamy również przez nałożenie
Możemy jednak otrzymać jednoznaczny sposób rekonstrukcji oryginal­
nych wzorców przez nadanie orientacji pionowym liniom, tak że strzałki
idą na przem ian w górę — dół — górę — dół • • • w pierwszym wzorcu i na
przemian w dół — górę — dół • • • w drugim. Na przykład
ł z
“
ł “
ił
+
h
:
i
i
i
=
ł c
m
“
q
.
Liczba takich zorientowanych cykli musi zatem wynosić T 2 = F2 +1 i po­
winniśmy także być w stanie dowieść tego algebraicznie. Znajdź wzór
rekurencyjny dla Qn , rozwiąż go za pomócą funkcji tworzących i wy­
wnioskuj stąd algebraicznie, że
= ^ +128. W spółczynniki A(z) w równaniu ( 7 .39 ) spełniają Ar + Ar+ i 0 + Ar+ 2o +
At + 3o = 100 dla 0 ^ r < 10 . Znajdź „proste” wytłumaczenie tego faktu.
29. Czemu jest równa suma iloczynów liczb Fibonacciego
Y_
Y.
m >0
k i +łC2 H----- bkm = n
ktfk 2ł...,k m>0
30. Jeśli funkcja tworząca G(z) = 1/(1 — az)(l — |3z) m a rozkład na ułam ki
częściowe a / ( l —ocz) + b / ( l —|3z), to jaki jest rozkład na ułam ki częściowe
dla G{ z ) n ?
31. Jaka funkcja g(n) dla naturalnego n spełnia rekurencję
Y_g(d) cp(n/d) = 1 ,
d \n
gdzie cp jest funkcją Eulera?
32. Ciągiem arytm etycznym nazywamy nieskończony ciąg liczb całkowitych
taki, że
{an + b} = {b, a + b , 2 a + b , 3 a + b , . . . } .
Zbiór ciągów arytm etycznych { a i n + bi}, . . . , {amn + b m} nazywany jest
d o k ła d n y m p o k r y c ie m , jeśli każda dodatnia liczba całkowita występuje
dokładnie w jednym z nich. Na przykład trzy ciągi {2 n }, { 4 n + 1}, {4n+3}
stanowią dokładne pokrycie. Pokaż, że jeśli { a in + b i }, . . . , {amrt + b m}
jest dokładnym pokryciem takim , że 2 ^ ai ^
^ a m , to a m_i = a m .
W s k a z ó w k a : Zastosuj funkcje tworzące.
Zadania egzam in acyjn e
33. Ile wynosi [wmzTL] (ln(1 + z))/(1 —wz)?
34. Znajdź zw artą postać dla funkcji tworzącej H n>0 Gn (z)wn , jeśli
(tu taj m jest ustaloną dodatnią liczbą całkowitą).
35. Oblicz sumę H 0<ic<n ^A ( n ~ k) na dwa sposoby:
a) Rozwiń składniki w sumy częściowe.
b) P otraktuj sumę jako splot i zastosuj funkcje tworzące.
36. Niech A(z) będzie funkcją tworzącą dla (a0, a i , CL2 , CI3 , . . . ) . W yraź sumę
L n a [n/mjzn jako funkcję A, z i m.
37. Niech a n będzie liczbą sposobów zapisania dodatniej liczby całkowitej rt
jako sumy potęg dwójki, niezależnie od porządku. Na przykład clą = 4,
ponieważ 4 = 2 + 2 = 2 + 1 + 1 = 1 + 1 + 1 + 1 . Przyjmijmy, że ao = 1.
Niech b n = Hk=o Qk b§ćlzie sumą częściową pierwszych a.
a) Sporządź tabelę dla a i b aż do n = 10. Jaką zaskakującą własność
zauważasz w swojej tabeli? (Jeszcze jej nie dowodź.)
b) W yraź funkcję tworzącą dla a n przez iloczyn nieskończony.
c) Zastosuj wzór z części (b) do udowodnienia wyniku z części (a).
38. Znajdź postać zw artą dla podwójnej funkcji tworzącej
M (w ,z) =
^
m in(m , rt) w mzn .
Uogólnij odpowiedź, aby uzyskać, dla ustalonego m ^ 2, zw artą postać
dla
mi n(ri i, . . . , n m ) z ^ 1. . . z ^ m .
M { z u . . . yz m ) =
ni
39. Dla danych dodatnich liczb całkowitych m i tl, znajdź zwarte postacie
sum
k ik 2 . . . k m
1^Tct <k 2<-"<km^TL
i
Y_
1
kik2 . ..k m .
^k 2^*"^km^ n
Na przykład dla m = 2 i rt = 3 sumy te są odpowiednio równe 1 - 2 + 1 x
3 + 2-3 oraz 1-1 + 1 - 2 + 1- 3 + 2- 2 + 2- 3 + 3-3. W s ka z ó w ka : Jakie są
współczynniki przy zm w funkcjach tworzących (1 + a-| z ) . .. (1 + a n z) i
1/(1 - a ) z ) . .. (1 - a n z)?
40. W yraź H k
- F k ) ( n - k ) j w zwartej postaci.
41. Perm utacja rosnąco-malejąca rzędu rt jest takim przyporządkowaniem
liczb cli <120.3 . . . a n liczbom {1 , 2 , . . . ,n}, że są one uporządkowane na
przemian rosnąco i malejąco:
CLI < 02 > 03 < o 4 > • • • .
Na przykład 35142 jest perm utacją rosnąco-malejącą rzędu 5. Niech An
oznacza liczbę perm utacji rosnąco-malejących rzędu tl. Pokaż, że (1 +
sin z)/cos z jest wykładniczą funkcją tworzącą dla (An ).
42. Stwierdzono, że m ateriał organiczny na Marsie m a DNA zbudowane z
pięciu składników, oznaczonych symbolami ( a , b , c , d , e), w odróżnieniu
od czterech składników ziemskiego DNA. Cztery pary cd, ce, ed i ee
nigdy nie w ystępują obok siebie w ciągu marsjańskiego DNA, ale każdy
ciąg nie zawierający tych par jest możliwy (tak więc ciąg b b cd o jest
zakazany, ale b b d co jest w porządku). Ile jest marsjańskich ciągów DNA
długości u ? Na przykład dla rt = 2 odpowiedzią jest 21, ponieważ jest 25
par i cztery są zabronione.
43. F u n k c ja tw o rz ą c a N e w to n a dla ciągu (gn ) definiowana jest jako
Znajdź wyrażenie splotowe, które definiuje zależność między ciągami
(fn ), (gn ) i (Hn ), których funkcje tworzące Newtona są powiązane toż­
samością F(z)G(z) = H(z). Spróbuj uprościć ten wzór i przedstaw go w
możliwie symetrycznej postaci.
44. Niech qn będzie liczbą możliwych wyników, gdy porównuje się rt liczb
{xi, . . . ,x Tt} pomiędzy sobą. Na przykład q 3 = 1 3 , ponieważ mamy na­
stępujące możliwości:
xi< x2<x3; xi<x2=x3;
xi < x 3 < x 2 ;
—x 2 = x 3 ; x ! = x 3 < x 2 ;
x2 < x i < x 3 ;
x 2 < x ! = x 3 ; x 2 < x 3 < xi ;
x2 = x 3 < x i ;
x3 < x i < x 2 ; x3 < x i = x 2 ;
x3 < x 2 < x ] .
Znajdź zw artą postać dla wft Q(z) = Y n
(an), ( b n ) i ( C n ) takie, że
qn = ^ k n a k = X . { k } bk
xi= x2<x3;
Znajdź również ciągi
( k ) Ck>
dla n > °-
45. Oblicz
n > 0 [m -L'rL]/'iTi2n 2.
46. Znajdź zw artą postać dla
l
( V k7) (v i f
0^k^n/2 v
Wskazówka: z3 —z2 + ^ = (z + j)(z —| ) 2.
47. Pokaż, że liczby Un i Vn dla problemu pokrycia prostokąta 3 x n , tak jak
to zostało podane w ( 7 .34 ), są blisko powiązane z ułamkami w drzewie
Sterna-B rocota, które zbiegają do \/348. Pewien ciąg (gn ) spełnia rekurencję
a g n + b gn + i + cg n+2 + d = 0 ,
całkowite n
0,
dla pewnych liczb całkowitych (a, b, c, d) z największym wspólnym dziel­
nikiem a, b, c i d równym 1. Ma on również postać zw artą
gn = |_oc(l + V l )n J ,
całkowite n ^ 0 ,
dla pewnej liczby rzeczywistej oc między 0 a 1. Znajdź a, b,c, d i a.
49. To jest zadanie o potęgach i parzystości.
a) Rozważmy ciąg (ao, a i , a 2, . . . ) = (2 ,2 , 6 , . . . ) zdefiniowany wzorem
an =
0 + V 2 )n + V - V 2 ) n .
Znajdź proste równanie rekurencyjne definiujące ten ciąg.
7» Im nkcje
b) Udowodnij, że |"(1 + y / l ) lx'\ = n (mod 2) dla wszystkich całkowitych
n > 0.
c) Znajdź liczbę oc postaci (p + y / ą ) / 2 , gdzie p i q są dodatnie i całko­
wite, tak że |_(xTLJ = n (mod 2 ) dla wszystkich całkowitych n > 0 .
Z adania d odatkow e
50. Kontynuując ćwiczenie 22 , spójrzm y na sumę wszystkich sposobów de­
kompozycji wielokątów na wielokąty:
+ A
Q = -
+ [j
+
+
+ K\7 +
+
Znajdź wzór symboliczny na Q i zastosuj go do znalezienia funkcji two­
rzącej na liczbę możliwych sposobów rysowania nie przecinających się
przekątnych wewnątrz wypukłego n-kąta. (Podaj zw artą postać funkcji
tworzącej jako funkcji zmiennej z; nie potrzeba tu taj znajdować zwartej
postaci dla współczynników.)
51. Udowodnij, że iloczyn
1 /4
2 tan /2
n
((cos2 ^ t t ) d 2 + (cos2 J t t ) ° 2)/
-i<"m x
1^ j^m
IsCksCn
Czy jest
to wskazówka,
czy ostrzeżenie?
jest funkcją tworzącą liczby podziałów prostokąta m x n kamieniami do­
mina. (Jest m n czynników i możemy sobie wyobrazić, że są one zapisane
w m n polach prostokąta. Jeśli m n jest nieparzyste, to środkowy czyn­
nik jest zerem. W spółczynnik przy □ ^ o k jest liczbą sposobów podziału
j pionowymi i k poziomymi kamieniami.) W s k a z ó w k a : To jest trudny
problem, naprawdę wybiegający poza ramy tej książki. Może wystarczy,
jeśli sprawdzisz to wyrażenie dla przypadku m = 3, n = 4.
52. Pokaż, że wielomiany zdefiniowane za pomocą rekurencji
TL— 1
Pn(y) = ( y -
2n \ / - I
- Y . ( 2k ) (
)
u -k
Pk(y). całkowite u ^ 0,
k= 0
są postaci i pn i y ) = ^ m = o
gdzie |m| Jest dodatnią liczbą całkowitą
dla 1 ^ m ^ n . W s k a z ó w k a : To ćwiczenie jest bardzo pouczające, ale
nie jest łatwe.
53. Ciąg liczb pięciokątnych (1, 5 ,1 2 ,2 2 ,...) uogólnia ciąg liczb trójkątnych
i kwadratowych w oczywisty sposób:
Niech n-tą liczbą trójkątną będzie Tn = n (n + l)/2 , niech n-tą liczbą
pięciokątną będzie Pn = n (3n — 1)/2 i niech Uu będzie liczbą pokryć
prostokąta kamieniami domina 3 x n zdefiniowaną w ( 7 .3 8 ). Udowodnij,
że liczba trójkątna T(U 4 łi+ 2 _ 1) / 2 jest również liczbą pięciokątną.
Wskazówka: 311^ = (V2 n -i + V 2 n + i ) 2 + 2 .
54. Rozważ następującą dziwaczną konstrukcję:
1
2
3
4
1
2
3
4
1
3
6
10
1
3
1
4
1
1
5
6 7 8 9
11
12
13 14 15 16 .
6 7 8 9
11
12
13 14
16 .
16 23 31 40
51
63
76 90
106 .
6
16 23 31
51
63
76
106 .
10
26 49 80
131 194 270
376 .
4
26 49
131 194
376 .
5
31 80
211
405
781 .
1
31
211
781 .
1
32
243
1024 .
10
(Zacznij od wiersza zawierającego same dodatnie liczby. Potem usuń co
m-tą kolumnę; w tym przypadku m = 5. Potem zastąp pozostałe warto­
ści ich sumami częściowymi. Potem usuń co (m —1)-szą kolumnę. Potem
znowu zastąp pozostałe liczby sumami częściowymi, i tak dalej.) Wyko­
rzystując funkcje tworzące pokaż, że uzyskany wynik jest ciągiem m-tych
potęg. Na przykład dla m = 5 otrzymamy (15 ,2 5 ,3 5 ,4 5, . . . ) , co tutaj
widać.
55. Udowodnij, że jeśli szeregi potęgowe F(z) i G(z) są skończenie różniczkowalne (tak, jak to było zdefiniowane w ćwiczeniu 2 0 ), to również F(z) 4 G(z) i F(z)G(z) są skończenie różniczkowalne.
7. Funkcje tworzące
Problem y badawcze
56. Udowodnij, że nawet jeśli dopuścimy odpowiednio dużą klasę prostych
postaci zwartych, to i tak nie znajdziemy takiej postaci na współczynniki
przy zn w (1 + z + z2)n .
57. Czy następujące zdanie jest prawdziwe: Jeśli wszystkie współczynniki
w G(z) są równe albo 0 , albo 1 , i wszystkie współczynniki w G(z ) 2 są
mniejsze niż pewna stała M, to nieskończenie wiele współczynników w
G(z ) 2 równa się zeru.
Prawdopodobieństwo dyskretne
Element szansy często występuje w naszych próbach zrozumienia świata, w
którym żyjemy. Matematyczna teoria rachunku prawdopodobieństwa po­
zwala obliczać szansę wystąpienia skomplikowanych zdarzeń, jeśli założymy,
że zdarzenia podlegają odpowiednim aksjomatom. Teoria ta ma szerokie za­
stosowania we wszystkich dziedzinach nauki i ma silne powiązania z techni­
kami badanymi w poprzednich rozdziałach.
Prawdopodobieństwo będzie nazywane „dyskretnym”, jeśli prawdopodo­
bieństwo wszystkich zdarzeń można policzyć za pomocą sumowania zamiast
całkowania. Nabraliśmy już biegłości w sumowaniu, więc nie powinno być
wielkim zaskoczeniem, że jesteśmy gotowi zastosować naszą wiedzę do cał­
kiem ciekawych obliczeń dotyczących prawdopodobieństw i średnich.
8.1. D efinicje
Teoria rachunku prawdopodobieństwa rozpoczyna się od pierwotnego poję­
cia przestrzeni losowej, która jest zbiorem £1 składającym się z wszystkich
rzeczy, które mogą się zdarzyć w danym problemie, wraz z regułą przypisu­
jącą prawdopodobieństwo Pr(cu) każdemu zdarzeniu elementarnemu cu € O.
Prawdopodobieństwo Pr(cu) musi być nieujemną liczbą rzeczywistą, a waru­
nek
Y _ Pr(cu) =
cueo
1
(8 .1)
musi być spełniony w każdej przestrzeni losowej. Tak więc każda wartość
Pr(cu) musi znajdować się w przedziale [0 .. 1]. Będziemy mówić o Pr jako o
rozkładzie losowym , ponieważ rozkłada on całkowite prawdopodobieństwo 1
między zdarzenia cu.
^ Weźmy następujący przykład: Jeśli rzucamy parą kości, to zbiorem O
zdarzeń elementarnych jest D 2 = { [•][•]>
•••> U ffi] )> gdzie
D = { □.□.H .H .H .D }
mmm,
(Czytelnik, nie
obeznany z
rachunkiem prawdo­
podobieństwa, z
dużym prawdopo­
dobieństwem może
wiele skorzystać
dokładnie czytając
klasyczne
wprowadzenie
Fellera [120] do tego
tematu.)
8 .Prawdopodobieństwo dyskretne
jest zbiorem wszystkich sześciu wyników, odpowiadających pojawieniu się
danej liczby oczek. Pary takie jak 0 H i H H s3= uważane za różne. Tak
więc ta przestrzeń losowa zawiera w sumie 6 2 = 36 elementów.
Będziemy z reguły zakładali, że kości są „wyważone” — to znaczy, że
każda z sześciu możliwych wartości wystąpi z prawdopodobieństwem ^ oraz
że każdy z 36 możliwych wyników ma jednakowe prawdopodobieństwo jg.
Ale możemy również rozpatrywać „niewyważoną” (źle wyważoną) kość, dla
której rozkład prawdopodobieństw jest różny. Na przykład niech
PritEI) = Pri(IOI) = 5 ;
Pr, O
= Pr,(|7]) = Pr, (|d ) = P r , ®
=
Wówczas Y deD Pri (d) = 1, tak więc Pri jest rozkładem losowym zbioru D i
elementom przestrzeni O = D 2 możemy przyporządkować prawdopodobień­
stwa w następujący sposób:
P r n (d d ') Na przykład Pri
Y
tuen
( 8 .2 ;
Pri(d) P n (d ') .
—
P r „ (tu) =
poprawny rozkład, ponieważ
P r „ (d d ') =
d d '6 D2
= X
dGD
P r ,(d) P r,(d ')
d ,d '6 D
Pri( d) L
d'£D
Pr^ d') = 1 1 = K
Możemy również rozważać przypadek, gdy jedna kość jest wyważona, a druga
nie,
Pr0, (d d ') = Pr0 (d) Pr, ( d ') ,
Gdyby wszystkie
ściany na kości były
identyczne, skąd
wiedzielibyśmy;
która została
wyrzucona?
gdzie Pr0 (d) = i
( 8 .3 )
i wówczas Pro, (| | ] | 3 ) = g • g = jgpowinniśmy oczekiwać, że kości
w „prawdziwym świecie” będą upadały tak samo często na każdą ścianę,
ponieważ nie są one całkowicie symetryczne. Ale wartość \ jest z reguły
bliska prawdzie.
Zdarzenie jest podzbiorem zbioru Cl. W grze w kości, na przykład, zbiór
0 0 -
59S9> 0 0 }
jest zdarzeniem że „wypadł dublet.” Pojedyncze elementy cu z O są nazywane
zdarzen iam i elem entarn ym i, ponieważ nie mogą być rozłożone na mniejsze
podzbiory. Można myśleć o cu jako o jednoelementowym zdarzeniu {cu}.
Prawdopodobieństwo zajścia zdarzenia A jest zdefiniowane wzorem
(8.4)
cu 6 A
i w ogólności, jeśli R(tu) jest dowolnym zdaniem logicznym zależnym od cu,
to będziemy pisać ‘Pr(R(cu))’ dla sumy wszystkich Pr(cu), dla których zdanie
R(cu) jest prawdziwe. Tak więc, na przykład, prawdopodobieństwo wypad­
nięcia dubletu, przy rzucie wyważoną kostką, jest równe 3^+3^ + ^ + ^ +
3^ + 3^ =
Ale gdy obie kości są niewyważone z rozkładem losowym P r i,
wówczas jest już równe je + -k + -gĘ + -^ + i i + j6 = T e > \ - Używając niewyważonych kości, czynimy prawdopodobieństwo wyrzucenia dubletu
bardziej prawdopodobnym.
(W tym miejscu używamy notacji Y. w bardziej ogólnym sensie niż było
to zdefiniowane w rozdziale 2: We wzorach (8.1) i (8.4) sumujemy wzglę­
dem wszystkich elementów cu z dowolnego zbioru, nie tylko względem liczb
całkowitych. Jednakże to rozszerzenie nie jest w rzeczywistości alarmujące.
Możemy założyć, że gdy nie mamy na myśli liczb całkowitych, używamy
specjalnej notacji pod znakiem
tak aby nie było niezgodności z naszą
zwykłą konwencją. Pozostałe definicje w rozdziale 2 są nadal poprawne. W
szczególności definicja sum nieskończonych w tym rozdziale nadaje poprawną
interpretację naszym sumom, również wtedy, kiedy przestrzeń Cl jest nieskoń­
czona. Każde prawdopodobieństwo jest nieujemne i suma wszystkich praw­
dopodobieństw jest ograniczona, tak że prawdopodobieństwo zdarzenia A w
(8.4) jest dobrze zdefiniowane dla wszystkich podzbiorów A C O.)
Z m ien n a losowa jest funkcją zdefiniowaną na zdarzeniach elementar­
nych cu z przestrzeni losowej. Na przykład gdy Cl = D 2, możemy zdefiniować
S(cu) jako sumę liczby oczek, gdy wyrzuciliśmy kośćmi cu, tak że S(||f]|X]) =
6 + 3 = 9. Prawdopodobieństwo, że wypadło siedem oczek, jest prawdopodo­
bieństwem zdarzenia S(cu) = 7, a dokładniej
Pr(0 0 ) + Pr(E3 g | ) + P r(|a |C |)
+ Pr(0 0 ) + P r(H E 3 ) + Pr(0 H ) .
Z wyważoną kością (Pr = Proo), zdarzy się to z prawdopodobieństwem
ale z niewy ważoną kością (Pr = Pri 1) prawdopodobieństwo to będzie równe
T 6 + ^ + ^4 + ^ + ^4 + T 6 = ^ ) takie samo>jakie otrzymaliśmy w przypadku
dubletów.
Zwyczajowo, gdy mówimy o zmiennych losowych, opuszczamy symbol
‘(cu)’ ponieważ z reguły podczas analizy konkretnego problemu rozważamy
tylko jedną przestrzeń losową skojarzoną z daną zmienną losową. Powiemy
więc po prostu, że ‘S = 7’, gdy zdarzeniem było wyrzucenie 7 oczek oraz
‘S = 4 \ aby określić zdarzenie { Q 0 >
0 0 }’
Zmienna losowa może być scharakteryzowana przez rozkład losowy jej
wartości. I tak, na przykład, S przybiera jedenaście możliwych wartości ze
zbioru { 2 ,3 ,..., 1 2 } i dla każdego s w tym zbiorze możemy zapisać prawdo­
podobieństwo tego, że S = s:
s
2
3
4
5
6
7
8
9
10
11
12
Pr00(S = s)
1
36
4
64
2
36
4
64
3
36
5
64
4
36
6
64
5
36
7
64
6
36
12
64
5
36
7
64
4
36
6
64
3
36
5
64
2
36
4
64
1
36
4
64 '
P rn (S = s)
Gdy zajmujemy się problemem, w którym występuje tylko zmienna losowa S
i nie wykorzystujemy żadnych innych własności kości, wówczas możemy dać
odpowiedź korzystając tylko z tych prawdopodobieństw, bez wdawania się we
własności zbioru O. = D 2. Tak naprawdę to moglibyśmy zdefiniować prze­
strzeń losową jako mniejszy zbiór jQ = { 2 ,3 ,..., 1 2 }, z odpowiednim rozkła­
dem losowym. Wtedy ‘S = 4 ’ byłoby zdarzeniem elementarnym. Tak więc
możemy często ignorować wyróżnioną przestrzeń losową D. i zajmować się od
razu zmienną losową i jej rozkładem.
Jeśli dwie zmienne losowe X i Y zdefiniowane są nad tą samą przestrzenią
losową O, to możemy opisać ich zachowanie bez jakiejkolwiek znajomości O,
pod warunkiem, że znamy „rozkład łączny”
Pr(X = x i Y = y)
dla każdego x z zakresu X i każdego y z zakresu Y. Powiemy że X i Y są
niezależnym i zmiennymi losowymi, jeśli
Pr(X = x i Y = i|) = Pr(X = x ).P r (Y = y )
(8 .5 )
dla każdego x i y. Intuicyjnie, oznacza to, że wartość X nie ma żadnego
wpływu na wartość Y.
Na przykład gdy O jest zbiorem D 2, możemy zdefiniować Si jako liczbę
oczek w pierwszym rzucie kostką i S2 jako liczbę oczek w drugim rzucie. Wów­
czas zmienne losowe Si i $2 są niezależne względem wszystkich rozkładów
losowych Proo, Pri 1 i Proi, które dotąd rozważaliśmy, ponieważ definiowa­
liśmy prawdopodobieństwa dla każdego zdarzenia elementarnego dd' jako
iloczyn prawdopodobieństwa dla Si = d i prawdopodobieństwa dla S2 = d ;.
Moglibyśmy też zdefiniować prawdopodobieństwa inaczej, tak, by na przy­
kład
P r(0 i5 ])/P r(0 0 )
± P r(H |X |)/P r(|3 |n i).
ale nie robimy tego,-ponieważ wartości oczek na każdej z kości nie wydają
się zależeć od siebie nawzajem. Według naszych definicji obydwa ułamki
wynoszą Pr(S 2 = 5 )/ Pr(S 2 = 6 ).
Zdefiniowaliśmy S jako sumę wartości wyrzuconych oczek, Si + S2. Roz­
ważmy inną zmienną losową P — będącą iloczynem Si S2- Czy S i P są nieza­
leżne? Intuicyjnie nie. Jeśli S = 2, to wiemy, że P musi być równe 1. Formalnie
też nie, ponieważ warunek niezależności ( 8 .5 ) nie jest spełniony, co można
pokazać w następujący spektakularny sposób (przynajmniej w przypadku
wyważonej kości): Dla wszystkich poprawnych wartości s i p mamy 0 <
Pr0 o(S = s) -Proo(P =p) ^
co nie może się równać Proo(S = s iP = p ),
które jest wielokrotnością jg .
Gdy chcemy zrozumieć typowe zachowanie się danej zmiennej losowej,
wówczas często pytamy się o jej wartość „przeciętną.” Pojęcie takiej wartości
jest jednak niejednoznaczne. Ogólnie mówi się o trzech różnych rodzajach
„średnich” dla danego ciągu liczb:
• wartość średnia (suma wartości wszystkich elementów dzielona przez
liczbę tych elementów),
• mediana (równa środkowemu co do wartości elementowi),
• dominanta (czyli wartość, która występuje najczęściej). Na przykład
wartością średnią (3 ,1 ,4 ,1 ,5 ) jest 3 + 1 + ^+ 1 + 5 = 2,8, medianą jest 3 i
dominantą jest 1 .
Teoretycy rachunku prawdopodobieństwa zwykle pracują ze zmiennymi
losowymi, a nie z ciągami liczb, tak że chcielibyśmy zdefiniować pojęcie „war­
tości średniej” także dla zmiennych losowych. Przypuśćmy, że ciągle powta­
rzamy eksperyment, wykonując niezależne próby w taki sposób, że każda
wartość X występuje z częstością w przybliżeniu proporcjonalną do swego
prawdopodobieństwa (np. moglibyśmy wiele razy rzucać parą kości, obser­
wując wartości S i/lub P). Chcielibyśmy zdefiniować wartość średnią zmiennej
losowej tak, żeby każdy eksperyment produkował z reguły ciąg liczb, których
wartość średnia, mediana oraz dominanta były mniej więcej takie same jak
zgodnie z naszą definicją wartość średnia, mediana i dominanta zmiennej
losowej X.
Oto jak można to osiągnąć: Wartością oczekiwaną zmiennej losowej X
przybierającej wartości rzeczywiste na przestrzeni losowej Cl jest
(8.6)
xex(n)
jeśli tylko te potencjalnie nieskończone sumy istnieją. (Tutaj X(D) oznacza
zbiór wszystkich wartości, które X może przybierać). Medianę zmiennej lo­
sowej X definiujemy jako zbiór wszystkich x takich, że
(8-7)
D o m in an ta zmiennej losowej X jest zdefiniowana jako zbiór wszystkich x
takich, że
Pr(X = x) ^ Pr(X = x')
dla wszystkich x r G X(£l).
(8.8)
W naszym przykładzie rzucania kością wartość oczekiwana zmiennej losowej
S wynosi
+
— 7 zarówno w rozkładzie losowym
Proo, jak i w rozkładzie Pri i . Mediana i dominanta są także {7}, dla obydwu
rozkładów. Tak więc zmienna losowa S ma taką samą „średnią” dla wszystkich
trzech definicji. Z drugiej strony, zmienna losowa P z rozkładem Proo ma
wartość średnią ^ = 12,25, medianę {10} i dominantę {6 ,12}. Wartość średnia
zmiennej losowej P nie zmieni się, jeśli rzucamy kośćmi niewy ważonymi z
rozkładem P rn , ale mediana zmniejsza się do {8 }, a dominanta staje się
jednoelementowym zbiorem {6 }.
Teoretycy rachunku prawdopodobieństwa mają specjalną nazwę i ozna­
czenie dla wartości średniej zmiennej losowej: nazywają ją w artością ocze­
kiwaną i piszą
EX =
Y _ X(cu)Pr(u>).
coGO
( 8 .9 )
W naszym przykładzie z rzucaniem kośćmi ta suma ma 36 składników (jeden
dla każdego elementu z O), podczas gdy ( 8 .6 ) jest sumą tylko jedenastu
składników. Ale obie sumy przybierają taką samą wartość, ponieważ obydwie
są równe
Y
xPr(o>) [x = X(cu)] .
cuGO
x € X (0 )
Już wiem:
średnio rzecz biorąc
„przeciętny” znaczy
„średni”
Wartość oczekiwana zmiennej losowej okazuje się mieć większe znaczenie
w zastosowaniach niż inne rodzaje wartości średniej, tak że z reguły nie bę­
dziemy się odtąd zajmowali medianą i dominantą. W pozostałej części tego
rozdziału będziemy używali oznaczenia „wartość oczekiwana” i „średnia” pra­
wie zamiennie.
Jeśli X i Y są dowolnymi zmiennymi losowymi zdefiniowanymi nad tą
samą przestrzenią losową, to X + Y też jest zmienną losową zdefiniowaną nad
tą przestrzenią losową. Ze wzoru (8 .9 ), wartość oczekiwana ich sumy jest
sumą ich wartości oczekiwanych:
E(X + Y) =
(X(cu) + Y(cu))Pr(cu) = EX + EY.
(8 . 1 0 )
o>en
Podobnie, jeśli oc jest dowolną stałą, to otrzymujemy prosty wzór
E(<xX) = ccEX.
(8 .1 1 )
Odpowiedni wzór dla mnożenia zmiennych losowych jest w ogólności znacznie
bardziej skomplikowany. Dzieje się tak dlatego, że wartość oczekiwaną defi­
niuje się jako sumę względem zdarzeń elementarnych, a suma iloczynu nie
ma często tak prostej postaci. Pomimo tej trudności, istnieje ładny wzór na
wartość oczekiwaną iloczynu w szczególnym przypadku, gdy zmienne losowe
są niezależne:
E(XY) = (EX)(EY),
gdy X i Y są niezależne.
(8 . 1 2 )
Możemy tego dowieść korzystając z prawa rozdzielności dla iloczynów:
Y X(oi)Y(co) -Pr(cu)
= Y. *y-Pr(X = x i Y = y)
E(XY) =
coGO
x G X (0 )
-yGY ( O )
=Y -
xy.Pr(X = x)Pr(Y = y)
x G X (0 )
U G Y (a )
=
Y
x g x (Q )
•
Y y p r (Y = y ) = ( e * ) ( e y ) .
ye Y(ci)
Wiemy na przykład, że S = Si + S2 i P = S iS 2, gdy Si i S2 są liczbami
oczek wyrzuconymi na pierwszej i na drugiej kości. Ponieważ ESi = ES2 = \ ,
więc otrzymujemy ES = 7. Co więcej, Si i S2 są niezależne, tak więc EP = | •
|
co ustaliliśmy wcześniej. Mamy również E(S + P) = ES + EP = 7 + ^ .
Ale S i P nie są niezależne, więc nie możemy wnioskować, że E(SP) = 7* ^ =
W istocie, wartość oczekiwana SP jest równa ^ w rozkładzie Proo,
podczas gdy jest ona równa 1 1 2 (dokładnie) w rozkładzie Pri i .
8.2. W artość oczekiw ana i wariancja
Drugim ważnym parametrem zmiennej losowej jest jej w ariancja, zdefinio­
wana jako wartość oczekiwana kwadratu odchylenia od wartości średniej roz­
ważanej zmiennej:
VX = E ( ( X - E X } 2) .
(8.13)
Jeżeli oznaczymy EX przez
to wariancja VX będzie wartością oczekiwaną
(X — |x)2. Mierzy ona rozproszenie rozkładu X.
Oto przykład obliczania wariancji: Przypuśćmy, że właśnie otrzymaliśmy
propozycję nie do odrzucenia; ktoś podarował nam dwa losy na pewną loterię.
(Subtelna uwaga:
W zależności od
tego, którą strategię
przyjmiemy,
otrzymamy różne
przestrzenie losowe,
ale w obydwu
przypadkach EXi
i EX2 są takie
same).
Organizatorzy loterii sprzedają 1 0 0 losów na cotygodniowe ciągnienie. Każdy
z losów jest wybierany w jednorodnym procesie losowym, to znaczy, że każdy
los może być wybrany z takim samym prawdopodobieństwem— i szczęśliwy
właściciel wybranego losu wygrywa sto milionów dolarów. Pozostałe 9 9 losów
nic nie wygrywa.
Możemy teraz wykorzystać nasz prezent na dwa sposoby: albo kupujemy
dwa losy na to samo ciągnienie, albo kupimy po jednym losie na dwa różne
ciągnienia. Która strategia jest lepsza? Spróbujmy to przeanalizować przy
użyciu zmiennych losowych Xi i X2 odpowiadających wysokości wygranej
dla pierwszego i dla drugiego losu. Wartość oczekiwana Xi, w milionach,
wynosi
= W -0 + W
=
-1 0 0
1
i jest taka sama dla X2. Wartości oczekiwane są addytywne, tak więc średnia
całkowita wygrana wynosi
E(Xi + X 2) = EXi + E X 2 = 2 miliony dolarów,
niezależnie od tego, jaką strategię wybierzemy.
Mimo to obydwie strategie wyglądają różnie. Nie patrzmy jednak na
wartości oczekiwane i przeanalizujmy dokładnie rozkład zmiennej losowej
Xi + X2 :
wygrana (w milionach)
0
100
to samo ciągnienie
0,9800
0 ,0 2 0 0
różne ciągnienia
0,9801
0,0198
200
0 ,0 00 1
Gdy kupimy dwa losy na tej samej loterii, wówczas mamy 98% szansy prze­
granej i 2 % szansy wygrania 10 0 milionów dolarów. Jeśli kupimy je na różne
ciągnienia, to mamy 98,01% szansy przegranej, czyli odrobinę więcej niż po­
przednio; mamy 0 ,0 1 % szansy wygrania 2 0 0 millionów dolarów, co jest rów­
nież troszkę więcej niż poprzednio, i nasze szanse na wygranie 10 0 millionów
dolarów wynoszą teraz 1,98%. Tak więc rozkład Xi + X2 w drugim przy­
padku jest bardziej rozproszony: wartość środkowa, 10 0 millionów dolarów,
jest mniej prawdopodobna, ale wartości ekstremalne są odrobinę bardziej
prawdopodobne.
Wariancja ma służyć właśnie do analizy pojęcia rozproszenia zmiennej
losowej. Będziemy mierzyli rozproszenie jako kwadrat odchylenia zmiennej
losowej od jej wartości oczekiwanej. W przypadku 1 wariancja wynosi
0 ,9 8 (0 M -2 M )2 + 0,02(100M —2M ) 2 = 196M2 ,
a w przypadku 2
0 ,9801 (OM —2M ) 2 4 - 0 ,0198(1 OOM —2M .)2 + 0 ,0001 (200M —2M ) 2
= 198M2 .
Tak jak oczekiwaliśmy, druga wariancja jest odrobinę większa, ponieważ roz­
kład losowy w przypadku 2 jest odrobinę bardziej rozproszony.
Gdy pracujemy z wariancjami, wszystko jest podnoszone do kwadratu,
tak że można uzyskać całkiem duże wartości. (W naszym przykładzie czynnik
M 2 wynosi bilion, co jest dość imponujące nawet dla graczy grających o
bardzo wysokie stawki.) Żeby przenieść liczby z powrotem do wyjściowej
skali, często bierze się pierwiastek kwadratowy z wariancji. Otrzymana liczba
jest nazywana odchyleniem standardow ym i jest zwykle oznaczana grecką
literą a:
a = VVX.
Ciekawe: Wariancja
liczby dolarów jest
wyrażona
w dolarach
kwadratowych.
( 8 .1 4 )
Odchylenia standardowe zmiennej losowej Xi + X2 dla naszych dwóch stra­
tegii na loterii wynoszą a/196M2 = 14,00M. i V l98 M 2 « 14,071247M. W
pewnym sensie, druga strategia jest o ok. 71247 dolarów bardziej ryzykowna.
Jak wariancja może nam pomóc w wyborze strategii? To nie jest wcale
takie oczywiste. Strategia z wyższą wariancją jest odrobinę bardziej ryzy­
kowna, ale czy uzyskamy najwięcej pieniędzy grając bardziej, czy mniej ry­
zykownie? Przypuśćmy że mamy szansę kupienia 100 losów zamiast tylko
dwóch. Wówczas mielibyśmy zagwarantowaną wygraną w pojedynczej loterii
(i wariancja byłaby zero), ale też moglibyśmy zagrać w stu różnych loteriach
z szansą przegrania 0 ,99 100 « 0,366, również z niezerową szansą wygrania aż
10000000000 dolarów. Decyzja, która z tych strategii jest lepsza, wykracza
poza ramy tej książki. Wszystko co my możemy tutaj wytłumaczyć, to tylko
jak przeprowadzać obliczenia.
Tak naprawdę to istnieje prostsza metoda obliczania wariancji, niż wyni­
kająca z definicji ( 8 . 1 3 ). (Podejrzewamy, że coś musi się dziać z matematyką
za naszymi plecami, ponieważ wariancja w przykładzie z loterią w jakiś ma­
giczny sposób wyskoczyła jako całkowita wielokrotność M 2.) Otrzymujemy
E((X — EX)2) = E(X 2 —2X(EX) + (EX)2)
= E(X2 )-2 (E X )(E X ) + (EX)2 ,
ponieważ (EX) jest stałą. Stąd
VX = E(X2) - (EX) 2 .
(8 .1 5 )
„Wariancja jest wartością oczekiwaną kwadratu zmiennej minus kwadrat war­
tości oczekiwanej.”
Innym sposobem
na zredukowanie
ryzyka byłoby
przekupienie
właściciela loterii.
Sądzę, że wówczas
prawdopodobień­
stwo przestałoby
być dyskretne.
(Opinia wyrażona
na tym marginesie
niekoniecznie
reprezentuje opinię
autorów.)
W przykładzie z loterią, wartość oczekiwana (Xi + X2 ) 2 wynosi albo
0 ,98(0M)2 + 0,02(100M ) 2 = 200M2, albo 0,9801 (OM) 2 + 0,0198(100M )2 +
0,0001 (200M ) 2 = 202M2. Po odjęciu 4M 2 (kwadrat wartości oczekiwanej)
otrzymujemy wynik, na który poprzednio tak ciężko pracowaliśmy.
Zachodzi nawet jeszcze prostszy wzór, gdy chcemy liczyć V(X + Y) dla
niezależnych X i Y. Otrzymujemy
E((X + Y)2) = E(X2 + 2XY + Y2)
= E(X2) + 2(EX)(EY) + E(Y2) .
Ponieważ wiemy, że E(XY) = (EX)(EY) dla niezależnych zmiennych losowych
X i Y, więc otrzymujemy
V(X + Y) = E((X + Y}2) - ( E X + EY)2
= E(X2) + 2(EX)(EY) + E(Y2)
-
(EX) 2 - 2(EX)(EY) - (EY)2
= E(X2) - (EX)2 + E(Y2) - (EY)2
( 8 .16 )
= VX + VY.
„Wariancja sumy niezależnych zmiennych losowych jest sumą ich wariancji.”
Na przykład wariancja wartości, jaką możemy wygrać na pojedynczy los na
loterii wynosi
E(X2) — (EXi )2 = 0,99(0M )2 + 0,01 (100M.)2 — ( I M )2 = 99M 2 .
Dlatego wariancja całkowitej wygranej przy dwóch losach w dwóch oddziel­
nych (niezależnych) ciągnieniach wynosi 2 x 99M 2 = 198M2. Odpowiednia
wariancja dla n niezależnych losów wynosi n x 99M2.
Wariancja dla sumy S wartości wyrzuconych oczek w rzutach kością może
być obliczona według tego samego wzoru, ponieważ S = Si + S2 jest sumą
dwóch niezależnych zmiennych losowych. Otrzymujemy
VSi = ^ ( 12 + 22 + 32 + 4 2 + 52 + 6 2) — ( Q
gdy kości są wyważone i stąd VS = f f + f§ =
= ^ ,
Dla niewyważonych kości
VS, = l( 2 - 1 2 + 22 + 3 2 + 4 2 + 52 + 2 - 6 2) - ( 0
= ^
i stąd VS = ^ = l \ . Można zauważyć, że niewyważona kość daje większą
wariancję dla S, pomimo że S przybiera swoją średnią wartość 7 częściej niż
przy wyważonych kościach. Tak więc gdy naszym celem jest wyrzucenie wielu
szczęśliwych 7, wariancja nie jest najlepszym wskaźnikiem sukcesu.
OK, wiemy już, jak obliczać wariancje. Ale jaki jest naprawdę rzeczywi­
sty powód, dla którego oblicza się wariancję? Każdy to robi, ale dlaczego?
Głównym powodem jest nierówność Czebyszewa ([29] i [73]), która mówi,
że wariancja ma następującą ważną własność:
Pr((X — EX) 2 ^ a) ^ VX/cx,
dla wszystkich a > 0.( 8 . 1 7 )
(Różni się ona od monotonicznych nierówności Czebyszewa, które spotkali­
śmy w rozdziale 2 .) W przybliżeniu wzór ( 8 . 1 7 ) oznacza, że zmienna losowa X
będzie rzadko odległa od swojej wartości oczekiwanej EX, jeśli wariancja VX
jest mała. Dowód jest zaskakująco prosty. Mamy
vx =
Y_ (x (a>) - Ex)2P rM
cu 6 0
Y_
(X(a>) — EX) 2 Pr(a>)
cuen
(X(a>)—E X ) 2 ^ o t
^
^
aPr(cu)
=
c»c-Pr((X — EX) 2 ^ a) ;
w go.
(X (c u )-E X )2^ a
dzieląc przez oc otrzymujemy tezę.
Jeśli oznaczymy wartość oczekiwaną przez [i, odchylenie standardowe
przez a i podstawimy c2VX za oc we wzorze ( 8 . 1 7 ), to warunek (X —EX) 2 ^
c2VX stanie się równoważny (X — \x) 2 ^ (ca)2. Czyli z nierówności ( 8 . 1 7 )
wynika, że
Pr(|X — M
-l ^ cc) ^ 1 /c2 .
(8 .1 8 )
Tak więc X będzie zwykle leżało w promieniu c razy odchylenie standardowe
od swojej średniej, z wyjątkiem co najwyżej 1 /c 2 przypadków. Zmienna lo­
sowa będzie leżała nie dalej niż 2cr od |ll w co najmniej 75% przypadków.
Znajdzie się pomiędzy \x— 10a i + 10a w co najmniej 99% przypadków.
Wynika to z zastosowania nierówności Czebyszewa dla oc = 4VX i oc = 10OVX.
Jeśli rzucamy parą wyważonych kości n razy, to całkowita liczba wyrzu­
conych oczek będzie prawie zawsze bliska 7n, dla dużych rt. A oto dlaczego:
Wariancja dla u niezależnych rzutów wynosi ^ r t. Wariancja
oznacza,
że odchylenie standardowe wynosi tylko
Tak więc nierówność Czebyszewa mówi, że całkowita suma będzie leżała po­
między
7n-lO y^n
i
7n+10y^fn
w co najmniej 99% spośród wszystkich doświadczeń rzucania n kośćmi. Na
przykład mamy szansę większą niż 99 do 1, że suma wyrzuconych oczek w
milionie rzutów parą kości będzie między 6,975 miliona a 7,025 miliona.
W ogólności, niech X będzie dowolną zmienną losową nad przestrze­
nią losową £1 , mającą skończoną wartość średnią \i i skończone odchylenie
standardowe cr. Rozważmy przestrzeń losową £ln , w której zdarzeniami ele­
mentarnymi są ciągi (o>i, cu2 >• • ., <^n) takie, że tuk E O, i które spełniają
Pr(a>i,cju2 ,...>cjun ) = Pr(cui) Pr(cu2) .. .Pr(cun ) .
Jeśli zdefiniujemy teraz zmienną losową X]C, jako
Xk(tUi , a>2, . • • , CDn ) = X(cuk),
to wyrażenie
Xi + X2 + • • • + XTL
(To znaczy,
że średnia wpadnie
do pokazanego
przedziału
w co najmniej 99%
wszystkich
przypadków, gdy
będziemy patrzyli
na n niezależnych
eksperymentów, dla
dowolnej ustalonej
wartości n. Nie
należy tego pomylić
ze stwierdzeniem
tego o średnich
nieskończonego
ciągu
X1 ,X 2 ,X 3, . . .
dla zmieniających
się wartości n.)
oznacza sumę rt niezależnych losowych, które odpowiadają wzięciu rt nieza­
leżnych „próbek” z X nad O i dodaniu ich. Wartość średnia X-| + X 2 H------bXn
wynosi n \i i odchylenie standardowe wynosi y/n cr. Tak więc średnia spośród
rt próbek
—(Xi + X2 H------- 1- Xn ) ,
będzie leżała pomiędzy \ i — 10a/^/n a \l + 1Ocr/y/n w co najmniej 9 9 % przy­
padków. Innymi słowy, jeśli weźmiemy wystarczająco duże n, to wartość
średnia w n niezależnych próbach będzie prawie zawsze leżała bardzo bli­
sko wartości średniej EX. Dowód silniejszego twierdzenia, zwanego silnym
prawem wielkich liczb można znaleźć w podręcznikach do rachunku praw­
dopodobieństwa, jednakże właśnie wyprowadzona konsekwencja nierówności
Czebyszewa jest wystarczająca dla naszych celów.
Czasami nie znamy parametrów przestrzeni losowej, a mimo to chcieliby­
śmy oszacować wartość oczekiwaną zmiennej losowej X poprzez wielokrotne
testowanie wartości X. Na przykład chcielibyśmy znać średnią temperaturę
w południe, w styczniowy dzień w San Francisco, lub też oczekiwaną długość
życia agenta ubezpieczeniowego. ,Gdy znamy empirycznie uzyskane nieza­
leżne obserwacje Xi, X2 ,
Xn , możemy zgadnąć, że prawdziwa wartość
oczekiwana równa jest w przybliżeniu
EX = X 1 + X 2 + - - - + X n
(}
n
Możemy również oszacować wariancję za pomocą wzoru
=
X j + X j + .. . + x ^ _ ( x , + x J + ..| -t- x , ln —1
n { n — 1)
n - 1 w tym wyrażeniu wygląda jak błąd typograficzny i wydaje się, że po­
winno być zastąpione przez n, podobnie jak w ( 8 . 1 9 ), ponieważ rzeczywista
wariancja VX jest zdefiniowana przez wartości średnie z (8 . 1 5 ). Tutaj otrzy­
mamy jednak lepsze oszacowanie z n — 1 niż z n, ponieważdefinicja ( 8 .2 0 )
pociąga za sobą
E(VX) = V X .
(8.21)
Wynika to z poniższego wyprowadzenia:
e^x) =
1f~ i > x*)
k= 1
j = l k=l
k= 1
= ^
t (
Ż
j=l k = 1
E(x 2 ) -
i Z . L ( t ( X ) 2[ j ^ k ] + E(X2) [ j = k ] ) )
k= 1
j = 1 k= 1
= ^ - j ( n E ( X 2) - ^ ( n E ( X 2) + n ( n - 1)E(X)2) )
= E(X2) - E ( X ) 2 = v x .
W powyższych operacjach niezależność obserwacji wykorzystujemy w mo­
mencie, gdy zastępujemy E ( X j X i < ) przez (EX)2[j ^ k ] + E ( X 2 ) [j = k ].
W praktyce eksperymentalne wyniki o zmiennej losowej X są z reguły
uzyskiwane przez obliczenie wartości średniej z próbki p, = EX, odchylenia
standardowego z próbki & = V v X , i przedstawienia wyniku w postaci ‘ ft ±
cr/y/n \ Przypuśćmy, że wykonaliśmy dziesięć rzutów parą kostek uważanych
za wyważone:
0
0
0
0
0
0
0
0
0
0
H 0
O 0
H O
0
H 0
0
Wartość średnia próbki dla sumy wyrzuconych oczek S wynosi
ft = ( 7 + n + 8 + 5 + 4 + 6 + 10 + 8 + 8 + 7)/10 = 7,4;
a wariancja próbki
(72 + 112 + 8 2 + 5 2 + 4 2 + 6 2 + 102 + 8 2 + 8 2 + 72 - 10(l2)/9 » 2,12 .
Opierając się więc na przeprowadzonym eksperymencie, możemy oszacować
średnią wyrzucanych oczek jako 7,4 ± 2,1 /y/TÓ « 7,4 =b 0,7.
Podamy jeszcze jeden przykład na wartość średnią i wariancję, aby po­
kazać, że można je obliczyć teoretycznie, a nie tylko uzyskać empirycznie.
Jednym z problemów rozważanych w rozdziale 5 był problem podrzucanych
kapeluszy, w którym n kapeluszy jest rzucanych w powietrze i wynikiem jest
losowa permutacja kapeluszy. Pokazaliśmy w równaniu ( 5 .5 1 ), że z prawdo­
podobieństwem n j/n! « 1 / e nikt nie odzyska swojego własnego kapelusza.
Wyprowadziliśmy również wyrażenie
( 8 .2 2 )
na prawdopodobieństwo, że dokładnie k osób odzyska z powrotem swoje
kapelusze.
Wyrażając te wyniki w formalizmie, który właśnie poznaliśmy, rozważmy
przestrzeń losową TT^ wszystkich n! permutacji n liczb {1 , 2 , . . . , n}, gdzie
Pr(7r) = 1/u ! dla wszystkich n e TT^. Zmienna losowa
Nie należy jej mylić
z liczbami
Fibonacciego.
Fu (tt) = liczba „stałych punktów” w tt,
dla n E TTn ,
wyznacza liczbę poprawnie spadających kapeluszy. Równanie ( 8 .2 2 ) daje
wzór na Pr(Fn = k ), ale przypuśćmy, że nie znamy takiego wzoru. Jedyne co
chcemy zbadać, to wartość średnią Fn i jej odchylenie standardowe.
W rzeczywistości poszukiwana wartość średnia jest bardzo łatwa do wyprowadzenia, bez skomplikowanych obliczeń z rozdziału 5. Po prostu za­
uważmy, że
Fn (7t) = Fn j ( 7t ) + F u ^ ( 7t) + --- + Flv łl(7i:)ł
Fn,ic(7t) = [pozycja k jest punktem stałym w 7t],
dla n E T\n .
Zatem
Wartość oczekiwana FU)ic jest więc prawdopodobieństwem tego, że F ^ = 1,
co jest równe 1 /n , ponieważ dokładnie (n — 1 )! spośród rt! permutacji n =
8-3. Funkcje tworzące prawdopodobieństwa
7ti 7t2 ... 7tn G TTn. spełnia
= k. Stąd
EFn = n / n = 1 ,
dla n > 0.
(8-23)
Tak więc średnio jeden kapelusz będzie na swojej pozycji początkowej. „Lo­
sowa permutacja ma średnio jeden punkt stały.”
Jak się ma sprawa z odchyleniem standardowym? To pytanie jest bar­
dziej skomplikowane, ponieważ Fn)ic nie są jednak od siebie niezależne. Mo­
żemy jednak obliczyć wariancję przez zbadanie wzajemnych zależności mię­
dzy nimi:
Tl
2\
Tt
Tt
Z Fn > 0 ) = e ( £ X F- . i F-.k )
a
k=l
n
j = 1 k= 1
n
= X. Z
E(Fn.j Fn,k) =
j = 1 k=l
Z
1
^k^n
E(Fn,k)+2
Z
1
E(Fn,j En,>c) -
^ j< k ^ n
(Używaliśmy już podobnej metody, gdy wyprowadzaliśmy wzór ( 2 .3 3 ) w roz­
dziale 2 .) Ponieważ F ^ jest równe 0 lub 1, więc otrzymamy F2 k = Fn>ic
i stąd E(F2 k) = E F ^ = 1/n , tak jak poprzednio. Teraz jeśli j < k, to
otrzymujemy EfF^j F ^ ) = Pr(j i k są punktami stałymi tt) = (n —2)1/n l =
1/n ( n — 1). Stąd
n
n
tlF" > - s
+ u ;
n ( „ - l )
= 2,
( 8 .2 4 )
(Dla sprawdzenia weźmy n = 3; otrzymamy | 0 2 + | l 2 + | 2 2 + ^3 2 = 2.))
Wariancja wynosi E(F2 ) —(EF^ ) 2 = 1, tak więc odchylenie standardowe (tak
samo jak i wartość średnia) wynosi 1 . „Losowa permutacja n ^ 2 elementów
ma 1 ± 1 stałych punktów.”
8.3. Funkcje tw orzące p raw dop od obieństw a
Gdy X jest zmienną losową, która przybiera tylko nieujemne wartości cał­
kowite, możemy dobrze opisać jej rozkład losowy, korzystając z technik z
rozdziału 7. Funkcją tworzącą prawdopodobieństwa lub inaczej ftp zmien­
nej losowej X jest
Gx (z) = ^ P r ( X = k )z k .
k^O
(8 -2 5 )
Ten szereg potęgowy zmiennej z zawiera całą informację o zmiennej losowej
Który jest ten
średni kapelusz?
j 8 . P ra w d op o d o b ieństw o
dysk retn e
438
X. Możemy go wyrazić również na dwa inne sposoby:
Gx (z) =
Y _ Pr(o>)zx(tu) = E(zx ) .
( 8 .2 6 )
cu g o
Współczynniki Gx(z) są nieujemne i sumują się do 1. Ten drugi warunek
można zapisać następująco:
Gx (1) = 1
(8 .2 7 )
Na odwrót, dowolny szereg potęgowy G(z) z nieujemnymi współczynnikami
spełniający równanie G (l) = 1 jest ftp pewnej zmiennej losowej.
Najważniejszą cechą ftp jest to, że zwykle upraszcza ona obliczenia war­
tości średniej i wariancji. Na przykład wartość średnią można łatwo wyrazić
jako:
EX = J]_k-Pr(X = k)
k^O
=
Pr(X = k) •kz k _1 Z = 1
k$sO
=
( 8 .2 8 )
6 ^ ( 1 ).
Po prostu różniczkujemy ftp względem z i przyjmujemy z = 1.
Wariancja jest tylko trochę bardziej skomplikowana:
E(X2) =
k 2 -Pr(X = k)
k^O
= ^ P r ( X = k ) - ( k ( k - 1 ) z k - 2 + kzk- l ) | z=l = G J|(1) + G i(1 ).
k^O
Zatem
VX = G£(1) + G i ( 1 ) - G i 0 ) 2 .
[„Mean” oznacza
po angielsku
wartość średnią, a
„Var” jest skrótem
od „variance” co
oznacza wariancję.]
(8 .2 9 )
Równania ( 8 .2 8 ) i ( 8 .2 9 ) mówią nam, że możemy obliczyć wartość średnią
i wariancję, jeśli potrafimy obliczyć wartości dwóch pierwszych pochodnych
Gx(1) i Gx(1). Nie musimy więc znać wyrażeń w zwartej postaci dla praw­
dopodobieństw, nie musimy znać nawet zwartej postaci dla samego Gx(z).
Dla wygody zdefiniujemy
Mean(G) = G '(1),
Var(G) = G"(1) + G'(1) — G'(1 ) 2 ,
(8-30)
(8 -3 1 )
gdzie G jest dowolną funkcją, ponieważ będziemy często chcieli obliczać kom­
binacje tych pochodnych.
Drugą miłą cechą ftp jest to, że w wielu ważnych przypadkach jest ona
względnie prostą funkcją zmiennej z. Na przykład spójrzmy na rozkład je d ­
n ostajny rzędu tl, w którym zmienna losowa przybiera każdą z wartości
{ 0 ,1 ,... ,n — 1} z tym samym prawdopodobieństwem 1/n. W takim przy­
padku ftp wynosi
Un (z) = —(1 + z H-------h z 71 ') =
rt
u I
,
d la r t^ l.
(8 .3 2 )
Mamy więc zwartą postać dla Un (z), ponieważ jest to szereg geometryczny.
Ta zwarta postać prowadzi do czegoś, co jednak wprawia nas w zakłopota­
nie: Gdy podstawimy z = 1 (wartość z, która jest newralgiczna dla ftp), wów­
czas otrzymamy niezdefiniowany ułamek 0 / 0 , mimo że Un (z) jest wielomia­
nem, który jest dobrze zdefiniowany dla każdej wartości z. Wartość 11^(1) = 1
jest oczywista, jeśli spojrzymy na rozwiniętą postać (1 + z + -----b z n _ 1 )/u .
Tak więc wydaje się, że jeśli chcemy wyznaczyć Un (1) ze zwartej postaci, to
musimy skorzystać z reguły de THospitala do obliczenia limz_>.i Un (z). Wy­
znaczenie U^(1) ze wzoru de 1’Hospitala wydaje się trudniejsze, ponieważ w
mianowniku będziemy mieli wyrażenie (z — I)2. Jeszcze trudniejsze będzie
wyznaczenie U"(1).
Szczęśliwie istnieje sposób na ominięcie tej trudności. Jeśli szereg G(z) =
£ n > 0 gnZn jest jakimkolwiek szeregiem potęgowym, który jest zbieżny dla
co najmniej jednej wartości z, gdzie \z\ > 1 , to szereg potęgowy G'(z) =
Y . n > o TL9 n ^ TL_1 będzie również miał tę własność, tak jak i G"(z), G"'(z) itd.
Korzystając z twierdzenia Taylora, możemy więc napisać
G 0+tt.
Sm + ^
t + ^
+ ^
( 8 .33 ,
+ ...
wszystkie pochodne G(z) w z = 1 wystąpią jako współczynniki w rozwinięciu
funkcji G (1 + t ) względem zmiennej t.
Na przykład można w ten sposób łatwo znaleźć pochodne ftp Un (z):
u „ o + l) = nI < l It t !
t n -1
Porównując to z rozwinięciem ( 8 .3 3 ), otrzymujemy
i M U = i;
u ;( i) =
^ 1; u ”(i) = (n ~ 1Hn ~ 2) .
(8.34)
i w ogólności, U ^ O ) = (rt — 1 )—/ ( m + 1 ), chociaż potrzebujemy tego wy­
rażenia do obliczenia wartości średniej i wariancji tylko dla wartości m = 1 i
m = 2. Wartość średnia w rozkładzie jednostajnym wynosi
(s-35)
a wariancja
12
n2-1
12
(8-36)
Kolejną miłą cechą ftp jest to, że iloczyn ftp odpowiada sumie niezależ­
nych zmiennych losowych. W rozdziałach 5 i 7 nauczyliśmy się, że iloczyn
funkcji tworzących odpowiada splotowi szeregów. Jednakże w zastosowaniach
ważniejsze jest, żeby wiedzieć, że splot prawdopodobieństw odpowiada su­
mie niezależnych zmiennych losowych. Zauważmy bowiem, że jeśli X i Y są
zmiennymi losowymi przybierającymi tylko wartości całkowite, to prawdo­
podobieństwo tego, że X + Y = n, wynosi
Pr(X + Y = n) =
Pr(X = k i Y = n —k ) .
k
Jeśli X i Y są niezależne, to otrzymujemy
Pr(X + Y = n) = ]T P r{X = k) Pr(Y = n —k ),
k
czyli splot. Dlatego— i to jest właśnie kluczowy moment —
G x + y ( z )
= Gx (z)G y (z),
gdy X i Y są niezależne.
( 8 -3 7 )
Zauważyliśmy wcześniej w tym rozdziale, że V(X + Y) = VX + VY, gdy X i
Y są niezależne. Niech F(z) i G(z) będą ftp dla X i Y i niech H(z) będzie ftp
dla X + Y. Wówczas
H(z) = F(z)G(z)
i nasze wzory ( 8 .2 8 ) aż do (8 .3 1 ) na wartość średnią i wariancję dają nam
Mean(H) = Mean(F) + M ean(G);
(8 .3 8 )
Var(H) = Var(F)+Var(G ).
(8-39)
Te wzory, które są własnościami pochodnych Mean(H) = H '(1) i Var(H) =
H"(1) + H '(l) — H'(1 )2, nie są prawdziwe dla iloczynu dowolnych funkcji
H(z) = F (z )G (z ). Mamy bowiem
H'(z) = F'(z)G(z) + F (z)G '(z),
H"(z) = F"(z)G(z) + 2F '(z)G '(z) + F(z)G "(z).
Ale przy podstawieniu z = 1 możemy zobaczyć, że zależności (8 .3 8 ) i ( 8 .3 9 )
będą zawsze prawdziwe, jeśli
F(1) = G(1) = 1
( 8 .4 0 )
i jeśli istnieją odpowiedne pochodne. Aby wzory te zachodziły, „prawdopodo­
bieństwa” niekoniecznie muszą być w przedziale [0 .. 1]. Zauważmy również,
że aby ten warunek był spełniony, możemy znormalizować funkcje F(z) i
G(z) przez podzielenie ich odpowiednio przez F(1) i G(1), jeśli F(1) i G(1) są
niezerowe.
Wartość średnia i wariancja nie są wszystkim, czym można się zajmo­
wać. Są one jedynie dwiema z nieskończonej rodziny tak zwanych staty­
styk półniezm ienników , które wprowadził duński astronom Thorvald Nicolai
Thiele [352] w 1903 r. Pierwsze dwa półniezmienniki ki i k2 zmiennej losowej
są tym, co my nazywamy wartością średnią i wariancją. Znane są również
półniezmienniki wyższego rzędu, które opisują bardziej subtelne własności
rozkładu. Ogólny wzór
( 8 .4 1 )
definiuje półniezmienniki wszystkich rzędów, gdzie G(z) jest ftp zmiennej
losowej.
Przyjrzyjmy się bliżej tak zdefiniowanym półniezmiennikom. Jeżeli G (z)
jest ftp dla X, to
k^O
m!
k.m^O
gdzie
(8-43)
k^O
[xm nazywane jest „m-tym momentem” X. Po obliczeniu potęg przy podsta­
wie e obydwu stron równania ( 8 .4 1 ), otrzymamy inny wzór na Gfe*):
Gfe*) = 1 +
( K l t + j K 2 t 2 H-------)
ii
( K l t + j K 2 t 2 H-------- ) 2
+
1 + K-\ t + \ { k 2 + K2 ) t 2 H-------.
2!
+ '
8 . P r a w d o p o d o b ie ń s tw o d y s k r e tn e
Po przyrównaim współczynników przy jednakowych potęgach t, otrzymamy
wzory
ki
=
m ,
(8.4 4)
k2 =
\^z
K3
=
M-3 - 3 |X i|L 1 2 + 1 \ Ą
vĄ»
k4
=
H 4 - 4 m *13 + 1 2 ^ 2 - 3 ^ 2 - 6 ^ 1 ,
K5
=
M-s — 5 | i i M-4 + 2 0 * i f (j-3 — 1 0 |a 2 |i3
(8. 45 )
,
'
+ 3 0 ;x i \ Ą -
„For these higher
half-invariants we
shall propose no
special names.”
T. N. Thiele [352]
GOyĄ m-2 +
( 8 .4 6 )
(8.4 7)
24(xf ,
( 8 .4 8 )
wyrażające półniezmienniki za pomocą momentów. Zauważmy, że k2 jest rze­
czywiście wariancją, równą E(X2) — (EX)2, tak jak poprzednio twierdziliśmy.
Z równania (8 .4 1 ) wynika oczywiście to, że półniezmiennik zdefiniowany
za pomocą iloczynu F(z)G(z) dwóch ftp będzie sumą odpowiednich półniezmienników z F(z) i G(z), ponieważ logarytmy z iloczynów są sumami.
Dlatego wszystkie półniezmienniki sumy niezależnych zmiennych losowych
są addytywne, tak samo jak wartość średnia i wariancja. Ta własność czyni
półniezmienniki czymś ważniejszym niż momenty.
Jeśli przyjmiemy inne podejście, pisząc
G(1+t) = 1 + ^ - t + ^ t 2 + a 3 *3
2!
3!
to równanie ( 8 .3 3 ) powie nam, że wszystkie alfy są „momentami ubywają­
cymi”
a m = G<m>(1)
=
Pr(X = k)k—zk-m 1lz—1
k^O
=
k—Pr(X = k)
kJtO
= E(X-2Ł).
(8.49)
To pociąga za sobą, że
G(et )< -
1+
ai_
1!
=
1 +
ai_
1!
—
1 + OC] t +
2!
) + f ( t 2 + t3 +
J ( OC2 + OC1 ) t 2 + •
)+
i że możemy wyrazić półniezmienniki za pomocą pochodnych G ^ f l ) :
ki
= <xi ,
(8.50)
k2
= a 2 + ai - a f ,
(8.51)
K3 = 0C3 + 3a 2 + ai —3a 2ai —
+ 2a f ,
(8.52)
Ten ciąg wyrażeń daje „addytywność” wzorów, co rozszerza równania (8.38)
i (8.39) na wszystkie półniezmienniki.
Wróćmy teraz na ziemię i zastosujmy te pomysły do prostego przykładu.
Najprostszym przypadkiem zmiennej losowej jest „losowa stała,” gdzie X
przybiera pewną ustaloną wartość x z prawdopodobieństwem 1. W tym przy­
padku Gx(z) = zx i ln G x (et ) = xt. Tak więc wartość oczekiwana wynosi x
i wszystkie inne półniezmienniki są równe zeru. Z tego wynika, że operacja
mnożenia ftp przez zx zwiększa wartość średnią o x, a wariancję i wszystkie
inne półniezmienniki zostawia nie zmienione.
Co się dzieje, gdy funkcje tworzące zastosujemy do problemu rzucania
kośćmi? Rozkład oczek na jednej (wyważonej) kości ma ftp postaci
nl
^
Z + Z2 + Z 3 + Z 4 + Z 5 + Z 6
G(z) = ----------------- ------------------ = zU6(z),
gdzie Ug jest ftp dla rozkładu jednostajnego 6-tego rzędu. Współczynnik ‘z’
dodaje 1 do wartości średniej, tak że wynosi ona 3,5 a nie
= 2 ,5, jak jest
w (8.35). Ale to extra ‘z ’ nie wpływa na wariancję (8.36), która wynosi f | .
Ftp dla sumy oczek w dwóch niezależnych rzutach jest kwadratem ftp
dla oczek na jednej kości,
z2 + 2z3 + 3z4 + 4z5 + 5z6 + 6z7 + 5z8 + 4z9 + 3 Z 10 + 2 Z 1 1 + z 12
= ------------------------------------------36-----------------------------------------=
z2U 6(z)2 .
Jeśli rzucamy parą wyważonych kości rt razy, to prawdopodobieństwo tego,
że otrzymamy w sumie k oczek, wynosi
[zk]Gs (z)n = [z*]z2nU 6(z)2n
= [zk- 2n]Us(z)2n.
W rozważanym wcześniej problemie podrzucanych kapeluszy, znanym
również jako problem zliczania punktów stałych losowej permutacji, wiemy
z ( 5 .4 9 ), że ftp wynosi
F- (z) =
L
O^k^n
ii
( n - k ) ! k!
dlan^O .
(8 .53 )
Dlatego
(n —Tc) i
p;(z) =
=
z k_1
Y.
( n - 1 - k ) i zk
(n —1 —k)!
k!
0^k^n-1 v
J
y
= F n -l(z ).
Bez dokładnej znajomości współczynników możemy z tej zależności otrzymać
rekurencję F^(z) = Fn_i (z), tak że Fnm)(z) = Fn_ m(z). Stąd otrzymujemy
F^>(1) = Fn_m(1) = [n ^ m ],
(8 .54 )
Wzór ten bardzo ułatwia obliczanie wartości średniej i wariancji. Podobnie
jak poprzednio (ale szybciej), możemy stwierdzić, że są one równe 1 , gdy
n ^ 2.
Tak naprawdę można nawet pokazać, że m-ty półniezmiennik K m dla tej
zmiennej losowej wynosi 1 dla każdego n ^ m. Dzieje się tak, ponieważ m-ty
półniezmiennik zależy tylko od F^(1), F"(1), . . . , F^m) (1), a one wszystkie są
równe 1. Otrzymujemy więc taką samą wartość na m-ty półniezmiennik, jak
gdybyśmy zamienili Fn (z) przez granicę ftp
-
F oo(z) =
e z_1 ,
(8 .5 5 )
która ma F ^ 1(1) = 1 dla pochodnych, wszystkich rzędów. Wszystkie polniezmienniki Foo są tożsamościowo równe 1 , ponieważ
lnFocfe*) = lnee*_1 = e t - 1 = ^ + ^ + ||- + ---.
8.4. R zu can ie m o n etą__________________________
Zajmiemy się teraz procesem, który ma tylko dwa wyniki. Gdy rzucamy mo­
netą, wówczas prawdopodobieństwo, że wypadnie orzeł, wynosi p, a prawdo­
podobieństwo wypadnięcia reszki wynosi q, gdzie
p + q =
1
(Zakładamy tutaj że moneta nie stanie na kancie lub nie zginie nam nagle ze
stołu itd.) W tym rozdziale liczby p i q będą się zawsze sumowały do 1. Jeśli
moneta jest w yw ażona, to mamy p = q = \ \ w przeciwnym razie moneta
jest niew y ważona.
Funkcją tworzącą prawdopodobieństwa dla liczby orłów w jednym rzucie
monetą jest
H(z) = q + pz
( 8 .5 6 )
Kiedy rzucamy monetą n razy, zawsze zakładając, że każdy rzut wykonany
jest niezależnie, wtedy liczba orłów jest generowana przez
H(z)n = (q + p z )n = Y .
n ' PV - kzk
(8.57)
k^O
zgodnie ze wzorem dwumianowym Newtona. Tak więc szansa wyrzucenia
dokładnie k orłów w n rzutach wynosi (£)p kqn_lc. Ten ciąg prawdopodo­
bieństw dla k = 0 , 1 , . . . ,rt nazywa się rozkładem dwumianowym.
Przypuśćmy, że rzucamy monetą, dopóki nie wyrzucimy pierwszego orła.
Jakie jest prawdopodobieństwo, że będziemy potrzebowali dokładnie k rzu­
tów? Mamy k = 1 z prawdopodobieństwem p (ponieważ takie jest prawdopo­
dobieństwo orła w pierwszym rzucie), mamy k = 2 z prawdopodobieństwem
qp (ponieważ takie jest prawdopodobieństwo, że w pierwszym rzucie będzie
reszka, a w drugim orzeł) i dla dowolnego k to prawdopodobieństwo wynosi
qk - 1p. Tak więc funkcją tworzącą jest
pz
pz + qpz 2 + q2 pz 3 +
( 8 .5 8 )
1 — qz
Powtarzając ten proces, dopóki nie wyrzucimy n orłów, otrzymujemy ftp
pz
1 — qz
H
( n + ,k - 1
)(<!*)*
(8.59)
Tak się składa, że jest to zn razy
P
1 — qz
= n ( n + ,k _ 1 ) p V z k
( 8 .6 0 )
funkcja tworząca dla ujemnego rozkładu dwumianowego.
Przestrzeń losowa w przykładzie ( 8 .5 9 ), gdzie rzucamy monetą dopóty,
dopóki nie wypadnie n orłów, różni się od przestrzeni losowych, które widzie­
liśmy wcześniej w tym rozdziale, ponieważ zawiera ona nieskończoną liczbę
Zawodowiec wie,
że p « 0 ,1 ,
gdy rzucisz świeżo
wybitą amerykańską
jednocentówką
(rozkład ciężaru
powoduje,
że Lincoln wypada
na dół.)
Orzeł ja wygrywam,
reszka ty
przegrywasz.
Nie? OK; reszka ty
przegrywasz, orzeł
ja wygrywam.
Nie? Dobrze,
to orzeł ty
przegrywasz,
a reszka ja
wygrywam.
elementów. Każdy element jest skończonym ciągiem orłów i reszek zawiera­
jącym w sumie dokładnie rt orłów i kończącym się orłem. Prawdopodobień­
stwo wystąpienia takiego ciągu jest równe p TLqk_n, gdzie k — n jest liczbą
reszek. Tak więc na przykład, jeśli będziemy oznaczać orły przez 0 i reszki
przez R, to dla n = 3 ciąg R0RRR00 jest elementem przestrzeni losowej i jego
prawdopodobieństwo wynosi qpqqqpp = p 3 q4.
Niech X będzie zmienną losową z rozkładem dwumianowym ( 8 .5 7 ) i niech
Y będzie zmienną losową z ujemnym rozkładem dwumianowym ( 8 .6 0 ). Oby­
dwa rozkłady zależą od rt i p. Wartością średnią X jest n H '(1) = np, ponie­
waż jego ftp jest H(z)n . Wariancja wynosi
n(H "(1) + H'(1) —H '(1)2) = n[0 + ip—ip2) = nipą.
( 8 .6 1 )
Tak więc odchylenie standardowe wynosi V n p q . Gdy rzucamy monetą n
razy, oczekujemy, że orzeł wypadnie około np ± y/n pą razy. Wartość średnia
i wariancja dla Y mogą być znalezione w podobny sposób: Jeśli
G(z) =
1 — qz ’
to mamy
G'(z) =
G"(z) =
pq
qz ) 2 ’
(1 -
2y ą 2
fl7i ^
(1 -— qz)
Stąd G '(l) = p q /p 2 = q/p i G"(1) = 2pq 2/ p 3 = 2q 2/ p 2. Dlatego wartość
średnia wynosi n q /p , a wariancją jest n q /p 2.
Prostszym sposobem wyprowadzenia wartości średniej i wariancji dla Y
jest użycie odwrotnej funkcji tworzącej
F(z) =
P
= --S .z
P
P
(8 .62 )
i zapisanie
G(z)n = F(z)“ n .
( 8 .6 3 )
Wielomian F(z) nie jest funkcją tworzącą prawdopodobieństwa, ponieważ ma
ujemne współczynniki. Jednakże spełnia on kluczowy warunek F(1) = 1. Tak
więc F(z) jest formalnie dwumianem odpowiadającym monecie, dla której
otrzymujemy orła z „prawdopodobieństwem” —q/p, a G(z) jest formalnie
równoważne rzucaniu monetą —1 razy(!). Ujemny rozkład dwumianowy z
parametrami (rt,p) może być więc traktowany jako zwykły rozkład dwu­
mianowy z parametrami (n ^ p ') = (—t l , —q/p ). Formalnie, wartość średnia
musi więc wynosić n /p ' = (—n )(—q/p) = rtq/p, a wariancją będzie n /p ^ '
= (—rt) (—q /p ) (1 + q/p) = rtq/p2. To formalne wyprowadzenie używające
ujemnych prawdopodobieństw jest poprawne, ponieważ wyprowadzenie dla
zwykłych dwumianów było oparte na tożsamościach dotyczących formalnych
szeregów potęgowych dla których założenie 0 ^ p ^ 1 nigdy nie było użyte.
Przejdźmy do następnego przykładu: Ile razy trzeba rzucić monetą, żeby
otrzymać dwa orły z rzędu? Przestrzeń losowa składa się teraz ze wszystkich
ciągów o elementach 0 i R, które kończą się 00 i nie mają pary 0 poza ostatnią
pozycją:
Cl = {00, R00, RR00,0R00, RRR00, R0R00, 0RR00,. . . } .
Prawdopodobieństwo dowolnego ciągu można uzyskać zastępując 0 przez p i
R przez q. Na przykład ciąg R0R00 wystąpi z prawdopodobieństwem
Pr(ROROO) = qpqpp = p 3q2 .
Możemy teraz zbadać funkcje tworzące, tak jak to robiliśmy na początku
rozdziału 7. Niech S będzie sumą nieskończoną
S = 00 + R00 + RR00 + 0R00 + RRR00 + R0R00 + 0RR00 + • • •
0 elementach z Cl. Jeśli zamienimy każde 0 przez pz i każde R przez qz, to
otrzymamy funkcję tworzącą dla rozkładu prawdopodobieństwa liczby rzutów
potrzebnych, żeby wyrzucić dwa orły z rzędu.
Zachodzi ciekawa relacja pomiędzy S i liczbą ułożeń kamieni domina:
T = H-D + ra + B + HD+ E + a H --- w równaniu ( 7 . 1 ). Zauważmy, że możemy otrzymać S z T, jeśli zastąpimy
każde □ przez R i każde B przez 0R i na końcu dodamy 0 0 . Ta odpowiedniość jest łatwa do udowodnienia, ponieważ każdy element z Cl jest postaci
(R + ORj^OO dla pewnego rt ^ 0 i każdy element z T ma postać (l]-bB)n . Tak
więc z równania ( 7 .4 ) wynika, że
s =
(1 — R — 0R)~' 00
1 funkcją tworzącą prawdopodobieństwa w naszym problemie jest
G(z) =
( 1 - q z - ( p z ) ( q z ) ) _ , (pz)2
1— qz — pqz2 ’
(8.64)
Z ujemnym prawdo­
podobieństwem
staję się coraz
młodszy.
Och! Tak więc z
prawdopodobień­
stwem > 1
starzejesz się łub
zostajesz w tym
samym wieku.
8 .Prawdopodobieństwo dyskretne
Doświadczenie z ujemnym rozkładem dwumianowym podpowiada nam,
że wartość średnią i wariancję (8.64) możemy najłatwiej obliczyć, definiując
G(z) = 7^ ,
F(z)
gdzie
1 —qz —pqz^
Hz) =
a potem wyznaczając „wartość średnią” i „wariancję” dla tej pseudo-ftp F(z).
(Podobnie jak poprzednio, zachodzi F(1) = 1.) Otrzymujemy
H i) =
F"(1) =
( - q - 2 p q )/p 2 =
2 —p - 1 —p - 2 ;
—2 p q /p 2 = 2 —2p _1 .
Ponieważ z 2= F(z)G(z), Mean(z2) = 2 i Var(z2) = 0, więc otrzymujemy
wartość średnią i wariancję dla G(z)
Mean(G) = 2 —Mean(F) = p -2
Var(G) = —Var(F)
-1 .
= p “ 4 + 2 p'
(8.65)
2p
2 —P
1
(8.66)
Dla V — \ wartość średnia i wariancja wynoszą odpowiednio 6 i 22. (Ćwicze­
nie 4 omawia obliczanie wartości średniej i wariancji za pomocą odejmowa­
nia.)
Zajmijmy się teraz bardziej skomplikowanym doświadczeniem: Rzucamy
monetą, dopóki nie wypadnie po raz pierwszy wzorzec R0RR0. Układy wy­
grywające są teraz następujące:
S = R0RR0 + 0R0RR0 + RR0RR0
+ 00R 0R R 0 + 0RR0RR0 + R0R0RR0 + RRR0RR0 H-------;
„ ‘You really aie an
autom aton — a
calculating
machinę, ’ I cried.
‘There is something
p o sitively inhuman
in you at times
J.H .W atson [84]
Ta suma jest trudniejsza do opisania niż poprzednia. Jeśli zastosujemy me­
todę, z której korzystaliśmy rozwiązując problem domina w rozdziale 7, to
możemy otrzymać wzór na S, gdy będziemy patrzyli na to jak na „język
stanów skończonych” zdefiniowany przez następujący „automat”:
Zdarzeniami elementarnymi w tej przestrzeni losowej są ciągi składające się
z 0 i R, które prowadzą ze stanu 0 do stanu 5. Przypuśćmy że właśnie wy­
rzuciliśmy ROR; jesteśmy wówczas w stanie 3. Wyrzucenie reszki prowadzi do
stanu 4 , natomiast wyrzucenie orła w stanie 3 prowadziłoby do stanu 2 (a
nie do początkowego stanu 0, ponieważ po ostatnio wyrzuconym RO mogłoby
wystąpić RRO).
Używając tej terminologii, możemy zapisać
jako sumę wszystkich cią­
gów o elementach 0 i R, które prowadzą ze stanu 0 do stanu k. Tak więc
50 =
1 + So 0 + S2 0 ,
51 — So R
Si R -j- S4 R,
5 2 = Si 0 + S3 0 ,
s3 = s 2 r ,
s4 = s 3 r ,
S5 = S4 O.
Suma S w naszym przypadku jest równa S5 . Możemy ją otrzymać przez
rozwiązanie powyższych sześciu równań z sześcioma niewiadomymi So, Si,
. . . , S5 . Zastępując 0 przez pz i R przez qz otrzymujemy funkcje tworzące,
których współczynnikami przy zn w S^ są prawdopodobieństwa, że jesteśmy
w stanie k po u rzutach.
Podobnie, dowolny diagram przejść pomiędzy stanami, w którym przej­
ście ze stanu j do stanu k następuje z prawdopodobieństwem p j>lc, prowa­
dzi do zbioru równań liniowych, których rozwiązaniami są funkcje tworzące
prawdopodobieństwa, że dany stan zostanie osiągnięty po n krokach. Sys­
temy tego typu są nazywane procesam i Markowa, a teoria ich zachowań jest
ściśle związana z teorią równań liniowych.
Problem rzutów monetą może być jednak rozwiązany w znacznie prostszy
sposób, bez dość skomplikowanego podejścia, jakim jest użycie automatów
skończonych. Zamiast sześciu niewiadomych So, S 1 , . . . , S5 , możemy opisać
S za pomocą tylko dwóch niewiadomych. Cały pomysł polega na rozważaniu
pomocniczej sumy N = So + Si + S2 + S3 + Są wszystkich ciągów, które nie
zawierają wystąpienia danego wzorca RORRO:
N = 1 + 0 + R + 00 -(-••• + R0R0R -f- RORRR -f- • • • .
Mamy
1 + N ( 0 + R) = N + S ,
( 8 .6 7 )
ponieważ każdy składnik po lewej stronie albo kończy się na RORRO (i należy
do S), albo nie (i należy do N). I odwrotnie, każdy składnik po prawej stronie
jest albo pusty, albo należy do N 0 lub N R. Mamy także ważny dodatkowy
wzór
N RORRO = S + SRRO,
( 8 .6 8 )
ponieważ każdy składnik po lewej stronie staje się pewnym wyrazem z S albo
po ostatnim 0 , albo po przedostatnim 0 i ponieważ każdy składnik z prawej
strony należy też do lewej strony.
Teraz łatwo można uzyskać rozwiązanie tych dwóch równań. Z równo­
ści (8 .6 7 ) mamy N = (1 — S)(l — 0 —R) - 1 i stąd
(1 - S ) ( 1 - R - 0 ) - 1 RORRO = S(1+R R 0).
Tak jak poprzednio, otrzymujemy funkcję tworzącą G(z) na liczbę rzutów,
jeśli zastąpimy 0 przez pz i R przez qz. Ponieważ p + q = 1, więc wszystko
nam się upraszcza:
(1 — G(z)) p2q3z5
2 3
-i-------- r -i ----------- = G(z) (1 + p q z )
I —Z
i stąd rozwiązaniem jest
p2q3z5 + (1 + pq2z3)(1 — z) ’
(8-^9)
Zauważmy, że dla pq ^ 0 zachodzi G(1) = 1: w końcuotrzymamy wzorzec
RORRO, z prawdopodobieństwem 1, chyba że moneta jest tak oszukana, że
zawsze wypadnie orzeł lub zawsze wypadnie reszka.
Żeby otrzymać wartość średnią i wariancję dla rozkładu ( 8 ,6 9 ), odwróci­
my G(z), tak jak to już robiliśmy w poprzednim problemie, zapisując G(z) =
z 5/F(z), gdzie F jest następującym wielomianem:
F(z) = p2q3z5 + (1pt qPaq2z3)(1~ Z) •
(8.70)
Odpowiednie pochodne są następujące:
F'(1) = 5 — (1 + pq2) / p 2q3 ,
F "(1) = 20 — 6pq2/ p 2q3 .
Jeśli X jest zmienną losową opisującą liczbę rzutów, to
EX = Mean(G) = 5 —Mean(F) = p - 2 q- 3 + p _1 q _1 ;
VX = Var(G) = -Var(F)
( 8 .7 1 )
= - 2 5 + p - 2 q - 3 + 7p~' q - 1 + Mean(F) 2
= (EX)2 - 9p - 2q - 3 - 3p - ' q -' .
(8.72)
Dla V — \ wartość średnia i wariancja wynoszą odpowiednio 36 i 996.
Spróbujmy to uogólnić: Problem, który właśnie rozwiązaliśmy, był na tyle
„losowy,” że pokazuje, jak analizować sytuację, w której czekamy na pierwsze
wystąpienie dowolnego wzorca A orłów i reszek. Tak jak dotychczas, niech
S będzie sumą wszystkich zwycięskich ciągów o elementach 0 i R, i niech N
będzie sumą wszystkich ciągów, w których nie otrzymaliśmy jeszcze wzorca
A. Wzór ( 8 .6 7 ) pozostanie nie zmieniony, a wzór ( 8 .6 8 ) będzie wyglądał na­
stępująco:
NA = S ( H - A ( 1) [A(m- , ) = A (m_ 1)] + A (2 ) [A(m- 2 ) = A (m_ 2)]
+ . . . + A ( m - D [A( i ) = A ( l ) ] ) i
(8.73)
gdzie m oznacza długość A i gdzie A |k) i A(k] oznaczają odpowiednio k ostatnich i k pierwszych elementów z A. Na przykład jeśli A jest wzorcem RGRRO,
który właśnie analizowaliśmy, to otrzymamy
A (1) =
0 ,
A (2) = R0 ,
A (3) = RRO,
A (4) = 0RR0;
A(i) = R,
A( 2 ) — R0,
^(3) = ROR,
A( 4 ) = RORR.
Ponieważ pełna zgodność występuje tylko dla A ^ = A( 2 ), więc równanie
( 8 .7 3 ) redukuje się do ( 8 .6 8 ).
Niech A będzie wynikiem podstawienia p _1 za 0 i q _1 za R we wzorcu A.
Nietrudno jest wówczas uogólnić wyprowadzenie równań ( 8 .7 1 ) i (8 .7 2 ) tak,
aby wywnioskować (ćwiczenie 2 0 ), że wartość średnia i wariancja wynoszą
m
EX = ^ A ( k | [ A ® = A (ij];
(8 .7 4 )
k= 1
m
VX = (EX)2 - X ( 2 k - 1 ) A (k )[A<k> = A (1c)].
( 8 .7 5 )
k= 1
W szczególnym przypadku, gdy p = \ , możemy interpretować te wzory
w wyjątkowo prosty sposób. Dla danego wzorca A o m orłach i reszkach,
niech
m
A : A = ^ 2 M [A,k l= A |k)].
( 8 .7 6 )
k= 1
Łatwo możemy znaleźć rozwinięcie dwójkowe tej liczby. Stawiamy ‘V na da­
nej pozycji reprezentacji dwójkowej wtedy, gdy wzorzec przesunięty do tej
pozycji pokryje się z samym sobą aż do końca.
A =
0R 0 R 00R 0R 0
A :A = (1000010101)2 = 5 1 2 + 16 + 4 + 1 = 5 3 3
0R 0 R 0 0 R 0R 0
V
0R 0 R 0 0 R 0R 0
0R 0R 00R 0R 0
0R 0 R 0 0 R 0R 0
0 R 0R 00R 0R 0
0R 0 R 0 0 R 0R 0
>/
0R 0R 00R 0R 0
0R 0 R 0 0 R 0R 0
V
OROROORORO
OROROORORO
„ 1leM óojibwe
nepuodoe y
nam ezo cjioea,
meM no3Dtce oho
nosiejistemcft”.
A .J l. Cojioebee
Oczywiście . że nie!
Nad kim by m ie li
wykazać tę swoją
przewagę?
V
Wzór ( 8 .7 4 ) oznacza teraz, że oczekiwana liczba rzutów aż do wystąpienia
wzorca A wynosi dokładnie 2(A:A), przy założeniu, że używamy monety
wyważonej. Wynika to stąd, że A(k) = 2k, w przypadku gdy p = q =
Wynik ten, pokazany po raz pierwszy przez rosyjskiego matematyka A. D.
Sołowiewa w roku 1966 [332], wydaje się na pierwszy rzut oka paradoksalny:
Wzorce, które nie nakładają się na siebie, występują częściej, niż wzorce
nakładające się na siebie! Oczekiwanie na wyrzucenie 0 0 0 0 0 zajmuje prawie
dwa razy tyle czasu co oczekiwanie na wyrzucenie 0 0 0 0 R lub R 0 0 0 0 .
Zajmijmy się teraz zabawną grą wymyśloną w 1 9 6 9 r. przez Waltera Penneya [2 9 0 ]. Alice i Bill rzucają monetą tak długo, aż wypadnie 00R lub 0RR.
Alice wygrywa, gdy wzorzec 00R wypadnie jako pierwszy, natomiast Bill, gdy
jako pierwsze wypadnie 0RR. Ta gra— obecnie nazywana „grą Penneya” —
oczywiście wydaje się być fair (przy założeniu że rzuca się monetą wyważoną),
ponieważ traktowane oddzielnie obydwa wzorce 0 0 R i 0RR wyglądają bardzo
podobnie. Funkcja tworząca dla czasu oczekiwania na pierwsze wystąpienie
0 0 R wynosi
tak samo jak dla 0RR. Dlatego ani Alice, ani Bill nie mają żadnej przewagi,
gdy grają samotnie.
Zachodzi jednak ciekawe wzajemne oddziaływanie pomiędzy tymi wzor­
cami, gdy analizujemy obydwa równocześnie. Niech Sa będzie sumą wygra­
nych układów dla Alice i niech S b będzie sumą wygranych układów dla Billa:
SA = OOR + 000R + ROOR + 0000R + 0R00R + R000R + • • • ;
SB = ORR + RORR + ORORR + RRORR + RORORR + RRRORR + • • • .
Tak więc— korzystając z metody użytej do analizy tylko jednego wzorca—
oznaczmy przez N sumę ciągów takich, że żaden z graczy jeszcze nie wygrał:
N = 1 + 0 + R + 00 + OR + RO + RR + 000 + 0R0 + R00 + • • • .
( 8 .7 7 )
Teraz możemy łatwo sprawdzić następujące tożsamości:
1 + N ( 0 + R) = N + Sa + S b ;
N OOR = SA ;
(8 .7 8 )
NORR = Sa R + Sb .
Jeśli podstawimy tutaj 0 = R = j , to uzyskana wartość dla Sa będzie ozna­
czała prawdopodobieństwo wygrania przez Alice, natomiast w przypadku Sb
będzie oznaczała prawdopodobieństwo wygranej Billa. Te trzy równania re­
dukują się do
1 + N = N + Sa + S b ;
jN
= Sa ;
|N
= l S A + SB ;
i możemy stąd uzyskać Sa = f i S b =
Alice będzie wygrywała dwa razy
częściej niż Bill!
W uogólnieniu tej gry Alice i Bill wybierają wzorce A i B orłów i reszek,
a następnie rzucają monetą dopóty, dopóki nie wypadnie A albo B. Obydwa
wzorce nie muszą mieć tej samej długości, ale założymy, że ani A nie wy­
stępuje wewnątrz B, ćmi B nie występuje wewnątrz A (W przeciwnym razie
suma byłaby zdegenerowana. Na przykład dla A = 0 R i B = R0 R0 , biedny
Bill nie mógłby nigdy wygrać; dla A = 0 R0 i B = R0 obydwoje graczy mo­
głoby równocześnie stwierdzić zwycięstwo.). Wówczas, analogicznie do ( 8 .7 3 )
i ( 8 .7 8 ), możemy utworzyć trzy równania:
1 + N ( 0 + R) = N + Sa + S b ;
1
m in(l,m )
NA = SA ^ A (l- 1c )[A*'c> = A (k)] +
SB ^
k= 1
m in(l,m )
NB = SA Ż
k= 1
A (l_k) [B(k>= A (1c)] ;
k=l
m
[A<k> = B (k)] +
SB
B(m- k) [B(k) = B (Ic)] .
k= 1
(g-79)
Tutaj l jest długością wzorca A, a m jest długością wzorca B. Na przykład
gdy A = 0RR0R0R0 i B = R0R0RR0, otrzymujemy dwa równania niezależne od
wzorców:
N 0 RR0 R0 R0 = SA RR0 R0 R0 + SA + SB RR0R0R0 + SB RORO ;
N R0 R0 RR0 = SA RORRO + SA RR0 + S B RORRO + SB •
Prawdopodobieństwa sukcesów możemy uzyskać za pomocą podstawienia
0 = R = 1, przy założeniu, że używamy monet wyważonych. To daje spro­
wadzenie tych dwóch równań do
l
m i n ( l ,m )
N = S A ^ 2 k [A<k> = A (k)] + SB
k= 1
Y.
2k [B(k)= A (k)];
k= 1
(8 .8 0 )
m i n ( l ,m )
N = SA
Y
m
2k [A<k> = B ,k)] + S B ] “ 2k [B<k> = B (k)].
k= 1
k= 1
Możemy teraz zobaczyć, co się dzieje, gdy uogólnimy zdefiniowaną za pomocą
wzoru ( 8 .7 6 ) operację A:A do funkcji dwóch niezależnych ciągów A i B:
m i n ( l ,m )
A:B =
Y
2k-'[A < k’ = B ,k)].
( 8 .8 1 )
k=l
Równania ( 8 .8 0 ) uproszczą się:
S a (A:A) + S b (B:A) = Sa (A:B) + S b (B:B) ;
Szanse na korzyść Alice wynoszą
SA _ B:B — B:A
Ś 7 ~~ A:A - A:B '
( 8 .8 2 )
(Ten piękny wzór został odkryty przez Johna Hortona Conwaya [137].)
Na przykład gdy jak wyżej A = 0RR0R0R0 i B = R0R0RR0, otrzymujemy
A:A = (10000001)2 = 129, A:B = (0001010) 2 = 10, B:A = (0001001 ) 2 = 9 i
B:B = ( 1 0 0 0 0 1 0 ) 2 = 6 6 . Tak więc iloraz SA/ S B wynosi ( 6 6 —9 )/(1 2 9 — 1 0 ) =
57/119. Alice wygra w 176 grach średnio tylko 57 razy.
Dziwne rzeczy mogą się zdarzyć w grze Penneya. Na przykład wzorzec
00R0 wygrywa z wzorcem 0R00 w stosunku 3 /2 i wzorzec 0R00 wygrywa z
wzorcem R000 w 7/5 przypadkach. Tak więc 00R0 powinno być dużo lep­
sze niż R000. Jednakże R000 wygrywa z 00R0 w stosunku 7/5! Relacja lepszości pomiędzy wzorcami nie jest przechodnia. W rzeczywistości ćwicze­
nie 57 dowodzi, że jeśli Alice wybierze dowolny wzorzec Ti T2 . . . Ti długości
1 ^ 3 , ‘Bill może zawsze mieć większe szanse wygrania, gdy wybierze wzorzec
T2 TiT2 .. .T i_ i, gdzie T2 jest orłowo-reszkową odwrotnością T2 .
8.5. H aszow anie________________________________
Podsumujmy ten rozdział zastosowaniem rachunku prawdopodobieństwa w
programowaniu. Kilka ważnych algorytmów składowania i wyszukiwania in­
formacji wewnątrz komputera opiera się na technice zwanej „haszowaniem.”
Będziemy się teraz zastanawiali nad metodami przechowywania ciągu rekor­
dów zawierających „klucz” K i pewne dane D(K) o kluczu, tak żeby mając
dane K szybko wyszukać D(K). Na przykład każdy klucz może być nazwi­
skiem studenta, a związane z nim dane mogą być stopniami uzyskanymi z
zadań domowych.
W praktyce pamięć komputera nie ma wystarczającej pojemności, żeby
poświęcić jedną jej jednostkę na każdy możliwy klucz. Możliwe są miliar­
dy kluczy, ale w konkretnym zastosowaniu występuje stosunkowo niewielka
ich liczba. Jedną z możliwości jest przechowywanie dwóch tablic KEY [j] i
DATA [j] dla 1 ^ j ^ N, gdzie N jest maksymalną liczbą rekordów, które
mogą być jednocześnie zapamiętane. Inna zmienna n określa, ile kluczy jest
rzeczywiście przechowywanych. Wówczas możemy szukać danego klucza K
przez przejrzenie tablicy w oczywisty sposób:
51 Niech j := 1. (Szukaliśmy już po wszystkich pozycjach < j.)
52 Jeśli j > rt, to stop. (Nie ma danego klucza.)
53 Jeśli KEY[j] = K, to stop. (Znaleziono klucz.)
54 Zwiększ j o l i wróć do kroku S2 . (Próbujemy dalej.)
Po udanym przeszukaniu dane D(K), które chcieliśmy znaleźć, znajdują się
w DATA [j ]. Gdy nie znaleźliśmy danego klucza, wówczas możemy wstawić K
wraz z D(K) do tablicy przez przypisanie
rt := j,
KEY [tl] := K,
DATA [rt] := D(K),
przy założeniu, że jeszcze nie przekroczyliśmy pojemności pamięci.
Opisana metoda działa, jednakże może się zdarzyć, że będzie ona strasz­
nie powolna: przy każdym nieudanym przeszukiwaniu krok S2 musimy po­
wtórzyć rt + 1 razy, a rt może być dość duże.
Haszowanie zostało wprowadzone w celu przyspieszenia tego procesu.
Podstawowy pomysł, w jednej z popularnych postaci, opiera się na użyciu
m oddzielnych list, a nie jednej gigantycznej listy. „Funkcja haszująca” wy­
licza dla każdego możliwego klucza K numer listy H(K) pomiędzy 1 i m. W
pomocniczej tablicy element FIRST [ i ] , dla 1 ^ i ^ m, wskazuje na pierwszy
rekord listy i. Kolejna pomocnicza tablica NEXT[j], dla 1 ^ j ^ N, wskazuje
„Jakoś tak wyszło,
że co prawda
czasownik (to hash ’
( ‘haszować’) w
połowie la t 60-tych
sta ł się
standardowym
określeniem te j
m etody
przechowywania
kluczy, to n ik t nie
odważył się użyć go
publicznie przed
rokiem 1967.”
D. E. K n u th [209]
Prawdopodobieństwo dyskretne
na rekord następujący po rekordzie j na tej liście. Zakładamy, że
FIRST [i] = -1 ,
NEXT [j] = 0,
gdy lista i jest pusta;
gdy rekord j jest ostatni na liście.
Jak poprzednio, mamy zmienną n mówiącą, ile rekordów łącznie jest prze­
chowywanych.
Przypuśćmy na przykład, że w danym momencie klucze są imionami i że
mamy cztery listy odpowiadające pierwszym literom imion:
H(imię) =
1,
2,
3,
4,
dla A-F;
dla G-L;
dla M-R;
dla S-Z.
Zaczynamy z czterema pustymi listami i z n = 0. Jeśli, powiedzmy, pierwszy
rekord ma jako klucz imię Nora, to mamy H(Nora) = 3, tak więc Nora staje się
kluczem pierwszego elementu na liście 3. Jeśli dwoma następnymi imionami
są Glenn i Jim, to obydwa umieszczone zostaną na liście 2. Tablice w pamięci
wyglądają teraz następująco:
FIRST [1] == - 1 , FIRST [2] = 2, FIRST [3] = 1,
KEY[1] =
Nora, NEXT[1] = 0
KEY[2]
KEY[3]
Zobaczymy je tu na
pamiątkę siedzących
w pierwszych
rzędach studentów
M atem atyki
Konkretnej, k tó rz y
użyczyli swoich
im ion do tego
doświadczenia.
=
Glenn, NEXT[2]
=
Jim,
FIRST [4] = - 1 .
= 3
NEXT[3] = 0 ;
rt = 3.
(Wartości DATA[1], DATA[2] i DATA [3] są tajne i nie będziemy ich przedsta­
wiali.) Po wstawieniu 18 rekordów na listach mogłyby się znaleźć imiona
lista
1
Dianne
Ari
Brian
Fran
Doug
lista
2
Glenn
Jim
Jennifer
Joan
Jerry
Jean
lista
3
lista 4
Nora
Mike
Michael
Ray
Paula
Scott
Tina
i imiona te występowałyby wymieszane w tablicy KEY wraz ze wskaźnikami
NEXT. Gdybyśmy chcieli szukać Johna, musielibyśmy przejść przez sześć imion
z listy 2 (która okazuje się najdłuższą listą), ale jest to nieporównanie lepiej
niż przejrzenie wszystkich 18 imion.
Poniżej zamieszczamy precyzyjny specyfikację algorytmu, który wyszu­
kuje klucz K według tego schematu.
H I Podstaw i := h(K) i j := FIRST [ i ] .
H 2 J eśli) ^ 0 to stop. (Nie ma danego klucza.)
H 3 Jeśli KEY[j] = K to stop. (Znaleziono klucz.)
H 4 Podstaw i := j, potem podstaw j := NEXT[i] i wróć do kroku H2. (Pró­
bujemy dalej.)
Na przykład żeby w powyższym przykładzie wyszukać Jennifer, krok HI
ustawiłby i := 2 i j := 2, krok H3 stwierdziłby że Glenn ^ Jennifer; krok H4
ustawiłby j := 3 i krok H3 znalazłby Jim ^ Jennifer. Następna iteracja
kroków H4 i H3 zlokalizowałaby Jennifer w tablicy.
Po udanym wyszukiwaniu interesujące nas dane D(K) znajdują się w
DATA[j], tak jak w poprzednim algorytmie. Po nieudanym wyszukiwaniu
możemy wstawić K i D(K) do tablicy, wykonując następującą operację:
n := n + 1 ;
if j < 0 then FIRST [i] := n else NEXT [i] :=n;
KEY[n] := K;
DATA[n] := D(K);
NEXT[n] := 0.
( 8 .8 3 )
W tym momencie tablica będzie znowu aktualna.
Mamy nadzieję, że otrzymamy listy mniej więcej tej samej długości. Da­
łoby to nam czas wyszukiwania około m razy krótszy. Wartość m jest z
reguły znacznie większa niż 4, tak więc współczynnik 1/m będzie znaczącym
ulepszeniem.
Początkowo nie wiemy, jakie otrzymamy klucze, ale można wybrać funk­
cję haszującą H tak, że będziemy mogli uznać h(K) jako zmienną losową, któ­
rej wartości są jednostajnie rozłożone w przedziale od 1 do m, niezależnie od
wartości innych kluczy, które otrzymaliśmy. W takich przypadkach oblicze­
nie funkcji haszującej odpowiada rzucaniu kością o m ścianach. Jest szansa,
że wszystkie rekordy zawsze będą wpadały do tej samej listy, podobnie jak i
jest szansa, że kości zawsze będą wskazywały [ 0 . Ale teoria rachunku praw­
dopodobieństwa mówi nam, że listy będą praw ie zaw sze wyważone całkiem
równomiernie.
Analiza haszowania: wprowadzenie
„Analiza algorytmów” jest gałęzią informatyki, która analizuje ilościową in­
formację o skuteczności metod informatycznych. „Probabilistyczna analiza
algorytmu” bada czas działania algorytmu, przy czym czas ten traktowany
jest jako zmienna losowa zależna od charakterystyki danych wejściowych. Ha­
szowanie jest szczególnie dobrym kandydatem do analizy probabilistycznej,
ponieważ jest ono wyjątkowo skuteczne w średnim przypadku, mimo że w
najgorszym przypadku jest zbyt złe, żeby nawet o nim myśleć. (Najgorszy
przypadek wystąpi wtedy, gdy wszystkie klucze będą miały taką samą war­
Zakładam się, że ich
rodzice cieszą się
z tego.
tość funkcji haszującej.) Faktycznie, dla programisty używającego haszowania
byłoby lepiej, gdyby wierzył w rachunek prawdopodobieństwa.
Oznaczmy przez P liczbę wykonań kroku H3 w czasie wyszukiwania w
powyższym algorytmie. (Każde wykonanie kroku H3 będziemy nazywali „po­
równaniem” w tablicy.) Jeśli znamy liczbę porównań P, to wiemy, jak często
jest wykonywany każdy krok, w zależności od tego, czy wyszukiwanie było
udane czy nie:
Krok
HI
H2
H3
H4
Nieudane wyszukiwanie
Udane wyszukiwanie
1 raz
P + 1 razy
P razy
P razy
1 raz
P razy
P razy
P — 1 razy
Tak więc głównym wskaźnikiem rzutującym na czas wyszukiwania jest liczba
porównań P.
Możemy przedstawić działanie algorytmu wyobrażając sobie książkę ad­
resową, która jest zorganizowana w specjalny sposób, z miejscem na jeden
adres na każdej stronie. Na okładce książki notujemy stronę pierwszego ad­
resu każdej z m list. Każda nazwa K wyznacza listę H(K), do której ona należy.
Każda strona w książce zawiera odnośnik do następnej strony ze swojej listy.
Liczba zajrzeń potrzebna do znalezienia adresu w takiej książce jest liczbą
stron, które musimy sprawdzić.
Jeśli wstawiliśmy n adresów, to ich pozycje w tablicy zależą tylko od
odpowiednich wartości funkcji haszującej, (Hi ,łi 2 , . . . ,Hn ). Zakładamy, że
każdy z m n możliwych ciągów (H i, H2 , . . . , Hn) jest tak samo prawdopodobny
i P jest zmienną losową zależną od takiego ciągu.
Przypadek 1: K lucza nie m a
Z a jrz y j pod
wycieraczkę.
$
Omówimy najpierw zachowanie się wartości zmiennej P w nieudanym wyszu­
kiwaniu, przy założeniu, że do tablicy haszującej włożyliśmy rt rekordów. W
tym przypadku odpowiednia przestrzeń losowa składa się ze rrtn +1 zdarzeń
elementarnych
cu = (Hi, H2 , . . . , Hn,, Hn_(-i ),
gdzie Hj jest wartością funkcji haszującej j-tego wstawionego klucza, nato­
miast Hu+i jest wartością funkcji haszującej klucza, którego wyszukiwanie
okazało się nieudane. Założymy, że funkcja haszująca została wybrana wła­
ściwie, tak że dla każdego cu, Pr(cu) = 1/m n+1.
Na przykład gdy m = rt = 2, mamy osiem jednakowo prawdopodobnych
możliwości:
Jeśli Hi = hz = H3 , to wykonujemy dwa nieudane porównania, zanim
stwierdzimy, że nie ma nowego klucza K; jeśli Hi = h 2 ^ H3 , nie wykonujemy
żadnego, i tak dalej. Ta lista wszystkich możliwości pokazuje, że dla m =
n = 2, P ma rozkład prawdopodobieństwa dany przez ftp ( | + | z + | z 2) =
Cz + i z )2*
Przy wyszukiwaniu nieudanym wykonujemy jedno porównanie z każdym
elementem z listy numer Hn+i , otrzymamy więc ogólny wzór
P = [Hi = H n+i] + [h2 = Hn + 1 ] + • • • + [Hu = Hn-i-i ].
( 8 .8 4 )
Prawdopodobieństwo tego, że Hj = Hn+i , wynosi 1/m , dla 1 ^ j ^ rt. Stąd
wynika, że
EP = E[H1= h n+1] + E[h2 = h n+1] + --- + E[hn = h u+1] =
m
Może powinniśmy przedstawić to jeszcze raz odrobinę wolniej: Niech Xj bę­
dzie zmienną losową
Xj = Xj (o>) = [Hj ^ H tl+ i ] .
-
Wówczas P = Xi H1- Xn i EXj — 1/m dla wszystkich j ^ n. Stąd
EP = EXi H------------+ EXn = n /m .
Dobrze: Tak jak myśleliśmy, średnia liczba porównań wynosi 1/m razy tego,
co byśmy uzyskali bez haszowania. Co więcej, zmienne losowe Xj są niezależne
i wszystkie mają taką samą funkcję tworzącą
v M _ m -1 + z
X’(Z) “
m
’
dlatego ftp dla całkowitej liczby porównań w nieudanym wyszukiwaniu wy­
nosi
TH — 1 A- 7\ri
(
—
m
— )
/
•
( 8 .8 5 )
8 .Prawdopodobieństwo dyskretne
Otrzymujemy więc rozkład dwumianowy z p = l / m i q = (m — 1}/m . In­
nymi słowy, liczba porównań w nieudanym wyszukiwaniu jest taka sama jak
liczba orłów, gdy rzucamy niewyważoną monetą, w której prawdopodobień­
stwo wyrzucenia orła wynosi ^/m w każdym rzucie. Wzór ( 8 .6 1 ) mówi nam
też, że wariancją P jest
rtpq =
rt(m — 1 )
nv
Dla dużego m wariancja P wynosi mniej więcej n /m , tak że odchylenie stan­
dardowe jest w przybliżeniu równe y / n / m.
W porządku, g łu p i
właściciel, myślimy,
i spokojnie się
włam ujem y
do mieszkania.
Przypadek 2: Klucz jest
Zajmiemy się teraz udanym wyszukiwaniem. W tym przypadku odpowied­
nia przestrzeń losowa jest odrobinę bardziej skomplikowana, w zależności od
naszych zastosowań. Niech £1 będzie zbiorem zdarzeń elementarnych
(8 .86)
gdzie, podobnie jak poprzednio, Hj jest wartością funkcji haszującej dla j-tego
klucza, k zaś jest indeksem szukanego klucza (klucza, którego wartością funk­
cji haszującej jest hic). Tak więc mamy 1 ^ hj ^ m dla 1 ^ ^ n i 1 ^ k ^ n,
i jest w sumie m rL-n zdarzeń elementarnych cu.
Niech Sj będzie prawdopodobieństwem, że szukamy j-tego klucza, który
został wstawiony do tablicy. Wówczas
Pr(cu) = sic/mT
(8.87)
gdy cu jest zdarzeniem ( 8 .8 6 ). (W pewnych zastosowaniach częściej szukamy
elementów, które zostały wstawione jako pierwsze, lub elementów, które zo­
stały wstawione jako ostatnie, tak więc nie będziemy zakładali, że każde
Sj = l/n .) Zauważmy, że
Pr(tu) = H k=i sk = 1, stąd wzór ( 8 .8 7 )
definiuje poprawny rozkład prawdopodobieństwa.
Liczba porównań P w nieudanym wyszukiwaniu wynosi p, jeśli klucz K
był p-tym kluczem wstawionym do listy. Dlatego
P(Hi, . . . ,Hn,;k) = [Hi = Hic] + [H2 = H]C] + ••• + [H i^ H iJ ,
(8.88)
lub, jeśli zdefiniujemy zmienną losową Xj jako [Hj = Hłc], otrzymujemy
P = Xi +
+ • • • + Xk .
-
( 8 .8 9 )
Przypuśćmy, że mamy na przykład m = 10 i n = 16, i ż e funkcja haszująca
ma następujący „losowy” wzorzec:
(Ht, , 1 1 - 1 6 ) = 3 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ;
Gdzie ja ju ż
widziałam ta k i
wzorzec?
(P t, . . . ,P 16) = 1 1 1 2 1 1 1 1 2 2 3 1 2 1 3 3 .
Liczba porównań Pj potrzebna do znalezienia j-tego klucza znajduje się
poniżej Hj.
Równanie ( 8 .8 9 ) przedstawia P jako sumę zmiennych losowych, ale nie
możemy po prostu obliczyć EP jako EXi + • • • + EXi<, ponieważ wartość k
sama w sobie jest zmienną losową. Jaka jest funkcja tworząca dla P? Żeby
odpowiedzieć na to pytanie, zrobimy na moment dygresję na temat praw do­
podobieństwa warunkowego.
Jeśli A i B są zdarzeniami w przestrzeni losowej, to powiemy, że prawdo­
podobieństwo warunkowe A przy zadanym B wynosi
__ ,
_,
P r (c u e A n B )
Pr ( a > e A | a > e B ) =
.
(8.90)
Na przykład jeśli X i Y są zmiennymi losowymi, to prawdopodobieństwo
warunkowe zdarzenia X = x przy zadanym Y = y wynosi
■
<s »i >
Dla ustalonego y z zakresu zmiennej losowej Y suma tych prawdopodobieństw
warunkowych po wszystkich x z X wynosi P r(Y = y)/P r(Y = y) = 1. Dlatego
( 8 .9 1 ) definiuje rozkład zmiennej losowej i możemy zdefiniować nową zmienną
losową łX|-y* taką, że Pr((X|-y) = x) = Pr(X = x | Y = y).
Gdy X i Y są niezależne, zmienna losowa X\y będzie w zasadzie taka sama
jak X, niezależnie od wartości y , ponieważ na mocy (8 .5 ) Pr(X = x | Y = y ) jest
równe Pr(X = x); czyli jest dokładnie tak jak byśmy chcieli rozumieć nieza­
leżność. Ale jeśli X i Y są zależne, to zmienne losowe X\y i X \y ' niekoniecznie
muszą być do siebie podobne w przypadku gdy y ^ y ' .
Gdy X przybiera tylko nieujemne wartości całkowite, wówczas możemy
rozbić jego ftp na sumę warunkowych ftp względem dowolnej innej zmiennej
losowej Y:
Gx (z) =
Y . P r(Y = y )G X|„(z).
yeY(n)
( 8 .9 2 )
Równość ta zachodzi, ponieważ współczynnik przy z 11 po lewej stronie wynosi
Pr(X = x) dla wszystkich x e X(Q), a po prawej stronie jest równy
Y
y e r (O )
Pr(Y=x))Pr(X = x |Y = v ) =
Y
ye Y {ci)
Pr(X = x i Y = y)
Wzór ( 8 .43 )
również b ył
dygresją zrobioną
tylko na moment.
8. Prawdopodobieństwo dyskretne
:
■ s f i l S i l 4 ®2 /
Na przykład jeśli X jest iloczynem wyrzuconych oczek w rzucie parą kości i
jeśli Y jest sumą wyrzuconych oczek, to ftp dla X |6 wynosi
GX|«(z) = | z 5 + | z 8 +
\ź*
ponieważ prawdopodobieństwo warunkowe dla Y = 6 składa się z pięciu
równoprawdopodobnych zdarzeń { 0 | g | , HICI>IZIIZI>ICIH)IEI 0 }- Rów"
nanie (8.92) redukuje się w tym przypadku do
Gx(z) = JgGx| 2 (z) + ^ G X|3(z ) + ^ G x |4 (z ) + ^ G x |5 (z)
^ G x | 6 (z) + ^ G X|7(z) + ^ G X|8 (z ) + ^ G X|9(z )
^ G X|io (z ) + ^ G X|n (z ) + 3^GX|i 2 (z) »
Och, teraz ju ż
rozumiem, co
m atem atycy m ają
na myśli, g dy
mówią że coś je s t
„oczywiste,”
J asne ” lub
„ try w ia ln e ”
wyrażenia, które będzie oczywiste, gdy tylko je raz zrozumiemy. (Koniec
dygresji.)
W przypadku haszowania wzór (8.92) mówi nam, jak zapisać ftp dla
liczby porównań w udanym wyszukiwaniu, jeśli podstawim y X = P i Y =
K. Dla dowolnego ustalonego k pom iędzy 1 i rt, zmienna losowa P |k jest
zdefiniowana jako suma niezależnych zmiennych losowych Xi H------- b Xk, tak
jak we wzorze (8.89). Tak więc ma ona następującą ftp:
m — 1 + z \ k_1
„P rzez jasne mam
na m yśli to,
że d obry student
pierwszego roku
powinien być
w stanie to zrobić,
aczkolwiek nie je st
to zupełnie
tryw ialne
Paul Erdós [94].
Stąd jest jasne, że ftp dla P wynosi
Gp(z) = 2 > G Plk(z)
k=1
Ti
/ m — 1 + z \ k_1
= k=1
5>(
V
m
m
J
(8-93)
gdzie
S(z)
=
Si + s2 z + S3 Z 2 + • • • + sn z n
^
( 8 .9 4 )
jest ftp dla prawdopodobieństw wyszukania sk (dla ułatwienia podzieloną
przez z).
Dobrze. Mamy funkcję tworzącą dla P, możemy teraz znaleźć jej war­
tość średnią i wariancję przez zróżniczkowanie. Dla uproszczenia usuniemy
najpierw współczynnik z, tak jak to robiliśmy poprzednio, otrzymamy więc
wartość średnią i wariancję dla P — 1:
m — 1 + z'
m
/
F(z) = GP(z)/z = s ( - ----- — ) ;
v
PW
1 ^ z / rrt — 1 + z'
= m
V
\
mz
m
V
m
/
/
Zatem
EP
= 1+ Mean(F) = 1 + F '(1 ) = 1 + m " 1 M ean(S);
VP
= Var(F) =
( 8 .9 5 )
F"(l) + F'(1) —F '(l ) 2
= m _ 2 S"(1) + m _ 1 S/ (1) —mT 2 S'(1 ) 2
—m ~2 Var(S) + (m _1 —m - 2 ) M ean(S).
( 8 .9 6 )
Są to ogólne wyrażenia na wartość średnią i wariancję dla liczby porównań
P, wyrażone za pomocą wartości średniej i wariancji założonego rozkładu
wyszukiwania S.
Przypuśćmy na przykład, że s* = 1/rt dla 1 ^ k ^ rt. Oznacza to, że
robimy prawdziwie „losowe” udane wyszukiwanie, przy założeniu że każdy
klucz może znajdować się w tablicy z takim samym prawdopobieństwem.
Wówczas S(z) ma określony wzorem z ( 8 .3 2 ) rozkład jednostajny Un (z) i
otrzymujemy Mean(S) = (rt — l)/2 , Var(S) = (n 2 — 1)/12. Stąd
EP-
^
1 +
, ;
.
<8 .W>
(m —1)(n —1) _ ( n —1)(6m + n —5}
VP ~ l 2 ^
+ -------t o ? ------- " ---------- 1 2 ^ ---------- •
( 8 -98)
Jeszcze raz uzyskaliśmy pożądane przyspieszenie o czynnik 1/m . Gdy m «
r t/ln n i rt —» oo, wówczas średnia liczba porównań w udanym wyszukiwa­
niu wynosi w tym przypadku około \ Inn, a odchylenie standardowe jest
asymptotycznie równe (lnn)/V T 2 .
Z drugiej strony, moglibyśmy przypuszczać, że
= (kHn ) - 1 dla 1 ^
k ^ n. Taki rozkład jest nazywany „prawem Zipfa.” Wówczas Mean(S) =
n /H n — 1 i Var(S) = j n { n + 1)/H n —n 2/H 2 . Średnia liczba porównań dla
m « n /ln n , przy n —> oo, jest w przybliżeniu równa 2 , z odchyleniem
standardowym dążącym do y/ l n n /y / 2 .
W obydwu przypadkach analiza pozwala dojść do konkluzji, że listy będą
krótkie, poza ekstremalnie rzadkimi przypadkami — zapewnia to nierówność
Czebyszewa.
Przypadek 2, kontynuacja: W arianty wariancji
Właśnie obliczyliśmy wariancję dla liczby porównań w udanym wyszukiwaniu
przez analizę zmiennej losowej P nad przestrzenią losową o m n •n elemen­
tach (Hi, . . . jHni k). Ale moglibyśmy też wybrać inne podejście: Każdy ciąg
wartości haszowanych definiuje zmienną losową P| (Hi, . . . , Hn ), reprezentu­
jącą liczbę porównań w udanym wyszukiwaniu w zadanej tablicy haszującej
z danymi n kluczami. Średnią wartość dla P| (Hi, . . . , Hn ),
n
A(hi , . . . , h j = ] T p - P r ( ( P | ( h . i , . . . , h n) ) = p ) ,
P
(8 .9 9 )
=1
można traktować jako czas działania przy udanym wyszukiwaniu. Ta wartość
A( Hi , . . . , Hn.) jest zmienną losową, która zależy tylko od (Hi, . . . , Hn ), a nie
od ostatecznej wartości k. Możemy zapisać to w postaci
Ti
A ( h i , . . . ,Hn ) = y Sfc P(H~i, . . . , łin,; k ) ,
k= 1
gdzie P ( h i , . . . jKajk) jest zdefiniowane za pomocą wzoru (8 .8 8 ), ponieważ
PI (Hi, . . . , Hn.) = p z prawdopodobieństwem
I L i Pr(P(H 1 ) . . . , H n ; k ) = p )
_
m ~n sk [P(Hi, . . . , Hu ; k) = p ]
Z k = i Pr(^ i, • • •, Hn ; k)
m - n sk
n
= X . s k [P(h 1 , . . . , h T1; k ) = p ] .
k= 1
Wartość średnia A ( H i , . . . , H n ) uzyskana przez zsumowanie względem
wszystkich m 71 możliwości (Hi, . . . ,Hn.) i podzielona przez m n będzie taka
sama jak wartość średnia, którą uzyskaliśmy poprzednio we wzorze ( 8 .9 5 ).
Ale w ariancja A(Hi, .. ., łVa) jest trochę inna; jest to wariancja m u śred­
nich, a nie wariancja m n -n zliczeń porównań. Na przykład dla m = 1 (tzn.
gdy jest tylko jedna lista) „średnia” wartość A( Hi , . . . , Hu ) = A(1, . . . , 1) jest
w rzeczywistości stałą, tak więc jej wariancja VA jest równa zeru. Natomiast
liczba porównań w udanych wyszukiwaniach nie jest stałą i dlatego wariancja
VP jest różna od zera.
Możemy zilustrować różnicę pomiędzy wariancjami przeprowadzając obli­
czenia dla ogólnych m i n w najprostszym przypadku, gdy sk = 1 /n , dla
1 ^ k ^ n. Innymi słowy, będziemy na razie zakładać, że rozkład wyszuki­
wanych kluczy jest jednostajny. Dowolny ciąg wartości funkcji haszujących
(Hi, . . . , hn ) definiuje m list, które zawierają odpowiednio ( n i , ri2 , . . . , n m)
elementów dla pewnych liczb rtj, gdzie
n i + n 2 H--------h n m = n .
Udane wyszukiwanie, w którym każdy z n kluczy w tablicy jest tak samo
prawdopodobny, wymaga średnio
( ! + • • • + t i i ) + ( ! + • • • + 112) + • • • + (1 + • • • + 11-1
x1)
n
Tli (ni +1) + n 2(n2+1 ) + • • • + Tim (n m+ 1 )
2n
ti ? + n | H---------1- n ^
+ n
2n
porównań. Naszym celem jest obliczenie wariancji dla wartości A (Hi, . . . , hn )
nad przestrzenią losową składającą się ze wszystkich m n ciągów ( h i , . . . , Hn ).
Obliczenia mogą być prostsze, jeśli obliczymy wariancję dla odrobinę
innej wartości,
Ponieważ zachodzi
A th i,...,? ^ ) = 1 + B (H i,...,H n)/n
więc wartość średnia i wariancja A spełniają równania
(8.100)
Prawdopodobieństwo, że rozmiary list będą odpowiednio n i, n 2, . . . , n m,
jest współczynnikiem wielomianowym
n
n i , n 2, . . . , n m
dzielonym przez m n . Dlatego ftp dla B ( h i , . . . , Hn ) wynosi
Suma ta wygląda być może odstraszająco, ale nasze doświadczenia z rozdziału
7 nauczyły nas, że jest to m-krotny splot. Jeśli spojrzymy na wykładniczą
funkcję supertworzącą
G(w,z) =
Bn(z)
n >0
m ,Lw'
n!
to łatwo możemy sprawdzić, że G(w,z) jest po prostu m-tą potęgą
G(w,z) = ( 2 L Z
k^O
Dla sprawdzenia możemy podstawić z = 1. Otrzymamy G(w,1) = (ew )m,
tak więc współczynnik dla m n w n/n ! wynosi Bn (l) = 1.
Gdybyśmy znali wartości B^(1) i B"(1), moglibyśmy obliczyć Var(Bn ).
Obliczymy więc pochodne cząstkowe funkcji G(w, z) względem z:
dz
G (w,z) =
Bń(z)
TTL“"W1
ni
n^O
k^O
k^O
g ^ G (w ,z ) = X Bn(Z)
TL^O
Tl!
M w ,v \
/ *— / k \
= m(m-1)(2:z®£r2(L
k^O
k^O
k \
+ m
z^2-
£
k^O
w kx2
k!
TTL— 1
M_ 9 W
k!
k!
k > 0
Tak, one są skomplikowane, ale wszystko ładnie się upraszcza, gdy podsta­
wimy z = 1. Na przykład mamy
n >0
n!
w
k^ 2 2 ( k - 2 )!
= m e(m
k + 2
,(m^—1)w V" ™
= m ev"
2 k!
k^O
m w 2 e (m -l)w
_
y
—
n^O
(mw)n+2y - rt(n—1)mnw n
Im n !
£—
tiJjO
2run!
i stąd wynika, że
B*i,) = CDś-
<s“‘»
Wzór dla EA w ( 8 . 1 0 0 ) daje nam teraz EA = 1 + (n — l)/2 m , zgodnie z
(8 .9 7 )W wyrażeniu na B"(1) mamy podobną sumę
LCi)(C5)-')£ = \Z. (k+ 1)k(k —1)(k —2)wk
k^o
^ k> 0
' h
(k - 3|!
4o .
k!
Stąd otrzymujemy
= m (m —l) e w(m_2) ( | w 2 ew)2 + m ew(m_1) (^w 4 + w 3 )e 1
rt!
n^O
= m eWTTL( |m w 4 + w 3) ;
i -
<l “
>
Teraz możemy złożyć wszystkie części razem i wyprowadzić wzór na pożą­
daną wariancję VA. Prawie wszystko się upraszcza i otrzymujemy zaskaku­
jąco prosty wynik:
VA =
vb
=
b ^(1) + b ; ( 1 ) - b ; ( 1 ) 2
rt2
n2
_ n (n — 1 ) / ( n + 1 ) (n —2 )
m
m2n 2 V
4
^2
rt(n — 1 )
4
( m - 1 ) ( n —1 )
=
2m2n
•
(8'103)
Kiedy spotykamy się z takimi ‘przypadkami’, możemy podejrzewać, że
jest ku temu jakiś matematyczny powód. Możemy zaatakować nasz problem
teraz w taki sposób, żeby wyjaśnić, dlaczego otrzymaliśmy tak prosty wzór. I
rzeczywiście, jest jeszcze jedno podejście do problemu (w ćwiczeniu 61), które
pokazuje, że wariancja średniej liczby porównań w udanym wyszukiwaniu
przybiera ogólną postać
VA = m 2 1 7~ s £ ( k - 1),
m
t i
(8.104)
Prawdopodobieństwo dyskretne
468
gdzie Sk jest prawdopodobieństwem tego, że k-ty wstawiony element był
elementem szukanym. Wzór ( 8 . 1 0 3 ) Jest szczególnym przypadkiem sk = l / n
dla 1 ^ k u.
Oprócz wariancji dla wartości średniej, moglibyśmy też rozważać wartość
średnią dla wariancji. Innymi słowy, każdy ciąg ( Hi , . . . , Hn ), który definiu­
je tablicę haszującą, definiuje także rozkład zmiennej losowej dla udanego
wyszukiwania i wariancja tego rozkładu mówi nam, jak bardzo rozproszona
będzie liczba porównań w różnych udanych wyszukiwaniach. Dla przykładu,
powróćmy do przypadku, gdy wstawiliśmy u = 16 elementów do m = 10 list:
Gdzie ja ju ż
widziałam ta ki
wzorzec?
Gdzie ja ju ż
widziałem takie
g ra ffiti?
( H i , . . . , H i 6) = 3 1 4 1
5 9 2 6 5 3 5 8 9 7 9 3
( P i , . . . , P i 6) = 1 1 1 2 1 1 1 1 2 2 3 1 2 1 3 3
Udane wyszukiwanie w otrzymanej tablicy haszującej ma ftp
16
G( 3, 1 , 4 , 1 . .,3) = Y _ SkZP(3,1,4,1,...,3;k)
k=l
— Si Z +
S2 Z +
S3 Z +
S4 Z
+
• • * 4 - S ig Z
.
Rozważaliśmy właśnie średnią liczbę porównań przy udanym wyszukiwaniu
w tej tablicy, tzn. A( 3 , 1, 4, 1, . . .,3) = Mean(G(3, 1, 4, 1, . . .,3)). Możemy
również rozważać wariancję
Si • 12 + S2 *12 + S3 • 12 + S4 *2^ +
+ S 1 6 -3 "
— ( S l * 1 + S 2 * 1 + S 3 * 1 + S 4 * 2 + - * * + Sl6*3) .
Wariancja ta jest zmienną losową zależną od ( h i , . . . , Hn ) , tak więc naturalne
jest, żeby rozważać jej wartość średnią.
Innymi słowy, istnieją trzy naturalne rodzaje wariancji, które chcieliby­
śmy znać, aby dokładnie zrozumieć zachowanie się algorytmu przy udanych
wyszukiwaniach: C ałkowita w ariancja liczby porównań, wzięta po wszy­
stkich (Hi , . . . , 1x0,) i k; w ariancja od w artości średniej liczby porównań,
gdzie wartość średnia jest wzięta po wszystkich k i wariancja jest wzięta po
wszystkich ( H i , . . . , H n ); i w artość średnia dla w ariancji liczby porównań,
gdzie wariancja jest wzięta po wszystkich k i wartość średnia jest potem
wzięta po wszystkich ( H i , . . . ,H n ). Formalnie, całkowita wariancja wynosi
wariancja od wartości średniej wynosi
L
VA =
1
^ ( L s kp ( h , >. . . , h a : ic)
k=1
natomiast wartość średnia dla wariancji jest równa
AV
k = l
Okazuje się, że powyższe trzy „wariancje”są wzajemnie powiązane w na­
stępujący prosty sposób:
(8 . 1 0 5 )
VP = Y A H -A Y .
W rzeczywistości, rozkład warunkowy prawdopodobieństwa zawsze spełnia
tożsamość
VX = V(E(X|Y)) + E(V(X|Y))
(8 . 1 0 6 )
jeżeli X i Y są zmiennymi losowymi w dowolnej przestrzeni losowej i X
ma wartości rzeczywiste. (Tożsamość ta jest udowodniona w ćwiczeniu 2 2 .)
Wzór (8 . 1 0 5 ) jest jej szczególnym przypadkiem, gdzie X jest liczbą porów­
nań w udanym wyszukiwaniu, a Y jest ciągiem wartości funkcji łiaszujących
Ogólna postać (8 . 1 0 6 ) wymaga szczególnego zrozumienia, ponieważ w
zastosowanej notacji przestrzenie losowe, w których określamy zmienne lo­
sowe, ich wartości oczekiwane i wariancje, są różne, czego ta notacja nie
odzwierciedla. Dla każdego y z dziedziny zmiennej losowej Y zdefiniowaliśmy
zmienną losową X|y w ( 8 .9 1 ) i ta zmienna losowa ma wartość oczekiwaną
E(X|y) zależną od y . W związku z tym, E(X|Y) oznacza zmienną losową, któ­
rej wartościami są E(X|-y), dla y przebiegającego wszystkie możliwe wartości
z Y, natomiast V(E(X|Y)) jest wariancją tej zmiennej losowej względem roz­
kładu zmiennej losowej Y. Podobnie, E(V(X|Y)) jest wartością średnią dla
zmiennej losowej V(X|'y), przy zmieniającym się y . Po lewej stronie ( 8 . 1 0 6 )
m a m y VX, bezwarunkową wariancję dla X. Ponieważ wariancje są nieujemne,
M
(Teraz je st dobry
moment, żeby
zrobić
na rozgrzewkę
ćwiczenie 6.)
dyskretne
470
zawsze otrzymujemy
VX ^ V(E(X|Y))
P je st nadal liczbą
porównań.
i
VX ^ E(V(X|Y))
(8.107)
P rzy p a d ek 1 , je szcze raz : W yszu k iw an ie n ieu d an e
Doprowadźmy do końca naszą wnikliwą analizę haszowania poprzez wykona­
nie jeszcze jednego obliczenia typowego dla analizy algorytmów. Tym razem
będziemy analizowali całkowity czas działania związany z nieudanym wy­
szukiwaniem, zakładając, że komputer będzie wstawiał nie znany dotąd klucz
do swojej pamięci.
Proces wstawiania w algorytmie (8 .8 3 ) rozbija się na dwa przypadki,
w zależności od tego, czy j jest ujemne, czy jest zerem. Przypadek j < 0
zachodzi wtedy i tylko wtedy, gdy P = 0, ponieważ wartość ujemna pochodzi
z elementu FIRST pustej listy. Tak więc, jeśli lista była uprzednio pusta,
mamy P = 0 i musimy podstawić FIRST [Hn+i] := n + 1 . (Nowy rekord
zostanie wstawiony na pozycję n + 1.) W przeciwnym razie P > 0 i musimy
ustawić wartość NEXT na n + 1. Te dwa przypadki mogą mieć różny czas
trwania i dlatego całkowity czas działania podczas nieudanego wyszukiwania
ma postać
T =
c t + p P + 6 [P = 0],
( 8 .1 0 8 )
gdzie a, p i 6 są stałymi, które zależą od używanego komputera i od sposobu,
w jaki haszowanie jest kodowane w języku wewnętrznym maszyny. Dobrze
by było znać wartość średnią i wariancję dla T, ponieważ taka informacja jest
bardziej istotna w praktyce niż wartość średnia i wariancja dla P.
Jak dotąd używaliśmy funkcji tworzących tylko w połączeniu ze zmien­
nymi losowymi przybierającymi nieujemne wartości całkowite. Ale okazuje
się, że możemy praktycznie w taki sam sposób pracować z
Gx {z)
Vi{a))zX(o>)
cu<EO
gdy X jest dowolną zmienną losową o wartościach rzeczywistych, ponieważ
istotne parametry X zależą tylko od zachowania się Gx w pobliżu z = 1,
gdzie potęgi z są dobrze zdefiniowane. Na przykład czas działania (8 . 1 0 8 )
w nieudanym wyszukiwaniu jest zmienną losową zdefiniowaną nad prze­
strzenią losową jednakowo prawdopodobnych wartości funkcji haszujących
( H i , . . . Hn , Hn + i ), z 1 ^ Hj ^ m. Możemy rozważać szeregi
Gj{z) =
m n+ 1
Z Z
z
Hl—1Trn—1 łl-n+1—1
8.5. Haszowanie j
jako ftp nawet wtedy, gdy a, |3 i 6 nie są całkowite. (W rzeczywistości pa­
rametry oc, (3, 6 są wielkościami fizycznymi mającymi swój wymiar czasowy;
one nie są nawet po prostu liczbami! Ale nawet mimo to możemy ich używać
w wykładniku dla z.) Tak jak poprzednio, możemy obliczać wartość średnią
i wariancję dla T przez obliczenie G |(l) i Gy(1) i zastosowanie ich wartości
w zwykły sposób.
Funkcja tworząca dla P wygląda następująco:
P(z) = ( ^ l ± £ )
= ^
Pr(P=p)zp.
p^O
Stąd mamy
Gt (z) =
Pr(P = p ) z a + P p + 6 [p = 0 1
= z“ ((z5 —1)Pr(P = 0) + ^ P r ( P = p ) z Pp)
p^O
Wyznaczenie Mean(Gy) i Var(Gj) jest teraz rutynowe:
TL
/ TTL —
1 \ Tl
Mean(Gj) — Gj(l) = oc+|3---- F6 ( ------- ) ;
m
V
m
(8.109)
/
Gj(l) = oc{oc - 1) + 2a(3 — + (3((3 —1) — + ft2
^
m
m
m
2
-,,/ru
—1 1\ \nu
_ c / m — 11 \ n .............
/m —
+ 2<xó(------- ) + 6 6 - 1 1 -------- ) ;
V m
/
V m
/
Var(GT) = G"( 1 ) + G | ( 1 ) - G | ( 1 ) 2
= p2 n ( m - 1 ) _
/m -lN nn
m2
V mm / / mm
^m — 1 \ lrL\
,
,
110
<8
W rozdziale 9 będziemy się uczyli, jak szacować wartości takie jak ta, gdy
m i n są duże. Jeśli, na przykład, m = n i n ^ oo, to techniki z rozdziału 9
pokażą nam, że wartość średnia i wariancja dla T wynoszą odpowiednio a +
P + 5e~1 + 0(tl_1) oraz |32 —2|36e-1 + 6 2 (e _1 —e~2) + 0(tl_1). Jeśli m =
n /ln u + 0 (1) i tl —>00, to otrzymujemy odpowiednio
Mean(Gj) = p I n n + a + 0 ( ( l o g r L ) 2/n ) ;
Var(Gj) = p2 l n n + 0 ((logn ) 2/n ) .
8. Prawdopodobieństwo dyskretne
*
472
Ć w iczenia
Rozgrzewka
1 . Jakie jest prawdopodobieństwo wypadnięcia dubletu (tzn. że na obu ko­
Dlaczego tylko
dziesięć liczb?
ściach wypadnie tyle samo oczek) w rozkładzie zmiennej losowej Proi
z ( 8 .3 ), gdy jedna kość jest wyważona, a druga nie? Jakie jest prawdopo­
dobieństwo, że wyrzuci się S = 7?
2 . Jakie jest prawdopodobieństwo, że pierwsza i ostatnia karta w losowo
potasowanej talii kart to asy? (Wszystkie 52! permutacje kart mają to
samo prawdopodobieństwo 1/52!.)
3. Studenci Matematyki Konkretnej na Uniwersytecie Stanforda byli pro­
szeni w 1979 roku o rzucanie monetami dopóty, dopóki nie wypadną dwa
orły z rzędu, i następnie o przedstawienie liczby wykonanych rzutów.
Otrzymali oni następujące wyniki:
3 , 2 , 3 , 5 , 1 0 , 2, 6 , 6 , 9 , 2 .
Studenci Matematyki Konkretnej na Uniwersytecie Princeton byli pro­
szeni o zrobienie tego samego w 1987 roku, z następującymi wynikami:
10, 2, 10, 7, 5, 2, 10, 6 , 10, 2 .
Oszacuj wartość średnią i wariancję opierając się na (a) próbce ze Stan­
forda; (b) próbce z Princeton.
4. Niech H(z) = F(z)/G(z), gdzie F(1) = G(1) = 1. Pokaż, że
Mean(Fi) = Mean(F) — Mean(G),
Var(H) = Var(F) —Var(G),
analogicznie jak w (8 .3 8 ) i ( 8 .3 9 ), przy założeniu że odpowiednie pocho­
dne istnieją w z = 1 .
5. Przypuśćmy, że Alice i Bill grają w grę ( 8 .7 8 ) z monetami niewy ważo­
nymi, na których orzeł wypada z prawdopodobieństwem p. Czy istnieje
wartość p, dla której gra staje się fair?
6 . Do czego redukuje się wzór ( 8 . 1 0 6 ), jeśli X i Y są niezależnymi zmiennymi
losowymi?
Podstaw y
7. Pokaż, że jeśli dwie kości są niewyważone, dając taki sam rozkład praw­
dopodobieństwa, to prawdopodobieństwo wyrzucenia dubletu wynosi za­
wsze co najmniej
8 . Niech A i B będą zdarzeniami takimi, że A U B = O. Udowodnij, że
Pr(eu € A fi B) = Pr(o> G A) Pr(cu G B) —Pr(cu ^ A) Pr(cu ^ B ) .
9. Czy prawdziwe jest następujące zdanie: Jeśli X i Y są niezależnymi zmien­
nymi losowymi, to niezależne są również F(X) i G(Y), gdzie F i G są
dowolnymi funkcjami?
10. Jaka jest maksymalna liczba elementów, które mogą być medianą zmien­
nej losowej X, zgodnie z definicją ( 8 .7 )?
1 1 . Skonstruuj zmienną losową, która miałaby skończoną wartość średnią i
nieskończoną wariancję.
1 2 . a) Jeśli P(z) jest ftp dla zmiennej losowej X, to pokaż, że
Pr(X <Cr) <C x~ rP(x)
dla 0 < x ^ 1;
Pr(X ^ r) ^ x_rP (x)
dla x ^ 1.
Te ważne relacje zwane są nierównościami ogonowymi.
b) W szczególnym przypadku, gdy P(z) = (1 + z ) n/ 2 TLi zastosuj pierw­
szą z tych nierówności do pokazania, że Y.ic<ctn (£) ^ 1 /(x a n (1 —
a ) ( 1 - a ) n d la 0 <
OC <
\.
13. Pokaż, że jeśli X i, . . . , Xzn są niezależnymi zmiennymi losowymi o takim
samym rozkładzie i oc jest dowolną liczbą rzeczywistą, to zachodzi
14. Niech F(z) i G(z) będą funkcjami tworzącymi i niech
H(z) = pF(z) + q G(z)
gdzie p + q = 1. (Takie H nazywane jest m ieszaniną F i G. Odpowiada
ona rzucaniu monetą i wybraniu rozkładu F lub G, w zależności od tego,
czy wypadł orzeł, czy reszka.) Znajdź wartość średnią i wariancję dla FI
jako funkcję p, q i wartości średnich i wariancji dla F i G.
15. Jeśli F i G są funkcjami tworzącymi, to możemy zdefiniować kolejne ftp
H(z) przez „złożenie”:
H(z) = F(G(z)).
Wyraź wartości Mean(H) i Var(H) jako funkcje zależne od Mean(F),
Var(F), Mean(G) i Var(G). (Nierówność ( 8 .9 3 ) jest szczególnym przy­
padkiem.)
16. Znajdź postać zwartą dla funkcji super tworzącej I ^ o ^ n W w 11, gdy
Fn (z) jest funkcją tworzącą dla problemu podrzucanych kapeluszy, zde­
finiowaną w ( 8 .5 3 ).
17. Niech Xn>p i Yn>p mają, odpowiednio, rozkład dwumianowy i ujemny
rozkład dwumianowy, z parametrami (rt,p). (Te rozkłady zdefiniowane są
8. Prawdopodobieństwo dyskretne
Rozkład liczby ry b
na jednostkę
objętości w ody
w
474
w równaniach ( 8 .5 7 ) i ( 8 .6 0 ).) Pokaż, że Pr(Yu>p ^ m) = Pr(Xm+U)P ^rt).
Jaką tożsamość dotyczącą współczynników dwumianowych pociąga za
sobą powyższa równość?
18. Mówimy że zmienna losowa X ma rozkład Poissona z wartością śred­
nią (j,, gdy Pr(X = k) = e~p-[i]c/k \ dla wszystkich k ^ 0.
a) Jaka jest ftp dla takiej zmiennej losowej?
b) Ile wynosi jej wartość średnia, wariancja i inne półniezmienniki tej
zmiennej losowej?
19. Niech Xi ma rozkład Poissona z wartością średnią \i-[ i niech Xz ma nie­
zależny od Xi rozkład Poissona z wartością średnią \±2 (por. poprzednie
ćwiczenie).
a) Jakie jest prawdopodobieństwo tego, że Xi + Xz = rt?
b) Ile wynosi wartość średnia, wariancja i inne półniezmienniki zmiennej
2X 1 + 3 X 2?
2 0 . Udowodnij zależności ( 8 .7 4 ) i ( 8 . 7 5 ), ogólne postacie dla wartości średniej
i wariancji dla czasu oczekiwania na dany wzorzec orłów i reszek.
21. Co reprezentuje wartość N, jeśli we wzorze (8 .7 7 ) podstawimy \ za 0 i R?
2 2 . Udowodnij wzór ( 8 . 1 0 6 ), prawo warunkowych wartości średnich i warian­
cji.
Ć w iczen ia d om ow e
23. Niech Proo będzie rozkładem losowym dla dwóch rzutów wyważoną ko­
ścią i niech Prn będzie rozkładem losowym dla dwóch rzutów kością
niewyważoną, tak jak w ( 8 .2 ). Znajdź wszystkie zdarzenia A takie, że
Proo (A) = Prn( A) . Które z tych zdarzeń zależą tylko od zmiennej lo­
sowej S? (Przestrzeń losowa z Cl = D 2 ma 2 36 elementów, ale tylko 2 11
spośród nich zależy jedynie od S.)
24. Gracz } rzuca 2n + 1 wyważonymi kośćmi i usuwa te, na których wypa­
dło J j . Gracz K wybiera potem liczbę pomiędzy 1 i 6 , rzuca pozostałymi
kośćmi i usuwa kości z wyrzuconą liczbą oczek taką, jak liczba wybrana
przez niego. Ten proces jest powtarzany dopóty, dopóki nie zostaną usu­
nięte wszystkie kości. Gracz, który usunął większość z kości (rt + 1 lub
więcej), wygrywa.
a) Jaka jest wartość oczekiwana i wariancja dla liczby kości usuniętych
przez gracza J? Wskazówka: Kości są niezależne.
b) Jakie jest prawdopodobieństwo, że gracz J wygra dla n = 2?
25. Rozważmy grę hazardową, w której zaczynasz z pulą A i rzucasz (wy­
ważoną) kością. Jeśli wypadnie k oczek, to mnożysz swoją pulę przez
2(k — l)/ 5. (W szczególności, podwajasz stawkę, gdy wyrzucisz j j , a
tracisz wszystko, gdy wyrzucisz [•].) Możesz skończyć grę w dowolnym
momencie, dostając aktualną pulę. Jaka jest wartość średnia i wariancja
puli po n rzutach? (Zignoruj efekt zaokrąglania wartości stawki).
ćwiczenia
26. Znajdź wartość średnią i wariancję dla liczby l-cykli w losowej permuta­
cji rt elementów. Problem podrzuconych kapeluszy omawiany w (8 .2 3 ),
( 8 .2 4 ) i ( 8 .5 3 ) jest tego szczególnym przypadkiem dla 1 = 1 .
27. Niech X i, X z 7 . . . , Xn będą niezależnymi próbkami zmiennej losowej X.
Wzory ( 8 . 1 9 ) i ( 8 .2 0 ) wyjaśniają, jak szacować wartość średnią i wa­
riancję dla X, opierając się na tych wartościach. Podaj analogiczny wzór
szacujący trzeci półniezmiennik K3 . Twój wzór nie powinien być „stron­
niczym” oszacowaniem, w takim sensie, że jego wartość średnia powinna
wynosić K3 .
28. Jaka jest średnia długość gry w rzucanie monetą (8 .7 8 ),
a) zakładając, że wygra Alice?
b) zakładając, że wygra Bill?
29. Alice, Bill i komputer grają wyważonymi monetami, aż wypadnie po raz
pierwszy jeden z wzorców A = 0 0 R0 , B = 0 R0 0 lub C = R0 0 0 . Jeśli
wypadnie wzorzec A, to wygrywa Alice, jeśli wzorzec B, to wygrywa
Bill, a jeśli C, to wygrywa komputer. Gdyby były tylko dwa wzorce, to
pamiętając wzór ( 8 .8 2 ), wiedzielibyśmy, że A prawdopodobnie wygrałby
z B, B wygrałby prawdopodobnie z C, a C wygrałby zapewne z A. Ale
teraz są te trzy wzorce równocześnie. Jakie są szanse każdego z graczy,
że wygra?
30. Omawialiśmy trzy rodzaje wariancji związanych z udanym wyszukiwa­
niem w tablicy haszującej. Tak naprawdę, to istnieją jeszcze dwie inne.
Możemy rozważać średnią (względem k) z wariancji (po H i, . . . , Hn ) z
P(Hi, . . . , Hn ; k), jak również wariancję (względem k) ze średnich (po H i,
. . . , Hn.). Wyznacz te funkcje.
31. W wierzchołku A pięciokąta ABCDE znajduje się jabłko, a dwa wierz­
chołki dalej, w C, znajduje się robaczek. Każdego dnia robaczek pełza
z takim samym prawdopodobieństwem do jednego z sąsiednich wierz­
chołków. Tak więc po jednym dniu znajdzie się on albo w wierzchołku B,
albo w D, w każdym z prawdopodobieństwem j . Po dwóch dniach roba­
czek może wrócić do C, ponieważ nie zapamiętuje poprzedniej pozycji.
Po osiągnięciu wierzchołka A robaczek zatrzymuje się na obiad.
a) Jaka jest wartość oczekiwana i wariancja liczby dni, które upłyną do
obiadu?
b) Niech p będzie prawdopodobieństwem, że liczba dni wynosi 100 lub
więcej. Co mówi nierówność Czebyszewa o p?
c) Co mówią o p nierówności ogonowe (ćwiczenie 1 2 )?
32. Alice i Bill znajdują się w wojsku, którego oddziały stacjonują w pię­
ciu stanach: Kansas, Nebrasce, Missouri, Oklahomie i Colorado. Począt­
kowo Alice jest w Nebrasce, a Bill w Oklahomie. Każdego miesiąca każda
osoba jest wysyłana do sąsiedniego stanu, przy czym wszystkie sąsiednie
Robaczek
Schródingera.
8. Prawdopodobieństwo dyskretne
476
stany są tak samo prawdopodobne. Diagram sąsiedztwa wygląda nastę­
pująco:
Początkowe stany są zaznaczone kółkiem. Na przykład Alice może być
przeniesiona po miesiącu do Colorado, Kansas lub do Missouri, wszędzie
z prawdopodobieństwem 1/3 . Znajdź wartość oczekiwaną i wariancję dla
liczby miesięcy, po jakiej Alice i Bill znajdą się w tej samej jednostce.
(Możesz przeprowadzić eksperymenty na komputerze.)
33. Czy zmienne losowe Xi i Xz we wzorze ( 8 .8 9 ) są niezależne?
34. Gina jest golfistką, która z prawdopodobieństwem p = 0,05 przy każdym
uderzeniu ma „superstrzał,” który daje jej dodatkowy punkt, z prawdo­
podobieństwem q = 0 , 9 1 wykonuje zwykłe uderzenie i z prawdopodo­
bieństwem r = 0,04 wykonuje beznadziejne uderzenie, które kosztuje ją
jeden punkt. (Dla nie-golfistów: każdy strzał posuwa ją o 2,1 lub 0 kroków
do celu, z prawopodobieństwem odpowiednio p, q i r. Na m-punktowym
dołku uzyska ona rt punktów, jeśli w u strzałach, ale jeszcze nie w t l — 1,
przesunie się o co najmniej m kroków do przodu, co oznacza, że piłeczka
wpadnie do dołka. Im mniej punktów tym lepiej.)
a) Pokaż, że gdy Gina gra z graczem, który zawsze wykonuje zwykłe
uderzenia, wówczas wygra ona na 4-punktowym dołku częściej niż
na nim przegra. (Innymi słowy, prawdopodobieństwo, że uzyska ona
mniej niż 4 punkty jest większe niż prawdopodobieństwo, że uzyska
więcej niż 4 punkty.)
b) Pokaż, że jej średnia liczba punktów na 4-punktowym dołku jest więk­
sza niż 4. (Dlatego z reguły będzie przegrywała ze „stabilnym” gra­
czem w całkowitej sumie punktów, mimo że będzie wygrywała mecz
na pojedynczej dziurze.)
Zdecydowanie je s t
to sytuacja
skończonych
stanów.
Użyj komputera
do obliczeń
numerycznych
potrzebnych w tym
ćwiczeniu.
Zadania eg za m in a cy jn e
35. Oczka na kości wypadają z rozkładem losowym określonym następująco:
PrflZD = Pi ;
Pr(H) = V2 ;
Pr (Ul) = P 6 .
Niech Sn będzie sumą wyrzuconych oczek po u rzutach kośćmi. Znajdź
warunek wystarczający i konieczny na „niewyważony rozkład,” tak żeby
"Pi,,.
Ówiaztuia %
477
dwie zmienne losowe Sn mod 2 i Sn mod 3 były niezależne od siebie dla
wszystkich rt.
36. Sześć ścian pewnej kości ma następujący wzorzec:
II
II
zamiast standardowych [•] • • • [fH .
a) Pokaż, że zawsze istnieje inne przypisanie oczek dla drugiej kości
takie, że gdy rzucone są obie kości, to suma oczek ma taki sam roz­
kład prawdopodobieństwa jak suma oczek dla standardowych kości.
(Załóż, że każdy z 36 możliwych układów ścian jest tak samo praw­
dopodobny).
b) Uogólnij powyższy wynik, znajdując taki sposób przyporządkowania
oczek dla 6 n ścian w rt kościach, że rozkład sumy oczek będzie taki
sam jak przy rzucaniu rt standardowymi kośćmi. (Każda ściana po­
winna otrzymać dodatnią całkowitą liczbę oczek.)
37. Niech p n będzie prawdopodobieństwem, że potrzeba dokładnie rt rzutów
wyważoną monetą aż do wypadnięcia po raz pierwszy dwóch orłów z
rzędu i niech qn =
Znajdź zwartą postać dla pn i qn jako
funkcji liczb Fibonacciego.
38. Jaka jest funkcja tworząca prawdopodobieństwa dla liczby rzutów wy­
ważoną kostką potrzebnych do tego, żeby pojawiło się wszystkich sześć
ścian? Uogólnij to do rt-ściennej kostki: Podaj zwarte postacie dla war­
tości średniej i wariancji dla liczby rzutów potrzebnych do uzyskania l
spośród m ścian. Jakie jest prawdopodobieństwo, że ta liczba będzie wy­
nosiła dokładnie n?
39. Funkcja tworząca prawdopodobieństwa D irichleta ma następującą pos­
tać:
n ^1
Tak więc P(0) = 1. Niech X będzie zmienną losową spełniającą warunek
Pr(X = rt) = p n . Wyraź E(X), V(X) i E(lnX) jako funkcje zależne od P(z)
i jej pochodnych.
40. Przedstawmy m-ty półniezmiennik Km rozkładu dwumianowego ( 8 .5 7 )
w postaci n f m(p), gdzie f m jest wielomianem stopnia m. (Na przykład
fi (p) = p i f 2 (p) = p —p 2, ponieważ wartość średnia i wariancja wynoszą
odpowiednio np i rtpq.)
a) Znajdź zwartą postać dla współczynników p k w f m(p).
b) Udowodnij, że f m(^) = (2m —1)Bm/ m + [ m = 1], gdzie Bm jest m-tą
liczbą Bernoulliego.
•^mmmmmm***
m
'“mmmmmi'
mm
m
-mmm#
|8* Prawdopodobieństwo dyskretne
Dziwny zestaw
graczy.
478
41. Niech zmienna losowa Xrt oznacza liczbę rzutów wyważoną monetą aż do
momentu, gdy orzeł wypadnie n razy. Pokaż, że H (X ~|1) = (—1)u (ln2 +
H |n / 2 j —Hn ). Zastosuj metody z rozdziału 9 do oszacowania tej wartości
z błędem bezwzględnym 0 (n - 3 ).
42. Pewien pan ma problem ze znalezieniem pracy. Jeśli jakiegoś poranka nie
jest zatrudniony, to ze stałym prawdopodobieństwem pn (niezależnym od
tego, co się działo dotąd) będzie on zatrudniony przed wieczorem. Ale
jeśli zaczyna on dzień będąc już zatrudnionym, to istnieje stałe prawdo­
podobieństwo p f, że zostanie zwolniony przed zmrokiem. Znajdź średnią
liczbę wieczorów, kiedy ma on pracę, przy założeniu, że początkowo był
on zatrudniony i że analizujemy okres n dni. (Na przykład, dla n = 1
odpowiedzią jest 1 —pf.)
43. Znajdź zwartą postać dla ftp Gn (z) = 2Zk ^ 0 Pk,n£k, gdzie p k>n jest
prawdopodobieństwem, że losowa permutacja n obiektów ma dokładnie
k cykli. Jakie są wartość średnia i wariancja dla liczby cykli?
44. Wydział kultury fizycznej przeprowadza w roku akademickim „turniej
pucharowy” (do pierwszej przegranej) dla 2 n tenisistów w następujący
sposób. W pierwszej rundzie gracze są kojarzeni w losowe pary i gra się
2 n _ 1 meczy. Zwycięzcy awansują do drugiej rundy, gdzie ten sam proces
daje następnie 2 n ~ 2 nowych zwycięzców, i tak dalej. W k-tej rundzie bę­
dzie rozegranych 2n~k losowych meczy między 2 n _ k + 1 graczami, którzy
jeszcze ani razu nie przegrali. Runda n-ta wyłania mistrza. Organizatorzy
nie wiedzieli jednak, że gracze są uporządkowani: xi jest najlepszy, x 2 jest
zaraz po nim, . . . , x2n jest najgorszy. Gdy x3- gra z xk i j < k, zwycięzcą
będzie Xj z prawdopodobieństwem p, a xk z prawdopodobieństwem 1 —p,
niezależnie od innych meczy. Założymy, że takie samo prawdopodobień­
stwo p stosuje się do wszystkich j i k.
a) Jakie jest prawdopodobieństwo, że xi wygra turniej?
b) Jakie jest prawdopodobieństwo, że w n tej rundzie (w finale) spotkają
się ze sobą dwaj najlepsi gracze xi i x2?
c) Jakie jest prawdopodobieństwo, że 2k najlepszych graczy wygra k-tą
od końca rundę? (Poprzednie pytania były dla k = 0 i k = 1.)
d) Niech N(n) będzie liczbą istotnie różnych wyników turnieju. Dwa
turnieje są istotnie takie same, gdy wszystkie mecze były pomiędzy
tymi samymi graczami i miały tych samych zwycięzców. Udowodnij,
że N (n) = 2 n !.
e) Jakie jest prawdopodobieństwo, że x 2 wygra turniej?
f) Udowodnij, że jeśli \ < p < 1, to prawdopodobieństwo, że wygra Xj,
jest większe niż prawdopodobieństwo, że wygra Xj+ i , dla 1 ^ j < 2 n .
45. Prawdziwe sherry wyrabiane jest w Hiszpanii zgodnie z wielostopniowym
systemem zwanym „Solera.” Dla uproszczenia założymy, mamy tylko trzy
beczki, oznaczone A, B i C. Każdego roku jedną trzecią wina z beczki C
rozlewamy do butelek i zastępujemy winem z beczki B. Potem beczkę B
dopełniamy do pełna winem z beczki A i na końcu beczkę A dopełniamy
nowym winem. Niech A(z), B(z) i C(z) będą ftp, dla których współczyn­
nik przy zn jest proporcją n-letniego wina w odpowiedniej beczce, tuż
po dokonaniu przelewania.
a) Załóżmy, że wszystkie te czynności były wykonywane od niepamięt­
nych czasów, tak że mamy ustabilizowany stan, w którym A(z), B(z)
i C(z) są takie same na początku każdego roku. Znajdź postać zwartą
dla tych funkcji tworzących.
b) Znajdź wartość średnią i odchylenie standardowe dla wieku wina w
każdej beczce, przy tych samych założeniach. Jaki jest średni wiek
sherry, gdy się ją butelkuje? Jaka część ma dokładnie 25 lat?
c) Weźmy teraz pod uwagę skończoność czasu: Przypuśćmy, że wszyst­
kie trzy beczki wina zawierają nowe wino na początku roku 0. Jaki
jest średni wiek sherry, która jest butelkowana na początku roku n?
46. Stefan Banach nosił ze sobą stale dwa pudełka zapałek, każde zawiera­
jące początkowo n zapałek. Gdy chciał zapalić, wybierał losowe pudełko
z prawdopodobieństwem \ , niezależnie od poprzednich wyborów. Po wy­
ciągnięciu zapałki wkładał z powrotem pudełko do kieszeni (nawet gdy
pudełko stało się puste — wszyscy wielcy matematycy zwykli byli tak
robić). Gdy wybrał puste pudełko, wówczas wyrzucał je i sięgał po nowe.
a) Raz stwierdził, że również drugie pudełko było puste. Jakie jest praw­
dopodobieństwo wystąpienia takiego zjawiska? Na przykład dla rt =
1 zdarzy się to średnio w połowie przypadków, a dla n = 2 w 3 / 8
przypadków. Żeby odpowiedzieć na to pytanie, znajdź postać zwartą
dla funkcji tworzącej P(w ,z) = ^ m n p m)TXw mzn , gdzie p m>TX jest
prawdopodobieństwem, że zaczynając z rt zapałkami w jednym pu­
dełku i rt w drugim, kiedy wyciągniemy puste pudełko, w drugim nie
będzie już też zapałek. Potem znajdź postać zwartą dla p n>n.
b) Uogólniając odpowiedź z części (a), znajdź postać zwartą dla praw­
dopodobieństwa tego, że gdy wyrzucane jest jedno puste pudełko, w
drugim jest dokładnie k zapałek.
c) Znajdź postać zwartą dla średniej liczby zapałek w drugim pudełku.
47. Pewna grupa lekarzy współpracująca z fizykami odkryła ostatnio parę
mikrobów rozmnażających się w szczególny sposób. Samiec mikroba, na­
zywany dwufagiem, ma dwa receptory na swojej powierzchni ciała, a
samica, nazywana trójfagiem, ma trzy receptory:
dwufag:
trójfag:
receptor: □
„Szybkie obliczenie
arytmetyczne
pokazuje, że sherry
ma zawsze co
najm niej trz y lata.
Od dalszych
obliczeń zacznie
nam szumieć ju ż
w głowie.”
Revue du vin de
France
(listopad 1984)
Również dla liczby
zapałek w pustym
pudełku.
8, Prawdopodobieństwo dyskretna
11.
480 t
Gdy kulturę dwufagów i trójfagów napromieniujemy cząstką psi, wówczas
dokładnie jeden z receptorów jednego z fagów absorbuje cząstkę, każdy z
nich z jednakowym prawdopodobieństwem. Jeśli był to receptor dwufaga,
to dwufag przemienia się trójfaga, a jeśli był to trójfag, to rozdziela się
on na dwa dwufagi. Tak więc jeśli eksperyment zaczyna się z jednym
dwufagiem, to pierwsza cząstka psi zmieni go w trójfaga, druga rozdzieli
go na dwa dwufagi i trzecia cząstka przekształci jednego z dwufagów na
trójfaga. Czwarta cząstka zostanie zaabsorbowana albo przez dwufaga,
albo przez trójfaga i powstaną albo dwa trójfagi (prawdopodobieństwo
| ) , albo trzy dwufagi (prawdopodobieństwo | ) . Znajdź zwartą postać
dla średniej liczby dwufagów, jeśli zaczęliśmy z jednym dwufagiem i n
razy napromieniowaliśmy kulturę pojedynczą cząstką psi.
48. Pięć osób stoi w wierzchołkach pięciokąta, rzucając między sobą latający
krążek.
Mają oni dwa krążki, które początkowo znajdują się w sąsiednich wierz­
chołkach, jak pokazano na rysunku. W każdej jednostce czasu, każdy krą­
żek rzucany jest na lewo lub na prawo (wzdłuż boków pięciokąta) z takim
samym prawdopodobieństwem. Kontynuujemy ten proces, aż jedna osoba
otrzyma obydwa krążki równocześnie. Wtedy kończymy grę. (Wszystkie
rzuty są niezależne od poprzednich.)
a) Znajdź wartość średnią i wariancję długości gry.
b) Znajdź zwartą postać dla prawdopodobieństwa, że gra trwa ponad
1 0 0 kroków jako funkcję zależną od liczb Fibonacciego.
49. Lukę Snowwalker spędza zimowe ferie w swojej górskiej chatce. Na fron­
towej werandzie stoi u niego m par butów, a na tylnej rt par. Gdy Lukę
chce wyjść z chaty, rzuca (wyważoną) monetą, żeby zdecydować, czy
wyjść przez frontową werandę, czy też przez tylną, a potem zakłada parę
butów z wybranej werandy. Z prawdopodobieństwem \ wróci przez tę
samą werandę, niezależnie od tego, przez którą wyszedł, i zostawi buty
na werandzie, przez którą wrócił. Tak więc po jednej przechadzce będzie
m + [—1, 0 , lub + 1 ] par butów na frontowej werandzie i n — [—1 , 0 , lub + 1 ]
par na tylnej. Jeśli wszystkie buty znajdą się na jednej z werand, a Lukę
będzie chciał wyjść przez drugą, to wyjdzie bez butów i przemarznie, tak
że skończy swoje ferie. Zakładamy, że Lukę chodzi na spacery aż przemarźnie. Niech Pis^r^n) będzie prawdopodobieństwem, że odbędzie on
dokładnie N wędrówek bez przemarznięcia, zaczynając z m parami bu­
tów na frontowej werandzie i rt parami butów na tylnej. Tak więc, jeśli
m i u są dodatnie, to
PN(m,n) =
+
+ ^P n - i (tu + 1 ,n — 1),
co wynika z faktu, że pierwsza przechadzka jest albo front/tył, albo
front/front, albo tył/tył, albo tył/front, każda z prawdopodobieństwem
i pozostanie dalej N —1 wyjść.
a) Dokończ rekurencję dla PN(m,n), znajdując wzory, które zachodzą
też gdy m = 0 lub n = 0. Zastosuj tę rekurencję, żeby uzyskać
równania pomiędzy funkcjami tworzącymi prawdopodobieństw
gm,n(z) = ^ P N ( m , n ) z N .
N^O
b) Zróżniczkuj swoje równania i podstaw z = 1, uzyskując w ten sposób
związki pomiędzy wielkościami g^nO )- Rozwiąż te równania uzy­
skując wartość średnią na liczbę wędrówek przed przemarznięciem.
c) Pokaż, że gm>TL ma zwartą postać, jeśli podstawimy z = 1/cos2 0:
( 1 \
Vcos2 0 /
9 m ,n (
sin(2m + 1)0 + sin(2n + 1)0
1 To
TTn
sm(2m
+ 2rt +i 2)0
*
50. Rozważmy funkcję
H(z) = 1 +
(z - 3 + ^(1 - z)(9 - z) ) •
Celem tego zadania jest udowodnienie, że H(z) =
jest funk­
cją tworzącą prawdopodobieństwa i uzyskanie podstawowych własności
takiego rozkładu.
a) Niech (1 —z)3/2(9 —z)1/2 = X.k$>ockzk- Udowodnij, że co = 3, ci =
-1 4 /3 , c2 = 37/27 i c3+l = 3 ^ k (£) (3^ ) ( | ) k+3 dla wszystkich
1 ^ 0. Wskazówka: Zastosuj tożsamość
(9 - z ) V 2 =
3 (1 - z ) V 2(1 + | z / ( 1 - * ) ) V 2
i rozwiń ostatni współczynnik w potęgi z/(1 —z).
b) Zastosuj część (a) i ćwiczenie 5.81 do pokazania, że wszystkie współ­
czynniki funkcji H(z) są dodatnie.
c)
Udowodnij zaskakującą tożsamość
y T = W )
~
\ l ~ z + 1 -
d) Jaka jest wartość średnia i wariancja dla H?
51. Loteria stanowa w El Dorado korzysta przy wypłatach z rozkładu lo­
sowego H zdefiniowanego w poprzednim ćwiczeniu. Każdy los kosztuje
1 dublon i wygraną jest k dublonów z prawdopodobieństwem Hic. Twoja
szansa wygrania, gdy masz dany los, jest zupełnie niezależna od szansy
dla innych losów. Innymi słowy, wygrana lub przegrana z jednym losem
nie zmienia prawdopodobieństwa wygranej w przypadku, gdybyś nabył
dowolny inny los na tej samej loterii.
a) Przypuśćmy, że zaczynasz z jednym dublonem i grasz według nastę­
pującej strategii: Jeśli wygrasz k dublonów, to nabywasz k losów w
drugiej grze. Bierzesz potem całą wygraną z drugiej gry i kupujesz
za nią losy na trzecią grę, i tak dalej. Jeśli żaden z twoich losów nie
wygrał, to jesteś bankrutem i kończysz grę. Pokaż, że ftp dla twojego
aktualnego stanu posiadania po n rundach takiej gry wynosi
1 ____________ 4__________ _____________4___________
V(9 —z)/( 1 —z) + 2n —1 + V ( 9 - z ) / ( 1 - z ) + 2 n + 1 '
b) Niech g^ będzie prawdopodobieństwem tego, że przegrasz wszystkie
pieniądze (po raz pierwszy i ostatni) w n-tej grze i niech G(z) =
g!Z + g2^2 + • • •. Udowodnij, że G(1) = 1. (To oznacza, że z praw­
dopodobieństwem zbiegającym do 1 przegrasz wszystko prędzej czy
później, chociaż możesz się nieźle bawić grając do tego czasu.) Jakie
są wartość średnia i wariancja dla G?
c) Jaka jest średnia liczba losów, które kupisz, jeśli grasz aż do bankruc­
twa?
d) Jaka jest średnia liczba gier aż do bankructwa, gdy zaczynasz nie z
jednym, lecz z dwoma dublonami?
Zadania dodatkowe
52. Pokaż, że podane w tekście definicje mediany i dominanty dla zmiennych
losowych odpowiadają w sensowny sposób definicjom mediany i domi­
nanty dla ciągów, gdy przestrzeń losowa jest skończona.
53. Udowodnij następujące stwierdzenie lub znajdź kontrprzykład: Jeśli X, Y
i Z są zmiennymi losowymi, takimi że wszystkie trzy pary (X,Y), (X,Z)
i (Y, Z) są niezależne, to X + Y jest niezależne od Z.
54. Wzór (8.20) dowodzi, że wartość średnia dla VX wynosi VX. Jaka jest
wariancja dla VX?
55. Normalna talia kart zawiera 52 karty, po cztery wartości w zbiorze {A,
2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,1 0 , J,Q,K}. Niech X i Y oznaczają odpowiednio warto­
ści pierwszej i ostatniej karty w talii. Rozważmy następujący algorytm
tasowania kart:
51) Przepermutuj wszystkie karty losowo tak, aby każda permutacja wy­
stąpiła z prawdopodobieństwem 1/52!.
52) Jeśli X / Y, to rzuć niewyważoną monetą, na której orzeł wypada
z prawdopodobieństwem p, i przejdź z powrotem do kroku SI, gdy
wypadł orzeł. W przeciwnym razie zatrzymaj się.
Załóżmy, że każdy rzut monetą i każda permutacja są niezależne od in­
nych zdarzeń. Jaka wartość p uczyni X i Y niezależnymi po zakończeniu
tej procedury?
56. Uogólnij problem rzucania krążkami z ćwiczenia 48, przyjmując, że za­
miast pięciokąta mamy m-kąt. Jaka jest wartość średnia i wariancja dla
liczby bezkolizyjnych rzutów, gdy krążki znajdują się początkowo w są­
siednich wierzchołkach? Pokaż, że jeśli m jest nieparzyste, to ftp dla
liczby rzutów może być przedstawiona jako iloczyn rozkładów dla rzuca­
nia monetą:
(m-1)/2
Wskazówka: Zastosuj podstawienie z = 1/cos2 0.
57. Udowodnij, że w grze Penneya wzorzec Ti t 2 ... Ti_iTi zawsze jest gorszy
niż wzorzec T2Ti t 2 ... t i - i dla wyważonych monet i l ^ 3.
58. Czy istnieje ciąg A = TiT2 ... Ti_iTi orłów i reszek taki, że obydwa ciągi
0ttT2 ... Ti-i i R tit2 .. .Ti_i będą jednakowo dobre przeciw A w grze
Penneya?
59. Czy istnieją wzorce A i B składające się z orłów i reszek takie, że A jest
dłuższe niż B, a mimo to A pojawi się przed B częściej niż w połowie gier
wyważoną monetą?
60. Niech k i n będą ustalonymi liczbami dodatnimi z k < n.
a) Znajdź postać zwartą dla funkcji tworzącej prawdopodobieństwa
m
m
...,HTX;k)zP(H1
dla rozkładu łącznego liczby porównań potrzebnych do znalezienia
k-tego i n-tego obiektu wstawionego do tablicy haszującej o m listach.
b) Chociaż zmienne losowe P (h i, . . . ,
k) i P (h i, . . . , Hn ;n) są zale­
żne, to pokaż, że są one jednak częściowo niezależne:
E(P(h 1, . . . , h u ; k ) P ( H i , . . . , h 1l ;n))
= ( E P ( h i,...,h n ;k))(EP(H1........h n ;n ) ) .
61. Zastosuj wynik z poprzedniego ćwiczenia do udowodnienia wzoru (8.104).
62. Kontynuując ćwiczenie 47, znajdź wariancję dla liczby dwufagów po n
napromieniowaniach.
Problem y badawcze
63. Rozkład normalny jest ciągłym rozkładem losowym charakteryzującym
się tym, że wszystkie jego półniezmienniki są zerowe, poza wartością śred­
nią i wariancją. Czy istnieje łatwy sposób na stwierdzenie, że demy ciąg
półniezmienników ( ki , k2) K 3 , . . . ) pochodzi z rozkładu dyskretnego? (W
rozkładzie dyskretnym wszystkie prawdopodobieństwa muszą być „ato­
mami.” )
1P1 A sym ptotyka
Dokładne odpowiedzi są doskonałe, kiedy możemy je uzyskać; jest coś fascy­
nującego w posiadaniu pełnej wiedzy. Niemniej istnieją przypadki, w których
dopuszczamy rozwiązania przybliżone. Jeżeli natkniemy się na sumę czy rów­
nanie rekurencyjne, którego rozwiązanie nie ma postaci zwartej (przy naszej
aktualnej wiedzy), chcielibyśmy jednak coś na temat tego rozwiązania wie­
dzieć. Nie możemy się upierać, że albo wszystko, albo nic. Zresztą, jeśli nawet
mamy postać zwartą odpowiedzi, to w dalszym ciągu nasza wiedza może nie
być całkowita, w przypadku, gdy nie wiemy, jak porównać odpowiedź z in­
nymi wzorami w postaci zwartej.
Na przykład, nie jest (jak dotąd) znana postać zwarta sumy
Niemniej dobrze wiedzieć, że
mówimy, że wartość sumy jest „asymptotyczna do” 2(3t[l). Jeszcze lepiej jest
jednak mieć dokładniejszą informacje, w stylu
(9-i)
która daje nam „błąd względny rzędu 1/ n 2.” Ale nawet ta postać nie mówi
nam, jak duże jest Sn w porównaniu z innymi wartościami. Która z wartości
jest większa, Sn czy liczba Fibonacciego F4n? Odpowiedź: prawdą jest, że
S2 = 22 > Fg = 21, jeśli n = 2, ale dla odpowiednio dużych n liczba F4U jest
większa, ponieważ F4n ~ <ł>4n/V5 oraz 4>4 s* 6,8541, podczas gdy
Naszym zadaniem w trakcie lektury tego rozdziału będzie nauczenie się, jak
rozumieć i wyprowadzać podobne wyniki bez wielkiego bólu.
Słowo asymptotyczny ma grecki źródłosłów oznaczający „opadający ra­
zem.” Starożytni matematycy greccy, badając przecięcia stożka, rozważali
krzywe hiperboliczne takie, jak wykres funkcji y = v/T+~x2,
który ma dwie „asymptoty” y = x oraz y = —x. Krzywa przybliża się do
swoich asymptot, lecz nigdy się z nimi nie styka. W dzisiejszych czasach
używamy pojęcia „asymptotyczny” w znaczeniu znacznie szerszym, mając
na myśli przybliżoną wartość zbiegającą w kierunku wartości prawdziwej,
gdy pewien parametr zbiega do wartości granicznej. W naszym przypadku
„asymptotyczne” oznacza „prawie opadające równocześnie.”
Niektóre wzory mają bardzo trudne wyprowadzenia, znacznie wykracza­
jące poza zakres tej książki. My zadowolimy się przedstawieniem wstępnej
wiedzy dotyczącej badanej dziedziny. Naszym celem będzie przekazanie wła­
ściwych podstaw, umożliwiających konstruowanie bardziej złożonych tech­
nik. W szczególności będziemy zainteresowani znaczeniami symboli
oraz
‘O’, a także innych im. podobnych. Poznamy również podstawowe metody
postępowania z wielkościami asymptotycznymi.
9.1. H ierarchia
Stosowane w praktyce funkcje liczb całkowitych n mają zwykle różne „asym­
ptotyczne współczynniki przyrostu”. Jedne z nich osiągają nieskończoność
szybciej, inne wolniej. Ściślej rzecz ujmując,
f(n )
-< g (n )
lim
n - fo o g ( n j
= 0■
(9-3)
Powyższa relacja jest przechodnia. Jeżeli f(n) -< g{n) oraz g(n) -< H(n),
to f(rt) -< H(n). Możemy również napisać g(n) >- f(n), gdy f(n) -< g(n).
Ta notacja została zaproponowana przez Paula du Bois-Reymonda w roku
1871 [35].
Na przykład, rt -< n 2. Nieformalnie mówimy, że n rośnie wolniej niż n 2.
W rzeczywistości,
n a -< n p
<^=>
oc < |3 ,
(9.4)
gdzie oc i |3 są dowolnymi liczbami rzeczywistymi.
Oczywiście istnieje wiele funkcji zmiennej n poza potęgami n. Relacji
-< możemy użyć do określenia rzędu różnych funkcji i ich uszeregowania w
porządku asymptotycznym zawierającym pozycje takie, jak:
1 -<: log log n -< lo g n -< n e -< n c -< rtlogn -< cu
n n -< c°n .
(Gdzie e i c są dowolnymi stałymi spełniającymi zależność 0 < e < 1 < c.)
Wszystkie wymienione powyżej funkcje, poza funkcją stałą 1, zmierzają
do nieskończoności przy rt dążącym do nieskończoności. Oznacza to, że gdy
chcemy umieścić nową funkcję w tej hierarchii, nie staramy się rozstrzygnąć
czy osiąga nieskończoność, ale raczej ja k szybko to robi.
Pozytywny wpływ na nasze nastawienie podczas analizy asymptotycz­
nej może mieć m y ś l e n i e z r o z m a c h e m , gdy próbujemy wyobrazić sobie
zmienną osiągającą nieskończoność. Na przykład zgodnie z powyższą hierar­
chią zachodzi lo g n -< ri0,0001, co może wydawać się bujdą, jeśli ograniczymy
się do tyci-tyci liczb jak „jeden gigant”, n = IO100. Dla tego przypadku
lo g n = 100, podczas gdy n 0,0001 to tylko IO0,01 « 1, 0233. Niemniej, gdy
pójdziemy dalej do giganteksu, n = IO10 , to lo g n = IO100 wysiada w
porównaniu z n 0’0001 = IO10' 6.
Nawet gdy e jest niezwykle małe (powiedzmy, mniejsze niż 1/ 1010 ),
wartość lo g n będzie zdecydowanie mniejsza niż wartość n e , dla n odpo­
wiednio dużych. I tak dla ustalonego n = IO10 , gdzie k jest tak duże,
że e ^ 10_k, otrzymujemy lo g n = 102k, podczas gdy n e ^ IO10 . Zatem
stosunek (log n ) / n e osiąga zero przy n —> 00 dla każdego e > 0.
Powyższa hierarchia zajmuje się funkcjami rozbiegającymi do nieskoń­
czoności. Często jednak jesteśmy zainteresowani funkcjami zbiegającymi do
zera, zatem przydatna będzie hierarchia je porządkująca. Hierachia otrzy­
mana przez użycie odwrotności funkcji jest dobrze zdefiniowana dla funkcji
f (n) i g(n) zbliżających się do zera, ale nigdy zera nie osiągających, ponieważ
f(n) -i g(n)
^
^ -± -y
(9.6)
I tak, na przykład, następujące funkcje (poza ostatnią) wszystkie zbiegają do
zera:
_ 1_
c cn
1
Jł_
nn
J_
cn
_ J ____ J _
n los n
nc
_1_
ne
____1
lo g n
log log n
1
Przyjrzyjmy się kilku innym funkcjom, próbując znaleźć ich miejsce w
hierarchii. Liczba 7t(n) mówi nam, ile jest liczb pierwszych nie większych
niż n. Jej wartość to w przybliżeniu n /ln n . Ponieważ l/r t e -< 1/ l n n X 1,
więc mnożąc całe wyrażenie przez n otrzymujemy
n 1_e -< 7t(n) -< u .
Możemy teraz uogólnić wzór (9.4) zauważając, że
n ai (lo g n )a2(loglogn )*3 -< n 131 (lo g n )132(loglogn)^3
[0i u 0i2, 0C3) < (P i,P 2,P 3).
(9-6)
Tu *(<xi, (X2 , 0C3) < ( P i, P2 , P3 )’ oznacza porządek leksykograficzny (porządek
słownikowy). Innymi słowy, albo oci < Pi, albo oc1 = pi oraz ct2 < P2 , albo
oc-[ = Pi oraz oc2 = P2 i <*3 < P3A co z funkcją eV logn, jakie jest jej miejsce w hierarchii? Na takie pytania
możemy odpowiadać używając reguły
e f(n)
e g(n)
4=^
lim
(f(n) — g(n)) =
— 00,
(9.7)
którą można wyprowadzić biorąc logarytmy obu stron definicji (9.3). Zatem
1 -< f(n) -< g(n)
=>
e |f(n)l
e lg(n)l.
Ponieważ 1 -< log lo g n -< ^ /\o g n -< e lo g n , mamy też lo g n -< e ^/l°SVi -< n e.
W przypadku, gdy dwie funkcje f(n) oraz g(n) mają ten sam współ­
czynnik przyrostu, napiszemy *f(n) x g (n )’. Bardziej formalnie:
f(n) x g(n)
|f(n )| ^ C |g(n)| oraz |g(n)| ^ C |f(n )|,
dla pewnej stałej C oraz
wszystkich odpowiednio dużych n.
(9.8)
Powyższy przypadek zachodzi np. wtedy, gdy f (n) jest funkcją stałą, a g(n) =
cosn + arctgn. Udowodnimy później, że zachodzi on zawsze dla dowolnych
funkcji f(n) i g(n) będących wielomianami tego samego stopnia. Istnieje
również silniejszy związek, odpowiadający regule
f(n) ~ g(n)
<*=*■
lim
n->oo g(n)
= 1.
(9.9)
W przypadku tym powiemy, że funkcja ,,f(n) jest asymptotyczna do g (n ).”
G. H. Hardy [179] zaproponował ciekawe, ważne pojęcie nazywane klasą
fun kcji logarytmiczno-wykładniczych , zdefiniowaną rekurencyjnie jako naj­
mniejsza rodzina funkcji £ spełniających następujące warunki:
•
•
•
•
•
Funkcja stała f (n) = oc należy do £, dla wszystkich rzeczywistych oc.
Funkcja tożsamościowa f (n) = n należy do £.
Jeżeli f(n) i g(n) należą do £, to również f(n) — g(n) należy do £.
Jeżeli f(n) należy do £, to również
należy do £.
Jeżeli f(n) należy do £ oraz jest „w końcu dodatnia,” to również ln f(n )
należy do £.
Funkcja f(rt) nosi miano „w końcu dodatniej”, jeżeli istnieje liczba cał­
kowita no taka, że f(rt) > 0 dla wszystkich n ^ no.
Używając powyższych reguł możemy na przykład pokazać, że f(n) +
g(n) należy do klasy £ , gdy f(n) i g(n) do niej należą, ponieważ f (n) +
g(n) = f(n) — (0 — g(n)). Jeżeli f(n) oraz g(n) są w końcu dodatnimi funk­
cjami należącymi do £, to ich iloczyn f(n )g (n ) = e lnf(1x)+lll9(rL) oraz iloraz
f(rt)/g(rt) = e lnf(TL) - ln9(TL) również należą do £, są zatem funkcjami po­
dobnymi do y / i (n) = e2 lnf(n)>itd. Hardy pokazał, że każda fukcja logarytmiczno-wykładnicza jest w końcu dodatnia, w końcu ujemna lub odpowiada
tożsamościowo zeru. Stąd też zarówno iloczyn, jak i iloraz dowolnych dwóch
£-funkcji należą do £, wykluczając dzielenie przez funkcję tożsamościowo
równą zeru.
Główne twierdzenie Hardy’ego dotyczące funkcji logarytmiczno-wykładniczych mówi, że funkcje te tworzą hierarchię asymptotyczną. Jeżeli f(n)
oraz g(rt) są funkcjami z £, to albo f(rt) -< g(rt), albo f(n) >- g(n), albo
f (rt) x g(n). W ostatnim przypadku, faktycznie, istnieje stała oc taka, że
f(n) -
ag(n).
Dowód twierdzenia Hardy’ego wykracza poza zakres tej książki. Niemniej
dobrze zdawać sobie sprawę z tego, że takie twierdzenie istnieje, ponieważ
prawie wszystkie funkcje, z jakimi mamy do czynienia, należą do £. W prak­
tyce najczęściej możemy umieścić daną funkcję w hierarchii bez większych
kłopotów.
9.2. N o ta cja O__________________________________
W roku 1894 matematyk niemiecki Paul Bachmann zaproponował znako­
mitą konwencję notacyjną w analizie asymptotycznej, spopularyzowaną w
późniejszych latach przez Edmunda Landaua i innych. Jej użycie widzieli­
śmy w takich wzorach, jak
Hn = lnrt + y + 0 ( 1 / r t ) ,
który mówi nam, że n-ta liczba harmoniczna jest równa sumie logarytmu
naturalnego z n, stałej Eulera oraz wielkości będącej „Dużym O od 1 nad n.”
„... wir durch das
Zeichen 0 (n) eine
GróSe ausdriicken,
dereń Ordnung in
Bezug auf n die
Ordnung von n
nicht uberschreitet;
ob sie wirklich
Glieder von der
Ordnung n in sich
enthalt, bleibt bei
dem bisherigen
SchluBverfahren
dahingestellt.”
P. Bachmann [17]
Wartość ostatniego składnika nie jest sprecyzowana. Niemniej jednak, nieza­
leżnie od jego wartości, notacja ta zapewnia, że jego wartość bezwzględna nie
przewyższa wartości 1/rt pomnożonej przez pewną stałą.
Piękno notacji O wyraża się poprzez ukrycie nieistotnych szczegółów, co
pozwala skoncentrować uwagę na cechach znaczących: Wielkość 0 (1/rt) jest
pomijalnie mała, jeżeli stała stojąca przy 1/rt jest dla nas bez znaczenia.
Również użycie O wewnątrz wzoru powinno być poprawne. Chcąc wy­
razić wzór (9.10) przy użyciu notacji z rozdziału 9.1, zmuszeni jesteśmy do
przeniesienia ‘lnrt + y ’ na lewą stronę, otrzymując słabszy wynik
Hu —Inn —y -<
log logn
n
lub silniejszy
Hn —ln n —y x
To nie jest nonsens,
ale sensu też
nie ma.
Notacja Dużego O zapewnia od razu odpowiedni poziom precyzji, pozwalając
na uniknięcie przenoszenia.
Rozważenie kilku dodatkowych przykładów powinno wyjaśnić przydat­
ność użycia niedoprecyzowanych wielkości. Czasami używamy oznaczenia
‘±1 ’ do określenia czegoś będącego +1 albo —1, nie wiedząc (czy może nie
dbając o to), czym jest w rzeczywistości. Mimo to możemy tym manipulować
wewnątrz wzorów.
N. G. de Bruijn we wstępie do swojej książki Asymptotic Methods in Analysis [49] wprowadza notację Dużego L ułatwiającą zrozumienie Dużego O.
Używając zapisu L(5) na określenie liczby, której wartość bezwględna jest
mniejsza niż 5 (bez precyzowania jej dokładnej wartości), możemy wyko­
nywać różne obliczenia nie posiadając pełnej wiedzy. Na przykład, możemy
wyprowadzać wzory takie, jak 1 +L (5) = L(6); L(2) + L(3) = L(5 ); L(2 )L(3) =
L(6); eL^ = L(e5), i tak dalej. Nie możemy jednak wnioskować, że L(5) —
L(3) = L(2), ponieważ lewa strona może odpowiadać 4 —0. W rzeczywistości,
jedyne, co możemy powiedzieć, to L(5) —L(3) = L(8).
Notacja O Bachmanna przypomina notację L, jest jednak jeszcze mniej
precyzyjna: O (a) odpowiada liczbie, której wartość bezwzględna jest równa
co najwyżej iloczynowi pewnej stałej i |a|. Nie precyzujemy wartości liczby,
więcej, nie mówimy nic na temat stałej. Oczywiście pojęcie „stałej” nie ma
sensu w przypadku, gdy nie ma żadnej zmiennej wewnątrz 0 (*)- Zatem
rozsądne jest używanie notacji O wyłącznie w kontekście, w którym wartość
przynajmniej jednej wielkości (powiedzmy n) jest zmienna. W powyższym
kontekście wzór
f(n) = 0 (g (n ))
dla wszystkich n
mówi nam, że istnieje stała C taka, że
KM
^ C |g(n)|
dla wszystkich rt;
(9*12)
w przypadku, gdy 0 (g (u )) użyte jest wewnątrz innego wzoru, reprezen­
tuje funkcję f(n) spełniającą wzór (9.12). Wartości f(n) pozostają nieznane,
wiemy jednak, że nie są zbyt duże. Podobnie, wielkość L(n) powyżej repre­
zentuje nie sprecyzowaną funkcję f (rt), której wartości spełniają |f(rt)| < |n|.
Główna różnica pomiędzy L i O jest taka, że notacja O wplata nie sprecy­
zowaną stałą C. Każde pojawienie się O może wpleść następne C, niemniej
każde C jest niezależne od tl.
Na przykład wiemy, że suma kwadratów pierwszych tl liczb naturalnych
wyraża się wzorem
□n
^ u ( n + l ) ( n + 1) = ^ n 3 + \ n 2 + \ n .
Możemy zapisać
□„
= 0 ( n 3)
ponieważ | i n 3+ i n 2+ i n | ^ 5 |n |3+ | | n | 2+ | | n | ^ j |n 3|+ ^ |n 3| + | | n 3| = |n3|
dla wszystkich całkowitych u. Podobnie prawdziwy jest bardziej precyzyjny
wzór
□n
= j n 3 + O (n2) .
Możemy być również mniej staranni, tracąc cześć informacji, mówiąc, że
□ n = 0 ( n 10) .
Definicja O nie zmusza nas do formułowania najlepszych oszacowań.
Ale zaraz. Co się stanie, gdy zmienna n nie jest całkowita? Kiedy mamy
wzór taki jak S(x) = ^x3 + ^x2 + |x , gdzie x jest liczbą rzeczywistą? Nie
możemy teraz powiedzieć, że S(x) = 0 (x3), ponieważ stosunek S (x )/x 3 =
j + ^x_1 + \ x ~ 2 przestaje być ograniczony przy x —>0. Nie możemy również
powiedzieć, że S(x) = 0 (x), ponieważ stosunek S (x)/x = ^x2 + ^x + \
przestaje być ograniczony, gdy x —> 00. Najwyraźniej nie możemy używać
notacji O wraz z S(x).
Rozwiązaniem powyższego dylematu może być spostrzeżenie, że zmienne
używane wewnątrz O podlegają zazwyczaj warunkowi strony. Na przykład
jeżeli zastrzeżemy, że |x| ^ 1, albo że x ^ e, gdzie e jest dowolną stałą do­
datnią, albo że x jest całkowite, wtedy możemy napisać S(x) = 0 (x3). Jeżeli
zastrzeżemy, że |x| ^ 1, albo że |x| ^ c, gdzie c jest dowolną stałą dodat­
nią, to możemy napisać S(x) = 0 (x). Notacja O podlega prawom swojego
środowiska poprzez więzy nałożone na zmienne.
Te więzy są często określone przez zależności graniczne. Na przykład
możemy powiedzieć, że
f(n) = 0 (g(n))
przy n
OO.
( 9 - 13 )
Oznacza to, że warunek O jest spełniony dla rt „bliskich” 00. Nie dbamy o to,
co się dzieje, dopóki rt nie jest odpowiednio duże. Ponadto, nie precyzujemy
dokładnie pojęcia „bliski” . W takich przypadkach wystąpienie O niejawnie
zakłada istnienie dwóch stałych, C oraz uq, takich że
^ C | g (rt) |
You are the fairest
of your sex,
Let me be your
hero;
I love you as
one over x,
As x approaches
zero.
Positively.
dla wszystkich rt ^ rio.
Wartości C oraz no mogą być różne dla każdego O, nie zależą jednak od rt.
Podobnie, notacja
f(x) = 0 (g (x ))
przy x —» 0
oznacza, że istnieją dwie stałe C oraz e takie,
|f(x)| ^ C|g(x)|
że
dla wszystkich |x| ^
e.
(915)
Graniczna wartość nie musi odpowiadać 00 czy 0 . Równie dobrze możemy
napisać
ln z = z —1 + 0 ( ( z —I)2)
„And to auoide the
tediouse repetition
of these woordes: is
eąualle to: I will
sette as I doe often
in woorke use, a
paire of paralleles,
or Gemowe lines of
one lengthe, thus:
■■■
, bicause
noe .2. thynges, can
be moare eąualle.”
R. Recorde [306]
914)
( -
przy z
1.
ponieważ możemy udowodnić, że | ln z —z + 11 |z — 112, gdy |z — 11^ \ .
Nasza definicja O stopniowo rozrosła się na tych kilku stronach z czegoś
całkiem oczywistego do czegoś dość skomplikowanego. Mamy teraz O re­
prezentujące niezdefiniowaną funkcję oraz dodatkowe dwie niesprecyzowane
stałe, zależne od środowiska. Może to wyglądać na wystarczająco skompliko­
waną definicję każdej rozsądnej notacji, ale na tym nie koniec! Nie powinni­
śmy pominąć czającego się w tle następującego problemu. Musimy zdać sobie
sprawę, że możemy napisać
^rt3 + j n 2 +
= 0 ( n 3) ,
podczas gdy nigdy nie wolno nam napisać powyższej równości z przesta­
wionymi stronami. W przeciwnym razie moglibyśmy wywnioskować absurd,
taki jak rt = rt2, korzystając z równoważności rt = 0(rt2) oraz rt2 = 0(rt2).
Kiedy korzystamy z notacji O, używając wzorów z nieprecyzyjnie określo­
nymi wielkościami, to mamy do czynienia z równościami jednostronnymi.
Prawa strona równania nie dostarcza więcej informacji niż lewa, a może mniej.
Prawa strona jest „rozmyciem” lewej.
Ze ściśle formalnego punktu widzenia, zapis 0 (g(rt)) nie jest użyty do
określenia jednej funkcji f(n ), lecz całego zbioru funkcji f(n) takich, że
M l ^ C |g(n)|, dla pewnej stałej C. Zwykły wzór g(n) nie zawierający no­
tacji O odpowiada zbiorowi zawierającemu pojedynczą funkcję f(n) = g(n).
Jeżeli S oraz T są zbiorami funkcji zmiennej n, to oznaczenie S + T odpo­
wiada zbiorowi wszystkich funkcji postaci f(n) + g(n), gdzie f (n) G S oraz
g(n) G T. Inne oznaczenia, takie jak S — T, ST, S/T, y/S, es , InS definiujemy
podobnie. Zatem „równość” umieszczona pomiędzy takimi zbiorami funkcji
jest, ściśle mówiąc, zaw ieraniem zbiorowym. Znak ł=* w rzeczywistości re­
prezentuje znak ‘C \ Powyższe definicje formalne dają silną podstawę logiczną
przekształceniom wyrażeń typu O.
Na przykład przez „równanie”
^n3 + 0(rt2) = 0(rt3)
rozumiemy, że Si C S2, gdzie Si jest zbiorem wszystkich funkcji postaci
| n 3 + fi (n) takich, że istnieje stała Ci, dla której |fi(n )| ^ C-||n2|, oraz
S2 jest zbiorem wszystkich funkcji f2(n) takich, że istnieje stała C2, dla
której |f2 (ti) | ^ C2|rt3|. Możemy formalnie udowodnić powyższe „równanie”
pokazując, że dowolny element lewej strony należy również do prawej. Przy
danym | u 3+ f 1(n) takim, że |f 1(rt) | ^ Ci |n2|, musimy udowodnić, że istnieje
stała C2 taka, że |^ n 3 + f i (rt)| ^ C2|rt3|. Użycie stałej C2 = \ + Ci okazuje
się wystarczające, ponieważ n 2 ^ |n31, dla wszystkich naturalnych rt.
Jeżeli znak ‘=* w rzeczywistości oznacza ‘C*, to dlaczego zamiast nad­
używać znak równości nie użyjemy ‘C’ ? Są ku temu cztery powody.
Pierwszy— tradycja. Uczeni zajmujący się teorią liczb zaczęli używać
notacji O ze znakiem równości i zwyczaj ten się utrwalił. Jest on obecnie
na tyle uznany, że nie możemy mieć nadziei, iż społeczność matematyczna
przyjmie jego zmianę.
Drugi — tradycja. Ludzie pracujący z komputerami przyzwyczaili się cał­
kowicie do oglądania nadużytego znaku równości— od lat programiści języ­
ków FORTRAN oraz BASIC pisali znak przypisania w postaci ‘N = N + V.
Jedno więcej nadużycie to mimo wszystko niedużo.
Trzeci— tradycja. Często odczytujemy
jako słowo ‘jest’. Na przykład
wzór Hrt = O (logn) wyrażamy mówiąc, że „H en jest duże O od log n.” Po
angielsku to ‘jest’ jest jednostronne. Mówimy, że ptak jest zwierzęciem, ale
nie każde zwierzę jest ptakiem; „zwierzę” jest rozmyciem pojęcia „ptak”
W końcu czwarty powód— zapis ten jest naturalny dla naszych potrzeb.
Jeśli ograniczylibyśmy użycie notacji O do sytuacji, w których wypełnia ona
cała prawą stronę wzoru— tak jak w przypadku przybliżenia liczby harmo­
nicznej Hu = O (log n) czy przy opisie złożoności czasowej T (n) = O (n log n)
algorytmu sortującego— nie miałoby znaczenia, czy używamy *=’, czy czegoś
„To oczywiste,
że znak = jest
niewłaściwym
znakiem dla tego
typu zależności,
ponieważ sugeruje
on symetrię, której
nie ma. ...
Po otrzymaniu tego
ostrzeżenia, nie
widać wielkich
szkód, jakie
miałoby
spowodować użycie
znaku—, więc
będziemy go
stosowali z tej
choćby przyczyny,
że jest to
wygodne.”
N. G. de Bruijn [49]
innego. Lecz jeśli używamy notacji O wewnątrz wyrażenia, tak jak to zwykle
czynimy w obliczeniach asymptotycznych, naszej intuicji odpowiada zarówno
rozumienie znaku równości jako rzeczywistej równości, jak i interpretacji wy­
rażenia 0(1 /n ) jako bardzo małej wielkości.
Będziemy więc kontynuować użycie znaku *=’, ale 0 (g(n)) będziemy
rozumieć jako nie w pełni określoną funkcję, wiedząc, że w każdej chwili, gdy
zostaniemy do tego zmuszeni, możemy powrócić do definicji teoriozbiorowej.
Przyglądając się szczegółowo kruczkom definicyjnym, musimy zauważyć
jeszcze jedną dodatkową trudność techniczną. Jeżeli środowisko wzoru za­
wiera więcej niż jedną zmienną, to notacja O odpowiada formalnie zbiorowi
funkcji niejednej, lecz dwóch lub więcej zmiennych. Dziedziną dowolnej funk­
cji jest każda zmienna podlegająca rzeczywistym zmianom.
Takie podejście może się okazać troszeczkę za sprytne, ponieważ zmienna
może być zdefiniowana tylko w części wyrażenia, w której jest kontrolowana
przez Y. CZY c°ś podobnego. Na przykład przyjrzyjmy się bliżej równaniu
n
^ ( k 2 + 0 (k )) = -|n 3 + 0 ( n 2),
dla całkowitych rt ^ 0.
(9.16)
k=0
Wyrażenie k2 + 0 (k), po lewej, odpowiada zbiorowi funkcji dwóch zmiennych
postaci k2 + f(k,rt) takich, że istnieje stała C spełniająca |f(k ,n )| ^ Ck, dla
0 ^ k ^ n. Suma powyższego zbioru funkcji przy 0 ^ k ^ n jest zbiorem
wszystkich funkcji g(ri) postaci
n
^ 2 (k2+ f(k ,n )) =
+ \ n 2 + ^n + f(0,n ) + f ( l , n ) H-------|-f(n,T i),
k=0
gdzie funkcja f ma znaną nam własność. Ponieważ mamy
| \ n 2 4-
+ f (0, n) + f (1, rt) H-------1- f (n, rt) |
^ -jfTi2 -(- ^ti2 -ł- C •0 -|- C • 1 -j----- h C -n
< rt2 + C(n2 + n )/2 < (C + l)rt2 ,
(Nadszedł właściwy
czas na ćwiczenia
rozgrzewające,
3 oraz 4.)
więc wszystkie takie funkcje g(n) należą do prawej strony (9.16), pociągając
za sobą prawdziwość (9.16).
Ludzie nadużywają czasami notacji O, zakładając, że daje ona dokładny
porządek przyrostu. Używają jej do określania zarówno górnych, jak i dolnych
granic. Na przykład jakiś algorytm sortujący n liczb może być nazwany nie­
efektywnym, „ponieważ jego czas działania jest 0 (n2).” Z tego, że czas dzia­
łania jest 0 ( n 2) nie wynika jednak, że czas ten nie może być również 0 (n ).
Przy dolnych granicach używamy innej notacji, Duże Omega :
f(n) = Q (g (n ))
|f(n )| ^ C |g(n)| dla pewnego C > 0.(9.17)
Mamy f (n) = Q (g(n)) wtedy i tylko wtedy gdy g(rt) = 0(f(ri)). Algorytm
sortujący, którego czas działania jest Q (n2), jest nieefektywny w porównaniu
z pracującym w czasie O(rtlogrt), kiedy rt jest odpowiednio duże.
Na koniec dochodzimy do Dużego Theta, określającego dokładny porzą­
dek przyrostu:
f(n) = 0 (g(n))
4=4-
f(n) = 0 (g(n))
oraz f(n) = Q (g(n )).
(9-18)
Mamy f(n) = 0 (g (n )) wtedy i tylko wtedy, gdy f(n)
g(n) w notacji
użytej wcześniej w równaniu (9.8).
Edmund Landau [238] zaproponował notację „małego o” ,
f(n) = o(g(n))
<=>
|f(n)| ^ e|g(n)|
dla wszystkich rt no(e) i
wszystkich stałych e > 0.
(919)
Zasadniczo notacja małego o odpowiada relacji f(n) -< g(n) z (9.3). Dodat­
kowo mamy
f(n) ~ g(n)
f(n) = g(n) + o ( g ( n ) ) .
( 9 -2 ° )
Wielu autorów używa ‘o’ we wzorach asymptotycznych, lecz bardziej
bezpośrednie wyrażenie ‘O’ jest prawie zawsze preferowane. Na przykład
średni czas działania znanej metody zwanej „sortowaniem bąbelkowym” za­
leży od wartości asymptotycznej sumy P(n) = JL£=0 kTL_kk!/rt!. Podsta­
wowe metody asymptotyczne wystarczają, aby dowieść prawdziwości wzoru
P(n) ~ y^7m /2, co oznacza, że stosunek V{n)/yJnn/2 osiąga 1, przy rt —>00.
Jednak prawdziwe zachowanie się P(rt) można lepiej zrozumieć rozwijając
różnicę , P(rt) — ^ J n u /2 , a nie ich iloraz:
rt
P (n )Ą /7tn/2
P(n) - y/nn/2
1
10
20
0, 798
0,878
0,904
30
40
50
0,918
0,927
0,934
-0,253
-0 ,4 8 4
-0 ,5 3 8
-0,561
-0,575
-0,585
Świadectwo liczbowe w środkowej kolumnie nie wzbudza zbytniego szacunku.
Jest ono wyraźnie dalekie od dowodu, że ?{n)/y/nn/2 osiąga błyskawicznie 1,
jeśli w ogóle osiąga. Za to prawa kolumna wskazuje, że P(n) jest rzeczywiście
Ponieważ Cl oraz
0 są dużymi
greckimi literami,
więc O pojawiające
się w notacji O
musi odpowiadać
dużemu greckiemu
Omikron.
Ostatecznie,
to właśnie Grecy
wprowadzili
asymptotykę.
bardzo bliskie y m i/Ż . Zachowanie P(rt) będziemy mogli opisać dokładniej,
jeśli uda nam się wyprowadzić wzory postaci
P(tl) = y /n n /2 + 0 ( 1 ) ,
czy nawet ostrzejsze przybliżenia jak
P(n) = \J n n /2 - § + 0(1 / y / n ) .
Dowody wzorów typu O wymagają silniejszych metod analizy asymptotycz­
nej, lecz dodatkowy nakład pracy związany z poznaniem zaawansowanych
technik rekompensowany jest głębszym zrozumieniem płynącym z określenia
granic typu O.
Wiele algorytmów sortujących charakteryzuje się złożonością czasową po­
staci:
T(n) = A n l g n + B n + O (logn)
Zauważmy,
że log log logn
jest niezdefiniowane
dla
10.
przy pewnych stałych A oraz B. Analiza zakończona na etapie T (n) ~ A n lg n
nie daje pełnego obrazu. Wybór algorytmu sortującego wyłącznie na podsta­
wie wartości stałej A nie jest najlepszą strategią. Algorytmy za dobre ‘A ’
płacą często złym ‘B \ Ponieważ n l g n nie rośnie dużo szybciej niż n, więc
algorytm szybszy asymptotycznie (z niewiele mniejszą wartością A) może
być szybszy wyłącznie dla wartości n zasadniczo nie pojawiających się w
praktyce. Oznacza to, że niezbędne są metody asymptotyczne pozwalające
dodatkowo wyliczyć wartość B, gdy chcemy podjąć właściwą decyzję przy
wyborze rozwiązania.
Zanim zaczniemy gruntowne studia notacji O, porozmawiajmy o jeszcze
jednym, drobnym aspekcie matematycznego stylu. W rozdziale tym użyli­
śmy trzech różnych notacji rozważając logarytmy: lg, ln oraz log. Często, w
połączeniu z metodami komputerowymi, używamy £lg’, ponieważ logarytmy
dwójkowe najczęściej pojawiają się w tym kontekście. Równie często używa­
my ‘ln’ przy czysto matematycznych obliczeniach, ponieważ wzory dla logarytmów naturalnych są przyjemne i proste. A co w przypadku ‘log’? Czyż
nie jest to „powszechny” logarytm z podstawą 10, który uczniowie poznają w
szkole średniej — „powszechny” logarytm, który zdaje się być wyraźnie omi­
jany w matematyce i informatyce? Istotnie, wielu matematyków w rezultacie
powoduje zamieszanie, używając ‘log’ w znaczeniu zarówno logarytmu natu­
ralnego, jak i dwójkowego. Nie ma tu powszechnej zgody. Możemy jednak
odetchnąć z ulgą, gdy logarytm pojawia się wewnątrz notacji O, ponieważ O
zaniedbuje stałe multiplikatywne. Nie ma żadnej różnicy pomiędzy O (lgn),
O (Inn) oraz O (logn), przy n —> oo. Podobnie, nie ma różnicy pomiędzy
O (lglgn ), O (lnlnn) oraz O (log logn). Możemy wybrać to, co jest dla nas
najlepsze. I tak ‘log’ wydaje się być najwygodniejsze, ponieważ jest je najła­
twiej wymówić. Dlatego też, używamy zwykle ‘log’ we wszystkich tych sytu­
acjach, w których podwyższa to czytelność, bez wprowadzania dwuznaczno­
ści.
9.3. P rzek szta łcen ia ty p u O
Podobnie jak każdy formalizm matematyczny, notacja O podlega regułom
przekształceń uwalniającym nas od niemiłych szczegółów definicyjnych. Raz
udowodniwszy poprawność reguł przy użyciu formalnych definicji, możemy
później pracować na wyższym poziomie abstrakcji, zapominając o faktycz­
nym sprawdzaniu, czy jeden zbiór funkcji jest zawarty w drugim. Nie musimy
nawet obliczać stałych C pojawiających się wraz z każdym O dopóty, dopóki
postępujemy zgodnie z regułami gwarantującymi istnienie takich stałych.
Na przykład możemy raz na zawsze udowodnić, że
n
0 (nT
( 9 -21 )
0 (f(n)) + 0 (g(n)) = 0 (|f(n)| + |g(n)|).
Sekretem bycia
nudnym jest
powiedzenie
wszystkiego.
Yoltaire
(9 -22 )
Później możemy natychmiast powiedzieć, że 31n 3 +, i2ni^2 +, i6n = 0 (n3) +
0 ( n 3) + 0 ( n 3) = 0 ( n 3), unikając żmudnych obliczeń z poprzedniego roz
działu.
Oto kilka następnych reguł wynikających wprost z definicji:
f (n)
c • 0 (f(n))
0 ( 0 (f(n)))
0 (f(n)) 0 (g(n))
0 (f(n)g(n))
0 (f(n));
0 (f (n ) ) ,
( 9 -23 )
jeżeli c jest stałą;
(9-24)
0 (f(n));
(9-25)
0 (f(n)g(n));
(9 -26 )
f(n) 0 (g(n)) .
(9-27)
Ćwiczenie 9 zawiera dowód reguły ( 9 . 2 2 ) , reszta dowodów jest analogiczna.
Wzory o postaci z lewej strony możemy zawsze zastąpić ich prawostronnymi
odpowiednikami, nie zważając na ograniczenia obowiązujące zmienną tl.
Równania ( 9 . 2 7 ) oraz ( 9 . 2 3 ) implikują tożsamość 0 (f(n )2) = 0 (f(n ))2.
Czasem pomaga to uniknąć zbędnych nawiasów, ponieważ możemy napisać
O (logn)
zamiast
O ((logn)'
Obie postacie są bardziej pożądane niż niejednoznaczne ‘0 (log n ) ’ używane
przez niektórych autorów w celu uzyskania krótszego zapisu ‘O (loglogn )’.
(Uwaga: wzór
0(f(n))2 nie
oznacza zbioru
wszystkich funkcji
g{n)2 , gdzie g(n)
jest 0(f(n)).
Funkcje postaci
g (n)2 nie mogą
być ujemne, a zbiór
0(f(n))2 zawiera
takie funkcje.
W ogólności, jeżeli
S jest zbiorem,
notacja S2 oznacza
zbiór wszystkich
iloczynów S1S2,
dla si i s2
należących do S, a
nie zbiór wszystkich
kwadratów s2, dla
s e S .)
Czy możemy również napisać
O (logn) 1
zamiast
O ((logn) *)?
Nie! To byłoby już nadużyciem tej notacji, ponieważ zbiór funkcji 1/O (lo g n )
nie jest podzbiorem ani nadzbiorem 0 (1/lo g n ). Możemy legalnie zastąpić
0 ((lo g n )- 1 ) przez O (lo g n )- 1 , ale to może okazać się kłopotliwe. Ograni­
czymy więc użycie „wykładników na zewnątrz O” do dodatnich stałych
całkowitych.
Szeregi potęgowe dostarczają nam najbardziej użytecznych operacji. Je­
żeli suma
S(z) -
Y
anZn
n$>0
jest bezwzględnie zbieżna dla pewnej liczby zespolonej z = zo, to
S(z)
=
0 (1 ),
dla wszystkich \z\ ^ \z q \.
To jest oczywiste, ponieważ
|S(z}| ^ ^ j a J l z r
rt^O
= C < oo.
n^O
W szczególności, S(z) = 0 (1), jeśli z —» O, oraz S(1 /n ) = 0 (1), jeśli n —> oo,
pod jedynym warunkiem — szereg S(z) jest zbieżny dla przynajmniej jednej
niezerowej wartości z. Możemy używać tej zasady do obcinania szeregu potę­
gowego na dowolnie wybranej pozycji, szacując resztę za pomocą wyrażenia
typu O. Na przykład nie tylko S(z) = 0 (1), ale również
S(z) = a 0 + O (z),
S(z) = a0 + ai z + O (z2),
1 tak dalej, ponieważ
S(z} =
Y_ aiczk + zm n^m
X. a nZn_m-
O^kcm
Ostatnia suma, podobnie jak szereg S(z), jest zbieżna bezwzględnie przy
z = zo oraz jest 0 (1). Tabela 499 zawiera kilka najbardziej użytecznych
wzorów asymptotycznych, których połowa oparta jest wprost na obcięciu
szeregu potęgowego zgodnie z powyższą regułą.
Szeregi Dirichleta, będące sumami postaci
a k /k z, mogą być obci­
nane w podobny sposób. Jeżeli szereg Dirichleta jest zbieżny bezwzględnie
T abela 4 9 9 . Przybliżenia asymptotyczne, ważne przy rt —» oo oraz z —> 0
j- t i—L—44. o f — )
120tt4
\ n 6/
ni = 'y /h m ( U^
K e)
l 1 + 12n ‘ 288n 2
%
.*
51840n 3
przy z = zo, to możemy go obciąć na dowolnym wyrazie, otrzymując przy­
bliżenie
Y aTc/kz + 0(m_z),
1< ;k < m
prawdziwe dla 9łz
¥łzo. Asymptotyczna postać liczb Bernoulliego Bn w
tabeli 499 obrazuje tę zasadę.
Z drugiej strony, wzory asymptotyczne, w tabeli 499, dla liczb Hu , rt!
oraz 7t(n) nie są obcięciami zbieżnych szeregów. Jeżeli rozwiniemy je nieograniczenie, mogą okazać się rozbieżne dla wszystkich wartości rt. Łatwo to
zauważyć na przykładzie funkcji 7t(n). W podrozdziale 7.3 zaobserwowaliśmy
już (przy kład 5), że szereg potęgowy
k !/(ln n )k jest rozbieżny wszę­
dzie. Jednakże powyższe obcięcia okazują się użytecznymi przybliżeniami.
Powiemy, że błąd bezwzględny przybliżenia asymptotycznego jest równy
0 (g (rt)), jeżeli jest ono postaci f(n) + 0 (g (rt)), gdzie f(rt) nie zawiera O.
B łąd względny przybliżenia wynosi 0 (g(rt)), jeżeli jest ono postaci f(rt)(l +
0 (g(rt))), gdzie f(rt) nie zawiera O. Na przykład błąd bezwzględny przybli­
żenia liczby Hn. w tabeli 499 jest równy 0 (rt“ 6). Błąd względny przybliżenia
rt! z tej samej tabeli wynosi 0 (rt~4). (W rzeczywistości prawa strona (9.29)
nie jest przedstawiona w wymaganej postaci f (rt) (l + 0 ( n 4) ) , ale stanie się
tak, jeśli tylko zechcemy zapisać ją jako
1
288rt2
(Rozważanie błędu
względnego jest
wygodne
w przypadku
odwrotności,
ponieważ
139
) ( l + 0 ( n - 4));
51840rt3
podobne obliczenie jest treścią ćwiczenia 12.) Błąd bezwzględny tego przy­
bliżenia wynosi 0 (nn -3 ’5e-TL). Odpowiada on liczbie poprawnych cyfr w
rozwinięciu dziesiętnym części ułamkowej, przy pominięciu wyrazu O. Błąd
względny odpowiada liczbie poprawnych „cyfr znaczących.”
W dowodzie ogólnych praw możemy użyć obcięcia szeregu potęgowego:
1 /(1 + 0 (e )) =
1 + 0 ( e ).j
gdy f (n) -< 1;
(9-36)
gdy f(n) = 0 (1 ).
(9-37)
(Zakładamy tu, że rt
00.
Podobne wzory są prawdziwe dla ln(l + 0 (f(x
>0 (f (x))
orazprzy
x —> 0.) Na przykład niech ln(l + g(rt)) będzie dowolną
funkcją należącą do lewej strony (9.36). Istnieją wówczas stałe C, rto oraz c
takie, że
|g(n )| $ C |f( tl)|
sC c <
1
dla wszystkich rt ^ rto.
Wynika stąd, że suma nieskończona
ln (1 + g(n)) = g(n) • (1 - |g(n) + jg (n )2 ----- )
jest zbieżna dla wszystkich rt ^ n 0, a zamknięty w nawiasy szereg jest ograni­
czony przez stałą 1+ ^ c + | c 2H---- . Otrzymujemy dowód (9.36). Dowód (9.37)
przebiega analogicznie. Wykorzystując równania (9.36) oraz (9.37) otrzymu­
jemy użyteczny wzór
(1+0(f(„)))<™ "» . , + 0(f<n),,|n|)p
M )
Problem 1: Powrót do K oła Fortuny
Spróbujmy teraz naszego szczęścia z kilkoma innymi problemami asympto­
tycznymi. W rozdziale 3 wyprowadziliśmy równanie (3.13) na liczbę wygry­
wających pozycji w pewnej grze:
W = [N/KJ + ^K2 + | K - 3 ,
K = [v^ N J.
Wówczas obiecaliśmy, że asymptotyczna wersja W zostanie wyprowadzona
w rozdziale 9. Słowo się rzekło, jesteśmy w rozdziale 9. Spróbujmy zatem
oszacować W, przy N —» 00.
Głównym pomysłem będzie pozbycie się znaków podłogi, przez zastą­
pienie zmiennej K wyrażeniem N 1/3 + 0 (1). Kontynuując przekształcenia
dochodzimy do
K = N 1/3(1 + 0 ( N “ 1/3) ) .
Nazywamy to „wyciąganiem większej części.” (Później będziemy często sto­
sować ten chwyt.) Mamy teraz
K2 = N 2 /3 (1 + 0 (N -1 /3 ))2
= N 2/3( 1 + 0 ( N ~ 1/3)) = N2/3+ 0 ( N 1/3)
dzięki (9.38) oraz (9.26). Podobnie
[N/KJ = N 1_' /3(1 + 0 ( N - , / 3 ))-1 + 0 (1 )
= N2/3(1 + 0 ( N “ 1/3)) + 0 (1 ) = N2/3 + 0 ( N 1/3).
Zatem liczba wygrywających pozycji wynosi
W = N 2/ 3 + O fN 1/ 3) + 2 (N 2/3 + 0 (N ,//3)) + 0 (N 1/3) + 0 (1)
= 3 N 2/3 + 0 ( N i / 3)
(939)
Zauważmy, jak wyrazy O pochłaniają inne do momentu, aż pozostaje tylko
jeden. To jest bardzo typowa sytuacja. Obrazuje ona przydatność użycia
notacji O wewnątrz wzoru.
Problem 2: Zaburzenie wzoru Stirlinga
Niewątpliwie przybliżenie Stirlinga dla liczby rt! jest najbardziej znanym wzo­
rem asymptotycznym. Poprawność przybliżenia udowodnimy w dalszej części
rozdziału. Teraz zajmiemy się bliższym poznaniem jego własności. Jedna z
wersji przybliżenia ma następującą postać:
n! = y /ln n
^1 + ^
+ 0 ( n - 3 )^ ,
jeżeli n —> 00, (9.40)
dla pewnych stałych a i b. Ponieważ wzór ten jest prawdziwy dla wszystkich
odpowiednio dużych rt, więc musi być prawdziwy również wówczas, gdy rt
zastąpimy przez n — 1:
( n - 1 ) ! = i/27t(n — 1)
x ( 1+ ~ T +
~ jy 2 +
+ °0 (( (( n
3) )) •
n _—1)
1 ) 3)
(9 4 i)
Oczywiście wiemy, że (rt — 1)! = n l/n . Stąd prawa strona tego wzoru musi
się uprościć do prawej strony wzoru (9.40), podzielonej przez n.
Spróbujmy zatem uprościć (9.41). Pierwszy czynnik staje się łatwy w
obróbce, jeśli użyjemy sztuczki z wyciąganiem największej części:
y/2n[n —1) = V Inn (1 —n 1)1/2
Zastosowaliśmy tutaj równanie (9.35).
Podobnie mamy
0 ( ( n —I)"3) = 0 ( n - 3 (1 —n - 1 )-3 ) = 0 (n ~ 3).
Jedyną częścią wzoru (9.41), która wymaga sprytnego podejścia, jest czynnik
(n — 1)n - 1 , o wartości równej
n n 1(1 —n 1)n 1 = n u 1(1 —n 1)rL(l + t l 1 + n 2 + 0 (n 3) ) .
(Rozwijanie kontynuujemy do momentu, w którym otrzymamy względny
błąd rzędu 0 ( n 3), ponieważ błąd względny iloczynu jest sumą błędów
względnych samodzielnych czynników. Wszystkie wyrazy 0 (n “ 3) zlewają się
w jeden.)
W celu rozwinięcia (1 — n _1)n , obliczamy najpierw ln(1 — n _1), a na­
stępnie tworzymy funkcję wykładniczą, euln^1-Tl
(1 —rt-1 )n = exp(nln(l —n - 1 ))
= exp(n(—n _1 — \n ~ 2 — \n ~ s + 0 (n ~ 4)))
= exp(—1 — \n~^ —\n ~ 2 + O (u- 3 ))
= exp(—1) • exp(—\ n ~ A) • exp(—^n- 2 ) • e x p (0 (n - 3 ))
= e x p ( - l) • (1
\ n ~ ' + \ n ~ 2 + 0 ( n “ 3))
. (1 - l n ~ 2 + 0 ( n - 4)) • (1 + 0 ( n - 3))
= e"1 (1 - l n " 1 - ^ n - 2 + 0 (n " 3) ) .
Używamy powyżej zapisu expz zamiast ez, ponieważ pozwala nam to pra­
cować ze złożonym wykładnikiem, w najbardziej widocznej części wyraże­
nia, unikając kłopotliwej pracy z indeksami. Musimy rozwinąć ln(1 — n _1)
z błędem bezwzględnym 0 (n- 4 ). Działania zamierzamy zakończyć z błędem
względnym O (u - 3 ), ponieważ logarytm jest wymnażany przez n.
Prawa strona wzoru (9.41) została właśnie uproszczona do iloczynu y /ln n
oraz n n-1/ eTL pomnożonego przez iloczyn następujących czynników:
(1 — \ n ~ A — |r t ~ 2 + 0 ( n - 3 ))
• (1 + U - 1 + n - 2 + 0 ( n - 3))
• (1
\ n ~ A - J fn “ 2 + 0 ( n ~ 3))
• (1 + art-1 + (a + b )n -2 + 0 ( n - 3 ) ) .
Obliczenie całego iloczynu oraz umieszczenie wszystkich wyrazów pod jed­
nym 0 ( n - 3 ) daje nam
1 + an 1 + (a + b — T2
0 (^l 3) .
Hmmm, mieliśmy przecież nadzieję na uzyskanie 1 + a n -1 + b n -2 + 0 (n- 3 ),
ponieważ to jest to, czego potrzebujemy, aby otrzymać prawą stronę (9.40).
Czy coś poszło nie tak? Nie, wszystko jest w porządku, pod warunkiem, że
a + b - j ź = b.
To rozumowanie, oparte na zaburzaniu, nie dowodzi prawdziwości przy­
bliżenia Stirlinga, dowodzi natomiast czego innego. Pokazuje, że wzór (9.40)
może być prawdziwy wyłącznie wtedy, gdy a = j j . Jeżeli zastąpimy 0 (n- 3 )
w (9.40) przez c n -3 + 0 ( n - 4 ) oraz przeprowadzimy dalsze obliczenia do
momentu uzyskania błędu względnego 0 ( n - 4 ), to możemy wydedukować, że
b musi być równe ^ g , zgodnie z tabelą 499. (Nie jest to najprostsza droga
wyznaczenia wartości stałych a i b, ale na pewno jest skuteczna.)
Problem 3: n-ta liczba pierwsza
Równanie (9.31) jest wzorem asymptotycznym na 7t(n), liczbę wszystkich
liczb pierwszych nie przekraczających n. Jeżeli n zastąpimy przez p = Pn,
czyli n-tą liczbę pierwszą, to otrzymamy 7r(p) = n. Stąd
n = —^
- — \ - o ( .. — -r~\
lnp
\(lo g p )2 /
(9*42)
przy n —» 00. Spróbujmy „rozwiązać” to równanie względem p, co pozwoli
nam poznać przybliżoną wartość n-tej liczby pierwszej.
W pierwszym kroku uprościmy wyraz O. Jeżeli podzielimy obie strony
wzoru przez p /ln p , uzyskamy n ln p /p —> 1, stąd p /ln p = O(n) oraz
#■
W drugim kroku przestawiamy obie strony wzoru (9.42), oprócz wyrazu
O. Możemy to zrobić dzięki ogólnej regule
a-n = bn + 0 (f (n ) )
<£=>
bn =
an+ 0 ( f ( n ) ) .
(9.43)
(Każde z tych równań wynika z drugiego, jeżelipomnożymy obie strony
przez —1, a później dodamy an + bn do obu stron.) Stąd
bk - n+0(ii) =
i otrzymujemy
p = n ln p (l+ 0 (1 /lo g n )).
(9.44)
To jest „przybliżona rekurencją” na wartość p = Pn , wyrażona przez nie
samo. Naszym celem jest uzyskanie „przybliżonej postaci zwartej”, a możemy
to zrobić rozwijając rekurencję asymptotycznie. Spróbujmy zatem rozwinąć
wzór (9.44).
Wyciągając z obu stron logarytmy, wnioskujemy, że
lnp = ln n + ln ln p + 0 (1 / l o g n ) .
(9-45)
Wartość tę można podstawić zamiast lnp we wzorze (9.44), ale my chcieliby­
śmy się pozbyć wszystkich p po prawej stronie, zanim wykonamy odpowied­
nie podstawienie. Gdzieś po drodze, ostatnie p musi zniknąć. Nie możemy
się go pozbyć w zwykły dla rekurencji sposób, ponieważ (9.44) nie precyzuje
warunków wstępnych dla niedużych p.
Jednym ze sposobów rozwiązania tego problemu jest rozpoczęcie od po­
kazania słabszego wyniku p = 0 (n2). Podnosząc do kwadratu obie strony
wzoru (9.44), a następnie dzieląc przez p n 2, otrzymujemy
£
= < ! £ £ ! ! ( ,+ 0 ( , / ! « „ ) ) ,
ponieważ prawa strona osiąga zero przy n —> 00. W porządku, wiemy, że
p = 0 (n2). Zatem logp = O (logn) oraz log log p = O (log logn). Korzystając
teraz ze wzoru (9.45), możemy wywnioskować, że
ln p = ln n + O (log log n ) .
Faktycznie, mając w ręku to oszacowanie wnioskujemy, że ln ln p = ln ln n +
O (log log n /lo g n) i na podstawie (9.45) otrzymujemy
lnp = Inn + ln Inn + 0(log log n /lo g n ) .
Możemy to teraz wrzucić do prawej strony równania (9.44), otrzymując
p = n ln n + n ln ln n + 0 ( n ) ,
przybliżony rozmiar n-tej liczby pierwszej.
Możemy poprawić to oszacowanie, używając lepszego przybliżenia 7t(n)
wewnątrz (9.42). Następny wyraz (9.31) mówi nam, że
n = bk +
+°((to^)'
(9'46)
Postępując podobnie jak wcześniej, otrzymujemy rekurencję
p = n l n p (1 + (lnp)- 1 ) - ’ ( 1 + 0 ( 1 / l o g n ) 2) ,
Radzę znowu wyjąć
brudnopis.
(9.47)
której błąd względny wynosi 0 (1/lo g n ) 2, zamiast 0(1 /lo g n ). Stosując lo­
garytm oraz zachowując odpowiedni (nie za duży) poziom dokładności otrzy­
mujemy
lnp = Inn + ln ln p + 0(1 /lo g n )
= ln n (l +
ln ln p
ln ln p ^ l n l n n + ^
ln n
+ 0 ( 1 /lo g n ) 2) ;
+ 0 f ł g f l0 g n ) 2 .
V log n /
Powyższe wyniki podstawiamy do (9.47), uzyskując w końcu oczekiwaną od­
powiedź:
„
,
. ,
ln ln n
/ n \
Pn = n l n n + n ln l n n —n + n —-------- FO ------- .
Inn
\lo g n /
,
(9.48)
Stosując powyższe oszacowanie dla n = 106, otrzymujemy 15631363,6 +
O (n /log n). W rzeczywistości milionowa liczba pierwsza jest równa 15485863.
Ćwiczenie 21 pokazuje, że można otrzymać jeszcze dokładniejsze przybliże­
nie Pn , gdy zaczniemy od precyzyjniejszego przybliżenia n [n ) niż wzór (9.46).
P ro b lem 4 : S um a ze starego egzam inu końcow ego
Kiedy w latach 1970-1971 na Uniwersytecie Stanforda pojawił się po raz
pierwszy wykład z Matematyki Konkretnej, studenci dostali do policzenia
wartość asymptotyczną sumy
Sn = ^ ? T T + ^ ? T 2 + "' + ^ T ^ ,
(949)
z błędem bezwzględnym 0 (n- 7 ). Wyobraźmy sobie, że dostaliśmy właśnie
ten problem (do domu) na zaliczenie. Jaka jest nasza pierwsza instynktowna
reakcja?
Nie panikujmy. Pierwsza próba opiera się na m y ś l e n i u z r o z m a c h e m .
Jeżeli weźmiemy, powiedzmy rt = 10lo°, i spojrzymy na sumę, widzimy, że
składa się ona z rt składników, z których każdy jest trochę mniejszy niż 1/rt2.
Oznacza to, że cała suma jest trochę mniejsza niż 1/n . Ogólnie, rozpoczy­
nając pracę z problemem asymptotycznym, warto posiadać dobry przegląd
sytuacji oraz zgrubne oszacowanie odpowiedzi.
Spróbujmy poprawić nasze zgrubne oszacowanie przez wyciągnięcie naj­
większej części każdego wyrazu. Otrzymujemy
k2
k3
1
1 A
/
kk k2
k3
66
rt2( 1 + k / n 2) — n—
2yV
\ ( 1 ---nrtJ
22 ----4
nn44 ----nn6
1
rt2 + k
/ /k 4
(V
'
Vn*
Zsumujemy teraz wszystkie otrzymane przybliżenia:
1
1
nz + I
n * "" n ?
1
n2 + 2
^
rtz + rt
uz
1
2
_
n
ri4
l3
n 6 '~ n 8
22
+
“
n
c
l2
+
23
/ 24
u 6 "“ n 8
n2
rt4
n3
(n>°)
n n ( n + 1) ,
n2
2n 4 + "' '
Na podstawie sumy pierwszych dwóch kolumn wygląda tak, jakbyśmy uzyski­
wali Sn = n —1 —\ n ~ 2 + 0 (rt- 3 ). Niestety, obliczenia stają się coraz bardziej
zawiłe.
Jeżeli uparlibyśmy się przy tym podejściu, to cel zostałby osiągnięty. Nie
będziemy się jednak kłopotać liczeniem sumy pozostałych kolumn, z dwóch
powodów. Po pierwsze — ostatnia kolumna dostarczy nam wyrazy rozmia­
ru 0(rt- 6 ), gdy n /2 ^ k ^ u, co dawałoby błąd rzędu 0(rt- 5 ), a to już
za dużo. Musimy dodatkowo uwzględnić jeszcze jedną kolumnę rozwinięcia.
Czy egzaminator mógł być aż takim sadystą? Zaczynamy podejrzewać, że
musi być jakieś inne rozwiązanie. Po drugie— rzeczywiście jest lepszy sposób,
wprawiający nas w zdumienie.
A mianowicie, znamy już postać zwartą Sn.: to jest Hn2+TL—Hn2. Znamy
również dobre przybliżenie liczb harmonicznych, które właśnie zastosujemy
teraz dwukrotnie:
Hnz+n = ln(n2 + n) + y +2[J +n) - n(J +n)2 + O ( - 1 ) ;
Hn2 = ^ 2 + y + ^
- ^
+ o Q
.
Wyciągamy teraz duże wyrazy i upraszczamy, podobnie jak postępowaliśmy
w przypadku przybliżenia Stirlinga. Otrzymujemy
^ --;
ln(rt2 + n ) = Inn2 H-lnfl + —) = Inn2 + — —
V
n /n
2n z
3n 3
1
n2 + n
_
J _____ 1_
n2
J_ _
n3
1
_ J__2_
(n2 + n )2
n4 n5 ^
n4
n6
Kilka przydatnych redukcji prowadzi do
Sn = n _1 — ^ n “ 2 + ^ n -3 — ^ n - 4 + ^ n -5 — | n - 6
—^n -3 + \n ~ 4 —jn ~ 5 + jn ~ 6
+ l n ~5 ~ i n ~6
plus wyrazy rzędu 0 (n - 7 ). Jeszcze trochę arytmetyki i jesteśmy w domu:
Sn = rt-1 - \ n ~ 2 - \ n ~ 3 + \ n ~ Ą - j^ n ~ 5 + ^ n -6 + 0 ( n - 7 ) . (9.50)
Dobrze byłoby otrzymaną odpowiedź sprawdzić liczbowo, tak jak to zro­
biliśmy przy wyprowadzaniu dokładnych odpowiedzi w poprzednich rozdzia­
łach. Sprawdzanie wzorów asymptotycznych jest trudniejsze. Wewnątrz wy­
razu O może ukrywać się dowolnie duża stała. Oznacza to, że żaden test licz­
bowy nie jest pewny. W praktyce jednak nie mamy podstaw do przypuszczeń,
że przeciwnik stara się nas usidlić. Możemy więc założyć, że nieznana stała
przy O jest rozsądnie mała. Używając kalkulatora kieszonkowego obliczamy,
żeS 4 = y7 + yg + y^ + 2^j = 0)2170107. Nasze oszacowanie asymptotyczne
przy n = 4 osiąga wartość
1 0 + ?(_ 2 + \ { ~ \ + \ ( \ +
= 0,2170125.
Jeżeli popełniliśmy błąd, powiedzmy j j , w wyrazie odpowiadającym n - 6 ,
różnica
daje o sobie znać na piątej pozycji dziesiętnej. Nasza odpo­
wiedź jest najprawdopodobniej poprawna.
Problem 5: Suma nieskończona
Wrócimy teraz do asymptotycznego problemu postawionego przez Solomona
Golomba [152]. Jaka jest przybliżona wartość sumy
(9-51)
gdzie N n (k) jest liczbą cyfr niezbędnych do zapisania k w zapisie pozycyjnym
przy podstawie n?
Zacznijmy od ponownej próby użycia pobieżnego oszacowania. Liczba
cyfr N n (k), to w przybliżeniu logn k = log k/log rt. Kolejne wyrazy tej sumy
odpowiadają z grubsza wartościom (logn )2/k (lo g k )2. Sumując po k kolej­
nych wyrazów otrzymujemy wartość « (logn )2 z k> 2 1/k (lo g k )2. Suma ta
zbiega do pewnej stałej, na co wskazuje jej podobieństwo do całki
Spodziewamy się zatem, że
odpowiada mniej więcej C (logn)2, dla pewnej
stałej C.
Tego typu analiza, na oko, przydaje się do nabrania intuicji. Dla rozwią­
zania naszego problemu potrzebujemy jednak lepszych oszacowań. Jednym z
pomysłów może być wyrażenie N n (k) precyzyjniej:
N n (k) = l l o g n k j + l .
(9-52)
I tak, na przykład, k ma trzy cyfry w zapisie przy podstawie n, w przypadku
gdy n 2 ^ k < n 3. Przypadek ten zachodzi dokładnie wtedy, kiedy [logn kj =
2 . Wynika z tego, że N n (k) > log^k, a stąd Sn = ^ k>1 1/k N n (k)2 <
1 + (logn.)2 Y . y.^2 1/k(logk)2.
Postępując podobnie jak w problemie 1, możemy użyć zapisu N n (k) =
logn k + 0 (1), podstawiając go później do wzoru na Sn . Wartość wyrazu
odpowiadającego 0 (1 ) zawarta jest pomiędzy O a 1, a jego średnia wartość
oscyluje w okolicy
Zachowuje się zatem całkiem przyzwoicie. Niestety,
wciąż nie jest to wystarczająco dobre przybliżenie, by mogło mówić nam coś
o Sn . Nie dostarcza nam żadnych znaczących cyfr (co odpowiada znacznemu
błędowi względnemu), gdy k jest małe, a to są wyrazy, których wkład do
sumy jest największy. Potrzebujemy innego pomysłu.
Kluczem do rozwiązania (podobnie jak w problemie 4) będzie wykorzy­
stanie naszej dużej wprawy w przekształcaniu, w celu sprowadzenia sumy do
bardziej poręcznej postaci, zanim skorzystamy z asymptotycznych przybli­
żeń. Możemy wprowadzić nową zmienną sumacyjną, m = N n (k):
c
_
"
2 .
k,m^1
Y_
k,m^1
[m —N TL(k)]
i^ 2
[^m _1^ k < n ’
km2
Uzyskana suma może wyglądać na pierwszy rzut oka gorzej niż ta, od której
rozpoczęliśmy. W rzeczywistości zrobiliśmy jednak krok naprzód, ponieważ
dysponujemy bardzo dobrymi przybliżeniami na liczby harmoniczne.
Wstrzymamy się jeszcze na chwilę i spróbujemy wykonać kilka dodatko­
wych uproszczeń. Nie ma pośpiechu z użyciem asymptotyki. Sumowanie przez
części pozwala nam pogrupować wyrazy przybliżonych wartości wszystkich
których potrzebujemy:
Sn = ^ j Hnk-1( i ? _ ( k + i ) 2) '
Na przykład Hn2_i pomnożone jest najpierw przez 1/ 22, a później przez
—1/ 32. (Skorzystaliśmy z tego, że Hno_1 = Ho = 0.)
Jesteśmy już przygotowani do rozwinięcia liczb harmonicznych. Nasze
doświadczenie w szacowaniu (rt —1)! nauczyło nas, że łatwiej jest przybliżyć
Hnk niż HTtk_1, ponieważ operowanie wartościami (rtk — 1) byłoby kłopo­
tliwe. Otrzymujemy zatem
Hnk_, = Hnk- ^
= lnnk + y + ^ + 0 ( ^ ) - ^
= klnn+1/-2^ +0( i ) ’
a nasza suma uzyskuje nową postać
Sn =
( k l n n + Y _ 2 ^ + C)( ^ ) ) ( i ? _ (k + 1)2)
= (lnn)Ii + y l 2 - ^ ( n ) + 0 ( l 3 (n2)) .
(9 .53)
Pozostały cztery proste części: I i , I2, £3(^1) oraz l3 (rt2).
Zabierzemy się najpierw za I3 , ponieważ l3 (rt2) jest wyrazem typu O.
Później zobaczymy, jakiego rzędu błąd otrzymamy. (Nie ma sensu wykony­
wanie dalszych, doskonale dokładnych obliczeń, jeżeli miałyby one okazać się
W objęciach
Dużego O.
zbędne w świetle używanego O.) Suma ta jest zwykłym szeregiem potęgo­
wym
13 w
=
( k + i) 2) x k ’
a szereg ten jest zbieżny przy x ^ 1. Możemy go zatem obciąć na dowolnie
wybranej pozycji. Jeżeli zatrzymamy się w rozwinięciu L s [n 2) na wyrazie
z k = 1, otrzymamy L s{n 2) = 0 (n - 2 ). Błąd bezwzględny (9.53) wynosi
wtedy 0 (n- 2 ). (W celu zmniejszenia jego rozmiaru, możemy użyć lepszego
przybliżenia Hnk, ale jak na razie 0 (n- 2 ) jest wystarczająco dobre.) Jeżeli
obetniemy I3 (rt) na wyrazie z k = 2, to otrzymamy
I 3 (n)
=
| n - i + 0 ( n - 2).
To jest dokładność, której potrzebujemy.
Możemy również od ręki poradzić sobie z sumą L 2, nie sprawiającą nam
większego problemu
12 = £
(k+T)2) '
Jest to szereg teleskopowy 0 - * ) + ( * - £ ) + ( £ - ^ ) H-----= 1.
Wreszcie suma 1 1 odpowiadająca czołowemu wyrazowi Sn — współczyn­
nikowi przy Inn we wzorze (9.53):
Z’ =
k(i? “
'
Powyższa suma wynosi (1 - \ ) + ( f - f ) + ( f - Ą ) + • • • = \ + \ +
^ + • • • = H {2) = 7t2/6. (Jeżeli nie zastosowalibyśmy wcześniej sumowa­
nia przez części, zobaczylibyśmy wprost, że Sn ~ ]Lic>i (ln n )/k 2, ponieważ
Hnk_i —Hnk-i _i ~ Inn. Tak więc sumowanie przez części nie pomogło nam
w wyliczeniu wyrazu wiodącego, ułatwiło zaś wykonanie pozostałej pracy.)
Znamy już każdą z poszukiwanych sum Z w (9.53), możemy więc zebrać
wszystko razem, otrzymując rozwiązanie problemu Golomba
Sn
=
^ ln n + y - A
+ o (_ L ).
( 9 .5 4 )
Zauważmy, że suma ta rośnie o wiele wolniej niż nasze początkowe oszaco­
wanie, na oko, C (logn)2. Nierzadko suma dyskretna nie poddaje się naszej
intuicji ciągłości.
Problem 6: D uże Fi
Przed końcem rozdziału 4 zauważyliśmy, że liczba ułamków wewnątrz szeregu
Fareya jFn wynosi 1 + ® (n), gdzie
<D(n) = cp(1 ) + cp(2 )H---- + <p(n).
Dodatkowo pokazaliśmy we wzorze (4.62), że
®(n) = i ^ n ( k ) L n / k J L l + n / k J
(9-55)
k^ 1
Spróbujmy teraz oszacować O (rt), gdy rt jest duże. (Sumy podobne do tych
były głównym powodem wprowadzenia notacji O przez Bachmanna.)
M y ś l e n i e z r o z m a c h e m owocuje wnioskiem, że <D(n) jest najprawdo­
podobniej proporcjonalne do rt2. Jeżeli wartość ostatniego czynnika byłaby
równa [n/kJ zamiast [1 + n /k j , otrzymalibyśmy | O (rt) | ^ ^ H k^i Ln A J 2 ^
l l k ^ i ( n / k)2 = TI n 2 ) ponieważ funkcja Mobiusa |x(k) przybiera wartość
—1,0 lub + 1. Dodatkowe ‘1 + ’ występujące w ostatnim czynniku odpowiada
Hic^i
[rt/kj. Wyrazy z k > n są równe zeru, zatem cała suma nie może
mieć wartości bezwzględnej większej niż nH u = O (n lo g n ).
Ta wstępna analiza podpowiada nam, że wygodnie będzie napisać
®(„) -
+ o,„ )2 - i | . , w ( ( = ) ! + o Q ) )
k=l
= ? H ,xW ( r )
k= 1
+ O(nlogn).
k= 1
Usuwa to problem podłóg. Jedyne co pozostaje, to wyliczenie pozbawionej
podłóg sumy ^ ^ k = i M W ^ /k 2 z dokładnością O (n lo g n ). Innymi słowy,
chcemy wyliczyć ^ £ =1 |x(k)1/k 2 z dokładnością 0 (n-1 logn). A to nie jest
trudne. Możemy rozszerzyć sumę aż do k = oo, ponieważ nowo dodane wy­
razy sumują się do
(W roku 1960
Sałtykow pokazał
[317], że wyraz
błędu wynosi
co najwyżej
Udowodniliśmy w (7.89), że
= 1/C(z). Zatem
1 /k 2) = 6/7T2 , a my otrzymujemy gotową odpowiedź:
O
0(n(log n)2/3 x
(log log n )1+e).
Z drugiej strony,
nie jest on
tak mały, jak
(u) = —r-n2 + O (n lo g n ).
7t
mW A2 =
(9.56)
9A. D w ie sztuczki a sy m p totyczn e______________
o (n.(log log Tl)1/2),
zgodnie z Montgomerym [276].)
Posiadając już pewne obycie z przekształceniami wyrażeń typu O, spójrzmy
na to, co zrobiliśmy do tej pory, w trochę szerszej perspektywie. Dorzucimy
teraz kilka ważnych technik do naszego arsenału asymptotycznego, potrzeb­
nych nam w radzeniu sobie z bardziej opornymi problemami.
Sztuczka 1: K olejn e p rzy b liżen ia
Kiedy oszacowywaliśmy n-tą liczbę pierwszą Pn zajmując się problemem 3
(rozdział 9.3), rozwiązywaliśmy asymptotyczną rekurencję postaci
Pn = n ln P n (1 + 0 ( 1 /logTl)) .
Udowodniliśmy, że Pn = T L l n u + 0 (tl), używając wstępnie rekurencji do po­
kazania słabszego wyniku 0 (n2). Jest to szczególny przypadek ogólnej tech­
niki zwanej metodą kolejnych przybliżeń , w której rozwiązujemy rekurencję
asymptotycznie, stosując aktualnie posiadane oszacowanie wewnątrz mecha­
nizmu rekurencji. Proces rozpoczynamy od wstępnego, pobieżnego przybli­
żenia, otrzymując w kolejnych krokach coraz to lepsze oszacowania.
Oto inny problem dobrze ilustrujący metodę kolejnych przybliżeń. Jaka
jest wartość asymptotyczna współczynnika gn = [zn] G (z) w funkcji tworzą­
cej
G(z) = exp(Y_ £ 2 ) >
(9-57)
k>1
przy tl —> 00? Jeżeli zróżniczkujemy to równanie względem z, to otrzymamy
00
k —1
G'(z) = ^ n g n zn _ ' =
n=0
( X . “T - ) G (Z)k$:l
Przyrównanie po obu stronach współczynników przy zn 1 definiuje nowe
równanie rekurencyjne
ngn =
V"
>
0^k<n
9k
------r*
tl — k
(9-58)
Nasz problem jest teraz równoważny znalezieniu wzoru asymptotycznego od­
powiadającego rozwiązaniu równania (9.58), z warunkiem początkowym go =
1. Kilka pierwszych wartości
n
gn
0
1
1
2
3
4
5
6
1
3
4
19
36
107
288
641
2400
51103
259200
nie mówi nam zbyt dużo o całkowitym schemacie, a ciąg liczb całkowitych
(rt!2gn) niestety nie pojawia się w książce Sloane’a [331]. Zwarta postać na
gn wydaje się więc być poza zasięgiem, a wiedza asymptotyczna jest naj­
prawdopodobniej wszystkim, czego możemy oczekiwać.
Pracę nad naszym problemem rozpoczniemy od obserwacji, że 0 < gn ^ 1
dla wszystkich rt ^ 0, czego możemy łatwo dowieść przez indukcję. Mamy
zatem bazę
gn = 0 (1 ) .
Faktycznie równanie to jest użyte jako „wstępne zalanie pompy” w metodzie
kolejnych przybliżeń. Użycie go po prawej stronie (9.58) przynosi
O (lo g n );
0^k<TL
a stąd mamy
dla rt > 1.
Możemy teraz wykonać kolejną rundę
0< k < n
0<k<n
- + - H n_-|0 (logu) = —O (logn)2 ,
u
n
n
otrzymując
(9-59)
Czy tak będziemy ciągnąć w nieskończoność? Może gn = 0 (rt-1 lo g n )m dla
wszystkich m.
Nic z tego, właśnie osiągnęliśmy punkt słabnących oszacowań. Próba uży­
cia kolejnego przybliżenia doprowadza nas do sumy
0
<k<TL
k2(rt —k)
v
1
0
-
<k<n
\n k 2 ^ rt2k
n 2(n — k )/
v
}
1 H(2) + 2 H
będącej Q (n - 1 ). Nie możemy zatem otrzymać lepszego oszacowania na gn
niż Q (n - 2 ).
W rzeczywistości, wiemy wystarczająco dużo o gn , aby zastosować naszą
starą sztuczkę z wyciąganiem największej części:
ng!
= O^kcn
Z -+
_ z—
n
_Z
”
0^k<n
n z— rt z—
k^O
Vrt —k
Ti/
n z— u —k
k^n
O^kcn
Pierwsza suma odpowiada G(1) = e x p (| + ^ ^
) = e71 /6 , ponieważ
G(z) jest zbieżna dla wszystkich |z| ^ 1. Druga suma jest ogonem pierwszej.
Na podstawie równania (9.59) możemy otrzymać jej górne ograniczenie
£ * - o (k^ru
£ ^ )-o (S si.).
k^n.
To ostatnie oszacowanie zachodzi, ponieważ
y-
2—
k>n
(log k)2
k2
y
y
2-
m ^>1 n m< k ^ n m + 1
(logTlm+1)2
y
(m + 1 )2 (log Tl)2
k(k — 1)Tim
(Ćwiczenie 54 prezentuje ogólniejszą metodę szacowania podobnych ogonów.)
Trzecia suma (9.60) ma postać
"0 < k < n
ze znanych już nam powodów. Na podstawie (9.60) wnioskujemy, że
e7t2/6
3
9 n = — j - + 0 (logn/n) .
(9 .61)
Wreszcie, możemy ponownie wrzucić ten wzór do mechanizmu rekurencji,
poszukując kolejnego przybliżenia. Jako wynik otrzymujemy
9rx =
e7^ 6
—^2—
(9.62)
O (log n / n )
(Ćwiczenie 23 zajmuje się dokładniej resztą O.)
Sztu czka 2: W y m ien n e ogon y
Wyprowadzenie (9.62) wyglądało nieco podobnie do wyprowadzenia wartoś­
ci asymptotycznej liczby O(n) (9.56). W obydwu przypadkach obliczenia
rozpoczęliśmy od sumy skończonej, jednak wartość asymptotyczną otrzyma­
liśmy rozważając sumy nieskończone. Nie mogliśmy zwyczajnie przejść do
sumy nieskończonej, wprowadzając notację O do składnika. Musieliśmy być
ostrożni, używając jednego podejścia w przypadku małego k, innego zaś, gdy
k okazało się duże.
Powyższe wyprowadzenia są szczególnymi przypadkami ważnej trzystop­
niowej sumacyjnej metody asymptotycznej, którą zajmiemy się teraz szerzej.
Kiedykolwiek tylko chcemy oszacować wartość ]Tk ak(n), możemy spróbować
następującego podejścia:
1. Najpierw dzielimy wyrazy sumy na dwa rozłączne zakresy, D n oraz Tn.
Wynik sumowania wewnątrz D n powinien być składową „dominującą”,
przez co rozumiemy, że zawiera ona wystarczającą liczbę elementów, przy
dużych n, do wyznaczenia wszystkich cyfr znaczących sumy. Wynik su­
mowania wewnątrz drugiego zakresu Tn powinien być „ogonem” koń­
cowym, którego wartość całkowita jest niezauważalnie mała.
2. Znajdujemy oszacowanie asymptotyczne
ak(n) = bk(n) + 0 (ck(n))
prawdziwe dla k e D n . Granica O nie musi zachodzić dla k e Tn.
3. Dowodzimy teraz, że każda z następujących trzech sum jest mała:
£a(u) =
Y. flk(n ) ;
Zb(n) =
IcgTtl
£c{n) =
bk(n);
kGTn
Y . M n )|-
(9-63)
keDn
W przypadku, gdy wszystkie trzy kroki zakończą się sukcesem, otrzymujemy
poprawne oszacowanie:
Y
keD^UTt,
ak(n) =
Y
b*(n) + °(£a(^) + 0(lb(n)) + 0(lc(n)).
kGD^UT^
(Ta ważna metoda
została zainicjowana
przez
Laplace’a [240].)
Oto dlaczego. Możemy „odrąbać” ogon danej sumy, otrzymując dobre osza­
cowanie dla zakresu D n , gdy takowe jest niezbędne:
Y
ak(n ) =
lcGDrt
X
Y
(bk(n ) + ° ( ck(n ))) =
T
cGDtl
bkfn) + 0 ( I c(n)) .
kGDn
Ogon sumy możemy zastąpić innym, nawet jeśliby nowy ogon miał być bar­
dzo złym przybliżeniem starego, ponieważ ogony nie mają żadnego znacze­
nia:
Asymptotyka
to sztuka wiedzy,
kiedy można być
niedbałym, a kiedy
należy być
dokładnym.
Y ik ( n ) = Y (bk ( n ) - b i c ( n ) + ak(n))
k£Tn
kETn
= Y b^ n ) +
keT^
+ O ( l 0(n)).
Kiedy obliczaliśmy sumę (9.60), rozważaliśmy
O-k(n) = [0 ^ k < n ]g k/ ( n - k ) ,
bk(n) .= gic/n,
cic(n) = kgk/ n ( n - k ) ;
z dwoma zakresami sumowania
Dn = {0,1,... ,n —1},
Tn = {rt,n + 1,...}.
Doszliśmy do tego, że
I a(n) = 0,
I b(rt) = 0((logn)2/ n 2) ,
I c(n) = 0((logn)3/ n 2) .
To prowadzi do równania(9.6i).
Podobnie, kiedy szacowaliśmy wartość O (u) w (9.55), mieliśmy
ak(n) = M-(k)|u/kj [1 +n/kj , bk(n) = |ii(k)n2/k2 ,
Dn = {1,2,
Tn = { n + 1 , n + 2, . ..}.
Również kocie
ogony podlegają
zmianom, kiedy
nadchodzi pora
karmienia.
ck(n) = n/k;
Wyprowadziliśmy (9.56) zauważając, że
= 0, I b M = O(n), oraz
Xc (n) = O (n logn).
Oto następny przykład, w którym zamiana ogonów okazuje się być bardzo
pożyteczna. (Inaczej niż poprzednio, przykład ten ilustruje sztuczkę w całej
swej okazałości, przy Zq(ti) 7^ 0-) Poszukujemy wartości asymptotycznej
T
_ ^
ln(n + 2*)
“ 2_
fcj
'
Duży wkład do wartości sumy wnoszą wyrazy z małym k, ze względu na k!
występujące w mianowniku. Dla tego zakresu otrzymujemy
2k
22k
/ 23k \
ln(n + 2k) = l n n + - - ^ + 0 ( ^ )
(9.64)
Możemy udowodnić, że to oszacowanie zachodzi przy 0 ^ k < [lgn j, po­
nieważ początkowe wyrazy, które obcięliśmy przez użycie O, ograniczone są
przez zbieżne szeregi
n~
m^3
m>3
rt
(Dla tego zakresu 2k/ n < 21^ “ '/n sC { . )
Możemy zatem zastosować właśnie opisaną trzystopniową metodę, dla
aic(n) = ln(rt + 2k) / k ! ,
b k(n) = (ln n + 2k/ n - 4k/ 2n 2)/k !,
Ck(n) = 8k/ n 3k!;
D n = {0, 1, . . . , [lgnj — 1),
Tn = (LlgnJ, [lgnj + 1 , . . . } .
Wszystko, co musimy zrobić, to znaleźć dobre ograniczenie dla każdej sumy
I z (9.63), a będziemy pewni, że
a k(n) js
bk(n).
Rozmiar błędu, na jaki możemy sobie pozwolić wewnątrz dominującej
części sumy, I c(u) = H keDri 8k/rt3k!, jest w oczywisty sposób ograniczony
przez Y.\c^o
— e8/™3- Możemy go więc zastąpić przez wyraz 0 (n ~3).
Błąd związany z nowym ogonem wynosi
|£b(n)| =
bk(n )
k ^ [lg nj
<
L
k ^ [lg nj
ln n + 2k + 4k
k!
ln n + 2 ^ ^ + 4 ^ ^
LlgTlJ!
"— ^
4k
/
n2
\
-° y
Ponieważ [lg tlJ ! rośnie szybciej niż dowolna potęga n , ten niewielki błąd gubi
się w otchłani £ c (n) = 0 (n- 3 ). Błąd związany z początkowym ogonem,
Ia(n ) =
X.
k ^ [lg nj
jest jeszcze mniejszy.
k ^ [lg nj
k + ln u
k!
„Może nie jesteśmy
duzi, ale jesteśmy
mali.”
Wreszcie, ponieważ łatwo wyliczyć postać zwartą sumy X k > o bk(n )»
otrzymaliśmy żądany wzór asymptotyczny:
ln(n + 2k)
k^O
e2
e4
/ 1 \
= e ln n + n - 2 ^ + ° f e ) '
(9'65)
Metoda, której właśnie użyliśmy, precyzuje jasno, że w rzeczywistości
k^O
k=1
dla każdego ustalonego m > 0. (Jest to obcięcie szeregu zbieżnego dla wszyst­
kich ustalonych u, w przypadku, gdy m —* oo.)
Nasze rozwiązanie ma jedną wadę. Byliśmy zbyt uważni. Wyprowadzi­
liśmy (9.64) przy założeniu, że k < [lg n j, ale ćwiczenie 53 pokazuje, że
otrzymane oszacowanie jest w rzeczywistości prawdziwe dla wszystkich k.
Gdybyśmy wcześniej znali silniejszy, ogólniejszy wynik, nie musielibyśmy ko­
rzystać ze sztuczki z dwoma ogonami. Moglibyśmy przejść bezpośrednio do
końcowego wzoru! Później napotkamy inne problemy, przy których jedynym
rozsądnym podejściem będzie zamiana ogonów.
9.5. W zór sum acyjny Eulera
Następna sztuczka, jaką poznamy— w rzeczywistości, ostatnia ważna tech­
nika przedstawiona w tej książce — to ogólna metoda przybliżania sum, za­
proponowana po raz pierwszy przez Leonharda Eulera [101] w roku 1732.
(Powyższa technika kojarzona jest również z nazwiskiem Colina Maclaurina,
profesora matematyki z Edynburga, który odkrył ją niezależnie, ale trochę
później [263, strona 305].)
Oto ów wzór:
m T>
Y_ f(k) =
a^kcb
I"b
f(x)dx + £ - j T f (k“ 1)M
+
Rm >
(9*^7)
k=l
Rm = (_ i r + i [b M M
Ja
m!
f (m)M d x > ^ o w i t e a O ;
całkowite m ^ 1.
J
Lewa strona wzoru jest typową sumą, której wyliczeniem jesteśmy zaintereso­
wani. Wyrażenie po prawej stronie, odpowiadające sumie, zawiera całki oraz
pochodne. Jeżeli f (x) jest wystarczająco „gładką” funkcją i ma m kolejnych
pochodnych f'(x), . . . , f (m^(x), to powyższy wzór okazuje się tożsamością.
Prawa strona jest często doskonałym przybliżeniem sumy występującej po le­
wej, dzięki temu, że reszta Rm jest zazwyczaj niewielka. Zobaczymy wkrótce,
że przybliżenie Stirlinga dla rt!, jak również nasze asymptotyczne przybliżenie
na liczby harmoniczne Hn są następstwem wzoru sumacyjnego Eulera.
Liczby Bk z (9.67) są liczbami Bernoulliego, z którymi spotkaliśmy się
już w rozdziale 6. Funkcja Bm ({x}) z (9.68) jest wielomianem Bernoulliego, z
którym zapoznaliśmy się w rozdziale 7. Notacja {x} jest użyta do oznaczenia
ułamkowej części x —|_xj, podobnie jak w rozdziale 3. Wzór sumacyjny Eulera
jest jednym z tych, które łączą wszystko razem.
Przypomnijmy sobie wartości kilku niewielkich liczb Bernoulliego. Za­
wsze wygodnie jest je mieć wraz z ogólnym wzorem Eulera:
\
Bo = 1 , Bi = — , B2 = l , B 4 = —3 ^ , B 6 =
B 3 = B 5 = B7 = B9 = B n
41
> B8 =
;
= ••• = 0.
Jakub Bernoulli odkrył te liczby podczas prac nad sumami potęg liczb całko­
witych, a wzór Eulera wyjaśnia, jaki jest tego powód. Jeżeli weźmiemy f (x) =
xm_1, to otrzymamy f
(x) = 0, ponieważ Rm = 0, a wzór (9.67) redukuje
się do
Jeśli, na przykład, m = 3, to znów otrzymujemy nasz ulubiony przykład
sumowania:
(To jest już ostatnie wyprowadzenie tego znanego wzoru w naszej książce.)
Zanim przejdziemy do dowodu wzoru Eulera, przyjrzyjmy się, które prawa ogólne (Lagrange [234]) wymuszają istnienie takiego wzoru. Rozdział 2
zawiera definicję operatora różnicowego A oraz wyjaśnienie, dlaczego Y. Jes^
odwrotnością A, tak jak / jest odwrotnością operatora różniczkowego D.
Za pomocą wzoru Taylora możemy w następujący sposób wyrazić A przy
^ y S^ 0 co rfobre
kiedyś się kończy.
użyciu D:
f(x + e) = f(x) + l M 6 + ! ^ W 62 +
1!
21
Biorąc e = 1, dostajemy
Af(x) = f ( x + 1) - f ( x )
= f '(x)/1 ! + f "(x)/2! + f '"(x)/3! + • • •
= ( D / l ! + D 2/ 2 ! + D 3/ 3! + • • •) f (x)
= (eD - l ) f ( x ) .
(9-69)
Tutaj eD odpowiada operacji różniczkowania 1 + D / l ! + D 2/ 2 ! + D 3/ 3! H-----.
Ponieważ A = eD — 1, więc operator odwrotny L = 1/A powinien być równy
1 / (eD —1). Z tabeli 390 wiemy, że z /{ e z —1) =
Bkzk/k! jest szeregiem
potęgowym zawierającym liczby Bernoulliego. Dlatego
Bo
£
-
Bi
B2 „
B3
y
(9-70)
■E? + TT+ 2 f D + 3 f D +
Po zastosowaniu tego równania operatorowego do f(x), i ustaleniu granic,
otrzymujemy
y~
Bi
f(x) 6x =
Z------CL
„
f(x)dxH -V ~ -7-7
^ ------ Ic
k^1
(9-71)
czyli wzór sumacyjny Eulera (9.67) pozbawiony składnika reszty. (Euler,
w rzeczywistości, nie rozważał owej reszty, podobnie jak i inni. Dopiero w
roku 1823 z.ajął się nią S. D. Poisson [296] w publikacji na temat przybli­
żonego sumowania. Człon reszty jest istotny, ponieważ suma nieskończona
H k^i (Bk/k!)f(k-1H*)|a Jest często rozbieżna. Niemniej nasze wyprowadze­
nie i bez założenia o zbieżności (9.71) było w pełni formalne.)
Udowodnimy teraz (9.67) z uwzględnieniem reszty. Wystarczy udowodnić
przypadek, w którym a = 0 oraz b = 1, czyli
pi
f(0) =
m y,
1
f ( x ) d * + r 1^ f ‘k- i >(x)
Jo
k=1
K[
„1
-(-n m
o
■’ Bm(x)
Jo
m!
f (m)(x )d x ,
ponieważ możemy potem zastąpić f (x) przez f (x + l) dla każdego całkowi­
tego l, otrzymując
1+1
pl+1
m T>
f(l) =
f(x )d x + X T 7 f (’c_1)(x)
k=1 *
1+1
•
l
Bm ({*})
f (m)(x)dx.
m!
Wzór ogólny (9.67) jest sumą tej tożsamości w przedziale a ^ l < b, ponieważ
wyrazy pośrednie znoszą się wzajemnie.
Dowód, przy a = 0 oraz b = 1, przeprowadzamy przez indukcję po m,
rozpoczynając o d m = 1,
f(0) = j 1 f(x) dx - 1 (f(1) - f(0)) + j 1(x- |)f'(x) dx.
(Poniższe równanie jest ogólną definicją wielomianu Bernoulliego Bm(x)
BmM = ( ^ B o x m + ( ^ B 1x m- ' + - + ( ™ ) B n x°,
(9.72)
w szczególności Bi (x) = x — A.) Innymi słowy, chcemy udowodnić, że
f (x) dx +
(x —
dx.
To jest szczególna postać wzoru
u (x )v (x )| q =
|
u(x) dv(x)
+
| v(x) du(x)
(9-73)
na całkowanie przez części, przy u(x) = f(x) oraz v(x) = x — Czyli przy­
padek m = 1 jest prosty.
Aby przejść od m — 1 do m, a więc otrzymać dowód dla m > 1, musimy
udowodnić, że Rm- i = (Bm/ru !)f(m_1)(x)|J + Rm, czyli że
Bm—1M _jr(m—1)
(x) dx
0 iTU— 1j!
5 ^ f ( m - 1 ) ( x) 1 -(-i)"*- ['Bm(x) f {m)(x )d x .
m!
o
Jc
m!
To równanie redukuje się do
( - 1)mBmf 'm- " ( x )
o
= m [ 1Bm_ 1(x)f<™-’> (x )d x + f B m(x)f<m»(x)dx
Jo
Jo
Ponownie równanie (9.73) stosuje się do powyższych dwóch całek, przy
u(x) = f (m_1)(x) oraz v(x) = Bm(x), ponieważ pochodna wielomianu Ber-
Czy autorzy nigdy
nie spoważnieją?
noulliego (9.72) jest równa
k
v
k
7
=
v
7
mz ( V ) Bkxm“1_,e
= mBm_i(x).
(9.74)
(Przydała nam się tu tożsamość pochłaniania (5.7).) Zatem rozważany wzór
jest poprawny wtedy i tylko wtedy, gdy
Innymi słowy, potrzebujemy tożsamości
(—1)mBm = Bm(1) = Bm(0) ,
dla m > 1.
(9.75)
Jest to trochę kłopotliwe, ponieważ Bm (0) jest równe Bm, a nie (—l ) mBm.
Tak naprawdę jednak nie ma żadnego problemu, ponieważ m > 1. Wiemy,
że Bm jest zerem, gdy m jest nieparzyste. (Niemniej, wróciliśmy z dalekiej
podróży.)
Aby zakończyć dowód wzoru sumacyjnego Eulera, musimy pokazać, że
BmO) = Bm(0), co jest równoważne
Bk = Bn
k
dla m > 1.
v
A to jest przecież definicja liczb Bernoulliego (6.79). Koniec!
Tożsamość B^l (x) = mBm_i (x) implikuje
Jo
m +l
ponadto wiemy, że całka ta jest równa zeru przy m ^ 1. Stąd składnik reszty
we wzorze Eulera,
Rm =
j
Bm ({x})f<m> M d x ,
wymnaża f (m)(x) przez funkcję Bm ({x}), której wartość średnia jest zerem.
Oznacza to, że mamy prawo oczekiwać małego Rm.
Przyjrzyjmy się bliżej wartościom Bm(x) dla 0 ^ x ^ 1, ponieważ Bm(x)
rządzi zachowaniem się Rm. Oto wykresy Bm(x) dla pierwszych dwunastu
wartości m:
9 *5 . W zór su m acyjn y E u leral
m = 2
m = 3
m = 4
Bs+ml^)
Chociaż Bs(x) aż do B 9M są niezbyt duże, wielomiany oraz liczby Ber­
noulliego zasadniczo rosną całkiem szybko. Szczęśliwie Rm ma wyrównujący
czynnik l/m !, pozwalający nam się uspokoić.
Wykres Bm(x) zaczyna się wyraźnie upodabniać do sinusoidy, gdy m ^ 3.
Ćwiczenie 58 pokazuje, że w rzeczywistości poprawnym przybliżeniem Bm(x),
jest ujemna wielokrotność cos(27tx—^7rm), przy czym błąd względny wynosi
O (2-m maxx Bm ({x})).
W ogólności, B4k+i M jest ujemne dla 0 < x < \ oraz dodatnie dla
\ < x < 1. Zatem jego całka B4ic+2(x)/(4k. + 2 ) jest malejąca dla 0 < x < \ y
a rosnąca dla i < x < 1. Ponadto, mamy
B4k+i (1 - x) = -B41C+1 M ,
dla 0 ^ x ^ 1,
z czego wynika, że
B41C+2O-*) = B41C+2M,
dla 0 ^ x 0 .
Stały wyraz Bą^+2 powoduje, że całka
B4k+2(x) dx przybiera wartość zero.
Stąd B4ic+2 > 0. Całka funkcji 64^+2(x) jest równa B4i<+3(x)/(4k + 3), która
musi być zatem dodatnia dla O < x < \ oraz ujemna, gdy \ < x < 1.
Ponadto 64^+3 (1 —x) = —64^+3 (x), więc 64^+3 (x) ma takie własności, jak
B41C+1 M , tyle że przeciwne. Podobnie 64^+4 (x) ma własności B4i<+2(x), rów­
nież przeciwne. Zatem 64^+5 (x) ma własności 64^+1 (x). Zamknęliśmy cykl,
który przenosi indukcyjnie określone własności na wszystkie k.
Zgodnie z powyższą analizą, maksymalna wartość B2mM musi pojawić
się przy x = O albo przy x =
W ćwiczeniu 17 będziemy mieli okazję
udowodnić, że
(9-76)
A zatem mamy
(9-77)
Powyższą nierówność możemy wykorzystać do ustanowienia przydatnej gór­
nej granicy na składnik reszty we wzorze sumacyjnym Eulera, ponieważ
wiemy z (6.89), że
Możemy zatem zapisać wzór Eulera (9.67) w następujący sposób:
Y_ f(k) = Jaf fMdx-lf(x)|^
+k=1
X!g^(2
k (*)la
z
IZKJ-
^k<b
Ja
Na przykład jeżeli f (x) = ex, to wszystkie pochodne są takie same, a powyż­
szy wzór mówi nam, że ^ a^k<b ek = (eb — ea)(l — \ + B2/2! + B4/4! +
— f-B2m /(2m )!) + 0 ((27i)_2m) . Oczywiście wiemy, że ta suma jest faktycznie
szeregiem geometrycznym, równym (eb—ea)/(e —1) = (eb—ea) ^ k>0 Bk/lc!.
Jeżeli f
(x) ^ Odla a ^ x ^ b, to całka
|f(2m) (x)| dx jest równa po
prostu f (2m_1)(x)|a, a my otrzymujemy
Innymi słowy, składnik reszty jest, w tym przypadku, ograniczony przez war­
tość wyrazu końcowego (wyrazu poprzedzającego resztę). Możemy się nawet
pokusić o dokładniejsze oszacowanie, kiedy wiemy, że
f(2m+2)(x) ^ o i
f (2m+4)(x) ^ O,
Okazuje się, że implikuje to zależność
dla a ^ x ^ b.
(9-79)
Innymi słowy, wartość reszty mieścić się będzie pomiędzy 0 a pierwszym
wyrazem odrzuconym w (9.78) — wyrazem, który pojawi się tuż za wyrazem
końcowym, gdy powiększymy m.
Oto dowód. Wzór sumacyjny Eulera jest prawdziwy dla wszystkich m
oraz B2m+i = 0 dla m > 0. Stąd R2m = R2m+i» a pierwszy wyraz odrzucony
musi wynosić
R2m
R2m+2 •
Chcemy zatem pokazać, że R2™. leży pomiędzy 0 oraz R2m —^2m+2} a to jest
prawdą wtedy i tylko wtedy, gdy R2m oraz R2m+2 mają znaki przeciwne.
Zauważamy, że
f (2m+2)(x) ^ 0
d la a ^ x O
implikuje
( - l ) mR2m ^ 0.
(9.81)
To wraz z (9.79) wystarcza, aby udowodnić, że R2m oraz R2m+2 mają znaki
przeciwne, czyli zakończyć dowód (9.80).
Nie jest trudno wykazać prawdziwość (9.81), jeżeli przypomnimy sobie
definicje R2m+i oraz fakty, jakie udowodniliśmy o wykresie B2m+i (x). Mia­
nowicie, mamy
a funkcja f {2m+1)(x) jest rosnąca, ponieważ jej pochodna f (2m+2)(x) jest
dodatnia. (A dokładniej, f^2m+1^(x) jest niemalejąca, ponieważ jej pochodna
jest nieujemną.) Wykres B2m+i (W ) przypomina iloczyn funkcji (—1)m+l
oraz sinusoidy, jest więc geometrycznie oczywiste, że druga połowa każdej
sinusoidy ma większy wpływ niż pierwsza, gdy cała sinusoida wymnożona
jest przez funkcję rosnącą. To czyni (—1)mR2m+i ^ 0, tak jak chcieliśmy.
Ćwiczenie 16 zawiera bardziej formalny dowód.
9.6. K ońcow e sum ow ania
Zbliżamy się do końca książki, czas zatem na podsumowanie. Zastosujemy
teraz wzór sumacyjny Eulera w kilku ważnych i interesujących przykładach.
Sumowanie 1: Zdecydowanie za proste
Zacznijmy od interesującego nieistotnego przykładu, a mianowicie sumy, z
którą umiemy już sobie poradzić. Zobaczmy, jaki będzie efekt zastosowania
wzoru sumacyjnego Eulera do składającej się sumy
Możemy równie dobrze rozpocząć od zapisania funkcji f(x) = 1/x (x + 1)
w postaci różnicy ułamków prostych,
rr a
1
f(x) = - X
1
X+ 1
ponieważ ułatwia to proces całkowania oraz różniczkowania. I rzeczywiście,
otrzymujemy f'(x) = —1/ x 2 + 1/ ( x + 1)2 oraz f"(x) = 2/ x 3 — 2/ ( x + 1)3, a
w ogólności
f <k >(X) =
( - 1 )*k ! ( - ± _
-
( x + 11 )fc + 1 ) ,
d la k > 0.
Ponadto
[ f(x) dx = ln x —ln(x + 1)
Ji
2n
= ln
n + 1
Zastosowanie tego we wzorze sumacyjnym (9.67) daje nam
1
gdzie Rm(n) =
dx
■ m +1
Dla m = 4 prawa strona przybiera postać
ln
2tl
1 / 11
n+1
2 \n
1 1 1\1 \
11 / / 11
11
3\
2)
12 V n 2
(n + 1 )2
4)
n + 1
W 1
1
15\
+ 1 2 o ( ^ _ ( n T T F - 1?) +
,
^n ) '
To jest jakiś bełkot. Z pewnością nie wygląda to na prawdziwą odpowiedź
1 — n _ 1 . Nie zatrzymujmy się jednak i przyjrzyjmy się temu, co otrzymali­
śmy. Wiemy już, w jaki sposób rozwinąć prawostronne wyrazy przy użyciu
ujemnych potęg n , kończąc powiedzmy na 0 ( n - 5 ):
= —n -1 + \n ~ 2 - ^n-3 + | n -4 + 0 ( n - 5 ) ;
ln
=
1
(n + 1)2
1
(n + 1)4
n -1 — n _2 +
n-3 -
n ~ 4 + 0 ( n - 5 };
n -2 —2n-3 + 3n-4 + 0 ( n - 5 ) ;
n~4 + 0(n-5)
Zatem prawostronne wyrazy naszego przybliżenia sumują się do
ln2 + 4 + i6
128 + ( '1
2
\)n 1 + (2
2
12
12) Tl
-2
+ (“ 5 + 2 - ‘fe)n 3 + (i- 5 + T2 + TIĆ - T2o)n 4 + R4(n )
= ln2 +
—rt-1 + R4(tl) + 0 ( n - 5 ) .
Współczynniki przy n ~ 2, n ~3 oraz rt- 4 , tak jak powinny, zniosły się.
Gdyby życie zawsze było proste, udowodnilibyśmy teraz, że R4(n) jest
asymptotycznie małe, może 0 (rt_5), otrzymując w ten sposób przybliżenie
dla całej sumy. Jednak nie jesteśmy w stanie tego pokazać, ponieważ tak
się akurat składa, że wiemy, iż poprawnym stałym składnikiem jest 1, a nie
ln 2 +
(w przybliżeniu 0 , 9978). Czyli R4(n) jest w rzeczywistości równe
— ln 2 + 0 (n “ 5), jednak wzór sumacyjny Eulera nie mówi nam tego.
Innymi słowy, przegraliśmy.
Jedną z prób naprawienia sytuacji może być zauważenie, że stałe wyrazy
przybliżenia układają się według pewnego wzorca, jeśli bierzemy coraz to
większe m:
Być może uda nam się pokazać, że szereg ten osiąga wartość 1 przy nieskoń­
czonej liczbie wyrazów? Niestety nie. Liczby Bernoulliego rosną za szybko.
Na przykład, B22 = 851435813 > 6192, zatem liczba |R22 ('tl) | będzie o wiele
większa niż | R4 (rt) |. Przegrywamy na całej linii.
Jest jednak pewne wyjście. Ucieczka ta okazuje się istotna również w in­
nych zastosowaniach wzoru Eulera. Kluczem do rozwiązania jest zauważenie,
że R4 (rt) osiąga określoną granicę przy rt —» 00
I, B4({x}) ( i - u w ) dx=R4(00)-
lim R4(rt) —
n —>00
Całka J^50 Bm ({x})f(m)(x) dx istnieje zawsze, jeżeli tylko zachodzi f^m^(x) =
0 (x ~ 2), przy x —> 00, a w tym przypadku funkcja f^4^(x) spełnia te wyma­
gania. Ponadto, mamy
R4 ( n )
R 4 (oo ) + £
=
B 4 ({x})
dx
/ f°°
\
= R4(oo) + Of
x ~ 6 dxj = R4(oo) + 0 ( n - 5 ) .
Jn
Zatem użyliśmy wzoru sumacyjnego Eulera do udowodnienia, że
T .
l^ k < n
wTZTT
k
(k + 1 ) = h l 2 + m ~ n ~ ' + R4(°°) + ° ( n - 5)
v
J
= C —n _1 + 0 (n ~ 5)
dla pewnej stałej C. Nie znamy wartości tej stałej— musimy użyć innej me­
tody do jej określenia— ale wzór sumacyjny Eulera zapewnia istnienie takiej
stałej.
Załóżmy, że wybraliśmy m o znacznie większej wartości. Wtedy takie
samo rozumowanie wykazałoby, że
Rm(n) = Rm(oo) + 0 (n_m_1),
i otrzymalibyśmy wzór
C — rt-1 + c 2n ~ 2+ c 3Ti-3 H-------h cmu “ m + 0 (n -TTL_1)
WJ u
Y
l^ k cn
^
^
dla pewnych stałych C2, C3, . . . . Wiemy, że w tym przypadku wszystkie
stałe c okazują się zerami. Ale udowodnijmy to, przywracając trochę za­
ufania do wzoru Eulera (jeśli nie do samych siebie). Wyraz ln
wnosi
(—1)m/ m do cm, wyraz (—1)m+1 (Bm/m )u ~ m wnosi (—1)m+1 Bm/m , a wy­
raz (—l ) k(Bic/ k ) ( n + 1)_k jest równy (—1)m (1|^ri1)Bk/k. Zatem
( _ i ) - Cm =
m
m
+
z— V k — 1
k=l x
- X ( k ) Bk = - ( 1 - B m + Bm( 1 } - 1 ) .
k=1 x 7
Nabraliśmy już pewności, że otrzymujemy zero, gdy m > 1. Udowodniliśmy
zatem, że
Y
vrv 11 = C -T i " 1 + 0 (n~m~1),
1 ^ < n KllC+ '>
dlam^l.
(9 .82)
To jednak nie wystarczy, aby udowodnić, że dokładna wartość sumy wynosi
C —n - 1 . Rzeczywista wartość może odpowiadać C —rt-1 + 2~u , albo jesz­
cze innej wartości. Wzór sumacyjny Eulera obciążony jest błędem rozmiaru
0 (n _m_1) dla dowolnie dużych m. Oznacza to, że nie udało nam się wyliczyć
chociażby jednej reszty dokładnie.
Sum ow anie 1, raz je szcz e. P o d su m ow a n ie i u o g óln ien ie
Przypomnijmy sobie, co zrobiliśmy do tej pory, patrząc z trochę szerszej
perspektywy. Rozpoczęliśmy od sumy
Sn
=
Y
l^k <n
i po zastosowaniu wzoru sumacyjnego Eulera otrzymaliśmy
m
Su = F(n) - F(1) + X (Tic(n) - Tk(1)) + Rm( n ) ,
(9.83)
k=1
gdzie F(x) odpowiadała J f(x) dx, a Tk(x) było pewnym wyrazem zawierają­
cym Bk oraz f^k_1^(x). Zauważyliśmy również pojawienie się stałej c speł­
niającej
f (m)(x) = 0 ( x c-TTL)
przy x —} oo,
dla wszystkich dużych m.
Mianowicie, f(k) było równe 1/k (k + 1), F(x) było równe ln ( x /( x + 1)),
c było —2 , natomiast Tk(x) było równe (—1)k+1 (Bic/k)(x_k — (x + 1)~k).
Oznaczało to, że dla wystarczająco dużych wartości m reszty miały niewielki
ogon,
Rm(n ) = R m (° o )-R m(n)
= M ) m+1 f°° Bm^
Jn
m!
f (m)(x)dx = 0 ( n c+1_m) .
Mogliśmy zatem stwierdzić, że istnieje stała C taka, że
m
Sn = F(n) + C + Y _ Tk(n) - R ^ n ) .
(9-85)
k=1
(Zauważmy, że C szczęśliwie pochłonęło wyrazy Tic(1), które były dla nas tak
dokuczliwe.)
Możemy zaoszczędzić sobie niepotrzebnej pracy na przyszłość, zakładając
istnienie C w przypadku, gdy istnieje Rm(oo).
Załóżmy teraz, że f<2m+2>(x) ^ 0 oraz f<2m+4>(x) ^ 0 dla 1 ^ x ^ n.
Udowodniliśmy już, że zapewnia to proste ograniczenie (9.80) na wartość
reszty,
= ^m,u (^ Ira + lin )
T2m+2(1)) >
gdzie 0m,n leży gdzieś pomiędzy 0 a 1. Tak naprawdę, to my nie jesteśmy za­
interesowani ograniczeniem zawierającym wyrażenia R2m(i'0 oraz T2m+2(1)Ostatecznie, wprowadzając stałą C pozbyliśmy się wyrazu Tic(1). To, czego
oczekujemy, jest ograniczeniem postaci
gdzie O < (j)ttl,n < 1* Pozwala nam to wywnioskować z (9.85), że
m
Sn = F(n) + C + Tl (n) +
"^kM + <t>m,nT2m+2('n') ,
(9-86)
k=1
zatem faktycznie reszta znajdzie się pomiędzy zerem a pierwszym odrzuco­
nym wyrazem.
Lekka modyfikacja naszego poprzedniego rozumowania pozwoli nam po­
sklejać wszystko w jedną całość. Załóżmy, że
f(2m+2)ęx j ^ 0 oraz f (2m+4) (x) ^ 0,
przy x —> oo.
(9*87)
Prawa strona (9.85)wygląda tak samo, jak prawa strona wzoru sumacyjnego
Eulera (9.67) z ujemnym znakiem, przy a = n oraz b = 0 0 , o ile weźmiemy
pod uwagę składniki reszty, gdzie kolejne reszty tworzone są przez indukcję
po m. Możemy teraz zastosować nasze poprzednie rozumowanie.
Sumowanie 2: Zgrane liczby harm oniczne
Teraz, kiedy nauczyliśmy się już tak dużo na banalnym (ale bezpiecznym)
przykładzie, z ochotą zabierzemy się do przykładu mniej oczywistego. Uży­
jemy wzoru sumacyjnego Eulera do wyprowadzenia przybliżenia liczby Hn ,
którego domagaliśmy się od pewnego czasu.
W przypadku tym f (x) = 1/x . Dzięki sumowaniu 1, wiemy już coś o całce
oraz pochodnych funkcji f, również to, że f^m^(x) = 0 ( x _m_1), gdy x —* 0 0 .
Możemy zatem bezpośrednio skorzystać ze wzoru (9.85), otrzymując
1
m
R
Y_ ^ = Inn 4- C + B m "1 - Y_ 2 j j k “ R2n » .
15Ck<n
k=l
dla pewnej stałej C. Suma po lewej stronie jest równa Hn- i , a nie Hn .
Wygodniej jednak będzie nam operować na liczbie Hn- i , dodając wyraz
1 / n później, zamiast kłopotać się o (n + 1) po prawej stronie. Zatem B in -1
odpowiadać będzie (Bi + 1)n -1 = 1/ ( 2n). Stałą nazwijmy y zamiast C,
ponieważ stała Eulera y jest rzeczywiście zdefiniowana jako limn^oo(Hn —
ln u ).
Teoria, którą właśnie rozwinęliśmy, wystarczy nam, aby spokojnie osza­
cować składnik reszty, ponieważ f(2m) (x) = (2m )!/x2m+1
0, dla wszystkich
x > 0. Zatem (9.86) mówi nam, że
H“ -
.
(9 » )
gdzie 0m>n jest pewnym ułamkiem pomiędzy 0 a 1. Uzyskaliśmy wzór ogólny,
którego kilka pierwszych wyrazów pojawia się w tabeli 499. Na przykład dla
m = 2 otrzymujemy
Hn
ln n + Y + 2n
Un2 + UOn4
252n6 '
Nawiasem mówiąc, ten wzór daje dobre przybliżenie y nawet dla n = 2 :
y = H2 —ln 2 — ^ + ^g —
+ 6 -
0, 577165. . . + e ,
gdzie e jest stałą pomiędzy zerem a 16]28. Jeżeli przyjmiemy rt = 104 oraz
m = 250, to otrzymamy poprawną wartość y aż do 1271 pozycji dziesiętnej,
rozpoczynając od
y = 0,57721 566490153286060651209008240243. . . .
(9.90)
Stała Eulera pojawia się również w innych wzorach, które pozwalają wyliczyć
jej wartość jeszcze sprawniej [346].
S um ow anie 3 : P rz y b liże n ie S tirlinga
Jeżeli f(x) = lnx, to f'(x) = 1/x . Możemy więc wyliczyć sumę logarytmów,
używając prawie takich samych obliczeń, jakimi posłużyliśmy się sumując
odwrotności. Wzór sumacyjny Eulera daje nam
y
Ink =
,
Inn
n l n n — u + a ------ —
l^kcn
, y-
B2k_____ ___________B2m+2_____
2 k (2 k —1 )n 2k_1
m,n ( 2 m + 2 ) ( 2 m + 1 ) n 2m+1
gdzie a jest pewną stałą, „stałą Stirlinga”, oraz 0 < <pm>n < 1. (W tym przy­
padku f (2m^(x) jest ujemne, a nie dodatnie. Jednak w dalszym ciągu prawdą
jest, że reszta zdominowana jest przez pierwszy odrzucony wyraz, ponieważ
moglibyśmy rozpocząć od f(x) = —ln x zamiast f(x) = lnx.) Dodając Inn do
obu stron, otrzymujemy
Inn
1
Inn! = n l n n - n + — + a + —
1cp2n,.
(9. 91)
dla m = 2. Możemy teraz otrzymać przybliżenie z tabeli 499 biorąc funkcję
‘exp’ po obu stronach. (Wartość e° okazuje się równa \ / 27r, ale nie jesteśmy
jeszcze całkiem gotowi do wyprowadzenia wzoru. Prawdę mówiąc, Stirling nie
odkrył postaci zwartej a. Dopiero kilka lat później de Moivre [275] udowodnił,
że taka stała istnieje.)
Jeżeli m jest ustalone oraz n —> oo, to wzór ogólny daje coraz to lepsze co
do błędu bezwzględnego przybliżenia Inn!. Daje zatem coraz to lepsze przy­
bliżenie n! co do błędu względnego. Ale jeśli n jest ustalone, a m zwiększa
Kłania się nam
Heisenberg.
się, to granica błędu |B2m+2|/(2m + 2 )(2m + 1)n 2m+1 zmniejsza się tylko
do pewnego momentu, aby później zacząć się zwiększać. Zatem przybliżenie
osiąga punkt, poza którym pewnego rodzaju zasada nieoznaczoności ograni­
cza dokładność otrzymanego przybliżenia rt!.
W rozdziale 5, równanie (5.83), rozszerzyliśmy pojęcie silni na dowolne
liczby rzeczywiste oc dzięki definicji
1 = lim ( n + C V
a!
twoo \ n J
a
zaproponowanej przez Eulera. Przypuśćmy, że oc jest dużą liczbą, wtedy
Ina! =
n
lim ( a l n n + Inn! — Y" ln (a + k ) j ,
n->oo V
L—
J
k=1
a wzór sumacyjny Eulera może być użyty, wraz z f(x) = ln(x + a), do osza­
cowania wartości tej sumy:
n
2 2 1n(k+<x) = Fm(o c ,n )-F m(cx,0) + R2m( a , n ) ,
k=l
ln(x + a)
Fra(a,x) = ( x + a )ln (x + a) —x +
2
B2k
2k(2k
—
1)
(x + a )2k_1 ’
k=1
[>TXB2m ({x})
a,TL
Jo
2m
dx
(x + a )2 m ’
(Zastosowaliśmy tu (9.67) z a = 0 oraz b = n, dodając później ln(n + a) —
In a do obu stron.) Jeżeli odejmiemy to przybliżenie dla £ £ = 1 ln(k + a)
od przybliżenia Stirlinga dla Inn!, dodając później a ln n , oraz weźmiemy
granicę przy n —> 00, to otrzymamy
1
oc
m a! = a 1
ln a — a -|— —
—
h cr
Y
B21c
(2Tc)(2łc —1Jcc2^ -1
r ° B 2m({x})
dx
Jo
2m
(x + ot)2™ ’
ponieważ a ł n n + n l n n —n + j I n n —(n+< x)ln(n+< x)+n—^ ln (n + a ) —> —<x
a pozostałe, nie występujące tu wyrazy, zbiegają do zera. Oznacza to, że
przybliżenie Stirlinga zachowuje się dla uogólnionej silni (również dla funkcji
gamma F (a + 1) = a!) dokładnie tak samo jak w przypadku zwyczajnej.
Sum ow anie 4 : S kład nik d zw on ow y
Przyjrzyjmy się teraz sumie mającej zupełnie inne cechy:
©n
=
Y . e _k2/n
(9 92)
k
= — t-e_ 9 /n + e _ 4 /n + e _ , / u + 1 + e _ 1 /n + e _ 4 /u + e _9/n H—
.
Jest to podwójnie nieskończona suma, której wyrazy osiągają maksymalną
wartość e° = 1 przy k = 0. Suma ta nosi nazwę 0 n , ponieważ jest ona szere­
giem potęgowym zawierającym wielkości e~ ^ n podniesione do potęg p(k),
gdzie p(k) jest wielomianem stopnia 2. Takie szeregi potęgowe tradycyjnie
nazywamy „theta funkcjami.” Dlan = IO100 otrzymujemy
r e - ° ’01 » 0,99005, d l a k - 1049;
e_1c/n = < e - 1
0 , 36788,
l e " 100 < IO”43,
d l a k = 10so;
dla k = 1051.
Rzeczywiście wartość składnika jest bliska 1 do momentu, w którym k osiąga
mniej więcej y/n. Później szybko opada, stając się bliska zeru. Możemy się
domyślić, że 0 U będzie proporcjonalna do y/n. Poniżej wykres e~k / n dla
rt = 10:
Większe wartości rt rozprostowują wykres poziomo o czynnik y/n.
Oszacowanie funkcji 0 n otrzymujemy podstawiając f(x) = e~x /n oraz
a = —00, b = +00 we wzorze sumacyjnym Eulera. (Jeżeli nieskończoności są
dla nas zbyt przerażające, niech a = —A oraz b = +B, a następnie bierzemy
granice przy A,B —>00.) Całka f(x) jest równa
'+00
J—OO
r+00
e~x /n dx = y/n
J—OO
e~u du = y/n C ,
jeżeli zastąpimy x przez u-^rt. Wartość
e_u2 du jest nam dobrze znana,
ale pozostaniemy na razie przy nazwie C. Wrócimy do niej, kiedy zakończymy
proces podłączania do wzoru sumacyjnego Eulera.
Następnie powinniśmy poznać ciąg pochodnych f'(x), f "(x), . . . , a w tym
celu wygodnie jest użyć funkcji
f(x) = g (x A /r t),
g(x) = e- *2 .
Wówczas przez zróżniczkowanie funkcji złożonej dostajemy
co odpowiada stwierdzeniu, że
f'(x) = - ^ = g ' ( x / v / n ) .
yn
Przez indukcję otrzymujemy
f (k)(x) = n ~ k/2g (k)( x / \ / n ) .
Na przykład mamy: g'(x) = —2xe_x2 oraz g/;(x) = (4x2 —2)e_x2. Stąd
f'w
-
-
ś(4(^)2- 2)e"Vn-
Łatwiej będzie zrozumieć, co się dzieje, jeśli rozważymy prostszą funkcję g(x).
Nie musimy dokładnie obliczać pochodnych g(x),
ponieważ
będziemy
niepokoić się wyłącznie o graniczne wartości przy x = ± 00.A w
tymcelu
wystarczy zauważyć, że każda pochodna g(x) jest równa e_x2 razy pewien
wielomian zmiennej x:
g(k)(x) = Pk(x)e-x2 ,
gdzie Pk jest wielomianem stopnia k.
Dowód przeprowadzamy indukcyjnie.
Funkcja wykładnicza e~x zbliża się do zera o wiele szybciej, niż Pk(x)
dąży do nieskończoności, przy x —» ± 00, mamy zatem
f ^ (+00) =
f ^ ( —00) = 0
dla wszystkich k ^ 0. Oznacza to, że wszystkie wyrazy
m T>
k=1
znikają,
@n
amy zostajemy z wyrazem odpowiadającym J f (x) dx oraz resztą
= c V ń + ( - 1 ) m+1 [+
dx
J — OO
(x = u J n )
m!
= C y n + 0 (n (1- m)/2).
pm(u )e
du
Oszacowanie O jest prawidłowe, ponieważ ^ ^ { ua/ tl}) | jest ograniczone,
a całka
du istnieje, gdy P jest wielomianem. (Stała ukryta
pod O jest zależna od m.)
Udowodniliśmy, że ©n = C y / n + 0 (n ~ M), dla dowolnie dużego M. Róż­
nica pomiędzy ©n a C y/n jest „wykładniczo mała.” Wyznaczmy zatem do­
kładną wartość stałej C, mającej duży wpływ na wartość ©n .
Jednym ze sposobów wyznaczenia stałej C jest wyszukanie całki w odpo­
wiedniej tabeli. Ale my wolelibyśmy wiedzieć, jak taką wartość wyprowadzić,
abyśmy mogli całkować nawet wtedy, gdy odpowiednia całka nie została stabelaryzowana. Do wyliczenia C wystarczy znajomość podstawowych rachun­
ków, jeżeli nie przerazi nas podwójna całka
+00
p+oo
+00 r + o o
>~V‘ dy =
dx
C
J—oo
O
- ( x 2+ y 2 )
dx dy
Przechodząc do współrzędnych biegunowych otrzymujemy
c
=
p>27T
Z7T
pOO
nO O
Jo
Jo
1
e
T
rd r d0
(u = r2)
f2n
— I'2 "J
- i2 fJo
du
tc
7t .
Czyli C = y/n. Fakt, że x2 + y 2 = r2 jest równaniem koła o obwodzie 2n r ,
wyjaśnia nieco pojawienie się liczby n.
Innym sposobem wyliczenia C jest zastąpienie x przez y /t oraz dx przez
l f 1/ 2 dt:
+O O
dx = 2
dx =
t - ^ 2e - l d t.
Wartość całki wynosi F Q ) , ponieważ F(a) = J^° t a_1 e- t dt zgodnie ze wzo­
rem (5.84). Pokazaliśmy zatem, że r Q ) = y/n.
Nasz końcowy wzór uzyskuje postać
en =
Y.
- k z/n
y/m v -\-0 [n
),
dla ustalonych M.
(9.93)
Stała ukryta pod O jest zależna od M. Właśnie dlatego mówimy, że M. jest
„ustalone.”
Na przykład dla rt = 2, nieskończona suma @2 jest w przybliżeniu równa
2 , 506628288. To już jest bardzo blisko y/2m. w 2 , 506628275, mimo że rt jest
małe. Wartość ©100 zgadza się z 10y/ń na pierwszych 427 dziesiętnych pozy­
cjach! Ćwiczenie 59 używa zaawansowanych metod do wyprowadzenia szybko
zbiegającego szeregu dla 0 n . Okazuje się, że
0 n / V ^ = 1 + 2e-Tl7t2 + 0 ( e - w
).
(9.94)
Sum ow anie 5 : O sta tn ie słow o
Zajmiemy się teraz już ostatnią sumą, która, jak się okaże, da nam wartość
stałej Stirlinga a. Ta ostatnia suma pozwoli również zilustrować użycie tech­
nik poznanych nie tylko w tym rozdziale. Będzie to zatem właściwy sposób
na zakończenie naszego spotkania z Matematyką Konkretną.
Nasze końcowe zadanie na pierwszy rzut okiem wygląda niemalże na ab­
surdalnie proste. Będziemy próbowali znaleźć wartość asymptotyczną
na podstawie wzoru sumacyjnego Eulera.
To już kolejny przypadek, w którym z góry znamy odpowiedź (czyż nie
tak?). Interesujące jest jednak wypróbowywanie nowych metod na starych
problemach, pod warunkiem, że przyglądamy się dokładnie otrzymanym wy­
nikom - może jednak odkryjemy coś nowego.
Zaczynamy m y ś l e ć z r o z m a c h e m i zdajemy sobie sprawę, że największy
wkład do An dają wyrazy środkowe, bliskie k = rt. Prawie zawsze najwygod­
niej jest wybrać notację, w której największy wkład do sumy dają wyrazy
pojawiające się blisko k = 0. Możemy zatem użyć sztuczki z zamianą ogonów
w celu pozbycia się wyrazów z dużym |k|, co osiągamy zastępując k przez
n + k:
an = +y W( 2nv ) = +y (n + k)!(2n()!n - k ) ! '
Nasze położenie wydaje się być niezłe, gdyż wiemy, jak przybliżać (n ± k )!,
gdy n jest duże, a k małe.
Chcemy teraz wykonać trzykrokową procedurę opartą na sztuczce z za­
mianą ogonów. Mianowicie, chcielibyśmy napisać
(n + k ^ n - k ) ! = a,c(n) = bk(n) + ° ( Ck{n)) ’
dla k e D " ’
pod warunkiem, że możemy otrzymać oszacowanie
An =
Y_bk(n) + o ( Y. ° k ( n )) + ° ( Y bk(n )) + I O ( c k( n ) ) .
Ic
k£D n
keD n
Postarajmy się zatem oszacować (^J^) w zakresie, w którym |k| jest
małe. Moglibyśmy zastosować przybliżenie Stirlinga, które znajduje się w ta­
beli 499, ale łatwiej nam będzie poradzić sobie z jego logarytmicznym równo­
ważnikiem w (9.91):
lncik(n) = ln(2n)! —ln(n + k)! —ln(n —k)!
= 2n ln 2 n — 2n + \ ln 2n + a + O (rt- 1 )
— (n+k) ln(n+k) + n + k — \ ln(n+k)
— cr + O ((n + k )- 1 )
— (n—k )ln (n —k) + n —k — \ ln(n—k) — cr + 0 ( ( n —k)_1) .
(9-95)
Powyższe wyrażenie chcemy przekształcić do przyjemnego, prostego oszaco­
wania typu O.
Metoda zamiany ogonów pozwala nam pracować używając oszacowań,
które są prawdziwe wyłącznie wtedy, gdy k znajduje się w zbiorze „dominu­
jącym” D n . Ale w jaki sposób powinniśmy zdefiniować D n? Musimy stworzyć
na tyle małe D n , abyśmy mogli otrzymać dobre oszacowanie. Powinniśmy, na
przykład, unikać zbliżania się k do n, w przeciwnym razie wyraz O ((n —k)_1)
w równaniu(9.95) eksploduje. Z drugiej strony, zakres D n musi być odpo­
wiednio duży,tak aby wyrazy ogonowe (wyrazy z k ^ D n ) były pomijalnie
małe w porównaniu z całą sumą. Zwykle metoda prób i błędów okazuje się
niezastąpiona w procesie ustalania odpowiedniego zbioru D n . W tym przy­
padku obliczenia, jakie musimy wykonać, pokażą, że roztropnie jest użyć
następującej definicji:
k € Dn
4=^
| k | < n 1/2+ e.
(9.96)
Powyższe e jest małą, dodatnią stałą, którą dobierzemy później, zaraz po
zakończeniu wstępnego rozpoznania. (Dokładność oszacowania O będzie za­
leżeć od wartości e.) Równanie (9.95) upraszcza się do
lnaic(n) = (2n + ^) ln2 — a — ^ Inn + 0(n ~’1)
— (n+k+^J ln (l+ k /n ) - ( n - k + 1 ) l n ( l - k / n ) .
(9.97)
(Wyciągnęliśmy duże części logarytmów, zapisując
ln ( n ± k ) = Inn + ln(l ± k / n ) ,
co pozwoliło pozbyć się wielu wyrazów Inn.)
Będziemy teraz rozwijać asymptotycznie wyrazy ln(1 ± k /n ), aż otrzy­
mamy wyraz błędu osiągający zero przy n —> 00. Mnożymy ln(l ± k /n ) przez
(n ± k + j ] , powinniśmy zatem rozwijać logarytm aż osiągniemy o(rt 1), przy
założeniu, że |k| ^ n 1//2+e:
Mnożąc przez n ± k +
k2
±-i
k — -k2
— I----Zn
otrzymujemy
0 ( n _1/2+3e) ,
n
poszerzone o pozostałe wyrazy, które zostają pochłonięte przez O (n 1/ 2+3e
Zatem równanie (9.97) przybiera postać
lnaicfn) — ( 2 n + ^ ) l n 2 — cr— ^ ln n —k2/ n + 0 ( r t -1/^2+3e) .
Przechodząc do funkcji wykładniczych, otrzymujemy
22n+1/2
cik(n) =
(9-98)
eay/ń
Oto otrzymane przez nas przybliżenie wraz z
22 TL+1/ 2
bic(n) =
ck(n) = 22nn _1+3e e~k /n .
Zauważmy, że wystąpienia k wewnątrz bk(n) oraz Ck(n) nie są zbyt skom­
plikowane. Mamy szczęście, ponieważ bedziemy sumować względem k.
Sztuczka z zamianą ogonów pokazuje, że suma
a k(n) będzie w przy­
bliżeniu równa
b k M , pod warunkiem, że uzyskaliśmy dobre oszacowanie.
Spróbujmy zatem obliczyć
2 > (n )
*
=
e ^
= ^
Cóż za przedziwny
zbieg okoliczności.
k
eay /ń
0n = ^
eff
(1 + O ( n - ) ) .
v
y
(Następny łut szczęścia. Możemy wykorzystać sumę 0 n z poprzedniego
przykładu.) Sytuacja wygląda bardzo zachęcająco, ponieważ wiemy, że po­
czątkowa suma w rzeczywistości jest równa
An = Y _
2n
= (1 + 1 ) 2n = 2\2n
Wygląda zatem, jak byśmy już mieli eCT= y /ln , zgodnie z oczekiwaniami.
Jednak nie na tym koniec. Ciągle jeszcze nie udowodniliśmy, że nasze
oszacowanie jest wystarczająco dobre. Przyjrzyjmy się zatem najpierw błę­
dowi wnoszonemu przez Ckfn):
I c(n) = Y_ 22nn ~ 1+3ee~k2/n ^ 22nn ~ 1+3e0 n = 0(22nn ~ i +3e) .
Ikl^n1/ 2+e
Świetnie, wyrażenie to jest asymptotycznie mniejsze od poprzedniej sumy,
gdy 3e < \ .
Musimy jeszcze sprawdzić ogony. Mamy
Y_
e“ k2/n < exp(—|u 1/2+eJ2/n)(1 + e“ 1/n + e“2/n + • • •)
k > n 1/2+ e
= 0 ( e - 2e) . 0 ( n ) ,
Mam już dość
docierania do końca
długich, trudnych
książek nie
otrzymując
w zamian żadnego
ciepłego słowa
od autorów. Miło
byłoby przeczytać
„dziękujemy
za lekturę książki,
mamy nadzieję,
że Ci się do czegoś
przyda,” zamiast
wpadać na twardą,
zimną oprawę
książki na samym
końcu długiego,
suchego dowodu.
Czyż nie tak?
które jest O (n ~ M) dla wszystkich M. Czyli 2Zk£Dn "^kM jest asymptotycz­
nie nieistotna. (Obcięcie ustalamy na n 1/2+e tak, aby e-k / n było wykład­
niczo małe poza D n . Inne rozwiązania, jak n 1//2 logn, mogłyby być również
wystarczająco dobre, a otrzymane oszacowania mogłyby być nieco ostrzej­
sze. Mielibyśmy jednak do czynienia z bardziej skomplikowanymi wzorami.
Nie potrzebujemy najsilniejszych z możliwych oszacowań, naszym głównym
zadaniem jest ustalenie wartości stałej a.) Podobnie, drugi ogon
ł
C2+\)/
k>TX1/2 +e \
ograniczony jest przez iloczyn 2n oraz wartości jego największego wyrazu,
który pojawia się w punkcie obcięcia k « n 1/2+e. Wartość tego wyrazu to
w przybliżeniu bic(n), które jest wykładniczo małe w porównaniu z An , a
wykładniczo mały mnożnik eliminuje czynnik 2n.
Oznacza to, że sztuczka z zamianą ogonów powiodła się, a my otrzymu­
jemy oszacowanie
22n = Y _
)
= l P 22n + 0 (2 2nn - i +3e) , dla 0 < e < 1. (9.99)
Bierzemy teraz e = \ i otrzymujemy
<r = \ \ n l n .
QED.
Dziękujemy
za lekturę książki,
mamy nadzieję,
że Ci się do czegoś
przyda.
Autorzy
Ć w iczenia
Rozgrzewka
1. Czy jest prawdą, że dla fi (rt) -< gi (n) oraz f z W -< gz{n) otrzymujemy
fi (n) + h [ n ) -< gi (n) + g2(rt)?
2. Które z funkcji rosną szybciej:
a) nJlnn) czy (lnrt)n ?
b) rt^lnlnlnTL^ czy (lnrt)!?
c) (rt!)! czy ((rt — 1)!)! (rt — 1)!n!?
d) FrH.i czy H^ ?
3. Na czym polega błąd w następującym rozumowaniu? „Ponieważ rt =
0 (n ) oraz 2rt — 0 (n ) itd., stąd
kn = ^ k = i 0 (n ) = 0 ( n 2).”
4 . Podaj przykład prawdziwej równości, w której wyłącznie lewa strona
zawiera notację O. (Nie używaj sztuczki z mnożeniem przez zero, to zbyt
proste.) Wskazówka: Rozważ użycie granic.
5 . Czy jest prawdą, że O (f (n) + g(n)) = f (n) + O (g (n )), w przypadku, gdy
funkcje f (n) oraz g(n) są dodatnio określone dla wszystkich n? (Porównaj
Z (9-27)-)
6 . Pomnóż (Inn + y + 0 ( 1/n ) ) przez (n + O (\ / n )) i wyraź odpowiedź
używając notacji O.
7 . Oszacuj sumę 2Zk$>0 e-k/rL z błędem bezwzględnym 0 (n - 1 ).
Podstaw y
8. Podaj przykład funkcji f(n) oraz g(n) takich, że żadna z trzech zależ­
ności f(n) -< g(n), f(n) >- g(n), f(n) x g(n) nie jest prawdziwa, przy
dodatkowym założeniu, że funkcje f (n) i g(n) rosną monotonicznie do 00.
9 . Przeprowadź ścisły dowód (9.22), pokazując, że lewa strona jest podzbio­
rem prawej, zgodnie ze zbiorową definicją O.
10. Czy jest prawdą, że cosO(x) = 1 + 0 (x2) dla każdego x rzeczywistego?
11. Czy jest prawdą, że 0 (x + y ) 2 = 0 (x2) + 0 (y2)?
12. Udowodnij, że dla n —> 00 zachodzi
1 + ^ + 0 ( n - 2) = ( i + ^ ) ( 1 + 0 ( n - 2) ) .
1 3 . Oblicz (n + 2 + 0 (n -1 ))n z dopuszczalnym błędem względnym 0 (n _1).
14 . Udowodnij, że ( n + a )u+|3 = n n+^ea'(l + a (|3 — ^ a )n _1 + 0 (n- 2 )).
1 5 . Podaj asymptotyczną postać „środkowego” współczynnika trójmianowego (n3rJvrL) , z dopuszczalnym błędem względnym O (n~3).
1 6 . Pokaż, że jeśli B(1 —x) = —B(x) ^ 0 dla 0 < x <
to otrzymamy
fb
B ({x})f(x)dx ^ 0
Ja
przy dodatkowym założeniu, że f'(x) ^ 0 dla a ^ x ^ b.
17. Pokaż, korzystając z funkcji tworzących, że Bm(^) = (21-m — 1)Bm, dla
wszystkich m ^ 0 .
18. Oszacuj sumę
(2^) z dopuszczalnym błędem względnym 0 ( n -1//4),
dla oc > 0 .
Z adania d om ow e
19. Porównaj, korzystając z pomocy komputera, lewe i prawe strony przy­
bliżeń w tabeli 499, dla n = 10, z = <x = 0,1 i 0 (f (n ) ) = 0 (f(z )) = 0.
2 0 . Udowodnij albo wykaż niepoprawność następujących oszacowań, przy
n —> oo:
b)
e( i+ o ( i / n . ) ) 2 = e _j_ 0(1 / n ) .
c) n! = o ( ( ( 1 - 1 / n ) nn )u) .
2 1 . Równość
(9.48) daje przybliżoną wartość n-tej liczby pierwszej z błę­
dem względnym O (logn )- 2 . Popraw powyższe oszacowanie zmniejszając
wartość błędu względnego do O (log n )- 3 . Wykorzystaj następny wyraz
wzoru (9.31) w (9.46).
2 2 . Popraw oszacowanie we wzorze (9.54), osiągając dokładność 0 ( n - 3 ).
23. Dopracuj przybliżenie wzoru (9.62), uzyskując błąd bezwzględny 0 ( n - 3 ).
Wskazówka: Niech gn = c /(n + 1 )(n + 2) + h^. Jakiej zależności reku­
rencyjnej podlega h n?
24. Przypuśćmy, że an = 0 ( f (n ) ) oraz bn = 0 ( f ( n ) ) . Sprawdź, czy splot
L L o akbn-k jest również 0 (f(n )), w następujących przypadkach:
a) f(n) = n - a , oc > 1 .
b) f (n) = a -rL, a > 1 .
25. Udowodnij wzory (9.1) oraz (9.2), którymi rozpoczęliśmy ten rozdział.
26. Wzór (9.91) pokazuje, jak znaleźć oszacowanie liczby lnlO! z błędem
bezwzględnym < 126oooooo- Zatem korzystając z własności funkcji wy­
kładniczej otrzymujemy wartość 1 0 ! z błędem względnym mniejszym
niż e 1Z126000000 — 1 < 10- 8 . (W istocie to przybliżenie daje wynik
3628799,9714.) Jeśli zaokrąglimy tę liczbę do najbliżej liczby naturalnej,
wiedząc, że 1 0 ! jest liczbą naturalną, uzyskamy dokładne rozwiązanie.
Czy w podobny sposób zawsze możemy obliczyć n!, gdy odpowiednio
duża liczba wyrazów przybliżenia Stirlinga jest znana? Oszacuj wartość m
dającego najlepsze przybliżenie Inn!, dla ustalonego (dużego) natural­
nego n. Porównaj błąd bezwzględny przybliżenia z wartością n!.
27. Oblicz wartość asymptotyczną Hn_a) = X k =i ^ korzystając ze wzoru
sumacyjnego Eulera, dla ustalonej liczby rzeczywistej oc. (W odpowiedzi
możesz użyć stałej, której postać zwarta nie jest Ci znana.)
28. Ćwiczenie 5.13 definuje funkcję typu hipersilnia Qn = V 2 2 . . . n n . Wy­
znacz asymptotyczną wartość Qn z dopuszczalnym błędem względnym
0 ( n _1). (W odpowiedzi możesz użyć stałej, której postać zwarta nie jest
Ci znana.)
29. Oszacuj funkcję 1 1Z12 1/ 2 . . . n 1/n podobnie jak w poprzednim ćwiczeniu.
30. Wyznacz wartość asymptotyczną sumy Y-\c^o kl e_k /lx z błędem bez­
względnym O (n- 3 ), dla ustalonej dodatniej liczby naturalnej l.
31. Oblicz sumę Y.k^o V ( ck + cTa) z błędem bezwzględnym 0 ( c _3m), dla
dowolnego c > 1 oraz dodatniej liczby naturalnej m.
Z adania eg zam in acyjn e
32. Oblicz eH^+H^2) z błędem bezwzględnym 0 ( n _1).
33. Oblicz
(k)ALk z błędem bezwzględnym 0 ( n - 3 ).
34. Ustal wartości współczynników od A do F wiedząc, że (1 + 1 / n ) nHri jest
równe
A n + B (lnn )2 + C ln n + D + E(lnn)2 + ZjgJl + 0 ( n - ' ).
n
n
35. Oblicz
1/k H k z błędem bezwzględnym 0 (1 ).
36. Oblicz Sn = X!k=i 1/ ( n 2 + k2) z błędem bezwzględnym 0 ( n ~ 5).
37. Oblicz
(n mod k) z błędem bezwzględnym O (n lo g n ).
38. Oblicz L k ^ o kk(£) z błędem względnym 0 ( n _1).
39. Oblicz ^ 0 <k<TLln(n — k )(ln n )k/k! z błędem bezwzględnym 0 ( n - 1 ).
Wskazówka: Pokaż, że składniki dla k ^ 10Inn są nieznaczące.
40. Niech m będzie (ustaloną) dodatnią liczbą naturalną. Oblicz wartość
sumy Y-k=] ( — 1
z błędem bewzględnym 0 ( 1 ).
41. Oblicz „silnię Fibonacciego” flk = i ^ z błędem względnym 0 ( n _1) albo
mniejszym. W odpowiedzi możesz użyć stałej, której postać zwarta nie
jest Ci znana.
42. Niech a będzie stałą z przedziału 0 < a <
Jak mogliśmy zauważyć w
poprzednim rozdziale, suma H k<can ( k ) n*e ma ogólnej postaci zwartej.
Pokaż, że istnieje jej postać asymptotyczna
y
k^art
=
2 nH(a)“ ^ lgn+° (1),
dla H(a) = odg-^ + (1 — cx)lg(yr^). Wskazówka: Pokaż, że
<
d la O < k ^ a n .
4 3 . Pokaż, że Cn będące liczbą sposobów, na ile możemy rozmienić n centów
(rozważane już w rozdziale 7), ma złożoność asymptotyczną cn 4 + 0 ( n 3)
dla pewnej stałej c. Jaka to stała?
44. Udowodnij, że
x l / i = X1/ 2
'1 / 2 ' _ x - I / 2 " 1 / 2 '
"1 /2 "
+ X" 3/ 2
-3 /2
.1 / 2
- 1 /2
0 (x~ -5/2-
przy x —ł oo. (Przypomnij sobie definicję x-^- = x !/(x — \ ) \ w ( 5 .8 8 ),
oraz definicje uogólnionych liczb Stirlinga w tabeli 304.)
45. Niech oc będzie liczbą niewymierną pomiędzy 0 a 1. W rozdziale 3 roz­
ważaliśmy wielkość D (a ,n ) określającą największą niezgodność, z jaką
części ułamkowe {ka} dla 0 ^ k < rt odbiegają od rozkładu jednorod­
nego. Wzór rekurencjyjny
D ( a ,n ) ^
D ( { a - 1 }, [ocrtj) + a -1 + 2
został udowodniony w ( 3 .3 1 ). Maimy również oczywiste ograniczenia
0 ^
D ( a ,r t) ^
tl .
Udowodnij, że limr^oo D ( a ,n ) /n = 0. W skazówka: W rozdziale 6 roz­
ważaliśmy ułamki łańcuchowe.
46. Pokaż, że liczba Bella CDn = e - 1 Y-h>o k^/k! z ćwiczenia 7.15 jest asymp­
totycznie równa
m (n )n em (n )-n - 1/ 2 / \ / i n n ,
gdzie m (n) ln m (n ) = n — Oszacuj wielkość błędu względnego w powyższym przybliżeniu.
47. Niech m będzie liczbą naturalną ^ 2. Rozważmy dwie sumy
X .L logm kJ
oraz
H r iogm ki
k=l
k=1
która z nich jest asymptotycznie bliższa logm tl! ?
48. Rozważmy tabelę liczb harmonicznych Hk dla 1 ^ k ^ n reprezentowaną
w systemie dziesiętnym. Liczba
jest zaokrągleniem liczby Hk do dk
cyfr znaczących, gdzie liczba dk jest wystarczająco duża, aby odróżnić
wartość Hk od Hk_i oraz Hk+i . Poniższy przykład odpowiada fragmen­
towi powyższej tabeli ilustrującemu przekroczenie 10 przez liczbę Hk
k
Hk
Hk
dk
12364
12365
12366
12367
12368
9,999800419,99988128+
9,9999621510,0000430110,00012386+
9,9998
9,9999
9,99996
5
5
1 0 ,0 0 0 0
6
10 ,00 0 1
6
6
Oszacuj całkowitą liczbę cyfr użytych w tabeli, ^ £ = 1 ^k, z błędem bez­
względnym 0 (rt).
49. W rozdziale 6 poznaliśmy opowieść o robaczku, który dociera do końca
rozciąganej taśmy po rt sekundach, gdzie Hn_i < 100 ^ Hn . Udowodnij,
że jeśli n jest dodatnią liczbą naturalną taką, że Hn_i ^ oc ^ Hu , to
|_ea-yJ ^ n ^ fea_'Y] .
Pewnego razu
zarobiłem
0 (10 ~n) dolarów.
50. Odważni kapitaliści z Doliny Krzemowej otrzymali propozycję dającą im
szansę wykładniczego zarobku w stosunku do ich inwestycji. Za każde za­
inwestowane n milionów dolarów, przy n ^ 2, konsorcjum GKP obiecuje
zyski do N milionów dolarów po jednym roku, gdzie N = 10n . Oczywiście
istnieje odpowiednie ryzyko inwestycji. Właściwa umowa mówi, że GKP
płaci k milionów dolarów z prawdopodobieństwem 1 /(k 2 H j^), dla każ­
dego całkowitego k z przedziału 1 ^ k ^ N. (Wszystkie sumy wyrażone
są w megadolcach, tzn. w dokładnych wielokrotnościach miliona dolarów.
Każde rozliczenie jest ustalane w prawdziwie losowym procesie.) Zauważ,
że inwestor otrzymuje po roku zwrot w wysokości co najmniej jednego
miliona dolarów.
a) Jaka jest asymptotyczna wartość średnia zwrotu po jednym roku, w
przypadku zainwestowania n milionów dolarów? (Innymi słowy, jaka
jest wartość średnia wypłaty?) Podaj odpowiedź z dopuszczalnym
błędem bezwzględnym 0 ( 10 ~n ) dolarów.
b) Jakie jest asymptotyczne prawdopodobieństwo uzyskania dodatniego
zysku, przy zainwestowaniu rt milionów? (Innymi słowy, jaka jest
szansa, że otrzymasz wiecej niż zainwestowałeś?) Podaj odpowiedź z
dopuszczalnym błędem bezwzględnym 0 (rt- 3 ).
Z adania d odatkow e
51. Czy jest prawdą, że J^° 0 ( x - 2 ) dx = 0 ( u _1), przy rt —> 0 0 .
52. Udowodnij, że istnieje szereg potęgowy A(z) = ^ k > 0
zbieżny dla
wszystkich liczb zespolonych z, taki że
A(n) X n a’>
K
53. Udowodnij, że jeżeli f(x) jest funkcją, której pochodne spełniają
f'(x K 0 ,
-f"(x K 0 ,
f" '(x K 0 ,
( - i ) mf (m+1)(x) ^ o
dla wszystkich x ^ 0 , to otrzymujemy
f'fO)
I!
f (x) = f (0) + - ^ x + • • • +
f (m - 1) (0 )
xm- ’ + 0 ( x m) ,
(m — IJ!
dla x ^ 0.
W szczególności, przypadek f(x) = —ln(1 + x) odpowiada dowodowi
( 9 .6 4 ) dla wszystkich k,!! > 0 .
54. Niech f (x) będzie dodatnią, różniczkowalną funkcją taką, że xf ;(x) -< f (x)
przy x —ł 0 0 . Udowodnij, że
k^n
k1+K
= 0 ( ^ V
\ n“ /
v
7
dla « > 0 .
W skazówka: Rozważ wielkość f ( k — ^ ) /( k — j ) cc —f ( k + ^ )/(k + ^ )a .
55. Popraw wzór ( 9 .9 9 ), uzyskując błąd względny 0 ( n ~ 3/ 2+5e).
56. Wielkość Q(rt) = 1 + Ik^ - +
+ ••• =
t l —/ n k pojawia się
podczas analizy wielu algorytmów. Wyznacz jej wartość asymptotyczną,
z dopuszczalnym błędem bezwzględnym o (l).
57. Asymptotyczna postać sumy Golomba 2Zk$;1 1/k|_1 +logn k j 2 została wy­
prowadzona w ( 9 .5 4 ). Wyznacz postać asymptotyczną dla analogicznej
sumy ‘bez podłóg’,
1/k(1 + lo g n k)2.
Rozważ użycie
całki J^° u e _ 1Łk_tu du = 1 / ( 1 + t l n k ) 2.
58. Udowodnij, że
«
/r
^ m!
M M )
= -2( ^
v— cos(27tkx — \n m )
L
~
— km ~
•
dla m £ 2,
używając reziduum. Scałkuj
1
2 7ti
27tie27tize dz
02 m z _1 2,m
wzdłuż kwadratowego konturu z = x + iy, gdzie max(|x|, |-y|) = M. +
biorąc całkowite M zbiegające do oo.
59. Niech 0 n (t) =
/ n będzie funkcją okresową względem t. Po­
każ, że rozwinięcie ©n (t) w szereg Fouriera wyraża się wzorem
©n (t) =
+ 2 e _7t2ll'(cos27rt)+2e~47t2Ti(cos47rt)
+ 2 e" 97t2n (cos 67r t)+ • • • ) .
(Powyższy wzór odpowiada szybko zbiegającym szeregom dla sumy ©n =
@n (0 ) w równaniu ( 9 -9 3 ) 0
60. Wyjaśnij, dlaczego w każdym współczynniku asymptotycznego rozwinię­
cia
/2 n \ _
\ tl /
y /n ri \
8 tl
_ J __
__ 5______ 21
128n2
1 0 2 4 tl3
w mianowniku występuje potęga 2 .
32768n4
_5
U
61. Ćwiczenie 45 dowodzi, że niezgodność D (a ,n ) jest o (u) dla wszystkich
liczb niewymiernych oc. Zaproponuj niewymierne oc takie, że D (a ,n ) nie
będzie 0 (n 1 -e ) dla każdego e > 0 .
62. Przy danym n, niech
= maxk { £ } będzie największym elemen­
tem n-tego wiersza w podzbiorowym trójkącie Stirlinga. Pokaż, że dla wy­
starczająco dużych n, otrzymujemy m (n) = |_m(u)J lub m (n) = pm(n)],
gdzie
rfC (n)(m (n)+ 2 )ln (m (n )+ 2 ) = n ( m ( n ) + l ) .
Wskazówka: To jest trudne zadanie.
63. Udowodnij, że samo definiujący się ciąg S. W. Golomba z ćwiczenia 2.36
spełnia zależność f(n) = c()2 —
1 + 0 (n^- 1 /logrt).
64. Udowodnij następującą tożsamość:
v— COS 2lT7tX
------ 2—
n^l
^
/
7 /7
== 7t (x —x +
i\
..
A
dla 0 ^ x ^ 1 ,
używając wyłącznie „eulerowskiej” (osiemnastowiecznej) matematyki.
65. Jakie współczynniki występują w szeregu asymptotycznym
-
1
1
n — 71
1
7-------TT?------ TT “I-------- 1“ 7-------iTT
(n —1 ) (n —2 )
(n —1 )! =
CLl &7
a ° -------rt *—rt22 ------
_
'
P ro b lem y badaw cze
6 6 . Zaproponuj „interpretację kombinatoryczną” przybliżenia Stirlinga. (Za­
uważ, że rtn jest liczbą przekształceń zbioru {1 , 2 , . . . ,u} w siebie, a rt!
jest liczbą odwzorowań zbioru { 1 , 2 , . . . ,u} na siebie.)
67. Rozważmy wypełnioną punktami kwadratową tablicę o wymiarach n x u ,
n ^ 3, w której każdy punkt ma czterech sąsiadów. (Zakładamy, że pierw­
sze i ostatnie punkty w każdym wierszu i kolumnie sąsiadują ze sobą.)
Niech Xn będzie liczbą sposobów przyporządkowania punktom trzech ko­
lorów: czerwonego , białego oraz niebieskiego, tak aby każde dwa sąsiadu­
jące ze sobą punkty były pokolorowane różnymi kolorami. (Na przykład
X3 — 12.) Udowodnij, że
4 \ 3 n 2/ 2 —7t /6
Xn ~ ( f ) '
6 8 . Niech Qn będzie największą liczbą naturalną m taką, że Hm > n. Znajdź
Dwie dziurki
w nosie
skończyło się.
najmniejszą liczbę naturalną n taką, że Qn ^ [eTL-y + j \ , albo udowod­
nij, że takie rt nie istnieje.
O dpow iedzi do ćw iczeń
W rozdziale tym podamy odpowiedź (a przynajmniej krótki komentarz) do
każdego ćwiczenia. Niektóre z odpowiedzi wykraczają poza postawione py­
tanie. Czytelnicy najlepiej zrobią, jeżeli spróbują najpierw sami rozwiązać
zadania p r z e d z a j r z e n i e m do tego rozdziału.
Autorzy są zainteresowani poznaniem jakichkolwiek rozwiązań (także
rozwiązań częściowych) przedstawionych tu problemów badawczych, jak rów­
nież jakichkolwiek prostszych (czy poprawniej szych) rozwiązań pozostałych
zadań.
1 .1 .
Dowód jest w porządku poza przypadkiem n = 2. Gdyby wszyst­
kie dwuelementowe zbiory koni miały ten sam kolor, zdanie byłoby
prawdziwe dla każdego zbioru koni.
1 .2 .
Jeśli Xn jest liczbą ruchów, to Xo = 0 i Xn = Xn_i + 1 + Xn_i +1 +
Xn_i dla n > 0. Stąd (na przykład przez dodanie 1 do obu stron)
wynika, że Xn = 3n — 1. (Po ^Xn ruchach okaże się, że cała wieża
będzie na środkowym pręcie. W połowie drogi do domu!)
1.3.
Mamy 3n dopuszczalnych ułożeń, ponieważ każdy z krążków mo­
żemy położyć kolejno na każdym pręcie. Wszystkie te ułożenia mu­
simy napotkać podczas przenoszenia wieży, ponieważ najkrótsze roz­
wiązanie wymaga
— 1 ruchów. (Konstrukcja ta jest równoważna
„trójkowemu kodowi Graya”, który przebiega wszystkie liczby od
(0 . . . 0 )3 do (2 . . . 2 ) 3 , zmieniając za każdym razem dokładnie jedną
cyfrę.)
1 .4 .
Takie konfiguracje nie istnieją. Jeżeli największego krążka nie trzeba
ruszać, to wystarczy wykonać 2 n _1 — 1 ruchów (założenie induk­
cyjne), w przeciwnym razie wystarczy wykonać (2 n _ 1 — 1 ) + 1 +
(2 n _ 1 — 1 ) ruchów (znowu założenie indukcyjne).
1.5.
Nie. Dwa różne okręgi mogą się przeciąć w co najwyżej 2 punktach,
więc czwarty okrąg może zwiększyć liczbę obszarów do co najwy­
(Pierwszy odkrywca
każdego błędu
dostanie nagrodę
2,56 dolara.)
Czy to oznacza,
że ja muszę znaleźć
k a ż d y błąd?
(Rozumieliśmy
przez to
„jakikolwiek”
błąd.)
Czy to więc
oznacza, że tylko
jedna osoba
dostanie nagrodę?
(Hmmm, spróbuj
i przekonaj się.)
żej 14. Można jednak to zadanie rozwiązać za pomocą innych kształ­
tów (np. wydłużonych okręgów, czegoś w rodzaju „fasolek”):
Okazuje się, że
chodziło tu o liczbę
punktów przecięcia.
Wypukłość była
tylko zmyłką.
Venn [360] twierdził, że nie da się tego wykonać za pomocą elips
dla 5 zbiorów, jednak elipsoidalne rozwiązanie przypadku 5 zbiorów
zostało podane przez Gninbauma [167].
1.6.
Jeśli n-ta prosta przecina pozostałe w k > 0 różnychpunktach, to
dostaniemy k — 1 nowych obszarów ograniczonych (przy założeniu,
że żadne 2 proste nie są równoległe) oraz 2 obszary nieskończone.
Zatem maksymalna liczba obszarów ograniczonych wynosi (rt—2) +
(rt—3) + • - - = S-n,_2 - ( n - 1 ) (n—2 ) / 2 = Ln - 2n.
1.7.
Nie udowodnimy bazy: w rzeczywistości H(1) ^ 2 .
1.8.
Q 2 = (1 + |3)/<x; Q 3 = (1 + a + |3)/a|3; Q4 = (1 + oc)/13; Qs = oc;
Qs = p. W związku z tym nasz ciąg jest okresowy.
1.9.
(a) Prawdziwość P(n — 1) dostajemy z nierówności
Zakładamy tu, że
n > 0.
k
( x-\ H-------b xn- i \
n —1
)
( xi H---------\~xri- i
\
n —1
(b) X] . . . XlxXTL_|_i . . . X2ti^ (((^1 H-*'
((^ri+1 *,-H^2n)/T0)
na mocy P(n); wewnętrzny iloczyn jest nie większy niż ((xi H-------h
X2 n )/2 n ) 2 na mocy P(2). (c) Na przykład P(5) wynika z P( 6 ), z P(3),
z P (4) i z P(2).
1.10.
Pokaż najpierw, że Rn = !Rn _ 1 + 1 + Qn_i +. 1 + Rn- 1 , gdy n > 0.
Jak zobaczymy, metody rozdziału 7 pozwolą nam wyliczyć, że
=
((1 + V 3 r +1 - ( l - y / 3 ) n+' ) / ( 2 V 3 ) - 1 .
1 .1 1 .
(a) Nie możemy uczynić nic lepszego, niż przenieść na pręt po­
mocniczy podwójną (n — 1 )-wieżę, następnie przenieść dwa rów­
nej wielkości największe krążki odwracając ich porządek, i w końcu
znowu przenieść podwójną (n — l)-wieżę. Zatem An = 2An_i + 2
i An = 2Tn = 2 TX+1 — 2. Rozwiązanie to zamienia kolejność dwóch
największych krążków, ale zachowuje porządek pozostałych 2 n —2.
(b) Niech Bn będzie minimalną liczbą ruchów.. Wtedy Bi = 3 i
można pokazać, że żadna strategia nie daje wyniku lepszego niż Bn =
Atl_i + 2 + An_i + 2 + Bn_i dla n > 1. Zatem Bn = 2n + 2 —5, dla
każdego n > 0. Zadziwiające, ale jest to po prostu 2An — 1, i mamy
też Bn = An—i + 1 + An_i + 1 + An_i + 1 + A-rt—i .
1 .1 2 .
Jeśli wszystkie
> 0, to A (m i, . . . , m n ) = 2 A (m i>• • • >
)+
m n . Jest to równanie typu „uogólnionego Flawiusza” z rozwiązaniem
(mi . . . m n )2 = 2TV-1mi + • • • + 2m n_i + m n .Co ciekawe, okazuje
się, że rozwiązanie uogólnienia ćwiczenia l l b spełnia rekurencję
A(m -|, . . . ,m n ),
jeśli
;
mn = 1;
1,
jeśli rt = 1 ;
2 A (m i, . . . , m n_ i ) + 2m n
+
jeśli rt > 1 i m n > 1 .
I
2mn -
1.13.
Wiedząc, że n prostych może wyznaczyć Ln obszarów, możemy je
zastąpić bardzo wąskimi zygzakami z odcinkami wystarczająco dłu­
gimi, aby uzyskać 9 przecięć z każdym innym zygzakiem. W związku
z tym ZZn = ZZn_i + 9n — 8 , dla wszystkich rt > 0, i dalej
ZZn = 9Sn —8 rt + 1 = | u 2 — j n + 1.
1.14.
Liczba nowych 3 -wymiarowych obszarów zdefiniowanych przez n-te
cięcie jest równa liczbie 2 -wy miarowych obszarów wyznaczonych na
płaszczyźnie cięcia przez jej przecięcia z innymi płaszczyznami. Za­
tem Pn = Pn_i + Ln_i i okazuje się, że P5 = 26. (Sześć cięć w sze­
ściennym kawałku sera czyni z niego 27 kostek, albo aż do Pę = 4 2
kawałki dziwniejszych kształtów.)Ciekawe, że rozwiązanie tej reku­
rencji pasuje do ładnego wzorca wyrażonego przez współczynniki
dwumianowe (zob. rozdz. 5):
Oczywiście Xn jest liczbą 1 -wymiarowych obszarów wyznaczonych
przez n punktów na prostej.
1.15.
Funkcja I spełnia tę samą rekurencję co J, gdy n > 1, ale 1(1) jest
nieokreślone. Ponieważ 1(2) = 2 oraz 1(3) = 1, więc nie istnieje
wartość 1( 1 ) = a, która pozwoliłaby nam zastosować ogólną metodę.
„Końcówka” rozwijania zależy od 2 najstarszych bitów w dwójkowej
reprezentacji n.
Założę się, że wiem,
co się będzie działo
w 4 wymiarach!
Jeśli rt - 2m + 2 m _ 1 + k , gdzie O <C k < 2 m + 1 + 2 m - (2m + 2™ -1) =
>
2. Inną drogą wyrażenia tego za pomocą notacji n = 2m + l jest
stwierdzenie, że
2 m + 2 m_1, to rozwiązaniem będzie I(n) = 2 k + 1 dla każdego n
irni = l J(u) + 2 m _ l’ i e ś l i 0 ^ l < 2m -1;
J
1 J(n) - 2 m,
jeśli 2 ™ " 1 ^ l < 2 m.
1.16.
Niech g(rt) = a(rt)a + b(n)|3o + c(rt)(3i + d(n)y. Z równania ( 1 . 1 8 )
wiemy, że dla każdego rt = (1 bm_i . ..b i bo )2 zachodzi a ( n ) a +
b (n )p 0 + c (n ) 0 i = (a |3 b m_ 1 |3bm_ 2 . . . |3bl Pbota; to nam definiuje
a(n), b(rt) i c(n). Po podstawieniu g(n) = n do naszego równa­
nia rekurencyjnego dostajemy a(n) + c(n) — d(n) = rt; wiemy więc
wszystko. (Przyjmując g(n) = 1, uzyskujemy dodatkową tożsamość
a (rt) — 2 b(rt) — 2 c(n) = 1 , którą można zastosować do wyrażenia
b(u) za pomocą prostszych funkcji a(u) i a(n) + c(n).)
1.17.
W ogólności mamy W m ^ 2Wm_ k + Tk, dla 0 ^ k ^ m. (Relacja
ta odpowiada przeniesieniu wierzchnich m —k krążków na któryś z
pomocniczych prętów, następnie bez użycia tego pręta przeniesieniu
dolnych k krążków, i w końcu powtórnym przeniesieniu wierzchnich
m — k krążków na pręt docelowy. Przedstawiona nierówność zależy
od wartości k, która minimalizuje prawą stronę dla m = rt(n +
1)/2. (Nie możemy jednak stwierdzić, że zachodzi równość; istnieje
wiele innych strategii wartych uwagi). Jeśli przyjmiemy, że Yn =
(Wn(n+i ) / 2 — l ) / 2 n , to dojdziemy do wniosku, że Yn ^ Yn_i + 1;
zatem W n (n + 1 ) / 2 < 2n (n - 1) + 1.
1.18.
Wystarczy pokazać, że obie półproste wychodzące z [n 2\ 0 ) prze­
tną obie półproste wychodzące z (n 2 k, 0 ), i że wszystkie te punkty
są różne. Półprosta wychodząca z (x3-, 0) przez (xj — a j, 1) prze­
cina półprostą wychodzącą z (xk>0 ) przez (xk — cik,1 ) w punkcie
(xj —
gdzie t = (xk — Xj)/(a.k — aj). Niech Xj = n 2^ oraz
aj = ró + (0 lub n -1x). Wtedy współczynnik t = (n2k — rt2^)/
(rtk —ró + (—n _1x lub 0 lub rt-11)) leży dokładnie między ró + n k — 1
i ró + rtk + 1 ; tak więc współrzędna y punktu przecięcia jednoznacz­
nie określa j oraz k. Podobnie, cztery przecięcia mające te same j
oraz k są różne.
1.19.
Nie, gdy n > 5. Załamana linia, której ramiona rozchodzą się pod
kątami 0 i 0 + 30°, może przeciąć inną, której ramiona rozchodzą się
pod kątami c|) oraz + 30° 4 razy tylko wtedy, gdy 30° < |0 — 4>| <
150°. Nie możemy wybrać więcej niż 5 kątów tak bardzo oddalonych
od siebie (ale można wybrać 5).
1 .2 0 .
Niech H(n) = a(rt)oc+b(rt)|3o+ c(n)|3i +d(rt)yo + e ( u ) y i. Wiemy z
( 1 . 1 8 ), że a(n)<x+b(n)po + c ( n ) 0 i = ( a p bin_, Pbm_ 2 . - - 0 bl Pb0 )4 ,
kiedy rt = (1 bm_i .. .b i bo) 2 - To określa a(n), b(rt) i c(rt). Przyj­
mując H(n) = rt, uzyskujemy a(n) + c(n) — 2 d(n) — 2 e(n) = n;
przyjmując H(n) = n 2, dostajemy a(n) + c(n) + 4 e(n) = n 2. Zatem
d(n) = (3a(n) + 3c(n) —rt2 —2n )/4; e(n) = (rt2 — a(n) —c(n ))/4 .
1 .2 1 .
Wystarczy wziąć jako m najmniejszą (lub jakąkolwiek) wspólną wie­
lokrotność 2n, 2 n —1, . . . , n + 1. (Nieformalnie można sobie wyobra­
zić, że „losowa” wartość m będzie dobra z prawdopodobieństwem
n n —1
1
_
j ( 2ti\
2n 2rt — 1 " n + 1
/ \ n J
4n
możemy się więc spodziewać istnienia takiego m mniejszego niż 4™.)
1 .2 2 .
Weź 2n-kąt foremny i poetykietuj jego boki elementami „cyklu de
Bruijna” długości 2n . (Cykl de Bruijna to cykliczny ciąg 0 i 1, w
którym każdy podciąg kolejnych elementów jest inny; zob. [207, ćw.
2.3.4.2-23] i [208, ćw. 3.2.2-17].) Dodaj bardzo cienkie uzupełnienie
każdego boku etykietowanego 1. Szukane n zbiorów, to kopie po­
wstającego wielokąta obróconego o długość k boków dla k = 0 , 1 ,
..., n - 1 .
1.23.
Tak. (Do dowodu potrzebujemy pewnych podstaw teorii liczb z roz­
działu 4). Niech L(n) = N W W (1, 2 , . . . ,n ). Możemy założyć, że
rt > 2; więc zgodnie z postulatem Bertranda istnieje liczba pierw­
sza p między n /2 a n. Możemy również założyć, że ) > n /2 , gdyż
q ' = L(n) + 1 —q pozostawia j ' = n + 1 —) wtedy i tylko wtedy, gdy
q pozostawia j. Dobierz q tak, aby q = 1 (mod L (n)/p) i q = j+1 —rt
(mod p). Osoby są teraz eliminowane w następującej kolejności: 1,
2 , . . . , n - p, ) + 1 , j + 2 , . . . , rt, n - p + 1 , . . . , j - 1 .
1.24.
Jedynymi znanymi przykładami są: Xn = 2 i s in 7t r + 1/X n_ i , gdzie r
jest wymierne, a 0 ^ r < | (w zależności od zmieniającego się r do­
stajemy wszystkie możliwe okresy większe od 1 ); rekurencją Gaussa
o okresie 5 w ćw. 8 ; zaskakująca rekurencją H. Todda, o okresie 8 :
XTL= (1 + X n_i + Xtv_ 2 )/X t l _ 3 , (zob. [261]); oraz wszystkie rekuren­
cje uzyskane z przedstawionych powyżej przez zastąpienie Xn przez
stałą razy Xmn. Możemy założyć, że pierwszy niezerowy współczyn­
nik w mianowniku jest jednością i że pierwszy współczynnik nie­
zerowy w liczniku (o ile istnieje) ma nieujemną część rzeczywistą.
Za pomocą algebry komputerowej można pokazać, że nie ma więcej
rozwiązań o okresie nie przekraczającym 5, gdy k = 2. Teoria takich
rekurencji została częściowo rozwinięta przez Lynessa [261, 262] oraz
przez Kurshana i Gopinatha [231].
Interesującym przykładem o okresie 9 przy początkowych warto­
ściach rzeczywistych jest rekurencją Xn = |Xtl_i | — XTL_ 2 odkryta
przez Mortona Browna [45]. Nieliniowe rekurencje dowolnej długości
powyżej 4 mogą opierać się na kontynuantach [6 6 ].
1.25.
Jeśli T(k)(n) oznacza minimalną liczbę ruchów potrzebną do prze­
niesienia n krążków przy k pomocniczych prętach (w szczególno­
ści T(1 )(n) = Tn i T(2 )(n) = W n), to T ^ t ^ 1)) ^ 2 T ^ ( © ) +
T (k—i ) (
i )). Nie są znane przykłady (rt, k), dla których ta nierów­
ność byłaby ostra. Dla małych k w stosunku do rt wzór 2 n +1 _k
daje wygodne górne ograniczenie na
((£)).
)
1.26.
Permutacje odpowiadające kolejności egzekucji można wyliczyć w
O(rtlogn) krokach dla każdego m oraz n [209, ćw. 5.1.1-2 i 5.1.1-5].
Bjorn Poonen udowodnił, że niefławiuszowe zbiory z dokładnie 4
„złymi osobami” istnieją, jeśli rt = 0 (mod 3) oraz rt ^ 9; w rze­
czywistości liczba takich zbiorów jest równa co najmniej e(J) dla
pewnego e > 0. Poonen odkrył też za pomocą żmudnych obliczeń,
że poza tym jedyną liczbą poniżej 24 ze zbiorami nieflawiuszowymi
jest rt = 20, dla której istnieje 236 takich zbiorów przy k = 14 oraz 2
przy k = 13. (Jednym z nich jest {1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,1 1 ,1 4 ,1 5 ,1 6 ,1 7 };
drugim— jego odbicie lustrzane względem 21.) W przypadku rt =
15 oraz k = 9 istnieje jedyny nieflawiuszowy zbiór, a mianowicie
{3,4,5,6,8,10,11,12,13}.
2 .1 .
Brak jest powszechnej zgody co do interpretacji tego zapisu. Sen­
sowne są trzy odpowiedzi: ( 1 ) Możemy przyjąć, że suma Xk=m
jest równoważna sumie
^k, a w takim przypadku nasza
suma jest równa zeru. ( 2 ) Można powiedzieć, że dana suma jest
równa q4 +<l3 + c |2 + ęh H-qo» jeżeli będziemy sumowali względem ma­
lejących wartości k. To jednak pozostaje w sprzeczności z powszech­
nie przyjętą konwencją, że 5 Z£ =1 ^ =
S^y n =
(3) Można
przyjąć, że w ogólności Hk=m ^
flk - L k < m ^ wówczas
rozważana suma jest równa —q i — q2 —q3 - Konwencja ta może wy­
glądać dziwnie na pierwszy rzut oka, ale spełnia użyteczne prawo
i L
+ l U + i = L L a dla wszystkich a ,b ,c .
A najlepiej używać notacji
tylko wtedy, gdy n — m ^ —1;
wówczas obie konwencje (1) i (3) są zgodne.
2 .2 .
Jest to po prostu |x|. Przy okazji: wartość ([x > 0]—[x < 0]) jest często
nazywana sign(x) lub signum(x); jest ona równa + 1 , gdy x > 0 ,
0 , gdy x = 0 i —1 , gdy x < 0 .
2.3.
Pierwsza z sum, to oczywiście ao + ai + a 2 + a 3 + a 4 + as; druga
to a 4 + ai 4 - ao + ai + a4, gdyż suma brana jest względem wartości
k e {—2 , —1, 0, + 1 , + 2}. Prawo przemienności tu nie zachodzi, gdyż
funkcja p(k) = k2 nie jest permutacją. Dla niektórych wartości rt
(np. rt = 3) nie istnieje takie k, żeby p(k) = tl; dla innych (np.
n = 4) istnieją dwie takie wartości k.
2-4.
(a) L t ,
iL j+ i ^
= E?=i L i W , L L r ,
=
((tli 23 + 0-124) + a i 34) + 0-234(b) U L i L - r ; L i : ! aij]c = Z L s T . U L ł= i atjk = a i 23 + (a i2 4 +
(a l 34 + 0-234)) •
2 .5 .
Jest to [1 ^ j ^ rt] (n —j + 1). Pierwszy czynnik jest niezbędny, gdyż
powinniśmy otrzymać O dla j < 1 lub j > u.
2.6.
Ta sama zmienna ‘k’ została użyta jako indeks dwóch różnych sum,
mimo że samo k jest związane z sumą wewnętrzną. Jest to częsty
błąd w matematyce (i programowaniu komputerów). Wynik byłby
prawidłowy, gdyby zachodziło aj = ak dla wszystkich j i k, 1
j,k ^ n .
2 .7 .
m xm_1. Wariant rachunku różnicowego oparty na operatorze V za­
miast na A uprzywilejowałby zatem potęgi przyrastające.
2.8.
O, jeśli m ^ 1; 1/|m|!, jeśli m ^ 0.
2 .9 .
xTn+rt _ xm
_j_ m )Tt} ęQa m oraz n całkowitych. Po podstawieniu
m = —tl dostaniemy x - n = 1/(x —rt)71 = 1/(x — 1)—.
2.10.
Prawą stronę można też zapisać jako EuAv + v Au.
2.11.
Rozbij prawą stronę na 2 sumy i zmień k na k + 1 w drugiej z nich.
2.12.
Jeśli p(k) = rt, to n + c = k + ((—1)k + 1)c, przy czym ((—1 )k + 1)
jest parzyste. Zatem (—1)n+c = (—l ) k, i k = rt — (—1)lx+cc. Na
odwrót, taka wartość k oznacza, że p(k) = rt.
2 .13 .
Przyjmijmy R0 = a, Rn = Rn_i + (-1 )n (0 + n y + n 2b) dla n > 0.
Wtedy R(n) = A (u) a + B (u)|3 + C {n )y + D(n)6. Podstawiając
Rn = 1 otrzymujemy A(n) = 1. Podstawiając Rn = (—l ) n otrzy­
mujemy A(n) + 2B(n) = (—1)n . Podstawiając Rn = (—1)nu otrzy­
mujemy —B(n) + 2C(n) = (—1)nn. Podstawiając Rn = (—1)nu 2
otrzymujemy B(n) — 2C(n) + 2D (n) = (—1)nrt2. Wynika stąd, że
2D (n) = (—l ) n (rt2 + n ); szukana suma to D (u).
2 .14 .
Sugerowane przedstawienie tej sumy jest prawidłowe, gdyż zachodzi
k = Li<cj<ck 1 ^la 1 ^ k ^ rt. Po przesumowaniu najpierw względem
k nasza podwójna suma upraszcza się do
Y _ (2 n + 1 - 2 ’) = n 2 u + 1 - (2 n + 1 - 2 ).
l^j^TL
2 .1 5 .
W pierwszym kroku zastępujemy k ( k + 1) przez 2 ^ 1<;j<k j. W dru­
gim kroku zauważamy, że SPn + mn = (L k = i k) 2 + Dn.
„Głęboko błędnym
truizmem,
powtarzanym
we wszystkich
podręcznikach
i przez wszystkie
sławy przy okazji
rozmaitych
wystąpień jest,
że powinniśmy
kultywować nawyk
myślenia o tym,
co robimy
W istocie trzeba
postępować
dokładnie
na odwrót. Postęp
cywilizacji dokonuje
się przez
poszerzenie
repertuaru ważnych
operacji, które
jesteśmy w stanie
stosować bez
myślenia o nich.
Działanie myśli
przypomina szarże
kawalerii w bitwie.
Ich liczba jest ściśle
ograniczona;
wymagają one
1 świeżych koni
i powinny być
dokonywane
we właściwych
momentach.”
A.N. Whitehead [371]
2 .1 6 .
x—(x —m )—= xm+n = x—(x —rt}—, na mocy ( 2 .5 2 ).
2 .1 7 .
Skorzystaj z indukcji dla pokazania pierwszych dwóch równości i z
równania ( 2 .5 2 ) dla pokazania trzeciej. Drugi zestaw równości wy­
nika z pierwszego.
2 .1 8 .
Skorzystaj z tego, że (9lz)+ ^ |z|, {9\z)~ ^ |z|, (3z)+ ^ |z|, (3z)_ ^
|z| oraz |z| ^ (9ctz)+ + (£Kz)“ + (3z)+ + p z ) “ .
2 .1 9 .
Przemnóż obie strony przez 2n _ 1/rt!, a następnie przyjmij, że Sn =
2nTn/rt! = Sn_i + 3 • 2 n _ 1 = 3(2n — 1) + So- Rozwiązaniem jest
więc Tn = 3 •rt! + n!/2'a_1. (Jak zobaczymy to w rozdziale 4, Tn jest
całkowite jedynie wtedy, gdy rt jest równe 0 lub jest potęgą 2 .)
. .
2 20
Metodą zaburzania
Sn + (TL+ 1 )Hn+i = Sft + f
2 .2 1 .
H fc ^ + T l+ 1 .
Wyciągnięcie ostatniego wyrazu przed sumę daje Sn +1 = 1 — Su ;
wyciągnięcie pierwszego wyrazu daje nam
Sn+l = ( - 1 ) n + 1
+l^k^n
Y. (-1)
n + 1 —k
+1
= H
) n+1
n—k
I
h :
= ( - 1)
T l+ 1
O^k^n
W związku z tym 2Sn = 1 + ( —1)n i otrzymujemy Sn = [rt parzyste].
Podobnie dostajemy
n
Tn+i = n + 1 —Tn = ^ ( - 1 )— k( k + 1 ) = T n + Sn>
k=0
więc 2Tn = rt + 1 —Sn i ostatecznie Tn = ^ (tl + [rt nieparzyste]). W
końcu to samo podejście daje nam
Un +1
=(n + 1 )2 - U n =
Un
+ 2Tn + Sn
= Un + rt + [rt nieparzyste] + [rt parzyste]
= Un.
Un jest zatem liczbą trójkątną i(rt + 1 )rt.
+ Tl + 1 .
2 .22.
Podwójna suma w ogólnej tożsamości Lagrange’a dwukrotnie po­
zwala nam zastosować sumowanie „waniliowe” względem 1 s: j .k s :
n. Po rozdzieleniu dostaniemy w końcu ( £ k akAk) ( ^ k bkBk) —
(L k a kBlc) (L k bkAlc).
2.23.
(a) Podejście to daje 4 sumy, które upraszczają się do 2n + Hu —
2n + (Hn +
— 1). (Byłoby prościej, gdyby udało się. wyrazić
składniki przez 1/k + 1 / ( k + 1).) (b) Niech u(x) = 2x + 1 , a Av(x) =
1 /x (x+ 1 ) = (x—1)— ; wtedy Au(x) = 2 i v ( x ) = —(x—1)— = —1/x.
Odpowiedzią jest 2HU —
2.24.
Sumując przez części dostajemy ^ x ^ H x 6 x = x ^ ± iH x/( m + 1) —
^m+l
/(m + I ) 2 + C; więc L o ^ k < n k~ H^ =
- 1/(m +
1 ) ) / (ttl+ 1) +
(m + 1)2. W naszym przypadku m = —2, więc
poszukiwana suma sprowadza się do 1 — (Hn. + 1 ) /( n + 1 ).
2.25.
Oto kilka podstawowych analogii:
Y _ ca k = c Y _ ak
kGK
<-
kGK
^ T (a k+ b k) = ^ a k + ^ b k
kGK
kGK
X
=
kGK
kGK
ap<k)
Yl
=
n
kGK
Y a j>k = YLYLa ^>k
n
je j
kGK
kGK
Y _ Qk = J > * [kGK]
7
= ( r i ak) ( r i bk
Xk G K
7 Vk G K
'
kGK
jG j
kGK
j€ j
= ( n « ) ‘
Vk G K
E K
p(k)G K
kGK
2.26.
E K
kGK
ap(k)
p (k)G K
a).k = n
n
^ .k
jG j kGK
n « * = r K €K]
k
kGK
k
: #K
X 1 = #K
ric = <
kGK
kG K
p2 = (n sjj ,k<;n a i a k) (n SCj=k!;n Qi Qk) ■ Pierwszym czynnikiem
1
1
jest ( n L i a k )2i drugim: n L i a t- Zatem p = (F I L i a k)n + '2.27.
A(’c£) = c-(c —x —1) — c^±V(c —x). Podstawiając c = —2 i zmniej­
szając x o 2 dostajemy A(—(—2)— -) = (—2 ) - /x t w związku z tym
szukana suma jest równa (—2 )— — (—2 ) ^ 1 = (— 1 )nrt! — 1 .
2.28.
Nie da się uzasadnić zamiany kolejności sumowania między drugim i
trzecim wierszem wyprowadzenia. Składniki tych sum nie są zbieżne
bezwzględnie. Wszystko poza tym jest bez zarzutu, może z wyjąt-
kiem tego, że wynik sumy L k ^ i fr = j — l]lc/j powinno się raczej
zapisać jako [j — 1 ^ 1 ](j — 1 )/j, a następnie od razu uprościć.
2.29.
Zastosuj ułamki proste, aby uzyskać tożsamość
Czynnik (—1)* sprawia, że dwie połowy każdego wyrazu kasują się
ze swoimi sąsiadami. To co pozostaje, to —1/4 -f (—1)n/{S n + 4).
2.30.
21^ x 8x = j (b - — a-) = \ (b — a) (b + a — 1). Otrzymujemy więc
(b — a)(b + a — 1) = 2100 = 2 2 -3-5 2 -7.
Mamy jedno rozwiązanie dla każdego przedstawienia liczby 2100 jako
iloczynu 2100 = x -y , gdzie x jest parzyste, a y nieparzyste. Przyj­
mijmy a = j \x —ul + \ i b = j [ x + y) +
Liczba rozwiązań jest
zatem liczbą dzielników liczby 3-5 2 -7, równa się więc 12. W ogólno­
ści liczbę n p Pnp możemy przedstawić na Y lv> 2^n v + ^) sposobów,
gdzie iloczyny bierzemy względem wszystkich liczb pierwszych.
2 -3 1 -
- l / i ) = L j > 2 1 /i(j - 1 ). W analogiczny
sposób pokazujemy, że druga z sum jest równa 3/4.
2.32.
Dla 2rt ^ x < 2rt+l rozważane sumy wynoszą OH------- |-n + (x —rt—1) +
-----b (x—2rt) — rt(x—rt) = (x—1) + (x—3) H-------h (x—2rt+1). Podob­
nie, dla 2rt — 1 ^ x < 2rt obie te sumy są równe rt(x — rt). (Jeśli
wybiegniemy nieco naprzód do rozdziału 3, to zobaczymy, że wzór
I i( x + 1 )] (x — (x + 1 )J) obejmuje oba przypadki.)
2.33.
Jeśli K jest puste, to AkeK ak = °°* Podstawowe analogie, to
^ (a ic + b ic ) =
Y _ a k + Y . b !c
kGK
kGK
<— >
A
m i n (a k , b k )
2 .3 4 .
Niech K+ = {k | ak ^ 0} i K = {k |
< 0}. Jeśli teraz np. n jest
nieparzyste, to wybieramy Fn równe Fn _ i U En , gdzie En C K_ jest
wystarczająco duże, aby Zke(Fn_,nK+) a k “ L k 6 E„(_ a ic) < A _ -
2 .3 5 .
Można pokazać, że suma Goldbacha może być przedstawiona jako
1
= Z
Z
m,n^ 2
m >2
m (m — 1
=
1
Permutacja
zużywająca wyrazy
jednego znaku
szybciej niż
drugiego może
doprowadzić sumę
do dowolnej zadanej
wartości.
Dowód: Rozpisując ciąg geometryczny dostajemy L keP i^i k 1; do
dowodu wystarczy więc znaleźć bijekcję między uporządkowanymi
parami (m ,n ) takimi, że m,rt ^ 2 i uporządkowanymi parami (k, l),
gdzie k £ P i l ^ 1, przy założeniu że m n = kl , kiedy pary odpowia­
dają sobie. Jeśli m i P, to przyjmijmy, że (m ,n) <— » (mn , 1); jeśli
a -,b ) .
natomiast m = a b e P, to przyjmijmy, że (m ,n)
2 .3 6 .
(a) Na mocy definicji g(n) — g(rt — 1) = f( n ). (b) Na mocy (a),
g ( g W ) - g ( g ( n - 1)) = L k f ( k ) [ 9 ( n - 1 ) < k ^ g ( n ) ] = n ( g ( n ) g(n — 1)) = n f(n ). (c) Znowu na mocy (a) mamy g(g(g(n}}) —
g ( g ( g ( n - 1 ))) jest równe
X . f (k) [g(g(n ~ 1 ) ) < k ^ 9 (g(n))]
k
= X . ’ [ j = f (k)][9 (9(n - ' I) ) < lc^ g ( g (n ))]
),k
= X .) [ j = f ( k ) ] [ g ( n - 1)< K g ( n ) ]
j,k
=
=
(g (j)-g (j-i))[g (n -i)< j< g (n )]
2 1 ^
)
) [9 ( ^ - 1 ) < K g ( n ) ] = n £ j [ g ( n - 1 ] < j < g ( n ) ]
)
Colin Mallows zauważył, że ciąg Golomba może być zadany rekurencyjnie jako
f(1) =
1;
f(n + 1 ) = 1 + f ( n + 1 - f ( f ( u ) ) ) ,
d la n ^ O .
2 .3 7 .
(RLG podejrzewa, że raczej nie pokryją, DEK sądzi, że raczej po­
kryją, OP nie włącza się w tę dyskusję.)
3 .1 -
m = L lg n J ;
3 .2 .
(a) |x + 0,5J. (b) r x - 0 ,5 1 .
3 .3 .
Jest to [m n —{m a}n /aj = m n — 1, gdyż 0 < {ma} < 1.
3 .4 .
Czasami, gdy nie jest potrzebny dowód, wystarczy tylko zgadnąć.
l = n - 2 m = n - 2 L ' « uJ.
Z takim
samoopisem ciąg
Golomba nie miałby
większych szans
w „Randce
w ciemno”!
3.5.
Wiemy, że [nxj = [n[xj +rt{x}J = n[xj + |_n{x}J z (3 .8 ) i (3 .6 ). Dla­
tego |_nxj = n[xJ <ś=> [n{x}J = 0 <ś=> 0 ^ rt{x} < 1 <=> {x} <
1/rt, przy założeniu, że rt jest dodatnią liczbą całkowitą. (Zauważ,
że w tym przypadku dla wszystkich x mamy n[xj ^ |_nxj.)
3.6.
[f(x)J =
3.7.
[rt/mj + n mod m.
3.8.
Jeśli wszystkie pudełka zawierają mniej niż [n /m ] przedmiotów, to
n ^ ([n /m ] — l)m , zatem n / m + 1 ^ [n /m ], co przeczy wzorom
(3 .5 ). Analogicznie dowodzimy drugiej nierówności.
3.9.
Wiemy, że m /n — 1/q = (n antymod m )/q n . Algorytm musi się
zakończyć, gdyż 0 ^ n antymod m < m. Ponieważ q n /(n antymod
m) > q, to wyliczane mianowniki są różne, gdyż tworzą ciąg ściśle
rosnący.
3.10.
Jeśli {x} ^ j , to [x + j ] — [(2x + 1)/4 nie jest liczbą całkowitą] jest
najbliższą do x liczbą całkowitą. W przeciwnym razie jest to naj­
bliższa liczba parzysta. (Zobacz zadanie 2 .) Stąd wzór ten daje nam
metodę „zaburzonego” zaokrąglania.
3.11.
Jeśli n jest liczbą całkowitą, to cc < n < (3 <=> [aj < n <
[|3]. Liczb całkowitych spełniających warunek a < n < b dla a
i b całkowitych jest (b — a — 1)[b > a]. Dlatego możemy uzyskać złą
odpowiedź, gdy oc = |3 i obie liczby są całkowite.
3 .12.
Odejmijmy [n /m j od obu stron równości { 3 .6 ). Uzyskamy [(n m od
m )/m ] = [(n mod m + m — 1)/m J . Ponieważ 0 ^ n mod m < m,
więc obie strony są teraz równe [n mod m > 0 ].
Nieco krótszy, lecz mniej bezpośredni dowód wynika z obserwacji,
że pierwszy składnik równości ( 3 .2 4 ) musi być równy ostatniemu
składnikowi równości ( 3 .2 5 ).
3.13.
Jeśli tworzą one podział, to z definicji N(ct,n) wynika, że 1 /a +
1 / |3 = 1 } ponieważ jeśli równanie N(<x,n) + N (|3,n) = n ma być
prawdziwe dla dużych n, to współczynniki przy n po obu stronach
. równania muszą być sobie równe. Zatem obie liczby oc i |3 są albo
równocześnie wymierne, albo równocześnie niewymierne. Jeśli obie
są niewymierne, to jak było pokazane w tekście, otrzymamy podział.
Jeśli obie mogą być zapisane z licznikiem m, wartość m —1 nie pojawi
się w żadnym z widm, a wartość m pojawi się w obu. (Jednakże
Golomb [151] zaobserwował, że zbiory {[nctj | n ^ 1} i {[n|3] — 1 |
n ^ 1} zawsze tworzą podział, gdy 1 / a + 1/(3 = 1.)
3.14.
Gdy n y = O, wynika to z równości (3 .2 2 ). W przeciwnym razie wy­
nika z ( 3 .2 1 ) i ( 3 .6 ).
3.15.
Wstaw [mx] zamiast rt we wzorze ( 3 .2 4 ): [mx] = |"x] + [x —
3.16.
Sprawdź równość rt mod 3 = 1 + i ((cu — 1 )cun — (cu + 2)cu2n) dla
0^n<3.
W zadaniu 7.25 można znaleźć ogólny wzór dla n mod m, gdzie m
jest dowolną liczbą całkowitą.
3 -1 7 *
L j )k [ ° ^ k < T n '] [ 1
+ k/™J =
[k ^ m(j —x )]. To wyrażenie jest równe
+
^ M ] x
^ k < m] —
L k [ ° ^ k < m 0 _ x )] = vn\x] - [m(|"x] - x ) ] = - \ - m x \ =
|_mxj.
3.18.
Wiemy, że
S =
L [ j c x - U k < ( j + v ) a - 1] .
O^jc [net] k^n
Jeżeli j ^ rux — 1 ^ noc —v, to (j + v ) a _1 ^ ri i wszystkie składniki
sumy są równe zeru. Wystarczy zatem rozważyć przypadek, gdy j =
|_na|, ale wtedy suma równa się |"(|naj + v ) a - 1 ] —rt ^ [va-1 ].
3.19.
Wtedy i tylko wtedy, gdy b jest liczbą całkowitą. (Jeśli b jest liczbą
całkowitą, to logb x jest ciągłą i rosnącą funkcją o wartościach cał­
kowitych tylko w całkowitych punktach. Jeśli b nie jest liczbą cał­
kowitą, to dla x = b równość jest fałszywa.)
3.20.
Mamy
k x ^ |3 ] = x ^ k k [[a /x ] ^ k ^ |_PAJ]> co sumuje
się do lx(|_|3/xj |_|3/x + 1 J — \oc/x\ \oc/x— 1 ]).
3.21.
Niech 10™ ^ 2 M < 10n+1. Ponieważ tylko jedna z k-cyfrowyćh po­
tęg 2 zaczyna się od 1 , to dokładnie n + 1 potęg 2 zaczyna się od
cyfry 1. Zatem odpowiedzią jest 1 + [M.log2J.
Uwaga: Dużo trudniej jest policzyć liczbę potęg 2 zaczynających się
od cyfry l, gdy l > 1: jest to Z o « ^ M (L n l ° g 2 ~ lo6 l J “ Ln l o g 2 log(l+ 1)J).
3 . 2 2 .Sumy o indeksach rt i rt—1 są identyczne, z wyjątkiem k-tego wyrazu,
gdzie rt = 2 k_1 q i q jest liczbą nieparzystą. Stąd Sn = Sn_i + 1 i
Tn = Tn_i + 2kq. Zatem Sn = n i
= n (n + 1).
3.23*
= m
2n <
^m (m — 1) < n ^ ^m (m + 1) <==> m 2 — m + \ <
m2 + m + ^
4=^
m — \
< \/2 ti < m +
„Podczas próby
przeprowadzenia
dowodu
indukcyjnego, może
ci się nie powieść
z dwóch
przeciwstawnych
powodów. Albo
próbujesz dowieść
za dużo: twoja teza
indukcyjna P(n)
jest za mocna, albo
próbujesz dowieść
za mało: twoje
założenie
indukcyjne P(rt)
jest za słabe.
Ogólnie musisz
wypośrodkować
treść twego
twierdzenia tak,
by założenie było
wystarczająco silne
do udowodnienia
tezy.”
G. Pólya [298]
3. 24.
Niech |3 = <x/(oH-1). Wtedy liczba m pojawia się w Spec(P) dokład­
nie jeden raz więcej niż w Spec(ct). Dlaczego? Ponieważ N ((3,tl) =
N (a ,n ) + n + 1 .
3.25.
Zgodnie z rozważaniami z tekstu rozdziału, jeśli znajdziemy liczbę m
spełniającą nierówność Km ^ m, to będziemy mogli zaprzeczyć
nierówności dla rt + 1, gdzie rt = 2m + 1. (Także dla u = 3rrt + 1
lub rt = 3m + 2.) Istnienie takiego rrt = rt' + 1 wymaga, żeby była
prawdziwa któraś z nierówności 2 K|_n //2j ^ rt' lub 3K^n // 3 j ^ rt',
tzn.
KLn'/2j
[n'/2\
lub
Aha! Schodzilibyśmy tak w dół i w dół, dochodząc w końcu do nie­
równości Ko ^ 0 , gdy tymczasem Ko = 1 .
Tak naprawdę, to chcemy udowodnić, że dla każdego rt > 0, Kn jest
ostro większe od rt. Faktycznie, tę nierówność jest łatwo udowodnić
przez indukcję, choć jest ona mocniejsza od nierówności, której nie
mogliśmy udowodnić w ten sposób!
(To zadanie udziela nam ważnej lekcji. Więcej dowiadujemy się z
niego o naturze indukcji niż o własnościach funkcji podłoga.)
3.26.
Dowód indukcyjny, z silniejszą hipotezą indukcyjną
^
~ 1 1>
d la r O O .
3.27.
Jeśli D i3* = 2mb —a, gdzie a równa się 0 lub 1, to
3.28.
Jeśli an = m 2, to a n + 2 k + 1 = (m + k ) 2 + m - k i a n + 2 k + 2 = (m + k)2+
2rrt, gdzie 0 ^ k
m. Stąd a n + 2 m + 1 = (2rrt)2. Rozwiązanie może
być zapisane w ładnej postaci znalezionej przez Carla W itty’ego:
CLtl—1 — 2 l +
3.29.
n -l
= 3mb —a.
2
gdzie 2 l + 1 ^ rt < 2 l+ 1 + 1 + 1 .
D (a ', |_artj) jest równy co najwyżej modułowi z największej wartości
prawej strony równości
s(ct', |n a j ,v ')
= —s(a,rt,v) — S + e + {0 lub 1} + v' —{0 lub 1}.
3.30.
Dowodzimy indukcyjnie, że Xn = oc2n + a 2*\ a Xri jest liczbą cał­
kowitą.
3.31.
Oto „elegancki” i „imponujący” dowód, który nie daje żadnej wska­
zówki, jak został odkryty:
L*J + LvJ + L * + y J = L * + L y J j + L * + y J
^ Lx + i L2yJJ + Lx + 1 L2 yJ + 2J
-= [ 2x + [ 2y \ \ = [2xJ + \ 2 y \ .
Istnieje również prosty, graficzny dowód oparty na obserwacji, że wy­
starczy tylko rozważyć przypadek 0 ^ x,tj < 1. Funkcje wyglądają
tak, jak na rysunku:
1
2
0
1
Możemy udowodnić trochę silniejszą nierówność, mianowicie
M + LyJ + I* + vj <
[2x\+| y J .
2
Różnica zachodzi tylko dla {x} = j . Jeśli zastąpimy w tej nierówności
(x,y) przez f—x, x + y) i zastosujemy wzór ( 3 .4 ), otrzymamy
LyJ + L* + yJ + L2 *J < W + l2x + 2v\ ■
3.32.
Niech f(x) będzie sumą z pytania. Ponieważ f(x) = f(—x), możemy
założyć, że x ^ 0. Wyrazy sumy są ograniczone przez 2k, gdy k —>
— 00 i przez x 2/ 2 k, gdy k —» + 0 0 , zatem suma istnieje dla dowolnych
liczb rzeczywistych-^
Mamy f(2x) = 2 £ lc2 k “ 1 \\x/2*-' ||2 = 2f(x). Niech f(x) = l(x) +
r(x), gdzie l(x) jest sumą po k ^ 0 i r(x) jest sumą po k > 0. Wtedy
dla wszystkich x zachodzi l(x + 1 ) = l(x) i l(x) ^ 1/2 . Gdy 0 ^ x < 1,
otrzymujemy r(x) = x2/2 + x2/4 H-----= x 2 i r(x -f 1) = (x — 1)2/2 +
(x + 1 )2/4 + (x + 1)2/S H-----= x 2 + 1. Zatem f (x + 1) = f (x) + 1, dla
0 ^ x < 1.
Możemy teraz udowodnić przez indukcję, że jeżeli 0 ^ x < 1, to
dla liczb naturalnych zachodzi f (x +mrt) = f (x) + n. W szczególności
f(n) = n. Stąd f(x) = 2"mf(2mx) = 2"m |2mxJ + 2"mf({2mx}),
ale f({ 2 mx}) = l({ 2 mx}) + r({ 2 mx}) ^ \ + 1 ; zatem |f (x) — x| ^
|2 _m | 2 mxJ — x| + 2 _TTL• | ^ 2 “ 171 • | dla wszystkich liczb całkowi­
tych m.
Nieuchronnym wnioskiem jest, że dla wszystkich liczb rzeczywistych
zachodzi f(x) = |x|.
3.33.
Niech r = n —j będzie promieniem okręgu, (a) Pomiędzy polami sza­
chownicy przebiega dokładnie 2 u — 1 prostych pionowych i 2 n — 1 pro­
stych poziomych. Każda prosta przecina okrąg dwa razy. Ponieważ r2
nie jest liczbą całkowitą, to z twierdzenia Pitagorasa wynika, że okrąg
nie przechodzi przez róg żadnego pola. Zatem okrąg przechodzi przez
tyle pól, ile jest punktów przecięcia tzn. 8 n —4 = 8 r. (Jest to też wzór
na liczbę pól na obwodzie szachownicy.) (b) f(rt,k) = 4 [v /r2^ -l? J .
Z (a) i (b) wynika, że
\ n T 2 —2r ^
l V r2 - k2J ^ \ ™ z ,
r = n —j.
0<k<r
Problem znalezienia bardziej precyzyjnego oszacowania jest znanym
problemem z teorii liczb i był rozważany przez Gaussa i wielu innych;
patrz Dickson [79, tom 2 , rozdział 6 ].
3.34.
(a) Niech m = [lg n ]. By uprościć obliczenia, dodamy 2m —rt skład­
ników:
2 Tn
f(n) + (2 m —n )m = ^ T l g k ] =
k=1
=
^ k ^ 2 m]
j,k
j ,k
m
=
2j
2i_1
=
2 m( m
- 1) + 1 .
j= 1
Zatem f (n) = n m —2m + 1.
(b) Wiemy, że [n/2] = [(n + 1)/2J. Z tego wynika, że rozwiązanie
rekurencji g(n) = a ( n ) + g ( [ n / 2 ] ) + g ( [ n / 2 J) musi spełniać warunek
Ag(n) = Aa(n) + A g ([n /2 J). W szczególności, gdy a(n) = n —1, to
zależność Af(n) = 1 + A f([n /2J) jest spełniona przez liczbę bitów
w binarnej reprezentacji liczby n tzn. [lg(n + 1)]. Teraz przejdźmy
od A do Z.
Bardziej bezpośrednie rozwiązanie otrzymamy z równości [lg 2j] =
rigj] + 1 i [lg(2 j - 1 )] = [lgj] + [j > 1 ], gdzie j ^ 1 .
3.35.
(n + 1)2 n! e = An + (n + 1) 2 + (n + 1) + Bn , gdzie
_
(n + 1 )2 n! , ( n + l ) 2 n! ,
0!
1!
, ( n + 1 ) 2 n!
+ ( n - 1 )!
jest wielokrotnością n, oraz
_
n •
-
( n + l ) 2 n! t(n + 1 )2 n! ,
(n + 2)! + (n + 3)!
n + 1 (i
1
1
n + 2 \ ‘ ~^n + 3~*~ (n + 3)(n +
4)
n + 1 /
n + 2 y
1
1
n + 3
(n + 3) (n + 3)
(n + 1) (n + 3)
(n + 2 ) 2
=
jest mniejsze niż 1. Zatem odpowiedzią jest 2 mod n.
3.36.
Suma jest równa
Y _ 2- l 4-m [m = Lig IJ ] [l = |_lg kj ] [1 < k < 2 2" ]
k,l,m
=
Y . 2~l4~m [2m ^ l < 2 m+ 1 ][2l s ę k < 2 l + ,][0^ m .<n ]
k )l,m
= Y _ 4- m [2m ^ l < 2 m+1 ] [0 ^ m < n]
l,m
|
= ^ 2 - m[0 ^ m < n ] =
m
2 (1
- 2 ~u ).
3.37.
Najpierw rozważ przypadek m < n, który rozbija się na dwa podprzypadki zależne od tego, czy m < \ n . Następnie pokaż, że gdy m
rośnie o n, wówczas obie strony równości zmieniają się w ten sam
sposób.
3.38.
Co najwyżej jedno xk nie jest liczbą całkowitą. Pomińmy wszystkie
liczby całkowite
i załóżmy, że pozostało ich n. Gdy {x} ^ 0,
średnia {mx} znajduje się między \ i j , gdy m —> oo. Zatem {m xi}+
---- h{mxn}-{m x i H----- hmxu} nie może mieć średniej wartości równej
zeru, gdy n > 1 .
Powyższy argument opiera się na trudnym twierdzeniu o jednostaj­
nym rozkładzie. Można podać elementarny dowód, który naszkicu­
jemy tu dla n = 2. Niech Pm będzie punktem o współrzędnych
({mx},{rruj}). Podzielmy kwadrat jednostkowy 0 ^ x ,y < 1 na ob­
szary trójkątne A i B opisane równaniami x + y < 1 lub x + y ^ 1.
Chcemy pokazać, że jeśli {x} i {y} są niezerowe, to dla pewnego m za­
chodzi Pm e B. Jeśli Pi G B, kończymy dowód. W przeciwnym razie
istnieje koło D o promieniu e > 0 i środku w Pi takie, że D C A. Je­
śli N jest dostatecznie duże, to z zasady szufladkowej Dirichleta ciąg
P i, . . . , Pn musi zawierać dwa takie punkty, że zachodzi |Pk~Pjl < e
i k > j.
Sformułowanie
zadania jest mylące!
Jest to zadanie
rodzaju 4.
Z tego wynika, że P k -j-i znajduje się w odległości od punktu (1,1) —
Pi mniejszej niż e. Zatem P k -j-i € B.
3.39.
Zastąp ) przez b — j i dodaj do sumy składnik j = 0. Można teraz
skorzystać z zadania 15, by wysumować po j. Po zsumowaniu po k,
otrzymamy
Tx/bkl - rx/bk+1] + b — 1 .
3.40.
segment
wk
Sic
Hic
Nic
r
m
Niech [2^/n\ = 4k + r, gdzie —2 ^ r < 2. Podstawmy m = \y/n \.
Następujące relacje mogą być udowodnione przez indukcję:
X
V
wtedy i tylko wtedy, gdy
- 2 2k—1 m (m +1 ) —n —k
k
(2k—1)(2k—1) ^ n ^ (2k-1)(2k)
-1 2k—1
-k
m (m +1) —n + k
(2k—1)(2k) < n < (2k)(2k)
0
2k 'rt —m (m + 1 ) + k
-k
(2k)(2k)^ n^ (2k)(2k + 1)
1
2k
k
n —m (m + 1 ) —k (2k) (2k+1) < n < (2k+1 ) (2k+1 )
Stąd dla k ^ 1, jeśli ścieżka biegnie na zachód i y (n) = k, to W k jest
segmentem długości 2k. Segment Sk ma długość 2k —2, jeśli ścieżka
biegnie na południe, itd. (a) Zatem szukanym wzorem jest
-y(u) = ( — 1 )m ^(n —m (m + 1 )) • [|_2 ^/nJ jest nieparzyste] — r* m l) •
(b) Dla wszystkich segmentów k = m ax(|x(n)|,|‘y(n )|). W segmen­
tach W k i Sk mamy x < y i n + x + y = m (m + 1) = (2k) 2 —2k, w
segmentach Ek i N k mamy x ^ y i n —x —y = m (m + 1 ) = (2k)2 +2k.
Zatem znak jest równy (—l)W Tl)<‘y(n)].
3.41.
Ponieważ 1/c()+1 /(f >2 = 1, oba ciągi tworzą podział zbioru dodatnich
liczb całkowitych. Zatem z warunku g(n) = f (f(n)) + 1 wyznaczymy
jednoznacznie f i g . Potrzebujemy tylko udowodnić, że dla wszyst­
kich n > 0 zachodzi równość |_|_tlc|>J cj>J + 1 = |_ri4>2 J. Wynika to z
zadania 3, jeżeli oc = 4> i n = 1.
3.42.
Nie. Rozważania podobne do tych z zadania 13 pokazują, że podział
na trzy części może zajść wtedy i tylko wtedy, gdy 1/ a + 1/(3 +1 / y =
1 i dla wszystkich rt > 0 zachodzi
Ale jeśli a jest niewymierne, to wartość średnia { ( n + 1) /a } z twier­
dzenia o jednostajnym rozkładzie jest równa 1/2. Nie wszystkie jed­
nak zmienne mogą być wymierne. Jeśli y = m /n , to średnia jest
I
równa 3 /2 —1/ (2n). Zatem y musi być liczbą całkowitą, lecz to rów­
nież jest źle. (Istnieje również dowód elementarny, który nie korzysta
z twierdzenia o jednostajnym rozkładzie, zobacz [155].)
3.43.
Rozwinięcie rekurencji w jednym kroku dla Kn daje najmniejszą z
czterech liczb 1 + a + a -b -K ^ ^ -i-a j/ia b )]) gdzie a i b są równe 2
lub 3. (Stosujemy tożsamość x + minCy, z) — min(x + y }x + z) i by
usunąć nawiasy podłogi z wnętrza nawiasów podłogi korzystamy ze
wzoru ( 3 . 1 1 ). Pomijamy też wyrazy z ujemnymi dolnymi indeksami,
tzn. n — 1 — a < 0 .)
Kontynuując to postępowanie, otrzymamy następującą interpretację:
Kn jest najmniejszą liczbą większą od n w zbiorze z powtórzeniami
S liczb postaci
1 + ai + ai
a2+ ^ a a H------ 2
3
gdzie m ^ 0 i każda z liczb
1
a 2 a 3 ... am ,
równa się 2 lub 3. Stąd
S = { 1 ,3 ,4 ,7 ,9 ,1 0 ,1 3 ,1 5 ,1 9 ,2 1 ,2 2 ,2 7 ,2 8 ,3 1 ,3 1 ,...}.
Liczba 31 znajduje się w S „dwukrotnie,” gdyż ma dwie reprezentacje
1 + 2 + 4 + 8 + 1 6 = 1 + 3 + 9 + 18. (Nawiasem mówiąc, Michael
Fredman [134] udowodnił, że lim ^ o o K^/rt = 1, tzn. zbiór S nie
jest zbyt dziurawy.)
3 .4 4 .
Niech d[?] =
antymod (q - 1). Stąd D^q) = ( q D ^ + dl?]) /
( q - 1 ) i a iq) = [D|1q_]1/(q - 1)]. Zatem
^ (q - 1)n
^ rt, z czego wynika rozwiązanie. (Jest to rozwiązanie znale­
zione przez Eulera [116], który wyliczał kolejno liczby a i d. Nie
wpadł na to, że wystarczy pojedynczy ciąg D ^ . )
3 .4 5 .
Niech oc > 1 spełnia warunek oc + 1/oc = 2m. Wtedy 2Yn = o/F' +
oc~2n i z tego wynika, że Yn = |"o F /2 \ .
3 .4 6 .
Podpowiedź wynika ze wzoru (3 .9 ), ponieważ 2n [n + 1) = [2{n +
^) 2 J. Niech n + 0 = ( \ / 2 l + \ / 2 l ] ) m i n ' + 0' = (s /2 W + v /2 l )m ,
gdzie 0 ^ 0 ,0 ' < 1. Wtedy 0' = 20 mod 1 = 20 — d, gdzie d równa
się 0 lub 1. Chcemy udowodnić, że rt' = [\/2 (n + j ) \ . Równość ta
zachodzi wtedy i tylko wtedy, gdy
0
^
0 ' ( 2 —V 2 ) + V5(1 - d )
<
2 .
By rozwiązać rekurencję, zauważmy, że zbiory Spec(1 + 1 /^ /2 ) i
Spec(1 + y/2) tworzą podział zbioru dodatnich liczb całkowitych.
Zbyt łatwe.
Zatem każda dodatnia liczba całkowita a może być zapisana jedno­
znacznie w postaci a = [( y /l + y /l
)TnJ, gdzie l i m są licz­
bami całkowitymi) przy czym m jest nieparzyste, a l ^ 0. Stąd
Ln = [ ( V 5 l+U + V 2 l + n _ , H -
3.47.
(a) c = —j . (b) c jest liczbą całkowitą, (c) c = 0 . (d) c jest do­
wolna. Bardziej ogólne wyniki można znaleźć w odpowiedzi do za­
dania 1.2.4-40 w [207].
3.48.
Niech x :0 = 1 i x :^k+1^ = x [x :kJ oraz ak = {x:k} i bk = |x :kJ. Naszą
tożsamość możemy teraz zapisać jako x 3 = 3x :3 + 3ai a 2 + a 3 —
3bi b 2 + b f . Ponieważ dla k ^ 0 mamy ak + bk = x :k = xbic_i, więc
(1 —xz)(1 + b i z + b 2 z 2 H-----) = 1 — a-i z — a 2 z 2 ------ . Zatem
1
1 —xz
1 “l- b^ z H- b 2 z 2 ")“ •••
1 — ai z — a 2 z 2 --*
Zlogarytmujmy obie strony równości i oddzielmy liczby a od liczb
b. Następnie zróżniczkujmy względem zmiennej z. Otrzymamy
x
1 —xz
ai + 2 a2z + 3 a 3Z2 H----1 — a-i z — a 2 z 2 -----
bi + 2 b2z + 3bsz 2 H----1 + b iz + b 2 z 2
Współczynnikiem przy zn_1 po lewej stronie jest X™, po prawej stro­
nie jest nim szukany wzór, który dla n = 3 zgadza się z podaną na
początku zadania formułą.
Możemy wyprowadzać (por. [170]) podobne równości dla ogólnych
iloczynów XoXi . . . xn_ i .
Oto bardziej
interesujący
(i ciągle nie
rozwiązany)
problem: Niech obie
liczby oc i |3 będą
mniejsze niż 1 .
Kiedy z danego
zbioru
z powtórzeniami da
się określić
nieuporządkowaną
parę {a, |3}?
3.49.
(Rozwiązanie podane przez Heinricha Rolletschka.) Zastąpmy (oc, |3)
przez ({|3},cx + [PJ)- Nie zmieniamy przy tym sumy |_naj + |_n|3 j .
Zatem równość oc = {|3} jest warunkiem koniecznym. Jest też warun­
kiem dostatecznym: niech m = [f>J będzie najmniejszym elementem
danego zbioru z powtórzeniami oraz S będzie zbiorem z powtórze­
niami otrzymanym z danego przez odjęcie, dla wszystkich rt, liczby
m n od n-tego najmniejszego elementu. Jeśli a = {|3}, to kolejne
elementy S różnią się albo o 0, albo o 2. Zatem ze zbioru z powtó­
rzeniami jS = Spec(oc) wyznaczymy oc.
3.50.
Zgodnie z nie publikowanymi notatkami Williama A. Veecha, wy­
starczy, by liczby a|3, (3 i 1 były liniowo niezależne względem liczb
wymiernych.
3.51.
H. S. Wilf zauważył, że równanie funkcyjne f (x2 —1) = f(x ) 2 powinno
wyznaczyć f (x) dla wszystkich x ^ cj>, jeśli znamy f (x) na dowolnym
przedziale (cf>.. <$>+ e).
3.52.
Dla liczb niew ym iernych
istnieje nieskończenie wiele sposobów
podziału zbioru liczb dodatnich za pomocą trzech lub więcej uogól­
nionych widm, na przykład
Spec(2a; 0) U Spec(4a; —oc) U Spec(4ct; —3 a) U Spec(|3; 0)
Powstają one przez „rozwinięcie” podstawowego podziału Spec (a) U
Spec(P); por. [158]. Jedyne znane wymierne przykłady, jak:
Spec(7;—3) U S p e c (|;—1) U S p e c ( |; 0 ) ,
opierają się na hipotezie sformułowanej w zadaniu wziętym od A. S.
Fraenkela [128].
3.53.
Częściowe rezultaty były dyskutowane w [95, s. 30-31]. Zachłanny
algorytm prawdopodobnie się nie zatrzyma.
4.1.
1,2, 4, 6 , 16, 12.
4.2.
Zauważ, że m p + n p = min(mp ,n p) + max(mp)u p). Co prawda
zachodzi rekurencją N W W (m ,n) = ( n /(n mod m ))N W W (n mod
m ,m ), ale nie jest ona dobrą metodą wyliczania NWW. Najlep­
szą znaną metodą obliczenia N W W (m ,n ) jest podzielenie m n przez
N W D (m ,n ).
4.3.
Wzór ten zachodzi dla całkowitych x, ale funkcja n(x) zdefiniowana
jest dla wszystkich liczb rzeczywistych x. Właściwym wzorem jest,
jak łatwo sprawdzić,
7t(x) —7t(x — 1) =
[|_xj jest pierwsza] .
4.4.
Pomiędzy ^ a ~ mielibyśmy lustrzane odbicie drzewa Sterna-Bro­
cota z zanegowanymi mianownikami, itd. W rezultacie otrzymali­
byśmy w szystkie ułamki postaci m /n takie, że m 1 n. Warunek
m /n —mn ' = 1 nadal byłby spełniony podczas konstrukcji. (Nazywa
się to kolią S terna-B rocota, gdyż końcowy ułamek y możemy uznać
za tożsamy z pierwszym y, zawijając drzewo na najwyższym pozio­
mie w coś co przypomina nieskończoną kolię. Kolia Sterna-Brocota
ma interesujące zastosowania w grafice komputerowej, ponieważ re­
prezentuje wszystkie możliwe wymierne kierunki na płaszczyźnie.
4.5.
Lk = (Jk) i Pk = ( i i ) 5 wzory te zachodzą nawet dla k < 0. (W
rozdziale 6 wyprowadzimy ogólny wzór na dowolny iloczyn macierzy
LiP.)
4.6.
a = b. (W rozdziale 3 zdefiniowaliśmy x mod 0 = x, więc tak to
powinno być.)
4.7.
Aby tak było, musiałoby zachodzić m mod 10 = 0, m mod 9 = k i
m mod 8 = 1. Liczba m nie może być jednak jednocześnie parzysta
i nieparzysta.
4.8.
I
Chcielibyśmy, aby zachodziło 10x + 6y = 10x + -y (mod 15) więc
5y = 0 (mod 15); zatem y = 0 (mod 3). Musi więc być y = 0 lub 3
i x = 0 lub 1 .
4.9.
32k+1 mod 4 = 3, więc (32k+1 — 1)/2 jest nieparzyste. Zdefiniowana
liczba jest podzielna przez (3 7 —1) / 2 i (3 11 —1 )/2 (i przez inne liczby
także).
4.10.
999(1 - 1)(1 -
4.11.
cr(O) = 1; c(1) = —1; <r(n) = 0 dla u > 1. (Uogólnione funkcje
Mobiusa, które definiuje się dla dowolnych częściowo uporządkowa­
nych struktur mają interesujące i ważne własności, zbadane najpierw
przez Weisnera [367], a następnie rozwinięte przez wielu badaczy,
szczególne przez Gian-Carlo Rotę [314].)
4.12.
Uwzględniając ( 4 .7 ) i ( 4 .9 ), uzyskujemy Z d\m E k \ d u(d/k) g(lc) =
I k \ m l d \ ( m / k ) ^ d) 9(k) = H ic\m g(k)[tn/k = 1 ] = g(m).
4 .13.
(a) u p ^ 1 dla każdego p; (b) |i(n) ^ 0.
4.14.
Prawdziwe, gdy k > 0. Zastosuj równania (4 . 1 2 ), ( 4 . 1 4 ) i ( 4 . 1 5 ).
4.15.
Nie, na przykład en mod 5 = [2lub 3]; en mod 11 = [2 ,3 ,7 lub 10].
4.16.
1/ei + 1 / e 2 H
4 .17.
Zachodzi f n mod f m = 2 , więc N W D (fn , f m) = N W D (2 ,fm) =
1. (Co ciekawe, relacja
= fofi ...fn ,-! + 2 bardzo przypomina
rekurencję definiującą liczby Euklidesa en .)
4.18.
Jeśli n = qm i q jest nieparzyste, to 2™ + 1 = (2m + 1)(2TX_m —
2 n - 2 m + ------ 2 m + 1 ).
4.19.
Pierwsza suma to 7t(n), poniewciż wyraz pod sumą to po prostu
[k + 1 jest liczbą pierwszą]. Suma w środku to L i^ ic<m[lc\m], a
więc jest większa niż 1 wtedy i tylko wtedy, gdy m jest liczbą złożoną
i znów liiamy n{n). W końcu |"{m/n}] = [n\m ], więc aby uzyskać
ostatnią równość, wystarczy zastosować twierdzenie Wilsona. Trzeba
mieć nie wszystko po kolei, aby funkcję n (n) wyliczać za pomocą
któregokolwiek z tych wzorów.
4 .20.
Niech pi = 2, a p n niech będzie najmniejszą liczbą pierwszą więk­
szą od 2? ^ - '. Wtedy 2 P n ~ 1 < p n < 2Pn~1+1, więc wynika stąd, że
37) =
648.
h 1 /e n = 1 — 1 / (en (en — 1)) = 1 — 1 /(en+i — 1).
możemy przyjąć b = limn_^oo lg(Tl) p n , gdzie lg(n) jest funkcją lg iterowaną n razy. Podana wartość numeryczna pochodzi z przypadków
P 2 = 5, P 3 = 37. Okazuje się, że p 4 = 2 37 + 9, co daje dokładniejszą
wartość
b w 1,2516475977905
(niestety nie mamy wiadomości na temat ps).
4.21.
Zgodnie z postulatem Bertranda, Pn < 10n . Niech
K =
10_k2Pk = 0,200300005... .
k^1
Wtedy 10n2K = Pn + reszta (mod 102n_1).
4.22.
(bmn —1)/(b —1) = ((bm —l ) / ( b —l))( b mTV_mH--------j-1). [Jedynymi
liczbami pierwszymi postaci ( 1 0 p — l ) / 9 dla p < 20000 są te, które
powstają dla p = 2, 19, 23, 317, 1031.]
4.23.
p ( 2k + 1) = 0; p(2k) = p(k) + 1, dla k ^ 1. Za pomocą indukcji
pokazujemy, że p(n) = p(n —2m), jeśli n > 2m i m > p(rt). Jeżeli
ponumerujemy krążki od 0 do tl —1 , to w k-tym ruchu przeniesiemy
krążek o numerze p(k). Jest to oczywiste dla k będącego potęgą 2,
ale i w ogólnym przypadku, gdy 2m < k < 2m+1, to p(k) < Ta,
ruchy zaś o numerach k i k —2 m odpowiadają sobie w sekwencjach
przenoszących m + 1 krążków w Tm + 1 + Tm krokach.
4.24.
Jeśli cyfra wnosi do n wartość dpm, to do ep (n!) wnosi również
wartość dp m _ 1 + ••• + d = d(pm — 1 )/(p — 1 ), zatem ep (n!) —
( r t - T p ( n ) ) / ( p - 1 ).
4.25.
m \\T L
4.26.
Tak, ponieważ ciąg S n stanowi poddrzewo drzewa Sterna-Brocota.
4.27.
Wydłuż krótszy z ciągów reprezentujących porównywane liczby za
pomocą liter M. (ponieważ M. alfabetycznie leży pomiędzy L a P), aż
do uzyskania jednakowej długości dwóch ciągów, a następnie użyj po­
rządku leksykograficznego. Górne poziomy drzewa Sterna-Brocota
spełniają dla przykładu LL < LM. < LP < MM. < P L < P M < P P .
(Innym rozwiązaniem może być wydłużenie każdego ciągu o nieskoń­
czone słowo PL°°, a następnie znalezienie pierwszej pozycji, na której
L < P.)
4=> m p = 0 lub m p = n p, dla każdej liczby pierwszej p.
Wynika stąd, że (a) jest prawdziwe, (b) jednak nie zachodzi, np.
dla naszego ulubionego przykładu Ta = 12, u = 18. (Jest to znana
złuda.)
4.28.
Do naszego celu nadaje się tylko kilkanaście początkowych symboli:
P
P
P
L
L
L
L
L
L
L
P
P
P
P
P
P
1 2 3 4 7 1 0 1 3 1 6 1 9 2 2 2 5 4 7 6 9 9 1 113 135
1 > 1 » 1 > 1 >2» 3 » 4 » 5 » 6 ’ 7 > 8 » 15 » 22 >29 » 36 ’ 43 > *** *
Ułamek y znalazł się na tej liście nie dlatego, że jest lepszym przy­
bliżeniem 7T niż y, lecz dlatego, że jest lepszym górnym ogranicze­
niem niż
Podobnie ^ jest lepszym ograniczeniem dolnym niż
y. Wszystkie najprostsze ograniczenia górne i dolne występują, ale
22/7 jest na tyle dobrym górnym ograniczeniem, że następne, lepsze
od niego, pojawi się tuż przed tym, jak ciąg 292 symboli P przestawi
się znów na L.
4.29.
1/oc. Po to, żeby uzyskać 1 —x z x w notacji dwójkowej, zamieniamy
zera i jedynki, natomiast w systemie Sterna-Brocota zamiana L i
P oznacza otrzymanie odwrotności 1/oc z liczby oc (przypadki skoń­
czone oczywiście muszą być także wzięte pod uwagę, ale wszystko się
zgadza, ponieważ opisana odpowiedniość zachowuje uporządkowanie
liczb).
4 .30.
Wszystkie m liczb całkowitych z przedziału x G [ A.. A + m) dają
różne wyniki modulo m, więc ich reszty (x mod m i , . . . , x mod m r)
przybierają wszystkie mi . . . m r = m możliwych wartości, z których
jedna musi być równa (di mod m i , . . . , aT mod m r) na mocy zasady
szufladkowej Dirichleta.
4.31.
Liczba zapisana w systemie liczbowym o podstawie b jest podzielna
przez d wtedy i tylko wtedy, gdy suma jej cyfr jest podzielna przez d
zawsze wówczas, gdy b = 1 (mod d). Wynika to z następującego
wzoru (am . . . a0)b = ambm H-------b d 0 b° = dm H-------h a 0.
4.32.
Liczby {k n mod m | k l m i 0 ^ k < m}, których jest cp(m), są to
liczby { k | k _ L m i 0 ^ k < m } w pewnym porządku. Przemnóż je
przez siebie, a następnie podziel przez rio<k<m kim
4.33.
Mamy H(1) = 1. Jeśli m _L n, to H(mn) = H d\ mn f(d )g (m n /d ) =
^-c\m,d\rL f ( c d ) g ( ( m /c ) ( n / d ) ) = £ c\m £ d\n f(c}g (m /c)f(d )g (n /d );
jest to H(m) H(n), ponieważ c _L d w każdym wyrazie sumy.
4 .34.
g(m) = £ dym f (d) = Z d \ m f(™ /d) = £ < ^ 1 f (m /d ), jeśli f(x) jest
zerem dla niecałkowitego x.
4.35.
Przypadki bazowe, to
1 (0 , n)
=
0 ;
l(m , 0 ) =
1 .
W przypadku gdy m, n > O, będą potrzebne dwa wzory: pierwszy z
nich trywialny, gdy m > rt, a drugi trywialny dla m < n:
I(m,rt) = I(m ,n mod m) — L'n/mJI(n mod m , m ) ;
I(m, rt) = I ( m m o d n , n ) .
4 .36.
Rozkład dowolnej z podanych wartości musiałby spełniać równanie
m 2 — lOn2 = ± 2 lub ± 3 , ale jest to niemożliwe modulo 1 0 .
4 .37.
Niech au = 2~n ln(en. —
en = |E2" + iJ
zaś bn = 2- n ln(en + j ) . Wtedy
an
^
lnE < bn .
Ponieważ an_i < a-^ < bn < bn_ i , więc można przyjąć, że E =
limn_^oo e an. W rzeczywistości okazuje się, że
Iloczyn ten szybko zbiega do (1,26408473530530111 . . . ) 2. Niestety
te spostrzeżenia nie mówią nam, czemu jest równe eu , chyba że zna­
leźlibyśmy inne wyrażenie na E, nie zależące od liczb Euklidesa.
4 .38.
Niech r = n mod m. Wtedy an — b™ = (am — bm)(aTL mb° +
a n - 2 m b m _j-------+ Qr | , n - m - r j + b m | n / m J j Qr _
4.39.
^
Jeśli ai . . . at i bi . . . bu są kwadratami liczb całkowitych, to takim
kwadratem jest także liczba
ci! . . . a tbi . . . b u/ c 2 . . . c l ,
gdzie {cii, . . . , at} fi { b i , . . . , bu} = { c i , . . . , cv}. (W rzeczywistości
można pokazać, że ciąg ( S(l ), S(2), S(3), . . . , ) zawiera każdą dodat­
nią liczbę złożoną dokładnie raz.)
4 .40.
Niech f(n) = n i ^ n , p X k k = n ! /p LTl/pJ [n /pj!, natomiast g(n) =
n !/p e"(nl). Wtedy
g(n) = f ( n ) f ( |n / p J ) f ( |n / p 2 J ) . . . = f ( n ) g ( | n / p j ) .
Zachodzi również f(n) = ao!(p — 1)!
= ao!(—1 )LnA’J (mod p)
oraz ep (n!) = [n /pj + ep(|n/p_|!). Rekurencje te prowadzą do łatwego dowodu indukcyjnego. (Znanych jest parę innych rozwiązań
tego zadania.)
4.41.
(a) Jeśli n 2 = —1 (mod p), to (n2)(p 1 ) / 2 = —1; Fermat jednak
twierdzi, że ma to być równe +1. (b) Niech n = ((p—1) / 2 ) !; zachodzi
więc n = ( - I) Ip - 1) / 2 n isk < p /2 (p - k) = (p - 1 )!/n , zatem n 2 =
( p - 1 )!.
4.42.
Zauważmy najpierw, że ze względu na otrzymaną z algorytmu Eu­
klidesa równość N W D (k ,l) = N W D ( k , l + ak), dla każdej liczby
całkowitej a zachodzi k J_ l
k ± l + ak. W takim razie
m _L n
i
n ' _L rt
<ś=>
m n ' JL n
<==>
m n' + n m ' _L n .
Podobnie
m ' _L n '
i
n J_ n '
<=>
m n ' + n m ' _L n ' ,
i w związku z tym
m _L n
i m ' _L n '
i n _L n '
m n ' 4 -nm'
_L n n ' .
4.43.
Wyjściową macierz chcemy podzielić przez L- 1 P, następnie przez
P_ 1L_ 1 PL, potem przez L_ 1 P, dalej przez P- 2 L- 1 PL2, itd.; n-ty
czynnik to po prostu p - p(n)L- 1 PLp^n^, gdyż musimy skrócić p(n)
macierzy P. A przy tym zachodzi p _Tni __1 PLm = (? 2 m+i)*
4.4 4 .
Znajdźmy najprostszą liczbę wymierną leżącą w przedziale
[0,3155. .0,3165) = [ ^ . . ^
5)
szukając liczb
i
w drzewie Sterna-Brocota i zatrzymując
się tuż przed tym, jak pierwsza z nich będzie miała L, podczas gdy
druga z nich będzie miała P.
(mi ,n i ,rrt2 ,n 2 ) := (631,2000,633,2000);
w h ile mi > n i or rrt2 < n2 do
i f m 2 < n 2 th e n (wypisz(L); ( n i,n 2) := (ni ,n 2) — (m i, m2))
else (wypisz(P); (Tm ,m 2):= (m] ,m 2) - (ni ,n 2)).
Wypisany ciąg to LLLPPPPP = ^ w 0,3158. Co ciekawe, aby uzy­
skać średnią równą 0,334 trzeba wykonać 287 rzutów.
4.45.
x 2 = x (mod 10n )
x(x — 1) = 0 (mod 2n ) i x(x — 1) = 0
(mod 5n)
x mod 2n = [Olub 1] i x mod 5n = [Olub 1]. (Ostatni
krok wynika stąd, że skoro x(x — 1) mod 5 = 0, to albo x, albo x —
1 jest wielokrotnością 5, a w takim przypadku ten drugi czynnik
jest względnie pierwszy z 5n i może zostać wyłączony z rozważanej
kongruencji.)
Mamy więc co najwyżej cztery rozwiązania, z których dwa: x = 0 i
x = 1 nie mają szans na tytuł „liczby n-cyfrowej”, chyba że rt = 1 .
Pozostałe dwa rozwiązania mają postać x i 10^ + 1 —x, przy czym
przynajmniej jedna z liczb jest nie mniejsza niż 10n_1. W przypadku
rt = 4 tym drugim rozwiązaniem jest 10001 — 9376 = 625, co z
kolei nie jest liczbą czterocyfrową. Wygląda na to, że powinniśmy
otrzymywać dwa n-cyfrowe rozwiązania w około 90% przypadków
przy zmieniających się n, ale nie mamy dowodu na tę hipotezę.
(Takie samoreprodukujące się liczby bywają nazywane „automorficznymi”.)
4.46.
(a) Jeśli j'j - k'k = NWD(j,k), to n k,¥ WD(j-k) = n j,J' = 1 i
rtk k = 1. (b) Niech rt = pq, gdzie p jest najmniejszym dzielnikiem
pierwszym liczby n. Jeśli 2n = 1 (mod rt), to 2n = 1 (mod p).
Podobnie, 2P_1 = 1 (mod p) i w związku z tym 2 NWD(p_1’TL) = 1
(mod p). Jednak, zgodnie z definicją p, zachodzi N W D ( p —1, n) = 1.
4.47.
Jeśli n m _ 1 = 1 (mod m), to n J_ m. Jeśli natomiast n k = ró
dla pewnego 1 ^ ) < k < m, to n k_:i = 1 , ponieważ możemy po­
dzielić obie strony przez n?. Dlatego jeżeli liczby rt1 mod m, . . . ,
n m _ 1 mod m nie są parami różne, to istnieje k < m — 1 takie, że
rtk = 1. Najmniejsza z takich liczb k dzieli m — 1, zgodnie z ćwicze­
niem 46(a). Wtedy jednak zachodziłoby kq = (m —1)/p dla pewnej
liczby pierwszej p i pewnej liczby całkowitej dodatniej q, co jest jed­
nak niemożliwe, gdyż n kq ^ 1. W związku z tym liczby rt1 mod m,
. . . , n m - 1 mod m są różne i względnie pierwsze z m. Zatem liczby 1,
. . . , m — 1 także są względnie pierwsze z m, więc m musi być liczbą
pierwszą.
4.48.
Parując kolejne liczby z ich odwrotnościami, możemy uprościć nasz
iloczyn (mod m) do nis;n<m,n^modm=i n - Możemy teraz wykorzy­
stać naszą wiedzę o rozwiązaniach równania n 2 mod m = 1. Używając arytmetyki reszt dochodzimy do wniosku, że odpowiedzią jest
m — 1, jeśli m = 4, p k lub 2pk (p > 2), a w przeciwnym razie
odpowiedź wynosi + 1 .
4.49.
(a) Albo m < n (O(N) — 1 przypadków) albo m = rt (jeden przy­
padek) albo m > n (znów <D(N) — 1 przypadków). Zatem R(N) =
2<D(N) — 1. (b) Zgodnie ze wzorem (4 .6 2 ) otrzymujemy
2 <D(N) - 1 = -1 +
H(d) LN/ dJL1 + N/ dJ .
d^l
wynik ten zachodzi więc wtedy i tylko wtedy, gdy
Y _ M-(d) LN/dJ = 1 ,
d^l
dla N > 1,
co stcinowi przypadek szczególny wzoru (4.61), jeśli tylko przyj­
miemy, że f(x) = [x ^ 1 ].
4.50.
(a) Dla dowolnej funkcji f zachodzi
Z
O ^kcm
= Z
Z
f(k) [d = N W D (k,m )]
d \m 0 ^ k < m
Z
z
f(k) [k/d ± m /d]
d \m O ^kcm
= z
z
f(kd)[k_Lm/d]
d\m 0^k<m/d
= z
z
f(km /d ) [k_L d] ,
d\ra 0^k<d
a szczególny przypadek zastosowania tego wzoru widzieliśmy przy
wyprowadzaniu tożsamości (4.63). Analogiczne wyprowadzenie mo­
żemy przeprowadzić rozważając Yl zamiast
Mamy więc
zm~-\=0^k<m
n
u - k) = n
n
d\m 0^k<d
k_Ld
d\m
ponieważ cum/d = e2m/d
Część (b) wynika z części (a) ze względu na analogię do wzoru (4.56)
dla iloczynów zamiast sum. Przy okazji wzór ten dowodzi, że wielo­
mian ^ m(z) ma współczynniki całkowite, jest on bowiem zdefinio­
wany za pomocą mnożenia i dzielenia wielomianów, których współ­
czynnik przy najwyższej potędze wynosi 1.
(*i H------ l-*n)p = Z kl +...+!cn=p p !/(k 1 ! • • • kn!)*?' • • • *nn>i współczynnik ogólny jest podzielny przez p, chyba że kj = p dla pewnego j.
W związku z tym (x H ------ bxn )p = x^ H\-x £ (mod p). Możemy
teraz podstawić 1 w miejsce wszystkich x, otrzymując n p = n.
4.52.
Gdy p > n, wówczas nie ma czego dowodzić. W przeciwnym razie
x 1 p, więc xk(p- 1} = 1 (mod p). Oznacza to, że co najmniej |_(n —
1)/(p — 1)J spośród danych liczb, to wielokrotności p. Wobec tego
(n - 1)/(p - 1) ^ n /p , gdyż n ^ p.
-
4 .5 1 .
4.53.
Zacznijmy od pokazania, że jeśli m ^ 6 i m nie jest liczbą pierwszą,
to (m —2)! = 0 (mod m ). (Jeśli m = p 2, to iloczyn (m —2)! zawiera
zarówno p, jak i 2 p, a w przeciwnym razie zawiera d i m /d , gdzie
d < m /d .) Następnie zajmijmy się kolejno przypadkami:
Przypadek 0 , rt < 5. Wzór zachodzi tylko dla rt = 1.
Przypadek 1 , n ^ 5 i rt jest liczbą pierwszą. W tedy (n — 1) !/(n + 1)
jest liczbą całkowitą i nie może być wielokrotnością rt.
Przypadek 2 , rt ^ 5, u jest liczbą złożoną i n + 1 jest liczbą złożoną.
W tedy n i rt + 1 dzielą (rt — 1)!, a zarazem rt _L n + 1, w związku z
tym rt(rt + 1 ) \ ( t v — 1 )!.
Przypadek 3 , rt ^ 5, rt jest liczbą złożoną i n + 1 jest liczbą pierwszą.
Wtedy, zgodnie z twierdzeniem Wilsona, (n —1)! = 1 (mod n + 1) i
f ( n — 1)!/(n + 1)] =
((n -1 )!+ n )/(n + 1 );
więc jest to podzielne przez rt.
Ostatecznie odpowiedź jest taka: albo rt = 1, albo rt jest liczbą zło­
żoną różną od 4.
4.54.
£2 ( 1000 !) > 500, a zarazem 6 5 (1000!) = 249, zatem 1000! — a x
10249 dla pewnej parzystej liczby a. Ponieważ 1000 = (1300)s, więc
zgodnie z ćwiczeniem 40 widzimy, że a - 2 249 = 1000!/5 249 = —1
(mod 5). Podobnie, 2 249 = 2, zatem a = 2, czyli a mod 10 = 2 lub 7
i w związku z tym ostatecznie odpowiedzią jest 2 - 10 249.
4.55.
Jedną z możliwości rozwiązania tego zadania jest udowodnić za po­
m ocą indukcji mocniejsze twierdzenie, że P 2n /P n (n + "0 j es^ liczbą
całkowitą; dzięki niemu dowód indukcyjny upraszcza się. Innym spo­
sobem jest pokazanie, że każda liczba pierwsza dzieli licznik co naj­
mniej tyle razy, ile mianownik. W tym celu wystarczy pokazać, że
zachodzi nierówność
2n
Y_ IV H
n
> 4 Y . Lk/ m J ’
k=1
k=1
która wynika z
|_(2 n — 1 )/m J + |_2 ri/m J ^
[r t/m j.
O statnia nierówność zachodzi dla 0 ^ n < m, a obie strony zwięk­
szają się o 4 przy powiększaniu n o m .
4.56.
Przyjmijmy, że f(m ) =
m in (k ,2 n —k)[m \k], oraz g(m) =
(2n—2k—1) [m \(2 k + 1)]. Liczba p dzieli licznik naszego wy­
rażenia f(p) + f(p 2) + f(p 3) H-----razy, a mianownik g(p) + g(p2) +
„D/e ganzen Zahlen
hat der Hebe Gott
gemacht, alles
andere ist
Menschenwerk.”
L. Kronecker [366]
g(p3) + • • • razy. Ale f(m ) = g(m), jeśli liczba m jest nieparzysta
(ćwiczenie 2.32). Rozważany iloczyn redukuje się wtedy do 2TL^n~ 1^,
zgodnie z ćwiczeniem 3.22.
4.57.
Wskazówka sugeruje standardową zamianę sumowania, gdyż
y~
I^m ^n
[d\m] =
^
[m = dk] = [ n / d j .
0 < k ^ n /d
Oznaczając sumę ze wskazówki przez H(n), otrzymujemy
I (m + n) — I(m ) —I (n ) =
<p(d).
deS(m,n)
Z drugiej strony, ze wzoru ( 4 .5 4 ) wiemy, że I (n ) = ^ n ( n + 1). Zatem
I (m + n) — I(m ) — I (n ) = mn.
4.58.
Funkcja f (m) jest multiplikatywna, a dla m = pk jej wartość wynosi
1 + p H------- h p k. Liczba ta jest potęgą 2 wtedy i tylko wtedy, gdy
p jest liczbą pierwszą Mersenne’a, a zarazem k = 1. Dzieje się tak
ze względu na to, że k musi być nieparzyste i wtedy suma ta będzie
równa
(i + p ) 0 + p 2 + p 4 + --- + p k_')>
tutaj zaś (k—1)/2 musi być nieparzyste, itd. Warunkiem koniecznym
i wystarczającym jest zatem to, że m jest iloczynem różnych liczb
pierwszych Mersenne’a.
4.59.
Dowód wskazówki: Jeśli n = 1, to xi = oc = 2, więc nie ma problemu.
Jeśli n > 1, to możemy założyć, że xi ^
xT1. Przypadek 1 :
x f 1 H------- 1- x ~ ! 1 + (xn — 1) - 1 ^ 1 i xn > xn_ i . Możemy wtedy tak
dobrać |3 ^ xn — 1 ^ xn_ 1 , że x ^ ] H------- 1- x “ ! 1 -f |3_1 = 1, zatem
^ (3+1 ^ en i Xt . . . xn ^ xt . . . xTV_i (p + 1 ) ^ ei . . . en , na mocy
założenia indukcyjnego. Istnieje więc liczba całkowita dodatnia m
taka, że oc = xi . . . xn/m , czyli a ^ ei . . . en = en+i —1 , mamy więc
xi . . . xn(<x + 1) ^ ei . . . en en+i . Przypadek 2: x f 1 H------- b x “l 1 +
(xn - 1) _1 ^ 1 i xn = xn_ i . Niech a = xn i a - 1 + (a — I ) - 1 =
( a —2 ) _1 +C _1 • Możemy więc pokazać, że a ^ 4 i ( a —2)(£+1) ^ a2.
Istnieje zatem takie |3 ^ £, że x ^ 1 H------ hx“i 2 + ( a —2 ) _1 + |3- 1 = 1.
Z założenia indukcyjnego wiemy, że xi . . . xn ^ xi . . . xrL_ 2 (a —2)(C+
l ) ^ x i . . .x u_ 2 ( a —2)(|3 + 1 ) ^ ei . . . eu , dalej wnioskujemy tak jak
w przypadku 1 . Przypadek 3: x^j~1 + • • • + x “l 1 + (xn — 1) _1 < 1.
Niech a = xn i niech a - 1 + ot- 1 = (a —1) _1 + |3_1. Można pokazać,
że ( a—1)(P + 1) > a(<x+ 1 ), ponieważ ta nierówność jest równoważna
następującej:
aoc2 — a 2 a + aoc — a 2 + a + a > O,
a ta z kolei jest konsekwencją aoc{oc — a) + (1 + a)oc ^ (1 + a)oc >
a 2 — a. Możemy więc zastąpić xn i oc przez a — 1 i |3, powtarzając
tę transformację, aż zajdzie któryś z poprzednich przypadków.
Innym wnioskiem z tej wskazówki jest to, że z nierówności 1/x*\ H----- 11 /x-a < 1 wynika nierówność 1 /x i H
------- (-1 / x n ^ 1 /e i H-------hi / e n ;
zob. ćwiczenie 16.
4.60.
Sedno rozwiązania stanowi pokazanie, że 0 < | . W takim przypadku
możemy wziąć wystarczająco dużą liczbę p i, aby zostały spełnione
warunki podane poniżej, oraz liczbę pn będącą najmniejszą liczbą
pierwszą większą niż p 3 . Dla tak zdefiniowanych liczb przyjmijmy
a T1 = 3_TLln p n i bn = 3_ n ln(pn + 1). Gdybyśmy pokazali, że
O-n-i ^ an < bu ^ bn-T, to moglibyśmy przyjąć P = lim ^ o o ea~,
podobnie jak w ćwiczeniu 37. Hipoteza nasza jest teraz równoważna
następującym nierównościom: p 3 _ 1 ^ p n < (pn- i + I)3- Jeśli w
tych granicach nie istnieje liczba pierwsza p n , to musi istnieć liczba
pierwsza p <
taka>że p + cpe > (pn_i + 1)3. To jednak mu­
siałoby pociągać za sobą cp 0 > 3p2/3, co jest niemożliwe, gdy p jest
wystarczająco duże. Prawie na pewno możemy przyjąć pi = 2, gdyż
wszystko wskazuje na to, że znane ograniczenia na luki między licz­
bami pierwszymi są znacznie słabsze niż w rzeczywistości (zob. ćwi­
czenie 69). W takim razie p 2 = 11, p 3 = 1361, p 4 = 2521008887 i
1,306377883863 < P < 1,306377883869.
4.61.
Oznaczmy prawe strony rekurencji za pomocą symboli m i ft. Za­
uważmy, że m n' — m 'n = 1, więc m _L n. Jednocześnie m /n >
m '/n ' i N = ( ( n + N ) /n ') n '—n ^ n > (( n + N )/n ' —l ) n ' —n = N —
n ' ^ 0 , jest więc spełniona następująca nierówność: m /n ^ m " /n" .
Jeżeli równość ta nie zachodziłaby, to mielibyśmy n" = (m n' —
m 'n)n" = n '(m n " — m"n) + n (m " n' — m 'n") ^ n ' + n > N —
sprzeczność. Co ciekawe, z ćwiczenia tego wynika, że ( m + m " ) /( n +
rt") = m '/n ', chociaż ułamek po lewej stronie nie zawsze jest w
postaci uproszczonej.
4.62.
2-i
+ 2 - 2 + 2 - 3 - 2 " 6 - 2 - 7 + 2 - 12 + 2 - 13 - 2 ~ 20 - 2 ~ 21 + 2 ~ 30 +
H-----, co można zapisać jako
2 ~ 31 —2 ~ 42 —2 - 4 3
- + 3 ^ ^2_ 4 k 2 “ 6 k _ 3 —2 - 4k2- 10k~ 7)
k^ 0
Sumę tę można przedstawić w postaci zwartej za pomocą „funkcji
„Człowiek stworzył
liczby całkowite,
wszystko poza
tym—Dieudonne.”
R.K. Guy
theta” 0(z, A) = Y.]c e nAk2+2lzk, która nam daje odpowiedniość
e
<->
} + § 0 ( £ ln 2 , 3 iln 2 ) - ^ 0 ( 4 l n 2 , 5 i l n 2 ) .
=.63.
Każda liczba rt > 2 albo ma dzielnik pierwszy d, albo jest po­
dzielna przez d = 4. W każdym z tych przypadków istnienie roz­
wiązania o wykładniku n oznacza, że istnieje rozwiązanie równania
(an/ d)d + (bTl/d)d = (cn /d )d o wykładniku d. Ponieważ dla d = 4
rozwiązań nie ma, więc d musi być liczbą pierwszą. Wskazówka wy­
nika z rozwinięcia dwumianu Newtona, ponieważ dla p nieparzystego
zachodzi (ap + (x — a)p )/x = p a p_1 (mod x). Jeśli równanie ( 4 .4 6 )
nie jest spełnione, to najmniejszy kontrprzykład spełnia a _L x. Jeśli
x nie jest podzielne przez p, to jest względnie pierwsze z cp/x , co
oznacza, że dla każdej liczby pierwszej q spełniającej qe\\x i qf \\c
zachodzi e = fp. W związku z tym dla pewnego m zachodzi x = mp .
Z drugiej strony, jeśli x jest podzielne przez p, to cp/ x jest podzielne
przez p, ale nie przez p 2, a cp nie ma innych dzielników wspólnych
z x.
.64.
Równe ułamki w ciągu Peirce’a występują w następującym porządku:
Odkryłem cudowny
dowód twierdzenia
Fermata,
ale nie mam tu
wystarczająco dużo
miejsca, aby go
przytoczyć.
2m 4m
rm
3m m
Załóżmy, że ciąg CPn jest poprawny. Chcemy pokazać, że ciąg CPn + i
jest również poprawny. Oznacza to, że jeśli kN jest nieparzyste, to
mamy pokazać, że
natomiast gdy kN jest nieparzyste, to mamy pokazać, że
W obu przypadkach warto poznać liczbę ułamków, które są ściśle
mniejsze od (k — 1)/(N + 1) w ciągu P n i wynosi ona
ze względu na wzór ( 3 .3 2 ), w którym d = N W D ( k - 1,N + 1).
Wyrażenie to redukuje się z kolei do \(k N —d + 1), ponieważ N mod
d = d —1 .
Co więcej, liczba ułamków równych ułamkowi (k — 1)/(N + 1) w
ciągu CPisi, które powinny go poprzedzać w ciągu Tn+i , wynosi, ze
względu na specyfikę naszego porządku, \ (d — 1 — [d parzyste]).
Jeśli kN jest nieparzyste, to liczba d jest parzysta i ułamek (k —
1)/(N + 1) występuje po ^(kN — 1) wyrazach ciągu
jest to
dokładnie tyle, aby wszystko grało. Jeśli kN jest parzyste, to d jest
nieparzyste i ułamek (k —1)/ (N + 1 ) występuje po ^(kN) wyrazach
ciągu Tn . W przypadku gdy d = 1, żaden z nich nie jest równy
(k —1)/(N + 1) i IPn^n jest *<*; w przeciwnym razie (k —1)/(N + 1)
wpada między dwa równe wyrazy i CPn,icN jest *=\ (C. S. Peirce
[289] odkrył niezależnie drzewo Sterna-Brocota mniej więcej w tym
samym czasie, kiedy odkrywał CPn-)
4 .6 5 .
Analogiczne pytanie dla (analogicznych) liczb Fermata
to znany,
nie rozstrzygnięty do dziś problem. Ten może się okazać łatwiejszy
albo trudniejszy.
4 .6 6 .
Wiadomo, że żaden kwadrat mniejszy od 36 x 10 18 nie dzieli żad­
nej liczby Mersenne’a ani Fermata. Wciąż nie mamy jednak dowodu
hipotezy Schinzla, że istnieje nieskończenie dużo bezkwadratowych
liczb Mersenne’a. Nie wiadomo nawet, czy istnieje nieskończenie
wiele takich liczb pierwszych p, że p \ \ ( a ± b ) , gdzie wszystkie dziel­
niki pierwsze liczb a i b nie przekraczają 31.
4 . 67.
M. Szegedy pokazał, że hipoteza ta zachodzi dla wszystkich dosta­
tecznie dużych liczb n; zob. [349], [95, str. 78-79] i [59].
4 .6 8 .
Jest to znacznie słabsza hipoteza od tej, która jest sformułowana w
następnym ćwiczeniu.
4 .6 9 .
Cramer [67] pokazał, że na gruncie probabilistycznym można przyjąć
tę hipotezę, a eksperymenty obliczeniowe to potwierdz
Download