Matematyka Konkretna: Podręcznik

Wydawnictwo Naukowe PWN Ronald L. Graham, Donald E. Knuth Oren Patashnik Matematyka konkretna Matematyka konkretna Ronald L. Graham, Donald E. Knuth Oren Patashnik Matematyka konkretna Wydanie trzecie Z języka angielskiego przełożyli P. Chrząstowski, A. Czumaj, L. Gąsieniec, M. Raczunas Wydawnictwo Naukowe PWN Warszawa 2001 Dane oryginału: R on ald L. G raham , AT&T Bell Laboratories D on a ld E. K n u th , Stanford University O ren P atash n ik , Center for Communications Research Concrete Mathematics. A Foundation fo r Computer Science Copyright © 1994 by Addison-Wesley Publishing Company, Inc. First published by Addison-Wesley Publishing Company, One Jacob Way, Reading, Massachusetts, 01867 USA Okładka i strony tytułowe B o k iew icz &; F reud en reich Redaktor M a łg o rza ta K op czy ń sk a Redaktor techniczny B e a ta S telęgow sk a Copyright © for the Polish edition by Wydawnictwo Naukowe PWN Sp. z o.o. Warszawa 1996 Copyright © for the Polish edition by Wydawnictwo Naukowe PWN SA Warszawa 1998 ISBN 83-01-12124-6 Spis treści P rzed m ow a N o ta c ja ..................................................................................................... 7 ............................................................................................................... 13 1. P ro b lem y rek u ren cyjn e ...................................................................... 15 1 . 1 . Wieże z Hanoi ....................................................................................... 15 1.2. Proste na płaszczyźnie ........................................................................ 19 1.3. Problem Józefa Flawiusza ................................................................... 23 Ćwiczenia ................................................................................................... 32 2 . Sum y .............................................................................................................. 37 2 . 1 . Notacja .................................................................................................... 37 2 .2 . Sumy i rekurencje ............................................................................... 41 2.3. Przekształcenia sum ............................................................................ 46 2.4. Sumy wielokrotne ............................................................................... 51 2.5. Metody ogólne ....................................................................................... 59 2.6. Rachunek różnicowy i różniczkowy .................................................. 65 2.7. Sumy nieskończone .............................................................................. 75 Ćwiczenia ................................................................................................... 81 3. Funkfcje całk ow itoliczb ow e ................................................................ 87 3.1. Funkcje podłoga i sufit ...................................................................... 87 3.2. Użycie funkcji podłoga i sufit ........................................................... 90 3.3. Rekurencje z podłogą i sufitem .......................................................100 3.4. Działanie dwuargumentowe ‘mod’ .....................................................103 3.5. Sumy podłogi i sufitu ........................................................................... 108 Ćwiczenia ....................................................................................................117 4. T eoria liczb ..................................................................................................124 4.1. Podzielność ..............................................................................................124 4.2. Liczby pierwsze ...................................................................................... 128 4.3. Pierwsze przykłady ............................................................................... 130 4.4. Współczynniki rozkładu silni .......................................................... 135 4.5. Liczby względnie pierwsze ................................................................ 139 4.6. Relacja kongruencji ‘mod’ ................................................................ 148 4.7. Niezależne reszty ................................................................................... 151 4.8. Dalsze zastosowania ........................................................................... 154 4.9. Fi oraz mi ................................................................................................158 Ćwiczenia ....................................................................................................171 5. W sp ó łc zy n n ik i d w um ianow e ............................................................. 180 5.1. Podstawowe tożsamości ........................................................................ 180 5 .2 . Podstawowe ćwiczenia, .......................................................................... 201 5.3. Podstawowe techniki ............................................................................. 215 5.4. Funkcje tworzące ................................................................................... 226 5.5. Funkcje hip ergeometryczne ................................................................ 234 5.6. Przekształcenia hip ergeometryczne ...................................................247 5.7. Częściowe sumy hipergeometryczne ................................................. 253 5.8. Sumowanie mechaniczne ...................................................................... 260 Ćwiczenia ....................................................................................................273 6 . L iczby szczególn e .................................................................................... 288 6.1. Liczby Stirlinga ...................................................................................... 288 6 .2 . Liczby Eulera .......................................................................................... 299 6.3. Liczby harmoniczne : ............. ............................................................... 304 6.4. Sumowanie harmoniczne ...................................................................... 311 6.5. Liczby Bernoulliego ............................................................................... 316 6 .6 . Liczby Fibonacciego ..............................................................................324 6.7. Kontynuanty ...........................................................................................336 Ćwiczenia ....................................................................................................345 7. Funkcje tw orzące ..................................................................................... 356 7.1. Teoria domina i rozmieniania .............................................................356 7.2. Podstawowe techniki ............................................................................. 368 7.3. Rozwiązywanie rekurencji ....................................................................374 7.4. Szczególne funkcje tworzące ................................................................ 389 7.5. Sploty ........................................................................................................392 7.6. Wykładnicze funkcje tworzące ...........................................................404 7.7. Funkcje tworzące Dirichleta ................................................................ 410 Ćwiczenia ....................................................................................................412 8 . P raw d op o d ob ień stw o d y sk retn e ......................................................423 8 . 1. Definicje ................................................................................................... 423 8 .2 . Wartość oczekiwana i wariancja ........................................................ 429 8.3. Funkcje tworzące prawdopodobieństwa ........................................... 437 8.4. Rzucanie monetą ................................................................................... 444 8.5. Haszowanie .............................................................................................. 455 Ćwiczenia ....................................................................................................472 9. A sy m p to ty k a ............................................................................................. 485 9.1. Hierarchia ................................................................................................ 486 9.2. Notacja O ................................................................................................ 489 9.3. Przekształcenia typu O ........................................................................497 9.4. Dwie sztuczki asymptotyczne .............................................................512 9.5. Wzór sumacyjny Eulera ...................................................................... 518 9 .6 . Końcowe sumowania ............................................................................. 525 Ćwiczenia ....................................................................................................540 A . O dp ow ied zi do ćw iczeń ........................................................................ 547 B . B ibliografia ................................................................................................. 672 C. Ź ródła ćw iczeń ..........................................................................................694 Skorow idz .......................................................................................... ...............700 W ykaz t a b e l .................................................................................................... 718 Przedm ow a Książka ta powstała na podstawie wykładu o tej samej nazwie prowadzonego na Uniwersytecie Stanforda od 1970 r. Zazwyczaj przedmiot ten wybierało około 50 studentów, głównie magistrantów i doktorantów, choć zdarzali się również studenci starszych i młodszych lat. Ci, którzy zaliczyli ten przedmiot, zaczęli prowadzić podobne wykłady na innych uczelniach. Wygląda na to, że nadszedł czas, kiedy powinno się zaprezentować materiał wykładu szerszej publiczności (włączając w to studentów pierwszego roku). Matematyka konkretna powstała w czasie burzliwej dekady. Zaczęto kwe stionować wtedy nie podważane do tej pory wartości, przy czym kolebkę niepokojów stanowiły uniwersytety. Rewidowano programy studiów uniwer syteckich, i matematyka nie uniknęła znalezienia się pod lupą. John Hammersley napisał wtedy prowokujący artykuł „O osłabieniu umiejętności ma tematycznych przez ‘Matematykę Współczesną’ i przez jej podobne papki in telektualne serwowane w szkołach i na uniwersytetach” [176]. Inni przerażeni matematycy [333] pytali wręcz „Czy można uratować matematykę?” Jeden z autorów tej książki (DEK) wplątał się w pisanie serii książek pod tytułem The A rt of Computer Programming (Sztuka programowania komputerów) i w trakcie przygotowywania pierwszego tomu zorientował się, że brakuje mu narzędzi matematycznych. Te, których potrzebował w celu gruntownego zrozumienia programów komputerowych, różniły się znacznie od tych, które poznał w czasie, kiedy odbywał klasyczne studia matematyczne. Wprowa dził więc nowy przedmiot, aby uczyć tego, czego jemu samemu brakowało w czasie jego studiów. Tytuł wykładu „Matematyka Konkretna” miał początkowo stanowić an tidotum na coś, co się wtedy nazywało „Matematyka Abstrakcyjna”, jako że ta druga na fali mody nazwanej „Nową Matematyką” została wyprana nagle ze wszystkich konkretnych wyników stanowiących rdzeń matematycznej kla syki. Matematyka abstrakcyjna jest wspaniałym przedmiotem i nie ma w niej niczego złego: jest piękna, ogólna i użyteczna. Niestety, jej promotorzy doszli do wniosku, że cała reszta matematyki jest nic nie warta. Uogólnianie stało się tak modne, że całe pokolenie matematyków nie było w stanie docenić piękna „Czytelnik, poziom przedstawienia — tego typu rzeczy powinny znaleźć się w przedmowie.” P. R. Halmos [173] „Ludzie używający odpowiedniego żargonu dość szybko zdobywają powierzchowny autorytet: mogą wygłaszać górnolotne, a pozbawione wartości opinie. Liczy się jednak nie umiejętność mielenia jęzorem, ani nawet brylowania znajomością aktualnego stanu wiedzy matematycznej, lecz raczej zdolność wykorzystania tego, czego się nauczyło i zastosowania posiadanej wiedzy do rozwiązywania praktycznych problemów matematycznych. W skrócie chodzi nam nie o słowa, a o czyny.” J. Hammersley [176] [W tym miejscu i wielokrotnie później autorzy bawią się nieprzetłumaczalną grą słów. Słowo „concrete” po angielsku oznacza również beton. Tłumacze] „ Jest to z gruntu niesłuszne, aby uczyć abstrakcji przed konkretem.” Z. A. Melzak [267] „Rdzeń matematyki stanowią konkretne przykłady i konkretne problemy.” RR.Halm os [172] [Znowu nieprzetłumaczalna gra słów. „C iągły” po angielsku, to continuous, a „ dyskretny’, to discrete, co daje po zlepieniu c o n c r e te — konkretny.] Matematyka konkretna jest pomostem do matematyki abstrakcyjnej. przypadków szczególnych, ani podjąć wyzwania rozwiązywania konkretnych problemów ilościowych, czy nawet dostrzec wartość w tym, że ktoś posiada sprawność rachunkową. Upojona sukcesami matematyka abstrakcyjna zaczęła tracić kontakt z rzeczywistością. Potrzeba było konkretnej przeciwwagi, aby przywrócić wykształceniu matematycznemu zdrową równowagę. Wykładając po raz pierwszy Matematykę Konkretną na Uniwersytecie Stanforda, DEK wyjaśniał ten cokolwiek dziwny tytuł wykładu mówiąc, że jest to próba przedstawienia matematycznego wykładu kursowego w sposób twardy, a nie miękki. Zapowiedział, że wbrew oczekiwaniom niektórych jego kolegów nie zamierza uczyć teorii wiązek, ani twierdzenia Stone’a o wło żeniu, ani nawet uzwarcenia Stone’a-Ćecha. (Kilku studentów z wydziału inżynieryjnego wstało i po cichu opuściło salę) Choć Matematyka Konkretna powstała w reakcji na inne trendy, rzeczy wiste przyczyny jej powstania były pozytywne, a nie negatywne. W miarę, jak wykład ten stawał się w trakcie studiów popularnym przedmiotem, jego treść „utwardzając się” okazywała się użyteczna w wielu nowych zastosowaniach. Tymczasem nadeszło nowe potwierdzenie trafności nazwy tej dziedziny, gdy Z. A. Melzak opublikował dwuczęściową książkę pod tytułem Companion to Concrete Mathematics [267]. Materiał matematyki konkretnej zdaje się na pierwszy rzut oka być wor kiem przypadkowych chwytów, jednak praktykowanie ich przetwarza go w zorganizowany warsztat z gotowymi narzędziami. W rzeczywistości przed stawione w tej książce techniki charakteryzują się pewną jednorodnością i na wielu wywierają duże wrażenie. Kiedy inny z autorów (RLG) po raz pierwszy prowadził ten przedmiot w 1979 r., studentom tak się wykład spodobał, że wielu z nich zobaczył jeszcze raz rok później. Czym dokładnie jest Matematyka Konkretna? Jest to mieszanina ma tematyki ciągłej i dyskretnej. Konkretniej, w jej zakres wchodzi usyste matyzowane przetwarzanie wzorów matematycznych oparte na zestawie od powiednich technik rozwiązywania problemów. Gdy opanujesz, Czytelniku, materiał zawarty w tej książce, wówczas wszystko, czego będziesz potrzebo wał, to niezmącony umysł, trochę papieru i całkiem niemało pisania, aby wyliczać wartości jakichś horrendalnie wyglądających sum, rozwiązywać zło żone relacje rekurencyjne i odkrywać subtelne wzorce w danych. Będziesz na tyle biegły w stosowaniu technik algebraicznych, że często będziesz wolał znajdywać wartości dokładne, niż ich oszacowania. Podstawowe zagadnienia ujęte w tej książce zawierają sumy, rekurencje, elementarną teorię liczb, współczynniki dwumianowe, funkcje tworzące, prawdopodobieństwo dyskretne i metody asymptotyczne. Główny nacisk jest położony nawet nie na twierdzenia egzystencjalne, czy myślenie kombinatoryczne, a na techniki rachunkowe. Celem książki jest bowiem zaznajomienie czytelnika z działaniami dyskretnymi (takimi jak część całkowita, czy sumo wanie skończone) w podobnym stopniu, w jakim studiujący analizę matema tyczną zapoznają się z działaniami ciągłymi (takimi jak wartość bezwzględna czy całkowanie). Warto zauważyć, że przedstawiona lista zagadnień różni się zasadniczo od tego, co zwyczajowo jest wykładane pod nazwą „Matematyki Dyskretnej”. Potrzebujemy więc odrębnej nazwy, a „Matematyka Konkretna” okazała się nazwą równie wygodną, jak pozostałe powszechnie używane dla określenia innych dziedzin. Początkowo podręcznikiem do stanfordzkiego wykładu był rozdział „Mathematical Preliminaries” z książki The A rt of Computer Programming [207]. Materiał zawarty na 110 stronach tego rozdziału był jednak zbyt zwięzły, więc trzeci z autorów (OP) wpadł na pomysł opracowania notatek uzupełniają cych, które przyjęły całkiem spore rozmiary. Książka ta stanowi rozwinięcie tych notatek. Jest to więc uzupełnienie wspomnianego rozdziału i bardziej przystępne wprowadzenie do materiału w nim zawartego. Niektóre znajdu jące się tam zbyt zaawansowane części pominięto w tej książce, inne z kolei zagadnienia dodano dla pełności wywodu. Autorzy mieli dużo satysfakcji przy tworzeniu tej książki, gdyż jej te mat krzepł przed ich oczyma i zaczynał żyć swoim własnym życiem; w czasie pracy nad nią książka ta zdawała pisać się sama. Co więcej, przyjęte przez nas dość niekonwencjonalne metody przedstawienia materiału tak dobrze za częły do siebie pasować, że — po latach doświadczeń— nie możemy oprzeć się wrażeniu, że książka ta jest rodzajem manifestu na temat tego, w jaki sposób powinno się uprawiać matematykę. Z naszego punktu widzenia książka ta jest bajką o matematycznym pięknie i przypadku. Mamy nadzieję, że czytelnicy podzielą z nami choć e tej przyjemności, którą mieliśmy w trakcie tworzenia tej książki. Książka ta powstała w środowisku uniwersyteckim, staraliśmy się więc oddać ducha współcześnie prowadzonych zajęć za pomocą nieformalnego stylu prezentacji materiału. Niektórzy uważają, że matematyka to przedsię wzięcie poważne i że musi w związku z tym być zimna i sucha. My jednak sądzimy, że matematyka jest zabawą i nie wstydzimy się tego ujawnić. W imię czego mielibyśmy oddzielać grubą kreską pracę od zabawy? Matematyka konkretna jest pełna pociągających wzorców; przekształcenia nie zawsze są łatwe, ale uzyskiwane odpowiedzi bywają zaskakująco atrakcyjne. Radości i smutki naszej matematycznej pracy są oddane tu wprost, gdyż są częścią naszego życia. Studenci zawsze wiedzą lepiej od swoich nauczycieli, więc poprosiliśmy kilku z nich o wyrażenie szczerych opinii w postaci „graffiti” na margine sach. Niektóre z nich są banalne, inne głębokie, niektóre ostrzegają o niejed „Czytelnik zaawansowany przeskakując części, które wydają mu się zbyt elementarne, często traci więcej, niż czytelnik początkujący, przeskakujący części, które wydają się mu zbyt złożone” . G. Pólya [298] „ . . . betonowa kamizelka ratunkowa rzucona studentom tonącym w morzu abstrakcji.” W. Gottschalk [Zobaczcie, ile jest w tej książce Deńnicji, Lematów, Twierdzeń ...] Graffiti matematyczne: Uwolnić grupę! Domknąć pierścień! Zbadać przestrzeń nad ciałem. N = 1 => P = N P . Szczerze mówiąc, mało mnie to interesuje. To był najfajniejszy wykład, na ja k i kiedykolwiek chodziłem. Ale dobrze jest czasami podsumowywać przerobiony materiał. Rozumiem, matematyka konkretna, to po prostu zaćwiczanie. Ćwiczenia domowe były trudne, ale dały m i dużo. Każda godzina się opłaciła. Domowe zadania egzaminacyjne są niezbędne— tak trzymać! Egzaminy były trudniejsze niż to, czego się spodziewałem po ćwiczeniach domowych. noznacznościach i niezręcznościach, inne są typowymi komentarzami czynio nymi przez zdolnych gości z ostatnich rzędów; niektóre są pozytywne, inne są negatywne, a jeszcze inne są zerowe. Wszystkie jednak wynikły z prawdzi wych odczuć powstałych w trakcie czytania, co powinno ułatwić przyswoje nie tego materiału. (Pomysł ubarwienia tekstu książki takimi komentarzami pochodzi z podręcznika dla studentów Wstępując na Stanford , w którym ofi cjalne teksty są kontrowane przez komentarze studentów kończących studia. Na przykład Stanford pisze: „Jest parę rzeczy, których nie możesz nie za uważyć w tym amorficznym tworze, jaki stanowi Stanford”, a na marginesie czytamy: „Amorficzny . . . o co tu, kurczę, chodzi? Typowy pseudointelektualizm panoszący się tutaj”. Stanford: „Nie ma granic dla potencjału, jaki stanowi grupa wspólnie żyjących studentów.” Graffito: „Akademiki Stan forda to coś w rodzaju ZOO bez dozorcy.”) Na marginesach pojawią się także dokładne cytaty z prac znanych ma tematyków minionych pokoleń, przytaczające oryginalne słowa, których uży wali ânonsując niektóre z ich fundamentalnych odkryć. Niemniej jednak, uznaliśmy za właściwe przemieszać nazwiska takie jak Leibniz, Euler czy Gauss z nazwiskami tych, którzy po nich kontynuowali pracę. Matematyka jest ciągłym wyzwaniem dla ludzi na całym świecie. Ta bogata tkanina utkana jest z wielu wątków. • Książka ta zawiera ponad 500 ćwiczeń podzielonych na sześć kategorii: R ozgrzew k ę stanow ią ćw iczenia, które w s z y s c y c z y t e l n i c y pow inni spróbować rozw iązać przy p ierw szym czytaniu. • • • • • P od staw y, to ćwiczenia, które pozwalają wprowadzić fakty najłatwiej przyswajalne za pomocą próby ich samodzielnego odkrycia. Ć w iczen ia d om ow e, to zadania mające pogłębić zrozumienie przero bionego w danym rozdziale materiału. Z adania egzam in acyjn e zazwyczaj dotyczą materiału z dwóch lub więcej rozdziałów. Stanowiły one najczęściej domowe zadania zalicze niowe, a nie zadania do rozwiązania w czasie egzaminu tradycyjnego, przeprowadzanego we wspólnej sali pod presją czasu. Ć w iczen ia d od atk ow e wykraczają poza materiał, który przewidziany został dla średniego studenta uczącego się matematyki konkretnej według tej książki. Rozszerzają one materiał w różnych ciekawych kierunkach. P ro b lem y badaw cze dadzą się, albo się nie dadzą rozwiązać przez czło wieka, ale te, które tu proponujemy są warte zastanowienia się i próby podejścia do rozwiązania (nie pod presją czasu). Odpowiedzi do wszystkich ćwiczeń są w Dodatku A, często z informacją o po wiązanych z nimi wynikach. (Oczywiście „odpowiedzi” na problemy badaw cze są niepełne, jednakże nawet w takich przypadkach podajemy wskazówki P rzed m ow a L łłZ lub wyniki częściowe, które mogą być użyteczne przy rozwiązywaniu tych pro blemów). Zachęcamy Czytelników do zaglądania do odpowiedzi, szczególnie do odpowiedzi do zadań rozgrzewkowych, ale tylko p o dokonaniu rzetelnej próby rozwiązania danego zadania bez podglądania. W Dodatku C próbowaliśmy dla każdego ćwiczenia określić źródła, gdyż uważamy, że wymyślenie dobrego zadania wymaga często ogromnego nakładu energii i (lub) szczęścia. Niestety matematycy wprowadzili zwyczaj zapoży czania ćwiczeń bez cytowania źródeł. Uważamy, że przeciwna taktyka, zacho wywana np. w książkach i czasopismach szachowych (gdzie zwykle podaje się nazwiska twórców, daty i miejsca pierwszych publikacji cytowanych zadań szachowych) jest znacznie lepsza. Nie udało się nam jednak zlokalizować źró deł wielu zadań, które stały się częścią folkloru matematycznego. Będziemy wdzięczni za wskazanie każdego nie znanego nam lub niedokładnie podanego źródła któregokolwiek z przedstawionych ćwiczeń lub zadań. Chcielibyśmy poznać jak najwięcej szczegółów i poprawić niedoróbki w następnych wyda niach tej książki. Matematyczne czcionki, których używamy w tej książce, zostały zapro jektowane przez Hermanna Zapfa [227] na zlecenie AMS (American Mathematical Society— Amerykańskiego Towarzystwa Matematycznego) i opraco wane przez komitet, w skład którego wchodzili: B. Beeton, R. P. Boas, L. K. Durst, D.E. Knuth, P. Murdock, R. S. Palais, P. Renz, E. Swanson, S.B. Whidden, i W. B. Woolf. Pomysłem, który legł u podstaw projektu Zapfa, było uchwycenie stylu, jakim mógłby się posługiwać matematyk dysponujący przepięknym charakterem pisma. Pismo ręczne ma tę przewagę nad mecha nicznym, że matematycy zwykle pracują z długopisem, ołówkiem lub kredą. (Jednym z przykładów rozwiązań tego projektu jest znak zero, ‘0’, który jest lekko zaostrzony na górze, ponieważ rzadko kiedy pisząc zero udaje się je precyzyjnie zaokrąglić domykając na górze.) Symbole są pisane pionowo, a nie kursywą, tak więc indeksy i akcenty układają się bardziej naturalnie. Ta nowa rodzina czcionek została nazwana AMS Euler, na cześć wielkiego matematyka szwajcarskiego Leonharda Eulera (1707-1783), który tak dużo odkrył w matematyce, którą się dziś posługujemy. Pośród czcionek można wyodrębnić takie zbiory, jak Euler Text (A aB b C c aż do X x Y y Z z), Euler Fraktur (21a £c aż do 2}t) 33) i Euler Script Capitals (A ¥> 6 aż do X y Z), jak również Euler Greek (AaB|3 Ty aż do X xAł/4, ^ a>) i symbole szczególne takie jak jp lub K. Szczególnie cieszy nas to, że możemy zainaugurować ro dzinę czcionek Eulera w tej właśnie książce, ponieważ duch Eulera przenika tu każdą stronę: Matematyka konkretna jest matematyką eulerowską. Autorzy są szczególnie wdzięczni Andreiowi Broderowi, Ernstowi Mayrowi, Andrew Yao i Frances Yao, którzy mieli znaczny wpływ na tę książkę w latach, gdy wykładali Matematykę Dyskretną na Stanfordzie. Ponadto kierummm- Ci, którzy będą oszukiwali, mogą zaliczyć ten materiał przepisując odpowiedzi, ale oszukają tylko siebie samych. Przypadkowem u studentowi zaleciłbym trzymanie się z dala od tego wykładu. Nie widzę, jak to, czego się do tej pory nauczyłem, mogłoby mi w czymkolwiek pomóc. Miałem sporo kłopotów z tym przedmiotem, ale wiem, że wyostrzył moją sprawność matematyczną i umysłową. [Uwaga o błędach typograficznych odnosi się niestety tylko do angielskiego oryginału.] jemy 1024 podziękowania tym asystentom, którzy twórczo przetworzyli to, co działo się w czasie ćwiczeń w latach, kiedy je prowadzili i którzy poma gali w opracowywaniu zadań egzaminacyjnych. Ich lista zamieszczona jest w dodatku C. Książka ta, która w dużej części wyrosła z prowadzonych przez nich w ciągu 16 lat notatek, byłaby nie powstała bez ich wspaniałej pracy. Wiele innych osób przyczyniło się do tego, że książka ta ujrzała światło dzienne. Chcielibyśmy dla przykładu odnotować wkład studentów Uniwer sytetów Browna, Columbia, CUNY, Princeton, Rice i Stanforda, którzy do pomogli w wyborze graffiti i w poprawianiu pierwszych maszynopisów. Kon takty z wydawnictwem Addison-Wesley były bardzo pomocne i efektywne. W szczególności chcielibyśmy wyrazić naszą wdzięczność wydawcy — Peterowi Gordonowi, redaktorowi technicznemu— pani Bette Aaronson, projektan towi— Royowi Brownowi i redaktorowi— Lynowi Dupre. National Science Foundation i Office of Naval Research wspomogły nas nieocenionymi gran tami. Cheryl Graham była niezwykle pomocna przy opracowywaniu skoro widza. Przede wszystkim jednak chcielibyśmy podziękować naszym żonom (Jill, Fan i Amy) za ich cierpliwość, pomoc, zachęty i pomysły. Obecne, drugie wydanie tej książki, zawiera nowy rozdział 5.8, który przedstawia pewne ważne pomysły odkryte przez Dorona Zeilbergera krótko po tym, jak pierwsze wydanie poszło do druku. Prawie na każdej stronie tego wydania można znaleźć poprawki w stosunku do wydania pierwszego. Próbowaliśmy stworzyć książkę bezbłędną, ale jesteśmy autorami omyl nymi. Apelujemy więc gorąco o poprawianie wszelkich błędów przez nas po czynionych. Wyznaczamy nagrodę w wysokości 2,56 dolara, którą wypłacimy z wdzięcznością każdemu pierwszemu odkrywcy jakiegokolwiek błędu mate matycznego, historycznego lub typograficznego. Murray Hill, New Jersey i Stanford, Kalifornia maj 1988 i październik 1993 — RLG DEK OP N otacja Niektóre^pomysły notacyjne użyte w tej książce nie stały się (jeszcze ?) stan dardem. Poniżej przedstawiamy listę tych symboli, które mogą być nie znane czytelnikom, czytającym o podobnych rzeczach w innych książkach. Obok podajemy numery stron, na których pojawiają się ich objaśnienia. W celu uzyskania odnośników do innych, częściej spotykanych oznaczeń, zajrzyj też do skorowidza na końcu książki. O zn aczen ie N azw a ln x logarytm naturalny: loge x 309 lg x logarytm dwójkowy: log 2 x 90 log x logarytm dziesiętny: log10x 496 w podłoga: m ax{n | n ^ x, całkowite n } 87 M sufit: m in {n | n ^ x, całkowite n } 87 x mod y reszta: x —y [x /y j 103 m część ułamkowa: x mod 1 90 y f (x) óx sumowanie nieoznaczone 67 V" f (x) óx Ł— a sumowanie oznaczone 68 x^ potęga ubywająca: x !/(x —n)! 66,241 X* potęga przyrastająca: V(x + tl)/F (x) 66,241 n\ podsilnia: rt!/ 0 ! —n ! / l ! H------- b (—1)nrt!/n! 223 mz część rzeczywista: x, jeśli z = x + iy 83 3z część urojona: y, jeśli z = x + iy 83 Stron a H,ln liczba harmoniczna: 1/1 H-------h 1/ n 46 [(*) uogólniona liczba harmoniczna: 1/ 1X H-------b 1/ n x 310 m-ta pochodna funkcji f w z 518 cykliczna liczba Stirlinga ( „pierwszego rodzaju”) 290 rt m podzbiorowa liczba Stirlinga („drugiego rodzaju”) 289 n m liczba Eulera 299 liczba Eulera drugiego rodzaju 302 (am . . . a 0)b pozycyjny zapis liczby Y.™=o 26 K( a i , . . . , an ) wielomiany kontynuant 337 Q>k c funkcja hipergeometryczna 234 #A moc zbioru: liczba elementów w zbiorze A 57 fcn]f(z) współczynnik przy zn w rozwinięciu f (z) 226 [ a .. |3] przedział domknięty: zbiór {x | oc ^ x ^ (3} 94 [m = n] 1 jeśli m = u, w przeciwnym razie 0 * 40 [m \n] 1 jeśli m dzieli n, w przeciwnym razie 0 * 124 [m\\n] 1 jeśli m dokładnie dzieli n, w przeciwnym razie 0 * 173 [m_Ln] 1 jeśli m jest względnie pierwsze z n, Tl m_ w przeciwnym razie 0 * 139 *W ogólności, jeśli S jest dowolnym stwierdzeniem, które może być prawdą lub fałszem, to nawiasowa notacja [S] oznacza 1, jeśli S jest prawdą, a 0 w przeciwnym razie. W tekście książki używamy pojedynczych cudzysłowów (*...*) w celu oznaczenia tekstu samego w sobie, tak jak został napisany , a podwójnych („... ”)—tak jak ma zostać przeczytany . W związku z tym słowo ‘słowo’ jest czasami nazywane „słowem.” Wyrażenie postaci ‘a /b c ’ ma to samo znaczenie, co ‘a /(b c )\ Ponadto logx/log-y = (logx)/(logy) oraz 2 rt! = 2 (rt!). | i | P roblem y rekurencyjne W rozdziale tym zajmujemy się trzema przykładowymi problemami, które będą stanowiły przedsmak tego, co nas czeka. Problemy te mają dwie wspólne cechy: wszystkie były wielokrotnie badane przez matematyków, a ich rozwią zanie opiera się na pojęciu rekurencji. Rekurencja polega na tym, że roz wiązanie badanego problemu wyraża się za pomocą rozwiązań tego samego problemu dla danych o mniejszych rozmiarach. 1.1. W ieże z H anoi Przyjrzyjmy się na początek zgrabnej łamigłówce zwanej Wieżami z Hanoi. Łamigłówkę tę wymyślił francuski matematyk Edouard Lucas w roku 1883. Mamy wieżę złożoną z 8 krążków ułożonych jeden na drugim i nadzianych na jeden z 3 prętów malejącymi średnicami ku górze: Zadanie polega na przeniesieniu całej wieży krążków na jeden z pozosta łych prętów, przy czym w każdym ruchu można brać tylko jeden krążek i nie wolno położyć większego krążka na mniejszym. Lucas [260] ubarwił swoje zadanie legendą o znacznie wyższej Wieży Brahmy, która miała mieć 64 krążki z czystego złota spoczywające na 3 dia mentowych igłach. U zarania czasu Bóg umieścił te złote krążki na pierwszej z igieł i polecił grupie mnichów, aby przełożyli je na igłę trzecią zgodnie z po Ci, którzy jeszcze tego nie znają, niech podniosą rękę. OK, a teraz cała reszta może spokojnie przeskoczyć do równania ( 1 .1 ). Z łoto— o rany! Nasze krążki są pewnie z czegoś konkretniejszego? danymi regułami. Mnisi pracują bez wytchnienia dzień i noc. Kiedy skończą, wieża rozsypie się i nastąpi koniec świata. Wcale nie jest oczywiste, że łamigłówka ta ma jakiekolwiek rozwiązanie. Chwila zastanowienia (lub wcześniejsza znajomość problemu) pozwala nam być jednak dobrej myśli. Powstaje teraz pytanie: jaki jest najszybszy spo sób wykonania zadania? Ściślej: ile co najmniej ruchów trzeba wykonać, aby przenieść wieżę? Najlepszą metodą zaatakowania problemu tego typu jest pewne jego uogólnienie. Wieża Brahmy zawiera 64 krążki, wieża z Hanoi — 8 . Zasta nówmy się, co się dzieje w przypadku n krążków. Jedną z zalet takiego podejścia jest to, że możemy wejść w nasz problem nieco głębiej. W rzeczywistości, jak to jeszcze wielokrotnie w tej książce zo baczymy, warto r o z w a ż a ć d r o b n e p r z y p a d k i najpierw. Łatwo jest prze łożyć wieżę składającą się z jednego lub dwóch krążków. Po paru próbach znajdziemy też bez trudu metodę dla trzech. Następnym krokiem przy rozwiązywaniu problemu będzie wprowadze nie odpowiedniej notacji: n a z w ij i z w y c i ę ż a j . Niech będzie minimalną liczbą ruchów konieczną do przeniesienia n krążków z jednego pręta na drugi zgodnie z zasadami Lucasa. Oczywiście Ti jest równe 1, a Tz = 3. Możemy też natychmiast otrzymać dodatkową wartość, gdy rozważymy przypadek najdrobniejszy ze wszystkich. Oczywiście To = 0, ponieważ żadne ruchy nie są potrzebne, aby przenieść zero krążków! Sprytni matematycy nie wstydzą się myśleć detalicznie ( think sm ali), gdyż przypadki ogólne są ła twiejsze do ogarnięcia, gdy dokładnie zrozumiemy sytuacje krańcowe (nawet gdy są trywialne). Spójrzmy na to z innej strony i postarajmy się myśleć z rozmachem ( think big)\ jak można przenieść dużą wieżę? Próby z trzema krążkami pokazują, że do celu prowadzi przeniesienie 2 górnych krążków na pręt środkowy, następ nie przeniesienie trzeciego krążka na pręt docelowy i w końcu przeniesienie na ten pręt pozostałych dwóch krążków. Pomysł ten dostarcza nam ogólnej metody dla n krążków: najpierw przenieś n — 1 wierzchnich krążków na pręt pomocniczy (to wymaga Tn_i ruchów), następnie przenieś największy krą żek na pręt docelowy (1 ruch) i w końcu przenieś położone na pomocniczym pręcie n — 1 krążków na pręt docelowy (znów T^-i ruchów). Możemy zatem przenieść n krążków (dla n > 0) w co najwyżej 2Tn_i + 1 ruchach: Tn ^ 2Ta_i + 1 , dla n > 0. W powyższym wzorze występuje ‘ ^ ’ zamiast ‘ = *, gdyż jak na razie poka zaliśmy, że 2Tn_i + 1 ruchów wystarcza. Nie pokazaliśmy jeszcze tego, że konieczne jest użycie co najmniej 2Tn_i + 1 ruchów. Nietrudno jest jednak dojść do tego. 1.1. W ieże z H anoi I Czy może istnieć lepsze rozwiązanie? Okazuje się, że nie. W którymś momencie musimy przecież ruszyć największy krążek i wtedy pozostałe n —1 musi leżeć na pręcie pomocniczym. Aby je tam przenieść, musimy wykonać co najmniej Tn-i ruchów. Oczywiście gdybyśmy byli rozrzutni, moglibyśmy największy krążek jeszcze poprzekładać sobie tam i z powrotem, ale po doko naniu tego po raz ostatni musimy znowu przenieść rt — 1 krążków (z których wszystkie w tym momencie muszą się znaleźć na jednym pręcie) na najwięk szy z nich znajdujący się już na pręcie docelowym, a to wymaga znów Tn_i ruchów. Zatem n —1 + i dla n > 0 . Większość publikowanych „ rozwiązań” problemu Lucasa, takich jak na przykład podane przez Allardice’a i Frasera [7], nie zawiera uzasadnienia tego, że Tu musi być nie mniejsze niż 2Tn—1 + 1 . Te dwie nierówności wraz z trywialnym rozwiązaniem dla rt = 0 dają To = 0; Tn = 2Tn_i + 1 , (i-i; dla rt > 0 . Zauważmy, że te wzory są zgodne ze znanymi nam już wartościami Ti = 1 i T2 = 3. Doświadczenie z małymi liczbami pomogło nam nie tylko znaleźć ogólny wzór, lecz także pozwoliło nam sprawdzić, czy nie popełniliśmy jakie goś głupiego błędu. Takie weryfikacje będą bardzo użyteczne, gdy napotkamy bardziej skomplikowane obliczenia w późniejszych rozdziałach. Zestaw równości takich jak ( 1 .1 ) nazywany jest rekurencją (używa się też na nie określenia relacji rekurencyjnej lub rekursywnej). Rekurencją składa się z podania wartości brzegowej i z równania wyrażającego ogólną wartość za pomocą wartości wyrazów wcześniejszych. Czasami nazywamy rekurencją samo równanie ogólne, choć z technicznego punktu widzenia potrzeba tam jeszcze wartości brzegowej. Wyprowadzona rekurencją pozwala na obliczenie Tn dla każdego n. Nikt jednak nie lubi wyliczać wartości z zależności rekurencyjnej: dla dużych n jest to zbyt pracochłonne. Rekurencją dostarcza nam jedynie informacji lokalnej. R ozwiązanie rekurencji zadowalałoby nas znacznie bardziej. Chcielibyśmy więc uzyskać zgrabną „zwartą postać” na T n, za pomocą której moglibyśmy szybko dostawać żądane wartości nawet dla dużych rt. Mając taką zwartą postać możemy lepiej zrozumieć, czym w rzeczywistości jest Tn . Jak zatem rozwiązuje się taką rekurencję? Można oczywiście zgadnąć wynik i pokazać, że mieliśmy rację. Najlepiej w tym celu jest znowu przyjrzeć się drobnym przypadkom. Liczymy więc kolejno: T3 = 2 -3 + 1 = 7; T4 = 2 * 7 + 1 =1 5; T5 = 2*15 + 1 = 31; Tg = 2 * 3 1 +1 = 6 3 . Aha! To niewątpliwie wygląda, jak gdyby Tn = 2n - 1 , dla rt >. 0 . ( 1 .2 ) W każdym razie działa przynajmniej dla n ^ 6 . I I P JL Tak, ta k .. .ja już to gdzieś widziałem. 1 . P ro b lem y reku rencyjn e Indukcja matematyczna pozwala dowieść, że możemy wspiąć się na drabinę tak wysoko jak chcemy przez wykazanie, że możemy wspiąć się na najniższy szczebel (baza), a następnie, że z każdego szczebla możemy wspiąć się na następny (krok indukcyjny). Indukcja m atem atyczn a stanowi ogólne narzędzie dowodzenia, że pew ne stwierdzenie o liczbie naturalnej rt jest prawdziwe dla wszystkich n noNajpierw wykazujemy prawdziwość dla możliwie małego n 0 — nazywamy to bazą indukcji. Następnie dowodzimy stwierdzenia dla rt > rto, zakładając, że zostało ono już udowodnione dla wszystkich wartości pomiędzy no i n — 1 włącznie — tę fazę nazywamy krokiem indukcyjnym. Dowód taki dostarcza nam nieskończonej liczby wyników za pomocą skończonego nakładu pracy. Definicje rekurencyjne wyśmienicie nadają się do dowodów indukcyjnych. W naszym przypadku na przykład wzór ( 1 .2 ) wynika bezpośrednio z ( 1 . 1 ): Baza jest oczywista, gdyż To = 2° — 1 = 0 . Krok indukcyjny wynika dla n > 0 natychmiast, gdy założymy, że wzór ( 1 .2 ) zachodzi dla n zastąpionego przez n — 1 : Tn = 2Tn_ , + 1 = 2(2 n _ 1 - 1) + 1 = 2n - 1 . Okazuje się więc, że wzór ( 1 .2 ) zachodzi również dla n. Świetnie! Nasze po szukiwania wzoru na Tn zostały zakończone sukcesem. Oczywiście nie oznacza to końca pracy mnichów: wciąż sumiennie prze kładają krążki i jeszcze zajmie im to trochę czasu, gdyż dla n = 64 trzeba wykonać 264—1 ruchów (około 18 trylionów). Nawet z niemożliwą do zrealizo wania prędkością jednego ruchu na mikrosekundę przełożenie wieży Brahmy zajęłoby im ponad 5000 wieków. Oryginalna łamigłówka Lucasa była nieco bardziej realna: wymagała jedynie 2 8 — 1 = 255 ruchów, co wprawnej ręce zajmuje około 4 minut. Rekurencją wież z Hanoi jest typowa dla wielu przypadków, z którymi spotykamy się w zastosowaniach najprzeróżniejszych rodzajów. Znalezienie postaci zwartej dla pewnej wielkości takiej jak Tn będzie przebiegało w na stępujących fazach: 1. 2. 3. Przypatrz się małym przypadkom. To daje wyobrażenie o problemie i pomaga w fazach 2 i 3. Zgadnij postać wyrażenia matematycznego opisującego szukaną wartość i udowodnij jego poprawność. W przypadku wież z Hanoi jest to rekurencja ( 1 . 1 ), która pozwala nam wyliczyć wartość Tn.dla każdego n. Znajdź i udowodnij zwartą postać naszego wyrażenia matematycznego. Dla wież z Hanoi będzie to rozwiązanie rekurencji ( 1 .2 ). W książce tej będziemy się przede wszystkim zajmowali fazą trzecią. Istotnie, będziemy często przeskakiwali fazy 1 i 2 , gdyż wyrażenie matematyczne bę dzie nam dane na starcie. Nawet wtedy jednak, przy badaniu pojawiających się podproblemów, będziemy wracali do faz 1 i 2 . Analizując wieże z Hanoi doszliśmy do poprawnego rozwiązania, ale po drodze wykonaliśmy „indukcyjny skok” — musieliśmy w pewnym momencie polegać trochę na szczęściu, że uda się nam zgadnąć wynik. Jednym z głów 1.2. P r o ste n a p łaszczyźn ie nych celów tej książki jest wyjaśnienie, jak można rozwiązywać rekurencje bez bycia jasnowidzem. Zobaczmy dla przykładu, w jaki sposób rekurencją ( 1 . 1 ) może się uprościć przez dodatnie 1 do obu stron równości: To + 1 = i ; Tn + 1 = 2Tn_i + 2 , r dla rt > 0. (^ ' 1 ' !i Teraz jeśli przyjmiemy Un = Tn + 1, to otrzymamy U 0 = 1; Un = 2 Un_, dla n > 0 . (i-3) Interesujące: pozbywamy się +1 w ( 1.1) przez dodanie jedynki, a nie odjęcie! Nie trzeba być geniuszem, aby odkryć, że rozwiązanie tej rekurencji, to po prostu Un = 2n ; zatem Tn = 2n — 1. Nawet komputer by to zauważył. 1.2. P ro ste na p łaszczyźnie Drugi z naszych przykładów będzie miał charakter geometryczny. Ile kawał ków pizzy można uzyskać za pomocą rt prostoliniowych cięć nożem? Albo, ściślej, jaka jest największa liczba Lu obszarów wyznaczonych przez n pro stych na płaszczyźnie? Problem ten został rozwiązany przez szwajcarskiego matematyka Jacoba Steinera w 1826 roku [339]. Jak zwykle, rozważymy na początku drobne przypadki, pamiętając aby zacząć od najdrobniejszego z nich. Płaszczyzna bez prostych ma jeden obszar, płaszczyzna z jedną prostą — 2 obszary, z dwiema— 4. Lo = 1 Li = 2 (Każda prosta przedłuża się w obu kierunkach w nieskończoność). A zatem, myślimy, Ln = 2n . Oczywiście! Dodanie nowej prostej po dwaja po prostu liczbę obszarów. Niestety, nie jest to prawdą. Tak byłoby, gdyby ri-ta prosta mogła podzielić każdy zastany obszar na dwa. Niewąt pliwie można za pomocą tej prostej podzielić taki obszar na co najwyżej dwa kawałki, gdyż każdy z zastanych obszarów jest wypukły. (Prosta może podzielić obszar wypukły na co najwyżej dwa obszary, każdy z nich znów wypukły). Kiedy jednak dodamy trzecią prostą— pogrubioną na rysunku poniżej— przekonamy się, że może ona podzielić co najwyżej 3 spośród 4 (Pizza z serem szwajcarskim?) Obszar jest wypukły, jeśli zawiera wszystkie odcinki łączące dowolne dwa z jego punktów. (To nie jest dokładnie to, co na ten temat można przeczytać w słowniku, ale to jest coś, w co wierzą matematycy.) 1 . P ro b lem y rekurencyj 20 obszarów, niezależnie od tego, jak poprowadziliśmy poprzednie 2 proste: Zatem nie możemy uzyskać więcej niż L3 = 4 + 3 = 7 obszarów. Po krótkim zastanowieniu się dostrzeżemy właściwe uogólnienie: n-ta prosta (dla n > 0 ) zwiększa liczbę obszarów o k wtedy i tylko wtedy, gdy przecina k spośród zastanych obszarów. Dzieje się tak z kolei wtedy i tylko wtedy, gdy przecina zastane proste w k — 1 różnych punktach. Dwie proste mogą przeciąć się w co najwyżej jednym punkcie, a więc nowa prosta może przeciąć co najwyżej n — 1 zastanych prostych w co najwyżej n — 1 różnych punktach, zatem musi być k ^ n. Udało sięnam znaleźć ograniczenie górne: Ln ^ Ln_i + t l , dla n > 0. Co więcej, za pomocą indukcji można łatwo pokazać, że w powyższym wzo rze możemy uzyskać równość. Wystarczy tak poprowadzić n-tą prostą, żeby nie była równoległa do żadnej innej (zatem wszystkie je będzie przecinać) i tak, żeby nie przechodziła przez żaden z istniejących już punktów przecięcia (zatem wszystkie proste będzie przecinać w różnych punktach). Uzyskana rekurencją przedstawia się następująco: ' 1-0 = 1 ; Ln = Ln_i + rt, , Rozwijając? Raczej nazwałbym to wtykaniem w siebie. dla rt > 0. (i-4) Znane już wartości L i, L2 i L3 zgadzają się,więc ją akceptujemy. Przystąpmy teraz do poszukiwań postaci zwartej. Moglibyśmy zacząć bawić się w zgadywanie, tak jak poprzednio, ale ciąg 1, 2, 4, 7, 11, 16, . . . niczego nie przypomina. Spróbujmy więc inaczej. Rekurencję często można zrozumieć „rozwijając” ją tak jak poniżej: Ln — Ln_i + Tl = Lrt- 2 + (n — 1) + n = ' Ln _ 3 + (n - 2 ) + (n - 1) + n — Lo + 1 + 2 H------- 1- (rt —2 ) + (n — 1 ) + n = 1 + Sn , gdzie Sn = 1 + 2 + 3 H------- 1- (rt — 1 ) + n . 1.2. P r o ste na p łaszczyźn ie Innymi słowy, Ln jest o 1 większe od sumy Sn początkowych rt liczb natu ralnych. Liczby Sn pojawiają się na tyle często, że warto zrobić zestawienie paru początkowych wartości. Będziemy mogli łatwiej skojarzyć te liczby, gdy zo baczymy je następnym razem. n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 sn 1 3 6 10 15 21 28 36 45 55 66 78 91 105 Liczby te są także zwane liczbami trójkątnym i, gdyż Sn jest liczbą kul bilar dowych ułożonych w trójkąt o n rzędach. Na przykład, przy n = 4 trójkątne ustawienie ’v X wymaga S4 = 10 kul. Aby wyliczyć Sn , możemy skorzystać z pomysłu Gaussa, do którego do szedł w roku 1786, mając zaledwie 9 lat [8 8 ] (zobacz także Euler [114, część 1 , §415]): = 1 + + sn = rt + (n — 1 ) + (rt —2 ) + Sn 2 + 3 + + (rt — 1 ) + + 2 + 2Sr,, —' (n + 1) + (tl + I) + (ti + 1) + ••• + (n + 1) + (n + 1) Dodajemy po prostu ciąg Sn do niego samego w odwrotnej kolejności, tak żeby każda z rt kolumn po prawej stronie sumowała się do n + 1. Po uprosz czeniu otrzymujemy Wygląda na to, że Gaussowi przypisuje się kupę rzeczy — albo rzeczywiście był niezły, albo miał świetnego agenta prasowego. A może miał po prostu magnetyzującą osobowość? n(n+ 1 (i-5) S r, = Dobrze, mamy więc rozwiązanie Ln , 2 l2 ± ! ! + 1, ( 1 .6 ) Jako eksperci moglibyśmy być zadowoleni z uzyskanego wyprowadzenia i uznać je za dowód, choć trochę machaliśmy rękami przy rozwijaniu i od wracaniu ciągu. Studenci matematyki powinni jednak móc sprostać wyższym wymaganiom; nie jest więc złym pomysłem przedstawić precyzyjny dowód przez indukcję. Kluczowym przejściem indukcyjnym jest Ln = Ln_i + n = ( j { n - l ) n + 1) + n = j n { n + 1) + 1 . W tym momencie bez wątpienia mamy już postać zwartą ( 1 .6 ). Od pewnego czasu mówimy o postaciach zwartych bez precyzowania, co to takiego. Zwykle wiadomo, o jaką postać chodzi. Rekurencje takie jak ( 1 . 1 ) czy ( 1 .4 ) nie są w postaci zwartej — wyrażają pewną wielkość odwołując się Bogiem a prawdą Gauss jest często nazywany największym matematykiem wszechczasów. Dobrze jest więc zrozumieć przynajmniej jedno z jego odkryć. W końcu rt! może być całkiem sensownie przybliżane wzorem Stirlinga, w którym występują tylko „ przyzwoite” operacje, o czym później w tej książce. Czy „nieskończona litera V” jest pojęciem ścisłym? do niej samej. Z kolei rozwiązania takie jak ( 1 .2 ) lub ( 1 .6 ) są zwarte. Sumy typu 1 + 2 H------- b tl nie są w postaci zwartej — oszustwa dokonuje się przez użycie notacji ‘ ’— za to wyrażenia typu n (n -b 1 ) / 2 mają postać zwartą. Zgrubna definicja mogłaby wyglądać następująco: Wyrażenie na wartość f (n) jest w postaci zwartej, jeśli możemy je wyliczyć stosując skończoną, nieza leżną od n, liczbę „dobrze znanych” działań standardowych. Na przykład, 2n — 1 i n ( n + l ) / 2 są w postaci zwartej, gdyż wykorzystują i to w jawny sposób jedynie dodawanie, odejmowanie, mnożenie, dzielenie i potęgowanie. Liczba wszystkich prostych postaci zwartych jest ograniczona. Na do miar złego istnieją rekurencje nie mające zwartych odpowiedników. Kiedy takie rekurencje napotykamy odpowiednio często, uzupełniamy arsenał pod stawowych operacji; manewr ten zwiększa wydatnie zakres problemów mają cych swe rozwiązanie w „prostych” postaciach zwartych. Przykładem takiej operacji jest iloczyn początkowych rt liczb naturalnych, n!, który okazał się tak ważny, że obecnie uznajemy go za operację podstawową. Przyjmujemy więc, że wzór n! jest w postaci zwartej, choć jego odpowiednik ‘ 1 *2 *... -n* nie jest. A teraz, króciutko, pewien wariant problemu prostych na płaszczyźnie. Załóżmy, że zamiast prostych mamy załamane linie tworzące coś w rodzaju nieskończonej litery V. Jaka jest maksymalna liczba Vn obszarów możliwych do uzyskania przez ułożenie takich n nieskończonych V na płaszczyźnie? Spodziewamy się, że Vn powinno być tak ze dwa-trzy razy większe od Ln . Zobaczmy: Zi = 2 . . . oraz chwili zamyślenia . . . Z2 = 7 Przyjrzawszy się tym drobnym przypadkom, po chwili namysłu zauwa żamy, że zagięte linie przypominają parę przecinających się prostych, z tym że niektóre obszary zlewają się po tej stronie, po której „podwójne” proste nie przedłużają się poza punkt spotkania. 4 1.3. P ro b lem Józefa F law iu sza i Obszary 2 , 3 i 4, które byłyby rozłączne w przypadku dwóch prostych, stają się jednym obszarem, jeśli dopuścimy załamanie jednej prostej. Tracimy więc 2 obszary. Niemniej jednak, zawsze tak możemy przesunąć to załamanie, żeby punkt załamania leżał „poza” rejonem przecięć z innymi prostymi; w tym przypadku te 2 obszary to będzie wszystko, co stracimy. Ubędą nam zatem tylko dwa obszary dla każdej załamanej prostej. Mamy więc Z n = I_2 n — 2n = 2 n ( 2 n + 1 ) / 2 + 1 — 2n = 2u2 —n + 1 , W ćwiczeniu 18 znajdziecie dalsze szczegóły. (i-7) Porównując zwarte postacie wzorów ( 1 .6 ) i ( 1 .7 ), dochodzimy do wniosku, że dla dużych n mamy Ln ~ 5u2 , Zn - 2n2 ; dostajemy więc 4 razy tyle obszarów w przypadku linii załamanych, niż w przypadku normalnych prostych. W późniejszych rozdziałach dokładnie omó wimy, jak analizować przybliżone zachowanie się funkcji całkowitoliczbowych dla dużych n. (Symbol *~ł zdefiniowany jest w rozdziale 9.1.) 1.3. P rob lem Józefa Flaw iusza Ostatni z wprowadzających przykładów będzie wariantem starożytnego pro blemu nazwanego tak od znanego historyka pierwszego wieku naszej ery Jó zefa Flawiusza. Legenda głosi, że Flawiusz nie byłby dziś znany, gdyby nie jego talent matematyczny. W trakcie wojny rzymsko-żydowskiej został wraz z grupą 41 żydowskich powstańców otoczony przez Rzymian w jaskini. Wo ląc samobójstwo od pojmania, powstańcy zdecydowali się utworzyć krąg i zabijać co trzecią osobę, aż nikt nie pozostanie przy życiu. Flawiusz jednak wraz ze swoim przyjacielem nie zgadzał się na to nonsensowne samobójstwo i szybko wyliczył, gdzie on i jego przyjaciel powinni stanąć w kręgu, aby uniknąć śmierci. W naszej wersji załóżmy, że mamy n ludzi ponumerowanych od 1 do n ustawionych w kręgu. Eliminować będziemy co drugą osobę, aż pozostanie tylko jeden człowiek żywy. Niech na przykład początkowa konfiguracja dla u = 10 wygląda następująco: r v ' 'I (Ahrens [6, tom 2] oraz Herstein i Kaplansky [187] omawiają interesującą historię tego problemu. Sam Flawiusz jest zbyt pobieżny [197].) . . . dając nam tym samym szansę usłyszenia tej historii. Oto mamy przypadek, gdzie n = 0 nie ma sensu. Nawet zły strzał ma swoją wartość: pozwala nam wciągnąć się w problem. Tu leży pies pogrzebany. Mamy przecież ] [ 2 n ) = nowaliczba[]{n)), przy czym nowaliczba(k) = 2 k —1 . Porządek eliminowania jest taki: 2, 4, 6 , 8 , 10, 3, 7, 1, 9, tak więc numer 5 przeżywa. Nasz problem polega teraz ogólnie na wyliczeniu przeżywającego numeru J(n ). Wiemy już, że J( 10) = 5 . Pierwszy pomysł: J(rt) = n /2 dla parzystych n; przypadek n = 2 zgadza się: J(2) = 1. Kilka następnych wartości jest już jednak innych — hipoteza upada dla n = 4 i n = 6 . rt 1 2 J(n) 1 1 3 3 4 5 6 1 3 5 Przyjrzyjmy się tym wartościom i spróbujmy lepiej strzelić. Hmmm . . . wy gląda na to, że J(n) zawsze jest nieparzyste. Faktycznie, są po temu powody: Pierwsza runda wokół okręgu eliminuje wszystkie numery parzyste. Co wię cej, jeśli n jest liczbą parzystą, to dochodzimy po niej do sytuacji podobnej, tyle że mamy do czynienia z połową ludzi, a ich numery się tylko trochę zmieniły. Załóżmy więc, że zaczęliśmy z 2n osobami. Po pierwszej rundzie wokół okręgu zostaniemy z i kolejny obrót zaczniemy od numeru 3. Mamy sytuację taką, jak gdybyśmy zaczęli z n osobami, których numery zostały podwojone i zmniejszone o 1 . Mamy więc, J(2n) = 2J(n) — 1 , dlau^l. Możemy teraz od razu przejść do dużych rt. Jeżeli, na przykład, J(10) = 5, to J(20) = 2J(10) — 1 = 2 - 5 - 1 = 9. Podobnie, J(40) = 17, i teraz już możemy stąd wywnioskować, że J(5 • 2m) = 2m+1 + 1. Jak w takim razie będzie to wyglądało z liczbami nieparzystymi? W przy padku 2 rt + 1 osób widać, że osoba o numerze 1 odpada zaraz po osobie o numerze 2 n i zostajemy wtedy z 2n + 1 3 2n — 1 5 7 9 Znowu otrzymaliśmy tak jakby n osób, lecz tym razem ich numery są po dwojone i powiększone o 1. W związku z tym J(2n + 1) = 2J(n) + 1 , dla u ^ 1. Łącząc te dwa równania z J(1) = 1 otrzymujemy rekurencję obejmującą wszystkie przypadki: 1( 1) = 1 ; J(2tl) = 2 J(n) — 1 , dla n ^ 1; J(2n + 1) = 2J(n) + 1 , dlari^l. (1 .8 ) Tym razem nasza rekurencja jest bardziej „wydajna”, ponieważ za każdym razem, gdy korzystamy z tej rekurencji, zamiast otrzymywania J(n) z J(tl—1) mamy mniej więcej dwukrotne zmniejszenie argumentu n. Możemy zatem ob liczyć np. J(1000000) za pomocą zaledwie 19 kroków wynikających z ( 1 .8 ). Wciąż jednak brakuje nam postaci zwartej; dawałoby to szybszą metodę wy liczania J(n), a ponadto byłoby bardziej pouczające. W końcu posiadanie postaci zwartej może być często na wagę życia i śmierci. Otrzymana rekurencja pozwala na szybkie skonstruowanie tabeli małych wartości. Być może pozwoli nam to uchwycić regułę i w rezultacie zgadnąć odpowiedź. n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 J(n) 1 1 3 1 3 5 7 1 3 5 7 9 11 13 15 16 1 Voila\ Wygląda na to, że możemy zgrupować wartości według kolejnych potęg dwójki (zaznaczonych pionowymi przegrodami w tabeli). J(n) jest zawsze jedynką na początku grupy, a wewnątrz grupy zwiększa się o 2. Jeśli więc przedstawimy n w postaci n = 2 m + l, gdzie 2 m jest największą potęgą dwójki nie przekraczającą n, a l jest tym co zostaje, to rozwiązaniem naszej rekurencji będzie J(2m + 1) = 21 + 1 , (Warto zauważyć, że jeśli 2m ^ n < 2m+1, to reszta l = n — 2m spełnia zależność 0 ^ l < 2m+1 —2 m = 2 m.) Pozostało zatem udowodnić równanie ( 1.9 ). Tak jak dotychczas, użyjemy indukcji, ale tym razem indukcji ze względu na m. Gdy m = 0, wówczas musi być 1 = 0, więc baza ( 1 .9 ) sprowadza się do J(1) = 1, co jest prawdą. Krok indukcyjny składa się z dwóch części, zależnie od tego, czy liczba l jest parzysta, czy nieparzysta. Jeśli m > 0, a przy tym 2m + l = 2n, to l jest parzysta i J(2m + l) = 2J(2m- ' + l / 2 ) - 1 =2(21/2 + 1) - i metoda! Kluczowe jest zauważenie, że J(2m )= 1 dla wszystkich m , a to wynika bezpośrednio z pierwszego równania, J(2n ) = 2 J (n }- 1. Wiemy więc, że osoba nr 1 przeżyje, gdy n jest potęgą dwójki. Ogólnie jeśli tylko n = 2m + l, to liczba ludzi redukuje się do potęgi dwójki po l egzekucjach. W tym momencie osobą numer 1 , czyli uratowaną jest ktoś, kto stał na początku na pozycji 21 + 1. =21+1, ze względu na ( 1.8 ) oraz na założenie indukcyjne; jest to dokładnie to, czego nam potrzeba. Podobny manewr stosujemy i w przypadku nieparzystym, kiedy 2m + 1 = 2ri + 1. Można było też zauważyć, że z równania ( 1.8) wynika wzór J (2 n + 1 )-J (2 n ) = 2. Tak czy owak, indukcja została zakończona i równanie ( 1.9 ) jest udowod nione. Aby zilustrować postać rozwiązania ( 1 .9 ), obliczmy J(100). W tym przy padku mamy 100 = 2 6 + 36, więc J(100) = 2 - 3 6 + 1 = 73. Teraz, kiedy mamy już za sobą tę harówkę (rozwiązanie problemu), mo żemy sobie pozwolić na trochę luzu. Każde rozwiązanie problemu może być uogólnione tak, żeby zastosować je do szerszej klasy problemów. Gdy tylko poznamy metodę, warto jest przyjrzeć się jej z bliska i zobaczyć, do jakiego stopnia możemy ją wykorzystać. W pozostałej części rozdziału zbadamy roz wiązanie ( 1.9 ) oraz uogólnimy strukturę, która związana jest z rozwiązaniem tego typu problemów. Potęgi dwójki odegrały ważną rolę przy znalezieniu rozwiązania, natu ralne jest zatem przebadanie rozwinięcia dwójkowego n oraz J(n). Załóżmy, że n w układzie dwójkowym ma następujące przedstawienie: n = (bm b m—1 • bi b0); czyli n = bm2m + b m—1 >m—1 • + b i 2 + bo , gdzie każde bt jest albo 0 , albo 1, przy czym najbardziej znaczący bit b-, jest równy 1. Pamiętając, że n = 2m + 1, otrzymujemy kolejno n = ( 1 b m_ i b m_ 2 . . . b i b 0 )2 > l = (0 bm_i b m_ 2 .. .b i b 0)2 , 1.3. JProb lem J ó z e fa F law iusza j 21 = (bm_i b m _ 2 . . . bi b 0 0 ) 2 , 21+1 = (bm_i bm_ 2 . . . b i b 0 1 ) 2 , J(n) = (bm_-| b m _ 2 . . . bi b 0 b m ) 2 . Ostatni krok wynika stąd, że J ( n ) = 21+ 1, a przy tym bm = 1. Pokazaliśmy zatem, że J(( bm bra—1 • • • bi b o)2) — ( bm—1 • • • bi bo b m ); ( 1 .1 0 ) co w żargonie informatycznym można wyrazić jako cykliczne przesunięcie o bit w lewo — to wystarcza, aby z rt otrzymać J(n)! Magia. Na przykład jeśli n = 10 0 = ( 1 1 0 0 1 0 0 )2 , to J(n) = J((1100100)2) = ( 1 0 0 1 0 0 1 )2, co jest równe 64 + 8 + 1 = 73. Gdybyśmy używali na co dzień notacji binarnej, zauważylibyśmy zapewne tę zależność natychmiast! Zaczynając od rt i iterując m + 1 razy funkcję J, wykonujemy m + 1 jednobitowych przesunięć cyklicznych. Skoro rt jest liczbą (m + 1)-bitową, moglibyśmy się spodziewać, że w końcu powrócimy do rt. Tak jednak oczy wiście nie jest. Weźmy np. rt = 13. Mamy wtedy j((l 1 0 1 )2 ) = ( 1 0 1 1 )2 , ale J(( 1 0 1 1 ) 2 ) = ( 1 1 1 ) 2 i proces przesuwania załamuje się: zero znika, gdy tylko stanie się najbardziej znaczącym bitem. W rzeczywistości J(rt) musi być za wsze mniejsze lub równe n z definicji; jest w końcu numerem przeżywającej osoby. Jeśli więc tylko J(rt) < rt, to nigdy nie będziemy już w stanie wrócić do n iterując J. Powtarzane stosowanie J tworzy malejący ciąg wartości, który w końcu stabilizuje się na pewnym „punkcie stałym”, dla którego J(rt) = n. Własność cyklicznego przesunięcia ułatwia nam zgadnięcie, co będzie takim punktem stałym: iterowanie funkcji odpowiednią liczbę razy zawsze zakończy się na wzorcu złożonym z samych jedynek o wartości 2 — 1 , gdzie ~v(n) jest liczbą jedynek w przedstawieniu dwójkowym liczby n. Skoro ^(13) = 3, więc otrzymamy 2 lub więcej J-ów J 0 U I(1 3 )...)) = 23 - 1 = 7. Podobnie 8 lub więcej jauj((101101101101011)2)...)) = 210 —1 = 1023. Dziwne, ale prawdziwe. Wróćmy do naszej pierwszej hipotezy, że J(n) = n /2 , gdy n jest parzyste. Rzecz jasna, nie jest ona prawdziwa w ogólności, ale możemy teraz dokładnie („Iteracja” oznacza tu zastosowanie funkcji do siebie.) Ciekawe, że jeśli M jest zwartą C°° n-rozmaitością ( n > ]) , to istnieje różniczkowalne zanurzenie M W R 2 n -v (n ) _ ale niekoniecznie W . Zastanawia mnie, czy Flawiusz był kryptotopologiem. określić, kiedy jest prawdziwa: J(n) = n / 2 , 21 + 1 = (2m + l)/2 , l = j ( 2 m —2 ). Jeżeli zatem liczba l = 5 (2 ™ — 2) jest całkowita, to n = 2m + l będzie rozwiązaniem, gdyż l będzie mniejsze niż 2m. Nietrudno zauważyć, że liczba 2 m — 2 jest wielokrotnością 3 wówczas, gdy m jest nieparzyste, natomiast nie jest wielokrotnością 3 wówczas, gdy m jest parzyste (tego typu zależno ściami zajmiemy się w rozdziale 4). Otrzymaliśmy zatem nieskończenie wiele rozwiązań równania J(n) = ri/2, których kilka początkowych przedstawia się następująco: m Wygląda mi to na grekę! l n = 2m + 1 J(u) = 21 + 1 = n / 2 n (dwójkowo) 1 0 2 1 10 3 2 10 5 1010 5 10 42 21 101010 7 42 170 85 10101010 •Zobaczmy, jaki wzorzec powstaje w skrajnie prawej kolumnie. Znajdują się tam liczby w przedstawieniu dwójkowym, które ma tę własność, że cykliczne przesunięcie w lewo daje ten sam efekt, co zwykłe przesunięcie w lewo (po łowienie). OK, rozumiemy już funkcję J całkiem dobrze. Następnym krokiem będzie jej uogólnienie. Co by było, gdyby jakiś problem doprowadził nas do reku rencji mniej więcej postaci ( 1.8 ), lecz z innymi stałymi? Wtedy mogłoby się nam tak nie poszczęścić ze zgadnięciem wzoru, ponieważ takie rozwiązanie mogłoby się okazać naprawdę dziwaczne. Rozważmy tę sytuację w ogólności, wprowadzając stałe a, |3 oraz y i próbując znaleźć zwartą postać ogólniejszej rekurencji 1 i f ( 1) = « ; f(2n) = 2f(n) + |3 , dlan^l; f (2n + 1) = 2 f (n) + y , dla n ^ 1. f1-11) (W naszej oryginalnej rekurencji było <x' = 1, p = —1, y = 1.) Zaczynając od f(l) = oc i postępując zgodnie z tym, co robiliśmy dotychczas, możemy ^ '™5™ ™ !ISK 1.3. P ro b lem Józefa F law iu szaj ułożyć sobie następującą tabelkę małych wartości rt: n f(n) 1 oc 2 2oc + 2oc 3 4 5 6 7 8 9 |3 + y 4 oc + 3|3 4oc + 2|3 + y 4 a + |3 + 2y 4 oc + 3y 8oc — |—7 13 Soc + 6(3 + y Wygląda na to, że współczynnik przy oc jest najwyższą potęgą dwójki nie przekraczającą n. Co więcej, w ramach tej samej potęgi dwójki współczynniki przy |3 maleją o 1 do zera, współczynniki zaś przy y rosną o 1 , poczynając od zera. Jeśli więc wyrazimy f (rt) w postaci f(rt) = A(n) oc + B(n)|3 + C (n )y , ( 1 .1 3 ) i wykorzystamy zauważone prawidłowości, to wygląda na to, że A(rt) = 2m ; B (n) = 2 - - 1 - 1 ; ( 1 .1 4 ) ‘ C(n) = l . Jak zwykle, przyjmujemy tu, że n = 2m + l oraz 0 ^ l < 2m, dla n ^ 1. Nie jest tak trudno udowodnić przejście z ( 1 . 1 3 ) do ( 1 . 1 4 ) za pomocą indukcji, ale rachunki są zagmatwane i techniczne. Na szczęście mamy lepszą metodę postępowania przez wybranie odpowiednich wartości i lekką nimi manipulację. Zilustrujmy to przy założeniu, że oc = 1, |3 = y = 0, czyli f (n) ma być równe A(n). Rekurencją ( 1 . 1 1 ) przybiera teraz postać A(1) = 1; A(2n) = 2 A ( n ) , dla n is 1; A(2n + 1) = 2 A ( n ) , dla n ^ 1. Bez trudu można pokazać, przez indukcję ze względu na m, że A(2m + 1) = 2yn. Podejdźmy teraz do rekurencji ( 1 . 1 1 ) oraz rozwiązania równania ( 1 . 1 3 ) z drugiej strony. Zacznijmy od jakiejś prostej funkcji f (rt) i sprawdźmy, czy Trzymajcie się mocno krzeseł. Ten kawałek, to zupełna nowość! Fajny pomysł! istnieją stałe (a, |3,y), które mogą ją określić. Po podstawieniu do równania. ( 1. 11) funkcji stałej f(n) = 1 uzyskamy 1 = oc; 1 = 2-1 + P; 1 = 2-1+y; zatem wartości (a,|3,y) = (1,—1, —1) wyznaczone przez te równania będą spełniały A(n) — B(n) — C(n) = f(n) = 1. W podobny sposób możemy spróbować z funkcją f (n) = n: 1 = OC] , 2n = 2 -n 4- (3; 2n + 1 = 2 -n + y. Równania te są spełnione dla każdego n, gdy oc= 1, |3 = 0 oraz y = 1. Nie potrzeba więc nawet indukcji, żeby pokazać, że te parametry odpowiadają funkcji f (n) = n. My ju ż wiem y , że f (n) = n będzie rozwiązaniem w tym przypadku, gdyż rekurencja ( 1 . 11) jednoznacznie określa f (n) dla każdego n. I to już wystarczy! Pokazaliśmy, że funkcje A(tl), B(n) oraz C(n) z równa nia ( 1. 13), które rozwiązują rekurencję ( 1. 11) w ogólności, spełniają równania Uwaga! Autorzy zamiast przedstawić nam systematycznie metodę repertuaru chcą, żebyśmy zrozumieli ją za pomocą przerobienia paru przykładów. Metoda ta działa w przypadku rekurencji, które są „liniowe,” w tym sensie, że ich rozwiązanie wyraża się przez sumę pewnych bazowych funkcji zmiennej n przemnożonych przez stale parametry, tak ja k to jest w ( 1 .13 ). Równanie ( 1 .13 ) stanowi klucz do wszystkiego. A(n) = 2 m , gdzie n = 2 m + 1 i 0 ^ l < 2 m; A (n)-B(n)-C (n) = 1; A(n) + C(n) = n . Nasza hipoteza ( 1. 14) wynika z nich natychmiast, gdyż rozwiązując te równa nia dostajemy właśnie C(n) = n —A(n) = l oraz B(tl) = A(n) — 1 — C(n) = 2m - 1 - l. Podejście to ilustruje zaskakująco użyteczną przy rozwiązywaniu reku rencji metodę repertuaru. Zaczynamy od ustalenia parametrów, dla któ rych znamy rozwiązanie— to daje nam repertuar przypadków specjalnych, które umiemy rozwiązać. Następnie otrzymujemy uogólnienie przez połącze nie przypadków szczególnych. Potrzebujemy tylu niezależnych przypadków szczególnych, ile mamy niezależnych parametrów (w omawianym przykła dzie trzech ze względu na a, |3, i y). Ćwiczenia 16 i 20 dostarczają nam dalszych przykładów stosowania metody repertuaru. Wiemy już, że oryginalna J-rekurencja ma tajemnicze rozwiązanie w sys temie dwójkowym: I((bm bm _i ...bi boh) = (bm -i •••bib0bm )2 , gdzie bm = 1. 1.3. P ro b lem Józefa F law iu sza Czy uogólniona rekurencją Flawiusza też będzie miała podobnie tajemnicze własności? Dlaczegóż by nie? Możemy przepisać uogólnioną rekurencję ( 1 . 1 1 ) jako f ( 1) = <x; f( 2n + j ) = 2 f(n) + dla j = 0 , 1 , i (i 1 5 ) u ^ 1, jeśli tylko przyjmiemy po = |3 oraz (31 = y. Nasza rekurencją zaś rozwija się następująco: f ((bm bm_i . . . bi b oh) =: 2 f ((bm bm_i . . . bi ) 2 ) + |3b0 = 4f ((bm bm_i . . . b 2 k ) + 2|3bl + |3bo — 2 mf ((bm)2 ) + 2 m 1 |3bm_1H------ h2|3b1 +P b 0 — 2moc + 2 m 1 + • • • + 2(3b! + Pb0 • Odejdźmy teraz od notacji dwójkowej i dopuśćmy dowolne cyfry w miejsce zer i jedynek. Z dokonanego wyprowadzenia wynika, że f ( ( ^ m b m _ i . . . b i bo)2) — ( ^ | 3bm_i Pbm„2 • • • Pbi Pbo) 2 • ( lodchodzimy’ = ‘niszczymy’) ( 1 .1 6 ) Świetnie! Wzorzec ten zobaczylibyśmy wcześniej, gdybyśmy nieco inaczej przedstawili sobie tabelę ( 1 . 1 2 ): n f(n) 1 oc 2 2 oc + (3 2oc + y 3 4 5 6 7 Wydaje mi się, że w końcu to złapałem: Przedstawienia dwójkowe A(rt), B(rt) i C(rt) mają 1 na różnych pozycjach. 4 a + 2|3 + (3 4oc + 2|3 + y 4<x + 2y + (3 4 a + 2y + y Na przykład, gdy n = 100 = ( 1 1 0 0 1 0 0 )2 , nasze flawiuszowe wartości oc = 1, (3 = —1 oraz y = 1 pociągają za sobą n= f (n) = = (1 0 (1 0 1 - 1 - 1 +64 +32 -16 -8 = 1 0 0 )2 100 1 -1 -1 )2 +4 -2 -1 = 73 tak jak przedtem. Właściwość cyklicznego przesunięcia wynika z tego, że każdy blok cyfr (10 . . . 00)2 w dwójkowej reprezentacji n przechodzi na ( 1 - 1 . . . - 1 - 1)2 = (0 0 . . . 0 1 )2 . „Mamy dwa rodzaje uogólnień. Są uogólnienia proste i uogólnienia wartościowe. Łatwo jest uogólniać, rozwadniając pomysł dużymi słowami. Znacznie trudniej jest stworzyć dokładny i skondensowany ekstrakt z paru dobrych składników G. Pólya [298] To chyba musiało być okropne szczęście. Wprowadzona zmiana notacji doprowadziła w końcu do zwartego rozwią zania (1.16) ogólnej rekurencji (1.15). Jeżeli to nas nie przeraża, to możemy pójść nawet dalej. Rekurencja f(j) = o j , f(dn + j) = cf(n) + Pj , dla 1 ^ j < d; dla 0 ^ j < d i n^l, 1 ^ jest taka sama, jak poprzednio, z tym że zaczynamy z liczbami zapisanymi przy podstawie d, a w wyniku dostajemy liczby zapisane przy podstawie c. Otrzymujemy zatem rozwiązanie zmieniające podstawę zapisu: f ((b-m. b m _ l . . .b i b o ) d ) — (^ b m P b m _i P b m _2**-I^bi P b o )c • Załóżmy, że przez jakieś niebywałe szczęście dostajemy do rozwiązania taką rekurencję: f ( 1) f( 2 ) —34, = 5, f(3rt) = f(3n+l) = 10f(n) —2 , dlan^l, f(3n + 2) = 10f(n) + 8 , dlan^l, 10f(n)+ 76, dla n ^ 1, i załóżmy, że chcemy obliczyć f(19). Mamy tutaj d = 3 i c = 10. Ze względu na to, że 19 = (201 ) 3, rozwiązanie zmieniające podstawę każe nam zamieniać zapis liczby cyfra po cyfrze z podstawy 3 do podstawy 10. Początkowa dwójka stanie się więc piątką, a 0 i 1 staną się odpowiednio 76 i —2, ostatecznie więc f (19) = f ((201 )3 ) = (5 76 —2) 10 = 1258, Ale tak w ogóle, to jestem przeciwny rekurencjom wojen. Prosimy o robienie wszystkich zadań rozgrzewkowych we wszystkich rozdziałach! Autorzy co stanowi odpowiedź. Józef Flawiusz i wojna rzymsko-żydowska doprowadziły nas w końcu do całkiem ogólnych rekurencji. Ć w iczenia R ozgrzew ka 1 . Wszystkie konie są tego samego koloru. Możemy to udowodnić przez in dukcję ze względu na liczbę koni w rozważanym zbiorze. Oto w jaki sposób: „Jeśli mamy do czynienia z jednym koniem, to ma on ten sam kolor co on sam. Baza więc zachodzi trywialnie. W celu pokazania kroku indukcyjnego załóżmy, że w n-elementowym zbiorze koni są one ponume rowane od 1 do n. Na mocy założenia indukcyjnego konie od 1 do n — 1 mają ten sam kolor, podobnie konie o numerach od 2 do n. Ale środ kowe konie o numerach od 2 do n — 1 nie są kameleonami, więc nie mogą zmieniać koloru, kiedy przyznają się do różnych grup. Zatem konie od 1 do n muszą mieć ten sam kolor, czyli wszystkie n koni jest tego samego koloru; QED.” Co, jeśli cokolwiek, jest błędne w tym rozumowaniu? 2. Znajdź najkrótszą sekwencję ruchów przekładających wieżę u krążków z lewego pręta A na prawy pręt B, jeśli bezpośrednie ruchy między A i B są zabronione. (Każdy ruch musi dotyczyć środkowego pręta. Tak jak poprzednio, większego krążka nie można położyć na mniejszym.) 3 . Pokaż, że podczas przenoszenia wieży z ograniczeniami z poprzedniego zadania napotkamy każde dopuszczalne ułożenie krążków na 3 prętach. 4. Czy istnieje początkowa i końcowa konfiguracja n krążków na 3 prętach, tak aby z jednej do drugiej trzeba było wykonać więcej niż 2 n —1 ruchów zgodnie z oryginalnymi zasadami Lucasa? 5. „Diagram Venna” z 3 zachodzącymi na siebie kołami jest często używany dla zilustrowania 8 podzbiorów związanych z 3 danymi zbiorami Czy można zilustrować 16 możliwych podzbiorów związanych z 4 danymi zbiorami za pomocą 4 zachodzących na siebie kół? 6 . Niektóre obszary określone przez n prostych na płaszczyźnie są nieskoń czone, podczas gdy inne są ograniczone. Jaka jest maksymalna liczba obszarów ograniczonych? 7. Niech H(n) = J(n + 1) — J(rt). Z równania ( 1.8) wynika, że H(2n) = 2 i H (2n+1) = J (2 n + 2 )-J (2 n + l) = ( 2 J ( n + 1 ) - l ) - ;(2 J (n )+ l) = 2 H (n )-2 , dla wszystkich n ^ 1. Wygląda na to, że przez indukcję ze względu na n można udowodnić, że H(n) = 2 dla wszystkich n. Gdzie tkwi błąd? Ć w iczen ia d om ow e 8 . Rozwiąż rekurencję Qo = <x; Qn = Qi = |3; (1 “1“ Qn—1 ) / Qn—2 , d l a Tl > 1. Załóżmy, że Qn ^ 0 dla każdego n ^ 0. Wskazówka: Q4 = (1 + <x)/p. ... tu mamy tego konia innego koloru. 9. Czasami można użyć indukcji działającej wstecz, dowodząc kroku od rt do n — 1 zamiast na odwrót! Rozważmy na przykład stwierdzenie P(n) : Jest to niewątpliwie prawdą, gdy n = 2, ponieważ (xi + x z ) 2 — 4xi x 2 = (x i - x 2 )2 ^ 0. a) Przyjmując xn = (xi + • • • + xn_i ) / (n — 1), udowodnij, że z P(n) wynika P (rt — 1) dla n > 1. b) Pokaż, że z P(rt) i P(2) wynika P(2n). c) Objaśnij, dlaczego wystarcza to do pokazania prawdziwości P(n) dla każdego n. 1 0 .Niech Qn będzie minimalną liczbą ruchów konieczną do przełożenia wieży złożonej z n krążków z A na B przy założeniu, że wszystkie ruchy należy wykonywać zgodnie ze wskazówkami zegara — czyli z A na B, z B na trzeci pręt oraz z trzeciego pręta na A. Niech Rn będzie minimalną liczbą ruchów potrzebną, aby przy tych samych ograniczeniach przenieść krążki z powrotem z B na A. Pokaż, że 0, Qn + Qn--| + 1 , gdy n = 0 ; gdy n > 0 . (Nie potrzebujesz rozwiązywać tych rekurencji; nauczymy się to robić w rozdziale 7.) 11. Podwójna wieża z Hanoi składa się z 2n krążków n różnych rozmiarów, po 2 krążki każdego rozmiaru. Jak zwykle, wymagamy, aby przenosić w jednym ruchu jeden krążek i nie kłaść większego na mniejszym. a) Ile ruchów trzeba co najmniej wykonać, aby przenieść wieżę z jednego pręta na drugi, jeśli krążki równej wielkości są nierozróżnialne? b) Co by było, gdybyśmy zażądali odtworzenia oryginalnego ułożenia krążków? ( Wskazówka: To jest rzeczywiście trudne, na dobrą sprawę powinno się znaleźć w następnej grupie problemów.) 1 2 . Uogólnijmy nieco ćwiczenie l l a zakładając, że mamy n różnych rozmia rów krążków i że mamy m * krążków rozmiaru k. Oblicz minimalną liczbę ruchów A ( m i , . . . , m n ), potrzebnych do przeniesienia wieży, kiedy nie rozróżniamy krążków tego samego rodzaju. 13. Jaka jest największa liczba obszarów wydzielonych przez rt zygzaków, gdzie każdy zygzak składa się z dwóch równoległych półprostych połą czonych odcinkiem? 14. Ile kawałków sera można uzyskać z pojedynczego grubego kawałka za pomocą 5 cięć? (Ser musi być utrzymany na swoim miejscu w czasie, gdy dokonywane są cięcia i każde cięcie musi odpowiadać pewnej płaszczyźnie w przestrzeni 3-wymiarowej.) Znajdź rekurencję dla Pn., maksymalnej liczby 3-wymiarowych obszarów określonych przez rt różnych płaszczyzn. 15. Flawiusz miał przyjaciela, który został uratowany, gdy był na przedostat niej pozycji. Ile wynosi I(rt), numer przedostatniej pozycji, gdy co druga osoba jest eliminowana? 16. Za pomocą metody repertuaru rozwiąż 4-parametrową ogólną rekurencję Powodzenia w utrzymaniu sera na swoim miejscu! g(i) = <*; g(2rt + j) = 3 g ( r t ) + y r t + P j , dlaj=0,1 i rt^l. Wskazówka: Spróbuj wykorzystać funkcję g (n) = rt. Z adania egzam in acyjn e 17. Niech W n będzie minimalną liczbą ruchów koniecznych do przeniesienia wieży złożonej z rt krążków, przy założeniu że mamy łącznie 4 pręty zamiast 3. Pokaż, że W n(n+ 1)/2 ^ 2W n (n_ !)/2 + Ttl , dla U > 0. (Tn = 2n — 1 jest określone jak w klasycznym przypadku 3 prętów.) Korzystając z tej rekurencji znajdź zwartą postać funkcji f(n) takiej, że Wn (n+i ) / 2 ^ f (tl) dla wszystkich rt ^ 0 . 18. Pokaż, że następujący zbiór rt załamanych linii wyznacza Zn obszarów, gdzie Zu zdefiniowane jest jak we wzorze ( 1.7 ): j-ta linia załamana dla 1 ^ j ^ rt ma swój wierzchołek w {n 2 \ 0 ) i przechodzi przez punkty (n2>- n > , 1) i (n2> -rt* - n - n ,l). 19. Czy można otrzymać Zn obszarów za pomocą rt załamanych linii, gdy wszystkie kąty przy załamaniach są równe 30°? 20. Korzystając z metody repertuaru rozwiąż poniższą 5-parametrową reku rencję: h(1) = oc; h(2n + j) = 4 H (rt)+ y jn + P j, dla j = 0,1 i rt^l. Wskazówka: Spróbuj wykorzystać funkcje H(n) = rt i H(n) = rt2. 2 1 . Załóżmy, że w kręgu stoi 2n osób. Pierwsze rt stanowią „dobrzy”, a drugie rt— „źli”. Pokaż, że zawsze można dobrać liczbę naturalną m (zależną od rt) tak, aby przy eliminowaniu co m-tej osoby wszystkie złe osoby zostały Czy to rodzaj pięciogwiazdkowej ogólnej rekurencji? wyeliminowane jako pierwsze. (Dla przykładu, gdy rt = 3, wówczas m = 5, gdy n = 5, wówczas m = 30.) Zadania d odatkow e 2 2 . Pokaż, że można skonstruować diagram Venna dla każdej z 2n kombina cji danych rt zbiorów za pomocą n wypukłych wielokątów powstających przez obroty jednego z nich wokół pewnego środka. 23. Załóżmy, że Flawiusz spostrzegł, że znajduje się na pozycji j, ale ma możliwość wybrania parametru eliminacji q, tak aby co q-ta osoba była eliminowana. Czy zawsze może się uratować? P ro b lem y badaw cze 24. Znajdź wszystkie rekurencje postaci yr _ n _ Tak, i moje gratulacje, jeśli taki zbiór znajdziesz! 1 + aiXn_i H--- h akXn-Tc b!Xn_i + . . . + b kXn_ k ’ których rozwiązania są okresowe niezależnie od początkowych wartości Xo, . . . , Xic_i. 25. Rozwiąż problem wież z Hanoi z 4 prętami przez pokazanie, że we wzorze w zadaniu 17 zachodzi równość. 26. Uogólniając zadanie 23, załóżmy, że podzbiór Flawiusza (albo „zbiór flawiuszowy”) zbioru {1 , 2 , . . . , rt} to zbiór takich k liczb, że dla pewnego q osoby spoza tego zbioru zostaną wyeliminowane jako pierwsze. (To są te k pozycji „dobrych osób”, które Flawiusz chce uratować.) Okazuje się, że dla rt = 9 trzy spośród 2 9 możliwych podzbiorów są nieflawiuszowe, a mianowicie { 1, 2, 5, 8 ,9}, {2 , 3 , 4 , 5 , 8} i { 2 ,5 , 6 ,7 , 8}. Dla n = 12 mamy 13 zbiorów niefławiuszowych. Co ciekawsze, są to jedyne nieflawiuszowe podzbiory dla n ^ 12. Czy zbiory nieflawiuszowe są rzadkie dla dużych n? Sumy występują w całej matematyce, musimy więc mieć podstawowe na rzędzia do radzenia sobie z nimi. W tym rozdziale wprowadzamy notację i przedstawiamy ogólne techniki, które sprawiają, że sumy stają się bardziej przyjazne. 2.1. N o ta cja W rozdziale 1 napotkaliśmy sumę początkowych rt liczb naturalnych, którą oznaczyliśmy przez 1 + 2 + 3 H------ b (n — 1) + n. Notacja ‘ ’ w takich wzo rach nakazuje nam wypełnić kropki liczbami zgodnymi z wzorcem ustalonym przez okalające elementy. Oczywiście musimy uważać z sumami takimi, jak 1 + 7 H-------b 41,7, których znaczenie jest niejasne ze względu na zbyt ubogi opis. Z drugiej strony, obecność elementów takich jak 3 i (n — 1) jest lekką przesadą; wzprzec zapewne byłby jasny również wtedy, gdybyśmy napisali 1 + 2-1-------b n. Z czasem ośmielimy się pisać wręcz 1 H-------bn. Będziemy mieli do czynienia z sumami ogólnej postaci cii + a.2 + • • • + clu , (2.1) gdzie każde z a k jest liczbą, która została jakoś określona. Notacja ta ma tę zaletę, że przy odrobinie wyobraźni możemy „ujrzeć” całą sumę tak, jak gdyby została napisana w całości. Każdy element a k sumy będziemy nazywali w yrazem lub składnikiem. Wyrazy podane w odpowiedniej liczbie zwykle powinny układać się w łatwo przyswajalny wzorzec i dlatego jesteśmy zmuszeni niekiedy wypisać je w postaci bardziej skomplikowanej, tak aby ogólne znaczenie stało się jasne. Jeśli na przykład wyrażenie 1 + 2 + -----b 2 n _ 1 ma przedstawiać sumę n składników, a nie 2 n_1, to powinniśmy zapisać je precyzyjniej jako 2 ° + 2 ' + -----b 2 n_1. „Le signe indiąue que Fon doit donner au nombre entier i toutes ses valeurs 1, 2, 3, ..., et prendre la somme des termes.” J. Fourier [127] Moment! Nie chciałbym używać a lub n na określenie zmiennej indeksowej zamiast k w (2 .2); te litery są „zmiennymi wolnymi”, które mają w tym przypadku znaczenie poza • Notacja wielokropkowa ma wiele zastosowań, ale czasem bywa niejedno znaczna i jest nieco przegadana. Dostępne są inne możliwości, w szczególności notacja n (2.2) k=1 nazywana notacją Sigma, ze względu na grecką literę Y. (duże sigma). No tacja ta każe włączyć do sumy dokładnie te wyrazy a^, których indeks k jest liczbą całkowitą zawierającą się pomiędzy 1 a rt włącznie. Wyrażając to słowami, „sumujemy względem k od 1 do rt.” Joseph Fourier wprowadził tę notację sumy oznaczonej w roku 1820 i wkrótce została ona powszechnie przyjęta w świecie matematycznym. Zmienna indeksowa k nazywana jest zmienną związaną ze znakiem sumy Y_ w (2.2), ponieważ k w ą jest oderwane od czegokolwiek, co znajduje się poza sumą. Każda inna litera mogłaby tutaj pełnić rolę k bez wpływu na wartość (2.2). Litera i jest też często używana (być może jako zaczynająca słowo „indeks” sumy), ale będziemy przede wszystkim używali k, zachowując i na oznaczenie \ f —\. Okazuje się, że uogólniona notacja Sigma jest nawet bardziej użyteczna niż jej forma oznaczona. W celu określenia zakresu indeksów, które zmienna k może przyjąć, możemy, po prostu napisać jeden lub więcej warunków pod znakiem Sumy w przypadku (2.1) i (2.2) można zapisać także jako <*k . (2-3) I^ k ^ n W tym konkretnym przypadku nie ma dużej różnicy między nową notacją i notacją (2.2), ale postać uogólniona pozwala nam rozważać sumy wzglę dem zbiorów indeksów niekoniecznie będących kolejnymi liczbami całkowi tymi. Możemy na przykład wyrazić sumę kwadratów wszystkich nieparzy stych liczb naturalnych mniejszych niż 100 w następujący sposób: L l^ k c lO O k nieparzyste *2 - Oznaczona postać tej sumy 49 2k + n 2 k=0 wygląda dziwacznie i jest mniej przejrzysta. Podobnie, suma odwrotności wszystkich liczb pierwszych pomiędzy 1 a N przedstawia się następująco: p pierwsza postać oznaczona zaś wymagałaby zastosowania notacji gdzie pic oznacza k-tą liczbę pierwszą, a tt(N) jest liczbą liczb pierwszych nie przekraczających N. (Ciekawe, że suma ta daje przybliżoną średnią liczbę dzielników pierwszych losowej liczby bliskiej N, gdyż około 1/p spośród tych liczb dzieli się przez p. Wartość tej sumy dla dużych N wynosi około l nl nN + M, gdzie M w 0,2614972128476427837554268386086958590515666 jest stałą Mertensa [271]; ln x oznacza logarytm naturalny z x, a ln ln x ozna cza ln(lnx).) Największą zaletą uogólnionej notacji Sigma jest to, że jest ona wygod niejsza przy przekształcaniu niż postać oznaczona. Przypuśćmy, że chcemy na przykład zmienić zmienną indeksową k na k + 1. W postaci uogólnionej mamy ^ ak = Y i Qk+i ; l^k^n 1^k+1^n i łatwo jest dostrzec, o co chodzi; możemy dokonywać podstawień niemal w ciemno. Natomiast w postaci oznaczonej mamy n n —1 i nie jest tak łatwo dostrzec, co się stało, a ponadto możemy łatwiej popełnić błąd. Z drugiej strony postać oznaczona nie jest znowu tak zupełnie bezuży teczna. Jest ładna i zgrabna, możemy ją zapisać szybko, gdyż ( 2 .2) ma 7 symboli, podczas gdy ( 2 .3 ) ma ich 8 . W związku z tym będziemy używali często Y. z dolnymi i górnymi ograniczeniami przy określaniu problemu lub przedstawianiu wyniku, natomiast w trakcie przekształcania sum, których zmienne indeksowe podlegają zmianom, będzie nam łatwiej pracować z rela cjami umieszczonymi pod To jeszcze nic. Zobaczcie, ile razy H występuje w Iliadzie! Znak Y. występuje ponad 1000 razy w tej książce, więc chcemy być pewni, że dokładnie wiemy, o czym mówimy. Formalnie będziemy pisali Y . ak ( 2 '4) p(k) jako skrót na sumę wszystkich wyrazów a k takich, że k jest liczbą całkowitą spełniającą pewną własność P(k). (Własność P(k) jest dowolnym zdaniem o k, które może być albo prawdziwe, albo fałszywe.) Na razie założymy, że tylko dla skończenie wielu liczb całkowitych k spełniających P(k) zachodzi ak 7^ 0 ; w przeciwnym razie bylibyśmy zmuszeni dodać nieskończenie wiele liczb niezerowych i musielibyśmy być ostrożniejsi. Z drugiej strony, jeśli P(k) jest fałszywe dla każdego k, to mamy do czynienia z sumą „pustą”, a wartość pustej sumy definiujemy jako zero. Wewnątrz akapitu będziemy używali nieco zmienionej wersji ( 2 .4 ): pi sząc T P(k) dic’, umieścimy własność P(k) jako indeks w taki sposób, żeby wzór nie rozpychał zanadto wiersza. Podobnie, zapis ‘X k = i a k* jes^ dobrym pomysłem na ( 2 .2), gdy chcemy zmieścić taką notację w jednym wierszu. Często nas korci, aby napisać rt—1 rt k(k — 1) (n —k) k = 2 Hej! Delta Kroneckera, którą widziałem ju ż w innych książkach (mam na myśli 6icn,równa 1,jeśli k = n, a 0 w przeciwnym razie), jest szczególnym przypadkiem konwencji Iversona: możemy po prostu napisać [k = n]. zamiast k(k — 1) (rt —k ) , k = 0 gdyż wyrazy dla k = 0, 1 i u w tym wzorze są zerami. Może to się nam wydać bardziej ekonomiczne, żeby zamiast rt + 1 składników dodać rt — 2 składniki. Takie kuszące uproszczenia powinny być jednak odrzucane; efek tywność obliczeń to nie to samo, co efektywność zrozumienia! Przekonamy się, że utrzymywanie możliwie prostej postaci dolnych i górnych ograniczeń powoduje, że sumy mogą być przekształcane łatwiej. W rzeczywistości postać m°że być niebezpiecznie dwuznaczna, ponieważ jejznaczenie nie jest jasne dla n = 0 lub rt = 1 (zob. ćwiczenie 1). Składniki zerowe niepowodują szkód, a często ułatwiają nam znacznie zadanie. Jak dotąd, przedstawione notacje były dość standardowe, ale teraz do konamy radykalnego odejścia od tradycji. Kenneth E. Iverson w stworzonym przez siebie języku programowania APL [191, str. 11; zob. także 220] wpadł na świetny pomysł, i jak się przekonamy, notacja ta wspaniale upraszcza wiele rzeczy, o których będziemy w tej książce pisali. Pomysł polega po prostu na ujęciu zdań logicznych w nawiasy i przyjęciu, że jeżeli zdanie jest prawdziwe, to wartością tego wyrażenia będzie 1, natomiast jeśli zdanie jest fałszywe, to wartością wyrażenia będzie 0. Na przykład [p pierwsza] = ( ’ • ^ P jest Uc^ ą PierWSZą: 1 0 , jeśli p me jest liczbą pierwszą. Konwencja Iversona pozwala nam wyrażać sumy w ogóle bez jakichkolwiek ograniczeń na zmienne indeksowe, ponieważ sumę (2 .4 ) możemy zapisać w postaci 3 £ a k [P(k)]. k (2 .5 ) Jeśli P(k) jest fałszywe, to składnik a.k[P(k)] jest zerem, więc można bez obawy włączyć go do sumy. Znacznie upraszcza to manipulacje na indeksach sumowania, gdyż nie musimy się męczyć z wartościami ograniczającymi. Trzeba tu wspomnieć o drobnym szczególe technicznym: ak niekiedy bywa nie zdefiniowane dla pewnych liczb całkowitych k. Ominiemy tę trud ność przez przyjęcie, że [P(k)] jest „bardzo silnym zerem”; gdy P(k) jest fałszem, wówczas czyni z a k zero nawet wtedy, gdy jest nie zdefiniowane. Jeśli na przykład użyjemy konwencji Iversona do zapisania sumy odwrotności liczb pierwszych nie przekraczających N w taki sposób, „Często zaskakują mnie nowe, ważne zastosowania tej notacji.” B. de Finetti [123] Y [P pierwsza] [p ^ N ]/p , p to nie będzie problemu z dzieleniem przez zero, gdy p = 0 , gdyż przyjęta konwencja gwarantuje, że [0 pierwsza][0 ^ N]/ 0 = 0. Podsumujmy to, co do tej pory powiedzieliśmy o sumach. Istnieją dwa* dobre sposoby wyrażania sumy zadanych wyrazów. Jeden z nich używa no tacji ‘ drugi używa notacji ‘ ’• Postać wielokropkowa często podsuwa użyteczne przekształcenia, w szczególności kombinacje sąsiadujących składni ków. Bywa bowiem tak, że zauważymy upraszczający pomysł dopiero wtedy, gdy zobaczymy przed oczyma całą sumę. Zbyt wiele szczegółów może być jednak denerwujące. Notacja Sigma jest zwarta, robi wrażenie na rodzinie i przyjaciołach, a zarazem podsuwa przekształcenia, których z kolei nie widać w postaci wielokropkowej. Kiedy pracujemy z notacją Sigma, wyrazy zerowe nie są szkodliwe, przeciwnie, zera często upraszczają dokonywane przekształ cenia. 2.2. Sum y i rekurencje_________________________ No dobrze, rozumiemy już, jak wyrazić sumę w zgrabnej notacji. Jak jednak wyliczyć wartość takiej sumy? Jedną z metod jest zauważenie subtelnego związku między sumami i rekurencjami. Suma n = ^ &k k= 0 . . . i masz mniej szans na utratę punktów na egzaminie za „brak precyzji” . (Myśl o Sn nie jako o pojedynczej liczbie, lecz jako o ciągu określonym dla wszystkich jest równoważna rekurencji So = Q° ; Sn = Sn_i + an , / dla rt > 0 . (2 .6 ) rt ^ 0 .) Możemy więc wyliczać wartości sum w postaci zwartej używając metod po znanych w rozdziale 1. Na przykład, jeśli au jest równe stałej plus pewna wielokrotność rt, to odpowiednia rekurencja przybiera następującą ogólną postać: R° = a ; Ru = Rn_i + (3 + yrt, dla n > 0. 2'7 - Postępując jak w rozdziale 1, otrzymujemy, że Ri = oc+ |3+y, R2 = <x+2p+3y, itd. W ogólności rozwiązanie tej rekurencji przedstawia się w postaci Rn = A (rt)a+ B (rt)|3 + C(rt)y , ( 2 .8 ) gdzie A(rt), B(tl) i C(rt) są współczynnikami zależącymi od ogólnych para metrów a, |3 oraz y. Metoda repertuaru każe nam spróbować wykorzystać jako R(tl) w tej rekurencji proste funkcje zmiennej rt w nadziei, że uda się nam znaleźć stałe parametry oc, |3 oraz y w przypadkach, w których rozwiązanie jest szczególnie łatwe. Przyjęcie R^ = 1 wymusza oc = 1, |3 = 0, y = 0, więc A( tl) = 1 . Przyjęcie Rn = rt wymusza oc = 0, |3 = 1, y = 0, więc B(n) = n . Przyjęcie Rn = rt2 wymusza oc = 0, |3 = —1, y = 2; więc 2 C(rt) — B ( t l ) = rt2 , skąd ostatecznie C(rt) = (rt2 + n ) / 2 . Proste jak drut. Jeśli więc chcemy wyliczyć ^ ( a + b k ), k = 0 to odpowiednia rekurencja ( 2 .6 ) sprowadza się do ( 2 .7 ) z o c = | 3 = a, y = b, a rozwiązaniem jej jest aA(rt) + aB(rt) + bC(n) = a(rt + 1) + b(rt + 1)rt/2. Na odwrót, wiele rekurencji można sprowadzić do sum. Specyficzne me tody wyliczania sum, które poznamy w tym rozdziale, pomogą nam rozwią zywać rekurencje, których ruszenie w inny sposób byłoby trudne. Wieża z Hanoi jest taką właśnie rekurencją: T0 = 0 ; Tn = 2Tn_i + 1 , dla rt > 0. Można ją przedstawić w szczególnej postaci ( 2 .6 ) przez podzielenie obu stron przez 2n : To/2° = 0; Tn/ 2 n = Tn_ i / 2 n _ 1 + 1/2n , dla n > 0. Teraz dla Sn = Tn/ 2 n otrzymamy So = 0; Sn = Sn.-! + 2~n , dla n > 0 . Stąd wynika Sn = f_ 2 ~ \ k=1 (Zauważ, że wyraz odpowiadający k = 0 nie został uwzględniony w tej su mie.) Suma ciągu geometrycznego 2 _1 + 2 _ 2 H------ h2-TL = (^)1+ ( ^ ) 2 H------ b (^)n będzie wyprowadzona później w tym rozdziale; jest ona równa 1 —(^)n . A zatem Tn = 2nSn = 2 n — 1 . W powyższym wyprowadzeniu zastąpiliśmy przez Sn na mocy prostej obserwacji, że to równanie rekurencyjne można z powodzeniem podzielić obu stronnie przez 2n . Chwyt ten jest szczególnym przypadkiem ogólnej metody, która pozwala uprościć dowolną rekurencję postaci O-nTn — bnTn —1 H" Cn ( 2 .9 ) do sumy. Pomysł polega na przemnożeniu obu stron przez czynnik sumacyjny sn : Sn ^ n .T u = S n ^ n T n —1 -j- . Czynnik sn jest tak sprytnie dobrany, aby spełnić Srubn — Sn—1 d n —1 W tym przypadku, jeśli uwzględnimy, że Sn = sn anTn, to otrzymamy reku rencję Sn. — Sn—1 H- Sn Cn * Zatem n Sn = ąoapTo + y ~ SkCk rt = sib iT p + k=l s^Ck > k=1 a rozwiązaniem wyjściowej rekurencji ( 2 .9 ) będzie Tn = —-— (sibTTo + ^ s i c C k ) . (Wartość si ma się uprościć, więc może być wszystkim oprócz zera.) ( 2 . 10) Na przykład gdy n = 1, otrzymujemy Ti = (sibiTo + siCi )/si ai = (biTo + Ci ) / a i . Jak jednak znaleźć właściwe sn? Nie ma problemu: wystarczy rozwinąć wzór sn == s n—1ctn—1A>n> aby upewnić się, że iloraz t t n —1Cln- 2 . . . ai Sn = -7- T---------------------------------------------------------------------7— ,(2 .11 ) D n b n -1 (Sortowanie szybkie zostało wymyślone przez Hoare’a w roku 1962 [189].) • • • t> 2 lub jego dowolna wygodna dla nas wielokrotność będzie odpowiednim czynni kiem sumacyjnym. Dla przykładu, w rekurencji wieży z Hanoi mamy an = 1 i bn = 2. Zgodnie z ogólną metodą, którą właśnie wyprowadziliśmy, przeko nujemy się, że sn = 2 _n jest właściwą liczbą, przez którą należy pomnożyć rekurencję wieży z Hanoi, jeśli chcemy ją wyrazić w postaci sumy. Nie po trzeba nam błysku geniuszu, aby dojść do tego czynnika. Jak zwykle trzeba uważać, aby nie dzielić przez zero. Metoda czynnika sumacyjnego działa wówczas, gdy wszystkie a oraz b są różne od zera. Zastosujmy przedstawione pomysły do rozwiązania rekurencji, która po jawia się przy analizie sortowania szybkiego („ąuicksortu”), jednej z najważ niejszych metod sortowania danych w pamięci wewnętrznej. Średnia liczba porównań wykonywanych przez sortowanie szybkie dla n losowych elementów spełnia rekurencję C0 = 0 ; 2 V -1 Cn = n ł l ł - V Ck) n ĆTo dla n > 0. ( 2 . 12) Hm mm. To wygląda znacznie gorzej niż rekurencje, z którymi mieliśmy do tej pory do czynienia. Po prawej stronie znajdujemy tu sumę wszystkich po przednich wartości i dzielenie przez n. Przegląd małych wartości (Ci = 2 , Cz = 5 , C3 = dostarcza nam pewnych danych, ale nie napawa optymi zmem. Możemy jednak uprościć równanie ( 2 . 1 2 ) krok po kroku, pozbywając się najpierw dzielenia, a potem znaku Pomysł polega na przemnożeniu obu stron przez rt, co prowadzi do n —1 riCn = n 2 + n + 2 Ck , dla n > 0; k=0 i teraz zastępując rt przez n — 1 uzyskujemy n-2 (n — 1)Cn_i = ( r t - l ) 2 + ( n - 1 ) + 2 Ck , d lan -l> 0. k=0 Możemy teraz odjąć drugie równanie od pierwszego i znak Y zniknie: riCn — ( u — 1)Cn_i = 2rt + 2Cn_i , dla rt > 1. Okazuje się, że relacja ta zachodzi także dla n = 1, gdyż Ci = 2. Wyjściowa rekurencją uprościła się więc do znacznie prostszej: Co = 0 ; riCn = ( n + 1 ) C n_ i + 2 n , dla n > 0 . Postęp. Doprowadziliśmy wzór do stanu, w którym można zastosować metodę czynnika sumacyjnego; rekurencją jest bowiem postaci ( 2 .9 ) z an = n, bn = rt + 1 i cn = 2tl. Ogólna metoda opisana na poprzedniej stronie wymaga teraz przemnożenia rekurencji obustronnie przez pewną wielokrotność liczby Sn — fln-1 CLn—2 • • • a l bnbn_ - | . . . b 2 (n - 1 ) • (n - 2 ) • . . . • 1 ( n + 1 ) - n * . . . -3 (n + 1)n Zgodnie z równaniem (2 . 1 0 ), rozwiązanie przedstawia się tak: Cn = 2 ( n + 1) £ . k=1 k+1 Suma, która pozostała, jest bardzo podobna do wartości, która często pojawia się w zastosowaniach. Spotykamy ją na tyle często, że nadamy jej specjalną nazwę i notację: H „ = 1 + 1 + .. . + 1 = £ l . 2 n ( 2 1 3) Zaczęliśmy z symbolem Y w rekurencji, pracowaliśmy ciężko, żeby się tego symbolu pozbyć, a teraz, po zastosowaniu czynnika sumacyjnego, znów mamy przed sobą symbol Y • To jak w końcu, czy sumy są dobre, czy złe, czy co? Litera H pochodzi od słowa „harmoniczny”, Hn jest liczbą harm oniczną, zwaną tak ze względu na to, że k-ta harmoniczna wytwarzana przez strunę skrzypcową jest tonem podstawowym wytwarzanym przez strunę o długości równej 1 /k-tej długości struny wyjściowej. Dokończymy teraz rozważania dotyczące rekurencji ( 2 . 1 2 ) sortowania szybkiego przedstawiając Cn w postaci zwartej; wyrazimy Cn za pomocą Hn . Suma w naszym wzorze na Cn wynosi y —— = y — więc bez kłopotu możemy odnieść ją do Hn przez zamianę k na k —1 i zmianę wartości ograniczających: Y— k— + 1 l^k^n = y kl ^k - l ^n - X i 2 ^k^n +1 ( V ^ kj l^k^n 7 1 1 1 n +1 |1 U tl + 1 Świetnie! Znaleźliśmy sumę kończącą poszukiwania rozwiązania równania ( 2 . 1 2 ): Średnia liczba porównań dokonywanych przez sortowanie szybkie na losowych danych równa jest więc Cn = 2(n + 1)Hn —2 n . (2 . 1 4 ) Jak zwykle, sprawdzamy wzór dla małych wartości n: Co = 0, Ci = 2 , C2 = 5. 2.3. P rzek szta łcen ia sum _______________________ Kluczem do sukcesu przy działaniu na sumach jest zdolność zamiany jed nej Y na inną prostszą lub bliższą celu. Nietrudno jest do tego dojść, jeśli poznamy pewne podstawowe prawa transformacji i przećwiczymy ich wyko rzystanie. Niech K będzie dowolnym skończonym podzbiorem zbioru liczb całkowi tych. Sumę elementów zbioru K można przekształcać za pomocą 3 następu- jących prostych praw: Y cak = keK c 2 2 ak 5 keK X .(a k + bk) = ^ _ a k + ^ bic; k€K keK k€K y aic = IcGK ^ ap(k) • p(k)GK (prawo rozdzielności) (2 . 1 5 ) (prawo łączności) (2 . 1 6 ) (prawo przemienności) (2 .1 7 ) Prawo rozdzielności pozwala wyciągać stałe przed znak Y lub wprowa dzać je pod ten znak. I^rawo łączności pozwala rozbić Y na dwie części, prawo przemienności zaś gwarantuje nam możliwość przegrupowywania składników w dowolny sposób; tutaj p(k) oznacza dowolną permutację zbioru wszystkich liczb całkowitych. Jeśli na przykład K = {—1,0, +1}, natomiast p(k) = —k, to nasze 3 prawa ^gwarantują nam odpowiednio: ca_i + cao + cai = c(a_i + ao + a i ); Czemu więc nie nazwać go prawem permutacji zamiast przemienności? (prawo rozdzielności) (a_i + b _ i ) + (a 0 + b0) + (ai + b i ) = (a_i + do + a i ) + (b_i + b 0 + b i ); (prawo łączności) a_! + ao + ai = ai + ao + a_i . (prawo przemienności) Chwyt Gaussa z rozdziału 1 można postrzegać jako zastosowanie tych 3 podstawowych praw. Załóżmy, że mamy obliczyć sumę ciągu a rytm etycz nego, s= (a + bk). O^k^n Na mocy prawa przemienności możemy zastąpić k przez n —k, otrzymując S = (a + b (n —k)) = O^n—k^n 2 2 (a + bn —bk). O^k^n Te dwa równania można teraz dodać i dzięki prawu łączności otrzymu jemy 2S = 22 ((o. + bk) + (a + bn —bk)) = O^k^n ^ (2 a + b n ). 0 <Ck^n Możemy teraz zastosować prawo rozdzielności i wyliczyć trywialną sumę 2S = (2 a + bn) 2 ^ ^ — (2 a + b n ) ( n + 1 ). O^k^n To mi przypomina zamianę zmiennych przy całkowaniu, tyle że jest prostsze. „Ile to jest jeden i jeden i jeden i jeden i jeden i jeden i jeden i jeden i jeden i jeden?” „Nie wiem,” powiedziała Alicja. „Straciłam rachubę.” „Ona nie potrafi dodawać.” Lewis Carroll [54] Dzieląc przez 2 pokazujemy, że ostatecznie rt ^ ( a + bk) = ( a + jb n ) { n + 1 ). ( 2 .1 8 ) k=0 Prawą stronę można^łatwo zapamiętać jako średnią z pierwszego i ostat niego wyrazu, czyli \ (a + ( a + b n ) ) , przemnożoną przez liczbę wyrazów, czyli ( n + 1 ). Ważne jest, aby pamiętać, że funkcja p(k) w prawie przemienności ( 2 . 1 7 ) musi być permutacją wszystkich liczb całkowitych. Innymi słowy: dla każdej liczby całkowitej rt ma istnieć dokładnie jedna liczba całkowita k taka, że p(k) = n. W przeciwnym âzie prawo przemienności może nie zachodzić; ćwiczenie 3 dobitnie to ilustruje. Przekształcenia typu p(k) = k + c lub p(k) = c — k, gdzie c jest stałą całkowitą, są zawsze permutacjami, więc wolno je zawsze stosować. Z drugiej strony, możemy nieco osłabić wymaganie o permutacji: wystar czy, jeśli będzie istniało dokładnie jedno k spełniające p(k) = rt dla każdego n będącego elementem zbioru indeksowego K. Jeśli n i K (czyli jeśli liczby n nie ma w zbiorze K), to nie jest istotne, dla ilu k zachodzi p(k) = n, gdyż to k nie bierze udziału w badanej sumie. Możemy więc np. twierdzić, że y ak = y_ an = y_ a2k = k£K neK 2keK k parzyste n parzyste 2 k parzyste y _ a 2 k> ( 2 .1 9 ) 2keK gdyż istnieje dokładnie jedno k takie, że 2k = n dla n £ K oraz rt parzystego. Konwencja Iversona, która ze zdań logicznych pozwala nam uzyskiwać wewnątrz wzoru wartości 0 i 1 , może być używana wspólnie z prawami roz dzielności, łączności i przemienności do wyprowadzania dodatkowych wła sności sum. Dla przykładu, mamy tu ważną regułę łączenia dwóch zbiorów indeksów: Jeśli K i K' są dowolnymi zbiorami liczb całkowitych, to y_dk + y_ak = keK keK' keKnK' Qk + x. Qk• keKuK' (2-2°) Wynika to z ogólnych wzorów Y _ ak keK = y _ ak [k € K] k (2.21) oraz [k€ K] + [k€ K'] = [k<GKnK/] + [ k e K U K /]. (2.22) Zwykle stosujemy wzór (2.20) albo po to, żeby połączyć dwa prawie roz łączne zbiory, tak jak w Y_ ak + Y . Qk k=1 k= m = am + 21 ak , dla 1 ^ m ^ n; k=1 albo po to, żeby wydzielić pojedynczy element z sumy, tak jak we wzorze ak = a0 + O^k^n Y . “k > dla n ^ 0 . ( 2 .2 3 ) l^k^n (Dwie strony równania (2 .20) zostały tu zamienione.) Operacja wydzielenia wyrazu poza sumę stanowi podstawę metody za burzania , która często pozwala wyliczyć sumę w postaci zwartej. Pomysł polega na oznaczeniu niewiadomej wartości sumy przez Sn : Sn — 'y &k • O^k^n (Nazwij i zwyciężaj!) Następnie przepisujemy Sn+ 1 na dwa sposoby: wydzie lając pierwszy i ostatni wyraz sumy: Sn + G-n+1 = } G-k = O^k^n+1 0-0 ~ł“ = a0 + <10 + ) O-k l^k^n +1 ^ ak+i l ^k+l^n +1 2 Z ak+1 * O^k^n ( 2 .2 4 ) Teraz możemy popracować nad ostatnią sumą i postarać się wyrazić ją za po mocą Sn - Jeśli się nam to uda, to otrzymamy równanie, którego rozwiązanie jest szukaną sumą. Zastosujmy to podejście na przykład do znalezienia sumy ciągu geome trycznego, Sn = y_ axk . O^k^n Ogólny schemat zaburzania przedstawiony we wzorze (2.24) pozwala wy wnioskować, że Sn + ax n+1 = a x ° + Y _ ax k+l O^k^n przy czym suma po prawej stronie jest równa x ^ 0<k<n axk = xSn na mocy prawa rozdzielności. W związku z tym Sn + axn+1 = a + xSn i możemy Jeśli jest geometryczny; to powinien mieć geometryczny dowód. rozwiązać to równanie ze względu na Sn . Uzyskujemy n Z ax k a — ax n+1 = — ---------- (2.25) k=0 Faktycznie! Ten wzór został wwiercony we mnie w szkole średniej. (Dla x = 1 suma ta oczywiście wynosi (n + l )a.) Prawą stronę można zapamiętać jako pierwszy wyraz należący do sumy minus pierwszy wyraz poza sumą podzielone przez 1 minus iloraz ciągu geometrycznego. To było proste, może nawet trochę zbyt proste. Spróbujmy zastosować metodę zaburzeń do nieco bardziej skomplikowanej sumy: sn = y _ k2kO^k^n Mamy tutaj So = 0, Si = 2, S2 = 10, S3 = 34, S4 = 98; jak może wyglądać ogólny wzór? Zgodnie ze wzorem ( 2 .2 4 ) mamy Sn + ( n + 1 ) 2 n+1 = Y_ 0<+1)2k+1 I O^k^n będziemy więc dążyli do wyrażenia sumy z prawej strony równania za pomocą Sn.. W porządku, możemy rozbić ją na 2 sumy za pomocą prawa łączności k 2k+1 O^k^n + Y . 2k+’ > O^k^n i teraz pierwsza z tych sum równa jest 2Sn . Druga z nich natomiast jest ciągiem geometrycznym, równym ( 2 — 2 n + 2 ) / ( 1 — 2 ) = 2 n + 2 — 2 na mocy (2.25). W takim razie mamy Sn + (ri+1)2 n +1 = 2Sn + 2 n + 2 — 2 i elementarne przekształcenia algebraiczne dają nam k 2 k = (n — 1)2n+1 + 2 . O^k^n Rozumiemy już, dlaczego S3 = 34: to jest po prostu 32 + 2, a nie 2*17. Analogicznie przeprowadzone rachunki dla x zamiast 2 dałyby nam ogól ny wzór Sn + (tl + 1)x n+1 = xSn + (x — xn+2)/ (l — x); możemy zatem wydedukować, że r , k x — (n + 1 )x n+1 + nx n+2 > kx = ------------ r- -------------------- , to n -*)2 J1 d l a x ^ 1. . ( 2 .26 ) Ciekawe, że można otrzymać tę zwartą postać w zupełnie inny sposób, po zastosowaniu podstawowych technik rachunku różniczkowego. Jeżeli za czniemy od równania Zn k x i —x TL+ 1 1 y = — 1i---—X k=0 i weźmiemy po obu stronach pochodną ze względu na x, to otrzymamy k_! y- “ k=0 (1—x )(—(n+1 )xu ) + 1—xn+1- _ (l-x )2 ~ 1 - ( n + l ) x n + n xn+1 (1-x)2 ponieważ pochodna sumy jest sumą pochodnych jej wyrazów. W następnych rozdziałach poznamy jeszcze wiele innych związków między rachunkiem róż niczkowym a matematyką dyskretną. 2.4. Sum y w ielokrotne_____ ___________________ Składniki sum mogą być indeksowane niekoniecznie jedną, ale również dwoma lub więcej zmiennymi. Przyjrzyjmy się dla przykładu sumie dziewięciu skład ników, określanych przez dwie zmienne indeksowe j oraz k: Y cijbic = ai bi + a i b 2 + a i b 3 iscj,k^3 _l_ CL2'\Dl _|_ a 2 b 2 + a 2b 3 + a 3b! + a 3b 2 + a 3b 3 . Stosujemy tu te same konwencje notacyjne i metody, jak w przypadku sum indeksowanych pojedynczo. Jeśli więc P(j,k) jest własnością zależną od j i k, to suma wszystkich wyrazów aj>k takich, że P(j,k) jest prawdziwe, może być zapisana w dwojaki sposób. W drugim z nich używamy konwencji Iversona i sumujemy względem w szystkich par liczb całkowitych j i k: Y CLj,k = X.CLj,k [P(j,k)] . P(j,k) 3,Tc Jeden znak ^ wystarcza, nawet wówczas, gdy mamy więcej indeksów sumo wania; znak oznacza sumę wszystkich kombinacji indeksów, które dotyczą danego przypadku. Gdy jest mowa o sumie sum, wówczas możemy użyć także dwóch znaków przykład £ £ a jilc [P(j,k)] j k Warto zwrócić uwagę, że nie chodzi tu o sumowanie po wszystkich j ^ 1 i wszystkich k^3. jest skrótem dla Sumy wielokrotne wylicza się od prawej do lewej (od wewnątrz na zewnątrz). j v k przy czym należy to rozumieć jako sumę względem wszystkich liczb całkowi tych j z k a i% P5(j >k)] • Ostatnia suma to z kolei suma względem wszystkich liczb całkowitych k, dla których P(j,k) jest prawdą. W takich przypadkach mówimy, że suma podwójna „wyliczana jest najpierw względem k.” Sumę względem więcej niż jednego indeksu można wyliczać najpierw względem dowolnego z nich. Mając to na uwadze, wprowadzimy podstawowe prawo nazywane zm ianą porządku sum owania , które uogólnia wspomniane już wcześniej prawo łącz ności (2 . 16): £ j Kto tu panikuje? Moim zdaniem ta zasada jest całkiem zrozumiała, przynajmniej w porównaniu z tym, co się działo w rozdziale 1. k «« - P ( j,k) L L fc Oj,k[P(j,lc)]. ( 2 .27) j W środku mamy sumę względem dwóch indeksów. Z lewej strony oznacza sumowanie najpierw względem k, a potem względem j, natomiast po prawej stronie X.k^Lj oznacza sumowanie najpierw względem j, a po tem względem k. W praktyce, jeśli będziemy chcieli wyrazić podwójną sumę w postaci zwartej, to zazwyczaj jeden z indeksów będzie miał tę własność, że łatwiej jest sumować najpierw względem niego. Zgodnie z tym prawem możemy zatem wybrać do sumowania najpierw ten indeks, dla którego su mowanie okaże się wygodniejsze. Z powodu sumy sum nie ma co wpadać w panikę, ale u nowicjusza mogą one spowodować zamęt. Zacznijmy więc od paru przykładów. Dziewięcioskładnikowa suma, od której zaczęliśmy, jest dobrym punktem wyjścia do przedstawienia pewnych technik przekształcania podwójnych sum. Sumę tę można bowiem uprościć, a uproszczenia to jest właśnie to, co robimy zazwy czaj z X. L : Y_ l^j,k^3 ajbk = ]T = £_Ojbk[1^K3][1^1cO] j >k j,k = L L ajbk[1 ^j^ 3] [l ^ k ^ 3 ] j ic = X a; [1 ^ 3] Z j k j ' b* [1^ k ^ 3] k ' = ( 2 1 a j [ l ! S K 3 ] ) ( ^ b k[ K l c $ 3 ] - (£ < ■> )(!> )• Xj=l 7 Vk=1 7 Pierwszy wiersz oznacza tu sumę 9 składników bez żadnego specjalnego po rządku. W drugim wierszu grupujemy je trójkami: (aibi + a-\\)2 + a-|b3) + (a.2bi + a2b2 + 0 ^ 3 ) + (a^bi + a^bz + ci3b3). W trzecim wierszu korzy stamy z prawa rozdzielności, aby wyłączyć wszystkie wyrazy a^, gdyż aj oraz [1 ^ j ^ 3] nie zależą od k; to daje nam a-[ (bi+ b 2 + b3)+ a.2(bi + b2 + t>3) + a3(bi + b2 + b3). Czwarty wiersz jest taki sam,jak trzeci, z tym że wzbogacamy się o nadmiarową parę nawiasów tak, aby piąty wiersz nie wy glądał zbyt tajemniczo. W wierszu piątym wyłączamy poza nawias wyrażenie (bi + b 2 + b3), które dotyczy każdej wartości j: (ai +a.2 + ci3)(bi + b 2 + b3). Ostatni wiersz, to po prostu inaczej zapisany wiersz poprzedni. Powyższa me toda wyprowadzania może być użyta do udowodnienia uogólnionego prawa rozdzielności , y _ djbk = ( y _ a >) ( Y . bk) jej keK Mej 7 VkeK (2-28) 7 zachodzącego dla wszystkich zbiorów indeksów J i K. Podstawowe prawo (2.27) zmiany kolejności sumowania ma wiele wa riantów pojawiających się, gdy zamiast sumować względem wszystkich liczb całkowitych j i k chcemy ograniczyć zakres indeksów. Warianty te są o dwóch smakach: waniliowym i bakaliowym. Najpierw wersja waniliowa: Z H j e j keK a >.k = Y - a >.k = jej k€K je j keK (2-29) Jest to po prostu inna wersja zapisania (2.27), gdyż iversonowskie [j 6 J, k G K] rozkłada się na [j € J][k 6 K]. Prawo waniliowe stosuje się wtedy, gdy j i k są od siebie niezależne. Wzór o smaku bakaliowym jest cokolwiek sprytniejszy. Stosuje się go wtedy, gdy dziedzina sumy wewnętrznej zależy od wartości zmiennej ze wnętrznej : £_ H a i-k = H H ai ’k j e j ke«(j) keK' je j'(k ) (2-3°) Zbiory J, K(j), K' i J'(k) muszą być tu tak określone, żeby zachodziło Bej][keK(j)] = [keK'] [je j'(k)] Rozkład taki jak ten jest zawsze możliwy, gdyż możemy określić J = K; jako zbiór wszystkich liczb całkowitych, a K(j) (równe J'(k)) może stać się podstawową własnością P(j, k), która określa zakres podwójnej sumy. Są jed nak przypadki szczególne, gdy J, K(j), K' oraz J'(k) mają prostą postać. Przypadki te spotykamy często w zastosowaniach. Mamy na przykład taki użyteczny rozkład: [1 ^ j ^ n ] [ j ^ k ^ n ] = [ l ^ j ^ k ^ r t ] = [1 ^ k ^ n][l ^ j ^ k ] . (2.31) Powyższe równanie przedstawione w konwencji Iyersona można zapisać w postaci tradycyjnej w następujący sposób: n rt n X . H a i.k = j=l k=j Któraś z tych 2 sum jest zazwyczaj łatwiejsza do policzenia. Równania ( 2 .3 2 ) możemy używać do przełączania się z trudniejszej postaci na łatwiejszą. Zilustrujmy te pomysły użytecznym skądinąd przykładem. Rozważmy tablicę "ai ai a2ai a3a-i 1----P ? .. P (Ałbo sprawdzić, czy w lodówce nie został jeszcze jakiś baton Snickers.) (2-32) k=1 j = 1 Cli0-2 ai a3 .... a! an " CL20-2 a2a3 . Q2dn a3a2 a3a3 . CL3CLti P ? P 3 _____ 1 Teraz nadszedł dobry moment, aby zrobić ćwiczenia rozgrzewkowe 4 i 5. k dj.k = ancl2 składającą się z n 2 iloczynów. Naszym zadaniem będzie znaleźć prosty wzór na Sî = Szczególnie, gdy tablica ma postać diagonalną! ajak , l^j^k^n ^ czyli sumę wszystkich wyrazów leżących na i powyżej głównej przekątnej. Po nieważ djCiic = a kcij, tablica jest symetryczna względem głównej przekątnej, i w związku z tym będzie mniej więcej równe połowie sumy wszystkich elementów (z dokładnością do tych drobiazgów z głównej przekątnej). Rozważania te pozwalają nam zapisać ajQk = a kGj = 21. ajQk = gdyż zawsze możemy zamienić (j,k) na (k, j). Dalej, ze względu na to, że [1 ^ j ^ k ^ n ] + [1 ^ k ^ j ^ n ] = [1 ^ j , k ^ n ] + [1 ^ j = k ^ n ] , rrrw tu i m « i i ......... 1 * mamy y~ 2S\| = S^q + S^ = Gj ak + l^j.k^n y~~ Gj Clk 1<Cj=k<Cu Pierwsza z tych sum na mocy uogólnionego prawa rozdzielności ( 2 .2 8 ) jest rów na (HjLi 0 == ( Z k = f ak)2>a d r u g a s u m a w y n o s i £ £ =1 aj;. ( L ^ i ai)(L k = il Q ak) Zatem w wyniku otrzymujemy S<q = Y_ Qi ak = ^ ( ( i l ak ) + 1 1 4 ) - l^ j^ k ^ n V 'k= 1 (2-33) 7k=1) co jest przedstawieniem górnej sumy trójkątnej za pomocą prostszych poje dynczych sum. Zachęceni takim sukcesem przyjrzyjmy się innej podwójnej sumie: S = (G k-G j)(b k - b j ) . 1^ j<k^rt Podobnie jak poprzednio, zamiana j oraz k daje nam sytuację symetryczną: S = (Gj - Gk ) ( b j - b k ) = Y . l^kcj^n (ak — a j ) ( b k — b j ) . Y_ 1^k<j^n Możemy więc dodać S do siebie i czyniąc użytek z tożsamości [1 ^ j < k ^ n ] + [1 ^ k < j ^ n ] = [1 ^ j , k ^ n ] — [1 ^ j = k ^ ri] wywnioskować, że 2S = Y _ (aj — a k)(bj —bk) - l^j.k^n Y_ (a i ~ a k)(bj - b k) . 1^j=k^n Druga z sum jest równa 0, co się więc dzieje z pierwszą? Możemy ją rozbić na 4 oddzielne sumy, każda z nich o smaku waniliowym: y Gjbj 1<Cj,k^rt y_ cijbk l^j,k^n Y_ = 2 2 1 Gkbk 1^j.kû 2 Y_ a>bk l^j.k^n = l( V 2n Y_ IsCk^n a kbk - 'k=1 akbj + 1^j,k^n a k^ f J~ bk ' k=l y_ 1^j,k^n akbk W ostatnim kroku obie sumy zostały uproszczone zgodnie z uogólnionym prawem rozdzielności ( 2 .2 8 ). Przekształcenie pierwszej sumy może wyglądać tajemniczo, podajemy je więc jeszcze raz w zwolnionym tempie: 2 Y_ a kbk = 2 n y _ akbk 1^k^n l^j^n = 2 Y_ = 2 akK H ^ o 1 Y _ a kbkTX = 2n Y a kbk . I^k^n l^k^rt Zmienną indeksową, która nie występuje w składniku (w tym przypadku )) można wyeliminować, przemnażając całą resztę przez wielkość zbioru indek sowego (w tym przypadku n). Wracając do tematu, możemy teraz wszystko podzielić przez 2 i przegru pować wyrazy tak, aby otrzymać interesujący wzór: (Tak naprawdę Czebyszew [74] udowodnił analogiczny rezultat dla całek, nie dla sum (Ja f M dx) • (Ja 9M dx) ^ (b - a) *(Jaf Ws W d x ) , jeśli f(x) i g(x) są funkcjami niemalejącymi.) Z tożsamości tej wynikają m onotoniczne nierówności Czebyszewa : ( y ~ a k) ( 5 ~ b k ) ^ n y " a kbk , \ k=1 / \ k=1 / k=1 jeśli cm ^ ^ an i bi ^ ( H ak) ( H bk) ^ n ^ c i i c b i c , jeśli ai ^ ^ an i b i ^ Sc=1 7 'k=1 ' •O n i ^ b n. k=1 (W ogólności, jeżeli cm ^ ^ an, a p jest permutacją zbioru {1, . . . , rt}, to można łatwo udowodnić, że największa wartość ^ k=1 a kbp(k) jest osiągana, gdy bp(1) ^ ^ bp(n), a najmniejsza, gdy bp(1) ^ ^ bp(n).) Sumowanie wielokrotne ma interesujący związek z ogólną operacją zmia ny indeksu sumowania w pojedynczych sumach. Na mocy prawa przemien ności wiemy, że Y_ Qk = Y. ap(k) > k€K p(k)€K dla dowolnej permutacji p(k) liczb całkowitych. Co jednak się stanie, gdy zastąpimy k przez f(j), gdzie f jest dowolną funkcją f : J —> K, która zamienia liczbę całkowitą j G J na liczbę całkowitą f(j) G K? Ogólny wzór na zamianę indeksów przedstawia się następująco: H a f(j) = X . a k # f - (k' ’ je j (2-35) keK gdzie # f “ (k) oznacza liczbę elementów zbioru f “ (k) = { j |f(j) = k } , czyli liczbę takich wartości j G J, dla których f(j) jest równe k. Równanie (2.35) można łatwo udowodnić zmieniając porządek sumowa nia = je j 2 1 cik [f (j)= k ] = Y jej keK qk Y [f(j) = k ] , keK je j gdyż H j€j [f(j) =k] = # f “ (k). W przypadku szczególnym, gdy f jest od wzorowaniem różnowartościowym między J i K, dostajemy # f - (k) = 1 dla wszystkich k, a ogólny wzór (2.35) sprowadza się do = jej Y. af<j) = H f(j)eK a,c- k€K Mój nauczyciel matematyki nazywał to „bijekcją” ; może kiedyś uda mi się polubić to słowo. Otrzymaliśmy nieco zamaskowane prawo przemienności (2.17). W dotychczas rozważanych przykładach sum wielokrotnych występowały wyłącznie wyrazy typu a k lub bk. Książka ta jednak ma być konkretna, zobaczmy więc, jak się będzie pracowało z sumą wielokrotną zawierającą konkretne liczby: = Z k -j Na przykład Si = 0; S2 = 1; S3 = j z j + jr y + j z j = T Typową metodą obliczania podwójnej sumy jest sumowanie najpierw względem j lub najpierw względem k. Sprawdźmy obie możliwości: s« - L L t h l ^ k ^ r t 1 ^ j< k sumujemy najpierw względem j J zastępujemy j przez k —j = l ^Zk ^ n 1^ kZ—-j< k T } upraszczamy ograniczenia n a ) Uwaga! Autorzy wydają się być przekonani, że j , k oraz n są „konkretnymi liczbami.” = = = Y H* -i Y Hk l^k+ l^n na mocy definicji Hk_i ( 2 . 1 3 ) zastępujemy k przez k + 1 Y Hk- upraszczamy ograniczenia na k 0^k<n I tyle! Nie wiemy, jak wyrazić sumę liczb harmonicznych w postaci zwartej. Jeżeli spróbujemy wy sumować najpierw względem k, to otrzymamy s- = l ^Lj ^ n j<k<û I q ^ ^ i =L Y l = Y H"-s - sumujemy najpierw względem k zastępujemy k przez k + j l ^ j ^ n j < k + j^ r t upraszczamy ograniczenia na k l ^ j ^ u 0 < k ^ n —j = L na mocy definicji H u _ j ( 2 . 1 3 ) zastępujemy j przez n —j Hj 1 ^ n —j ^ n = Y H,. upraszczamy ograniczenia na j I jesteśmy w tym samym miejscu. Jest jednak jeszcze jedn a droga postępowania. Zamieńmy k na k + j przed decyzją o sprowadzeniu Sn do sumy sum: 1 Sn = Y kopiujemy zadaną sumę fc -j zastępujemy k przez k + j - l^k^rt L l^j^TL— L ki Z l^k^n Całkiem sprytne było uwzględnianie k ^ n zamiast k ^ n —1. Proste ograniczenia oszczędzają energię. n —k v suma względem j jest trywialna = l^kîr I M l^k^n ’ —n = tiHt, —n . sumujemy najpierw względem j na mocy prawa łączności no jasne! na mocy ( 2 . 1 3 ), definiującego Hn . M e to d y ogóln e] No tak! Znaleźliśmy Sn . W zestawieniu z poprzednimi falstartami uzyskali śmy w nagrodę dodatkową tożsamość: Y Hk = nH n —n O^kcrt ( 2 .36 ) Postaramy się zrozumieć zastosowany tu chwyt za pomocą dwóch spo sobów: algebraicznego i geometrycznego. ( 1 ) Algebraicznie: jeśli mamy po dwójną sumę, której wyrazy zawierają k+f ( j ) , gdzie f jest pewną funkcją, to przykład powyższy podpowiada, że niezłym pomysłem może być zastąpienie k przez k —f(j), a następnie sumowanie względem j. ( 2 ) Geometrycznie: mo żemy spojrzeć się na tę konkretną sumę Sn dla n = 4 w następujący sposób: k=1 k= 2 k= 3 k= 4 j=1 T + )= 2 2 + 3 ł + i = 3 j= 4 { T Nasze pierwsze próby sumowanianajpierw względem j (kolumny) lub najpierw względem k (wiersze) dały nam Hi + H2 + H3 = H3 + H 2 + H i. Kluczem do sukcesu było natomiast sumowanie względem przekątnych, co dawało y + § + j • 2.5. M e to d y ogólne Utrwalmy to, co poznaliśmy do tej pory, przyglądając się jednemu przykła dowi z różnych stron. Na kolejnych kilku stronach będziemy się starali znaleźć postać zwartą dla sumy kwadratów początkowych n liczb naturalnych, którą oznaczymy przez Dn□ n = X k2 , dla n ^ 0 . ( 2 .3 7 ) Jak się przekonamy, istnieje co najmniej 7 różnych sposobów rozwiązania tego zadania. W miarę ich odkrywania będziemy przy okazji starali się poznać użyteczne metody obliczania sum w ogólności. Najpierw, jak zwykle, przyglądamy się drobnym przypadkom. n 0 1 2 3 4 5 6 7 8 9 10 11 12 n2 0 1 4 9 16 25 36 49 64 81 100 121 144 □u 0 1 5 14 30 91 140 204 285 385 506 650 55 Nie widać na pierwszy rzut oka postaci zwartej dla [Hn , lecz gdy ją znaj dziemy, będziemy mogli z tych wartości skorzystać przy jej sprawdzaniu. A także na str. 202 „Poradnika encyklopedycznego” Bronsztejna i Siemiendiajewa [42]. Trudniejsze sumy można znaleźć w przystępnej książce Hansena. A przynajmniej do problemów, które mają te same odpowiedzi, jak problemy; które inni byli łaskawi rozważyć. M e to d a 0 : Z naleźć gd zieś rozw iązan ie Problem sumy początkowych n kwadratów liczb naturalnych jest już za pewne rozwiązany, więc możliwe, że znajdziemy to rozwiązanie w jakimś poręcznym poradniku. Faktycznie, na str. 36 w CRC Standard Mathematical Tables [28] znajdujemy odpowiedź: n (n + 1)( 2n + 1) □ n = -----------t-----------, ,, dla u ^ 0 . , * ( 2 .38 ) Tak tylko dla pewności, że odpowiedź przeczytaliśmy poprawnie, wyli czamy kilka wartości, np. EI5 = 5- 6-11/6 = 55. Ciekawe, że na str. 36 CRC Tables znajdziemy dalsze wzory na sumę sześcianów, . . . , dziesiątych potęg. Rozwiązania wielu problemów związanych ze wzorami matematycznymi można znaleźć w Handbook of Mathematical Functions, pod redakcją Abramowitza i Stegun [2]. Na stronach 813-814 znajdziemy wartości Dn dla n ^ 100, a strony 804 i 809 zawierają wzory równoważne ( 2 .38 ), wraz z analogicznymi wzorami na sumy sześcianów, . . . , 15-tych potęg zawierające naprzemienne znaki, albo ich nie zawierające. Najlepszym jednak źródłem odpowiedzi na pytania dotyczące ciągów jest zadziwiająca mała książeczka Sloane’a [331], Handbook oflnteger Seąuences, która zawiera tysiące ciągów posortowanych według ich wartości liczbowych. Jeżeli wpadniesz na rekurencję i masz podejrzenie, że ktoś już ją mógł rozwią zać, to wystarczy, abyś policzył wystarczająco dużo początkowych wartości, aby odróżnić ją od pozostałych już znanych. Masz wtedy duże szanse na to, że znajdziesz w książeczce Sloane’a swój ciąg i dotyczące go odpowiednie odnośniki. Ciąg 1, 5, 14, 30, . .. na przykład okazuje się u Sloane’a ciągiem numer 1574 „kwadratowych liczb piramidalnych” (ponieważ w piramidzie o podstawie kwadratu złożonego z n 2 kul znajduje się U n kul). Sloane podaje 3 odnośniki, wśród nich wspomnianą już książkę Abramowitza i Stegun. Jeszcze innym miejscem poszukiwań w światowym magazynie zakumu lowanej mądrości matematycznej może być program komputerowy (taki jak Axiom, MACSYMA, Mapie czy Mathematica), dostarczający narzędzi prze kształcania symbolicznego. Takie programy są nieodzowne, szczególnie dla ludzi, którzy mają do czynienia z dużymi wzorami. Dobrze jest znać standardowe źródła informacji, gdyż mogą się one oka zać bardzo pomocne. Metoda 0 nie jest tak do końca zgodna z duchem tej książki, chcemy się bowiem dowiedzieć, jak można samemu dojść do takich rezultatów. Metoda znajdowania gdzieś rozwiązania ogranicza się do proble mów, które ktoś już rozwiązał; nowego problemu tam nie znajdziemy. 2.5. M etody ogólnej M e to d a 1 : Zgadnij o d p ow ied ź, udow odnij ją przez indukcję Może to jakiś krasnoludek nam tę odpowiedź podpowiedział, a może doszli śmy do niej za pomocą innych, nie tak precyzyjnych metod. Wtedy wystarczy, jeśli pokażemy, że mamy rację. Moglibyśmy zauważyć, że wartości rozkładają się na niewielkie sto sunkowo liczby pierwsze, więc moglibyśmy wpaść na wzór ( 2 .38 ) jako coś, co działa dla małych wartości rt. Moglibyśmy też wpaść na równoważny wzór n ( n + ł ) ( n + 1) dla rt ^ 0 , □ n. = ( 2 .39) o tyle zgrabniejszy, że łatwiejszy do zapamiętania. Wzór ( 2 .39 ) przemawia do wyobraźni, ale musimy udowodnić nasze przypuszczenia, aby uwolnić się od jakichkolwiek wątpliwości. Właśnie po to została wymyślona indukcja matematyczna. „Zatem dobrze, mój Panie, wiemy, że Do = 0 = 0(0 + ^)(0 + 1)/3, czyli baza jest prosta. Dla pokazania kroku indukcyjnego załóżmy, że n > 0 i że wzór (2 .39) zachodzi, kiedy n zastąpimy przez rt — 1. Ponieważ D rt — D n - 1 “I" Tl > więc mamy 3Dn = (n — l ) ( n — ^)(n) + 3n 2 = (rt3 — |r t 2 + j n ) + 3rt2 = (n 3 + |r t 2 + j n ) = n ( n + \ ) { n + 1). Zatem ( 2 .39 ) rzeczywiście zachodzi poza wszelkimi wątpliwościami dla wszys tkich u ^ 0.” Sędzia Wapner, w swojej nieskończonej mądrości, zgadza się z tym. Doceniamy wartość indukcji, ale jest coś defensywnego w tym, że czasami musimy polegać na zgadnięciu rozwiązania. To ciągle nie jest to, czego szu kamy. Jak dotąd wszystkie inne sumy, które udało się nam wyliczyć w tym rozdziale, pokonaliśmy bez pomocy indukcji. Powinniśmy sobie poradzić od zera także z sumą taką jak Dn . Nie będziemy wymagać błysku geniuszu. Sumy powinny się dawać wyliczyć również podczas mniej twórczych dni. M e to d a 2: Zaburz su m ę Wróćmy więc do metody zaburzania, która tak dobrze działała przy ciągu geometrycznym ( 2 .25 ). W celu otrzymania równania na Dn , wyodrębnijmy pierwszy i ostatni wyraz sumy Dn-u □ n + ( n + 1)2 = Y. (k + 1 )2 = Y (k2 + 2k + 1) O^ksCn O^k^n = Y O ^k^n k2 + 2 Y _ k+ Y . O^k^n = Dn + 2 Y _ k + 1 O^k^n ( n + 1). O^kû Wygląda mi to raczej na remis. Niestety! Symbole mn kasują się nawzajem. Czasami, mimo naszych naj szczerszych chęci, metoda zaburzania doprowadza nas do czegoś w rodzaju □ n = On. i przegrywamy. Z drugiej strony, to wyprowadzenie nie jest taką znowu kompletną po rażką; odkrywa przed nami metodę obliczenia sumy początkowych rt liczb naturalnych, k = (rt + 1)2 — (n + 1), 2 0< ; k < ; n jakkolwiek spodziewaliśmy się dostać sumę kwadratów początkowych liczb naturalnych. To może aby dostać wyrażenie na sumę kwadratów, trzeba za cząć od sumy sześcianów liczb naturalnych, którą oznaczymy przez CSPn ? Spróbujmy: ® n + (n +1) 3 = Y (k + T)3 = Y (k3 + 3 k 2 + 3 k + 1 ) O ^k^rt O^k^n = Wn + 3Dn + 3 Metoda 2 ': Zaburz swojego asystenta. ^ + (n+1) ■ No tak, ® tl c o prawda się upraszcza, ale pozostaje wystarczająco dużo in formacji, aby otrzymać D n bez uciekania się do indukcji: 3 d n = (n + 1)3 —3(n + 1)n / 2 — (n + 1) = (n+1)(n2 + 2 n + 1 —§ n —1) = (n+1)(n+-jjn. M e to d a 3: Skonstruuj rep ertu ar Drobna modyfikacja rekurencji ( 2 .7) wystarczy, aby poradzić sobie również ze składnikami zawierającymi rt2. Rozwiązanie rekurencji R0 = oc; o Rn = R n - i + |3 + y n + 6 n 2 , dla n > 0 , ( 2 -4o) będzie miało ogólną postać Rn = A ( n ) a + B(n)p + C (n )y + D(n)ó; ( 2 .41 ) przy czym wartości A(rt), B(rt) i C(rt) zostały już określone, gdyż (2.40) jest identyczne z (2.7) dla 6 = 0. Jeśli teraz włączymy funkcję Rn = rt3, to przekonamy się, że rt3 jest rozwiązaniem, gdy a = 0, |3 = 1, y = —3, 6 = 3. W związku z tym 3D ( n ) - 3C (n )+ B (n ) = n 3 ; co określa już D (n). Interesuje nas obliczenie sumy IHn , która się równa D n -1 + rt2. Otrzy mujemy więc U n = Rn , jeśli przyjmiemy o c = | 3 = y = 0, a 6 = 1 w (2.41). W związku z tym mamy Dn = D(rt). Nie musimy się więc męczyć z prze kształceniami, żeby wyliczyć D (n) z B(n) i C(n), gdyż wiemy, jaki będzie wynik. Ci, którzy jeszcze w to wątpią, mogą się tych wątpliwości pozbyć po zaakceptowaniu, że 3D(rt) = n 3 + 3C(rt) —B(rt) = n 3 + 3 -^— rt = r t(n + ^ )(n + l). M etoda 4: Zamień sumy na całki Ci z nas, którzy byli wychowani raczej na rachunku różniczkowym niż na matematyce dyskretnej, są bardziej zaznajomieni ze znakiem J niż ze znakiem Y , będzie więc dla nich łatwiej przejść od Y do J. Jednym z celów tej książki jest uczynienie z Y tak przystępnego narzędzia, że dojdziemy do wniosku, iż J jest trudniejsza od Y (przynajmniej jeśli idzie o dokładne obliczenia). Niemniej jednak dobrze jest zbadać relację pomiędzy Y a J, gdyż sumowanie i całkowanie wyrastają z tych samych korzeni. W rachunku różniczkowym całka może być przedstawiona jako pole pod krzywą. Skala pozioma jest tu 10 razy rzadsza niż pionowa. Pole to przybliżamy dodając pola długich i cienkich prostokątów dotykają cych krzywą od spodu. Gdy taki ciąg smukłych prostokątów jest dany, mo żemy spojrzeć się na tę konstrukcję również z drugiej strony. Ponieważ IHn jest sumą prostokątów o bokach 1 x 1, 1 x 4, . . . , 1 x n 2, to suma ta jest w przybliżeniu równa polu pod krzywą f(x) = x2 między 0 a n. Pole pod tą krzywą jest równe J q X 2 dx = n 3/ 3; wiemy więc już, że [Hn w przybliżeniu będzie równe ^n3. Jedną z metod wykorzystania tego faktu jest ocenienie błędu aproksy macji, En = □ n — -jri3. Ponieważ Dn spełnia rekurencję = Dn-1 + n 2, więc dochodzimy do wniosku, że En spełnia prostszą rekurencję En = D n - ^ n 3 = D n - i + n 2 - ^ u 3 = En_! + ^ (rt-1 )3 + rt2 - ^ rt3 = t n_i + rt — ^ . Inną metodą wykorzystania podejścia całkowego jest znalezienie wzoru na En przez wysumowanie krzywoliniowych trójkącików składających się na błąd. Mamy tu X ” 2 - L x2 dx ( k' k=1 N 7 k=1 W obu przypadkach z łatwością znajdujemy En , a następnie II]n . M etoda 5: Skomplikuj i uprość Jeszcze jednym sposobem wyliczenia zwartej postaci dla Du jest zamiana wyjściowej sumy na trochę bardziej z wyglądu skomplikowaną^sumę po dwójną, która może być potem uproszczona, jeśli odpowiednio ją wymasujemy: □n = £_ l^k^n k2 = Y . 1^ j^k^n k Przejście od sumy pojedynczej do podwójnej może wydawać się na pierw szy rzut oka krokiem wstecz. Jest to jednak krok naprzód, gdyż uzyskujemy sumy, z którymi łatwiej jest pracować. Nie możemy rozwiązywać wszystkich problemów ciągle tylko upraszczając. Nie można pokonać najwyższych szczy tów górskich bezustannie podchodząc do góry. M etoda 6: Zastosuj rachunek skończony M etoda 7: Wykorzystaj funkcje tworzące Przygotuj się na jeszcze bardziej ekscytujące obliczenia Dn = tym jak w nadchodzących rozdziałach poznamy nowe techniki. P° 2.6. R achunek różnicow y i różniczkowy Poznaliśmy wiele sposobów postępowania z sumami. Teraz nadszedł moment, kiedy możemy dokładniej poznać istniejące możliwości, przyglądając się temu problemowi z szerszej perspektywy. Matematycy rozwinęli „rachunek róż nicowy” będący odpowiednikiem tradycyjnego rachunku różniczkowego. Za pomocą tego narzędzia będziemy mogli wyliczać sumy w sposób zgrabny i systematyczny. Rachunek różniczkowy opiera się na właściwościach operatora pochod n ej D, zdefiniowanego jako D f(x) = lim f(* + h ) - f (x) . H->0 Tl Rachunek różnicowy oparty jest na własnościach operatora różnicy A, zde finiowanego jako Af(x) = f(x + 1) —f ( x ) . (2-42) Jest to skończony odpowiednik pochodnej, w którym ograniczamy się do dodatnich całkowitych wartości h. W związku z tym H = 1 jest najbliższe temu, co moglibyśmy otrzymać, gdyby rozważać „granicę” przy h —> 0, a Af (x) jest wartością (f (x + H) —f (x)) /H dla h = 1. Symbole D oraz A są nazywane operatorami , gdyż operując funkcjami dają nowe funkcje, są więc funkcjami funkcji produkującymi funkcje. Jeśli f jest odpowiednio gładką funkcją ze zbioru liczb rzeczywistych w zbiór liczb rzeczywistych, to D f jest również funkcją ze zbioru liczb rzeczywistych w zbiór liczb rzeczywistych. Tak samo, jeśli f jest jakąkolwiek funkcją z liczb rzeczywistych w liczby rzeczywiste, to Af też będzie taką funkcją. Wartości funkcji D f i Af w punkcie x są określone przez podane wyżej definicje. Jednym z pierwszych kroków podczas poznawania rachunku różniczko wego jest zbadanie, jak operator D działa na funkcje potęgowe f(x) = xm. Ostatni krok tutaj jest czymś w rodzaju metody zaburzania, ponieważ dostajemy równanie z szukaną wielkością po obu stronach. W takich przypadkach Df (x) = mxm 1. Możemy to samo napisać nieformal nie opuszczając symbol f: D(xm) = mxm_1 . Miło by było, gdyby operator różnicowy A dawał podobnie eleganckie wyniki. Niestety nie daje; na przykład A(x3) = ( x + I)3 - x 3 = 3x2 + 3 x + 1 . Jest jednak wersja „m-tej potęgi”, która zachowuje się bardzo ładnie, gdy zadziała na nią operator A, i to jest właśnie to, co czyni rachunek różnicowy interesującym. Takie różnicowe potęgi definiuje się za pomocą wyrażenia m czynników x— = x(x —1) . . . ( x —m + 1 ), całkowite m ^ 0 . (2 .43 ) Zwróćmy uwagę na małe podkreślenie pod m; wynika z niego, że kolejne czynniki będą się krok po kroku zmniejszały. Istnieje też dualna definicja, w której czynniki zwiększają się krok po kroku: m czynników _ ,--------------*---------------- s xm = x(x + 1 ) . . . (x + m —1 ), Notacja matematyczna jest jednak pokręcona: Pochhammer [294] w rzeczywistości używał notacji (x)m dla oznaczenia współczynników dwumianowych (m) , * nie potęg kroczących. / całkowite m ^ 0 . (2 .44 ) Dla m = 0 mamy x- = x° = 1, gdyż przyjmujemy zwykle, że iloczyn zera czynników jest równy 1 (podobnie jak suma zera składników jest równa 0 ). Wartość x— czytamy jako „x do m-tej ubywającej,” podobnie xm czy tamy „x do m-tej przyrastającej.” Funkcje te nazywane są również potęgami kroczącymi lub dolnymi silniami i górnymi silniami , gdyż z silniami mają trochę wspólnego. W istocie tl! = n—= 1n. W literaturze matematycznej istnieje wiele różnych notacji dla wyraże nia potęg kroczących, w szczególności symbol Pochhammera (x)m na xm lub x—; spotyka się też notacje typu x^m^lub X(m) dla oznaczenia x—. Pod kreślenie i nadkreślenie ma jednak istotne przewagi; jest łatwe do zapisania, zapamiętania i nie ma zbędnych nawiasów. Ubywające potęgi x— współdziałają w szczególnie atrakcyjny sposób z operatorem A. Mamy bowiem A(x—) = ( x + i p - x 2Ł = (x + 1 ) x... (x —m + 2 ) — x ... (x —m + 2 ) (x —m + 1 ) = mx(x —1 ) . . . (x —m + 2 ). Jest to wygodny wzór, analogiczny do wzoru D(xm) = mxm_1: A(x^) = mx2^ i . Jest to podstawowa zależność rachunku różnicowego. (2.45) Operator D rachunku różniczkowego ma operator odwrotny— antypochodną (lub całkę) oznaczaną przez J. Podstawowe równanie rachunku róż niczkowego wiąże operatory D i J: g(X) = Df(x) <£> g(x) dx = f(x) + C We wzorze tym J g(x) dx, całka nieoznaczona z g(x), jest klasą funkcji, któ rych pochodna jest równa g(x). Podobnie dla operatora A istnieje operator odwrotny, antyróżnica (albo suma) JI, a odpowiednie twierdzenie podsta wowe wyraża się następująco: g(x) = Af(x) O ^ g ( x ) 6 x = f(x) + C . (2.46) Rolę sumy nieoznaczonej dla funkcji g(x) pełni tu wyrażenie X^9(x )6x, oznaczające klasę funkcji, dla których różnica wynosi g(x). (Zwróć uwagę na to, że symbol 6 ma się tak do A, jak symbol d do D.) Symbol „C” dla całek nieoznaczonych oznaczał dowolną stałą, tutaj, w przypadku sum nieoznaczo nych, oznacza dowolną funkcję okresową p(x) taką, że p ( x + 1) = p(x). Na przykład C mogłoby być okresową funkcją a + b s in 27tx; takie funkcje zni kają, gdy działamy na nie operatorem różnicy, tak jak stałe znikają przy różniczkowaniu. Dla całkowitych argumentów x funkcja C jest stała. Dochodzimy już prawie do sedna. W rachunku różniczkowym znajdziemy również całki oznaczone : jeśli g(x) = D f(x), to [ g(x) dx = f(x) Ja = f(b) — f ( a ) . Q W związku z tym rachunek różnicowy—zawsze starający się naśladować swo jego sławnego kuzyna— zawiera też sumy oznaczone : jeśli g(x) = Af(x), to »Y—n g(x)óx = f(x) i-i = f(b) —f (a ) . Wzór ten nadaje znaczenie notacji (2.47) g(x) óx, podobnie jak poprzedni wzór definiował J a g(x) dx. Co znaczy jednak intuicyjnie rzecz biorąc zapis g(x) 6x? Zdefiniowa liśmy ten obiekt przecież na zasadzie analogii, a nie konieczności. To, że ana logia taka zachodzi, pozwala nam łatwo zapamiętywać zasady rachunku róż nicowego, ale sama notacja jest bezużyteczna, jeśli nie będziemy rozumieli jej znaczenia. Spróbujmy je wydedukować, przyglądając się najpierw paru szcze gólnym przypadkom. Załóżmy przy tym, że g(x) = Af(x) = f(x + 1) —f(x). Jeśli b = a, to „Quemadmodum ad differentiam denotandam usi sumus signo A , ita summam indicabimus signo I . ... ex quo aeąuatio z = A y , si inveńatur, dabit quoque y = Iz + C .” L. Euler [110] Dalej, jeśli b = a + 1, to w wyniku dostajemy Y a+1 g { x ) 5x = f(a + 1 ) —f(a) = g ( a ) . L— a Ogólnie, jeśli b zwiększa się o 1, to 2 2 ^+ 1 g(x)Sx - ] T * g ( x ) 6 x = (f(b + 1) — f(a)) — (f(b) — f(a)) = f(b + 1 ) - f ( b ) = g(b). Na podstawie powyższych obserwacji i indukcji matematycznej możemy wydedukować, co dokładnie oznacza w ogólności ]T £ g(x) całkowitych a oraz b spełniających warunek b ^ a: b Y _ b_1 g(x)5x = ^ g (k ) k=a. = Y . g(k), c a łk o w i t e b ^ cl. ( 2 . 48) a^kcb Innymi słowy, suma oznaczona to to samo co zwykła suma, tyle że pomijamy składnik odpowiadający górnemu ograniczeniu. Spróbujmy spojrzeć się na to w nieco inny sposób. Załóżmy, że dostali śmy do policzenia nie znaną nam sumę, której postać zwartą mamy znaleźć. Załóżmy też, że możemy ją zapisać w postaci H a<k<b 9 (k) = Z a 9 M 5 x . Teoria rachunku różnicowego podpowiada nam, że możemy dostać rozwiąza nie w postaci f(b) —f(a), jeśli tylko uda się nam znaleźć nieoznaczoną sumę (czyli antyróżnicę) f, taką że g(x) = f(x + 1) — f(x). Dobrą metodą zrozu mienia tego jest wypisanie sumy H a<ck<b 90 0 w całości przy użyciu notacji wielokropkowej: Y_ (f(k + 1) —f(k)) = ( f ( a + T ) - f ( a ) ) + ( f ( a + 2 ) - f ( a + 1 ) ) + • • • a^kcb + (f ( b - 1 ) - f ( b - 2 ) ) + (f(b) - f ( b - 1 ) ) . A ja cały czas myślałem, że to się nazywa teleskopowe, bo bardzo długie wyrażenie składa się tak jak teleskop do bardzo krótkiego. Wszystkie wyrazy po prawej stronie kasują się nawzajem poza f(b) — f(a); wartością naszej sumy jest więc f(b) — f(a). (Sumy postaci H a<k<b(f(k. + 1 ) —f (k)) często nazywane są teleskopowym i przez podobieństwo ze składa nym teleskopem, gdyż grubość obudowy złożonego teleskopu zależy jedynie od zewnętrznego promienia najbardziej zewnętrznej tuby i od wewnętrznego promienia tuby najbardziej wewnętrznej.) Prawo (2.48) stosuje się tylko wtedy, gdy b ^ a. Co się jednak stanie, jeżeli b < a? Wszystko będzie w porządku, równanie (2.47) gwarantuje, że zachodzi Jest to równanie analogiczne do odpowiedniego równania dla całkowania oznaczonego. Podobnie rozumując, dowodzimy, że + = Ha> co âje nam sumacyjny odpowiednik tożsamości J Q + = J^. W pełnej krasie: V h g(x)óx + y ~ % (x ) 6x = V Cg(x)óx, ^— a z—b z— a (2 4 9 ) dla wszystkich liczb całkowitych a, b oraz c. Niewątpliwie w tym momencie niektórzy zastanawiają się zapewne, jak możemy wykorzystać te analogie i paralele. Mamy niewątpliwie jeden atut w ręku: sumowanie oznaczone dostarcza nam prostej metody sumowania uby wających potęg: z podstawowych równań (2.45), (2.47), i (2.48) wynika ogólne prawo ]cm ±i k- = O^kcn m+ 1 n ra+1 m+ 1 dla całkowitych m ,n ^ 0. (2.50) Wzór ten łatwo zapamiętać, gdyż bardzo przypomina doskonale znany wzór Jo x m dx = n m+l/ ( m + 1 ) . W szczególności, gdy m = 1 dostajemy k - = k, więc zasady rachunku różnicowego dają nam prostą metodę zapamiętania, że Y k = T O^kcn = n{-n ~ ' V 2 - Metoda sum oznaczonych podpowiada nam, że nieco łatwiej jest liczyć sumy względem 0 ^ k < rt, niż względem 1 ^ k ^ rt, gdyż te pierwsze są równe po prostu f(n) —f(0), podczas gdy te drugie muszą być wyliczone jako f(n + D -f(i). Zwykłe potęgi też można sumować tym nowym sposobem, najpierw trze ba je jednak wyrazić jako kombinację ubywających potęg, na przykład: k2 = k - + k - , więc Y _ k2 = ' T + T 0^k<n = 3 n (n _ 1) ( n - 2 + §) = ± n ( n - ^ ) ( n , - 1). Zamieniając teraz rt na rt + 1 dostajemy kolejną metodę policzenia wartości naszej starej znajomej sumy Dn = L o^ k ^ n ^ 2 w postaci zwartej. W porządku, to było całkiem proste. Na dobrą sprawę to było to prost sze niż którakolwiek z dotychczasowych metod, które na śmierć zamęczyły Pozostali zastanawiają się nad tym już od pewnego czasu. tę biedną sumę już w poprzednim podrozdziale. Spróbujmy więc trochę am bitniej policzyć sumę sześcianów. Proste rachunki dają nam k 3 = k^ + 31cż + lcl. (Zawsze można dokonać konwersji między potęgami zwykłymi a ubywają cymi za pomocą liczb Stirlinga, którymi zajmiemy się w rozdziale 6.) Zatem CLîv\ u Ubywające potęgi są więc bardzo poręczne dla sum. Czy mają one jeszcze jakieś inne przyjemne własności? Czy zanim zabierzemy się do sumowania musimy zawsze dokonywać konwersji naszych zwykłych potęg do potęg uby wających, a potem, dokonawszy sumowania, znowu męczyć się z konwersją wyniku? Okazuje się, że nie. Możemy od razu zabrać się do pracy z potęgami ubywającymi, gdyż mają one dodatkowe własności. Na przykład, podobnie jak w przypadku potęg normalnych, gdzie mamy (x + y )2 = x2 + 2xy + y 2} tak tutaj zachodzi (x + y ) - = x - + 2x - y - + y 2. Analogiczne wzory zachodzą też dla (x + ij)m i (x + ij)— (ten „wzór dwumianowy” zostanie udowodniony w ćwiczeniu 5.37). Do tej pory rozważaliśmy jedynie potęgi ubywające z nieujemnymi wy kładnikami. Aby rozszerzyć naszą analogię do ujemnych wykładników, mu simy dobrze określić, co rozumiemy przez x— dla m < 0. Przyglądając się ciągowi zauważamy, że aby przejść z x - do x - do x - do x-, dzielimy kolejno przez x —2, następnie przez x — 1 i w końcu przez x. Wydaje się rozsądne (jeśli nie konieczne), aby teraz w celu otrzymania x— z x - dokonać dzielenia tego ostatniego przez x + 1. Idąc tak dalej, dostaniemy kolejne wykładniki uby wających potęg ujemnych: x+ 1 (x + 1)(x + 2 ) ’ 1 (x + 1)(x + 2)(x + 3) a nasza ogólna definicja ujemnych potęg ubywających przedstawia się nastę pująco: x ^ = ------ —----- ■!----- ---------- , ( x + 1)(x + 2 ) . . . ( x + m) dla m > 0 . (2 .51 ) v 0 ' (Ubywające potęgi można również określić dla m rzeczywistych, a nawet zespolonych, odłóżmy to jednak do rozdziału 5.) Tak zdefiniowane potęgi ubywające mają dalsze przyjemne własności. Być może najważniejszą z nich jest ogólne prawo wykładników, analogiczne do prawa xm+n _ zachodzącego dla potęg zwykłych. Analogiczny wzór dla potęg ubywających wygląda tak: xm+n _ xm jx _ mjn ^ dla rn i rt całkowitych. (2 .52 ) Na przykład x^±^- = x -(x —2)-, a dla ujemnego n mamy xiz3 = x—(x 2 )— = - J - = x=±. = x ( x - 1 ) 7----- 1 (x - 1)x(x + 1) X+1 Gdybyśmy zdefiniowali x— jako 1/x zamiast 1/ (x + l), to prawo wykładników (2.52) nie byłoby spełnione dla przypadków takich jak m = —1 i rt = 1. Na dobrą sprawę mogliśmy użyć równania (2.52) do wymuszenia odpowiedniej definicji ujemnych potęg ubywających przez podstawienie m = —n. Kiedy istniejąca notacja ma objąć większą liczbę przypadków, dobrze jest ją tak uogólnić, aby ogólne prawa nadal zachodziły. Przekonajmy się jeszcze, że podstawowa własność dla różnicy ubywają cych potęg zachodzi także w przypadku dopiero co zdefiniowanych ujemnych potęg ubywających. Czy rzeczywiście Ax— = m x^^l dla m < 0? Jeśli np. m = —2 , to różnica wynosi Ax— = _ 1 1 (x + 2)(x + 3) (x + 1)(x + 2) (x + 1) —(x + 3) (x + 1) (x + 2) (x + 3) = —2 x— . Tak— to działa! Podobne wyprowadzenie można przeprowadzić dla każdego m < 0. Własność (2.50) zachodzi więc także dla ujemnych potęg ubywających. I wszystko jest w porządku, pod warunkiem, że unikniemy dzielenia przez 0: > b —a .m+1 x— óx = dla m ^ - 1 m+ 1 Co jednak będzie, gdy m = —1? Gwoli przypomnienia, w przypadku całek mamy dla m = —1 : 1 dx = ln x Chcielibyśmy zatem znaleźć skończony odpowiednik dla lnx. Innymi słowy, szukamy funkcji f(x) takiej, że x= I = X+1 = Af (x) = f (x + 1) —f ( x ). Nietrudno jest zauważyć, że + f(x) - J + 2 + 0,577 dokładnie? Może oni mają na myśli 1/y/3 ? 1 jest taką właśnie funkcją dla x będącego liczbą całkowitą. Dostaliśmy więc po prostu liczbę harmoniczną Hx z równania (2.13). Liczba Hx jest zatem dyskretnym odpowiednikiem ciągłej funkcji lnx. (W rozdziale 6 zdefiniu jemy Hx dla niecałkowitych x, ale całkowite wartości wystarczają nam do bieżących potrzeb. Jak się o tym przekonamy w rozdziale 9, dla dużych x wartość Hx —ln x jest w przybliżeniu równa 0,577 +1 / ( 2x ). Funkcje Hx oraz ln x są nie tylko analogiczne, lecz także ich wartości różnią się zazwyczaj o mniej niż 1.) Możemy już przedstawić pełny wzór na sumowanie ubywających potęg: .m+1 £ 6x = m 1 jeśli m ^ - 1 ; (2-53) b Hx jeśli m = —1 Wzór ten wyjaśnia, dlaczego liczby harmoniczne ukazują się tak często w roz wiązaniach problemów dyskretnych, takich jak analiza algorytmu sortowania szybkiego. Podobnie zresztą logarytmy naturalne pojawiają się w naturalny sposób w rozwiązaniach problemów ciągłych. Skoro znaleźliśmy odpowiednik funkcji lnx, może zastanówmy się, co powinno odpowiadać funkcji ex? Która z funkcji f(x) ma tę własność, że Af(x) = f(x), tak jak D ex = ex? Proste: f(x + T ) — f(x) = f(x) <= $ f ( x + 1 ) = 2 f(x ); mamy więc do czynienia z prostą rekurencją i możemy przyjąć, że funkcja f(x) = 2X jest dyskretnym odpowiednikiem funkcji ex. Różnica dla funkcji cx jest także prosta, a mianowicie dla każdego c: A(cx ) = cx+I - cx = ( c - 1)cx . W związku z tym antyróżnicą funkcji cx jest cx/(c — 1), dla c ^ 1. Fakt ten wraz z podstawowymi prawami (2.47) i (2.48) daje nam zręczną metodę zrozumienia ogólnego wzoru na sumę ciągu geometrycznego: cb - c a Z ck = a^kcb = Ilekroć napotkamy funkcję f, której postać zwarta mogłaby być uży teczna, możemy policzyć jej różnicę Af = g uzyskując funkcję g, taką że suma nieoznaczona Y 9 (x ) ^x Jes^ znana. Tabela 74 zawiera kilka najprost szych, użytecznych przy sumowaniu par różnica-antyróżnica. Pomimo wielu analogii między matematyką ciągłą a dyskretną, niektóre z pojęć ciągłych nie mają swojego dyskretnego odpowiednika. Na przykład reguła różniczkowania funkcji złożonej nie ma odpowiadającego jej wzoru w rachunku różnicowym; nie istnieje żaden sensowny wzór na Af (g (x )). Podob nie zamiana zmiennych w przypadku dyskretnym jest trudna, poza paroma konkretnymi podstawieniami w stylu zamiany x n a c ± x . Na szczęście A (f (x) g(x)) m a całkiem zgrabną postać i dostarcza nam re guły na sumowanie przez części. Jest to dyskretny odpowiednik całkowania przez części. Przypomnijmy, że wzór D(uv) = u D v + v D u w rachunku różniczkowym prowadzi po scałkowaniu i uporządkowaniu zmien nych do wzoru na całkowanie przez części, [ u Dv = uv —| v D u . Podobny wzór możemy wyprowadzić w rachunku różnicowym. * Zaczynamy od zastosowania operatora różnicowego do iloczynu dwóch funkcji u(x) i v(x): A (u(x)v(x)) = u (x + 1) v (x + l) —u(x) v(x) = u ( x + l ) v(x + 1 ) —u(x) v ( x + l) + u(x) v (x+ 1) - u(x) v(x) = u(x) Av(x) + v (x + 1) A u (x ). (2 .5 4 ) Tabela 74 jest na stronie 74. Tabela 74. Jaka to różnica? f = Igą Af = g f 0' *;iv | X1 = X 1 m r» {^X- = x(x — 1) •*;; 2x 'j"\ e)'! {ff x— mx!.-a-125^1 x 22± i / ( m + 1) xm H, x = i = 1/(x + 1) ' r;-V l H* U M : C' ‘ cx/ ( c - 1) r| , c’ 3 *• cf f+ g fg _ cAf Af + Ag fAg + EgAf Wzór ten można wyrazić w dogodnej postaci za pomocą operatora prze sunięcia E, zdefiniowanego jako Ef(x) = f ( x + 1). Po podstawieniu Ev(x) w miejsce v(x+1) otrzymujemy zwartą postać wzoru na różnicę iloczynu: A(uv) = u A v + Ev Au Rachunek różniczkowy unika operatora E przyjmując, że 1 -> 0. (Operator E jest nieco przykrym zaskoczeniem, ale nic nie możemy poradzić, bez niego wzór nie byłby prawdziwy.) Biorąc teraz sumę nieoznaczoną po obu stronach równania i przenosząc odpowiednie składniki na jedną stronę, uzyskujemy zapowiedziany wzór na sumowanie przez części: y~ u Av = uv — Domyślam się, ie ex = 2X, d/a małych wartości 1 . ( 2 .55 ) ^v (2 .56 ) Tak jak w rachunku całkowym, można zastąpić węzystkie.składniki wzoru ich granicami, dostając wzór na sumowanie oznaczone. Wzór ten jest użyteczny wtedy, gdy lewa strona jest trudniejsza do wy liczenia niż prawa. Przyjrzyjmy się przykładowi. Funkcja J xex dx stanowi typowy przykład, kiedy stosujemy całkowanie przez części. Jej dyskretnym odpowiednikiem jest funkcja *2 Xóx, którą już rozważaliśmy w tym roz dziale w postaci k 2 k. Aby przesumować ją przez części, przyjmujemy u(x) = x i Av(x) = 2X; w takim razie Au(x) = 1, v(x) = 2X i Ev(x) = 2X+1. Po podstawieniu do zależności ( 2 .56 ), otrzymujemy ^ x 2 x Sx = x 2 x - J 2 2X+1 8x = x2-X ~ 2X+1 + c * Możemy zastosować tę postać do wyliczenia rozważanej już sumy, wprowa- dzając granice przedziału: rt+l Y_ k2k = Y 0 x2* bx k=0 n+1 = x T - 2 X+1 0 = ( ( n + 1 ) 2 n+1 - 2 n+2) —(0-2° —21) = ( n - 1 ) 2 n+1+ 2 Ta metoda jest o tyle prostsza od zastosowania metody zaburzania, że nie musimy tu w ogóle wysilać umysłu. Wcześniej w tym rozdziale natknęliśmy się na problem znalezienia wzoru Zôsck<n 1 szcz?śliwie udało się nam sobie z nim poradzić. Czy mogli byśmy jednak znaleźć wzór ( 2 .3 6 ) w systematyczny sposób, gdybyśmy zasto sowali sumowanie przez części? Zademonstrujmy to wyliczając sumę, która wygląda nawet na nieco trudniejszą, Ho^kcn^Hk- Rozwiązanie nie jest ta kie trudne, jeśli przypomnimy sobie, jak postępuje się z całką J x ln x d x . Przyjmujemy u(x) = Hx i Av(x) = x = x-, więc Au(x) = x— , v(x) = x -/2 , Ev(x) = (x + 1) - /2 i dostajemy x2 ^ x H x 6 x = — Hx - = f» , -- — 2 HH > (* + l £ X— -1 óx ^ x i 8x + C (przejście z pierwszego wiersza do drugiego polegało na zastosowaniu prawa wykładników ( 2 .5 2 ) do dwóch ubywających potęg (x + 1 ) - x — z m = —1 oraz n = 2). Możemy teraz wprowadzić ograniczenia górne i dolne i ostatecz nie dochodzimy do wniosku, że Y _ kHk = ^ x H x 5x = ^ ( H n - l ) . O^kcn ( 2 -57) 2.7. Sum y nieskończone Kiedy zdefiniowaliśmy notację Y_ na początku tego rozdziału, pytanie o sumy nieskończone zbyliśmy mówiąc, że zajmiemy się tym później i że na razie mo żemy przyjąć, iż w rozważanych sumach jedynie skończona liczba wyrazów przybiera wartości niezerowe. Nadeszła jednak pora prawdy i musimy przy Ostatecznym celem matematyki jest eliminacja jakiejkolwiek potrzeby używania umysłu. znać, że sumy mogą być nieskończone. Co ciekawe, sumy nieskończone niosą ze sobą zarówno złe, jak i dobre wieści. Najpierw złe wieści. Okazuje się, że nie wszystkie metody przetwarzania sum są poprawne, gdy stosujemy je do sum nieskończonych. A teraz do bre wieści. Istnieje spora klasa sum nieskończonych, które można bez obawy przekształcać za pomocą wszystkich wprowadzonych operacji. Powody, które stoją za oboma tymi spostrzeżeniami, staną się jasne, gdy tylko przyjrzymy się z bliska temu, czym naprawdę jest sumowanie. Jest powszechnie wiadome, czym jest suma skończona. Dodajemy po pro stu parę wyrazów jeden po drugim, aż wszystkie będą dodane. Nieskończona suma musi być jednak zdefiniowana precyzyjniej, ażeby nie dojść do para doksalnych sytuacji. Wydaje się na przykład naturalne określenie naszych działań tak, że nie skończona suma S = 1 + 2 + i + g + n + 3i + --będzie równa 2 , gdyż po jej podwojeniu otrzymamy 2 S = 2 + 1 + -j + ^ + £ + ^ + -- - = 2 + S . Z drugiej strony, to samo rozumowanie pozwala nam dojść do wniosku, że T = 1 + 2 + 4-1-8 + 16 + 32-1----No jasne! 1 + 2 + 4 + 8 H---jest reprezentacją liczby —1 w kodzie uzupełnieniowym o nieskończonej długości słowa. równe jest —1. Jeśli bowiem podwoimy tę sumę, to dostaniemy 2T = 2 + 4 + 8 + 1 6 + 32 + 64 + --- = T - 1 . Dzieje się tu coś podejrzanego; jak można dostać liczbę ujemną przez sumo wanie wielkości dodatnich? Chyba lepiej pozostawić wyrażenie T nie zdefiniowane. A może warto uznać, że T = oo, gdyż dodawane wyrazy kumulują się w T do czegoś więk szego od dowolnej liczby skończonej? (Zauważmy, że oo jest „rozwiązaniem” równania 2T = T—1, podobnie jak jest „rozwiązaniem” równania 2S = 2+S. ) Spróbujmy sformułować dobrą definicję wartości ogólnej sumy H kęK a^, gdzie K może być nieskończone. Na początek przyjmijmy, że wszystkie wyrazy a k są nieujemne. Odpowiednia definicja nie jest trudna do znalezienia. Jeśli istnieje stała A taka, że X .ak ^ A k 6F dla każdego skończonego podzbioru F C K, to zdefiniujemy ]Tk6K najmniejsze takie A (z właściwości liczb rzeczywistych wynika, że zbiór 2.7. S um y n ieskoń czone wszystkich takich A musi mieć najmniejszy element). Jeśli jednak takiej ogra niczającej stałej A nie ma, to mówimy, że ]Tk€K ak = oo, co oznacza, że jeśli A jest liczbą rzeczywistą, to zawsze można dobrać taki skończony podzbiór wyrazów ak, których suma przekroczy A. Jag# Definicja z poprzedniego akapitu została sformułowana precyzyjnie; war tość sumy nie zależy więc od porządku, który mógłby istnieć w zbiorze indek sów K. W związku z tym wnioski, które zaraz wyciągniemy, będą prawdziwe również dla sum wielokrotnych z wieloma indeksami k i , k2 , . . . , a nie tylko dla sum względem zbioru liczb całkowitych. W przypadku szczególnym, kiedy K jest zbiorem liczb naturalnych, z naszej definicji dla nieujemnych wyrazów ak wynika, że V_ a k = • — tl— lim V~ O-k •■ k=0 Oto dlaczego: Każdy niemalejący ciąg liczb rzeczywistych ma granicę (być może oo). Jeśli granicą jest liczba A i jeśli F jest dowolnym skończonym zbio rem liczb naturalnych, którego żaden element nie przekracza ri, to H kGF ak ^ £ k=o ak ^ A. Zatem A = oo lub A jest stałą ograniczającą tę sumę. Jeśli A' jest jakąkolwiek liczbą mniejszą niż założona granica A, to istnieje takie n, że H k=o a k > A', i skończony zbiór F = { 0 ,1 ,... ,n} staje się przyczyną tego, że A' nie może być uznane za stałą ograniczającą. Przy użyciu wprowadzonej właśnie definicji możemy policzyć wartości pewnych nieskończonych sum. Na przykład, gdy a k = xk, otrzymujemy V xk = L— kÔ i _ •vn+l lim — -------- u-*oo I —X f 1 / ( 1 —x), \ oo, jeśli 0 ^ x < 1 ; jeśli x ^ 1 . W szczególności dwie dopiero co rozważane sumy nieskończonej liczby niezerowych elementów S i T mają odpowiednie wartości równe 2 i oo, tak jak przypuszczaliśmy. Innym ciekawym przypadkiem jest E kSO ( k + 1 ) ( k + 2) kÔ = lim > k— = k=0 n —^no ■ k— lim — tl— >-oo — = 1. Rozważmy teraz sytuację, kiedy w sumie występują także wyrazy ujemne. Czemu na przykład powinna być równa suma ] T ( - 1 )k = kÔ 1 — 1 + 1 —1 + 1 — 1 H-----? Zbiór K mógłby być nawet nieprzeliczalny, ale tylko przeliczalna liczba wyrazów mogłaby być niezerowa, jeżeli chcielibyśmy utrzymać stalą A , która ogranicza sumę z góry. Jeśli taka stała istnieje, to co najwyżej nA wyrazów może być większe lub równe l/n. „Aggregatum ąuantitatum a —a + a —a + a —a etc. nunc est = a, nunc = O, adeoąue continuata in infinitum serie ponendus = a/2, fateor acumen et veritatem animadversionis tuae.” G. Grandi [163] Jeśli pogrupujemy wyrazy parami, to dostaniemy ( 1 — 1) + ( 1 — 1) + ( 1 — 1)H----- = 0 + 0 + 0 + • • • , suma więc będzie równa 0. Jeśli jednak zaczniemy parować wyrazy poczyna jąc od drugiego, to dostaniemy 1 — (1 — 1 ) — (1 — 1 ) — (1 — 1 ) ------= 1 — 0 —0 — 0 -------- ; i suma wychodzi równa 1 . Możemy też we wzorze k > 0 xk = 1/{I —x) przyjąć x = —1, gdyż poka zaliśmy, że wzór ten zachodzi, gdy 0 ^ x < 1 ; w takim razie bylibyśmy jednak zmuszeni do przyjęcia, że ta nieskończona suma składająca się z samych liczb całkowitych równa jest \ \ Jeszcze jednym interesującym przypadkiem jest podwójnie nieskończona suma a k) gdzie ak = 1 /(k + 1 ) dla k ^ 0 i a k = 1 / ( k — 1 ) dla k < 0 . Możemy zapisać ją jako ----- 1- (~ J ) + (—5 ) + (—j ) + l + l + -----• ( 2 *58) Jeśli teraz wyliczymy tę sumę zaczynając od wyrazu „środkowego” i bę dziemy sumowali na zewnątrz w taki sposób: •• • + ( - * + (“ i + ( - i + 0 ) + 1 ) + i ) + i ) h > to otrzymamy wartość 1. Tę samą wartość dostaniemy, gdy przesuniemy wszystkie nawiasy o jeden wyraz w lewo: • " + H + H + (—3 + ( - l ) + D + ł ) + l ) + " - > gdyż suma wszystkich liczb wewnątrz środkowych rt nawiasów jest równa 1 1 1 , 1 1 --------------------------1--------7 n +—1 -----------------n 2 2 n —1 — , 1 1 -----------n n +T1T ' Podobne rozumowanie doprowadzi nas do wniosku, że otrzymamy 1, gdy na wiasy przesuniemy o dowolną ustaloną wartość w lewo lub w prawo. Upraw nia nas to do przypuszczenia, że wartością tej sumy jest 1. Nieoczekiwanie jednak, gdy pogrupujemy wyrazy w nieco inny sposób: • • • + ( - 5 + ( - i + ( - i + 1 + i ) + i + ?) + 5 + i ) + *‘ * » to n-ta para nawiasów, licząc od środka, zawiera liczby Udowodnimy w rozdziale 9, że limn^ 00 (H 2 n — Hn+i ) = ln2, zatem to prze grupowanie pozwala nam przypuszczać, że nasza suma o zbiorze indeksów nieograniczonym z obu stron może być w istocie równa 1 + ln 2 . Jest coś niepokojącego w sumie, która daje różne wartości w zależności od tego, jak pogrupujemy wyrazy. Zaawansowane książki z analizy matema tycznej dostarczają wielu definicji pozwalających nadać sensowne wartości takim patologicznym sumom, ale zaakceptowanie tych definicji oznaczałoby dla nas rezygnację z operowania notacją Y z taką swobodą, z jaką robiliśmy to dotychczas. Nie potrzebujemy w naszych rozważaniach subtelnego pojęcia zbieżności warunkowej. Przyjęta przez nas definicja jest na tyle prosta, że zachodzą wszystkie omówione do tej pory operacje, pozostaniemy więc przy tej uproszczonej wersji definicji sumy nieskończonej. W rzeczywistości nasza definicja sumy nieskończonej jest bardzo pro sta. Niech K będzie dowolnym zbiorem, natomiast a k—wartością rzeczywistą określoną dla każdego k G K. (Tutaj ‘k’ może oznaczać kilka indeksów k i , k2 , . . . , więc K można postrzegać jako indeks wielowymiarowy). Każdą liczbę rzeczywistą x można przedstawić jako różnicę jej części dodatniej i ujemnej: x = x+ —x_ , gdzie x+ = x • [x > 0 ] oraz x_ = —x • [x < 0 ]. (Albo x+ = 0, albo x _ = 0.) Wyjaśniliśmy właśnie, jak określić wartości sum nieskończonych postaci ^ keK a£ i Y keK a k , dla nieujemnych i a^. W związku z tym, definicja ogólna wygląda następująco: ^ ak = 2 K k€K keK - H ak> (2-59) keK chyba że obie sumy po prawej stronie są równe oo. W tym przypadku przyj mujemy, że wartość ^ keK a k jest nieokreślona. Niech A + = X,keK a ic >za^ ~ HkeK a ić• Jeżeli zarówno A+ , jak i Asą skończone, to mówimy, że suma 21 keK jes^ zbieżna bezwzględnie do wartości A = A+ —A - . Jeśli A + = oo, a jednocześnie A- jest skończone, to mówimy, że suma Y k eK a k rozbiega do +oo. Podobnie, jeśli A - = oo, a A + jest skończone, to mówimy, że Y kek ak rozbiega do —oo. Jeśli natomiast, A + = A - = oo, to nie ma co się męczyć ze zgadywaniem. Zaczęliśmy od definicji, która działała dla wyrazów nieujemnych, potem rozszerzyliśmy ją na wyrazy rzeczywiste. Dla liczb zespolonych kolejnego roz szerzenia dokonamy w naturalny sposób. Sumę Y keK definiujemy przez LkeK * akH-iLkeK âk»&dzie ;?tak oraz 3 a k są odpowiednio częścią rzeczy wistą i urojoną liczby a k— przy założeniu, że obie są określone. W przeciw nym razie przyjmujemy, że H keK ak jest nieokreślone (zob. ćwiczenie 18). Złe wieści, to, jak już mówiliśmy, nieokreśloności niektórych nieskończo nych sum; bardziej nam bowiem zależy na zachowaniu poprawności wprowa dzonych przekształceń, niż na ogólności definicji (zob. ćwiczenie 34). Dobre Innymi słowy, zbieżność bezwzględna oznacza, że suma wartości bezwzględnych jest zbieżna. F s - - , y ........... Czytając to po raz pierwszy lepiej jest odpuścić sobie następną stronę. Twój przyjazny asystent * m . m . ____________________ _____ w wieści to te, że gdy mamy do czynienia z sumami zbieżnymi bezwzględnie, tak jak je zdefiniowaliśmy, wówczas wszystkie przekształcenia wprowadzone w tym rozdziale zachowują swoją poprawność. Zweryfikujemy te dobre wieści pokazując, że każde z naszych przekształ ceń zachowuje wartości wszystkich sum zbieżnych bezwzględnie. Ściślej ozna cza to, że musimy udowodnić prawa rozdzielności, łączności i przemienności, a ponadto prawo niezależności wyniku sumowania od wyboru kolejności in deksów; wszystko inne wynika z tych czterech podstawowych praw. Prawo rozdzielności ( 2 . 15) może być ściślej sformułowane w następujący sposób: Jeśli ^ keK &k zbiega bezwzględnie do A i jeśli c jest liczbą zespoloną, to H k6K ca k zbiega bezwzględnie do cA. Możemy to udowodnić rozbijając naszą sumę na część rzeczywistą i urojoną, a każdą z nich dodatkowo na do datnią i ujemną. Dokonawszy tego rozbicia otrzymujemy prawo rozdzielności osobno dla każdej z tych sum, jako że każda z nich składa się z wyrazów nieujemnych, przy c > 0. Ze względu na to, że kGF CCLk = c HkeF ak ^la każdego zbioru skończonego F, prawo rozdzielności dla tych 4 części wynika z indukcji ze względu na rozmiar zbioru F. Prawo łączności (2 . 16) może być wyrażone następująco: Jeżeli J IkeK ak i Hic<ek s3 b ieżn e bezwzględnie odpowiednio do A i B, to suma HkeK(a k+ bk) jest zbieżna bezwzględnie do A + B. Fakt ten okazuje się szczególnym przypadkiem ogólniejszego twierdzenia, którego szkic dowodu podamy. Prawo przemienności ( 2 . 17) nie wymaga tu dowodu, gdyż na dobrą spra wę pokazaliśmy w trakcie dyskusji, jak otrzymać je jako szczególny przypadek zasady zamieniania kolejności sumowania. Dyskusja ta nastąpiła po przed stawieniu tożsamości ( 2 .35 ). Głównym faktem, który wymaga dowodu, jest podstawowe prawo sum wielokrotnych: sumy zbieżne bezwzględnie względem dwóch lub więcej indek sów mogą być sumowane najpierw względem dowolnego indeksu. Formalnie rzecz ujmując, udowodnimy, że jeśli J oraz {Kj | j e J} są dowolnymi zbiorami indeksów takimi, że y~ aj }k zbiega bezwzględnie do A , jej k £ K j to dla każdego j E J istnieje liczba zespolona Aj taka, że y~ aj,k zbiega bezwzględnie do Aj i kGKj y~ Aj zbiega bezwzględnie do A . jej Wystarczy udowodnić ten fakt dla przypadku, gdy wszystkie wyrazy są nieujemne, gdyż, jak już wiemy, ogólny przypadek można rozbić na część rzeczywistą i urojoną, dodatnią i ujemną. Załóżmy więc, że a.j)k ^ 0 dla wszystkich par (j,k) E M., gdzie M jest nadrzędnym zbiorem indeksowym {(j,k) | j e J .k e K ,} . Wiemy, że suma k)eM jes^ skończona, czyli że y O-jyk. ^ (j,lc)GF dla wszystkich skończonych podzbiorów F C M, i że A jest najmniejszym takim ograniczeniem (kresem górnym). Dla dowolnego j E J każda suma po staci ^ kGf. clîc, gdzie Fj jest skończonym podzbiorem zbioru Kj, jest ogra niczona z góry przez A. Wszystkie takie skończone sumy mają zatem kres górny Aj ^ 0 i jednocześnie, na mocy definicji, YkeK= Wciąż jeszcze pozostaje do udowodnienia, że A jest kresem górnym sum ^ j GG Aj dla wszystkich skończonych podzbiorów G C J. Załóżmy, że G jest skończonym podzbiorem zbioru }, przy czym XjeG ~ ^ ' > A- Możemy wtedy znaleźć skończone podzbiory Fj C Kj takie, że ^ kGF. ajłk > (A /A 7)Aj dla każdego j E G spełniającego Aj > 0. Istnieje co najmniej jedno takie j. Wtedy jednak H jGG kGF. a.j,k > (A /A 7) ^ j GG Aj = A, co przeczy faktowi, że dla wszystkich skończonych podzbiorów F C A/l zachodzi Y_{j k)eF ai,^ ^ A. Zatem ^ j GG Aj ^ A dla wszystkich skończonych podzbiorów G C J. W końcu niech A 7 będzie dowolną liczbą rzeczywistą mniejszą od A. Nasz dowód dobiegnie końca, jeśli pokażemy, że istnieje skończony zbiór G C J taki, że X,jGG Aj > A 7. Wiemy, że istnieje skończony zbiór F C M. spełniający ^ ( j k)GFa.j>k > A 7; niech więc G będzie zbiorem indeksów j ze zbioru F i przyjmijmy, że Fj = {k | (j,k) € F}. Wtedy £ j6G A,- > £ jgG LkgF, ai,k = ^(i,k)eF a i>k > W porządku. Nasze wzory są już dowiedzione. Wszystko, co do tej pory wyprawialiśmy z sumami nieskończonymi, jest uzasadnione, pod warunkiem, że istnieje skończone ograniczenie na wszystkie skończone sumy wartości bez względnych wyrazów. Ponieważ podwójnie nieskończona suma ( 2 .5 8 ) dała nam dwie odpowiedzi, zależne od porządku sumowania, więc jej dodatnie wyrazy 1 + \ + -j H-----muszą rozbiegać do 0 0 ; w przeciwnym razie dostali byśmy tę samą odpowiedź niezależnie od metody grupowania wyrazów. Ć w iczenia______________________________________ R ozgrzew ka 1 . Co oznacza notacja o Y _ qk? k=4 2 . Uprość wyrażenie x • ([x > 0] — [x < 0]). 3. Zademonstruj zrozumienie notacji Y przez wypisanie wszystkich wyra zów sum Y_ ak 0^ks$5 i Y_ a k2 • 0 ^k2^ 5 (Uwaga— druga suma jest podchwytliwa.) 4. Wyraź potrójną sumę y °-ijk jako trzykrotne sumowanie (z trzema znakami Y ) a) sumując najpierw względem k, potem względem j, oraz i; b) sumując najpierw względem i, potem względem j, oraz k. Wypisz również tę sumę wyraz po wyrazie, bez użycia notacji Y - Za pomocą nawiasów pokaż, co będzie sumowane i w jakiej kolejności. 5. Jaka jest wartość sumy £ k[1 ^ j ^ k ^ rt], w zależności od j i rt? 6 . Gdzie tkwi błąd w następującym przekształceniu? 7. Niech V f(x) = f(x) —f(x —1). Czemu jest równe V (xm)? 8 . Czemu jest równe 0—, dla danej liczby całkowitej m? 9. Jak powinno wyglądać prawo wykładników dla przyrastających potęg analogiczne do ( 2 .5 2 )? Zdefiniuj x -n tak, aby to prawo zachodziło także dla wykładników ujemnych. 10. Wyprowadziliśmy następujący wzór na różnicę iloczynu funkcji: A(uv) = u A v + E v A u . Jak to jest możliwe, żeby ten wzór był poprawny, skoro jego lewa strona jest symetryczna ze względu na u i v, a prawa strona symetryczna nie jest? Podstawy 1 1 . Ogólny wzór ( 2 .5 6 ) na sumowanie przez części jest równoważny następu jącemu wzorowi: y (cik+i —ak)bk = anbn —aobo O^kcn - ak+i(b k+ 1 - b k), O^kcn d la n ^ O . Udowodnij ten wzór wprost opierając się na prawach rozdzielności, łącz ności i przemienności. 12. Pokaż, że funkcja p(k) = k + (—1 )kc jest permutacją zbioru wszystkich liczb całkowitych dla każdej liczby całkowitej c. 13. Znajdź postać zwartą sumy 2Ik=o(—1)kk 2 za pomocą metody repertu aru. 14. Oblicz sumę 2Zk=i k2k wyrażając ją jako sumę podwójną ^ i ^ j ^ k<cn 2k. 15. Oblicz sumę = X!k=i k 3 za pomocą metody 5 w następujący sposób: Zauważywszy, że + D-a = jk, zastosuj równanie ( 2 .33). 16. Udowodnij, że x—/ [ x — n ) — = x—/ { x — m )—, pod warunkiem, że żaden z mianowników nie jest zerem. 17. Pokaż, że przy konwersji między potęgami przyrastającymi i ubywają cymi dla każdej liczby całkowitej m można stosować następujące wzory: x m = (—",)m(—x)— = (x + m - i p = 1/ ( x - 1) ^ ; 0x— = ( - 1)m(-x)™ = ( x - m + i r = 1/ ( x + l f ^ . (W odpowiedzi do ćwiczenia 9 jest zdefiniowane x- m .) 18. Niech oraz 3z będą odpowiednio częścią rzeczywistą i urojoną liczby rzeczywistej z. Wartość bezwzględną \z\ określamy jako ^ { 9 \z ) 2 + (3z)2. Suma Y-keK Qk wyrazów zespolonych a k jest zbieżna bezwzględnie, gdy sumy rzeczywistych wyrazów ^ keK 9^0.^ oraz â k są zbieżne bez względnie. Pokaż, że suma HkeK Qk jes^ zbieżna bezwzględnie wtedy i tylko wtedy, gdy istnieje stała B taka, że 2 IkGF la kl ^ B dla wszystkich skończonych podzbiorów F C K . Ć w iczen ia dom ow e 19. Korzystając z czynnika sumacyjnego rozwiąż rekurencję T0 = 5; 02Tn = u Ttl- i + 3 • n ! , dla n > 0. 20. Spróbuj obliczyć sumę £lk=o za pomocą metody zaburzania, ale tym razem wyprowadź wzór na X-k=o Hic2 1 . Oblicz za pomocą metody zaburzania sumy Sn = ^ k=0(—1)n-1c, Tn = ^ k=0( - l )TL_kk i Un = ^ £ = 0 (—1)TX~ kk 2 przy założeniu, że rt ^ 0 . 2 2 . Udowodnij tożsamość Lagrange’a (bez pomocy indukcji): Y_ 1^ j < k ^ n (cijbk — cikbj )2 = ( X . a M ( 'k = 1 ' k=1 X . b k ) ' _ ( H k=1 a k b * Trudno jest udowodnić tożsamość kogoś, kto nie żyje od prawie 200 lat. A tak naprawdę, udowodnij tożsamość dla ogólniejszej sumy podwójnej ^ (ciebie cif cb j) ( A j B k A icB j). 1<:j <k^n 23. Oblicz sumę J I k=1 (2k + 1)/k(k + 1) na dwa sposoby: Notację tę wprowadził Jacobi wr. 1829 [192]. a) Wyraź 1/k (k + 1) przez „ułamki proste” 1/k — 1/(k + 1). b) Zsumuj przez części. 24. Czemu jest równa suma H 0<ck<T1 Hk/(k + 1 )(k+2)? Wskazówka: Uogólnij wyprowadzenie wzoru ( 2 .57 ). 25. Notacja flkeK ak oznacza iloczyn liczb a k dla wszystkich k G K. Za łóżmy dla prostoty, że a k ^ 1 jedynie dla skończenie wielu k. Nie bę dziemy więc zmuszeni definiować znaczenia iloczynów nieskończonych. Jakie prawa analogiczne do praw rozdzielności, łączności i przemienności zachodzące dla sum spełnia notacja ]^[? 26. Wyraź podwójny iloczyn Eli ^j<ck<cn a)a k za pomocą pojedynczego ilo czynu rik = i Qk> stosując przekształcenia notacji (Ćwiczenie to daje nam iloczynowy wzór analogiczny do tożsamości górnego trójkąta ( 2 .33 ).) 27. Oblicz A (c-) i wykorzystaj wynik do wyliczenia wartości X k = i (—2)—/k . 28. W którym miejscu poniższe wyprowadzenie zwodzi nas na manowce? Zadania egzam in acyjn e 29. Oblicz sumę X.k=i (—^)kk /(4k 2 — 1). 30. Jak łatwo sprawdzić, liczba 15 daje się przedstawić na 4 różne sposoby jako suma kolejnych liczb naturalnych, włączając w to samą liczbę 15 jako jeden z nich (znający karcianą grę cribbage niewątpliwie to wiedzą): 15 = 7 + 8 = 4 + 5 + 6 = 1 + 2 + 3 + 4 + 5 . Znajdź liczbę sposobów, na które można przedstawić liczbę 1050 jako sumę kolejnych liczb naturalnych. Ustalmy, tak jak powyżej, że trywialne przedstawienie 1050 jako samej siebie liczy się za jedno z nich. (Uwaga: znajomość reguł cribbage’a nie pomaga w rozwiązaniu zadania!) 31. Funkcja zeta Riemanna £(k) jest zdefiniowana jako nieskończona suma 1 1 v— 1 F + 3^ + " ' = E ł k • )3=i 1 Udowodnij, że~ 1) = 1- Czemu jest równe XLkî 32. Niech a —b = max(0, a —b). Udowodnij, że —"0? Y min(k, x —k) = ^ (x — (2 k + 1 )) kÔ kÔ dla wszystkich rzeczywistych x ^ 0. Wyraź wartość tej sumy w postaci zwartej. Zadania premiowane 33. Niech AkeK oznacza minimum z liczb a k (albo ich kres górny, gdy K jest nieskończony). Przyjmijmy, że każde z a k jest albo liczbą rzeczywistą, albo dboo. Które z praw analogicznych do praw działających dla notacji i n zachodzą także dla notacji Ą? (Zobacz ćwiczenie 25.) 34. Udowodnij, że jeśli suma 21 keK a k jes^ zgodnie z zasadą ( 2 .5 9 ) nie zdefi niowana, to jest bardzo wrażliwa na zmianę kolejności sumowania w na stępującym sensie: Jeśli A - i A + są dowolnymi liczbami rzeczywistymi, to można znaleźć taki ciąg Fi C F2 C F3 c • • • skończonych podzbio rów K, że y ak ^ A - , gdy n jest nieparzyste; ak ^ A+ , gdy rt jest parzyste. kGF^ 35. Udowodnij twierdzenie Goldbacha _ 1 1 1 1 1 1 1 1 _ ^ - 1 “ 3 + 7 + 8 + T5 + 24 + 26 + 3T + 35 + " ' - kep lc — 1 ’ gdzie P jest zbiorem „potęg doskonałych” zdefiniowanym rekurencyjnie: P = { m n I m ) 2, n ^ 2 , m ^ P}. 36. Samoopisujący się ciąg S. Golomba (f (1), f (2), f ( 3 ) , . . . ) jest jedynym nie małej ącym ciągiem liczb całkowitych dodatnich spełniających warunek, Prawa dżungli. że ciąg ten zawiera dokładnie f(k) wystąpień liczby k dla każdego k. Chwila namysłu odsłania nam początek ciągu: n 1 2 3 4 5 6 7 S 9 10 11 12 f(n) 1 2 2 3 3 4 4 4 5 5 5 6 Niech g(rt) będzie największą liczbą całkowitą m taką, że f(m ) = n. Pokaż, że a) 9(n) = L £ = , f(k). b) g(g(n)) = E k = i kfWc) g(g(g(n))) = ±ng(n)(g(n) + 1) - ^ g(k)(g(k) + 1). Problem badawczy 37. Czy wszystkie prostokąty l / k na l / ( k + 1 ) , dla k 1, mogą pokryć kwadrat o boku 1? (Przypominamy, że suma ich pól jest równa 1.) i i i !■ 3 Funkcje całkowitoliczbowe Liczby całkowite są duszą matematyki dyskretnej. Często jesteśmy zmuszeni przekształcać liczby wymierne lub rzeczywiste na liczby całkowite. Naszym celem w tym rozdziale będzie zaznajomienie się z tymi przekształceniami, nauczenie się czegoś o ich godnych uwagi własnościach i osiągnięcie biegłości w stosowaniu tych przekształceń. 3.1. Funkcje p o d ło g a i sufit Poznajmy funkcje podłoga (najbliższa z dołu liczba całkowita) i sufit (naj bliższa z góry liczba całkowita), które dla wszystkich liczb rzeczywistych x zdefiniowane są następująco: |_xj = największa liczba całkowita mniejsza lub równa x ; |Y| = najmniejsza liczba całkowita większa lub równa x . (3 .i) Notację-tę, jak również nazwy „podłoga” i „sufit,” wprowadził na początku lat sześćdziesiątych Kenneth E. Iverson [191, s. 1 2 ]. Zauważył, że zecerzy mogą uzyskać te symbole przez obcięcie górnych lub dolnych części nawia sów ‘ [’ i ‘] ’. Jego notacja stała się wkrótce powszechnie używana, tak że nawiasów podłogi i sufitu używa się w artykułach bez wyjaśniania ich zna czenia. Do niedawna oznaczało się największą liczbę całkowitą nie przekra czającą x przez *[x]\ Niestety nie było dobrego odpowiednika dla funkcji sufit. Niektórzy autorzy próbowali stosować ‘]x[*— bez powodzenia, co było do przewidzenia. Nie tylko oznaczano różnorodnie te funkcje, lecz także różnie je definio wano. Na przykład w niektórych kalkulatorach kieszonkowych znajdziemy funkcję INT zdefiniowaną dla x dodatnich jako |x_|, a. dla x ujemnych jako \x\. Projektanci tych kalkulatorów prawdopodobnie chcieli, by ich funkcja miała własność INT(—x) = —INT(x). My pozostaniemy wierni naszym funk cjom podłoga i sufit, zwłaszcza że mają one ładniejsze własności niż funkcja INT. )Au!( Dobrą metodą zaznajomienia się z funkcjami podłoga i sufit jest sporzą dzenie ich. wykresów. Tworzą one wzorce podobne do schodów, leżące powyżej i poniżej prostej f (x) = x: Z wykresu widzimy, że na przykład dla e = 2, 71828.. . [ej = 2 , L -e J ----- 3 , rei = 3 , [—e| = —2 . Przyglądając się temu wykresowi możemy zaobserwować kilka faktów o funk cjach podłoga i sufit. Na przykład wykres funkcji podłoga leży poniżej prostej f (x) = x, zatem [x\ ^ x. Z podobnej przyczyny zachodzi nierówność [x] ^ x. (Wynika to też bezpośrednio z definicji.) Obie funkcje są sobie równe dokład nie w punktach całkowitych:’ |_xj = x <ś=> x jest liczbą całkowitą <=> [x*| = x . (Używamy notacji ‘<ś=>’ w znaczeniu „wtedy i tylko wtedy, gdy”). Co więcej, gdy te funkcje się różnią, wówczas wartość funkcji sufit jest dokładnie o 1 większa niż podłogi: |Y| — [xj = [x nie jest liczbą całkowitą]. ( 3 .2 ) Jeśli przekątną układu współrzędnych przesuniemy o jedną jednostkę w dół, to znajdzie się ona poniżej wykresu funkcji podłoga, stąd x — 1 < [x j. Z podobnego powodu zachodzi nierówność x + 1 > |Y |. Łącząc te obserwacje otrzymujemy nierówności: ( 3 -3 ) Funkcje podłogi i sufitu są ponadto wzajemnie symetryczne względem środka układu współrzędnych: L-*J = - M ; r-*l = -W ■ (3 4 ) Stąd każda z nich może być wyrażona za pomocą drugiej funkcji. Fakt ten może wyjaśniać, czemu w przeszłości funkcja sufit nie miała swojej własnej notacji. Funkcję sufit napotykamy jednak dostatecznie często, by usprawiedli wiło to stworzenie dla niej szczególnego oznaczenia, podobnie jak zrobiliśmy to dla potęg przyrastających i ubywających. Matematycy od dawna znają i stosują takie pary funkcji jak sinus i cosinus, tangens i cotangens, secans i cosecans, maximum i minimum. Od teraz będziemy mieli parę funkcji podłoga i sufit. Ponieważ chcemy dowodzić własności funkcji podłoga i sufit, a nie tylko obserwować ich wygląd graficzny, bardzo przydadzą się nam cztery następu jące reguły: |_xj = rt <ś=> n ^ x < rt + 1 , (a) x- (b) 4=* rt — 1 < x ^ r t, (c)i3 ‘5j x ^ n < x+ 1. (d) |xj = n [x] = rt Wkrótce pojawią się ściany. |Y| = n 1 < n ^ x , (We wszystkich przypadkach zakładamy, że n jest liczbą całkowitą, x zaś jest liczbą rzeczywistą.) Reguły (a) i (c) wynikają bezpośrednio z definicji (3 . 1 ). Reguły (b) i (d) otrzymamy z reguł (a) i (c) po przestawieniu nierówności tak, by n znalazło się w środku. Składnik będący liczbą całkowitą możemy przesunąć do nawiasów pod łogi (lub sufitu) lub na zewnątrz: [x + nj = |_xj n, gdy rt jest liczbą całkowitą. ( 3 .6 ) (Wiemy przecież z reguły (3 -5 (a)), że ta równość jest równoważna nierówno ściom [x\ + rt ^ x + n < |_xj + n + 1.) Niestety dla mnożenia nie możemy wykonać podobnych operacji. Na przykład dla n = 2 i x = 1/2 otrzymamy [nxj / n|_xj. Oznacza to, że nawiasy podłogi i sufitu nie mają tak dobrych właściwości jak zwykłe nawiasy. Jeśli wystąpią one we wzorach, zwykle bę dziemy szczęśliwi, gdy uda się nam albo je usunąć, albo cokolwiek udowodnić. Okazuje się, że istnieje wiele sytuacji, gdy nawiasy podłogi i sufitu są zbędne. Możemy je zatem wstawiać lub usuwać wedle uznania. Na przy kład dowolna nierówność pomiędzy liczbą rzeczywistą a całkowitą jest równo- W 3« Funkcje całk ow itoliczb ow e 90; ważna nierówności pomiędzy liczbami całkowitymi: x < n 4=^ TL < X x ^ rt TL ^ X < u , (a) n < W . M ^ n, (b) |x j . n L*J • (c) ( 3 .7 ) (d) Reguły te są łatwe do udowodnienia. Na przykład, ze względu na to iż za chodzi |xj ^ x wiemy, że jeśli x < n, to |_xj < n. Na odwrót, jeśli |xj < n, to zachodzi x < n, ponieważ x < |_xj + 1 i [xj + 1 ^ n. Byłoby wspaniale, gdyby reguły (3 .7 ) byłyby równie łatwe do zapamięta nia jak są łatwe do udowodnienia. Każda z nierówności bez nawiasów podłogi i sufitu odpowiada pewnej nierówności z tymi nawiasami, ale musimy się dwa razy zastanowić, zanim zdecydujemy, którego z nawiasów należy użyć. Różnicę pomiędzy x i [ x j nazywamy częścią ułamkową x . Pojawia się ona w zastosowaniach dostatecznie często, by zasłużyła na swą własną notację: Hmmm. Lepiej nie używać {x} dla oznaczenia części ułamkowej, gdy może być ono pomylone ze zbiorem jednoelementowym zawierającym x. M = W- (3 .8 ) Ponieważ x = [xj + {x}, więc [xj nazywamy też częścią całkowitą x. Jeśli liczbę rzeczywistą zapiszemy w postaci x = n + 0 , gdzie rt jest liczbą całkowitą i 0 ^ 0 < 1 , to z reguły ( 3 -5 (a)) wnioskujemy, że rt = |_xj i 0 = {x}. Gdy rt jest dowolną liczbą rzeczywistą, równość (3 .6 ) nie jest prawdziwa. Dla |x + y j zachodzą jednak tylko dwa przypadki. Jeśli zapiszemy x = |x J + M i V = [v\ + {y}, wtedy otrzymamy | x + y j = |_XJ + lv\ + I M + M J- Ponieważ 0 ^ {x} + {y} < 2 , to [x + y \ równa się albo [xj + [y\ , albo |xj + [y\ + 1 . 3.2. U życie funkcji p o d ło g a i sufit Mamy już podstawowe narzędzia do posługiwania się funkcjami podłoga i su fit. Użyjmy ich zaczynając od nietrudnego zadania: Czemu równa się fig 35]? (Zgodnie z sugestią Edwarda M. Reingolda logarytm o podstawie 2 ozna czamy przez „Ig”.) Cóż, ponieważ 2 5 < 35 ^ 26, więc logarytmując obie strony nierówności otrzymamy 5 < lg 35 ^ 6 . Zatem z reguły ( 3 -5 (c)) wy nika, że [lg 35] = 6 . Zauważmy, że liczba 35 w zapisie dwójkowym ma długość 6 bitów: 35 = ( 1 0 0 0 1 1 )2 . Czy zawsze jest prawdą, że długość liczby n zapisanej dwójkowo równa się [lgn ]? Nie zawsze. Liczbę 32 = ( 1 0 0 0 0 0 ) 2 zapisujemy również za pomocą 6 bitów. Stąd [lgrt] nie jest właściwą odpowiedzią na nasze pytanie. (Odpowiedź jest błędna, co prawda, tylko dla n będących potęgami 2, ale ten błąd popełniamy nieskończenie wiele razy.) Prawidłową odpowiedź możemy znaleźć uświadamiając sobie, że za pomocą m bitów możemy zapisać każdą liczbę rt taką, że 2 m _ 1 ^ n < 2m. Stąd z reguły (3 -5 (a)) wynika, że m — 1 = [lgrij. Zatem m = Lig txJ + 1. Tak jest! Dla wszystkich n > 0 potrzebujemy [lgnj +1 bitów by zapisać n w systemie dwójkowym. Podobne rozumowanie doprowadzi nas do odpowiedzi |’lg(n + 1)]. Jeśli przyjmiemy, że liczba zero zapisana dwójkowo zajmuje zero bitów, to wzór ten jest również prawdziwy dla rt = 0 . Rozważmy kolejne wyrażenie z nawiasami podłogi i sufitu. Czemu równa się [L*J1? Proste— ponieważ [x \ jest liczbą całkowitą, więc |~[xj~| równa się właśnie [xj. Tyle też równa się dowolne wyrażenie składające się z dowolnej liczby nawiasów podłogi i sufitu otaczających |_xj. Teraz trudniejsze zadanie. Czy prawdziwe jest stwierdzenie: U /W J = IV*J > rzeczywiste x ^ 0 . ( 3 .9 ) Równość zachodzi wtedy, gdy x jest liczbą całkowitą, ponieważ w tym przy padku x = |xj. Równość zachodzi również w kilku szczególnych przypadkach, jak n = 3, 14 1 5 9 . . . , e = 2, 71828.. . i <t> = (1 + V 5 )/2 = 1, 61803. . . , gdyż otrzymamy 1 = 1 . Niepowodzenie w znalezieniu kontrprzykładu suge ruje, że równość zawsze zachodzi. Spróbujmy zatem ją udowodnić. Nawiasem mówiąc, gdy napotykamy pytanie „czy prawdą jest, że,” z dwóch powodów lepiej zrobimy próbując najpierw znaleźć kontrprzykład. Obalenie dowodu jest potencjalnie łatwiejsze (potrzebujemy tylko kontrprzy kładu), a szukanie dziury w całym działa inspirująco. Nawet jeśli stwierdzenie jest prawdziwe, nasze poszukiwania kontrprzykładu często doprowadzają nas do dowodu, gdy tylko zauważymy, czemu znalezienie kontrprzykładu sprawia nam trudność. Poza tym, dobrze jest być sceptycznym. Jeśli spróbujemy udowodnić równość [ \ / |_xj J = |_\/xj poznanymi w szkole metodami rachunku różniczkowego, możemy zacząć od przedstawienia x jako sumy części całkowitej i ułamkowej liczby x: [xj + {x} = rt + 0 i rozpisa nia pierwiastka kwadratowego za pomocą wzoru dwumianowego Newtona: (n + 0 ) 1//2 = n 1 /2 + n - 1//2 0 /2 —n - 3 //2 02/8 H-----. To podejście sprawi nam nielichy kłopot. Lepiej jest użyć metod właśnie przez nas odkrytych. Oto możliwy plan postępowania: pozbądźmy się jakoś zewnętrznych nawiasów i pierwiastka kwadratowego z wyrażenia |_vT*T] • Następnie usuńmy wewnętrzne nawiasy. Dodajmy z powrotem pierwiastek i nawiasy zewnętrzne, by otrzymać [y /x \. Dobrze. Niech m = LVTaTJ • Z reguły ( 3 -5 (a)) wynika, że m ^ vT*T < nH -l • Usunęliśmy właśnie zewnętrzne nawiasy nie tracąc przy tym jakiejkolwiek informacji. Ponieważ wszystkie trzy wyrażenia są nieujemne, więc po pod niesieniu do kwadratu otrzymamy nierówności m 2 ^ |xj < ( m + 1 ) 2. Po zbyliśmy się pierwiastka kwadratowego. By usunąć nawias podłogi stosu (Z pewnością n , e i ej) są pierwszymi liczbami rzeczywistymi, które musimy wypróbować, nieprawdaż?) Sceptycyzm jest dobry tylko w ograniczonym zakresie. Bycie sceptycznym względem dowodów i programów (zwłaszcza swoich) pozwoli prawdopodobnie zachować pracę i dobrą markę. Duża dawka sceptycyzmu zmienia człowieka w pracusia, który kosztem odpoczynku spędza czas w pracy. Zbyt wiele sceptycyzmu doprowadza do paraliżu, gdyż wiecznie zamartwiając się o poprawność nigdy nic nie skończysz. Sceptyk [3. Funkcje całkow itoliczbow c jemy regułę ( 3 .7 ( 01)) dla lewej nierówności, a regułę (3 -7 (a)) dla prawej: m2 x < ( m + 1 ) 2. Odtwórzmy teraz nasze kroki. Najpierw pierwiastku jemy, otrzymując m ^ y/x < m + 1 , a potem stosujemy regułę(3 -5 (a)), by uzyskać m = |_a/xJ . Stąd |_\/LXJ] = v n = |_a/xJ . Stwierdzenie jest prawdziwe. Podobnie możemy dowieść, że [a /M 1 — IV* 1 > dla liczb rzeczywistych x ^ 0 . Znaleziony dowód nie zależy istotnie od własności pierwiastka kwadra towego. Gdy przyjrzymy się bliżej dowodowi, zauważymy, że możemy go uogólnić. Niech f (x) będzie dowolną rosnącą, ciągłą funkcją, o własności f(x) = liczba całkowita =£> x = liczba całkowita. (Symbol ‘= > ’ oznacza „jeśli . . . to”.) Stąd otrzymujemy (Zauważył to R. J. McEliece.) LfMj = i f ( W ) j 1 r f w i = rf(M)i> ( 3 -1 0 ) wszędzie gdzie f (x), f ( [xj) i f ( |Y |) są zdefiniowane. Udowodnijmy tę ogólną własność tym razem dla nawiasów sufitu, ponieważ poprzedni dowód doty czył nawiasów podłogi i ponieważ dowód dla tych nawiasów jest prawie taki sam. Jeśli x = [x], to nie mamy nic do dowodzenia. W przeciwnym razie, ponieważ f jest funkcją rosnącą, zachodzi x < |Y| i f(x) < f(|Y |). Ponieważ funkcja |”| jest niemalejąca, stąd [f(x)"| ^ [f([x])]. Jeśli ff (x)~| < ff( f7c"| )"|, to ponieważ f jest ciągła, istnieje liczba y, taka że x y < M i f (y) = rfWlZ powodu szczególnej własności funkcji f, liczba y jest liczbą całkowitą. Nie istnieje jednak liczba całkowita leżąca pomiędzy x i [x \. Z tej sprzeczności wynika, że ff(x)] = [f( 1* 1 )1 Zwróćmy uwagę na pewien ważny przypadek tego twierdzenia: x + m. n |_xj + m n "x + m" rt ' M + m~ n (3 -n ) gdzie m i n są liczbami całkowitymi, a mianownik n jest liczbą dodatnią. Niech na przykład m = 0 i n = 10. Wtedy |_[|_x/10j/10j/10j = [x/1000j. Trzykrotne dzielenie przez 10 i pozbywanie się cyfr jest tym samym co po dzielenie przez 1 0 0 0 i odrzucenie reszty z dzielenia. Czy prawdą jest, że: I7 W 1 = IV * 1 , gdzie x ^ 0 jest liczbą rzeczywistą? Równość jest prawdziwa dla x = n i x = e, ale niestety nie dla x = ({>. Stąd wiemy, że nie jest prawdziwa w ogólności. Zanim pójdziemy dalej, zróbmy krótką dygresję na temat różnych rodza jów zadań, które to zadania mogą pojawiać się w książkach matematycznych. R od zaj 1 . Mając dany obiekt x i własność P(x), udow odnij, że P(x) jest prawdziwa. Na przykład, „Udowodnij, że [7tJ = 3.” Tutaj zadanie wymaga znalezienia dowodu pewnego sensownego faktu. R od zaj 2 . Mając dany zbiór X i własność P(x) udowodnij, że P(x) jest praw dziwa dla wszystkich x G X. Na przykład, „Udowodnij, że dla wszystkich liczb rzeczywitych x zachodzi |_*J ^ x.” Znowu, zadanie wymaga znalezie nia dowodu, ale dowód musi być tym razem ogólny. To czego tym razem potrzebujemy jest algebrą, a nie arytmetyką. R od zaj 3. Mając dany zbiór X i daną własność P(x) udowodnij lub za przecz zdaniu: ,,P(x) jest prawdziwa dla wszystkich x G X”. Na przykład: „Czy prawdą jest, że dla wszystkich liczb rzeczywistych x ^ 0 zachodzi W LXJ1 = \ y f r V Mamy tu dodatkowy poziom niepewności — nie znamy z góry odpowiedzi. Jest to bliższe prawdziwej sytuacji, z którą matematycy stale się spotykają— stwierdzenia, które znajdziemy w książkach są zwykle prawdziwe, lecz na najnowsze z nich powinniśmy patrzeć podejrzliwie. Jeśli stwierdzenie jest fałszywe, musimy znaleźć kontrprzykład. Jeśli stwierdzenie jest prawdziwe, musimy znaleźć dowód, tak jak w zadaniu rodzaju 2 . R o d zaj 4. Mając dany zbiór X i własność P(x) znajdź warunek konieczny i dostateczny Q(x) taki, że własność P(x) jest prawdziwa. Na przykład: „znajdź warunek konieczny i dostateczny, taki że |xj ^ [ x ] P r o b l e m e m jest znalezienie Q takiego, że P(x) Q(x). Oczywiście, zawsze ist nieje trywialna odpowiedź — możemy wziąć Q(x) = P(x), ale chcemy zna leźć możliwie jak najprostszy warunek. Znalezienie prostego i prawdziwego warunku wymaga trochę twórczej pracy. (Na przykład, w tym przypadku, ,,[xj ^ |Y| <ś=> x jest liczbą całkowitą.”) Dodatkowy wysiłek sprawia, że ten rodzaj problemów jest trudniejszy, ale też bardziej przypomina to, z czym matematycy spotykają się w „prawdziwym świecie”. Ostatecznie trzeba udowodnić, że P(x) jest prawdziwe wtedy i tylko wtedy, gdy Q(x) jest praw dziwe. R o d za j 5. Mając dany zbiór X, znajdź interesującą w łasność P(x) jego ele mentów. Teraz znajdujemy się w przeraźliwej krainie czystej nauki gdzie, jak mogą myśleć studenci, panuje totalny chaos. To jest prawdziwa matematyka. Autorzy książek rzadko ośmielają się zadawać pytanie piątego rodzaju. Koniec dygresji. Przekształćmy pytanie, które padło przy omawianiu za dań rodzaju 3, na pytanie rodzaju 4. Jaki jest konieczny i dostateczny wa runek na to, by |V |x J 1 = IV* 1? Zauważyliśmy, że równość zachodzi dla x = 3,142, ale nie dla x = 1,618. Dalsze eksperymenty pokażą, że równość jest fałszywa także dla x pomiędzy 9 i 10. Aha, Tak! Widzimy, że równość nie zachodzi, gdy tylko m 2 < x < m 2 + 1 , ponieważ z lewej strony równości W innych moich tekstach pytanie „czy prawdą jest, że” oznacza to samo co „udowodnij” w około 99,44% przypadków. Nie jest to prawdą w tej książce. Ałe nie prostszy. A. Einstein 3. Funkcje całk ow itoliczb ow e (Lub, przez pesymistów— jednostronnie domkniętymi.) mamy m, a z prawej m + 1. W innych przypadkach, gdzie ^/x jest określony, mianowicie gdy x = 0 lub m 2 + 1 ^ x ( m + 1 )2, otrzymujemy równość. Dlatego następujące zdanie jest koniecznym i dostatecznym warunkiem rów ności: Albo x jest liczbą całkowitą, albo ^/\x\ nią nie jest. Dla potrzeb naszego następnego zadania rozważmy wygodną notację, zasugerowaną przez C.A.R. Hoare’a i Lyle’a Ramshawa, dla przedziałów prostej rzeczywistej: [oc.. |3] oznacza zbiór liczb rzeczywistych x takich, że oc ^ x ^ |3. Zbiór ten jest zwany przedziałem d om kniętym , ponieważ za wiera oba końce oc i |3. Przedział nie zawierający żadnego z końców, ozna czany przez {oc.. |3), składa się ze wszystkich x takich, że oc < x < (3. Jest on nazywany przedziałem otwartym. Podobnie definiujemy przedziały [oc.. |3) i (a..|3] zawierające jeden ze swoich końców i nazywamy je przedziałami jednostronnie otwartymi. Jak dużo liczb całkowitych jest zawartych w tych przedziałach? Prze działy jednostronnie otwarte są łatwiejsze, więc zacznijmy od nich. Faktycz nie, przedziały jednostronnie otwarte są prawie zawsze przyjemniejsze od przedziałów domkniętych lub otwartych. Na przykład, są one addytywne — możemy połączyć jednostronnie otwarte przedziały [a. . (3 ) i [|3 . . y ) w je den jednostronnie otwarty przedział [oc..y). Nie możemy tego zrobić ani z przedziałami otwartymi, ponieważ pominiemy punkt (3, ani z przedziałami domkniętymi, ponieważ punkt |3 policzymy dwukrotnie. Wróćmy do zadania. Odpowiedź jest prosta, gdy oc i |3 są liczbami całko witymi. Wtedy jeśli założymy, że oc ^ |3, to przedział [oc. . |3) zawiera |3 — oc liczb całkowitych a, oc + 1, . . . , |3 — 1. Przy tym samym założeniu przedział {oc.. |3] zawiera również |3 — a liczb całkowitych. Nasze zadanie jest jednak trudniejsze, gdyż oc i |3 mogą być dowolnymi liczbami rzeczywistymi. Mimo to, możemy przekształcić ten problem do łatwiejszego, ponieważ zgodnie z regułami (3 .7 ) [al m , La J LPJ, gdzie rt jest liczbą całkowitą. Przedziały po prawej stronie kończą się w punk tach całkowitych i zawierają dokładnie tyle samo liczb całkowitych, co prze działy po lewej stronie kończące się w punktach rzeczywistych. Stąd przedział [<x..| 3 ) zawiera dokładnie [|3] — [cc] liczb całkowitych, a przedział (a. .| 3] zawiera ich L|3J — L<xJ. W tym przypadku zamiast wyrzucać— wprowadzamy nawiasy podłogi i sufitu. Przy okazji, istnieje prosty sposób zapamiętania, w którym przypadku użyć nawiasów podłogi, a w którym nawiasów sufitu. Przedziały jednostron nie otwarte, które zawierają lewy koniec, ale nie prawy (takie, że 0 ^ 0 < 1 ) są troszkę częściej spotykane od tych, które zawierają prawy koniec, ale nie zawierają lewego. Podobnie nawiasy podłogi są częściej spotykane niż na wiasy sufitu. Stąd, zgodnie z prawem Murphy’ego, właściwą zasadą będzie odwrotność tego, czego się spodziewaliśmy— nawias sufitu dla [o c . . |3 ) i pod łogi dla ( a . . |3]. Podobnie rozumując możemy pokazać, że domknięte przedziały [oc.. |3] zawierają dokładnie [|3J — \oć\ + 1 liczb całkowitych, a otwarte przedziały [oc.. |3) dokładnie f(3~| — [aj — 1. Do ostatniej formuły dodamy jednak zało żenie oc ^ |3, by nie kłopotać się stwierdzeniem, że pusty przedział [oc.. a ) zawiera w sumie —1 liczb całkowitych. Podsumowując, wywnioskowaliśmy następujące fakty: przedział liczba liczb całkowitych ograniczenia [ a . . p] LPJ - W + 1 oc^ (3 [a ..|3 ) m - w oc^ |3 (a ..|3 ] LPJ - L«J oc^ 13 ( a .. |3 ) TPl-W -1 oc < |3 Następnego zadania nie możemy pominąć. Klub Konkretnej Matmy po siada kasyno (dostępne tylko dla nabywców tej książki), w którym znajduje się ruletka z kołem o liczbach ponumerowanych od 1 do 100Ó. Jeżeli wylo sowana liczba rt będzie podzielna przez część całkowitą swego pierwiastka sześciennego, to znaczy gdy [v/nj \ n , wówczas wygrywamy i kasyno płaci nam 5 dolarów, w przeciwnym razie prze grywamy i płacimy kasynu dolara. (Notacja a \b , którą czytamy „a dzieli b,” oznacza, że b jest wielokrotnością a. W rozdziale 4 zajmiemy się dokładnie tą relacją.) Czy możemy się wzbogacić grając w te grę? Możemy wyliczyć średnią wygraną— to znaczy, ilość pieniędzy, jaką wy gramy (lub stracimy) przeciętnie w jednej grze — licząc wpierw liczbę W liczb wygrywających i liczbę P = 1000 —W liczb przegrywających. Jeżeli każdą liczbę wylosujemy jednokrotnie w ciągu 1 0 0 0 gier, to wygramy 5W dolarów i przegramy P dolarów. Stąd średnia wygrana wynosi 5W -P 1000 _ 5 W — (1000 —W) _ 6 W - 1 0 0 0 ” 1Ó0 Ó " 1Ó0 0 ’ Jeśli zatem liczb wygrywających jest 167 lub więcej, to zarobimy, w przeciw nym razie zarobi kasyno. Jak możemy policzyć liczbę wygrywających liczb pomiędzy 1 i 1000? Nie jest trudno zauważyć pewną regularność. Liczby od 1 do 2 3 — 1 = 7 są wygrywające, gdyż dla każdej z nich zachodzi [y/n \ = 1. Pomiędzy liczbami (Przeprowadzone na zajęciach głosowanie wykazało, że 28 studentów nie grałoby, 13 wzięłoby udział w grze, reszta nie była zdecydowana.) (Zaciekawiliśmy ich Klubem Konkretnej Matmy.) 2 3 = 8 i 3 3 — 1 = 26 tylko liczby parzyste wygrywają. Pomiędzy 3 3 = 27 i 4 3 — 1 = 63 wygrywają tylko liczby podzielne przez 3 itd. Szukaną liczbę W otrzymamy, gdy użyjemy techniki sumowania z roz działu 2 i skorzystamy z zalet konwencji Iversona przyporządkowującej zda niom logicznym wartości 0 lub 1 : 1000 W = ^ [n jest liczbą wygrywającą] n=1 [Lv^J\n] = Y [k=[^/nJl[k\n][1 ^rt^lOOO] = l^n^lOOO = k,n [k3 ^ rt < (k + 1)3] [n = km] [1 ^ rt 1000] k,m ,n = H - ^ [ k 3 ^ k m < ( k + 1}3][1 ^k<10] k,m = 1 + 2 1 [ m e [k2 . . ( k + 1 ) 3/k)][1 ^k<10] k,m = 1+^2 (T^2 + 3k + 3 + 1/k] — fk2l) 1^k<10 = 1+21 (3k + 4) = 1 + ^ y ^ - 9 = 172. Kk<10 Prawda! Zaraz, zaraz, gdzie jest to kasyno? Powyższe wyprowadzenie zasługuje na dokładne przestudiowanie. Zauważmy, że wiersz 6 wykorzystuje nasz wzór ( 3 . 1 2 ) na liczbę liczb całkowitych w prze dziale jednostronnie domkniętym. Jedynym „trudnym” manewrem jest de cyzja podjęta pomiędzy wierszami 3 i 4 by traktować rt = 1000 jako szcze gólny przypadek. (Nierówność k 3 ^ rt < ( k + 1 ) 3 nie współgra z nierównością 1 ^ rt ^ 1000 dla k = 10.) Ogólnie, graniczne warunki okazują się najbardziej krytyczną częścią ^-przekształceń. W ostatnim wierszu napisaliśmy, że W = 172. Zatem nasz wzór na średnią wygraną redukuje się do (6-172— 1000)/1000 dolarów, czyli 3 ,2 centów. Po zrobieniu 100 zakładów, każdy po dolarze, spodziewamy się być bogatsi o 3,20 dolarów. (Oczywiście, jeżeli kasyno nie uczyni pewnych liczb „równiejszymi” od innych.) Zadanie o kasynie, które właśnie rozwiązaliśmy, jest ubarwioną wersją bardziej przyziemnego pytania: „Jak wiele liczb całkowitych rt, gdzie 1 ^ rt ^ 1000, spełnia relację [y/n\ \ n?” Matematycznie oba pytania są tym samym, ale czasami dobrym pomysłem jest ubarwić zadanie. Mamy do dys pozycji bogatsze słownictwo (jak „wygrywający” i „przegrywający”), które pomaga nam w zrozumieniu istoty zadania. Uogólnijmy zadanie. Załóżmy, że zamieniamy 1000 na 1000000, lub nawet na większą liczbę N. (Zakładamy, że kasyno ma znajomości i może załatwić większe koło.) Ile jest wygrywających liczb? Stosujemy to samo rozumowanie, ale musimy być bardziej ostrożni postępując z największą wartością k, którą dla wygody oznaczymy przez K: K = L^NJ • (Poprzednio K wynosiło 10.) Całkowita liczba wygrywających liczb dla ogól nego N jest w = Y_ (3Tc + 4) + ]T [K3 ;gKm^N] 1^k<K m = i ( 7 + 3K + 1)(K-1) + L [ m e [K2 ..N/K]] m = §K2 + |K —4 + 2 2 [ m e [ K 2 ..N/K]] . Wiemy, że suma z ostatniego wiersza równa się [N/KJ — [K2] + 1 = |_N/KJ K2 + 1. Zatem wzór W = [N/Kj + ^K2 + | K - 3 , K = [\/NJ (3-13) daje ogólną odpowiedź dla koła z N liczbami. Pierwsze dwa składniki tego wzoru równają się w przybliżeniu N 2//3 + I N 2/ 3 = § N 2/3. Dla dużych N pozostałe składniki w porównaniu z pierw szymi są znacznie mniejsze. W rozdziale 9 nauczymy się, jak wyprowadzać wyrażenia podobne do W = f N 2/ 3 + 0 ( N 1/ 3 ) ) gdzie O f N 1/ 3) oznacza wielkość nie większą niż N 1/ 3 razy pewna stała. Ja kakolwiek by ta stała była, wiemy, że jest ona niezależna od N. Stąd dla du żych N udział O-składnika w W będzie bardzo mały w porównaniu z | N 2^3. Następująca tablica pokazuje na przykład, o ile różni się W od | N 2/ 3: N | N 2/3 W % błędu 1000 150,0 696,2 3231,7 15000,0 69623,8 323165,2 1500000,0 172 746 3343 15247 70158 324322 1502497 12,791 6,670 3,331 1,620 0,761 0,357 0,166 10000 100000 1000000 10000000 100000000 1000000000 Jest to bardzo dobre przybliżenie. ■W ttC Y ' ff ~ Przybliżone wzory są pożyteczne, ponieważ są prostsze niż wzory z na wiasami podłogi i sufitu. Dokładne wyniki jednakże są często również ważne, zwłaszcza dla mniejszych wartości N pojawiających się w zastosowaniach praktycznych. Na przykład właściciel kasyna może fałszywie założyć, że dla N = 1000 jest tylko | N 2//3 = 150 liczb wygrywających (w którym to przy padku kasyno wygrywałoby 10 centów). W ostatnim problemie poruszanym w tej części zbadajmy tak zwane widma (spectrum). Definiujemy widmo liczby rzeczywistej a jako nieskoń czony zbiór liczb całkowitych z powtórzeniami, Spec (a) = {[aj, [2aJ, |3aJ, . . . } . „Jeżeli x jest liczbą niewymierną mniejszą od jedności, to dla danych dwóch kolejnych liczb całkowitych znajdziemy między nimi dokładnie jeden wyraz jednego z ciągów m /x, m/(l —x), gdzie m jest liczbą całkowitą.” Rayleigh [305] Racja! Ponieważ musi wzrosnąć dokładnie jeden z liczników, gdy n powiększy się o 1 . (Zbiór z powtórzeniami jest podobny do zbioru, z tym że może on zawierać powtarzające się elementy.) Na przykład, widmo liczby 1/2 rozpoczyna się od liczb {0 , 1, 1 , 2 , 2 , 3 , 3 , . . . } . Łatwo udowodnimy, że widma są wzajemnie różne— to znaczy, że jeśli oc 7^ |3, to Spec (a) ^ Spec(|3). Bez straty ogólności możemy założyć, że oc < |3. Istnieje wtedy dodatnia liczba całkowita m taka, że m((3 — oc) ^ 1. (Faktycznie, może to być dowolna liczba m ^ [1/(13 — cc)], ale nie musimy się cały czas popisywać naszą wiedzą o funkcjach podłoga i sufit.) Zatem m|3 —moc ^ 1 i [m|3J > [m aj. Stąd Spec(|3) ma mniej niż m elementów nie większych niż [m aj, podczas gdy Spec(a) ma ich co najmniej m. Widma mają dużo pięknych własności. Rozważmy na przykład dwa zbio ry z powtórzeniami Spec(V2) = { 1, 2, 4, 5, 7, 8, 9, 11, 12, 14, 15, 16, 18, 19, 21, 22, 24, . . . } , Spec(2 + V 2) = { 3, 6, 10, 13, 17, 20, 23, 27, 30,34, 37,40, 44,47, 51,. .. }. Łatwo wyliczymy Spec(\/2) za pomocą kieszonkowego kalkulatora. Wtedy z równości ( 3 .6 ) wynika, że ri-ty element zbioru z powtórzeniami Spec(2 + y / l ) jest dokładnie o 2rt większy niż ri-ty element zbioru z powtórzeniami Spec(\/2). Gdy przyjrzymy się dokładnie obu zbiorom z powtórzeniami, wówczas spostrzeżemy, że są one również związane w jeszcze bardziej za dziwiający sposób— wydaje się, że brakujące liczby z jednego widma znaj dziemy w drugim i żadna liczba nie występuje równocześnie w obu wid mach! Jest to prawda. Zbiór dodatnich liczb całkowitych jest rozłączną sumą Spec(\/2) i Spec(2 + y / l ) . W takim przypadku mówimy, że widma tworzą podział zbioru dodatnich liczb całkowitych. Aby udowodnić to twierdzenie, musimy policzyć, ile elementów zbiorów S p ec(\/2 ) i Spec(2 + \ / l ) jest nie większych niż rt. Jeśli dla każdego rt suma będzie równa rt, to te dwa widma rzeczywiście są podziałem zbioru dodatnich liczb całkowitych. 3.2. Użycie funkcji podłoga i sufit Niech oc będzie liczbą dodatnią. Liczba elementów Spec(a) nie większych niż n wynosi Y [ LkocJ ^ n 1 k>0 N (c x ,n ) = = <TL + 1] k>0 = ^ [ k a < n + 1] k>0 Y k = (rt + 1 ) / cx] = r(n+n/cci - i . ( 3 *1 4 ) Wyprowadzenie to ma dwa interesujące miejsca. Po pierwsze, używa reguły m < rt+ 1 , m i n liczby całkowite ( 3 *1 5 ) by zmienić na '< ’. Stąd można usunąć dzięki regule ( 3 .7 ) nawias podłogi. Po drugie — i jest to bardziej subtelne — zakresem sumowania jest k > 0 zamiast k ^ 1 , ponieważ dla pewnych n i oc iloraz (n + l ) / a może być mniejszy niż 1. Jeśli zamiast wyznaczyć liczbę liczb całkowitych w przedziale (0 . . ( n + 1 )/oc), spróbowalibyśmy zastosować wzory ( 3 . 1 2 ), by wyznaczyć liczbę liczb całkowitych w przedziale [1 .. (n + 1 )/a ), to otrzymalibyśmy dobrą odpowiedź, ale nasze wyprowadzenie byłoby błędne. Dobrze, otrzymaliśmy wzór na N(cx,n). Teraz musimy stwierdzić, czy S pec(\/2) i Spec(2 + y / l ) dzielą dodatnie liczby całkowite, sprawdzając za pomocą wzoru ( 3 . 1 4 ), czy dla wszystkich liczb całkowitych n > 0 zachodzi N ( x / 2 , n ) + N ( 2 + v/2 , n ) = n : n+ 1 n +1 + -1 V2 1 2 + a/ 2 n + 1 ~7T + = n n +1 2 + y/l, wzór ( 3 .2 ); = n > n +1 n + 1 .+ n+ 1 V2 l V2 J 2+V2 {2 +^} Wszystko upraszcza się z powodu zgrabnej równości i J_ 1 y /l 2 + y /l = 1. n, wzór ( 3 .8 ). Wystarczy teraz sprawdzić, czy dla wszystkich rt > O zachodzi rt + 1 = 1. V2 Równość to jest prawdziwa, gdyż jest to suma części ułamkowych dwóch liczb, które po dodaniu dają liczbę całkowitą rt + 1. Zatem jest to podział. 3.3. R ekurencje z p o d ło g ą i sufitem ____________ Funkcje podłoga i sufit nadają nowy wymiar badaniom nad relacjami rekurencyjnymi. Spójrzmy najpierw na rekurencję Ko = 1 ; Kn+1 = 1 + min(2KLn/2 j,3 K Ln/3j ) , dla n > 0. (3 -1 6 ) Stąd na przykład Ki równa się 1 + min(2Ko,3Ko) = 3 i ciąg zaczyna się od liczb 1, 3, 3, 4, 7, 7, 7, 9, 9, 10, 13, . . . . Jeden z autorów tej książki skromnie zadecydował nazwać te liczby liczbami Knutha. W ćwiczeniu 25 zostaniemy zapytani, czy prawdą jest, że dla wszyst kich rt ^ 0 zachodzi Kn ^ rt. Kilka właśnie wyliczonych pierwszych wartości ciągu K spełnia tę nierówność. Mamy zatem duże szanse na to, by była ona zawsze prawdziwa. Spróbujmy dowodu indukcyjnego. Baza dla rt = 0 wy nika bezpośrednio z definicji rekurencji. W kroku indukcyjnym zakładamy, że nierówność jest spełniona dla wszystkich liczb naturalnych nie większych od rt i próbujemy udowodnić, że Kn+i ^ rt + 1. Z rekurencji wiemy, że Kn+i = 1 + min(2KLn/ 2j ,3K|_n/ 3j). Z założenia indukcyjnego wiemy też, że 2KLn /2J ^ 2 [rt/2 J i 3Klu/3j ^ 3|rt/3j. Jednakże 2 |rt/ 2 J i 3[n/3J mogą być równe odpowiednio rt — 1 i tl — 2. Z założenia indukcyjnego możemy co naj wyżej wywnioskować, że Kn+i 1 + (tl —2). Trochę brakuje do nierówności Kn+i ^ rt + 1 . Mamy teraz powód, by martwić się o prawdziwość nierówności Kn ^ rt. Spróbujmy może znaleźć kontrprzykład. Jeżeli znaleźlibyśmy takie rt, że albo 2 K^n/ 2j < rt, albo 3Klti/3j < rt, czyli innymi słowy K[n/2J < n /2 lub KLn/3j < n /3 , to mielibyśmy K^+i < n + 1. Czy jest to możliwe? Będzie lepiej, jeśli nie podamy teraz odpowiedzi, ponieważ zepsuje nam przyjemność rozwiązania ćwiczenia 25. W informatyce często pojawiają się rekurencje, w których używamy na wiasów podłogi i sufitu, ponieważ algorytmy, które opierają się na ważnej technice „dziel i rządź,” redukują zazwyczaj problem rozmiaru n do podob nych problemów o rozmiarach będących ułamkami n. Jedna z metod sorto wania zbioru n elementowego (rt > 1 ) polega na przykład na podzieleniu tego zbioru na dwie możliwie równe części: jedna rozmiaru [ n / 2 ] , druga rozmiaru [n/2J. (Zauważmy, że n = [ n /2] + [ n /2 J ; ( 3 .1 7 ) wzór ten przydaje się dość często.) Po posortowaniu z osobna każdej z tych części (tą samą metodą, zastosowaną rekurencyjnie) możemy połączyć oba podzbiory w jedną całość dokonując co najwyżej n — 1 dalszych porównań. Stąd całkowita liczba dokonanych porównań jest równa co najwyżej f(n), gdzie f(1) = 0 ; (3 .1 8 ) f (n) = f ( [ n / 2 ] ) + f ( [ n / 2 J) + n — 1 , dla n > 1 . Rozwiązanie tej rekurencji znajdziemy w ćwiczeniu 34. Problem Flawiusza z rozdziału 1 prowadzi do podobnej rekurencji, która może być wyrażona w postaci l(i) = i ; J(ruj = 2J([n/2J) — (—1)n , dla n > 1. Znamy teraz więcej metod, niż znaliśmy w rozdziale 1 . Rozważmy więc autentyczny problem Flawiusza. Eliminowana jest nie co druga, lecz co trze cia osoba. Jeśli zastosujemy skuteczne w pierwszym rozdziale metody do roz wiązania tego trudniejszego problemu, to dojdziemy do ciekawej rekurencji postaci hM = [ f J3 (Lfnj) + anj mod n + 1 , gdzie „mod” jest funkcją, którą zajmiemy się wkrótce, oraz au równa się —2, +1, lub —j w zależności od tego, czy n mod 3 równa się 0, 1 czy 2. Ta rekurencją jest zbyt skomplikowana, by się nią zajmować. Istnieje inne podejście do problemu Flawiusza, które daje znacznie lepsze rezultaty. Każdej ocalonej (chwilowo) osobie nadajemy nowy numer. Stąd 1 i 2 staje się n + 1 i n + 2, następnie 3. osoba jest eliminowana; 4 i 5 staje się n + 3 i n + 4, następnie eliminowana jest 6 . osoba; . . . ; 3k + 1 i 3k + 2 staje się n + 2 k + 1 i n + 2 k + 2 , a 3 k + 3 osoba jest eliminowana; . . . w końcu osoba 3n zostanie wyeliminowana (lub pozostawiona przy życiu). Na przykład, dla rt = 10 numeracja osób wygląda następująco: 1 2 11 12 3 18 4 5 13 14 19 20 23 24 6 7 8 15 16 9 21 10 17 22 25 27 26 28 29 30 W chwili śmierci k-ta eliminowana osoba ma numer 3k. Dowiemy się zatem, kto przeżyje, jeśli będziemy potrafili odnaleźć początkowy numer osoby o końcowym numerze 3 rt. Osoba o numerze N (gdzie N > rt) musiała mieć mniejszy numer, który znajdziemy w następujący sposób: niech N = rt + 2k + 1 lub N = rt + 2k + 2. Wtedy k = [(N — rt — 1)/2J. Osoba ta poprzednio miała numer 3k + 1 lub 3k + 2, tzn. 3k + (N —u — 2k) = k + N — rt. Zatem numer Js(n) ocalonej osoby wyliczymy następującą metodą: N := 3rt; w h ile N > tl do N := h (n ) „Nie za wolno, nie za szybko.” L. Armstrong N —TL — 1 + N —tl ; := N . Nie jest to postać zwarta J3 (tl). Nie jest to nawet rekurencją. Możemy za to dosyć szybko wyliczyć odpowiedź dla dużych rt. Szczęśliwie algorytm ten można uprościć, gdy podstawimy w miejsce N liczbę D. = 3rt + 1 — N. (Ta zmiana w notacji odpowiada numerowaniu osób od 3rt do 1, zamiast od 1 do 3rt, czyli odliczaniu wstecz.) Uprości to skom plikowane obliczenie N: D :— 3tl 1— = rt + D (3rt+ 1 — D) —rt — 1 2rt —D 2 = D— Algorytm przybierze postać D := 1; w h ile D ^ 2rt do D := [ f D] ; I3 W •= 3rt + 1 — D . + (3 rt + 1 — D) —Tt —D "D" = D+ = [fol. _ 2 _ ~1 3.4. Działanie dwuargumentowe ‘m od ’j Aha! Wygląda to lepiej, gdyż liczby n używamy w obliczeniach w bardzo prosty sposób. Podobnie rozumując, możemy wyliczyć numer ocalonej osoby Jq(n), gdy co q-ta osoba jest eliminowana: D := 1; w h ile D (q — 1)n do D := |"-^ryD] ; (3-19) Jq(n) := qn + 1 — D . Jeśli q = 2, wiemy, że D rośnie do 2m+1, gdzie n = 2m + 1. Zatem = 2(2m + 1) + 1 - 2 m+1 = 21 + 1. Zgadza się! Algorytm ( 3 . 1 9 ) wylicza ciąg liczb całkowitych zdefiniowanych następu jącą rekurencją: D i q) = 1 : (3 2 0 ) dla n > 0 . Liczby te nie wydają się bezpośrednio spokrewnione z żadną znajomą funkcją, z wyjątkiem gdy q = 2 ; zatem prawdopodobnie nie mają ładnej postaci zwartej. Jeśli zaakceptujemy ciąg D ^ jako „znany,” to rozwiązanie ogólnego problemu Flawiusza przedstawimy w prosty sposób: numer Jq(n) ocalałej osoby równa się q n + 1 —D^q\ gdzie k jest najmniejszą liczbą taką, że d { ^ > (q - 1 )n. „Znany” powiedzmy jak liczby harmoniczne. A.M. Odlyzko i H. S. Wilf pokazali [284], że ,(3) = L(f)ncj, C « 1,622270503 3.4. D ziałan ie dw uargum entow e ‘m o d ’ Ilorazem dzielenia n przez m jest | n / m j , gdzie m i n są dodatnimi liczbami całkowitymi. Wygodnie jest mieć prostą notację na resztę z tego dzielenia. Oznaczymy ją ”n mad m ”. Z podstawowego wzoru \ ^ 1 ) 5 sv, vj\ ' <vevł n = m [ n / mJ + n mod m iloraz r ii reszta i - '“U - wynika, że możemy wyrazić n mod m jako n — m |_n/m j. Możemy uogólnić n mod m na wszystkie liczby całkowite, a nawet na dowolne liczby rzeczywi ste: x mod y = x - y [x/yj , dla y ^ 0 . (3-2i) To definiuje „mod” jako działanie dwuargumentowe, gdyż jest ono sumą i różnicą innych działań dwuargumentowych. Matematycy od dłuższego czasu używali funkcji mod w ten sposób i liczyli różne wartości mod 1 0 , mod 2n 1 »i j h Dlaczego ten podrozdział nazwano „‘mod’: działanie dwuargumentowe ?” Dowiesz się tego w następnym, fascynującym rozdziale! 3. Funkcje całk ow itoliczb ow e Strzeżcie się języków programowania używających innej definicji. itp., ale dopiero w ciągu ostatnich dwudziestu lat ujęto to formalnie. Stare pojęcie, nowa notacja. Łatwo możemy uchwycić intuicyjne znaczenie x m o d y , gdy x i y są dodatnimi liczbami rzeczywistymi. Wyobraźmy sobie okrąg o obwodzie y , którego punktom przyporządkowano liczby rzeczywiste z przedziału [0 .. y ). Jeżeli przejdziemy wzdłuż okręgu drogę długości x, zaczynając od 0, to skoń czymy naszą wędrówkę w punkcie x mod ij. (I w czasie spaceru liczbę 0 na potkamy [x /y \ razy.) Gdy x lub y są ujemne, musimy przyjrzeć się dokładnie definicji, by ustalić, co to właściwie znaczy. Oto kilka przykładów: 5 mod 3 = 5 —3 L5/3J 5 mod —3 = 5 — ' (—3) |5/(—3)J —5 mod 3 = —5 —3 L—5/3J = 2; =-1; = 1; -5 mod —3 = —5 — (—3) [—5 /(—3)J = - 2 . Może nazwać ją moduiną? Liczba za ‘mod’ jest nazywana modulnikiem. Nikt do tej pory nie zdecy dował, jak nazwać liczbę przed ‘mod’. W zastosowaniach modulnik jest z reguły dodatni, ale definicja jest bez zarzutu również wtedy, gdy modulnik jest ujemny. W obu przypadkach wartość x mod y znajdziemy pomiędzy 0 i modulnikiem: dla y > 0 ; dla y < 0 . Co jednak będzie, gdy y = 0? Definicja ( 3 .2 1 ) zostawia ten przypadek niezde finiowany, by uniknąć dzielenia przez zero, ale dla pełności możemy określić, że x mod 0 x. ( 3 -2 2 ; Konwencja ta zachowuje własność stwierdzającą, że x mod y zawsze różni się od x o wielokrotność y . (Może wydawać się bardziej naturalne określenie funkcji mod tak, by była ciągła w 0 , definiując x mod 0 = lim ^ o x mod y = 0. W rozdziale 4 zobaczymy, że to podejście jest mniej użyteczne. Ciągłość nie jest ważną cechą operacji mod.) Użyliśmy już raz niejawnie działania mod, gdy napisaliśmy x jako sumę części całkowitej i ułamkowej: x = [_xj + {x}. Część ułamkowa może być zapisana jako x mod 1 , ponieważ x = |x j + * mod 1 . Zauważmy, że nie potrzebujemy nawiasów w tym wzorze, jeśli przyjmiemy, że mod wiąże mocniej niż dodawanie i odejmowanie. Funkcja podłoga została użyta w definicji operacji mod. Funkcja sufit nie jest traktowana równorzędnie. Może moglibyśmy użyć funkcji sufit do zdefiniowania podobnej do mod operacji x antymod y = y \x /y ] —x . W naszym przykładzie z okręgiem byłby to dystans, który należałoby przejść po minięciu punktu x, by wrócić z powrotem do 0. Oczywiście potrzebujemy lepszej nazwy niż ‘antymod’. Jeśli pojawi się wystarczająca liczba prac, to właściwa nazwa prawdopodobnie sama się znajdzie. Prawo rozdzielności jest jedną z najważniejszych algebraicznych własno ści działania mod: c(x m odij) = (cx) mod (cy) Wiatach 70. działanie ‘mod’ było w modzie. Może funkcję antymod nazwać ‘punk’ ? Nie— Ja wole ‘antymod’. ( 3 -2 3 ) gdzie c, x i y są liczbami rzeczywistymi. (Ci, którzy uważają, że mod wiąże słabiej niż mnożenie, mogą usunąć nawiasy z prawej strony równości.) Tożsa mość tę łatwo jest udowodnić wprost z definicji ( 3 .2 1 ), ponieważ, jeśli cy ^ 0 , to c( xmodi j ) = c[x —y [ x / y \ ) = cx —c y [c x /c y \ = cx mod c y . Przypadek z zerowymi modulnikami jest trywialnie prawdziwy. W naszym przykładzie zilustrowaliśmy prawo rozdzielności dwukrotnie używając ±5, ±3 i c = —1. Tożsamości takie jak ( 3 .2 3 ) uspokajają, ponieważ dają powód, by wierzyć, że operacja ‘mod’ nie została zdefiniowana nieprawidłowo. W pozostałej części tego podrozdziału rozważymy problem, w którym ‘mod’ będzie pomocne, choć nie odegra głównej roli. To zadanie pojawia się często w różnych sytuacjach: Chcemy podzielić rt przedmiotów na m możliwie równych grup. Przypuśćmy, na przykład, że w m kolumnach chcemy ustawić n krótkich wierszy. Z powodów estetycznych chcemy, by kolumny były ustawione w ma lejącym porządku długości (dokładniej, w porządku nierosnącym) i długości kolumn powinny być w przybliżeniu te same — żadne dwie kolumny nie po winny się różnić o więcej niż jeden wiersz tekstu. Z dwóch ustawień 37 wierszy tekstu w pięciu kolumnach będziemy woleli ustawienie z prawej strony: 8 8 8 8 5 8 8 7 7 7 w iersz 1 w iersz 2 w iersz 3 wiersz 4 w iersz 5 w iersz 6 w iersz 7 w iersz 8 w iersz 9 w i e r s z 10 w i e r s z 11 w i e r s z 12 w i e r s z 13 w ier sz 14 w i e r s z 15 w i e r s z 16 w i e r s z 17 w i e r s z 18 w i e r s z 19 w i e r s z 20 w i e r s z 21 w i e r s z 22 w i e r s z 23 w i e r s z 24 w i e r s z 25 w iersz 26 w iersz 27 w ier sz 28 w i e r s z 29 w iersz 30 w i e r s z 31 w ier sz 32 w i e r s z 33 w iersz 34 w ier sz 35 w iersz 36 w iersz 37 w iersz 1 w iersz 2 wiersz 3 wiersz 4 wiersz 5 w iersz 6 w iersz 7 w iersz 8 w iersz 9 w i e r s z 10 w i e r s z 11 w i e r s z 12 w i e r s z 13 w i e r s z 14 w i e r s z 15 w i e r s z 16 w i e r s z 17 w i e r s z 18 w i e r s z 19 w iersz 20 w i e r s z 21 w i e r s z 22 w iersz 23 w i e r s z 24 w i e r s z 25 w ier sz 26 w iersz 27 w ier sz 28 w i e r s z 29 w iersz 30 w i e r s z 31 w ier sz 32 w i e r s z 33 w iersz 34 w i e r s z 35 w i e r s z 36 w iersz 37 Co więcej, chcemy rozmieścić kolejne porcje wierszy w kolejnych kolum nach— najpierw decydując, ile wierszy powinno znaleźć się w pierwszej ko lumnie, potem w drugiej i w trzeciej, itd .— ponieważ jest to sposób, w jaki ludzie czytają. Umieszczając, rząd po rzędzie, kolejne wiersze w kolejnych ko lumnach, otrzymamy poprawną liczbę wierszy w każdej kolumnie. Niestety, wiersze będą źle uporządkowane. (Otrzymalibyśmy coś jak uporządkowanie po prawej stronie, ale kolumna 1 zawierałaby wiersze 1, 6 , 11, . . . , 36 zamiast wierszy 1, 2, 3, . . . , 8 , jak byśmy tego chcieli.) Nie możemy użyć strategii rozmieszczania rząd po rzędzie, lecz dzięki niej dowiemy się, ile wierszy umieścić w każdej kolumnie. Jeśli rt nie jest wielokrotnością m, to dłuższe kolumny powinny zawierać [n /m ] wierszy, a krótsze |n /m j wierszy. Dokładnie n mod m kolumn będzie długich (i jak się okazuje rt antymod m krótkich). Uogólnijmy terminologię i mówmy o ‘przedmiotach’ i ‘grupach’, zamiast mówić o ‘wierszach’ i ‘kolumnach’. Zdecydowaliśmy właśnie, że pierwsza grupa powinna zawierać [n /m ] przedmiotów, dlatego powinna działać nastę pująca metoda rozmieszczania przedmiotów: By rozmieścić n przedmiotów w m grupach, gdzie m > 0 , włóżmy [n /m ] przedmiotów do pierwszej grupy i użyjmy tej samej metody rekurencyjnie, by włożyć pozostałe n ' = n —[n /m ] przedmioty do m / = m — 1 pozostałych grup. Na przykład, dla liczb n = 314 i m = 6 , rozdzielanie przedmiotów prze biega następująco: pozostałe przedmioty 314 261 208 156 104 52 pozostałe grupy [przedmioty / grupy] 6 53 53 52 52 52 52 5 4 3 2 1 Działa! Otrzymujemy grupy tej samej wielkości, mimo zmieniającego się dzielnika. Dlaczego to działa? Załóżmy, że n = qm + r, gdzie q = [n /m j i r = n mod m. Gdy r = 0, proces jest prosty: Wkładamy [n /m ] = q przedmiotów do pierwszej grupy i zastępujemy n przez n ' = n —q, pozostawiając n ' = qm/ przedmiotów do włożenia w pozostałe m / = m — 1 grup. Jeśli r > 0, to wkładamy [n /m ] = q + 1 przedmiotów do pierwszej grupy i zastępujemy n przez n f = n — q — 1 , pozostawiając n ' = qm/ + r — 1 przedmiotów do rozmieszczenia w następnych grupach. Nową resztą jest r ' = r — 1, ale q nie zmienia się. Z tego wynika, że r grup z q + l przedmiotami będzie poprzedzało m —r grup z q przedmiotami. 3.4. Działanie dwuargumentowe ‘m od’j Jak wiele przedmiotów jest w k-tej grupie? Chcielibyśmy mieć wzór, który daje liczbę [n/m] dla k ^ n mod m, i |n/m j w przeciwnym razie. Jeśli zapiszemy jak w poprzednim akapicie n = qm + r, gdzie q = [n /m j, to nietrudno będzie sprawdzić, że wyrażenie n —k + 1 m ma żądane własności, ponieważ skraca się do q + [(r —k + 1)/m]. Mamy bowiem [(r —k + l)/m ] = [k^r], jeśli 1 O ^ m i 0 ^ r < m . Dlatego możemy zapisać tożsamość, która wyraża podział liczby n na m możliwie równych części w porządku nierosnącym: m n "n — 1 " ~n —m + 1 " "n" — + + ••• + m m m (3-24) Tożsamość ta jest prawdziwa dla wszystkich dodatnich liczb całkowitych m i dla każdej liczby całkowitej n (obojętnie czy jest dodatnia, ujemna, czy zerem). Wzór (3 .17 ) jest szczególnym przypadkiem powyższej identyczności, (gdy m = 2 ), chociaż zapisaliśmy go w nieco innej postaci, n = [n / 2 ] + |_n/2 J. Jeśli chcemy uporządkować grupy w niemałejącym porządku, małe przed większymi, moglibyśmy postępować w ten sam sposób, ale tym razem umie ścilibyśmy w pierwszej grupie [n/mj przedmiotów. Stąd moglibyśmy wypro wadzić odpowiednią tożsamość n n m — + n +1 + ...+ m n + m —1 m ( 3 -2 5 ) Możliwe jest przekształcenie wzoru ( 3 .2 5 ) we wzór ( 3 .2 4 ) za pomocą albo równości (3 .4 ), albo tożsamości z ćwiczenia 1 2 . Jeśli zastąpimy teraz n we wzorze ( 3 .2 5 ) przez [m xj, i zastosujemy regułę ( 3 . 1 1 ) do usunięcia wewnętrznych nawiasów, otrzymamy tożsamość praw dziwą dla wszystkich liczb rzeczywistych x: |_mxj = [xj + 1 x + — + •■■• + m —1 x + -------rrt ( 3 -2 6 ) Jest to zadziwiające, gdyż funkcja podłoga jest całkowitoliczbowym przybli żeniem wartości rzeczywistej, ale pojedyncze przybliżenie z lewej strony jest równe sumie całej gromady przybliżeń z prawej strony. Jeśli założymy, że [ x j wynosi średnio x —\ , to lewa strona równa się w przybliżeniu m x —\ , pod czas gdy prawa strona ( x — j ) + ( x — \ + H---------1- ( x — \ + II^ - ) = m x — Suma wszystkich tych zgrubnych przybliżeń okazuje się dokładna! ( 3.5. Sum y p o d ło g i i sufitu Równanie ( 3 .2 6 ) pokazuje, że możliwe jest uzyskanie postaci zwartej dla przy najmniej jednego rodzaju sum z nawiasami [ J • Czy są inne? Tak! Dobrym pomysłem, który zazwyczaj pomaga w takich przypadkach, jest usunięcie nawiasów podłogi lub sufitu przez wprowadzenie nowej zmiennej. Na przykład, zobaczmy, czy jest możliwe przedstawienie sumy L O^kcu w zwartej postaci. Dobrym pomysłem jest wprowadzenie zmiennej m = [\/kJ. Następnie postępujemy „mechanicznie,” podobnie jak w zadaniu o ru letce: L L^J = y m [ k < n ] [ m = [\/kJ] k,m^ 0 O^kcn m[k < rt] [m ^ \/k < m + 1 ] k,m^ 0 y m [k < n ] [m 2 ^ k < (m + l ) 2] k,m^ 0 /' y m [m 2 ^ k < ( m + l ) 2 ^rt] k,m^ 0 + ^ m [m 2 ^ k < r t < ( m + l ) 2] . k,m^ 0 Znowu musimy ostrożnie postępować z warunkami granicznymi. Załóżmy najpierw, że n = a2 jest kwadratem liczby naturalnej. Wtedy druga suma jest równa zeru, a pierwsza może być przekształcona niemalże rutynowo: m [ m 2 ^ k < ( m + 1 ) 2 ^ a2] k.mÔ = ^ m ( ( m + 1 ) 2 ^ m 2) [ m + K a ] mÔ = Y m( 2 m + 1) [ m < a] mÔ = y _ (2m - + 3ra-) [m < a] m.^0 = § a ( a — 1 )(a —2 ) + | a ( a — 1 ) = ^(4a + l ) a ( a — 1 ). W ogólnym przypadku podstawmy a = [y/n \. Następnie, dla a 2 ^ k < n, dodajmy składniki drugiej sumy — wszystkie równe a — które sumują się do (rt — a 2 )a. To daje poszukiwaną postać zwartą [Vk\ = n a — j<r ?a, a = |y i\|. (3-27) O^kcn Innym sposobem podejścia do takich sum jest zastąpienie wyrażenia po staci [xj wyrażeniem HjH ^ j Jest to dozwolone, gdy x ^ 0. Zobaczmy, jak ta metoda skutkuje dla sumy [pierwiastków kwadratowych]. Dla wygody założymy, że rt = a 2: L = Z n O ^kcn j ,k = Y_ l^ j< a ^ \/k ][0 ^ k < a2] V [j2 ^ Tc< CŁ2] k = X . (a 2 _ i2) = a3 - j a ( a + 2 ) ( a + 1) • 1^j<a W następnym przykładzie zobaczymy, jak zmiana zmiennej prowadzi do przekształcenia sumy. W roku 1909 trzech matematyków— Bohl [34], Sier piński [327] i Weyl [369]— mniej więcej w tym samym czasie i niezależnie od siebie odkryło znakomite twierdzenie: jeśli oc jest liczbą niewymierną, to części ułamkowe {na} są jednostajnie rozłożone pomiędzy 0 a 1 , gdy n —» 0 0 . Można to stwierdzić, gdyż wzór 1 r1 lim — V" f ({ka}) = f(x) dx n-"°° n Os$k<n Jo ( 3 -2 8 ) jest prawdziwy dla wszystkich liczb niewymiernych a, i wszystkich ograni czonych, prawie wszędzie ciągłych funkcji f. Na przykład, wartość średnia ciągu {na} może być wyliczona przez podstawienie f(x) = x. Otrzymamy (Dokładnie tego mogliśmy oczekiwać, ale dobrze jest wiedzieć, że można ten fakt udowodnić, niezależnie od tego jak bardzo niewymierna jest liczba a.) Twierdzenie Bohla, Sierpińskiego i Weyla można udowodnić przez przy bliżanie funkcji f(x) z góry i z dołu „funkcjami schodkowymi,” które są liniowymi kombinacjami funkcji prostych fv (x) = [0 ^ x < v ] , gdzie 0 ^ v ^ 1. Nie jest naszym celem udowodnienie tego twierdzenia. Jest to robota dla podręcznika rachunku różniczkowego. Ale spróbujmy sobie wyobrazić podstawowy powód tego, że jest ono prawdziwe. Zobaczmy, jak Ostrzeżenie: Trudny tekst! Podczas pierwszego czytania lepiej pominąć następne dwie strony. Nie są one istotne. Twój przyjazny asystent Skocz „ stąd dobrze się sprawdza w szczególnym przypadku f(x) = fv (x). Innymi słowy, sprawdźmy jak blisko „idealnej” wartości rtv znajduje się suma Y_ [{ka}< v] , 0 ^k<Tl gdy rt jest duże i oc jest liczbą niewymierną. W tym celu zdefiniujmy funkcję niezgodności D(a, rt) jako największą z wartości bezwzględnych sum s(«,n,v) = ([{k a l < v] ~ v ) . (3-29) 0 ^k<n dla v przyjmującego wartości z przedziału 0 ^ v ^ 1. Naszym celem jest pokazanie, że D (a, n) w porównaniu z rt nie jest „zbyt duże” przez wykazanie, że | s(a,n,v)| jest zawsze sensownie małe, gdy a jest liczbą niewymierną. Zapiszmy najpierw funkcję s(cx,n,v) w prostszej postaci, a następnie wprowadźmy nową zmienną j: y~ ^[{ka}< v] — ^ ( [kaj — [ka —vj —v) 0 ^k<n 0^k<n = —n v + ^ 0 <Jk<n = —rtv + y [ka —v < j ^ ka] j y~ r^ - 1 0 +v) a-~i i • O^j < [noc] k < n Racja! Nazywaj i zwyciężaj. Istotna jest zamiana zmiennej k na j . Twój przyjazny asystent Przy odrobinie szczęścia znajdziemy sumę względem k. Wprowadźmy nowe zmienne, by nieco uporządkować ten wzór. Bez utraty ogólności, możemy założyć, że 0 < oc < 1. Przyjmijmy a = La 1 J > b = rv«_li. oc 1 = a + oc' ; v a - 1 = b —v' — J/v-l Stąd oc'' = {a } jest częścią ułamkową oc 1, a v' jest anty7częścią ułamkową -1 voc Po raz kolejny warunki graniczne przysparzają nam kłopotów. Zapo mnijmy chwilowo o ograniczeniu ‘k < rt’ i przekształćmy sumę: X [ k e [ja - 1 . . ( j + v ) a - 1 )] = [ ( j + v ) ( a + a ' } ] - |"j(a + a')] "i-:c‘i •V J :,iy ' 3.5* Sumy podłogi i su fitu 1 To było proste. Wstawmy wyliczoną sumę: s ( a , n, v) = —rtv+ [n a]b + £_ ([ j a ' - v ' ] - [ j a ' ] ) - S , ( 3 .3 0 ) 0 ^ j < fna"l gdzie S jest poprawką reprezentującą sumę składników k rt, których nie wyłączyliśmy. Wartość ja' będzie liczbą całkowitą tylko wtedy, gdy j = 0, ponieważ a (zatem i a') jest liczbą niewymierną. Tak samo ja ' —v' będzie liczbą całkowitą dla co najwyżej jednej wartości j. Możemy zatem zamienić nawiasy sufitu otaczające składniki sumy na nawiasy podłogi: s( a , n, v) = —rtv + [n a]b — ^ ([ja'J — [jo 7 —v'J) —S + { 0 lub 1 }. 0^j<[noc] (Wyrażenie Interesujące. Zamiast wzoru w postaci zwartej, otrzymaliśmy sumę, która wy gląda raczej jak s ( a , n, v), ale z innymi parametrami: a ' zamiast a, [na] za miast n i v' zamiast v. Dla s( a , n, v) otrzymaliśmy wzór rekurencyjny, który (na szczęście) doprowadzi nas do rekurencji dla funkcji niezgodności D ( a , n) . Ponieważ s ( a ', | n a | , v ' ) = ^ {0 lub 1} oznacza coś, co jest równe albo 0, albo 1 .) ( | J a 'J - [j oc' - v ' J - v ' ) , O ^ jc [not] więc s ( a , n, v) = —n v + [n a]b — [n a]v' — s(a', [n a ],v ') — S + {0 lub 1}. Gdy przypomnimy sobie, że b —v' = v a _1, wszystko pięknie się uprości, gdy podstawimy n a (b —v') = nv zamiast [na] (b —v'): s ( a , n, v) = —s(a ', [n a ],v ') —S + e + { 0 lub 1}. Pojawiający się we wzorze składnik e jest dodatnią liczbą mniejszą od v a _1. W ćwiczeniu 18 zostaniemy poproszeni o wykazanie, że S znajduje się gdzieś pomiędzy 0 i [va- 1 ]. Usuwamy ostatni wyraz sumy (j = [na] — 1 = [n a j), ponieważ jest on równy albo v', albo v' —1. Zatem jeśli policzymy największą wartość bezwzględną, jaką przybiera funkcja s dla jakiegoś v, otrzymamy D ( a , n ) ^ D(a' , [an j) + a 1+2. (3 -3 1 ) Dzięki metodom, które poznamy w następnych rozdziałach, możemy wy wnioskować z postaci tej rekurencji, że dla wystarczająco dużych n funkcja D ( a , n ) jest zawsze znacznie mniejsza od n. Stąd twierdzenie ( 3 .2 8 ) jest prawdziwe, chociaż zbieżność do granicy nie jest szybka. (Spójrz do ćwiczeń 9.45 i 9.61.) Dotąd 3. Funkcje całk ow itoliczb ow e Czy to będzie cięższa suma podłóg, czy suma cięższych podłóg? Uwaga! Tutaj autorzy wpadają w manierę kończenia rozdziału cokolwiek przydługim, trudnym problemem nie mającym innego uzasadnienia niż jego dziwaczność. Studenci Trafiony! Ale, moja bando, czy musicie być informowani o zastosowaniach, zanim się czymś zainteresujecie? Ta suma,, na przykład, pojawia się podczas badań nad generowaniem liczb losowych. Matematycy zajmowali się nią, zanim powstały komputery, ponieważ interesowało ich, czy istnieje sposób policzenia sumy „opodłogowanego” ciągu arytmetycznego. Wasz nauczyciel 112 Uff! Było to solidne zadanie w operowaniu sumami, nawiasami podłogi i sufitu. Czytelnicy, którzy nie są przyzwyczajeni do „dowodzenia, że niedo kładności są niewielkie” mogą się dziwić, że ktokolwiek miał odwagę zmie rzyć się z tak dziwacznie wyglądającymi sumami. Gdy dokładniej przyjrzymy się wywodowi, dostrzeżemy pewną ideę towarzyszącą obliczeniom. Głównym pomysłem jest zredukowanie pewnej sumy s ( a , n, v) o n składnikach do po dobnej sumy o co najwyżej |"ocn"| składnikach. Prawie wszystko znika poza małymi resztkami składników bliskich granicom. Odpocznijmy sobie i zajmijmy się jeszcze jedną sumą, co prawda nie trywialną, lecz mającą duże zastosowania (w porównaniu z tą, którą zajmo waliśmy się przed chwilą). Suma ta ma postać zwartą, będziemy więc mogli sprawdzić odpowiedź. Naszym celem jest uogólnienie sumy ( 3 .2 6 ) przez zna lezienie wzoru na nk + x Z O^kcm całkowite m > 0 , m całkowite n. Znalezienie postaci zwartej dla tej sumy jest trudniejsze od wszystkiego, co do tej pory robiliśmy (z wyjątkiem, może, problemu niezgodności). Jest jednak pouczające, więc będziemy się nim zajmować do końca rozdziału. Jak zwykle, zwłaszcza przy trudnych zadaniach, przyjrzyjmy się małym przypadkom. Przypadek dla n = 1 okazuje się wzorem (3 .2 6 ), gdzie x zastą piono przez x/m : 1— 1 + LmJ 1+ x m + ••• + m —1 + x m = w Sprawdźmy też przypadek n = 0: 1— 1 + 1— 1 + • • • + 1— 1 = m l — I . LmJ LmJ LmJ LmJ W naszym zadaniu występują dwa parametry: m i n. Przyjrzyjmy się przypadkom z małym m. Gdy m = 1, suma składa się tylko z jednego wy razu |x_|. Gdy m = 2, mamy już dwa wyrazy [x/2\ + |_(x + n)/2J. Możemy usunąć teraz n ze środka nawiasów, ale musimy rozważyć z osobna dwie sy tuacje, gdy n jest albo parzyste, albo nieparzyste. Jeśli n jest parzyste, to n / 2 jest liczbą całkowitą i możemy ją usunąć poza nawias: n + 2 ' Jeśli n jest nieparzyste, to (n — l ) / 2 jest liczbą całkowitą. Stąd LjJ + X + 1 n —1 n —1 = M + Ostatnia równość wynika ze wzoru (3 .2 6 ), gdzie m = 2. Wzory, które otrzymaliśmy, są podobne do wzorów z rt = 0 i 1, ale nie możemy dostrzec jeszcze żadnego przejrzystego wzorca, więc lepiej zrobimy badając większą liczbę małych przypadków. Dla m = 3 otrzymamy sumę x + rt + 3 l!J x + 2 rt 3 Musimy teraz rozważyć trzy sytuacje. Albo liczba n jest wielokrotnością 3, albo jest o 1 lub o 2 większa od takiej wielokrotności. Ściślej, n mod 3 = 0, 1 lub 2. Jeśli rt mod 3 = 0, to rt/3 i 2 u /3 są liczbami całkowitymi i + T1. + Jeśli tl mod 3 = 1, to (n — 1)/3 i (2n —2)/3 są liczbami całkowitymi, stąd [jj x+1 3 + n 7 1W 3 ) x+ 2 3 \ 2 n —2 \ , . + — 3— J = Ostatnia równość znów wynika ze wzoru (3 .2 6 ). Tym razem musimy podsta wić m = 3. W końcu, gdy n mod 3 = 2 , wówczas UJ+ x+ 2 3 2 rt — 1 . H------^— I = [xj + n — 1 . X+1 3 )V 3 Lewa półkula naszego mózgu skończyła z przypadkiem m = 3, ale prawa wciąż nie może rozpoznać wzoru. Zajmijmy się więc przypadkiem m = 4: x + rt i ? H + x + 2n 4 + x + 3n 4 Wiemy chociaż tyle, że należy zajmować się przypadkami zależnymi od tl mod m. Jeśli n mod 4 = 0, to UMUKWUI+ t M M - 1 5 ] 3n Natomiast, gdy rt mod 4 = 1, wówczas mamy [?j x+ 1 4 + n ; 1) + f 4 ) V x+ 2 4 + 2"^ f j) + (\ x+3 3 n -3 \ 4 4 ) . . 3n 3 - W + T - 2 - Tę samą odpowiedź otrzymamy, gdy rt mod 4 = 3. Jeżeli rt mod 4 = 2, to 1x 1 ( x+ 2 [?M —. n —2 \ {1 x 1 2n\ ( x+ 2 I 3 rt—2 \ —]+— ) -1 . „Inventive genius reąuires pleasurable mental activity as a condition for its vigorous exercise. ‘Necessity is the mother of invention’ is a silly proverb. (Necessity is the mother of futile dodges’ is much nearer to the truth. The basis of the growth of modern invention is science, and science is almost wholly the outgrowth of pleasurable intellectual curiosity.” A.N. Whitehead [372] .111 |3 . Funkcje całk ow itoliezb ow e W ostatnim kroku upraszczamy coś postaci |_y/2J + |_(y + 1)/2J, będącej znów szczególnym przypadkiem wzoru (3 .2 6 ). Wypiszmy znalezione sumy dla małych m: n mod m = 0 m n mod m = 1 n mod m = 2 1 W 2 2Ll J + f 3 3L U + U W +S -j |_xj + n — 1 |_xj + n — 1 4 4L?J + ¥ W + 4f-§ n u + ¥ - i n mod m = 3 w + ^ - § Otrzymaliśmy coś postaci a l_aJ + bn + C’ gdzie a, b i c jakoś zależą od m i n. Nawet krótkowidz dostrzeże, że b prawdo podobnie jest równe ( m — 1)/2. Trudniej jest zauważyć wzór na a, ale przy padek n mod 4 = 2 daje nam wskazówkę, że a równa się prawdopodobnie N W D ( m , n ) , największemu wspólnemu dzielnikowi liczb m i n. Ma to sens, ponieważ N W D ( m , n ) jest usuwanym czynnikiem z liczb m i n podczas re dukcji ułamka n /m do ułamka właściwego i nasza suma używa ułamka n /m . (Zajmiemy się operacją NWD w rozdziale 4.) Wartość c wydaje się bardziej tajemnicza, ale prawdopodobnie wyniknie z dowodów na a i b. Wyliczając sumę dla małych m, każdy ze składników zapisywaliśmy jako x + kn m x + kn mod m m kn kn mod m H------------------------m m Ponieważ (kn —kn mod m )/m jest liczbą całkowitą, może być ona usunięta poza nawiasy podłogi. Zatem oryginalna suma może być rozwinięta tak, jak pokazano poniżej: L=J + x + n mod m m + x + 2 n mod m m + x + (m — 1 )n mod m m + 0_ m 0 mod m n m n mod m m 2n 2 n mod m m m (m — 1 )n m (m — 1 )n mod m m m Gdy eksperymentowaliśmy z małymi wartościami m, trzy kolumny dopro wadzały nas do wzorów na a[_x/aj, bn i c. W szczególności, wyprowadźmy wzór na b. Druga kolumna jest ciągiem arytmetycznym, którego sumę potrafimy policzyć— jest to średnia arytme tyczna pierwszego i ostatniego wyrazu ciągu pomnożona przez długość ciągu: 1 ( (m —1 ń 2 V0 + ------m m = (m — 1)n Nasz strzał b = ( m — l ) / 2 okazał się celny. Pierwsza i trzecia kolumna wyglądają gorzej. By ustalić wartość a i c, musimy się przyjrzeć ciągowi liczb 0 mod m, n mod m, 2 n mod m, ..., (m — 1 )n mod m. Załóżmy na przykład, że m = 12 i n ■= 5. Pomyślmy o ciągu, jak o godzi nach na zegarze. Ciąg zaczyna się od godziny 0 (przyjmujemy, że 12 godzina jest godziną 0), potem mamy 5 godzinę, 10 godzinę, 3 godzinę (= 15 godzi nie), 8 godzinę, itd. Okazuje się, że każda godzina w naszym ciągu pojawia się tylko raz. Teraz przyjmijmy m = 12 i n = 8 . Wyrazami ciągu są kolejno godziny 0 , 8 , 4 (= 16 godzinie), a potem znowu 0, 8 i 4. Ponieważ obie liczby 8 i 12 są wielokrotnościami 4, i ponieważ ciąg rozpoczyna się od 0 (też wielokrot ność 4), nie mamy szansy wyłamać się ze wzoru— wszystkie liczby muszą być wielokrotnościami 4. W tych dwóch przypadkach mamy NWD(12,5) = 1 i NWD(12,8) = 4. Ogólna reguła, którą udowodnimy w następnym rozdziale, mówi, że jeśli d = N W D (m, n) to otrzymamy liczby 0, d, 2d, . . . , m —d w jakimś porządku, za którymi to liczbami znajdziemy kolejne d —1 kopii tego samego ciągu. Na przykład, gdy m = 12 i n = 8 , liczby 0, 8 , 4 pojawiają się czterokrotnie. Pierwsza kolumna nabiera teraz sensu. Zawiera ona d kopii składników [ x / m j , [_(x + d ) / m j , . . . , [(x + m — d ) / m j , w jakimś porządku, stąd suma równa się X — + Lm. x+ d Ix + m — d + •••+ --m L m d (1 x/d + \,Lm /d. , 1X I = d [zJ- x/d + 1 m/d x/d + m/d — 1 m/d Ostatni krok jest jeszcze jednym zastosowaniem wzoru ( 3 .2 6 ). Teraz lemat, potem dylemat. 3. Funkcje całk ow itoliezb ow e Wzór na a też zgadliśmy poprawnie: a = d = NWD(m,n). Tak jak przypuszczaliśmy, możemy wyliczyć teraz c, ponieważ trzecia kolumna jest łatwa do ogarnięcia. Zawiera ona d kopii ciągu arytmetycznego O/m, d /m , 2d /m , . . . , (m — d )/m . Stąd jej suma równa się m m "d m —d d( K o+ m Trzecia kolumna jest odejmowana, nie dodawana, stąd c = d —m Koniec tajemnicy, koniec wyzwania. Oto szukana postać zwarta: E 0 ^k<m nk + x m = d LJ 5 m —1 d —m + — n + --- -— gdzie d = NWD(m,rt). Sprawdźmy, czy nasz wzór daje prawidłowe wyniki w przypadku, gdy n = 0 lub n = 1. Gdy rt = 0, mamy d = N W D (m , 0) = m. Ostatnie dwa składniki we wzorze równają się zeru i wzór prawidłowo przybiera postać m | x / m j . Dla rt = 1 mamy d = N W D (m , 1) = 1. Ostatnie dwa składniki redukują się wzajemnie i otrzymujemy |_xj. Jeśli poprzekształcamy troszkę wzór, uzyskamy jego symetryczną wersję: Z O^kcm nk + x m - , ,x i m —1 d —m d|s i + — n + ~ -*iu - lii f m —1 ) f n —1) m—1 d —m + --------- ^------- - + —TT— + —TT— 2 (m — 1)(n — 1) + d —1 ( 3 -3 2 ) Zadziwiające! Nie ma żadnych algebraicznych powodów, dla których ta suma miałaby być symetryczna. Niemniej jednak dowiedliśmy „prawa dualności,” Z 0 ^k<m rtk + x m 0 Z ^k<n mk + x TL całkowite m, n > 0 . Na przykład, gdy m = 41 i n = 127, lewa suma ma 41 składników, a prawa 127, ale dla dowolnej liczby rzeczywistej x sumy te są sobie równe. Ć w iczenia Rozgrzewka 1. Gdy analizowaliśmy problem Flawiusza w rozdziale 1 , przedstawialiśmy dowolną dodatnią liczbę całkowitą n w postaci n = 2 m + 1, gdzie 0 ^ l < 2m. Przedstaw l i m jako funkcje n. We wzorach możesz użyć nawiasów podłogi i sufitu. 2 . Znajdź wzór wyliczający dla danej liczby rzeczywistej x najbliższą do niej liczbę całkowitą. W przypadku gdy x znajduje się dokładnie w połowie drogi pomiędzy dwoma liczbami całkowitymi, podaj wyrażenie, które zaokrągla liczbę x (a) w górę— do [x]; (b) w dół — do |xj. 3. Oblicz wyrażenie [ [ m a j n /a j , gdy m i n s ą dodatnimi liczbami całkowi tymi i oi jest liczbą niewymierną większą niż n. 4. W tekście opisano zadania rodzajów od 1 do 5. Co jest zadaniem ro dzaju 0 ? (To zadanie, nawiasem mówiąc, nie jest zadaniem rodzaju 0 .) 5. Znajdź warunek konieczny i dostateczny, by dla dodatnich liczb całko witych n zachodziła równość [uxj = n|_xj. (Twój warunek powinien zawierać {x}.) 6 . Czy możemy powiedzieć coś ciekawego o [f (x)J, gdy f (x) jest ciągłą i m a lejącą funkcją o wartościach całkowitych tylko dla całkowitych liczb x? 7. Rozwiąż rekurencję Xn = n , dla 0 ^ n < m; Xn = Xn_ m + 1 , dla n ^ m. 8 . Udowodnij zasadę szufladkową Dirichleta: jeśli wkładamy do m pude łek n przedmiotów, to wtedy pewne pudełko zawiera co najmniej [n /m ] przedmiotów i pewne pudełko zawiera ich co najwyżej '[n/m j. 9. Egipscy matematycy w roku 1800 p.n.e zapisywali ułamki właściwe jako sumy ułamków egipskich (prostych) 1 /x \ H------ h 1 /xic, gdzie x są różnymi liczbami całkowitymi. Na przykład | zapisywali jako | + Udowodnij, że można zrobić to systematycznie: Jeśli 0 < m /n < 1, to (Jest to algorytm Fibonacciego, podany przez Leonarda Fibonacciego w roku 1 2 0 2 .) Podstawy 10. Wykaż, że wyrażenie jest zawsze równe albo | x j , albo |Y |. W jakich okolicznościach zachodzą poszczególne równości? 11. Uzupełnij podany w tekście dowód faktu, że otwarty przedział ( a . . |3), gdzie a < |3, zawiera dokładnie |~|3] —[aj —1 liczb całkowitych. Dlaczego, aby uczynić dowód poprawnym, musimy wykluczyć przypadek oc = |3? 12. Udowodnij, że równość zachodzi dla wszystkich liczb całkowitych n i dla wszystkich dodatnich liczb całkowitych m. [Dzięki tej tożsamości możemy przekształcać funkcję podłoga na funkcję sufit i na odwrót nie korzystając ze wzoru ( 3 .4 ).] 13. Niech a i |3 będą dodatnimi liczbami rzeczywistymi. Udowodnij, że zbiory z powtórzeniami Spec (a) i Spec(|3) tworzą podział zbioru liczb całko witych dodatnich wtedy i tylko wtedy, gdy a i |3 są niewymierne i l / a + 1 / 0 = 1. 14. Czy prawdą jest, że (x mod n y) mod y = x m o d y , gdzie n jest liczbą całkowitą? 15. Czy istnieje podobna do ( 3 .2 6 ) równość używająca nawiasów sufitu za miast nawiasów podłogi? 16. Udowodnij, że rt mod 2 = (1 — (—l ) n )/2. Znajdź i udowodnij podobne wyrażenie dla rt mod 3, gdzie prawa strona jest postaci aH-bo>rLH-ca>2'a, a cu jest liczbą zespoloną (—1 + iV 3 )/2. Wskazówka: cu3 = 1 i 1 H-cu+cu2 = 0. 17. Wylicz sumę Xo<ck<mLx + V mJ, gdzie x ^ 0, przez wstawienie sumy k/m ] zamiast |_x + k/m j i wysumowanie najpierw wzglę dem k. Czy wzór ( 3 .2 6 ) daje identyczną odpowiedź? 18. Udowodnij, że błąd przybliżenia S z wyrażenia ( 3 .3 0 ) jest równy co naj wyżej [a - 1 v ]. Wskazówka: Pokaż, że we wzorze nie występują małe war tości j. Ćwiczenia domowe 19. Znajdź warunek konieczny i dostateczny na to, by liczba rzeczywista b > 1 spełniała równość |logb xJ = [logb |xJJ dla wszystkich liczb rzeczywistych x ^ 1 . 20. Znajdź dla x > 0 sumę wszystkich wielokrotności x znajdujących się w przedziale domkniętym [ a . . (3]. 2 1 . Jak wiele liczb postaci 2m, gdzie 0 ^ m ^ M., zaczyna się w zapisie dziesiętnym od cyfry 1 ? 2 2 . Oblicz sumy Sn = Ln / 2k + W 1 = I k ^ i 2k |_n/2k + \ \ 2. 23. Pokaż, że n-ty wyraz ciągu 1,2,2,3,3,3,4,4,4,4,5,5,5,5,5,... jest równy [\/2 n + . (Ciąg zawiera dokładnie m wystąpień liczby m.) 24. W zadaniu 13 dowiedziono interesującą własność dwóch zbiorów z po wtórzeniami Spec(a) i Spec(a/(<x— 1)), gdzie a jest dowolną liczbą nie wymierną większą niż 1. Jaką ciekawą własność (znajdź i udowodnij) spełniają zbiory z powtórzeniami Spec(a) i Spec(cx/(cx+l)), gdzie a jest dowolną dodatnią liczbą niewymierną? 25. Czy prawdą jest, że liczby Knutha zdefiniowane za pomocą rekuren cji ( 3 . 1 6 ) spełniają dla wszystkich liczb naturalnych nierówność* Kn ^ rt? 26. Pokaż, że liczby Flawiusza ( 3 .2 0 ) spełniają nierówność 27. Udowodnij, że nieskończenie wiele liczb zdefiniowanych rekurencją ( 3 .2 0 ) jest parzystych i nieskończenie wiele jest nieparzystych. 28. Rozwiąż rekurencję ao = 1 ; a n = an_i + lyarL-iJ, gdzie n > 0 . 29. Pokaż, że oprócz nierówności (3 .3 1 ), zachodzi nierówność D(<x,n) ^ D(cx'> L^nJ) —cc-1 —2. 30. Wykaż, że dla m większego niż 2 rozwiązaniem rekurencji X0 = m , " Xn = X2 _, —2, gdy n > 0, jest Xn = [a 2"”!, gdzie oc + a - 1 = m i oc > 1. Na przykład gdy m = 3, rozwiązaniem jest Xn = r ^ 2 TL+1 n 1> x 1 + = ----2 ---- ’ 2 Ot =($> . ‘31. Czy prawdą jest, że |xj + [y\ + |x + yj ^ [2x\ + [2yJ? Widzę niezgodność pomiędzy tą nierównością a (3-3i)- |3 . Funkcje*całkow itolłczbow e 32. Niech ||x|| = min(x — [xj, [x] —x) oznacza odległość dzielącą x od naj bliższej liczby całkowitej. Jaka jest wartość sumy X 2l */2 k il2 (Zauważ, że suma ta może być podwójnie nieskończona. Jeśli na przykład x = 1 / 3 , to wyrazy sumy są niezerowe zarówno, gdy k —» —oo, jak i gdy k —> + 0 0 .) Zadania egzaminacyjne 33. Na szachownicy 2 n x 2 n został narysowany symetrycznie okrąg o średnicy 2n — 1. Dla n = 3 otrzymamy następujący rysunek: Uprość, lecz nie zmieniaj wartości a) Ile pól szachownicy zawiera fragment okręgu? b) Znajdź funkcję f (tl, k) taką, że dokładnie ^(n > pól szachow nicy jest w całości zawarte w kole. 34. Niech f(n) = ££=1 \ lgk\. a) Znajdź postać zwartą dla f (n), gdy n ^ 1. b) Udowodnij,"że^ówność f(n) = n — 1 + f(|"n/2~|) + f([n/ 2J) zachodzi dla wszystkich n ^ 1 . 35. Uprość wyrażenie [ ( n + 1 ) 2 n! ej mod n. 36. Zakładając, że n jest liczbą naturalną, znajdź postać zwartą sumy 1 L 2L 1gKl4 L 1g 1g lcJ 1 < k < 2 21 37. Udowodnij tożsamość m +k n ;j - a ) L - m2 n _ m in(m mod n, (—m) mod n) n dla wszystkich dodatnich liczb całkowitych m i n . 38. Niech x i , . . . , xn będą takimi liczbami rzeczywistymi, że równość Y k =1 Lm *kJ = m ) Xk ■ l^k^n jest spełniona dla wszystkich dodatnich liczb całkowitych m. Udowodnij coś interesującego o x-|, . . . , xn . 39. Udowodnij, że podwójna suma Z o ^ i o g ^ Ho<j )/t'lc+11 jest równa (b — 1 ) ( Llogb xj + 1 ) + [Y| — 1 , gdzie x 5: 1 jest liczbą rzeczywistą, a b > 1 liczbą całkowitą. 40. Spiralna funkcja a(n), pokazana na poniższym rysunku, przyporządko wuje liczbie naturalnej rt parę liczb całkowitych (x(rt),'y(rt)) . Na przy kład liczbie rt = 9 przyporządkowuje parę (1,2). Ludzie na południowej półkuli używają innej spirali. 0 7 5 6 a) Udowodnij, że dla m = |_V^J zachodzi x (n ) = (— —m (m + 1 )) • [[ 2 v/tiJ jest parzyste] + Znajdź podobny wzór dla y (n ). Wskazówka: Podziel spiralę na seg menty Wic, Sic, t k, Nk określone równościami |_2 A/rtJ = 4k—2 , 4k—1 , 4k, 4 k + 1 . b) Udowodnij, że mając a(rt), możemy wyliczyć rt wzorem rt = (2 k ) 2 ± (2 k + x(n) H -(tl)) , k = max(|x(n)|, |-y(rt)|). Podaj, kiedy używamy + , a kiedy —. Z adania d odatkow e 41. Niech f i g będą rosnącymi funkcjami takimi, że zbiory {f (1), f ( 2 ) ,...} i {g(1), g ( 2 ) ,...} są podziałem zbioru dodatnich liczb całkowitych. Za łóżmy, że dla wszystkich rt > 0 funkcje f i g są związane warunkiem g(rt) = f(f(rt)) + 1 . Udowodnij, że f(rt) = |_rLct>J i g(rt) = |tu|)2 J, gdzie 4> = (1 + V '5 )/2 . 42. Czy istnieją liczby rzeczywiste oc, |3 i y takie, że Spec(a), Spec(|3) i Spec(y) tworzą podział zbioru dodatnich liczb całkowitych? 43. Znajdź interesującą własność liczb Knutha, przez rozwinięcie rekurencji (3-i6). ...... . 13. Funkcje całkow itoliczbow e W ,£ ^ *v i * W s 7 * i 122\ 44. Pokaż, że istnieją liczby całkowite o ^ i dj^ takie, że Q(q) = DP (q) n - . +, ddu(q) q-i = nD(c,) n ++ dr i(q) n q d la n > 0 gdzie D ^ ' jest rozwiązaniem rekurencji ( 3 .2 0 ). Zastosuj ten fakt, by przedstawić rozwiązanie uogólnionego problemu Flawiusza w postaci: Jq(n) = 1 + d jcq) + q ( n —a{,q)), dla a[q) ^ n < a [ ^ , . 45. Zastosuj metodę z ćwiczenia 30, by znaleźć rozwiązanie rekurencji Yo = m , Yn = 2Y2 n - 1! - 1 , dla n > 0, gdzie m jest dodatnią liczbą całkowitą. 46. Udowodnij, że jeśli rt = [(a/2 + a/2 ) m j , gdzie m i l są liczbami natu ralnymi, to [y / 2n {n + 1 )J = [ ( \ / 2 l+1 + \ / 2 l )rnj. Użyj tej zadziwiającej własności, by znaleźć postać zwartą rekurencji Lo = a , a > 0 jest liczbą całkowitą; u dla n > 0 . = [ y 2 L n—i(L n —1 + 1 )J , Wskazówka: [ y /2 n (n + 1 )J = \_\/2{n + jlJ • 47. O funkcji f(x) powiemy, że jest pow ielająca, jeśli dla każdej dodatniej liczby całkowitej m spełniona jest równość f(mx) — f(x) + f (x + H-------h f (x + • Znajdź warunek konieczny i dostateczny, który musi spełniać liczba rze czywista c, by następujące funkcje były funkcjami powielającymi: a) f(x) = x + c. b) f(x) = [x + c jest liczbą całkowitą]. c) f(x) =max(|_x_|,c). d) f(x) = x + c|_xj — j[ x nie jest liczbą całkowitą]. 48. Udowodnij tożsamość x 3 = 3x[x|_x_|J + 3{x}{x|_xJ} + {x}3 —3|_xJ |x [xj J + |_xj3 , i pokaż, jak osiągnąć podobne wzory dla xn , gdy rt > 3. 49. Jakie liczby rzeczywiste O ^ a < 1 i p ^ O da się jednoznacznie wyzna czyć ze zbioru z powtórzeniami { [naj + |n|3j | rt > 0 } ? P ro b lem y badaw cze 50. Znajdź warunek konieczny i dostateczny spełniany przez liczby rzeczywi ste oc i |3 dające się jednoznacznie wyznaczyć ze zbioru z powtórzeniami postaci { |_|uaj Pj | ti > 0 } . 51. Niech x będzie liczbą rzeczywistą nie mniejszą niż <f) = ^(1 + y/5). Roz wiązanie rekurencji Z 0 (x) x, Zn (x) — Z-tl—i (x ) 2 — 1 , dla n > 0, można zapisać jako Zn (x) = [f(x)2n] , jeśli x jest liczbą całkowitą i f(x) = lim Zn (x)1/2" , n —tôo ponieważ w tym przypadku Zn (x) — 1 < f(x )2n < Zn (x). Jakie inne ciekawe własności ma funkcja f(x)? 52. Niech zbiór z powtórzeniami Spec(a;|3) = {|_a + |3J,|_2 a + |3J, |3 a + |3J, . . . } będzie uogólnieniem zbioru Spec(a) = Spec(a;0) dla danych nieujem nych liczb rzeczywistych oc i p. Czy prawdą jest, że jeśli m ^ 3, to zbiory z powtórzeniami S p ec(a i; P i), Spec(a 2 ; P2 ), . . . , Spec(am; pm) są podzia łem zbioru dodatnich liczb całkowitych i jeśli liczby ai < a 2 < • • • < a m są wymierne, to <*k = 2m - 1 2 k -i ’ dla 1 ^ k ^ m ? 53. Algorytm Fibonacciego (ćwiczenie 9) jest „zachłanny” w tym sensie, że wybiera w każdym kroku najmniejsze możliwe q. Jest znany bardziej skomplikowany algorytm, w którym każdy ułamek m /n o nieparzystym mianowniku n może być przedstawiony jako suma różnych ułamków egip skich 1/qi + • • • + l/qic o nieparzystych mianownikach. Czy dla takiej reprezentacji zachłanny algorytm zawsze się zatrzyma? f 4 ] Teoria liczb \ Innymi słowy: bądź gotów na zatonięcie. Liczby całkowite stanowią podstawę matematyki dyskretnej, której w tej książce poświęcamy szczególną uwagę. Zrozumiałe więc jest, że chcemy skupić się nieco na teorii liczb, ważnej gałęzi matematyki, związanej z własnościami liczb całkowitych. Na wody teorii liczb wpłynęliśmy już w poprzednim rozdziale, gdy ba daliśmy działania binarne ‘mod’ i ‘NW D’. Zanurzmy się teraz na serio w ten dział matematyki. 4.1. P od zieln ość________________________________ Mówimy, że m dzieli n (albo n jest podzielne przez m), gdy m > 0 i iloraz m /n jest liczbą całkowitą. Zależność ta stanowi podstawę całej teorii liczb, zatem warto wprowadzić specjalną notację na jej oznaczenie. Piszemy zatem m \n żadna liczba nie jest podzielna przez —1 (ściśle rzecz ujmując).” Graham, Knuth i Patashnik [161] m > 0 i n = mk dla pewnego całkowitego k . (4 . 1 ) (Na dobrą sprawę częściej stosowana w literaturze jest notacja ‘m |n \ Pionowe kreski mają jednak zbyt wiele znaczeń— oznaczają wartości bezwzględne, prawdopodobieństwa warunkowe, są używane przy definicjach zbiorów itd. — tymczasem znak „\” jest prawie nie używany. Co więcej, notacja ‘m \n ’ wy wołuje wrażenie, że m jest mianownikiem rozważanego ilorazu. Będziemy więc śmiało pochylali nasz symbol podzielności do tyłu. Będziemy też pisali ‘mXn’, jeśli m nie dzieli n. Istnieje również podobna relacja, „n jest wielokrotnością m,” która ozna cza prawie to samo, z tym, że m nie musi być dodatnie. W takim przypadku mamy na myśli po prostu to, że istnieje liczba całkowita k taka, że n = mk. W związku z tym na przykład istnieje tylko jedna wielokrotność liczby 0, mianowicie samo 0, ale nic nie jest podzielne przez 0. Każda liczba jest wie lokrotnością —1 , ale żadna liczba nie jest podzielna przez — 1 (ściśle rzecz ujmując). Definicje te można zastosować do dowolnych liczb rzeczywistych, np. 2n jest podzielne przez n. Niemniej jednak będziemy ich używali prawie zawsze w sytuacjach, w których zarówno m, jak i n są liczbami całkowitymi. W końcu zajmujemy się teorią liczb. Największy wspólny dzielnik (NWD) dwóch liczb całkowitych m i n jest to największa liczba całkowita, która dzieli obie liczby: N W D (m ,n ) = m ax{k | k \m i k \u } . ( 4 .2 ) Na przykład NW D (12,18) = 6 . To pojęcie jest znane— już czwartoklasiści uczą się wyciągać wspólny dzielnik z licznika i mianownika ułamka m /n , w celu przedstawienia go w postaci nieskracalnej: 12/18 = (1 2 /6 )/(1 8 /6 ) = 2/3. Zauważmy, że dla n > 0 zachodzi N W D (0,n ) = n, ponieważ każda liczba dodatnia dzieli 0 , a liczba n jest największym dzielnikiem samej siebie. Wartość NW D (0,0) pozostawiamy nie zdefiniowaną. Innym spotykanym pojęciem jest najmniejsza wspólna wielokrotność (NWW), N W W (m ,n ) = m in{k | k > 0, m \k i n \k } , ( 4 .3 ) którą pozostawiamy nie zdefiniowaną dla m ^ 0 lub n ^ 0. Znający aryt metykę z łatwością rozpoznają tu najmniejszy wspólny mianownik, spoty kany przy dodawaniu dwóch ułamków z mianownikami odpowiednio m i n. Na przykład NW W (12,18) = 36, a czwartoklasiści wiedzą, żg jz + jg = §£ + jg = | | . Pojęcie NWW odpowiada w pewnym sensie pojęciu NWD, ale nie poświęcimy mu równej uwagi, gdyż NWD ma ładniejsze własności. Jedną z najładniejszych własności NWD jest łatwość jego obliczania za pomocą metody liczącej sobie 2300 lat i nazywanej algorytmem Euklidesa. Aby obliczyć N W D (m ,n ) dla zadanych 0 ^ m < n, algorytm Euklidesa korzysta z następującej rekurencji: N W D (0,n ) = n ; N W D (m ,n ) = NW D (n mod m, m ) , <*§% dla m > 0. (4 .4 ) Tak więc, na przykład, N W D(12,18) = NW D (6,12) = N W D (0,6) = 6 . Przedstawiona rekurencją jest prawidłowa, gdyż każdy wspólny dzielnik m oraz n musi być także dzielnikiem zarówno m, jak i n mod m, które z kolei jest równe n — [n /m jm . Nie wygląda na to, aby istniała jakakolwiek rekurencja opisująca N W W (m ,n ), a zarazem będąca choćby w przybliżeniu tak prosta, jak dla NWD (por. ćwiczenie 2 ). Algorytm Euklidesa daje nam jeszcze więcej. Możemy rozszerzyć go tak, aby znalazł liczby całkowite m / i n / spełniające równość m /m + n ' n = N W D (m ,n ). (4 -5 ) W Anglii nazywa się go ‘hcf’ (highest common factor), a w USA ‘gcd’ (greatest common divisor). Tylko proszę nie pomylić jej z największą wspólną wielokrotnością. msMmmmmmKmmmĘHHiKm |4 . Teoria liczb (Rzecz jasna m/ oraz n ' mogą być ujemne.) Oto w jaki sposób. Jeśli m = 0, to bierzemy po prostu m / = 0 i n ' = 1. W przeciwnym przypadku przyjmujemy r = n mod m i stosujemy tę metodę rekurencyjnie dla r i m zamiast m i n , wyliczając f i r n takie, że rr + m m = N W D (r,m ). Ze względu na to, żer = n —[n /m jm , a zarazem NW D(r, m) = N W D (m ,n ), równanie powyższe daje nam r ( n — [n /m jm ) + m m = N W D (m , n ) . Lewą stronę tego równania można tak zapisać, aby od razu było widać zależ ność między m i n: (m — [n /m jr ) m + r n = N W D (m ,n ); zatem m/ = m — [n /m jr i n ' = r są tymi liczbami, których poszukujemy w celu spełnienia równania (4.5). W naszym ulubionym przykładzie, gdzie m = 12, n = 18, metoda ta daje nam 6 = 0-0 + 1- 6 = 1*6 + 0-12 = (—1)*12 + 1 -18. Czemu jednak istnienie liczb spełniających równanie (4.5) miałoby być takim ładnym wynikiem? Przede wszystkim dlatego, że w istocie liczby m/ i n ' dowodzą, że algorytm Euklidesa dostarcza prawidłowej odpowiedzi w każdym przypadku. Załóżmy, że nasz komputer po żmudnych obliczeniach da nam odpowiedź, że N W D (m ,n ) = d i że m /m + n ' n = d. My jednak jesteśmy sceptyczni i podejrzewamy, że istnieje większy, pominięty przez nas wspólny dzielnik liczb m i n . Tak jednak zdarzyć się nie może, ponieważ każdy dzielnik liczb m i n musi jednocześnie dzielić liczbę m /m + n 'n , więc także liczbę d. Skoro tak, to dzielnik ten nie może przekraczać d. Idąc dalej, możemy bez trudu sprawdzić, że d dzieli zarówno m, jak i n. (Algorytmy, które same podają swoje uzasadnienie, nazywają się samouzasadniającymi.) Równanie (4.5) będzie wielokrotnie wykorzystywane w pozostałej części tego rozdziału. Jednym z jego ważnych wniosków jest następujące minitwierdzenie: k \m i k \n k \N W D (m ,n ). (4 .6 ) (Dowód: Jeśli k dzieli zarówno m, jak i n, to dzieli również m /m + n 7n, a zatem dzieli także N W D (m ,n ). Na odwrót, jeśli k dzieli N W D (m ,n ), to dzieli któryś z dzielników m oraz któryś z dzielników n, zatem musi dzielić także m i n. Nigdy nie było dla nas niespodzianką, że każdy wspólny dzielnik m i n musi być mniejszy lub równy ich największemu wspólnemu dzielni kowi; wynikało to wprost z definicji NWD, teraz jednak wiemy, że każdy ich wspólny dzielnik jest dodatkowo dzielnikiem ich NWD. Będziemy czasami wykonywali sumowanie względem wszystkich dzielni ków liczby n. W takim przypadku wygodniej jest użyć poręcznego wzoru całkowite n > 0 . m \n (4 .7 ) rn\n który zachodzi ze względu na to, że kiedy m przebiega przebiega wszystkie wartości dzielników liczby n, to n /m także przebiega ten zbiór wartości. Na przykład jeśli n = 1 2 , to cii + 0.2 + 0 3 + 0 4 + 0.6 + 0 1 2 = clm + <*6 + 0 4 + a3 + a2 + a i . Możemy przytoczyć tu nieco ogólniejszą tożsamość Y = m \n Y Y a m [n = m k ], k (4 .8 ) m>0 którą można bezpośrednio wyprowadzić z definicji ( 4 . 1 ). Jeśli n jest dodat nie, to prawa strona (4 .8 ) wynosi on/k i z tożsamości (4 .8 ) wynika wzór ( 4 .7 ). Równanie ( 4 .8 ) jest przy tym także spełnione dla n ujemnych. (W takim przypadku niezerowe wyrazy po prawej stronie występują wówczas, gdy k jest przeciwne do pewnego dzielnika liczby n.) Co więcej, sumę podwójną względem dzielników można „przestawić”, zgodnie z prawem I I Clk >m — m \n k \m z z (4-9) O k .k l • k \n l\(n /k ) Na przykład prawo to przybiera następującą postać dla n = 12: 0 -1,1 + (cl 1,2 + 0 -2 , 2 ) + ( 0 + 3 + 0 3 ,3 ) + (di }ą + 0-2,4 + 0 4 ,4 ) + (di + + <12,6 + 0-3,6 + 06,e] ( 0 1 , 1 2 + 0 2 , 1 2 + 0 3 , 1 2 + O4 1 2 + 0 6 , 1 2 + 0 1 2 , 1 2 ) = ( 0 -1,1 + Oi,2 + Oi}3 + 0-1,4 + 0 .1,6 + 0 1 ,12 ) + ( 0 2 ,2 + 0 2 ,4 + 0 2 ,6 + 0 2 ,1 2 ) + + ( 0 4 , 4 + O4 J 2 ) + ( 0 3 ,3 + 0 3 ,6 + 0 3 ,1 2 ) (06,6 + 06,12) + 012,12 • Równanie ( 4 .9 ) możemy udowodnić za pomocą notacji Iversona. Lewa strona jest równa j,l k,m > 0 j k ,l> 0 a prawa j,m k ,l> 0 m k ,l> 0 co daje to samo, z dokładnością do przemianowania indeksów. Przykład ten pokazuje, że metody, których nauczyliśmy się w rozdziale 2 , będą użyteczne także w trakcie badań nad teorią liczb. 4.2. Liczby pierw sze A co z p w słowie ‘pierwsza’ ? Dodatnia liczba naturalna p nazywana jest liczbą pierw szą, gdy ma dokład nie dwa dzielniki, a mianowicie 1 oraz p. W pozostałej części tego rozdziału rezerwujemy symbol p dla oznaczenia liczby pierwszej. Symbolu tego bę dziemy używali bez przypominania za każdym razem, że chodzi nam o liczbę pierwszą. Umawiamy się, że 1 nie jest liczbą pierwszą. Ciąg liczb pierwszych zaczyna się więc następująco: 2 ,3 ,5 , 7, 11, 13, 17, 19, 23, 29, 31,37, 41, . . . . \ Niektóre liczby wyglądają, jak pierwsze, ale nimi nie są, np. 91 (= 7 -1 3 ) lub 161 (= 7*23). Liczby te oraz wszystkie inne mające 3 lub więcej dzielników nazywamy liczbami złożonymi. Każda liczba większa niż 1 jest albo pierwsza, albo złożona. Liczby pierwsze mają ogromne znaczenie. Stanowią podstawowe cegiełki, z których są zbudowane liczby naturalne. Każda dodatnia liczba naturalna rt może być przedstawiona jako iloczyn liczb pierwszych: n = pi . . . p n = flv . Pi < . < (4-io] k =1 Na przykład 12 = 2-2 -3 ; 11011 = 7-11-11-13; 11111 = 41 -271. (Iloczyny oznaczane za pomocą notacji Yl są analogiczne do sum przedstawianych w notacji Y_} jak to było wyjaśnione w ćwiczeniu 2.25.) Jeśli m = 0, to rozwa żany iloczyn, jako pusty, przybiera wartość 1 na mocy definicji. Wyjaśnia to, jak możemy otrzymać liczbę rt = 1 reprezentowaną w postaci ( 4 . 1 0 ). Roz kład na czynniki pierwsze jest zawsze możliwy, ponieważ jeśli n > 1 nie jest liczbą pierwszą, to ma dzielnik rti taki, że 1 < rti < rt; możemy więc napi sać n = u i -ri2 , a dalej, na mocy indukcji wiemy, że rti i rtz mogą zostać przedstawione jako iloczyny liczb pierwszych. Co więcej, rozwinięcie (4 . 1 0 ) jest jednoznaczne. Istnieje tylko jeden spo sób, w jaki liczbę rt możemy zapisać jako iloczyn liczb pierwszych w niemalejącym porządku. Stwierdzenie to nazywane jest podstawowym twierdzeniem arytmetyki i wygląda tak naturalnie, że nie wiadomo, co tu w ogóle jest do do wodzenia. W jaki sposób mogłyby istnieć dwa różne zbiory liczb pierwszych o tym samym iloczynie? W istocie nie mogą, ale bynajmniej nie wynika to wprost „z definicji liczb pierwszych.” Na przykład, jeśli rozważymy zbiór wszystkich liczb rzeczywistych postaci m + nVTO dla całkowitych m i u, to iloczyn dowolnych dwóch takich liczb jest znów liczbą z tego zbioru. Mo żemy więc wprowadzić pojęcie „liczby pierwszej” w tym zbiorze, nazywając tak każdą liczbę, która nie może być rozłożona w nietrywialny sposób. Liczba 6 ma dwie reprezentacje, 2-3 = (4 + VTÓ)(4 —a/10 ); co więcej, ćwiczenie 36 pokazuje, że liczby 2, 3, 4 + y/TÓ i 4 — vTÓ są „pierwsze” w tym zbiorze. Widać więc, że powinniśmy przeprowadzić precyzyjny dowód tego, że rozkład (4 . 1 0 ) jest jednoznaczny. Oczywiście dla rt = 1 mamy niewątpliwie jedyną możliwość rozkładu, gdyż iloczyn musi być w tym przypadku pusty. Załóżmy więc, że rt > 1 oraz że wszystkie liczby mniejsze od rt rozkładają się w jednoznaczny sposób. Przypuśćmy, że istnieją dwa rozkłady n = Pi-.-Pm = qi . . . q k , Pi^***^Pm i qi^--*^qk, gdzie wszystkie liczby p i q są pierwsze. Udowodnimy, że pi = q i. Gdyby tak nie było, wówczas ze względu na symetrię moglibyśmy założyć, że pi < -qi, co oznaczałoby, że pi jest mniejsze od wszystkich q. Ponieważ jednak pi oraz qi są pierwsze, więc ich NWD musi być równy 1. W takim razie samouzasadniający się algorytm Euklidesa znajdzie liczby a i b takie, że api + b q i = 1 . Zatem apiq2 ...qk + bqiq2 ...qk = q2 . . . q k . Liczba p 1 dzieli oba składniki po lewej stronie (drugi z nich ze względu na to, że dzieli qi . . . qk = rt), jest więc także dzielnikiem prawej strony, q2 . . . qkW związku z tym liczba q 2 . . . qk/Pi jest całkowita, a jako mniejsza od rt ma jednoznaczny rozkład (założenie indukcyjne), w którym pi musi wystąpić. Sprzeczność, do której doszliśmy, oznacza, że p 1 musi być w końcu równe q i . Możemy zatem podzielić oba rozkłady przez pi otrzymując p 2 .. .p m = q2 . . . qk < rt. Na mocy założenia indukcyjnego pozostałe dzielniki muszą być sobie równe, co kończy nasz dowód jednoznaczności. Czasami wygodnie jest podać Podstawowe Twierdzenie Arytmetyki w nieco innej postaci: Każda liczba naturalna może być jednoznacznie przedstawiona jako rt = ]^ [p np , gdzie każde rtp ^ 0 . ( 4 -11) p Prawa strona to iloczyn wyliczony względem nieskończonej liczby liczb pierw szych, ale dla dowolnego rt prawie wszystkie wykładniki będą równe zeru, więc odpowiadające im czynniki będą równe 1. Jest to więc w istocie iloczyn skończony, podobnie jak wiele spośród rozważanych przez nas sum „nieskoń czonych” okazywało się skończonymi, gdyż prawie wszystkie ich wyrazy były równe zeru. Wzór (4 . 1 1 ) przedstawia n jednoznacznie, możemy więc myśleć o ciągu (1x2 , 1x3 , 1x5 , . . . ) jako o system ie liczbowym dla zbioru liczb naturalnych. Taka reprezentacja wykładników liczb pierwszych dla liczby 12, to na przy kład ( 2 ,1 ,0 ,0 ,...) , a dla liczby 18 to ( 1 ,2 ,0 ,0 ,...) . Aby przemnożyć dwie liczby, dodajemy ich reprezentacje wektorowo. Innymi słowy, k = mn <ś=> kp = m p + n p dla każdego p. (4 . 1 2 ) W reprezentacji tej mamy też m \n mp ^ n v dla każdego p, U -^ ) z czego od razu wynika, że k - N W D (m ,n ) <ś=> kp = min(mp ,rtp ) dla każdego p; (4 . 1 4 ) k = N W W (m ,n) <=> kp = max(mp ,rtp ) dla każdego p. (4 . 1 5 ) Weźmy na przykład 12 = 2 2 -3 1 i 18 = 2 1 -32. Możemy uzyskać ich najwięk szy wspólny dzielnik i najmniejszą wspólną wielokrotność biorąc minimum i maksimum po ich wspólnych wykładnikach: NWD(12,18) = 2” ” '2-1' - 3 min(1’2) = 21 -31 = 6; NWW(12,18) = 2m“ (2'1>-3m“ (1’2) = 22 -32 = 36. Jeśli liczba pierwsza p dzieli iloczyn m n, to dzieli albo-liczbę m, albo n, albo obie z nich, na mocy twierdzenia o jednoznacznym rozkładzie. Liczby złożone nie mają jednak tej własności. Na przykład liczba złożona 4 dzieli 60, ale nie dzieli ani 6 , ani 1 0 . Z prostej przyczyny: dwa czynniki pierwsze z rozkładu 4 = 2 - 2 znalazły się w różnych częściach iloczynu 60 = 6 • 10 = (2-3) (2-5), więc 4 nie dzieli żadnej z nich. Liczba pierwsza jest jednak nie podzielna, stąd musi dzielić któryś z zadanych czynników. „Oi npcóroi a p iO iio l 7r\e to v ę 4.3. P ierw sze przykłady________________________ elcrl n a u r b ę t o v npoTeOei/Toę n\f)Q ovę 'KpUTUV apiOiiCoi'” Euklides [98] Tłumaczenie: „Jest więcej liczb pierwszych niż w każdym danym zbiorze liczb pierwszych Ile jest liczb pierwszych? Dużo. W rzeczywistości nieskończenie wiele. Eukli des udowodnił to dawno temu jako Twierdzenie 9: 20, w następujący sposób: Załóżmy, że liczb pierwszych jest tylko skończenie wiele, dajmy na to k — 2, 3, 5, . . . , Pic- W takim razie, rozumował Euklides, powinniśmy przyjrzeć się liczbie U M = 2 - 3 - 5 - . . . - Pi c + 1. Żadna z k liczb pierwszych nie jest dzielnikiem M., gdyż każda dzieli M — 1. Musi więc istnieć inna liczba pierwsza, która dzieli M; być może samo M jest liczbą pierwszą. Jest to sprzeczne z założeniem, że 2, 3, . . . , Pk są jedynymi liczbami pierwszymi, musi ich być więc nieskończenie wiele. Dowód Euklidesa nasuwa pomysł zdefiniowania liczb Euklidesa za po mocą następującej rekurencji: = e ie 2 . . . e n_i + 1 , g d y n ^ l. (4 . 1 6 ) Początek ciągu wygląda tak: ei = 1 + 1 = 2; e 2 = 2 + 1 = 3; e 3 = 2 - 3 + 1 = 7; e4 = 2 -3 -7 + 1 = 43. Są to wszystko liczby pierwsze, ale kolejna liczba Euklidesa, es, jest równa 1807 = 13-139. Okazuje się, że co prawda liczba e& = 3263443 jest pierwsza, ale liczby e 7 = 547-607-1033-31051; e 8 = 29881-67003-9119521-6212157481 są złożone. Wiadomo, że liczby eę, . . . , e w są złożone i zapewne pozostałe liczby en są również złożone. Niemniej jednak liczby Euklidesa są parami względnie pierw sze, czyli N W D (em,e n ) = 1, gdym ^n. Algorytm Euklidesa (i co jeszcze?) gwarantuje nam to w trzech krótkich krokach, ponieważ en mod em = 1 dla rt > m, a zatem: N W D (em,e n ) = N W D (1 ,em) = N W D (0,1) = 1. W związku z tym, jeśli przyjmiemy, że q3- jest najmniejszym czynnikiem pierwszym liczby ej dla każdego j ^ 1 , to wszystkie liczby qi, q2, q3 , . .. będą różne. Jest to ciąg nieskończenie wielu liczb pierwszych. Zatrzymajmy się, aby rozważyć liczby Euklidesa z punktu widzenia roz działu 1?. Czy możemy wyrazić en w postaci zwartej? Rekurencją ( 4 . 1 6 ) może być uproszczona przez usunięcie trzech kropek: Jeśli rt > 1, to Sn = e-| . . . en_ 2 eTL_i + 1 = (en_i — 1 )e-n._i + 1 = e 2 _-| — e ^ -i + 1 . Liczba en ma mniej więcej dwa razy tyle cyfr, co en_ i. W ćwiczeniu 37 dowodzimy, że istnieje stała E « 1,264 taka, że ń V Natomiast ćwiczenie 60 dostarcza nam podobnego wzoru, który generuje wy łącznie liczby pierwsze: Vn = [P 3nJ , ( 4 - 18 ) dla pewnej stałej P. Równości takie jak ( 4 . 1 7 ) i (4 . 1 8 ) nie mogą być niestety uznane za napisane w postaci zwartej, ponieważ stałe E i P są wyliczone z ciągów* liczb en i pn w podejrzany sposób. Nie jest znany (ani podejrzewany 0 istnienie) żaden wzór wiążący te stałe z innymi znanymi stałymi matema tycznymi. Tak naprawdę nikt nie wie, czy istnieje jakikolwiek wzór generujący dowolnie duże liczby pierwsze i tylko liczby pierwsze. Informatycy z konsor cjum Chevron Geosciences dokopali się do matematycznej ropy w r. 1984. Za pomocą programu stworzonego przez Davida Słowińskiego odkryli testując superkomputer Cray X-MP największą znaną wtedy liczbę pierwszą 2216091 _ 1 Albo nawet więcej w chwili, gdy to czytasz. Liczbę tę łatwo jest wyliczyć na dowolnym mikrokomputerze w ciągu paru milisekund. Wszystkie bowiem komputery używają do reprezentacji liczb za pisu dwójkowego, a ta liczba, w zapisie dwójkowym, to po prostu ciąg jedy nek: (11 . . . 1) 2 - Wszystkie 216091 bitów tej liczby to jedynki. Dużo trudniej natomiast pokazać, ze względu na jej wielkość, że liczba ta jest pierwsza. Na wet wyrafinowane algorytmy potrzebują bowiem paru minut, aby wyrazić tę liczbę w postaci dziesiętnej na komputerze klasy PC. Wydrukowana składa się z 65050 cyfr dziesiętnych, a wysłanie takiego wydruku pocztą kosztowa łoby w USA 78 centów. Nawiasem mówiąc 2 216091 —1 jest liczbą ruchów niezbędną do przełożenia 216091 krążków wieży z Hanoi. Liczby postaci 2P —1 , gdzie p jest liczbą pierwszą, nazywane są liczbami M ersen n e’a, upamiętnia jąc w ten sposób Ojca Marina Mersenne’a, który badał niektóre ich własności w XVII wieku [269]. Liczby pierwsze Mersenne’a znane przed r. 1998 odpo wiadają wykładnikom p = 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1279, 2203, 2281, 3217, 4253, 4423, 9689, 9941, 11213, 19937, 21701, 23209, 44497, 86243, 110503, 132049, 216091, 756839, 859433, 1257787, 1398269 1 2976221. Liczba 2n — 1 nie może być pierwsza, jeśli rt jest liczbą złożoną, gdyż 2 km — 1 jest podzielne przez 2 m — 1 : 2 km — i = ( 2 m — l) ( 2 m (k- 1 ^ + 2 m (k-2) -1______b - 1 ) . Jednak nie zawsze liczba 2P — 1 jest pierwsza dla pierwszego wykładnika p; 2 11 — 1 = 2047 = 23*89 jest najmniejszą ze znanych takich liczb. (Mersenne wiedział o tym.) Szukanie rozkładów liczb lub sprawdzanie czy są pierwsze, są dziś gorą cymi" tematami. Podsumowanie tego, co było wiadome do r. 1981, można zna leźć w rozdziale 4.5.4 książki [208]; później pojawiło się jeszcze wiele nowych rezultatów. Na stronach 391-394 wspomnianej książki znajdziemy konkretną metodę sprawdzania, czy liczba Mersenne’a jest pierwsza. W ciągu ostatnich 2 wieków największa znana liczba pierwsza była zawsze liczbą Mersenne’a. Niezależnie od tego, że znanych jest raptem niespełna 40 liczb pierwszych Mersenne’a. Wiele ludzi szuka następnych, ale jest to coraz trudniejsze. Ci więc, którzy są naprawdę zainteresowani zdobyciem sławy (jeśli nie fortuny) i znalezieniem się w Księdze rekordów Guinessa, mogą popróbować liczb postaci 2nk + 1, dla małych wartości k w rodzaju 3 lub 5. To, czy liczby tej postaci są pierwsze, czy nie, daje się sprawdzać równie łatwo, jak w przypadku liczb Mersenne’a; ćwiczenie 4.5.4-27 z [208] zawiera odpowiednie szczegóły. Nie odpowiedzieliśmy jeszcze w pełni na nasze początkowe pytanie, ile jest tak naprawdę liczb pierwszych. Oczywiście jest ich nieskończenie wiele, ale wiemy, że niektóre zbiory nieskończone są „gęstsze” niż inne. Na przy kład pośród liczb naturalnych mamy nieskończenie wiele liczb parzystych oraz nieskończenie wiele liczb będących kwadratami innej liczby naturalnej, tzw. pełnych kwadratów, niemniej jednak pod pewnymi względami liczb pa rzystych jest więcej niż takich pełnych kwadratów. Jeden z takich względów może dotyczyć wielkości n-tej wartości rozważanego ciągu. W naszym przy padku n-t a liczba parzysta, to 2u, a ri-ty pełny kwadrat, to u 2. Ponieważ 2n jest znacznie mniejsze niż rt2 dla dużych n, więc możemy powiedzieć, że wśród liczb naturalnych znacznie więcej jest liczb parzystych niż pełnych kwadratów. Z podobnego punktu widzenia można rozważać liczbę wartości nie prze kraczających x. Istnieje [x / 2\ takich liczb parzystych i [\/xJ takich pełnych kwadratów, a ponieważ x / 2 jest znacznie większe dla dużych x od ^/x, więc i z tego punktu widzenia możemy twierdzić, że liczb parzystych jest znacznie więcej. Co możemy powiedzieć o liczbach pierwszych ze względu na te dwa po dejścia? Okazuje się, że ri-ta liczba pierwsza Pn jest równa mniej więcej n razy logarytm naturalny z rt: Dziwne. Zdawało mi się, że jest tyle samo liczb parzystych, co pełnych kwadratów, gdyż istnieje odpowiedniość 1-1 między tymi zbiorami. Pn ~ n l n n . (Symbol może być odczytany jako „jest asymptotyczne do”. Oznacza on, że granica ilorazu Pn/rt lnrt jest równa 1 przy n dążącym to nieskończoności.) i Podobnie, dla określenia liczby tc( x ) liczb pierwszych nie przekraczają cych x mamy coś, co się nazywa twierdzeniem o liczbach pierwszych: 7T(x) ~ ln x Udowodnienie tych dwóch faktów wykracza poza zakres tej książki, jakkol wiek z łatwością można wykazać, że każdy z nich pociąga za sobą drugi. W rozdziale 9 omówimy szybkości, z jakimi funkcje dążą do nieskończono ści i przekonamy się, że funkcja rtln n , będąca przybliżeniem P(n), zawiera się asymptotycznie pomiędzy 2n a n 2. Liczb pierwszych jest więc mniej niż parzystych, ale więcej niż pełnych kwadratów. Wzory te zachodzą jedynie asymptotycznie przy rt lub x dążących do oo, ale można podać dokładniejsze oszacowania. Rosser i Schoenfeld [313] wyprowadzili na przykład poręczne nierówności ln x — | < ln x — ^ , dla x ^ 67; (4 . 1 9 ) n (ln n + l n l n n — | ) < Pn < n(lnrt + l n l n n — ^), dla u ^ 20. ( 4 .2 0 ) Jeśli przyjrzymy się „losowej” liczbie rt, to szanse na to, że będzie ona pierwsza, mają się mniej więcej jak jeden do Inn. Na przykład jeśli weź miemy liczby bliskie 1016, to średnio po I6ln10 « 36,8 próbactrtrafimy na liczbę pierwszą. (Okazuje się, że istnieje dokładnie 10 liczb pierwszych w przedziale od 10 16 — 370 do 10 16 — 1.) Wciąż jednak występowanie liczb pierwszych wykazuje wiele nieregularności. Na przykład wszystkie liczby po między Pi P2 . . . Pn + 2, a Pi P2 . . . Pn + Pn+i —1 włącznie są złożone. Istnieje wiele przykładów bliźniaczych liczb pierwszych p oraz p + 2: (5 i 7, 11 i 13, 17 i .19, 29 i 31, . . . , 9999999999999641 i 9999999999999643, . . . ), ale jeszcze nikt nie wie, czy takich par jest nieskończenie wiele (zob. Hardy i Wright [181, §1.4 i §2.8]). Jedną z prostszych metod obliczenia wszystkich 7t(x) liczb pierwszych nie większych od x jest skonstruowanie tzw. sita Eratostenesa. Wypisujemy najpierw wszystkie liczby naturalne od 2 do x. Zakreślamy 2, jako pierw szą, i skreślamy wszystkie wielokrotności 2. Następnie, kolejno, zakreślamy najmniejszą nietkniętą liczbę i znów skreślamy wszystkie jej wielokrotności. Kiedy każda liczba będzie zakreślona lub skreślona, wówczas zakreślone liczby będą szukanymi liczbami pierwszymi. Na przykład jeżeli x = 10, to wypisu jemy wszystkie liczby od 2 do 1 0 , zakreślamy 2 , skreślamy wielokrotności 2 : 4, 6 , 8 i 10. Teraz 3 jest najmniejszą nietkniętą liczbą, więc zakreślamy ją i skreślamy 6 i 9. Teraz już liczba 5 jest najmniejsza, więc zakreślamy ją i skreślamy 10. W końcu zakreślamy 7. Zakreślone liczby, to 2, 3, 5 i 7, jest więc 7t( 1 0 ) = 4 liczb pierwszych nie przekraczających 10. 135 llfef 't~ .(t 4.4. W sp ó łczy n n ik i rozkład u silni j 4.4. W sp ółczyn n ik i rozkładu silni Przyjrzyjmy się teraz rozkładowi pewnych ciekawych bardzo dużych liczb, niewątpliwie złożonych, a mianowicie silni: rt n! = 1-2 (4-ai; = n * . k=1 Zgodnie z naszą konwencją pusty iloczyn określa 0! jako 1. W związku z tym rt! = (n — l ) ! n dla każdej liczby całkowitej dodatniej n. Jest to liczba permutacji u różnych obiektów. Innymi słowy, chodzi tu o liczbę sposobów, na które można ułożyć rt elementów w ciąg. Mamy n możliwości wybrania pierwszego elementu; dla każdej z nich mamy n — 1 możliwości wybrania drugiego; dla każdej z tych rt(n—1 ) możliwości mamy n —2 możliwości wyboru trzeciego itd. co daje ostatecznie n (n — 1 ) (rt —2 ) . . . ( 1 ) ułożeń wszystkich n elementów. Oto kilka początkowych wartości funkcji silnia: “Je me sers de la notation tres simple n! pour designer le produit de nombres decroissans depuis n jusqu’a 1’unite, savoir n (n —1) n 0 1 2 3 4 5 6 7 8 9 10 ( n - 2 ) . . . . 3.2.1. n! 1 1 2 6 24 120 720 5040 40320 362880 3628800 U emploi continuel de 1’analyse combinatoire que je fais dans la plupart de mes demonstrations, a rendu cette ńotation/ indispensable.” Ch. Kramp [228] Warto znać kilka podstawowych faktów dotyczących silni, takich jak choćby wartości pierwszych mniej więcej sześciu silni, lub to, że 1 0 ! to nieco więcej niż 3 j miliona. Innym interesującym faktem jest to, że liczba cyfr dziesiętnych rt! przekracza n, gdy u ^ 25. Możemy pokazać, że wartość tl!jest całkiem duża za pomocą pomysłu Gaussa z rozdziału 1 : n n!2 = (1 - 2 -. . . - rt)(rt • - 2 -1) = J } k ( n + 1 - k ) . k=1 Zachodzą przy tym następujące nierówności: n ^ k(rt + 1 —k) ^ | ( n + 1)2, ponieważ wielomian drugiego stopnia k (n + l —k) = \ (n + 1 )2—(k—\ (n + 1 ) ) 2 przybiera najmniejszą wartość w punkcie k = 1 , a największą wartość w punkcie k = j (n + 1). Zatem (n + 1 ): k=1 k=1 innymi słowy, n n/2 nl < ( n + 1 )' Relacja ta pokazuje nam, że silnia rośnie wykładniczo!! (4 .22; W celu uzyskania lepszego przybliżenia wartości rt! dla dużych rt możemy posłużyć się wzorem Stirlinga, który zostanie wyprowadzony w rozdziale 9 : n! ~ V 2n n (J ^ j . (4*23) Dokładniejsze przybliżenie obejmuje jeszcze asymptotyczny błąd względny: wzór Stirlinga daje wartość mniejszą od rt! o czynnik rzędu 1/(12rt). Nawet dla małych wartości rt to ściślejsze przybliżenie jest całkiem dobre. Na przy kład wzór Stirlinga ( 4 .2 3 ) daje wartość bliską 3598696 dla rt = 10, co jest o ok. 0,83% « 1/120 za małe. Niezła rzecz, ta asymptotyka. Wróćmy jednak do liczb pierwszych. Chcielibyśmy dla danej liczby pierw szej p określić jej największą potęgę, która dzieli rt!, czyli chcemy uzyskać wykładnik przy p w jednoznacznym rozkładzie liczby rt!. Oznaczmy ten wy kładnik przez ep (rt!) i zacznijmy nasze badania od małych wartości p = 2 i rt = 10. Ponieważ 10! jest iloczynem 10 liczb, więc 6 2 ( 1 0 !) może być wyli czone przez zsumowanie potęg dwójki, które występują w rozkładach tych 10 liczb. Rachunki te odpowiadają przesumowaniu kolumn następującej tabeli: 1 2 3 4 5 6 7 8 9 10 podzielne przez 2 X podzielne przez 4 X podzielne przez 8 potęgi 2 X 0 X X X potęgi 2 5 = |_1 0 / 2 J X 2 = L10/4J X 1 - L10/8J 10201030 1 8 (s]imy w kolumnach mają formę czegoś, co się czasem nazywa funkcją calówki "p(k), ze względu na podobieństwo do calowych linijek ‘ ’, w których coraz krótsze odcinki wyznaczają kolejne ułamki cala.) Suma tych dziesięciu sum wynosi 8 , więc 2 8 dzieli 1 0 !, ale 2 9 już nie dzieli. Jest jeszcze jeden sposób. Możemy zsumować to, co uzyskaliśmy w wier szach. W pierwszym wierszu sumujemy te przypadki, które wnoszą jedną potęgę dwójki (i w związku z tym są podzielne przez 2 ); takich liczb jest [ 1 0 / 2 J = 5. W drugim zaznaczamy te, które wnoszą dodatkową potęgę 2, takich liczb jest |_1 0/4J = 2. W trzecim wierszu mamy zaznaczone te liczby, które wnoszą jeszcze jedną potęgę dwójki, jest ich [10/8J = 1 . To już jest wszystko, co mogliśmy uwzględnić, więc otrzymujemy 6 2 ( 1 0 !) = 5 + 2 + 1 = 8 . Ogólnie, dla dowolnej liczby rt metoda ta daje nam wzór k^l Suma ta jest w rzeczywistości skończona, gdyż wyrazy odpowiadające takim k, dla których 2k > rt, są zerami. Mamy tu więc jedynie [lgrtj wyrazów 4 .4 . W sp ó łczy n n ik ! rozkład u silni niezerowych, co sprawia, że suma ta z obliczeniowego punktu widzenia jest prosta. Na przykład gdy rt = 100, wówczas e 2 (100!) = 50 + 25 + 12 + 6 + 3 + 1 = 97. Każdy wyraz to po prostu podłoga z połowy poprzedniego. Jest to prawdziwe dla każdego rt, gdyż jako przypadek szczególny równania ( 3 . 1 1 ) dostajemy |_n/2k+1J = |_|_n/2 k] / 2 j . Szczególnie w zapisie dwójkowym łatwo jest zoba czyć, co się dzieje: 100 = (1100100)2 = 100 [100/2J = (110010)2= 50 [100/4J = (11001)2= 25 [100/8J = (1100)2= 12 [100/16J = (110)2 = 6 [100/32J = (11)2 = 3 [100/64J = (1)2 = 1 W celu otrzymania kolejnego wyrazu po prostu odrzucamy od jego poprzed nika najmniej znaczący bit. Zapis dwójkowy daje nam możliwość wyprowadzenia kolejnego wzoru: e2(n!) = n - ^ 2( n ) , (4.24) gdzie ^ ( n ) , to liczba jedynek w zapisie dwójkowym liczby rt. Uproszczenie to jest poprawne z tego względu, że każda jedynka, która wnosi 2 m do liczby rt, wnosi również 2 m _1 + 2 m - 2 H-------b 2 ° = 2 m — 1 do wartości e 2 (n!). Uogólniając nasze odkrycia do dowolnej liczby p, na mocy analogicznego rozumowania otrzymujemy ep (n!) (4-25) Jak duże jest mniej więcej ep (rt!)? Możemy otrzymać łatwe i jednocześ nie niezłe ograniczenie, jeżeli zaniechamy brania podłóg z każdego wyrazu, a następnie przesumujemy nieskończony ciąg geometryczny: rt p - i • } Dla p = 2 i n = 100 nierówność ta sprowadza się do 97 < 100. Górne ograniczenie, równe w tym przypadku także 1 0 0 , jest nie tylko prawidłowe, ale również bardzo bliskie dokładnej wartości 97. W rzeczywistości dokładna wartość rt —v 2(tl) wynosi w ogólnym przypadku n, gdyż t 2 (u) ^ flgn ] jest asymptotycznie znacznie mniejsze niż n. Dla 2 i 3 nasze wzory dają e 2(n!) ~ rt i 6 3 (11!) ~ n /2 , jest więc zrozumiałe, że raz na jakiś czas 63 (n!) powinno być równe dokładnie połowie 6 2 (n!). Dzieje się tak na przykład dla n = 6 i n = 7, ponieważ zachodzi 6 ! = 2 4 -32 *5 = 71/7. Nie wiadomo jednak, czy dzieje się tak w nieskończenie wielu przypadkach. Ograniczenie na funkcję ep (n!) daje nam również ograniczenie na funk cję która oznacza wkład czynnika p w rozkład n! : p £ p ( tl! ) ^ ^ Możemy teraz uprościć ten wzór (ryzykując znaczne pogorszenie górnego ograniczenia) zauważając, że p ^ 2 P_1 iw związku z tym zachodzi nierówność pTt/(p-1 ) <; (2 ? - 1 ) = 2n . Innymi słowy, wkład, jaki wnosi jakakolwiek liczba pierwsza do rozkładu u!, jest mniejszy niż 2 n . Możemy wykorzystać to spostrzeżenie w celu uzyskania innego dowodu na to, że liczb pierwszych jest nieskończenie wiele. Gdyby bowiem istniało jedynie k liczb pierwszych 2, 3 ,..., P^, to mielibyśmy n! < (2n )k = 2nk dla wszystkich n > 1 , ponieważ każda liczba pierwsza wnosi wkład równy co najwyżej 2n — 1. Prowadzi to jednak do sprzeczności, gdyż nierówność n! < 2 7lk może być obalona przez wzięcie dostatecznie dużego n, na przykład n = 2 2k; wtedy n! < 2 nk = 2 22kk = n u /2 , co jest sprzeczne z nierównością n! ^ n ^ 2 wyprowadzoną w (4 .2 2 ). Mamy więc znowu nieskończenie wiele liczb pierwszych. Możemy wykorzystać ten rezultat także dla uzyskania zgrubnego ograni czenia na 7t(n), liczbę liczb pierwszych nie przekraczających n. Każda liczba pierwsza wnosi w n! wkład mniejszy niż 2n , więc, podobnie jak przedtem, n , < 2 TL7r( 'n ') . Jeśli teraz zastąpimy n! przez przybliżenie Stirlinga (4 .2 3 ), które ogranicza n! z dołu, to po zlogarytmowaniu otrzymamy n 7t(n) > n lg (n /e ) + jlg (2 7 tn ); czyli 7t(n) > lg (n /e ). 4 .5 . L iczby w zględ n ie p ierw sze 139 To dolne ograniczenie jest dosyć słabe, w porównaniu z faktyczną równością asymptotyczną 7t(n) ~ n /ln n , ponieważ dla dużych n wartość lo g n jest znacznie mniejsza niż rt/log n. Ale w końcu zbytnio się nie napracowaliśmy, a ograniczenie jest ograniczeniem. 4.5. Liczby w zględnie pierw sze O dwóch liczbach m, n mówimy, że są względnie p ierw sze, gdy m i n nie mają wspólnych dzielników pierwszych, czyli gdy N W D(m ,rt) = 1. P o ję c ie to je st n a ty le u ż y te c z n e w p r a k ty c e , że p o w in n iś m y m ie ć n a n ie s p e c j a l n e o z n a c z e n i e . N ie s t e t y ! T e o r i o l ic z b o w c y n ie u z g o d n i l i t a k d o b r e g o o z n a c z e n i a , j a k t o , k t ó r e m a m y z a m ia r z a p r o p o n o w a ć . Z a t e m w o ła m y : U s ł y s z c i e n as, o M atem atycy całego Ś w i a t a ! N ie c zek a jm y a n i c h w il i d ł u ż e j ! M o ż e m y u p r o ś c ić w ie l e w z o r ó w p r z e z p r z y j ę c ie teraz now ej n o t a c ji! Zgódźm y s ię na n o ta cję ‘m _L n ’, c z y t a n ą JAKO “ m PIERWSZE WZGLĘDEM Tl,” JEŚLI TTl I Tl SĄ WZGLĘDNIE PIERWSZE. Innymi słowy, ustalmy, że m m ,n są całkowite i N W D (m ,n ) — 1. n ( 4 .2 6 ) Ułamek m /n jest nieskracalny wtedy i tylko wtedy, gdy m _L n. Ponie waż upraszczamy ułamki wyciągając największy wspólny dzielnik z licznika i mianownika, więc wolno nam podejrzewać, że w ogólności m /N W D (m , n) _L n/N W D (m , n ) ; Podobnie, jak proste prostopadłe nie mają wspólnego kierunku, tak prostopadłe liczby nie mają wspólnego dzielnika pierwszego. ( 4 -2 7 ) i rzeczywiście tak jest. Wynika to z ogólniejszego prawa NW D (km, kn) = k N W D (m ,n ), udowodnionego w ćwiczeniu 14. Relacja _L wyraża się łatwo, jeżeli korzystamy z reprezentacji wykładni czej liczb, z uwagi na regułę NWD (4 . 1 4 ): m _L n <£=> min(mp ,n p) = 0 dla każdego p. ( 4 *2 8 ) Co więcej, ponieważ m p i n p są nieujemne, możemy zapisać to następująco: m ± n <==> m pn p = 0 dla każdego p . ( 4 *2 9 ) Jesteśmy gotowi udowodnić teraz ważny fakt, który pozwala rozdzielać i łą czyć dwie różne relacje _L o tej samej lewej stronie: k 1 m ik 1 n k _L m n (4 -3 0 ) Iloczyn skalarny wynosi zero, tak jak w przypadku wektorów prostopadłych. W świetle równania (4 .2 9 ) prawo to jest innym sposobem powiedzenia, że kpm p = 0 i kpTtp = 0 wtedy i tylko wtedy, gdy kp (mp + rtp) = 0 , dla nieujemnych m p i n p. Ciekawe, że matematycy tak lubią mówić ,odkrycie”^podczas gdy wszyscy inni powiedzieliby „wynalazek” Istnieje piękna metoda konstrukcji wszystkich nieujemnych ułamków po staci m /rt spełniających m _L n, nazywana drzewem Sterna-B rocota za względu na jej odkrycie dokonane niezależnie przez matematyka niemiec kiego, Moritza Sterna [340] oraz przez francuskiego zegarmistrza Achille Brocota [41]. Pomysł polega na rozpoczęciu od dwóch ułamków ( y , 5 ) i następnie na wykonywaniu następującej czynności tak długo, jak długo tego potrzebu jemy: Wprowadź m u + n' między dwa sąsiadujące ze sobą ułamki — i . n w Nowo powstały ułamek (m + vnf) / { n + n f) nazywa się m ediantem ułamków m /n i v n '/n f. Na przykład pierwszy krok daje nam jeden nowy ułamek pomiędzy f i l , 0 1 1 1 > 1 >0 • W kolejnym kroku dostajemy 2 następne: 0 1 1 2 1 1 >2 ’ 1 » 1 >0 * a krok później 4 kolejne: 0 1 1 2 1 3 2 3 1 . 1> 3’ 2> 3’ 1’ 2’ 1’ 1’ 0 ’ Wydaje mi się, że 1/0 to w postaci nieskracalnej po prostu nieskończoność. a dalej uzyskamy 8,16 itd. nowych ułamków. Całą tę strukturę można sobie wyobrazić jako nieskończone drzewo binarne, którego górne poziomy wyglą dają następująco: 2 / V l\ 1 5 2 7 3 8 i\ 3 7 4 7 i\ 5 8 5 7 /\ 4 5 5 4 i\ 7 5 8 5 /\ 7 4 ./ \ 7 3 i\ 8 3 7 2 /\ 5 1 Każdy ułamek jest postaci , gdzie ^ jest najbliższym przodkiem na lewo, a jest najbliższym przodkiem na prawo. (Przodek jest to tu ułamek, który może zostać osiągnięty za pomocą przechodzenia po gałęziach do góry.) Drzewo to ma wiele ciekawych właściwości. Dlaczego ta konstrukcja w ogóle działa? Czeaaurna przykład każdy mediant (m + m /J /fn + n ') okazuje się w postaci nieskracalnej w tym drzewie? (Gdyby np. tl, m, rt', m ' były nieparzyste, wówczas otrzymalibyśmy mediant typu parzyste/parzyste; jednak jakoś tak się dzieje, że ułamki z nieparzystymi licznikami i mianownikami nigdy w tym drzewie obok siebie nie występują.) Dlaczego wszystkie możliwe ułamki występują w drzewie dokładnie raz? Dla czego jakiś ułamek nie mógłby wystąpić 2 razy, albo w ogóle nie wystąpić? Na wszystkie te pytania są zaskakująco proste odpowiedzi, wynikające z następującego podstawowego faktu: Jeśli m /n i m ' / n f są sąsiadującymi ułamkami na dowolnym etapie konstrukcji, to zachodzi m /n —mn' = 1 . (4.3 u.) Równanie to jest spełnione na samym początku konstrukcji (1-1—0-0 = 1), a kiedy wstawimy nowy mediant { m + v n ' ) / ( n + n f), to przypadki, które trzeba sprawdzić, są następujące: (m + m /)n —m (n + n ') = m ,(n + n ' ) - ( m + m ,)n / = 1; 1. Oba te równania są równoważne wyjściowemu równaniu ( 4 .3 1 ), które mają zastąpić. W związku z tym równanie ( 4 .3 1 ) jest spełnione na wszystkich etapach konstrukcji. Co więcej, jeśli m /n < raZ/n' i jeśli wszystkie wartości są nieujemne, to łatwo można sprawdzić, że m /n < (m + m /) /( n + n /) < m ' / n ' . Mediant nie leży dokładnie w połowie między swoimi rodzicami, ale leży gdzieś pośrodku. Konstrukcja ta zachowuje więc porządek i nie jest możliwe uzyskanie jednego ułamka w dwóch różnych miejscach. Ostatnim problemem jest stwierdzenie, czy przypadkiem jakiś ułamek postaci a /b dla a l b nie jest w drzewie Sterna-Brocota pominięty. Odpo wiedź brzmi nie. Możemy bowiem zawęzić pole widzenia do bezpośredniego sąsiedztwa liczby a /b , a jest to rejon łatwo poddający się analizie. Mamy na początku m rt ___ 1 0 Vb / 0 ^ Tt7 / a.\ ^ J_ ______ m/ * przy czym nawiasy naokoło ^ oznaczają, że ułamka ^ tam w rzeczywistości jeszcze nie ma. Jeżeli zatem na pewnym etapie konstrukcji mamy ^ <(t) < to konstrukcja wymusi powstanie ułamka (m + m /)/(n + n ') i mamy 3 przy padki. Albo (m + m ')/(n + n ') = a /b i wygrywamy, albo (m + m ')/(n + n ') < a /b i możemy dokonać podstawienia m m + m', rt f - u + u'; albo (m \ m ')/(n + rt') > a /b i możemy dokonać podstawienia m' f - m + m/, rt' <— n + n '. Proces ten nie może trwać w nieskończoność, ponieważ warunki a _ rtm > o i1 b n' ^ > b 0 powodują, że a n —bm ^ zatem i 1 ^ bm ' — an' ^ 1; . —bm) + (-nfc}(bm' — an') ^ m ' + n ' + m + n ; co jest tym samym, co a + b ^ m ' + n ' + m + n na mocy równania (4 .3 1 ). Ze względu na to, że w każdym kroku musimy zwiększyć albo m, albo n, albo m ', albo n ', wygramy po co najwyżej a + b krokach. Ciąg Fareya rzędu N, oznaczany przez jFn, definiuje się jako posorto wany rosnąco ciąg wszystkich uproszczonych ułamków z przedziału [0 , 1], których mianowniki są równe co najwyżej N. Dla przykładu, ^ przedstawia się następująco: nr — ~ 0 1 1 1 1 2 1 3 2 3 4 5 1 1 > 6 ’ 5> 4> 3> 5 ’ 2 ’ 5 ’ 3> 4 ’ 5> 6> 1 * Ciąg jFn możemy uzyskać zaczynając od 3 ^ = y , j , a następnie wstawia jąc medianty wszędzie tam, gdzie mianownik nie stanie się zbyt duży. Nie pominiemy w ten sposób żadnych ułamków, gdyż wiemy, że konstrukcja Sterna-Brocota nie pomija żadnego z nich, i dlatego jeszcze, że mediant z mianownikiem mniejszym lub równym N nie może powstać z ułamka, któ rego mianownik jest większy niż N. (Innymi słowy, 3 ^ określa poddrzewo drzewa Sterna-Brocota powstałe przez odcięcie wszystkich niechcianych ga łęzi.) Wynika stąd, że gdy m /n i m ,'/n' są kolejnymi elementami ciągu Fa reya, wówczas m 'n —m n ' = 1 . Podana metoda konstrukcji sugeruje, że jFn można łatwo uzyskać z IFn-i • po prostu wkładamy (m + m ')/N między te kolejne ułamki m /n , m '/n ' ciągu jF n-i, których mianowniki sumują się do N. Na przykład ciąg J 7 otrzymu jemy z ciągu $6 wstawiając y, y, . . . , | zgodnie z podaną regułą: nr — J J ~ 0 1 1 1 1 2 1 2 3 1 4 3 2 5 3 4 5 6 1 1 > 7 ’ 6 ’ 5> 4> 7> 3> 5 ’ 7> 2 ’ 7> 5 ’ 3> 7> 4> 5> 6 ’ 7 ’ 1 *• W przypadku gdy liczba N jest pierwsza, pojawi się N —1 nowych ułamków, w przeciwnym razie będzie ich mniej niż N — 1, ponieważ podana metoda tworzy tylko takie liczniki, które są względnie pierwsze z N. Dawno temu, w równaniu ( 4 .5 ), wykazaliśmy, choć inaczej to wyrażali śmy, że jeśli m JL rt oraz 0 < m ^ rt, to można tak dobrać liczby całkowite a i b, że m a —nb — 1 . ( 4 *3 2 ) (Tak naprawdę twierdziliśmy, że m /m + n /r i — NW D (m ,rt), możemy jednak podstawić 1 w miejsce N W D (m ,n ), a w miejsce m /, b zaś w miejsce —rt'.) Ciąg Fareya dostarcza nam nowego dowodu wzoru (4 .3 2 ), ponieważ możemy przyjąć, że b /a jest ułamkiem, który bezpośrednio poprzedza m /n w ciągu SFtl. Wzór (4 .5 ) staje się wtedy równaniem (4 .3 1 ). Na przykład jednym z roz wiązań równania 3 a —7b = 1 jest a = 5, b = 2, ze względu na to, że | poprze dza | w ciągu 3^7. Zastosowana konstrukcja gwarantuje dodatkowo istnienie takiego rozwiązania równania (4 .3 2 ), że 0 b < a < n, jeśli 0 < m ^ n. Podobnie, jeśli 0 ^ n < m i m 1 u, to możemy rozwiązać równanie ( 4 .3 2 ) za pomocą 0 < a ^ b ^ m przyjmując, że a /b jest ułamkiem, który w ciągu jFm następuje po n /m . Każde trzy kolejne wyrazy ciągu Fareya mają zadziwiającą własność udo wodnioną w ćwiczeniu 61. Nie będziemy jednak zatrzymywali się dłużej nad ciągami Fareya, gdyż całe drzewo Sterna-Brocota wydaje się jeszcze bardziej interesujące. Ze względu na to, że każdy uproszczony dodatni ułamek występuje w drzewie Sterna-Brocota tylko raz, możemy w rzeczywistości potraktować to drzewo jako system pozycyjny reprezentujący liczby wymierne. Użyjmy liter L i P do oznaczenia zejścia w lewo lub w prawo na drodze od korzenia drzewa do szukanego ułamka. Wtedy ciąg symboli L i P jednoznacznie określi nam pozycję w drzewie. Na przykład LPPL oznacza, że od -j- zamierzamy pójść w lewo do potem w prawo do | , następnie w prawo do i w końcu w lewo do j . Możemy więc przyjąć, że LPPL reprezentuje liczbę Każdy dodatni ułamek może być w ten sposób reprezentowany jako jednoznaczny ciąg symboli L i P. Na dobrą sprawę mamy tu jeden mały problem. P ustem u ciągowi od powiada ułamek y, więc też musimy go jakoś oznaczyć. Umówmy się, że bę dziemy go oznaczali jako I, bo wygląda to trochę jak 1 i jednocześnie oznacza „identyczność”. Reprezentacja ta skłania do sformułowania dwóch problemów: ( 1 ) Dla danych liczb całkowitych dodatnich m i n takich, że m _L n, znaleźć ciąg zło żony z L i P odpowiadający wartości m /n . ( 2 ) Dla zadanego ciągu złożonego z L i P stwierdzić, jaki ułamek jest przez niego reprezentowany. Problem ( 2 ) wygląda na prostszy, więc przyjrzyjmy mu się najpierw. Określamy f (S) = ułamek odpowiadający S 4. T eoria liczb .Jifj dla S będącego ciągiem złożonym z symboli L i P. Na przykład dla ciągu LPPL otrzymamy f(LPPL) = | . Zgodnie z podaną konstrukcją f(S) = (m + m ')/(n + rt'), jeśli m /n i m '/n ' są ułamkami najbliżej S z lewej i prawej strony w wyższych poziomach drzewa. Początkowo m /n = 0/1, a następnie sukcesywnie zastępujemy albo m /n , albo m '/n ' ich mediantem (m + m ')/(n + n '), w zależności od tego, czy w drzewie schodzimy w prawo, czy w lewo. Jak można wyrazić to zachowanie w postaci wzoru matematycznego, który byłby wygodny w użyciu? Chwila prób wystarcza, aby przekonać się, że najwygodniej jest utworzyć macierz 2 x 2 M(S) = ( U \m n ', V m /y zawierającą cztery wartości pochodzące od rodzicielskich ułamków otaczają cych S: m /n i m '/n '. Moglibyśmy równie dobrze umieścić m i m / na górze, a n i n ' na dole, ale proponowana organizacja macierzy jest naturalniejsza, gdyż na początku całego procesu mamy M(I) = (J°), a macierz (J°) jest tradycyjnie nazywana macierzą jednostkową I. Krok w lewo zamienia n ' na u + n ' oraz m/ na m + m /, więc » ™ - ( : ; ' ) ( J : ) - M,s)0 :)• Jest to szczególny przypadek ogólniejszej reguły mnożenia dwu macierzy roz miaru 2 x 2 : / a \c Jeżeli macierze cię przerażają, nie denerwuj się: występują one w tej książce tylko tutaj. b\ / w x \ _ / aw + by z J ~ \ cw + dy ax + b z \ cx + dz ) ' Podobnie, okazuje się, że »<*■> - u : » - m’0 = Mis,(! ? )■ Jeśli więc zdefiniujemy L i P jako macierze 2 x 2 L= (o !) ’ P= (i i) ’ (4'33) to stosując indukcję ze względu na długość ciągu S otrzymamy prosty wzór M(S) = S. Czyż nie jest to ładne? (Symbole L i P pełnią podwójną rolę: jako macierze i jako elementy alfabetu użytego do budowy S.) Na przykład M(LPPL) = LPPL = Q Q ( ] ? ) a = (?!)(!!) = (Is)- I***'" ^ m W. /y Ł ł ź L m ______ — — Rodzicielskie ułamki, które otaczają LPPL = cja daje odpowiedź na pytanie 2 : «»>-'((: K:- w .— „ ____ 3B flL ....... ..... to | i 4.5. L iczby w zg lęd nie p ierw sze Powyższa konstruk S ) ) - S £ - ,ł34) Jak wygląda sprawa z pytaniem 1 ? Teraz, gdy już rozumiemy podsta wowy związek między węzłami drzewa i macierzami 2 x 2 , jest to proste. Mając parę liczb całkowitych dodatnich m i n takich, że m 1 n, możemy określić pozycję ułamka m /n w drzewie Sterna-Brocota za pomocą „prze szukiwania binarnego” w następujący sposób: S := I; w h ile m /n if m /n ^ f(S) do < f(S) th en (wypisz(L); S := SL) else (wypisz(P); S := S P ). Wynikiem jest żądany ciąg złożony z symboli L i P. Ten sam efekt można osiągnąć w inny sposób, modyfikując liczby m i n zamiast zmieniać stan S. Jeśli S jest dowolną macierzą rozmiaru 2 x 2, to zachodzi f (PS) = f(S) + 1, ponieważ macierz PS różni się tym od S, że górny wiersz macierzy S został dodany do dolnego. Przyjrzyjmy się temu dokładniej, w nieco zwolnionym tempie: S = (\ vnn m/ n' V ) ’ PS = ( n n' \m + n V m/ - h n ' ) ’ zatem f(S) = (m + m /)/(n + n ;), a jednocześnie f(PS) = ((m + n) + (m/ + n ') ) /( n + n ') .) Jeśli będziemy wykonywali algorytm binarnego wyszukiwania dla ułamka m /n przy m > n, to pierwszą wypisaną wartością będzie P, więc następujące po tym działania algorytmu będą miały do czynienia z wartością f(S) dokładnie o 1 większą, niż gdybyśmy zaczęli z liczbą (m —n ) / n zamiast m /n . Podobna własność zachodzi dla L, mamy więc — = f (PS) n <ś=> —— n = f (S ), gdy m > n; — = f(LS) n <ś=> —m = n —m f(S ), gdy m < n. Oznacza to, że algorytm wyszukiwania binarnego może zostać przekształcony do następującej bezmacierzowej postaci: w h ile m / n do if m < u then (wypisz(L); rt := u —m) else (wypisz(P); m := m —n) . Na przykład przy danych m /n = 5/7, otrzymujemy w uproszczonym algo rytmie kolejno m = 5 5 3 1 1 n = 7 2 2 2 1 wypisz L P P L . Liczby niewymierne nie występują w drzewie Sterna-Brocota, ale wszyst kie „bliskie” im co do wartości liczby wymierne występują. Na przykład je śli wypróbujemy działanie algorytmu wyszukiwania binarnego z liczbą e = 2 ,7 1 8 2 8 ... na wejściu zamiast ułamka m /n , to otrzymamy nieskończony ciąg symboli L, P zaczynający się od PPLPPLPLLLLPLPPPPPPLPLLLLLLLLPLP . . . . Hermann Minkowski przedstawił tę zadziwiającą reprezentację dwójkową na międzynarodowym Kongresie Matematyków w Heidelbergu, w roku 1904. Możemy uznać ten ciąg za reprezentację liczby e w systemie Sterna-Brocota, podobnie jak reprezentujemy liczbę e w dziesiętnym systemie liczbowym za pomocą ciągu cyfr dziesiętnych 2,718281828459... lub też za pomocą nie skończonego dwójkowego ułamka (10,101101111110.. .)2 * Interesujące, że reprezentacja Sterna-Brocota liczby e ma regularne przedstawienie e = PL°PLP2 LPL4 PLPfiLPL8 PLP10 LPL12PL . . . ; jest to równoważne szczególnemu przypadkowi czegoś, co odkrył Euler [105] w wieku 24 lat. Z reprezentacji tej wnioskujemy, że ułamki P P L P P L P L L L L P L P P P P 1 2 3 5 8 1 1 1 9 3 0 4 9 6 8 8 7 106 193 299 492 685 878 1 ’ 1 ’ 1 > 2 ’ 3 > 4 ’ 7 > 11 > 18 ’ 25 ’ 32 > 39 > 71 > 110 > 181 > 252 > 323 > * * * są najprostszymi z możliwych górnymi i dolnymi przybliżeniami wymiernymi liczby e. Dzieje się tak dlatego, że jeśli m /n nie występuje na tej liście, to wartość pewnego ułamka z tej listy, którego licznik jest nie większy od m, a mianownik nie większy od n znajduje się pomiędzy m /n , a e, będzie to więc lepsze przybliżenie liczby e. Na przykład ułamek y^, którego na tej liście nie znajdziemy, nie jest tak prostym przybliżeniem, jak występujący na tej liście i lepiej przybliżający e ułamek y- = 2 ,7 1 4 ___ Dzieje się tak dlatego, że drzewo Sterna-Brocota nie dość, że zawiera wszystkie liczby wymierne, to jeszcze występują one w specyficznym po rządku, w którym wszystkie ułamki o małych licznikach i mianownikach po jawiają się powyżej wszystkich ułamków bardziej złożonych. W związku z tym = PPLPPLL jest mniejsze niż y- = PPLPPL, co z kolei jest mniejsze niż e = PPLPPLP___Sposób ten daje nam wyśmienite przybliżenia liczby e. Liczba §|§ & 2,718266 w 0,999994e na przykład zgadza się z e dla począt kowych sześciu cyfr dziesiętnych, a otrzymaliśmy ją za pomocą zaledwie 16 symboli reprezentacji Sterna-Brocota; taką samą mniej więcej dokładność uzyskalibyśmy używając 16 bitów klasycznej reprezentacji dwójkowego przy bliżenia liczby e. Nieskończoną reprezentację Sterna-Brocota dowolnej liczby niewymier nej oc możemy uzyskać nieznacznie modyfikując algorytm uściślania binar nego: if oc < 1 th en (wypisz(L); oc := oc/{ 1 — a)) else (wypisz(P); oc a —1). (Kroki te trzeba powtarzać nieskończoną liczbę razy albo aż uznamy, że już nam wystarczy.) Gdyby liczba oc była wymierna, wówczas otrzymalibyśmy nieskończoną reprezentację, która przypominałaby poprzednią, z tym że na prawo od tej skończonej reprezentacji oc zostałby dołączony ciąg PL°°. Jeżeli na przy kład oc = 1, to otrzymamy PLLL. . . , odpowiadający nieskończonemu ciągowi ułamków y, y, §, | , | , . . . , który jest zbieżny do 1. Sytuacja ta jest ana logiczna do zwykłej reprezentacji dwójkowej, jeżeli przedstawimy symbole L jako 0, a P jako 1. Podobnie jak w przypadku liczb rzeczywistych, gdzie każda liczba x z przedziału [0 .. 1 ) ma nieskończoną reprezentację dwójkową (0 , bi b 2 b 3 . . . )z nie zakończoną samymi jedynkami, tak każda liczba oc z prze działu [0 .. 1) ma nieskończoną reprezentację Sterna-Brocota Bi B2 B3 . . . nie zakończoną samymi symbolami P. Mamy więc zachowującą porządek wza jemnie jednoznaczną odpowiedniość między przedziałem [0 .. 1 ), a przedzia łem [0 .. 0 0 ), jeśli tylko przyjmiemy, że 0 <-» L i 1 <-> P. Istnieje także bliski związek między algorytmem Euklidesa a reprezenta cją Sterna-Brocota. Dla zadanego oc = m /n otrzymujemy [rnAkl symboli P, następnie [rt/(m mod ru)J symboli L, potem |_(m mod rt)/ (rt mod (m mod rt))J symboli P, i tak dalej. Liczby m mod rt, rt mod (m mod rt), . . . są po prostu liczbami, które kolejno pojawiają się przy wykonywaniu algorytmu. (Trzeba tu trochę sprytu, żeby upewnić się, że na końcu rzeczywiście nie dostaniemy nieskończenie wielu symboli P.) Zbadamy głębiej ten związek w rozdziale 6 . 4, T eoria liczb 4.6. R elacja kongruencji ‘m o d ’ Arytmetyka modulo jest jednym z podstawowych narzędzi dostarczanych przez teorię liczb. Pojęcie dzielenia modulo mignęło nam już w rozdziale 3, gdzie używaliśmy binarnego działania ‘mod’, zazwyczaj jako jednego z wy stępujących w bardziej złożonym wyrażeniu. Tutaj będziemy stosowali dzia łanie ‘mod’ również w pełnych równaniach, wprowadzimy więc notację nieco bardziej do tego celu użyteczną: a „Numerorum congruentiam hoc signo, = , in posterum denotabimus, modulum ubi opus erit in clausulis adiungentes, -16 = 9 (mod. 5), —7 = 15 (mod. 11).” C. F. Gauss [142] =b (mod m) a mod m = b mod m . (4 -3 5 ) Mamy więc na przykład 9 = —16 (mod 5), ze względu na to, że 9 mod 5 = 4 = (—16) mod 5. Wyrażenie ‘a = b (mod m )’ można odczytać jako „a przystaje do b modulo m.” Definicja ta ma sens również dla dowolnych liczb rzeczywistych a, b oraz m. My jednak będziemy jej używali prawie wyłącznie dla liczb całkowitych. Ze względu na to, że x mod m różni się od x o wielokrotność m, możemy spojrzeć na kongruencje z innej strony: a =b (mod m) a —b jest wielokrotnością m. ( 4 *3 6 ) Jeśli bowiem a mod m = b mod m, to definicja działania ‘mod’ zawarta w równaniu (3 .2 1 ) gwarantuje, że a —b = a mod m + k m — (b mod m + lm) — (k —l)m dla pewnych liczb całkowitych k i l. Na odwrót, jeśli a —b = km, to a = b dla m = 0 , a w przeciwnym razie a mod m = a — [a /m jm = b + km — [(b + k m )/m jm = b — [b /m jm = b mod m . „Czuję się dziś nieźle modulo lekki ból głowy.” The Hackefs Dictionary [338] Przedstawienie działania ‘mod’ za pomocą równania (4 .3 6 ) jest często wy godniejsze niż za pomocą równania ( 4 .3 5 ). Zachodzi na przykład 8 = 23 (mod 5), ponieważ 8 —23 = —15 jest wielokrotnością 5; nie musimy wyliczać ani 8 mod 5, ani 23 mod 5. Znak kongruencji ‘ = ’ przypomina znak ‘ = ’ nie bez przyczyny, ponieważ kongruencje to nieomal równości. Kongruencja jest na przykład relacją rów noważności, czyli ma trzy własności: jest zwrotna (a = a), symetryczna (a = b b = a) i przechodnia (a = b = c =£■ a = c). Wszystkie te własności są łatwe do udowodnienia, gdyż każda relacja *=’ spełniająca ‘a = b f(a) = f(b )’ dla pewnej funkcji f jest relacją równoważności (w naszym przypadku f(x) = x m o d m ). Co więcej, elementy przystające możemy dodawać i odejmować bez utraty własności przystawania: a = b i c = d => a+ c = b+ d (mod m ) ; a = b i c = d ==£• a —c = b — d (mod m ) , 4.6. R elacja kongruencji ‘m o d ’ ponieważ jeżeli liczby a —b i c —d są wielokrotnościami m, to będą nimi także liczby ( a + c ) —(b + d) = ( a —b) + (c —d) i ( a —c) —(b —d) — (a —b) —(c—d). Na marginesie, nie jest konieczne pisanie ‘(mod m )’ za każdym razem, gdy wystąpi znak ‘ = jeżeli modulnik jest stały, to wystarczy, że zaznaczymy go tylko raz, aby ustalić kontekst. Jest to jedna z większych zalet notacji ‘mod’. Analogiczne wzory zachodzą także dla mnożenia, pod warunkiem, że mamy do czynienia z liczbami całkowitymi: a = b i c = d => ac = bd (mod m ) , całkowite b ,c. Dowód: ac —bd = (a —b)c + b(c —d). Wielokrotne zastosowanie powyższego wzoru daje nam odpowiedni wzór dla potęgowania: a = b an = bn (mod m ) , całkowite a, b; całkowite rt ^ 0 . Na przykład ponieważ zachodzi 2 = —1 (mod 3), więc mamy również 2n = (—1 )n (mod 3), co oznacza, że 2n — 1 jest wielokrotnością 3 wtedy i tylko wtedy, gdy n jest parzyste. Większość przekształceń algebraicznych, których zwykle dokonywaliśmy z równościami, może być wykonana także z kongruencjami. Większość, ale nie wszystkie. Działanie dzielenia świeci swoją nieobecnością. Jeśli ad = bd (mod m), to bynajmniej nie możemy twierdzić, że zawsze a = b. Zachodzi bowiem na przykład 3*2 = 5-2 (mod 4), ale 3 ^ 5 . Możemy częściowo uratować tę własność skracania dla kongruencji, ale tylko wtedy, gdy d oraz m są względnie pierwsze: ad = bd <£=£• a = b (mod m ) , (4 -3 7 ) całkowite a, b, d, m oraz d J_ m. Jest więc na przykład uprawomocnione wyciągnięcie wniosku, że skoro 15 = 35 (mod m), to 3 = 7 (mod m), chyba że modulnik m byłby wielokrotno ścią 5. Do dowodu tej własności ponownie skorzystamy z rozszerzonego prawa NWD ( 4 .5 ). Znajdziemy takie liczby d' i m ', że d'd + m /m = 1. Jeżeli w takim przypadku ad = bd, to wolno nam obie strony tej kongruencji pomnożyć przez d', uzyskując ad'd = bd'd. Ponieważ d'd = 1, więc ad'd = a i b d ' d = b ; a c o z a tym idzie, a = b. W dowodzie tym wykorzystujemy fakt, że gdy rozważamy kongruencje (mod m), liczba d' zachowuje się niemal jak 1 /d , nazwiemy ją więc „odwrotnością d modulo m.” f 4. Te 150 Jeszcze jedną metodą zastosowania dzielenia do kongruencji jest podzie lenie modulnika wraz z pozostałymi liczbami: ad = bd (mod md) a = b (mod m ) , dla d ^ 0 . ( 4 .3 8 ) Prawo to zachodzi dla wszystkich liczb rzeczywistych a, b, d oraz m, po nieważ zależy jedynie od prawa rozdzielności (a m o d m )d = ad mod md: Ze względu na to, że a mod m = b mod m (a mod m )d = (b mod m )d ad mod m d = bd mod md. W takim razie, na przykład, z tego że 3 -2 = 5 -2 (mod 4) możemy wywnioskować, że 3 = 5 (mod 2). W celu uzyskania ogólnego prawa dotyczącego możliwie małej zmiany modulnika, możemy połączyć równania (4 .3 7 ) i (4 .3 8 ): ad = bd (mod m) a = b (mod m ^, N W D (d,m ) całkowite a, b, d, m. ( 4 .3 9 ) Wolno nam bowiem pomnożyć kongruencję ad = bd przez d', gdzie d'd + m /m = N W D (d,m ). Daje to kongruencję a -N W D (d ,m ) = b -N W D (d ,m ) (mod m), którą można podzielić przez N W D (d, m). Przyjrzyjmy się z bliska pomysłowi zamiany modulnika. Wiedząc, że a = b (mod 1 0 0 ) wnioskujemy, że a musi przystawać do b również modulo 1 0 , jak i modulo dowolny dzielnik 100. Zdanie „a —b jest podzielne przez 100” jest mocniejsze niż zdanie „ a —b jest podzielne przez 10”. W ogólnym przypadku natomiast zachodzi a = b (mod md) => a = b (mod m ) , całkowite d, (4 .4 0 ) gdyż każda wielokrotność liczby m d jest również wielokrotnością liczby m. Na odwrót, czy wiedząc że a = b względem dwóch małych modułów, możemy dojść do wniosku, że a = b względem jakiegoś większego modułu? Tak jest! A odpowiedni wzór przedstawia się następująco: a = b (mod m) <=> i a = b (mod rt) a = b (mod N W W (m ,n )), całkowite m ,n > 0. (4 .4 1 ) Jeżeli na przykład wiemy, że a = b modulo 12 i 18, to możemy z całą pewnością utrzymywać, że a = b (mod 36). Dzieje się tak dlatego, że jeśli a —b jest wspólną wielokrotnością liczb m oraz n, to jest też wielokrotnością liczby N W W (m ,n). Wynika to z twierdzenia o jednoznacznym rozkładzie. Szczególny przypadek powyższego prawa, gdy m J_ n, jest wyjątkowo ważny, gdyż wtedy N W W (m ,n) = m n. Wyraźmy to wprost: a = b (mod m n) <ś==> a = b (mod m) i a = b (mod n ) , jeśli m i n . (4 4 2 ) ^ ,^ 4 .7 . N ieza leżn e reszty Na przykład a = b (mod 100) wtedy i tylko wtedy, gdy a = b (mod 25) i a = b (mod 4). Wyrażając to w inny sposób, jeśli wiemy, czemu jest równe x mod 25 oraz x mod 4, to mamy wystarczająco dużo informacji, żeby określić x mod 100. Jest to szczególny przypadek chińskiego twierdzenia o resztach (por. ćwiczenie 30), nazwanego tak z uwagi na Sun Tsu, który w Chinach odkrył je około 350 roku n.e. Modulniki m i n w równaniu (4 .4 2 ) mogą być dalej rozkładane na mniej sze czynniki pierwsze, aż wszystkie czynniki pierwsze zostaną odizolowane od siebie. Zachodzi więc równoważność a = b (mod m) <ś==> a = b (mod p mp) dla wszystkich p , jeżeli rozkład na czynniki pierwsze ( 4 . 1 1 ) liczby m jest równy J^[ p mp. Kon gruencje modulo potęgi liczb pierwszych są cegiełkami, z których buduje się kongruencje modulo wszystkie inne liczby całkowite. 4.7. N iezależn e reszty Ważnym zastosowaniem kongruencji jest system niezależnych reszt, w któ rym liczba całkowita x przedstawiana jest jako ciąg reszt względem modułów parami względnie pierwszych: Res(x) = (x mod m i , . . . ,x mod m r) , jeśli rrij _L rrik dla 1 ^ j < k ^ r. Znając x mod m i , . . . ,x mod m r, nie wiemy jeszcze wszystkiego o samym x, ale możemy stwierdzić, ile wynosi x mod m, dla m = mi . . . m r. W praktyce będziemy zazwyczaj wiedzieli, w jakim przedziale można spodziewać się x. W takim przypadku, jeżeli tylko będziemy znali wszystkie wartości reszt i jeśli m będzie wystarczająco duże, aby objąć ten przedział, to o x będziemy wiedzieli wszystko. Przyjrzyjmy się na przykład niewielkiemu systemowi niezależnych reszt opartemu na dwóch modułach, 3 oraz 5: x mod 15 x mod 3 x mod 5 0 0 0 1 1 1 2 2 2 3 4 5 0 1 3 4 2 0 6 0 1 7 1 2 Na przykład liczba Mersenne’a 231 — 1 świetnie się do tego nadaje. 0 3 4 10 1 0 11 2 1 12 0 2 13 14 1 2 3 4 8 2 9 Każda uporządkowana para (x mod 3 ,x mod 5) jest różna od każdej innej, gdyż x mod 3 = y mod 3 i zarazem x mod 5 = y mod 5 wtedy i tylko wtedy, gdy x mod 15 = y mod 15. Dodawanie, odejmowanie i mnożenie dla dwóch składników możemy wy konywać niezależnie, dlatego że pozwalają nam na to prawa kongruencji. Gdybyśmy na przykład chcieli przemnożyć 7 = (1,2) przez 13 = (1,3) mo dulo 15, wówczas wystarczyłoby wyliczyć 1 -1 mod 3 = 1 oraz 2-3 mod 5 = 1. Odpowiedź brzmi (1,1) = 1 i w związku z tym 7-13 mod 15 musi być równe 1. No i oczywiście jest równe. Przedstawione prawo niezależności ma ważne zastosowania w informa tyce, ponieważ różne składniki mogą być przetwarzane niezależnie (na przy kład na różnych komputerach). Jeśli każdy modulnik rriic jest inną liczbąpierwszą p k, wybraną tak, aby jej wartość była nieco mniejsza niż 2 31, to komputer wykonujący działania na liczbach całkowitych o wartościach z przedziału [—2 31 . . 2 31) może łatwo wyliczać sumy, różnice i iloczyny mo dulo pic. Zbiór takich r liczb pierwszych umożliwia dodawanie, odejmowanie i mnożenie „liczb wielokrotnej precyzji” reprezentowanych przez 31 r bitów, a system niezależnych reszt umożliwia robienie tego w przypadku dużych liczb szybciej niż za pomocą innych znanych metod. Przy pewnych założeniach możemy także wykonywać dzielenie. Załóżmy, że mamy obliczyć wartość dużego wyznacznika macierzy liczb całkowitych. Wynik będzie liczbą całkowitą D, a ograniczenie na |D| może być znale zione na podstawie wielkości elementów macierzy. Ale wszystkie znane me tody szybkiego obliczania wyznaczników wymagają dzielenia, a to prowadzi do ułamków (i straty dokładności, jeśli weźmiemy pod uwagę przybliżenia dwójkowe). Remedium na to może być znalezienie wartości D mod = D^, dla różnych dużych liczb pierwszych p^. Możemy śmiało podzielić elementy macierzy modulo p^, chyba że któryś z nich okazałby się być wielokrotnością jakiejś liczby p^. Jest to mało prawdopodobne, ale nawet gdyby się tak zda rzyło, możemy wybrać inną liczbę pierwszą. W końcu, znając wartości D k dla wystarczająco wielu liczb pierwszych, mamy dostatecznie dużo informa cji, aby wyliczyć D. Nie wyjaśniliśmy jeszcze, w jaki sposób z zadanego ciągu reszt (x mod m i , . . . ,x mod m T) otrzymać z powrotem wartość x mod m. Pokazaliśmy, że taka konwersja może zostać w ogólności dokonana, ale rachunki mogłyby być tak upojne, że cały pomysł prawdopodobnie w praktyce ległby w gru zach. Na szczęście istnieje stosunkowo prosta metoda poradzenia sobie z tym problemem. Możemy ją zilustrować na przykładzie par (x mod 3 ,x mod 5), które pojawiają się w naszej tabelce. Kluczowym pomysłem jest rozwiązanie problemu dla przypadków bazowych ( 1 , 0 ) i (0 , 1 ), gdyż jeśli ( 1 , 0 ) = a, nato miast (0,1) = b, to (x,y) = (cnc + by) mod 15, ponieważ kongruencje można dodawać i mnożyć. W naszym przypadku zajrzawszy do tabeli znajdujemy jednym rzutem oka odpowiednie wartości a = 10 i b = 6 . Jak jednak je znaleźć, gdy moduły są ogromne? Innymi słowy, jak znaleźć liczby a i b w przypadku, gdy m _L n, tak aby wszystkie równania a mod m = 1, a mod n = 0, b mod m = 0, b mod n = 1 były spełnione? Raz jeszcze wynik ( 4 .5 ) przychodzi nam z pomocą. Wyko rzystując algorytm Euklidesa znajdujemy takie m / i n ', że rn/m + n/n = 1 . W związku z tym możemy przyjąć, że a = n 'n i b = m /m, dzieląc je w razie potrzeby modulo mn. W przypadku dużych modułów będą potrzebne kolejne chwyty w celu zminimalizowania obliczeń. Szczegóły wykraczają poza zakres tej książki, ale można je znaleźć np. w książce [208, str. 274]. Konwersja z układów reszt do odpowiadających im oryginalnych liczb jest wykonalna, ale jest na tyle wolna, że opłaca się z niej korzystać tylko wtedy, gdy wszystkie potrzebne działania możemy wykonać w systemie niezależnych reszt, dokonując konwersji jedynie raz na końcu obliczeń. Utrwalmy pomysły dotyczące kongruencji, rozwiązując mały problem. Ile jest rozwiązań kongruencji x2 = 1 (mod m ) , (4 .4 3 ) jeśli utożsamimy wszystkie te rozwiązania x oraz x', dla których zachodzi x mod x'? r; Zgodnie z ogólnymi zasadami wyjaśnionymi wcześniej, powinniśmy naj pierw rozważyć przypadek m będącego potęgą liczby pierwszej, równego za tem p k dla k > 0. Kongruencja x 2 = 1 może być wtedy zapisana jako ( x —1 ) ( x + 1 ) = 0 (mod p k) , więc p musi dzielić albo x —1, albo x + 1 , albo obie te liczby. Liczba p nie może jednak dzielić jednocześnie x —1 i x + 1 , chyba że p równa się 2 ; zostawmy ten przypadek na później. Jeśli p > 2 , to alb o p k\( x —1 ) ( x + 1 ) p k\ ( x —1 ), albo p k\( x + 1 ); mamy więc tu dokładnie dwa rozwiązania: x = + 1 oraz X EE —1. Przypadek, kiedy p równa się 2 jest nieco inny. Jeśli 2k\ ( x — 1 ) ( x + 1), to albo x —1, albo x + 1 jest podzielne przez 2, ale nie jest podzielne przez 4, więc jedna z tych liczb musi być podzielna przez 2k_1. Oznacza to, że istnieją 4 rozwiązania gdy k ^ 3, a mianowicie x = ±1 i x = 2 k_1 ± 1. (Na przykład jeśli p k = 8 , to te cztery rozwiązania wynoszą 5, 7 (mod 8 ). Czasami warto jest wiedzieć, że kwadrat każdej nieparzystej liczby naturalnej jest postaci 8 n -f- 1 .) Wiemy już, że x 2 = 1 (mod m) wtedy i tylko wtedy, gdy x 2 = 1 (mod p mp) dla wszystkich liczb pierwszych p takich, że m p > 0 w roz kładzie na czynniki pierwsze liczby m. Każda liczba pierwsza jest niezależna od innych, więc dla każdego układu x mod p mp otrzymujemy 2 rozwiązania, poza przypadkiem p = 2. Jeśli więc m ma dokładnie r różnych dzielników pierwszych, to całkowita liczba rozwiązań kongruencji x 2 = 1 wynosi 2 T, z poprawką w przypadku gdy m jest parzyste. Dokładna liczba rozwiązań jest równa 2 T+[ 8\ m ] + [4\m ]-[2\m J ^ Dla przykładu istnieją 4 „pierwiastki kwadratowe z jedności modulo 12,” a mianowicie 1, 5, 7 i 11. Dla m = 15 te 4 pierwiastki to są liczby, których reszty modulo 3 i modulo 5 wynoszą ±1. Chodzi tu oczywiście o liczby (1,1), (1,4), (2,1), i (2,4) w systemie niezależnych reszt. Ich rozwiązania w zwykłym zapisie dziesiętnym wynoszą odpowiednio 1,4, 11 i 14. 4.8. D alsze zastosow ania Pozostało nam jeszcze kilka niedokończonych zagadnień z rozdziału 3. Chcie libyśmy na przykład udowodnić, że ciąg następujących m liczb 0 mod m, n mod m, 2n mod m, . . . , (m — 1 )tl mod m (4 -4 5 ) składa się z dokładnie d kopii ciągów liczb m /d w pewnej ustalonej kolejności 0, d, 2 d, ..., m —d, przy czym d = N W D (m ,n ). Jeśli na przykład m = 12 i n = 8 , to d = 4, a omawiane liczby układają się w następujący ciąg: 0, 8 , 4, 0, 8 , 4, 0, 8 , 4, 0, 8 , 4. Pierwsza część dowodu— wykazanie, że otrzymujemy d kopii m /d po czątkowych wartości— jest teraz trywialna. Mamy bowiem jn = kn (mod m) <ś=> j(n /d ) = k (n /d ) (mod m /d ) na mocy (4 .3 8 ); otrzymamy więc d kopii wartości, które wystąpią, gdy 0 ^ k < m /d . Pozostało do wykazania, że te m /d liczb to {0, d, 2d , . . . , m —d} w pew nym porządku. Przyjmijmy m = m /d i n = n'd. W takim razie kn mod m = d (k n /m o d m /), ze względu na prawo rozdzielności (3.23), więc wartości, które wystąpią, gdy 0 ^ k < m/, są d razy większe niż liczby 0 mod m /, n ' mod m /, 2 n ' mod m /, ..., (m/ — 1 )n' mod m ' . Wiemy jednak, że m ' _L n ' na mocy (4.27); wyciągnęliśmy przed nawias ich NWD. Pozostał więc już tylko przypadek d = 1, czyli sytuacja, w której m i n są względnie pierwsze. Załóżmy więc, że m _L n. Na podstawie zasady szufladkowej Dirichleta łatwo jest teraz zauważyć, że liczby (4 .4 5 ), to po prostu {0 , 1 , . . . , m — 1 } ustawione w pewnym porządku. Zasada ta mówi nam, że jeśli m przedmiotów włożymy do m szufladek, to istnieje pusta szufladka wtedy i tylko wtedy, gdy w którejś szufladce znajduje się więcej niż jeden przedmiot (zob. wariant tej zasady udowodniony w ćwiczeniu 3.8). To, że liczby występujące w ciągu (4 .4 5 ) są różne, jest dość oczywiste, za względu na to, że jn = kn (mod m) <=> ) = k (mod m) dla m 1 n, ze względu na równanie ( 4 .3 7 ). W związku z tym nasze m różnych liczb musi wpaść do m różnych szufladek 0 , 1, . . . , m — 1 , co oznacza, że zakończyliśmy uzupełnianie rozdziału 3. Przedstawiony dowód jest pełny, ale moglibyśmy udowodnić jeszcze wię cej, jeśli użylibyśmy metody wprost, zamiast polegać na działaniu nie wprost zasady szufladkowej. Jeżeli m _L n, a jednocześnie znamy wartość j e [0 .. m), to możemy wyliczyć wprost wartość takiego k e [0 .. m), że kn mod m = j. W tym celu rozwiążemy kongruencję kn = j (mod m) ze względu na k. Wystarczy pomnożyć obie strony przez n ', gdzie m /m + n rn — 1 , aby otrzymać k = jn' (mod m ) . Ostatecznie k = jn' mod m. Matematycy uwielbiają mówić, że coś jest trywialne. Wykorzystując pokazane właśnie własności, udowodnimy ważny rezultat odkryty w 1640 r. przez Pierre’a de Fermat. Fermat był wielkim francuskim matematykiem, który wniósł istotny wkład w powstanie rachunku różnicz kowego i całkowego, jak również wielu innych gałęzi matematyki. Pozostawił notatniki zawierające dziesiątki twierdzeń bez dowodów, a kolejne lata po kazały, że nie pomylił się w żadnym przypadku. Późniejsi matematycy udo wodnili wszystkie jego stwierdzenia z jednym może wyjątkiem. Chodzi tu o słynne „ostatnie twierdzenie Fermata”, zwane też „wielkim”, które mówi, że + bn ^ cn KĄCIK CIEKAWOSTEK Euler [115] podejrzewał, że a4+ b 4 + c4 # d 4, ale Noam Elkies [92] znalazł w sierpniu 1987 r. nieskończenie wiele rozwiązań. Natomiast Roger Frye za pomocą przebadania wszystkich przypadków wykazał (po ok. 110 godzinach obliczeń na komputerze Connection Machinę), ■ że jedynym rozwiązaniem, dla którego d < 1000000, jest: 958004 + 2175194 + 4145604 = 4224814 . (4 4 6 ) dla wszystkich liczb całkowitych dodatnich a, b, c oraz n, z zastrzeżeniem, że rt > 2. (Oczywiście istnieje mnóstwo rozwiązań równań a + b = c i a 2 + b 2 = c2.) Matematyk angielski, Andrew Wiles, po latach pracy ogłosił niedawno wiekopomny dowód twierdzenia Fermata ( 4 .4 6 ) w Annals of Mathematics, maj 1995. Twierdzenie Fermata z r. 1640 jest znacznie łatwiejsze do sprawdzenia. Nazywamy je dziś małym twierdzeniem Fermata (albo po prostu twierdze niem Fermata), a głosi ono, że rtp - i = 1 (mod p ) , jeśli ri_Lp. (447 ) Dowód: Jak zwykle zakładamy, że symbolu p używamy do oznaczenia liczby pierwszej. Wiemy, że p —1 liczb rt mod p, 2rt mod p, . . . , (p —1)n mod p, to liczby 1,2, . . . , p — 1 ustawione w pewnym porządku. Jeśli przemnożymy je przez siebie, to otrzymamy n • (2 n) • . . . • ((p - 1 )n) = (n mod p) • (2 n mod p) • . . . • ((p — 1 )n mod p) = (P —1)«, przy czym kongruencje brane są modulo p. Oznacza to, że (p — 1 )!n p —1 = (p — 1 )! (mod p ) , i możemy usunąć (p —1)!, ponieważ liczba ta nie jest podzielna przez p. QED. Często wygodniej jest używać innej postaci twierdzenia Fermata: nv = n (mod p) całkowite rt. (4 .4 8 ) Kongruencja ta zachodzi dla wszystkich liczb całkowitych rt. Jeśli n i p , to możemy po prostu pomnożyć kongruencję obustronnie przez n. Natomiast w przeciwnym razie, p\rt, więc rtp = 0 = n. 4 .8 . D a lsze zastosow an ia Tego samego lata, kiedy odkrył swoje twierdzenie ( 4 .4 7 ), Fermat napisał list do Mersenne’a informujący go o przypuszczeniu, że dla każdego rt ^ 0 liczba fn = 22n+1 miałaby być pierwsza. Wiedział, że początkowych pięć liczb tej postaci, to liczby pierwsze: 2’+1 = 3; 22+1 = 5; 24+1 = 17; 2S+1 = 257; 216+1 = 65537; ale nie mógł dojść do tego, jak sprawdzić, czy kolejna liczba, 2 32 + 1 = 4294967297, jest pierwsza. Interesujące, że Fermat za pomocą właśnie co udowodnionego swojego twierdzenia mógłby zauważyć, że liczba 2 32 +1 nie jest liczbą pierwszą. Wy starczyło wykonać trochę mnożeń. Przyjmijmy, że rt = 3 w równaniu ( 4 .4 7 ), skąd od razu mamy, że 32 = 1 (mod 2 32 + 1), jeśli 2 32 + 1 jest pierwsza. To, czy ta relacja zachodzi, można sprawdzić ręcznie. Zaczynamy od 3 i pod nosimy kolejne liczby do kwadratu 32 razy, biorąc pod uwagę jedynie reszty z dzielenia modulo 2 32 + 1 . Otrzymujemy kolejno 3 2 = 9, 3 2 = 81, 3 2 = 6561, itd., aż dochodzimy do 3 2 ' 2 = 3029026160 (mod 2 32 + 1). Niewątpliwie nie jest to równe 1, więc liczba 2 32 + 1 nie może być liczbą pierwszą. Ta metoda obalenia przypuszczenia, że interesująca nas liczba jest pierwsza, nie daje żadnych podpowiedzi co do tego, czemu mogłyby być równe jej dzielniki, ale ponad wszelką wątpliwość dowodzi, że takie dzielniki istnieją. (Wynoszą one 641 i 6700417, a zostały po raz pierwszy znalezione przez Eulera w r. 1732 [1 0 2 ].) Gdyby 3 2 okazało się być równe 1 modulo 2 32 + 1, wówczas rachunki nasze nie dowiodłyby niczego, po prostu nie obaliłyby naszego przypusz czenia. W ćwiczeniu 47 znajdziemy omówienie twierdzenia odwrotnego do małego twierdzenia Fermata. Materiał tam zawarty pozwala nam udowod nić, że pewne duże liczby są pierwsze, bez odwoływania się do ogromnych ilości żmudnych obliczeń arytmetycznych. Udowodniliśmy twierdzenie Fermata, kasując czynnik (p—1)! po obu stro nach kongruencji. Okazuje się, że (p — 1)! zawsze przystaje do —1 modulo p. Jest to część klasycznego wyniku, znanego jako twierdzenie Wilsona: „... laąuelle proposition, si elle est vraie, est de tres grand usage.” P. de Fermat [121] W jedną stronę twierdzenie to jest trywialne: jeśli rt > 1 nie jest liczbą pierw szą, to istnieje jej czynnik pierwszy p, który jako że jest mniejszy od rt, musi dzielić (rt—1)!, zatem ( n —1)! nie może przystawać do —1 modulo rt. (Gdyby (rt — 1)1 przystawało do — 1 modulo rt, przystawałoby także do — 1 modulo p, a nie przystaje.) W drugą stronę twierdzenie Wilsona stwierdza, że (p —1)! = —1 (mod p). Możemy to wykazać, układając w pary liczby wraz z ich antymodułami wzglę dem p. Jeżeli rt _L p, to wiemy, że istnieje liczba rt' taka, że rt'rt = (mod p ) . 1 Liczba rt' jest tu odwrotnością rt, także liczba rt jest odwrotnością rt'. Każde dwie odwrotności liczby rt muszą być przystające do siebie, gdyż rtrt' = rtrt" pociąga za sobą rt' = rt". Przypuśćmy teraz, że każdą liczbę pomiędzy 1 a p —1 stawiamy w parze z jej odwrotnością. Ponieważ iloczyn każdej liczby z jej odwrotnością przystaje do 1 modulo p, więc iloczyn wszystkich liczb z tak utworzonych par również przystaje do 1. Wygląda na to, że na tej samej zasadzie (p—1)! przystaje do 1. Sprawdźmy to dla, powiedzmy, p = 5. Oczywiście 4! = 24; ale to przystaje do 4, a nie do 1, modulo 5. Hmm! — coś tu nie gra! Przyjrzyjmy się bliżej odwrotnościom: 1' = 1 , 2' = 3 , 3' = 2 , 4' = 4 . No tak! Liczby 2 i 3 są nawzajem ze sobą w parze, ale 1 i 4 nie są— stanowią swoje własne odwrotności. Musimy więc w celu kontynuowania analizy określić, które liczby x są swoimi własnymi odwrotnościami. Dla takich liczb zachodzi x 2 = 1 (mod p), a dopiero co pokazaliśmy, że taka kongruencja ma dokładnie 2 rozwiązania, gdy p > 2. (Jeśli p = 2, to jest oczywiste, że (p — 1)! = —1, więc o ten przypadek martwić się nie musimy.) Rozwiązaniami są 1 i p — 1, a pozostałe liczby (między 1, a p — 1) stoją w parach. Ostatecznie więc (p - U ! = W p - 1) = - i , tak jak tego chcieliśmy. Niestety nie znamy żadnej efektywnej metody wyli czania silni, więc twierdzenie Wilsona nie ma praktycznego zastosowania jako test na złożoność liczby. Jest po prostu zwykłym twierdzeniem. 4.9. Fi oraz mi Ile jest liczb całkowitych {0, 1, . . . ,rrt — 1} względnie pierwszych z rrt? Ta ważna wielkość oznaczana przez <p(m), została nazwana „tocjentem” z m przez angielskiego matematyka J. J. Sylvestra [348], który lubił wymyślać nowe słowa. Wiemy, że cp(1) = 1, cp(p) = p — 1, a także cp(m) < m — 1 dla wszystkich liczb złożonych m. Funkcja cp nazywana jest funkcją Eulera, gdyż Euler ją badał jako pierw szy. Odkrył na przykład, że małe twierdzenie Fermata (4 .4 7 ) może zostać uogólnione do złożonych liczb m w następujący sposób: n cp(m) = -| (mo d m ) , jeśli rt _L m. (4 -5 °) Ćwiczenie 32 polega na udowodnieniu tego twierdzenia Eulera. Jeśli m jest potęgą liczby pierwszej p k, to łatwo jest wyliczyć cp(m), ponieważ rt _L p k p \n . Wielokrotności liczby p w ciągu { 0 , 1 , . . . , p k—1} t o { 0 , p , 2 p , . . . , p k—p}; mamy więc i chpk_1, a cp(pk) oblicza to, co pozostaje, czyli „Si fuerit N ad x numerus primus et n numerus partium ad N primarum, tum potestas xn unitate minuta semper per numerum N erit divisibi]is.” L. Euler [111] cp(pk) - Plc- P lc" 1 . Warto zauważyć, ze wzór ten daje nam właściwą odpowiedź <p(p) = p — 1 w przypadku, gdy k = 1 . Jeśli m > 1 nie jest potęgą liczby pierwszej, to możemy ją zapisać jako m = mi rri2 , przy czym mi _L rri2 . Liczby 0 ^ n < m mogą być wtedy reprezentowane w systemie niezależnych reszt jako (rt mod mi ,rt mod mz). Zachodzi tutaj zależność n ± m rt mod m i 1 m i i n mod m 2 _L rri2 na mocy (4 .3 0 ) i (4 .4 ). Jeżeli względna pierwszość jest zaletą, to liczba rt mod m jest „dobra” wtedy i tylko wtedy, gdy obie liczby rt mod mi i rt mod m.2 są „dobre.” Ogólną liczbę dobrych wartości modulo m można wy liczyć rekurencyjnie: wynosi ona (p(mi )(p{m2)} ponieważ mamy (p(rrti) do brych sposobów wybrania pierwszego czynnika rt mod mi i <p{vnz) dobrych sposobów wybrania drugiego czynnika rt mod rri2 w systemie reszt. Rozważmy na przykład (p(12) — cp(4)cp(3) = 2 -2 = 4, ponieważ n jest względnie pierwsze z 12 wtedy i tylko wtedy, gdy n mod 4 = (1 lub 3) i rt mod 3 = (1 lub 2). Cztery wartości względnie pierwsze z 12 to (1,1), (1,2), (3,1), (3 , 2 ) w systemie niezależnych reszt; odpowiadają one liczbom 1, 5 , 7 i 11 w notacji dziesiętnej. Twierdzenie Eulera mówi nam, że rt4 = 1 (mod 12) gdy n _L 12. Dowolna funkcja f (m) o dziedzinie całkowitej dodatniej nazywana jest m ultiplikatywną, jeśli f ( 1 ) = 1 i f ( m i m 2) = f ( m i ) f ( m 2) g d y m i _ L m 2. (4 *51 ) Udowodniliśmy właśnie, że funkcja cp(m) jest multiplikatywna. Widzieliśmy już wcześniej w tym rozdziale inny przykład funkcji multiplikaty wnej, a mia „Si sint A et B numeri inter se primi et numerus partium ad A primarum sit = a, numerus vero partium ad B primarum sit = b, tum numerus partium ad productum AB primarum erit = a b .” L. Euler [ 111] |4 . T eoria liczb -Jl0 nowicie liczbę nie przystających, rozwiązań kongruencji x 2 = 1 (mod m). Jeszcze jednym przykładem może być funkcja f(m ) = m a dla każdej po tęgi a. Funkcja multiplikatywna jest jednoznacznie określona przez swoje war tości dla liczb pierwszych, gdyż zawsze jej argument m możemy rozłożyć na potęgi liczb pierwszych nawzajem pierwsze względem siebie. Ogólny wzór f(tn) = f ^ [ f ( p mp), jeśli m = ]~ Jp m» P ( 4 .5 2 ) P zachodzi wtedy i tylko wtedy, gdy funkcja f jest multiplikaty wna. W szczególności wzór ten pozwala nam wyliczyć wartość funkcji Eulera dla każdego m: <p(rn) = n (Pmp - Pmp- ' ) = m n p\m (i - - ) •(4 .53) p\m ^ Na przykład, cp(12) = (4 —2)(3 — 1) = 12(1 — ^)(1 — ^). Przyjrzyjmy się teraz pewnemu zastosowaniu funkcji Eulera cp w bada niu liczb wymiernych mod 1. Powiemy, że ułamek m /n jest w łaściw y, jeśli 0 ^ m < n. W związku z tym, cp(n) jest liczbą uproszczonych ułamków wła ściwych z mianownikiem równym co najwyżej n. Pamiętamy, że ciąg Fareya 3ri zawiera wszystkie ułamki właściwe z mianownikiem równym co najwy żej n, a także jedyny niewłaściwy ułamek y. Zbiór wszystkich ułamków właściwych z mianownikiem równym 12 przed uproszczeniem wygląda następująco: _0_ J _ 12’ 12’ _2_ _3_ _4_ _5_ _6_ _7_ _8_ _9_ 1_0 1 2 ’ 1 2 ’1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ 1 2 ’ TJ_ 12’ Po uproszczeniu otrzymujemy ciąg 0 J _ 1 1 1 _ 5 _ 1 _ 7 _ 2 3 5 1 1 1’ 1 2 ’6 ’ 4 ’ 3 ’ 1 2 ’ 2 ’ 1 2 ’ 3 ’ 4 ’ 6> 12 1 możemy teraz pogrupować te ułamki ze względu na mianowniki: o. 1» i. 2’ 1 2 .1 3 . 3 ’ 3» 4 ’ 4» 15. 6’ 6’ j _ _5_ _Z_ 12’ 12’ 12’ 11 12* Do czego może nam się to przydać? Proszę bardzo! Każdy dzielnik d liczby 1 2 występuje jako mianownik z wszystkimi cp(d) możliwymi jego licznikami. W mianownikach z kolei możemy ujrzeć tylko dzielniki liczby 12. W związku z tym <P(1) + <p(2) + cp(3) + <p(4) + <p(6) + <p(12) = 12. Podobnie będzie to wyglądało, gdy zaczniemy od nie uproszczonych, ułamków , Ir^ - w przypadku dowolnej liczby m, zatem Y_ <p(d) = m ( 4 -5 4 ) d \m Gdzieś na początku tego rozdziału napomknęliśmy, że często trzeba brać sumy względem wszystkich dzielników danej liczby. Jak widzimy, we wzorze (4 .5 4 ) mamy taką sumę, więc nasze stwierdzenie znalazło pierwsze potwier dzenie (a zobaczymy też inne przykłady). Oto zaskakujący fakt: jeśli f jest dowolną funkcją, taką że suma g(m) = Y _ f (d) d\m jest multiplikaty wna, to sama funkcja f też jest multiplikaty wna. (Wynik ten wraz z równaniem ( 4 .5 4 ) i z oczywistym założeniem, że funkcja g(m) = m jest multiplikatywna, dostarcza nowego argumentu na rzecz multiplikatywności funkcji Eulera.) Udowodnimy ten zadziwiający rezultat przez indukcję ze względu na m. Baza jest prosta, bo f (1) = g(1) = 1. Niech m > 1, a ponadto załóżmy indukcyjnie, że f(rrtirri2 ) = f(Trvi)f(m2 ), gdy mi ± rri2 i m i m 2 < m. Jeśli m = m im .2 i mi _L rrt2 , to g ( m i m 2) = f(d) = d \m i m 2 Z L di \ m i d 2 \ m .2 f ( d i d 2), a ponadto di _L d2 , gdyż wszystkie dzielniki liczby mi są względnie pierw sze ze wszystkimi dzielnikami liczby rri2 . Na mocy założenia indukcyjnego f ( d i d 2 ) = f ( di ) f ( d 2 ), poza możliwym przypadkiem, gdy di = mi i d2 = IU2 . Mamy więc L f(d, ) di \ m i Y. f(d 2)^ - f ( m i ) f ( m 2) + f ( m 1m 2) d2 \m.2 = g ( m i ) g ( m 2 ) - f ( m i ) f ( m 2 ) + f ( m i m 2). Jest to wszakże równe g(m i IU2 ) = g ( m i ) g(m 2 ), więc zachodzi także związek f ( m i m 2) = f ( m i ) f ( m 2). Na odwrót, jeśli f(m ) jest multiplikatywna, to odpowiadająca jej suma względem dzielników g(m) = mus^ kyć multiplikatywna. W rze czywistości, jak przekonamy się o tym w ćwiczeniu 33, prawdziwe jest nawet twierdzenie mocniejsze. Ten zadziwiający rezultat zachodzi więc w obu kie runkach. Funkcja M obiusa p.(m), nazwana na cześć dziewiętnastowiecznego ma tematyka Augusta Mobiusa, który wymyślił także swoją znaną wstęgę, jest zdefiniowana dla wszystkich liczb całkowitych 1 za pomocą równania Y _ M-(d.) = [m = 1]. (4.55) d \m Nawiasem mówiąc, równanie to jest rekurencyjne, ponieważ po lewej stronie mamy sumę składającą się z fx(m) oraz pewnych wartości p,(d) dla d < m. Jeśli na przykład będziemy kolejno podstawiali m = 1, 2, . . . , 12, to możemy wyliczyć 12 początkowych wartości: m jx(m) 2 3 4 5 6 7 1 - 1 - 1 0 - 1 1 -1 1 8 9 10 11 0 0 1 -1 12 0 Richard Dedekind [78] i Joseph Liouville [251] zauważyli w r. 1857 na stępującą ważną „regułę odwracania” g(m ) = Y _ f(d) 4=^ f(m ) = d \m Nadszedł właściwy czas, aby rozgrzać się za pomocą ćwiczenia 11. ^(d)g(^). ( 4 .5 6 ) d \m Zgodnie z tą regułą, funkcja Mobiusa pozwala nam zrozumieć każdą funkcję f(m), dla której znamy wartości H d\ m f(d). W dowodzie równoważności ( 4 .5 6 ) wykorzystamy dwa chwyty opisane wzorami (4 .7 ) i (4 .9 ) na początku tego rozdziału: Jeśli g(m) = H d\ m f(d), to H(d)g(^) = Y . M-(-j)g(d) d \m d \m = L ^ i L m d \m k \d - Z Z <)<« k \m d \(m /k ) = L Z k \m d \(m /k ) = Y [m /k = 1 ]f(k) = f( m) . k \m W drugą stronę dowód przebiega podobnie (zob. ćwiczenie 1 2 ). Relacja ( 4 .5 6 ) obrazuje użyteczną własność funkcji Mobiusa i za jej po mocą udało się nam wypisać pierwszych 12 wartości tej funkcji. Jak sobie jednak poradzić z obliczeniem fJ-(m), gdy m jest duże? Jak rozwiązać re kurencję ( 4 .5 5 )? Rzecz jasna, funkcja g(m) = [ m = l ] jest multiplikatywna, w końcu jest ona zerem poza przypadkiem, gdy m = 1. Funkcja Mobiusa zdefiniowana równaniem (4 .5 5 ) także musi być multiplikatywna na mocy cie kawego faktu, który minutę czy dwie temu został udowodniony. Możemy więc wywnioskować, czym jest |x(m) na podstawie znajomości |j.(pk). W przypadku gdy m = p k, równanie (4 .5 5 ) gwarantuje, że M-(1) + M-(P) + H(P2) + • • • + M-(pk) = 0 dla wszystkich k ^ 1, ponieważ dzielniki liczby p k, to 1, . . . , p k. Stąd otrzy mujemy n(p) = - 1 ; ^(pk) = 0 dla k > 1 . Zatem na mocy (4 .5 2 ) otrzymujemy ogólny wzór r \ TT S 1 m „i | ' ( - ' | )r> jeśli m = p ,p 2 . . . p T; : jeśli 3p p2\m . . . (łW) I to jest \x. W przypadku, gdy równanie (4 .5 4 ) potraktujemy jako rekurencję definiu jącą funkcję Eulera cp(m), wówczas można tę rekurencję rozwiązać stosując regułę Dedekinda-Liouville’a (4 .5 6 ). Otrzymamy wtedy <p(m) = M-(d) -j • (4-58) d \m Na przykład <p(12) = n(1) *12 + |x(2) - 6 + |x(3) -4 + 1^(4) *3 + jx(6 ) -2 + |x(12) • 1 = 1 2 - 6 - 4 + 0 + 2 + 0 = 4. Jeśli liczba m jest podzielna przez r różnych liczb pierwszych, na przykład { p i , . . . , p r}, to suma (4 .5 8 ) ma tylko 2 r niezerowych wyrazów, ponieważ funkcja \i często przybiera wartość zero. Widzimy więc, że równanie (4 .5 8 ) jest zgodne ze wzorem ( 4 .5 3 ), który można zapisać jako <p(m) = Jeśli przemnożymy każdy z r czynników przez (1 — 1/pj), to dostaniemy dokładnie 2r niezerowych wyrazów w (4 .5 8 ). Zaletą funkcji Mobiusa jest to, że stosuje się także w wielu innych przypadkach. To zależy od tego, jak szybko się czyta. Spróbujmy dla przykładu wywnioskować, ile ułamków znajduje się w ciągu Fareya Sn- Liczba takich ułamków to liczba ułamków z przedziału [0 .. 1], których mianowniki nie przekraczają n, jest więc ona o 1 większa od wartości 0 (n), którą definiujemy następująco: $ (* ) = y_ <po<). (4 -5 9 ) (Musimy dodać jedynkę do O (rt), ponieważ ostatnim ułamkiem ciągu jest zawsze y.) Suma w (4 .5 9 ) wygląda skomplikowanie, ale możemy obliczyć 0 (x) nie wprost, zaobserwowawszy, że (To rozszerzenie do wartości rzeczywistych jest użytecznym chwytem, który stosujemy w wielu rekurencjach napotykanych przy analizie algorytmów.) ( 4 .6 0 ) = lW Li+*J dj-s1 dla wszystkich liczb rzeczywistych x. Dlaczego zachodzi ten wzór? Wygląda dość przeraźliwie, ale wciąż jest w zasięgu naszych możliwości. Mamy bowiem \ LXJ D + XJ ułamków właściwych m /n , 0 ^ m < n ^ x, licząc zarówno te uproszczone, jak i te nie uproszczone. To czyni prawą stronę. Liczba ułamków właściwych, dla których N W D ( m , n ) = d, wynosi 0 (x /d ), ponieważ ułamki takie są postaci m ' /n ' dla 0 ^ m ' < n ' ^ x / d po zamianie m na m /d oraz n na n 'd . Lewa strona równania zlicza te same ułamki w inny sposób, więc tożsamość musi zachodzić Przyjrzyjmy się z bliska temu przypadkowi, aby równania (4 .5 9 ) i (4 .6 0 ) stały się bardziej zrozumiałe. Z definicji funkcji <D(x) wynika, że 0 (x ) = 0 ( [ x j ) . Wydaje się teraz sensowne uogólnić 0 (x ) tak, ażeby jej dziedziną stał się zbiór liczb rzeczywistych, a nie tylko całkowitych. Stablicujmy w punktach całkowitych parę wartości funkcji <D(x): n 0 1 2 3 4 5 6 7 8 9 10 11 12 <p(n) — 1 1 2 2 4 2 6 4 6 4 10 4 <D(n) 0 1 2 4 6 10 12 18 22 28 32 42 46 i możemy sprawdzić wzór ( 4 .6 0 ) dla x = 1 2 : 0 ( 1 2 ) + 0 (6 ) + <D(4) + 0(3) + 0 (2 ) + 0 (2 ) + 6 - 0 ( 1 ) = 46 + 12 + 6 + 4 + 2 + 2 + 6 = 78 = i -12 -13. Zadziwiające. Tożsamość ( 4 .6 0 ) może być postrzegana jako rekurencją wprost dla 0 (x ). Widzieliśmy na przykład, jak można było jej użyć w celu obliczenia 0(12) z wybranych wartości 0 (m ) dla m < 12. Rekurencje takie możemy rozwiązy wać używając innej własności funkcji Mobiusa: g(*) = ^ = L ^ (d )g (x /d ). d^1 (4-61) d^1 Przedstawiona reguła odwracania zachodzi dla wszystkich funkcji f takich, że Z k ,f ó i l f (x/ kd)| < 00. Możemy wykazać ją następująco. Załóżmy, że 9(x) = L d ^ i f(x/d). Wtedy Z . M-(d)g(x/d) = Y _ M-(d) Y _ f(x/kd) d js l d^l = ^ k ^1 H ^ /m ) m^l = ^ p.(d)[m = kd] d ,k ^ 1 Y f(*Ari) Y H-W = Y f(x /m )[m = 1 ] = f ( x ) . m^1 d \m m^l Dowód w drugą stronę jest w istocie taki sam. Jesteśmy już gotowi do rozwiązania rekurencji (4.60) określającej 0 (x): = l Y. M-(d)L*/dJ LI + */dJ . (4-62) d^ 1 Suma po prawej stronie jest zawsze skończona, na przykład 0(12) = ^(12-13 — 6-7 —4-5 + 0 —2-3 + 2-3 — 1-2 + 0 + 0 + 1 - 2 — 1-2 + 0 ) = 78-21 - 1 0 - 3 + 3 - 1 +1 - 1 = 46. W rozdziale 9 zobaczymy, w jaki sposób wykorzystać równanie (4.62) w celu uzyskania dobrego przybliżenia funkcji 0 (x). W istocie udowodnimy wzór odkryty przez Mertensa w r. 1874 [270], = - 4 x 2 + 0 (x lo g x ). 71 Widać więc, że funkcja 0 (x) rośnie w sposób „gładki”, wyrównując kaprysy funkcji cp(k). Pozostając w duchu tradycji wprowadzonej w ostatnim rozdziale, za kończmy ten rozdział analizą problemu ilustrującego wiele z tego, co właśnie badaliśmy, a zarazem stanowiącego dobre wprowadzenie do rozdziału następ nego. Załóżmy, że mamy n paciorków różnych kolorów i że chcemy policzyć, na ile sposobów można z nich utworzyć naszyjnik o długości m, nanizując je na okrągły sznurek. Zaatakujemy ten problem metodą „nazwij i zwyciężaj”, oznaczając liczbę takich naszyjników przez N(m ,rt). Tak naprawdę Móbius [273] wymyślił swoją funkcję nie ze względu na (4 .56), a właśnie ze względu na (4 .61). Jeżeli na przykład mamy do czynienia z dwoma kolorami paciorków R i B, to naszyjników złożonych z 4 paciorków możemy ułożyć N(4,2) = 6 : r R^ R R ^-R^ r R^ R R ^B-^ r R~>> R B ^B^ r R~^ B B ^R-^ r R^ B B ^B-^ B B ^B^ Wszystkie pozostałe sposoby są równoważne któremuś z nich, ze względu na to, że obroty naszyjnika nie zmieniają układu paciorków. Jednak odbicia symetryczne uznajemy za różne, jak na przykład w przypadku m = 6 : R R I | 'R B jest różny od R R I I . B R ^-B -7 Problem policzenia szukanej liczby konfiguracji został po raz pierwszy roz wiązany przez P. A. MacMahona w r. 1892 [264]. Nie ma żadnej oczywistej rekurencji na N( m, n) , ale możemy policzyć liczbę naszyjników, rozrywając każdy z nich w m różnych punktach i ba dając powstałe kawałki. W rozważanym przypadku, gdy m = 4, a rt = 2, otrzymamy RRRR RRRR RRRR RRRR RRBR RRRB BRRR RBRR RBBR RRBB BRRB BBRR RBRB BRBR RBRB BRBR RBBB BRBB BBRB BBBR BBBB BBBB BBBB BBBB Każdy z rtm możliwych układów wystąpi co najmniej raz w takiej tabeli składającej się z mN( m, n ) słów, a niektóre słowa wystąpią więcej niż raz. Ile razy wystąpi tam słowo ao . . . a m_i ? To proste! Jest to oczywiście liczba cyklicznych przesunięć a^ . . . a m_i ao . . . a ^ - i , które układają się w ten sam wzorzec co wyjściowe ao . . . a m_ i . Słowo BRBR występuje na przykład dwu krotnie, ponieważ przerywając naszyjnik BRBR cyklicznie w czterech różnych miejscach (BRBR, RBRB, BRBR, RBRB) uzyskujemy powtórzenie układu wyj ściowego BRBR. Na mocy tego rozumowania wnioskujemy, że m N (m ,n ) = ia° • *• a™-i = Qk .. . am_! a 0 . . . ak_i] ao,...,CLm-i eSn. 0 ^ k < m = Y . Y . [ a ° **• a m —i = Q k • •• a m —i a o . . . a k—i ] . 0 ^ k < m a 0 , . . . , a m_ i e S n Symbol Sn oznacza tu zbiór różnych kolorów. Zastanówmy się, dla ilu wzor ców spełnione będzie równanie ao . . . a m_i = a k . . . a m_i ao . . . a ^ - i , przy ustalonym k. Jeśli dla przykładu m = 12 przy k = 8 , a my chcemy policzyć liczbę różnych rozwiązań równania ao a-\ ci2a 3 clą as ag a 7 ag a<?ai o &i i = a s a 9 a i o a n aoai a 2 a 3 a 4 a s a 6 a 7 . Oznacza to, że ao = ag = 0 4 , cii = ac; = as, a 2 = aio = ag i 0 3 = a n = a 7. W związku z tym wartości ao, a i , a 2 , oraz as można wybrać na rt4 sposobów, a pozostałe już od nich zależą. Czy nie wygląda to znajomie? W ogólności rozwiązanie równania CLj = a (j+k) mod rn , dla 0 ^ j < m zrównuje aj z a(j+lcl) mod m dla l = 1 , 2 , . . . , a wiemy przecież, że wie lokrotnościami liczby k modulo m są {0 , d, 2 d , . . . , m — d}, gdzie d = NW D(k, m). A zatem ogólne rozwiązanie można otrzymać wybierając nieza leżnie ao, . . . , a d- i , a następnie ustalając aj = aj_d dla d ^ j < m. Takich rozwiązań jest rtd. Udowodniliśmy właśnie, że m N (m ,n ) = £ n NWD<k’m>. O^kcm Ponieważ suma ta zawiera jedynie wyrazy postaci rtd, gdzie d \m , więc można ją uprościć. Po podstawieniu d = N W D (k,m ) dostajemy N ( m, n ) = — Y _ n d [d = N W D (k,m )] d\m 0 ^k<m = 1 Y_ d\m = L nd d\m [k/d X m /d] 0 ^k<m H [k-Lm/d] . 0 ^k<m/d (Wolno nam zamienić k /d przez k, ponieważ k musi być wielokrotnością d.) Suma z ostatniego wiersza to z definicji ^ 0 ^k<Tny d[kJLm/d] = cp(m/d), więc natychmiast otrzymujemy wzór MacMahona: N( m, n ) = ~m X (P(d) Tim/d • z— n<1 <p(\ T a /) = ~ mY .z— d\m d\m ( 4 -6 3 ) Sprawdźmy go np. dla przypadku m = 4 i n = 2: liczba naszyjników równa się 1 ( 1 -2 4 + 1 -2 2 + 2 -2 1) = 6 , tak jak przypuszczaliśmy. Bynajmniej nie jest oczywiste, że wartość N(m ,ri) określona wzorem MacMahona jest liczbą całkowitą. Spróbujmy udowodnić wprost, bez odwo ływania się do naszyjników, że Y cp(d)nm/d = 0 (mod m ) . ( 4 *6 4 ) d \m W szczególnym przypadku, gdy m jest liczbą pierwszą, kongruencja ta re dukuje się do rtp + (p — 1)n = 0 (mod p), czyli do n v = n. Jak już to spostrzegliśmy wyprowadzając wzór (4 .4 8 ), kongruencja ta jest wersją ma łego twierdzenia Fermata. W związku z tym wzór (4 .6 4 ) jest prawdziwy dla m = p. Możemy go więc potraktować jako uogólnienie twierdzenia Fermata w przypadku, gdy moduł przystawania nie jest liczbą pierwszą. (Uogólnienie Eulera ( 4 .5 0 ) jest inne.) Udowodniliśmy wzór (4 .6 4 ) dla wszystkich modułów przystawania będą cych* liczbami pierwszymi. Przyjrzyjmy się więc najmniejszemu przypadkowi złożonemu, gdy m = 4. Musimy pokazać, że n 4 + n 2 + 2n = 0 (mod 4 ). Dowód staje się prosty, gdy rozważamy osobno przypadki n parzystych i nieparzystych. Jeśli rt jest parzyste, to wszystkie trzy czynniki pod sumą po lewej stronie przystają do 0 modulo 4. Jeśli n jest nieparzyste, to zarówno rt4, jak i n 2 przystają do 1, natomiast 2n przystaje do 2. Lewa strona przystaje więc do 1 + 1 + 2, co daje 0 modulo 4. Gotowe. Ośmielmy się teraz rozważyć przypadek m = 12. Taka wartość dla m, choć niewielka, powinna być interesująca, ponieważ ma sporo dzielników, wliczając w to kwadrat liczby pierwszej. (Widzimy też szansę, że dowód dla m = 12 da się uogólnić dla dowolnego m.) Kongruencja, którą mamy pokazać, jest następująca: rt12 + rt6 + 2n 4 + 2 u 3 + 2rt2 + 4ri = 0 (mod 12). I co teraz? Ze względu na własność (4 .4 2 ), kongruencja ta zachodzi wtedy i tylko wtedy, gdy zachodzi również modulo 3 i modulo 4. Pokażemy najpierw, że zachodzi modulo 3. Kongruencja (4 .6 4 ) zachodzi dla liczb pierwszych, więc mamy ri3 + 2n = 0 (mod 3). Właściwe pogrupowanie składników pozwala nam użyć tego faktu dla wyjściowej sumy w takiej postaci: n 12 + n 6 + 2n 4 + 2n 3 + 2n 2 + 4 n = (rt12 + 2 n 4) + (rt6 + 2 n 2) + 2 (n 3 + 2n) = 0 + 0 + 2-0 = 0 (mod 3 ). Czyli modulo 3 wszystko się zgadza. Jesteśmy w połowie drogi. W celu pokazania, że kongruencja ta zachodzi dla m = 4, zastosujemy ten sam chwyt. Pokazaliśmy, że rt4 + n 2 + 2n = 0 (mod 4), użyjmy więc tego wzorca, jako wskazówki przy przegrupowaniu naszej sumy: rt12 + rt6 + 2n 4 + 2n 3 + 2n 2 + 4n = (n 1 2 + u 6 + 2 n 3 ) + 2 (u 4 + n 2 + 2 ri) = 0 + 2-0 = 0 (mod 4 ). QED dla przypadku m = 12. Do tej pory udało się nam udowodnić naszą kongruencję dla m będących liczbami pierwszymi oraz dla m = 4 i dla m = 12. Spróbujmy teraz naszych sił dla potęg liczb pierwszych. Aby zbytnio nie uogólniać od razu, załóżmy, że m = p 3 dla pewnej liczby pierwszej p. Lewa strona wzoru ( 4 .6 4 ) przybiera wtedy postać n p3 + cp(p)np2 + (p(p2 )np + cp(p3)n = n p3 + (p - 1 )n p2 + (p 2 - p )n p + (p 3 - p 2)n = (n p3 - u p2<) + p (n p2 - n p) + p 2 (np - n) + p 3 u . Otrzymane wyrażenie przystaje do 0 modulo p 3, jeżeli n p3 — n p2 jest po dzielne przez p 3, n v — n v jest podzielne przez p 2 i n v — n jest podzielne przez p, ponieważ cała suma będzie wtedy podzielna przez p 3. Z alternatyw nej postaci małego twierdzenia Fermata wnioskujemy, że n v = n (mod p), więc p dzieli n v —n. Istnieje zatem liczba całkowita q taka, że rtp = rt + pq . Podnieśmy teraz obie strony do p-tej potęgi i rozwińmy prawą stronę zgod nie ze wzorem dwumianowym (który napotkamy w rozdziale 5), a następnie przegrupujmy wynik: n ?2 = ( n + V ą )v = n * + (pq) 1n ” - 1 ( ^ + (pq) 2n * - 2 Q + ••• = n p + p 2Q dla pewnej liczby całkowitej Q. Wspólny czynnik p 2 wolno nam było wy ciągnąć przed nawias dlatego, że w drugim składniku (^) = p, a w dodatku czynnik (pq ) 2 występuje we wszystkich kolejnych wyrazach. Wiemy już, że 7 2 p z dzieli n p —n p. QED: Quite Easily Done. Znów podnosimy obie strony do p-tej potęgi, rozwijamy i przegrupowujemy, otrzymując u p3 = (n p + p 2 Q )p -= u p2 + + (p 2 Q) 2 n p(p_2' + ••' = n p2 + p3Q dla jakiejś innej liczby całkowitej Q. Liczba p 3 dzieli więc n p3 —n p2, co kończy dowód dla m = p 3; pokazaliśmy przecież, że p 3 dzieli lewą stronę wzoru (4 .6 4 ). Co więcej, możemy pokazać przez indukcję, że dla pewnej końcowej liczby całkowitej £2 (końcowej, bo braknie nam już czcionek) zachodzi n Pk = rtPk_1 + p k£ i w związku z tym n pk = n pk 1 ( mo d p k), dla k > 0 . ( 4 *6 5 ) Lewa strona równania (4 .6 4 ), która równa się (rtpk—rtpk ^ + p (n pk npk 2) + ••• + p k - 1 (np —n) + p kn , jest podzielna przez p k, czyli przystaje do 0 modulo p k. Już prawie kończymy. Skoro udowodniliśmy wzór (4 .6 4 ) dla potęg liczb pierwszych, to został jeszcze do udowodnienia przypadek, gdy m = m.im.2 , gdzie mi _L rri2 , przy założeniu, że kongruencja zachodzi dla mi i m 2 . Przy naszej próbie z m = 12 korzystaliśmy z rozkładu na m = 3 i m = 4; podobnie powinno dziać się i w ogólnym przypadku. Wiemy, że funkcja cp jest multiplikatywna, więc wolno nam stwierdzić, że ^cp(d)nm/d= d\m Y . <p(d1d2 ) n mim 2/d' d2 di \rai ,d2\rri2 = Y <P(di)( £ di\mi ‘P(d2){nm’ / d' ) m2/d2) . d2\m2 Wewnętrzna suma przystaje do 0 modulo rri2 — założyliśmy przecież, że wzór ( 4 .6 4 ) zachodzi dla r a z — zatem i cała suma przystaje do 0 modulo m 2 . Ze względu na symetrię, dochodzimy do wniosku, że cała suma przystaje do 0 także modulo m i, więc zgodnie ze wzorem ( 4 .4 2 ) przystaje również do 0 modulo m. QED. * Ć w iczenia______________________________________ Rozgrzewka 1 . Jaka jest najmniejsza liczba naturalna mająca dokładnie k dzielników, dla 1 ^ k ^ 6 ? 2 . Udowodnij, że N W D (m , n)-NW W (m , rt) = m-n i korzystając z tej tożsa mości wyraź NW W (m , n) za pomocą N W W (n mod m, m), w przypadku gdy rt mod m / 0 . Wskazówka: Skorzystaj ze wzorów (4 . 1 2 ), ( 4 . 1 4 ) oraz (4 -1 5 )3. Niech n[x) oznacza liczbę liczb pierwszych nie przekraczających x. Czy prawdą jest, że zachodzi równość n(x) —n{x — 1 ) = [x jest pierwsza]? 4. Co by się zmieniło, gdybyśmy konstrukcję Sterna-Brocota zaczęli od pię- ciu ułamków (f, i , Ą , =1, 2), zamiast od 5. Znajdź proste wzory na Lk i Pk, gdy L i P są macierzami 2 x 2 z równa nia (4 .3 3 ). 6 . Co oznacza ‘a = b (mod 0)’? 7. Dziesięciu ludzi ponumerowanych od 1 do 10 staje w kręgu, tak jak w problemie Flawiusza, i eliminujemy co m-tą osobę. (Wartość m może być znacznie większa niż 10.) Udowodnij, że nie jest możliwe, aby dla jakiegokolwiek k jako pierwsze zostały wyeliminowane osoby o numerach 1 0 , k i k + 1 (w tej kolejności). 8 . Rozważany w tekście system niezależnych reszt (x mod 3 ,x mod 5) ma ciekawą własność, a mianowicie liczba 13 odpowiada w tym systemie parze (1,3), co wygląda prawie tak samo jak w zapisie dziesiętnym. Wy jaśnij, jak można znaleźć wszystkie przypadki takiej zgodności bez prze glądania wszystkich piętnastu par reszt. Innymi słowy, znajdź wszystkie rozwiązania kongruencji 10x + -y = x (mod 3 ), 10x + y = y (mod 5 ). Wskazówka: Zauważ, że 10u + 6 v = u (mod 3) i 1 0 u + 6 v = v (mod 5). 9. Pokaż, że liczba (377—1)/2 jest nieparzysta i złożona. Wskazówka: Czemu jest równe 3 77 mod 4? 10. Oblicz cp(999). 1 1 . Znajdź funkcję cr(n) mającą własność g(n) = f (k) O^k^n ^ f (n ) = Y. o W g t u - k ) . O^k^n (Jest to funkcja analogiczna do funkcji Mobiusa, por. równanie ( 4 .5 6 ).) 12. Uprość wzór £ dXm L kXd n(k) g(d/k). 13. Całkowita liczba dodatnia n nazywa się liczbą bezkwadratową, jeśli nie jest podzielna przez m 2 dla jakiegokolwiek m > 1. Znajdź warunek ko nieczny i dostateczny na to, aby liczba n była bezkwadratowa: a) używając reprezentacji wykładniczej (4 . 1 1 ) liczby n; b) używając |Lt(n). P o d sta w y 14. Udowodnij albo podaj kontrprzykład: a) NW D (km, kn) — kN W D (m, n ) ; b) N W W (km ,kn) = k N W W (m ,n ). 15. Czy każda liczba pierwsza występuje jako czynnik pewnej liczby Eukli desa en ? 16. Ile wynosi suma odwrotności początkowych u liczb Euklidesa? 17. Oznaczmy przez f n n-tą „liczbę Fermata” 2 + 1. Udowodnij, że f m _L f n , jeśli m < n. 18. Wykaż, że jeśli 2n + 1 jest liczbą pierwszą, to n musi być potęgą 2. 19. Pokaż, że dla każdej liczby całkowitej dodatniej n zachodzą następujące tożsamości: cp(k+ 1 Z 1 ^k<n = y_ L [(m A )/r m /k ] j 1<m^n _ X1^k<m = n - l - £ (k — 1 )! + 1 k=1 W skazówka: Jest tu ukryta pułapka, a odpowiedź jest całkiem prosta. 20. Dla każdej liczby całkowitej dodatniej n istnieje liczba pierwsza p taka, że n < p ^ 2n. (W istocie jest to tzw. „postulat Bertranda”, postawiony i sprawdzony dla rt < 3000000 przez Josepha Bertranda w r. 1845, a udowodniony dla wszystkich n przez Czebyszewa w r. 1850.) Za pomocą postulatu Bertranda pokaż, że istnieje stała b « 1,25 taka, że wszystkie liczby L2bJ, L22bJ, L222bJ, ... są pierwsze. 2 1 . Niech Pn oznacza n-tą liczbę pierwszą. Znajdź stałą K taką, że [(10n2K ) m o d 10nJ = Pn . 2 2 . Liczba 1111111111111111111 jest pierwsza.'Udowodnij, że dla każdej podstawy systemu liczbowego b, liczba (11 . . . 1 )b może być pierwsza tylko wtedy, gdy liczba jedynek jest pierwsza. 23. Znajdź rekurencję na p(k), funkcję calówki, którą zajmowaliśmy się przy okazji omawiania 6 2 (11!). Pokaż, że istnieje związek pomiędzy p(k) oraz krążkiem, który w kroku k został przeniesiony przy przenoszeniu n-krążkowej wieży Hanoi za pomocą 2n — 1 ruchów, dla 1 ^ k ^ 2n — 1. 24. Wyraź ep (n!) za pomocą Tp (n), sumy cyfr w systemie reprezentacji przy podstawie p uogólniając tym samym wzór ( 4 .2 4 ). 25. Powiemy, że m dokładnie dzieli n, co zapisujemy jako m \\n , jeśli m \n i m ! l n /m . Przykładem może tu służyć wyrażenie p ep^n!^\\n! napotkane przy okazji omawiania czynników typu silnia. Czy prawdą jest, że a) k \\n i m \\n k m \\n , dla k _L m. b) Dla wszystkich m ,n > 0 , N W D (m ,n )\\m , albo N W D (m ,n )\\n . 26. Rozważ ciąg S n wszystkich nieujemnych ułamków właściwych m /n ta kich, że m n ^ N. Na przykład G _0J_111111121213253456789J_0 ^10 ~ 1»10 >9>8>7’6’5 >4 >3»5 >2>3’1>2 >1>2’1>1>1M >1>1>1> 1 * Czy rzeczywiście tak jest, że m 'n —m n ' = 1, jeżeli m /n jest bezpośred nim poprzednikiem m '/n ' w ciągu S n ? 27. Podaj prostą regułę porównywania liczb wymiernych w reprezentacji sys temu liczbowego Sterna-Brocota. 28. Początek reprezentacji Sterna-Brocota liczby n wygląda następująco: 7i = P3L7P ,5 LP292LPLP2LP3LP14L2P . . . . Wykorzystaj to do znalezienia możliwie prostych wymiernych przybliżeń liczby 7i, których mianowniki są mniejsze niż 50. Czy 22/7 będzie wśród nich? 29. W tym rozdziale została przedstawiona zależność między dwójkowymi reprezentacjami liczb rzeczywistych x = (0 , b i b 2 b 3 . . . )2 z przedziału [0.. 1) i liczbami rzeczywistymi zapisanymi w systemie Sterna-Brocota oc = Bi B2 B3 . . . z przedziału [0.. 0 0 ). Jeśli liczba x odpowiada liczbie oc i x 7^ 0 , to jaka liczba odpowiada liczbie 1 —x? 30. Udowodnij następujące twierdzenie (zwane chińskim twierdzeniem o resztach): Niech m i , . . . , m r będą liczbami naturalnymi spełniającymi rrij _L mic dla 1 ^ j < k ^ r. Przyjmijmy, że m = mi . . . m r; niech a i , . . . , ar, A będą liczbami całkowitymi. Istnieje wtedy dokładnie jedna liczba cał kowita a taka, że a = aic (mod mk) dla l ^ k ^ r i A ^ a < A + m. 31. Liczba naturalna zapisana w systemie dziesiętnym jest podzielna przez 3 wtedy i tylko wtedy, gdy suma jej cyfr jest podzielna przez 3. Udowodnij i uogólnij tę powszechnie znaną regułę. 3 /ó g ^ / '^ 0 Dlaczego „Euler” wymawia się „O jler” podczas gdy na „Euklidesa” mówi się „Elklides” ? 32. Udowodnij twierdzenie Eulera ( 4 .5 0 ) uogólniając dowód wzoru (4 .4 7 ). 33. Pokaż, że jeśli f(m ) i g(m) są funkcjami multiplikatywnymi, to multipli katywna jest też funkcja h(m) = X d \ m f(d) g(m /d ). 34. Udowodnij, że wzór ( 4 .5 6 ) jest szczególnym przypadkiem wzoru ( 4 .6 1 ). Ć w iczen ia d om ow e 35. Załóżmy, że funkcja I(m,n) spełnia równanie I(m ,n )m + I(n ,m )n = N W D ( m , n ) , dla każdych nieujemnych liczb całkowitych m i n takich że m / n. W związku z tym we wzorze (4 .5 ) I(m,n) = m / i I(n, m) = n ', czyli wartość I(m ,n) jest odwrotnością liczby m ze względu na n. Znajdź rekurencję, która zdefiniuje I(m ,n ). 36. Rozważmy zbiór Z(\/TÓ) = (m + nVTÓ | m ,n całkowite}. Liczbę m + nVTÓ nazwiemy jed n o ścią, jeśli m 2 — 1 0 n 2 = ± 1 , gdyż istnieje dla niej liczba odwrotna (to sformułowanie bierze się stąd, że (m-|-n\/TÓ) -zb(m— n y /TÓ) = 1 ). Na przykład liczba 3^ł- \/TÓ jest jednością, podobnie jak 19 — 6y/10. Nie ma sensu włączać do rozkładu na czynniki par znoszą cych się jedności, po prostu będziemy je ignorowali. Liczby nie będące jednościami w zbiorze Z ( \ / l 0 ) nazywamy pierwszymi, jeśli nie mogą być przedstawione jako iloczyn dwóch^licjb îe będących jednościami. Po każ, że liczby 2, 3 i 4 ± a/10 są jefinośaąmi w Z( v/1_0 ). Wskazówka: Jeśli 2 = (k + l v ^ ) ( m + n\/TÓ), to 4 = (k2 — 1 0 l 2 )(m 2 — 1 0 n 2). Co wię cej, kwadrat każdej liczby naturalnej modulo 10 może być równy 0 , 1,4, 5, 6 lub 9. 37. Udowodnij wzór ( 4 . 1 7 ). Wskazówka: Pokaż, że en -~- = (en_i —\ ) 2j r \ i rozważ 2 _TLlog (en — \ ). 38. Udowodnij, że jeśli a 1 b i a > b, to N W D (am — bm, au — b71) = a NWD(m,n) _ ^NWD(m,-a)^ gfefe 0 m < n. (Wszystkie zmienne są liczbami całkowitymi.) Wskazówka: Wykorzystaj algorytm Euklidesa. 39. Niech S(m) będzie najmniejszą liczbą całkowitą dodatnią n, dla której istnieje rosnący ciąg liczb całkowitych m = ai < ci2 < • • • < a t = n taki, że a i a 2 . . . a t jest kwadratem liczby całkowitej. (Jeśli m samo w sobie jest kwadratem liczby całkowitej, to możemy przyjąć, że t = 1 i n = m.) Na przykład S(2) = 6 , ponieważ najlepszym takim ciągiem jest cii = 2. Mamy więc n 1 2 3 4 5 6 7 8 9 10 11 12 S(n) 1 6 8 4 10 12 14 15 9 18 22 20 Udowodnij, że S(m) ^ S(m '), jeśli tylko 0 < m < m '. 40. Załóżmy, że liczba rt ma w systemie pozycyjnym o podstawie p przed stawienie (am . . . ai ao)p. Udowodnij, że n !/ p €„(nn = ( - l ) M " 0 Qmt . . . a , ! Qo! (mod p ) . (Lewa strona, to po prostu n! z usuniętymi wszystkimi czynnikami p. Dla n = p ten wzór to twierdzenie Wilsona.) 41. a) Pokaż, że jeśli p mod 4 = 3, to nie ma liczby całkowitej n takiej, że p dzieli n 2 + 1. Wskazówka: Wykorzystaj małe twierdzenie Fermata, b) Jednocześnie wykaż, że jeśli p mod 4 = 1, to takiej liczby całkowi tej nie ma. W skazówka: Zapisz (p — 1)! jako ( n l S 1 ~ k)) i przypomnij sobie twierdzenie Wilsona. 42. Pokaż, że jeśli ułamki m /n i m //n ' są w postaci nieskracalnej, to ich suma m /n + m //r t ' wyrażona w postaci nieskracalnej będzie miała mia nownik równy n n ' wtedy i tylko wtedy, gdy n _L n '. (Innymi słowy, uła mek (m n' H -m /n j/n n' jest w postaci nieskracalnej wtedy i tylko wtedy, gdy n i n ' nie mają wspólnych dzielników.) 43. W drzewie Sterna-Brocota na poziomie k mamy 2k węzłów. Odpowiadają one macierzom Lk, Lk_1 P, . . . , Pk. Pokaż, że ciąg ten możemy otrzymać zaczynając od macierzy Lk, a następnie sukcesywnie mnożąc ją przez (i 2p(n) + l ) dla 1 ^ n < 2 k, gdzie p(n) jest funkcją calówki. 44. Pokazać, że jeśli średnia liczba orłów uzyskanych w rzutach pewną niewyważoną monetą wynosi 0,316, to musiano wykonać co najmniej 19 rzu tów. (Zakładamy tu, że jeśli wyrzucono m orłów w n rzutach rozważaną monetą, to m /n E [0,3155.. 0,3165).) 45. Liczba 9376 ma ciekawą własność samoreprodukcji przy podnoszeniu do kwadratu: 93762 '= 87909376. Ile spośród 4-cyfrowych liczb x spełnia równanie x 2 mod 10000 = x? Ile spośród n-cyfrowych liczb x spełnia równanie x 2 mod 1 0 n = x? 46. a) Udowodnij, że jeśli n* = 1 i n k = 1 (mod m), to TtNWD^*»kJ = 1 . b) Pokaż, że 2^ ^ 1 (mod n) dla n > 1. W skazówka: Rozważ najmniejszy pierwszy czynnik liczby n. 47. Pokaż, że jeśli n m _ 1 = 1 (m odm ), a jednocześnie n (m_1)//p ^ 1 (m odm ) dla wszystkich liczb pierwszych p takich, że p \ ( m — 1 ), to m jest liczbą pierwszą. Wskazówka: Pokaż, że jeśli ten warunek jest spełniony, to wszystkie liczby n k mod m są różne dla 1 ^ k < m. 48. Uogólnij twierdzenie Wilsona( 4 4 9 ) przez rozważenie wartości wyrażenia ( r ii^ n < m , n im n ) m odm , dla m > 1. 4» T eoria liczb 176 49. Oznaczmy przez R(N) liczbę par liczb całkowitych (m^n), takich że 1 ^ m ^ N, 1 im ln . a) Wyraź R(N) za pomocą funkcji b) Udowodnij, że R(N) = Y.d.^1 [ N / d J ^ l d ) . 50. Niech m będzie liczbą całkowitą dodatnią i niech cu = e27rx/m _ cos ( 27t / m ) + i s i n ( 27r / m ) . Mówimy, że cu jest m-tym pierw iastkiem z jedności ze względu na to, że cum = e2ni = 1. Ogólniej, każda z m liczb zespolonych cu°, cu1 , . . . , cum _ 1 jest m-tym pierwiastkiem z jedności, ponieważ (cuk ) m = e2n\cx _ -j y j związku z tym wielomian z — cuk jest dzielnikiem wie lomianu z m — 1 dla 0 ^ k < m. Ponieważ pierwiastki te są różne, więc pełny rozkład wielomianu z m — 1 w dziedzinie liczb zespolonych musi wyglądać następująco: 0 ^k<m a) N i e c h z ) = rio^k<m, a,k)* ( zdefiniowany wielomian stopnia cp(m) nazywamy w ielom ianem cyklotom icznym rzędu m.) Pokaż, że zm - i = d \m b) Udowodnij, że ¥ m(z) = r id \m (zd - l ) ^(m/d). Zadania egzaminacyjne 51. Udowodnij twierdzenie Fermata (4 .4 8 ) rozwijając wyrażenie (1 +1 H------ b 1 )p zgodnie z twierdzeniem multimianowym. 52. Załóżmy, że rt oraz x są takimi liczbami całkowitymi dodatnimi, że x nie ma dzielników mniejszych lub równych n (poza 1 ), p zaś jest liczbą pierwszą. Udowodnij, że co najmniej |_rt/pj spośród liczb { x — 1 , x 2 — 1 , . . . , x n _ 1 — 1} jest wielokrotnościami liczby p . 53. Znajdź wszystkie liczby całkowite u takie, że u \ |"(n — 1)!/(rt + 1)"|. 54. Oblicz bez pomocy komputera 1000! mod 10250. 55. Oznaczmy przez Pn iloczyn n początkowych silni, n L i P°każ, że dla wszystkich liczb całkowitych dodatnich P2 n /P i jest liczbą całkowitą. V 56. Pokaż, że jest potęgą 2 . 57. Przyjmijmy, że S(m ,n) jest zbiorem wszystkich liczb całkowitych k takich, że m mod k + n mod k ^ k . Na przykład: S(7,9) = {2,4,5,8,10,11,12,13,14,15,16}. Udowodnij, że IcGStm^n) Wskazówka: Pokaż, że L 1sSmsSn L d\ m cp(d) = £ d;sl <p(d)|n/dj, a następnie rozważ [(Ta + rt)/dj — Lm/dJ — [n/d_|. 58. Przyjmijmy, że f(m ) = Hd \ m Znajdź warunek konieczny i dostateczny na to, żeby funkcją f (m) była potęgą 2 . Zadania dodatkowe 59. Udowodnij, że jeśli x -\, . . . , xn są liczbami całkowitymi dodatnimi speł niającymi 1/x-\ H-------[-1 A-a = 1, to max( xi , . . . ,x Tl) < en . Wskazówka: Udowodnij indukcyjnie następujący mocniejszy wynik: „Jeśli 1/x-\ H------ h 1/x n + 1 /<x = 1 , gdzie x i , . . . , xn są całkowitymi liczbami dodatnimi, oc zaś jest liczbą wymierną nie mniejszą niż max( xi , . . . , xn ), to <x+ 1 ^ en+i i x i . . . xn (cx + 1) ^ e-i . . . en en+i ( D o w ó d nie jest oczywisty.) 60. Udowodnij, że istnieje stała P taka, że wzór ( 4 . 1 8 ) daje tylko liczby pierw sze. Możesz skorzystać z (dalece nietrywialnego) faktu, że jeśli 0 > ^-, to dla wszystkich odpowiednio dużych liczb p istnieje liczba pierwsza zawarta pomiędzy p i p + p 0. 61. Pokaż, że jeśli m /n , m '/n ', i m " /n " są kolejnymi wyrazami ciągu jFn, to m" = [(n + NJ/ n/Jm/ —m , n" = |_(n + N )/n'J n ' —n . (Rekurencją ta pozwala na wyliczanie kolejnych elementów ciągu Fareya J N, poczynając od f i ^-.) 62. Jaka liczba w systemie dwójkowym odpowiada rozwinięciu liczby e w sys temie Sterna-Brocota? (Wyraź swoją odpowiedź w postaci nieskończonej sumy, niekoniecznie przedstawiając ją w postaci zwartej.) 63. Tylko na podstawie materiału zawartego w tym rozdziale pokaż, że gdyby (4 .4 6 ) okazało się nieprawdziwe, to najmniejsze n, dla którego istniałby kontrprzykład, musiałoby być liczbą pierwszą. (Możesz założyć, że rów nanie (4 .4 6 ) zachodzi dla n = 4.) Dodatkowo, pokaż, że jeśli av + b p = cp jest najmniejszym kontrprzykładem, to a+ b = mp, jeśli p\c, pp _ 1m p , jeśli p\c, dla pewnej liczby całkowitej m. Wynika stąd, że liczba c ^ m p/2 musi być rzeczywiście ogromna. Wskazówka: Przyjmij, że x = a + b, i zauważ, że NW D (x, (ap + (x - a)v )/x) = N W D (x ,p a p- 1). 64. 3^ rzędu N jest to nieskończony ciąg ułamków oddzielonych znakami *<’ lub *=’ i zawierający wszystkie nieujemne ułamki m /n dla m ^ 0 i n ^ N (zawierający także ułamki w postaci skracalnej). Definiuje się go rekurencyjnie zaczynając od Dla N ^ 1 , tworzymy ^Pn+i z CPn przez wstawienie bezpośrednio przed wyrazem kN ciągu dwóch symboli: k —1 N+ 1 jeśli kN jest nieparzyste; k —1 N + -j , ^N,kN jeśli kN jest parzyste. W poniższym zestawieniu T n j oznacza j-ty wyraz ciągu ? n , który może być albo ‘<* albo l— dla j parzystego i jest ułamkiem właściwym dla j nieparzystego. Na przykład m _ 0 _0^1^2_ 1^3^4_2 ^5^6_3^ 7^8_4 2 —2 <T)_ _ — 1 2 2 1 2 2 1 2 2 1 2 2 .9^T0_5^ 1 2 2 1 0 _ 0 _ 0 .1 .1 .2 . 2 _ 3 _ 1 .4 .3 .5 . 4 _ 6 _ 2 .7 .5 . 2 3 1 3 2 3 2 3 1 3 2 3 2 3 1 3 2 _ — 0 _ 0 _ 0 _ 0 </ l 2 4 3 1 4 . 2 _ 1 .2 . 3 ^ 2 _ 4 _ 3 _ 1 ^ 5 ^ - 4 . 6 _ 3 4 2 3 4 2 4 3 1 4 3 4 rn _ — 0_0_0_0_0 2 4 5 3 1 / 1 / 1 / 2 ^ 2_1/,> 5 4 3 5 4 2 5 rn _ — 0 _ 0 _ 0 _ 0 _ 0 _ 0 ^ 1 ^ 1 ^ 1 ^ 2 _ 1 ^ 2 ^ 2 _ 3 _ 1 ^ 3 ^ 4 _ 2 4 6 5 3 16 5 4 6 3 5 4 6 2 5 6 2 . 3^-4 . 2 _ 4 _ 3 4 5 2 4 ** ' (Elementy równe występują w cokolwiek dziwnym porządku.) Udowod nij, że znaki *<’ i ‘= ’ zdefiniowane przez podane wyżej reguły właściwie określają porządek między sąsiadującymi ułamkami w ciągu Peirce’a. Problem y badawcze 65. Czy wszystkie liczby Euklidesa en są bezkwadratowe? 6 6 . Czy wszystkie liczby Mersenne’a 2P — 1 są bezkwadratowe? 67. Czy prawdą jest, że maxi^j<ic^n aic/NW D(aj, a^) ^ n, dla wszystkich ciągów liczb całkowitych 0 < ai < • • • < an? 6 8 . Czy istnieje stała Q taka, że |_Q J Jes^ pierwsze dla wszystkich n ^ 0 ? 69. Oznaczmy przez Pn n-tą liczbę pierwszą. Czy prawdą jest, że Pn+i —Pn = 0 (logPn )2? 70. Czy dla nieskończenie wielu n £ 3 (11!) = £ 2 (n !)/ 2 ? 71. Czy prawdą jest, że jeśli k ^ 1, to istnieje n > 1 takie, że 2n = k (mod n). Czy jest nieskończenie wiele takich rt? 72. Czy prawdziwe jest stwierdzenie, że dla każdej liczby całkowitej a istnieje nieskończenie wiele liczb rt takich, że ( p ( n ) \ ( n + a)? 73. Gdyby <D(n) + 1 wyrazów ciągu Fareya = (yn(0),3'n(1),...,3'u(<!>(n))> było rozmieszczonych jednorodnie, to spodziewalibyśmy się, że S^nik) « k /® (n ). W związku z tym suma D (n) = l^nfk) — okre śla „odchylenie 5FU od jednorodności.” Czy prawdą jest, że D (n) = 0 (rt1//2+e) dla każdego e > 0 ? 74. Ile różnych wartości znajduje się w zbiorze {0! mod p, 1! mod p , . . . , (p — 1 )! mod p}, gdy p —t 0 0 ? Całe szczęście! Odpocznijmy. W poprzednim rozdziale zmagaliśmy się z sumami zawiera jącymi funkcje podłoga, sufit, mod, fi i mi. Teraz zajmiemy się współczyn nikami dwumianowymi, które okażą się (a) ważniejsze w zastosowaniach i (b) łatwiejsze w przekształcaniu od tych funkcji. 5.1. P odstaw ow e tożsam ości Zwane również: kombinacją bez powtórzeń z u elementów po k. Symbol (£) nazywamy współczynnikiem dwumianowym (albo symbolem Newtona), ze względu na ważne twierdzenie zwane wzorem dwumianowym. Twierdzenie to poznamy później. Symbol ten czytamy „n po k.” Ma on kombinatoryczną interpretację— jest to liczba sposobów, na które można wybrać k-elementów ze zbioru n-elementowego. Na przykład ze zbioru {1,2,3,4} mo żemy wybrać dwa elementy na sześć sposobów: {1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4}; stąd (2 ) = 6 . ^ Aby wyrazić liczbę (£) w sposób bardziej zrozumiały, zamiast liczyć liczbę podzbiorów ustalmy liczbę k elementowych podciągów wybranych z n elementowego zbioru. Dla podciągów ważny jest porządek, w jakim wy stępują elementy. Używamy takiej samej argumentacji, jakiej używaliśmy w rozdziale 4, by pokazać, że n! jest liczbą permutacji rt obiektów. Pierwszy element ciągu możemy wybrać na rt sposobów, drugi na tl —1 sposobów, itd. k-ty na n —k + 1 sposobów. To daje rt(rt —1 ) . . . ( n —k + 1 ) = rt- możliwych wyborów. Ponieważ każdy k-elementowy podzbiór można uporządkować na dokładnie k! różnych sposobów, to każdy podzbiór został policzony dokład nie k! razy. Stąd by otrzymać odpowiedź na nasze pytanie, wystarczy po prostu podzielić liczbę podciągów przez k!: fn \ W _ n ( n - 1 ) . . . ( n —k + 1 ) “ k(k-i)...(i) Na przykład, 1) = ± 1 = 2-1 6 - co zgadza się z naszym poprzednim wyliczeniem. Liczbę rt nazywamy górnym indeksem , a liczbę k dolnym indeksem. Ze względu na kombinatoryczną interpretację, indeksy są nieujemnymi licz bami całkowitymi, ponieważ zbiory nie mają ujemnej lub ułamkowej liczby elementów. Współczynniki dwumianowe mają jednak zbyt wiele zastosowań, dlatego usuniemy te ograniczenia. Najbardziej użyteczne będzie przyzwole nie na to, by górny indeks był dowolną liczbą rzeczywistą (lub zespoloną), a dolny był dowolną liczbą całkowitą. Nasza formalna definicja przybierze zatem następującą postać: ( T*fT*_ 11 fT _ V — I—1 1 k(k-D...(D 0 , -r»fc = id’ llc z b a c a łk 0 W lta k ^ 0; (5.1) .liczba całkowita k < 0 . Definicja ta ma kilka cech godnych naszej uwagi. Po pierwsze, górny in deks jest oznaczony symbolem r, nie rt. Ma to uwydatnić fakt, że współczyn niki dwumianowe mają sens dla dowolnej liczby rzeczywistej r pojawiającej się w tym miejscu. Na przykład, mamy (“^) = (—1)(—2)(—3)/(3 *2 *1) = —1. Nie potrafimy podać żadnej sensownej kombinatorycznej interpretacji tego współczynnika dwumianowego, ale r = —1 jest ważnym, szczególnym przy padkiem. Takim przypadkiem jest również r = —1/2. Po drugie, możemy traktować (£) jako wielomian stopnia k zmiennej r. Ten punkt widzenia będzie nam często pomocny. Po trzecie, nie zdefiniowaliśmy współczynnika dwumianowego dla dol nych indeksów innych niż liczby całkowite. Można to uczynić, ale obecne zastosowania są raczej rzadkie, stąd odłożymy to uogólnienie na później. Uwaga końcowa: po prawej stronie definicji wymieniliśmy ograniczenia ‘liczba całkowita k ^ 0 ’ i ‘liczba całkowita k < 0 ’. Aby zakres stosowania był jasny, takie ograniczenia pojawią się we wszystkich tożsamościach, którymi będziemy się zajmować. Ogólnie, im mniej ograniczeń, tym lepiej. Choć tożsa mości bez ograniczeń są najbardziej przydatne, to jednak każde ograniczenie pojawiające się w tożsamości jest jej ważną częścią. Kiedy przekształcamy współczynniki dwumianowe, łatwiej jest tymczasowo ignorować trudne do spamiętania ograniczenia i tylko później sprawdzić, czy nic nie popsuliśmy. Sprawdzić jednak trzeba. Niemal zawsze, na przykład, usłyszymy, że (£) równa się 1, więc my ślimy uspokojeni, że ta równość jest prawdziwa. Gdy jednak przyjrzymy się definicji ( 5 . 1 ), spostrzeżemy, że (£) równa się 1 tylko wtedy, gdy rt ^ 0 (za 5. W spółczynniki dwumianowe kładamy, że rt jest liczbą całkowitą). Gdy natomiast rt < 0, wówczas (£) = 0. Pułapki takie jak ta czynią życie pełnym przygód. Zanim dojdziemy do tożsamości, w których będziemy obłaskawiać współ czynniki dwumianowe, zerknijmy jeszcze na drobne wartości. Liczby w ta beli 182 tworzą początek trójkąta Pascala, nazwanego tak na cześć Blaise’a T abela 182. Trójkąt Pascala Współczynniki dwumianowe były dobrze znane w Azji na k iM stuleci narodzinami Pascala [90]. Pascala (1623-1662), który napisał o nich znakomitą rozprawę [286]. Puste miejsca w tabeli są równe 0, ponieważ licznik jest równy zeru. Na przykład, (2 ) = 0 • 0)/(2 -1) = 0. Miejsca te zostały zostawione puste, by uwydatnić resztę tabeli. Warto jest zapamiętać wzory na trzy pierwsze kolumny tabeli: (r\ = r We Włoszech trójkąt ten jest nazywany trójkątem Tartaglii. = (5 -2 ; gdzie r jest dowolną liczbą rzeczywistą. (Przypomnijmy, że (""J ) = ^n (n + 1) jest wyprowadzonym w rozdziale 1 wzorem na liczby trójkątne. Liczby trój kątne znajdziemy w kolumnie (™) tabeli 182.) Dobrym pomysłem jest zapa miętanie pierwszych pięciu rzędów trójkąta Pascala. Jeśli w jakimś zadaniu zobaczymy ciąg 1, 4, 6 , 4, 1, będzie to niechybny znak, że prawdopodobnie gdzieś w pobliżu przyczaiły się współczynniki dwumianowe. Liczby w trójkącie Pascala, prawdę mpwiąc, spełniają nieskończenie wiele równości. Nie bądźmy więc zdziwieni, gdy po bliższym się im przyj rzeniu znajdziemy zadziwiające wzory. Rozważmy na przykład ciekawą „wła sność sześciokąta,” spełnianą przez sześć liczb 56, 28, 36,120, 210,126 otacza jących 84 w lewej dolnej części tabeli 182. Mnożąc na dwa sposoby co drugą liczbę z tego sześciokąta otrzymamy zawsze ten sam iloczyn: 56-36-210 = 28-120-126 = 423360. Tę samą własność ma dowolny inny sześciokąt z trój kąta Pascala. Czas na tożsamości. Naszym celem jest nauczenie się kilku prostych reguł, za pomocą których rozwiążemy ogromną większość praktycznych za dań, w których pojawiają się współczynniki dwumianowe. Gdy górny indeks r jest liczbą całkowitą n, nie mniejszą od dolnego in deksu k, wówczas możemy przedstawić współczynnik dwumianowy w postaci: T l\ Tl! k) k! (n —k)! całkowite n ^ k ^ 0 . ( 5 .3 ) Aby otrzymać ten wzór, wystarczy przemnożyć licznik i mianownik w de finicji ( 5 . 1 ) przez (n — k)!. Czasami dobrze jest przedstawić współczynnik dwumianowy za pomocą silni (na przykład przy dowodzie własności sześcio kąta). Często postępujemy odwrotnie, zamieniając silnie na współczynniki dwumianowe. Reprezentacja za pomocą silni pokazuje, że trójkąt Pascala jest syme tryczny. Każdy wiersz czytany z lewa na prawo lub z prawa na lewo wy gląda tak samo. Równość odzwierciedlającą ten fakt — nazywaną regułą sy m e tr ii— wyprowadzamy przez zamianę k n a n - k : /n \ lk / _ / n \ Vn —k / ’ całkowite n ^ 0 , , całkowite k.^ Wzór ten ma sens kombinatoryczny, gdyż wyróżniając k przedmiotów ze zbioru u elementowego, wybieramy albo k wyróżnionych przedmiotów, albo j n —k nie wyróżnionych przedmiotów. Oczywiste jest ograniczenie we wzorze ( 5 .4 ) mówiące, że n i k są liczbami całkowitymi, ponieważ dolny indeks musi być liczbą całkowitą. Ale dlaczego n nie może być liczbą ujemną? Załóżmy, na przykład, że n = —1. Czy zachodzi równość: Nie. Gdy, na przykład, k = 0, otrzymamy po lewej stronie 1, a po prawej 0. Faktycznie, dla dowolnej liczby całkowitej k ^ 0 lewa strona równa się (_ ,) _ K ą a . ale ponieważ dolny indeks jest ujemny, więc prawa strona zawsze równa się 0 . „ C’est une chose estrange combien il est fertile en proprietez.” B. Pascal [286] Dla ujemnych k lewa strona równa się 0, a prawa - . " - 0 Byle nie wpaść na egzaminie! - czyli albo 1, albo —1. Zatem równanie = (jj"lk) ’ jest zawsze fałszywe! Reguła symetrii zawodzi również dla pozostałych liczb ujemnych n. Na nieszczęście bardzo łatwo się zapomina o tym ograniczeniu, zwłaszcza gdy wyrażenie w górnym indeksie jest funkcją, która tylko czasami przybiera ujemne wartości dla nieznanych (ale poprawnych) argumentów. Każdy, kto wielokrotnie przekształcał współczynniki dwumianowe, wpadł w tę pułapkę co najmniej trzy razy. Reguła symetrii ma jedną, rehabilitującą ją cechę. Jest ona prawdziwa dla wszystkich wartości k, nawet wtedy gdy k < 0 lub k > n (ponieważ obie strony równości są wówczas równe zeru). W przeciwnym razie 0 ^ k ^ n i symetria zachodzi bezpośrednio ze wzoru ( 5 .3 ): n\ _ rt! _ k £!(ti —k)t J rt! ( u - ( u - k ) ) ! (n —k)! / n \ \n -k y Następna ważna tożsamość pozwala przesuwać liczby ze współczynnika dwumianowego i do niego: (5-5) D - » Ograniczenie na k zapobiega dzieleniu przez 0. Tożsamość ( 5 .5 ) nazywamy regułą pochłaniania, ponieważ często używamy jej do wchłonięcia zmiennej pozostawionej na zewnątrz współczynnika dwumianowego. Równanie wynika z definicji ( 5 . 1 ), gdyż r - = r(r — 1 oraz k! = k(k — 1)! dla k > 0. Obie strony zerują się, gdy k < 0 . Jeśli przemnożymy obie strony równości ( 5 .5 ) przez k, to otrzymamy regułę pochłaniania, prawdziwą nawet wówczas, gdy k = 0 : k(k ) = T( k - l ) ’ całkowitek- (5-6) Równość ta ma partnera zachowującego dolny indeks: (r - k) f M = r ( T k 1 ) > całkowite k. ( 5 .7 ) ,? odstawowe tożsamości Równość ( 5 .7 ) możemy wyprowadzić wstawiając wzór ( 5 .6 ) pomiędzy dwie reguły symetrii: ( r - O = (r-lc) = r = r r —1 r -k -1 ( V ) (symetria) (wzór ( 5 .6 )) (sym etria). Chwileczkę! Twierdziliśmy, że tożsamość ta jest prawdziwa dla w szyst kich liczb rzeczywistych r, a dowód, który przed chwilą przeprowadziliśmy, jest prawdziwy tylko wtedy, gdy r jest dodatnią liczbą całkowitą. (Górny indeks r — 1 musi być nieujemną liczbą całkowitą, jeśli chcemy bezkarnie zastosować regułę symetrii ( 5 .4 ).) Oszukiwaliśmy? Nie! Co prawda, wypro wadzenie to jest prawdziwe tylko dla dodatnich liczb całkowitych r, ale mo żemy twierdzić, że równość zachodzi dla wszystkich wartości r, ponieważ obie strony równania ( 5 .7 ) są wielomianami zmiennej r stopnia k + 1 . Niezerowy wielomian stopnia co najwyżej d może mieć co najwyżej d miejsc zerowych. Stąd różnica dwóch wielomianów stopnia co najwyżej d, jeśli nie jest tożsamościowo równa zeru, nie może być zerowa w więcej niż d punktach. Innymi słowy, jeśli dwa wielomiany co najwyżej stopnia d równają się w więcej niż d punktach, to są sobie równe we wszystkich punktach. Pokazaliśmy, że dla dowolnej dodatniej liczby całkowitej r zachodzi (r — k)(£) = t ^ 1). Stąd oba wielomiany równają się sobie w nieskończenie wielu punktach, czyli są identyczne. Technika dowodzenia z poprzedniego akapitu, którą nazywamy argumen tem w ielom ianow ym , jest użyteczna przy rozszerzaniu wielu tożsamości z liczb całkowitych na liczby rzeczywiste. Będziemy z niej korzystać wiele razy. Niektóre równości, takie jak reguła symetrii ( 5 .4 ), nie są równościami pomię dzy wielomianami, stąd nie zawsze tę metodę można zastosować. Na szczęście wiele równości ma odpowiednią postać. Inną wielomianową równością, być może najważniejszą z tożsamości dwu mianowych, jest ta, która jest znana pod nazwą reguły dodawania: ) - ( V ) + r —1 k —1 całkowite k. (5-8) Gdy r jest dodatnią liczbą całkowitą, reguła dodawania mówi nam, że każda liczba z trójkąta Pascala jest sumą dwóch liczb z poprzedniego wiersza. Pierw sza z nich znajduje się bezpośrednio nad naszą liczbą, druga po lewej stronie pierwszej. Reguła pozostaje prawdziwa również wówczas, gdy r jest liczbą (No, może. Ale akurat nie tutaj.) ujemną, rzeczywistą lub zespoloną. Jedynym ograniczeniem jest to, że k musi być liczbą całkowitą, gdyż tak jest zdefiniowany współczynnik dwumianowy. Jeśli założymy, że r jest dodatnią liczbą całkowitą, to regułę tę mo żemy udowodnić za pomocą interpretacji kombinatorycznej. Przypomnijmy, że (£) jest liczbą możliwych wyborów k-elementowych podzbiorów zbioru r-elementowego. Jeśli mamy zbiór r jajek zawierający jedno zepsute jajko, to na (£) sposobów możemy wybrać k jajek. Dokładnie (rk1) razy wybie rzemy tylko dobre jajka, a (kZi) razy wśród wybranych jaj będzie jedno zepsute, ponieważ tak naprawdę wybieramy k — 1 z r — 1 dobrych jaj. Do dając te dwie liczby do siebie otrzymamy równość ( 5 .8 ). W wyprowadzeniu tym założyliśmy, że k ^ 0 i r jest dodatnią liczbą całkowitą. Dla k < 0 obie strony równości są równe zeru. Argument wielomianowy załatwia nam resztę przypadków. Równość ( 5 .8 ) możemy także udowodnić dodając do siebie tożsamości (5-7) i (5-6): Lewa strona równa się t (£), stąd obie strony możemy podzielić przez r. Do wód jest prawdziwy dla wszystkich r, z wyjątkiem łatwego do sprawdzenia przypadku r = 0 . Ci, którzy nie zamierzają znajdować tak zręcznych dowodów, i nie zamie rzają się przemęczać, będą woleli wyprowadzenie wzoru ( 5 .8 ) bezpośrednio z definicji. Jeśli k > 0, to (V )C ) = (r —1)— ( r - l ) Ł n l k! + ( k — 1)1 (r —1)— - (r —k) (r —1 ki + ki (t-I)Ł z It _ _ ki ki" “ \k Lk (r Przypadek k ^ 0 i tym razem nie sprawia kłopotu. Zobaczyliśmy trzy różne dowody reguły dodawania. Nie ma w tym nic dziwnego. Współczynniki dwumianowe mają wiele użytecznych właściwości, z których kilka zmusza nas do dowodzenia tożsamości od ręki. Reguła dodawania jest w istocie rekurencją liczb z trójkąta Pascala, stąd będzie ona szczególnie użyteczna w indukcyjnych dowodach innych tożsa mości. Jedną z nich otrzymamy natychmiast przez rozwinięcie tej rekurencji. Ponieważ (J-,) = 0, to składnik ten znika i możemy się zatrzymać. Ta metoda daje ogólny wzór Zauważmy, że nie potrzebujemy ograniczać liczby k z dołu, gdyż dla k < 0 wszystkie wyrazy sumy są równe zeru. Wzór ten wyraża współczynnik dwumianowy jako sumę współczynni ków dwumianowych, których górne i dolne indeksy pozostają w tej samej odległości. Otrzymaliśmy go poprzez wielokrotne rozpisanie współczynnika dwumianowego o najmniejszym dolnym indeksie: najpierw (|) , potem ( 2 ), (^) i na końcu (^). Co się stanie, gdy będziemy postępować inaczej, wielokrot nie rozbijając współczynnik dwumianowy o największym dolnym indeksie? Otrzymamy Teraz (3 ) jest zerem (jak również (2 ) i (2 ), ale obecność obu współczynników pozwoli nam zgrabniej zapisać tożsamość): L V 7 O^k^TL - (m) \ / + (m \ / )+ '" + (m \ . m 1J > całkowite m, n ^ 0 . (5 . 1 0 ) Tożsamość ta, którą nazwiemy sum ow aniem po górnym indeksie, określa współczynnik dwumianowy jako sumę współczynników o stałym dolnym in deksie. Tym razem musimy zachować ograniczenie k ^ 0, gdyż składniki sumy dla k < 0 nie są równe zeru. Także m i n nie mogą być ujemne. Tożsamość ( 5 . 1 0 ) ma interesującą interpretację kombinatoryczną. Jeśli chcemy ze zbioru n + 1 biletów numerowanych od 0 do n wybrać m + 1 biletów, to na (^ ) sposobów wybierzemy tak, by biletem o największym numerze był bilet k. Oba wzory ( 5 .9 ) i ( 5 . 1 0 ) możemy udowodnić przez indukcję na podsta wie reguły dodawania. Możemy je też wyprowadzić jeden z drugiego. Do wiedźmy na przykład ( 5 .9 ) z ( 5 . 1 0 ). Nasz dowód zilustruje pewne, zwy kłe przekształcenia współczynników dwumianowych. Będziemy chcieli prze kształcić lewą stronę C kk) wzoru ( 5 -9 ) tak, by wyglądała jak lewa strona Y_ (^ ) wzoru ( 5 . 1 0 ). Wtedy zastosujemy ten wzór, zastępując sumę poje dynczym współczynnikiem dwumianowym, by ostatecznie przekształcić ten współczynnik w prawą stronę wzoru ( 5 .9 ). Załóżmy dla wygody, że r i n są nieujemnymi liczbami całkowitymi. Ogólny przypadek ( 5 .9 ) wynika z argumentu wielomianowego. Piszmy m za miast r, gdyż zmienna ta bardziej kojarzy się z liczbą całkowitą. Wykonujemy teraz systematycznie nasz plan: ^— f m + k \ k^n y —m^k^n 7 (m + k k T- ( T ) —m^k^n L 0 ^k<m+n _ - / m + n + 1\ V m +i ; _ ” / m + n + 1\ V n ; Przyjrzyjmy się temu wyprowadzeniu krok po kroku. Kluczowym miejscem jest drugi wiersz, w którym zastosowaliśmy regułę symetrii ( 5 .4 ) zastępując (m+k) przez ( ^ k ) . Wolno nam to zrobić tylko wtedy, gdy m + k ^ 0. Z tego 5.1. P od staw ow e tożsam ości ,w-. powodu w pierwszym kroku ograniczyliśmy zakres k, odrzucając wszystkie wyrazy, dla których k < —m. (Możemy to zrobić, gdyż te wyrazy są równe zeru.) Teraz prawie jesteśmy gotowi zastosować wzór (5 .10 ). Umożliwia to trzeci wiersz, w którym podstawiliśmy k —m w miejsce k i doprowadziliśmy do porządku zakres sumowania. Ten krok, podobnie jak pierwszy, wykorzy stuje tylko notację Teraz k pojawia się tylko w górnym indeksie, a przy tym zakres sumowania jest we właściwej postaci, stąd w czwartym wierszu możemy zastosować równanie (5 .10 ). Praca zostanie zakończona, gdy jeszcze raz skorzystamy z reguły symetrii. Pewne sumy z rozdziałów 1 i 2 są szczególnymi przypadkami równania (5 ;io). Na przykład, dla m = 1 otrzymujemy sumę kolejnych nieujemnych liczb całkowitych nie większych od n: = 0 + 1 + ---+TI = + ••• + + ( n + 1)n n+ 1 2 Wzór ogólny jest równoważny równości z rozdziału drugiego (y, _|_ 1 )m+1 y~ k— = ----———|— , m +1 ’ O^k^n całkowite m, n ^ 0 , jeśli podzielimy obie strony przez m!. Faktycznie, gdy zastąpimy r i k odpo wiednio przez x + 1 i m, to z reguły dodawania (5 .8 ) mamy x+ 1 x m rrt — m Metody z rozdziału drugiego dają nam zatem poręczny wzór na sumę nie oznaczoną Z óx = x m +1 C. Współczynniki dwumianowe wzięły swą nazwę od wzoru dwumiano wego, który dotyczy potęg wyrażenia x + y. Przyjrzymy się początkowym przypadkom tego wzoru: (x + y)° = 1x°y° (x + y ) 1 = 1x V (x + y )2 = 1x 2y° + 2 x’y 1 + 1x°y 2 + 1x V (x + y )3 = 1x3y ° + 3 x V + 3 x V + 1x°y3 (x + y )4 = 1x4y ° + 4 x 3y 1 + 6x2y 2 + 4x'y 3 + 1x°y4 • „W wieku 21 lat napisał on [Moriarty] traktat o wzorze dwumianowym. Dzięki temu objął katedrę matematyki na jednym z mniejszych naszych uniwersytetów.” S. Holmes [85] Nietrudno jest zauważyć, dlaczego te współczynniki są takie same jak w trój kącie Pascala. Jeśli rozwiniemy iloczyn rt czynników (x + y )n = (x + y ) ( x + y ) . . . ( x + y ) , to każdy ze składników jest iloczynem rt czynników, z których każdy jest równy albo x, albo y. Liczba takich składników, w których x występuje k razy, a y występuje n —k razy, jest współczynnikiem przy xkt(TL_k. Jest ona równa dokładnie liczbie wyborów k z rt czynników, w których znajduje się x, tzn. jest równa (£). Niektóre podręczniki pozostawiają wartość 0° nie zdefiniowaną, ponieważ gdy x maleje do 0 , funkcje x° i 0 X mają różne granice, Jest to błąd. Jeśli wzór dwumianowy ma być prawdziwy dla x = 0, y = 0 oraz dla x = —y , to musimy zdefiniować x° = 1 , dla wszystkich x. Wzór ten jest zbyt ważny, by jakkolwiek go ograniczać! Dla kontrastu, funkcja 0X jest całkiem nieistotna. (Zobacz [220] dalsze informacje.) Jak dokładnie wygląda wzór dwumianowy? Jest to następująca tożsa mość: /■ % r vv _ i, (« + v )’ = z y « v - k , całkowite r > 0 lu b lx /u l< ^ , fa .= ) Sumujemy po wszystkich liczbach całkowitych k, ale tak naprawdę, gdy r jest nieujemną liczbą całkowitą, to jest to suma skończona. Wszystkie wyrazy są równe zeru z wyjątkiem tych, dla których 0 ^ k ^ r. Z drugiej strony, wzór jest prawdziwy, gdy r albo jest ujemne, albo jest liczbą rzeczywistą lub nawet zespoloną. W tym przypadku suma jest nieskończona i by szereg był bezwzględnie zbieżny, musi zachodzić warunek \x/y \ < 1 . Dwa szczególne przypadki wzoru dwumianowego są warte naszej uwagi, nawet jeśli są one niezwykle proste. Jeśli x = y = 1 i r = rt jest liczbą nieujemną, to 2U = H-------b , całkowite n ^ 0 . Z tej równości wynika, że sumą elementów n-tego wiersza trójkąta Pascala jest 2n . Jeśli w miejsce x podstawimy —1 zamiast +1, otrzymamy 0n - H-------b ( — 1 )n , całkowite n ^ 0 . 5.1. P od staw ow e to żsa m o ści | T abela 191. Trójkąt Pascala, skierowany w górę f--3 r .- 2 Ą 4U;. l- 1 -1 * 1 1 ; -4 -3 «f ,*■ ^ 10 - 2 0 ' . 35 "-56 t 84 -1 2 0 6 --10 15 - 2 1 28 - 3 6 3 -4 5 -6 7 -8 -2 1 0 -1 0 0 -1 0 1 0 -1 0 1 0 -1 0 ^ ,I 165 -2 2 0 '* 286 45 9 1 0 -55 -10 -1 0 66 11 1 0 Mi Na przykład, 1 —4 + 6 —4 + 1 = 0. Sumą elementów każdego wiersza, gdy kolejne elementy mają przeciwne znaki, jest zero, z wyjątkiem pierwszego wiersza (gdy rt = 0 i 0 ° = 1 ). Często używamy wzoru dwumianowego w szczególnym przypadku y = 1, jeśli r nie jest nieujemną liczbą całkowitą. Przyjrzyjmy się temu przypadkowi. Napiszmy z zamiast x, by podkreślić fakt, że poniższa równość jest spełniona przez dowolną liczbę zespoloną: (1 + Z ) r = ę ( £ ) z \ M < 1• ( 5 - 13 ) Wzór ( 5 . 1 2 ) wynika z powyższego, jeśli podstawimy z = x / y i przemnożymy obie strony przez y r . Wzór dwumianowy udowodniliśmy posługując się interpretacją kombinatoryczną tylko dla przypadków, w których r jest nieujemną liczbą całkowitą. Nie możemy uzasadnić ogólnego przypadku posługując się argumentem wie lomianowym, gdyż wtedy pojawia się suma nieskończona. Dla ustalonego r możemy użyć szeregu Taylora i teorii funkcji zespolonych: kÔ k! Łatwo wyliczymy pochodne funkcji f(z) = (1 + z)r. Wynoszą one f ^ ( z ) = r—(1 + z ) r_k. Po podstawieniu z = 0 otrzymamy ( 5 . 1 3 ). Musimy również udowodnić zbieżność sumy nieskończonej dla |z| < 1 . Jest to prawdą, ponieważ z równania ( 5 .8 3 ) wynika, że (£) = 0 ( k - 1 - r ). Przyjrzyjmy się teraz dokładniej wartościom (£), gdy n jest ujemną liczbą całkowitą. Wyliczając te wartości możemy skorzystać z reguły do dawania ( 5 .8 ). Wypełnimy w ten sposób miejsca, które leżą powyżej liczb (Znaczenie symbolu O jest omówione w rozdziale 9.) 192 |S . W spółczynniki dwum ianowe w tabeli 182 i otrzymamy tabelę 191. Na przykład, ( g ) = 1, ponieważ O = Co') + t t ) i C l) = P“ ż (?) = + Co1). (-,’) = -1 itd. Wszystkie te liczby są nam znajome. Rzeczywiście, wiersze i kolumny tabeli 191 pojawiają się jako przekątne tabeli 182 (z wyjątkiem znaku mi nus). Stąd musi istnieć związek pomiędzy wartościami (£) dla ujemnych u z wartościami dla dodatnich rt. Ogólny wzór = ( - 1 )k ( k * całkowite k (5 .1 4 ) jest łatwy do udowodnienia, ponieważ gdy k ^ 0 , rŁ = r(r — 1 ) . . . ( r —k + 1 ) = (Nadszedł właściwy czas na czwarte ćwiczenie rozgrzewkowe.) ( — 1 )k(—r )(1 —r ) . . . (k — 1 —r) ( - 1 )k(k - r- 1 )Ł, oraz obie strony równają się zeru, gdy k < 0 . Tożsamość ( 5 . 1 4 ) jest szczególnie wartościowa, gdyż zachodzi bez żad nych ograniczeń. (Oczywiście, poza tym, że dolny indeks musi być, zgodnie z definicją współczynnika dwumianowego, liczbą całkowitą.) Przekształce nie we wzorze ( 5 . 1 4 ) jest zwane negowaniem górnego indeksu lub „górną negacją.” Jak możemy zapamiętać ten ważny wzór? Inne reguły, które już spo tkaliśmy— symetrii, pochłaniania, dodawania itd. — są proste. Ta wygląda nieciekawie. Mimo to nie jest tak źle. By zanegować górny indeks, napiszmy najpierw (—1)k, gdzie k jest dolnym indeksem. (Dolny indeks się nie zmie nia.) Następnie natychmiast zapiszmy k, dwa razy, raz na górze, raz na dole. Teraz zanegujmy początkowy górny indeks przez odjęcie go od nowego gór nego indeksu. Pracę zakończymy odejmując jeszcze 1 (zawsze odejmowanie, nie dodawanie, przecież negujemy górny indeks). Zanegujmy górny indeks dwa razy z rzędu, dla praktyki. Otrzymamy = H )1 = f - i i2 k Szkoda tyłko, że w ten sposób nigdzie nie dotrzemy. = k -r -1 k k — (k —r — 1 ) — 1 k czyli wróciliśmy do punktu wyjściowego. Prawdopodobnie nie o to chodziło twórcom tej reguły, ale dobrze jest wiedzieć, że nie pobłądziliśmy. Inne zastosowania równości ( 5 . 1 4 ) są, oczywiście, bardziej pożyteczne od tego. Możemy na przykład zastosować górną negację do przemieszczania war tości pomiędzy górnym, a dolnym indeksem. Tożsamość ta ma symetryczną postać ^ ^ 1), całkowite m ,n ^ 0, (5.15) i zachodzi, gdyż obie strony są równe' (m+m n ) Górna negacja może być użyta do wyprowadzenie następującej sumy: = (—1 )m ^T całkowite m. ( 5 -1®) Wystarczy zanegować górny indeks, zastosować ( 5 .9 ) i wynik ponownie za negować: Ł © ( - » “ - k<Cm L (v k^rn v 7 k-r-1 k -er) Równość ta daje wzór na sumę częściową r-tego wiersza trójkąta Pascala, przy założeniu, że kolejne liczby w wierszu mają przeciwne znaki. Jeśli na przykład r = 5 i m = 2, to otrzymamy 1 —5 + 10 = 6 = (—'1) 2 (^). Zauważmy, że jeśli m ^ r, to wzór ( 5 . 1 6 ) daje nam naprzemienną sumę całego wiersza. Suma ta jest równa zeru, gdy r jest dodatnią liczbą całkowitą. Udowodniliśmy już to, gdy rozwijaliśmy (1 — l ) r za pomocą wzoru dwumia nowego. Dobrze jest wiedzieć, że sumy częściowe tego wyrażenia też mogą być przedstawione w postaci zwartej. Co możemy powiedzieć o prostszych sumach częściowych: £ 0 Wydaje się, że jeśli potrafimy wyliczyć odpowiednie naprzemienne sumy, to będziemy w stanie policzyć i te. Niestety, nie. Nie ma zwartej postaci na częściową sumę liczb z wiersza w trójkącie Pascala. Możemy sumować kolumny— korzystając ze wzoru ( 5 . 1 0 ) — ale nie wiersze. Niezwykłe jest to, że istnieje sposób policzenia częściowej sumy elementów wiersza, jeżeli są one (Tu podwójna negacja nie sprowadzi nas do punktu wyjścia, gdyż między pierwszym a drugim negowaniem wykonaliśmy inną operację.) 5. Współczynniki dwumianowe 194 przemnożone przez ich odległość od środka: = Y m+ 1/ całkowite m. TTl+ 1 k^m ' ' (Cóż, prawa całka jest równa 5 V^tO + erf a), stała plus „funkcja błędu” ot. Wyrażenie to można by uważać za postać zwartą.) r T -V (5 1 8 ) (Wzór ten jest prosty do sprawdzenia przez indukcję względem m.) Związek pomiędzy tymi sumami częściowymi z czynnikiem i bez czynnika (r/2 — k) jest podobny do związku pomiędzy całkami f xe *2dx = —\ e 0(2 J—OO i f e x2dx. J—OO Pozornie bardziej skomplikowana całka po lewej z czynnikiem x ma zwartą postać, podczas gdy prościej wyglądająca całka bez tego czynnika nie ma. Wygląd może zmylić. Prawie pod koniec tego rozdziału poznamy metodę, która pozwoli nam ustalić, czy istnieje postać zwarta dowolnej sumy częścio wej zawierającej współczynniki dwumianowe. Metoda ta umożliwia odkrycie takich tożsamości jak (5.16) i (5.18), jak również powie nam, że (5.17) jest przypadkiem beznadziejnym. Częściowe sumy szeregów dwumianowych prowadzą do zadziwiających związków innego rodzaju: k, , m —k z (T )k<m ( - x ) k(x + y) m —k = Z k<m całkowite m. ( 5 -1 9 ) Tożsamości tej nietrudno jest dowieść przez indukcję. Obie strony są równe zeru, gdy m < 0 i równe 1, gdy m = 0. Niech Sm oznacza sumę z lewej strony. Po zastosowaniu reguły dodawania (5.8) otrzymamy s m = y_ m — 1 + r x ky m-k k^m + z ('m k r— \ 1+ T ' ) * v a- k k<m a dla m > 0 -1 V +r k^m Zatem Sm — (x + y )Sm_i + —r (-X ) 1 m TTl +r Rekurencją jest spełniona także przez prawą stronę równania ( 5 . 1 9 ). Na mocy założenia indukcyjnego obie strony muszą się sobie równać. QED. Istnieje zgrabniejszy dowód. Gdy r jest liczbą całkowitą z zakresu 0 ^ r ^ —m, wówczas ze wzoru dwumianowego wiemy, że obie strony ( 5 . 1 9 ) są równe (x + 'y)m+r'y- r . Ponieważ są one wielomianami zmiennej r stopnia co najwyżej m, więc ich równość w m + 1 miejscach gwarantuje (ledwo, ledwo!) równość dla wszystkich r. Przykro jest mieć tożsamość, w której jedna suma równa się drugiej, a żadna ze stron nie jest w postaci zwartej. Czasami jednak jedna ze stron oka zuje się łatwiejsza w przekształcaniu od drugiej. Jeśli przyjmiemy na przy kład x = — 1 i y = 1 , to otrzymamy alternatywną postać wzoru ( 5 . 1 6 ) Y ( m ^ T^j ( — 1 )k = f , k^m ^ ' Vm / całkowite rrO 0 . Jeżeli przyjmiemy x = y = ) i r = m + 1, to ‘ z p t 1) = £ Lewa strona jest sumą połowy współczynników dwumianowych o górnym indeksie 2 m + 1 , która jest równa sumie swych odpowiedników z drugiej połówki trójkąta Pascala. Wynika to z symetrii tego trójkąta. Zatem jest ona równa j 2 Zrn+1 = 22m. To daje całkiem nieoczekiwany wzór Y ( X k<Cm ' ky = ’ całkowite m ^ 0 . ( 5 *2 0 ) ' Sprawdźmy dla m = 2: (2) + j (^) + ^ (*) = 1 + \ + f = 4. Zdumiewające! Do tej pory zajmowaliśmy się albo samymi współczynnikami dwumia nowymi, albo sumami, w których na każdy wyraz przypadał tylko jeden współczynnik dwumianowy. W wielu ambitnych zadaniach napotkamy ilo czyny dwóch lub więcej współczynników dwumianowych, zatem przez resztę tego podrozdziału zajmiemy takimi właśnie sumami. Oto wygodna reguła często pomagająca w upraszczaniu iloczynu dwóch współczynników dwumianowych: J \k J = ( A ( T~ k \ k j \ m -k całkowite m, k. ( 5 -21) Dla k = 1 otrzymamy znaną nam regułę pochłaniania ( 5 .6 ). Chociaż obie strony równości ( 5 .2 1 ) są iloczynami współczynników dwumianowych, jedna ze stron może być łatwiejsza do sumowania z powodu swego wpływu na po zostałą część wyliczanego wyrażenia. Na przykład po lewej zmienna m wy- (Bardzo przyjemny kombinatoryczny dowód można znaleźć w [247].) stępuje dwa razy, po prawej tylko raz. Dlatego zazwyczaj podczas sumowania po m zastąpimy ( J (™) przez (£) ( £ 1 ^). Równanie ( 5 .2 1 ) zachodzi głównie dlatego, że znoszą się czynniki m!, gdy rozpiszemy i (™) za pomocą silni: r! m! m! (r —m)! k! (m —k)! r! k! ( m - k ) l ( r - m ) ! r! (r —k)! k! (r —k ) ! (m —k ) ! (r — m ) ! W porządku. gdzie wszystkie zmienne są nieujemnymi liczbami całkowitymi i r ^ m ^ k ^ 0. To było łatwe. Co więcej, jeśli m < k lub k < 0, to obie strony równości ( 5 .2 1 ) są równe zeru, zatem równość zachodzi dla wszystkich liczb całkowitych m i k . Resztę załatwia argument wielomianowy. Współczynnik dwumianowy (£) = r!/(r —k)! k! po odpowiedniej zmianie nazw zmiennych można zapisać w postaci (a + b)!/a! b!. Podobnie wyrażenie ze środka powyższego wyprowadzenia r!/k! (m —k}! (r—m)!, możemy zapisać w postaci (a + b + c)!/a! b! c!. Ten „współczynnik trójmianowy” pojawia się w „trójmianowym wzorze”: {x + y + z ) n = „ Excogitavi autem olim mirabiłem regulam pro numeris coefficientibus potestatum, non tantum a binomio x + y , sed et a trinomio x + y + z, imo a polynomio quocunque, ut data potentia gradus cujuscunque v. gr. decimi, et potentia in ejus valore comprehensa, ut x 5y 3 z2 , possim statim assignare numerum coefficientem, quem habere debet, sine ulla Tabula jam calculata.” G. W. Leibniz [245] r-k m - k , 1’ Y_ 0 â,b,c^n (a + b + c)! a!b! c! V b (a+ b+ c ^ a + b + c —n y- V b+ c 0 â,t>,c^n x ay b Zc a+b+c=n Stąd, tak naprawdę, (^ ) (^ ) jest ukrytym współczynnikiem trójmianowym. Trójmianowe współczynniki pojawiają się czasami w zastosowaniach, dlatego dla podkreślenia symetrii wygodnie jest je zapisać w postaci a+ b+ c a, b, c (a + b + c)! a! b! c! Dwumianowe i trójmianowe współczynniki można uogólnić do m ultim ianowych współczynników, które zawsze można wyrazić jako iloczyn współ czynników dwumianowych: (ai + a 2 + -----h a m)! a ! ! a 2! .. . a m ! ai + a2 + • • • + am - ( a2 -1------ 1- am a") T ab ela 197. Sumy iloczynów współczynników dwumianowych. Dlatego, gdy napotykamy taką bestię, możemy ją poskromić naszymi stan dardowymi metodami. Przyjrzyjmy się teraz tabeli 197, w której wymieniono najważniejsze ze znanych standardowych tożsamości. Na nich właśnie będziemy polegać pod czas naszych zmagań z sumami zawierającymi iloczyny dwóch współczynni ków dwumianowych. Każda z tych równości jest sumą względem k, z jednym wystąpieniem k w każdym współczynniku dwumianowym. W każdym z in deksów znajdziemy po jednej zmiennej m, n, r, itd. Mnogość wzorów wynika z tego, że k pojawia się raz w górnym, a raz w dolnym indeksie ze znakiem plus lub minus. Czasami pojawia się dodatkowy czynnik (—1)k, bez którego nie dałoby się przedstawić sumy w postaci zwartej. Tabela 197 jest zbyt skomplikowana, by spamiętać ją w całości. Będzie nam służyć tylko jako ściągawka. Jednak pierwsza z równości w tej tabeli, która jest najłatwiejsza do zapamiętania, powinna być zapamiętana. Dowia dujemy się z niej, że suma (względem wszystkich liczb całkowitych k) iloczy nów dwóch współczynników dwumianowych, których górne indeksy są stałe, a dolne mają stałą sumę, jest współczynnikiem dwumianowym uzyskanym przez zsumowanie obu dolnych i górnych indeksów. Tożsamość ta jest znana jako tożsam ość C auchy’ego lub splot Vandermonde’a, ponieważ Alexandre Vandermonde napisał o niej ważną pracę pod koniec osiemnastego wieku [358]. Jednakże równość ta była znana w Chinach przez Chu Shih-Chieh już w roku 1303. Wszystkie inne równości z tabeli 197 otrzymamy z tożsamo ści Cauchy’ego, jeśli zastosujemy ostrożnie negowanie górnego indeksu, regułę symetrii itd. Dlatego tożsamość Cauchy’ego jest najbardziej podstawową toż samością z nich wszystkich. Zagnij róg tej strony. Później będziesz ją mógł szybko odnaleźć. Będziesz tego potrzebował! Udowodnimy tożsamość Cauchy’ego podając jej zgrabną interpretację kombinatoryczną. Zastąpmy k przez k — m i n przez rt —m lub załóżmy, że m = 0, co na jedno wychodzi. Wystarczy zatem udowodnić równość zk.fNki// )Vrt \/ w V\r:Ti s). —k / \L Kobiety mają pierwszeństwo, proszę panów. (b->7) Niech r i n będą nieujemnymi liczbami całkowitymi. Ogólny przypadek wy nika z zastosowania argumentu wielomianowego. Po prawej stronie (T^s) jest liczbą sposobów wybrania n osób spośród r mężczyzn i s kobiet. Po lewej, każdy ze składników sumy jest liczbą sposobów wyboru k mężczyzn i n —k ko biet. Sumując względem wszystkich k zliczamy każdą możliwość dokładnie raz. Najczęściej używamy tych równości w celu przekształcenia lewej strony w prawą, gdyż taki jest kierunek upraszczania. Od czasu do czasu opłaca się pójść w odwrotnym kierunku, tymczasowo komplikując sumę. Skutkuje to w sytuacjach, gdy zmiana porządku sumowania pozwoli na uproszczenie sumy. Zanim pójdziemy dalej, dowiedźmy kolejne dwie tożsamości z tabeli 197. Łatwo jest udowodnić równość (5.23). Wystarczy zastąpić pierwszy współ czynnik dwumianowy przez (x_ i następnie skorzystać z tożsamości Cauchy’ego (5.22). Następna równość (5.24) jest troszkę trudniejsza. Możemy albo ją zredu kować kilkoma przekształceniami do tożsamości Cauchy’ego, albo udowodnić za pomocą starej i pewnej metody, jaką jest indukcja matematyczna. Indukcja jest zwykle pierwszą metodą, której próbujemy, gdy opuściło nas natchnienie. W tym przypadku pięknie działa indukcja względem l. Dla 1 = 0 baza indukcji jest oczywista, gdyż wszystkie składniki są zerami z wyjątkiem k = —m. Stąd obie strony tożsamości równają się (—1 )m (s~ m). Załóżmy teraz, że równość zachodzi dla wszystkich wartości mniejszych od pewnego, ustalonego l > 0. Stosując regułę dodawania zastąpmy (m+k) przez ( m + k ) + ( m + k —1) * Suma wyjściowa rozpada się teraz na dwie sumy, do któ rych z osobna stosujemy założenie indukcyjne: Jeśli teraz zastosujemy regułę dodawania jeszcze raz, to otrzymamy prawą stronę równości (5.24). Zwróćmy uwagę na dwie sprawy związane z powyższym dowodem. Po pierwsze, bardzo wygodnie jest sumować po wszystkich liczbach całkowi- ! 199 J*. *«w *&. - 5.1. Podstawowe tożsam ości tych k, a nie tylko po pewnej ich części, ponieważ unikamy problemu z warunkami brzegowymi. Po drugie, reguła dodawania sprawdza się dobrze w zestawieniu z indukcją matematyczną, ponieważ jest ona rekurencją dla współczynników dwumianowych. Współczynnik dwumianowy o górnym in deksie l jest wyrażany za pomocą dwóch innych współczynników dwumiano wych o górnych indeksach l —1 i jest to dokładnie to, czego potrzebujemy, by zastosować założenie indukcyjne. To tyle na temat tabeli 197. Co powiemy o sumach z trzema lub więcej współczynnikami dwumianowymi? Jeżeli zmienna indeksowa pojawia się we wszystkich współczynnikach, to nasze szanse znalezienia zwartej postaci nie są wielkie. Dla sum takiego rodzaju znamy tylko kilka wzorów. Jednym z tych rarytasów, dowiedzionych w ćwiczeniu 43, jest L /m —r + s \ / n + r —s\ / r + k . I k yv /V m + n m) (n ) ’ całkowite m, n ^ 0 .(5 .28 ) A oto inny, bardziej symetryczny przykład: +^ ^ + + ky . CV VC , aV - 1)' + k / Vb c+ +k (a + b + c)! a! b! c! całkowite a, b, c ^ 0 . (5 *29 ) Ma on swój odpowiednik z dwoma współczynnikami dwumianowymi z (a + 9 ( £ + k) M )k = ’ całkowite a’b ^ °- (5-30) który nie pojawia się w tabeli 197. Analogiczna czterowspółczynnikowa suma nie ma postaci zwartej, ale podobna suma ma: y ^ ^^k f cl + b \ fb + c^ ( c + d^\ ( d + a \ / ( 2 a + 2 b + 2 c + 2 d a + ky yb + kJ yc + k y \ vd + ky/ y a + b + c + d + k _ (a+b+c+d)! (a+b+c)! (a+b+d)! (a+c+d)! (b+c+d)! = (2 a + 2 b + 2 c + 2 d)! (a+c)! (b+d)! a! b! c! d! ’ całkowite a, b, c, d ^ 0 . Wynika to z pięcioparametrowej tożsamości odkrytej przez Johna Dougalla na początku dwudziestego wieku [83]. \ Czy tożsamość Dougalla jest sumą z największą liczbą współczynników dwumianowych? Nie! Rekordzistą jest, jak dotąd Oj + O-n. H (-D z j on “H2-x<jktj Jest to suma względem (TL2 1) zmiennych indeksowych k^-, gdzie 1 ^ i < j < rt. Gdy n = 3, otrzymujemy równanie ( 5 .2 9 ). Przypadek n = 4 może być zapisany następująco: jeśli użyjemy (a, b, c, d) zamiast (ai >0-2, 0 3 , 0 4 ) i ■ (i,j,k ) zamiast (ki 2 >k 1 3 ,k 23): / a + b \ f a + c \ A > + c\ / a + d \ / b + d \ / c + d \ \ b + i y \ c + j / \c + k y ^d—i —y \ d + i —ky \d + j + k y (a + b + c + d)! a! b! c! d! całkowite a, b, c, d ^ 0 . Lewa strona tożsamości ( 5 .3 1 ) jest współczynnikiem jednomianu z®z® .. .z® powstałego po przemnożeniu n [n — 1 ) ułamków i pełnym rozwinięciu dodatnich i ujemnych potęg zmiennych z. Prawa strona równości ( 5 .3 1 ) została wymyślona przez Freemana Dysona w 1962 roku i udowodniona przez kilka osób wkrótce potem. W ćwiczeniu 86 znajdziemy „prosty” dowód tej równości. Inną, wartą uwagi sumą mającą wiele współczynników dwumianowych jest Suma ta, dowiedziona w ćwiczeniu 83, ma nawet szansę użycia w praktycz nych zastosowaniach. Oddaliliśmy się jednak od naszego tematu „podstawo wych tożsamości,” zatem lepiej zatrzymajmy się i oceńmy wartość tego, czego się do tej pory nauczyliśmy. Widzimy, że współczynniki dwumianowe spełniają oszałamiającą różno rodność tożsamości. Niektóre z nich szczęśliwie są łatwe do zapamiętania 5 . 2 . P od staw ow e ćw iczen ia! i możemy je wykorzystać do wyprowadzenia większości pozostałych równości w kilku krokach. Tabela 202 gromadzi w jednym miejscu dziesięć najbardziej pożytecznych tożsamości. Warto je znać! 5.2. Podstaw ow e ćw iczenia W poprzednim podrozdziale wyprowadziliśmy kilka tożsamości przekształ cając sumy i stosując je w innych tożsamościach. Wymyślenie dowodów nie było zbyt trudne— wiedzieliśmy, co chcemy udowodnić. Mogliśmy więc sfor mułować ogólny plan, który wypełnialiśmy potem szczegółami bez większych kłopotów. Jednak zazwyczaj w prawdziwym świecie trudzimy się, nie z do wodzeniem wzorów, lecz z upraszczaniem sum. W dodatku nie wiemy, jak może wyglądać suma po uproszczeniu, ani czy da się ją w ogóle uprościć. Zmagając się z wieloma takimi sumami w tym i następnych podrozdziałach, nabierzemy wprawy w radzeniu sobie z nimi. Na początek, policzmy kilka sum z pojedynczym współczynnikiem dwumianowym. Algorytm uczenia się samemu: 1 przeczytaj zadanie 2 spróbuj rozwiązać 3 przeskocz książkowe rozwiązanie 4 i f próba zawiodła goto 1 else goto następne zadanie Z adanie 1 : S um a ilorazów Chcielibyśmy uzyskać postać zwartą dla Z lc=0 (;)• W pierwszym momencie możemy wpaść w panikę, ponieważ jak do tej pory nie spotkaliśmy tożsamości z ilorazem współczynników dwumianowych. (Co więcej, suma zawiera dwa współczynniki dwumianowe, co przeczy zdaniu poprzedzającemu to zadanie.) Podobnie jak zrobiliśmy przy dowodzie tożsa mości ( 5 .2 1 ), możemy zapisać iloraz za pomocą silni. Możemy też podstawić we wzorze ( 5 .2 1 ) r = n i podzielić obie jego strony przez (£) (™). Otrzymamy n —k \ m —k ) / / rt \m Niestety, powyższy algorytm wpada w nieskończoną pętlę. Sugerowane poprawki: set c j— 0 3a set c ( - c + 1 3b if c = N goto Twój asystent. 0 Jeśli zatem zastąpimy lewy iloraz, który pojawia się w naszej sumie, prawym ilorazem, to rozważana suma stanie się równa Z L— (\ n_lc m— E. W. Dijkstra k=0 Ciągle mamy iloraz, lecz mianownik nie zawiera zmiennej indeksowej k. Możemy go zatem wyciągnąć poza sumę. Możemy również uprościć warunki graniczne, sumując względem k ^ 0, ponieważ wszystkie wyrazy k > m są zerami. Suma, która nam pozostała, . . . Ale ten podrozdział nazwany został PODSTAWOWE ćwiczenia. |5 . Współczynniki dwumianowe ^ ............. ^ ^ ^^2 T abela 2 0 2 . Najważniejsze tożsamości ze współczynnikami dwumianowymi n! k! ( n - k ) ! n r t-k ii:- ■ \ ..... \k / . fj* cajôwj|;e ) ę ^ o , -^s-ń * k \k — 1 . . W j ( całkowite n ^ k ^ 0. i i ; « łk o w ite n > 0 , W fW całkowite k. symetria ‘ B ( r \ ^ r f r -1 y> ... t i,. pochłanianie * ... dodawanie indukcja całkowite k. górna negacja" •^ fW y A /m\ ▼ / r \ / r - k \ '*» »'-aS ( wJ\lcJ- VVVm—V ^ /t \ v _ v .* \ r \k / lc= ( x + y ) r r + k’ Z V + n + lV ' Ti k^n całkowite m ,Ł iiw i całkowite r ^ 0 , l u b |x /y |< 1 . >• ^f jł o -e r ,) L* całkowite u. wzor ■ • -,; dwumianowy ^ ^ w S o l e g ł e 'tl'. sumowanie całkowite górne* sumowanie ■>,* całkowite n, tozsamosc -yg Cauchy}ego : **» j* " nie jest już tak straszna: Z kÔ n-k' m Jest ona podobna do tożsamości ( 5 .9 ), ponieważ zmienna indeksowa k poja wia się dwukrotnie z tym samym znakiem. Ale tu mamy —k, a w ( 5 .9 ) nie. Następny krok jest oczywisty. Można zrobić tylko jedną sensowną rzecz: £ ( ; : k') = kÔ v n — (m —k) m — (m —k) t . m -k ^ 0 n —m + k k L(v k^m Następnie zastosujmy regułę równoległego sumowania (5.9): (u —m) + m + 1 m 11L Na końcu wstawmy z powrotem do mianownika wyrzucone z niego (£ ) i zastosujmy równość ( 5 .7 ). Otrzymamy postać zwartą: To wyprowadzenie jest prawidłowe dla dowolnej liczby rzeczywistej n dopóty, dopóki nie dzielimy przez zero, tzn. dopóki rt nie jest jedną z liczb całkowitych 0 , 1, . .., m - 1. Im bardziej skomplikowany jest dowód, tym ważniejsze jest sprawdze nie odpowiedzi. To wyprowadzenie nie było zbyt skomplikowane, mimo to sprawdźmy. Dla małych m = 2 i n = 4 mamy + Tak! Doskonale zgadza się z naszym wzorem (4 + 1 )/ (4 + 1 —2). Zadanie 2: Z literatury o sortowaniu Nasza kolejna suma pojawiła się w starożytnych czasach (początek lat siedemdziesiątych), zanim ludzie zaczęli się biegle posługiwać współczynnikami dwumianowymi. Artykuł, w którym przedstawiono poprawioną metodę sca lania [196], kończył się następującą uwagą: „Można pokazać, że oczekiwana liczba przesunięć . . . dana jest wzorem gdzie m i n s ą zdefiniowane powyżej, natomiast symbol ^C n oznacza liczbę kombinacji bez powtórzeń z m elementów po n. . . . Autor jest wdzięczny re cenzentowi za zredukowanie bardziej skomplikowanego równania na wartość oczekiwaną przesunięć do postaci tutaj podanej.” Zobaczymy, że nie jest to ostateczna odpowiedź na problem autora. Nie zasługuje ona nawet na miano odpowiedzi częściowej. Na początku przekształćmy sumę w coś, z czym będziemy mogli pra cować. Okropna notacja m_ r- i Cm_n _i może zniechęcić każdego. Ułatwmy życie entuzjastycznie nastawionemu recenzentowi. W naszym języku wzór przybierze postać: całkowite m > rt ^ 0. Współczynnik dwumianowy w mianowniku nie zawiera zmiennej indeksowej, zatem usuńmy go i dalej pracujmy z sumą Co dalej? Zmienna indeksowa pojawia się w górnym indeksie współczyn nika dwumianowego, ale nie w dolnym. Jeśli nie byłoby we wzorze innych k, to moglibyśmy zastosować sumowanie względem górnego indeksu ( 5 . 1 0 ). Z dodatkowym k nie możemy. Jeśli w jakiś sposób udałoby się nam wchłonąć k do środka współczynnika dwumianowego, używając jednej z naszych reguł pochłaniania, to moglibyśmy sumować względem górnego indeksu. Niestety, reguł tych nie można tu zastosować. Ale gdyby zamiast k było m — k, to moglibyśmy użyć reguły pochłaniania ( 5 .6 ): (m —k) m —k — 1 m —rt — 1 (m —n) m —k m —rt Oto klucz: zapiszmy k jako m —(m —k) i rozbijmy sumę S na dwie części: rrt —k — 1 m —rt — 1 — rrtA — (m —rt)B , gdzie Sumy A i B są naszymi starymi przyjaciółkami — górny indeks się zmie nia, podczas gdy dolny jest niezmienny. Zajmijmy się wpierw B, ponieważ wygląda prościej. Po prostych przekształceniach osiągniemy lewą stronę toż samości ( 5 .1 0 ): m — (m —k)' m —rt "'" O^m—k< k^rt £ C:‘) = z ( O^k^n V / = L m—n^k^m k m —u k m —u O^k^m W ostatnim kroku dołączyliśmy do sumy składniki z 0 ^ k < m —n. Wszyst kie one są zerami, gdyż górny indeks jest mniejszy od dolnego. Teraz sumu jemy względem górnego indeksu stosując tożsamość ( 5 . 1 0 ) i otrzymujemy O^k^m \ / \ / Suma A jest podobna do B, z tym że m trzeba zastąpić przez m —1. Zatem otrzymaliśmy zwartą postać danej sumy S, którą możemy jeszcze uprościć: S = m A — (m —n)B = m ( m ^ — (m —n ) ( m _^ \ m —n ) \ m —n + 1 ( , , m + 1\ ( m = m — (m —n) m —n + 1 J Vm —n = (\ m —nn + JV\ m m —n V ) 1 Stąd zwarta postać początkowej sumy: T = S C) Ti / m \ / /m m m —n + 1 Nawet recenzent nie może tego uprościć. Ponownie sprawdzamy wynik dla małych wartości. Gdy m = 4 i n = 2, mamy T = 0- ( M + ! • ( ? ) / © + 2 -(!)/© co zgadza się z naszym wzorem 2 /(4 —2 + 1). =0 + 1+ 1 = 2 3 > Zadanie 3: Ze starego egzaminu Czy stare egzaminy już wymarły? Stare egzaminy nie umierają, idą do piekła się przebrać. Policzmy jeszcze jedną sumę, w której pojawi się tylko jeden współczynnik dwumianowy. Suma ta tym razem, w przeciwieństwie do poprzedniej urodzo nej w murach uniwersyteckich, była zadaniem z testu domowego. Chcemy wyliczyć wartość Qioooooo, gdzie Qn = \ *i ](—1 )k , całkowite n ^ 0. Jest ona trudniejsza od poprzednich. Nie możemy zastosować żadnej z po znanych już tożsamości. Ta suma ma 21000000+1 wyrazów, więc nie możemy ich po prostu dodać. Zmienna indeksowa k pojawia się w obu indeksach, gór nym i dolnym, ale z przeciwnymi znakami. Zanegowanie górnego indeksu w niczym nie pomoże. Co prawda usunie czynnik (—1)k, ale wprowadzi 2k do górnego indeksu. Kiedy nic oczywistego nie da się zrobić, najlepiej jest, jak wiemy, przyj rzeć/się małym przypadkom. Jeśli nie dostrzeżemy jakichś regularności i nie udowodnimy ich przez indukcję, to przynajmniej będziemy mieli trochę da nych do sprawdzenia naszych wyników. Mamy tu dla pierwszych czterech wartości n niezerowe składniki i ich sumy. n Qn 0 G) = 1 = 1 1 © - (?) = 1-1 = 0 2 (o) - (?) + ® =1-3+1 = -1 3 (S) - (D + (D - © + 0 = 1 - 7 + 1 5 - 10 + 1 = 0 Lepiej nie sprawdzajmy następnego przypadku n = 4. Szansa zrobienia błędu w rachunkach jest zbyt duża. (Zostawmy desperatom ręczne wyliczenie skład ników (Y ) i ( 51) i dodanie ich do siebie.) Wzór zaczyna się od 1, 0, —1, 0. Nawet gdybyśmy znali jedną lub dwie następne liczby, postać zwarta nie byłaby oczywista. Jeśli moglibyśmy zna leźć i udowodnić wzór rekurencyjny na Qu , prawdopodobnie moglibyśmy odgadnąć i udowodnić jej zwartą postać. By znaleźć rekurencję, musimy po wiązać Qn z Qn_i (lub z Q mniejsze liczb y ), ale by to zrobić, musielibyśmy powiązać składnik jak ( 12^3 13), który otrzymamy dla n = 7 i k = 13, np. ze składnikiem (641“313) . Nie wygląda to obiecująco. Nie znamy żadnych zgrab nych związków pomiędzy liczbami trójkąta Pascala odległymi od siebie o 64 wiersze. Reguła dodawania, nasze główne narzędzie w dowodach induk cyjnych, wiąże tylko liczby z sąsiednich wierszy. To prowadzi nas do kluczowej obserwacji: Nie potrzebujemy zajmować się liczbami odległymi od siebie o 2 n _ 1 wierszy. Zmienna n nigdy nie pojawia się sama, lecz tylko jako wykładnik w potędze 2n. Zatem 2n jest tylko zmyłką! Jeśli zastąpimy 2TLprzez m, to wszystko, co musimy zrobić, to znaleźć postać zwartą ogólniejszej (lecz łatwiejszej) sumy Rm = ^ y 1ir k<Cm ' / ^ ’ Ach, ci podstępni egzaminatorzy! całkowite m ^ 0. 7 Wtedy uzyskamy postać zwartą dla Qn = R2 ^. Mamy dużą szansę na to, że reguła dodawania da nam rekurencję dla Rm. Wartości Rm dla małych wartości m odczytamy z tabeli 182, jeśli na przemian dodamy i odejmiemy liczby pojawiające się na przekątnej biegnącej z południowego zachodu na północny wschód. Oto otrzymane wyniki: m 0 1 2 3 4 5 6 7 8 9 Rm 1 1 -1 -1 0 1 1 0 - 1 -1 0 10 Wygląda na to, że dużo rzeczy się uprościło. Przyjrzyjmy się teraz wzorowi na Rm i zobaczmy, czy nie definiuje on rekurencji. Nasza strategia polega na zastosowaniu reguły dodawania ( 5 .8 ) i na znalezieniu w wynikowym wyrażeniu sum postaci R^, podobnie jak zro biliśmy w metodzie zaburzeń z rozdziału 2 : m —k = L (-o 1 k^m m —1 — ,_- j jic + =■ z k^m = L k^m m — 1 —k (- i)k + k y ( m —1 k-1 k<m m —2 —k y_ -1 < - i) k + k^m—1 - „ u 1< k+1 m — 1 —k = L * H )k ) ( - 1 ) k+1 ( - 1)" m - u - j ' - " - ’ = Rm_! + ( - 1 )2m - Rm - 2 - (—1 )2(m_1) = Rm - 1 - Rm- 2 (W przedostatnim kroku użyliśmy prawdziwego dla m ^ 0 wzoru ( m ) = (—1)m.) Wyprowadzenie to jest prawdziwe dla m ^ 2. Wiedzą o tym ci z nas, którzy zrobili już rozgrzewkowe ćwiczenie 4. 5. W spółczynniki dwum ianowe Dzięki rekurencji możemy wygenerować szybko kolejne wartości Rm i szybko spostrzeżemy, że ciąg jest okresowy. Rzeczywiście: 1 0 1 1 0 — -1 jeśli m mod 6 = < -1 o 2 3 4 5 Dowód indukcyjny przeprowadzamy przez sprawdzenie. Gdyby żądano od nas bardziej uczonego dowodu, moglibyśmy rozwinąć rekurencje, o jeden krok. Otrzymamy wtedy Rm — (Rm—2 Rm—3 ) Rm—2 — Rm—3 > dla m ^ 3. Zatem dla m ^ 6 mamy Rm = Rm-6Ponieważ Qu = R2 ti, wyliczymy Qn , jeśli policzymy 2n mod 6 i użyjemy wzoru na Rm. Dla rt = 0 wiemy, że 2° mod 6 = 1. Następnie mnóżmy przez 2 (mod 6 ). Otrzymamy na przemian liczby 2 i 4. Wzór 2, 4 powtarza się. Stąd ( Rt = 1 , Qn = R2^ = < R2 = 0 , [ R4 = —1 , gdy rt = 0 ; gdy rt jest nieparzyste; gdy u > 0 jest parzyste. Postać zwarta dla Qn zgadza się z pierwszymi czterema wartościami poli czonymi przez nas, gdy zajęliśmy się tym zadaniem. Wnioskujemy stąd, że Qi 000000 = R4 = —1. Z adanie 4: S um a zaw ierająca dw a w sp ó łczy n n ik i d w um ianow e Naszym następnym zadaniem będzie znalezienie zwartej postaci dla całkowite m > n > 0 . k=0 Chwileczkę! Gdzie jest obiecany w tytule drugi współczynnik dwumianowy Dlaczego musimy upraszczać sumę, którą już upraszczaliśmy? (Jest to suma S z zadania 2 .) Cóż, tę sumę jest łatwiej uprościć, jeśli spojrzymy na nią jak na iloczyn dwóch współczynników dwumianowych i użyjemy jednej z ogólnych tożsa mości z tabeli 197. Drugi współczynnik dwumianowy zmaterializuje się, gdy zapiszemy k jako (^): k=0 O^k^n m —k — 1 m —r t — 1 Tożsamość ( 5 .2 6 ) jest jedyną, którą możemy zastosować, ponieważ zmienna indeksowa pojawia się w obu górnych indeksach, w dodatku z przeciwnym znakiem. Nasza suma nie jest jeszcze w prawidłowej postaci. Jeśli chcemy mieć idealną zgodność ze wzorem ( 5 .2 6 ), to górną granicą sumowania powinno być m — 1. Nie ma problemu. Składniki n < k ^ m — 1 są równe zeru. Możemy zatem je dołączyć, podstawiając równocześnie (l, m >nyq) <— (m — 1, m —n — 1,1,0). Otrzymamy odpowiedź V S = ( m \vn —n + 1 ) Jest ona przejrzystsza od znalezionej poprzednio. Możemy ją przekształcić do poprzedniej za pomocą wzoru ( 5 .7 ): Podobnie, możemy otrzymać interesujące wyniki podstawiając szczególne wartości do ogólnych wzorów. Przypuśćmy, że wstawimy m = n = 1 i q = 0 do wzoru ( 5 .2 6 ). Wtedy Lewa strona równa się l ( ( l + 1)l/2 ) —( l 2 + 2 2 H------ hi2), co daje nam całkiem nową metodę policzenia sumy kolejnych kwadratów, z którym to zadaniem zmagaliśmy się na śmierć i życie w rozdziale 2 . Morał z tej powieści jest następujący: szczególne przypadki bardzo ogól nych sum jest lepiej przekształcać w ogólnej postaci. Gdy poznaliśmy ogólną postać, mądrze jest poznać jej proste przypadki. Zadanie 5: Suma z trzem a mnożnikami Oto następna, niezbyt groźna suma. Życzymy sobie uprościć k Zmienna indeksowa k pojawia się w obu dolnych indeksach z tym samym znakiem. Dlatego tożsamość ( 5 .2 3 ) w tabeli 197 najbardziej przypomina to, co jest nam potrzebne. Po drobnych przekształceniach powinniśmy móc ją zastosować. Nasza suma różni się od sumy z tożsamości ( 5 .2 3 ) dodatkowym k. Mo żemy na szczęście wchłonąć k do jednego ze współczynników dwumianowych używając jednej z reguł pochłaniania: Nie interesuje nas to, że po zniknięciu k pojawiło się s, ponieważ jest ono stałe. Teraz jesteśmy gotowi zastosować tożsamość (5.23). Otrzymamy nastę pującą postać zwartą: Gdybyśmy w pierwszym kroku wchłonęli k do (£), zamiast do (£), nie mo glibyśmy zastosować bezpośrednio tożsamości (5.23), gdyż rt — 1 może być liczbą ujemną. Tożsamość ta wymaga bowiem co najmniej jednej nieujemnej wartości w co najmniej jednym górnym indeksie. Zadanie 6: Groźna suma Następna suma stanowi pewne wyzwanie. Szukamy postaci zwartej dla Użyteczną miarą trudności sumy jest liczba wystąpień zmiennej indeksowej we wzorze. Wedle tej miary jesteśmy w poważnym kłopocie — k pojawia się tam aż sześć razy. Co więcej, kluczowy pomysł, który był skuteczny w poprzednim zadaniu— wchłonąć coś z zewnątrz do jednego ze współczynników dwumianowych— w tym przypadku się nie sprawdza. Jeśli wchłoniemy k + 1, to otrzymamy w zamian inne wystąpienie k. Nie tylko to sprawia nam kłopot. Nasz indeks k jest podwójnie sprzęgnięty z liczbą 2 wewnątrz współczynnika dwumianowego. Multiplikatywne stałe są zwykle trudniejsze do usunięcia od addytywnych. Jednak tym razem mamy szczęście. Liczby 2k są dokładnie w tych miej scach, gdzie powinny być, by można było zastosować tożsamość (5.21): Obie dwójki znikają razem z jednym k. Jednego nie ma, pozostało pięć. Najbardziej kłopotliwy jest mianownik k + 1, ale możemy go wchłonąć do (£) na podstawie tożsamości (5 .6 ): (Przypominamy, że rt ^ 0.) Drugie k zniknęło, pozostały cztery. Mamy dwie obiecujące drogi eliminujące następne k. Możemy użyć reguły symetrii względem (n£ k) , albo zanegować górny indeks n + k , eliminując przy okazji mnożnik (—1)k. Zbadajmy obie możliwości, zaczynając od symetrii: Trzecie k odeszło, trzy pozostały. Możemy teraz wiele zyskać przez użycie tożsamości ( 5 .2 4 ): zastępując s) przez (n + 1 ,1 , n, n) , otrzymamy O, jak dobrze! A już myślałem, że trzeba będzie zgadywać! Zero, hmmm? Po takiej pracy? Sprawdźmy dla n = 2: (2) Q \ — (2) (2) \ + (4) Q 3 = 1 - f + f = Z sadza si?- Tak dla hecy, zbadajmy drugą możliwość negując górny indeks (TXkk): Teraz stosujemy tożsamość ( 5 .2 3 ), dla (l,m,rt,s) <— (rt + 1 , 1 , 0 , —rt — 1), i otrzymujemy Hej, stop! Jest to zero dla rt > 0, ale 1, gdy n = 0. W pierwszej wersji rozwiązania otrzymaliśmy zero we wszystkich przypadkach! Co jest grane? Suma okazuje się równa 1 dla u = 0, więc prawidłową odpowiedzią jest ‘[n = 0 ]\ Musieliśmy zrobić błąd w poprzednim dowodzie. Przejrzyjmy ponównie dowód, wstawiając wszędzie 0 zamiast u, by zna leźć pierwsze miejsce, w którym powstaje niezgodność. Ach, tak! Wpadliśmy w znaną już pułapkę. Próbowaliśmy zastosować regułę symetrii dla ujem nego górnego indeksu! Nie możemy zastąpić (nkk) przez (n^k), gdy k jest Wykorzystaj przeszukiwanie binarne: Spróbuj najpierw w środku dowodu, by sprawdzić, czy błąd wystąpił wcześniej, czy później. dowolną liczbą całkowitą, ponieważ dla k < —rt zamiast zera otrzymamy wartość niezerową. (Bardzo nam przykro.) Drugi czynnik sumy, (£+ ]), jest równy zeru, gdy k < —n, z wyjątkiem rt = 0 i k = —1. Dlatego nie zauważyliśmy błędu sprawdzając przypadek rt = 2. W ćwiczeniu 6 możemy zobaczyć, jak powinno się postąpić. Zadanie 7: Nowa przeszkoda Ten przypadek jest jeszcze trudniejszy. Chcemy wzoru w postaci zwartej dla V" (— ^^ , > (^ ^ L ------^ -o ym + 2 k J \ \ c ) k + - i n > 0*4.-a całkowite m, rt Gdyby m równało się 0, wówczas otrzymalibyśmy dopiero co policzoną sumę. Ale się nie równa i jesteśmy teraz w prawdziwym kłopocie — niczego, co zastosowaliśmy w zadaniu 6 , nie możemy użyć tutaj. (Zwłaszcza pierwszego, krytycznego kroku.) Jednakże, gdyby udało się nam jakoś pozbyć m, moglibyśmy skorzystać z dopiero co otrzymanego wyniku. Stąd nasz plan: Zastąpmy (T1^ klc) sumą składników postaci (l^ °) dla pewnej nieujemnej liczby całkowitej l. Składniki będą wyglądać jak składniki sumy z zadania 6 . Następnie zmieńmy kolejność sumowania. Co powinniśmy podstawić za (^ + 2 k)? starannym przejrzeniu toż samości wyprowadzonych w tym rozdziale znajdziemy tylko jednego odpo wiedniego kandydata, mianowicie tożsamość ( 5 .2 6 ) z tabeli 197. Jest jedna metoda użycia jej przez odpowiednie przypisanie zmiennym ( l , m, n , q,k) wartości (rt + k — 1 , 2 k, m — 1 , 0 , j): L kÔ U + k \ / 2 k \ ( - l ) ik m + 2 ky \ k / k + 1 - zkÔ 0 ^j^n+k z -1 v - z jÔ x ( 7 z k^j—n +1 7 v )(? )£ & ' / \ ' • ł l 2'k 1 H M V k1 /' kH+|1 1 k>0 W ostatnim kroku zmieniliśmy porządek sumowania, manipulując warun kami poniżej £ 1 , zgodnie z zasadami przedstawionymi w rozdziale 2 . Nie możemy całkowicie zastąpić wewnętrznej sumy, używając wyniku z zadania 6 , z powodu dodatkowego warunku k j —rt + 1. Ale ten warunek jest zbyteczny dopóty, dopóki nie zachodzi warunek j — rt + 1 > 0 ; tzn. jeśli jest j < rt. Gdy j ^ rt, wówczas pierwszy współczynnik dwumianowy z wewnętrznej sumy jest równy zeru, ponieważ jego górny indeks zawiera się pomiędzy 0 i k — 1 , czyli jest ostro mniejszy od dolnego indeksu 2 k. Dlatego możemy dołożyć w zewnętrznej sumie dodatkowy warunek j < n, nie usuwając przy okazji niezerowych wyrazów sumy. To czyni warunek k ^ j —n + 1 niepotrzebnym i możemy zastosować wynik z zadania 6 . Podwójna suma zaczyna się teraz zwijać: kÔ Wewnętrzne sumy znikają, z wyjątkiem przypadku gdy j = n — 1, zatem w rezultacie otrzymaliśmy prosty wzór w postaci zwartej. Zadanie 8 : Inna przeszkoda od zadania 6 w inny sposób, rozważając sumę całkowite m, u ^ 0 . Znowu, gdyby było m = 0, wówczas otrzymalibyśmy sumę z zadania 6 . Tym razem m pojawia się w innym miejscu. To zadanie jest trochę trudniejsze od zadania 7, ale (na szczęście) jesteśmy coraz lepsi w znajdowaniu rozwiązań. Zacznijmy, jak w zadaniu 6 Teraz (tak jak w zadaniu 7) spróbujmy część zależącą od m przedstawić jako sumę składników, z którymi będziemy umieli postępować. Gdy m było równe zeru, wchłonęliśmy k + 1 do (£). Jeśli m > 0, możemy zrobić to samo, gdy rozwiniemy 1/ ( k + 1 + m ) w sumę składników dających się wchłonąć. Ciągle dopisuje nam szczęście. Udowodniliśmy już w zadaniu 1 właściwą równość (5-33) |,5. Współczynniki dwumianowe Po zastąpieniu r przez —k —2 otrzymamy właściwą sumę -1 )k y n + k\ fn =L W k +1 frA i kÔ He, he i co, ktoś się spodziewa, że wykażemy ten wzór licząc na skrawku papieru? f m \ f —k —2 Teraz, zgodnie z planem, możemy wchłonąć czynnik ( k + 1 ) - 1 do (£). W rze czywistości może on być wchłonięty również przez ( - k _ 2 ) _1 • Dwie możliwo ści wchłonięcia sugerują, że możliwe są i inne uproszczenia, które pozostaną poza polem naszej uwagi. Tak— przedstawienie wszystkiego w naszym skład niku za pomocą silni i zamiana z powrotem na współczynniki dwumianowe da nam wyrażenie, które możemy sumować względem k: Tn!tl! j/m + T i + 1 \ fn + 1 + j ^ n + l+ j/^ ljc + j+ l . (m + n + 1 )! — —n — 1 k m! n! (m + n + Ze wzoru ( 5 .2 4 ) wynika, że suma ta względem wszystkich liczb całkowitych j jest równa zeru. Stąd suma względem j < 0 jest równa —Sm. By obliczyć —Sm dla ) < 0, zastąpmy j przez —k —1 i sumujmy po k ^ 0: Sm = m! u! Z M (m + n + 1 )! kÔ m !n! (m + n + 1 )! jkfm + n + 1 V u —k n ’) / m + n + 1 \ f k —n — 1 ZM ) Tl k<TL m! n! 'm + n + 1 )! I M ) ' k^n m + n + 1 \ / 2 n —k n __ ^ / m + n + 1 \ f2 n —k — y )C (-1 )k( ( m + n + 1 ) ! k^2n 1 J V J- Tl W końcu po zastosowaniu wzoru ( 5 .2 5 ) otrzymamy Sm = ( - 1 ) 1 m! n! fm\ —rt—1 = (—1 )nm—ttv (rn + n + 1 )! Vn / Uff! Lepiej go sprawdźmy. Gdy n = 2, mamy Sm = 1 6 6 m+1 m+ 2 m+ 3 m ( m —1 (m + 1)(m + 2)(m + 3) * Nasz dowód wymaga, by m było liczbą całkowitą, ale rezultat jest praw dziwy dla wszystkich liczb rzeczywistych m, ponieważ (m + 1) n + 1 Sm jest wielomianem zmiennej m stopnia nie większego niż rt. 5.3. P odstaw ow e techniki Przyjrzyjmy się trzem technikom, które istotnie wzbogacają poznane już przez nas metody. Chwyt 1: Połow ienie W wielu naszych tożsamościach występują dowolne ustalone liczby rzeczy wiste r. Gdy r ma szczególną postać „liczba całkowita minus jedna druga,” wówczas współczynnik dwumianowy (£) można zapisać jako całkiem inaczej wyglądający iloczyn współczynników dwumianowych. Prowadzi to do nowej rodziny tożsamości, które mogą być przekształcane z zadziwiającą łatwością. Żeby sprawdzić jak to działa, zacznijmy od reguły podwajania t- (r - \ )“ = (2r)—/ 22k , całkowite k Js 0. to^być^zwan Chwyt 1/2. (5-34) Tożsamość ta jest oczywista, gdy rozwiniemy ubywające potęgi i przeple ciemy czynniki po lewej stronie: r ( r — l ) ( r — 1 )(r — f ) ... ( r — k+1)(r — k + I ) (2r) (2r — 1 ) . . . (2t —2k + 1) 2 • 2 •... •2 Gdy podzielimy obie strony przez k!2, otrzymamy całkowite k. (5-35) Jeśli wstawimy k = r = n, gdzie n jest liczbą całkowitą, to teraz całkowite n. (5-36) Negując górny indeks, otrzymamy inny pożyteczny wzór całkowite n. Na przykład, gdy n = 4 mamy (5-37) ... połowimy... i możemy teraz wyprowadzić formułę jedną, drugą... •1 \ 4 1-3-5-7 1 -2-3-4 ■1\ 4 1 - 3- 5-7-2-4- 6-8 1- 2- 3- 4- 1- 2- 3- 4 (-1 \ 4 /8 Zauważ, że zmieniliśmy iloczyn nieparzystych liczb na silnię. Z tożsamości ( 5 .3 5 ) wynika zadziwiający wniosek. Przesumujmy ją wzglę dem wszystkich liczbach całkowitych k dla r = ^n. Otrzymamy 2kMk7 , 2_2k == y+y 1 / V 2V ( n - 1)/2 1 n - 1/2 [n /2\ ) ’ całkowite n ^ °- (5-38) Skorzystaliśmy ze wzoru ( 5 .2 3 ), ponieważ albo n /2 , albo (n — 1)/2 jest nie ujemną liczbą całkowitą równą (_ix/2 J. Możemy też zastosować tożsamość Cauchy’ego ( 5 .2 7 ), by wywnioskować, że L (“I/2) ( ” -k ) = ( n ) = M ^ ’ Całk°Wite n ^ °- Po wstawieniu wartości ze wzoru ( 5 .3 7 ) otrzymamy coś, co sumuje się do nra - (=?)*(?) a r ( 2t : ] ( - 1 )n / 2 k \ / 2 n - 2 k 4U \ k / \ n —k Stąd mamy godną odnotowania własność „środkowych” elementów trójkąta Pascala: 2k \ / 2n - 2k \ „n k)( n - k I = 4 ' „ całkowite n ^ 0. . (5.39) Na przykład, (g) ( |) + ( ? ) © + 0 ) (?) + (D (g) = 1 -20 + 2-6 + 6-2 + 20-1 = 64 = 4 3. Ta ilustracja naszego pierwszego chwytu wskazuje, że mądrze jest spróbo wać zamienić współczynnik dwumianowy postaci (2^) na współczynnik dwu mianowy postaci (TL-1^/2 ), gdzie n jest odpowiednią liczbą całkowitą (zwykle 0, 1 lub k). Wzór końcowy może okazać się dużo prostszy. C h w yt 2 : R ó żn ice w y ższy ch rzędów Widzieliśmy wcześniej, że możliwe jest wyliczenie sum częściowych szeregu (£)(—1)k, ale nie szeregu (£). Okazuje się, że jest wiele ważnych zastoso wań współczynników .dwumianowych z naprzemiennymi znakami (£ )(—1 )kJedną z przyczyn tego stanu rzeczy jest to, że takie współczynniki dwu mianowe są stowarzyszone ze zdefiniowanym w podrozdziale 2 .6 operatorem różnicowym A . Różnicą Af funkcji f w punkcie x jest Af(x) = f ( x + 1 ) - f ( x ) . Jeśli ponownie zastosujemy A, otrzymamy drugą różnicę A2 f(x) = Af (x + 1) —Af (x) = (f(x+2) —f(x+ 1)) — (f(x+1) —f(x)) = f (x + 2 ) —2 f (x + 1 ) + f ( x ) , która jest odpowiednikiem drugiej pochodnej. Podobnie mamy A 3 f (x) = f (x + 3) —3f (x + 2) + 3f (x + 1) —f ( x ) ; A4 f (x) = f (x + 4) —4f (x + 3) + 6 f (x + 2) —4f (x + 1) + f (x) i tak dalej. Współczynniki dwumianowe pojawiają się w tych wzorach z na przemiennymi znakami. Ogólnie, n-t różnica jest równa An f(x) = ^ (—1)rL_kf(x + k ) , całkowite n ^ 0. ( 5 -4 o) k ^ ' Wzór ten można łatwo udowodnić przez indukcję, ale istnieje również piękny dowód oparty na elementarnej teorii operatorów. Przypominamy, że w pod rozdziale 2 .6 zdefiniowaliśmy operator przesunięcia E wzorem Ef(x) = f ( x + l ) . Operator A równa się E — 1, gdzie 1 jest operatorem identyczności, zdefinio wanym wzorem lf(x) = f(x). Ze wzoru dwumianowego Newtona mamy Jest to równanie, którego elementami są operatory. Jest ono równoważne tożsamości ( 5 .4 0 ), ponieważ operator Ek zamienia f(x) na f(x + lc). Interesujący i ważny przypadek dotyczy ujemnych potęg ubywających. Niech f(x) = (x — 1)— = 1/x . Wtedy na podstawie wzoru ( 2 .4 5 ) mamy Af(x) = (—1)(x — 1)— , A 2 f(x) = (—1)(—2)(x — 1)— i w ogólności Z równania ( 5 .4 0 ) wynika, że n! x(x + 1 ) . . . (x + rt) Na przykład x x+1 x+ 2 x+ 3 x+ 4 4! x(x + 1)(x + 2)(x + 3)(x + 4) Suma we wzorze ( 5 .4 1 ) jest rozwinięciem na ułamki proste funkcji n !/(x (x + Ciekawe rezultaty można wyprowadzić również dla dodatnich potęg uby wających. Jeżeli f(x) jest wielomianem stopnia d, to różnica Af(x) jest wie lomianem stopnia d — 1. Stąd Ad f(x) jest stałą i An f(x) = 0, gdy rt > d. Ten niezwykle ważny fakt upraszcza wiele wzorów. Przyjrzyjmy się temu bliżej. Zdefiniujmy f(x) = a dx d + a d- i x d_1 H-------h a ^ 1 + a 0 x° jako wielomian stopnia d. W rozdziale 6 zobaczymy, że możemy wyrazić zwykłe potęgi jako sumy potęg ubywających (na przykład x 2 = x - + x-). Istnieją zatem współczynniki b d, b d_ i , . . . , , bo takie, że f(x) = b dx - + b d_ i x ^ - H ------- b b - | X - + b 0 x - . (Okazuje się, że b d = a d i bo = ao, ale współczynniki pośrednie są powiązane w znacznie bardziej skomplikowany sposób.) Niech Cic = k! b^ dla 0 ^ k ^ d. Wtedy f(x) = c d Zatem każdy wielomian może być przedstawiony jako suma wielokrotności współczynników dwumianowych. Takie przedstawienie jest nazywane szere giem Newtona funkcji f (x), gdyż szereg ten był bardzo intensywnie używany przez Isaaca Newtona. Zauważyliśmy wcześniej w tym rozdziale, że reguła dodawania daje nam równość Stąd, przez indukcję, n-ta różnica szeregu Newtona jest bardzo prosta: A"fW - c a d— fA n j W . f ,\ d—1—n J Xrt V— V1—rt / Jeśli wstawimy teraz x = 0, to wszystkie składniki Cic(1c^TL) po prawej stronie będą równe zeru, z wyjątkiem składnika k —rt = 0. Zatem An f (0) = i" Ctv ł S d y n ^ d ; \ 0, gdy rt > d. Dlatego szereg Newtona dla f(x) jest równy: f(x) = Ad f (0) Q + Ad_1 f (0) ( d * ^ + • • • 4- Af(0) ^ + f (0) Q . Załóżmy na przykład, że f(x) = x3. Z łatwością wyliczymy, że f( 0 ) = 0 , f(1) = 1, Af (0) = 1, f{2 )= 8 , Af (1) = 7, A2 f(0) = 6, f (3) = 27'; Af (2) = 19; A2 f(1) = 12; A3 f(0) = 6 . Zatem szereg Newtona dla x 3 jest równy 6(3) + 6 (2) +1 (*) + 0(o)Nasz wzór An f(0) = cn można również wyliczyć za pomocą równości ( 5 .4 0 ), gdy podstawimy x = 0 : L ( k ) ( - 1 )k ( c o Q + c i ę ) + C 2 Q + ...) = (-d -c, całkowite rt ^ 0 . Dla dowolnego ciągu (c 0 , c i , c 2 , . . . ) nieskończona suma Co(q) + c i (*) + c 2 (k) H -----staje się skończona dla wszystkich k ^ 0 , zatem nie ma problemu ze zbieżnością. W szczególności, możemy udowodnić ważną równość y_ ( ^ ) ( - 1)1c(a ° + a i k + " - + a n1<n ) = (—1)nn! a n , całkowite rt ^ 0 , (5 4 2 ) ponieważ wielomian ao + a ik + -----b ankn może być zawsze zapisany jako szereg Newtona c 0 (£) + ci (*) H------------------------- h cu (£), gdzie cn = nl an . Wiele sum, które w pierwszym momencie wydają się beznadziejnie trudne do wyliczenia, można wyliczyć bardzo prosto używając n-tej różnicy. Roz ważmy, na przykład, równość Y_ ( T n Sk) ( _ 1 )k = , całkowite n ^ 0 . ( 5 .4 3 ) Wygląda bardzo imponująco, ponieważ jest całkiem różna od tego, co do tychczas widzieliśmy. Ale jest dosyć łatwa do zrozumienia, gdy zauważymy w składniku wiele mówiący czynnik (£ )(—1 )k, ponieważ funkcja fM - ( r ; !l) - jest wielomianem zmiennej k i stopnia u z głównym współczynnikiem (przy kn ) równym (—l ) n s^/nl. Zatem wzór ( 5 .4 3 ) jest niczym więcej, jak zastoso waniem tożsamości ( 5 .4 2 ). Zajmowaliśmy się szeregami Newtona przy założeniu, że funkcja f (x) jest wielomianem. Zauważyliśmy również, że nieskończone szeregi Newtona mają sens, gdyż są zawsze skończone, gdy x jest nieujemną liczbą całkowitą. Nasz dowód wzoru An f(0) = cn jest prawdziwy także dla nieskończonej sumy, podobnie jak w przypadku wielomianów. Zatem mamy ogólną równość f (X) = f (0) ( * ) + Af (0) ( * ) + A 2 f (OJ Q + A 3 f (0) ( 3 ) + • • • > całkowite x ^ 0 . ( 5 -4 4 ) Wzór ten jest prawdziwy dla dowolnej funkcji f (x) określonej dla nieujemnych liczb całkowitych x. Co więcej, jeżeli prawa strona jest zbieżna dla innych wartości x, mamy zdefiniowaną funkcję, która „interpoluje” f (x) w naturalny sposób. (Można na nieskończenie wiele sposobów przybliżać wartości funkcji, zatem nie możemy twierdzić, że wzór ( 5 .4 4 ) jest prawdziwy dla wszystkich x, w których nieskończona suma jest zbieżna. Na przykład, jeśli f (x) = sin( 7tx), mamy f(x) = 0 we wszystkich punktach całkowitych. Stąd prawa strona równości ( 5 .4 4 ) jest tożsamościowo równa zeru, ale lewa strona jest niezerowa dla wszystkich liczb x nie będących liczbami całkowitymi.) Szereg Newtona jest różnicowym odpowiednikiem szeregu Taylora. Po dobnie jak szereg Taylora może być zapisany w postaci 9 ( 0 + x) _ + + ..., (Ponieważ E = 1+A, tak i szereg Newtona funkcji f (x) = g(a + x) można zapisać jako ,(«ł ,) = !|!« * + 4f l , l + i Exg ( a ) = g(a + x).j + ^ * 1 + ••• . (6.46) (Jest to to samo co wzór ( 5 .4 4 ), ponieważ An f(0) = A71 g(a) dla wszystkich rt ^ 0, gdzie f(x) = g(a + x).) Oba szeregi, Taylora i Newtona, są skończone, gdy g jest wielomianem lub gdy x = 0. Dodatkowo szereg Newtona jest skończony, gdy x jest dodatnią liczbą całkowitą. W przeciwnym razie sumy mogą być, albo nie być zbieżne dla poszczególnych wartości x. Jeśli szereg Newtona jest zbieżny dla nieujemnej liczby całkowitej x, to może on być zbieżny do wartości różnej od g(a + x), ponieważ szereg Newtona ( 5 .4 5 ) zależy tylko od rozstrzelonych wartości funkcji g(a), g ( a + 1 ), g(a + 2 ), . . . . Jednym z przykładów zbieżnego szeregu Newtona jest wzór dwumianowy Newtona. Niech g(x) = (1 + z )x , gdzie z jest ustaloną liczbą zespoloną taką, że |z| < 1. Wtedy Ag(x) = (1 + z ) x+1 —(1 + z )x = z(1 + z )x i An g(x) = zn (1 + z )x. W tym przypadku nieskończony szereg Newtona x g(a + x) = X A n 9 ( aH n ) = ( 1 + z)QH ( n j z zbiega dla wszystkich x do „prawidłowej” wartości (1 + z ) a+x. James Stirling próbował zastosować szeregi Newtona do uogólnienia funk cji silnia na liczby niecałkowite. Wpierw znalazł współczynniki Sn, dla któ rych wzór = m ; ^ 0 ; + s i ; + s2 (s.46) n jest tożsamością, gdy x = 0, x = 1, x = 2 itd. Ale odkrył, że otrzymał szereg rozbieżny poza nieujemnymi liczbami całkowitymi x. Spróbował zatem jeszcze raz, pisząc tym razem lnx! = £ sn Q = s0 Q + si ( * ) + s 2 ( * ) + • • ■ . ( 5 -4 7 ) „Forasmuch as these terms increase very fast, their differences will make a diverging progression, which hinders the ordinate of the parabola from approaching to the truth; therefore in this and the like cases, I interpolate the logarithms of the terms, whose differences constitute a series swiftly converging.” J. Stirling [344] |5 . W spółczynniki dwum ianowe Teraz A(lnx!) = ln(x + 1)! —lnx! = ln(x + 1), stąd dzięki ( 5 .4 0 ) sn = An (ln x ! ) | x = 0 = A n—1 (in(x + 1 )) |x = 0 =L (Dowód zbieżności został znaleziony dopiero w dziewiętnastym wieku.) n —1 n —1—k l n ( k + 1 ( - 1) k Szukanymi współczynnikami są więc so = Si = 0, s 2 = ln2, S3 = ln3 — 21n2 = ln | , S4 = ln4 — 31n3 + 31n2 = ln itd. W ten sposób Stirling otrzymał zbieżny szereg (choć nie umiał tego udowodnić). Faktycznie szereg zbiega dla wszystkich x > —1. Mógł zatem policzyć !. W ćwiczeniu 8 8 odnajdziemy resztę tej historii. Chwyt 3: Odwracanie (inwersja) Szczególny przypadek wzoru ( 5 .4 5 ), który właśnie wyprowadziliśmy dla sze regu Newtona, można zapisać w następującej postaci: g(n) = X. (v ) (— 1)1Cf(1c) Odwróć to: (zmb ppo’. ■1 )kg(k). (5 .4 8 ) Ten podwójny związek pomiędzy f i g jest nazywany regułą odwracania. Jest on podobny do podanych przez Mobiusa reguł odwracania (4 .5 6 ) i (4 .6 1 ). Reguła odwracania wyjaśnia nam, jak rozwiązywać „uwikłane rekurencje,” z występującym w sumie nieznanym ciągiem. Na przykład, w przeciwieństwie do f(n) funkcja g(rt) może być znana. Chcemy znaleźć sposób pokazania, że g(n) = ^)kf M ' Wtedy wzór ( 5 .4 8 ) pozwoli nam wyrazić f (u) w postaci sumy znanych wartości. Równość ( 5 .4 8 ) możemy udowodnić korzystając z podstawowych metod poznanych na początku tego rozdziału. Jeżeli dla wszystkich n ^ 0 zachodzi 9 ( t i ) = L i c ( k ) ( - 1 )kf(k), to Ze względu na symetrię związku pomiędzy f i g dowód w drugą stronę jest taki sam. Zademonstrujmy wzór ( 5 .4 8 ) stosując go do rozwiązania „problemu pod rzucanych kapeluszy”: grupa n kibiców wygrywającej drużyny piłkarskiej podrzuciła wysoko w powietrze swoje kapelusze. Kapelusze spadły przypad kowo, z tym że każdy z n kibiców złapał jeden kapelusz. Na ile sposobów h(n, k) dokładnie k kibiców złapało swój własny kapelusz? Jeśli przyjmiemy, że n = 4 oraz kapelusze i kibice nazwani są A, B, C i D, to kapelusze mogą spaść na 4! = 2 4 możliwych sposobów (obok podajemy, ilu kibiców odzyskało swój kapelusz): 4 AB CD ABDC ACBD ACDB ADBC ADCB 2 2 1 1 2 BACD BADC BCAD BCDA BDAC BDCA CABD CADB CBAD CBDA CDAB CDBA 2 0 1 0 0 1 1 0 2 1 0 0 DABC DACB DBAĆ DBCA DC AB DCBA 0 1 1 2 0 0 d H(4,4) = i; H ( 4 , 3) = 0 ; H(4,2) = 6 ; h(4, l ) = 8 ; H(4,0) = 9 . Możemy wyliczyć H(n, k), jeśli zauważymy, że jest to liczba wyborów k szczęśliwych właścicieli kapeluszy, mianowicie (£), razy liczba sposobów takich upadków pozostałych n —k kapeluszy, by żaden z nich nie wrócił do swego właściciela, czyli h (n —k, 0). Permutacja jest zwana nieporządkiem , je śli przemieszcza każdy element. Liczba nieporządków rt obiektów jest czasami oznaczana symbolem ‘rij’, czytanym „rt podsilnia.” Stąd H(ri—k, 0) = ( n —k)j oraz ogólny wzór h.(n,k) = ( ^ ) h ( n - k , 0 ) = ( k ) ( n ~ k)i(Notacja dolnej silni nie jest powszechnie używana. Może nie jest ona naj lepsza, ale spróbujmy się do niej przyzwyczaić. Jeśli się „nj” nie przyjmie, zawsze będziemy mogli wrócić do „Dn”.) Nasz problem byłby rozwiązany, gdybyśmy znali postać zwartą nj. Zo baczmy zatem, co się da zrobić. Łatwo otrzymamy rekurencję, ponieważ suma względem wszystkich k liczb H(n, k) jest liczbą permutacji n kapeluszy: n! = ^ h ( n , k ) = k ( v V n ~ k)' k ' 7 k ' ' = » całkowite n ^ 0 . ( 5 -4 9 ) (W ostatnim wierszu zamieniliśmy k na n — k i na (£).) Dzięki tej uwikłanej rekurencji możemy policzyć wszystkie wartości H(n, k): 5. W spółczynniki dwumianowe n M n, 0 ) h(n, 1 ) M n, 2 ) h(n, 3) M n, 4) h(n, 5) 0 1 1 0 1 2 1 0 1 3 4 5 2 9 44 265 3 0 1 8 6 0 1 45 264 20 10 0 1 135 40 15 0 6 Sztuką w matematyce, jak i w życiu jest mieć wyczucie, które prawdy są bezużyteczpe. 224! M n, 6 ) 1 Oto przykład, w jaki sposób liczymy wiersz n = 4: Dwie skrajnie prawe liczby są oczywiste — na tylko jeden sposób wszystkie kapelusze wylądują na gło wach swych właścicieli i nie ma sposobu, by swoje kapelusze odzyskało tylko trzech z nich. (Kto odzyskałby czwarty kapelusz?) Dla k = 2 i k = 1, gdy zastosujemy nasz wzór na H(n,k), otrzymamy H(4,2) = (^)h{2}0) = 6 -1 = 6 i H(4,1) = ({)H (3,0) = 4 - 2 = 8 . Nie możemy zastosować tego wzoru do wy liczenia H(4,0)— gdy spróbujemy, otrzymamy równość H(4,0) = (q)H(4,0), niewątpliwie prawdziwą, lecz bezużyteczną. Gdy spróbujemy inaczej i za stosujemy równość h(4 , 0) + 8 + 6 + 0 + l = 4 ! , otrzymamy 4j = h ( 4 , 0) = 9. Podobnie nj zależy od wartości kj, gdzie k < rt. Jak możemy rozwiązać rekurencję ( 5 .4 9 )? Łatwo. Jest ona postaci ( 5 .4 8 ), gdzie g(n) = n! i f(k) = (—1)kkj. Zatem rozwiązaniem jest nj = (-1)n X r ) ( - l ) kk!. Dobrze, ale nie jest to dobre rozwiązanie. Jest to suma, która o ile to moż liwe, powinna być przedstawiona w postaci zwartej. Mimo to rozwiązanie to jest lepsze od rekurencji. Sumę można uprościć, ponieważ k! upraszcza się z ukrytym k! w (£). Spróbujmy. Otrzymamy -i= u! L (n-k)! OsCk^ru - 1 i n + k _= n! Z OsCksCn -I) 1 k! Otrzymana suma zbiega bardzo szybko do liczby Yicô(~^ )k/W Składnikami wykluczonymi z sumy są . V ■■f- k>rt h ll! k! = V r - n u— (n+1)! _____ — n + 1 g - ( ) (k + n + 1 )i ( ~ 1 ) n+1 kÔ (5-5o) i wielkość w nawiasach leży pomiędzy liczbami 1 i 1 — = S+ 2 * Dlatego wartość bezwzględna różnicy rtj i rt!/e jest równa w przybliżeniu l / u — do kładniej, jest większa niż liczba l / ( n + 2) i mniejsza niż 1/(rt + 1). Ale rtj jest liczbą całkowitą. Dla rt > 0 uzyskamy ją zaokrąglając n !/e do najbliższej liczby całkowitej. Stąd otrzymujemy szukaną przez nas postać zwartą: rtj = n! 1 T + 2 + [n = 0]. (5 .51) Jest to liczba rzutów, w których żaden z kibiców nie odzyska swojego ka pelusza. Gdy rt jest duże, istotniejsze jest znać prawdopodobieństwo takiego zdarzenia. Jeśli założymy, że każde z rt! losowań jest jednakowo prawdopo dobne— ponieważ kapelusze zostały podrzucone bardzo wysoko— to praw dopodobieństwo to równa się nj n!/e + 0 (1) 1 — = ---------;------- ------ ---- 0,367... . n! tl! e Zatem jeśli liczba rt jest bardzo duża, to prawdopodobieństwo przemieszcze nia wszystkich kapeluszy jest równe prawie 37%. Nawiasem mówiąc, rekurencją ( 5 .4 9 ) dla dolnych silni jest identyczna z rozważaną przez Stirlinga pierwszą rekurencją ( 5 .4 6 ). Zatem = kj. Te współczynniki są tak duże, że nic dziwnego, że nieskończony szereg ( 5 .4 6 ) dla x nie będących liczbami całkowitymi jest rozbieżny. Zanim przestaniemy zajmować się tym problemem, przyjrzyjmy się jesz cze dwóm regularnościom, które znajdziemy w tablicy z małymi wartościami H(rt,k). Po pierwsze, wydaje się, że liczby 1, 3, 6 , 10, 15, . . . leżące poniżej przekątnej wypełnionej zerami są liczbami trójkątnymi. Łatwo tego dowieść, ponieważ te elementy tabeli są równe H (n ,n —2 ), stąd Mn, n - 2) = ( n ^ 2) 2| = Po drugie, wydaje się, że liczby z dwóch pierwszych kolumn różnią się o ±1. Czy jest to zawsze prawdą? Tak: H(n, 0 ) —H(n, 1 ) = rtj—n ( n —1)j -(■* E x O ^k^n ilcx 7 / -(■'(■'-•i' x E 0<Jk<Cn—1 ( - i )1 ^ = n!Lf -_1 }n L = (_ i r . Innymi słowy, rtj = rt(rt — 1)j + (—1)TL. Jest to rekurencją znacznie prostsza od poprzedniej rekurencji ( 5 .4 9 ). Odwróćmy coś jeszcze. Jeśli zastosujemy metodę odwracania do wzoru ( 5 .4 1 ) v = [k j x + k lfx + n V xV n ) r ’ to otrzymamy Jest to interesujące, lecz nie całkiem nowe. Jeśli zanegujemy górny indeks w (x£ k), znowu otrzymamy odkrytą już wcześniej tożsamość ( 5 .3 3 ). 5.4. Funkcje tw orzące Przechodzimy teraz do najważniejszej w całej książce idei, pojęcia funkcji tworzącej. Nieskończony ciąg (ao, a-|, a.2 , . . . ) , którym chcemy się zajmować, może być wygodnie przedstawiony jako szereg potęgowy zmiennej z A(z) = a 0 + ai z + a 2 z 2 H----- = ^ a^z1. kÔ (Jeśli interesuje cię historia i użyteczność tej notacji, spójrz do [223].) ( 5 -5 2 ) Zmienną oznaczamy literką ‘z ’, ponieważ często będziemy myśleć o z jako liczbie zespolonej. W teorii funkcji zespolonych zwykle używa się ‘z’ we wzo rach. Szeregi potęgowe (znane też pod nazwą funkcji analitycznych lub funkcji holomorficznych) są sercem tej teorii. W kolejnych rozdziałach zobaczymy dużo funkcji tworzących. Jest im po święcony, faktycznie, cały rozdział 7. Naszym obecnym celem jest po prostu wprowadzenie podstawowych pojęć i zademonstrowanie użyteczności funkcji tworzących w badaniach nad współczynnikami dwumianowymi. Funkcja tworząca jest pożyteczna, ponieważ jest to pojedyncza wielkość reprezentująca cały nieskończony szereg. Często rozwiązujemy zadania przez skonstruowanie jednej lub więcej funkcji tworzących. Po przyjrzeniu się funk cji i po ewentualnych przekształceniach wracamy z powrotem do współczyn ników. Przy odrobinie szczęścia będziemy wiedzieć dostatecznie dużo o funk cji, by orzec coś o współczynnikach. Niech A(z) będzie dowolnym szeregiem potęgowym 2Zks>o a ^ - P o j mijmy wygodną (naszym zdaniem) notację [zn] A (z) = an . Innymi słowy, [zn] A (z) oznacza współczynnik przy zn w A(z). (5 -53 ) Niech A (z) i B(z) będą funkcjami tworzącymi dla ciągów (ao, a i , i (bo, , t>2 , . . . ) . Iloczyn A(z)B(z) jest szeregiem potęgowym ...) (a 0 + ai z + a 2 Z2 H-----)(b 0 + b iz + b 2 z 2 H------) = a 0 b 0 + (a0bi + a^b0)z + (a 0 b 2 + aibi + a 2 b 0 )z2 + • • • . Współczynnik stojący przy zn w tym iloczynie jest równy n a 0 bn + a-i bn- i + • • • + anb 0 a kbn -k • k= 0 Dlatego jeśli chcemy przekształcać dowolną sumę postaci n cn = Y . k= 0 , (5-54) i znamy funkcje tworzące A(z) i B(z), to otrzymamy Cn = [zn]A(z)B(z). Ciąg (cn ) zdefiniowany wzorem ( 5 .5 4 ) jest nazywany splotem ciągów (an ) i (bn ). Dwa ciągi są „splecione” tworząc sumę wszystkich iloczynów, dla których dolne indeksy sumują się do ustalonej wartości. Możemy powiedzieć, że splot ciągów odpowiada mnożeniu ich funkcji tworzących. Funkcje tworzące dają nam skuteczną metodę odkrywania i dowodzenia nowych równości. Na przykład, ze wzoru dwumianowego Newtona wiemy, że (1 + z ) T jest funkcją tworzącą ciągu ((J), (J), Q ) , . . . >: Jeśli przemnożymy obie funkcje, to otrzymamy inną funkcję tworzącą: (1 + z ) r (1 + z ) s = (1 + z ) r + s . Porównując współczynniki przy zn po obu stronach równania, otrzy mamy Odkryliśmy tożsamość Cauchy’ego ( 5 .2 7 )! (5-27)!= (5.27X4.27) (3.27X2.27) (1.27X0.27)1 Było to piękne i łatwe. Spróbujmy jeszcze raz. Tym razem użyjmy funkcję ( 1 - z ) r, która jest funkcją tworzącą ciągu ( ( - 1 )n (^)) = (G)>~(i)> 6 )> • • • )• Po przemnożeniu przez (1 + z ) r otrzymamy inną funkcję tworzącą o znanych nam współczynnikach: o -z n i+ z r = ( 1 - z 2)r . Po porównaniu współczynników przy zn otrzymujemy równanie r O U * ) '- '1* - '-" " " O * - parzyste]. ( 5 .5 5 ) Sprawdźmy je dla jednego lub dwóch drobnych przypadków. Na przykład, gdy n = 3, otrzymamy O G M O M G K )© -Każdy dodatni składnik znosi się z odpowiadającym mu składnikiem ujem nym. To samo stanie się dla dowolnej liczby nieparzystej n. Nie jest to in teresujący przypadek. Ale gdy n jest liczbą parzystą, powiedzmy n = 2, otrzymamy różniącą się od tożsamości Cauchy’ego nietrywialną sumę: Zatem wzór ( 5 .5 5 ) dla n = 2 jest prawdziwy. Okazuje się, że wzór ( 5 .3 0 ) jest szczególnym przypadkiem naszej nowej równości ( 5 .5 5 ). Współczynniki dwumianowe pojawiają się również w pewnych funkcjach tworzących, szczególnie w następujących ważnych tożsamościach, w których dolny indeks pozostaje stały, a górny się zmienia: Jeśli masz fluoryzujący flamaster, zaznacz te dwa równania. = ) zk > n -*)n+1 t-0 \ n (1 —z ) n + 1 = ^ ( k ) zk> \n kÔ x ■ K J całkowite u > o całkowite n ^ 0 . ( 5 -5 6 ) ( 5 -5 7 ) Druga tożsamość jest przemnożoną przez zn pierwszą tożsamością, czyli jest „przesunięta w prawo” o n miejsc. Pierwsza tożsamość jest ukrytym przy padkiem wzoru dwumianowego. Rozwijając za pomocą wzoru ( 5 . 1 3 ) funk cję (1 —z ) _1x_1 otrzymujemy przy zk współczynnik (_Tjc_1) ( — 1 )k, który po zanegowaniu górnego indeksu jest równy (k£ n) lub (n^k) . Te szczególne przypadki są warte wyraźnego zapisania, gdyż często są one używane w za stosowaniach. Dla n = Ow szczególnym przypadku szczególnego przypadku otrzymamy szereg geometryczny: kÔ Jest to funkcja tworząca ciągu ( 1 , 1 , 1 , . . . ) . Jest ona bardzo pożyteczna, ponieważ splot tego ciągu z dowolnym ciągiem jest ciągiem sum. Gdy dla wszystkich k zachodzi = 1 , wzór ( 5 .5 4 ) redukuje się do równości n Dlatego jeśli A(z) jest funkcją tworzącą ciągu (ao, a i , a 2 , . . . ) , to A (z)/(1 —z) jest funkcją tworzącą dla ciągu sum (co, c i , C2 , . . . ) . Zadanie o nieporządkach rozwiązane przez nas za pomocą odwracania przy okazji zadania o kibicach i podrzucanych kapeluszach, może być w in teresujący sposób rozwiązane za pomocą funkcji tworzących. Rekurencję możemy otrzymać w postaci splotu, jeśli przedstawimy (£) za pomocą silni i podzielimy obie strony przez n!: Funkcją tworzącą ciągu ((jp jp 5 7 , • • •) jest ez. Zatem jeśli oznaczymy ki kÔ to ze splotu i rekurencji otrzymamy 1 —z = ez D (z ). Stąd D(z) = ------ e " z 1 —z ------1 —z Porównanie współczynników przy zn daje Jest to wzór, który wyprowadziliśmy już wcześniej za pomocą metody od wracania. Dotychczas nasze badania nad funkcjami tworzącymi dały nam zgrabne dowody poznanych już wcześniej faktów, wyprowadzonych za pomocą bar dziej nieporęcznych metod. Jak do tej pory, za pomocą funkcji tworzących nie uzyskaliśmy żadnych nowych wyników, z wyjątkiem wzoru ( 5 .5 5 ). Te raz jesteśmy gotowi na coś nowego i bardziej zadziwiającego. Istnieją dwie rodziny szeregów potęgowych, które generują szczególnie bogatą klasę tożsa mości ze współczynnikami dwumianowymi. Zdefiniujmy uogólniony szereg dwum ianowy !Bt (z) i uogólniony szereg wykładniczy £t(z) wzorami: ® t(2) = £t(z) = L (tk+1)k'1 zk k! kÔ (5-58) kÔ Dowiedziemy w podrozdziale 7.5, że te funkcje spełniają tożsamości :Bt (z)1 _ t - : B t ( z ) _t = z; £t (z)- t l n £ t (z) = z. ( 5 .5 9 ) W szczególnym przypadku t = 0, otrzymamy !B0(z) = 1 + z; Uogólnione szeregi dwumianowe £ t (z) zostały odkryte w 1750 roku przez J. H. Lamberta [236, §38], który kilka lat później zauważył [237], że ich potęgi spełniają pierwszą z tożsamości (5 .60). W ćwiczeniu 84 dowiemy się jak wyprowadzić wzór (5-fo) £ 0(z) = ez ; co wyjaśnia, dlaczego szeregi z parametrem t są nazywane „uogólnionymi” szeregami dwumianowymi lub wykładniczymi. Następujące pary tożsamości są prawdziwe dla wszystkich liczb rzeczy wistych r: ® t(z)r = Y . kÔ tk + r ,k . k 7 tk + r Z kÔ Bt (zY (tk + r) k —1 X . k! ( 5 -6 o) (tk + r)k ^k k! (5.6i) X . kÔ St(z ) 1 1 — zt£ t (z) = y kÔ z tożsamości (5 .60). (Jeśli tk + r = 0 , to przy interpretacji współczynnika przy zk musimy za chować ostrożność— każdy z nich jest wielomianem zmiennej r. Na przykład wyrazem wolnym sumy £ t (z)r jest r (0 + r)_1 , i równa się on 1 nawet wtedy, gdy r = 0 .) ;H?I . 5: f ■. funkcje tw?rz^CG Ponieważ równania (5 .6 0 ) i ( 5 .6 1 ) są prawdziwe dla wszystkich r, otrzy mamy bardzo ogólne tożsamości, gdy przemnożymy przez siebie szeregi od powiadające różnym potęgom r i s. Na przykład / tk + ® t ( *v 1 - t + t2t(z)-' tj + S t 2— V k kSO /tk + r tk + r \ r / t ( n —k) + s ) tk + r V n - k = £ « " £ fV k nÔ kÔ Ten szereg potęgowy musi być równy 1- < B t {z)r+s _ t + t^tfz) - 1 _ y- (\n + r + s rt nÔ 2 _ Po porównaniu współczynników przy zn , otrzymamy tożsamość y ^tk + ^t(n —k) + s n tk + r tn + r + s n całkowite rt, prawdziwą dla wszystkich r, s i t. Jeśli t = 0, tożsamość ta redukuje się do tożsamości Cauchy’ego. (Jeśli przypadkiem zdarzy się, że we wzorze liczba tk + r będzie równa zeru, to mianownik tk + r powinien skrócić się z tk + r znajdującym się w liczniku współczynnika dwumianowego. Obie strony toż samości są wielomianami zmiennych r, s i t.) Podobne równości otrzymamy mnożąc 33-t(z)r przez !Bt (z)s itd. W tabeli 232 możemy znaleźć rezultaty. Nauczyliśmy się, że dobrym pomysłem jest sprawdzenie szczególnych przypadków ogólnych wyników. Co się stanie, gdy wstawimy t = 1? Uogól niony szereg dwumianowy 231 (z) jest bardzo prosty— jest równy ®,(z) = £ z k = kÔ dlatego korzystając z 231 (z) nie dowiemy się niczego więcej, czego byśmy już nie wiedzieli z tożsamości Cauchy’ego. Ale £1 (z) jest ważną funkcją Elz) = Z ( k + ^ k~1$ kÔ = ' + z + b 2 + h 3 + ]S - z4 + - ( 5 .6 6 ) Aha! Jest to iterowana potęga £ ( l n z ) = z 2* której jeszcze nie widzieliśmy. Spełnia ona podstawową tożsamość ZZZz £(z) = ez£<*>. (5.67) Funkcja ta, wpierw badana przez Eulera [117] i Eisensteina [91], pojawia się w wielu zastosowaniach [193, 204]. zz. . . 232 fs . W spółczynniki dwumianowe - T ab ela 232. Sploty prawdziwe dla liczb całkowitych u ^ 0 >*+■ kWW**rł;ii r \ / t n — tk + s \ *. r / t u + r + s" |X -(^ ^ J ^ u —k /tk + r | y - / t k + r \ /t u —tk + s\ ^ r j \ k / \ n —k _. /tk + r . tu —tk + s t tu + r + s \ u -( ( fy " ( f \ ) ( t k + r ) k ( t n — t k + s) / ^ /tn + r + s (tU + T + s}n . tk + r ( t k + r ) k ( t u - t k + s) V / = tk + r tu — tk + s \ 5 ( t n + r + s)' I Szereg potęgowy fy§ £ Ę rlin ^ ^ ^ ' r + $ r + s tn + r + s ' ( 5 -6 5 ) ■b <«7; I Szczególne przypadki t = 2 i t = —1 uogólnionego szeregu dwumianowego są bardzo interesujące, ponieważ ich współczynniki pojawiają się bez ustanku w zadaniach o rekurencyjnej strukturze. Dlatego dobrze jest je zapisać z myślą o przyszłych zastosowaniach: 3 i / 2 ( z)t = ( V ^ + 4 + z)2r/4r jest też warty napisania. ® 2 (z) 1 - VI - 4 z - £ ( \ 2Vk ' ) 1 + 2 k 2z ( 5 .6 8 ) B - i (z) 2 k - 1 \ (-z) - £ 1 —2 k 2k + r ®2 W r = £ 2k + r ® _ , ( Zr = X ^ , r ~k ,0/' r^ - :-k Z,C• k 1 + v T + 4z ( 5 -6 9 ) (5-70) (5-7i) ®2(2)T = Z f 2V T) z,C- (5^) S - ' (z)r+' = Z f T; kV k -s/ T + 4 z ^ V k (5-73) Współczynniki (2T[l) + r z ® 2 (z) są nazywane liczbami Catalana CU| ponieważ francuski matematyk Eugene Catalan napisał o nich ważną pracę w latach trzydziestych dziewiętnastego stulecia [56]. Ciąg ten zaczyna się od liczb: rt 0 1 2 3 4 5 6 7 8 9 10 Cn 1 1 2 5 14 42 132 429 1430 4862 16796 Współczynniki 2>_i (z) są tymi samymi liczbami, z tym że znajdziemy na początku dodatkową liczbę 1 , a pozostałe liczby mają naprzemienne znaki: ( 1 , 1 1 , 2 , —5 , 1 4 , . . . ) . Stąd 23_i (z) = 1 + z^Bzi—z). Również zachodzi rów ność 23_i (z) = ‘B zi—z)- 1 . Zakończmy ten podrozdział wyprowadzając ze wzorów ( 5 .7 2 ) i ( 5 .7 3 ) tożsamość, która pokazuje inne związki między funkcjami *B_i (z) i"Bzi—z): B _ ,(z)n+1 - ( - z ) n+1B2( - z ) n+1 V- ------------ --------------------' k S k * u Jest ona prawdziwa, ponieważ w (—z ) n+1 ‘B zi—z)n+1/ V l + 4z współczynni kiem przy zk jest liczba VT+~4 z Vl +4z = ( _ 1)T v + l(_ 1) k - ^ - 1[z k - n - 1] ® 2(z)n+1 a/ 1 —4z k —rt — 1 ’)ŁCkn-k\ k S - i ( s )" +1 W vT+4z gdzie k > n. Składniki znoszą się wzajemnie. Możemy teraz skorzystać ze wzorów ( 5 .6 8 ) i ( 5 .6 9 ), by uzyskać postać zwartą V- / n - k \ k 1 Ę-S * > ( ( \ + s / U Ź i \ n+' — 2— J - / l - v T + 4 i V +1 (— 5— ) całkowite n ^ 0 . ( 5 .7 4 ) (Szczególny przypadek z = —1 pojawił się w zadaniu 3 w podrozdziale 5 .2 . Ponieważ liczby ^ 0 ± V ~ 3 ) są pierwiastkami szóstego stopnia z jedności, więc sumy (nk1c) (—1)k są okresowe.) Podobnie, po połączeniu wzorów ( 5 .7 0 ) i ( 5 .7 1 ) znikną duże współczynniki i otrzymamy /n-k \ t n ) — k e (1 + V T 4 4 z Y l , p - V U 4 z \ n = H ż — ) ■ całkowite rt > 0 . ( 5 -7 5 ) 5.5. Funkcje hipergeom etryczne One są nawet bardziej zmienne niż kameleony: możemy je rozkroić i potem złożyć do kupy razem na różne sposoby. Cokolwiek, co ocalało przez stulecia z tak straszliwą notacją, musi być bardzo pożyteczne. Metody, które zastosowaliśmy do współczynników dwumianowych Newtona, jeśli skutkują, to są bardzo efektywne. Musimy jednak przyznać, że często wydają się być bardziej sztuczkami magicznymi niż porządnymi metodami. Jeśli pracujemy nad zadaniem, często możemy pójść w różnych kierunkach, i stąd może się zdarzyć, że zamiast posuwać się naprzód, krążymy w kółko. Współczynniki dwumianowe są jak kameleony— łatwo zmieniają swą postać. Dlatego naturalne jest pytanie, czy nie istnieje jakaś jedna metoda, która pozwoliłaby zająć się wielką liczbą sum ze współczynnikami dwumianowymi. Odpowiedź na szczęście brzmi: tak. Ta metoda opiera się na teorii pewnych nieskończonych sum zwanych szeregami hipergeometrycznymi. Studia nad szeregami hipergeometrycznymi zostały rozpoczęte wiele lat temu, przez Eulera, Gaussa i Riemanna. Szeregi te, prawdę mówiąc, są ciągle przedmiotem poważnych badań. Szeregi hipergeometryczne mają straszną notację, do której przyzwyczajenie się zajmie trochę czasu. Ogólne szeregi hipergeometryczne są szeregami potęgowymi zmiennej z z-m + n parametrami i są zdefiniowane za pomocą przyrastających potęg: Ql, b!,. - x = y ^ _ . Ś - 0 ' b f . . . b * k! ( 5 .7 6 ) Liczby a nazywamy górnym i param etram i; pojawiają się one w liczni kach składników F. Liczby b nazywamy dolnymi param etram i; pojawiają się one w mianownikach. Wielkość z jest nazywana argumentem. Aby unik nąć dzielenia przez zero, żaden z dolnych parametrów nie może być zerem ani ujemną liczbą całkowitą. Poza tym ograniczeniem górne i dolne parame try mogą przybierać dowolne wartości. Notacji *F(cli , . . ., am; b i , . . . , b^; z)’ używamy również jako notacji alternatywnej do dwuwierszowej postaci toż samości ( 5 . 7 6 ), ponieważ jednowierszowa postać czasami lepiej się sprawdza typograficznie. W podręcznikach często znajdziemy ‘mFn ’ zamiast lF jako oznaczenie szeregu hipergeometrycznego z m górnymi i z u dolnymi parametrami. Ale dodatkowe indeksy zapełniają wzory i zabierają nam czas, jeśli jesteśmy zmu szeni ciągle je pisać. Możemy policzyć, ile mamy parametrów, stąd nie po trzebujemy dodatkowych symboli. Wiele ważnych funkcji okazuje się szczególnymi przypadkami szeregów hipergeometrycznych. Jest to powód, dla którego są one tak ważne. W naj prostszym przypadku, na przykład, gdy m = n = 0 , tzn. nie ma żadnych parametrów, otrzymujemy znajomy szereg Gdy m lub rt są równe zeru, ten zapis wygląda nieco dziwnie. By tego unik nąć, możemy wstawić dodatkowe ‘T do górnego i dolnego wiersza: Nie zmienimy funkcji, jeśli wykreślimy lub wstawimy takie same parametry z/do licznika i mianownika. Następnym z najprostszych przypadków jest m = 1, ai = 1 i rt = 0. Zmienimy parametry na m = 2, a-\ = a 2 = J , n = 1 i bi = 1, by mieć rt > 0. Jest to też znajomy nam szereg, gdyż l k = ki: To nasz stary przyjaciel, szereg geometryczny. F (a i, . . . , a m; b i , . . . , bn ; z) jest zwany szeregiem hipergeometrycznym, ponieważ zawiera w sobie, jako bardzo szczególny przypadek, szereg geometryczny F(1,1; 1; z). Jeśli skorzystamy ze wzoru ( 5 .5 6 ), ogólny przypadek m = 1 i rt = 0 jest łatwy do przedstawienia w postaci zwartej Jeśli zastąpimy a przez —a i z przez —z, otrzymamy wzór dwumianowy Newtona, -a, 1 1 -Z = (1 + Z ) Q Ujemna liczba całkowita jako górny parametr powoduje, że szereg nieskoń czony staje się sumą skończoną, ponieważ dla liczb całkowitych a takich, że k > a ^ 0 , zachodzi (—a)k = 0 . Przypadek m = 0, rt = 1 jest innym słynnym szeregiem, choć może nie jest zbyt dobrze znany w matematyce dyskretnej: 1 \ b ,1 r ) v~ Z ( b - 1 )! zk ( b - 1 +k) ! k! ~ , b- ’ ( ( b - 1 )! z (b - i ) / 2 • , x (5-78) Funkcja I^-i jest zwana „zmodyfikowaną funkcją Bessela” rzędu b — 1. Gdy b = 1, otrzymamy F ( 111 |z) = lo{2y/z), który jest interesującym szeregiem HkJsO zVk!2. Inny szczególny przypadek, m = n = 1, jest zwany „szeregiem hipergeometrycznym konfluentnym” i często oznaczany literą M: a % ~k ~k = Y - h z T = M (a >b >z )kÔ ^ |C‘ (5-79) Funkcja ta, ważna w zastosowaniach inżynierskich, była wprowadzona przez Ernsta Kummera. Niektórzy z nas dziwią się zapewne, czemu do tej pory nic nie powie dzieliśmy o zbieżności szeregu nieskończonego ( 5 .7 6 ). Odpowiemy, że można ignorować zbieżność, jeśli traktujemy zmienną z jako symbol formalny. Nie jest trudne sprawdzenie, że formalne sumy nieskończone postaci Xlk$m 0i^ tworzą ciało, jeśli współczynniki oc^ są elementami jakiegoś ciała. Możemy dodawać, odejmować, mnożyć, dzielić, różniczkować i składać takie formalne sumy, nie martwiąc się o ich zbieżność. Każda równość, jaką uzyskamy, będzie formalnie prawdziwa. Na przykład, hipergeometryczny szereg F ( 1 ,] ,1 |z) = Xkô k! nie jest zbieżny dla żadnej niezerowej wartości z, ale jak zoba czymy w rozdziale 7, możemy z niego korzystać przy rozwiązywaniu zadań. Z drugiej strony, jeśli zastąpimy z konkretną liczbą, musimy być pewni, że nieskończona suma jest dobrze zdefiniowana. Następny w kolejce jest najsłynniejszy z szeregów hipergeometrycznych. Faktycznie to on był nazywany szeregiem hipergeometrycznym do około roku 1870, kiedy to został uogólniony do dowolnych m i n . Ma on dwa górne i jeden m dolny parametr: a, b c akbk zk = / — —rk =----V| • ( 5 -8 o) kÔ c Ponieważ wiele subtelnych własności było udowodnionych po raz pierwszy przez Gaussa w jego pracy doktorskiej z roku 1812 [143], jest też często nazywany szeregiem hipergeometrycznym Gaussa, pomimo że Euler [118] i Pfaff [293] zajmowali się tym szeregiem wcześniej. Jednym z jego szczególnych przypadków jest ln (1 + z) = zF ( ^ Tc! Tc! (—z)k z3 z4 ~ ZI z2 = Z~ T + T ~ T + " ' ' Zauważmy, że z - 1 ln(1 + z) jest funkcją hipergeometryczną, ale ln(l + z) nie jest, ponieważ szeregi hipergeometryczne zawsze mają wartość 1 , gdy z = 0. Do tej pory szeregi hipergeometryczne nic nie zrobiły dla nas, z wy jątkiem usprawiedliwienia dla swej nazwy. Ale zobaczyliśmy kilka bardzo różnych funkcji, które wszystkie mogą być uważane za szeregi hipergeome tryczne. Zobaczymy, że olbrzymia klasa sum może być zapisana jako szereg hip ergeometryczny w „kanoniczny” sposób, stąd możemy stworzyć dobry sys tem gromadzenia faktów o współczynnikach dwumianowych. Jakie szeregi są hipergeometryczne? Łatwo odpowiemy^ na to pytanie, jeśli przyjrzymy się ilorazowi dwóch kolejnych składników: bi,...,^ k> 0 bk . . . b k k! Pierwszy składnik to = 1, a ilorazy pozostałych składników są dane wzorem t k+1 a k+T. . . a k+T tfc a J f . . . akt - bk . . . b k k! bk+ 1 . . . b k+1 ( k + 1 )! (Tc + d i ) . . . (Tc + Qm ) z (k + b i ) . .. (k + bn ) ( k + 1 ) z k+1 zł (5-8i) Jest to funkcja w ym ierna zmiennej k, tzn. iloraz wielomianów zmiennej k. Zgodnie z podstawowym twierdzeniem algebry, każdy wielomian zmiennej k może być przedstawiony jako iloczyn wielomianów liniowych (o współczyn nikach zespolonych). Górne parametry a są negacjami pierwiastków wielo mianu w liczniku, a dolne parametry b są negacjami pierwiastków wielomianu „There must be many universities to-day where 95 per cent, if not 100 per cent, of the functions studied by physics, engineering, and even mathematics students, are covered by this single symbol F(a,b;c;x).” W. W. Sawyer [319] w mianowniku. Jeżeli mianownik nie zawiera szczególnego czynnika ( k + 1 ) , możemy dopisać ( k + 1 ) równocześnie do licznika i mianownika. Stały czynnik pozostaje i nazywamy go z. Dlatego szeregami hipergeometrycznymi są do kładnie te szeregi, których pierwszym składnikiem jest 1 i dla których iloraz składników tic+i / t k jest funkcją wymierną zmiennej k. Załóżmy na przykład, że mamy dany nieskończony szereg o ilorazie skład ników tk+i k 2 + 7k + 1 0 " tT = 4k 2 + 1 ’ będącym funkcją wymierną zmiennej k. Wielomian w liczniku rozbija się prosto na iloczyn (k+2)( k+5), a w mianowniku 4 (k + i/2 )(k —i/2 ). Ponieważ w mianowniku nie ma czynnika (k + 1 ), więc zapisujemy iloraz składników w postaci tic+ i = tk (k + 2)(k + 5 ) ( k + l ) ( 1 / 4 ) (k + i / 2 ) (k —i / 2 ) (k + 1 ) ’ i możemy odczytać wynik: danym szeregiem jest x> = *»fGA-J2I,/4 (Teraz jest dobry czas na ćwiczenie rozgrzewkowe 11.) Mamy zatem ogólną metodę znajdowania hipergeometrycznej postaci da nej wielkości S, jeśli tylko jest to możliwe: na początku zapiszmy S jako nie skończony szereg o niezerowym pierwszym składniku. Zapiszmy ten szereg jako H k^ 0 tic, gdzie t 0 ^ 0. Policzmy teraz t k+i / t k. Jeśli iloraz składników nie jest funkcją wymierną, nie mamy szczęścia. W przeciwnym razie wy raźmy go w postaci ( 5 .8 1 ). Otrzymamy parametry d i , . . . , a m, b i , . . . , bn , i argument z, taki że S = to F( a i , . . . , am; b i , . . . , b^; z). Szereg hipergeometryczny Gaussa możemy zapisać w postaci rekursywnego iloczynu a, b c f f ab a+1b+1 a+2b+2 = i + -r ó-----r 1 + —5--------r r z 1 + 1~ c z V1 + “ 2 c +r 1z V 3 c+2 Spróbujmy przeformułować napotkane wcześniej tożsamości ze współ czynnikami dwumianowymi, tak by je przedstawić jako szeregi hipergeome tryczne. Na przykład, spróbujmy wykombinować, jak wygląda prawo równo ległego sumowania, ^ (T)/ = (T +n+1)/ ’ \ k<$n \ Całk0Wlte n ’ w notacji hipergeometrycznej. Musimy zapisać sumę jako nieskończony szereg zaczynający się od k = 0 , zatem zastąpmy k przez rt —k: Szereg ten, choć formalnie nieskończony, faktycznie jest skończony, ponieważ wielkość (tl—Tc)! w mianowniku powoduje, że = 0, gdy k > n. (Zobaczymy później, że 1 /x! jest zdefiniowane dla wszystkich x i że jeżeli x jest ujemną liczbą całkowitą, to 1/x! = 0. Ale na razie ignorujmy takie drobiazgi dopóty, dopóki nie nabędziemy więcej hipergeometrycznego doświadczenia.) Iloraz składników wynosi tic+i (r + n —k — l)!r! (rt —k)! tl —k t k ~ r! ( n - k - 1 )! (r + n - k ) ! _ r + n - k = ( k + 1 )(k —n ) ( 1 ) (k —n —r ) ( k + 1 ) ‘ Co więcej, to — C • Zatem prawo równoległego sumowania jest równo ważne hipergeometrycznej równości Po podzieleniu przez (r* n) otrzymamy nieco prostszą wersję Przekształćmy jeszcze jedną równość. Iloraz składników tożsamości ( 5 .1 6 ), całkowite m, wynosi (k—m ) / ( r —m + k + 1 ) = (k + 1 )(k—m )(1 ) / ( k —m + r + 1 ) ( k+T), jeśli zastąpimy k przez m —k. Stąd ze wzoru ( 5 . 1 6 ) uzyskujemy postać zwartą dla Jest to ta sama funkcja, co funkcja hipergeometryczna z lewej strony równości ( 5 .8 2 ), z tym że m zastąpiło n, a r+ 1 zastąpiło —r. Dlatego tożsamość ( 5 . 1 6 ) może być wyprowadzona z ( 5 .8 2 ) — hipergeometrycznej wersji równości ( 5 .9 ). (Nie dziwmy się zatem, że tak łatwo udowodniliśmy ( 5 . 1 6 ) używając równości ( 5 .9 ).) 5. W spółczynniki dwum ianowe (Dowodziliśmy równości dla całkowitych r i używaliśmy argumentu wielomianowego by pokazać, że są one prawdziwe dla dowolnych liczb rzeczywistych. Teraz dowodzimy równość dla niecałkowitych wartości r by używając następnie granicy pokazać, że są one prawdziwe dla wartości całkowitych!) Zanim pójdziemy dalej, powiniśmy pomyśleć o przypadkach zdegenerowanych, ponieważ szeregi hipergeometryczne nie są zdefiniowane, gdy dolny parametr jest zerem lub ujemną liczbą całkowitą. Zwykle stosujemy tożsa mość równoległego sumowania dla dodatnich liczb całkowitych r i rt, ale wtedy —rt —r jest ujemną liczbą całkowitą i szereg hipergeometryczny ( 5 .7 6 ) jest nieokreślony. Co możemy zrobić, by móc używać wzoru ( 5 .8 2 )? Odpo wiedzią jest, że możemy wziąć granicę funkcji gdy e —» 0 . Zajmiemy się tym jeszcze później w tym rozdziale, ale teraz musimy sobie zdawać sprawę, że niektóre mianowniki mogą sprawiać kłopot. Interesujące jest, że pierwsza suma, jaką próbowaliśmy wyrazić hipergeometrycznie, oka zała się zdegenerowana. Innym słabym miejscem naszego wyprowadzenia wzoru ( 5 .8 2 ) jest to, że wyraziliśmy (T^ kk) jako (r + rt —k)!/r! (rt —k)!. Wzór ten jest błędny, gdy r jest ujemną liczbą całkowitą, ponieważ (—rrt)! musi równać się 0 0 , jeśli ma być spełnione prawo 0! = 0 • (—1 ) • (—2 ) -m + 1 -m)! Znowu, aby uzyskać wynik dla liczb całkowitych, musimy rozważyć granicę wyrażenia r + e, gdy e —» 0 . Ależ wzór (£) = r!/k! (r — k)! obowiązuje tylko wtedy, gdy r jest liczbą całkowitą! Jeśli chcemy efektywnie pracować z funkcjami hipergeometrycz nymi, potrzebujemy zdefiniować funkcję silnia dla wszystkich liczb zespolo nych. Szczęśliwie taka funkcja istnieje. Może być zdefiniowana na wiele spo sobów. Oto jedna z najbardziej pożytecznych definicji funkcji z!, właściwie definicja 1 /z!: 1 z! = lim ( n + z )n ~ * tx—^00 V n (5 -8 3 ) (Zobacz ćwiczenie 2 1 . Euler [99, 1 0 0 , 76] odkrył ten wzór w wieku 22 lat.) Granica istnieje dla wszystkich liczb zespolonych z i jest równa zeru tylko wtedy, gdy z jest ujemną liczbą całkowitą. Inną ważną definicją jest t ze * d t , j - rJo gdy > -1 ( 5 -8 4 ) Całka istnieje tylko wówczas, gdy część rzeczywista z jest większa niż —1. Możemy jednak użyć wzoru z! = z (z — 1 )! ( 5 -8 5 ) by rozszerzyć definicję na wszystkie liczby zespolone (z wyjątkiem ujemnych liczb całkowitych). Inną definicję otrzymamy z przybliżenia Stirlinga lnz! we wzorze ( 5 .4 7 ). Wszystkie te definicje dają tę samą funkcję uogólnionej silni. Istnieje też bardzo podobna funkcja, zwana funkcją gam m a , która jest związana ze zwykłymi silniami, podobnie jak ubywające potęgi są związane z przyrastającymi potęgami. Standardowe podręczniki często używają równo cześnie silni i funkcji gamma. Dobrze jest móc w razie potrzeby przekształcać wzajemnie te funkcje. Oto potrzebne wzory: (5 -86 ) T ( z + 1 ) = z!; (- z )i r(z) = 7T (5 -87 ) s m 7tz Możemy użyć uogólnionych silni do zdefiniowani uogólnionych potęg monotonicznych, gdy z i w są dowolnymi liczbami zespQlonymi: z— = Z = z! (5-88) Jak zapiszemy z do potęgi w , gdzie w jest liczbą sprzężoną z w ? (5 -89 ) r{z) Jedynym zastrzeżeniem jest to, że musimy użyć właściwych wartości gra nicznych, gdy w tych wzorach otrzymamy 00/00. (We wzorach nigdy nie otrzymamy 0/0, ponieważ funkcje gamma i silnia nigdy nie są równe zeru.) Współczynnik dwumianowy może być zapisany w postaci WJ a = lim lim - , , r £— cu-Kn> CU! ((_, cu)! ( 5 -9 0 ) gdzie z i w są dowolnymi liczbami zespolonymi. Wyposażeni w uogólnione silnie możemy powrócić do naszego celu, jakim jest zredukowanie wyprowadzonych wcześniej równości do ich postaci hiper geometrycznej. Wzór dwumianowy Newtona (5.13) okazuje się ni mniej, ni więcej wzorem (5.77), czego mogliśmy się spodziewać. Spróbujmy teraz prze kształcić tożsamość Cauchy’ego (5.27): L A r+ s n całkowite n. Składnikiem k-tym jest tk = r! S! (r —k )! k! (s —rt + k)! (rt —k)! y i nie obawiajmy się więcej używać uogólnionych silni w tych wyrażeniach. Jeśli tk zawiera czynnik (a + k )!, ze znakiem plus przed k, to dzięki równości (5.85) w ilorazie składników ti<+ i/t^ otrzymamy (<x+ k + 1 ) ! / ( cx + k.)! = k + Rozumiem. Liczymy granicę najpierw względem dolnego indeksu. Dlatego (*) jest równe zeru, gdy w jest ujemną liczbą całkowitą. Wartość granicy jest nieskończona, gdy w nie jest liczbą całkowitą, a z jest ujemną liczbą całkowitą. a + 1 . Jeśli (a+ k)! jest w liczniku tk, to w odpowiednim szeregu hipergeometrycznym ‘a + 1 ’ pojawi się jako górny parametr. W przeciwnym razie, jeśli (a + k )! jest w mianowniku tk, to ‘a + 1’ będzie dolnym parametrem. Podob nie czynnik ( a —k)! prowadzi do równości ( a —k—1} !/(a —k)! = (—1)/(k —a), co powoduje że ‘—a ’ jest dolnym (górnym) parametrem szeregu hipergeometrycznego, gdy czynnik (a —k)! jest w liczniku (mianowniku) tk- Czynniki niezależne od k, jak r! idą do to, ale znikają z ilorazu składników. Stosując ta kie chwyty, możemy bez dalszych obliczeń przewidzieć, że iloraz składników wzoru (5.27) jest równy k -r k-n k + 1 k + s —n + 1 tk+i tk razy (—1)2 = 1. Zatem tożsamość Cauchy’ego przybierze postać - r , -r t s —n + 1 rt 1 = r+ s n ( 5 -9 1 ) Możemy stosować ten wzór do wyliczenia F(a,b;c;z), gdy z = 1 i b jest ujemną liczbą całkowitą. Zapiszmy nieco inaczej wzór (5.91). Otrzymamy a ,b c Kilka tygodni temu badaliśmy to, co Gauss zrobił w przedszkolu. Teraz zajmujemy się tym, co robił po doktoracie. Czy ktoś chce nas przestraszyć? całkowite b ^ 0 lub 9t e > m a + mb. = 1 ( 5 -9 2 ) Tożsamość Cauchy’ego (5.27) odpowiada przypadkowi, gdy jeden z górnych parametrów, powiedzmy b, jest niedodatnią liczbą całkowitą. Gauss udowod nił, że równość (5.92) jest prawdziwa także wtedy, gdy a, b, c są liczbami zespolonymi spełniającymi warunek *Kc > + *Rb. W innych przypad kach szereg nieskończony F (a(ib |l) nie jest zbieżny. Gdy b = —n, równość może być zapisana w wygodniejszy sposób za pomocą potęg monotonicznych zamiast funkcji gamma: a, —n 1 = (c — a)n (a —c): całkowite n ^ 0. (5.93) (—c): Okazuje się, że wszystkie pięć tożsamości w tabeli 197 są szczególnymi przy padkami tożsamości Cauchy’ego. Wzór (5.93) uogólnia je wszystkie, gdy pra widłowo postępujemy w sytuacjach zdegenerowanych. Zauważmy, że wzór (5.82) jest szczególnym przypadkiem (a = 1) wzoru (5.93). Dlatego nie potrzebujemy pamiętać wzoru (5.82). Nie musimy też pamiętać wzoru (5.9), który prowadzi nas do równości (5.82), nawet gdy ta bela 202 mówi, że ten wzór należy zapamiętać. Program komputerowy prze kształcający wzory, poproszony o uproszczenie wzoru ^ k<n Cic*)* Przed- stawi sumę jako funkcję hipergeometryczną i skorzysta z uogólnionej tożsa mości Cauchy’ego. W zadaniu 1 podrozdziału 5.2 upraszczaliśmy sumę U* Jest to zadanie typowe dla funkcji hip ergeometryczny ch. Każdy hipergeometra z małą praktyką od razu odczyta te parametry i otrzyma F(1, —m; —n; 1). Hmm, to zadanie jest znów przypadkiem szczególnym tożsamości Cauchy’ego. Suma z zadań 2 i 4 odpowiada funkcji F(2 , *1 —n ;2 —m; 1}. (Musimy za stąpić wpierw k przez k + 1.) „Groźna” suma z zadania 6 jest tylko funkcją F(n + 1, —rt; 2; 1). Czy nie ma już sum, nie będących ukrytą wersją przepo tężnej tożsamości Cauchy’ego? Cóż, zadanie 3 lekko się różni od pozostałych. Suma w tym zadaniu jest szczególnym przypadkiem ogólnej sumy (n~ k)z k rozważanej w (5.74), z której to sumy otrzymamy zwarty wzór dla F ( 1+ 2 rV 2 ’ ""I-274) Czegoś nowego dowiedliśmy we wzorze (5.55), gdzie wyliczyliśmy współ czynniki wielomianu (1 —z )r (1 + z) r : P . 1—c—2n, —2n - 1 | = (~ 1)n ^ rt! ! . (C 1)! (c + n — 1j! całkowite n 0. Po uogólnieniu na dowolne liczby zespolone wzór ten jest zwany wzorem K u m m era : FI a’ b 1 + b -a . (b /2 )! b/2 - 1 ) = —gj— (h — a ) (5-94) (Ernst Kummer [229] udowodnił go w roku 1836.) Interesujące jest porównanie obu wzorów. Zastępując c przez 1 —2n — a otrzymamy, że wyniki są zgodne wtedy i tylko wtedy, gdy = 1 j n! Um M U b ^ -2 n b! = Um *— >—-* (2x)! (5.95) yó; gdzie u jest dodatnią liczbą całkowitą. Załóżmy na przykład, że n = 3. Wtedy powinniśmy otrzymać —6!/3! = limx^_3 x !/(2x)!. Wiemy, że obie liczby (—3)! i (—6)! są nieskończone. Gdybyśmy zignorowali tę trudność i wy obrazili sobie, że (—3)! = (—3)(—4)(—5)(—6)!, wtedy oba wystąpienia (—6)! by się skróciły. Musimy się jednak oprzeć tej pokusie, ponieważ zwodzi nas Kummer mussial tto nieźźle kummać. dając złą odpowiedź! Granicą x!/(2x)!, gdy x —> —3, nie jest (—3) (—4) (—5), ale zgodnie ze wzorem ( 5 .9 5 ) jest —6!/3! = (—4)(—5) (—6 ). By prawidłowo uprościć granicę we wzorze ( 5 .9 5 ), musimy użyć równo ści ( 5 .8 7 ), która wiąże silnie o ujemnych argumentach z funkcjami gamma o dodatnich argumentach. Zastąpmy x przez —n — e i niech e —» 0. Po zasto sowaniu dwa razy równości ( 5 .8 7 ) otrzymamy (—n —e)! r (n + e)fc sin(2n + 2 e) 7r sin(rt + e)n (—2rt —2e)! F(2n + 2e) Ponieważ sin(x+'y) = sin x cos'y+cosx siny, to korzystając z metod rozdziału 9 otrzymamy cos2rt7r sin2e7t = (—i r (2 + 0 (e)). cos ri7Tsm en Stąd i ze wzoru ( 5 .8 6 ) uzyskujemy pożądaną równość (-n -e)l lim = e-ô (—2 u —2e)i „ , m r(2n) = r(u) 2 ( - 1) , , n ( 2 n - 1 ) l _ f i m (2n)! 2 (—1 ) = (- 1 ) 1 n! Przejrzyjmy pozostałe napotkane w tym rozdziale tożsamości i przeksz tałćmy je do postaci hipergeometrycznej. Sumę (5 .2 9 ) z trzema współczyn nikami dwumianowymi zapiszemy jako 1—a —2n, 1—b —2n, —2n a, b = ( - 1 )’ (2 n)! (a + b + 2 rt — 1 )' rt! au bn Po uogólnieniu do liczb zespolonych jest ona zwana w zorem Dixona: a, b, c 1 + c —a, 1 + c —b (Historyczna notatka: Saalschutz [316] odkrył ten wzór prawie 100 lat później po tym, jak Pfaff [293] opublikował go po raz pierwszy. Po obliczeniu granicy n —>oo otrzymamy wzór (5-94) (c/2)! (c —a)— (c —b)— -)■ C! ( c - a —b)— (5-96) SHa + 5Kb < 1 + 9tc/2. Jednym z najbardziej ogólych wzorów, jaki napotkaliśmy, jest suma z ilo czynem trzech współczynników dwumianowych (5 .2 8 ), która daje nam to ż sam ość $aalschutza: a, b, - n c, a + b —c —n +1 1 = _ (c — a)n (c —b)n cn (c — a —b)n (a -c )Ł (b -c fi (—c )^ (a + b —c)S- (5-97) całkowite n ^ 0 . 5*5. Funkcje h ip ergeo m etryczn ej Wzór ten daje nam dla z = 1 wartość szeregów hipergeometrycznych z trzema górnymi i dwoma dolnymi parametrami, przy założeniu, że jeden z górnych parametrów jest niedodatnią liczbą całkowitą i zachodzi bi + b2 = ai + a.2 + a.3 + 1. (Jeśli suma dolnych parametrów przekracza sumę górnych parametrów o 2 zamiast o 1, to na podstawie wzoru z ćwiczenia 25 możemy wyrazić F (a i, a2, 0.3; bi ,b 2; 1) za pomocą dwóch funkcji hipergeometrycz nych spełniających warunki tożsamości Saalschiitza.) Nasza, tak ciężko wywalczona równość z zadania 8 w podrozdziale 5.2 redukuje się do wzoru 1+ x x + 1 , n + 1 , —n 1, x + 2 -rt—1 Cóż, jest to szczególny przypadek c = 1 tożsamości Saalschiitza (5.97). Zaosz czędzilibyśmy dużo pracy korzystając od razu z funkcji hipergeometrycznych! Co z zadaniem 7? Ta supergroźna suma daje nam wzór / n + 1 , m - n , 1, \ całkowite n > m > 0. y ^ m + l, j m + j , 2 który jest pierwszym przypadkiem z trzema dolnymi parametrami. Wygląda na nowy wzór. Ale nim naprawdę nie jest — lewą stronę równości można zastąpić przez wielokrotność n, m —n —1, \ m y j m —j i - 1 jeśli zastosujemy ćwiczenie 26. Tożsamość Saalschiitza wygrywa jeszcze raz. Dobrze. Jeszcze jedno dołujące doświadczenie, które pozwoli nam doce nić siłę metod hipergeometrycznych. Tożsamości z tabeli 232 nie mają hipergeometrycznych odpowiedników, ponieważ ich ilorazy składników są funkcjami wymiernymi zmiennej k tylko wtedy, gdy t jest liczbą całkowitą. Równości (5.64) i (5.65) nie są „hiper geometryczne” nawet gdy t = 1. Przyjrzyjmy się, co uzyskamy z równości (5.62), gdy t jest małą liczbą całkowitą: l 2 r>I r + 2 ’ - n ’ - T i- s V r+1, - n — j s , —n — \s + j \ _ ) ( J r> 5t+ 3’ J T + f ’ “—nn,- —n — j s y V7T+7, ir+l, — n — is, - (' r + s + 2n n V s + 2n n 1„ 1 1 r + s + 3n n s + 3n n (Historyczna notatka: George Andrews w 1974 roku [9, rozdział 5]. pierwszy wskazał na ważność szeregów hiperge ometrycznych dła równości ze współczynnikami dwumianowymi.) Z pierwszego z tych wzorów otrzymujemy znowu rozwiązanie zadania 7, jeśli wielkości (r, s, rt) zastąpimy odpowiednio przez (1 , m —2 ri —1 , rt —m). W końcu, „nieoczekiwana” suma (5 .20 ) daje nam nieoczekiwaną, lecz pouczającą tożsamość hipergeometryczną. Przekształćmy tę sumę: 2m - k \ 2lc = 2lm k^m v , ' kÔ . m —k Iloraz składników (2m —Tc)! 2^/rrt! (m —k)! równa się 2(k —m)/(k —2m), zatem uzyskaliśmy hipergeometryczną tożsamość dla z = 2 : 2) = 2 2m, całkowite m ^ 0 . (5 *98 ) Spójrzmy na dolny parametr ‘—2m }. Ujemne liczby całkowite są zabronione, zatem ta równość jest nieokreślona! Ponieważ zdegenerowaną funkcję hipergeometryczną możemy wyliczyć osiągając ją z pobliskich niezdegenerowanych punktów, najwyższy już czas — jak obiecaliśmy wcześniej— przyjrzeć się z uwagą tym granicznym przypad kom. Musimy bardzo uważać, ponieważ zależnie od sposobu policzenia gra nicy możemy otrzymać różne wyniki. Na przykład, otrzymamy dwie różne granice, gdy jeden z górnych parametrów zwiększymy o e: UmFl _ 1 + e ’ _ 3 V —2 + e e —>0 II 1 - lim (1 I M + e H - 3 ) , ( -1 + e )( e ) ( -3 ) (- 2 ) (—2 + e ) 1! +1 (—2 + e ) ( —1 + e ) 2! “ ei-inU 2+e) * 0 ' + (— + = lim F e->0 1 - f + 0 + 1 ( - 2 + e I’) = (-1+ e)(e)(1+ e)(-3)(-2)(-1) (_2+ e)(-l+ e)(e)3! = 0; + ( - 2 + e n i + 0 + °) Podobnie, zdefiniowaliśmy (“ ]) = 0 = limeô Nie jest to to samo, co lime_>o (Z]+e) —1 • Aby prawidłowo obejść się z (5 .98 ), musimy uświadomić sobie, że górny parametr —m powoduje zerowanie się wszystkich składników szeregu Lkzo (2r - t ) 2 k. gdy k > m. Chcemy udowodnić, że ( 2: ) F ( —2 m + e 12) = 22m ’ całk0wite m ^ ° - (5'99) Każdy wyraz w tej granicy jest dobrze określony, gdyż czynnik w mianow niku (—2m)k dopóty nie staje się zerem, dopóki k ^ 2m. Dlatego w granicy otrzymamy dokładnie sumę (5 .20 ), od której zaczęliśmy. 5.6. P rzek ształcen ia hipergeom etryczn e Powinno być jasne, że baza znanych postaci zwartych funkcji hipergeometrycznych jest użytecznym narzędziem dla wyliczenia sum ze współczynni kami dwumianowymi. Przekształcamy, po prostu, daną sumę do kanonicznej postaci hipergeometrycznej i następnie sprawdzamy w tabeli. Jeśli jest tam, wspaniale — mamy odpowiedź. Jeśli nie ma, to możemy ją dodać do bazy, jeśli suma okaże się mieć postać zwartą. Moglibyśmy także dołączyć wiersze do tabeli postaci „ta suma nie ma prostej postaci zwartej”. Na przykład, suma YLk<m (k) odpowiadająca funkcji hipergeometrycznej ma postać zwartą tylko wtedy, gdy m jest bliskie 0 , \ n lub n. Nie jest to koniec historii, ponieważ funkcje hipergeometryczne mogą spełniać swe własne równości. To znaczy, że każda postać zwarta funkcji hi pergeometrycznej prowadzi do innej postaci zwartej i do dodatkowego wiersza w bazie. Na przykład równości w ćwiczeniach 25 i 26 pozwalają nam prze kształcić jedną funkcję hipergeometryczną w dwie inne z podobnymi, lecz różnymi parametrami. Te funkcje z kolei można przekształcić ponownie. W 1797 r. J. F. Pfaff [293] odkrył zadziwiające prawo odbicia, ¥ f a }b 1 (1 - z ) a —z \ 1 —z ) _ [ a, c —b \( “ ■ c (5 .1 0 1 ) które jest przekształceniem innego typu. Jest to formalna równość szeregów potęgowych, otrzymana przez zastąpienie wielkości (—z)k/(1 —z)k+a z lewej strony równości szeregiem nieskończonym (—z)k (l + (kâ) z + (k+2 + 1)z 2 + •••) (zobacz ćwiczenie 50). Gdy z ^ 1, możemy na podstawie tego prawa wyprowadzić nowe wzory ze znanych już nam tożsamości. Na przykład, wzór Kummera ( 5 .9 4 ) można przekształcić przez prawo odbicia ( 5 . 1 0 1 ), gdy dobierzemy odpowiednio parametry: 2 - a F( a ! ) = ? ( a’ b 2 l 1 + b —a 1 + b —a -1 M H f(hb --na )) ^V i 2- . b! ( 5 -1 0 2 ; Jeśli podstawimy a = —rt i przekształcimy to równanie do postaci sumy ze współczynnikami dwumianowymi, uzyskamy równość, która być może przyda się nam któregoś dnia: y k$sO (-ri)k (1+rt)k 2~~k _ y ( 1 +b + rt)k (t ) k! ( T ) / ( n+r _ , - n (b / 2 )! (b+n)! b! (b / 2 +n)! ’ całkowite n ^ 0. k) ( 5 -1 0 3 ) Na przykład, gdy rt = 3, otrzymamy: 1- 3 4 2(4 + b) . 4 -5 4(4 + b)(5 + b) _ “ Żaden z nich nie interesuje się takimi bzdetami. 4-5-6 8(4 + b)(5 + b ) ( 6 + b) (b + 3)(b + 2 )(b + 1) (b + 6 )(b + 4 )(b + 2 ) * Niewiarygodne, ale prawdziwe dla wszystkich b. (Chyba, że znika któryś z czynników w mianowniku.) Zabawne, spróbujmy jeszcze raz. Może znajdziemy sumę, która zadziwi naszych przyjaciół. Co zrobi prawo odbicia Pfaffa, jeśli zastosujemy go do dziwnego wzoru ( 5 .9 9 ), gdy z = 2? W tym przypadku podstawiamy a = —m, b .= 1 , c = —2 m + e i uzyskujemy (—1)m lim F £—>•0 ( - m ,1 \ - 2m +i 21 = lim F e—>0 —m, —2 m —1 + e —2 m + e = lim Y e—>0 L— kÔ k) k^m (Histeryczna notatka: Zobacz ćwiczenie 51, jeśli otrzymałeś inny wynik.) (—m )k ( - 2 m - l + e ) k 2 ^ - 2 m + e)k k! (2 m )— ponieważ żadne z granicznych wyrażeń nie jest bliskie zera. Uzyskujemy inny cudowny wzór: k^m 2m + 1 (_ 2 )k = k / 2 m + l —k H ) m22m/ ( 2^ - 1/2 m Na przykład gdy m = 3, suma wynosi 1_7+ ^ -14 = - y , i (" Y 2) jest rzeczywiście równe —j$- całkowite m ^ 0 . ( 5 . 1 0 4 ) Gdy przeglądaliśmy nasze tożsamości dwumianowe i przekształcaliśmy je do postaci hipergeometrycznej, pominęliśmy wzór ( 5 . 1 9 ), ponieważ nie jest to równość sumy i jej postaci zwartej, lecz jest to równość dwóch sum. Za to teraz możemy uważać wzór ( 5 . 1 9 ) za równość dwóch szeregów hipergeome trycznych. Jeśli zróżniczkujemy ją rt razy względem zmiennej y i zastąpimy k przez m —n —k, otrzymamy L m kÔ m+ r n —k rt x,m - n - k y k rt —r n+ k = z L m:—rt -X) TL kÔ m—tl—k (x+ u )1 Prowadzi to do następującego przekształcenia hipergeometrycznego: a, —n (a — c)— ( c)— a, —u 1 —n + a —c 1 —z całkowite ( 5 -1 0 5 ) n ^ 0. Zauważmy, że dla z = 1 równość ta redukuje się do tożsamości Cauchy’ego (5 -9 3 )Różniczkowanie wydaje się być pożyteczne, jeśli mielibyśmy sugerować się tym przykładem. Przydało się nam w rozdziale 2 przy sumowaniu x + 2x 2 + • • • + rtxTL. Sprawdźmy, co się stanie, gdy zróżniczkujemy względem zmiennej z szereg hipergeometryczny: d / cii, . . . , ctm dz V b l>--->bn k+1 = z— Z ™ k+1 = L k+1 ~k ... a m ^ — 1 k+1 H + ' .. .bu +1 k! ai ( a i + 1 )k . . . a m(a m + 1 )k z k kÔ bi (bi + 1 )k . . . b-ajb^+l )k k! Ql F bi . . . bti ( 5 -1 0 6 ) Parametry przesunęły się na zewnątrz i powiększyły o jeden. Możemy zróżniczkować tak, by zmienić tylko jeden z parametrów, nie ruszając przy tym innych. Do tego celu używamy operatora d = z T z' Jak wymawiać d ? (Nie wiem, ale T^jK nazywa go ‘vartheta’.) który zróżniczkowaną funkcję mnoży przez z. Otrzymamy równość p / cn , . . . , a m \ \b i,...,b n ; = z y a zk = y - k a j . . <g j l zk j ^ b f . . . b * ( k - 1 )l 4 -0 bf...b£k! która sama w sobie nie jest zbyt użyteczna. Ale jeśli przemnożymy F przez jeden z parametrów, powiedzmy a-[, i dodamy to do #F, uzyskamy ( k + a 1 ) a 1k . . . a ^ t zk (S + a , ) F = kÔ L bk . .. bk k! a i ( a i + 1 ) lc 0-2 • • • a j l z k = kL^ 0 bk . . . b k k! a i + 1 , Q2, . . . , a m = aiF bi, . . . , b. Tylko jeden z parametrów jest powiększony o jeden. Podobny chwyt można zastosować z dolnym parametrem, ale wtedy uzy skamy parametr pomniejszony, zamiast powiększony o jeden: (fl + b! - 1 ) F ' a u . . . } a, b!,...,bn = kZ> 0 (k + b, - 1 )a*. .. < 4 zk bk . . . b * k ! y (hi - l X - . . a ^ z lc S 5 (b, - 1) k b f ...b * k ! (bi —1) F T \ b j - 1 , b2> bn z). y Możemy połączyć wszystkie te operacje tworząc matematyczny „kalam bur”, otrzymując tę samą wielkość na dwa różne sposoby. Mianowicie, mamy ($ + ai ) . . . ( # + am)F = ai ... am F z) ’ dl , . . • , dm b i- 1, bn — 1 gdzie F = F(di , . . . , am; b i , . . . , bn ; z). Ze wzoru ( 5 . 1 0 6 ) wiemy, że górny wzór jest pochodną dolnego wzoru. Stąd ogólna funkcja hipergeometryczną F spełnia równanie różniczkowe D (£ + bi — 1) . . . (-&+ bn — 1)F = (-&+ a 1) . . . ( ^ + a m)F, (5*107) gdzie D jest operatorem Czas na przykład. Znajdźmy równanie różniczkowe spełniane przez szereg hipergeometryczny F(z) = F(a,b;c;z). Zgodnie ze wzorem (5.107), mamy D(-& + c — 1)F = (S + a)(£ + b)F. Co to oznacza w zwykłej notacji? Cóż, (# + c —1)F to zF'(z) + (c — 1)F(z), a po zróżniczkowaniu otrzymamy F ^ + z F ^ z H fc -l^ z ). Po prawej stronie mamy (-&+ a) (zF7(z) + bF (z)) = z ^ (z F '(z )+ b F (z )) + a(zF'(z)+bF(z)) = zF/ (z )+ z 2F//(z)+bzF'(z) + azF/ (z) + abF (z). Przyrównując obie strony otrzymamy z (1 —z)F"(z) + (c —z(a + b + 1))F'(z) — abF(z) = 0 . (5*108) Równanie to jest równoważne iloczynowej postaci (5.107). Na odwrót, możemy z równania różniczkowego uzyskać szereg potęgowy. Załóżmy, że F(z) = ^ k>o tkZk jest szeregiem potęgowym spełniającym rów nanie (5.107). Bezpośrednie obliczenia pokażą nam, że tk+i tk (k + a i ) . . . (k + a m) (Tc + b i ) . . . (Tc + bn )(k + 1 ) ’ zatem F(z) musi być równe to F (a i, . . . , a m; b i , . . . , b^; z). Udowodniliśmy, że szereg hipergeometryczny (5.76) jest jedynym szeregiem formalnym z wy razem wolnym równym 1 i spełniającym równanie różniczkowe (5.107). Byłoby dobrze, gdyby funkcje hipergeometryczne rozwiązywały wszyst kie równania różniczkowe świata, ale tak nie jest. Prawą stronę równania (5.107) zawsze można przedstawić jako sumę składników postaci (z), gdzie F(k)(z) jest k-tą pochodną D kF(k). Lewą stronę można zapisać jako sumę składników postaci p ^ z ^ ^ ^ ^ z ) , gdzie k > 0. Zatem równanie róż niczkowe (5.107) zawsze ma szczególną postać z " - 1( P n -z < x u )F(n)(2 ) + --- + (p 1 - z a 1) F ' ( z ) - a 0F(z) = 0 . Funkcja H z) = 0 - z ) r spełnia -&F = z(d —r)F. To daje inny dowód wzoru dwumianowego. Równanie ( 5 . 1 0 8 ) ilustruje to dla przypadku rt = 2. Na odwrót, udowodnimy w ćwiczeniu 6.13, że dowolne różniczkowe równanie w tej postaci może być przedstawione jako iloczyn operatorów $ i otrzymujemy równanie podobne do ( 5 . 1 0 7 ). Są to równania różniczkowe, których rozwiązania są szeregami potęgowymi z wymiernym ilorazem składników. Mnożąc obie strony równości ( 5 . 1 0 7 ) przez z uwalniamy się od operatora D i otrzymujemy pouczający wzór W + b! - 1 ) . . . ( f l + bn - 1 ) F = z(£ + a 1) . . . ( £ + am)F. ( 5 -1 0 9 ) Pierwszy po lewej stronie czynnik $ = (#+1 —1) odpowiada ( k + 1) w ilorazie składników (5 .8 1 ), który to odpowiada k! w mianowniku k-tego składnika ogólnego szeregu hip ergeometrycznego. Inne czynniki (-&+bj —1) odpowiadają czynnikowi w mianowniku (k + bj), który odpowiada bk we wzorze ( 5 .7 6 ). Po prawej stronie z odpowiada zk, i (-&+ aj) odpowiada ak. Stosując teorię równań różniczkowych możemy znaleźć i udowodnić nowe przekształcenia. Na przykład możemy z łatwością sprawdzić, że obie funkcje hipergeometryczne / 2 a ,2b Va + b + 4 (Uwaga: Nie możemy stosować bezpiecznie wzoru (5 -no), gdy \z\ > 1/2, chyba że obie strony są wielomianami. Zobacz ćwiczenie 53.) a, b ?(V &+b + 4- 4z(1 —z) spełniają to samo równanie różniczkowe z(1 —z)F"(z) + (a + b + ^)(1 —2z)F/(z) —4abF(z) = 0; zatem jest spełniona tożsam ość Gaussa [143, równanie 1 0 2 ] p ( 2 a, 2 b hU + b + i = f ( a, b 4z(1 —z) \ a+b + ^ ( 5 -iio) r( a’ b \ a+b + ^ (5-iii W szczególności / 2 a ,2b U +b+i W rzeczywistości obie sumy są zbieżne poza zdegenerowanym przypadkiem, gdy a + b + \ jest niedodatnią liczbą całkowitą. = gdy obie nieskończone sumy są zbieżne. \ Każda nowa tożsamość hipergeometryczną ma swoje konsekwencje dla współczynników dwumianowych. Ta też nie jest wyjątkiem. Rozważmy sumę m —k \ / m + n + 1 \ / —l xlc n / \ k VT J Składniki są niezerowe, gdy 0 ^ k ^ m —rt, i biorąc granicę, jak już robiliśmy poprzednio, możemy wyrazić sumę jako funkcję hipergeometryczną elim —>-0 \ n ) n - m , —rt—m — 1 + a e —m + e )■ Wartość oc nie wpływa na granicę, ponieważ niedodatni górny element n —m ucina sumę dosyć wcześnie. Jeśli podstawimy oc = 2, to możemy zastosować wzór ( 5 . 1 1 1 ). Możemy wyliczyć teraz grsinicę, ponieważ prawa strona jest szczególnym przypadkiem wzoru ( 5 .9 2 ). Jak pokazano w ćwiczeniu 54, wynik może być wyrażony w prostej postaci L ( V ) ( m+r ' X k^m v 7 v / (m + n ) / 2 \ TL J \ t )' / 2n m[m + n parzyste], całkowite m ^ Tl u. (5-112) Na przykład gdy m = 5 i n = 2, otrzymamy (|) (®) - (*) (*)/2 + ( 2 ) © / 4 ~ (2 ) ( 3 ) /# = 10 —24 + 21 —7 = 0. Gdy m = 4 i n = 2, obie strony są równe W pewnych przypadkach wzór ( 5 . 1 1 0 ) da sumy dwumianowe dla z = —1, ale są one bardzo dziwaczne. Jeśli podstawimy a = \ — j i b = —rt, otrzymamy potworny wzór 2 _ 1 3 3 - 1 1 = F l a3 - i3n -8 Funkcje te są niezdegenerowanymi wielomianami, gdy n ^ 2 (mod 3) i pa rametry są tak sprytnie dobrane, że możemy lewą stronę przekształcić za pomocą wzoru ( 5 .9 4 ). Stąd otrzymujemy wzór 2n\ n) / \ n ) ’ całkowite n > 0 , n ^ 2 (mod 3). To najbardziej wstrząsająca tożsamość ze współczynnikami dwumianowymi, jaką kiedykolwiek widzieliśmy. Nawet dla małych liczb nie jest łatwa do ręczńego sprawdzenia. (Okazuje się, że obie strony dają gdy n = 3.) Oczywiście, tożsamość ta jest kompletnie bezużyteczna. Z pewnością nigdy nie znajdzie zastosowania w praktycznym problemie. Zobaczyliśmy, że szeregi hipergeometryczne pomagają nam w oblicze niu sum ze współczynnikami dwumianowymi. Wiele dodatkowych informacji znajdziemy w książce Baileya [18] i w książce Gaspera i Rahmana [141]. 5.7. C zęściow e sum y hipergeom etryczn e_______ W większości z wyliczonych w tym rozdziale sum zmienna indeksowa k prze biegała zbiór liczb całkowitych nieujemnych. Czasami znajdowaliśmy postać zwartą sumy o zakresie sumowania z przedziału a ^ k < b. Na przykład, Jedyny pożytek z równania (5 .113) to zademonstrowa nie istnienia niezwykle bezużytecznych tożsamości. 5. Współczynniki dwumianowe wiemy z równości (5 .16 ), że Z rt całkowite m. ( - i ) k = ( - 1) (5-114) k<m Teoria z rozdziału 2 dała nam piękną metodę rozumienia takich wzorów: Przyjmijmy f(k) = Ag(k) = g (k + 1) — g(k). Umówiliśmy się zapisywać £ f ( k ) ók = g(k) + C i ^ N ( k ) 5 k = g(k)|^ = g(b) —g (a ). Co więcej, gdy a i b są liczbami całkowitymi takimi, że a ^ b, mamy £ ^ f ( k ) 6k = Y. W a^kcb = 9(b ) “ 9(a)- Dlatego tożsamość (5 .114 ) odpowiada wzorowi sumowania nieoznaczonego 1 )k Sk = I +<= 1 wzorowi rozmcowemu A ik i'n = -1 1k+1 n +1 k+1 Łatwo jest zacząć od funkcji g(k) i wyliczyć funkcję Ag(k) = f (k), której suma nieoznaczona będzie równa g(k) + C. O wiele trudniej jest zacząć od funkcji f(k) i odnaleźć jej nieoznaczoną sumę Y f(k) = 9 (k) + C. Funk cja g może nie mieć prostej postaci. Na przykład nie istnieje prosta postać sumy Y © w przeciwnym razie moglibyśmy upraszczać sumy postaci H k ^ i r / 3 ( k ) - A m ° ż e istnieje prosta postać sumy Y ( k ) tylko jej nikt do tej pory nie wymyślił? Jak możemy być tego pewni? W roku 1977 R. W. Gosper [154] odkrył piękną metodę odszukiwania nie określonych sum Y f(k) 6k —g (Tc) H-C, jeśli tylko f i g należą do ogólnej klasy funkcji zwanych wyrazami hipergeometrycznymL^Zapiszmy k-ty składnik O-l > • • • > G-m bi, ... , bn ik z 1 = —L------ — — b \ ... b£ k! k (5-ii5) szeregu hipergeometrycznego F( a i , . . . , a m; b i , . . . , bn ; z). Będziemy uważać F( ai , . . . , a m; b i , . . . jbn.;z)k za funkcję zmiennej k, a nie jak dotychczas zmiennej z. W wielu przypadkach okazuje się, że dla danych a i , . . . , a m, b i , ..., bn, z istnieją stałe c, A i, ... , A m , Bi , . .., Bn , Z takie, że zachodzi równość ........ a ’ U l ........ bi z] k 6k = cF A i, . .. , A m Z) + C . k \ di , . .. , dn (5.116) Będziemy mówić, że dana funkcja F (a i, . . . , a m; b i , . . . , bn ; z)* jest sumowalna za pomocą wyrazów hipergeometrycznych , jeżeli istnieją takie stałe c, A i , . . . , Am, Bi , . . . , Bn, Z. Za pomocą algorytmu Gospera albo znaj dziemy te stałe, albo udowodnimy, że one nie istnieją. W ogólności powiemy, że t(k) jest wyrazem hipergeometrycznym , je żeli t ( k + 1)/t(k) jest funkcją wymierną zmiennej k nietożsamościowo równą zeru. Oznacza to, że w istocie t(k) jest wielokrotnością wyrażeń podobnych do (5.115). (Problem sprawiają zera w mianowniku, ponieważ chcemy, by t(k) było określone dla liczb k ujemnych lub gdy jedna lub więcej z dolnych liczb b we wzorze (5.115) jest zerem lub ujemną liczbą całkowitą. Ściślej, uzy skamy najbardziej ogólny wyraz hipergeometryczny, jeśli pomnożymy (5.115) przez niezerową stałą razy pewna potęga 0, a następnie uprościmy zera w licz niku z zerami w mianowniku. Przykłady w ćwiczeniu 12 powinny pomóc w wyjaśnieniu tej generalnej zasady.) Chcemy znaleźć Y. t(k) Sk, gdy t(k) jest wyrazem hipergeometrycznym. Algorytm Gospera wykonujemy w dwóch etapach, z których każdy jest dość prosty. W etapie 1 przedstawiamy iloraz składników w specjalnej postaci t(k + 1 ) _ p (k + 1 ) q(k) t(k) “ p(k) r(k + 1 ) ’ l5'117; gdzie p, q, r są wielomianami spełniającymi następujący warunek: (k + a )\q (k ) i (k + a)\q(k) ( k + ( 3)\r(k) =4- oc — P nie jest dodatnią liczbą całkowitą. (5*118) Warunek ten jest łatwo osiągnąć. Na początku tymczasowo przyjmujemy, że p(k) = 1, a za q(k) i r(k + 1) podstawiamy licznik i mianownik ilorazu składników rozłożony na iloczyn wielomianów liniowych. Na przykład, jeśli wyraz t(k) ma postać (5.115), to zaczynamy od rozłożenia go na iloczyn q(k) = ( k + a 1) . . . ( k + a m)z i r(k) = (k + bi - 1) . . . (k + b^ - 1)k. Wtedy sprawdzamy, czy warunek (5.118) jest spełniony. Jeśli q i r ma czynniki (Tc+a) i (k + |3), gdzie a — |3 = N > 0, to usuwamy je z wielomianów q i r i zastępujemy p(k) przez p(k)(kH-a—1)^ ^ - = p (k )(k + a —1)(k+cx.—2 ) . . . (k + p + 1 ). (5*119) Nowe p, q, r ciągle spełniają równość (5.117). Następnie powtarzamy te czyn ności dopóty, dopóki warunek (5.118) nie będzie spełniony. Za chwilę zrozu miemy, dlaczego warunek (5.118) jest taki ważny. Etap 2 jest ostatnim etapem algorytmu Gospera. Znajdziemy, o ile to możliwe, wyraz hipergeometryczny T (k) taki, że t(k) = T(k + 1) —T (k ). (Podzielność wielomianów przypomina podzielność liczb całkowitych. Na przykład (5.120) oznacza, że iloraz q(k)/(k+ a) jest wielomianem. Nietrudno jest sprawdzić, że zachodzi warunek: (k + a)\q(k) wtedy i tylko wtedy, gdy q ( - a ) = 0.) Nie jest oczywiste, jak to zrobić. Musimy rozwinąć najpierw pewną teorię, zanim będziemy wiedzieli, jak postępować. Po przestudiowaniu wielkiej ilości szczególnych przypadków Gosper zauważył, że mądrze jest zapisać nieznaną funkcję T(k) w postaci r(k) s(k) t(k) = — ?(k)----- ’ T(k) (Ćwiczenie 55 może nam wyjaśnić, czemu chcielibyśmy wykonywać takie magiczne podstawienia.) .. (5'121) gdzie s(k) jest nieznaną funkcją, którą jakoś musimy odkryć. Wstawiając (5.121) do (5.120) i stosując (5.117), otrzymamy , n l _ T( k + 1 ) s ( k + 1 )t(k + 1 ) 1 J _ ~ zatem musi p(k) r(k)s(k)t(k) p(k + l) P(k) q(k )s (k + 1 )t(k) _ r(k)s(k)t(k) p(k) p(k) zachodzić = q (k )s(k + 1)—r (k )s(k ). (5*122) Jeśli znajdziemy s(k) spełniającą tę rekurencję, to znajdziemy ^ t ( k ) ók. W przeciwnym razie takie T nie istnieje. Zakładamy, że T(Tc) jest wyrazem hipergeometrycznym, co oznacza, że T (k + 1)/T(k) jest funkcją wymierną zmiennej k. Dlatego, dzięki wzorom (5.121) i (5.120) wiemy, że r(k)s(k)/p(k) = T (k )/(T (k + 1) — T(k)) jest funkcją wymierną zmiennej k i s(k) musi być ilorazem wielomianów: s(k) = f( k )/g (k ). W rzeczywistości możemy udowodnić, że s(k) jest wielomianem. Załóżmy, że g(Tc) nie jest funkcją stałą oraz że f (k) i g(k) nie mają wspólnego dzielnika. yNFiech N będzie największą liczbą całkowitą taką, że (k + (3) i (k + p + N —1) są dzielnikami wielomianu g(k), dla pewnej zespolonej liczby |3. Wartość N jest dodatnia, ponieważ N = 1 zawsze spełnia ten warunek. Możemy teraz zapisać równanie (5.122) w postaci p(k)g(k+1)g(k) = q(k)f(k+1 )g(k) - r(k)g(k+T)f(k) i jeśli podstawimy k = —13 i k = —(3 — N, uzyskamy T( - P ) g ( 1 - P ) f ( - P ) = 0 - q(-p_N )f(1-p-N )g(-P -N ). Ponieważ f i g nie mają wspólnych pierwiastków, więc f (—P) ^ 0 i f (1 — P — N) ^ 0, Także g(l — P) ± 0 i g(—P —N) ^ 0, gdyż w przeciwnym razie g(k) zawierałoby jeden z czynników (k + P — 1) lub (k + p + N), co przeczyłoby maksymalności N. Dlatego t(-P) = q ( - P ~ N ) = 0 . Ale to przeczy warunkowi ( 5 . 1 1 8 ). Zatem s(k) musi być wielomianem. Nasze zadanie sprowadza się do znalezienia wielomianu s(k) spełniają cego równość ( 5 . 1 2 2 ), gdzie p(k), q(k), r(k) są danymi wielomianami, lub udowodnienia, że taki wielomian nie istnieje. Łatwo jest to zrobić, gdy znamy stopień wielomianu s(k). Napiszmy s(k) = <xdkd + a d- i k d_1 H-------b oc0 , ocd ^ 0 ( 5 -1 2 3 ) gdzie d jest stopniem wielomianu s(k) i ( a d ł . . . , ao) S3Lnieznanymi współ czynnikami. Wstawmy to wyrażenie do podstawowej rekurencji ( 5 . 1 2 2 ). Wie lomian s(k) będzie spełniał rekurencję wtedy i tylko wtedy, gdy współczyn niki oc spełniają liniowe równania, które otrzymamy przyrównując współ czynniki przy każdej potędze k w równaniu ( 5 . 1 2 2 ). Jak wyznaczyć stopień wielomianu s? Są dwie możliwości. Zapiszmy rów nanie (5 . 1 2 2 ) w postaci 2p(k) = Q ( k ) ( s ( k + 1 ) + s(k)) + R ( k ) ( s ( k + l ) - s ( k ) ) , gdzie Q(k) = q ( k ) —r(k) i (5 .1 2 4 ) R(k) = q ( k ) + r ( k ) . Jeśli s(k) jest stopnia d, wtedy suma s(k + 1) + s(k) = 2 a dk d H-----także jest stopnia d, podczas gdy różnica s(k-ł-1) —s(k) = As(k) = dcxdk d_1 H---jest stopnia d —1. (Zakładamy, że wielomian zerowy jest stopnia —1.) Niech deg(P) oznacza stopień wielomianu P. Jeśli deg(Q) ^ deg(R), wtedy stopniem prawej strony równości ( 5 . 1 2 4 ) jest deg(Q) -1- d, zatem d = deg(p) —deg(Q). Z drugiej strony, jeśli deg(Q) < deg(R) = d', wtedy możemy napisać, że Q(k) = A'kd _1 + • • • i R(k) = Akd’ + • • •, gdzie A / 0. Prawa strona równości ( 5 . 1 2 4 ) jest postaci (2A'cxd + Ad a d)k d + d ' “ 1 + • • • . Stąd dwie możliwości: albo 2A'+ Ad ^ 0 i d = deg(p) —deg(R) + 1 , albo 2A' + Ad = 0 i d > deg(p) —deg(R) + 1. Drugi przypadek musimy sprawdzić tylko wtedy, gdy —2A'/A jest liczbą całkowitą d większą niż deg(p) —deg(R) + 1 . Znamy już dostatecznie wiele faktów, by dokończyć etap 2 algorytmu Gospera. Jeśli równanie ( 5 . 1 2 2 ) ma wielomianowe rozwiązanie, to sprawdza jąc co najwyżej dwie wartości d, możemy znaleźć s(k). Jeśli s(k) istnieje, to po wstawieniu go do wzoru ( 5 . 1 2 1 ) uzyskamy nasze T. W przeciwnym razie udowodnimy, że t(k) nie jest sumowalne za pomocą wyrazów hipergeome trycznych. Rozumiem. Gosper by przeprowadzić ten dowód musiał założyć warunek (5.118). Czas na przykład. Spróbujmy policzyć sumę częściową (5.114). Posługu jąc się metodą Gospera powinniśmy wyliczyć wartość k dla dowolnego, ustalonego n. Szukamy zatem sumy nieoznaczonej wyrazów k! ( n - k ) ! ' W etapie 1 przedstawiamy iloraz składników w wymaganej postaci (5.117). Otrzymamy t ( k + 1) k -n t(k) ” k+1 Dlaczego r(k) nie równa się k+1 ? Och! Rozumiem. ” p ( k + 1 )q(k) p(k)r(k + 1 ) ’ stąd p(k) = 1, q(k) = k —n i r(k) = k. Ten wybór p, q i r spełnia warunek (5.118), chyba że n jest ujemną liczbą całkowitą. Przypuśćmy, że nie jest. Teraz etap 2. Zgodnie z równością (5.124), powinniśmy rozważyć wielo miany Q(k) = —n i R(k) = 2k —n. Ponieważ R jest większego stopnia niż Q, musimy rozważyć dwa przypadki. Albo d = deg(p) — deg(R)+ 1, które jest równe 0, albo d = —2A'/A, gdzie A' = —n i A= 2, stąd d= n. Pierwszy przypadek jest przyjemniejszy, ponieważ nie wymaga, żeby n było dodat nią liczbą całkowitą. Zatem pójdźmy wpierw tą drogą. Będziemy zmuszeni sprawdzić drugą możliwą wartość dla d tylko wtedy, gdy zawiedzie pierwsza z możliwości. Jeżeli d = 0, wartością s(k) jest po prostu ao i równanie (5.122) redukuje się do 1 = (k —n)cxo —kao . Stąd ao = —1/n . Wartość ta spełnia równanie i otrzymujemy T (u _ r(k) s(k) t(k) T(k) - — F(ió ^ _ 1) ( ^ 1)k_1 > Jeśli n ^ O , odpowiedź, jaką mieliśmy nadzieję uzyskać. Jeśli zastosujemy tę samą metodę, by odnaleźć wzór na sumę nieozna czoną Y © tym razem bez (—1)k, otrzymamy to samo, z wyjątkiem tego, że q(k) będzie równe n —k. Zatem Q(k) = n —2k będzie większego stopnia niż R(k) = n, i wnioskujemy, że d ma niemożliwą wartość deg(p) —deg(Q) = —1. (Wielomian s(k) nie może być ujemnego stopnia, ponieważ nie może być tożsamościowo równy zeru.) Dlatego funkcja (£) nie jest sumą wyrazów hipergeometrycznych. Jednakże, gdy wyeliminujemy to co niemożliwe, wówczas to co pozo stanie— chociaż nieprawdopodobne — musi być prawdziwe (według S. Hol mesa [84]). Kiedy zdefiniowaliśmy p, q i r w etapie 1 , zdecydowaliśmy zigno rować możliwość, że rt może być ujemną liczbą całkowitą. A jeśli jest? Niech rt = —N, gdzie N jest liczbą dodatnią. Wtedy iloraz składników (£) ók jest równy t(k+1) t(k) - ( k + N) ( k + 1) p(k+1) q (Tc) p(k) r(k + 1 ) i zgodnie ze wzorem ( 5 . 1 1 9 ) powinien być reprezentowany przez wielomiany p(k) = (k + 1)N_1, q(k) — —1, r(k) = 1. W etapie 2 algorytmu Gospera szukamy wielomianu s(k) stopnia d = N — 1. Może nam się to uda. Jeżeli na przykład N = 2, to z rekurencji ( 5 . 1 2 2 ) wynika, że powinniśmy rozwiązać równanie k+1 = —( ( k + 1 )oc-\ + ao) — (koti + oco). Po przyrównaniu współczynników przy k i 1 uzyskamy układ równań 1 = —oci - o c 1 ; 1 — OC] - oco - oc0) zatem rozwiązaniem jest s(k) = —j k — \ i '- 2 1- ( - ł * - 1) ■ (V ) T« , ------- ----------- I-') 4 Czy jest to szukana suma? Tak! Sprawdźmy to: _ 1 )lc2 k + 3 _ ( _ i )k_ 1 21c+2 = (_ 1 )ie( k + 1 ) (-* )■ Nawiasem mówiąc, możemy zapisać ten wzór sumacyjny w innej postaci przez dołączenie górnego ograniczenia: ~2\ = v *k / k<m 1 m 4 0 m—1 2 = ( - 1) 2 \ m—1 m 2 „Genialne, Holmesie!” „Elementarne, mój drogi Watsonie Reprezentacja ta ukrywa fakt, że (~j^) jest sumowalne za pomocą wyrazów hi pergeometrycznych, ponieważ fm / 2 ] nie jest wyrazem hipergeometrycznym. (Zobacz ćwiczenie 1 2 .) Problem pojawia się w mianowniku wzoru ( 5 . 1 2 1 ) jeśli p(k) = 0 dla pewnych liczb całkowitych k. Ćwiczenie 97 daje nam pewne pojęcie o tym, co można zrobić w takich sytuacjach. Zauważmy, że nie musimy się kłopotać katalogiem sum nieoznaczonych wyrazów hipergeometrycznych, analogicznym do bazy sum hipergeometrycz nych wspomnianej wcześniej w tym rozdziale, ponieważ algorytm Gospera dostarcza nam szybkiej, jednolitej metody działającej we wszystkich sumowalnych przypadkach. Marko Petkovśek [292] uogólnił algorytm Gospera dla bardziej skompli kowanego problemu odwracania, pokazując, jak należy wyliczyć składniki hipergeometryczne T(k), które spełniają rekurencję l-tego rzędu t(k) = p l (k)T(k+t) + . . - + p 1 ( k ) T ( k + l ) + p 0 (lc)T(k), (5 .1 2 5 ) gdzie dany jest składnik hipergeometryczy t(k) i wielomiany p i ( k ) , . . . ,pi (k), PoM- 5.8. Sum ow anie m echaniczne Algorytm Gospera, jakkolwiek piękny, znajdzie nam postać zwartą tylko nie wielu sum ze współczynnikami dwumianowymi Newtona. Ale nie poprze staniemy na nim. Doron Zeilberger [384] pokazał, jak rozszerzyć algorytm Gospera tak, by można go było zastosować do ogromnej liczby sum. Dzięki rozszerzeniu Zeilbergera poradzimy sobie nie tylko z częściowymi sumami, lecz również z sumowaniem względem wszystkich k. Stąd mamy alternatywę dla hipergeometrycznych metod podrozdziałów 5.5 i 5.6. Co więcej, tak jak w oryginalnym algorytmie Gospera obliczenia mogą być dokonane prawie na ślepo przez komputer. Nie musimy więc polegać na własnych zdolnościach i szczęściu. Pomysł polega na tym, że uważamy składnik, który chcemy sumować, za funkcję t(n ,k ) dwóch zmiennych n i k. (W algorytmie Gospera pisali śmy po prostu t(k).) Zeilberger zauważył, że gdy t(n ,k ) nie jest nieskończe nie sumowalne względem zmiennej k za pomocą wyrazów hipergeometrycz nych— prawdę mówiąc dla niewielu przypadków jest— możemy zmodyfiko wać t(rt,k) tak, by uzyskać inny nieskończenie sum owalny składnik. Na przykład, często okazuje się w praktyce, że |3o(n)t(n,k) + |3i(n )t(n + l ,k) jest dla odpowiednich wielomianów Po(n) and |3i(n) nieskończenie sumo walne względem zmiennej k. Gdy wyliczymy sumę względem k, otrzymamy rozwiązującą nasz problem rekurencję względem n. .261 Sum ow anie m ech an iczn ej By zapoznać się z ogólną metodą, zacznijmy od prostego przypadku. Załóżmy, że nie znamy wzoru dwumianowego i chcemy wyliczyć (£) zk. Jak moglibyśmy odkryć odpowiedź bez daru jasnowidzenia lub natchnionego przepowiadania? Wcześniej w tym rozdziale, na przykład w zadaniu 3 pod rozdziału 5.2, dowiedzieliśmy się, jak zastąpić (£) przez + (£Z]) i jak wykorzystać ten wynik. Istnieje jednak bardziej systematyczna metoda po stępowania. Niech t(n ,k ) = (£) zk będzie wielkością, którą chcemy sumować. Z al gorytmu Gospera wiemy, że z wyjątkiem przypadku z = —1 nie możemy wyliczyć dla dowolnego rt sumy częściowej L k^m t(n ,k ) za pomocą hiper geometrycznych składników. Rozważmy, w zamian, bardziej ogólną postać t(n ,k ) = p 0 (n )t(n ,k ) + Pt (n ) t ( n + 1 , k ) . ( 5 *1 2 6 ) Będziemy szukać wartości po(n) i Pi (tl), dzięki którym skutecznie zastosu jemy algorytm Gospera. Wpierw uprośćmy równość ( 5 . 1 2 6 ), korzystając ze związku pomiędzy t ( n + 1 , k) i t(n , k) tak, by usunąć t ( n + 1 , k) z wyrażenia. Ponieważ t(n + 1 , k) _ t(n ,k ) (n + 1 )!zk ( n - k ) ! k ! ( n + 1 —k)!k! n !z k n +1 n +1 - k ’ otrzymujemy t(n ,k ) = p (n ,k ) t(n , k) n + 1-k ’ gdzie p(n,k) = ( n + 1 —k)Po(n) + ( n + 1 ) P i ( n ) . Zastosujmy teraz algorytm Gospera do t(n,k), gdzie n jest ustaloną liczbą, i podobnie jak we wzorze ( 5 . 1 1 7 ) napiszmy t ( n , k + 1) = p ( n , k + 1) q(n,k) t(n,k) p(n,k) r ( n , k + 1) ' Metoda Gospera powinna znaleźć odpowiednie wielomiany zaczynając od p (n, k) = 1, ale zgodnie z pomysłem Zeilbergera lepiej jest zacząć od p(n, k) = p(n,k). Zauważmy, że jeśli podstawimy t(n,k) = t ( n, k) /p (n ,k ) i p(n,k) = p( n, k)/ p( n, k) , to równanie ( 5 . 1 2 7 ) będzie równoważne równości t ( n , k + 1) = p ( n , k + 1) q(n,k) t(n,k) p(Tv,k) r ( n , k + 1)" Lub bez zaglądania na stronę 202. Zatem możemy znaleźć p, q i r spełniające równanie ( 5 . 1 2 7 ) przez znalezienie p, q i r spełniających równość ( 5 . 1 2 8 ), rozpoczynając od p(rt, k) = 1. Uprości nam to życie, gdyż t(n , k) nie zawiera nieznanych wielkości |3o(n) i |3i (rt), które pojawiają się w t(n , k). W naszym przypadku t(n ,k ) = t ( n , k ) / ( n + 1 —k) = rt! zk/ ( n + 1 —k )! k!, zatem uzyskujemy t(n , k + 1) (rt + 1 —k) z t ( n ,k ) = k+1 ’ Tym razem pamiętam, dlaczego r(n, k) nie jest równe k + 1 . czyli możemy przyjąć, że q(n,k) = (n + 1 —k)z i r(n,k) = k. Zakładamy, że te wielomiany zmiennej k spełniają warunek ( 5 . 1 1 8 ). W przeciwnym ra zie moglibyśmy usunąć czynniki z q i r i dołączyć odpowiednie czynniki ( 5 . 1 1 9 ) do p(n,k). Powinniśmy tak uczynić tylko wtedy, gdy wartość oc — [3 w warunku ( 5 . 1 1 8 ) jest dodatnią liczbą całkowitą niezależną od n, ponieważ chcemy, by nasze wyliczenia były prawidłowe dla dowolnego n. (Jeśli użyjemy uogólnionej silni ( 5 .8 3 ), to wyprowadzane przez nas wzory będą prawdziwe, nawet gdy rt i k nie będą liczbami całkowitymi.) Nasz pierwszy wybór wielomianów q i r spełnia warunek ( 5 . 1 1 8 ), zatem możemy przejść do etapu 2 algorytmu Gospera. Chcemy rozwiązać odpo wiednik równości ( 5 . 1 2 2 ), korzystając ze wzoru ( 5 . 1 2 7 ) zamiast z równania ( 5 . 1 1 7 ). Chcemy zatem rozwiązać równanie P(n,k) = q ( n , k ) s ( n , k + 1 ) —r(n, k)s(n,k) ( 5 -1 2 9 ) gdzie s(rt, k) = a d(rt)kd + ad - 1 (rt)k d_1 H-------hao(n) ( 5 -3-3 0 ) jest nieznanym wielomianem. (Współczynniki wielomianu s nie są stałymi, lecz są funkcjami zmiennej n.) W naszym przypadku równanie( 5 . 1 2 9 ) przy biera postać ( n + 1 - k J P o M + fn + I J M n ) = ( n + 1 —k ) z s ( n , k + 1) —k s ( n , k ) , Stopień funkcji deg(Q) odpowiada tutaj stopniowi wielomianu zmiennej k. Traktujemy n jako stałą. i uważamy je za równość wielomianów zmiennej k, gdzie współczynniki tych wielomianów są funkcjami zmiennej n. Jak poprzednio, ustalamy stopień d wielomianu s przez porównanie stopni wielomianów Q(n,k) = q(n,k) — r(n,k) i R(n,k) = q(n,k) + r ( n , k ) . Ponieważ deg(Q) = deg(R) = 1 (zakła damy, że ±1), otrzymujemy d — deg(p) —deg(Q) = 0 i s(n,k) = <xo(n) jest niezależne od k. Nasze równanie przybiera postać (n + 1 —k)Po(n) + (n + 1)|3i (n) = (n + 1 —k )zao(n) —k a 0 ( n ) ; i po przyrównaniu współczynników przy k i 1 otrzymamy wolny od k układ równań ( r t + 1) po(n) + (n + 1) 0 i (n) - ( n + 1)zcx0 ( n ) = 0 , - ( 30(ti) + ( z + 1)cxo(n)= 0 . Zatem mamy rozwiązanie równania (5.129), gdzie |3o(n) = z + 1 , Pi(rt) = —1 , cxo(n) = s(n ,k ) = 1 . (Przypadkiem pozbyliśmy się n.) Odkryliśmy, czysto mechaniczną metodą, że t(n ,k ) = (z + 1)t(n,k ) — t ( n + 1, k) jest sumowalnym hipergeometrycznym składnikiem. Innymi słowy, t ( n , k ) = T ( n , k + 1) — T ( n , k ) , (5-131) gdzie T (n, k) jest hipergeometrycznym składnikiem zmiennej k. Czemu jest równe T (n,k)? Zgodnie z równościami (5.121) i (5.128) uzyskujemy , ' ( a w . y i , r(„ ik|J(„ ik ]; |n i k |i ( M ia ) p (n , kj ponieważ p (n ,k ) = 1. (Rzeczywiście, p(n, k) prawie zawsze w praktyce oka zuje się być równe 1.) Zatem k ., ^ k A i\ v T(* ' k) = ^ T T ^ t ( n 'k) = / n \ ) zK = U - i . , z k • Dla pewności, sprawdźmy— równanie (5.131) jest prawdziwe: n\ v (z+1)W z A i+A l ic r v k+1 = Ur ( n U -ir ■ Tak naprawdę, to nie potrzebujemy znać dokładnej wartości T(rt,k), ponieważ zamierzamy sumować t(n, k) względem wszystkich liczb całkowi tych k. Wystarczy nam wiedzieć, że gdy n jest dowolną ustaloną nieujemną liczbą całkowitą, wtedy T(n,k) jest niezerowe tylko dla skończonej liczby wartości k. Suma T (n, k + 1) —T (rt, k) po wszystkich k musi się zredukować do 0. Niech Sn = ^ t f n , k) = ^Tk (k)z k. Jest to suma, od której zaczęliśmy nasze rozważania. Jesteśmy teraz gotowi ją policzyć, ponieważ dużo wiemy o t(n ,k ). Z metody Gospera-Zeilbergera wnioskujemy, że ^ ( ( z + 1) t( n ,k ) —t ( n + 1,k)) = 0 . W rzeczywistości lim T(n,k) = 0 , k—>00 gdy |z| < 1 i n jest dowolną liczbą zespoloną. Zatem wzór (5 . 133) jest prawdziwy dla wszystkich rt i w szczególności Sn = (z + 1 ) n , gdzie rt jest ujemną liczbą całkowitą. Ta suma spełnia równość (z+ 1) ^ k Zatem otrzymujemy k )~ 21 k t f a + l , k) = (z+1 )Sn —Sn+i . Sn+i = ( z + l ) S n . (5 .1-33 ) Aha! Jest to rekurencją, którą wiemy jak rozwiązać, jeśli znamy So- Oczy wiście So = 1. Zatem wnioskujemy, że Sn = (z + l ) n dla wszystkich liczb całkowitych rt ^ 0, QED. Przyjrzyjmy się ponownie przeprowadzonym rachunkom i podsumujmy nasze dokonania w postaci, którą możemy zastosować do innych składników t(n,k). Algorytm Gospera-Zeilbergera dla danego t(n,k) można sformuło wać następująco: 0. Niech l := 0. (Szukamy rekurencji rzędu l względem zmiennej rt.) 1. Niech t(n,k) = |3o(rt)t(rt,k) H------- (- pifrtjtfrt + l,k), gdzie 0o(n), . . . , Pi (u) są nieznanymi funkcjami. Użyjmy własności t(rt,k), by znaleźć liniową kombinację p(rt,k) wielomianów Po(tv), . . . , Pi(rt), której współ czynniki są wielomianami zmiennych n i k. Stąd t(rt,k) zapiszemy w po staci p(n,k)t(n, k), gdzie t(rt, k) jest hipergeometrycznym składnikiem zmiennej k. Znajdujemy wielomiany p(rt,k), q(n,k), r(n,k) takie, że iloraz składników t(rt,k) jest postaci ( 5 . 1 2 8 ), gdzie q(rt,k) i r(rt,k) speł niają warunek Gospera ( 5 . 1 1 8 ). Podstawiamy p(rt, k) = p(rt,k)p(rt,k). 2 .a) Niech dQ := deg(q - r), dR := deg(q + r) i d := 2 .b) Jeśli f deg(p) - dQ, \ deg(p) - dR + 1 , gdy dQ ^ dR; gdy dQ < dR. d ^ 0, to zdefiniujmy s(rt, k) wzorem ( 5 . 1 3 0 ) i rozważmy otrzy many przez przyrównanie współczynników przy potęgach zmiennej k w głównym równaniu ( 5 . 1 2 9 ) liniowy układ równań zmiennych a o , . . . , a d , Po, . .. Pi- Jeśli te równania mają rozwiązanie, w którym nie wszystkie P o , . . . , P i są zerami, przejdźmy do kroku 4. W przeciwnym razie jeśli dę> < dR i —2A'/A jest liczbą całkowitą większą niż d, gdzie A jest współ czynnikiem przy kdR w wielomianie q + r, a A' jest współczynnikiem przy k dR_1 w wielomianie q —r, to podstawiamy d := —2A'/A i powtarzamy krok 2 b. 3. (Składnik t(rt, k) nie jest sumowalny hipergeometrycznie.) Zwiększmy l o 1 i wróćmy do kroku 1 . 4. (Sukces.) Podstawmy T(rt, k) := r(rt,k)s(rt, k)t(rt,k)/p(rt,k). Otrzyma liśmy t(rt,k) = T(rt,k + 1) —T (n, k). Udowodnimy później, że algorytm zawsze się zakończy, gdy t(rt,k) należy do dużej klasy składników zwanych składnikami właściwymi. Zabierzmy się teraz do tożsamości Cauchy’ego. Czy możemy za pomocą algorytmu Gospera i Zeilbergera wywnioskować, że k (£) (n^k) ma postać zwartą? Rozpoczynamy algorytm od l = 0, dla której to wartości jest to pier wotny algorytm Gospera, i próbujemy sprawdzić, czy (£) (n^k) jest sumo walne za pomocą składników hipergeometrycznych. Niespodzianka: Składnik ten jest sumowalny, gdy a + b jest specyficzną nieujemną liczbą całkowitą (zobacz ćwiczenie 94). Jesteśmy jednak zainteresowani ogólnymi wartościami a i b i dzięki algorytmowi szybko odkryjemy, że nieskończona suma nie jest składnikiem hipergeometrycznym. Zatem powiększamy l z 0 do 1 i próbu jemy zastosować algorytm do t(n,k) = Po(n)t(n,k) + pi ( n ) t ( n + l,k). Na stępnie zapiszemy, podobnie jak w wyprowadzeniu wzoru dwumianowego, że t(ri,k) = p (n,k)t( n, k) , gdzie p(n,k) otrzymaliśmy po wyrzuceniu wspól nych czynników z t(n + 1 , k )/t(n , k ). W tym przypadku— czytelnik jest pro szony o sprawdzenie samemu wszystkich obliczeń— nie są one tak trudne na jakie wyglądają, wszystko wykonujemy w podobny sposób, lecz tym razem uzyskujemy p(n,k) = (n + 1 —k)Po(n) + (b —n + k)Pi(n) = p ( n , k ) , t(n,k) = t (n ,k )/ (n + 1—k) = a!b!/(a-k)!k! (b-n+k)! (n + 1- k ) ! , q(n,k) = (tl + 1 — k)(a — k ) , r(n,k) = (b —n + k)k. W etapie 2 a otrzymujemy, że deg(q —r) < deg(q + r ) i d = deg(p) —deg(q + r) + 1 = 0, zatem s(n,k) jest znowu niezależne od k. Podstawowe równanie Gospera ( 5 . 1 2 9 ) jest równoważne układowi dwóch równań z trzema niewia domymi, ( n + l ) p 0 (n) + ( b - r t ) P i ( n ) — Po (ti) - (rt + 1 ) a a 0 (n )= 0 , + P i(rt) + (a + b + 1)cxo(ti)= 0, który ma rozwiązanie Po(n) = a + b —n , pi (rt) = —n —1, oc0{n) = 1. Stąd (a + b —n )t(n , k) —(rt + 1 ) t(rt + 1 , k) jest sumowalne względem k, czyli jeśli Sn = ]Tk (k) (n^k)j to spełniona jest rekurencją _ a + b -rt - —n + -j.. Ponieważ So = 1, więc Sn = (a^b)- Kaszka z mlekiem. Co możemy powiedzieć o równości Saalschiitza (5 .2 8 ) z trzema współ czynnikami dwumianowymi? Dowód wzoru ( 5 .2 8 ), który znajdziemy w ćwi czeniu 43, jest interesujący, lecz wymaga natchnienia. Spróbujmy spraw dzić, czy metoda Gospera-Zeilbergera pomoże nam znaleźć i udowodnić wzór ( 5 .2 8 ) w czysto mechaniczny sposób. Dla wygody podstawmy m = b + d, Istotne jest to, że algorytm GosperaZeilbergera zawsze prowadzi do układu równań liniowych z nieznanymi liczbami oc i p , ponieważ lewa strona równości (5-i2g) jest liniowa względem liczb P, a prawa względem liczb oc. n = a, r = a + b + c + d, s = a + b + c, stąd wzór ( 5 .2 8 ) przybierze bardziej symetryczną postać (a + b + c + d + k)! k)! (b —k )! (c + k )! ( d + k )! k! Zadecydowanie, którą ze zmiennych nazwać n, jest jedyną niemechaniczną czynnością. (a + b + c + d)!(a + b + c)!(a + b + d)! a! b! (a + c)! (a + d)! (b + c)! (b + d)! ( 5 -1 3 4 ) Aby suma była skończona załóżmy, że a lub b jest nieujemną liczbą całkowitą. Niech t ( n ,k ) = (n + b + c + d + k )! /( n —k)! (b —k)! (c + k)! (d + k)!k! i t( n ,k ) = P o (n )t(n ,k ) + P i ( n ) t ( n + l,k ) . Postępując w już dobrze nam znany sposób, podstawiamy p (n ,k ) = (rt + 1 -k)P o(T t) + ( r t + 1 + b + c + d + k ) p 1 (n) = p ( n , k ) , i^ _ "t(n, k) ^ (n + b + c + d + k)! i n ’ J “ n + 1 - k “ (n + 1 - Tc)! (b - k)! (c + k)! (d + k)! k! ’ q (n ,k ) = (n + b + c + d + k + 1 ) ( n + 1 —k)(b —k ) , r( n ,k ) = (c + k)(d + k)k Zauważmy, że A' nie jest głównym współczynnikiem wielomianu Q, chociaż A jest głównym współczynnikiem wielomianu R. W wielomianie Q liczba A' jest współczynnikiem ^deg(R)—1 i próbujemy rozwiązać równanie ( 5 . 129 ) dla s (n ,k ). Znowu deg(q — r) < deg(q + r), ale tym razem deg(p) —deg(q + r) + 1 = —1 . Jednakże, w kroku 2 b możemy wybrać jako stopień wielomianu s liczbę d = —2A'/A. Zanim się poddamy, spróbujmy pójść tą drogą. Teraz R(n,k) = q (n ,k ) + r ( n ,k ) = 2k 3 H-----, zatem A = 2, podczas gdy wielomian Q (n ,k ) = q (n ,k ) —r ( n ,k ) prawie cudownie okazuje się stopnia 1 względem zmiennej k — współczynnik przy k 2 znika! Dlatego A' = 0 i możemy podstawić d = 0 i s(n, k) = oco(n). Wystarczy teraz rozwiązać układ równań (n + 1 ) Po (tl) + (n + 1 + b + c + d)pi (n) — (n + 1 ) ( n + 1 + b + c + d)b ocq(n) = 0 , - P o ( n ) + P i(n ) — ((n + 1)b — (n + 1 + b) (n + 1 + b + c + d) —cd) ocq(n) = 0 . A oto wynik: Po (ti) — ("rt + 1 + b + c)(n + 1 + b + d )(n + 1 + b + c + d ), Pi (*rt) — —(n + 1 ) (n + 1 + c) (n + 1 + d ) , oto (t^) = 2 n + 2 + b + c + d . Bezpośrednio z tego wynika równość ( 5 . 134 ). Uzyskamy podobny dowód równości ( 5 . 134 ), jeśli podstawimy n = d zamiast n = a. (Zobacz ćwiczenie 99.) Podejście Gospera-Zeilbergera pozwala nam przekształcać sumy okre ślone zarówno dla ograniczonego, jak i dla całego zakresu k. Rozważmy sumę: Sn(z) = Y . f U V k) z k ' (5-135) k=0 Gdy z = j , otrzymamy „nieoczekiwany” wzór ( 5 .2 0 ). Czy Gosper i Zeilberger mogliby go oczekiwać? Po podstawieniu t(n , k) = (nkk)z k dojdziemy do równań p(n,k) = (n + 1) |30 (rt) + (n + 1 +k)|3i (n) = p ( n ,k ) , t(n,k) = t ( r t , k ) / ( n + 1 ) = (rt + k)!zk/k! (rt+ 1 )!, q(n,k) = ( n + 1 + k ) z , r(n,k) = k, i deg(s) = deg(p) — deg(q — r) = 0. Rozwiązaniem równania ( 5 . 1 2 9 ) jest Po(tl) — 1, Pi (n) = z — 1, s(n,k) = 1. Zatem t(n , k) + (z — 1 )t(rt + 1,k) - T(n,k + 1) —T ( n , k ) , ( 5 *1 3 6 ) gdzie T(n,k) = r t r t j k J s t ^ k J t ^ k J / p ^ k ) = ( k^^)zk. Dla 0 ^ k teraz możemy wysumować ( 5 . 1 3 6 ). Uzyskamy Sn (z) + t ( n , n + 1) + ( z - 1)Sn+ 1 (z) rt + 1 T (rt, rt + 2) - T (rt, 0 ) = C ::? y2 - < 2nn+ > “ł i Ale t ( n , n + 1) = C^ 1) ^ 1 = (2nn+1) zn+’ >st3d Sn +1 (z) = T- ^ ( S n ( z ) + ( 1 - 2 z ) ( 2 n + 1 ) Z’l+ 1j . (5*137) Dostrzegamy natychmiast, że z = \ jest szczególnym przypadkiem oraz że Sn + 1 [■%) = 2Sri{ j ). Co więcej, rekurencją ( 5 . 1 3 7 ) może być uproszczona przez zastosowanie czynnika sumacyjnego (1 —z ) 71+1 po obu stronach równania. To prowadzi nas do ogólnej tożsamości c i ("t' > “=1-leii (?)w k=0 v 7 k=l v 7 ■ <B«8) której stosunkowo niewielu ludzi mogło oczekiwać, zanim zajęli się nią Gosper i Zeilberger. Teraz produkcja takich tożsamości jest rutynowa. Co powiemy o podobnej sumie S n (z) = X . k) zk ’ k= 0 ' ' (5-139) na którą się natknęliśmy we wzorze (5 .74 )? Ufając w swe siły, podstawiamy t(n,k) = (nkk)zk i zaczynamy rachunki p(n,k) = t(n,k) = q(n,k) = r(n,k) = Sn (—J) równa się (n + 1 )/ 2 n . (n + 1 - 2 k)p 0 (n) + (n + 1 - k) Pi ( n ) = p(n,k), t(n ,k )/(n + 1 —2 k) = (n —k)! zk/k! (n + 1 —2 k)!, (n + 1 —2 k)(n —2 k)z, (n + 1 —k)k. Zaraz, zaraz — nie można rozwiązać równania (5 .129 ), jeśli założymy że —^, ponieważ stopień wielomianu s będzie równy deg(p) —deg(q —r) = —1 . Żaden problem. Dodajmy po prostu parametr p2 (n) i spróbujmy w za mian t(n, k) = Po (n)t(n, k) + p 1 (n)t(n + 1 , k) + p2 (n)t(n + 2 , k): p(n,k) = (n + 1 —2 k)(n + 2 —2 k)po(n) + (n + 1 —k)(n + 2 —2k)Pi(n) + (n + 1 —k )(n + 2 —k )P i(n ) = p ( n , k ) , t( n ,k ) = t ( n , k ) / ( n + 1 —2 k )(n + 2 —2k) = (n —k)! zk/k ! (n + 2 —2 k )!, q (n ,k ) = (n + 2 —2 k ) ( n + 1 —2k)z, r ( n ,k ) = ( n + 1 —k )k . Niech teraz s(n, k) = cto(n) i rozwiązaniem równania (5 .129 ) jest: Po(n) = z, Pi(n) = 1 , p2 (n) = -1 , cx0 (n) = 1 . Odkryliśmy, że zt(n, k) + t(n + 1 , k) —t(n + 2 , k) = T(n, k + 1 ) —T(n, k ), gdzie T(n,k) równa się r(n,-k)s(n,k)t(n,k)/p(n,k) = (n + 1 —k)kt(n,k) = (TLk^yk)zk. Sumując od k = 0 do k = n, otrzymamy zSn (z) + (Sn+1 (Z) - (n° ,)zn+') - (Sn+2(Z) - (n+2)z n + 2 - (n+,)zn+') = T( n, n+ 1) —T(n,0). Zatem dla wszystkich n ^ 0 zachodzi (n+ 1)z n+1 = (°)z u+1 = T( n, n+ 1), skąd uzyskujemy Sn+2 (z) = S-a-f-i (z) + zSrt(z), n ^ 0. (5 *140 ) Zajmiemy się rozwiązaniem takich rekurencji w rozdziałach 6 i 7. Metody z tych rozdziałów prowadzą nas bezpośrednio od ( 5 . 1 4 0 ) do postaci zwartej ( 5 .7 4 ), gdzie S0 (z) = S, (z) = 1. Jeszcze jeden przykład— bardzo znany— dopełni obrazu. Francuski ma tematyk Roger Apery rozwiązał w roku 1978 długo nie rozwiązany problem, gdy udowodnił, że liczba C(3) = 1 + 2 - 3 + 3 - 3 + 4 ~ s H-----jest niewymierna [14]. W jednej z głównych części jego dowodu znajdowały się sumy ze współ czynnikami dwumianowymi a- l C H T ) 1- < -> Apery podał dla tych sum wzory rekurencyjne, których żaden inny matema tyk nie był w stanie w tym czasie sprawdzić. (Od tego czasu liczby An są znane jako liczby Apery’ego. Wiemy, że Ao = 1, Ai = 5, A 2 = 73, A 3 = 1445, A ą = 33001.) W końcu [357] Don Zagier i Henri Cohen znaleźli dowód hipo tezy Apery’ego. Pomysły zawarte w ich dowodzie tej szczególnej (lecz trud nej) sumy doprowadziły Zeilbergera do odkrycia przedstawionej przez nas metody. Do tej pory, w rzeczywistości, widzieliśmy już dość przykładów, by suma ( 5 .1 4 1 ) wydała się nam trywialna. Po podstawieniu t(n,k) = ( £ ) 2 ( n £ k ) 2 i t(n,k) = |30 (n )t(n ,k ) + 0 i ( n ) t ( n + l ,k) + £ 2 (11)t(n + 2 ,k), próbujemy rozwiązać równanie ( 5 . 1 2 9 ), gdzie p(n,k) = ( n + 1 —k)2(n + 2 - k ) 2|30(n) + ( n + 1 + k ) 2(n + 2 - k ) 2 |3i(n) + (n + 1 + k)2(n + 2 + k)202(n) = p(n,k), t(n,k) = t ( n ,k ) / ( n + 1—k)2(rt+2—k)2 = (ri-|-k)!2/k!4 (ri+2—k)!2 , q(n,k) = ( n + 1 + k)2(n + 2 - k )2 , r(n,k) = k4 . (Nie martwmy się o to, że w q występuje czynnik (k + n + 1), podczsis gdy w r znajdziemy czynnik k. Nie psuje to warunku ( 5 . 1 1 8 ), ponieważ u uważamy za zmienną, a nie stałą liczbę.) Ponieważ q(rt,k) — r(n,k) = —2k 3 + • • •, możemy podstawić deg(s) = —2A'/A = 2, zatem s(n,k) = a 2(rt)k2 + ai (r t ) k + a 0( n ) . Przy takim wyborze s, rekurencją ( 5 . 1 2 9 ) sprowadza się do układu pięciu rów nań z sześcioma niewiadomymi Po(ti), Pi(n), P2 (n), ao(n), ai (n ), a 2 (n). Na przykład, po porównaniu współczynników przy k° otrzymamy równanie Po + Pi + |32 - cx0 - ai - cx2 = 0 ; (Najpierw próbowaliśmy nie używać $ 2, a/e się nie udało.) a po porównaniu współczynników przy k4 otrzymamy Po + Pi + 02 + ft-i + (6 + 6n + 2n2)oc2 = 0. Pozostałe trzy równania są bardziej skomplikowane. Istotne jest to, że te li niowe równania— podobnie jak wszystkie równania uzyskane za pomocą al gorytmu Gospera-Zeilbergera— są. jednorodne (ich prawe strony są równe 0). Zatem zawsze istnieje niezerowe rozwiązanie. Rozwiązaniem w naszym przy padku będzie 3 o(n) = ( n + 1 ) 3 , P i(n ) = —(2n + 3 )(17u 2 + 51n + 39), |32(n) = (n + 2 )3 , ao(n) = —16(n + 1)(n + 2)(2n + 3 ), a i(n ) = —12(2n + 3) , 0C2{n) — 8(2n + 3 ). Zatem ( n + l ) 3t(n ,k ) — (2n + 3)(17n 2 + 51n + 39)t(n + 1,k) + (n + 2) 3 t(n + 2, k) = T ( n , k + 1 ) —T(tL,k), „Profesor Littlewood, kiedy używa tożsamości algebraicznej, zawsze zaoszczędza sobie kłopotu jej dowodzenia. Zakłada, że tożsamość, jeśli jest prawdziwa, może być sprawdzona w kilku wierszach przez każdego, kto czuje potrzebę jej zweryfikowania. Moim celem jest zaprzeczyć temu przekonaniu.” F. J. Dyson [89] gdzie T(n,k) = k4 s(n,k)t(n,k) = (2 n + 3 )( 8 k 2 — 1 2 k — 16(n + 1 ) (n + 2 )) x (n+k) !2/ ( k —1) !4 (n + 2 —k) !2. Sumując po k otrzymamy „nieprawdopodobną” rekurencję Apery’ego (n + 1)3An + (n + 2)3A-a+2 — (2n + 3)(17n 2+ 51n + 39)ArL+i . (5.142) Czy metoda Gospera-Zeilbergera jest skuteczna dla wszystkich sum na potkanych w tym rozdziale? Nie. Nie można jej zastosować, gdy t(n,k) jest wyrazem (£) (k + 1 ) k_1 (n — k + 1 ) n - k - ' 1 we wzorze ( 5 .6 5 ), ponieważ iloraz składników t(n , k + 1)/t(n , k) nie jest funkcją wymierną zmiennej k. Zawodzi również w takich przypadkach, jak t(n , k) = (k)n k, ponieważ iloraz skład ników t(n + 1 , k)/ t(n, k) również nie jest funkcją wymierną zmiennej k. (Tę sumę możemy uzyskać, gdy wpierw wysumujemy (£)zk, a potem podstawimy z = n .) Metoda ta również zawodzi w stosunkowo łatwych przypadkach, jak t(n,k) = 1 / ( n k + 1 ), nawet gdy t ( n , k + 1 )/ t( n, k) i t ( n + 1 ,k)/ t(n, k) są wymiernymi fukcjami zmiennych n i k (zobacz ćwiczenie 107). Jednak algorytm Gospera-Zeilbergera zapewnia sukces w ogromnej licz bie przypadków. Mianowicie zawsze wtedy, gdy składnik t(n , k) jest tak zwa nym składnikiem w łaściw ym — składnikiem, który możemy zapisać w po staci u ^ u , J a m + a j k + a ," ) ! . . . (apn + a £ k + a £ ) ! t ( n ’k) = ^n> ^ (bi n + b jk + b " )! . . . (bqn + b 'k + b " ) ! W Z ’ (5'14S) We wzorze tym f(n,k) jest wielomianem zmiennych n i k, współczynniki a i, a j , . . . , ap, ap, bi, bj, . . . , b q, b£, są specyficznymi całkowitymi sta łymi, parametry w i z są niezerowe, a wielkości aj', . . . , a " , b", . . . , b" są dowolnymi liczbami zespolonymi. Udowodnimy, że kiedykolwiek t(n , k) jest składnikiem właściwym, wówczas istnieją wielomiany Po(rt), . . . , |3i(rt), nie wszystkie równe zeru, i istnieje składnik właściwy T(n,k), taki że Po(Ti)t(n,k) H-------h Pi(rt)t(n + l,k) = T ( n , k + 1) —T ( n , k ) . (5 . 1 4 4 ) Poniższy dowód podajemy za Wilfem i Zeilbergerem [375]. Niech N będzie operatorem zwiększającym n o 1, a K będzie operato rem zwiększającym k o l . Stąd na przykład N 2 K3 t(n , k) = t(n + 2, k + 3). Zajmiemy się liniowymi operatorami różnicowymi zmiennych N, K i n , mia nowicie wielomianami operatorowymi postaci 1 J H(N, K,n) = ( 5 .1 4 5 ) i=0 j=0 gdzie każde o c (rt) jest wielomianem zmiennej rt. Naszym pierwszym spo strzeżeniem jest następujący fakt: jeśli t(n , k) jest dowolnym składnikiem właściwym i H(N,K,n) jest dowolnym liniowym operatorem różnicowym, to H(N, K,n)t( n, k) jest składnikiem właściwym. Załóżmy, że t i H są dane wzorami odpowiednio ( 5 . 1 4 3 ) i ( 5 . 1 4 5 ). Zdefiniujmy „podstawowy składnik” wzorem n Ł i (<UTt+ a { k + aJtai CO] + a ( J [ a { < 0 ] + a[')l t(n , k)i j = -------------------------------- --------------------------------------- w nz k . r i i =1 (bin + b(k + b il [bi > 0 ] + b ' J[b{ > 0 ] + b ")! Na przykład, jeśli t(n,k) jest równe (^"k210) = (n — 2k)!/k! (rt — 3k)!, to podstawowym składnikiem odpowiadającym liniowemu operatorowi różnico wemu stopni I i J jest t ( n , k ) i j = (rt—2k—2J)!/(k+J)! ( n—3k+I)!. Kluczowe jest to, że a i >j(n)N 1KH(n, k) jest równe t ( n , k ) i j razy wielomian zmiennych n i k, jeśli tylko O ^ i ^ I i O ^ j ^ J . Ponieważ skończona suma wielo mianów jest wielomianem, to H(N, K,n)t(n, k) jest w wymaganej przez nas postaci danej wzorem ( 5 . 1 4 3 ). W następnym kroku pokażemy, że jeśli kiedykolwiek t(n , k) jest właści wym składnikiem, to zawsze istnieje niezerowy liniowy operator różnicowy H(N,K,n) taki, że H( N, K,n)t( n, k) = 0. Jeśli O ^ i ^ I i O ^ j ^ J , przesunięty składnik N xKU(n,k) jest równy * t ( n , k ) i j razy wielomian zmiennych n i k o stopniu (względem zmiennej k) Co się stanie, gdy t(n,k) nie zależy od n ? równym co najwyżej D ij — deg(f) + |ai|I + \a\\ JH-------f- |ap|I + \a^\J + |b1|I + |b1,|J + . .. H- |bq|I + |b;iJ. Zatem poszukiwane H istnieje, jeśli możemy rozwiązać jednorodny układ D i j + 1 równań liniowych z (I + 1 )(J + 1 ) zmiennymi atj (n) , o współczyn nikach będących wielomianami zmiennej rt. Na przykład możemy przyjąć I = 2A' + 1 i J = 2A + deg(f), gdzie A = |olt| H-------h|ap| + |bi|H------H b q|; A' = lajl H-------b |a^| + |b{|H------f- |bq| . Chwyt polega na uznaniu H za wielomian zmiennej K i zastąpieniu K przez A + 1 . W ostatnim kroku dowodu przechodzimy od H(N, K, n)t( n, k) = 0 do rozwiązania równości ( 5 . 1 4 4 ). Wybierzmy H tak, by J było najmniejsze, tzn. by H było najmniejszego stopnia względem zmiennej K. Możemy napisać H(N,K,n) = H ( N , 1 łn ) - ( K - - 1 ) G ( N , K ł Ti) gdzie G(N,K,rt) jest jakimś liniowym operatorem różnicowym. Załóżmy, że H( N, 1, n) = M n ) + M n ) N + . . . + |3l (n )N l i T(n,k) = G(N, K,n)t(n, k). Wtedy T(n,k) jest składnikiem właściwym spełniającym wzór ( 5 .1 4 4 ). Prawie zakończyliśmy nasz dowód. Musimy jeszcze udowodnić, że opera tor H ( N , l , n ) nie jest operatorem zerowym. Jeśli jest, to T(rt,k) nie za leży od k. Wtedy istnieją wielomiany |3o(rt) i pi (rt) takie, że (po(n) + Pi (nJNjTtrijk) = 0. Ale wtedy (Po(ti) + Pi (n)N)G(N,K, n) jest niezerowym operatorem różnicowym stopnia J — 1 zerującym t(n,k), co przeczy minimalności J. Teraz nasz dowód równości ( 5 .1 4 4 ) jest kompletny. Skoro już wiemy, że dla pewnego składnika właściwego T zachodzi wzór ( 5 . 1 4 4 ), możemy być pewni, że algorytm Gospera zakończy się sukcesem i znajdzie T (lub T plus stała liczba). Chociaż udowodniliśmy algorytm Gospera tylko dla przypadku hipergeometrycznych składników t(k) jednej zmiennej k, nasz dowód może być rozszerzony do przypadku o dwóch zmien nych jak następuje: Istnieje nieskończenie wiele liczb zespolonych n, dla któ rych warunek (5 . 1 1 8 ) jest spełniony, gdy q(rt,k) i r(rt,k) są wielomianami zmiennych k i dla których obliczenia z etapu 2 są identyczne z obliczeniami algorytmu Gospera dla jednej zmiennej. Dla takich n nasz poprzedni dowód pokazuje, że istnieje odpowiedni wielomian s(n,k) zmiennej k. Stąd istnieje odpowiedni wielomian s(rt,k) zmiennych n i k. QED. Udowodniliśmy, że algorytm Gospera-Zeilbergera znajdzie nam rozwią zanie równania ( 5 .1 4 4 ) dla możliwie najmniejszego l. W rozwiązaniu otrzy mujemy rekurencję zmiennej rt przekształcającą sumę względem k dla dowol nego składnika właściwego t(k,rt), przy założeniu, że t(rt,k) jest niezerowy dla skończonej liczby wartości k. Role zmiennych rt i k mogą być, oczywiście, odwrócone, ponieważ definicja właściwego składnika ( 5 . 1 4 3 ) jest symetryczna ze względu na rt i k. W ćwiczeniach 98-108 znajdziemy dodatkowe przykłady zastosowania algorytmu Gospera-Zeilbergera ilustrujące jego wszechstronność. Wilf i Zeil berger [375] ogromnie rozszerzyli swe rezultaty, tak że możemy je stosować do uogólnionych współczynników dwumianowych i sum wielokrotnych. Ć w iczenia R ozgrzew k a 1 . Czemu jest równe II 4 ? Dlaczego ta liczba jest łatwa do wyliczenia dla osoby, która zna współczynniki dwumianowe? 2 . Niech rt będzie daną dodatnią liczbą całkowitą. Dla jakich wartości k liczba (£) jest największa? Odpowiedź uzasadnij. 3. Udowodnij własność sześciokąta, ( r O W t r ) = 4. Oblicz (“ ^ negując górny indeks. 5. Niech p będzie liczbą pierwszą. Udowodnij, że dla 0 < k < p zachodzi (£) mod p = 0. Co z związku z tym możemy powiedzieć o współczynniku dwumianowym (p“ 1)? 6 . Popraw wyprowadzenie zadania 6 , z podrozdziału 5 .2 , stosując poprawnie regułę symetrii. 7. Czy wzór ( 5 .3 4 ) jest prawdziwy również wtedy, gdy k < 0? 8 . Oblicz ę ( k ) (- | ) k ( 1 - 1 c / u ) n ' Jaka jest przybliżona wartość sumy dla bardzo dużych u? Wskazówka: Suma jest równa An f (0) dla pewnej funkcji f . 9 . Pokaż, że uogólnione szeregi wykładnicze zdefiniowane wzorem ( 5 .5 8 ) spełniają zależność £ t (z) = 10. g d y t # 0. Pokaż, że —2(ln(1 —z) + z ) /z 2 jest funkcją hipergeometryczną. 5, Współczynniki dwumianowe 1 1 . Przedstaw obie funkcje z3 z5 z7 sm z = z -------- 1-------------- 13! 5! 71 1 •z 3 1 •3 •z 5 1 •3 •5 •z7 arcsin z = z + — — + — — _ + + 2-3 2-4-5 2-4-6-7 12. (Funkcje t / T nie są powiązane wzorem (5 .120).) jako szeregi hipergeometryczne. Która z następujących funkcji zmiennej k jest zdefiniowanym w podroz dziale 5.7 wyrazem hipergeometrycznym? Wyjaśnij, dlaczego nim jest lub nie jest. a) n k. b) kn . c) (k! + ( k + 1 )!)/ 2 . d) Hic tzn. j + j -i-------h e) f) g) h) i) V(ic)* t(k)T(k), gdzie t i T są hipergeometrycznymi składnikami. t(k) + T(k), gdzie t i T są hipergeometrycznymi składnikami. t(n —k), gdzie t jest hipergeometrycznym składnikiem. a t(k) + b t(k + 1 ) 4 - c t(k + 2 ), gdzie t jest hipergeometrycznym skład nikiem. j) pc/2]. k) k [ k > 0 ]. Podstawy 13. Znajdź związek między funkcją Pn = FTv-i k! z ćwiczenia 4.55, funkcją Qn = T I L , v-k i iloczynem Rn = I l L o (£)• 14. Udowodnij wzór ( 5 .2 5 ) za pomocą negowania górnego indeksu w tożsa mości Cauchy’ego ( 5 .2 2 ). Następnie pokaż, że powtórne zanegowanie daje wzór ( 5 .2 6 ). 15. Czemu równa się 16. Wylicz sumę Z 2a a+ k (£)S(—1)k ? Wskazówka: Zobacz wzór ( 5 .2 9 ). 2b b+ k 2c N ( - 1 )' c + k, gdzie a , b , c są nieujemnymi liczbami całkowitymi. 17. Znajdź prost] prosty związek między (2n n1^2) i (2 lX2 n^2)* 18. Dla iloczynu 1/3 k ) \ 2/3 k znajdź wzór podobny do równości ( 5 .3 5 ). 19. Pokaż, że uogólnione szeregi dwumianowe ( 5 .5 8 ) spełniają równość B t (z) = • 20. Zdefiniujmy szereg G 0-1 > • • • > O-m ^ ( b i , . . . , bn używając we wzorze ( 5 .7 6 ) potęg ubywających, zamiast przyrastających. Wyjaśnij, jak są powiązane funkcje G i F. 21. Wykaż, że podana przez Eulera definicja silni jest zgodna ze zwykłą de finicją. Pokaż, że granica we wzorze ( 5 .8 3 ) jest równa 1/m!, gdy z = m jest dodatnią liczbą całkowitą. 2 2 . Użyj wzoru ( 5 .8 3 ), by udowodnić równość Przy okazji, ( - i ) ! = Vń23. Jak jest wartość F(—rt, 1;; 1)? 24. Wylicz Îk (m+k) (TT^kk)4 k za pomocą szeregów hipergeometrycznych. 25. Pokaż, że GLi , d 2 , . . . , a m t>1 >b2> bn y Znajdź podobną relację pomiędzy funkcjami hipergeometrycznymi 26. Przedstaw funkcję G(z) jako wielokrotność szeregu hipergeometrycznego. ' 27. Udowodnij, że j. / a.1 , ai + ^ , . . . , am, am + 2 \ b i , bi + 2 > • • • > m —tl—1 t>n. + 2 ) 2 2 28. Udowodnij w zór Eulera F stosując dwukrotnie prawo odbicia ( 5 . 1 0 1 ) Pfaffa. 29. Pokaż, że konfluentny szereg hipergeometryczny spełnia równość 30. Jaki szereg hipergeometryczny F spełnia równanie różniczkowe zF'(z) + F(z) = 1/(1 —z)? 31. Pokaż, że jeśli f (k) jest dowolną funkcją sumowalną za pomocą skład ników hipergeometrycznych, to f jest również składnikiem hipergeome trycznym. Jeśli np. fM = cF(Ai , . . . , A m ; B i , . . . , B n ; Z)* + C, to istnieją stałe a i , . . . , a m, b i , ...., bn i z takie, że f (k) jest wielokrotnością (5-115)32. Znajdź ][_ k 2 ók za pomocą algorytmu Gospera. 33. Użyj algorytmu Gospera, by wyliczyć ]T 6 k/( k 2 — 1). 34. Pokaż, że częściowa suma hipergeometryczną może być przedstawiona jako granica zwykłej funkcji hipergeometrycznej: 0-1 > • • • > b i , . . . , bn gdzie c jest nieujemną liczbą całkowitą. (Zobacz wzór ( 5 . 1 1 5 ).) Wyko rzystaj ten pomysł, by wyliczyć H k<cm G ) ( - D k Ćwiczenia domowe 35. Notacja ^ k<n (k)2k~ n jest niejasna bez znajomości kontekstu. Oblicz tę sumę a) jako sumę względem k; b) jako sumę względem rt. 36. Niech m i rt będą dowolnymi nieujemnymi liczbami całkowitymi oraz p k będzie największą potęgą liczby pierwszej p dzielącą (mTJ[n)- Udowodnij, że k jest liczbą przeniesień, które się pojawią, gdy dodamy m do rt w systemie liczbowym o podstawie p. Wskazówka: Zajrzyj do ćwiczenia 4.24. 37. Pokaż, że dla potęg monofonicznych zachodzi odpowiednik wzoru dwu mianowego: rt ( x + d ) ł = X U h Ły— < k (X+ i , r = I I gdzie rt jest nieujemną liczbą całkowitą. 38. Pokaż, że wszystkie nieujemne liczby całkowite rt mogą być jednoznacznie przedstawione w postaci rt = (^) + Q) + ( 3 ), gdzie a, b, c są liczbami całkowitymi spełniającymi warunek 0 ^ a 0 zachodzi = (2 n ~ ] £ k=l ^ + ' U Znajdź podobny wzór dla ogólniejszego iloczynu xvriy Ti. (Wzory te po zwalają rozwinąć częściowe ułamki, na przykład, gdy x = 1 /( z — c) i y = 1/ ( z - d ) . ) 40. Znajdź postać zwartą dla sumy ^ ( —1 ) * +1 ^ ^ ^ 4 "rk. + ^ całkowite m,rt ^ 0 . 41. Oblicz ( k ) W ( n + ^ k)!, gdzie n Jest nieujemną liczbą całkowitą. 42. Znajdź sumę nieoznaczoną ^ ( ( —1)x/(™)) 6 x. Użyj jej do przedstawienia L k = o(- 1 )V(k) w P°staci zwartej43. Udowodnij potrójnie-dwumianową równość ( 5 .2 8 ). W skazówka: Wpierw zastąp ( £ * ) przez Z , L + n - M f ) 44. Użyj wzoru ( 5 .3 2 ), by znaleźć zwartą postać podwójnych sum j*' v j,k^ 0 gdzie m ^ a ^ O i r t ^ b ^ O s ą danymi liczbami całkowitymi. 45. Znajdź postać zwartą dla Yic^n ( ? ) 4 - K 46. Przedstaw następującą sumę w postaci zwartej, gdy rt jest dodatnią liczbą całkowitą: — 1\ /4 n . — 21c — 1\ ę (V )C k x .. „ N 2n —k (—I)14-1 ; (2k-1)(4n-2k-1) Wskazówka: Zastosuj funkcje tworzące. 47. Suma /r k + s \ fr n —rk — s \ Z V ^ y V n -k ) jest wielomianem zmiennych r i s. Pokaż, że nie zależy ona od s. 48. Równość Xlic^-a (nn k)2 k = 2U skojarzona z równością 1 / ( 1 - z ) 71+1 da nam = Jaka jest hipergeometryczną postać tego wzoru? 49. Użyj funkcji hipergeometrycznych do przekształcenia sumy 50. Udowodnij prawo odbicia Pfaffa ( 5 . 1 0 1 ) przez porównanie współczynni ków zn po obu stronach równania. 51. W wyprowadzeniu wzoru ( 5 . 1 0 4 ) pokazujemy, że lime-ô F(—m, —2m — 1 + e; —2m + e;2) = l / ( ^ 2) . W tym zadaniu zobaczymy, jak obliczanie granicy dla lekko zmienionej funkcji prowadzi do kompletnie różnych rezultatów dla zdegenerowanego szeregu hipergeometrycznego F(—m, —2m — 1; —2m; 2). a) Pokaż, że lime_*o F(—m + e, —2 m — 1; —2m + 2e; 2) = 0. Korzystając z prawa odbicia Pfaffa udowodnij dla wszystkich m ^ 0 równość F(a, —2m — 1; 2a; 2) = 0 . b) Czemu równa się lime->o F(—m + e, —2m — 1; —2m + e; 2)? 52. Udowodnij, że jeśli N jest nieujemną liczbą całkowitą, to M )nf ( 1—b i - N , . . . , 1 —bn—N , —N (-1 )m+1v 1—a i—N , . .. , 1—am—N z 5 3 . Jeśli podstawimy w tożsamości Gaussa ( 5 . 1 1 0 ) b = —j i z = 1, to lewa strona zredukuje się do —1 , podczas gdy prawa strona będzie równa + 1 . Dlaczego stąd nie wynika, że —1 = +1? 5 4 . Wyjaśnij, jak można otrzymać prawą stronę równości ( 5 . 1 1 2 ). 55. Niech wyrazy hipergeometryczne t(k) = F( ai , . . . , a m; b i , . . . , bn ; z)* i T(k) = F(Ai , . . . , A m ; B i , . . . , Bn ; Z)* dla wszystkich k ^ 0 spełniają zależność t(k) = c( T ( k + 1) —T(k)). Pokaż, ż e z = Z i m —rt = M — N. 56. Stosując algorytm Gospera znajdź ogólny wzór dla sumy Y ("jf) Sic. Udo wodnij, że wyrażenie (—1 ) k - 1 —J także jest rozwiązaniem. 57. Stosując algorytm Gospera znajdź stałą 0, dla której zk(k + 0) 6k jest sumowalna za pomocą wyrazów hipergeometrycznych. 58. Niech m i rt będą liczbami całkowitymi spełniającymi nierówność 0 ^ m ^ rt oraz Znajdź związek między T i Tm_ i >n_i, następnie rozwiąż otrzymaną rekurencję stosując czynnik sumacyjny. Z adania eg zam in acyjn e 59. Znajdź postać zwartą dla gdzie m i n są dodatnimi liczbami całkowitymi. 60. Użyj przybliżenia Stirlinga (4 .2 3 ), by oszacować dla dużych m i r t współ czynnik dwumianowy (m7^TL) • Co otrzymamy, gdy m = n? 61. Udowodnij, że jeśli p jest liczbą pierwszą, to dla wszystkich nieujemnych liczb całkowitych m i n zachodzi (mod p ) . 62. Zakładamy, że p jest liczbą pierwszą, a m i n są dodatnimi liczbami całkowitymi. Ustal wartość w yrażen ia(^ ) m o d p 2. W skazówka: Można użyć następującego uogólnienia tożsamości Cauchy’ego: +1C2H bkm—Tl 63. Znajdź postać zwartą dla gdzie n ^ 0 jest liczbą całkowitą. k+1 64. Oblicz , gdzie n ^ 0 jest liczbą całkowitą. k=0 65. Udowodnij, że (k + 1 )! = n 6 6 . Oblicz „podwójną sumę Harry’ego,” mÔ, OsCj^k jako funkcję zmiennej m. (Sumujemy po j i k.] 67. Znajdź postać zwartą dla y k=0 ^ ( 2 )^ f 2 n ~ k n 6 8 . Znajdź postać zwartą dla y~ ( ™j min(k, u —k) 69. Znajdź postać zwartą dla mm kt ,. . . , k m ^ 0 ki -\-----bkm = n L i=1 jako funkcję zmiennych m i n . 70. Znajdź postać zwartą dla ^ (k) ( ? ) ( t ) • calkowite n ^ a 71. Dla m i n nieujemnych liczb całkowitych przyjmijmy sn = £ ' n + k ) « * , m + 2k kÔ i niech A (z) = Y k ^ o a k^k będzie funkcją tworzącą dla (ao, a i , a 2 , .. a) Przedstaw funkcję tworzącą S(z) = ^ n > 0 Snzn za pomocą A(z). b) Użyj tej metody do rozwiązania zadania 7 z podrozdziału 5 .2 . 72. Udowodnij, że jeśli m, n, k są całkowite i rt > 0, to 'm / n \ . * r 2k-'v(k) jest całkowite, gdzie ^(k) jest liczbą jedynek w dwójkowej reprezentacji liczby k. 3 73. Użyj metody repertuaru do rozwiązania rekurencji Xo = oc; X] = |3; Xn = (rt — 1)(Xn_i + Xn_ 2 ) , dla rt > 1. Wskazówka: Zarówno rt!, jak i rtj spełniają rekurencję. 74. W tym zadaniu rozważamy wersję trójkąta Pascala. Na krawędziach trój kąta zamiast samych jedynek znajdują się kolejne liczby naturalne. We wnętrzu trójkąta ciągle obowiązuje reguła dodawania 2 3 4 5 2 4 7 11 3 7 14 4 11 5 Niech dla 1 ^ k ^ n symbol ((£)) oznacza k-tą liczbę w wierszu n. Przyjmujemy, że ((^)) = ((£)) = rt oraz dla 1 < k < u zachodzi ((£)) = (O^k1)) ((k—I)) ’ w yraź wartość ((£)) w zwartej postaci. 75. Znajdź relację pomiędzy funkcjami - £ ( 3") k x ' i liczbami [2n/3 J , [2n/3 ]. 76. Rozwiąż następującą rekurencję dla n, k ^ 0: Qn,,o — 1 j Qo,k — [ k — 0 ]; gdzie n, k > 0 . 77. Czemu równa się jeśli m > 1 ? 7 8 . Znajdź zwartą postać dla poniższej sumy, jeśli m jest dodatnią liczbą całkowitą: 2y" ^ ( k m°d m \ ( 2 k + 1 ) mod (2 m + 1 ) 79. Dobrze wiedzieć. a) Co jest największym wspólnym dzielnikiem (2n), (2^ ), . . . , ( 2 2 - i ) ? Wskazówka: Rozważ sumę tych rt liczb, b) Pokaż, że najmniejsza wspólna wielokrotność liczb (£), (^), . . . , (™) jest równa L(rt + 1)/(n + 1), gdzie L(n)= NW W( 1, 2 , . . . ,rt). 80. Udowodnij, że dla wszystkich liczbcałkowitych k ,n ^ 0zachodzi (£) (ert/k)k. 81. Niech 0 < 9 < 1 i 0 ^ x ^ 1 , oraz l,m,rt są nieujemnymi liczbami całkowitymi spełniającymi warunek m < n. Udowodnij nierówność > o. Wskazówka: Zróżniczkuj względem zmiennej x. Zadania dodatkowe 82. Udowodnij, że trójkąt Pascala spełnia bardziej zaskakującą własność sześciokąta od cytowanej już uprzednio w rozdziale 3 : NW D ( ( r ] ) . u , ) - r n ) = n w d ((V ), o , (,-0 ) ■ gdzie 0 < k < n. Na przykład NW D (56,36,210) = N W D (28,120,126) = 2. 83. Udowodnij zadziwiającą, pięcioparametrową równość ( 5 .3 2 ). 84. Pokaż, że druga para wzorów (5 .6 1 ) wynika z pierwszej pary ( 5 .6 0 ). Wskazówka: Zróżniczkuj względem zmiennej z. 85. Udowodnij, że ^ m=1 1 /kf+k^H bk^ + 2n\ < k 2<-"<lcm ^ n ^ / = (- , ) " " |3 - ( 2„n (Lewa strona jest sumą o 2n —1 wyrazach.) Wskazówka: Prawdziwe jest coś ogólniejszego. 8 6 . Niech a i , . . . , an będą nieujemnymi liczbami całkowitymi, i niech liczba C(a-|, . . . , an ) będzie współczynnikiem przy wyrazie wolnym z° . . . z^ w rozwinięciu iloczynu ai n (i -j a) Udowodnij, że C ( di , . . . , an ) jest równe lewej stronie wzoru ( 5 .3 1 ). b) Udowodnij, że jeśli Zi, . . . , z^ są wzajemnie różnymi liczbami zespo lonymi, to wielomian Z — Zi k=1 Zk Z) jest tożsamościowo równy 1 . c) Przemnóż pierwszy iloczyn przez f(0) i dowiedź, że C (d i , d2 ł . . . , an ) jest równe C(d! - 1, d2,..., dn)+ C(d!,d2 - 1,..., dn) H--- h C(di,d2,...,d-n,— 1) . (Ponieważ ta rekurencją definiuje multimianowe współczynniki, to liczba C(di,..., dn) musi być równa prawej stronie równości ( 5 .3 1 ).) 87. Niech m będzie dodatnią liczbą całkowitą oraz £ = en i/m . Pokaż, że k^n/m B _ m(zm ) n + 1 (1 + m ) $ _ m (zm ) —m y- (C2>+ , z ® 1+1/m(C2i+ ,z )1/m) n+1 ( m + 1 ) ® 1+1/mU 2H - z ) - ’ - 1 • (Gdy m = 1, równość ta redukuje się do równości ( 5 .7 4 ).) 8 8 . Udowodnij, że współczynniki s^ we wzorze ( 5 .4 7 ) dla wszystkich k > 1 są równe (-l)k [ 1 Jo Zatem |sid < 1/ ( k — 1). 89. Udowodnij, że równość ( 5 . 1 9 ) ma swój nieskończony odpowiednik y~ f m ^"T>) xk‘yTll_lc = k>m ' ' ^ k>m ' (~ x )k(x +'y)m-k ł ' całkowite m gdzie |x| < |y| i |x| < |x + -y|. Zróżniczkuj tę równość rt razy względem zmiennej y i wyraź wynik jako funkcję hipergeometryczną. Jaką tożsa mość otrzymamy? 90. W zadaniu 1 z podrozdziału 5.2 rozważaliśmy sumę X k ^ o (k) / (k)> g d z i e r i s były liczbami całkowitymi oraz s ^ r ^ 0. Czemu równa się suma, gdy r i s nie są liczbami całkowitymi? 91. Udowodnij tożsam ość W hipple’a pokazując, że obie strony równości spełniają to samo równanie różnicz kowe. 92. Udowodnij równości iloczynowe Clausena Jakie otrzymamy równania po przyrównaniu współczynników przy zn ? 93. Pokaż, że dla dowolnej funkcji f i stałej oc nieskończona suma ma (względnie) prostą postać zwartą. 94. Znajdź (£) (ul alc) 5k, gdy rt jest dodatnią liczbą całkowitą. 95. Jakie warunki trzeba dodać do ( 5 . 1 1 8 ), by można było jednoznacznie wyznaczyć wielomiany p, q, r? 96. Udowodnij, że jeśli dla danego składnika hipergeometrycznego t(k) algo rytm Gospera nie znajdzie żadnego rozwiązania równości ( 5 . 1 2 0 ), to nie istnieje rozwiązanie ogólniejszego równania t(k) = (Ti(k + 1) H-------bTm(k-Hi)) — (Ti(k) H------- 1-Tm( k ) ) , gdzie Ti (k), . . . , Tm(k) są składnikami hipergeometrycznymi. 97. Znajdź wszystkie liczby zespolone z, takie że k!2/ n j L i (j2 + jz + 1) jest sumowalne za pomocą składników hipergeometrycznych. 98. Jaką rekurencję otrzymamy za pomocą metody Gospera-Zeilbergera dla sumy Sn = £ k ( 2nJ ? 99. Przyjmijmy, że a jest nieujemną liczbą całkowitą. Znajdź za pomocą metody Gospera-Zeilbergera postać zwartą dla sumy ^ k t(n,k), gdzie t(n,k) = ( n + a + b + c + k)!/(rt + k)! (c + k)! (b —k )! (a —k)!k!. 100. Znajdź rekurencję dla sumy Następnie użyj tej rekurencji do znalezienia innego wzoru dla Sn . 101. Znajdź rekurencję spełnianą przez sumy Dla tej sumy (i kilku następnych) lepiej użyć komputera ze specjalnym programem. 1 0 2 . Zastosuj metodę Gospera-Zeilbergera do uogólnionej „bezużytecznej” tożsamości ( 5 . 1 1 3 ). Dla jakich wartości a, b, z ma postać zwartą? 103. Niech t(n,k) będzie składnikiem właściwym ( 5 . 1 4 3 ). Jakiego stopnia względem zmiennej k będą wielomiany p(n,k), q(n,k) i r(rt,k), gdy zastosujemy metodę Gospera-Zeilbergera do t(n,k) = Po W t( n , k) + -----h |3x(n)t(n + l,k)? (Zignoruj rzadkie, wyjątkowe przypadki.) 104. Zastosuj metodę Gospera-Zeilbergera do zweryfikowania godnej uwagi tożsamości 1 r —n —k + 1 r —2 rt + 1 * Wyjaśnij, dlaczego tą metodą nie znaleźliśmy dla tej sumy najprostszej rekurencji. 105. Pokaż, że jeśli cu = e27tl//3, to całkowite rt ^ 0 . 106. Udowodnij zadziwiającą tożsamość ( 5 .3 2 ). Podstaw t(r, j,k) pod wyrazy sumy podzielonę przez wyrażenie z prawej strony równości i następnie pokaż, że istnieją funkcje T(r, j,k) i U(r, j,k) takie, że t(r + 1, j,k) —t(r, j,k) = T(r, j + 1,k ) - T ( r , j,k) + U(r,j,k + 1) - U ( r , j , k ) . 107. Udowodnij, że 1 / ( n k + 1) nie jest składnikiem właściwym. 108. Pokaż, że liczby Apery’ego An ( 5 . 1 4 1 ) są elementami przekątnej An>n macierzy zdefiniowanej wzorem ^ r ( 7 ) 2( : ) ! (2™+ L - ’- k)- Udowodnij, że jest to macierz symetryczna i że zachodzi A -.. = r ( mT k)!(m: r k2k)2 = z ( 3 0 ( \ +k)(":k)109. Udowodnij, że liczby Apery’ego An ( 5 . 1 4 1 ) spełniają dla wszystkich liczb pierwszych p i nieujemnych liczb całkowitych rt kongruencję An — Ajn/pj An modp (mod p ) . Problemy badawcze 110. Dla jakich wartości n zachodzi ( ^ = (—1)n (mod ( 2 n + 1))? 1 1 1 . Niech q(rt) będzie najmniejszym, nieparzystym dzielnikiem współczyn nika dwumianowego ( 2rJx) . Zgodnie z zadaniem 36, jeśli zapiszemy liczbę rt w systemie pozycyjnym o podstawie p i wszystkie cyfry będą co naj wyżej równe (p —1)/2, t o p nie dzieli (2^ )- Eksperymenty komputerowe wykazały, że dla 1 < rt < 10 10000 zachodzi q(rt) ^ 1 1 , z wyjątkiem q (3160) = 13. a) Czy dla wszystkich rt > 3160 zachodzi nierówność q(n) ^ 11 ? b) Czy równość q(rt) = 11 jest prawdziwa dla nieskończenie wielu rt? Nagroda 7-11-13 dolarów jest oferowana za rozwiązanie albo (a), albo (b). 1 1 2 . Czy dla wszystkich rt > 4 , z wyjątkiem n = 64 i n = 256, liczba ( ^ jest podzielna przez 4 lub 9? 113. Załóżmy, że t(rt + 1,k)/t(rt,k) i t(rt,k + 1)/t(rt,k) są funkcjami wy miernymi zmiennych rt i k oraz że istnieje niezerowy, liniowy operator różnicowy H(N,K,rt) taki, że H(N,K,rt)t(rt,k) = 0. Czy t(n,k) jest składnikiem właściwym? 114. Niech m będzie liczbą całkowitą. Zdefiniujmy ciąg c ! ^ rekurencją Czy wszystkie liczby c ^ są całkowite? fisi Liczby szczególne Niektóre ciągi liczbowe tak często występują w matematyce, że rozpozna jemy je bez trudu. Ciągom tym nadajemy szczególne nazwy. Na przykład każdy, kto uczył się arytmetyki, poznał ciąg kwadratów kolejnych liczb natu ralnych ( 1 , 4 , 9 , 1 6 , . . . ) . W rozdziale 1 zajmowaliśmy się liczbami trójkątnymi ( 1, 3, 6 , 1 0 , . . . ) , a w rozdziale 4 liczbami pierwszymi ( 2 , 3 , 5 , 7 , . . . ) . W roz dziale 5 przyjrzeliśmy się w skrócie liczbom Catalana ( 1, 2 , 5, 1 4 , . . . ) . W tym rozdziale poznamy kilka innych ważnych ciągów liczbowych. Na początku zajmiemy się liczbami Stirlinga {£ } i [£] oraz liczbami Eulera (£ ). Tworzą one trójkątne wzorce współczynników podobnie jak współczyn niki dwumianowe (£) w trójkącie Pascala. Potem przyjrzymy się dokładniej liczbom harmonicznym Hn oraz liczbom Bernoulliego B^. Różnią się one od wcześniej przez nas poznanych ciągów tym, że są ułamkami, a nie licz bami całkowitymi. Pod koniec rozdziału zbadamy fascynujące liczby Fibo nacciego Fn i ich niektóre ważne uogólnienia. 6.1. Liczby Stirlinga .. par cette notation, les formules deviennent plus symśtriąues.” J. Karamata [199] Zaczniemy od liczb Stirlinga, bliskich kuzynów współczynników dwumiano wych, nazwanych tak na cześć Jamesa Stirlinga (1692-1770). Liczby te wystę pują w dwóch odmianach, zwykle nazywanych „liczbami Stirlinga pierwszego i drugiego rodzaju.” Chociaż mają one szacowną historię i wiele zastosowań, ciągle cierpią na brak standardowej notacji. Zgodnie z notacją wprowadzoną przez Jovana Karamatę, liczby Stirlinga drugiego rodzaju będziemy ozna czać { £} , a liczby Stirlinga pierwszego rodzaju [£]. Symbole te wydają się bardziej przyjazne niż wiele innych, których próbowano w przeszłości. Tabele 289 i 290 pokazują, jak wyglądają liczby {£ } i [£] dla małych rt i k. Zagadnienie, dotyczące liczb: „1, 7, 6 , 1” prawdopodobnie wiąże się z { £} , „6 , 1 1 , 6 , 1 ” związane jest z [£], tak jak przyjmujemy, że zagad nienie dotyczące „1, 4, 6 , 4, 1” odpowiada (£). Te charakterystyczne liczby pojawiają się przy n = 4. T abela 289. Trójkąt Stirlinga dla podzbiorów Liczby Stirlinga drugiego rodzaju pojawiają się częściej niż liczby pierw szego rodzaju, a zatem tym razem zaczniemy od końca. Symbol { £ } oznacza liczbę sposobów podziału zbioru rt elementowego na k niepustych podzbio rów. Na przykład, istnieje siedem sposobów podziału zbioru czteroelementowego na dwie części: {1,2,3}U{4}, {1,2} U {3,4}, {1,2,4} U {3}, {1,3,4} U {2}, (Sam Stirling rozważał ten rodzaj jako pierwszy w swojej książce [344].) {2,3,4}U{1}, {1,3} U{2,4}, {1,4}U czyli { 2 } = 7. Zauważmy, że nawiasy klamrowe oznaczają zarówno zbiory, jak i liczby { £} . To notacyjne pokrewieństwo pozwoli nam zapamiętać znaczenie symbolu { £} , który można odczytać jako „k podzbiorów rt.” Przyjrzyjmy się małemu k. Jest tylko jeden sposób na umieszczenie rt elementów w jednym niepustym zbiorze. Stąd = 1 dla wszystkich n > 0. Z drugiej strony, {^} = 0, ponieważ zbiór 0-elementowy jest tylko jeden— pusty. Przypadek dla k = 0 wymaga nieco zręczności. Najlepiej będzie, jeśli zgodzimy się, że jest tylko jeden sposób podziału pustego zbioru na zero nie pustych części. Mamy więc {^} = 1. Ponieważ niepustego zbioru nie można podzielić na zero niepustych części, więc { o } = 0 d l a n > 0 . Co się dzieje przy k = 2? Oczywiście = 0. Jeśli zbiór n > 0 obiektów dzielimy na dwie niepuste części, to jedna z nich zawiera ostatni obiekt i jakiś podzbiór pierwszych n — 1 obiektów. Istnieje 2 n _1 sposobów na wybranie powyższego podzbioru, ponieważ każdy z pierwszych n —1 obiektów jest albo w nim, albo poza nim. Jednak nie wolno nam włożyć wszystkich obiektów do tego podzbioru, ponieważ chcemy uzyskać dwie niepuste części. Zatem {2,3};(6 .1) T abela 290. Trójkąt Stirlinga dla cykli n | 1 i 40320 r Tl TL TL M .7 8 M 4536 546 36 Tg W 3 11 ^ f 11 lĘ 6 l ||n 50 35 10 274 225 85 1764 1624 735 13068 13132 6769 109584 118124 67284 1 22449 1 odejmujemy 1 dla całkowitych n > 0 . ( 6 .2; (Zgadza się to z naszym powyższym wyliczeniem = 7 = 2 3 — 1.) Modyfikacja tego rozumowania prowadzi do wzoru rekurencyjnego, za pomocą którego możemy wyliczyć {£ } dla wszystkich k: Dzieląc zbiór rt > 0 obiektów na k niepustych części, ostatni obiekt umieszczamy w zbiorze jednoelementowym (na { £ z { } sposobów) albo umieszczamy go razem z jakimś niepustym podzbiorem pierwszych n —1 obiektów. W tym drugim przypadku daje to k {nk 1} możliwości, ponieważ każdy z { n“ 1} sposobów na rozłożenie pierwszych n — 1 obiektów na k niepustych części daje k podzbiorów, do których n-ty obiekt może dołączyć. Stąd = k rt — 1 k M n —1 k —1 dla całkowitych n > 0. (6-3) Wzór ten generuje tabelę 289. Bez czynnika k zredukowalibyśmy go do wzoru sumacyjnego ( 5 .8 ) generującego trójkąt Pascala. Zajmiemy się teraz liczbami Stirlinga pierwszego rodzaju. Przypominają one poprzednie, przy czym [£] oznacza liczbę sposobów na rozmieszczenie rt obiektów w k cyklach zamiast w podzbiorach. *[£]* wyrażamy słowami „k cykli n.” Cykle to cykliczne ustawienia, takie jak naszyjniki, które rozważaliśmy w rozdziale 4. Cykl D B ^ -c y możemy zapisać krócej jako ‘[A, B, C, D]’ rozumiejąc, że [A, B, C, D] = [B, C, D, A] = [C,D,A,B] = [D.A.B.C]; Cykl „zapętla się”, ponieważ jego koniec łączy się z początkiem. Z dru giej strony, cykl [A,B,C,D] nie jest równoważny cyklowi [A, B,D,C] ani [D, C, B, A]. Istnieje jedenaście różnych sposobów na stworzenie dwóch cykli z czte rech elementów: [1,2,3] [4], [1,2,4] [3], [1,3,4] [2], [2,3,4] [1], [1.3.2] [4], [1,4,2] [3], [1,4,3] [2], [2,4,3] [1], [1.2] [1,3] [2,4], [1,4] [2,3]; [3,4], ( 6 .4 ) stąd [2] = 1 1 . Cykl singletowy (tzn. cykl składający się tylko z jednego elementu) zasad niczo odpowiada zbiorowi singletowemu (zbiór z tylko jednym elementem). Podobnie, 2-cykl odpowiada 2-zbiorowi, ponieważ mamy [A, B] = [B,A], tak jak {A, B} = {B,A}. Ale istnieją dwa różne 3-cykle: [A,B,C] i [A, C,B]. Za uważmy, na przykład, że jedenaście par cykli w ( 6 .4 ) można uzyskać z siedmiu par zbiorów w ( 6 . 1 ) poprzez stworzenie dwóch cykli z każdego 3 -elementowego zbioru. W ogólności, z każdego n-elementowego zbioru można stworzyć n !/n = (n — 1)! różnych n-cykli, o ile rt > 0. (Istnieje rt! permutacji, a każdy n-cykl występuje rt razy, ponieważ każdy z jego elementów może być wypisany jako pierwszy.) Zatem otrzymujemy = (n — 1 )!, dla całkowitych rt > 0 . ( 6 .5 ) Jest to dużo więcej niż wartość } = 1, którą otrzymaliśmy w przypadku liczb podzbiorowych Stirlinga. Łatwo zauważyć, że liczba cykli musi być co najmniej tak duża, jak liczba podzbiorów ^ \ ^ }►, dla całkowitych rt, k ^ 0 , ( 6 .6 ) ponieważ każdy podział na niepuste podzbiory prowadzi do co najmniej jed nego ustawienia w cykl. W wyrażeniu ( 6 .6 ) równość zachodzi wyłącznie wtedy, gdy wszystkie cykle są albo singletonami, albo dubletonami, ponieważ wówczas cykle są równoważne podzbiorom. Przypadek ten zachodzi dla k = rt i k = rt — 1. Stąd „ Istnieje dziewięć i sześćdziesiąt sposobów na. ułożenie pieśni plemiennej, i-każdy-z-nich-jestdobry Rudyard Kipling Nie mylić z rowerem. Łatwo zauważyć, że (Liczba sposobów ustawienia n obiektów w rt —1 cykli lub podzbiorów odpo wiada liczbie sposobów wybrania dwóch obiektów, które będą w tym samym cyklu lub podzbiorze.) Liczby trójkątne (£) = 1, 3, 6 , 10, . . . są wyraźnie obecne zarówno w tabeli 289, jak i w tabeli 290. Wzór rekurencyjny na liczby [£] wyprowadzamy modyfikując rozumo wanie przeprowadzone dla {£}. Każde ustawienie n obiektów w k cykli albo umieszcza ostatni obiekt w 1-cyklu (na [£z]] sposobów), albo wstawia ten obiekt w jeden z [n cykli ustawień pierwszych u — 1 obiektów. W ostat nim przypadku można to zrobić na rt — 1 różnych sposobów. (Wymaga to chwili zastanowienia, ale nie jest trudno sprawdzić, że istnieje j sposobów na włożenie nowego elementu do j-cyklu, aby utworzyć (j +1 )-cykl. Na przykład dla j = 3 z cyklu [A, B, C] otrzymujemy [A, B, C, D ] , [A,B,D,C] lub [A,D,B,C], gdy wstawiamy nowy element D, i są to jedyne możliwości. Sumowanie po wszystkich j daje nam rt—1 sposobów na wstawienie n-tego obiektu do cyklu złożonego z n —1 obiektów.) Żądany wzór rekurencyjny przedstawia się zatem następująco: = (n-1) n -1 k n -1 k —1 dla całkowitych n > 0 . ( 6 .8 ) Jest to odpowiednik wzoru sumacyjnego generującego tabelę 290. Jeśli porównamy wzory ( 6 .8 ) i ( 6 .3 ), to przekonamy się, że pierwszy skład nik prawej strony jest pomnożony przez górny indeks, rt — 1 , w przypadku liczb cyklicznych Stirlinga, a przez dolny indeks, k, w przypadku liczb pod zbiorowych Stirlinga. Możemy zatem przeprowadzać proces „pochłaniania” w wyrazach takich, jak rt [£] oraz k {£}, kiedy dowodzimy za pomocą indukcji matematycznej. Każda permutacja jest równoważna zbiorowi cykli. Rozważmy, na przy kład, permutację, która zamienia 123456789 w 384729156. Dla wygody mo żemy przedstawić ją w dwóch wierszach: 123456789 384729156. Widzimy, że 1 staje się 3, 2 staje się 8 , i tak dalej. Wyłania się teraz struktura cyklu, ponieważ 1 przechodzi w 3, które przechodzi w 4, które przechodzi w 7, które przechodzi z powrotem w 1. Otrzymujemy cykl [1,3,4,7]. Innym cyklem w tej permutacji jest [2,8 ,5], jeszcze jednym [6 ,9]. Zatem permutacja 384729156 jest równoważna następującemu układowi cykli: [1,3,4,7] [2,8,5] [6,9]. Jeżeli mamy dowolną permutację 7T| 7t2 . . . 7tn elementów zbioru { 1 , 2 , . . . , rt}, każdy element jest w tylko jednym cyklu. Albowiem jeśli zaczniemy od trio = m i przejrzymy mi = 7tmo, rrt2 = 7im i , i tak dalej, musimy ostatecznie wrócić do = rrio. (Liczby muszą się powtórzyć wcześniej lub później, a pierwszą liczbą, która się ponownie pojawi, musi być mo, ponieważ znamy jedynych poprzedników pozostałych liczb m i , m.2 , . . . , m ic_i.) Zatem każda permutacja definiuje układ cykli. I oczywiście odwrotnie, każdy układ cykli definiuje permutację, jeśli odwrócimy powyższą konstrukcję, a odpowiedniość jeden-na-jeden pokazuje, że permutacje i układy cykli są zasadniczo tym samym. Zatem [£] jest liczbą permutacji n obiektów, które zawierają dokładnie .kJ k cykli. [£] po wszystkich k, musimy otrzymać całkowitą ykli. Jeżeli zsumujemy zsui liczbę permutacji: = rt!, L dla całkowitych u £ 0 . (6 .9 ) k=0 Na przykład, 6 + 11 + 6 + 1 = 24 = 4!. Rekurencyjne relacje (6 .3 ) oraz (6 .8 ), związane z liczbami Stirlinga, przy dają się w rozwiązaniach wielu problemów. Jeśli, na przykład, chcemy wyra zić potęgi xri przez ubywające potęgi x—, zauważamy, że w pierwszych paru przypadkach otrzymujemy: x° = x -; X1 = x - ; x2 = x - + x - ; = x - + 3x - + x - ; x 6 x - + 7x- + x - . Współczynniki te wyglądają podejrzanie tak samo, jak odbicie lustrzane liczb w tabeli 289. Zatem możemy się spodziewać, że wzór ogólny wygląda nastę pująco: xn = ^ { k | X~ ’ dla całkowitych rt ^ 0 . (6 . 1 0 ) Lepiej założyć, że G} = [a = ° dla k < 0 i n ^ 0. Prosty dowód przez indukcję utwierdza nas w tym przekonaniu. Mamy x-x- = xk+i _|_ p0 niewa2 x]£±l = x—(x —k). Stąd x*xn_1 wynosi n -1 • Ę l W - Ę r r j ^ t Z kx- -£{:=<V+S { V Innymi słowy, liczby podzbiorowe Stirlinga są współczynnikami potęg kro czących, za pomocą których otrzymujemy zwykłe potęgi. Można również pokazać, że liczby cykliczne Stirlinga są współczynnikami zwykłych potęg, za pomocą których otrzymujemy potęgi kroczące: x° = x ° ; = X1 ; x2 = x2 + X 1 ; = x3 + 3x2 + 2y} ; xT = x 4 + 6 x 3 + 11x2 + 6 x 1 . Mamy (x + n —1) -xk = x k+1 + (n —1)xk, zatem dowód podobny do poprzed niego pokazuje, że (x + n - 1 )xn “ 1 = (x + n - 1 )]T n - 1‘ xk = ^ Przez indukcję możemy udowodnić ogólny wzór =L dla całkowitych n ^ 0 . (6 . n ; (Jeżeli podstawimy x = 1, dostaniemy ponownie (6 .9 ).) Chwileczkę, ktoś zaprotestuje. Ta równość zawiera potęgi przyrastające xTL, podczas gdy (6 .10 ) zawiera potęgi ubywające x—. Co zrobić, jeśli chcemy przedstawić x—za pomocą zwykłych potęg lub jeśli chcemy przedstawić xn za pomocą potęg przyrastających? To proste, dorzucamy kilka znaków minus i dostajemy n—k^k ( - 1) dla całkowitych n ^ 0 ; (6 .1 2 ) ( - 1) n - kx \ dla całkowitych n ^ 0 . (6 -13) Łatwo się o tym przekonać, ponieważ, na przykład, wzór x— = x(x —1) (x —2) (x —3) = x4 —6x3 + 11 x2 —6x odpowiada wzorowi x4 = x(x + 1)(x + 2)(x + 3) = x4 + 6 x 3 + 11x2 + 6 x , tyle że z przeciwnymi znakami. Ogólna tożsamość ( 6 .1 4 ) z ćwiczenia 2.17 zamienia wyrażenia ( 6 . 1 0 ) w ( 6 . 1 2 ) i ( 6 . 1 1 ) w ( 6 . 1 3 ), jeśli zanegujemy x. Możemy zapamiętać, kiedy wstawić czynnik (—1 )n k do wzoru takiego jak ( 6 . 1 2 ), ponieważ istnieje naturalny porządek potęg dla dużych x: xu > xu > x—, dla wszystkich x > n > 1 . ( 6 -3 0 ) Liczby Stirlinga [£] i {£ } są nieujemne, zatem musimy użyć znaków minus, kiedy wyrażamy „małe” potęgi poprzez „duże”. Kiedy podstawimy wzór ( 6 . 1 1 ) do (6 . 1 2 ), dostaniemy podwójną sumę: n ~lcx1c Powyższa równość zachodzi dla wszystkich x, więc wszystkie współczynniki przy x°, X 1 , . . . , X7 1 - 1 , x 11+1, xTL+2, . . . z prawej strony muszą być równe zeru i otrzymujemy tożsamość dla całkowitych m, n ^ 0 . ( 6 .3 1 ) Liczby Stirlinga, tak jak współczynniki dwumianowe, spełniają wiele zas kakujących tożsamości. Są one jednak mniej uniwersalne niż te, z którymi spotkaliśmy się w rozdziale 5, więc nie są tak często stosowane. Zatem naj lepiej będzie wypisać najprostsze z nich, żeby w przyszłości móc się do nich odwołać, gdy będziemy zmuszeni rozgryźć twardy orzech liczb Stirlinga. Ta bele 296 i 297 zawierają najczęściej używane wzory. Wyprowadzone przez nas główne tożsamości pojawiają się tam ponownie. Kiedy badaliśmy współczynniki dwumianowe w rozdziale 5, odkryliśmy, że korzystnie było zdefiniować (£) dla ujemnych n w taki sposób, że tożsamość (k) = (nk 1) + (£_]) jest prawdziwa bez żadnych ograniczeń. Po zastosowaniu tej tożsamości do rozszerzenia (£) poza jego kombinatoryczne T ab ela 296. Podstawowe tożsamości liczb Stirlinga, dla całkowitych [Wzory inwersji: £0{mK'r" = Im- nl; ł {;} iiiS ':y.r*ł 'Vv V i -1 /4 M 0 Liczby S tirlin ga] T abela 297. Inne tożsamości liczb Stirlinga, dla całkowitych l, m, n ^ 0 nm( _ i r — [£] i r a t k mv k Również, □ (n-D -m L K IO , uogólnienie (6.9). T ab ela 298. Trójkąty Stirlinga w tandemie znaczenie, odkryliśmy (w tabeli 191), że trójkąt Pascala istotnie odtwarza się w obróconej formie, gdy rozszerzymy go w górę. Spróbujmy zrobić to samo z trójkątami Stirlinga: Co się stanie, jeśli zdecydujemy, że podstawowe rekurencje TL — 1 {;m v w Tl" k n -T = (tl — 1 ) k k —1 “n - 1 " + k—1 są prawdziwe dla wszystkich całkowitych n i k? Przy dodatkowym założeniu: = [k = 0 ] © i = [n = 0 ], (6.32) otrzymujemy jednoznaczne rozwiązanie. Ukazuje nam się zadziwiająco ładny wzór. Trójkąt Stirlinga dla cykli pojawia się powyżej trójkąta Stirlinga dla podzbiorów, i odwrotnie! Oba rodzaje liczb Stirlinga powiązane są wyjątkowo prostą zależnością [2 2 0 , 2 2 1 ]: -k -n dla całkowitych k, n. (6.33) Otrzymaliśmy „dualność,” podobną do relacji pomiędzy min i max, pomiędzy [xj i |Y |, pomiędzy x—i xn oraz pomiędzy NWD i NWW. Łatwo sprawdzić, że obie rekurencje [£] = (n — 1 ) [ \ ] + [£_-|] oraz {£ } = k{ v }+{£=;} stają się tym samym, przy takiej odpowiedniości. T abela 299. Trójkąt Eulera 6.2. Liczby Eulera Od czasu do czasu pojawia się jeszcze jeden trójkąt wartości. Jego odkrycie przypisujemy Eulerowi [104, §13; 110, strona 485]. Elementy trójkąta Eulera oznaczamy przez (£). Nawiasy kątowe w tym przypadku sugerują znaki „mniejszy niż” i „większy niż”. (£) jest liczbą permutacji 7ti tcz . . . 7rn zbioru {1,2, . . . , n } mających k w zniesień, tzn. k pozycji, na których 7tj < 7tj+ -|. (Uwaga: Notacja ta jest mniej standardowa niż nasze notacje [£] oraz {£ } dla liczb Stirlinga. Wkrótce zobaczymy, że ma swoje uzasadnienie.) Na przykład, jedenaście permutacji {1,2,3,4} ma dwa wzniesienia: 1324, 1243, 1423 , 1342, 2314 , 2341; 2413 , 3412; 2134, 3124, 4123. (W pierwszym wierszu są permutacje typu < 712 > 713 < 714, w drugim typu 7ti < 7i 2 < 713 > 7T4 i 7ti > 7X2 < 7i 3 < ^ 4 -) Stąd . Tabela 299 zawiera najmniejsze liczby Eulera. Zauważmy, że w tym przypadku charak terystycznym ciągiem jest 1, 11, 11, 1. Jeżeli n > 0, może być co najwyżej n — 1 wzniesień, zatem mamy = [n = 0 ] na przekątnej trójkąta. Trójkąt Eulera, tak jak trójkąt Pascala, ma w każdym wierszu elementy ułożone symetrycznie. Ale w tym przypadku zasada symetrii wygląda nieco inaczej: n n — 1 —k dla całkowitych rt > 0 . ( 6 .3 4 ) (Knuth [209, pierwsze wydanie] używał (k^ ) zamiast Permutacja 711712 . . . 7Tn ma n — 1 —k wzniesień wtedy i tylko wtedy, gdy jej symetryczne „odbicie” 7tn . . . 7t27ti ma k wzniesień. Spróbujmy znaleźć wzór rekurencyjny dla liczb (£). Każda permutacja p = pi . . . pn_ 1 zbioru { 1 , . . . , n — 1} prowadzi do rt permutacji { 1 , 2 , . . . , u}, jeśli wstawimy nowy element n na wszystkie możliwe sposoby. Załóżmy, że rt wstawiamy na pozycji j, otrzymując permutację 7t = pi . . . pj_i rt Pj . . . pn_ i . Liczba wzniesień w 7r jest taka sama jak w p, je ś li) = 1 lub jeśli pj_i < pj, a jest o jeden większa niż liczba w p, jeśli Pj_i > p^ lub jeśli j = n. Zatem n ma k wzniesień ustawionych na (k + 1)(TL^ 1) sposobów uzyskanych z permutacji p, które mają k wzniesień, i dodatkowo na ((n — 2) — (k — 1) + l ) ( £ z ] ) sposobów uzyskanych z permutacji p mających k —1 wzniesień. Poszukiwany wzór rekurencyjny wygląda następująco: ^ = (k + 1)^n k ^ + (rL-lc) ^ _ > całkowite rt > 0. ( 6 .3 5 ) Jeszcze raz zaczynamy rekurencję od ustalenia r0 > = [k = 0 ], dla całkowitych k, (6 .3 6 ) i zakładamy, że (£} = 0 , gdy k < 0 . Liczby Eulera są użyteczne przede wszystkim dlatego, że dostarczają wy godnych zależności pomiędzy zwykłymi potęgami a kolejnymi współczynni kami dwumianowymi: xn = Zachodni uczeni dowiedzieli się ostatnio o ważnej chińskiej pracy autorstwa Li ShanLan [249; 265, strony 320-325], opublikowanej w 1867 roku, która zawiera pierwsze znane pojawienie się wzoru ( 6.37). ^ > dla całkowitych n ^ 0 . (6 .3 7 ) (Nazywamy ją „tożsamością Worpitzky’ego” [379].) Na przykład mamy x2 = m27 + V ' x+1 2 X3 = G W T M * :2). x4 = {x\ + n ( x V ] + n rx + A ■ (x + i 4 V 4 / V 4 7 V 4 i tak dalej. Łatwo udowodnić ( 6 .3 7 ) przez indukcję (ćwiczenie 14). Na marginesie, wzór ( 6 .3 7 ) odpowiada jeszcze jednemu sposobowi obli czenia sumy kwadratów pierwszych n liczb naturalnych. Zachodzi równość T abela 301. Trójkąt Eulera drugiego rzędu r??r m ® 1 2 ' .:*• -i • f " i, i *K' 1^ 1I 3 jlr 1 » 4 li i 1 5 6 *1 ¥■ ftp:#«f*f_- > ł ; j r ih 1 Ijf; ] 0 2 0 8 Z 6 58 328 1452 5610 19950 22 52 114 240 494 |f f i"lt f -T 0 ^ | § p ;S ad|43;|!#S /? \s o 24 444 4400 120 0 3708 720 33984 0 5040 k2 = o © + < ? ) ( ,cn = © + ( kr ) . « t e “ i 2 + 2z -i + ti 2 = ( G ) + ( i ) + - + Q ) ) + ( © + @ + - + m ) = (n ^ ) + (n3 2) = | ( n + 1 ) n ( ( n - 1 ) + (n + 2 ) ) . Rekurencją Eulera (6.35) jest trochę bardziej skomplikowana niż reku rencje Stirlinga (6.3) i (6.8), więc nie spodziewamy się, że liczby (£} będą spełniać aż tak wiele prostych tożsamości. Niemniej jednak jest ich kilka: (6.38) k rt —m m! rt =z (6 .39 ) M) m n — k —m (6.40) k!. Jeżeli pomnożymy wzór (6.39) przez z11-711 oraz zsumujemy jego kolejne kopie względem m, to otrzymamy 21 m {m }m *zn_Ta = H k ( k ) ( z + ^)k- Zastępu jąc z przez z — 1 i zrównując współczynniki przy zk, dostajemy (6.40). Za tem ostatnie dwie tożsamości są w zasadzie równoważne. Pierwsza tożsamość (6.38) daje nam wartości szczególne, gdy m jest małe: = 1; = 21 rt = 31 (tl+ 1)2n + n+ 1 Nie musimy tutaj rozwodzić się dłużej nad liczbami Eulera. Wystarczy po prostu wiedzieć, że istnieją, oraz mieć listę ich podstawowych tożsamości, aby poratować się nią, gdy zaistnieje potrzeba. Jednakże, zanim zakończymy ten temat, powinniśmy wspomnieć o jeszcze jednym trójkątnym wzorcu współ czynników, przedstawionym w tabeli 301. Nazywamy je „liczbami Eulera drugiego rzędu” ((£)), ponieważ spełniają równanie rekurencyjne podobne do ( 6 .3 5 ), ale z jednym n zastąpionym przez 2n — 1 : ( ( £ ) ) = ( k + 1 ) ( ( n k 1) ) + ( 2 n _ 1 “ ,c)( ( k - i ) ) - (6-4l) Liczby te mają ciekawą interpretację kombinatoryczną, pierwszy raz zapropo nowaną przez Gessela i Stanleya [147]. Jeżeli stworzymy permutacje zbioru z powtórzeniami { 1 , 1 , 2 , 2 , . . . ,n ,n } o takiej własności, że wszystkie liczby występujące pomiędzy dwoma pojawieniami się m są większe niż m, dla 1 ^ m ^ n, wówczas ((£)) jest liczbą tych permutacji, które mają k wznie sień. Na przykład, istnieje osiem odpowiednich permutacji z jednym wznie sieniem zbioru z powtórzeniami { 1 , 1 , 2 , 2 ,3 , 3 }: 113322, 133221, 221331, 221133, 223311, 233211, 331122, 331221. Oznacza to, że ((3)) = 8 . Zbiór z powtórzeniami { 1 , 1 , 2 , 2 , . . . ,n ,n } ma w sumie L ( ( k ) ) = (2n-1)(2n-3)...(1) = (6 .42 ) odpowiednich permutacji, ponieważ dwa wystąpienia n muszą ze sobą sąsia dować oraz istnieje 2 rt — 1 pozycji na umieszczenie ich wewnątrz permutacji dla n — 1. Gdy n = 3, permutacja 1221, mająca pięć pozycji do wypeł nienia, generuje 331221, 133221, 123321, 122331 i 122133. Rekurencję ( 6 .4 1 ) można udowodnić wzmacniając argumentację, jaką zastosowaliśmy dla zwy kłych liczb Eulera. Liczby Eulera drugiego rzędu są ważne, ponieważ są związane z liczbami Stirlinga [148]. Można wykazać (przez indukcję względem n ), że x ! n} = L((£)) (x+V x x —n = H ( ( k ) ) (* 2 0 ^ ’ k) > całkowiten>0; (6-43) całkowite n ^ O . (6 .44) Na przykład, (Rozważaliśmy już przypadek dla rt = 1 w ( 6 .7 ).) Tożsamości te zachodzą, gdy x jest całkowite, a rt jest całkowite nieujemne. Ponieważ prawe strony są wielomianami zmiennej x, więc możemy na podstawie wzorów ( 6 .4 3 ) i ( 6 .4 4 ) zdefiniować liczby Stirlinga { xZrL} i [x *n] dowolnej rzeczywistej (lub zespolonej) wartości. Jeżeli rt > 0, wielomiany {*}* i [*] są zerowe dla x = 0, x = 1, . . . , x. Zatem są one podzielne przez (x — 0), (x — 1), .. .i (x). Przyjrzyjmy się, co zostało po podzieleniu przez powyższe czynniki. Definiujemy w ielom iany Stirlinga crrL(x) zgodnie z regułą X OnM = x —rt / (x(x — 1 } . . . (x —n ) ) . (6-45) (Stopień wielomianu crn M wynosi rt — 1.) Pierwszych kilka przypadków to: oo(x) = l / x ; di(x) = 1 / 2 ; Czyli l/x jest wielomianem? 0 2 (x) = (3x — 1) /2 4 ; (Sorry, tak wyszło.) 0-3 (x) = (x 2 —x ) /4 8 ; a 4 (x) = (15x3 —30x2 + 5x + 2 )/5 7 6 0 . Można je generować używając liczb Eulera drugiego rzędu. Na przykład, 03M = ((x—4)(x—5 ) + 8 (x—4 ) ( x + 1 ) + 6 (x+ 2 )(x + 1 ) ) / 6 L Okazuje się, że wielomiany te spełniają dwie bardzo wygodne tożsamości: T abela 304. Wzory splotu Stirlinga A w ogólności, jeśli §t(z) jest szeregiem potęgowym, który spełnia l n O - z S t f z ) 1- 1) = -zS tfz)1 , (6.52) St (z)x = x^S” 0Yl(x + tn ) zn . n ( 6 .53 ) to Możemy zatem uzyskać ogólne wzory splotu dla liczb Stirlinga, tak jak to zrobiliśmy dla współczynników wielomianów w tabeli 232. Wynikiumiesz czone są w tabeli 304. Gdy suma liczb Stirlinga nie pasuje do tożsamości z tabeli 296 lub 297, podpowiedzi należy szukać w tabeli 304. (W tym rozdziale odpowiedni przykład pojawia się później, zaraz za równaniem ( 6 . 1 0 0 ). Ćwi czenie 7.19 omawia ogólne reguły splotów oparte na tożsamościach takich, jak (6.50) oraz (6 .5 3 ).) 6.3. Liczby harm oniczne________________________ Przyszedł czas, aby przyjrzeć się bliżej liczbom harmonicznym, z którymi spotkaliśmy się po raz pierwszy w rozdziale 2 : H-n. = 1+ 1 1 1 n 1 - + - H--------- 1— = y~ - , 1 5 n dla całkowitych n ^ 0 . ( 6 .54 ) k=ik Liczby te pojawiają się tak często w analizie algorytmów, że informatycy po trzebują dla nich specjalnej notacji. Używamy Hn , gdzie symbol ‘H’ oznacza „harmoniczny,” ponieważ ton fali o długości 1 /rt jest nazywany n-tą harmo niczną tonu fali o długości 1. Pierwszych kilka wartości wygląda następująco: n Hn 0 0 1 2 3 4 5 6 7 8 9 10 1 3 2 11 6 25 12 137 60 49 20 363 140 761 280 7129 252 0 7381 252 0 Ćwiczenie 21 pokazuje, że Hn nigdy nie jest liczbą naturalną dla n > 1. A oto sztuczka karciana, oparta na pomyśle R. T. Sharpa [326], która ilustruje, jak często liczby harmoniczne pojawiają się w codziennych sytu acjach. Mając n kart na stole, chcielibyśmy stworzyć największy możliwy nawis poprzez układanie kart jedna na drugą nad krawędzią stołu, uwzględ niając prawa grawitacji: karta 1 |— d2 — stół dn+i Definiując ten problem precyzyjniej, żądamy, aby brzegi kart były równoległe do krawędzi stołu. W przeciwnym razie moglibyśmy poprzez obrócenie kart powiększyć nawis. Dla uproszczenia obliczeń zakładamy, że każda karta ma długość 2 jednostek. Jeżeli mamy jedną kartę, największy nawis otrzymujemy wtedy, gdy jej środek ciężkości leży dokładnie nad krawędzią stołu. Karta ma środek ciężko ści w swoim środku geometrycznym, więc możemy stworzyć nawis długości połowy karty, czyli 1 jednostki. W przypadku dwóch kart, nie jest się trudno przekonać, że największy na wis osiągniemy wtedy, gdy środek ciężkości górnej karty leży nad wystającą krawędzią dolnej, a wspólny środek ciężkości obu kart leży nad krawędzią stołu. Środek ciężkości dwóch kart razem znajduje się w środku ich części wspólnej, otrzymujemy więc dodatkowe pół jednostki nawisu. Wzór ten sugeruje ogólną metodę, zgodnie z którą układamy karty tak, aby środek ciężkości k górnych kart leżał nad krawędzią (k + 1 )-szwej karty (która podtrzymuje górne k kart). Stół pełni rolę (n + l)-szej karty. Spró bujmy wyrazić ten warunek algebraicznie. Niech d^ będzie odległością mię dzy krawędzią karty leżącej na wierzchu, a odpowiadającą jej krawędzią k-tej karty od góry. Wówczas di = 0, a dk+i odpowiada środkowi ciężkości pierw szych k kart: dk+i = (di + 1 ) + (d 2 + 1 ) H-------b (dk + 1 ) k ! (Środek ciężkości k obiektów, ważących odpowiednio w i , . . . , w k i mających środki ciężkości w punktach p i , . . . p k, znajduje się w punkcie (w ip i H------ b wicpic)/(wi H-------l-wk).) Nasz wzór rekurencyjny możemy wyrazić w dwóch równoważnych postaciach kdic-i-i = k + diH------ b d ic-i+ d ic, kÔ; (k — 1 ) dk = k — 1 + di H-------h dic_i , k ^ 1. Po odjęciu równań stronami otrzymujemy kdk+i - (k - 1 )dk = 1 + dk , k ^ 1; stąd dk+i = dk + 1/k. Druga karta wystaje pół jednostki poza trzecią. Ta wystaje o jedną trzecią jednostki poza czwartą, i tak dalej. Ogólny wzór dk+i = Hk ( 6 .5 6 ) otrzymujemy przez indukcję. Jeżeli k = rt, wartość dn+i = Hn odpowiada całkowitemu nawisowi n kart ułożonych zgodnie z powyższym opisem. Czy moglibyśmy osiągnąć większy nawis, nie wysuwając każdej karty do jej ekstremalnego wychylenia, tylko magazynując „potencjalną energię grawitacyjną” w celu jej późniejszego wykorzystania? Nie, ponieważ każde dobrze zbalansowane ułożenie karty spełnia warunek z (1 + d i ) + (1 + d2) + • • ■ + (1 + dk) dk+i ^ ----------------------- ------------------------ , Każdy, kto faktycznie próbuje osiągnąć maksymalny nawis z 52 kartami, prawdopodobnie nie ma do czynienia z pełną talią— albo jest prawdziwym szulerem. 1 ^ k ^ n. Ponadto di = 0. Indukcyjnie otrzymujemy, że dk+i ^ Hk. Zauważmy, iż nie musimy użyć zbyt wielu kart, aby górna karta znala zła się całkowicie poza krawędzią stołu. Potrzebujemy nawisu większego niż długość jednej karty, czyli 2 jednostek. Pierwszą liczbą harmoniczną przekra czającą 2 jest H4 = y |, a zatem wystarczą tylko cztery karty. Używając 52 kart otrzymamy Hs 2 -jednostkowy nawis, który okazuje się odpowiadać długości H5 2 / 2 « 2 , 27 kart. (Wkrótce poznamy wzór, który powie nam, jak obliczyć przybliżoną wartość Hn dla dużych rt, bez dodawania całego pęku ułamków.) Zabawny problem znany pod nazwą „robaczek na gumowej taśmie” uka zuje liczby harmoniczne w innym świetle. Powolny, lecz wytrwały robaczek R rozpoczyna wędrówkę od początku metrowej gumowej taśmy i pełznie jeden centymetr na minutę w kierunku jej końca. Pod koniec każdej minuty równie wytrwały właściciel taśmy W, którego wyłącznym celem w życiu jest po krzyżowanie planów R, rozciąga taśmę równomiernie o jeden metr. Zatem po jednej minucie pełznięcia R jest odległy o 1 centymetr od początku swojej drogi i o 99 centymetrów od jej końca. Wówczas W rozciąga taśmę o jeden 307 L iczby harm oniczne' metr. Podczas operacji rozciągania R zachowuje swą względną pozycję, 1% od startu i 99% do finiszu. Zatem R znajduje się 2 cm od punktu wyjścia i 198 cm do celu. Po następnej minucie pełznięcia R osiąga 3 cm taśmy, mając jeszcze przed sobą 197 cm do przejścia. Teraz W rozciąga taśmę i odpowied nie odległości osiągają wartości 4,5 oraz 295,5. I tak dalej. Czy robaczek kiedykolwiek dobrnie do końca taśmy? Cały czas posuwa się do przodu, ale cel wydaje się oddalać coraz szybciej. (Zakładamy, że W i R są nieskończenie długowieczni, taśma jest nieskończenie elastyczna, a robaczek nieskończenie mały.) Zapiszmy teraz kilka wzorów. W czasie, gdy W rozciąga gumową ta śmę, ułamek drogi, którą przepełznął R, pozostaje ten sam. A zatem pełznie 1/100-tną w pierwszej minucie, 1/200-tną w drugiej, 1/300-tną w trzeciej, i tak dalej. Po n minutach R pokonuje 1 / 1 1 1 1\ Hn TÓ0 V^ + 2 + 3 + ' " + n J _ TÓ0 x ^ '57^ długości gumowej taśmy. A zatem osiągnie metę w momencie, gdy Hn prze kroczy wartość 1 0 0 . Wkrótce zobaczymy, jak oszacować Hn dla dużych n. Na razie jednak sprawdźmy nasze rozumowanie rozpatrując, jak zachowałby się „Superrobaczek” w tej samej sytuacji. Superrobaczek, w przeciwieństwie do R, potrafi pełznąć 50 cm na minutę. A zatem po n minutach przepełznie Hn/2 długości taśmy, zgodnie z naszą wcześniejszą argumentacją. Jeżeli nasze rozumowanie jest poprawne, superrobaczek powinien finiszować, zanim n osiągnie war tość 4, ponieważ Hą > 2. I owszem, z prostych rachunków wynika, że po trzech minutach superrobaczek ma przed sobą tylko 3 3 cm drogi. Finisz następuje dokładnie po 3 minutach i 40 sekundach. Liczby harmoniczne pojawiają się również w trójkącie Stirlinga. Spróbuj my znaleźć postać zwartą dla [J] - liczby permutacji n obiektów mających dokładnie dwa cykle. Zgodnie z wzorem rekurencyjnym ( 6 .8 ) n + 1" 2 = n = n Ti 2_ n" 2 + n 1 + (n - jeśli n > 0 , a rekurencją ta jest naturalnym kandydatem do użycia techniki czynnika sumacyjnego z rozdziału 2 : 1 "n+ 1 n! 2 " n 1 ( n - 1 )! _2 _ Użycie jednostek metrycznych czyni ten problem bardziej naukowym. Rozwijając ten wzór rekurencyjny, otrzymujemy = Hn . Stąd = n!Hu . 1 ( 6 .5 8 ) W rozdziale 2 udowodniliśmy, że szereg harmoniczny 1/Tc jest roz bieżny, co oznacza, że Hn staje się dowolnie duże przy rt —> 0 0 . Ale nasz dowód był przeprowadzony metodą „nie wprost”. Odkryliśmy, że pewna nie skończona suma ( 2 .5 8 ) daje różne wyniki, gdy ją poprzestawiamy, zatem 1/k nie może być ograniczony. Fakt, że —> 0 0 , wydaje się niezgodny z intuicją, gdyż między innymi wynikałoby z niego, że wystarczająco duży stos kart będzie tworzył nawis nad stołem na kilometr lub więcej oraz że robaczek R ostatecznie osiągnie koniec taśmy. Przyjrzyjmy się zatem bliżej wielkości Hn dla bardzo dużego rt. Prawdopodobnie najprostszym sposobem sprawdzenia tego, że Hn —> 0 0 , jest pogrupowanie jego wyrazów w ten sposób, że rozmiar grupy odpowiada kolejnym potęgom 2. Umieszczamy jeden składnik w grupie o numerze 1, dwa w grupie o numerze 2 , cztery w grupie o numerze 3 , osiem w grupie o numerze 4 itd.: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 , T + 2 + 3, + 4 + 5 + 6 + 7, + 8 + 9 + iÓ + TT+ T2 + 13+ T4+ T5, + '' ‘ ' grupa 1 grupa 2 grupa 3 grupa 4 Oba składniki w grupie o numerze 2 są pomiędzy | a | , więc suma skład ników tej grupy mieści się pomiędzy 2 - | = | a2* ^ = 1. Wszystkie cztery składniki w grupie o numerze 3 są pomiędzy ^ a więc ich suma jest rów nież pomiędzy \ a 1. W rzeczywistości, każdy z 2 k_1 składników w grupie o numerze k jest zawarty pomiędzy 2_k a 2 1_k. Stąd suma składników w każdej grupie mieści się pomiędzy \ a 1 . Ten sposób podziału mówi nam, że jeśli rt jest w grupie o numerze k, to prawdą jest, iż Hn > k /2 oraz Hn ^ k (przez indukcję względem k). Zatem Hn —> oo, i istotnie ^lgTj! + 1 < Hn sC [!gn J + 1 - Powinniśmy je nazwać liczbami żółwiowymi, są tak powolne. (6-59) Znamy już wartość Hn z dokładnością do czynnika 2. Chociaż liczby har moniczne osiągają nieskończoność, osiągają ją logarytmicznie szybko — czyli dosyć wolno. Lepsze ograniczenie można znaleźć, wydłużając nieco nasze obliczenia. W rozdziale 2 dowiedzieliśmy się, że Hn jest dyskretnym odpowiednikiem funkcji ciągłej lnrt. Logarytm naturalny definiujemy jako powierzchnię pod krzywą. Przyjrzyjmy mu się zatem od strony geometrycznej: Pole powierzchni pod krzywą między punktami 1 a n, jest równe całce d x /x = In n i jest ono mniejsze niż suma pól powierzchni n prostokątów wynosząca Jlk=i V k = Hn . Zatem In n < Hn . Uzyskaliśmy dokładniejszy rezultat w porównaniu z ( 6 .5 9 ). Biorąc nieco inne prostokąty, dostaniemy podobne dolne ograniczenie: Tym razem pole powierzchni n prostokątów Hn jest mniejsze niż pole po wierzchni pierwszego prostokąta oraz powierzchni pod krzywą. Udowodnili śmy wcześniej, że Inn < Hn < l n n + 1 , dlan>1. ( 6 .6 0 ) Znamy teraz wartość Hn z błędem co najwyżej 1. f2) Liczby harmoniczne „drugiego rzędu” tworzymy przez zsumowa nie odwrotności kwadratów kolejnych liczb całkowitych, zamiast sumowania zwykłych odwrotności: H® = n 1+ 1 4 + 1 + --- + -L = 9 n2 k=l k2 Podobnie definiujemy liczby harmoniczne rzędu r przez zsumowanie odwrot ności r-tych potęg: = I p k=l ( 6 -6 i) „I now see a way too how ye aggregate ofye termes of Musicali progressions may bee found (much after y e same manner) by Logarithms, but y e calculations for ńnding out those rules would bee still more troublesom.” I. Newton [281] Jeżeli r > 1, to liczby te osiągają granicę przy rt —> oo. W ćwiczeniu 2.31 dowiedzieliśmy się, że granica ta jest zwyczajowo nazywana funkcją zeta Riemanna: (6.62) k^1 Euler [103] pokazał zgrabny sposób wykorzystania uogólnionych liczb harmonicznych w celu przybliżania zwykłych liczb harmonicznych H ^1 ^. Roz ważmy nieskończony szereg ln k —1 - 1 _L _L _L ~ k + 21? + 31? + 41? + (6.63) który jest zbieżny dla k > 1. Lewa strona wynosi lnk —ln(k — 1), zatem jeśli zsumujemy obie strony po 2 ^ k ^ rt, suma z lewej strony składa się, a my otrzymujemy 1 n V- ( —+ ^1 -7 + 1 + 1 ln rt —ln 1 — / 2k2 3k3 4k 4 k=2 = (H n -1 ) + 1(h!v2 )- 1 ) + 1 ^ (3) - 1 ) + l ^ i(4) - l ) + Po przekształceniu otrzymujemy wyrażenie opisujące różnicę między Hn a Inn: Hn —ln n = l - l ( H ‘121- l ) - l ( H i(3) v3,- l ) - l ( H ti (4) l4,- l ) Gdy n - ) o o , prawa strona osiąga wartość graniczną 1 - K C P ) - 1) - 3 W 3) - 1) - ? ( « 4 ) - l ) - . . . , „Huius igitur qua.ntita.tis constantis C valorem deteximus, quippe est C = 0,577218.” L. Euler [103] znaną obecnie jako stała Eulera i standardowo oznaczaną grecką literą y . Wartość £(r) —1 wynosi w przybliżeniu 1/2 r, zatem ten szereg nieskończony zbiega dosyć szybko, a my możemy obliczyć rozwinięcie dziesiętne y = 0,5772156649.. .. ( 6 .6 4 ) Rozumowanie Eulera ustala związek graniczny lim (Hn, —Inn) = y , n — ¥00 ( 6 .6 5 ) zatem Hu umieszczone jest w około 58% drogi pomiędzy dwoma skrajnymi wielkościami we wzorze ( 6 .6 0 ). Stopniowo zbliżamy się do jego dokładnej wartości. Dalsze poprawianie jest możliwe, co zobaczymy w rozdziale 9, Udowod nimy, na przykład, że Hn = ln n + Y + ^ - T^ I + T^ 0 < e n <1. ?, (6.66) Korzystając z tego wzoru możemy obliczyć milionową liczbę harmoniczną Hioooooo ~ 14,3927267228657236313811275, nie sumując miliona ułamków. Między innymi oznacza to, że stos utworzony z miliona kart będzie tworzył nawis o długości ponad siedmiu kart. Czego dowiadujemy się z ( 6 .6 6 ) o robaczku na gumowej taśmie? Ponieważ Hn jest nieograniczone, robaczek ostatecznie dotrze do końca taśmy, gdy Hn przewyższy 100. Z naszego przybliżenia Hn wnioskujemy, że stanie się to, gdy rt wyniesie mniej więcej e 100-y _ e 99,42 3 W rzeczywistości, ćwiczenie 9.49 dowodzi, że krytyczna wartość n wynosi lîoo-yj ['e100-'*']. Możemy sobie tylko wyobrazić radość R, kiedy w końcu przekracza linię mety, ku wielkiemu zmartwieniu W, ok. 287 decylionów wieków od rozpoczęcia swojego pełznięcia. (Gumowa taśma rozciągnie się na więcej niż 1 0 27 lat świetlnych, a jej cząsteczki będą położone daleko od siebie.) 6.4. Sum ow anie harm oniczne___________________ Przyjrzyjmy się teraz niektórym sumom zawierającym liczby harmoniczne, rozpoczynając od przypomnienia kilku pomysłów przedstawionych wcześniej w rozdziale 2 . Udowodniliśmy w ( 2 .3 6 ) oraz ( 2 .5 7 ), że Y_ ^ O^kcn. Za to będzie ważył dobrze ponad tonę! = nH u —n ; £ (6 .6 7 ) . (6 .68) O^kcrt Podejmiemy się teraz wyliczyć bardziej ogólną sumę zawierającą obie powyż sze sumy jako swoje szczególne przypadki. Jaka jest wartość z (kK. OsCkCTL Vm / gdy m jest nieujemną liczbą całkowitą? Tak naprawdę, to nie mają aż tak dużo czasu. Świat skończy się dużo wcześniej, gdy Wieża Brahmy zostanie całkowicie przeniesiona. W rozdziale 2 najbardziej skutecznym podejściem do obliczenia zależno ści (6 .6 7 ) oraz ( 6 .6 8 ) okazało się sumowanie przez części. Każdy ze składni ków przedstawialiśmy w postaci u(k)Av(k) i stosowaliśmy ogólną tożsamość u(x)Av(x) 6x = u(x)v(x)|^ — ^ v(x + 1)Au(x) ó x . (6.69) Pamiętacie? Suma, z którą mamy w tej chwili do czynienia H 0<k<n, (m )^ > znakomicie pasuje do tej metody, ponieważ bierzemy u(k) = H k, Au(k) = H k+1 - V(,C) = 1m + l ) * Av(k) = ( m + l ) - ( m + l ) = (m 1 Hk = k+1 ’ (Innymi słowy, liczby harmoniczne mają prostą A, a współczynniki dwu mianu mają prostą A- 1 , czyli interes się kręci.) Na podstawie wzoru (6.69) otrzymujemy y OsCkcu ( kV = W XV 5 * = ( \ V n- 5 ~ n ( x+V)— « > • 7 L P 0^k<TL X 7 i Pozostała część sumy nie przedstawia trudności, ponieważ możemy się po zbyć kłopotliwego wyrazu ( k + 1 ) -1 używając naszego starego rezerwowego równania (5.5): y ('k+1N) _ ! _ = W+lJk+l y f k ) — !— J b - W m+1 = rt \ 1 Oznacza to, że otrzymaliśmy poszukiwaną odpowiedź: Ł O s i r ) - (Odpowiada to równaniom (6.67) i (6.68) dla m = 0 oraz m = 1.) W następnym przykładzie mamy do czynienia z dzieleniem zamiast mno żeniem: Spróbujmy obliczyć s " f S t h k ' Jeśli rozwiniemy Hk zgodnie z definicją, to otrzymamy podwójną sumę s- I r Teraz inna metoda z rozdziału 2 przychodzi nam z pomocą. Równanie ( 2 .3 3 ) mówi nam, że + V V=1 7 = j ( H ł + H !? ). k=1 (6-71) / Okazuje się, że mogliśmy uzyskać tę odpowiedź również w inny sposób, gdy byśmy zastosowali sumowanie przez części (zobacz ćwiczenie 26). Zmierzmy się teraz z trudniejszym problemem [355], który nie poddaje się sumowaniu przez części: Un = ( i" ) “— t ------(n —k)n , dla całkowitych n ^ 1. k^1 (W sumie tej liczby harmoniczne nie pojawiają w sposób jawny. Ale któż wie, może się jeszcze pojawią?) Rozwiążemy ten problem na dwa sposoby. Pierwszy, przy dużym nakła dzie sił, a drugi, korzystając z pomocy intelektu i/lub szczęścia. Najpierw podejście siłowe. Rozwijamy (n —k ) 71 przy użyciu twierdzenia dwumianowego tak, aby kłopotliwe k z mianownika związać z licznikiem: k^l Nie jest to aż taki bałagan, na jaki wygląda, ponieważ k ]_1 w wewnętrznej sumie jest wielomianem zmiennej k, a tożsamość ( 5 .4 0 ) mówi nam, że bie rzemy po prostu n-tą różnicę tego wielomianu. Zaczniemy jednak od wstęp nego uporządkowania naszej wiedzy. Po pierwsze, k i_ 1 nie jest wielomianem, gdy j = 0 , co oznacza, że będziemy musieli przyjrzeć się temu wyrazowi osobno. Poza tym, brakuje nam wyrazu z k = 0, ze wzoru na n-tą różnicę. (Grunt to nie zdradzić odpowiedzi.) Wyraz ten jest niezerowy przy j = 1, zatem dobrze byłoby go dodać (a potem odjąć). W wyniku przekształceń otrzymujemy i - i OK, teraz górny wiersz (jedyna pozostająca podwójna suma) jest równa zeru. Jest to suma wielokrotności ri-tych różnic wielomianów stopnia mniejszego niż n, a takie n-te różnice są zerami. Drugi wiersz jest równy zeru, wyłączając przypadek z j = 1, kiedy to równa się —n /1. Zatem pozostał nam kłopot wyłącznie z trzecim wierszem. Zredukowaliśmy początkowy problem do dużo prostszej sumy: U 3 = 27(Ts — 1 ), tak jak twierdziliśmy. W jaki sposób możemy obliczyć Tn? Możemy, na przykład, zastąpić (£) przez (n“ 1) + (£“ ]), uzyskując prostą rekurencję na Tn w zależności od Tn_ i . Ale istnieje również bardziej kształcący sposób. Podobne wyrażenie mieliśmy w równaniu ( 5 .4 1 ), mianowicie Jeżeli odejmiemy wyraz z k = 0 i podstawimy x = 0, otrzymamy —Tn. Zróbmy tak: (Skorzystaliśmy tu z rozwinięcia (6.11) do (x + 1) . . . (x + n) = xri+^/x. Mo żemy teraz wydobyć x z licznika, ponieważ [n^J’1] = rt!.) Ale wiemy z (6.58), że [U2 ^ —n! Hn.. Stąd Tn = HT1 i otrzymujemy odpowiedź: Un = n n (Hn — 1). (6.73) To był pierwszy sposób. Drugie podejście opiera się na policzeniu ogól niejszej sumy, Un (x,y) = ^X+ ’ całkowite n ^ 0 -(6.74) k^1 ^ ' Wartość początkowego Un jest szczególnym przypadkiem Un (rt, —1). (Po nieważ poprzednie wyprowadzenie „zgubiło” większość szczegółów naszego zagadnienia, odważyliśmy się na większe uogólnienie. Tak czy inaczej, szcze góły te muszą być nieistotne, ponieważ n-ta różnica je wymazuje.) Moglibyśmy powtórzyć poprzednie wyprowadzenie z małymi zmianami odkrywając wartość UTL(x,'y). Albo moglibyśmy zastąpić (x + Taj)1'1 przez (x + ky)n _1(x + ky) oraz (£) zastąpić przez (^j^1) + (£l{)» co prowadzi do rekurencji Un (*,-y) = xUn_ i ( x , y ) + x 7 n + -yxrL_1 , (6.75) której rozwiązanie otrzymujemy, korzystając z techniki czynnika sumacyj nego (ćwiczenie 5). Ale najłatwiej będzie zastosować sztuczkę, która przyniosła nam pożytek w rozdziale 2 — różniczkowanie. Pochodna Un (x,'y) względem y dostarcza k, które upraszcza się z k występującym w mianowniku i otrzymana suma jest już trywialna: ^ U u (x ,T j) = ę ) ( - 1 )k- , n (x + k y r - 1 nxn_1 — V" ( y ) ( - 1 ) kn(x + lcy)n-1 = nxn- ’ . kÔ ' 7 (Po raz kolejny zniknęła n-ta różnica wielomianu stopnia < n.) Udowodniliśmy, że pochodna Un (x,'y) względem y wynosi n xn_1 i jest ona niezależna od y. W ogólności, jeśli f'(y ) = c, to f (-y) = f (0) + cy. Zatem musimy otrzymać Un (x,'y) = Un (x ,0) + n x TX_1'y. Pozostało nam jeszcze ustalenie Un (x, 0). Ale Un (x, 0) to właśnie xu pomnożone przez sumę Tn = Hn., którą już rozważaliśmy w (6.72). Zatem ogólna suma w (6 .7 4 ) ma postać zwartą Un (x,y) = xTLHn + n x rL~ 1y . ( 6 .7 6 ) W szczególności, rozwiązaniem początkowego problemu jest Un (n, —1) = Tin (Hn — 1). 6.5. Liczby B ernoulliego________________________ Następnym ważnym ciągiem liczbowym na naszej liście jest ciąg nazwany imieniem Jakuba Bernoulliego (1654-1705), który odkrył ciekawą zależność podczas prac nad wzorami dla sum m-tych potęg [26]. Zapiszmy n —1 Sm (n) = 0m + 1m + --- + ( n —1)m = ^ k m = X o x m 5 x - (6‘77) k=0 (Zatem, gdy m > 0, mamy Sm(n) = w notacji uogólnionych liczb har monicznych.) Bernoulli przyjrzał się poniższemu ciągowi formuł i zauważył następujący wzorzec: S 0 (n) = n 51 (n) = \n 2 — 5 2 (ti) = |r t 3 — j n 1 + \ n S 3 (n )= \n Ą —jn 3 + S4(n) = - K S5(n) = —j t l 5 ±n2 + l3n 3 - 30 n + "fen4 - - ^ 2 S6(n) = l n 7 - l n 6 + l n 5 -- S7(n) = + Ju- nit2 2n 3 _ -— ł * 9 - l n 8 + K 15nri5 + 9 i n 8 _- ^ T l 6 + J _ n io + l n 4 -4 11 ion 10Tl S8(n) S9(n) = X Sio(n) = 11 11 -ln 7 + ^ - l n 10 + + T2 n 6 - 5 n 9 _6 11 n7+ n 5 -- ^ 2 ł - 3 Czy też go spostrzegacie? Współczynnik przy n m +1 w Sm(n) to zawsze 1/ ( m + 1). Współczynnik przy n m to zawsze —1/2 . Współczynnik przy n m _ 1 to zawsze . . . popatrzmy . . . m /l 2. Współczynnik przy n m - 2 jest zawsze ze rowy. Współczynnik przy n m _ 3 to zawsze . . . popatrzmy . . . hmm . . . tak, —m (m —1)(m—2)/720. Współczynnik przy rtm _ 4 jest zawsze zerowy. Wyglą da na to, że zgodnie z powyższym wzorcem, współczynnik przy n m-k będzie zawsze iloczynem pewnej stałej oraz m -. Tego właśnie empirycznego odkrycia dokonał Bernoulli. (Nie podał jed nak formalnego dowodu.) We współczesnej notacji współczynniki zapisujemy w postaci S m (n ) = — V r f B o Ti m + ' + m+ 1 \ f m + 1 f m i+ l N ) B i n m + - - + 1 / V \ m )B m n m Liczby Bernoulliego definiujemy za pomocą niejawnej rekurencyjnej za leżności m. / y~ ( j=o . m +1 . jB j = [m = 0 ] , dla wszystkich m ^ 0 . ( 6 .7 9 ) fi \ t> +, a( t) B i = 0. Kilka pierwszych wartości wygląda nastę Na przykład, (0)Bo pująco: U 0 1 2 1 1 2 1 6 3 4 0 -i 30 5 6 0 1 42 7 8 0 -1 30 9 10 0 5 66 11 12 0 -691 273 0 (Wszystkie oczekiwania co do prostej postaci zwartej dla Bu spełzają na niczym w obliczu dziwnego ułamka —691 /2730.) Możemy udowodnić wzór Bernoulliego ( 6 .7 8 ) przez indukcję względem m korzystając z metody zaburzeń (jeden ze sposobów, za pomocą którego zna leźliśmy S2 (ti) = Dn w rozdziale 2 ): n —1 S m + l (TV) + TVm+1 = X ( k + 1 ) m+1 k=0 T l— 1 = Z k=0 T Tt+ 1 / , -1 \ Z C t V j=0 ' } ' TTL+ 1 / = . 1 \ L ( m ,+ ) s S(n). (6 .8 0 ) j=0 ' J 7 Niech Sm(n) będzie prawą stroną (6 .7 8 ). Chcielibyśmy pokazać,że Sm(rt) = Sm(n ) Przy założeniu, że Sj(rt) = Sj(ri), dla 0 ^ j < m. Zaczniemy tak jak w rozdziale 2 , od m = 2, odejmując Sm+i (n) od obu stron (6 .8 0 ). Potem rozwiniemy każde Sj (rt) zgodnie z wyrażeniem ( 6 .7 8 ) i pogrupujemy tak, aby połączyć i uprościć współczynniki rt-tych potęg po prawej stronie: = L ( m i+ 1 ) i T T Z ^ r )Bkn H ’--c + ( m + 1 ) A j= 0 ' ' ' 1—A k =0 + ( tti + 1) A j+ 1 1 T l + 1 \ / j + 1 \ B j —k = Z = Z j - k/ j + 1 n k+1 + (m + 1) A m + 1\ ( ) + 1 \ B ,_k k + 1/ j +1 n k+1 O^k^m = v— k+1 / m + 1 7 — k +1 x O^k^m k^j rt = O^k^m Z k rt'm +1 k+1 /' m rn.-r + 1i \ k v— ( m + 1 —1c\ i ( i»>+(™+')a O^j^mk ' k+i m+ 1 +1 7m + 1 m +1 \ m [m —k = 0] + (m + 1) A + (m + 1) A = n m+1 + (m + 1) A Zacznij kartkować. / m + 1\ / j k^j^m. ^— ii L O^k^m A oto trochę więcej smutnych kawałków, które prawdopodobnie będziecie chcieli wyłącznie przekartkować podczas pierwszego czytania. Twój przyjazny asystent -nk+1 + (m + 1) A gdzie A = Sm(n) - Sm(n). (Powyższe wyprowadzenie jest dobrym przypomnieniem rutynowych prze kształceń, o których mówiliśmy w rozdziale 5.) A zatem A = 0 oraz Sm(n) = Sm(n), QED. W rozdziale 7 otrzymamy prostszy dowód (6 .78 ), używając funkcji two rzących. Kluczowym pomysłem będzie pokazanie, że liczby Bernoulliego są współ czynnikami szeregu potęgowego z rr = TZ B>rt! LÔ ez — 1 (6 .81 ) Na razie załóżmy, że równość (6 .81 ) zachodzi, możemy zatem wyprowadzić kilka jej zadziwiających następstw. Jeśli do obu stron dodamy j z, tym samym 6.5. L iczby B ern ou lliego /pozbywając się wyrazu B iz /1! = ~ \ z z prawej strony, otrzymamy z ez/2 + e' -z/2 2 ez/ 2 - e_z/ 2 z z _ z ez + 1 ez - 1 + 2 = 2 ez —1 (6 .82 ) Oznaczenie ctgh odpowiada funkcji „cotangens hiperboliczny,” znanej rów nież jako coshz/sinh z. Mamy sinhz = cosh z = ez + e' (6 .8 3 ) Zamieniając z na —z otrzymujemy ( - f ) ctgh ( ^ ) = | ctgh | . A zatem każdy współczynnik z nieparzystym indeksem funkcji § ctgh § musi być ze rowy, a my otrzymujemy B3 = B5 = B7 = B9 = Bn = Bi3 = ••• = 0 . (6.84) Ponadto, na podstawie (6.82) mamy postać zwartą współczynników ctgh: 2z 2z v— (2z)2n z ctgh z = - I— - + - = Y_ B2, = (2n)! rtÔ nÔ r2 n 2n (2 n)! .(6.85) Ale popyt na funkcje hiperboliczne jest niewielki. Ludzie są bardziej zain teresowani „rzeczywistymi” funkcjami trygonometrycznymi. Zwykłe funkcje trygonometryczne możemy wyrażać korzystając z ich hiperbolicznych kuzy nów, zgodnie z wzorami sin z = —isin h iz, (6.86) cos z = coshiz. Odpowiadające im szeregi potęgowe to: z1 1! z° z3 3! z2 z5 5! z4 sm z = ------------- 1------COS z = ------------- 1------0! 2! 4! z1 z3 z5 S1DhZ = 7 T + 3 ! + 5! + Z° c o sh z = z 2 z4 _ + - + - + Stąd ctg z = cos z/sin z = i cosh iz / sinh iz = i ctgh iz i otrzymujemy ctg Z = Y _ B2i nÔ (2iz) 2 n (2n)! v ' ,2n = X ( - 4 )n B2l (2n)! • nÔ (6.87) Euler odkrył inny godny uwagi wzór na z ctg z (ćwiczenie 73): ctg z = i —2 y~ k27t2 k^1 (6.88) No proszę, otrzymujemy „rzeczywiste” funkcje używając liczb urojonych. Rozwijając wzór Eulera względem z2, uzyskujemy __ / z2 z4 + ^ z c tg z = z^ + ^ \ + y k^1 x = -' \ - 2 1( ^— + — + — 2 H(2) 00 ^ rj^r H(4) n °0 ^ n 6 ÔO T+ i* Jeśli przyrównamy współczynniki przy z 2vi w powyższym wyrażeniu ( 6 .8 7 ), • dostaniemy niemalże cudowną postać zwartą dla nieskończenie wielu nieskoń czonych sum: o 2 u —1 _ 2 n i 5 C(2 n) = H g n) = ( - 1 T ” 1 ------ 2,t , całkowite n > 0 . (6.89) Na przykład, t(2) = H™ = 1 + * + ? + ••• = 7t2B2 = 7t2/6 ; (6.90) C(4) = H S ) = 1 + ^ + ^ + -- - = (6.91) -7 i4B4/3 = 7^ / 9 0 . Wzór (6.89) nie jest wyłącznie postacią zwartą H ^ n), możemy z niego rów nież otrzymać przybliżoną wartość 6 2 ,, , ponieważ jest bardzo bliskie 1 dla dużego n. Możemy z niego również wywnioskować, że (—1 )u _ 1 B2 n > 0, dla wszystkich n > 0. A zatem niezerowe liczby Bernoulliego zmieniają znaki na przemian. Ale to jeszcze nie wszystko. Liczby Bernoulliego pojawiają się także we współczynnikach funkcji tangens, nÔ Zacznij pomijać. v ; jak i w innych funkcjach trygonometrycznych (ćwiczenie 72). Wzór ( 6 .9 2 ) prowadzi do następnej ważnej własności liczb Bernoulliego, a mianowicie 4T1 (4n _ 1) T2n - i = (—1 ) n ------------------B 2 n jest dodatnie oraz całkowite. (6 .9 3 ) Na przykład mamy: n 1 3 5 7 9 11 13 1 16 272 7936 353792 22368256 2 (Liczby T są nazywane liczbami tangens owymi.) Jednym ze sposobów na udowodnienie wzoru ( 6 .9 3 ), zgodnie z pomysłem B. F. Logana, jest rozpatrzenie szeregu potęgowego sinz + x c o s z cos z —x sin z _ 3 ^ , z2 _ „ „ •? _ z 3 2 6 = ( 6 -94) n>0 gdzie TTt(x) jest wielomianem względem x. Biorąc x = 0 , dostajemy Tn (0) = Ta, n-tą liczbę tangensow^. Jeśli zróżniczkujemy (6.94) po x, otrzymamy z 71 1 (cos z —x sin z )2 v ' nÔ Natomiast jeżeli zróżniczkujemy po z, otrzymamy 1 4- x 2 . ,2 7-------(cos z —x s m z F v ' z n— 1 = n^1 ~n ------ TTT = H Tn + i ( x ) - r . ( n —1 ) z— rt vJn Ô (Spróbuj sam — napotkasz ciekawe uproszczenia.) Mamy zatem Tn+ 1 (x) = ( 1 + x 2 )T ;(x), To(x) = x , ( 6 .9 5 ) czyli prostą rekurencję, z której wynika, że współczynniki Tn (x) są nieujem nymi liczbami całkowitymi. Ponadto możemy łatwo udowodnić, że Tn (x) ma stopień n + 1 i że jego współczynniki są na przemian zerowe oraz dodatnie. Zatem T2 n+i (0) = T2 n+i jest dodatnią liczbą całkowitą, co odpowiada (6.93). Wzór rekurencyjny (6.95) daje nam prosty sposób obliczania liczb Berno ulliego, via liczby tangensowe, na podstawie wyłącznie prostych operacji na liczbach całkowitych. Dla porównania, definiujący wzór rekurencyjny (6.79) wymusza użycie skomplikowanych rachunków na ułamkach. Jeżeli chcemy obliczyć sumę n-tych potęg od a do (b — 1), zamiast od 0 do (n — 1 ), twierdzenie z rozdziału 2 daje nam b- 1 Y b km = X a xm 6x = Sm( b ) - S m(a ). (6.96) k—a Tożsamość ta ma interesujące konsekwencje, gdy rozważymy ujemne war tości k. Mamy -1 Y_ k = —n + 1 n -1 km = (—1 )m X k=0 km > gdy m > 0 , Gdy x = tg w, odpowiada to tg(z + w ) . Stąd, zgodnie z twierdzeniem Taylora, n-ta pochodna tg w wynosi Tn(tgw). stąd Sm( 0 ) - S m( - n + 1) = (—1)m (Sm(n) — Sm( 0 ) ) . Ale Sm(0) = O, więc otrzymujemy tożsamość Johann Faulhaber niejawnie użył ( 6.97) w 1635 roku [119] w celu znalezienia prostych wzorów na Sm(n) będących wielomianami n [ n + 1)/ 2 , gdy m ^ 17; zobacz [222].) Sm(l —rt) = (—1)m+1Sm( n ) , v n > 0.(6.97) Zatem Sm(l) = 0. Jeśli zapiszemy wielomian Sm(rt) w formie iloczynowej, zawsze będą występowały w nim czynniki rt oraz (rt—1), ponieważ wielomian ten ma pierwiastki 0 oraz 1. W ogólności, Sm(rt) jest wielomianem stopnia m + 1 z wyrazem wiodącym -J —j-nm+1. Ponadto możemy podstawić rt = \ w (6.97) i wywnioskować, że Sm(^) = (—1)m+1 Sm(^). Jeśli m jest parzyste, otrzymujemy Sm( | ) = 0, czyli dodatkowy czynnik (rt — j ) . Spostrzeżenia te wyjaśniają, dlaczego w rozdziale 2 znaleźliśmy prosty rozkład na iloczyn S2 (n) = | n ( n - | ) ( n - 1). Mogliśmy na podstawie tego rozumowania otrzymać wartość S2(rt) unikając obliczeń! Ponadto z równania (6.97) wnioskujemy, że wielomian z pozostają cymi czynnikami, Śm(rt) = Sm( n ) / ( n — j ) } zawsze spełnia ŚmO —n ) — Ś m (n ), m parzyste, m > 0. Wynika z tego, że Sm(n) możemy zawsze zapisać w formie iloczynowej: m S tu (ti) = 1 rm/2] 7 f i C71 — i — cxTc)(rt — ^ H- ocic), + - m nieparzyste; k = i ^ (6.98) (n _ 1 ) m / 2 ----- ~ r r TT ( n - A - ock) ( r t - A + a k) , m + 1 -L k=1 m parzyste, przy czym oc-i = j , i 0C2, . . . , <xpm/2l sai odpowiednimi liczbami zespolonymi, których wartości zależą od m. Na przykład, S3(n) = n 2( n - 1 ) 2/ 4 | S4 (n) = n ( n - l ) ( n - 1) ( n - I + v/ 7 T T 2 ) ( n - i - v ^ 7 i 2 ) / 5 ; S5(n) = n 2( n - 1)2( n - \ + ^ / 3 / 4 ) ( n - \ S6(n) = n ( n - i ) ( n - 1 ) ( n - i + a ) ( n - l - a ) ( n - l + a ) ( n - i - a )/7 , gdzie oc = 2 - 3/2 3 - 1/4 3 1 1/4 ^ V T \ + V 2 7 + i y / V f \ - V 2 7 ) . Jeżeli m jest nieparzyste oraz większe od 1, mamy Bm = 0. Stąd Sm(n) jest podzielne przez rt2 (i przez (n —l ) 2). W przeciwnym razie pierwiastki Sm(n) nie podlegają takiej prostej regule. Podsumujmy nasze badania dotyczące liczb Bernoulliego\poprzez przyj rzenie się ich powiązaniom z liczbami Stirlinga. Jednym ze sposobów na obli czenie Sm(n) jest zamienienie zwykłych potęg na ubywające, ponieważ sumy ubywających potęg są prostsze. Po wykorzystaniu tych prostych sum możemy wrócić do potęg zwykłych: n— 1 zz T l— 1 S m W = X . k' n n —1 m {I i ki k=0 jÔ k=0 kl J k= 0 rt-j+i m = Z j •1J 3 + 1 ml =Z jô f l H F kÔ 1 i Ji + j+ 1—k 'j + 1 n k A zatem, przyrównując współczynniki w ( 6 .7 8 ) z powyższymi, uzyskujemy tożsamość £{7 ’ i3=o 'j + 1' k 1 )i+i - k j+ 1 1 m +1 /m +1 Bm +l-k , k > 0. ( 6 .9 9 ) Dobrze byłoby udowodnić powyższy związek wprost, odkrywając liczby Ber noulliego na nowo. Ale tożsamości w tabeli 296 oraz 297 nie prowadzą nas w oczywisty sposób do dowodu przez indukcję tego, że lewostronna suma rów nania ( 6 .9 9 ) jest stałą wymnożoną przez m ^ - . Jeżeli k = m + 1 , lewostronna suma odpowiada dokładnie {™} [™ +]]/(m + 1 ) = 1 / (m + 1 ), więc ten przypa dek jest łatwy. Gdy k = m, lewa strona sumuje się do { ^ 1 } [m] m _ 1 — {m} l?71^ 1] (m + l ) - 1 — 1) — Zatem przypadek ten również jest dosyć prosty. Ale jeśli k < m, lewostronna suma wygląda wyjątkowo nieprzyjemnie. Bernoulli prawdopodobnie nie odkryłby swoich liczb, gdyby wybrał tę drogę. Jedyne, co możemy zrobić, to zastąpić {™} przez } — (j + 1){j™ }• Wówczas (j + 1) upraszcza się z niewygodnym mianownikiem, a lewa strona równania wygląda następująco: Z m +1 j + 1 j + 1 ( - D i+1 -k k j+ i (_ 0 H1 Druga suma jest zerowa przy k < m, zgodnie z ( 6 .3 1 ). A zatem zostaje nam tylko pierwsza suma dopraszająca się zmiany notacji. Przemianujmy wszyst- Przestań pomijać. kie zmienne tak, aby otrzymać indeks sumacyjny k oraz dwa inne parametry m oraz rt. Tożsamość (6.99) jest równoważna M ) k—m 1 fn Bn—m + [m = U — 1] n \m m > 0. (6.100] Dobrze, dostaliśmy teraz coś przyjemniejszego — chociaż w dalszym ciągu z tabeli 297 nie wynika jasno, co robić dalej. Na ratunek przychodzą nam wzory splotu z tabeli 304. Możemy zasto sować zależności (6.49) oraz (6.48), aby wyrazić każdy składnik za pomocą wielomianów Stirlinga: = n! in—k+1 (-1 (— l ) k - m M r - 0 "n— k( k) k! (m —1 )! crk- m ( k ) ; .pi = Sytuacja poprawia się. Wykorzystując regułę splotu (6.46), przy t = 1 otrzy mujemy Tl Tl—Ta Y O n-k(-k) <k_ m(k) = cru_ m_ k ( - n + ( n - m - k ) ) ak(m + k) 7 k=0 k=0 m —n (m )(—n) o-n_ T a ( m - n + (n -m )) . W ten sposób wzór (6.100) uzyskał potwierdzenie, a my dowiedzieliśmy się, że liczby Bernoulliego są związane ze stałymi wyrazami w wielomianach Stir linga: Przestań kartkować. Bm m! /-A\ (6.101) 6.6. Liczby Fibonacciego Dochodzimy teraz do szczególnego ciągu liczb, zapewne najbardziej przyjem nego ze znanych nam, ciągu Fibonacciego (Fn): u 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Fn 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 W przeciwieństwie do liczb harmonicznych, oraz liczb Bernoulliego, liczby Fibonacciego są zwykłymi liczbami całkowitymi. Definiujemy je wzorem rekurencyjnym F0 = 0; F, = 1; Fu = Fn_! + Fn - 2 , dla n > 1 . (6 .1 0 2 ) Prostota tej reguły— najprostsza możliwa rekurencją, w której każda liczba zależy od dwóch poprzednich— powoduje, że liczby Fibonacciego pojawiają się w bardzo wielu sytuacjach. „Drzewa pszczół” dostarczają dobrego przykładu na to, w jak naturalny sposób pojawiają się liczby Fibonacciego. Rozważmy rodowód samca pszczo ły. Każdy samiec (znany także jako truteń) jest spłodzony bezpłciowo z sa micy (znanej również jako królowa). Jednak każda samica ma dwoje rodziców, samca i samicę. Oto kilka pierwszych poziomów drzewa: c?—j—ę ę c^-y-9 9 — |— 9 d--------1-------- ę 9 & Truteń ma jednego dziadka i jedną babcię, jednego pradziadka i dwie pra babcie. Ma dwóch prapradziadków i trzy praprababcie. W ogólności, ła two sprawdzić przez indukcję, że ma dokładnie F^+i pran-dziadków i Fn + 2 pra^-babć. Liczby Fibonacciego spotykamy często w przyrodzie, zapewne z powodów podobnych do reguł w drzewie pszczół. Na przykład, typowy słonecznik ma dużą głowę zawierającą spirale ciasno upakowanych nasion, zwykle z 34 zwo jami w jednym kierunku oraz z 55 w drugim. Mniejsze głowy mają 21 oraz 34 spiral albo 13 oraz 2 1 . Pewien gigantyczny słonecznik z 89 i 144 spiralami był raz eksponatem na wystawie w Anglii. Podobne wzory odnajdujemy w niektórych gatunkach szyszek sosnowych. A oto przykład odmiennej natury [278]. Przypuśćmy, że kładziemy dwie szyby, jedna na drugiej. Na ile sposobów an promienie świetlne przechodzą Naturalistyczny charakter tego przykładu jest szokujący. Książka ta powinna być zakazana. iWM 6 , L iczby szczeg ó ln e 43 M M H H M ś S ifM .™ albo odbijają się po zmianie kierunku rt razy? Pierwszych kilka przypadków wygląda następująco: a0 = 1 „La suitę de Fibonacci possede des proprietes nombreuses fort interessantes.” E. Lucas [259] ai = 2 0-2 = 3 0-3 = 5 Gdy n jest parzyste, mamy parzystą liczbę odbić, a promień przechodzi przez szyby. Gdy n jest nieparzyste, promień odbija się i pojawia po tej samej stronie, z której przybył. Kolejne wyrazy ciągu a n wydają się odpowiadać liczbom Fibonacciego, a krótkie przyjrzenie się rysunkowi mówi nam, jaki jest tego powód. Dla rt ^ 2, promień o u odbiciach albo odbija się od dolnej po wierzchni, kontynuując bieg na an_i sposobów, albo zaczyna od odbicia od środkowej powierzchni, a później od górnej, kontynuując na a n _ 2 sposobów. A zatem otrzymujemy rekurencję Fibonacciego an = an_i + an_ 2. Warunki początkowe różnią się nieco, ponieważ mamy ao = 1 = F2 oraz ai = 2 = F3 . Oznacza to, że oba ciągi są przesunięte względem siebie o dwie pozycje, czyli O-Ti = Fn+2 Leonardo Fibonacci przedstawił swoje liczby w roku 1 2 0 2 . Matematycy stopniowo zaczęli odkrywać coraz więcej interesujących własności liczb Fi bonacciego. Edouard Lucas, twórca łamigłówki Wieże z Hanoi omawianej w rozdziale 1 , prowadził szeroko zakrojone badania nad tymi liczbami w drugiej połowie dziewiętnastego wieku (to właśnie Edouard Lucas spopularyzował nazwę „liczby Fibonacciego”). Jednym ze zdumiewających rezultatów jego prac było wykorzystanie własności liczb Fibonacciego do udowodnienia, że 39-cyfrowa liczba Mersenne’a 2 127 — 1 jest liczbą pierwszą. Jednym z najstarszych twierdzeń dotyczących liczb Fibonacciego, po raz pierwszy opublikowanym przez włoskiego astronoma Jean-Dominique Cassiniego w 1680 roku [55], jest tożsamość Fn+1Fn_ , - F 2 = (-1) dla rt > 0 . (6 .1 0 3 ) Na przykład, gdy n = 6 , tożsamość Cassiniego poprawnie stwierdza, że 135 — 8 2 równa się 1. (Johannes Kepler znał to prawo już w 1608 roku [202].) Wzór wielomianowy zawierający liczby Fibonacciego w postaci Tn±}c, dla małych wartości k, możemy przekształcić we wzór zawierający wyłącznie Fn oraz Fn+i, jeśli zastosujemy regułę Fm = Fm + 2 Fm + i , (6 .1 0 4 ) aby wyrazić Fm za pomocą większych liczb Fibonacciego, kiedy m < n, oraz Fm ~ F m _ 2 H- F m _ i (6 .IO 5 ) . 6 . L iczby F ib on acciego aby zastąpić Fm mniejszymi liczbami Fibonacciego, gdy m > n + 1. Oznacza to, że liczbę F^-i możemy zastąpić przez Fn+i —Fn w ( 6 . 1 0 3 ), aby otrzymać tożsamość Cassiniego w następującej postaci: (6 .1 0 6 ) F2 +1 - F 11+ 1 Fn - F 2 = ( - 1 ) n . Ponadto tożsamość Cassiniego zamienia się w Fn+ 2 Fn - F 2 + 1 = ( - 1 ) n+\ kiedy n zastąpimy przez ( n + 1 ) . Odpowiada to (F^+i + Fn )Fu — F2 +1 = (—1)n+1, co jest równoważne ( 6 . 1 0 6 ). A zatem Cassini(rt) jest prawdziwe wtedy i tylko wtedy, gdy Cassini(rt+1) jest prawdziwe. Równanie ( 6 . 1 0 3 ) zachodzi dla wszystkich n przez indukcję. Tożsamość Cassiniego jest podstawą geometrycznego paradoksu będą cego jedną z ulubionych łamigłówek Lewisa Carrolla [64], [320], [365]. Dzie limy szachownicę na cztery części zgodnie z poniższym rysunkiem, a następ nie składamy je tworząc prostokąt: Presto! Początkowa powierzchnia składająca się z 8 x 8 = 64 kwadratów została przekształcona do powierzchni złożonej z 5 x 13 = 65 kwadratów! Podobna konstrukcja dzieli dowolny kwadrat Fn x Fr,. na cztery części, przy czym wymiary Fn+i, F^, F^-i oraz Tn-2 odpowiadają wymiarom 13, 8 , 5 i 3 na rysunku. W wyniku otrzymujemy prostokąt Fn- i x Fn+ i . Zgodnie z ( 6 . 1 0 3 ), zyskujemy lub tracimy kwadrat jednostkowy, w zależności od tego, czy rt jest parzyste, czy nieparzyste. Ściśle mówiąc, nie możemy stosować redukcji ( 6 . 1 0 5 ), chyba że m ^ 2 , po nieważ nie zdefiniowaliśmy liczb Fu dla ujemnych wartości rt. Wiele naszych działań stanie się prostszych, kiedy wyeliminujemy ten wiążący warunek wy korzystując wzory ( 6 . 1 0 4 ) oraz ( 6 . 1 0 5 ) do zdefiniowania liczb Fibonacciego z ujemnymi indeksami. Na przykład, F_i okazuje się być Fi —Fo = 1. Stąd F_ 2 wynosi Fq —F_i = —1. W ten sposób otrzymujemy kolejne wartości n 0 -1 -2 -3 -4 -5 -6 -7 . -8 -9 -1 0 -1 1 Fn 0 1 -1 2 -3 5 -8 13 -2 1 34 -5 5 89 Paradoks bierze się stąd, że ... cóż, magiczne sztuczki nie są po to, aby je wyjaśniać. i szybko staje się jasne (przez indukcję), że F_n = (—1)TV—1 , dla całkowitych n. (6.107) Tożsamość Cassiniego (6.103) jest prawdziwa dla wszystkich liczb całkowi tych ri, a nie tylko dla n > 0, gdy rozszerzymy w ten sposób ciąg Fibonac ciego. Proces redukcji Fn±k do kombinacji F^ oraz Fn+i za pomocą (6.105) oraz (6.104) prowadzi nas do ciągu formuł Frt+2 = Fn+1 -f- Fn , F-a—i = Fu_|_i Fn , Frt+3 = 2Ftl_|_i + Fn, Fn_2 = Fn+1 “1“ 2Fn , Frt+4 = 3Fn _|_i + 2Fn , FrL—3 = 2F t x + \ Fn+5 — 5Fn + ] + 3Fn , Fn _ 4 = 3F n .+ i ^F^ , ~F 5 F n w którym pojawia się nowa zależność: Fn+k = F^Fn-i-i + F ^ —i F n . ( 6 .1 0 8 ) Tożsamość ta, łatwo dowodzona przez indukcję, zachodzi dla wszystkich liczb całkowitych k i rt (dodatnich, ujemnych oraz zerowych). Jeżeli podstawimy k = rt w (6.108), zobaczymy, że F2n = Ftt.Ftl+ 1 + Fn_iFn . (6.109) A stąd F2n jest wielokrotnością F^. Podobnie F3n = F2nFn+1 ~FF2n—1Fn. , i możemy teraz wywnioskować, że F3U jest również wielokrotnością Fn . Przez indukcję, Fkn jest wielokrotnością Fn , (6.110) dla wszystkich liczb całkowitych k i rt. Tłumaczy to, dlaczego F15 (którego wartość wynosi 610) jest wielokrotnością obu liczb F3 oraz F5 (wynoszących odpowiednio 2 i 5). W rzeczywistości możemy udowodnić jeszcze więcej (ćwi czenie 27): NW D(Fm,Fn ) = F]sjYVD(m,n) • (6.111) Na przykład, NW D(F12,F i8) = N W D (144, 2584) = 8 = F6. Możemy teraz udowodnić odwrotność (6.110). Jeżeli rt > 2 oraz Fm jest wielokrotnością Fn , wówczas m jest wielokrotnością rt. Jeśli Fn\F m, to Fn\N W D (F m,Fn ) — Fnwd(m,n) ^ Fn . Jest to możliwe wyłącznie wtedy, gdy FMWD(m,u) = Fn- Przy naszym założeniu, że rt > 2, musi zachodzić N W D (m ,n ) = tl. Stąd n \m . Rozszerzenie powyższej idei podzielności było wykorzystane przez Ju rija Matijasiewicza w jego słynnym dowodzie [266], że nie istnieje algorytm rozstrzygający, czy dane równanie wielomianowe z wieloma zmiennymi oraz współczynnikami całkowitymi posiada rozwiązanie w liczbach całkowitych. Lemat Matijasiewicza stwierdza, że jeśli n > 2, liczba Fibonacciego Fm jest wielokrotnością F2 wtedy i tylko wtedy, gdy m jest wielokrotnością nFu . Udowodnijmy to przyglądając się ciągowi (F^n mod F2) dla k = 1, 2, 3, . . . , patrząc, kiedy F^n mod F2 = 0. (Wiemy, że m musi miećpostać kn, jeśli Fm mod Fn = 0 .) Na początku mamy Fn mod F2 = Fn .Wartość ta jest niezerowa. Następnie F2 n = FnJn+i H- Fn—iFn — 2FnFn+i (mod Fn ) , zgodnie z ( 6 . 1 0 8 ), ponieważ Fn+i = F^-i (mod Fn ). Podobnie F2 n +1 = Fn+1 + F n = ^n+1 (mod F2 ) . Powyższa kongruencja pozwala nam na obliczenie F3n = F2 n +1 Fn H- F2 nFn—1 = F2 + 1 Fn + (2FnFn + 1 }Fn+) = 3F2 + 1Fn F3n+1 = F2 n +1 Fn+1 + F2 nFn = F* +1 + (2FnFn + 1 )Fn = F" +1 (mod F2 ) ; (mod F2) . W ogólności, korzystając z indukcji po k zauważamy, że Fkn = kFnF £ ] i Fkn + 1 = F i +1 (mod F2 ) . Liczby F^+i oraz Fn są względnie pierwsze, więc Fkn = o (mod F*) kFn = k = 0 (mod F.£) 0 (mod Fn ) • Udowodniliśmy właśnie lemat Matijasiewicza. Jedną z najważniejszych własności liczb Fibonacciego jest sposób, w jaki można je zastosować do reprezentacji liczb całkowitych. Zapiszmy j> k j ^ k + 2. (6.112) Wówczas każda dodatnia liczba całkowita ma jednoznaczną reprezentację w postaci ti = Fkl + Fk2 + • • • + Fkr , ki > k2 > • • • > kr » 0. (6.113) (Jest to „twierdzenie Zeckendorfa” [246], [382].) Na przykład, reprezentacja jednego miliona wygląda następująco 1000000 = 832040 + 121393 + 46368 + 144 + 55 — F30 + ^26 + F24 + F i 2 + F i o . Zawsze możemy znaleźć taką reprezentację używając metody zachłannej, wy bierając Fkl jako największą liczbę Fibonacciego ^ rt, następnie wybierając Fk2 jako największą liczbę będącą ^ (rt — Fk l), i tak dalej. (Dokładniej, przypuśćmy, że Fk ^ rt < Fk+1. Wówczas mamy 0 ^ rt — Fk < Fk+i — Fk = Fk_ i. Jeśli rt jest liczbą Fibonacciego, to warunek (6.113) zachodzi dla r = 1 oraz ki = k. W przeciwnym razie (rt — Fk) ma reprezentację Fibonacciego Fk2 H------- hFkr, przez indukcję względem tl. A (6.113) zachodzi, jeśli podstawimy ki = k, ponieważ z nierówności Fk2 ^ rt — Fk < Fk_i wynika, że k » k2.) I odwrotnie, z każdej reprezentacji w postaci (6.113) wynika, że Fkl <C rt < Fkl+1 , ponieważ największa możliwa wartość Fk2 H-------b Fkr przy k kr 0, wynosi Fk-2 + Fk-4 H-------F Fkmod2+2 = Fk_! — 1 , k2 ^> • • • ^> jeśli k ^ 2. (6.114) (Wzór ten łatwo udowodnić przez indukcję względem k. Lewa strona jest zerowa, gdy k wynosi 2 lub 3.) Zatem ki jest zachłannie wybraną wartością opisaną wcześniej, czyli reprezentacja musi być jednoznaczna. Każdy jednoznaczny system reprezentacji jest systemem liczbowym. Za tem twierdzenie Zeckendorfa prowadzi do system u liczbowego Fibonacciego. Możemy reprezentować każdą nieujemną liczbę całkowitą rt jako sekwencję 0 oraz 1, pisząc m rt = (bmbm_i . .. b2)F \ / ti — ^ t>kFk . (6.115) k=2 Powyższy system liczbowy przypomina notację dwójkową (system 2) uzu pełnioną o dodatkowy warunek, że dwie 1 nigdy nie występują obok siebie. Poniżej liczby od 1 do 20, w reprezentacji Fibonacciego: 1 = ( 0 0 0 0 0 1 )F 6 = (0 0 1 0 0 1 )f 11 = (0 1 0 1 0 0 )F 16 = ( 1 0 0 1 0 0 )? 2 = 7 = (001010)f 1 2=( 010101) f 17 = (100101)f (00001 0)f Hf. 6.6. L iczby F ib o n acciego] 3 = ( 0 0 0 1 0 0 )T 8 = (010000)]= 13 = (100000),: 18 = (101000)f 4 = (000101 )r 9 =( 010001)F 14 = (100001 )F 19 = (101001 )F 5 = (0 0 1 0 0 0 ) F 1 0 = (010010)i= 15 = (100010)f 20 = (10101 0)f Porównajmy, dla kontrastu, reprezentację jednego miliona w systemie Fibo nacciego, pokazaną przed chwilą, z jego reprezentacją dwójkową 2 19 + 2 18 + 217+ 216 + 214 + 29 + 26: (1000000) 10 = = (10001010000000000010100000000) F (11110100001001000000)2. Reprezentacja Fibonacciego potrzebuje kilka bitów więcej, ponieważ sąsiadu jące 1 nie są w niej dozwolone. Niemniej obie reprezentacje są analogiczne. Chcąc dodać 1 w systemie liczbowym Fibonacciego, napotykamy dwa przypadki: Jeśli „cyfrą jednostkową” jest 0, to zmieniamy ją na 1. W ten sposób dodajemy F2 = 1 > ponieważ cyfra jednostkowa odpowiada F2 . W przeciwnym razie dwie najmniej znaczące cyfry to 01 i zamieniamy je na 10 (a tym samym dodajemy F3 —¥2 = 1)- Jesteśmy zmuszeni „przenosić” 1 tak długo, jak to jest potrzebne, zamieniając sekwencję cyfr ‘011 ’ na ‘1 0 0 ’, aż nie będzie dwóch 1 z rzędu. (Reguła ta jest równoważna zastępowaniu Fm+i +F m przez Fm+2.) Na przykład, aby przejść od 5 = (1000)F do 6 = (1001 )F lub od 6 = (1001 )F do 7 = (1010)f niepotrzebne są przenoszenia. Ale aby przejść od 7 = ( 1 0 1 0 )f do 8 = ( 1 0 0 0 0 )f musimy przenieść I dwa razy. Do tej pory wiele mówiliśmy o własnościach liczb Fibonacciego, ale nie znaleźliśmy jeszcze ich postaci zwartej. Nie mamy również postaci zwartych dla liczb Stirlinga, liczb Eulera oraz liczb Bernoulliego. Niemniej byliśmy w stanie odkryć postać zwartą Fln = dla liczb harmonicznych. Czy istnieje związek pomiędzy Fn i innymi znanymi nam wielkościami? Czy możemy „rozwiązać” rekurencję definiującą Ftl? Odpowiedź brzmi: tak. W rzeczywistości, istnieje prosty sposób na roz wiązanie rekurencji poprzez użycie metody funkcji tw orzących, której przyj rzeliśmy się krótko w rozdziale 5. Rozważmy szereg nieskończony V(z) = -F0 + h z + h z 2 + --- = (6-116) TtÔ Jeżeli możemy znaleźć prosty wzór na F(z), mamy spore szanse na znalezienie prostego wzoru dla jego współczynników Fn . W rozdziale 7 skoncentrujemy się szczegółowo na funkcjach tworzących, ale wygodnie będzie mieć poniższy przykład pod ręką, zanim tam dotrzemy. „S it 1 -f-x -f- 2xx -f- 3x3 -I5x4 + 8x5 + 13xe + 21 x7 + 34x8 &c Series nata ex divisione Unitatis per Trinomium 1 — x — XX.” A. de Moivre [275] „Wielkości r , s, t, które wykazują powiązania wyrazów, są takie same, jak te w mianowniku ułamka. Własność tę, jakkolwiek oczywista może się nam ona wydawać, jako pierwszy wykorzystał M. DeMoivre, w rozwiązywaniu problemów z szeregami nieskończonymi, które w przeciwnym razie byłyby bardzo zawiłe.” J. Stirling [344] Szereg potęgowy F(z) ma przyjemną własność uwidaczniającą się, gdy po mnożymy go przez z oraz przez z2: F(z) = F0 + F ,z + F2z 2 + F3z 3 + F4 z 4 + F5z 5 + • • • , zF(z) = + Fi z 2 + F2Z3 + F3z 4 + F4 z 5 + • • • , z 2 F(z) = F0z F0z 2 + F ,z 3 + F 2 z 4 + F3 z 5 + • • • . Jeżeli teraz odejmiemy dwa ostatnie równania od pierwszego, wyrazy zawie rające z2, z 3 oraz wyższe potęgi z znikną zgodnie z rekurencją Fibonacciego. Ponadto stały składnik Fo faktycznie nie pojawi się w ogóle, ponieważ Fo = 0. Zatem wszystko, co zostało po odjęciu, wynosi (Fi — Fo)z i jest równe z. Innymi słowy, F(z) —zF(z) —z 2 F ( z ) = z , a rozwiązując to równanie względem F(z) otrzymujemy wzór bezpośredni = (6 - 7 ) Skondensowaliśmy zatem całą informację o ciągu Fibonacciego w pros tym (aczkolwiek mało mówiącym) wyrażeniu z/(1 —z —z2). Jest to, wierzcie lub nie, krok do przodu, ponieważ możemy przedstawić mianownik w postaci iloczynu, a następnie użyć ułamków częściowych, aby otrzymać wyrażenie, które możemy łatwo rozwinąć w szereg potęgowy. Współczynniki w tym sze regu potęgowym będą odpowiadały postaci zwartej liczb Fibonacciego. Właśnie naszkicowany plan ataku zapewne łatwiej będzie zrozumieć, jeśli przyjrzymy mu się od końca. Gdybyśmy mieli prostszą funkcję tworzącą, po wiedzmy 1 / ( 1 —<xz), gdzie a jest stałą, znalibyśmy współczynniki wszystkich potęg z, ponieważ 1 — OLZ = 1 + ocz + oc2z 2 + a 3 z 3 Ą-----. Podobnie, gdybyśmy mieli funkcję tworzącą w postaci A/(1 —<xz)+B/(1 —|3z), nadal nie byłoby trudno wyznaczyć współczynniki, ponieważ A az B 1 —6 z = A ^ ( « z ) n + BjT(Pz)n n>0 = n>0 £ _ ( A a T1 + B|3T') z Tl. rtÔ Zatem pozostało tylko obliczenie stałych A, B, oc oraz |3 takich, że A B 1 — ocz 1 — |3z _ z 1 —z —z 2 ’ ( 6 . 118 ) 333 . L iczb y F ib on acciego a znajdziemy wówczas postać zwartą A a u + B(3n dla współczynnika Fn przy zn w F(z). Lewą stronę możemy zapisać jako A B _ A —A( 3 z +B —Bocz 1 — ocz ~*~ 1 — |3z (1 — az)(1 — |3z) czyli cztery stałe, których szukamy, są rozwiązaniami dwóch równań wielo mianowych: (1 — ocz)(1 — |3z) = 1 —z —z2 ; (6 .1 1 9 ) (A + B) — (A|3 + B a)z = z . (6 .1 2 0 ) Chcielibyśmy przedstawić mianownik F(z) w postaci iloczynu (1 —<xz)(1 —(3z). Wówczas będziemy mogli wyrazić F(z) jako sumę dwóch ułamków, w których czynniki (1 — ocz) oraz (1 — |3 z) nie będą występować razem. Zauważmy, że czynniki w mianowniku w równaniu ( 6 . 1 1 9 ) zostały za pisane w postaci (1 — ocz) (1 — |3 z), zamiast w częściej używanej postaci c ( z —p i ) (z —P2 ), gdzie pi i p2 są pierwiastkami. Przyczyną tego jest fakt, iż (1 — ocz)(1 — (3 z) prowadzi do wygodniejszych rozwinięć w szeregi potęgowe. Stałe oc i (3 możemy znaleźć na wiele sposobów. W jednym z nich posłu żymy się zręcznym chwytem. Wprowadzamy nową zmienną w i próbujemy znaleźć rozkład na czynniki Jak zwykle, autorzy nie mogą oprzeć się trikom. w 2 —wz —z2 = (w —ocz) (w — (3z ) . Następnie możemy po prostu podstawić w = 1 i dostaniemy czynniki 1 — z — z2. Pierwiastki równania kwadratowego w 2 — w z — z 2 = 0 wyglądają następująco: Z dz ~\JZ2 + 4z 2 2 1 d= \/5 = 2 Z ‘ Zatem 2 2 ( 1+^5 \ / 1 — V5 \ w —w z —z = I w ------- -— z 1 I w --------— z I i otrzymujemy stałe oc oraz (3, których szukaliśmy. Liczba (1 + y/5 )/2 « 1,61803 występuje w wielu działach matematyki, jak również w świecie sztuki, gdzie już w starożytności była uważana za naj bardziej zadowalający stosunek, w wielu różnych projektach. Dlatego też nosi szczególne miano— złotego podziału. Oznaczamy ją grecką literą (f>, na cześć Fidiasza, o którym mówi się, że świadomie używał jej w swoich rzeźbach. Drugi pierwiastek równania kwadratowego (1 — >/5)/2 = —1/4> « —0,61803 Stosunek wysokości człowieka do wysokości położenia jego pępka wynosi w przybliżeniu l , 618, zgodnie z obszernymi empirycznymi obserwacjami prowadzonymi przez europejskich uczonych [136]. ma wiele własności 4>, a zatem ma szczególną nazwę $ , „fi z daszkiem.” Obie liczby są pierwiastkami równania kwadratowego w 2 —w — 1 = 0 , mamy więc cf>2 = 4> + 1 ; $2 = $ + 1. (6.121) (Więcej o c() i $ później.) Znaleźliśmy stałe oc = ej) oraz |3 = $ potrzebne w równaniu (6.119). Wy starczy teraz znaleźć A i B w (6.120). Podstawiając z = 0 do tego równania, otrzymujemy B = —A, zatem (6.120) skondensowaliśmy do - $ A + 4>A = 1 . Otrzymujemy rozwiązanie A = 1/(<t> — $ ) = 1/ \ / 5, czyli rozbicie na ułamki proste (6.117) wynosi F(z) = 7 i G (6'122) Dobrze, dostaliśmy F(z) dokładnie tam, gdzie chcieliśmy. Rozwijając ułamki w szereg potęgowy, tak jak w (6.118), dostaniemy postać zwartą współczyn nika przy zn : ^ (6 . 1 2 3 ) (Wzór ten był po raz pierwszy opublikowany przez Daniela Bernoulliego w roku 1728, ale został zapomniany i powtórnie odkryty przez Jacąuesa Bineta [31] w roku 1843.) Zanim zaczniemy podziwiać nasze wyprowadzenie, powinniśmy najpierw sprawdzić jego ścisłość. Dla u = 0 ze wzoru poprawnie otrzymujemy Fo = 0 . Dla rt = 1, dostajemy Fi = (4> — $ ) / \ / 5, rzeczywiście odpowiadające 1. Dla wyższych potęg, równania (6.121) mówią nam, że liczby zdefiniowane przez (6.123) spełniają rekurencję Fibonacciego, a zatem przez indukcję muszą być liczbami Fibonacciego. (Moglibyśmy także rozwinąć <j)n oraz $ n korzysta jąc z twierdzenia dmumianowego, wyławiając w ten sposób różne potęgi y/5 . Zaczynamy się powoli gubić. Sednem postaci zwartej nie jest koniecznie do starczenie nam szybkiej metody obliczania, ale raczej pokazanie powiązań pomiędzy Fn oraz innymi wielkościami w matematyce.) Posiadając dar jasnowidzenia, moglibyśmy zgadnąć wzór (6.123) oraz udowodnić go przez indukcję. Metoda funkcji tworzących jest bardzo sil nym mechanizmem, umożliwiającym nam wyprowadzenie tego wzoru. W roz dziale 7 zobaczymy, że ta sama metoda doprowadzi nas do rozwiązania znacz nie trudniejszych wzorów rekurencyjnych. Nawiasem mówiąc, nigdy nie mar twiliśmy się, czy sumy nieskończone w naszym wyprowadzeniu (6.123) były zbieżne. Okazuje się, że większość działań na wpółczynnikach szeregów po tęgowych może być całkowicie uzasadniona, niezależnie od tego, czy sumy faktycznie są zbieżne [182]. Sceptyczni czytelnicy, ciągle podejrzewający błęd ność rozumowania z sumami nieskończonymi, mogą uspokoić się faktem, że równanie (6 . 1 2 3 ), raz odkryte przy użyciu szeregu nieskończonego, może być potwierdzone rzetelnym dowodem przez indukcję. Jednym z ciekawszych wniosków płynących z równania ( 6 . 1 2 3 ) jest fakt, że całkowite Fn jest niewiarygodnie bliskie wymiernej liczby Ą)n/V 5 dla du żych n. (Ponieważ wartość bezwzględna $ jest mniejsza niż 1, staje się wykładniczo małe i jego znaczenie jest właściwie pomijalne.) Na przykład, F10 = 5 5 oraz Fn = 89 są bardzo bliskie cb10 « 55,00364 y/5 i cb1^ ^ V5 « 88,99775. Możemy użyć tego spostrzeżenia do wyprowadzenia jeszcze jednej postaci zwartej, Ft. = ^ 1 V5 + 2 (b71 = —■= zaokrąglone do liczby całkowitej, V5 (6 . 1 2 4 ) ponieważ | $ n/\ /5 | ^ 2 j dla wszystkich tl ^ 0. Grdy tl jsst parzystej j^st nieco mniejsze niż 4>TVv^5. W przeciwnym razie jest nieco większe. Tożsamość Cassiniego ( 6 . 1 0 3 ) można zapisać w następujący sposób: Fn+i F„rt F^ Fr,_ ' t l —1 ( - 1 )* ' n —1 i n Dla dużego n, 1/F n -i F^, jest bardzo małe, więc iloraz Fn+i /Fn musi być bardzo bliski Fn/FrL_i, a równanie ( 6 . 1 2 4 ) mówi nam, że stosunek ten osiąga 4>. Istotnie, mamy n+1 (Prawdziwość tej tożsamości sprawdzamy dla n = 0 oraz rt = 1 i dowodzimy przez indukcję dla rt > 1. Możemy również udowodnić ją bezpośrednio przez podstawienie do ( 6 . 1 2 3 ).) Stosunek F^+t/F^ jest bardzo bliski ej), osiąga jąc na przemian wartości większe i mniejsze niż (f>. Nawiasem mówiąc, (f> jest również bardzo bliskie liczbie kilometrów w mili. (Dokładna wartość tej liczby wynosi 1,609344, ponieważ 1 cal odpowiada 2,54 centymetrom.) Daje nam to wygodny sposób przeliczania w pamięci kilometrów na mile, ponie waż odległość Fn+i wyrażona w kilometrach odpowiada niemalże dokładnie odległości Fn wyrażonej w milach. Jeśli USA kiedykolwiek przejdą na system metryczny; ich znak ograniczenia prędkości zmieni się z 55 m il/h na 89 km/h. No chyba, że ludzie z drogówki będą wspaniałomyślni i pozwolą im jeździć 90. Reguła „przesunięcia-wdół” zmienia n w f (n/(J)), a reguła „przesunięcia-wgórę” zmienia n w f (tl4>) , gdzie f(x) = + Przypuśćmy, że chcemy zamienić liczbę kilometrów, nie będącą liczbą Fibonacciego, na mile. Jakiej odległości odpowiada 30 km w standardzie amerykańskim? To proste: zamieniamy w pamięci 30 na jego reprezentację w systemie liczbowym Fibonacciego 2 1 + 8 + 1 używając metody zachłannej, wyjaśnionej wcześniej. Możemy teraz przesunąć każdą liczbę w dół o jedną pozycję, otrzymując 13 + 5 + 1. (Poprzednie *1* odpowiadało F2 , po nieważ kr > 0 w (6 . 1 1 3 ). Nowe ‘1’ odpowiada Fi .) Przesunięcie w dół dzieli mniej więcej przez (f>. Stąd otrzymujemy 19 mil. (Całkiem blisko, ponie waż właściwa odpowiedź to około 18,64 mili.) Podobnie, aby przejść od mil do kilometrów, używamy odwrotnego przesunięcia. 30 mil to w przybliżeniu 34 + 13 + 2 = 49 kilometrów. (Już nie tak dokładnie, ponieważ poprawna odpowiedź to mniej więcej 48,28.) Okazuje się, że reguła przesunięcia-w-dół daje poprawnie zaokrągloną liczbę mil odpowiadającą rt kilometrom dla wszystkich rt ^ 1 0 0 , z wyjątkiem rt = 4, 12, 54, 62, 75, 83, 91, 96 i 99, kiedy to niedokładność przybliżenia nie przekracza 2/3 mili. Reguła przesunięcia w górę daje albo poprawnie zaokrągloną liczbę kilometrów odpowiadającą rt milom, albo o 1 km za dużo, dla wszystkich rt ^ 113. (Jedyny naprawdę żenujący przypadek pojawia się przy rt = 4, kiedy to oba błędy zaokrągleń, dla rt = 3 + 1 , sumują się zamiast nawzajem się znosić.) 6.7. K ontyn uanty_______________________________ Liczby Fibonacciego mają ciekawe powiązania z drzewem Sterna-Brocota, które poznaliśmy w rozdziale 4, oraz równie ważne uogólnienia do ciągu wie lomianów gruntownie badanych przez Eulera. Wielomiany te noszą miano kontynuant i są one kluczem do badań nad ułamkami łańcuchowymi takimi, jak (6 . 1 2 6 ) a0 + a-i + a2 + a3 + &4 + G-6 H----- 0-7 Wielomian kontynuant Kn (xi ,X2 , . . . , xn ) ma rt parametrów i definiu jemy go za pomocą następującego schematu rekurencyjnego: I tak wielomiany występujące po Ki ( x i ) odpowiadają kolejno K2 ( x t ,x 2 ) = * 1*2 + 1 ; K3 (x-|,x 2 ,x3) = x 1x 2 x 3 + x 1 + x 3 ; K 4 (x i , x 2 , x 3 , x 4 ) = X ! X 2 X3 X4 + X ! X 2 + X ! x 4 + X3 X4 + 1 . Łatwo zauważyć (indukcyjnie), że liczba wyrazów jest liczbą Fibonacciego: Kn ( l , 1 , . . . , 1 ) = Fn + 1 . (6 . 1 2 8 ) Jeżeli kontekst jednoznacznie określa liczbę parametrów, możemy po pro stu zastąpić ‘K’ przez tak jak mogliśmy pominąć liczbę parametrów zajmując się funkcjami hipergeometrycznymi F w rozdziale 5 . Na przykład, K(xi ,x2) = K2(xi , x 2 ) = x ix 2 + 1. Indeks dolny rt jest oczywiście niezbędny w takich wzorach, jak ( 6 . 1 2 8 ). Euler zauważył, że K(xi ,x2, . .. , xn ) można uzyskać rozpoczynając od iloczynu x ix 2 .. .x n i skreślając sąsiadujące pary xicxk+i na wszystkie moż liwe sposoby. Graficzna reprezentacja reguły Eulera odpowiada konstrukcji wszystkich ciągów kropek i kresek „kodu Morse'a” o długości rt, gdzie każda kropka zwiększa długość o 1, a każda kreska o 2. Poniżej wszystkie ciągi kodu Morse’a o długości 4: Powyższe sekwencje kropkowo-kreskowe interpretujemy jako kolejne wyrazy K(xi ,x 2 ,x 3 , x4), gdzie kropka odpowiada zmiennej użytej, a kreska odpo wiada usuniętej parze zmiennych. Na przykład, — to x i x 4. Ciąg kodu Morse’a o długości rt posiadający k kresek ma (u —2k) kropek oraz w sumie (rt—k) symboli. Kropki i kreski mogą być poukładane na (n^k) sposobów. Zatem jeśli zastąpimy każdą kropkę przez z, a każdą kreskę przez 1, otrzymamy (6.129) k=0 Wiemy również, że całkowita liczba wyrazów w kontymiancie jest liczbą Fibo nacciego. Stąd otrzymujemy tożsamość (6.130) (Postać zwarta dla (6.129), uogólniająca wzór Eulera-Bineta (6.123) dla liczb Fibonacciego, pojawia się w (5.74).) Powiązanie między wielomianami kontynuant a ciągami kodów Morse’a podpowiada nam, że kontynuanty mają symetrię lustrzaną: K(xn , . . . , x 2, xi ) = K(xi , x2, . . . , xn ) . (6 .1 3 1 ) Zatem rekurencją rządząca parametrami po lewej jest uzupełnieniem analo gicznej reguły dla parametrów po prawej, w definicji (6.127): Kn(^l >• • • >^n) — Krt—1 (^-2 >• • • >^n) “F ^n—2 (^3 >• • • >^n) •( 6 . 1 3 2 ) Obie rekurencje są szczególnymi przypadkami ogólniejszego prawa: (6 .1 3 3 ) Prawo to jest łatwo zrozumieć, posługując się analogią do kodu Morse’a. Pierwszy iloczyn KmKn dostarcza wyrazy Km+U, w których nie ma kreski stojącej na pozycji [m ,m + 1], podczas gdy drugi iloczyn dostarcza wyrazy zawierające kreskę na tej właśnie pozycji. Jeżeli na wszystkie x podstawimy 1, z powyższej tożsamości dowiadujemy się, że Fm+n+i = Fm+iFn+i + FmFTL. Zatem zależność (6.108) jest szczególnym przypadkiem (6.133). Euler [112] odkrył, że kontynuanty podlegają jeszcze bardziej godnemu uwagi prawu, które uogólnia tożsamość Cassiniego: Km+nl^l , . . . , 'X.m_)-TL) Kic(xm+1 , • • ♦ >^m+k) — Km+kl^l , . . . , XTrL-|_ic) KTL(xm+i , . . . ,Xm-|_u ) + ( 1) Km_i (X-| , . . . , Xm_ i ) Kn—k—1(^m+k+2) • • • >^m+n.) • (6-134) Prawo to (udowodnione w ćwiczeniu 29) zachodzi zawsze wtedy, gdy dolne indeksy przy wszystkich K są nieujemne. Dla k = 2 , m = 1 oraz n = 3 mamy K(X1,X2,X3,X4)K(X2)X3) = K(X1,X2,X3)K(X2,X3,X4) + 1 . Wielomiany kontynuant są silnie powiązane z algorytmem Euklidesa. Na przykład przypuśćmy, że obliczenie NW D(m ,rt) kończy się w czterech kro kach: N W D ( n o , ni ) N W D ( m , n 2) NW D(rt 2 ,rt3) ni = ti ; no = m ) n 2 = rt0 mod ni = n 0 -- f l i T i ! ; n 3 = Tl! mod n 2 = Tli -- q2 rt2 ; n 4 = ti 2 mod n 3 = n 2 -- q3Ti3 ; N W D (n 4 ,0) = Uą 0 = n 3 mod n 4 = ti 3 -- q4 rt4 . N W D (n 3 , n 4) Wówczas mamy = n4 = K()tl4 ; n 3 = q4 Ti4 = K(q 4 )n4 ; n 2 = q3n 3 + n 4 = K(q 3 )q4 )n4 ; uą n-i = q 2 Ti2 + n 3 = K(q2 )q 3 , q 4 )n 4 ; no =q in ,+ n 2 = K( q, , q 2 , q 3 >q4 )n4 . W ogólności, jeżeli algorytm Euklidesa znajduje największy wspólny dziel nik d po k krokach, obliczając ciąg ilorazów q i , . . . , qk, oznacza to, że liczby początkowe odpowiadają K(qi , q2, . . . , qic)d oraz K(q2, . . . , qic)d. (Fakt ten zauważony został na początku osiemnastego wieku przez Thomasa Fantet de Lagny [232], który, jak się wydaje, był pierwszą osobą jawnie rozważającą kontynuanty. Lagny zwrócił uwagę, że kolejne liczby Fibonacciego wystę pujące jako kontynuanty, osiągające minimalne wartości wraz z kolejnymi q, odpowiadają najmniejszym liczbom wejściowym w algorytmie Euklidesa wymuszającym zadaną liczbę kroków.) Kontynuanty są również ściśle związane z ułamkami łańcuchowymi. Za chodzi następujący związek: 1 K(a0, a , , a 2, a 3) “ " + ------------ i---------------K ( « „ « 2 , a s ) ' « , + -------- j a2 H----- <6 ‘ 35> a3 Ten sam wzór zachodzi dla ułamków łańcuchowych dowolnej głębokości. Mo żemy to łatwo udowodnić przez indukcję. Na przykład, mamy K taââ^c^ + I M ) K ( a i , a 2>a3 + 1/04) zgodnie z tożsamością = K(a0, ^ , a2, a3, a4) K (a i , a2, a 3, a4) Kn (*1 >• • • , ^n- 1 > + V) = Kn(xi >• • • )^ n -l »^n) H" ^ n —1 (Xi >• • • >XrL—1 )U • ( 6 *136 ) (Dowód oraz uogólnienie powyższej tożsamości pojawia się w ćwiczeniu 30.) Ponadto istnieje ścisłe powiązanie kontynuant z drzewem Sterna-Brocota omówionym w rozdziale 4. Każdy węzeł w tym drzewie może być przedsta wiony jako ciąg L i P, powiedzmy paoLai pa2La3 p aTl_2I_a1x_ 1 ^ (6.137) gdzie ao ^ 0, ^ ^ 1, a2 ^ 1, a3 ^ 1, . . . , an_ 2 ^ 1, ^ 0 i n jest parzyste. Korzystając z dwóch macierzy 2 x 2 L oraz P z (4.33), nietrudno dowieść przez indukcję, że macierz Kn-2(cii, . . . , an_ 2) Kn_i ( a i , . . . , an_ 2, a ^ - i ) \ Kn_i (ao, a i , . . . , an_ 2) Knfao, a i , . . . , arL_ 2, an_ i ) y ^ jest równoważna macierzy z (6.137). (Dowód jest częścią ćwiczenia 87.) Na przykład aybDCjd P•aL PCL = ( bc + 1 abc + a + c bcd + b + d abcd + ab + ad + cd + 1 J Zatem możemy, w końcu, zastosować (4.34), aby otrzymać postać zwartą dla ułamka w drzewie Sterna-Brocota reprezentowanego przez ciąg L-P (6.137): f ( Pa° . . . L a— ') = Kn+l (nO, <H, ---. On-1, 1) K-nlO-l >• • • >O-n—1 >1 J ( g i 39j (Jest to „twierdzenie Halphena” [174].) Na przykład, aby znaleźć ułamek dla LPPL, bierzemy ao = 0, ai = 1, a 2 = 2, a 3 = 1 i rt = 4. Wtedy równanie (6.139) daje nam K(0, 1 , 2 , 1 , 1 ) = K(2,1,1) = K(2 , 2) = 5 K(1,2,1,1) K(1, 2, 1,1) K(3,2) '7 ' (Użyliśmy reguły Kn (x i, . . . , xn_ ! , xn + 1 ) = Kn+1 (xt , . . . , xn_ ! , xu , 1) w celu wchłonięcia początkowych oraz końcowych 1 na liście parametrów. Regułę tę otrzymujemy przez podstawienie y = 1 w (6.136).) Porównanie (6.135) i (6.139) pokazuje, że ułamek odpowiadający ogólne mu węzłowi (6.137) w drzewie Sterna-Brocota ma przedstawienie w postaci ułamka łańcuchowego f ( Pa° . . . Lan_I) = a0 + -------------------------------------- . - (6.140) a i + ------------------- ------------ Cl2 H---------- 1 + ------- Możemy zatem dokonywać bezpośrednich, obustronnych przejść pomię dzy ułamkami łańcuchowymi a odpowiadającymi im wierzchołkami w drze wie Sterna-Brocota. Na przykład, f(LPPL) = 0 + ------ 1 W rozdziale 4 zauważyliśmy, że liczby niewymierne definiują nieskończo ne ścieżki w drzewie Sterna-Brocota oraz mogą być reprezentowane jako nies kończony ciąg L i P. W przypadku, gdy nieskończony ciąg odpowiadający oc jest równy P aoLai p a2â3 _ } istnieje odpowiadający mu nieskończony uła mek łańcuchowy 1 oc = ao H----------------------------------------------. ai H-------------------------------------- (6.141) Cl2 4ci3 CLą + 1 0-5 H-------- Ten nieskończony ułamek łańcuchowy można również otrzymać bezpośred nio: Niech ao = oc i dla k ^ 0 niech ak = La kJ ; oc]c = a ic H------------------------------------------------------ — .(6.142) ^k+1 Liczby a nazywamy „ilorazami częściowymi” oc. Jeżeli oc jest wymierne, po wiedzmy m /n , powyższy proces napotyka ilorazy generowane przez algorytm Euklidesa i zatrzymuje się (przy ock + i = 0 0 ) . Czy stała Eulera y Jest liczbą wymierną? Nikt tego nie wie. Możemy próbować uzyskać częściową informację o tym słynnym otwartym problemie A jeśli nawet ktoś wie, to się tym nie chwali. szukając y w drzewie Sterna-Brocota. Jeżeli y jest wymierne, to je znaj dziemy, a jeśli jest niewymierne, to znajdziemy jego wszystkie najbliższe wy mierne przybliżenia. Ułamek łańcuchowy dla y zaczyna się od następujących ilorazów częściowych: Cóż, y musi być niewymierne, zgodnie z mało znanym powiedzeniem Einsteina: „Bóg nie rzuca we wszechświat wielkich mianowników” . k 0 1 2 3 4 5 6 7 8 ak 0 1 1 2 1 2 1 4 3 Zatem reprezentacja Sterna-Brocota dla stałej Eulera rozpoczyna się od ciągu LPLLPLLPLLLLPPPI___ Żaden wzór nie jest oczywisty. Obliczenia Richarda Brenta [39] pokazały, że jeśli y jest liczbą wymierną, to jej mianow nik musi mieć więcej niż 10 0 0 0 cyfr dziesiętnych. Dlatego nikt nie wierzy, że y jest wymierne. Ale jak dotąd nikt nie był w stanie udowodnić, że nie jest. Podsumujmy ten rozdział poprzez udowodnienie godnej uwagi tożsamości wiążącej wiele z powyższych wzorów w jedną całość. W rozdziale 3 wprowa dziliśmy pojęcie widma. Widmo stałej oc jest zbiorem z powtórzeniami liczb postaci [n a j. O szeregu nieskończonym Y z Ln<t>J = z + z 3 -H z 4 + z 6 + z 8 + z 9 H----- n^l możemy zatem powiedzieć, że jest funkcją tworzącą dla widma 4 >, gdzie 4> = (1 + y /5 )/2 jest złotym podziałem. Tożsamość, którą udowodnimy, od kryta w 1976 roku przez J.L. Davisona [77], jest nieskończonym ułamkiem łańcuchowym wiążącym powyższą funkcję tworzącą z ciągiem Fibonacciego: zFi --------- = ( l - z ) £ z L ™ W . Z2 n£l 1 + -ZF3 1+ (6.143) 1+ ^ Obie strony tożsamości (6.143) wyglądają interesująco. Przyjrzyjmy się najpierw liczbom [nĄ)\. Jeżeli reprezentacja Fibonacciego (6.113) liczby n wynosi Fkl + • • • + Fkr, spodziewamy się, że rtcj) odpowiada w przybliżeniu F-ic1+i -t- • • • + Fkr+i , czyli liczbie otrzymanej po przesunięciu reprezentacji Fibonacciego w lewo (zamiana mil na kilometry). Rzeczywiście, wiemy z (6.125), że nc(> = F|c1+i H--------b FkT+i — ( $ k' H--------1- $ kr) • Teraz $ = —1/(J> oraz ki >• • • • l $ ki + . •. + kr 0, mamy więc | < c r kr + < r k r _ 2 + c r k r ~ 4 + • • • i na podstawie podobnego rozumowania $ kl H------- b $ kr ma ten sam znak, co (—l ) kr. Stąd = Fkl+1 H-------bFkr+1 - [kr (n) jest parzyste] . (6-144) Powiemy, że liczba n jest nieparzystą liczbą Fibonacciego (w skrócie F-nieparzysta), jeśli jej najmniej znaczący bit Fibonacciego wynosi 1. To tak samo, jakbyśmy powiedzieli, że kr(rt) = 2 . W przeciwnym razie rt jest parzystą liczbą Fibonacciego (F-parzysta). Na przykład, najmniejsze liczby F-nieparzyste to 1, 4 , 6, 9, 12, 14, 17 i 19. Jeżeli kr (rt) jest parzyste, wówczas (n — 1) jest F-parzyste, zgodnie z (6.114). Podobnie, gdy kT(rt) jest nieparzyste, wówczas (n — 1) jest F-nieparzyste. Zatem kr(n) jest parzyste n — 1 jest F-parzyste. Ponadto, jeśli kr(rt) jest parzyste, z (6.144) otrzymujemy, że kr (Ln4>J) = 2 . Gdy kr(rt) jest nieparzyste, (6.144) mówi nam, że kr ([nc()J) = kr(rt) + 1. Zatem kr (Ln(|)J) jest zawsze parzyste i udowodniliśmy, że |ri<j)J — 1 jest zawsze F-parzyste. I odwrotnie, jeśli m jest dowolną liczbą F-parzystą, możemy odwrócić to rozu mowanie znajdując takie rt, że m + 1 = |ncf>J. (Rozpoczynamy od dodania 1 w notacji Fibonacciego. Jeżeli nie ma przeniesienia, n odpowiada (m + 2) przesuniętemu raz w prawo. W przeciwnym razie rt jest równe (m + 1) prze suniętemu w prawo.) Prawostronną sumę w (6.143) możemy zatem zapisać (6.145) mÔ Co się dzieje z ułamkiem po lewej stronie? Przepiszmy (6.143) tak, aby ułamek wyglądał jak w (6.141), ze wszystkimi licznikami równymi 1: (Przekształcenie to jest dosyć trudne! Licznik oraz mianownik początkowego ułamka, mającego w liczniku zFn, musimy podzielić przez zFn- 1.) Jeżeli za kończymy ten nowy ułamek łańcuchowy na 1 / z ~ Fti , jego wartość będzie od powiadać stosunkowi kontynuant, Kn+1 (z- F ° , Z—F' .................................................................................. Z“ F" ) Kn + l ( z - F° , Z - F' ) . . . , Z - F' ') ’ podobnie, jak w ( 6 . 1 3 5 ). Przyjrzyjmy się najpierw mianownikowi w nadziei, że nie będzie z nim kłopotów. Po podstawieniu Qn = Kn+i (z~F° , . . . , z-F n) zauważamy, że Q 0 = 1, Qi = 1 + z - 1 , Q 2 = 1 + z - 1 + z- 2 , Q 3 = 1 + z - 1 + z - 2 + z - 3 + z- 4 , a w ogólności wszystko pięknie pasuje i dostajemy szereg geometryczny Qn = i + 2 : - 1 + z ~ 2 + . . . + z - ( f tv+2 - i ) ^ Odpowiadającym licznikiem jest Pn = Kn (z~Fl, . . . , z _Fn). Odnajdujemy duże podobieństwo do szeregu Qn , jednak szereg Pn ma mniejszą liczbę wy razów. Na przykład mamy P5 = Z- 1 + Z- 2 + z - 4 + z - 5 + z - 7 + z ~9 + z - 1 0 + z - 1 2 , w porównaniu z Qs = 1 + z - 1 + ••• + z-1 2 . Po bliższym przyjrzeniu się zauważamy wzór rządzący powstawaniem formuł. Mamy 1+ z 2 + z 3 + z 5 + z 7+ z 8 + z l 0+ z n _ 12 P5 = -------------------- J2------------------- = z l _ z z [m F-parzysta], m =0 i w przypadku ogólnym możemy udowodnić przez indukcję, że Fn+2 -1 Pn = zm [m jest F-parzysta]. z 1_Ftv+2 rrv=0 Zatem Pn Lm =o 1 Im Jest ^-parzysta] L Fn+2 1 _m m =0 Z Teraz biorąc granicę przy rt —> 0 0 , dostajemy ( 6 . 1 4 6 ), zgodnie z ( 6 . 1 4 5 ). Ć w iczenia Rozgrzewka 1 . Które z [ 2 ] = 11 permutacji zbioru {1,2,3,4} mają dokładnie dwa cykle? (Rozwiązanie w postaci cyklowej występuje w ( 6 .4 ). Wymagamy rozwią zania w postaci nie-cyklowej, czyli np. 2314.) 2 . Liczba funkcji ze zbioru rt elementowego w zbiór m elementowy wynosi m-rL. Jak wiele z nich ma więcej niż k różnych wartości? 3 . Każdy, kto kiedykolwiek układał karty, wie, że mądrze jest zostawić pe wien zapas tak, aby karty nie rozsypały się, gdy nadejdzie powiew wiatru. Przypuśćmy, że wymagane jest, aby środek ciężkości górnych k kart był położony przynajmniej e jednostek od krawędzi (k+1 )-szej karty. (Zatem, na przykład, pierwsza karta może wystawać poza drugą co najwyżej o (1 —e) jednostek.) Czy możemy nadal uzyskać dowolnie duży nawis, jeśli mamy wystarczającą ilość kart? 4. Zapisz 1/1 + 1/3 H------- 1- 1 / ( 2 n +1 ) przy użyciu liczb harmonicznych. 5. Wytłumacz, jak otrzymać rekurencję ( 6 .7 5 ), korzystając z definicji funk cji UTL(x,'y) w ( 6 .7 4 ). Rozwiąż powyższą rekurencję. 6 . Badaczowi na wyspie została jedna para młodych królików. Jeżeli młode króliki dorastają w ciągu jednego miesiąca, a każda para dorosłych króli ków produkuje jedną parę młodych co miesiąc, to ile par królików będzie miał badacz na wyspie po upływie rt miesięcy? (Po dwóch miesiącach będą dwie pary, z których jedna jest nowo narodzona.) Znajdź powiąza nie pomiędzy tym problemem a „drzewem pszczół” przedstawionym w tekście tego rozdziału. 7. Pokaż, że tożsamość Cassiniego ( 6 . 1 0 3 ) jest szczególnym przypadkiem ( 6 . 1 0 8 ) oraz szczególnym przypadkiem ( 6 . 1 3 4 ). 8 . Zastosuj system liczb Fibonacciego do zamiany 65 m il/h na przybliżoną wartość wyrażoną w km/h. 9. Ile mniej więcej kilometrów kwadratowych mieści się w 8 milach kwadra towych? 10. Jaki ułamek łańcuchowy reprezentuję liczbę cf>? Podstaw y 1 1 . Ile wynosi H k(—1)k [£], będąca sumą elementów w wierszu, ze zmienia jącymi się znakami, w trójkącie Stirlinga dla cykli, gdy n jest nieujemną liczbą całkowitą? 1 2 . Udowodnij, że dla liczb Stirlinga słuszne jest prawo inwersji analogiczne do (5 .4 8 ): Jeśli liczby harmoniczne są liczbami żółwiowymi, liczby Fibonacciego są liczbami królikowymi. 13. O operatorach różniczkowych D = rozdziałach 2 oraz 5. Mamy oraz £ = zD wspominaliśmy w z 2 D 2 + zD d2 = ponieważ -&2f(z) = # z f /(z) = z^ zf'(z) = z2 f"(z) +zf'(z), które wynosi (z2 D 2 +zD)f(z). Podobnie możemy pokazać, że&3 = z 3 D 3 +3z 2 D 2 +zD. Udowodnij wzory ogólne: n = L .k znDTL zkDk ( - 1 )n- ke k = L dla wszystkich rt ^ 0. (Można je wykorzystać do zamiany pomiędzy wyrażeniami różniczkowymi postaci ak2:kf^k^(z) oraz Pk^kf(z) podobnie jak w (5 .109 ).) 14. Udowodnij tożsamość potęgową (6 .37 ) dla liczb Eulera. 15. Udowodnij tożsamość Eulera (6 .39 ) biorąc m-tą różnicę (6 .37 ). 16. Jak wygląda rozwiązanie ogólne podwójnej rekurencji -A-rijO — O-ri [n ^ 0 ] | Ao?k ^TL,k = kATV_ i >ic + An_] ,k—1 0, jeśli k > 0 ; dla całkowitych k, n, gdy zakres k i n odpowiada wszystkim liczbom całkowitym? 17. Rozwiąż następującą rekurencję przy założeniu, że jest równe zeru dla n < 0 lub k < 0 : b) n =z n —1 n —1 +n + [n = k = 0 ], k k k —1 dla n, k > 0 . n n -1 = (n -k ) k k + dla n, k >. 0 . n n -1 = k k k ń -1 + [n = k = 0 ], k —1 +k n —1 + [n = k = 0 ] , k —1 dla n, k ^ 0 . 18. Udowodnij, że wielomiany Stirlinga spełniają (x + 1 ) an ( x + 1 ) = ( x - n ) a u (x )+ x a n_](x). 19. Udowodnij, że uogólnione liczby Stirlinga spełniają x+k Z k=0 n Z k=0 X x+ k x x n+k x x —n + k ■i ) 1 x+k Tl + 1 = 0, całkowite n > 0 . całkowite n > 0 . 20. Zaproponuj postać zwartą dla X k =i 2 1 . Pokaż, że jeśli Hn = an /b n , gdzie an i bn są liczbami całkowitymi, mianownik bn jest wielokrotnością 2 Llgn-l. Wskazówka: Rozważ liczbę postaci 2 Llg —1 Hn — j . 22. Udowodnij, że nieskończona suma jest zbieżna dla wszystkich liczb zespolonych z, poza przypadkiem, gdy z jest ujemną liczbą całkowitą. Pokaż, że powyższa suma równa się Hz , gdy z jest nieujemną liczbą całkowitą. (Gdy z jest liczbą zespoloną, możemy użyć tego wzoru do zdefiniowania liczb harmonicznych Hz.) 23. Z równania ( 6 .8 i) otrzymujemy współczynniki funkcji z / ( e z —1) pojawia jące się przy potęgach z po jej rozwinięciu. Jak wyglądają współczynniki funkcji z / ( e z + 1)? Wskazówka: Rozważ tożsamość (ez + 1)(ez — 1) = e2z — 1 . 24. Udowodnij, że liczba tangensowa T2 n+i jest wielokrotnością 2n . W ska zówka: Udowodnij, że wszystkie współczynniki T in M oraz T2 n+i(x) są wielokrotnościami 2 n . 25. Równanie ( 6 .5 7 ) dowodzi, że robaczek ostatecznie osiągnie koniec gumo wej taśmy po pewnym czasie N. Musi zatem przyjść taki moment rt, w którym robaczek jest bliżej końca taśmy po rt minutach niż był po (rt —1 ) minutach. Pokaż, że rt < ^N. 26. Oblicz sumując przez części Su = H^/k. Wskazówka: Rozważ rów nież podobną sumę X!k=i Hk- i / k. 27. Udowodnij prawo NWD ( 6 . 1 1 1 ) dla liczb Fibonacciego. 28. Liczbę Lucasa Ln, definiujemy jako + F n- i • Zatem, zgodnie z zależ nością ( 6 . 1 0 9 ), mamy F2 n = Fn Ln . Oto tabela kilku pierwszych wartości: Tl 0 1 2 3 4 5 6 7 8 9 10 11 12 13 U 2 1 3 4 7 11 18 29 47 76 123 199 322 521 a) Użyj metody repertuaru, aby pokazać, że rozwiązanie cego ogólną rekurencję Qo = oc j Q 1 = (3 J Qn — Q t l —1 "F Q n —2 > spełniają tl > 1 może być wyrażone przy użyciu Fn i Ln . b) Zapisz Ln. w postaci zwartej używając <J) i $ . 29. Udowodnij tożsamość Eulera dla kontynuant, równanie ( 6 . 1 3 4 ). 30. Uogólnij ( 6 . 1 3 6 ) w celu znalezienia wyrażenia dla powiększonej kontynu anty K(x 1 , . . . , x m_ 1 , xm + y , x m+ 1 , . . . , x n ), gdy 1 n. Ć w iczen ia dom ow e 31. Zapisz w postaci zwartej współtzynniki |£| użyte w przedstawieniu potęg przyrastających poprzez potęgi ubywające: xu = L k x -, dla całkowitych rt ^ 0 . (Na przykład, x 4 = x - + 12x- + 36x- + 24x1, stąd l^l = 36.). 32. W rozdziale 5 otrzymaliśmy wzory V- f ti + k \ / r t + TTt + 1 \ . v— ( k\ m +1 z ( k /)= ( \ m )/ 1 O^k^m l \y/ = n + V -m \ k^m 1 rozwijając rekurencję (£) = (TV^ 1) + ( £ lj ) na dwa sposoby. Jakie toż samości pojawiają się przy rozwinięciu analogicznej rekurencji {£ } = Ach! Stare dobre czasy! 33. Tabela 296 zawiera wartości [™] oraz Jakie są postacie zwarte (nie używające liczb Stirlinga) dla następnych przypadków, [3 ] i { 3 }? 34. Czemu odpowiadają i (~k2), jeżeli założymy, że podstawowa zależ ność rekurencyjna ( 6 .3 5 ) zachodzi dla wszystkich liczb całkowitych k i rt oraz jeśli (£) = 0 dla wszystkich k < 0 ? 35. Udowodnij, że dla każdego e > 0 istnieje liczba całkowita n > 1 (zależna od e) taka, że Hn mod 1 < e. 36. Czy jest możliwe ułożenie sterty n cegieł tak, aby górna cegła nie leżała nad żadnym punktem dolnej cegły, a dodatkowo osoba ważąca równowar tość 1 0 0 cegieł mogła balansować na środku górnej cegły nie powodując zawalenia się sterty? 37. Przedstaw ^ ^ ( k m o d m ) / k ( k + 1) za pomocą liczb harmonicznych, zakładając, że m oraz n są dodatnimi liczbami całkowitymi. Jaka jest graniczna wartość przy rt —» 0 0 ? 38. Oblicz sumę nieoznaczoną Y (—1 61c. 39. Przedstaw Y\c=i ^k za. pomocą tl otb.z . 40. Udowodnij, że 1979 dzieli licznik sumy 1)k_1/k oraz zapropo nuj podobną sumę dla 1987. W skazówka: Użyj sztuczki Gaussa, aby uzyskać sumę ułamków, których liczniki wynoszą 1979. Zobacz również ćwiczenie 4. 41. Przekształć sumę r(l",+] t k,/2J) do postaci zwartej, gdy n jest liczbą całkowitą (również ujemną). 42. Jeżeli S jest zbiorem liczb całkowitych, niech S + 1 będzie „przesuniętym” zbiorem {x + 1' | x e S}. Ile podzbiorów { 1, 2, . . . , n } ma następującą własność S U (S + 1) = { 1 , 2 , . . . , n + 1}? 43. Udowodnij, że nieskończona suma 0,1 + 0,01 + 0,002 + 0,0003 + 0,00005 + 0,000008 + 0,0000013 zbiega do liczby wymiernej. 44. Udowodnij odwrotność tożsamości Cassiniego (6 .1 0 6 ): jeżeli k oraz m są liczbami całkowitymi takimi, że |m 2 — km — k2| = 1 , wówczas istnieje liczba całkowita rt taka, że k = ± f ri i m = ±Fn+i • 45. Użyj metody repertuaru do rozwiązania ogólnej rekurencji Xo = <x; X] = (3 ; Xn = Xn_ i + X n _ 2 + y n + 6 . 46. Ile wynoszą cos 36° oraz cos 72°? 47. Pokaż, że i użyj tej tożsamości do wyprowadzenia wartości Fp mod p i Fp+i mod p, gdzie p jest liczbą pierwszą. 48. Udowodnij, że w wielomianie kontynuant można usunąć parametry o war tości zerowej spajając ich sąsiadów: (Xi , . . . , X TrL_ 1,0,X-rrL_|_i , . . . , X-n.) Xm—2>Xm —1+xm+1 ,xm+2,••.,xn), 1 < m < rt. 49. Przedstaw liczbę Y n > 1 2- Ltl4>J w postaci ułamka łańcuchowego. 50. Definiujemy f (u) dla wszystkich liczb całkowitych dodatnich n za po mocą rekurencji f(1) = 1; f( 2 n) = f [ n ) ; f( 2 n + 1 ) = f(n) + f ( n + 1 ). a) Dla jakich rt wartość f (rt) jest parzysta? b) Pokaż, że f (rt) można wyrazić przy użyciu kontynuant. Zadania egzaminacyjne 51. Niech p będzie liczbą pierwszą. a) Udowodnij, że {£ } = [£] = 0 (mod p), dla 1 < k < p. b) Udowodnij, że p5^ 1] = 1 (mod p), dla 1 ^ k < p. c) Udowodnij, że { 2v~2} = [2 Pp~2] = 0 (mod p), jeśli p > 2. d) Udowodnij, że jeśli p > 3, to [1J] = 0 (mod p 2). Wskazówka: Rozważ PE52. Zapiszmy Hn jako an / b n , gdzie an oraz bn są względnie pierwsze. . a) Udowodnij, że p \b n 4= ^ vXa ln/v}> S^y p jest liczbą pierwszą, b) Wyszukaj wszystkie tl > 0 takie, że jest podzielne przez 5. 53. Przedstaw UkLo (k) 1 (—^)lcHk w postaci zwartej, gdy 0 ^ m ^ rt. Wskazówka: Ćwiczenie 5.42 zawiera powyższą sumę bez czynnika H^. 54. Załóżmy, że rt > 0. Celem tego ćwiczenia jest pokazanie, że mianow nik liczby B2 n jest iloczynem wszystkich liczb pierwszych p takich, że ( p - l ) \ ( 2 n). a) Pokaż, że Sm(p) + [(p—1)\m ] jest wielokrotnością p, gdy p jest liczbą pierwszą oraz m > 0 . b) Zastosuj wynik z części (a) do pokazania, że B2 n + [(P— 1 ) \ ( 2 rt)l ------------------ = l 2 n — p p pierwsza / jest liczbą całkowitą. Wskazówka: Wystarczy dowieść, że jeśli p jest dowolną liczbą pierw szą, mianownik ułamka B2 n + [(p — 1 ) \( 2 rt)]/p nie jest podzielny przez p. c) Udowodnij, że mianownik liczby B2 n jest zawsze nieparzystą wielok rotnością 6 oraz że odpowiada dokładnie 6 dla nieskończenie wielu n. 55. Udowodnij ( 6 .7 0 ) jako wniosek z bardziej ogólnej tożsamości, sumując ł 0 ^k<n Q (x T x 7 oraz różniczkując względem x. 56. Podaj (k) 1)kkn+ 1/ ( k —m ) w postaci zwartej, jako funkcję liczb całkowitych m oraz n. (Suma liczona jest po wszystkich całkowitych k z pominięciem k = m.) 57. „Zawinięte współczynniki dwumianu 5 -tego rzędu” definiujemy jako oraz ((£)) = [k = 0]. Niech Qn będzie różnicą pomiędzy największą i najmniejszą z tych liczb w n-tym wierszu: Q" = o f £ 5( ( k ) ) “ 0 ^ 5 fk )) ' Wyszukaj i udowodnij powiązania między Qn a liczbami Fibonacciego. 58. Wyznacz postacie zwarte dla Y n ^ o ^tlzU oraz Y-nô ^nzTL* Co m°żna powiedzieć o wielkości F^ +1 —4F^ —F^ _ 1 ? 5 9 . Udowodnij, że jeśli m oraz rt są dodatnimi liczbami całkowitymi, istnieje liczba całkowita x taka, że Fx = m (mod 311). 60. Wyszukaj wszystkie dodatnie liczby całkowite rt takie, że Fu + 1 albo Fn — 1 jest liczbą pierwszą. 61. Udowodnij tożsamość V~ —— = t 3 — b , dla całkowitych n ^ 1 . Fzn Ile wynosi Hk=o ^/^ 3 -2 k? 62. Niech Au = ^ + 4>-u oraz Bn = a) Wyznacz stałe oc oraz |3 takie, że Au — aA n_i + |3An _ 2 oraz Bn = (xBn_i + pBn_ 2, dla wszystkich rt ^ 0 . b) Przedstaw An oraz Bn przy użyciu Fn oraz (patrz ćwiczenie 28). c) Udowodnij, że £ £ =1 V (F 2 k+i + 1) = Bn / A u +i . d) Wyznacz postać zwartą Y h = i V (F 2 k+i — 1)• Zadania dodatkowe 63. Ile permutacji 7ti 7t2 . . . 7tn zbioru { 1 , 2 , . . . , n} ma dokładnie k indeksów j takich, że a) 7tt < 7tj dla wszystkich i < j? (Takie j nazywamy „maksimami od-lewej-do-prawej.” ) b) 7tj > j? (Takie j nazywamy „przewyższeniami.”) 64. Ile wynosi mianownik względnie pierwszy z licznikiem w ułamku prostym odpowiadającym 65. Udowodnij tożsamość ^ ^ f ( | x , + • • • + xnJ) d x , . . . dxn = Y _ ( k ) ^ T ■ 6 6 . Czemu odpowiada X k ( —^ )k (k)> będąca n-tą wierszową sumą elementów ze zmieniającymi się na przemian znakami w trójkącie Eulera? Zeznania podatkowe. 67. Udowodnij, że n +1 vk+1JVTn — k/v \m ’J 6 8 . Pokaż, że ((Y)) — 2(Y) oraz wyznacz postać zwartą dla ((5))- 69. Wyznacz postać zwartą dla Y-k=i ^2 ^n+k70. Pokaż, że zespolone liczby harmoniczne z ćwiczenia 2 2 mają rozwinięcie w szereg potęgowy Hz = ^ H ^ z 71-1 . 71. Udowodnij, że uogólnioną silnię z równania ( 5 .8 3 ) możemy zapisać jako Z k$;1 rozważając granicę przy n 00 pierwszych n czynników tego nieskończo nego iloczynu. Pokaż, że ^ ( z ! ) jest powiązana z uogólnionymi liczbami harmonicznymi z ćwiczenia 2 2 . 72. Udowodnij, że funkcja tangens ma szereg potęgowy ( 6 .9 2 ) oraz wyznacz odpowiednie szeregi dla z/sin z oraz ln ((tg z )/z ). 73. Udowodnij, że z ctg z jest równe Z L 2^ Z Z i Z z / , z + k?t 2 V—- 1 2 ^ " 2 ^ tg 2 ^ + 2^{ ' k=1 g ~1 F ~ + z —k7r g ~ 1F ~ dla wszystkich liczb całkowitych n ^ 1 oraz pokaż, że granica k-tych składników, dla ustalonego k, wynosi 2 z 2/( z 2 —k 2 7t2), przy n —» 0 0 . 74. Ustal powiązanie między liczbami Tn (1) oraz współczynnikami 1 /cos z. 75. Udowodnij, że liczby tangensowe oraz współczynniki 1/cos z pojawiają się na krawędziach nieskończonego trójkąta zaczynającego się następująco: 1 1 0 1 1 0 5 0 61 4 5 5 61 0 2 1 14 10 56 2 2 46 0 16 32 16 16 0 Każdy wiersz zawiera sumy częściowe poprzedniego wiersza, idąc na przemian z lewej na prawo i z prawej na lewo. Wskazówka: Rozważ współ czynniki szeregu potęgowego (sin z + cos z ) / cos (w + z). 76. Wyznacz postać zwartą sumy - t - T f 2 n' kk!, k oraz pokaż, że jest ona równa zeru, gdy n jest liczbą parzystą. 77. Jeżeli m i rt są liczbami całkowitymi, gdzie n ^ 0, wartość c n (m) otrzy mujemy ze wzoru (6 .4 8 ), gdy m < 0 , ze wzoru ( 6 .4 9 ), gdy m > rt oraz ( 6 . 1 0 1 ), gdy m = 0. Pokaż, że w pozostałych przypadkach zachodzi wzór całkowite rt m > 0. 78. Udowodnij następującą zależność łączącą liczby Stirlinga, liczby Berno ulliego oraz liczby Catalana: 79. Pokaż, że cztery kawałki szachownicy pojawiające się w paradoksie 64 = 65 można również użyć do udowodnienia, że 64 = 63. 80. Ciąg zdefiniowany rekurencyjnie Ai = x, A 2 = y, oraz An = An_i + An —2 osiąga Am = 1000000 dla pewnego m. Dla jakich dodatnich całko witych x oraz y wartość m jest największa z możliwych? 81. W tekście tego rozdziału przedstawiliśmy sposób zmiany wyrażenia za wierającego na formułę zawierającą wyłącznie Fn oraz FrL+1. Zatem pojawia się naturalne pytanie, czy dwa takie „zredukowane” wyrażenia mogą być równoważne, jeśli nie mają identycznych postaci. Niech P(x,'y) będzie wielomianem zmiennych x i y , ze współczynnikami całkowitymi. Zaproponuj warunek konieczny i wystarczający na to, aby P(Fn+i ,J=n) = 0 , dla wszystkich rt ^ 0 . 82. Wytłumacz, jak się dodaje dodatnie liczby całkowite, pracując wyłącznie w systemie liczb Fibonacciego. 83. Czy jest możliwe, aby ciąg (An ) spełniający wzór rekurencyjny Fibonac ciego An = An_i + A n _ 2 nie zawierał liczb pierwszych, jeśli Ao oraz Ai są względnie pierwsze? 84. Niech m oraz n będą nieparzystymi, dodatnimi liczbami całkowitymi. Wyprowadź postać zwartą dla Wskazówka: Sumy w ćwiczeniu 62 wynoszą S^ 3 — S| 2tx+3 oraz S 7 3 — 85. Scharakteryzuj wszystkie N takie, że reszty Fibonacciego Fn mod N dla rt ^ 0 tworzą cały zbiór { 0 , 1 , . . . , N — 1}. (Patrz ćwiczenie 59.) 8 6 . Niech Ci, C2 , . . . będzie ciągiem niezerowych liczb całkowitych takich, ze N W D (C m , Cn ) = C isiW D (m ,n ) dla wszystkich dodatnich liczb całkowitych m oraz n. Udowodnij, że uogólnione współczynniki dwumianu f C n . C n —1 • ♦ • C n —k+1 \k y q C icC ic—i ... C i są całkowite. (W szczególności, „współczynniki Fibomianowe” otrzymane w powyższy sposób z liczb Fibonacciego są liczbami całkowitymi, zgodnie z ( 6 . 1 1 1 ).) 87. Pokaż, że wielomian kontynuant pojawia się w iloczynie macierzowym oraz w wyznaczniku / xi 1 0 0 . . . 0\ -1 x2 1 0 0 0 0 ... 1 -1 Xn/ 8 8 . Uogólniając ( 6 . 1 4 6 ), wyznacz ułamek łańcuchowy powiązany z funkcją tworzącą 2 Znî zLnaJ, gdy oc jest dowolną dodatnią liczbą wymierną. . 89. Niech oc będzie niewymierną liczbą z przedziału ( 0. . 1 ) oraz niech a i, ci2,CI3,. . . będzie ciągiem ilorazów częściowych w ułamku łańcuchowym odpowiadającym oc. Pokaż, że |D (a,rt)| < 2, gdy rt = K( a i , . . . , a m), gdzie D jest niezgodnością zdefiniowaną w rozdziale 3. 90. Niech Qn będzie największym mianownikiem na poziomie rt w drzewie Sterna-Brocota. (Stąd ciąg (Qo> Qi >Q 2 >Q 3 >Q4 >• •.} = ( 1 , 2 , 3 , 5 , 8 , . . . ) zgodnie z diagramem w rozdziale 4.) Udowodnij, że Qn = Fn+2 - P ro b lem y badaw cze 91. Jaki jest najlepszy sposób rozszerzenia definicji {£ } na dowolne liczby rzeczywiste n oraz k? 92. Zapiszmy Hn w postaci ułamka prostego an/b n , postępując podobnie jak w ćwiczeniu 52. a) Czy istnieje nieskończenie wiele liczb n spełniających p \ a n , dla pew nej ustalonej liczby pierwszej p? b) Czy istnieje nieskończenie wiele liczb n, dla których wartość bn = N W W ( 1 , 2 >. . . , n ) ? (Dwie takie wartości to n = 250 oraz rt = 1000.) 93. Udowodnij, że y oraz eY są liczbami niewymiernymi. 94. Rozwiń ogólną teorię rozwiązań dwuparametrowej rekurencji = (<xn+ |3k + y) U ^ IV + {oc'n + |3'k + y ') n —1 + [n = k = 0 ], k-1 d lan ,k^ 0, zakładając, że |£| = 0, d i a n < 0 lub k < 0. (Współczynnikidwumianowe, liczby Stirlinga, liczby Eulera oraz ciągi z ćwiczenia 17 i 31 są szczegól nymi przypadkami powyższej rekurencji.) Dla jakich szczególnych war tości (a, p,y, a', P ^ y 7) otrzymujemy „rozwiązania fundamentalne”, w których możemy wyrażać rozwiązania ogólne? 95. Zaproponuj efektywny sposób na rozszerzenie algorytmu Gospera-Zeil bergera z wyrazów hipergeometrycznych do wyrazów mogących zawierać liczby Stirlinga. m Funkcje tworzące Najskuteczniejszą obecnie znaną metodą analizy ciągów liczb jest manipulo wanie nieskończonymi szeregami, które „tworzą” te ciągi. Dużo już wiemy o ciągach oraz poznaliśmy kilka funkcji tworzących. Jesteśmy więc przygoto wani do głębokiej analizy funkcji tworzących oraz do poznania ich prawdziwej użyteczności. 7.1. Teoria dom ina i rozm ieniania „Let me count the ways.” —E.B. Browning Funkcje tworzące są wystarczająco ważne, i dla wielu z nas wystarczająco nowe, żeby uzasadnić uproszczone podejście na początku naszej wnikliwej analizy. Zacznijmy więc ten rozdział od zabaw i gier, żeby wyrobić sobie intuicje na temat funkcji tworzących. Będziemy się zajmowali dwoma zasto sowaniami tej metody: jednym dotyczącym domina, a drugim dotyczącym monet. Na ile'sposobów Tn można całkowicie pokryć prostokąt rozmiaru 2 x n kamieniami domina rozmiaru 2 x 1 ? Założymy tutaj, że kamienie domina są identyczne (albo dlatego, że są odwrócone górą do dołu, albo dlatego, że ktoś sprawił, że stały się nierozróżnialne, powiedzmy, malując je na czerwono). Tak więc tylko ich sposoby ułożenia— poziomy lub pionowy— mają dla nas znaczenie i możemy sobie wyobrazić, że zajmujemy się układaniem płytek w kształcie kamieni domina. Na przykład, są trzy ułożenia prostokąta rozmiaru 2 x 3, a mianowicie UD, CB i HI. Tak więc T3 = 3. Żeby znaleźć zwartą postać dla dowolnego Tn, robimy pierwszy krok, rozważając małe wartości u. Dla n = 1 mamy oczywiście tylko jedno ułoże nie, 0 , ale dla n = 2 są już dwa, ID i B. Jak wygląda przypadek dla rt = 0? Ile jest sposobów pokrycia prostokąta 2 x 0 ? Nie od razu jest jasne, co ma oznaczać to pytanie, ale widzieliśmy już podobne sytuacje: Istnieje jedna permutacja zera obiektów (mianowicie pusta permutacja), tak więc 0! = 1. Istnieje jeden sposób na wybranie zera elementów spośród n elementów (wybranie niczego), tak więc (£) = 1 . Ist nieje jeden sposób podziału zbioru pustego na zero niepustych zbiorów, ale nie ma takiego podziału dla niepustego zbioru, tak więc {£} = [n = 0]. Na podstawie takiego rozumowania wnioskujemy, że jest tylko jeden sposób uło żenia prostokąta 2 x 0 z kamieni domina, a mianowicie nie położenie żadnego kamienia. Dlatego To = 1. (Burzy to prosty wzorzec Tn. = n, który zachodzi dla n = 1 , 2 i 3 , ale i tak ten wzorzec wyglądał bezsensownie, skoro To po winno być równe 1 zgodnie z logiką danej sytuacji.) Właściwe zrozumienie przypadku zerowego okazuje się użyteczne przy rozwiązywaniu problemów ilościowych. Spójrzmy na następny przypadek, dla rt = 4. Są dwie możliwości ułożenia lewej krawędzi prostokąta— położymy tam albo pionowy kamień, albo dwa poziome. Jeśli wybierzemy pionowy, to częściowym rozwiązaniem jest O i pozostały prostokąt 2 x 3 może być pokryty na T3 sposoby. Jeśli weźmie my dwa kamienie poziome, to pozostałe częściowe rozwiązanie HU można zakończyć na T2 sposobów. Tak więc T4 = T3 + T2 = 5. (Tych pięć ułożeń wygląda tak: [UD, UH, O , BU i B3.) Znamy już pierwszych pięć wartości Tn.: TL 0 1 2 Tn 1 1 2 3 4 3 5 Wyglądają one podejrzanie podobnie do liczb Fibonacciego i nie jest tak trudno zobaczyć dlaczego: Podejście użyte do pokazania, że T4 = T3 + T2 , można łatwo uogólnić do Tn = T^-i + Tn- 2 >dla n ^ 2 . Uzyskujemy więc takie samo równanie rekurencyjne jak dla liczb Fibonacciego, poza tym, że początkowe wartości To = 1 i Ti = 1 są odrobinę różne. Ale te początkowe wartości są liczbami Fibonacciego Fi i F2 , tak więc T jest ciągiem liczb Fi bonacciego przesuniętym o jedno miejsce: Tn. = Fn+1 , dla n ^ 0. (Uważamy to za postać zwartą dla Tn, ponieważ liczby Fibonacciego są na tyle ważne, że możemy je uważać za znane. Samo Fn ma również zwartą postać (6 .123 ) wyrażoną za pomocą operacji algebraicznych.) Zauważmy, że ten wzór potwierdza sensowność naszego podstawienia To = 1 . Ale co to wszystko ma wspólnego z funkcjami tworzącymi? Jesteśmy już blisko tego— wyraźmy Tn inaczej. Ten nowy sposób opiera się na dość zuchwałym pomyśle. Spójrzmy na „sumę” wszystkich możliwych pokryć pro stokąta 2 x n, dla wszystkich rt ^ 0 , i nazwijmy ją T: T = l+ D+ m+ B + m] + [B + B ]+- (Pierwszy składnik ‘I’ po prawej stronie równania oznacza puste pokrycie prostokąta 2 x 0 .) Suma T niesie ze sobą bardzo dużo informacji. Użyteczność takiej sumy polega na tym , że pozwala nam ona udowodnić pewne rzeczy o T jako o całości, natom iast nie zmusza do dowodzenia ich (np. przez indukcję) na podstawie analizy pojedynczych składników T^. Składniki tej sumy oznaczają pokrycia prostokątów, które są obiektami kombinatorycznymi. Nie będziemy tu ta j grymasić na tem at legalności sytu acji, gdy nieskończenie wiele pokryć dodaje się do siebie. Wszystko można zrobić bardzo formalnie, ale naszym celem jest rozszerzenie świadomości po nad konwencjonalne wzory algebraiczne. Dodaliśmy już wzorce do siebie, możemy je również pom nożyć— przez dopisanie. Na przykład możemy pomnożyć pokrycia 0 i 0 , żeby otrzymać nowe pokrycie IB. Ale zauważmy, że mnożenie nie jest przemienne, to znaczy, że porządek jest ważny przy mnożeniu: IB różni się od E0. Patrząc w ten sposób na mnożenie, nie jest już trudno zauważyć, że puste pokrycie spełnia specjalną rolę— jest to element neutralny mnożenia. Na przykład, I x B = B x I = B. Możemy teraz zastosować arytm etykę domin do operacji na nieskończonej sumie T: T = l + D+ m + B + C[D+ [B + B ] + - - = l + D(l + D+ Q] + B + - - - ) + B ( l + D+ m + B + - - - ) = I+ D T + B T . Mam wrażenie, że te sumy muszą być zbieżne, jeśli tylko domina są wystarczająco małe. ( 7 .2 ) Każde poprawne pokrycie występuje dokładnie w jednym składniku prawej strony, tak więc to, co robimy, wydaje się sensowne, nawetmimo ostrzeżeń z rozdziału 2 o „zbieżności bezwzględnej.” O statni wiersz w tym wzorze mówi nam, że wszystko w T jest albo pustym pokryciem, albo pionowym kamieniem domina i następującym po nim czymś z T, albo dwoma poziomymi kamieniami domina i następującym po nich czymś z T. Spróbujmy teraz rozwiązać równanie dla T. Zastępując T po lewej stronie przez IT i odejmując dwa ostatnie składniki z prawej strony od obydwu stron równości, otrzymujemy (I —□ —B) T = I . Sprawdźmy. Rozwinięta wersja powyższej równości wygląda tak: i + D + m + B + cm + [B + B ] + - - * — □ — □ — cm — cb — mu — h b — n=n — . • • — h — Fn — rti — m — R m — f t h — m i — . . . ( 7 .3 ) Każdy składnik z najwyższego wiersza, poza pierwszym, jest kasowany przez składniki z drugiego i trzeciego wiersza, tak więc nasze równanie jest po prawne. Jak dotąd łatwo było znajdować kombinatoryczną interpretację dla wyra żeń, z którymi pracowaliśmy. Teraz jednakże, by otrzymać zwarte wyrażenie na T, musimy wykonać „kombinatoryczne” dzielenie. Pełni wiary w to, że nie zawsze trzeba się kurczowo trzymać algebraicznych formalizmów, dzielimy obie strony równania ( 7 .3 ) przez I—□ —B , żeby otrzymać (Ponieważ mnożenie nie jest przemienne, więc jesteśmy na krawędzi oszu stwa, nie rozróżniając pomiędzy lewym i prawym dzieleniem. W naszym przypadku nie ma to jednak znaczenia, ponieważ I komutuje ze wszystkim. Ale nie grymaśmy za bardzo, dopóki nasze dzikie pomysły nie prowadzą do paradoksów.) Następnym krokiem jest rozwinięcie tego ułamka w szereg potęgowy, za pomocą wzoru 1 -----= ,1 + z + z 2 + z 3 H-----. 1 —z Puste pokrycie I, które jest elementem neutralnym w naszej arytmetyce, pełni rolę standardowej, multiplikaty wnej jedynki. 0 + B pełni rolę z. Tak więc uzyskujemy rozwinięcie = i + { d + b ) + ( d + b )2 + ( d + b )3 + --- I — U — bd = 1+ (D + B) -f~ (CD-I-IB~ł~BU + HH) + ([H]+ [rB + [B]+ [ffl+ HD + H B + ffl]+ ^ B ) + --- . Jest to też T, ale pokrycia występują teraz w innym porządku niż poprzednio. Każde pokrycie pojawia się w tej sumie dokładnie jeden raz. I tak na przykład i h h i h i występuje w rozwinięciu (D + B ) 7. Możemy uzyskać ciekawą informację z tej nieskończonej sumy poprzez jej skompresowanie, ignorując nieinteresujące nas detale. Na przykład, możemy sobie wyobrazić, że wzorce się rozklejają i że pojedyncze domina nawzajem komutują. Wówczas składnik taki jak II-hihi staje się D4 i=i6, ponieważ za wiera cztery kamienie pionowe i sześć poziomych. Składając w ten sposób, otrzymujemy następujący szereg: T = 1 + □ + O2 + o 2 + O3 + 2 D o 2 + D4 + 3 D 2 n 2 + i=i4 H-------. Tutaj 2 Ucd2 reprezentuje dwa składniki w starym rozwinięciu, [B i B], które mają jeden kamień pionowy i dwa poziome. Podobnie 3D2 a 2 reprezentuje trzy składniki HB, CBD i BU. Tak naprawdę, to traktujemy tutaj 0 i o jako zwykłe (przemienne) zmienne. Możemy znaleźć postać zwartą dla współczynników w wersji przemiennej T za pomocą wzoru dwumianowego Newtona: I— (D + o 2) = ! + ( □ + o 2) + (0 + o 2 ) 2 + ( □ + a 2 ) 3 + = J j 0 + o 2)k kÔ = j ,zk ^ 0 v /r 'j + m j.mÔ Już-jestem całkiem zdezorientowany. (W ostatnim kroku k —j jest zastąpione przez m. Jest to poprawne, ponie waż dla 0 ^ k < j zachodzi (k) = 0.) Wnioskujemy stąd, że (,' *m) jest liczbą sposobów, na ile można pokryć prostokąt 2 x (j + 2 m) używając j pionowych i 2m poziomych kamieni domina. Na przykład, przyglądaliśmy się poprzednio pokryciom LH-i U-ll prostokąta 2 x 1 0 , które używają czterech kamieni piono wych i sześciu poziomych. W sumie jest (4 J 3) = 35 takich pokryć, tak więc jednym ze składników w przemiennej wersji T jest 3 5D4 o 6. Możemy ukryć jeszcze więcej szczegółów zaniedbując orientacje kamieni, Przypuśćmy, że nie interesuje nas to, czy dany kamień ułożony jest pionowo, czy poziomo. Jedyne co chcemy wiedzieć, to jaka jest liczba pokryć 2 x n (tak naprawdę, to jest to liczba Tn, którą na samym początku chcieliśmy obliczyć). Możemy uzyskać konieczną informację przez proste podstawienie pojedynczej zmiennej z za D i □ . Moglibyśmy również zastąpić I przez 1, otrzymując Jest to funkcja tworząca (6 . 1 1 7 ) dla liczb Fibonacciego, tylko że w liczniku brak jest zmiennej z. Stąd wnioskujemy, że Fn+i jest współczynnikiem przy zn w rozwinięciu T. Zwarte postacie 1/(1—D—B), 1/(1—□ —o 2) i 1/(1 —z —z2), które znaleźli śmy dla T, nazywane są. funkcjam i tw orzącym i, ponieważ tworzą (generują) interesujące nas współczynniki. Tak się akurat składa, że z naszego wyprowadzenia wynika, że liczba pokryć kamieniami domina prostokąta 2 x n przy użyciu dokładnie m par poziomych kamieni wynosi (n^m) . (Wynika to stąd, że jest j = n — 2m pionowych kamieni i dlatego mamy CY*) - CY") - (n ; m ) sposobów pokrycia według naszego wzoru.) Widzieliśmy już w rozdziale 6 , że (TL^nm) jest liczbą kodów Morse’a długości n zawierających dokładnie m kresek. W rzeczywistości łatwo zobaczyć, że pokrycia prostokąta 2 x n kamie niami domina odpowiadają jednoznacznie kodom Morse’a. (Pokrycie i h h i h i odpowiada ‘---------- ’.) Tak więc problem pokrycia kamieniami domina jest bardzo blisko związany z wielomianami kontynuant, które analizowaliśmy w rozdziale 6 . Jaki ten świat jest mały. Rozwiązaliśmy problem Tn na dwa sposoby. Pierwszy sposób, łatwiejszy, polegał na zgadnięciu odpowiedzi i udowodnieniu jej przez indukcję. Drugi sposób, ciekawszy, polegał na użyciu nieskończonej sumy wzorców domina i wydobyciu z niej potrzebnych nam współczynników. Ale czy użyliśmy tej drugiej metody tylko dlatego, że zabawniej jest grać dominem niż zmiennymi algebraicznymi? Nie! Prawdziwą przyczyną jej stosowania jest to, że podejście z nieskończonymi sumami jest znacznie bardziej skuteczne. Drugi sposób ma zastosowanie dla dużo szerszego zakresu problemów, gdyż nie wymaga od nas zgadywania niczego w żaden magiczny sposób. Uogólnijmy teraz nasze zadanie do problemu, w którym zgadywanie bę dzie dla nas dużo za trudne. Na ile sposobów Un. możemy pokryć kamieniami domina prostokąt 3 x rt? Początkowe wartości Un mówią nam niewiele: Puste pokrycie daje Uo = 1. Nie ma poprawnego pokrycia dla rt = 1, ponieważ domino 2 x 1 nie wypeł nia prostokąta 3 x 1 i nie ma miejsca dla dwóch kamieni. Następną wartość, rt = 2, możemy łatwo obliczyć ręcznie. Są trzy pokrycia H, H i §, tak więc U.2 = 3. (Zauważmy, że my już to wiedzieliśmy, ponieważ poprzedni problem dał nam T3 = 3, a liczba pokryć prostokąta 3 x 2 jest taka sama jak liczba pokryć prostokąta 2 x 3.) Dla rt — 3, podobnie jak i dla rt = 1, nie ma żadnego pokrycia. Możemy się o tym przekonać albo robiąc krótkie przeszu kanie wszystkich możliwości, albo spoglądając na ten problem z wyższego poziomu: Pole prostokąta 3 x 3 jest nieparzyste, tak więc nie ma żadnego po krycia kamieniami domina, których pole jest parzyste. (Oczywiście taki sam argument można zastosować do każdego nieparzystego rt.) Dalej, dla n = 4 wydaje się, że jest około dwunastu pokryć. Trudno jednak być pewnym co do dokładnej liczby, bez poświęcenia czasu na upewnienie się, że otrzymana lista jest kompletna. Tak więc spróbujmy podejścia z nieskończonymi sumami, z którym pra cowaliśmy poprzednim razem: u = | + H + E + § + E!B + H 3 + 0 eI + E 9 + 5 0 + (7-7) Każde niepuste pokrycie zaczyna się albo od Ł, albo od ff, albo od §. Ale nie stety, pierwsze dwa z tych przypadków nie rozkładają się dobrze i nie dają w rozkładzie U. Sumę wszystkich składników w U zaczynających się od ^ można jednakże przedstawić jako ^ V, gdzie r v = o + cg + [g + [g + g + ... jest sumą wszystkich pokryć kamieniami domina wyszczerbionego prostokąta 3 x rt, w którym brakuje dolnego lewego rogu. Podobnie, składniki w U zaczynające się od ff mogą być zapisane jako ff A, gdzie a = o + [B + [ 0 + [f=3 + ś ] + - - - składa się ze wszystkich pokryć z brakującym górnym lewym rogiem. Sze reg A jest odbiciem lustrzanym V. To rozłożenie na czynniki pozwala nam napisać u = | + ł v + F a + @u. Możemy również rozłożyć V i A, ponieważ ich pokrycia mogą się zaczynać tylko na dwa sposoby: V = ou + f t v , A = gU + f f A . Otrzymaliśmy teraz trzy równania z trzem a niewiadomymi (U, V i A). Mo żemy je rozwiązać w dwóch krokach: najpierw rozwiązujemy je dla V i A jako funkcji od U i wstawiamy potem wynik do równania na U: Słyszałem na innych zajęciach o „wyrażeniach regularnych” Jeśli się nie mylę, to możemy zapisać U = (Łft*o + Pś’*d+ B)* w języku wyrażeń regularnych; musi więc istnieć jakieś powiązanie pomiędzy wyrażeniami regularnymi a funkcjami tworzącymi. V = ( | - Ę Ł ) _10U, A = ( | - f f ) - , Du , U = I + Ł ( l - % r ,Qu + F d - ś T ^ u + SU. Końcowe równanie można rozwiązać ze względu na U. Otrzymujemy postać zwartą u = i- ł u - % )-^ - r (7-8) To wyrażenie definiuje nieskończoną sumę U, podobnie jak (7 .4 ) definiuje T. Znajdźmy teraz przemienną wersję tego wzoru. Wszystko się pięknie upraszcza, gdy rozłożymy domina i będziemy używać tylko potęg □ i □ : 1 - 02[=>(1 - a 3) - ' - 02o(1 - o 3) - 1 - a 3 1- o 3 (1 - a 3 )2 - 2 0 2 a (1 - - 3) - 1 1 - 2 0 2 a (1 - o 3) - 2 (To wyprowadzenie wymaga dokładnego zbadania. W ostatnim kroku korzy stamy ze wzoru (1 —w )_2k_1 = (mm2k)wm>tożsamość (5 .56 ).) Przyjrżyjmy, się teraz dokładniej ostatniemu wierszowi. Widać, że po pierwsze, każde pokrycie 3 x n wykorzystuje parzystą liczbę pionowych kamieni do mina. Co więcej, jeśli jest 2k kamieni pionowych, to musi być co najmniej k poziomych i całkowita liczba kamieni poziomych musi być równa k + 3 m, dla pewnego m ^ 0. Całkowita liczba pokryć z 2k kamieniami pionowymi i k + 3 m poziomymi wynosi ostatecznie (m^2k) 2 k. Możemy teraz przeanalizować pokrycia prostokąta 3 x 4, co wydawało się beznadziejne przy wstępnej analizie problemu pokrycia prostokąta 3 x rt. Dla n = 4 pole wynosi 12, tak więc potrzebujemy w sumie sześciu kamieni domina. Jest więc 2k pionowych i k + 3m poziomych, dla pewnych k i m. Stąd 2k + k + 3m = 6 . Innymi słowy, k + m = 2. Jeśli nie używamy kamieni pionowych, to k = 0 i m = 2. Liczba takich możliwości jest (2 2 °) 2 ° = 1 (jest to pokrycie ). Jeśli użyjemy dwóch kamieni pionowych, to k = 1 i m = 1, i wówczas otrzymujemy ( 1^2 )2 1 = 6 pokryć. A jeśli użyjemy czterech kamieni pionowych, tok = 2 im = 0 i mamy (°J 4)2 2 = 4 pokrycia. W sumie mamy więc U4 = 11 dominowych pokryć prostokąta 3 x 4. W ogólności, dla parzystego rt ta metoda pokazuje, że k + m = \ n i stąd (m^n21c) = (^/2-k )’ a całkowita liczba pokryć prostokąta 3 x rt wynosi U, = z n /2 + k 2k = n / 2 —k n —m 2 ~n./2—m m (7-9) Tak jak poprzednio, możemy również podstawić z za obydwa □ i □ , otrzy mując funkcję tworzącą, która nie określa, czy używamy kamieni pionowych, czy poziomych. Wynikiem jest 1 1 —z3 u = 1 - z 3(1 - z 3 ) - 1 - z 3(1 - z 3) - 1 - z 3 = 1 —4z 3 + z 6 • (7' 10) Jeśli rozwiniemy to wyrażenie w szereg potęgowy, to otrzymamy U = 1 + U 2 Z3 + U 4 Z6 + U 6 Z9 + U 8 Z12 + -- - , Tak, tak, pamiętam, . że kiedyś w USA były półdolarówki. czyli funkcję tworzącą dla liczb Un . (Istnieje pewna zależność pomiędzy inde ksami i wykładnikami w tym wzorze. Można ją łatwo wyjaśnić. Na przykład, współczynnikiem przy z9 jest Ug, które jest liczbą pokryć prostokąta 3 x 6 . Jest tak dlatego, że każde takie pokrycie zawiera dziewięć kamieni.) Moglibyśmy iść dalej w analizie (7 .10 ) i otrzymać zwartą postać współ czynników, ale będzie lepiej, jeśli pozostawimy to dalszym podrozdziałom, kiedy będziemy już mieli większe doświadczenie. Skończymy więc na razie z dominem i przejdziemy do kolejnego zapowiedzianego problemu, „rozmienia nia.” Na ile sposobów możemy wydać 50 centów? Załóżmy, że opłata musi być dokonana za pomocą jednocentówek ©, pięciocentówek ®, dziesięciocentówek ©, ćwierćdolarówek © i półdolarówek @ . George Pólya [299] spopula ryzował ten problem, pokazując, że można go rozwiązać w pouczający sposób przy użyciu funkcji tworzących. Rozważmy nieskończone sumy reprezentujące wszystkie możliwe sposoby rozmieniania, podobnie jak zaatakowaliśmy problem domina przy użyciu nieskończonych sum reprezentujących wszystkie możliwe wzorce kamieni do mina. Łatwiej pójdzie nam z mniej różnorodnymi monetami, zaczniemy więc od przypadku, gdy nie mamy nic poza jednocentówkami. Suma wszystkich sposobów, na ile możemy wydać resztę w jednocentówkach, może być zapi sana P = / + © + © © + © © © + © © © © + ••• = / + ® + © 2 + @ 3 + ©4 + - - - . Pierwszy składnik oznacza liczbę sposobów, na ile możemy wydać zero jedno centówek, drugi oznacza jedną jednocentówkę reszty, trzeci dwie, następny trzy jednocentówki i tak dalej. Jeśli pozwolimy teraz na wydawanie zarówno jednocentówkami, jak i piątkami, to sumą wszystkich sposobów jest N = P + © P + © ® P + © ® ® P + © © © © P H ------- = ( / + ® + ® 2 + ® 3 + ® 4 + • • •) P > ponieważ każda rozmiana ma pew ną liczbę piątek z pierwszego czynnika i pewną liczbę centówek wziętą z P. (Zauważ, że N n ie jest sumą / + © + © + (© + ® ) 2 + (© + ® ) 3 H---- , ponieważ taka suma zawiera niektóre rozmiany więcej niż jeden raz. Na przykład, składnik (© + ® ) 2 = © © + © © + © © + ® ® traktuje © © i © © tak, jak gdyby były one różne, a my chcemy każdej możliwej reszty tylko raz, bez względu na jej porządek.) Podobnie, gdy dodamy dziesięciocentówki, otrzymamy: D = (^ + © + © 2 + © 3 + © 4 H---- ) N , która przy pełnym rozwinięciu zawiera takie składniki jak © 3® 3 © 5 = © © 0 ® ® ® © © © © © . Każdy z tych składników odpowiada innemu sposo bowi rozmiany. Dodanie ćwierćdolarówek i potem półdolarówek do zakresu możliwych rozmian daje Q = + © + © 2 + ® 3 + ® 4 H---- )D , C = (fi + @ + @ 2 + 0 3 + 0 4 h---- ) Q . Naszym celem jest teraz znalezienie liczby składników w C o wartości 50 centów. Ładne rozwiązanie otrzymamy stosując prostą sztuczkę: Zastąpmymy przez zZi) i (53) przez z . Wów © przez z, © przez z5, © przez z 10 czas każdy składnik jest zastąpiony przez zn, gdzie n jest monetarną war tością oryginalnego składnika. Na przykład, składnik @ © © @ © staje się z 5 0 + i 0 + 5 + 5 + i _ z 7i Wszystkie cztery sposoby wydania 13 centów, a mia nowicie @©3, ® ® 8, ® 2 © 3 i ® 13, redukują się do z13. Tak więc, po zasto sowaniu podstawienia, współczynnikiem przy z 13 będzie 4. Niech Pn, Nn, Dn, Qn i Cn będą liczbami sposobów, na ile można roz mienić rt centów, gdy pozwolimy na użycie monet o wartości, kolejno, co najwyżej 1,5, 10, 25 i 50 centów. Nasza analiza pokazuje nam, że są to współczynniki przy zn w odpowiednich szeregach potęgowych: P = 1 + z + z 2 + z 3 + z4 + • • • N = (1 + z 5 + z 1 0 + z 15 + z 20 + - -0 P. , 40 H---- ) N , D = (1 + z 10 + z20 + z30 + zw 25 Q = (1+ z, z:,+ z 50 + z7 5 + z 100 C = ( 1 + z 50 + z 100 + z 150 + z 200 )Q . Oczywiście, Pu = 1 dla wszystkich n ^ 0. Odrobina więcej wysiłku daje Nn = [n/5J + 1 : Żeby otrzymać n centów z centówek i piątek, musimy wybrać albo 0 , albo 1 , albo ... albo piątek, po czym jest tylko jeden sposób na wybranie centówek. Tak więc Pn i Nn są łatwe. Wartości,D^, Qn i Cn stają się jednak coraz bardziej skomplikowane. Ile jest tych monet, ale tak naprawdę? Jeśli n jest większe niż, powiedzmy, 10 10, to założę się, że?n = 0 w „prawdziwym świecie” . Rozwiązwiążemy ten problem jeśli zauważymy, że 1 + zm + z2m + • • • wynosi dokładnie 1/(1 —zm). Możemy więc zapisać P = 1/(1- z ) , N = P / ( 1 - z 5), D = N / ( 1 - z 10), Q = D /( 1 —z25) , C = Q /(1 — z50) . Mnożąc przez mianowniki otrzymujemy ( 1 - z ) P = 1, (1 - z 5)N = P, (1 —z10) D = N , ( 1 - z25)Q = D, (1 —z50) C = Q. Porównując w tych równaniach współczynniki przy zn , otrzymujemy równa nie rekurencyjne, z którego szybko możemy obliczyć potrzebne współczyn niki: Pn — Pn—1 “t"[TV= 0 ] , N n — ^ n —5 + Pn > — D n -1 0 > Q tl = Q tl—25 “1“ D n > Cn = Cn—50 “1“ Qn • Na przykład współczynnik przy zn w D = (l —z25)Q jest równy Qn~ Qn- 25 i musi więc zachodzić Qn —Qn-2 5 = Dn, tak jak tego oczekiwaliśmy. Moglibyśmy rozwinąć te rekurencje i stwierdzić na przykład, że Qn = Dn + D n —25 + Dn-so + D n -7 5 H---- , kończąc, gdy indeksy stają się ujemne. Ale rekurencyjna postać ma tę zaletę, że każdy współczynnik oblicza się przy użyciu tylko jednego dodawania, tak jak w trójkącie Pascala. Użyjmy powyższych rekurencji do obliczenia C50. Po pierwsze, C50 = Co + Qso, chcemy więc znaleźć Q50. Dalej, Q50 = Q25 + D 50 i Q25 = Qo + D 25 ; chcemy więc znaleźć też D 50 i D 25 . Wartości Dn zależą z kolei od D40, D30, D20, D15, D io, D5 i od N50, N45,. . . , N5. Dlatego do wyznaczenia wszystkich potrzebnych współczynników wystarczają proste obliczenia: 7.1. T eoria d om in a i rozm ien ian ia! n 0 5 10 15 20 25 30 35 40 45 50 Pn Nn 1 1 1 1 1 1 1 1 1 1 1 1 2 4 9 25 10 11 2 7 16 8 1 5 9 6 Dn Qn Cn 3 4 6 12 13 1 1 36 49 50 Ostatnia wartość w tabeli daje nam rozwiązanie C5o: Jest dokładnie 50 sposobów dania 50 centów napiwku. A jaka jest zwarta postać Cn? Mnożąc przez siebie równania, otrzymamy zwarte wyrażenie C = 1 1 1 —z 1 —z5 1 —z 10 1 —z25 1 —z50 ’ (7-11 ale nie widać jeszcze, jak wyliczyć stąd współczynniki przy zn. Na szczęście jest na to sposób. Wrócimy do niego dalej w tym rozdziale. Wyrażenia w zgrabniejszej postaci otrzymamy wówczas, gdy rozważymy problem rozmieniania dla kraju, który bije monety o każdym całkowitym dodatnim nominale (©, © , ® , ... ), a nie tylko w pięciu nominałach, które rozważaliśmy dotychczas. Odpowiednia funkcja tworząca jest nieskończonym iloczynem ułamków 1 (1 - z )(1 - z 2 )(1 - z3) . . . a współczynnik przy zn po całkowitym wymnożeniu wszystkich ułamków oznaczany jest przez p(rt), liczbę podziałów liczby rt. Podziałem liczby n na zywamy reprezentację n w postaci sumy dodatnich liczb całkowitych, gdzie kolejność składników nie jest istotna. Na przykład, jest siedem różnych po działów liczby 5, a mianowicie 5 - 4 + 1 = 3+2 = 3+1+1 = 2 + 2 + 1 = 2 + 1 + 1 + 1 = 1 + 1 + 1 + 1 + 1 . Stąd p(5) = 7. (Również p(2) = 2, p (3) = 3, p(4) = 5 i p(6 ) = 11; za czyna wyglądać tak, jak gdyby p(rt) było zawsze liczbą pierwszą, jednakże p( 7 ) = 15 niszczy ten pomysł.) Nie jest znana postać zwarta dla p(rt), ale teoria podziałów jest fascynującą gałęzią matematyki, w której osiągnięto znaczące wyniki. Na przykład Ramanujan pokazał za pomocą pomysłowej transformacji funkcji tworzących, że p(5rt + 4) = 0 (mod 5), p(7rt + 5) = 0 (mod 7) i p (117i + 6 ) = 0 (mod 11) (patrz Andrews [11 , rozdział 10]). (Nie wliczając możliwości płacenia napiwku kartą kredytową.) 7.2. Podstawowe techniki Przyjrzyjm y się teraz bliżej technikom, które czynią szeregi potęgowe tak silnym narzędziem. Najpierw kilka słów o terminologii oraz notacji. Nasza ogólna funkcja tworząca ma postać G(z) = go + g i z + 9 2 Z2 H------= gnzU (7*12) nÔ Jeśli fizycy mogą ,patrzeć na światło czasem jako na falę i czasem jako na cząstkę, to również matematycy powinni móc patrzeć na funkcje tworzące na dwa różne sposoby. i mówimy wtedy, że G (z), lub w skrócie G, jest funkcją tworzącą dla ciągu (9o, gi >g 2 >***), który oznaczamy również (gn ). W spółczynnik g^ przy zn w G(z) jest często oznaczany przez [zn] G(z), tak jak w rozdziale 5.4. Suma w wyrażeniu ( 7 . 12 ) jest wyliczana względem wszystkich n ^ 0, ale często wygodniejsze będzie rozszerzenie zbioru indeksów do wszystkich całkowitych rt. Możemy to zrobić za pomocą prostego podstawienia g_i = g _2 = • • ■ = 0. Wówczas możemy nadal mówić o ciągu (go, g i , g2 , • • •), tak jak gdyby gn nie istniały dla ujemnych rt. Pracując z funkcjami tworzącymi mamy do czynienia z dwiema różnymi „postaciami zwartymi.” Możemy mieć albo postać zw artą dla G (z) wyrażoną jako funkcję zmiennej z, albo postać zw artą dla g^ wyrażoną jako funkcję zmiennej rt. Na przykład, funkcja tworząca dla liczb Fibonacciego m a postać zw artą z /(1 —z —z 2 ), ale same liczby Fibonacciego m ają postać zw artą (cf)11 — $ n )/\/5. Z kontekstu będzie wynikało, którą postać zw artą mamy w danym momencie na myśli. Teraz kilka słów o punktach widzenia. Funkcja tworząca G(z) wystę puje w dwóch różnych bytach, zależnie od tego, jak na nią patrzeć. Czasem traktujem y ją jako funkcję zmiennej zespolonej z, spełniającą wszystkie stan dardowe własności znane z analizy matem atycznej. Czasem jednak będzie to dla nas po prostu formalny szereg potęgowy, gdzie z jest czymś, co może reprezentować dowolną rzecz, czy też dowolną własność. W poprzednim roz dziale korzystaliśmy z drugiej interpretacji. W kilku przypadkach zmienną z zastępowaliśmy pew ną własność obiektu kombinatorycznego w „sumie” ta kich obiektów. W spółczynnik przy z71 był liczbą obiektów kombinatorycznych mających n wystąpień tej własności. Gdy traktujem y szereg G(z) jako funkcję zmiennych zespolonych, jego zbieżność zaczyna być istotna. Powiedzieliśmy w rozdziale 2, że nieskoń czony szereg ^ n>0 gnZ 71 zbiega (bezwzględnie) wtedy i tylko wtedy, gdy istnieje stała A taka, że skończone sumy \9 nZ r i \ nigdy nie przekra czają A dla dowolnego N. Łatwo zauważyć, że jeśli funkcja X n > o 9 n^n jest zbieżna dla pewnej wartości z — z o, to jest ona również zbieżna dla każdego z spełniającego |z| < |zo|. Co więcej, musi zachodzić lim^ôo |gn ZQ | = 0. Zgodnie z oznaczeniami z rozdziału 9, jeśli nasza funkcja jest zbieżna w zo, to gn = O (| 1/zo |n ). I odwrotnie, jeśli gn = 0 (M n ), to szeregi L n ô 9 n^n są zbieżne dla wszystkich |z| < 1/M.. Są to podstawowe fakty o zbieżności szeregów potęgowych. Dla naszych celów zbieżność jest jednak z reguły zupełnie nieistotna, chyba że próbujem y analizować asymptotyczne zachowanie się współczynni ków. Prawie każda operacja, którą wykonujemy na funkcjach tworzących, może być uzasadniona rygorystycznie jako operacja na formalnych szere gach potęgowych i takie operacje są poprawne nawet wtedy, gdy ciąg nie jest zbieżny. (Stosowne wyniki teoretyczne można znaleźć na przykład u Bella [23], Nivena [283] i Henriciego [182, rozdział 1].) Co więcej, nawet gdy zrezygnujemy z całej naszej ostrożności i wypro wadzimy wzory bez rygorystycznego uzasadnienia, możemy w końcu wziąć wynik naszych obliczeń i udowodnić go przez indukcję. Na przykład, funkcja tworząca dla liczb Fibonacciego jest zbieżna tylko dla |z| < 1/4> w 0,618, ale my nie potrzebowaliśmy tego wiedzieć, żeby dowieść wzoru = ( 4)™— $ Tt)/v/5. Ten wzór, raz znaleziony, można sprawdzić bezpośrednio, nawet jeśli nie dowierzamy teorii potęgowych szeregów formalnych. Dlatego będziemy w tym rozdziale ignorować kwestię zbieżności szeregów. Stanowi ona bardziej przeszkodę niż pomoc. Tyle o punktach widzenia. Zajmiemy się teraz naszymi głównymi na rzędziami przekształcania funkcji tworzących — dodawaniem, przesuwaniem, zamienianiem zmiennych, różniczkowaniem, całkowaniem i mnożeniem. Bę dziemy odtąd zakładali, że F(z) i G(z) są funkcjami tworzącymi dla ciągów (fn) i (gn)- Założymy również to, że wartości f n i g^ są równe zeru dla ujemnych n . Zaoszczędzi nam to kłopotów przy ustalaniu granic sumowania. Jest dość jasne, co się stanie, gdy dodamy do siebie stałe wielokrotności F i G: aF(z) + |3G(z) = a y f n zn + n = ^ t a f n |3 Y gn zn n + P g n )^ . ( 7 - 13 ) Tl Daje nam to funkcję tworzącą dla ciągu (<xfn + |3gn ). Przesuwanie funkcji tworzącej nie je^t wiele trudniejsze. Żeby przesunąć G(z) o m miejsc na prawo, czyli podać funkcję tworzącą dla ciągu (0 , . . . , 0 , g0, g i , ♦ ♦ • ) = (gn- m ) z m zerami na początku, funkcję wyjściową mnożymy po prostu przez zm : zm G(z) = Y gn zn+m = Y n rt g n -m Z u , całkowite m ^ 0 . ( 7 . 14 ) Tej operacji używaliśmy już dwukrotnie, wraz z dodawaniem, w celu uzyska nia równania (1 — z — z2 )F(z) = z, gdy znajdowaliśmy postać zw artą liczb Fibonacciego w rozdziale 6 . W celu przesunięcia G(z) w lewo o m pozycji — to znaczy znalezienia funkcji tworzącej dla ciągu (gm , gm+1, gm+2, . . . > = (gn+m) z usuniętym i pierwszymi m elem entam i— odejmujemy pierwszych m składników, a po tem dzielimy przez z m : G (z )-g 0- '9 m - 1Z m —1 = Z QnZ (7-15) n^m nÔ (Nie możemy rozszerzyć tej ostatniej sumy na wszystkie n , chyba że go = ~ gm —1 = o.) Zamiana z przez jego (stałą) wielokrotność jest naszą następną sztuczką: G(cz) = ^ g n (cz)n = ^ n cTtgn zTL, ( 7 . 16 ) n co daje funkcję tworzącą dla ciągu (cn gTt). Szczególnie użyteczny jest przy padek szczególny c = —1. Często tak się składa, że chcemy otrzymać czynnik rt jako współczynnik w szeregu. Różniczkowanie jest tym , co pozwala nam to zrobić: G '(z) = gi + 2 g2z + 3 g 3Z2 + • • •= ^ ( n + 1)g n+1 zn . ( 7 . 17 ) n Przesuwając tę sumę w prawo o jeden składnik, otrzymujemy bardziej przy datny wzór: zG '(z) = ^ n g n zn . ( 7 . 18 ) n Jest to funkcja tworząca dla ciągu (n g n ). Powtarzając różniczkowanie mo glibyśmy otrzym ać funkcję tworzącą dla iloczynu gn i dowolnego wielomianu zmiennej n. Całkowanie, odwrotność różniczkowania, pozwala nam dzielić składniki przez n: fzG ( t ) d t = g z + ^1g i z 21 + - g 2z3 H---- = Jo 0 2 3 Y 1 - g n_ i z n . n ( 7 . 19 ) (Zauważ, że stały składnik jest zerem.) Jeśli potrzebujem y funkcji tworzącej dla (g tl/ ti), a nie dla (gn _ i/ri), to powinniśmy przesunąć najpierw o jedno miejsce w lewo, zamieniając w całce G(t) przez (G(t) — g o )/t. T abela 371. Operacje na funkcjach tworzących <xF(z) + Na koniec pokazujemy, jak można mnożyć przez siebie funkcje tworzące: F (z )G (z ) = ( f 0 + f i z + f 2z2 H------) (go + g i z + g2Z2 H------- ) — ("fogo) + (fogi + f i g o ) z + (fog2 + fi gi + f 2 go)z2 + • • • = H ( L n k f k g n - k) 2n . (7-20) Jak już zaobserwowaliśmy w rozdziale 5, daje to nam funkcję tworzącą dla ciągu (hn.) — s p lo tu ciągów (fn ) i (gn)- Sumę Kn = 2 I k f kg n -k można także zapisać jako h n = Z!k=o fk 9 n - k , ponieważ f k = 0 dla k < 0 i gn- k = 0 dla k > rt. M nożenie/splot jest odrobinę bardziej skomplikowane niż inne operacje, ale jest bardzo użyteczne — tak użyteczne, że cały podrozdział 7.5 poświęcimy analizie jego zastosowania. T a b e la 372. Proste ciągi i ich funkcje tworzące Ciąg IBKiiliM f' Funkcja tworząca I Postać zw arta (1 , 0 , 0 , 0 , 0 , 0 ™ . {0 ,...,0 ,1 ,0 ,0 ,...} | ^ o fu=m]zn | <1,1,1,1,1,1,...) Z ,* ,* * y ( 1 , - 1 , 1 , - 1, 1 , - 1 , . . . ) - - ‘Ii ( 1 ,0 ,1,0,1,0 ,...) L «nÔ > J 2\ n w A— (1,0 ,...,0 ,1,0,...,0,1,0,...) r nSoEmXTv]: (1 ,2 ,3,4,5,6 ,...) Z (1,2,4,8,16,32,...) 5” 2n z < £ —-n>o McVUct%-) i z.__ V \ \ u > *>2 * 3 » 4 1 ** */ f m + n ) zn If' ' m f; n L n 1 1 —cz -Ł—nÔ \ /o 1 I I 1 (1 + z ) c r TlÔ ( c+n_1 1z U < 1 ,C ,C 2 ,C 3 , . . . ) (1 - z F 0 + z )4 \n . O.c, 1 1 1 — 2z Zti^ o * Z uÔ \Ti (1 ,4 ,6 ,4,1,0,0 ,...) (i J n + 1) 1 — Zm J 1 (1 - z ) m+1 ln -i1 —z ; ^ ? ; ‘ ■ ■ r>: -> 0 0 >1>i ’ h j 4 ^ i b >; *•) T l : :, 4 z n ^ O Tl! -V ln(l + z) Mnożenie m a kilka szczególnych przypadków, które warte są uznania ich za oddzielne operacje. Już widzieliśmy jeden z nich: Gdy F(z) = zm , wówczas otrzymujemy operację przesunięcia ( 7 . 14 ). W tym przypadku suma Hn staje się pojedynczym składnikiem gn _ m , ponieważ wszystkie f k są równe 0 poza fm = 1 . Inny przydatny przypadek szczególny otrzym amy wtedy, gdy F(z) jest znajom ą funkcją 1 / ( 1 —z) = 1 + z + z 2 + • • •. Wówczas wszystkie f k są równe 1 (dla k ^ 0 ) i otrzymujemy ważny wzór — G(z) = Z ( L f n - l c V z n ^kÔ = ' 9 kV U ' n (7'21) Mnożenie funkcji tworzącej przez 1/(1 — z) daje nam funkcję tworzącą dla sum częściowych ciągu wyjściowego. Tabela 371 podsumowuje omówione do tej pory operacje na funkcjach tworzących. Ażeby skutecznie używać wszystkich tych operacji, należy mieć pod ręką jak najpełniejszy repertuar funkcji tworzących. Tabela 372 pokazuje najprostsze funkcje tworzące. Ich użycie pozwala rozwiązać całkiem sporo trudnych problemów. Każda z funkcji tworzących w tabeli 372 jest wystarczająco ważna, żeby ją zapamiętać. Kilka z nich jest szczególnym przypadkiem innych funkcji i można je wyprowadzić szybko z innych przy użyciu prostych operacji z tabeli 371. Dlatego zapam iętanie ich nie powinno być zbyt trudne. Rozważmy na przykład ciąg ( 1 , 2 , 3 , 4 , . . . ) , którego funkcja tworząca jest szczególnie użyteczna. Ta funkcja tworząca znajduje się w środku tabeli 372 i jest również szczególnym przypadkiem ciągu ( 1 , , (m^ 2) , (™^3) >•••), dla m = 1, który znajduje się poniżej. Jest ona również szczególnym przy padkiem dla c = 2 funkcji tworzącej ciągu (1, c, (° 2 1) , C 3 2) >•••)• Możemy wyprowadzić ją z funkcji tworzącej dla ( 1 , 1 , 1 , 1 , . . . ) przez wzięcie sum czę ściowych, jak w ( 7 .21 ), to znaczy przez podzielenie funkcji 1/(1 — z) przez (1 —z). Możemy też wyprowadzić j ą z ( 1 , 1 , 1 , ! , . . . ) przez zróżniczkowanie, zgodnie ze wzorem ( 7 . 17 ). Ciąg ( 1 , 0 , 1 , 0 , . . . ) jest następnym ciągiem, którego funkcję tworzącą można uzyskać na wiele sposobów. Możemy ją oczywiście uzyskać ze wzoru Y n z2rL — 1/(1 — z2) przez podstawienie z 2 za z w tożsamości = 1/(1 —z). Możemy też zastosować sumy częściowe do ciągu (1, —1,1, —1 , . . . ) , którego funkcją tworzącą jest 1/(1 + z), żeby otrzymać 1/(1 + z )(1 — z) = 1/(1 —z2). Jest jeszcze trzeci sposób, który jest oparty na ogólnej metodzie dla wyodrębnienia parzystych składników (go, 0 , g 2 , 0 , g4 , 0 , . . . ) z d o w o ln e g o ciągu: Jeśli dodamy G(—z) do G (+z), to otrzym amy G(z) + G(—z) = ^ T g ^ O + ( - l ) 71) ^ n = gn [n parzyste]zn ; n Wskazówka: Jeśli ciąg składa się ze współczynników dwumianowych, to jego funkcja tworząca używa z reguły dwumianu 1 ± z. OK, OK. Już jestem przekonany. dlatego G(z) + G(—z) = Y ( 7 -22 ) g2nz2n- n Nieparzyste składniki można uzyskać w podobny sposób, G {z)-G {-z) _ y 2 — / „2n+1 9 2 rt+ 1 2 . ( 7 - 2 3 ) rt W szczególnym przypadku, gdy gn = 1 i G(z) = 1/(1 —z), funkcją tworzącą dla (1,0,1,0,... >jest 1 (G (z) + G(-z)) = \ ^ ^ Wypróbujmy tę sztuczkę na funkcji tworzącej dla liczb Fibonacciego. Wiemy, że ]Tn = z/(l —z —z2). Dlatego Y ^ n Z 2n = U 1 _ zZ_ z2 + 1 +zl z2 1 / z + z2 —z 3 —z + z 2 + z3 \ 2\ ( 1 - z 2 )2 - z 2 / T z2 3z2 + A * Definiuje to nam ciąg (F0 , 0, F2 , 0, F4)...). Stąd ciąg parzystych elementów F, (F0, F2, F4) Fć, ...) = (0,1,3, 8 ,.. .), ma prostą funkcję tworzącą: £ F 2n z - = — ( 7 .24 ) 7.3. R ozw iązyw anie rekurencji_________________ Skoncentrujmy teraz uwagę na jednym z najważniejszych zastosowań funkcji tworzących: rozwiązywaniu równań rekurencyjnych. Dla danego ciągu (gn) spełniającego zadane równanie rekurencyjne, szu kamy zwartej postaci wyrażającej gn jako funkcję n. Rozwiązanie takiego problemu za pomocą funkcji tworzących składa się z czterech kroków, które są prawie na tyle mechaniczne, że mogłyby być zaprogramowane na kompu terze: 1. Napisz jedno równanie, które wyraża gn jako funkcję od innych elemen tów w tym ciągu. Równanie to powinno być spełnione dla wszystkich całkowitych n, przy założeniu że g_i = g_ 2 = • • • = 0 . 2. Pomnóż obydwie strony równania przez zn i zsumuj po wszystkich rt. Po lewej stronie otrzymasz sumę Y_n 9 nZn>która jest funkcją tworzącą G (z). Prawa strona powinna być przekształcona tak, żeby stała się wyrażeniem zawierającym G(z). 3. Rozwiąż otrzymane równanie, otrzymując postać zwartą dla G (z). 4. Rozwiń G(z) w szereg potęgowy i weź współczynnik przy zu ; jest to zwarta postać dla g^. Ta m etoda działa, ponieważ pojedyncza funkcja G(z) reprezentuje cały ciąg (gn ) w sposób umożliwiający wykonywanie wielu przekształceń. P rzy k ła d 1: L iczby F ib on acciego je szcz e raz W ykonajmy dla przykładu jeszcze raz nasze przekształcenia dla liczb Fibo nacciego z rozdziału 6 . W tam tym rozdziale poruszaliśmy się po omacku i uczyliśmy się nowej metody. Teraz chcemy być bardziej systematyczni. Daną rekurencją jest 90 = 0 ; 9n = gi = 1 ; 9 n —i + 9 u —2 , dla n > 2. Znajdziemy zw artą postać dla gn przy użyciu powyższych czterech kroków. Krok 1 nakazuje nam zapisać równanie rekurencyjne jako „pojedyncze równanie” dla gn . Moglibyśmy napisać { 0, jeśli n ^ 0 ; jeśli n = 1 ; 1, g n -i + 9 n - 2 y jeśli n > 1 ; ale to jest oszukiwanie. Krok 1 wymaga wzoru, który nie zawiera instrukcji warunkowej. Pojedyncze równanie gn = gn —1 H- gn —2 działa dla n ^ 2 i zachodzi ono również wówczas, gdy n ^ 0 (ponieważ mamy g o = 0 i g Uje m n e = 0). Ale dla n = 1 otrzymujemy 1 po lewej stronie i 0 po prawej. Szczęśliwie można to łatwo obejść, ponieważ możemy dodać [n = 1] do prawej strony. W ten sposób dodamy 1, gdy n = 1 i nic nie zmienimy, gdy n / 1. Tak więc mamy gn — g-n-1 + g-n- 2 + Itl= 1] > co daje nam równanie dla kroku 1 . Krok 2 nakazuje nam przekształcić równanie dla (gn ) w równanie dla G(z) = Y -n 9 n zTi- Zadanie nie jest zbyt trudne: G(z) = Y _ g n ^ = Y n = g n -1 Zn + y~ gn - 2 Zn + n n Y 9 n * n+1 + Y [n = 1 ] z u n 9 n Z n+2 n n = zG(z) + z 2 G ( z ) + z . Krok 3 jest również prosty w tym przypadku. Mamy co oczywiście nie jest żadnym zaskoczeniem. + Z Krok 4 jest rozstrzygający. W rozdziale 6 wykonaliśmy go po nagłym błysku olśnienia. Teraz zrobimy to znacznie wolniej, aby bezpiecznie wykonać krok 4 także później, gdy napotkamy trudniejsze problemy. Ile wynosi [zT 1- z - z 2 ’ czyli współczynnik przy zn, gdy rozwiniemy z/( 1 —z—z2) w szereg potęgowy? Ogólniej, gdy mamy daną dowolną funkcję wymierną - PW QM gdzie P i Q są wielomianami, ile wynosi wówczas współczynnik [zu] R(z)? Istnieje grupa funkcji wymiernych, której współczynniki są szczególnie przyjemne, a mianowicie iT T ^ -z C \r y .-- <«> (Przypadek p = 1 wystąpił w tabeli 372 i możemy otrzymać ogólne wyrażenie podstawiając pz za z.) Skończona suma funkcji, podobnie jak w (7 .25 ), Q(~\ 1 a2 1 1 ^ {z> = (1 - Plz)™'+' + (1 - p 2z)"^+' + '" + (1 / c\ ’ (7'26) ma także ładne współczynniki, +ai{ mi jPi- (7-27) Pokażemy, że każda funkcja wymierna R(z) taka, że R(0) / wyrażona jako R(z) = S(z) + T(z), 00 , może być (7 .28 ) gdzie S(z) jest postaci (7 .26 ), T(z) zaś jest wielomianem. Dlatego też współ czynniki [zn] R(z) mają postać zwartą. Znalezienie S(z) i T(z) jest równo ważne znalezieniu „rozwinięcia na ułamki proste” dla R(z). Zauważmy, że S(z) = 00 , gdy z przybiera wartości 1/ p i ,..., 1/ę>\. Dla tego liczby pic, które musimy znaleźć, jeśli chcemy wyrazić R(z) w żądanej postaci S(z) + T(z), muszą być odwrotnościami liczb otic, gdzie Q(ctic) = 0 . (Przypomnijmy, że R(z) = P(z)/Q(z), gdzie P i Q są wielomianami, a stąd R(z) = 0 0 tylko dla Q(z) = 0 .) Przypuśćmy, że Q(z) jest postaci przy czym q0 ± 0 i qm ^ 0. Q(z) = q0 + q i z + • • • + qmzm , „Lustrzany” wielomian. ą0zm+ ąiz™--' + -----b q m QR(z) = znajduje się w następującej ważnej relacji do Q(z): QR(z) = C|o(z P l ) . . . ( z Pm) 4=» Q(z) = q0(l —P iz )... (1 —pmz ) . Tak więc pierwiastki QR są odwrotnościami pierwiastków Q, i vice versa, dlatego możemy znaleźć szukane liczby pk rozkładając na czynniki proste lustrzany wielomian QR(z). Na przykład, w przypadku liczb Fibonacciego mamy Q(z) = 1 —z —z2 ; Qr (z) = z2 —z —1 . Pierwiastki QR można znaleźć przez podstawienie (a,b,c) = (1,—1,—1) we wzorze (—b ± V b 2 —4ac)/2a. Otrzymujemy stąd i+V5 = . * ^-V5 * $ = - j - . Tak więc QR(z) = (z —<J>)(z —$) i Q(z) = (1 —4>z)(l —$z). Jeśli znamy już wszystkie p, to możemy iść dalej, znajdując rozbicie na ułamki proste. Najłatwiej jest wówczas, gdy wszystkie pierwiastki są różne, rozważmy więc ten szczególny przypadek najpierw. Podamy tutaj i udowod nimy formalnie następujący wynik: T w ie rd z e n ie o ro z w ija n iu fu n k c ji w y m ie rn y c h o p ie rw ia s tk a c h je d n o k ro tn y c h J e ś li R(z) = P(z)/Q(z), g d z i e Q(z) = qo(1 — piz)...(1 — piz) i l i c z b y (pi,...,pi) s ą r ó ż n e , t o w p r z y p a d k u g d y P(z) j e s t w ie lo m ia n e m s t o p n i a m n i e js z e g o n i ż l , z a c h o d z i [zn] R(z) = a, p? H-----+ cnpj1 , gdzie a k = (7-29) Dowód: Niech a i, . .., ai będą powyższymi stałymi. Wzór ( 7 . 2 9 ) jest speł niony, jeśli R(z) = P(z)/Q(z) jest równe C ( \ = ----------ai 1 S(z) 1------ 1h 1 Pi z Ql 1-P lZ Zaimponuj swoim rodzicom zostawiając książkę otwartą na tej stronie. Udowodnimy, że R(z) = S(z), pokazując, że funkcja T(z) = R(z) —S(z) nie jest nieskończona, gdy z —>1/ pk- W tym celu pokażemy, że funkcja wymierna T(z) nie jest nigdy nieskończona. Stąd będzie wynikało, że T(z) musi być wielomićinem. Ponieważ pokażemy również, że T(z) —> 0 dla z —> oo, więc otrzymamy ostatecznie, że T (z) musi być zerem. Niech aic = 1/pk- Żeby pokazać, że limz_».ak_T(z) ± oo, wystarczy udo wodnić, że limz-*ak (z —aic)T(z) = 0, ponieważ T(z) jest wymierną funkcją zmiennej z. Chcemy więc pokazać, że lim (z—aic)R(z) = z— fctic lim (z —cx.k)S(z). Z—MXic Granica po prawej stronie wynosi limz->ock a-k[z —ctk)/(1 —Pk*) = —cik/Pk, ponieważ (1 —pkz) = —Pk(z—otk) i (z—(Xk)/0 —Pjz) —» 0, dla j ^ k. Granica po lewej stronie wynosi Um ( z - « k) ^ l = p(«k) Urn Q(z) z - > a k Q(z) z->cxk P(a^ Q'(ak) z reguły de 1’Hospitala. To kończy dowód twierdzenia. Powracając do przykładu z liczbami Fibonacciego, mamy P(z) = z i Q(z) = 1 —z —z2 = (1 —4>z)(1 —$z). Zatem Q'(z) = —1 —2z i -pP(1/p) Q'(1/p) -1 -1-2/p p p + 2* Zgodnie z ( 7 . 2 9 ) , współczynnik przy ^ w [z^] R(z) wynosi dlatego + 2) = 1/V5, a współczynnik przy $ 1Xwynosi $ / ( $ + 2 ) = —1/y/5. Tak więc na sze twierdzenie mówi nam, że Fn = (4>n —<pn)/V5, tak samo jak w równćmiu (6.123). Gdy Q(z) ma pierwiastki wielokrotne, wówczas obliczenia stają się bar dziej skomplikowane, ale możemy wzmocnić dowód twierdzenia i dowieść następującego ogólniejszego wyniku: Ogólne twierdzenie o rozwijaniu wymiernych funkcji tworzących Jeśli R(z) = P(z)/Q(z), gdzie Q(z) = qo(1 — piz)dl ...(1 — p;z)dl i liczby ( pi , . . . , pi) są różne, to w przypadku gdy P(z) jest wielomianem stopnia mniejszego niż l, zachodzi [zn] R(z) = fi (n)p? + ••• + f i Mp^ dla wszystkich n ^ 0, ( 7 . 3 0 ) gdzie każdy wielomian fk(ti) jest wielomianem stopnia dk —1 z najbardziej znaczącym współczynnikiem = (-P icl^Pd/pO dfc Q (dk)0 / P k ) ___________ P(1/pfc)___________ (dic —1)! q 0 —P i/P k ) d) (’ Można tego dowieść przez indukcję względem m a x ( d i , . . . , di), korzystając z faktu, że a i (d! — 1 )! a x(dL- 1 )! R(z)(1 - Pi z) dl (1 - P!Z)dl jest funkcją wymierną, której mianownik nie jest podzielny przez (1 — pkz)dk, dla żadnego k. P r z y k ła d 2 : M n ie j-lu b -b a rd z ie j losow a re k u r e n c ją Po poznaniu ogólnej metody, jesteśm y gotowi rozwiązać nowe zadania. Spró bujm y znaleźć zw artą postać dla rekurencji 9o = 9i = 1 ; 9n = 9 n - 1 + 2 gn - 2 + ( - 1 r , dla n ^ 2 . ( 7 .32 ) Zawsze jest dobrze zacząć od zrobienia tabeli z wartościami dla m ałych liczb i dla naszej rekurencji mamy: rt 0 1 2 3 4 5 M )n 1 -1 1 -1 1 9n 1 1 4 5 6 7 -1 1 -1 14 23 52 97 Nie widać jednak stąd natychm iast postaci zwartej i taki ciąg nie jest nawet wymieniony w P o d rę c z n ik u Sloane’a [331]; tak więc musimy przejść przez wszystkie cztery kroki, żeby znaleźć rozwiązanie. Krok 1 jest prosty, ponieważ musimy tylko wstawić odpowiednie czynniki tak, aby wszystko działało dla rt < 2: Równanie 9-n. = 9 n —1 + 2 g n _ 2 + ( - 1 ) n [ n ^ 0 ] + [ n = 1] jest spełnione dla wszystkich całkowitych rt. Teraz możemy przejść do kroku 2 G(z) = £ g „ z n = ^ g n - 1z - + 2 ^ g n - 2 z - + ^ ( - 1 )n zn + ^ z n 1x i x = rt nô n=i zG(z) +2z2G(z) + — |---hz . 1+ z (Moglibyśmy również użyć (^11) zamiast (—1)n [rt^0] , otrzym ując równość Łn (n V = ^ ze wzoru dwumianowego Newtona.) Po elementarnych przekształceniach algebraicznych kończymy krok 3: n( , G(z) = 1 + z(1 + z ) 1 + Z + Z2 (1 + z )(1 —z —2 z2) (1 —2 z )(1 + z )2 * nie jest wcale zgubiony! Czas na krok 4. Kwadratowy czynnik w mianowniku jest odrobinę kłopo tliwy, ponieważ wiemy, że pierwiastki wielokrotne są bardziej skomplikowane niż pierwiastki jednokrotne; ale go mamy i nic na to nie poradzimy. Mamy dwa pierwiastki, pi = 2 i p2 = —1. Ogólne twierdzenie o rozwijaniu (7 .30 ) daje nam Qn = a i 2 n + (a2rt + c ) ( - 1 )n dla pewnej stałej c, gdzie fll - 1 + 1 / 2 + 1/4 (1 + 1 / 2 )2 7 9’ 1-1+1 az ~ 1 —2 / ( —1 ) - 1 3' (Drugi wzór dla ak w (7 .31 ) jest łatwiejszy w użyciu niż pierwszy, gdy mia nownik ma ładny rozkład na czynniki. Podstawiamy po prostu z = 1/pk wszędzie w R(z) poza czynnikami, w których to da zero, i dzielimy przez (dk— 1)!. To daje współczynniki przy rtdk_1 p£.) Podstawiając rt = 0 widzimy, że wartość c powinna wynosić | . Tak więc naszą odpowiedzią jest = |2n + ( in + f)(-1)n . (7-33) Nic nie kosztuje sprawdzenie tego dla rt = 1 i 2, tak żebyśmy mieli pewność, że nigdzie się nie pomyliliśmy. Może i powinniśmy nawet sprawdzić rt = 3, ponieważ nasz wzór wygląda trochę podejrzanie. Ale jest on poprawny, wszy stko jest w porządku. Czy moglibyśmy znaleźć (7 .33 ) poprzez zgadywanie? Być może po wy pisaniu większej liczby wartości zaobserwowalibyśmy, że gn+i « 2 gn dla dużych rt. Z dobrym węchem i odrobiną szczęścia moglibyśmy nawet jakoś wyniuchać stałą Ale z całą pewnością jest znacznie łatwiej i pewniej mieć pod ręką funkcje tworzące. Przykład 3: W zajemnie zależne równania rekurencyjne Czasem mamy dwie lub więcej rekurencje, które zależą od siebie nawzajem. Możemy wówczas znaleźć funkcje tworzące dla obydwu rekurencji i rozwiązać je potem przez proste rozszerzenie naszej metody czterech kroków. Na przykład, powróćmy do analizowanego wcześniej w tym rozdziale pro blemu pokrycia prostokąta 3 x rt kamieniami domina. Jeśli chcemy znać tylko całkowitą liczbę Un pokryć prostokąta 3 x rt kamieniami domina, bez dziele nia tej liczby na kamienie pionowe i poziome, to nie potrzebujemy wgłębiać się w szczegóły tak głęboko jak poprzednio. Weźmy rekurencje U 0 = 1, Ui = 0; Un = 2 Vn_! + U n _ 2 , Vo = 0,V1 = 1; Vn = Un _! + Vn _ 2 , dla rt ^ 2 . Vn oznacza tutaj liczbę pokryć wyszczerbionego prostokąta 3 x n (bez rogu) z użyciem (3rt—1)/2 kamieni. Możemy łatwo uzyskać te równania, jeśli prze analizujemy, tak jak poprzednio, wszystkie możliwe konfiguracje kamieni na lewej krawędzi prostokąta. Oto wartości Un i Y-n. dla małych u: rt 0 1 2 3 4 5 6 7 un 1 0 3 0 11 0 41 0 0 1 0 4 0 15 0 56 (7-34) Znajdźmy teraz postacie zwarte w czterech krokach. Najpierw otrzymu jemy (krok 1) Un = 2 Vn_i + Un _2 + [t i = 0] , V tl = Un_i + Vn _2 , dla wszystkich rt. Stąd (krok 2 ), U(z) = 2zV(z) + z 2U(z) + 1 , V(z) = z U ( z ) + z 2V(z). Teraz (krok 3 ) musimy rozwiązać dwa równania z dwiema niewiadomymi. Jest to proste, ponieważ drugie równanie daje Y(z) = zll(z)/(1 —z2). Otrzy mujemy więc u (z ) = i - 4y + Z 4 ; = i _ 4 z 2 + z4 • (7-35) (Wzór (7 .10 ) jest podobny do naszego wzoru na U(z), tyleże teraz mamy z3 zamiast z2. W tamtym przypadku n było liczbą kamieni, a teraz jest to szerokość prostokąta.) Mianownik 1 —4z2 + z4 jest funkcją z2. To właśnie daje lizn+i = 0 i V2n = 0, tak; jak być powinno. Możemy skorzystać z tej przyjemnej własności funkcji z2, gdy będziemy rozkładać mianownik. Nie musimy brać 1 —4z2 + z 4 jako iloczynu czterech czynników (1 — pkz), ponieważ dwa z nich postaci (1 —picZ2) będą wystarczające do znalezienia współczynników. Innymi słowy, jeśli rozważymy funkcję tworzącą w (z ) = a \ 2 = Wo + W ,z + W 2 z 2 + -- -' , I —4z H~z^ 1 ( 7 .36 ) to będziemy mieli V(z) = zW(z2) i U(z) = (1 —z2 )W(z2). Tak więc V2n+i = W n i U.2n = w n —Wn_ i . Zaoszczędzimy więc czasu i energii pracując z prostszą funkcją W (z). Rozkład 1 —4z + z2 daje nam (z —2 —\ / 3 ) i (z —2 + V 3 ), które mogą być również przedstawione jako (l —(2+\/3)z) i (l —(2—\/3)z), ponieważ ten wielomian jest sam swoim odbiciem. Otrzymujemy więc V2 n + 1 = w n = ł ^ ł ( 2 + V 3 )n + ^ j ^ - ( 2 - V 3 ) n -, U in = Wn - W n_, = ł t ^ I ( 2 + v £ ) n + 2 = ^ I ( 2 - > / 3 ) u _ (2 + y ^ r (2 - y i r 3-y /l 3 + V3 . ' . U '37J Jest to szukana postać zwarta na liczbę pokryć prostokąta 3 x rt. Możemy uprościć wzór na U2n zauważając, że drugi składnik leży zawsze pomiędzy 0 i 1. Liczba U2n jest zawsze całkowita, tak więc otrzymujemy U2n = (2 + 7 3 )1 dla n Js 0 . 3 —\/3 ( 7 .38 ) Tak naprawdę to drugi składnik (2 —\ / 3 )'V(3 + V 3 ) jest bardzo mały dla dużych n, ponieważ 2 a / 3 » s 0,268. Należy to wziąć pod uwagę, gdybyśmy chcieli zastosować wzór (7 .38 ) przy obliczeniach numerycznych. Na przykład, dość drogi „firmowy” kalkulator podręczny otrzymał 413403,0005 podczas obliczania (2+ \/3) 10/(3—y/3). Jest to poprawne z dokładnością do dziewięciu cyfr znaczących, ale prawdziwa wartość jest trochę mniejsza niż 413403, a nie trochę większa! Dlatego błędem by było wziąć sufit z liczby 413403,0005. Poprawną odpowiedź, U20 = 413403, uzyskuje się przez zaokrąglenie do najbliższej liczby całkowitej. Sufity mogą być niebezpieczne. — Znałem także śliskie podłogi. P r z y k ła d 4: P o s ta ć z w a r ta d la ro z m ie n ia n ia Gdy przerwaliśmy rozważania problemu rozmieniania pieniędzy, potrafiliśmy już obliczyć liczbę sposobów płacenia 50 centów. Spróbujmy teraz obliczyć liczbę sposobów rozmienienia jednego dolara, lub też miliona dolarów— na dal używając tylko jednocentówek, piątek, dziesiątek, ćwierćdolarówek i półdolarówek. Wyprowadzona wcześniej funkcja tworząca r , , C(z) = 1 1 —z ł 1 1 1 1 —z5 1 —z 10 1 —z25 1 —z50 jest funkcją wymierną zmiennej z z mianownikiem stopnia 91. Możemy więc rozłożyć mianownik na 91 czynników i otrzymać 91-składnikową „postać zwartą” dla Cn, liczby sposobów, na które można wydać rt centów. Ale jest to zbyt straszne, żeby nawet zacząć myśleć o tym. Czy możemy zasugerować lepszą metodę dla tego szczególnego przypadku? Promyczkiem nadziei może być to, że mianownik jest prawie funkcją od z5. Sztuczka, której poprzednio użyliśmy do uproszczenia obliczeń, zauwa- żając, że 1 — 4z 2 + z 4 jest funkcją z2, może być teraz użyta do C(z), jeśli zastąpim y 1/(1 —z) przez (1 + z + z 2 + z 3 + z 4 )/ (1 —z5): 1 + z + z2 + z 3 + z 4 C(z) = — 1 —z 5 1 1 1 1 1 —z 5 1 —z 10 1 —z 25 1 —z 50 = (1 + Z + Z2 + z 3 + z 4 )Ć(z5) , C(z) = 1 1 1 1 1 1 —z 1 —z 1 —z 2 1 —z 5 1 —z 10 * Ta skompresowana funkcja Ć(z) m a mianownik stopnia tylko 19, tak więc nadaje się już znacznie lepiej do naszych celów niż początkowa funkcja. To nowe wyrażenie na C(z) pokazuje nam w szczególności, że C5U = Csn+i = C5TL+2 = Csn +3 = C5n + 4 i że faktycznie, równania te są oczywiste z retrospekcji: Liczba sposobów dania napiwku 53 centów jest taka sama jak liczba sposobów dania napiwku 50 centów, ponieważ liczba centówek jest określona modulo 5. Ale Ć(z) nadal nie m a wystarczająco prostej postaci zwartej, jeśli chcemy użyć pierwiastków mianownika. Uprościmy obliczenia współczynników przy Ć(z), gdy zauważymy, że każdy czynnik w mianowniku jest dzielnikiem 1 — z 10. Stąd możemy napisać Ć(z ) = A (z) j-| _ z i 0)5 » gdzie A(z) = Ao + Ai z H-------I-A 31Z31. (7-39) Dla zainteresowanych: wartość A(z) wynosi (1 + z + - - - + z9)2(1 + z2 + --- + z8)(1 + z 5) = 1 + 2z + 4z2 + 6z3 + 9z4 + 13z5 + 18z6 + 24z7 + 31 z8 + 39z9 + 45z'0 + 5 2 Z 1 1 + 57z’2 + 63z’3 + 67z’4 + 69Z15 + 69z16 + 67z17 + 63z18 + 57z'9 + 52z20 + 45z21 + 39z22 + 31z23 + 24z24 + 18z25 + 13z26 + 9z27 + 6z28 + 4z29 + 2z30 + z31 . W końcu, ponieważ 1/(1 —z 10)5 = ^ k>0 (k 4 4) z 10Ic, więc możemy wyznaczyć współczynnik = [zn] Ć(z), tak że gdy rt = 10 q + r i 0 ^ r < 10 , wówczas Ćioq+r = ^ Ai ( kD n 0 q + r = 1 0 k + j] j,k ~ A.r (q4 4) + Ar+ io (C|J 3) + Ar+ 2o (q4 2) + Ar+3o(C,4 1) . ( 7 *40 ) Daje nam to dziesięć przypadków, po jednym dla każdego r. Ale jest to Nasze myślenie zaczyna teraz być zwarte i skondensowane. już całkiem zwarta postać w porównaniu z alternatywną postacią używającą potęg liczb zespolonych. Możemy na przykład zastosować to wyrażenie do otrzymania wartości C5oq = Ćioq. Wówczas r = 0 i mamy C” « = ( , : > < fl: 3) + < ‘,: 2) + 2(fl; ') Liczba sposobów rozmienienia 50 centów wynosi (4) + 45(4) = 50. Liczba sposobów rozmienienia 1 dolara wynosi (4) +45 (4) + 52(4) = 292, a ponadto istnieje (2 000004\„r / 2000003\ ( 4 m 4 r„ /2000002\ j +H( m 4 „ /2000001 \ 4 ) = 66666793333412666685000001 sposobów rozmienienia miliona dolarów. Przykład 5: Szeregi rozbieżne Spróbujmy teraz uzyskać zwartą postać dla liczb gu zdefiniowanych przez 90 = i ; 9 n = n g n _! , dla n > 0 . Już w kilka nanosekund po przyjrzeniu się tym równaniom zauważamy, że gn jest dokładnie n!. Istotnie, metoda czynników sumacyjnych opisana w rozdziale 2 natychmiast sugeruje taką odpowiedź. Ale spróbujmy rozwiązać to równanie rekurencyjne przy użyciu funkcji tworzących, tak żeby zobaczyć, co się stanie. (Silna technika powinna być też w stanie rozwiązać łatwe re kurencje takie jak ta równie dobrze jak i inne, dla których nie potrafimy dać odpowiedzi tak szybko.) Równanie 9n = rig n -i + [n = 0 ] spełnione jest dla wszystkich n i prowadzi nas do G(z) = 2 ^ g n Z n = Y ng-n - 1 Zn + Y rt n zn . n=0 Żeby zakończyć krok 2 , musimy wyrazić n 9 n -i jako funkcję od G(z). Gdy spojrzymy do tabeli 371, to dostrzeżemy, że można by skorzystać ze wzoru na pochodną G'(z) = ^ TIn 9 n 2TV 1. Spróbujmy: G(z) = 1 + Y ( n + 1 )gn z n+1 n = 1 + ^ n g u z " + 1 + ^ g n z " +1 rt n = 1 + z2 G'(z) + zG(z). Sprawdźmy to równanie, używając wartości gn dla m ałych n . Ponieważ G = 1 + z + 2z2 + G' = 6 z 3 + 24z4 H ---- , 1 + 4z + 18z2 + 96z3 + • • • , więc otrzymujemy z2 G ' = z 2 + 4 z 3 + 18z4 + 96z5+ • • • , zG = z + z 2 + 2z 3 + 6z 4 + 24z5 H-----, 1 = 1. Te trzy wiersze dodane do siebie d ają w sumie do G, tak więc jak dotąd wszystko jest w porządku. W szczególności, będziemy często uważali za wy godniejsze pisanie ‘G’ zamiast ‘G(z)\ Gdy nie zamierzamy zmieniać z, dla przejrzystości wyrażenia opuszczamy dodatkowe ‘(z)’. Następny jest krok 3 i jest on różny od tego, co robiliśmy do tej pory, ponieważ musimy teraz rozwiązać równanie różniczkowe. Ale takie równanie różniczkowe możemy rozwiązać przy użyciu technik szeregów hipergeome trycznych, które stosowaliśmy w podrozdziale 5.6. Tamte techniki nie są wcale takie złe. (Czytelnik nie znający hipergeometrii nie powinien się niepokoić — to będzie szybkie.) Po pierwsze, musimy się pozbyć stałej ‘1’, tak więc różniczkujemy oby dwie strony: G' = (z2 G' + zG + l)' = (2zG' + z2 G") + (G + zG') = z2 G" + 3zG' + G. Rozdział 5 mówi nam, żebyśmy to przepisali używając operatora z ćwiczenia 6.13, że $G = z G \ $ 2G = z 2 G" + z G ' . i wiemy Dlatego wymaganą postacią równania różniczkowego jest »G = z$2G + 2 z$G + z G = z(d + 1) 2 G. Zgodnie z równaniem ( 5 . 109 ), rozwiązaniem z go = 1 jest szereg hipergeometryczny F(1,1;;z). Krok 3 był trudniejszy niż się spodziewaliśmy, ale teraz wiemy, czym jest nasza funkcja G. Krok 4 jest łatw y — definicja ( 5 .76 ) daje nam rozwinięcie w szereg potęgowy: G(z) = F ' nÔ nÔ Tak więc potwierdziliśmy to, co wiedzieliśmy już wcześniej, że zw artą postacią dla gn jest n!. Zauważmy, że nasza technika dała nam poprawne rozwiązanie, mimo tego że szereg G(z) jest rozbieżny dla wszystkich niezerowych z. Ciąg wartości rt! rośnie tak szybko, że składnik \n\ zn | zawsze rośnie do 00 przy u —> 00 , z wyjątkiem przypadku, gdy z = 0. Umacnia to nas w przekonaniu, że mo żemy operować algebraicznie szeregami formalnymi bez m artwienia się o ich zbieżność. P r z y k ła d 6 : R e k u re n c ją , k tó r a p o w ra c a całk o w icie do p o c z ą tk u Skończmy ten podrozdział stosując funkcje tworzące do problemu z teorii grafów. W a c h la rz e m rzędu n jest graf o wierzchołkach {0 , 1, . . . , n} z 2 n — 1 krawędziami zdefiniowanymi następująco: Wierzchołek 0 połączony jest kra wędzią z każdym z pozostałych wierzchołków i wierzchołek k jest połączony krawędzią z wierzchołkiem k + 1, dla każdego 1 ^ k < rt. Na przykład wachlarz rzędu 4, który m a pięć wierzchołków i siedem krawędzi, wygląda następująco: Problem, który nas interesuje: czemu się równa liczba f n drzew rozpina jących w takim grafie? D rz e w o ro z p in a ją c e jest podgrafem zawierającym wszystkie wierzchołki i m ającym wystarczająco dużo krawędzi, żeby podgraf był spójny, ale nie aż tyle, żeby m iał cykl. Okazuje się, że każde drzewo rozpinające grafu o n + 1 wierzchołkach m a dokładnie rt krawędzi. Z mniej niż n krawędziami podgraf nie byłby spójny, a z więcej niż rt m iałby cykl. Podręczniki z teorii grafów dowodzą tego bardziej formalnie. Jest ( 2rx~^) sposobów na wybór rt krawędzi spośród 2rt—1 występujących w wachlarzu rzędu rt, ale te wybory nie zawsze dają drzewo rozpinające. Na przykład podgraf m a cztery krawędzie, ale nie jest drzewem rozpinającym; m a on cykl z 0 do 4 do 3 do 0 i nie m a połączenia pomiędzy {1,2} a innymi wierzchołkami. Chcemy obliczyć, ile spośród ( 2ri~^) wyborów daje nam drzewo rozpinające. Spójrzmy najpierw na małe wartości. Jest całkiem łatwo wyliczyć drzewa rozpinające dla rt = 1 , 2 i 3: A A fl = 1 f2 = 3 A A A A f3=8 A A (Nie potrzebujem y podawać etykiet na wierzcnoiKacn, jesn zawsze rysujemy wierzchołek 0 po lewej stronie.) Co jest dla n = 0? Na pierwszy rzut oka wydaje się rozsądne podstawić f 0 = 1 , ale my przyjmiemy jednak f 0 = 0 , ponieważ istnienie wachlarza rzędu 0 (który powinien mieć 2 n — 1 = —1 krawędzi) wydaje się podejrzane. Nasza czterokrokowa procedura mówi nam, że mamy znaleźć rekurencję na f n , która jest spełniona dla wszystkich rt. Możemy otrzymać rekurencję analizując, jak najwyższy wierzchołek (wierzchołek rt) połączony jest z resztą drzewa rozpinającego. Jeśli nie jest on połączony z wierzchołkiem 0, to musi być połączony z wierzchołkiem rt —1 , ponieważ musi jakoś łączyć się z resztą grafu. W takim przypadku dowolne z f n - i drzew rozpinających dla pozo stałego wachlarza (o wierzchołkach od 0 do rt — 1) będzie pełnym drzewem rozpinającym dla całego grafu. W przeciwnym razie wierzchołek rt je s t po łączony z 0 i istnieje pewna liczba k ^ rt, taka że wierzchołki rt, rt —1 , . . . , k są połączone między sobą, ale krawędź pomiędzy k i k — 1 nie występuje. Wówczas nie może być żadnej krawędzi pomiędzy 0 i {rt — 1 , . . . , k}, ponie waż dawałoby to cykl. Jeśli k = 1, to drzewo rozpinające jest już określone całkowicie. A jeśli k > 1, to dowolny z fk -i sposobów utworzenia drzewa roz pinającego dla wierzchołków {0 , 1 , . . . , k —1} będzie dawał drzewo rozpinające dla całego grafu. Oto na przykład analiza dla rt = 4: ^3 U k= 4 k= 3 k= 2 k= l ^3 ^2 h 1 Ogólny wzór, prawdziwy dla rt ^ 1, wygląda następująco: fn — fn - 1 + fn —1 + fn - 2 + fn —3 + **' + fl + 1 • (W ygląda to prawie tak, jak gdyby T , która występuje na samym końcu, była fo i powinnibyśmy wybrać f 0 = 1. Ale my będziemy uparcie trzym ać się naszego wyboru.) Kilka zmian wystarczy, żeby przekształcić to równanie tak, żeby było ono prawdziwe dla wszystkich całkowitych rt: fn = fn —1 + X fk + [ t l > 0] . ( 7 .41 ) k<n Jest to rekurencją która „powraca całkowicie do początku” od f n _i do wszy stkich poprzednich wartości, więc jest ona inna niż rekurencje, które do tej pory widzieliśmy w tym rozdziale. W rozdziale 2 zastosowaliśmy specjalną m etodę, aby się pozbyć podobnej sumy po prawej stronie równania, gdy roz wiązywaliśmy rekurencje dla sortowania szybkiego ( 2 . 12 ); to znaczy, odejmu jemy jeden poziom rekurencji od drugiego (fn +i —fn)- Ta sztuczka pozwala nam pozbyć się także teraz, tak samo jak i poprzednio, ale zobaczymy, że funkcje tworzące pozwalają pracować nam również bezpośrednio z tą sumą. (I bardzo dobrze, ponieważ wkrótce będziemy widzieli znacznie bardziej skom plikowane rekurencje.) Krok 1 jest skończony. W kroku 2 musimy zrobić nową rzecz: F(z) = Y fnzn = Y fn-1 zn + y ~ fk^n [k<rt] + Y n [ t l > 0]z1 n = zF(z) + ^ f kz k I I [n > lc ]zn “ ,C + n = zF(z) + F(z) Y zm + m-----/x >0 = zF(z) + F f z ) ^ + '_ Z TZ Z k ,n rt Cała sztuczka polegała na tym, żeby zamienić zn na z k zn ~ k , co umożli wia nam wyrażenie wartości podwójnej sumy jako funkcji od F(z), tak jak wymaga od nas krok 2 . Proste przekształcenia algebraiczne dają nam w kroku 3 Ci z nas ze świetnym zmysłem pamięci rozpoznają w tym funkcję tworzącą ( 7 .24 ) dla parzystych liczb Fibonacciego. Tak więc nie potrzebujem y wyko nywać kroku 4 i otrzymujemy dosyć zaskakującą odpowiedź dla problemu drzew rozpinających: fn = ^ 2n , dla rt ^ 0 . (7 4 2 ) 7.4. Szczególne funkcje tw orzące Krok 4 w naszej czterokrokowej procedurze jest znacznie prostszy, gdy znamy współczynniki wielu różnych szeregów potęgowych. Rozwinięcia w tabeli 372 są dość użyteczne, na tyle na ile mogą, ale jest wiele innych możliwych ro dzajów postaci zwartych. Dlatego powinniśmy tam tą tabelę uzupełnić nową, przedstawiającą szeregi potęgowe odpowiadające „liczbom szczególnym” wy stępującym w rozdziale 6 . Tabela 390 jest bazą danych, której nam właśnie potrzeba. Tożsamo ści w tej tabeli nie są trudne do udowodnienia, nie musimy się więc nad nimi rozwodzić. Ta tabela m a służyć głównie jako źródło, do którego można się odwołać, gdy napotkam y nowy problem. Ale istnieje zgrabny dowód dla pierwszej tożsamości ( 7 .43 ), który zasługuje na wzmiankę: Zaczynamy od tożsamości 1 (1 —z )x+1 którą różniczkujemy względem x. Po lewej stronie, (1 — z ) _x_1 jest równe e (x+i)in(i/(i-z))^ j-gk więC d /d * dodaje czynnik ln(l/(1 — z)). Po prawej stronie, (x + r t ) . . . (x + 1 ) jest mianownikiem w (X^ TL) i d /d x rozbija to na n czynników, których sum a jest równoważna pomnożeniu (x* n ) przez x+ n + x+ 1 — Hx+n . Zamieniając x na m , otrzymujemy tożsamość ( 7 .43 ). Zauważmy tu ta j, że różnica Hx+n — Hx m a sens, nawet wówczas, gdy x nie jest całkowite. T a b e la 390. Funkcje tworzące dla liczb szczególnych Swoją drogą, zróżniczkowanie skomplikowanego iloczynu — i pozostawie nie go jako iloczyn— jest zwykle lepsze niż wyrażenie tego samego jako po chodnej sumy. Na przykład prawa strona w i ( ( x + n ) " . . . l , + !)') - (x+ n ( j Ł. +. - . +j L ) byłaby znaczniej bardziej zawiła, gdyby została zapisana jako suma. Ogólne tożsamości w tabeli 390 zawierają wiele ważnych przypadków szczególnych. Na przykład wzór ( 7 .43 ) upraszcza się do funkcji tworzącej dla Hn , gdy m = 0: r b lnr b = L n ( 7 -57 ) H^ n - Tę równość można również otrzymać na inne sposoby, na przykład możemy wziąć szereg potęgowy dla ln ( 1/(1 —z)) i w celu uzyskania sum częściowych podzielić go przez 1 —z. We wzorach ( 7 .51 ) i ( 7 .52 ) w ystępują odpowiednio ułam ki {m™n }/ * [m—rJ / (mn ]) »^ ó r e m ają niezdefiniowaną postać 0/0 dla n ^ m. Jednakże istnieje sposób, żeby nadać im właściwe znaczenie za pomocą wielomianów Stirlinga z (6 .45 ), ponieważ zachodzi {m -n} / 0 = H ) n + 1* ‘™ n ( n - m ) ; ( 7 .58 ) = n ! m o ^ ( m )- (7-59) m m —rt / ( ™ n 0 Tak więc przypadek m = 1 w ( 7 .51 ) powinien być rozważany nie jako szereg potęgowy I n JO(I,l/ n ! ) { , l n } / 0 , lecz raczej jako ln(l + z, = - X .( - z )n<Jn(n ~ ^ = 1 + \ z ~ T l7-2 H---- • v ' ■ nÔ Tożsamości ( 7 .53 ), ( 7 *54 ), ( 7 -55 ) i ( 7 *56 ) są „funkcjami podwójnie tworzą cymi” lub „funkcjami supertworzącymi” , ponieważ są one postaci G(w,z) = 9 m,nWmzn . W spółczynnik przy w m jest funkcją tworzącą ze zmienną z, a współczynnik przy z 71 jest funkcją tworzącą ze zmienną w. Równanie ( 7 .56 ) można przedstawić w bardziej symetrycznej postaci e vv — e" w e z — zew = /m Z ^ (\ m,n ^0 + TL + 1 \ rn m TVm Zn f n i+l nn -+u 1l )! ll’ // (m ^ 6 o) 7.5. Sploty Zawsze myślałem, że splot jest stanem mojego umysłu, gdy próbuję coś udowodnić. S p lo te m dwóch ciągów <fo »f i , — > = (fn) i <go» 9 i »— > = (9n) jest ciąg (fogo, fogi + f i g o > . . . ) = ( Z ! ic ^ 9 n - k ) - Zaobserwowaliśmy już w podroz działach 5.4 i 7.2, że splot ciągów odpowiada mnożeniu ich funkcji tworzą cych. Ta cecha umożliwia nam operowanie pewnymi sumami, które bez tej własności byłyby trudne do przeanalizowania. P r z y k ła d 1 : S p lo t F ib o n a c c ie g o Spróbujmy, na przykład, przekształcić ]T £ =0 Fk^n-k do postaci zwartej. Jest to splot (Fn ) samego z sobą, tak więc ta suma musi być współczynnikiem przy zn w F(z)2, gdzie F(z) jest funkcją tworzącą dla (Fn ). Nasze zadanie polega na znalezieniu tych współczynników. Funkcją tworzącą dla F(z) jest z/(1 — z — z2), czyli iloraz wielomianów. Ogólne twierdzenie o rozwijaniu funkcji wymiernych mówi nam, że rozwią zanie może być uzyskane z reprezentacji ułamkowej. Możemy użyć ogólnego twierdzenia o rozwijaniu ( 7 .30 ) i zaplątać się w obliczenia lub możemy sko rzystać z faktu, że 1 \ (1 -<j>z)(1 - $ z ) + (1 - $ z ) 2 j / 1 2 ~5V (1-cł>zP 1 = I y . (n +1)*n*n - \ l f"+i *n+ 1 z (n + 1)$n*n • rtÔ nÔ nÔ Zamiast wyrażać odpowiedź jako funkcję zmiennych ej) i $ , spróbujmy znaleźć postać zw artą jako funkcję od liczb Fibonacciego. Pam iętając, że (f>+ $ = 1, otrzymujemy <\>n + $ n = [zu ] ■ 1 1 — 4>Z 1 1 —$ z = lznl ^ ~ ^ ^ z [ ] (1 — <t>^)(1 — $z) — \zn ] 2 —z— ?F [ 1 —z —z2 Zatem F^ 2 = nÔ nÔ i —F n+1 1 otrzymujemy odpowiedź, której szukaliśmy: V“ t r ^ F ^ - i c — (rt + 1 )Fn ------------------^------------------. = f a \ (7-61) k=0 Na przykład dla rt = 3 wzór ten daje F0F3 + F 1F2 + F 2 F1 + F 3 F0 = 0+1 +1 + 0 = 2 po lewej stronie i (6 F4 —4 F3 ) / 5 = (18 —8 )/5 = 2 po prawej. P r z y k ła d 2 : S p lo ty h a rm o n ic z n e Efektywność pewnego algorytmu komputerowego zwanego „samplesort” za leży od wartości sumy Tm n = V L— O ^kcn ( k ) — 'l~ r , \ v n j n —k całkowite m, n ^ 0 . W ćwiczeniu 5.58 uzyskaliśmy wartość tej sumy za pomocą dość zawiłej po dwójnej indukcji stosując czynniki sumacyjne. Możemy znacznie łatwiej zna leźć rozwiązanie, gdy zauważymy, że Tm>Tl jest n-tym składnikiem w splocie ciągu <(£), O , ( £ ) , . . . ) z ciągiem ( 0 , Obydwa ciągi m ają proste funkcje tworzące z tabeli 372: T tÔ X 7 TL>0 Dlatego na mocy ( 7 .43 ) otrzymujemy W zm 1 1 1 ------^ T T l n l----- = [zTL—m] 7^------r - r r l n (1 —z )m+1 1 —z (1 —z ) m+1 1 —z = = (Hn - H m ) ( n V \n —my W rzeczywistości jest dużo więcej sum, które redukują się do tego samego rodzaju splotów, ponieważ mamy 1 (1 —z )r+1 1 1 1 1 , 1 l n - ----- • ~rz-----:—TT- = TZ-------. . . ln 1 —z ( 1 —z ) s+1 (1 —z )r+s+2 1 —z dla wszystkich r i s. Porównując współczynniki przy zn otrzymujemy ogólną tożsamość (^r+ s+ n+ l Hr+s+l)* ( 7 -^2) Ponieważ jest to takie harmoniczne. W ydaje się to być prawie zbyt dobre, żeby było prawdziwe. Ale sprawdźmy, przynajm niej dla n = 2 : c ; ' ) c ; ' ) ^ + (r a 2) c r ) (r +^ 2+ r + 1 r + s + 3\ ( 1 2 J \ r + s+ 3 1 r + s + 2/'‘ Przypadki szczególne, takie jak s = 0, tak samo zasługują na uwagę jak przypadek ogólny. Ale zachodzi nawet więcej. Możemy użyć tożsamości dla splotów y- /r + k \ / s + n —k\ _ /r + s + n + 1 2- { k ) { n - k ) ~ { n żeby przenieść Hr na drugą stronę, ponieważ Hr jest niezależne od k: ę c : k) c r _ ; > = ^ n ^ (H -r+s+n+l — H r + s + i + H r ) . ( 7 -6 3 ) Możemy jeszcze więcej: Jeśli r i s są nieujemnymi liczbami całkowitymi l i m , to możemy zastąpić (r^ k) przez (l+k) i (s^ ^ k) przez (m+T^ _k). Wówczas możemy zmienić k n a k —l i n na u —m —l i otrzymujemy n 'k\/n-k \ . ( n+1 k=0 całkowite l, m , n ^ 0 . ( 7 .64 ) Nawet szczególny przypadek l = m = 0 tej tożsamości był dla nas jeszcze trudny w rozdziale 2 (patrz ( 2 .36 ).) Przeszliśmy długą drogę. P r z y k ła d 3: S p lo t ze s p lo tu Jeśli mamy sploty (fn ) i (gn ) i weźmiemy ich splot z trzecim ciągiem (Hn ), to otrzym amy ciąg, którego n-tym składnikiem jest Y fj S k b a - j+k+l=n Funkcją tworzącą dla takiego potrójnego splotu jest oczywiście potrójny ilo czyn F(z)G(z)H(z). Podobnie, m -krotny splot ciągu (gn ) samego z sobą ma ri-ty składnik równy 2_ 9k! gk2 • • • 9km k i +k2H----- hkm = n i jego funkcją tworzącą jest G(z)m. Możemy wykorzystać tę obserwację do omawianego poprzednio problemu drzew rozpinających dla wachlarzy (przykład 6 w podrozdziale 7.3). Okazuje się, że jest jeszcze inny sposób na obliczenie fn, liczby drzew rozpinających w n-wachlarzu, oparty na konfiguracjach krawędzi drzewowych łączących wierz chołki {1,2,..., rt}: Krawędź pomiędzy wierzchołkiem k i k + 1 może być lub nie być wybrana do drzewa. Każdy ze sposobów wybrania takich krawędzi łączy ze sobą pewne bloki sąsiednich wierzchołków. Na przykład gdy rt = 10, możemy połączyć ze sobą wierzchołki {1,2}, {3}, {4,5, 6 ,7} i {8 ,9,10}: 7 6 5 4 •3 o* T2 *1 Ile drzew rozpinających możemy uzyskać, dodając krawędzie do wierzchołka 0? Musimy połączyć 0 z każdym z czterech bloków i mamy dwa sposoby na połączenie 0 z {1,2 }, jeden na połączenie z {3}, cztery sposoby na połączenie z {4,5,6 ,7} i trzy sposoby na połączenie z {8 ,9,10}. W sumie 2 •1 *4 •3 = 24 sposoby. Sumując po wszystkich możliwych sposobach utworzenia bloków otrzymujemy następujące wyrażenie na całkowitą liczbę drzew rozpinających: *n= Z Z ki k2 ... km . (7 .65 ) m >0 k 1 + k 2 H hkm=Ti ki ,k2,...,km>0 Na przykład f 4 = 4 + 3 - 1+2- 2+ 1-3+ 2- 1- 1+1-2-1+1-1-2+ 1-1-1-1 =21. Jest to suma m-krotnego splotu ciągu (0,1,2,3,...) ze sobą, dla m = 1,2, 3 , __ Stąd funkcją tworzącą dla (fn) jest Hz) = G(z) + G(z) 2 + G(z)3 H---- = I — b(zj gdzie G(z) jest funkcją tworzącą dla ( 0 , 1 , 2 , 3 , . . . ) , tzn. z /( l —z)2. O trzym u jemy więc tak jak poprzednio. Takie podejście do ciągu (fn ) jest bardziej symetryczne i pociągające niż skomplikowana rekurencją, którą mieliśmy poprzednio. P rzy k ła d 4 : S p lotow a rekurencją Nasz następny przykład jest szczególnie ważny. Jest to „klasyczny przykład” pokazujący, dlaczego funkcje tworzące są użyteczne w rozwiązywaniu równań rekurencyjnych. Przypuśćmy, że mamy rt + 1 zmiennych x 0, x i , . . . , xn , których iloczyn mamy obliczyć za pomocą rt mnożeń. Ile jest sposobów Cn postawienia na wiasów w iloczynie xo -xi •... -xn , tak, żeby porządek mnożenia był całkowicie określony? Na przykład dla rt = 2 są dwa sposoby, x 0 • (xi -x2) i (x0 - x i ) • x2. A dla rt = 3 mamy pięć sposobów, *o-(xi *(x2 -x3) ) , x 0 - ((xi -x 2 )-x3) , (x0 - xi )- (x 2 *x3) , (x0 -(xi ' x2)) •x 3 , ((x 0 -x 1)-x 2 )-x 3 . Tak więc C2 = 2, C3 = 5. Mamy również Ci = 1 i Co = 1. Zastosujmy czterokrokową procedurę z podrozdziału 7.3. Jaka jest rekurencja dla C? Kluczową obserwacją jest to, że gdy rt > 0, wówczas istnieje dokładnie jedna operacja ‘ • ’ poza wszystkimi nawiasami. Jest to końcowe mnożenie, które daje ostateczny wynik. Jeśli ten ‘ • ’ wystąpi pomiędzy Xk i xic+i, to istnieje Ck sposobów, żeby ująć w nawiasy xo •... *xk oraz C ^ -k -i sposobów, żeby ująć w nawiasy Xk+i •.. . *xn . Tak więc otrzymujemy Cn = CoCu —i + Ci Cn —2 + • • • + Cn—i Co , dla rt > 0 . Od razu rozpoznajemy w tym wyrażeniu splot i wiemy, jak to równanie uzu pełnić, żeby było spełnione dla wszystkich całkowitych rt: ( 7 .66 ) k Krok 1 jest więc zrobiony. Krok 2 nakazuje nam pomnożyć Cn przez zn i zsumować: TV n CkCn - i _ k ^ n + y~ zn = k,TL n=0 = L CkzkL k n c«-'-kzn_k + 1 = C(z) • zC(z) + 1 . O dziwo, splot stał się iloczynem, w świecie funkcji tworzących. Życie jest pełne niespodzianek. Krok 3 jest również prosty. Rozwiązujemy równanie kwadratowe i otrzy mujemy: C(z) = 1 ± -y/ 1 - AZ 2z Ale jaki znak powinniśmy wziąć, + czy — ? Obydwa wybory dają funkcję spełniającą C(z) = zC (z )2 + 1 , ale tylko jeden z nich jest właściwy w naszym problemie. Moglibyśmy wybrać znak + zakładając, że pozytyw ne/dodatnie myślenie jest najlepsze, ale wkrótce byśmy zauważyli, że ten wybór daje C(0) = oo, zaprzeczając faktom. (Poprawna funkcja C(z) powinna spełniać C(0) = Co = 1.) Dlatego CU, . I na koniec krok 4. Ile wynosi [zn] C(z)? Ze wzoru dwumianowego New tona mamy: k . kÔ v 7 k^1 x 7 stąd zgodnie z równaniem ( 5 .37 ), ->i kv^1 \ / y - / - 1/ 2 \ (—4z)n = V Tl TLÔ V 7J n + 1 y / 2r t \ z" TLÔ lXn 7J u + 1 Całkowita liczba sposobów nawiasowania Cn wynosi więc ( ^ ) . Dowcip autorów. •d«Mi Tak więc splotowa rekurencją doprowadziła nas do często występującego splotu. Odgadliśmy ten wynik w rozdziale 5, gdy wprowadziliśmy ciąg lic zb C a ta la n a ( 1 , 1 , 2 , 5 , 1 4 , . . . ) = (Cn ). Ten ciąg pojawia się w dziesiątkach pro blemów, które w ydają się ze sobą zupełnie nie związane [48]. Wiele sytu acji m a bowiem strukturę rekurencyjną odpowiadającą równaniu rekurencyjnemu ( 7 .66 ). Rozważmy na przykład następujący problem: Ile jest ciągów (cii,<12 , • • • >0-2n ) o elementach +1 i —1 mających własność ai + a 2 H-------b a 2n = O takich, że wszystkie sumy częściowe &1 , 0-1 + 0-2 > • • • > di + 0-2 H------- b 02n są nieujemne? Musi być n wystąpień +1 i n wystąpień —1. Możemy przed stawić ten problem graficznie rysując ciąg sum częściowych sn = J 2 k=i jako funkcję zmiennej n: Pięć rozwiązań dla n = 3 wygląda następująco: Są to „pasma górskie” szerokości 2n, które mogą być narysowane odcin kami postaci / i \ . Okazuje się, że jest dokładnie Cn sposobów na zrobie nie tego i te ciągi są związane z problemem nawiasowania w następujący sposób: Dodajm y dodatkową parę nawiasów wokół całego wyrażenia, tak że uzyskujemy dokładnie u nawiasów odpowiadających n mnożeniom. Za stąpm y teraz każde *•’ przez +1 i każde *)’ przez —1 i usuńm y wszystko poza tym. Na przykład wyrażenie xo • ((xi *X2 ) • (x 3 -X4 )) odpowiada ciągowi (+1, +1, —1, +1, +1, —1, —1, —1) zgodnie z naszą konwencją. Pięć sposobów nawiasowania xq • xi • X2 • x 3 odpowiada pięciu pasmom górskim dla n = 3 pokazanym powyżej. Co więcej, drobne przeformułowanie naszego problemu prowadzi do za skakująco prostego kombinatorycznego rozwiązania, które unika funkcji two rzących: Ile jest ciągów (ao, a i , a 2 , . . . , a.2n) o elementach +1 i —1 takich, że ao + ai + a 2 + • • • + &2n — 1 > gdzie wszystkie sumy częściowe in s fl-O) i*:*?**?! cio + a i , ao + ai + a 2, ..., ao + a-j + • • • + a 2n są d o d a t n i e ? Oczywiście są to dokładnie ciągi z poprzedniego problemu, z dodatkowym elementem ao = +1 na początku. Ale ciągi w tym proble mie mogą być wyliczone przy użyciu prostego argumentu ilościowego za po mocą pięknego lematu podanego w 1959 r. przez George’a Raneya [303]: J e ś li (x1,x2,...,xm ) j e s t d o w o l n y m c ią g ie m c a ł k o w i t o l i c z b o w y m , k t ó r e g o s u m a w y n o s i +1, t o d o k ł a d n i e j e d n o je g o c y k l i c z n e p r z e s u n ię c ie ), (x2>..., )) •••> (^m >X ] ,...,Xm — 1) m a w s z y s t k ie s u m y c z ę ś c io w e d o d a t n i e . Rozważmy na przykład ciąg (3,-5, 2,— 2,3,0). Ma on przesunięcia cykliczne {3,-5,2,-2,3,0} (-5,2,-2,3,0,3) (2,-2,3,0,3,-5} (-2,3,0,3,-5,2} (3,0,3,-5,2,-2) y (0,3,-5,2,-2,3) i tylko zaznaczony ciąg ma wszystkie sumy częściowe dodatnie. Lemat Raneya można udowodnić za pomocą prostego argumentu geome trycznego. Rozszerzmy zadany ciąg okresowo, uzyskując ciąg nieskończony (X!,X2,..., >X ] >X 2,•••jXm ,%-j ,X2,...)J dokonaliśmy więc podstawienia xm+ic= x^ dla wszystkich k ^ 0. Jeśli nary sujemy teraz sumy częściowe s n = x i H--- h xn jako funkcję zmiennej n, to wykres dla ma „średni wzrost” 1/m, ponieważ sm+rL = sn + 1. Na przy kład wykres odpowiadający naszemu ciągowi (3,— 5,2, — 2,3,0,3, — 5,2,...) zaczyna się następująco: Cały wykres zawiera się pomiędzy prostymi o nachyleniu 1/m, tak jak widać na rysunku; wzięliśmy dla ilustracji m = 6. W ogólności, te proste ograni czające wykres dotykają go tylko jeden raz w każdym z cykli złożonym z Och, gdyby akcje na giełdzie zawsze szły tak w górę. tw orzące (Uwaga informatycy: Sumy częściowe reprezentują w tym zadaniu rozmiar stosu jako funkcji czasu, gdy obliczany jest iloczyn n + 1 czynników, ponieważ każda operacja „push” (wstawienia) zmienia rozmiar stosu o + 1 , a każde mnożenie zmienia go o —1 .J m punktów, ponieważ proste o nachyleniu 1/ m mogą mieć całkowite współ rzędne co najwyżej raz na m jednostek. Ten jedyny dolny punkt wspólny w cyklu jest zarazem jedynym miejscem, od którego wszystkie sumy czę ściowe będą dodatnie, ponieważ najbliższy punkt wspólny znajduje się o m jednostek na prawo. Mając lemat Raneya możemy łatwo policzyć liczbę ciągów ( a o , . . . , a 2U) 0 elementach +1 i —1 , których wszystkie sumy częściowe są dodatnie i których całkowita suma wynosi +1. Istnieje (2r^ł’1) ciągów z n elementami —1 i n + 1 elementami +1, tak więc lemat Raneya mówi nam, że dokładnie 1/( 2 n + 1) część spośród wszystkich tych ciągów m a dodatnie wszystkie sumy częściowe. (Wypisz wszystkie N = takie ciągi i wszystkie 2 n + 1 ich przesunięć cyklicznych w tabeli N x (2n + 1). Każdy wiersz zawiera dokładnie jedno rozwiązanie. Każde rozwiązanie występuje dokładnie raz w każdej kolumnie. Tak więc istnieje N / ( 2 n + 1) różnych rozwiązań w tabeli, każde powtarzające się ( 2 n + 1) razy.) Całkowita liczba ciągów z dodatnim i sumami częściowymi wynosi więc /2n + 1 \ _ l _ v n ) 2 n +1 /2 n \_ !_ = Vn/n+1 P r z y k ła d 5: R e k u re n c ją z m -k ro tn y m s p lo te m Uogólnijmy właśnie rozważany problem, przyglądając się ciągom (ao, a-|, . . . , Gran) o elementach +1 i (1 —m ), których wszystkie sumy częściowe są dodat nie i które sum ują się do +1. Będziemy nazywali takie ciągi m - t y m i c ią g a m i R a n e ya . Jeśli mamy k wystąpień (1 — m) i m n + 1 — k wystąpień +1, to zachodzi k (1 - m ) + (m n + l - k ) = 1 (Uwaga informatycy: Interpretowany teraz stos jest używany do operacji o m argumentach, w odróżnieniu od dwuargumentowego mnożenia rozważanego wcześniej.) 1 stąd k = n . Mamy (miJL+1) ciągów o n elementach (1 — m ) i m n + 1 —n wystąpieniach +1, tak więc lemat Raneya mówi nam, że całkowita liczba takich ciągów o dodatnich wszystkich sumach częściowych wynosi dokładnie (mr ) ^ (t )<^w (i*. Jest to więc liczba m -tych ciągów Raneya. Nazwijmy ją liczbą Fussa-C atalana C ^ , na cześć N. I. Fussa [135], który (na wiele lat przed Catalanem ) w 1791 r. badał ciąg ( C ^ ) . Zwykłe liczby C atalana wynoszą Cn = C ^ \ Teraz, ponieważ znamy już odpowiedź, pójdźm y na całość i spróbuj my odpowiedzieć na pytania, które prowadzą do tego wyniku. W przypadku m = 2 pytaniem było: „Jakie liczby spełniają równanie rekurencyjne Cn = Y_\c CicC^-i _ k + [n = 0]?” Będziemy próbowali znaleźć podobne pytanie (po dobne równanie rekurencyjne) w ogólnym przypadku. Trywialny ciąg (+1) długości 1 jest oczywiście m -tym ciągiem Raneya. Jeśli wstawimy liczbę (1 — m ) na końcu dowolnego ciągu m-elementowego, który jest m -tym ciągiem Raneya, to otrzym amy m -ty ciąg Raneya; sumy częściowe pozostają dodatnie, rosnąc do +2, potem +3, . . . , + m i +1. I na odwrót, możemy pokazać, że jeśli n > 0, to wszystkie m -te ciągi Raneya ( a o , . . . , a -mn) pow stają tylko w taki sposób, że ostatnim składnikiem a mn musi być (1 — m ). Sumy częściowe s, = ao + • • • + aj_i są dodatnie dla wszystkich 1 ^ j ^ m n , tak więc smTL = m , ponieważ smn + a mn = 1. Niech ki będzie największym indeksem ^ m n takim , że siCl = 1 ; niech k 2 będzie największym indeksem takim , że s k2 = 2; i tak dalej. Tak więc sk. = j i sic > h dla kj < k ^ m n i 1 ^ ^ m. Stąd wynika, że km = m n i mo żemy sprawdzić bez żadnych kłopotów, że każdy z ciągów ( a o , . . . , a kl _i), (a k l , . . . , a k2_i), . . . , ( akm_ 1, . . . , a km_ i) jest m -tym ciągiem Raneya. Mu simy więc mieć ki = m u i + 1 , k2— = m n 2 + 1 , . . . , k m—k m_-| = m n m+ l , dla pewnych nieujemnych liczb całkowitych n i , n 2, . . . , n m . Dlatego (mT^+1) mn+i j es^ odpowiedzią na następujące dwa ciekawe pyta nia: „Czemu są równe liczby zdefiniowane przez równanie rekurencyjne + [n = 0] (7.68) dla wszystkich całkowitych n ? ” i „Jeśli G(z) jest szeregiem potęgowym speł niającym G(z) = z G ( z) m + 1 ( 7 -69 ) to jaka jest wartość [zn ] G(z)?” Zauważmy, że nie są to wcale łatwe pytania. Przy zwykłych liczbach Catalana (m = 2) rozwiązaliśmy ( 7 .69 ) dla G(z) i jego współczynników ko rzystając z równań kwadratowych i wzoru dwumianowego Newtona, ale gdy m = 3, żadna ze standardowych m etod nie da podpowiedzi, jak rozwiązać równanie trzeciego stopnia G = zG3 + 1. Wyszło na to, że łatwiej jest odpo wiedzieć na pytanie, zanim się je zada. Teraz jednakże wiemy już wystarczająco dużo, żeby zadać nawet tru dniejsze pytania oraz wywnioskować odpowiedzi na nie. Co jest na przykład z pytaniem: „Jakie jest [:z a] G(z)1, jeśli l jest dodatnią liczbą całkowitą i G(z) jest szeregiem potęgowym zdefiniowanym przez ( 7 .69 )?” Argument użyty poprzednio wystarcza teraz do pokazania, że [zn]G(z)1 jest liczbą ciągów długości m n + l spełniających następującą własność: • • • Każdy element ciągu jest albo +1 albo (1 —m ). Wszystkie sumy częściowe są dodatnie. Całkowita suma wynosi l. Składając razem ze sobą l m -tych ciągów Ra neya otrzymujemy wszystkie takie ciągi w jednoznaczny sposób. Liczba sposobów, na które możemy to zrobić, wynosi C ^ C ^ .-.C ^ = k n ]G( z)1 . tli + tl2H --- Mxi=n Raney udowodnił uogólnienie swojego lem atu, które mówi, jak można zliczać takie ciągi: Jeśli (x-\ } x 2y • • • >*m) je s t d o w o ln y m ciągiem lic z b c a łk o w ity c h z Xj ^ 1 d la w szys tkich ) i s p e łn ia ją c y c h x i + x 2 H-------b x m = l > 0 , to is tn ie je d o k ła d n ie l p rze sun ięć c yk lic z n y c h ' (xi,x2)..., Xi), ..., (xm> ^m —1) m a ją c y c h w szystkie s u m y częściowe d o d a tn ie . Możemy sprawdzić ten lemat na przykładzie ciągu (—2,1, —1,0,1,1, —1, 1,1,1). Przesunięciami cyklicznymi są (-2,1 ,- 1,0 ,1 ,1, -1 ,1, 1,1 ) <1,-1,1,1,1,-2,1,-1,0,1) (1,-1 ,0 ,1, 1,- 1, 1,1 ,1 ,-2 ) ( -1 .1 .1 .1, -2 ,1, -1 ,0, 1,1 ) (-1,0, 1 ,1 ,- 1, 1, 1 ,1 ,- 2 ,1 ) (1,1, 1, -2 ,1 ,-1 ,0 ,1 ,1 ,-1 ) V (0,1,1,-1,1,1,1, - 2 , 1 , - 1 ) ( 1, 1 ,- 2,1 ,- 1,0 ,1 ,1, -1 ,1) (1,1,- 1 ,1 ,1 ,1 ,- 2 ,1 ,- 1 ,0 ) V ( 1 ,- 2, 1,- 1, 0,1 ,1 ,-1 ,1 ,1) i tylko dwa przykłady zaznaczone V ’ m ają dodatnie wszystkie sumy częścio we. Ten uogólniony lemat udowodnimy w ćwiczeniu 13. Ciąg o elementach +1 i (1 — m) długości m n + 1 i o sumie całkowitej l musi mieć dokładnie n wystąpień (1 —m ). Uogólniony lemat Raneya mówi nam, że l / ( m n + l ) spośród tych (mit!L+l) ciągów m a dodatnie wszystkie sumy częściowe. Tak więc nasze trudne pytanie m a zaskakująco prostą odpowiedź: [zn ] G (Z)1 = ( m n + 1 ) - ± — , \ n / mn + l (7.70) dla wszystkich całkowitych l > 0 . Czytelnik, który nie zapom niał jeszcze rozdziału 5, może się spytać: „To wyrażenie wydaje się znajome. Czy nie widzieliśmy go już wcześniej?” Rze czywiście, widzieliśmy, wzór Lam berta ( 5 .60 ) mówi, że f c - u y .r - ; t n + '' n J tn + r Dlatego funkcja tworząca G(z) w ( 7 .69 ) musi być uogólnionym szeregiem dwumianowym (Bm (z). Wzór ( 5 .59 ) daje = Z, co jest równoważne !Bm (z) - 1 = z £ m (z )m . Powróćmy do oznaczeń z rozdziału 5, wiedząc teraz, że zajmujemy się uogólnionymi dwumianami. Podaliśmy w rozdziale 5 cały zestaw tożsamości bez dowodu. W ypełniliśmy teraz tam tą lukę dowodząc, że szereg wykładniczy !Bt (z) zdefiniowany wzorem ®t(z) = y - / t n + 1\ zn \ n / t n + 1 TL 7 2- m a istotną własność: 't n + r \ r z 11 r gdy t i r są dodatnie oraz całkowite. Czy możemy rozszerzyć ten wynik do d o w o ln y c h wartości t i r? Tak, ponieważ współczynniki (tT1^~r) tnr+r są wielomianami względem t i r . r-ta potęga zdefiniowana wzorem 3 t (z)r = er l n S , (z» = Y ^Tl n ^ (z)^ = Y_^ Y ^ -n ^ nÔ nÔ " ^v -t-r* m ^11 n "■> A TTL X TL ^ m a współczynniki, które są wielomianami zmiennych t i r, i te współczynniki są równe (tT^ T) tnrf T: dla nieskończenie wielu wartości t i r. Tak więc te dwa ciągi wielomianów muszą być identycznościowo równe sobie. Rozdział 5 wspomina także o uogólnionych szeregach potęgowych c (-} V = (t n + 1 ) n _ l 2_ — rtÔ ^ — n Z ’ które, jak to wyraża wzór (5 .60 ), m ają równie interesującą własność: fcn]£ t l z ) T = r ( t n + r )n_1 (7-71) rt! Tożsamość ta może być traktow ana jako graniczny przypadek wzorów dla 23t (z), ponieważ nie jest trudno pokazać, że £ t {z)r = lim $ x t(z/x ): x —>00 7.6. W yk ład n icze funkcje tw orzące_____________ Czasem ciąg (gn ) m a funkcję tworzącą, której własności są dość skompliko wane, podczas gdy pokrewny ciąg (gn /Tt!) m a funkcję tworzącą, która jest dość prosta. W takich przypadkach wolelibyśmy w naturalny sposób praco wać z (gn /n !) i pomnożyć wszystko na samym końcu przez n!. Ta sztuczka działa na tyle często, że mamy dla niej specjalną nazwę. Szereg potęgowy G(z) = Y . 9' n! (7-72) nazywamy w y k ła d n ic z ą fu n k c ją tw o rz ą c ą lub „wft” ciągu (go>9 i , g 2 >.--)Nazwa ta wywodzi się z faktu, że funkcja wykładnicza ez jest wykładniczą funkcją tworzącą ciągu ( 1 , 1 , . . . ) . Wiele z funkcji tworzących w tabeli 390 jest tak naprawdę wft. Na przy kład wzór ( 7 .50 ) mówi, że ciąg ([£], , [ ^ ] , . . . ) m a wykładniczą funkcję tworzącą (ln y ^ ) m/rri!. Zwykła funkcja tworząca dla tego ciągu jest znacznie bardziej skomplikowana (i jest rozbieżna). W ykładnicze funkcje tworzące m ają swoje własne operacje, analogiczne do operacji, które poznaliśmy w rozdziale 7.2. Na przykład jeśli mnożymy wft dla (gn ) przez z, to otrzymujemy ,ti+1 Z* n >0 Czy już się dobrze bawimy? u! y gn—1 ( n - 1 )! co jest wft dla (0 , g 0 , 2 g i , . . . ) = (n g n _-|). Po zróżniczkowaniu wft dla (go,gi»g 2 »-*-) względem z otrzymujemy rn —1 n>0 rn — 1 n ^1 ( n - 1 )! t = nÔ Z 9n+1 Z, uf (7-73) jest to wft dla ( g i , g 2 >• • • )• Tak więc różniczkowanie wft odpowiada operacji lewego przesunięcia (G(z) — go)/ z dla zwykłej ft. (Użyliśmy już tej własno ści lewego przesunięcia wft, kiedy analizowaliśmy szeregi hipergeometryczne, ( 5 . 106 ).) Całkowanie wft daje Pz 0Z tn JU n >0 9^ zn dt = nÔ v TTH ; = n^l (7.74) jest to prawe przesunięcie, wft dla (0 , go, g i , . . . ) . Najciekawszą operacją dla wft, tak jak dla zwykłych ft, jest mnożenie. Jeśli F(z) i G(z) są wft dla (fn ) i (gn ), to F(z)G(z) = H(z) jest wft dla ciągu (Hn ) nazywanego d w u m ia n o w y m s p lo te m dla (fn ) i (gn ) ‘ g^-ic - K. = k ^ ( 7 -75 ) ' Pojaw iają się tu ta j współczynniki dwumianowe, ponieważ (£) = n l / k l (n — Tc)! i dlatego V" fk gn—k k! (rt —k)! -Z n! k=0 v J Innymi słowy, (hn /ri!) jest zwykłym splotem dla (fu /n !) i (gn /rt!). Sploty dwumianowe m ają wiele zastosowań. Na przykład zdefiniowaliśmy liczby Bernoulliego w ( 6 .79 ) za pom ocą ukrytej rekurencji m /m + 1\ Y_[ • j=o ' 5 )Bj = [m = 0 ] , dla wszystkich m ^ 0 . ' Można to zapisać jako splot dwumianowy, jeśli podstawim y n za m + 1 i dodam y składnik Bn do obydwu stron: Y f ^ J Bic = Bn + [n = 1], k ^ ' dla wszystkich rt ^ 0. ( 7 .76 ) Możemy tę rekurencję powiązać z szeregami wykładniczymi (jak obiecali śmy w rozdziale 6 ) biorąc wft dla liczb Bernoulliego, B(z) = Y .n ^ o Bn ^n/n !. Lewa strona ( 7 .76 ) jest splotem dwumianowym dla (Bn ) ze stałym ciągiem ( 1 , 1 , 1 , . . . ) . Zatem wft po lewej stronie wynosi B(z)ez. W ft po prawej stro nie jest równa H n ^ 0 O^n. + [n = 1])zrL/n ! = B(z) + z. Dlatego musimy mieć B(z) = z /( e z — 1 ), co dowodzi wzoru ( 6 .81 ), który znalazł się również w tabeli 390 jako wzór ( 7 .44 ). Spójrzmy teraz jeszcze raz na sumę, która była już wiele razy analizowana w tej książce, Sm(n) = 0m + 1m + 2m + --- + ( n - 1 ) m = £ lc i^m O^kcn Tym razem będziemy próbowali przeanalizować ten problem za pom ocą funk cji tworzących m ając nadzieję, że będzie to prostsze. Niech rt będzie ustalone i m będzie zmienną. Tak więc naszym celem jest znalezienie współczynników w szeregu potęgowym S(z) = S0 (n) + Si (n) z + S2 (rt) z 2 H--------- Sm ( n ) z m . rrtÔ Wiemy, że 1 = 1 —kz Y _ k m zm mÔ jest funkcją tworzącą dla ( 1 , k, k2, . . . ) i dlatego S(z) = £ £ k -z - = y . r^ T z mÔ O^kcrt 0^k<n przez zamianę kolejności sumowania. Możemy przedstawić tę sumę w postaci zwartej s(z) = i(z=^ 0 + : z:-1 — 1r + "'+ z -1 —n + 1 rTl— ^ ( H z-i H z- i _ n ) , ( 7 -7 7 ) ale nie wiemy, jak rozwinąć taką postać zw artą w potęgi z. Z pomocą przychodzą nam teraz wykładnicze funkcje tworzące. W ft dla naszego ciągu (S 0 (n ), Si (u ), S2 (rt), . . . ) jest ry S(z,n) = S0(n) +Si (n ) — + S2(n) — + ••• = ^ m /yTTL Sm(n) — . raÔ Aby otrzymać współczynniki Sm (n) możemy wziąć wft dla (1, k , k 2, . . . ) , to znaczy m ekz = vn>0 m! i mamy Ponieważ ta suma jest szeregiem geometrycznym, otrzymujemy postać zw artą enz — 1 (7-78) Eureka! Wszystko, co musimy teraz zrobić, to znaleźć współczynniki dla tej relatywnie prostej funkcji i będziemy już znali Sm (n), ponieważ Sm (rt) = m ![zm]S (z,u). T utaj właśnie pojaw iają się liczby Bernoulliego. Zauważyliśmy przed chwilą, że kÔ jest wft dla liczb Bernoulliego. Możemy więc zapisać enz — 1 S (z,n ) = B (z )---------- Suma Sm (rt) jest równa m! razy współczynnik przy zm w tym iloczynie. Na przykład, So(n) = 0 ! ( BoTT3T) Wyprowadziliśmy więc już po raz n -ty wzór □ u = S2 (tl) = -|n (n — \ ) { n — 1) i było to wyprowadzenie ze wszystkich najprostsze: W kilku wierszach przeanalizowaliśmy ogólne zachowanie się Sm (n) dla wszystkich m. Ogólny wzór można więc zapisać w postaci (7-79) gdzie Bm(x) jest wielomianem Bernoulliego zdefiniowanym wzorem Bm(x) = H ( ? ) B k X m- k . ( 7 .80 ) A oto dlaczego: Wielomian Bernoulliego jest dwumianowym splotem ciągu (B0, Bi ,B2, . . . ) z (1 , x , x 2, . . . ) ; dlatego wykładnicza funkcja tworząca dla (Bq(x),Bi (x),B 2 (x), . . . ) jest iloczynem ich wft, ^ __ B (z,x) = Y_ rm 7 __ L mÔ rm 7Pxz xm ^ [ = mÔ •( 7 .81 ) Wzór ( 7 .79 ) wynika stąd, że wft dla (0, So(n),2Si (rt),. . . ) wynosi, na mocy ( 7 -78 ), z enz — 1 ^ ~— =- = B(z,n) —B(z, 0). ez — 1 Przejdźmy teraz do innego problemu, dla którego wft są jak gdyby stwo rzone: Ile jest możliwych drzew rozpinających w grafie pełnym o rt wierzchoł kach {1,2,... ,rt}? Oznaczmy tę liczbę przez t n . Graf pełny m a j n ( n — 1) krawędzi, po jednej łączącej każdą parę różnych wierzchołków. Tak więc tak naprawdę to szukamy, na ile sposobów można połączyć rt danych punktów rysując pomiędzy nimi rt — 1 połączeń. Mamy ti = t 2 = 1. Z kolei t 3= 3,ponieważ graf pełny otrzech wierz chołkach jest wachlarzem rzędu 2iwiemy że f 2 = 3 . Mamy też szesnaście drzew rozpinających dla rt = 4: k x MU s n / i n KX CZ n m n j U (,s„ Stąd t 4 = 16. Nasze doświadczenie z analogicznym problemem dla wachlarzy sugeruje, że najlepszym sposobem na zaatakowanie tego problemu jest wyodrębnienienie jednego wierzchołka i rozważenie bloków lub składowych pozostałych w drzewie rozpinającym po usunięciu wszystkich krawędzi sąsiadujących z wybranym wierzchołkiem. Jeśli pozostałe wierzchołki tworzą rrt składowych o rozmiarach k i, k2, . . . , km , to możemy je połączyć z wybranym wierz chołkiem na ki k 2 . . . k m sposobów. Na przykład dla n — 4 możemy wybrać lewy dolny wierzchołek na rysunku ( 7 .82 ) . Wówczas w górnym rzędzie w (7 .82 ) mamy 3t3 przypadków, w których pozostałe trzy wierzchołki połą czone są pomiędzy sobą na t 3 sposobów, następnie połączone są z lewym dolnym wierzchołkiem na 3 sposoby. Dolny rząd pokazuje 2 • 1 x t2ti x Q rozwiązań, w których pozostałe wierzchołki zawierają się w składowych roz miarów 2 i 1 na Q sposobów. Jest tam także przypadek [ / , gdy pozostałe trzy wierzchołki nie są zupełnie połączone ze sobą. To rozumowanie prowadzi nas do równania rekurencyjnego tix = ^ m>0 rnJ ^ (ki k? ’ ki H-----t-km=ri—1 ^ U k ) klkl ‘' ,kmtkl tk2 **,tk™ 2»*“ > m / dla wszystkich rt > 1. A oto dlaczego: Istnieje (ki k^ _1 k ) sposobów na przy pisanie n —1 elementów do ciągu m składowych o rozmiarach odpowiednio k i, k2, ..., km. Jest tkl tic2 ... ticm sposobów na połączenie wszystkich tych składowych w drzewo rozpinające. Dzielimy tę wartość przez m!, ponieważ nie interesuje nas porządek składowych. Na przykład dla rt = 4, rekurencją ta daje nam t 4 = 3t3 + ^((^ 2)2tit 2 + (2 j)2 t 2 ti) + ^ ( ( 1j = 3t3 + 6 t2ti + . Uzyskana rekurencją dla wygląda na pierwszy rzut oka strasznie. Ale nie jest tak źle, trzeba to tylko rozplątać. Możemy zdefiniować U-n — Tl t n i wszystko się upraszcza: Un 1 V " U k i U k 2 w Z kTTl^r*" m > 0 k 1+ k 2 H hkm = n —1 u k m ,, - dlan> 1- , o \ (7-83) Suma wewnętrzna jest współczynnikiem przy zn_1 w wft U(z), podniesionym do m-tej potęgi; także dla rt = 1 otrzymujemy poprawne wyrażenie, jeśli dodamy składnik U(z)°, który odpowiada przypadkowi m = 0. Tak więc ^ = n rt!I ru ~ M z ) y JLu (z) m = [z11-1] e11^* = [z-ize ^— L—mÔ m! m I dla wszystkich rt > 0 i otrzymujemy równanie U(z) = z e Q(z). (7-84) Spójrzmy jaki postęp! Równanie ( 7 .84 ) wygląda prawie jak £(z) = ez£{z), które definiuje uogólniony szereg potęgowy £(z) = £1 (z) we wzorach ( 5 .59 ) i ( 7 .71 ). Istotnie, mamy bowiem U(z) = z 8 (z ) . Tak więc otrzymujemy odpowiedź: ta = ^ = ^ [ z n]U(z) = ( n - 1)![z— ' ]£ (z) = n n ~2 . ( 7 .85 ) Graf pełny o {1,2,... ,n} wierzchołkach m a dokładnie rt 11-2 drzew rozpina jących, dla wszystkich n > 0 . 7.7. Funkcje tw orzące D irichleta_______________ Istnieje wiele innych możliwych sposobów na tworzenie ciągów z szeregów. Można użyć dowolnego systemu funkcji Kn (z) takiego, że gn Kn (z) = 0 =^> g-n = 0 dla wszystkich n . n Zwykłe funkcje tworzące używają Kn (z) = zu , a wykładnicze funkcje two rzące korzystają z Kn (z) = zn/ n \ . Możemy również próbować potęg ubywa jących z—, lub współczynników dwumianowych z—/ n \ = (*). Najpoważniejszą kontrkandydaturą dla ft i wft jest użycie funkcji 1/ n z . Jest ona użyteczna dla ciągów ( g i , g 2, . . . ) , które zaczynają się od u = 1, a nie od n = 0 : G(z) = £ g . n^l ( 7 .86 ) Są to fu n k c je tw o rz ą c e D ir ic h le t a (ftd), nazwane tak, gdyż intensywnie zaj mował się nimi niemiecki m atem atyk Gustav Lejeune Dirichlet (1805-1859). Na przykład funkcją tworzącą Dirichleta dla ciągu stałego ( 1 , 1 , 1 , . . . ) jest Jest to f u n k c ja z e ta Riemanna, którą nazywaliśmy również uogólnioną liczbą harmoniczną dla z > 1 . Iloczyn funkcji tworzących Dirichleta odpowiada specjalnemu rodzajowi splotu: F(z)G(z) = Z Z l,m ^1 ru^l fi g m [ l - m = n ] . l,m ^1 Tak więc F(z)G(z) = H(z) jest ftd dla ciągu hn f d 9n /d • — ^ ( 7 *^8 ) d\rt Na przykład wiemy z (4 .55 ), że J l d \ n hW) = [ t l = 1]. Jest to splot Diri chleta dla ciągu Mobiusa (|x(l), |x(2), |x(3),. . . ) z ( 1 , 1 , 1 , . . . ) , tak więc M (z)£(z) = Y _ ^ n ^ = 1. ( 7 -89 ) Innymi słowy, C(z) -1 jest ftd dla <^(1), (i(2), |x(3),. . . ) . Funkcje tworzące Dirichleta są bardzo użyteczne, gdy ciąg ( g i , 9 2 , • ■ - ) jest fu n k c ją m u lt ip lik a t y w n ą , to znaczy gdy 9 ran = 9 m 9 ri d l a TU J_ Tl. W takich przypadkach wartości g n dla wszystkich n są wyznaczone przez wartości gn dla n będących potęgą liczby pierwszej i możemy rozłożyć ftd na następujący iloczyn indeksowany liczbami pierwszymi: n 0 + liczby pierwsze p ' S + S + S + 7 < ™ ° > Jeśli, na przykład, podstawim y g ^ = 1 dla wszystkich n , to otrzymamy iloczynową reprezentację funkcji zeta Riemanna: ^ = n (r=W)• liczby pierwsze p (r‘9i) Funkcja Mobiusa m a fx(p) = —1 i fx(pk) = 0 dla k > 1, tak więc jej ftd jest równa M(z) = fi ( 1 - P ~ Z), (7-92) liczby pierwsze p mmmmmmmmmmmmmmmmmmmmrnmmmkmmmmmmmm co się oczywiście zgadza z ( 7 .89 ) i ( 7 .91 ). Funkcja cp Eulera m a (p(pk) = p k —p k_1, tak więc jej ftd m a postać *<4- n 0 ^ ) liczby pierwsze p x 7 n liczby pierwsze p Wnioskujemy stąd, że O (z) = C(z —1)/£(z). Ć w iczenia R ozgrzew ka 1 . Ekscentryczny kolekcjoner domina rozmiaru 2 x n płaci 4 dolary za każdy pionowy kamień domina i 1 dolara za każdy kamień poziomy. Na ile sposobów można ułożyć domino, żeby dostać dokładnie m dolarów? Na przykład dla m = 6 są trzy rozwiązania: E , ED i F F P . 2 . Podaj w postaci zwartej funkcję tworzącą oraz wykładniczą funkcję two rzącą dla ciągu ( 2 , 5 ,1 3, 3 5, . .. ) = (2n + 3n ). 3. Ile wynosi Hn /1 0 n ? 4. Ogólne twierdzenie o rozwijaniu funkcji wymiernych P(z)/Q(z) nie jest zupełnie ogólne, ponieważ zakłada ono, że stopień P jest mniejszy niż stopień Q. Co się stanie, jeśli P m a stopień większy? 5. Znajdź funkcję tworzącą S(n) taką, że P o d sta w y 6 . Pokaż, że rekurencję ( 7 .32 ) można rozwiązać za pom ocą m etody reper tuaru, bez użycia funkcji tworzących. 7. Rozwiąż równanie rekurencyjne 9o = 1 ; 9 n = g n -i + 2 g n - 2 + • • • + n g 0 , dla rt > 0 . 8 . Ile wynosi [zn] (ln(1 —z ))2/(1 —z)m+1? 9. Policz sumę Y_k=o HkHn _ k. W tym celu wykorzystaj wynik z poprzed niego ćwiczenia. 10. Dla r = s = - 1 / 2 w tożsamości ( 7 .62 ) usuń wszystkie wystąpienia 1/2 , używając chwytu w rodzaju wzoru ( 5 .36 ). Jaką zaskakującą tożsamość możesz wywnioskować ? 1 1 . Ten problem, którego trzy części są rozłączne, da nam doświadczenie w manipulowaniu funkcjami tworzącymi. Zakładamy, że A(z) == Y n a nZn , B(z) — Y -n C(z) = ]Tn cu zn i że dla ujemnych rt współczynniki są zerowe. a) W yraź C jako funkcję A i B, gdy cn = H j+ 2k<ę;n a ?'b k * b) W yraź A jako funkcję B, gdy n b n = 2ka k/ ( n - Tc)!. c) W yraź A jako funkcję B, gdy a n = X k=o (r£ k)t>n-k a r jest liczbą rzeczywistą. Zastosuj otrzym any wzór do znalezienia współczynników f k (r) takich, że b n = Y k = o f kM a n -k* 1 2 . Na ile sposobów można umieścić liczby {1, 2,. .. ,2n} w tabeli 2 x n , tak żeby wiersze i kolumny były w porządku rosnącym od lewej do prawej i z góry do dołu ? Na przykład jednym z takich ułożeń dla n = 5 jest /I 2 4 5 7 9 6 8 \ lOy 13. Udowodnij uogólniony lemat Raneya, który jest podany tuż przed ( 7 .70 ). 14. Rozwiąż rekurencję 9o = 0 , gi = 1 , dla rt > 1 , za pom ocą wykładniczych funkcji tworzących. 15. L ic z b a B e l l a © n oznacza liczbę sposobów podziału zbioru n przedmio tów na podzbiory. Na przykład CD3 = 5 , ponieważ możemy podzielić {1 , 2 ,3} następującym i sposobami: {1,2,3}; {1,2} U {3}; {1,3}U{2}; {1}U{2,3}; {1}U{2}U{3}. Udowodnij, że © n+i = H k (k) ® n - k i korzystając z tej rekurencji znajdź zw artą postać dla wykładniczej funkcji tworzącej P(z) = Y n Q n z TL/ n l . 16. Dwa ciągi (an ) i (bn ) są związane wyrażeniem splotowym bn ki + 2 k 2 H— n k n = n i ao = 0 oraz bo = 1. Udowodnij, że odpowiednie funkcje tworzące speł niają lnB (z) = A(z) + Â (z2) + Â (z3) H-----. 17. Pokaż, że wykładnicza funkcja tworząca G(z) dowolnego ciągu jest po wiązana ze zwykłą funkcją tworzącą G(z) za pom ocą równania J-OO G(zt)e- t d t = G(z), o jeśli tylko taka całka istnieje. 18. Znajdź funkcje tworzące Dirichleta dla ciągów a) g-a = y /ń ; b) gTl= l n n ; c) 9 n = [tu jest bezkwadratowe]. W yraź swoje rozwiązanie za pomocą funkcji zeta (bezkwadratowość jest zdefiniowana w ćwiczeniu 4.13.) 19. Każdy szereg potęgowy F(z) = z warunkiem początkowym f 0 = 1 , definiuje ciąg wielomianów f n (x) w następujący sposób: W = I f « ( x ) t ł , nÔ Jak należy rozumieć „w ogólności” ? Jeśli f i = f2 = • •• = fm—1 —0 , to stopień f n (x) wynosi co najwyżej |n/m j. przy czym f n (1) = f n i f n (0) = [ t l = 0]. W ogólności, f u (x) m a stopień rt. Pokaż, że takie wielomiany zawsze spełniają wzory splotowe n ^ fk M fn -k (y ) = fn (x + y ); k=0 n (x + v) Y k f k (x)fn _ k (ij) = x n f n (x + y ) . k=0 (Tożsamości w tabelach 232 i 304 są szczególnymi przypadkami tego chwytu.) 2 0 . Szereg potęgowy G(z) nazywany jest s k o ń c z e n ie ró ż n ic z k o w a ln y m , jeśli istnieje skończenie wiele wielomianów Po (z), . . . , Pm (z), nie wszystkich zerowych, takich że Po(z)G(z) + P 1(z)G'(z) + --- + Pm (2 ) G ' m>(z) = 0. Ciąg liczb (go, g i , g 2 , • • •) jest w ie lo m ia n o w o r e k u r e n c y jn y , jeśli istnieje skończenie wiele wielomianów V o { z ) , . . . , p m (z), nie wszystkich zerowych, takich, że P o( n) gn + p i ( n ) g n + i + • • • + p m ( n) g u+m = 0 dla wszystkich całkowitych n ^ 0. Udowodnij, że funkcja tworząca jest skończenie różniczkowalna wtedy i tylko wtedy, gdy jej ciąg współczyn ników jest wielomianowo rekurencyjny. Ć w ic z e n ia do m o w e 2 1 . Złodziej napadł na bank i zażądał 500 dolarów w dziesięcio- i dwudziestodolarówkach. Domagał się również liczby sposobów, na ile kasjer inoże dać mu pieniądze. Znajdź funkcję tworzącą G(z), dla której ta liczba jest równa [z500] G(z) i bardziej zw artą funkcję tworzącą G(z), dla której ta liczba jest równa [z50] G(z). Wyznacz żądaną liczbę sposobów stosując (a) ułam ki proste; (b) m etodę jak w ( 7 .39 ). 22. Niech P będzie sumą możliwych „triangulacji” wielokątów: p = —+ A + + ^ / + ^ + \/^ / + ^ + ^ + •••• (Pierwszy składnik reprezentuje zdegenerowany wielokąt zawierający tyl ko dwa wierzchołki; każdy następny składnik pokazuje wielokąt podzie lony na trójkąty. Na przykład pięciokąt może być striangulowany na pięć sposobów.) Zdefiniuj operację mnożenia AAB dla striangulowanych wie lokątów A i B tak, żeby zachodziło równanie P = _ + PAP. Zamień potem każdy trójkąt na ‘z ’. Co ci to mówi o liczbie sposobów dekompozycji n -k ąta na trójkąty? 23. Na ile sposobów można zbudować kolumnę rozmiaru 2 x 2 x n z cegieł rozmiaru 2 x 1 x 1? 24. Ile drzew rozpinających jest w n-gwieździe (graf z n „zewnętrznymi” wierzchołkami połączonymi w cykl, każdy połączony z n + 1 wierzchoł kiem centralnym), dla n ^ 3? 25. Niech m ^ 2 będzie całkowite. Znajdź zw artą postać funkcji tworzącej dla ciągu (n m od m ), jako funkcji zmiennych z i m. Użyj tej funkcji tworzącej do wyrażenia ‘n m od m ’ jako funkcji liczb zespolonych cu = e27rL//m. Na przykład dla m = 2 mamy cu = —1 i n m od 2 = \ — \ (—1 )n . 26. Liczby Fibonacciego drugiego rodzaju (ffn ) są zdefiniowane za pom ocą następujących równań rekurencyjnych: #0 = 0 ; = W yraź ^ f f n —1 "F = 1; 2 H- "Fn > d l a Tl > 1. jako funkcję normalnych liczb Fibonacciego Fn i Fn + i . Czy będzie on może chciał też rozwiązać zadanie pokrycia kamieniami domina? 27. Pokrycia prostokąta 2 x rt kamieniami domina mogą być również rozwa żane jako sposoby rysowania n rozłącznych odcinków w tabeli punktów 2 x rt: I “ “ ! Z 1 1 Jeśli nałożymy dwa takie wzorce, to otrzymamy zbiór cykli, ponieważ każdy punkt będzie końcem dwóch odcinków. Na przykład jeśli powyż sze odcinki nałożymy na odcinki to otrzym amy orrm ; □ . Taki sam zbiór cykli uzyskamy również przez nałożenie Możemy jednak otrzymać jednoznaczny sposób rekonstrukcji oryginal nych wzorców przez nadanie orientacji pionowym liniom, tak że strzałki idą na przem ian w górę — dół — górę — dół • • • w pierwszym wzorcu i na przemian w dół — górę — dół • • • w drugim. Na przykład ł z “ ł “ ił + h : i i i = ł c m “ q . Liczba takich zorientowanych cykli musi zatem wynosić T 2 = F2 +1 i po winniśmy także być w stanie dowieść tego algebraicznie. Znajdź wzór rekurencyjny dla Qn , rozwiąż go za pomócą funkcji tworzących i wy wnioskuj stąd algebraicznie, że = ^ +128. W spółczynniki A(z) w równaniu ( 7 .39 ) spełniają Ar + Ar+ i 0 + Ar+ 2o + At + 3o = 100 dla 0 ^ r < 10 . Znajdź „proste” wytłumaczenie tego faktu. 29. Czemu jest równa suma iloczynów liczb Fibonacciego Y_ Y. m >0 k i +łC2 H----- bkm = n ktfk 2ł...,k m>0 30. Jeśli funkcja tworząca G(z) = 1/(1 — az)(l — |3z) m a rozkład na ułam ki częściowe a / ( l —ocz) + b / ( l —|3z), to jaki jest rozkład na ułam ki częściowe dla G{ z ) n ? 31. Jaka funkcja g(n) dla naturalnego n spełnia rekurencję Y_g(d) cp(n/d) = 1 , d \n gdzie cp jest funkcją Eulera? 32. Ciągiem arytm etycznym nazywamy nieskończony ciąg liczb całkowitych taki, że {an + b} = {b, a + b , 2 a + b , 3 a + b , . . . } . Zbiór ciągów arytm etycznych { a i n + bi}, . . . , {amn + b m} nazywany jest d o k ła d n y m p o k r y c ie m , jeśli każda dodatnia liczba całkowita występuje dokładnie w jednym z nich. Na przykład trzy ciągi {2 n }, { 4 n + 1}, {4n+3} stanowią dokładne pokrycie. Pokaż, że jeśli { a in + b i }, . . . , {amrt + b m} jest dokładnym pokryciem takim , że 2 ^ ai ^ ^ a m , to a m_i = a m . W s k a z ó w k a : Zastosuj funkcje tworzące. Zadania egzam in acyjn e 33. Ile wynosi [wmzTL] (ln(1 + z))/(1 —wz)? 34. Znajdź zw artą postać dla funkcji tworzącej H n>0 Gn (z)wn , jeśli (tu taj m jest ustaloną dodatnią liczbą całkowitą). 35. Oblicz sumę H 0<ic<n Â ( n ~ k) na dwa sposoby: a) Rozwiń składniki w sumy częściowe. b) P otraktuj sumę jako splot i zastosuj funkcje tworzące. 36. Niech A(z) będzie funkcją tworzącą dla (a0, a i , CL2 , CI3 , . . . ) . W yraź sumę L n a [n/mjzn jako funkcję A, z i m. 37. Niech a n będzie liczbą sposobów zapisania dodatniej liczby całkowitej rt jako sumy potęg dwójki, niezależnie od porządku. Na przykład clą = 4, ponieważ 4 = 2 + 2 = 2 + 1 + 1 = 1 + 1 + 1 + 1 . Przyjmijmy, że ao = 1. Niech b n = Hk=o Qk b§ćlzie sumą częściową pierwszych a. a) Sporządź tabelę dla a i b aż do n = 10. Jaką zaskakującą własność zauważasz w swojej tabeli? (Jeszcze jej nie dowodź.) b) W yraź funkcję tworzącą dla a n przez iloczyn nieskończony. c) Zastosuj wzór z części (b) do udowodnienia wyniku z części (a). 38. Znajdź postać zw artą dla podwójnej funkcji tworzącej M (w ,z) = ^ m in(m , rt) w mzn . Uogólnij odpowiedź, aby uzyskać, dla ustalonego m ^ 2, zw artą postać dla mi n(ri i, . . . , n m ) z ^ 1. . . z ^ m . M { z u . . . yz m ) = ni 39. Dla danych dodatnich liczb całkowitych m i tl, znajdź zwarte postacie sum k ik 2 . . . k m 1^Tct <k 2<-"<km^TL i Y_ 1 kik2 . ..k m . ^k 2^*"^km^ n Na przykład dla m = 2 i rt = 3 sumy te są odpowiednio równe 1 - 2 + 1 x 3 + 2-3 oraz 1-1 + 1 - 2 + 1- 3 + 2- 2 + 2- 3 + 3-3. W s ka z ó w ka : Jakie są współczynniki przy zm w funkcjach tworzących (1 + a-| z ) . .. (1 + a n z) i 1/(1 - a ) z ) . .. (1 - a n z)? 40. W yraź H k - F k ) ( n - k ) j w zwartej postaci. 41. Perm utacja rosnąco-malejąca rzędu rt jest takim przyporządkowaniem liczb cli <120.3 . . . a n liczbom {1 , 2 , . . . ,n}, że są one uporządkowane na przemian rosnąco i malejąco: CLI < 02 > 03 < o 4 > • • • . Na przykład 35142 jest perm utacją rosnąco-malejącą rzędu 5. Niech An oznacza liczbę perm utacji rosnąco-malejących rzędu tl. Pokaż, że (1 + sin z)/cos z jest wykładniczą funkcją tworzącą dla (An ). 42. Stwierdzono, że m ateriał organiczny na Marsie m a DNA zbudowane z pięciu składników, oznaczonych symbolami ( a , b , c , d , e), w odróżnieniu od czterech składników ziemskiego DNA. Cztery pary cd, ce, ed i ee nigdy nie w ystępują obok siebie w ciągu marsjańskiego DNA, ale każdy ciąg nie zawierający tych par jest możliwy (tak więc ciąg b b cd o jest zakazany, ale b b d co jest w porządku). Ile jest marsjańskich ciągów DNA długości u ? Na przykład dla rt = 2 odpowiedzią jest 21, ponieważ jest 25 par i cztery są zabronione. 43. F u n k c ja tw o rz ą c a N e w to n a dla ciągu (gn ) definiowana jest jako Znajdź wyrażenie splotowe, które definiuje zależność między ciągami (fn ), (gn ) i (Hn ), których funkcje tworzące Newtona są powiązane toż samością F(z)G(z) = H(z). Spróbuj uprościć ten wzór i przedstaw go w możliwie symetrycznej postaci. 44. Niech qn będzie liczbą możliwych wyników, gdy porównuje się rt liczb {xi, . . . ,x Tt} pomiędzy sobą. Na przykład q 3 = 1 3 , ponieważ mamy na stępujące możliwości: xi< x2<x3; xi<x2=x3; xi < x 3 < x 2 ; —x 2 = x 3 ; x ! = x 3 < x 2 ; x2 < x i < x 3 ; x 2 < x ! = x 3 ; x 2 < x 3 < xi ; x2 = x 3 < x i ; x3 < x i < x 2 ; x3 < x i = x 2 ; x3 < x 2 < x ] . Znajdź zw artą postać dla wft Q(z) = Y n (an), ( b n ) i ( C n ) takie, że qn = ^ k n a k = X . { k } bk xi= x2<x3; Znajdź również ciągi ( k ) Ck> dla n > °- 45. Oblicz n > 0 [m -L'rL]/'iTi2n 2. 46. Znajdź zw artą postać dla l ( V k7) (v i f 0^k^n/2 v Wskazówka: z3 —z2 + ^ = (z + j)(z —| ) 2. 47. Pokaż, że liczby Un i Vn dla problemu pokrycia prostokąta 3 x n , tak jak to zostało podane w ( 7 .34 ), są blisko powiązane z ułamkami w drzewie Sterna-B rocota, które zbiegają do \/348. Pewien ciąg (gn ) spełnia rekurencję a g n + b gn + i + cg n+2 + d = 0 , całkowite n 0, dla pewnych liczb całkowitych (a, b, c, d) z największym wspólnym dziel nikiem a, b, c i d równym 1. Ma on również postać zw artą gn = |_oc(l + V l )n J , całkowite n ^ 0 , dla pewnej liczby rzeczywistej oc między 0 a 1. Znajdź a, b,c, d i a. 49. To jest zadanie o potęgach i parzystości. a) Rozważmy ciąg (ao, a i , a 2, . . . ) = (2 ,2 , 6 , . . . ) zdefiniowany wzorem an = 0 + V 2 )n + V - V 2 ) n . Znajdź proste równanie rekurencyjne definiujące ten ciąg. 7» Im nkcje b) Udowodnij, że |"(1 + y / l ) lx'\ = n (mod 2) dla wszystkich całkowitych n > 0. c) Znajdź liczbę oc postaci (p + y / ą ) / 2 , gdzie p i q są dodatnie i całko wite, tak że |_(xTLJ = n (mod 2 ) dla wszystkich całkowitych n > 0 . Z adania d odatkow e 50. Kontynuując ćwiczenie 22 , spójrzm y na sumę wszystkich sposobów de kompozycji wielokątów na wielokąty: + A Q = - + [j + + + K\7 + + Znajdź wzór symboliczny na Q i zastosuj go do znalezienia funkcji two rzącej na liczbę możliwych sposobów rysowania nie przecinających się przekątnych wewnątrz wypukłego n-kąta. (Podaj zw artą postać funkcji tworzącej jako funkcji zmiennej z; nie potrzeba tu taj znajdować zwartej postaci dla współczynników.) 51. Udowodnij, że iloczyn 1 /4 2 tan /2 n ((cos2 ^ t t ) d 2 + (cos2 J t t ) ° 2)/ -i<"m x 1^ j^m IsCksCn Czy jest to wskazówka, czy ostrzeżenie? jest funkcją tworzącą liczby podziałów prostokąta m x n kamieniami do mina. (Jest m n czynników i możemy sobie wyobrazić, że są one zapisane w m n polach prostokąta. Jeśli m n jest nieparzyste, to środkowy czyn nik jest zerem. W spółczynnik przy □ ^ o k jest liczbą sposobów podziału j pionowymi i k poziomymi kamieniami.) W s k a z ó w k a : To jest trudny problem, naprawdę wybiegający poza ramy tej książki. Może wystarczy, jeśli sprawdzisz to wyrażenie dla przypadku m = 3, n = 4. 52. Pokaż, że wielomiany zdefiniowane za pomocą rekurencji TL— 1 Pn(y) = ( y - 2n \ / - I - Y . ( 2k ) ( ) u -k Pk(y). całkowite u ^ 0, k= 0 są postaci i pn i y ) = ^ m = o gdzie |m| Jest dodatnią liczbą całkowitą dla 1 ^ m ^ n . W s k a z ó w k a : To ćwiczenie jest bardzo pouczające, ale nie jest łatwe. 53. Ciąg liczb pięciokątnych (1, 5 ,1 2 ,2 2 ,...) uogólnia ciąg liczb trójkątnych i kwadratowych w oczywisty sposób: Niech n-tą liczbą trójkątną będzie Tn = n (n + l)/2 , niech n-tą liczbą pięciokątną będzie Pn = n (3n — 1)/2 i niech Uu będzie liczbą pokryć prostokąta kamieniami domina 3 x n zdefiniowaną w ( 7 .3 8 ). Udowodnij, że liczba trójkątna T(U 4 łi+ 2 _ 1) / 2 jest również liczbą pięciokątną. Wskazówka: 311^ = (V2 n -i + V 2 n + i ) 2 + 2 . 54. Rozważ następującą dziwaczną konstrukcję: 1 2 3 4 1 2 3 4 1 3 6 10 1 3 1 4 1 1 5 6 7 8 9 11 12 13 14 15 16 . 6 7 8 9 11 12 13 14 16 . 16 23 31 40 51 63 76 90 106 . 6 16 23 31 51 63 76 106 . 10 26 49 80 131 194 270 376 . 4 26 49 131 194 376 . 5 31 80 211 405 781 . 1 31 211 781 . 1 32 243 1024 . 10 (Zacznij od wiersza zawierającego same dodatnie liczby. Potem usuń co m-tą kolumnę; w tym przypadku m = 5. Potem zastąp pozostałe warto ści ich sumami częściowymi. Potem usuń co (m —1)-szą kolumnę. Potem znowu zastąp pozostałe liczby sumami częściowymi, i tak dalej.) Wyko rzystując funkcje tworzące pokaż, że uzyskany wynik jest ciągiem m-tych potęg. Na przykład dla m = 5 otrzymamy (15 ,2 5 ,3 5 ,4 5, . . . ) , co tutaj widać. 55. Udowodnij, że jeśli szeregi potęgowe F(z) i G(z) są skończenie różniczkowalne (tak, jak to było zdefiniowane w ćwiczeniu 2 0 ), to również F(z) 4 G(z) i F(z)G(z) są skończenie różniczkowalne. 7. Funkcje tworzące Problem y badawcze 56. Udowodnij, że nawet jeśli dopuścimy odpowiednio dużą klasę prostych postaci zwartych, to i tak nie znajdziemy takiej postaci na współczynniki przy zn w (1 + z + z2)n . 57. Czy następujące zdanie jest prawdziwe: Jeśli wszystkie współczynniki w G(z) są równe albo 0 , albo 1 , i wszystkie współczynniki w G(z ) 2 są mniejsze niż pewna stała M, to nieskończenie wiele współczynników w G(z ) 2 równa się zeru. Prawdopodobieństwo dyskretne Element szansy często występuje w naszych próbach zrozumienia świata, w którym żyjemy. Matematyczna teoria rachunku prawdopodobieństwa po zwala obliczać szansę wystąpienia skomplikowanych zdarzeń, jeśli założymy, że zdarzenia podlegają odpowiednim aksjomatom. Teoria ta ma szerokie za stosowania we wszystkich dziedzinach nauki i ma silne powiązania z techni kami badanymi w poprzednich rozdziałach. Prawdopodobieństwo będzie nazywane „dyskretnym”, jeśli prawdopodo bieństwo wszystkich zdarzeń można policzyć za pomocą sumowania zamiast całkowania. Nabraliśmy już biegłości w sumowaniu, więc nie powinno być wielkim zaskoczeniem, że jesteśmy gotowi zastosować naszą wiedzę do cał kiem ciekawych obliczeń dotyczących prawdopodobieństw i średnich. 8.1. D efinicje Teoria rachunku prawdopodobieństwa rozpoczyna się od pierwotnego poję cia przestrzeni losowej, która jest zbiorem £1 składającym się z wszystkich rzeczy, które mogą się zdarzyć w danym problemie, wraz z regułą przypisu jącą prawdopodobieństwo Pr(cu) każdemu zdarzeniu elementarnemu cu € O. Prawdopodobieństwo Pr(cu) musi być nieujemną liczbą rzeczywistą, a waru nek Y _ Pr(cu) = cueo 1 (8 .1) musi być spełniony w każdej przestrzeni losowej. Tak więc każda wartość Pr(cu) musi znajdować się w przedziale [0 .. 1]. Będziemy mówić o Pr jako o rozkładzie losowym , ponieważ rozkłada on całkowite prawdopodobieństwo 1 między zdarzenia cu. ^ Weźmy następujący przykład: Jeśli rzucamy parą kości, to zbiorem O zdarzeń elementarnych jest D 2 = { [•][•]> •••> U ffi] )> gdzie D = { □.□.H .H .H .D } mmm, (Czytelnik, nie obeznany z rachunkiem prawdo podobieństwa, z dużym prawdopo dobieństwem może wiele skorzystać dokładnie czytając klasyczne wprowadzenie Fellera [120] do tego tematu.) 8 .Prawdopodobieństwo dyskretne jest zbiorem wszystkich sześciu wyników, odpowiadających pojawieniu się danej liczby oczek. Pary takie jak 0 H i H H s3= uważane za różne. Tak więc ta przestrzeń losowa zawiera w sumie 6 2 = 36 elementów. Będziemy z reguły zakładali, że kości są „wyważone” — to znaczy, że każda z sześciu możliwych wartości wystąpi z prawdopodobieństwem ^ oraz że każdy z 36 możliwych wyników ma jednakowe prawdopodobieństwo jg. Ale możemy również rozpatrywać „niewyważoną” (źle wyważoną) kość, dla której rozkład prawdopodobieństw jest różny. Na przykład niech PritEI) = Pri(IOI) = 5 ; Pr, O = Pr,(|7]) = Pr, (|d ) = P r , ® = Wówczas Y deD Pri (d) = 1, tak więc Pri jest rozkładem losowym zbioru D i elementom przestrzeni O = D 2 możemy przyporządkować prawdopodobień stwa w następujący sposób: P r n (d d ') Na przykład Pri Y tuen ( 8 .2 ; Pri(d) P n (d ') . — P r „ (tu) = poprawny rozkład, ponieważ P r „ (d d ') = d d '6 D2 = X dGD P r ,(d) P r,(d ') d ,d '6 D Pri( d) L d'£D Pr^ d') = 1 1 = K Możemy również rozważać przypadek, gdy jedna kość jest wyważona, a druga nie, Pr0, (d d ') = Pr0 (d) Pr, ( d ') , Gdyby wszystkie ściany na kości były identyczne, skąd wiedzielibyśmy; która została wyrzucona? gdzie Pr0 (d) = i ( 8 .3 ) i wówczas Pro, (| | ] | 3 ) = g • g = jgpowinniśmy oczekiwać, że kości w „prawdziwym świecie” będą upadały tak samo często na każdą ścianę, ponieważ nie są one całkowicie symetryczne. Ale wartość \ jest z reguły bliska prawdzie. Zdarzenie jest podzbiorem zbioru Cl. W grze w kości, na przykład, zbiór 0 0 - 59S9> 0 0 } jest zdarzeniem że „wypadł dublet.” Pojedyncze elementy cu z O są nazywane zdarzen iam i elem entarn ym i, ponieważ nie mogą być rozłożone na mniejsze podzbiory. Można myśleć o cu jako o jednoelementowym zdarzeniu {cu}. Prawdopodobieństwo zajścia zdarzenia A jest zdefiniowane wzorem (8.4) cu 6 A i w ogólności, jeśli R(tu) jest dowolnym zdaniem logicznym zależnym od cu, to będziemy pisać ‘Pr(R(cu))’ dla sumy wszystkich Pr(cu), dla których zdanie R(cu) jest prawdziwe. Tak więc, na przykład, prawdopodobieństwo wypad nięcia dubletu, przy rzucie wyważoną kostką, jest równe 3^+3^ + ^ + ^ + 3^ + 3^ = Ale gdy obie kości są niewyważone z rozkładem losowym P r i, wówczas jest już równe je + -k + -gĘ + -^ + i i + j6 = T e > \ - Używając niewyważonych kości, czynimy prawdopodobieństwo wyrzucenia dubletu bardziej prawdopodobnym. (W tym miejscu używamy notacji Y. w bardziej ogólnym sensie niż było to zdefiniowane w rozdziale 2: We wzorach (8.1) i (8.4) sumujemy wzglę dem wszystkich elementów cu z dowolnego zbioru, nie tylko względem liczb całkowitych. Jednakże to rozszerzenie nie jest w rzeczywistości alarmujące. Możemy założyć, że gdy nie mamy na myśli liczb całkowitych, używamy specjalnej notacji pod znakiem tak aby nie było niezgodności z naszą zwykłą konwencją. Pozostałe definicje w rozdziale 2 są nadal poprawne. W szczególności definicja sum nieskończonych w tym rozdziale nadaje poprawną interpretację naszym sumom, również wtedy, kiedy przestrzeń Cl jest nieskoń czona. Każde prawdopodobieństwo jest nieujemne i suma wszystkich praw dopodobieństw jest ograniczona, tak że prawdopodobieństwo zdarzenia A w (8.4) jest dobrze zdefiniowane dla wszystkich podzbiorów A C O.) Z m ien n a losowa jest funkcją zdefiniowaną na zdarzeniach elementar nych cu z przestrzeni losowej. Na przykład gdy Cl = D 2, możemy zdefiniować S(cu) jako sumę liczby oczek, gdy wyrzuciliśmy kośćmi cu, tak że S(||f]|X]) = 6 + 3 = 9. Prawdopodobieństwo, że wypadło siedem oczek, jest prawdopodo bieństwem zdarzenia S(cu) = 7, a dokładniej Pr(0 0 ) + Pr(E3 g | ) + P r(|a |C |) + Pr(0 0 ) + P r(H E 3 ) + Pr(0 H ) . Z wyważoną kością (Pr = Proo), zdarzy się to z prawdopodobieństwem ale z niewy ważoną kością (Pr = Pri 1) prawdopodobieństwo to będzie równe T 6 + ^ + ^4 + ^ + ^4 + T 6 = ^ ) takie samo>jakie otrzymaliśmy w przypadku dubletów. Zwyczajowo, gdy mówimy o zmiennych losowych, opuszczamy symbol ‘(cu)’ ponieważ z reguły podczas analizy konkretnego problemu rozważamy tylko jedną przestrzeń losową skojarzoną z daną zmienną losową. Powiemy więc po prostu, że ‘S = 7’, gdy zdarzeniem było wyrzucenie 7 oczek oraz ‘S = 4 \ aby określić zdarzenie { Q 0 > 0 0 }’ Zmienna losowa może być scharakteryzowana przez rozkład losowy jej wartości. I tak, na przykład, S przybiera jedenaście możliwych wartości ze zbioru { 2 ,3 ,..., 1 2 } i dla każdego s w tym zbiorze możemy zapisać prawdo podobieństwo tego, że S = s: s 2 3 4 5 6 7 8 9 10 11 12 Pr00(S = s) 1 36 4 64 2 36 4 64 3 36 5 64 4 36 6 64 5 36 7 64 6 36 12 64 5 36 7 64 4 36 6 64 3 36 5 64 2 36 4 64 1 36 4 64 ' P rn (S = s) Gdy zajmujemy się problemem, w którym występuje tylko zmienna losowa S i nie wykorzystujemy żadnych innych własności kości, wówczas możemy dać odpowiedź korzystając tylko z tych prawdopodobieństw, bez wdawania się we własności zbioru O. = D 2. Tak naprawdę to moglibyśmy zdefiniować prze strzeń losową jako mniejszy zbiór jQ = { 2 ,3 ,..., 1 2 }, z odpowiednim rozkła dem losowym. Wtedy ‘S = 4 ’ byłoby zdarzeniem elementarnym. Tak więc możemy często ignorować wyróżnioną przestrzeń losową D. i zajmować się od razu zmienną losową i jej rozkładem. Jeśli dwie zmienne losowe X i Y zdefiniowane są nad tą samą przestrzenią losową O, to możemy opisać ich zachowanie bez jakiejkolwiek znajomości O, pod warunkiem, że znamy „rozkład łączny” Pr(X = x i Y = y) dla każdego x z zakresu X i każdego y z zakresu Y. Powiemy że X i Y są niezależnym i zmiennymi losowymi, jeśli Pr(X = x i Y = i|) = Pr(X = x ).P r (Y = y ) (8 .5 ) dla każdego x i y. Intuicyjnie, oznacza to, że wartość X nie ma żadnego wpływu na wartość Y. Na przykład gdy O jest zbiorem D 2, możemy zdefiniować Si jako liczbę oczek w pierwszym rzucie kostką i S2 jako liczbę oczek w drugim rzucie. Wów czas zmienne losowe Si i $2 są niezależne względem wszystkich rozkładów losowych Proo, Pri 1 i Proi, które dotąd rozważaliśmy, ponieważ definiowa liśmy prawdopodobieństwa dla każdego zdarzenia elementarnego dd' jako iloczyn prawdopodobieństwa dla Si = d i prawdopodobieństwa dla S2 = d ;. Moglibyśmy też zdefiniować prawdopodobieństwa inaczej, tak, by na przy kład P r(0 i5 ])/P r(0 0 ) ± P r(H |X |)/P r(|3 |n i). ale nie robimy tego,-ponieważ wartości oczek na każdej z kości nie wydają się zależeć od siebie nawzajem. Według naszych definicji obydwa ułamki wynoszą Pr(S 2 = 5 )/ Pr(S 2 = 6 ). Zdefiniowaliśmy S jako sumę wartości wyrzuconych oczek, Si + S2. Roz ważmy inną zmienną losową P — będącą iloczynem Si S2- Czy S i P są nieza leżne? Intuicyjnie nie. Jeśli S = 2, to wiemy, że P musi być równe 1. Formalnie też nie, ponieważ warunek niezależności ( 8 .5 ) nie jest spełniony, co można pokazać w następujący spektakularny sposób (przynajmniej w przypadku wyważonej kości): Dla wszystkich poprawnych wartości s i p mamy 0 < Pr0 o(S = s) -Proo(P =p) ^ co nie może się równać Proo(S = s iP = p ), które jest wielokrotnością jg . Gdy chcemy zrozumieć typowe zachowanie się danej zmiennej losowej, wówczas często pytamy się o jej wartość „przeciętną.” Pojęcie takiej wartości jest jednak niejednoznaczne. Ogólnie mówi się o trzech różnych rodzajach „średnich” dla danego ciągu liczb: • wartość średnia (suma wartości wszystkich elementów dzielona przez liczbę tych elementów), • mediana (równa środkowemu co do wartości elementowi), • dominanta (czyli wartość, która występuje najczęściej). Na przykład wartością średnią (3 ,1 ,4 ,1 ,5 ) jest 3 + 1 + ^+ 1 + 5 = 2,8, medianą jest 3 i dominantą jest 1 . Teoretycy rachunku prawdopodobieństwa zwykle pracują ze zmiennymi losowymi, a nie z ciągami liczb, tak że chcielibyśmy zdefiniować pojęcie „war tości średniej” także dla zmiennych losowych. Przypuśćmy, że ciągle powta rzamy eksperyment, wykonując niezależne próby w taki sposób, że każda wartość X występuje z częstością w przybliżeniu proporcjonalną do swego prawdopodobieństwa (np. moglibyśmy wiele razy rzucać parą kości, obser wując wartości S i/lub P). Chcielibyśmy zdefiniować wartość średnią zmiennej losowej tak, żeby każdy eksperyment produkował z reguły ciąg liczb, których wartość średnia, mediana oraz dominanta były mniej więcej takie same jak zgodnie z naszą definicją wartość średnia, mediana i dominanta zmiennej losowej X. Oto jak można to osiągnąć: Wartością oczekiwaną zmiennej losowej X przybierającej wartości rzeczywiste na przestrzeni losowej Cl jest (8.6) xex(n) jeśli tylko te potencjalnie nieskończone sumy istnieją. (Tutaj X(D) oznacza zbiór wszystkich wartości, które X może przybierać). Medianę zmiennej lo sowej X definiujemy jako zbiór wszystkich x takich, że (8-7) D o m in an ta zmiennej losowej X jest zdefiniowana jako zbiór wszystkich x takich, że Pr(X = x) ^ Pr(X = x') dla wszystkich x r G X(£l). (8.8) W naszym przykładzie rzucania kością wartość oczekiwana zmiennej losowej S wynosi + — 7 zarówno w rozkładzie losowym Proo, jak i w rozkładzie Pri i . Mediana i dominanta są także {7}, dla obydwu rozkładów. Tak więc zmienna losowa S ma taką samą „średnią” dla wszystkich trzech definicji. Z drugiej strony, zmienna losowa P z rozkładem Proo ma wartość średnią ^ = 12,25, medianę {10} i dominantę {6 ,12}. Wartość średnia zmiennej losowej P nie zmieni się, jeśli rzucamy kośćmi niewy ważonymi z rozkładem P rn , ale mediana zmniejsza się do {8 }, a dominanta staje się jednoelementowym zbiorem {6 }. Teoretycy rachunku prawdopodobieństwa mają specjalną nazwę i ozna czenie dla wartości średniej zmiennej losowej: nazywają ją w artością ocze kiwaną i piszą EX = Y _ X(cu)Pr(u>). coGO ( 8 .9 ) W naszym przykładzie z rzucaniem kośćmi ta suma ma 36 składników (jeden dla każdego elementu z O), podczas gdy ( 8 .6 ) jest sumą tylko jedenastu składników. Ale obie sumy przybierają taką samą wartość, ponieważ obydwie są równe Y xPr(o>) [x = X(cu)] . cuGO x € X (0 ) Już wiem: średnio rzecz biorąc „przeciętny” znaczy „średni” Wartość oczekiwana zmiennej losowej okazuje się mieć większe znaczenie w zastosowaniach niż inne rodzaje wartości średniej, tak że z reguły nie bę dziemy się odtąd zajmowali medianą i dominantą. W pozostałej części tego rozdziału będziemy używali oznaczenia „wartość oczekiwana” i „średnia” pra wie zamiennie. Jeśli X i Y są dowolnymi zmiennymi losowymi zdefiniowanymi nad tą samą przestrzenią losową, to X + Y też jest zmienną losową zdefiniowaną nad tą przestrzenią losową. Ze wzoru (8 .9 ), wartość oczekiwana ich sumy jest sumą ich wartości oczekiwanych: E(X + Y) = (X(cu) + Y(cu))Pr(cu) = EX + EY. (8 . 1 0 ) o>en Podobnie, jeśli oc jest dowolną stałą, to otrzymujemy prosty wzór E(<xX) = ccEX. (8 .1 1 ) Odpowiedni wzór dla mnożenia zmiennych losowych jest w ogólności znacznie bardziej skomplikowany. Dzieje się tak dlatego, że wartość oczekiwaną defi niuje się jako sumę względem zdarzeń elementarnych, a suma iloczynu nie ma często tak prostej postaci. Pomimo tej trudności, istnieje ładny wzór na wartość oczekiwaną iloczynu w szczególnym przypadku, gdy zmienne losowe są niezależne: E(XY) = (EX)(EY), gdy X i Y są niezależne. (8 . 1 2 ) Możemy tego dowieść korzystając z prawa rozdzielności dla iloczynów: Y X(oi)Y(co) -Pr(cu) = Y. *y-Pr(X = x i Y = y) E(XY) = coGO x G X (0 ) -yGY ( O ) =Y - xy.Pr(X = x)Pr(Y = y) x G X (0 ) U G Y (a ) = Y x g x (Q ) • Y y p r (Y = y ) = ( e * ) ( e y ) . ye Y(ci) Wiemy na przykład, że S = Si + S2 i P = S iS 2, gdy Si i S2 są liczbami oczek wyrzuconymi na pierwszej i na drugiej kości. Ponieważ ESi = ES2 = \ , więc otrzymujemy ES = 7. Co więcej, Si i S2 są niezależne, tak więc EP = | • | co ustaliliśmy wcześniej. Mamy również E(S + P) = ES + EP = 7 + ^ . Ale S i P nie są niezależne, więc nie możemy wnioskować, że E(SP) = 7* ^ = W istocie, wartość oczekiwana SP jest równa ^ w rozkładzie Proo, podczas gdy jest ona równa 1 1 2 (dokładnie) w rozkładzie Pri i . 8.2. W artość oczekiw ana i wariancja Drugim ważnym parametrem zmiennej losowej jest jej w ariancja, zdefinio wana jako wartość oczekiwana kwadratu odchylenia od wartości średniej roz ważanej zmiennej: VX = E ( ( X - E X } 2) . (8.13) Jeżeli oznaczymy EX przez to wariancja VX będzie wartością oczekiwaną (X — |x)2. Mierzy ona rozproszenie rozkładu X. Oto przykład obliczania wariancji: Przypuśćmy, że właśnie otrzymaliśmy propozycję nie do odrzucenia; ktoś podarował nam dwa losy na pewną loterię. (Subtelna uwaga: W zależności od tego, którą strategię przyjmiemy, otrzymamy różne przestrzenie losowe, ale w obydwu przypadkach EXi i EX2 są takie same). Organizatorzy loterii sprzedają 1 0 0 losów na cotygodniowe ciągnienie. Każdy z losów jest wybierany w jednorodnym procesie losowym, to znaczy, że każdy los może być wybrany z takim samym prawdopodobieństwem— i szczęśliwy właściciel wybranego losu wygrywa sto milionów dolarów. Pozostałe 9 9 losów nic nie wygrywa. Możemy teraz wykorzystać nasz prezent na dwa sposoby: albo kupujemy dwa losy na to samo ciągnienie, albo kupimy po jednym losie na dwa różne ciągnienia. Która strategia jest lepsza? Spróbujmy to przeanalizować przy użyciu zmiennych losowych Xi i X2 odpowiadających wysokości wygranej dla pierwszego i dla drugiego losu. Wartość oczekiwana Xi, w milionach, wynosi = W -0 + W = -1 0 0 1 i jest taka sama dla X2. Wartości oczekiwane są addytywne, tak więc średnia całkowita wygrana wynosi E(Xi + X 2) = EXi + E X 2 = 2 miliony dolarów, niezależnie od tego, jaką strategię wybierzemy. Mimo to obydwie strategie wyglądają różnie. Nie patrzmy jednak na wartości oczekiwane i przeanalizujmy dokładnie rozkład zmiennej losowej Xi + X2 : wygrana (w milionach) 0 100 to samo ciągnienie 0,9800 0 ,0 2 0 0 różne ciągnienia 0,9801 0,0198 200 0 ,0 00 1 Gdy kupimy dwa losy na tej samej loterii, wówczas mamy 98% szansy prze granej i 2 % szansy wygrania 10 0 milionów dolarów. Jeśli kupimy je na różne ciągnienia, to mamy 98,01% szansy przegranej, czyli odrobinę więcej niż po przednio; mamy 0 ,0 1 % szansy wygrania 2 0 0 millionów dolarów, co jest rów nież troszkę więcej niż poprzednio, i nasze szanse na wygranie 10 0 millionów dolarów wynoszą teraz 1,98%. Tak więc rozkład Xi + X2 w drugim przy padku jest bardziej rozproszony: wartość środkowa, 10 0 millionów dolarów, jest mniej prawdopodobna, ale wartości ekstremalne są odrobinę bardziej prawdopodobne. Wariancja ma służyć właśnie do analizy pojęcia rozproszenia zmiennej losowej. Będziemy mierzyli rozproszenie jako kwadrat odchylenia zmiennej losowej od jej wartości oczekiwanej. W przypadku 1 wariancja wynosi 0 ,9 8 (0 M -2 M )2 + 0,02(100M —2M ) 2 = 196M2 , a w przypadku 2 0 ,9801 (OM —2M ) 2 4 - 0 ,0198(1 OOM —2M .)2 + 0 ,0001 (200M —2M ) 2 = 198M2 . Tak jak oczekiwaliśmy, druga wariancja jest odrobinę większa, ponieważ roz kład losowy w przypadku 2 jest odrobinę bardziej rozproszony. Gdy pracujemy z wariancjami, wszystko jest podnoszone do kwadratu, tak że można uzyskać całkiem duże wartości. (W naszym przykładzie czynnik M 2 wynosi bilion, co jest dość imponujące nawet dla graczy grających o bardzo wysokie stawki.) Żeby przenieść liczby z powrotem do wyjściowej skali, często bierze się pierwiastek kwadratowy z wariancji. Otrzymana liczba jest nazywana odchyleniem standardow ym i jest zwykle oznaczana grecką literą a: a = VVX. Ciekawe: Wariancja liczby dolarów jest wyrażona w dolarach kwadratowych. ( 8 .1 4 ) Odchylenia standardowe zmiennej losowej Xi + X2 dla naszych dwóch stra tegii na loterii wynoszą a/196M2 = 14,00M. i V l98 M 2 « 14,071247M. W pewnym sensie, druga strategia jest o ok. 71247 dolarów bardziej ryzykowna. Jak wariancja może nam pomóc w wyborze strategii? To nie jest wcale takie oczywiste. Strategia z wyższą wariancją jest odrobinę bardziej ryzy kowna, ale czy uzyskamy najwięcej pieniędzy grając bardziej, czy mniej ry zykownie? Przypuśćmy że mamy szansę kupienia 100 losów zamiast tylko dwóch. Wówczas mielibyśmy zagwarantowaną wygraną w pojedynczej loterii (i wariancja byłaby zero), ale też moglibyśmy zagrać w stu różnych loteriach z szansą przegrania 0 ,99 100 « 0,366, również z niezerową szansą wygrania aż 10000000000 dolarów. Decyzja, która z tych strategii jest lepsza, wykracza poza ramy tej książki. Wszystko co my możemy tutaj wytłumaczyć, to tylko jak przeprowadzać obliczenia. Tak naprawdę to istnieje prostsza metoda obliczania wariancji, niż wyni kająca z definicji ( 8 . 1 3 ). (Podejrzewamy, że coś musi się dziać z matematyką za naszymi plecami, ponieważ wariancja w przykładzie z loterią w jakiś ma giczny sposób wyskoczyła jako całkowita wielokrotność M 2.) Otrzymujemy E((X — EX)2) = E(X 2 —2X(EX) + (EX)2) = E(X2 )-2 (E X )(E X ) + (EX)2 , ponieważ (EX) jest stałą. Stąd VX = E(X2) - (EX) 2 . (8 .1 5 ) „Wariancja jest wartością oczekiwaną kwadratu zmiennej minus kwadrat war tości oczekiwanej.” Innym sposobem na zredukowanie ryzyka byłoby przekupienie właściciela loterii. Sądzę, że wówczas prawdopodobień stwo przestałoby być dyskretne. (Opinia wyrażona na tym marginesie niekoniecznie reprezentuje opinię autorów.) W przykładzie z loterią, wartość oczekiwana (Xi + X2 ) 2 wynosi albo 0 ,98(0M)2 + 0,02(100M ) 2 = 200M2, albo 0,9801 (OM) 2 + 0,0198(100M )2 + 0,0001 (200M ) 2 = 202M2. Po odjęciu 4M 2 (kwadrat wartości oczekiwanej) otrzymujemy wynik, na który poprzednio tak ciężko pracowaliśmy. Zachodzi nawet jeszcze prostszy wzór, gdy chcemy liczyć V(X + Y) dla niezależnych X i Y. Otrzymujemy E((X + Y)2) = E(X2 + 2XY + Y2) = E(X2) + 2(EX)(EY) + E(Y2) . Ponieważ wiemy, że E(XY) = (EX)(EY) dla niezależnych zmiennych losowych X i Y, więc otrzymujemy V(X + Y) = E((X + Y}2) - ( E X + EY)2 = E(X2) + 2(EX)(EY) + E(Y2) - (EX) 2 - 2(EX)(EY) - (EY)2 = E(X2) - (EX)2 + E(Y2) - (EY)2 ( 8 .16 ) = VX + VY. „Wariancja sumy niezależnych zmiennych losowych jest sumą ich wariancji.” Na przykład wariancja wartości, jaką możemy wygrać na pojedynczy los na loterii wynosi E(X2) — (EXi )2 = 0,99(0M )2 + 0,01 (100M.)2 — ( I M )2 = 99M 2 . Dlatego wariancja całkowitej wygranej przy dwóch losach w dwóch oddziel nych (niezależnych) ciągnieniach wynosi 2 x 99M 2 = 198M2. Odpowiednia wariancja dla n niezależnych losów wynosi n x 99M2. Wariancja dla sumy S wartości wyrzuconych oczek w rzutach kością może być obliczona według tego samego wzoru, ponieważ S = Si + S2 jest sumą dwóch niezależnych zmiennych losowych. Otrzymujemy VSi = ^ ( 12 + 22 + 32 + 4 2 + 52 + 6 2) — ( Q gdy kości są wyważone i stąd VS = f f + f§ = = ^ , Dla niewyważonych kości VS, = l( 2 - 1 2 + 22 + 3 2 + 4 2 + 52 + 2 - 6 2) - ( 0 = ^ i stąd VS = ^ = l \ . Można zauważyć, że niewyważona kość daje większą wariancję dla S, pomimo że S przybiera swoją średnią wartość 7 częściej niż przy wyważonych kościach. Tak więc gdy naszym celem jest wyrzucenie wielu szczęśliwych 7, wariancja nie jest najlepszym wskaźnikiem sukcesu. OK, wiemy już, jak obliczać wariancje. Ale jaki jest naprawdę rzeczywi sty powód, dla którego oblicza się wariancję? Każdy to robi, ale dlaczego? Głównym powodem jest nierówność Czebyszewa ([29] i [73]), która mówi, że wariancja ma następującą ważną własność: Pr((X — EX) 2 ^ a) ^ VX/cx, dla wszystkich a > 0.( 8 . 1 7 ) (Różni się ona od monotonicznych nierówności Czebyszewa, które spotkali śmy w rozdziale 2 .) W przybliżeniu wzór ( 8 . 1 7 ) oznacza, że zmienna losowa X będzie rzadko odległa od swojej wartości oczekiwanej EX, jeśli wariancja VX jest mała. Dowód jest zaskakująco prosty. Mamy vx = Y_ (x (a>) - Ex)2P rM cu 6 0 Y_ (X(a>) — EX) 2 Pr(a>) cuen (X(a>)—E X ) 2 ^ o t ^ ^ aPr(cu) = c»c-Pr((X — EX) 2 ^ a) ; w go. (X (c u )-E X )2^ a dzieląc przez oc otrzymujemy tezę. Jeśli oznaczymy wartość oczekiwaną przez [i, odchylenie standardowe przez a i podstawimy c2VX za oc we wzorze ( 8 . 1 7 ), to warunek (X —EX) 2 ^ c2VX stanie się równoważny (X — \x) 2 ^ (ca)2. Czyli z nierówności ( 8 . 1 7 ) wynika, że Pr(|X — M -l ^ cc) ^ 1 /c2 . (8 .1 8 ) Tak więc X będzie zwykle leżało w promieniu c razy odchylenie standardowe od swojej średniej, z wyjątkiem co najwyżej 1 /c 2 przypadków. Zmienna lo sowa będzie leżała nie dalej niż 2cr od |ll w co najmniej 75% przypadków. Znajdzie się pomiędzy \x— 10a i + 10a w co najmniej 99% przypadków. Wynika to z zastosowania nierówności Czebyszewa dla oc = 4VX i oc = 10OVX. Jeśli rzucamy parą wyważonych kości n razy, to całkowita liczba wyrzu conych oczek będzie prawie zawsze bliska 7n, dla dużych rt. A oto dlaczego: Wariancja dla u niezależnych rzutów wynosi ^ r t. Wariancja oznacza, że odchylenie standardowe wynosi tylko Tak więc nierówność Czebyszewa mówi, że całkowita suma będzie leżała po między 7n-lO y^n i 7n+10y^fn w co najmniej 99% spośród wszystkich doświadczeń rzucania n kośćmi. Na przykład mamy szansę większą niż 99 do 1, że suma wyrzuconych oczek w milionie rzutów parą kości będzie między 6,975 miliona a 7,025 miliona. W ogólności, niech X będzie dowolną zmienną losową nad przestrze nią losową £1 , mającą skończoną wartość średnią \i i skończone odchylenie standardowe cr. Rozważmy przestrzeń losową £ln , w której zdarzeniami ele mentarnymi są ciągi (o>i, cu2 >• • ., <^n) takie, że tuk E O, i które spełniają Pr(a>i,cju2 ,...>cjun ) = Pr(cui) Pr(cu2) .. .Pr(cun ) . Jeśli zdefiniujemy teraz zmienną losową X]C, jako Xk(tUi , a>2, . • • , CDn ) = X(cuk), to wyrażenie Xi + X2 + • • • + XTL (To znaczy, że średnia wpadnie do pokazanego przedziału w co najmniej 99% wszystkich przypadków, gdy będziemy patrzyli na n niezależnych eksperymentów, dla dowolnej ustalonej wartości n. Nie należy tego pomylić ze stwierdzeniem tego o średnich nieskończonego ciągu X1 ,X 2 ,X 3, . . . dla zmieniających się wartości n.) oznacza sumę rt niezależnych losowych, które odpowiadają wzięciu rt nieza leżnych „próbek” z X nad O i dodaniu ich. Wartość średnia X-| + X 2 H------bXn wynosi n \i i odchylenie standardowe wynosi y/n cr. Tak więc średnia spośród rt próbek —(Xi + X2 H------- 1- Xn ) , będzie leżała pomiędzy \ i — 10a/^/n a \l + 1Ocr/y/n w co najmniej 9 9 % przy padków. Innymi słowy, jeśli weźmiemy wystarczająco duże n, to wartość średnia w n niezależnych próbach będzie prawie zawsze leżała bardzo bli sko wartości średniej EX. Dowód silniejszego twierdzenia, zwanego silnym prawem wielkich liczb można znaleźć w podręcznikach do rachunku praw dopodobieństwa, jednakże właśnie wyprowadzona konsekwencja nierówności Czebyszewa jest wystarczająca dla naszych celów. Czasami nie znamy parametrów przestrzeni losowej, a mimo to chcieliby śmy oszacować wartość oczekiwaną zmiennej losowej X poprzez wielokrotne testowanie wartości X. Na przykład chcielibyśmy znać średnią temperaturę w południe, w styczniowy dzień w San Francisco, lub też oczekiwaną długość życia agenta ubezpieczeniowego. ,Gdy znamy empirycznie uzyskane nieza leżne obserwacje Xi, X2 , Xn , możemy zgadnąć, że prawdziwa wartość oczekiwana równa jest w przybliżeniu EX = X 1 + X 2 + - - - + X n (} n Możemy również oszacować wariancję za pomocą wzoru = X j + X j + .. . + x ^ _ ( x , + x J + ..| -t- x , ln —1 n { n — 1) n - 1 w tym wyrażeniu wygląda jak błąd typograficzny i wydaje się, że po winno być zastąpione przez n, podobnie jak w ( 8 . 1 9 ), ponieważ rzeczywista wariancja VX jest zdefiniowana przez wartości średnie z (8 . 1 5 ). Tutaj otrzy mamy jednak lepsze oszacowanie z n — 1 niż z n, ponieważdefinicja ( 8 .2 0 ) pociąga za sobą E(VX) = V X . (8.21) Wynika to z poniższego wyprowadzenia: e^x) = 1f~ i > x*) k= 1 j = l k=l k= 1 = ^ t ( Ż j=l k = 1 E(x 2 ) - i Z . L ( t ( X ) 2[ j ^ k ] + E(X2) [ j = k ] ) ) k= 1 j = 1 k= 1 = ^ - j ( n E ( X 2) - ^ ( n E ( X 2) + n ( n - 1)E(X)2) ) = E(X2) - E ( X ) 2 = v x . W powyższych operacjach niezależność obserwacji wykorzystujemy w mo mencie, gdy zastępujemy E ( X j X i < ) przez (EX)2[j ^ k ] + E ( X 2 ) [j = k ]. W praktyce eksperymentalne wyniki o zmiennej losowej X są z reguły uzyskiwane przez obliczenie wartości średniej z próbki p, = EX, odchylenia standardowego z próbki & = V v X , i przedstawienia wyniku w postaci ‘ ft ± cr/y/n \ Przypuśćmy, że wykonaliśmy dziesięć rzutów parą kostek uważanych za wyważone: 0 0 0 0 0 0 0 0 0 0 H 0 O 0 H O 0 H 0 0 Wartość średnia próbki dla sumy wyrzuconych oczek S wynosi ft = ( 7 + n + 8 + 5 + 4 + 6 + 10 + 8 + 8 + 7)/10 = 7,4; a wariancja próbki (72 + 112 + 8 2 + 5 2 + 4 2 + 6 2 + 102 + 8 2 + 8 2 + 72 - 10(l2)/9 » 2,12 . Opierając się więc na przeprowadzonym eksperymencie, możemy oszacować średnią wyrzucanych oczek jako 7,4 ± 2,1 /y/TÓ « 7,4 =b 0,7. Podamy jeszcze jeden przykład na wartość średnią i wariancję, aby po kazać, że można je obliczyć teoretycznie, a nie tylko uzyskać empirycznie. Jednym z problemów rozważanych w rozdziale 5 był problem podrzucanych kapeluszy, w którym n kapeluszy jest rzucanych w powietrze i wynikiem jest losowa permutacja kapeluszy. Pokazaliśmy w równaniu ( 5 .5 1 ), że z prawdo podobieństwem n j/n! « 1 / e nikt nie odzyska swojego własnego kapelusza. Wyprowadziliśmy również wyrażenie ( 8 .2 2 ) na prawdopodobieństwo, że dokładnie k osób odzyska z powrotem swoje kapelusze. Wyrażając te wyniki w formalizmie, który właśnie poznaliśmy, rozważmy przestrzeń losową TT^ wszystkich n! permutacji n liczb {1 , 2 , . . . , n}, gdzie Pr(7r) = 1/u ! dla wszystkich n e TT^. Zmienna losowa Nie należy jej mylić z liczbami Fibonacciego. Fu (tt) = liczba „stałych punktów” w tt, dla n E TTn , wyznacza liczbę poprawnie spadających kapeluszy. Równanie ( 8 .2 2 ) daje wzór na Pr(Fn = k ), ale przypuśćmy, że nie znamy takiego wzoru. Jedyne co chcemy zbadać, to wartość średnią Fn i jej odchylenie standardowe. W rzeczywistości poszukiwana wartość średnia jest bardzo łatwa do wyprowadzenia, bez skomplikowanych obliczeń z rozdziału 5. Po prostu za uważmy, że Fn (7t) = Fn j ( 7t ) + F u ^ ( 7t) + --- + Flv łl(7i:)ł Fn,ic(7t) = [pozycja k jest punktem stałym w 7t], dla n E T\n . Zatem Wartość oczekiwana FU)ic jest więc prawdopodobieństwem tego, że F ^ = 1, co jest równe 1 /n , ponieważ dokładnie (n — 1 )! spośród rt! permutacji n = 8-3. Funkcje tworzące prawdopodobieństwa 7ti 7t2 ... 7tn G TTn. spełnia = k. Stąd EFn = n / n = 1 , dla n > 0. (8-23) Tak więc średnio jeden kapelusz będzie na swojej pozycji początkowej. „Lo sowa permutacja ma średnio jeden punkt stały.” Jak się ma sprawa z odchyleniem standardowym? To pytanie jest bar dziej skomplikowane, ponieważ Fn)ic nie są jednak od siebie niezależne. Mo żemy jednak obliczyć wariancję przez zbadanie wzajemnych zależności mię dzy nimi: Tl 2\ Tt Tt Z Fn > 0 ) = e ( £ X F- . i F-.k ) a k=l n j = 1 k= 1 n = X. Z E(Fn.j Fn,k) = j = 1 k=l Z 1 ^k^n E(Fn,k)+2 Z 1 E(Fn,j En,>c) - ^ j< k ^ n (Używaliśmy już podobnej metody, gdy wyprowadzaliśmy wzór ( 2 .3 3 ) w roz dziale 2 .) Ponieważ F ^ jest równe 0 lub 1, więc otrzymamy F2 k = Fn>ic i stąd E(F2 k) = E F ^ = 1/n , tak jak poprzednio. Teraz jeśli j < k, to otrzymujemy EfF^j F ^ ) = Pr(j i k są punktami stałymi tt) = (n —2)1/n l = 1/n ( n — 1). Stąd n n tlF" > - s + u ; n ( „ - l ) = 2, ( 8 .2 4 ) (Dla sprawdzenia weźmy n = 3; otrzymamy | 0 2 + | l 2 + | 2 2 + ^3 2 = 2.)) Wariancja wynosi E(F2 ) —(EF^ ) 2 = 1, tak więc odchylenie standardowe (tak samo jak i wartość średnia) wynosi 1 . „Losowa permutacja n ^ 2 elementów ma 1 ± 1 stałych punktów.” 8.3. Funkcje tw orzące p raw dop od obieństw a Gdy X jest zmienną losową, która przybiera tylko nieujemne wartości cał kowite, możemy dobrze opisać jej rozkład losowy, korzystając z technik z rozdziału 7. Funkcją tworzącą prawdopodobieństwa lub inaczej ftp zmien nej losowej X jest Gx (z) = ^ P r ( X = k )z k . kÔ (8 -2 5 ) Ten szereg potęgowy zmiennej z zawiera całą informację o zmiennej losowej Który jest ten średni kapelusz? j 8 . P ra w d op o d o b ieństw o dysk retn e 438 X. Możemy go wyrazić również na dwa inne sposoby: Gx (z) = Y _ Pr(o>)zx(tu) = E(zx ) . ( 8 .2 6 ) cu g o Współczynniki Gx(z) są nieujemne i sumują się do 1. Ten drugi warunek można zapisać następująco: Gx (1) = 1 (8 .2 7 ) Na odwrót, dowolny szereg potęgowy G(z) z nieujemnymi współczynnikami spełniający równanie G (l) = 1 jest ftp pewnej zmiennej losowej. Najważniejszą cechą ftp jest to, że zwykle upraszcza ona obliczenia war tości średniej i wariancji. Na przykład wartość średnią można łatwo wyrazić jako: EX = J]_k-Pr(X = k) kÔ = Pr(X = k) •kz k _1 Z = 1 k$sO = ( 8 .2 8 ) 6 ^ ( 1 ). Po prostu różniczkujemy ftp względem z i przyjmujemy z = 1. Wariancja jest tylko trochę bardziej skomplikowana: E(X2) = k 2 -Pr(X = k) kÔ = ^ P r ( X = k ) - ( k ( k - 1 ) z k - 2 + kzk- l ) | z=l = G J|(1) + G i(1 ). kÔ Zatem VX = G£(1) + G i ( 1 ) - G i 0 ) 2 . [„Mean” oznacza po angielsku wartość średnią, a „Var” jest skrótem od „variance” co oznacza wariancję.] (8 .2 9 ) Równania ( 8 .2 8 ) i ( 8 .2 9 ) mówią nam, że możemy obliczyć wartość średnią i wariancję, jeśli potrafimy obliczyć wartości dwóch pierwszych pochodnych Gx(1) i Gx(1). Nie musimy więc znać wyrażeń w zwartej postaci dla praw dopodobieństw, nie musimy znać nawet zwartej postaci dla samego Gx(z). Dla wygody zdefiniujemy Mean(G) = G '(1), Var(G) = G"(1) + G'(1) — G'(1 ) 2 , (8-30) (8 -3 1 ) gdzie G jest dowolną funkcją, ponieważ będziemy często chcieli obliczać kom binacje tych pochodnych. Drugą miłą cechą ftp jest to, że w wielu ważnych przypadkach jest ona względnie prostą funkcją zmiennej z. Na przykład spójrzmy na rozkład je d n ostajny rzędu tl, w którym zmienna losowa przybiera każdą z wartości { 0 ,1 ,... ,n — 1} z tym samym prawdopodobieństwem 1/n. W takim przy padku ftp wynosi Un (z) = —(1 + z H-------h z 71 ') = rt u I , d la r t^ l. (8 .3 2 ) Mamy więc zwartą postać dla Un (z), ponieważ jest to szereg geometryczny. Ta zwarta postać prowadzi do czegoś, co jednak wprawia nas w zakłopota nie: Gdy podstawimy z = 1 (wartość z, która jest newralgiczna dla ftp), wów czas otrzymamy niezdefiniowany ułamek 0 / 0 , mimo że Un (z) jest wielomia nem, który jest dobrze zdefiniowany dla każdej wartości z. Wartość 11^(1) = 1 jest oczywista, jeśli spojrzymy na rozwiniętą postać (1 + z + -----b z n _ 1 )/u . Tak więc wydaje się, że jeśli chcemy wyznaczyć Un (1) ze zwartej postaci, to musimy skorzystać z reguły de THospitala do obliczenia limz_>.i Un (z). Wy znaczenie U^(1) ze wzoru de 1’Hospitala wydaje się trudniejsze, ponieważ w mianowniku będziemy mieli wyrażenie (z — I)2. Jeszcze trudniejsze będzie wyznaczenie U"(1). Szczęśliwie istnieje sposób na ominięcie tej trudności. Jeśli szereg G(z) = £ n > 0 gnZn jest jakimkolwiek szeregiem potęgowym, który jest zbieżny dla co najmniej jednej wartości z, gdzie \z\ > 1 , to szereg potęgowy G'(z) = Y . n > o TL9 n ^ TL_1 będzie również miał tę własność, tak jak i G"(z), G"'(z) itd. Korzystając z twierdzenia Taylora, możemy więc napisać G 0+tt. Sm + ^ t + ^ + ^ ( 8 .33 , + ... wszystkie pochodne G(z) w z = 1 wystąpią jako współczynniki w rozwinięciu funkcji G (1 + t ) względem zmiennej t. Na przykład można w ten sposób łatwo znaleźć pochodne ftp Un (z): u „ o + l) = nI < l It t ! t n -1 Porównując to z rozwinięciem ( 8 .3 3 ), otrzymujemy i M U = i; u ;( i) = ^ 1; u ”(i) = (n ~ 1Hn ~ 2) . (8.34) i w ogólności, U ^ O ) = (rt — 1 )—/ ( m + 1 ), chociaż potrzebujemy tego wy rażenia do obliczenia wartości średniej i wariancji tylko dla wartości m = 1 i m = 2. Wartość średnia w rozkładzie jednostajnym wynosi (s-35) a wariancja 12 n2-1 12 (8-36) Kolejną miłą cechą ftp jest to, że iloczyn ftp odpowiada sumie niezależ nych zmiennych losowych. W rozdziałach 5 i 7 nauczyliśmy się, że iloczyn funkcji tworzących odpowiada splotowi szeregów. Jednakże w zastosowaniach ważniejsze jest, żeby wiedzieć, że splot prawdopodobieństw odpowiada su mie niezależnych zmiennych losowych. Zauważmy bowiem, że jeśli X i Y są zmiennymi losowymi przybierającymi tylko wartości całkowite, to prawdo podobieństwo tego, że X + Y = n, wynosi Pr(X + Y = n) = Pr(X = k i Y = n —k ) . k Jeśli X i Y są niezależne, to otrzymujemy Pr(X + Y = n) = ]T P r{X = k) Pr(Y = n —k ), k czyli splot. Dlatego— i to jest właśnie kluczowy moment — G x + y ( z ) = Gx (z)G y (z), gdy X i Y są niezależne. ( 8 -3 7 ) Zauważyliśmy wcześniej w tym rozdziale, że V(X + Y) = VX + VY, gdy X i Y są niezależne. Niech F(z) i G(z) będą ftp dla X i Y i niech H(z) będzie ftp dla X + Y. Wówczas H(z) = F(z)G(z) i nasze wzory ( 8 .2 8 ) aż do (8 .3 1 ) na wartość średnią i wariancję dają nam Mean(H) = Mean(F) + M ean(G); (8 .3 8 ) Var(H) = Var(F)+Var(G ). (8-39) Te wzory, które są własnościami pochodnych Mean(H) = H '(1) i Var(H) = H"(1) + H '(l) — H'(1 )2, nie są prawdziwe dla iloczynu dowolnych funkcji H(z) = F (z )G (z ). Mamy bowiem H'(z) = F'(z)G(z) + F (z)G '(z), H"(z) = F"(z)G(z) + 2F '(z)G '(z) + F(z)G "(z). Ale przy podstawieniu z = 1 możemy zobaczyć, że zależności (8 .3 8 ) i ( 8 .3 9 ) będą zawsze prawdziwe, jeśli F(1) = G(1) = 1 ( 8 .4 0 ) i jeśli istnieją odpowiedne pochodne. Aby wzory te zachodziły, „prawdopodo bieństwa” niekoniecznie muszą być w przedziale [0 .. 1]. Zauważmy również, że aby ten warunek był spełniony, możemy znormalizować funkcje F(z) i G(z) przez podzielenie ich odpowiednio przez F(1) i G(1), jeśli F(1) i G(1) są niezerowe. Wartość średnia i wariancja nie są wszystkim, czym można się zajmo wać. Są one jedynie dwiema z nieskończonej rodziny tak zwanych staty styk półniezm ienników , które wprowadził duński astronom Thorvald Nicolai Thiele [352] w 1903 r. Pierwsze dwa półniezmienniki ki i k2 zmiennej losowej są tym, co my nazywamy wartością średnią i wariancją. Znane są również półniezmienniki wyższego rzędu, które opisują bardziej subtelne własności rozkładu. Ogólny wzór ( 8 .4 1 ) definiuje półniezmienniki wszystkich rzędów, gdzie G(z) jest ftp zmiennej losowej. Przyjrzyjmy się bliżej tak zdefiniowanym półniezmiennikom. Jeżeli G (z) jest ftp dla X, to kÔ m! k.mÔ gdzie (8-43) kÔ [xm nazywane jest „m-tym momentem” X. Po obliczeniu potęg przy podsta wie e obydwu stron równania ( 8 .4 1 ), otrzymamy inny wzór na Gfe*): Gfe*) = 1 + ( K l t + j K 2 t 2 H-------) ii ( K l t + j K 2 t 2 H-------- ) 2 + 1 + K-\ t + \ { k 2 + K2 ) t 2 H-------. 2! + ' 8 . P r a w d o p o d o b ie ń s tw o d y s k r e tn e Po przyrównaim współczynników przy jednakowych potęgach t, otrzymamy wzory ki = m , (8.4 4) k2 = \^z K3 = M-3 - 3 |X i|L 1 2 + 1 \ Ą vĄ» k4 = H 4 - 4 m *13 + 1 2 ^ 2 - 3 ^ 2 - 6 ^ 1 , K5 = M-s — 5 | i i M-4 + 2 0 * i f (j-3 — 1 0 |a 2 |i3 (8. 45 ) , ' + 3 0 ;x i \ Ą - „For these higher half-invariants we shall propose no special names.” T. N. Thiele [352] GOyĄ m-2 + ( 8 .4 6 ) (8.4 7) 24(xf , ( 8 .4 8 ) wyrażające półniezmienniki za pomocą momentów. Zauważmy, że k2 jest rze czywiście wariancją, równą E(X2) — (EX)2, tak jak poprzednio twierdziliśmy. Z równania (8 .4 1 ) wynika oczywiście to, że półniezmiennik zdefiniowany za pomocą iloczynu F(z)G(z) dwóch ftp będzie sumą odpowiednich półniezmienników z F(z) i G(z), ponieważ logarytmy z iloczynów są sumami. Dlatego wszystkie półniezmienniki sumy niezależnych zmiennych losowych są addytywne, tak samo jak wartość średnia i wariancja. Ta własność czyni półniezmienniki czymś ważniejszym niż momenty. Jeśli przyjmiemy inne podejście, pisząc G(1+t) = 1 + ^ - t + ^ t 2 + a 3 *3 2! 3! to równanie ( 8 .3 3 ) powie nam, że wszystkie alfy są „momentami ubywają cymi” a m = G<m>(1) = Pr(X = k)k—zk-m 1lz—1 kÔ = k—Pr(X = k) kJtO = E(X-2Ł). (8.49) To pociąga za sobą, że G(et )< - 1+ ai_ 1! = 1 + ai_ 1! — 1 + OC] t + 2! ) + f ( t 2 + t3 + J ( OC2 + OC1 ) t 2 + • )+ i że możemy wyrazić półniezmienniki za pomocą pochodnych G ^ f l ) : ki = <xi , (8.50) k2 = a 2 + ai - a f , (8.51) K3 = 0C3 + 3a 2 + ai —3a 2ai — + 2a f , (8.52) Ten ciąg wyrażeń daje „addytywność” wzorów, co rozszerza równania (8.38) i (8.39) na wszystkie półniezmienniki. Wróćmy teraz na ziemię i zastosujmy te pomysły do prostego przykładu. Najprostszym przypadkiem zmiennej losowej jest „losowa stała,” gdzie X przybiera pewną ustaloną wartość x z prawdopodobieństwem 1. W tym przy padku Gx(z) = zx i ln G x (et ) = xt. Tak więc wartość oczekiwana wynosi x i wszystkie inne półniezmienniki są równe zeru. Z tego wynika, że operacja mnożenia ftp przez zx zwiększa wartość średnią o x, a wariancję i wszystkie inne półniezmienniki zostawia nie zmienione. Co się dzieje, gdy funkcje tworzące zastosujemy do problemu rzucania kośćmi? Rozkład oczek na jednej (wyważonej) kości ma ftp postaci nl ^ Z + Z2 + Z 3 + Z 4 + Z 5 + Z 6 G(z) = ----------------- ------------------ = zU6(z), gdzie Ug jest ftp dla rozkładu jednostajnego 6-tego rzędu. Współczynnik ‘z’ dodaje 1 do wartości średniej, tak że wynosi ona 3,5 a nie = 2 ,5, jak jest w (8.35). Ale to extra ‘z ’ nie wpływa na wariancję (8.36), która wynosi f | . Ftp dla sumy oczek w dwóch niezależnych rzutach jest kwadratem ftp dla oczek na jednej kości, z2 + 2z3 + 3z4 + 4z5 + 5z6 + 6z7 + 5z8 + 4z9 + 3 Z 10 + 2 Z 1 1 + z 12 = ------------------------------------------36-----------------------------------------= z2U 6(z)2 . Jeśli rzucamy parą wyważonych kości rt razy, to prawdopodobieństwo tego, że otrzymamy w sumie k oczek, wynosi [zk]Gs (z)n = [z*]z2nU 6(z)2n = [zk- 2n]Us(z)2n. W rozważanym wcześniej problemie podrzucanych kapeluszy, znanym również jako problem zliczania punktów stałych losowej permutacji, wiemy z ( 5 .4 9 ), że ftp wynosi F- (z) = L O^k^n ii ( n - k ) ! k! dlanÔ . (8 .53 ) Dlatego (n —Tc) i p;(z) = = z k_1 Y. ( n - 1 - k ) i zk (n —1 —k)! k! 0^k^n-1 v J y = F n -l(z ). Bez dokładnej znajomości współczynników możemy z tej zależności otrzymać rekurencję F^(z) = Fn_i (z), tak że Fnm)(z) = Fn_ m(z). Stąd otrzymujemy F^>(1) = Fn_m(1) = [n ^ m ], (8 .54 ) Wzór ten bardzo ułatwia obliczanie wartości średniej i wariancji. Podobnie jak poprzednio (ale szybciej), możemy stwierdzić, że są one równe 1 , gdy n ^ 2. Tak naprawdę można nawet pokazać, że m-ty półniezmiennik K m dla tej zmiennej losowej wynosi 1 dla każdego n ^ m. Dzieje się tak, ponieważ m-ty półniezmiennik zależy tylko od F^(1), F"(1), . . . , F^m) (1), a one wszystkie są równe 1. Otrzymujemy więc taką samą wartość na m-ty półniezmiennik, jak gdybyśmy zamienili Fn (z) przez granicę ftp - F oo(z) = e z_1 , (8 .5 5 ) która ma F ^ 1(1) = 1 dla pochodnych, wszystkich rzędów. Wszystkie polniezmienniki Foo są tożsamościowo równe 1 , ponieważ lnFocfe*) = lnee*_1 = e t - 1 = ^ + ^ + ||- + ---. 8.4. R zu can ie m o n etą__________________________ Zajmiemy się teraz procesem, który ma tylko dwa wyniki. Gdy rzucamy mo netą, wówczas prawdopodobieństwo, że wypadnie orzeł, wynosi p, a prawdo podobieństwo wypadnięcia reszki wynosi q, gdzie p + q = 1 (Zakładamy tutaj że moneta nie stanie na kancie lub nie zginie nam nagle ze stołu itd.) W tym rozdziale liczby p i q będą się zawsze sumowały do 1. Jeśli moneta jest w yw ażona, to mamy p = q = \ \ w przeciwnym razie moneta jest niew y ważona. Funkcją tworzącą prawdopodobieństwa dla liczby orłów w jednym rzucie monetą jest H(z) = q + pz ( 8 .5 6 ) Kiedy rzucamy monetą n razy, zawsze zakładając, że każdy rzut wykonany jest niezależnie, wtedy liczba orłów jest generowana przez H(z)n = (q + p z )n = Y . n ' PV - kzk (8.57) kÔ zgodnie ze wzorem dwumianowym Newtona. Tak więc szansa wyrzucenia dokładnie k orłów w n rzutach wynosi (£)p kqn_lc. Ten ciąg prawdopodo bieństw dla k = 0 , 1 , . . . ,rt nazywa się rozkładem dwumianowym. Przypuśćmy, że rzucamy monetą, dopóki nie wyrzucimy pierwszego orła. Jakie jest prawdopodobieństwo, że będziemy potrzebowali dokładnie k rzu tów? Mamy k = 1 z prawdopodobieństwem p (ponieważ takie jest prawdopo dobieństwo orła w pierwszym rzucie), mamy k = 2 z prawdopodobieństwem qp (ponieważ takie jest prawdopodobieństwo, że w pierwszym rzucie będzie reszka, a w drugim orzeł) i dla dowolnego k to prawdopodobieństwo wynosi qk - 1p. Tak więc funkcją tworzącą jest pz pz + qpz 2 + q2 pz 3 + ( 8 .5 8 ) 1 — qz Powtarzając ten proces, dopóki nie wyrzucimy n orłów, otrzymujemy ftp pz 1 — qz H ( n + ,k - 1 )(<!*)* (8.59) Tak się składa, że jest to zn razy P 1 — qz = n ( n + ,k _ 1 ) p V z k ( 8 .6 0 ) funkcja tworząca dla ujemnego rozkładu dwumianowego. Przestrzeń losowa w przykładzie ( 8 .5 9 ), gdzie rzucamy monetą dopóty, dopóki nie wypadnie n orłów, różni się od przestrzeni losowych, które widzie liśmy wcześniej w tym rozdziale, ponieważ zawiera ona nieskończoną liczbę Zawodowiec wie, że p « 0 ,1 , gdy rzucisz świeżo wybitą amerykańską jednocentówką (rozkład ciężaru powoduje, że Lincoln wypada na dół.) Orzeł ja wygrywam, reszka ty przegrywasz. Nie? OK; reszka ty przegrywasz, orzeł ja wygrywam. Nie? Dobrze, to orzeł ty przegrywasz, a reszka ja wygrywam. elementów. Każdy element jest skończonym ciągiem orłów i reszek zawiera jącym w sumie dokładnie rt orłów i kończącym się orłem. Prawdopodobień stwo wystąpienia takiego ciągu jest równe p TLqk_n, gdzie k — n jest liczbą reszek. Tak więc na przykład, jeśli będziemy oznaczać orły przez 0 i reszki przez R, to dla n = 3 ciąg R0RRR00 jest elementem przestrzeni losowej i jego prawdopodobieństwo wynosi qpqqqpp = p 3 q4. Niech X będzie zmienną losową z rozkładem dwumianowym ( 8 .5 7 ) i niech Y będzie zmienną losową z ujemnym rozkładem dwumianowym ( 8 .6 0 ). Oby dwa rozkłady zależą od rt i p. Wartością średnią X jest n H '(1) = np, ponie waż jego ftp jest H(z)n . Wariancja wynosi n(H "(1) + H'(1) —H '(1)2) = n[0 + ip—ip2) = nipą. ( 8 .6 1 ) Tak więc odchylenie standardowe wynosi V n p q . Gdy rzucamy monetą n razy, oczekujemy, że orzeł wypadnie około np ± y/n pą razy. Wartość średnia i wariancja dla Y mogą być znalezione w podobny sposób: Jeśli G(z) = 1 — qz ’ to mamy G'(z) = G"(z) = pq qz ) 2 ’ (1 - 2y ą 2 fl7i ^ (1 -— qz) Stąd G '(l) = p q /p 2 = q/p i G"(1) = 2pq 2/ p 3 = 2q 2/ p 2. Dlatego wartość średnia wynosi n q /p , a wariancją jest n q /p 2. Prostszym sposobem wyprowadzenia wartości średniej i wariancji dla Y jest użycie odwrotnej funkcji tworzącej F(z) = P = --S .z P P (8 .62 ) i zapisanie G(z)n = F(z)“ n . ( 8 .6 3 ) Wielomian F(z) nie jest funkcją tworzącą prawdopodobieństwa, ponieważ ma ujemne współczynniki. Jednakże spełnia on kluczowy warunek F(1) = 1. Tak więc F(z) jest formalnie dwumianem odpowiadającym monecie, dla której otrzymujemy orła z „prawdopodobieństwem” —q/p, a G(z) jest formalnie równoważne rzucaniu monetą —1 razy(!). Ujemny rozkład dwumianowy z parametrami (rt,p) może być więc traktowany jako zwykły rozkład dwu mianowy z parametrami (n ^ p ') = (—t l , —q/p ). Formalnie, wartość średnia musi więc wynosić n /p ' = (—n )(—q/p) = rtq/p, a wariancją będzie n /p ^ ' = (—rt) (—q /p ) (1 + q/p) = rtq/p2. To formalne wyprowadzenie używające ujemnych prawdopodobieństw jest poprawne, ponieważ wyprowadzenie dla zwykłych dwumianów było oparte na tożsamościach dotyczących formalnych szeregów potęgowych dla których założenie 0 ^ p ^ 1 nigdy nie było użyte. Przejdźmy do następnego przykładu: Ile razy trzeba rzucić monetą, żeby otrzymać dwa orły z rzędu? Przestrzeń losowa składa się teraz ze wszystkich ciągów o elementach 0 i R, które kończą się 00 i nie mają pary 0 poza ostatnią pozycją: Cl = {00, R00, RR00,0R00, RRR00, R0R00, 0RR00,. . . } . Prawdopodobieństwo dowolnego ciągu można uzyskać zastępując 0 przez p i R przez q. Na przykład ciąg R0R00 wystąpi z prawdopodobieństwem Pr(ROROO) = qpqpp = p 3q2 . Możemy teraz zbadać funkcje tworzące, tak jak to robiliśmy na początku rozdziału 7. Niech S będzie sumą nieskończoną S = 00 + R00 + RR00 + 0R00 + RRR00 + R0R00 + 0RR00 + • • • 0 elementach z Cl. Jeśli zamienimy każde 0 przez pz i każde R przez qz, to otrzymamy funkcję tworzącą dla rozkładu prawdopodobieństwa liczby rzutów potrzebnych, żeby wyrzucić dwa orły z rzędu. Zachodzi ciekawa relacja pomiędzy S i liczbą ułożeń kamieni domina: T = H-D + ra + B + HD+ E + a H --- w równaniu ( 7 . 1 ). Zauważmy, że możemy otrzymać S z T, jeśli zastąpimy każde □ przez R i każde B przez 0R i na końcu dodamy 0 0 . Ta odpowiedniość jest łatwa do udowodnienia, ponieważ każdy element z Cl jest postaci (R + ORjÔO dla pewnego rt ^ 0 i każdy element z T ma postać (l]-bB)n . Tak więc z równania ( 7 .4 ) wynika, że s = (1 — R — 0R)~' 00 1 funkcją tworzącą prawdopodobieństwa w naszym problemie jest G(z) = ( 1 - q z - ( p z ) ( q z ) ) _ , (pz)2 1— qz — pqz2 ’ (8.64) Z ujemnym prawdo podobieństwem staję się coraz młodszy. Och! Tak więc z prawdopodobień stwem > 1 starzejesz się łub zostajesz w tym samym wieku. 8 .Prawdopodobieństwo dyskretne Doświadczenie z ujemnym rozkładem dwumianowym podpowiada nam, że wartość średnią i wariancję (8.64) możemy najłatwiej obliczyć, definiując G(z) = 7^ , F(z) gdzie 1 —qz —pqz^ Hz) = a potem wyznaczając „wartość średnią” i „wariancję” dla tej pseudo-ftp F(z). (Podobnie jak poprzednio, zachodzi F(1) = 1.) Otrzymujemy H i) = F"(1) = ( - q - 2 p q )/p 2 = 2 —p - 1 —p - 2 ; —2 p q /p 2 = 2 —2p _1 . Ponieważ z 2= F(z)G(z), Mean(z2) = 2 i Var(z2) = 0, więc otrzymujemy wartość średnią i wariancję dla G(z) Mean(G) = 2 —Mean(F) = p -2 Var(G) = —Var(F) -1 . = p “ 4 + 2 p' (8.65) 2p 2 —P 1 (8.66) Dla V — \ wartość średnia i wariancja wynoszą odpowiednio 6 i 22. (Ćwicze nie 4 omawia obliczanie wartości średniej i wariancji za pomocą odejmowa nia.) Zajmijmy się teraz bardziej skomplikowanym doświadczeniem: Rzucamy monetą, dopóki nie wypadnie po raz pierwszy wzorzec R0RR0. Układy wy grywające są teraz następujące: S = R0RR0 + 0R0RR0 + RR0RR0 + 00R 0R R 0 + 0RR0RR0 + R0R0RR0 + RRR0RR0 H-------; „ ‘You really aie an autom aton — a calculating machinę, ’ I cried. ‘There is something p o sitively inhuman in you at times J.H .W atson [84] Ta suma jest trudniejsza do opisania niż poprzednia. Jeśli zastosujemy me todę, z której korzystaliśmy rozwiązując problem domina w rozdziale 7, to możemy otrzymać wzór na S, gdy będziemy patrzyli na to jak na „język stanów skończonych” zdefiniowany przez następujący „automat”: Zdarzeniami elementarnymi w tej przestrzeni losowej są ciągi składające się z 0 i R, które prowadzą ze stanu 0 do stanu 5. Przypuśćmy że właśnie wy rzuciliśmy ROR; jesteśmy wówczas w stanie 3. Wyrzucenie reszki prowadzi do stanu 4 , natomiast wyrzucenie orła w stanie 3 prowadziłoby do stanu 2 (a nie do początkowego stanu 0, ponieważ po ostatnio wyrzuconym RO mogłoby wystąpić RRO). Używając tej terminologii, możemy zapisać jako sumę wszystkich cią gów o elementach 0 i R, które prowadzą ze stanu 0 do stanu k. Tak więc 50 = 1 + So 0 + S2 0 , 51 — So R Si R -j- S4 R, 5 2 = Si 0 + S3 0 , s3 = s 2 r , s4 = s 3 r , S5 = S4 O. Suma S w naszym przypadku jest równa S5 . Możemy ją otrzymać przez rozwiązanie powyższych sześciu równań z sześcioma niewiadomymi So, Si, . . . , S5 . Zastępując 0 przez pz i R przez qz otrzymujemy funkcje tworzące, których współczynnikami przy zn w S^ są prawdopodobieństwa, że jesteśmy w stanie k po u rzutach. Podobnie, dowolny diagram przejść pomiędzy stanami, w którym przej ście ze stanu j do stanu k następuje z prawdopodobieństwem p j>lc, prowa dzi do zbioru równań liniowych, których rozwiązaniami są funkcje tworzące prawdopodobieństwa, że dany stan zostanie osiągnięty po n krokach. Sys temy tego typu są nazywane procesam i Markowa, a teoria ich zachowań jest ściśle związana z teorią równań liniowych. Problem rzutów monetą może być jednak rozwiązany w znacznie prostszy sposób, bez dość skomplikowanego podejścia, jakim jest użycie automatów skończonych. Zamiast sześciu niewiadomych So, S 1 , . . . , S5 , możemy opisać S za pomocą tylko dwóch niewiadomych. Cały pomysł polega na rozważaniu pomocniczej sumy N = So + Si + S2 + S3 + Są wszystkich ciągów, które nie zawierają wystąpienia danego wzorca RORRO: N = 1 + 0 + R + 00 -(-••• + R0R0R -f- RORRR -f- • • • . Mamy 1 + N ( 0 + R) = N + S , ( 8 .6 7 ) ponieważ każdy składnik po lewej stronie albo kończy się na RORRO (i należy do S), albo nie (i należy do N). I odwrotnie, każdy składnik po prawej stronie jest albo pusty, albo należy do N 0 lub N R. Mamy także ważny dodatkowy wzór N RORRO = S + SRRO, ( 8 .6 8 ) ponieważ każdy składnik po lewej stronie staje się pewnym wyrazem z S albo po ostatnim 0 , albo po przedostatnim 0 i ponieważ każdy składnik z prawej strony należy też do lewej strony. Teraz łatwo można uzyskać rozwiązanie tych dwóch równań. Z równo ści (8 .6 7 ) mamy N = (1 — S)(l — 0 —R) - 1 i stąd (1 - S ) ( 1 - R - 0 ) - 1 RORRO = S(1+R R 0). Tak jak poprzednio, otrzymujemy funkcję tworzącą G(z) na liczbę rzutów, jeśli zastąpimy 0 przez pz i R przez qz. Ponieważ p + q = 1, więc wszystko nam się upraszcza: (1 — G(z)) p2q3z5 2 3 -i-------- r -i ----------- = G(z) (1 + p q z ) I —Z i stąd rozwiązaniem jest p2q3z5 + (1 + pq2z3)(1 — z) ’ (8-^9) Zauważmy, że dla pq ^ 0 zachodzi G(1) = 1: w końcuotrzymamy wzorzec RORRO, z prawdopodobieństwem 1, chyba że moneta jest tak oszukana, że zawsze wypadnie orzeł lub zawsze wypadnie reszka. Żeby otrzymać wartość średnią i wariancję dla rozkładu ( 8 ,6 9 ), odwróci my G(z), tak jak to już robiliśmy w poprzednim problemie, zapisując G(z) = z 5/F(z), gdzie F jest następującym wielomianem: F(z) = p2q3z5 + (1pt qPaq2z3)(1~ Z) • (8.70) Odpowiednie pochodne są następujące: F'(1) = 5 — (1 + pq2) / p 2q3 , F "(1) = 20 — 6pq2/ p 2q3 . Jeśli X jest zmienną losową opisującą liczbę rzutów, to EX = Mean(G) = 5 —Mean(F) = p - 2 q- 3 + p _1 q _1 ; VX = Var(G) = -Var(F) ( 8 .7 1 ) = - 2 5 + p - 2 q - 3 + 7p~' q - 1 + Mean(F) 2 = (EX)2 - 9p - 2q - 3 - 3p - ' q -' . (8.72) Dla V — \ wartość średnia i wariancja wynoszą odpowiednio 36 i 996. Spróbujmy to uogólnić: Problem, który właśnie rozwiązaliśmy, był na tyle „losowy,” że pokazuje, jak analizować sytuację, w której czekamy na pierwsze wystąpienie dowolnego wzorca A orłów i reszek. Tak jak dotychczas, niech S będzie sumą wszystkich zwycięskich ciągów o elementach 0 i R, i niech N będzie sumą wszystkich ciągów, w których nie otrzymaliśmy jeszcze wzorca A. Wzór ( 8 .6 7 ) pozostanie nie zmieniony, a wzór ( 8 .6 8 ) będzie wyglądał na stępująco: NA = S ( H - A ( 1) [A(m- , ) = A (m_ 1)] + A (2 ) [A(m- 2 ) = A (m_ 2)] + . . . + A ( m - D [A( i ) = A ( l ) ] ) i (8.73) gdzie m oznacza długość A i gdzie A |k) i A(k] oznaczają odpowiednio k ostatnich i k pierwszych elementów z A. Na przykład jeśli A jest wzorcem RGRRO, który właśnie analizowaliśmy, to otrzymamy A (1) = 0 , A (2) = R0 , A (3) = RRO, A (4) = 0RR0; A(i) = R, A( 2 ) — R0, ^(3) = ROR, A( 4 ) = RORR. Ponieważ pełna zgodność występuje tylko dla A ^ = A( 2 ), więc równanie ( 8 .7 3 ) redukuje się do ( 8 .6 8 ). Niech A będzie wynikiem podstawienia p _1 za 0 i q _1 za R we wzorcu A. Nietrudno jest wówczas uogólnić wyprowadzenie równań ( 8 .7 1 ) i (8 .7 2 ) tak, aby wywnioskować (ćwiczenie 2 0 ), że wartość średnia i wariancja wynoszą m EX = ^ A ( k | [ A ® = A (ij]; (8 .7 4 ) k= 1 m VX = (EX)2 - X ( 2 k - 1 ) A (k )[A<k> = A (1c)]. ( 8 .7 5 ) k= 1 W szczególnym przypadku, gdy p = \ , możemy interpretować te wzory w wyjątkowo prosty sposób. Dla danego wzorca A o m orłach i reszkach, niech m A : A = ^ 2 M [A,k l= A |k)]. ( 8 .7 6 ) k= 1 Łatwo możemy znaleźć rozwinięcie dwójkowe tej liczby. Stawiamy ‘V na da nej pozycji reprezentacji dwójkowej wtedy, gdy wzorzec przesunięty do tej pozycji pokryje się z samym sobą aż do końca. A = 0R 0 R 00R 0R 0 A :A = (1000010101)2 = 5 1 2 + 16 + 4 + 1 = 5 3 3 0R 0 R 0 0 R 0R 0 V 0R 0 R 0 0 R 0R 0 0R 0R 00R 0R 0 0R 0 R 0 0 R 0R 0 0 R 0R 00R 0R 0 0R 0 R 0 0 R 0R 0 >/ 0R 0R 00R 0R 0 0R 0 R 0 0 R 0R 0 V OROROORORO OROROORORO „ 1leM óojibwe nepuodoe y nam ezo cjioea, meM no3Dtce oho nosiejistemcft”. A .J l. Cojioebee Oczywiście . że nie! Nad kim by m ie li wykazać tę swoją przewagę? V Wzór ( 8 .7 4 ) oznacza teraz, że oczekiwana liczba rzutów aż do wystąpienia wzorca A wynosi dokładnie 2(A:A), przy założeniu, że używamy monety wyważonej. Wynika to stąd, że A(k) = 2k, w przypadku gdy p = q = Wynik ten, pokazany po raz pierwszy przez rosyjskiego matematyka A. D. Sołowiewa w roku 1966 [332], wydaje się na pierwszy rzut oka paradoksalny: Wzorce, które nie nakładają się na siebie, występują częściej, niż wzorce nakładające się na siebie! Oczekiwanie na wyrzucenie 0 0 0 0 0 zajmuje prawie dwa razy tyle czasu co oczekiwanie na wyrzucenie 0 0 0 0 R lub R 0 0 0 0 . Zajmijmy się teraz zabawną grą wymyśloną w 1 9 6 9 r. przez Waltera Penneya [2 9 0 ]. Alice i Bill rzucają monetą tak długo, aż wypadnie 00R lub 0RR. Alice wygrywa, gdy wzorzec 00R wypadnie jako pierwszy, natomiast Bill, gdy jako pierwsze wypadnie 0RR. Ta gra— obecnie nazywana „grą Penneya” — oczywiście wydaje się być fair (przy założeniu że rzuca się monetą wyważoną), ponieważ traktowane oddzielnie obydwa wzorce 0 0 R i 0RR wyglądają bardzo podobnie. Funkcja tworząca dla czasu oczekiwania na pierwsze wystąpienie 0 0 R wynosi tak samo jak dla 0RR. Dlatego ani Alice, ani Bill nie mają żadnej przewagi, gdy grają samotnie. Zachodzi jednak ciekawe wzajemne oddziaływanie pomiędzy tymi wzor cami, gdy analizujemy obydwa równocześnie. Niech Sa będzie sumą wygra nych układów dla Alice i niech S b będzie sumą wygranych układów dla Billa: SA = OOR + 000R + ROOR + 0000R + 0R00R + R000R + • • • ; SB = ORR + RORR + ORORR + RRORR + RORORR + RRRORR + • • • . Tak więc— korzystając z metody użytej do analizy tylko jednego wzorca— oznaczmy przez N sumę ciągów takich, że żaden z graczy jeszcze nie wygrał: N = 1 + 0 + R + 00 + OR + RO + RR + 000 + 0R0 + R00 + • • • . ( 8 .7 7 ) Teraz możemy łatwo sprawdzić następujące tożsamości: 1 + N ( 0 + R) = N + Sa + S b ; N OOR = SA ; (8 .7 8 ) NORR = Sa R + Sb . Jeśli podstawimy tutaj 0 = R = j , to uzyskana wartość dla Sa będzie ozna czała prawdopodobieństwo wygrania przez Alice, natomiast w przypadku Sb będzie oznaczała prawdopodobieństwo wygranej Billa. Te trzy równania re dukują się do 1 + N = N + Sa + S b ; jN = Sa ; |N = l S A + SB ; i możemy stąd uzyskać Sa = f i S b = Alice będzie wygrywała dwa razy częściej niż Bill! W uogólnieniu tej gry Alice i Bill wybierają wzorce A i B orłów i reszek, a następnie rzucają monetą dopóty, dopóki nie wypadnie A albo B. Obydwa wzorce nie muszą mieć tej samej długości, ale założymy, że ani A nie wy stępuje wewnątrz B, ćmi B nie występuje wewnątrz A (W przeciwnym razie suma byłaby zdegenerowana. Na przykład dla A = 0 R i B = R0 R0 , biedny Bill nie mógłby nigdy wygrać; dla A = 0 R0 i B = R0 obydwoje graczy mo głoby równocześnie stwierdzić zwycięstwo.). Wówczas, analogicznie do ( 8 .7 3 ) i ( 8 .7 8 ), możemy utworzyć trzy równania: 1 + N ( 0 + R) = N + Sa + S b ; 1 m in(l,m ) NA = SA ^ A (l- 1c )[A*'c> = A (k)] + SB ^ k= 1 m in(l,m ) NB = SA Ż k= 1 A (l_k) [B(k>= A (1c)] ; k=l m [A<k> = B (k)] + SB B(m- k) [B(k) = B (Ic)] . k= 1 (g-79) Tutaj l jest długością wzorca A, a m jest długością wzorca B. Na przykład gdy A = 0RR0R0R0 i B = R0R0RR0, otrzymujemy dwa równania niezależne od wzorców: N 0 RR0 R0 R0 = SA RR0 R0 R0 + SA + SB RR0R0R0 + SB RORO ; N R0 R0 RR0 = SA RORRO + SA RR0 + S B RORRO + SB • Prawdopodobieństwa sukcesów możemy uzyskać za pomocą podstawienia 0 = R = 1, przy założeniu, że używamy monet wyważonych. To daje spro wadzenie tych dwóch równań do l m i n ( l ,m ) N = S A ^ 2 k [A<k> = A (k)] + SB k= 1 Y. 2k [B(k)= A (k)]; k= 1 (8 .8 0 ) m i n ( l ,m ) N = SA Y m 2k [A<k> = B ,k)] + S B ] “ 2k [B<k> = B (k)]. k= 1 k= 1 Możemy teraz zobaczyć, co się dzieje, gdy uogólnimy zdefiniowaną za pomocą wzoru ( 8 .7 6 ) operację A:A do funkcji dwóch niezależnych ciągów A i B: m i n ( l ,m ) A:B = Y 2k-'[A < k’ = B ,k)]. ( 8 .8 1 ) k=l Równania ( 8 .8 0 ) uproszczą się: S a (A:A) + S b (B:A) = Sa (A:B) + S b (B:B) ; Szanse na korzyść Alice wynoszą SA _ B:B — B:A Ś 7 ~~ A:A - A:B ' ( 8 .8 2 ) (Ten piękny wzór został odkryty przez Johna Hortona Conwaya [137].) Na przykład gdy jak wyżej A = 0RR0R0R0 i B = R0R0RR0, otrzymujemy A:A = (10000001)2 = 129, A:B = (0001010) 2 = 10, B:A = (0001001 ) 2 = 9 i B:B = ( 1 0 0 0 0 1 0 ) 2 = 6 6 . Tak więc iloraz SA/ S B wynosi ( 6 6 —9 )/(1 2 9 — 1 0 ) = 57/119. Alice wygra w 176 grach średnio tylko 57 razy. Dziwne rzeczy mogą się zdarzyć w grze Penneya. Na przykład wzorzec 00R0 wygrywa z wzorcem 0R00 w stosunku 3 /2 i wzorzec 0R00 wygrywa z wzorcem R000 w 7/5 przypadkach. Tak więc 00R0 powinno być dużo lep sze niż R000. Jednakże R000 wygrywa z 00R0 w stosunku 7/5! Relacja lepszości pomiędzy wzorcami nie jest przechodnia. W rzeczywistości ćwicze nie 57 dowodzi, że jeśli Alice wybierze dowolny wzorzec Ti T2 . . . Ti długości 1 ^ 3 , ‘Bill może zawsze mieć większe szanse wygrania, gdy wybierze wzorzec T2 TiT2 .. .T i_ i, gdzie T2 jest orłowo-reszkową odwrotnością T2 . 8.5. H aszow anie________________________________ Podsumujmy ten rozdział zastosowaniem rachunku prawdopodobieństwa w programowaniu. Kilka ważnych algorytmów składowania i wyszukiwania in formacji wewnątrz komputera opiera się na technice zwanej „haszowaniem.” Będziemy się teraz zastanawiali nad metodami przechowywania ciągu rekor dów zawierających „klucz” K i pewne dane D(K) o kluczu, tak żeby mając dane K szybko wyszukać D(K). Na przykład każdy klucz może być nazwi skiem studenta, a związane z nim dane mogą być stopniami uzyskanymi z zadań domowych. W praktyce pamięć komputera nie ma wystarczającej pojemności, żeby poświęcić jedną jej jednostkę na każdy możliwy klucz. Możliwe są miliar dy kluczy, ale w konkretnym zastosowaniu występuje stosunkowo niewielka ich liczba. Jedną z możliwości jest przechowywanie dwóch tablic KEY [j] i DATA [j] dla 1 ^ j ^ N, gdzie N jest maksymalną liczbą rekordów, które mogą być jednocześnie zapamiętane. Inna zmienna n określa, ile kluczy jest rzeczywiście przechowywanych. Wówczas możemy szukać danego klucza K przez przejrzenie tablicy w oczywisty sposób: 51 Niech j := 1. (Szukaliśmy już po wszystkich pozycjach < j.) 52 Jeśli j > rt, to stop. (Nie ma danego klucza.) 53 Jeśli KEY[j] = K, to stop. (Znaleziono klucz.) 54 Zwiększ j o l i wróć do kroku S2 . (Próbujemy dalej.) Po udanym przeszukaniu dane D(K), które chcieliśmy znaleźć, znajdują się w DATA [j ]. Gdy nie znaleźliśmy danego klucza, wówczas możemy wstawić K wraz z D(K) do tablicy przez przypisanie rt := j, KEY [tl] := K, DATA [rt] := D(K), przy założeniu, że jeszcze nie przekroczyliśmy pojemności pamięci. Opisana metoda działa, jednakże może się zdarzyć, że będzie ona strasz nie powolna: przy każdym nieudanym przeszukiwaniu krok S2 musimy po wtórzyć rt + 1 razy, a rt może być dość duże. Haszowanie zostało wprowadzone w celu przyspieszenia tego procesu. Podstawowy pomysł, w jednej z popularnych postaci, opiera się na użyciu m oddzielnych list, a nie jednej gigantycznej listy. „Funkcja haszująca” wy licza dla każdego możliwego klucza K numer listy H(K) pomiędzy 1 i m. W pomocniczej tablicy element FIRST [ i ] , dla 1 ^ i ^ m, wskazuje na pierwszy rekord listy i. Kolejna pomocnicza tablica NEXT[j], dla 1 ^ j ^ N, wskazuje „Jakoś tak wyszło, że co prawda czasownik (to hash ’ ( ‘haszować’) w połowie la t 60-tych sta ł się standardowym określeniem te j m etody przechowywania kluczy, to n ik t nie odważył się użyć go publicznie przed rokiem 1967.” D. E. K n u th [209] Prawdopodobieństwo dyskretne na rekord następujący po rekordzie j na tej liście. Zakładamy, że FIRST [i] = -1 , NEXT [j] = 0, gdy lista i jest pusta; gdy rekord j jest ostatni na liście. Jak poprzednio, mamy zmienną n mówiącą, ile rekordów łącznie jest prze chowywanych. Przypuśćmy na przykład, że w danym momencie klucze są imionami i że mamy cztery listy odpowiadające pierwszym literom imion: H(imię) = 1, 2, 3, 4, dla A-F; dla G-L; dla M-R; dla S-Z. Zaczynamy z czterema pustymi listami i z n = 0. Jeśli, powiedzmy, pierwszy rekord ma jako klucz imię Nora, to mamy H(Nora) = 3, tak więc Nora staje się kluczem pierwszego elementu na liście 3. Jeśli dwoma następnymi imionami są Glenn i Jim, to obydwa umieszczone zostaną na liście 2. Tablice w pamięci wyglądają teraz następująco: FIRST [1] == - 1 , FIRST [2] = 2, FIRST [3] = 1, KEY[1] = Nora, NEXT[1] = 0 KEY[2] KEY[3] Zobaczymy je tu na pamiątkę siedzących w pierwszych rzędach studentów M atem atyki Konkretnej, k tó rz y użyczyli swoich im ion do tego doświadczenia. = Glenn, NEXT[2] = Jim, FIRST [4] = - 1 . = 3 NEXT[3] = 0 ; rt = 3. (Wartości DATA[1], DATA[2] i DATA [3] są tajne i nie będziemy ich przedsta wiali.) Po wstawieniu 18 rekordów na listach mogłyby się znaleźć imiona lista 1 Dianne Ari Brian Fran Doug lista 2 Glenn Jim Jennifer Joan Jerry Jean lista 3 lista 4 Nora Mike Michael Ray Paula Scott Tina i imiona te występowałyby wymieszane w tablicy KEY wraz ze wskaźnikami NEXT. Gdybyśmy chcieli szukać Johna, musielibyśmy przejść przez sześć imion z listy 2 (która okazuje się najdłuższą listą), ale jest to nieporównanie lepiej niż przejrzenie wszystkich 18 imion. Poniżej zamieszczamy precyzyjny specyfikację algorytmu, który wyszu kuje klucz K według tego schematu. H I Podstaw i := h(K) i j := FIRST [ i ] . H 2 J eśli) ^ 0 to stop. (Nie ma danego klucza.) H 3 Jeśli KEY[j] = K to stop. (Znaleziono klucz.) H 4 Podstaw i := j, potem podstaw j := NEXT[i] i wróć do kroku H2. (Pró bujemy dalej.) Na przykład żeby w powyższym przykładzie wyszukać Jennifer, krok HI ustawiłby i := 2 i j := 2, krok H3 stwierdziłby że Glenn ^ Jennifer; krok H4 ustawiłby j := 3 i krok H3 znalazłby Jim ^ Jennifer. Następna iteracja kroków H4 i H3 zlokalizowałaby Jennifer w tablicy. Po udanym wyszukiwaniu interesujące nas dane D(K) znajdują się w DATA[j], tak jak w poprzednim algorytmie. Po nieudanym wyszukiwaniu możemy wstawić K i D(K) do tablicy, wykonując następującą operację: n := n + 1 ; if j < 0 then FIRST [i] := n else NEXT [i] :=n; KEY[n] := K; DATA[n] := D(K); NEXT[n] := 0. ( 8 .8 3 ) W tym momencie tablica będzie znowu aktualna. Mamy nadzieję, że otrzymamy listy mniej więcej tej samej długości. Da łoby to nam czas wyszukiwania około m razy krótszy. Wartość m jest z reguły znacznie większa niż 4, tak więc współczynnik 1/m będzie znaczącym ulepszeniem. Początkowo nie wiemy, jakie otrzymamy klucze, ale można wybrać funk cję haszującą H tak, że będziemy mogli uznać h(K) jako zmienną losową, któ rej wartości są jednostajnie rozłożone w przedziale od 1 do m, niezależnie od wartości innych kluczy, które otrzymaliśmy. W takich przypadkach oblicze nie funkcji haszującej odpowiada rzucaniu kością o m ścianach. Jest szansa, że wszystkie rekordy zawsze będą wpadały do tej samej listy, podobnie jak i jest szansa, że kości zawsze będą wskazywały [ 0 . Ale teoria rachunku praw dopodobieństwa mówi nam, że listy będą praw ie zaw sze wyważone całkiem równomiernie. Analiza haszowania: wprowadzenie „Analiza algorytmów” jest gałęzią informatyki, która analizuje ilościową in formację o skuteczności metod informatycznych. „Probabilistyczna analiza algorytmu” bada czas działania algorytmu, przy czym czas ten traktowany jest jako zmienna losowa zależna od charakterystyki danych wejściowych. Ha szowanie jest szczególnie dobrym kandydatem do analizy probabilistycznej, ponieważ jest ono wyjątkowo skuteczne w średnim przypadku, mimo że w najgorszym przypadku jest zbyt złe, żeby nawet o nim myśleć. (Najgorszy przypadek wystąpi wtedy, gdy wszystkie klucze będą miały taką samą war Zakładam się, że ich rodzice cieszą się z tego. tość funkcji haszującej.) Faktycznie, dla programisty używającego haszowania byłoby lepiej, gdyby wierzył w rachunek prawdopodobieństwa. Oznaczmy przez P liczbę wykonań kroku H3 w czasie wyszukiwania w powyższym algorytmie. (Każde wykonanie kroku H3 będziemy nazywali „po równaniem” w tablicy.) Jeśli znamy liczbę porównań P, to wiemy, jak często jest wykonywany każdy krok, w zależności od tego, czy wyszukiwanie było udane czy nie: Krok HI H2 H3 H4 Nieudane wyszukiwanie Udane wyszukiwanie 1 raz P + 1 razy P razy P razy 1 raz P razy P razy P — 1 razy Tak więc głównym wskaźnikiem rzutującym na czas wyszukiwania jest liczba porównań P. Możemy przedstawić działanie algorytmu wyobrażając sobie książkę ad resową, która jest zorganizowana w specjalny sposób, z miejscem na jeden adres na każdej stronie. Na okładce książki notujemy stronę pierwszego ad resu każdej z m list. Każda nazwa K wyznacza listę H(K), do której ona należy. Każda strona w książce zawiera odnośnik do następnej strony ze swojej listy. Liczba zajrzeń potrzebna do znalezienia adresu w takiej książce jest liczbą stron, które musimy sprawdzić. Jeśli wstawiliśmy n adresów, to ich pozycje w tablicy zależą tylko od odpowiednich wartości funkcji haszującej, (Hi ,łi 2 , . . . ,Hn ). Zakładamy, że każdy z m n możliwych ciągów (H i, H2 , . . . , Hn) jest tak samo prawdopodobny i P jest zmienną losową zależną od takiego ciągu. Przypadek 1: K lucza nie m a Z a jrz y j pod wycieraczkę. $ Omówimy najpierw zachowanie się wartości zmiennej P w nieudanym wyszu kiwaniu, przy założeniu, że do tablicy haszującej włożyliśmy rt rekordów. W tym przypadku odpowiednia przestrzeń losowa składa się ze rrtn +1 zdarzeń elementarnych cu = (Hi, H2 , . . . , Hn,, Hn_(-i ), gdzie Hj jest wartością funkcji haszującej j-tego wstawionego klucza, nato miast Hu+i jest wartością funkcji haszującej klucza, którego wyszukiwanie okazało się nieudane. Założymy, że funkcja haszująca została wybrana wła ściwie, tak że dla każdego cu, Pr(cu) = 1/m n+1. Na przykład gdy m = rt = 2, mamy osiem jednakowo prawdopodobnych możliwości: Jeśli Hi = hz = H3 , to wykonujemy dwa nieudane porównania, zanim stwierdzimy, że nie ma nowego klucza K; jeśli Hi = h 2 ^ H3 , nie wykonujemy żadnego, i tak dalej. Ta lista wszystkich możliwości pokazuje, że dla m = n = 2, P ma rozkład prawdopodobieństwa dany przez ftp ( | + | z + | z 2) = Cz + i z )2* Przy wyszukiwaniu nieudanym wykonujemy jedno porównanie z każdym elementem z listy numer Hn+i , otrzymamy więc ogólny wzór P = [Hi = H n+i] + [h2 = Hn + 1 ] + • • • + [Hu = Hn-i-i ]. ( 8 .8 4 ) Prawdopodobieństwo tego, że Hj = Hn+i , wynosi 1/m , dla 1 ^ j ^ rt. Stąd wynika, że EP = E[H1= h n+1] + E[h2 = h n+1] + --- + E[hn = h u+1] = m Może powinniśmy przedstawić to jeszcze raz odrobinę wolniej: Niech Xj bę dzie zmienną losową Xj = Xj (o>) = [Hj ^ H tl+ i ] . - Wówczas P = Xi H1- Xn i EXj — 1/m dla wszystkich j ^ n. Stąd EP = EXi H------------+ EXn = n /m . Dobrze: Tak jak myśleliśmy, średnia liczba porównań wynosi 1/m razy tego, co byśmy uzyskali bez haszowania. Co więcej, zmienne losowe Xj są niezależne i wszystkie mają taką samą funkcję tworzącą v M _ m -1 + z X’(Z) “ m ’ dlatego ftp dla całkowitej liczby porównań w nieudanym wyszukiwaniu wy nosi TH — 1 A- 7\ri ( — m — ) / • ( 8 .8 5 ) 8 .Prawdopodobieństwo dyskretne Otrzymujemy więc rozkład dwumianowy z p = l / m i q = (m — 1}/m . In nymi słowy, liczba porównań w nieudanym wyszukiwaniu jest taka sama jak liczba orłów, gdy rzucamy niewyważoną monetą, w której prawdopodobień stwo wyrzucenia orła wynosi ^/m w każdym rzucie. Wzór ( 8 .6 1 ) mówi nam też, że wariancją P jest rtpq = rt(m — 1 ) nv Dla dużego m wariancja P wynosi mniej więcej n /m , tak że odchylenie stan dardowe jest w przybliżeniu równe y / n / m. W porządku, g łu p i właściciel, myślimy, i spokojnie się włam ujem y do mieszkania. Przypadek 2: Klucz jest Zajmiemy się teraz udanym wyszukiwaniem. W tym przypadku odpowied nia przestrzeń losowa jest odrobinę bardziej skomplikowana, w zależności od naszych zastosowań. Niech £1 będzie zbiorem zdarzeń elementarnych (8 .86) gdzie, podobnie jak poprzednio, Hj jest wartością funkcji haszującej dla j-tego klucza, k zaś jest indeksem szukanego klucza (klucza, którego wartością funk cji haszującej jest hic). Tak więc mamy 1 ^ hj ^ m dla 1 ^ ^ n i 1 ^ k ^ n, i jest w sumie m rL-n zdarzeń elementarnych cu. Niech Sj będzie prawdopodobieństwem, że szukamy j-tego klucza, który został wstawiony do tablicy. Wówczas Pr(cu) = sic/mT (8.87) gdy cu jest zdarzeniem ( 8 .8 6 ). (W pewnych zastosowaniach częściej szukamy elementów, które zostały wstawione jako pierwsze, lub elementów, które zo stały wstawione jako ostatnie, tak więc nie będziemy zakładali, że każde Sj = l/n .) Zauważmy, że Pr(tu) = H k=i sk = 1, stąd wzór ( 8 .8 7 ) definiuje poprawny rozkład prawdopodobieństwa. Liczba porównań P w nieudanym wyszukiwaniu wynosi p, jeśli klucz K był p-tym kluczem wstawionym do listy. Dlatego P(Hi, . . . ,Hn,;k) = [Hi = Hic] + [H2 = H]C] + ••• + [H i^ H iJ , (8.88) lub, jeśli zdefiniujemy zmienną losową Xj jako [Hj = Hłc], otrzymujemy P = Xi + + • • • + Xk . - ( 8 .8 9 ) Przypuśćmy, że mamy na przykład m = 10 i n = 16, i ż e funkcja haszująca ma następujący „losowy” wzorzec: (Ht, , 1 1 - 1 6 ) = 3 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ; Gdzie ja ju ż widziałam ta k i wzorzec? (P t, . . . ,P 16) = 1 1 1 2 1 1 1 1 2 2 3 1 2 1 3 3 . Liczba porównań Pj potrzebna do znalezienia j-tego klucza znajduje się poniżej Hj. Równanie ( 8 .8 9 ) przedstawia P jako sumę zmiennych losowych, ale nie możemy po prostu obliczyć EP jako EXi + • • • + EXi<, ponieważ wartość k sama w sobie jest zmienną losową. Jaka jest funkcja tworząca dla P? Żeby odpowiedzieć na to pytanie, zrobimy na moment dygresję na temat praw do podobieństwa warunkowego. Jeśli A i B są zdarzeniami w przestrzeni losowej, to powiemy, że prawdo podobieństwo warunkowe A przy zadanym B wynosi __ , _, P r (c u e A n B ) Pr ( a > e A | a > e B ) = . (8.90) Na przykład jeśli X i Y są zmiennymi losowymi, to prawdopodobieństwo warunkowe zdarzenia X = x przy zadanym Y = y wynosi ■ <s »i > Dla ustalonego y z zakresu zmiennej losowej Y suma tych prawdopodobieństw warunkowych po wszystkich x z X wynosi P r(Y = y)/P r(Y = y) = 1. Dlatego ( 8 .9 1 ) definiuje rozkład zmiennej losowej i możemy zdefiniować nową zmienną losową łX|-y* taką, że Pr((X|-y) = x) = Pr(X = x | Y = y). Gdy X i Y są niezależne, zmienna losowa X\y będzie w zasadzie taka sama jak X, niezależnie od wartości y , ponieważ na mocy (8 .5 ) Pr(X = x | Y = y ) jest równe Pr(X = x); czyli jest dokładnie tak jak byśmy chcieli rozumieć nieza leżność. Ale jeśli X i Y są zależne, to zmienne losowe X\y i X \y ' niekoniecznie muszą być do siebie podobne w przypadku gdy y ^ y ' . Gdy X przybiera tylko nieujemne wartości całkowite, wówczas możemy rozbić jego ftp na sumę warunkowych ftp względem dowolnej innej zmiennej losowej Y: Gx (z) = Y . P r(Y = y )G X|„(z). yeY(n) ( 8 .9 2 ) Równość ta zachodzi, ponieważ współczynnik przy z 11 po lewej stronie wynosi Pr(X = x) dla wszystkich x e X(Q), a po prawej stronie jest równy Y y e r (O ) Pr(Y=x))Pr(X = x |Y = v ) = Y ye Y {ci) Pr(X = x i Y = y) Wzór ( 8 .43 ) również b ył dygresją zrobioną tylko na moment. 8. Prawdopodobieństwo dyskretne : ■ s f i l S i l 4 ®2 / Na przykład jeśli X jest iloczynem wyrzuconych oczek w rzucie parą kości i jeśli Y jest sumą wyrzuconych oczek, to ftp dla X |6 wynosi GX|«(z) = | z 5 + | z 8 + \ź* ponieważ prawdopodobieństwo warunkowe dla Y = 6 składa się z pięciu równoprawdopodobnych zdarzeń { 0 | g | , HICI>IZIIZI>ICIH)IEI 0 }- Rów" nanie (8.92) redukuje się w tym przypadku do Gx(z) = JgGx| 2 (z) + ^ G X|3(z ) + ^ G x |4 (z ) + ^ G x |5 (z) ^ G x | 6 (z) + ^ G X|7(z) + ^ G X|8 (z ) + ^ G X|9(z ) ^ G X|io (z ) + ^ G X|n (z ) + 3^GX|i 2 (z) » Och, teraz ju ż rozumiem, co m atem atycy m ają na myśli, g dy mówią że coś je s t „oczywiste,” J asne ” lub „ try w ia ln e ” wyrażenia, które będzie oczywiste, gdy tylko je raz zrozumiemy. (Koniec dygresji.) W przypadku haszowania wzór (8.92) mówi nam, jak zapisać ftp dla liczby porównań w udanym wyszukiwaniu, jeśli podstawim y X = P i Y = K. Dla dowolnego ustalonego k pom iędzy 1 i rt, zmienna losowa P |k jest zdefiniowana jako suma niezależnych zmiennych losowych Xi H------- b Xk, tak jak we wzorze (8.89). Tak więc ma ona następującą ftp: m — 1 + z \ k_1 „P rzez jasne mam na m yśli to, że d obry student pierwszego roku powinien być w stanie to zrobić, aczkolwiek nie je st to zupełnie tryw ialne Paul Erdós [94]. Stąd jest jasne, że ftp dla P wynosi Gp(z) = 2 > G Plk(z) k=1 Ti / m — 1 + z \ k_1 = k=1 5>( V m m J (8-93) gdzie S(z) = Si + s2 z + S3 Z 2 + • • • + sn z n ^ ( 8 .9 4 ) jest ftp dla prawdopodobieństw wyszukania sk (dla ułatwienia podzieloną przez z). Dobrze. Mamy funkcję tworzącą dla P, możemy teraz znaleźć jej war tość średnią i wariancję przez zróżniczkowanie. Dla uproszczenia usuniemy najpierw współczynnik z, tak jak to robiliśmy poprzednio, otrzymamy więc wartość średnią i wariancję dla P — 1: m — 1 + z' m / F(z) = GP(z)/z = s ( - ----- — ) ; v PW 1 ^ z / rrt — 1 + z' = m V \ mz m V m / / Zatem EP = 1+ Mean(F) = 1 + F '(1 ) = 1 + m " 1 M ean(S); VP = Var(F) = ( 8 .9 5 ) F"(l) + F'(1) —F '(l ) 2 = m _ 2 S"(1) + m _ 1 S/ (1) —mT 2 S'(1 ) 2 —m ~2 Var(S) + (m _1 —m - 2 ) M ean(S). ( 8 .9 6 ) Są to ogólne wyrażenia na wartość średnią i wariancję dla liczby porównań P, wyrażone za pomocą wartości średniej i wariancji założonego rozkładu wyszukiwania S. Przypuśćmy na przykład, że s* = 1/rt dla 1 ^ k ^ rt. Oznacza to, że robimy prawdziwie „losowe” udane wyszukiwanie, przy założeniu że każdy klucz może znajdować się w tablicy z takim samym prawdopobieństwem. Wówczas S(z) ma określony wzorem z ( 8 .3 2 ) rozkład jednostajny Un (z) i otrzymujemy Mean(S) = (rt — l)/2 , Var(S) = (n 2 — 1)/12. Stąd EP- ^ 1 + , ; . <8 .W> (m —1)(n —1) _ ( n —1)(6m + n —5} VP ~ l 2 ^ + -------t o ? ------- " ---------- 1 2 ^ ---------- • ( 8 -98) Jeszcze raz uzyskaliśmy pożądane przyspieszenie o czynnik 1/m . Gdy m « r t/ln n i rt —» oo, wówczas średnia liczba porównań w udanym wyszukiwa niu wynosi w tym przypadku około \ Inn, a odchylenie standardowe jest asymptotycznie równe (lnn)/V T 2 . Z drugiej strony, moglibyśmy przypuszczać, że = (kHn ) - 1 dla 1 ^ k ^ n. Taki rozkład jest nazywany „prawem Zipfa.” Wówczas Mean(S) = n /H n — 1 i Var(S) = j n { n + 1)/H n —n 2/H 2 . Średnia liczba porównań dla m « n /ln n , przy n —> oo, jest w przybliżeniu równa 2 , z odchyleniem standardowym dążącym do y/ l n n /y / 2 . W obydwu przypadkach analiza pozwala dojść do konkluzji, że listy będą krótkie, poza ekstremalnie rzadkimi przypadkami — zapewnia to nierówność Czebyszewa. Przypadek 2, kontynuacja: W arianty wariancji Właśnie obliczyliśmy wariancję dla liczby porównań w udanym wyszukiwaniu przez analizę zmiennej losowej P nad przestrzenią losową o m n •n elemen tach (Hi, . . . jHni k). Ale moglibyśmy też wybrać inne podejście: Każdy ciąg wartości haszowanych definiuje zmienną losową P| (Hi, . . . , Hn ), reprezentu jącą liczbę porównań w udanym wyszukiwaniu w zadanej tablicy haszującej z danymi n kluczami. Średnią wartość dla P| (Hi, . . . , Hn ), n A(hi , . . . , h j = ] T p - P r ( ( P | ( h . i , . . . , h n) ) = p ) , P (8 .9 9 ) =1 można traktować jako czas działania przy udanym wyszukiwaniu. Ta wartość A( Hi , . . . , Hn.) jest zmienną losową, która zależy tylko od (Hi, . . . , Hn ), a nie od ostatecznej wartości k. Możemy zapisać to w postaci Ti A ( h i , . . . ,Hn ) = y Sfc P(H~i, . . . , łin,; k ) , k= 1 gdzie P ( h i , . . . jKajk) jest zdefiniowane za pomocą wzoru (8 .8 8 ), ponieważ PI (Hi, . . . , Hn.) = p z prawdopodobieństwem I L i Pr(P(H 1 ) . . . , H n ; k ) = p ) _ m ~n sk [P(Hi, . . . , Hu ; k) = p ] Z k = i Pr(^ i, • • •, Hn ; k) m - n sk n = X . s k [P(h 1 , . . . , h T1; k ) = p ] . k= 1 Wartość średnia A ( H i , . . . , H n ) uzyskana przez zsumowanie względem wszystkich m 71 możliwości (Hi, . . . ,Hn.) i podzielona przez m n będzie taka sama jak wartość średnia, którą uzyskaliśmy poprzednio we wzorze ( 8 .9 5 ). Ale w ariancja A(Hi, .. ., łVa) jest trochę inna; jest to wariancja m u śred nich, a nie wariancja m n -n zliczeń porównań. Na przykład dla m = 1 (tzn. gdy jest tylko jedna lista) „średnia” wartość A( Hi , . . . , Hu ) = A(1, . . . , 1) jest w rzeczywistości stałą, tak więc jej wariancja VA jest równa zeru. Natomiast liczba porównań w udanych wyszukiwaniach nie jest stałą i dlatego wariancja VP jest różna od zera. Możemy zilustrować różnicę pomiędzy wariancjami przeprowadzając obli czenia dla ogólnych m i n w najprostszym przypadku, gdy sk = 1 /n , dla 1 ^ k ^ n. Innymi słowy, będziemy na razie zakładać, że rozkład wyszuki wanych kluczy jest jednostajny. Dowolny ciąg wartości funkcji haszujących (Hi, . . . , hn ) definiuje m list, które zawierają odpowiednio ( n i , ri2 , . . . , n m) elementów dla pewnych liczb rtj, gdzie n i + n 2 H--------h n m = n . Udane wyszukiwanie, w którym każdy z n kluczy w tablicy jest tak samo prawdopodobny, wymaga średnio ( ! + • • • + t i i ) + ( ! + • • • + 112) + • • • + (1 + • • • + 11-1 x1) n Tli (ni +1) + n 2(n2+1 ) + • • • + Tim (n m+ 1 ) 2n ti ? + n | H---------1- n ^ + n 2n porównań. Naszym celem jest obliczenie wariancji dla wartości A (Hi, . . . , hn ) nad przestrzenią losową składającą się ze wszystkich m n ciągów ( h i , . . . , Hn ). Obliczenia mogą być prostsze, jeśli obliczymy wariancję dla odrobinę innej wartości, Ponieważ zachodzi A th i,...,? ^ ) = 1 + B (H i,...,H n)/n więc wartość średnia i wariancja A spełniają równania (8.100) Prawdopodobieństwo, że rozmiary list będą odpowiednio n i, n 2, . . . , n m, jest współczynnikiem wielomianowym n n i , n 2, . . . , n m dzielonym przez m n . Dlatego ftp dla B ( h i , . . . , Hn ) wynosi Suma ta wygląda być może odstraszająco, ale nasze doświadczenia z rozdziału 7 nauczyły nas, że jest to m-krotny splot. Jeśli spojrzymy na wykładniczą funkcję supertworzącą G(w,z) = Bn(z) n >0 m ,Lw' n! to łatwo możemy sprawdzić, że G(w,z) jest po prostu m-tą potęgą G(w,z) = ( 2 L Z kÔ Dla sprawdzenia możemy podstawić z = 1. Otrzymamy G(w,1) = (ew )m, tak więc współczynnik dla m n w n/n ! wynosi Bn (l) = 1. Gdybyśmy znali wartości B^(1) i B"(1), moglibyśmy obliczyć Var(Bn ). Obliczymy więc pochodne cząstkowe funkcji G(w, z) względem z: dz G (w,z) = Bń(z) TTL“"W1 ni nÔ kÔ kÔ g ^ G (w ,z ) = X Bn(Z) TLÔ Tl! M w ,v \ / *— / k \ = m(m-1)(2:z®£r2(L kÔ kÔ k \ + m z^2- £ kÔ w kx2 k! TTL— 1 M_ 9 W k! k! k > 0 Tak, one są skomplikowane, ale wszystko ładnie się upraszcza, gdy podsta wimy z = 1. Na przykład mamy n >0 n! w k^ 2 2 ( k - 2 )! = m e(m k + 2 ,(m^—1)w V" ™ = m ev" 2 k! kÔ m w 2 e (m -l)w _ y — nÔ (mw)n+2y - rt(n—1)mnw n Im n ! £— tiJjO 2run! i stąd wynika, że B*i,) = CDś- <s“‘» Wzór dla EA w ( 8 . 1 0 0 ) daje nam teraz EA = 1 + (n — l)/2 m , zgodnie z (8 .9 7 )W wyrażeniu na B"(1) mamy podobną sumę LCi)(C5)-')£ = \Z. (k+ 1)k(k —1)(k —2)wk kô ^ k> 0 ' h (k - 3|! 4o . k! Stąd otrzymujemy = m (m —l) e w(m_2) ( | w 2 ew)2 + m ew(m_1) (^w 4 + w 3 )e 1 rt! nÔ = m eWTTL( |m w 4 + w 3) ; i - <l “ > Teraz możemy złożyć wszystkie części razem i wyprowadzić wzór na pożą daną wariancję VA. Prawie wszystko się upraszcza i otrzymujemy zaskaku jąco prosty wynik: VA = vb = b ^(1) + b ; ( 1 ) - b ; ( 1 ) 2 rt2 n2 _ n (n — 1 ) / ( n + 1 ) (n —2 ) m m2n 2 V 4 ^2 rt(n — 1 ) 4 ( m - 1 ) ( n —1 ) = 2m2n • (8'103) Kiedy spotykamy się z takimi ‘przypadkami’, możemy podejrzewać, że jest ku temu jakiś matematyczny powód. Możemy zaatakować nasz problem teraz w taki sposób, żeby wyjaśnić, dlaczego otrzymaliśmy tak prosty wzór. I rzeczywiście, jest jeszcze jedno podejście do problemu (w ćwiczeniu 61), które pokazuje, że wariancja średniej liczby porównań w udanym wyszukiwaniu przybiera ogólną postać VA = m 2 1 7~ s £ ( k - 1), m t i (8.104) Prawdopodobieństwo dyskretne 468 gdzie Sk jest prawdopodobieństwem tego, że k-ty wstawiony element był elementem szukanym. Wzór ( 8 . 1 0 3 ) Jest szczególnym przypadkiem sk = l / n dla 1 ^ k u. Oprócz wariancji dla wartości średniej, moglibyśmy też rozważać wartość średnią dla wariancji. Innymi słowy, każdy ciąg ( Hi , . . . , Hn ), który definiu je tablicę haszującą, definiuje także rozkład zmiennej losowej dla udanego wyszukiwania i wariancja tego rozkładu mówi nam, jak bardzo rozproszona będzie liczba porównań w różnych udanych wyszukiwaniach. Dla przykładu, powróćmy do przypadku, gdy wstawiliśmy u = 16 elementów do m = 10 list: Gdzie ja ju ż widziałam ta ki wzorzec? Gdzie ja ju ż widziałem takie g ra ffiti? ( H i , . . . , H i 6) = 3 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ( P i , . . . , P i 6) = 1 1 1 2 1 1 1 1 2 2 3 1 2 1 3 3 Udane wyszukiwanie w otrzymanej tablicy haszującej ma ftp 16 G( 3, 1 , 4 , 1 . .,3) = Y _ SkZP(3,1,4,1,...,3;k) k=l — Si Z + S2 Z + S3 Z + S4 Z + • • * 4 - S ig Z . Rozważaliśmy właśnie średnią liczbę porównań przy udanym wyszukiwaniu w tej tablicy, tzn. A( 3 , 1, 4, 1, . . .,3) = Mean(G(3, 1, 4, 1, . . .,3)). Możemy również rozważać wariancję Si • 12 + S2 *12 + S3 • 12 + S4 *2^ + + S 1 6 -3 " — ( S l * 1 + S 2 * 1 + S 3 * 1 + S 4 * 2 + - * * + Sl6*3) . Wariancja ta jest zmienną losową zależną od ( h i , . . . , Hn ) , tak więc naturalne jest, żeby rozważać jej wartość średnią. Innymi słowy, istnieją trzy naturalne rodzaje wariancji, które chcieliby śmy znać, aby dokładnie zrozumieć zachowanie się algorytmu przy udanych wyszukiwaniach: C ałkowita w ariancja liczby porównań, wzięta po wszy stkich (Hi , . . . , 1x0,) i k; w ariancja od w artości średniej liczby porównań, gdzie wartość średnia jest wzięta po wszystkich k i wariancja jest wzięta po wszystkich ( H i , . . . , H n ); i w artość średnia dla w ariancji liczby porównań, gdzie wariancja jest wzięta po wszystkich k i wartość średnia jest potem wzięta po wszystkich ( H i , . . . ,H n ). Formalnie, całkowita wariancja wynosi wariancja od wartości średniej wynosi L VA = 1 ^ ( L s kp ( h , >. . . , h a : ic) k=1 natomiast wartość średnia dla wariancji jest równa AV k = l Okazuje się, że powyższe trzy „wariancje”są wzajemnie powiązane w na stępujący prosty sposób: (8 . 1 0 5 ) VP = Y A H -A Y . W rzeczywistości, rozkład warunkowy prawdopodobieństwa zawsze spełnia tożsamość VX = V(E(X|Y)) + E(V(X|Y)) (8 . 1 0 6 ) jeżeli X i Y są zmiennymi losowymi w dowolnej przestrzeni losowej i X ma wartości rzeczywiste. (Tożsamość ta jest udowodniona w ćwiczeniu 2 2 .) Wzór (8 . 1 0 5 ) jest jej szczególnym przypadkiem, gdzie X jest liczbą porów nań w udanym wyszukiwaniu, a Y jest ciągiem wartości funkcji łiaszujących Ogólna postać (8 . 1 0 6 ) wymaga szczególnego zrozumienia, ponieważ w zastosowanej notacji przestrzenie losowe, w których określamy zmienne lo sowe, ich wartości oczekiwane i wariancje, są różne, czego ta notacja nie odzwierciedla. Dla każdego y z dziedziny zmiennej losowej Y zdefiniowaliśmy zmienną losową X|y w ( 8 .9 1 ) i ta zmienna losowa ma wartość oczekiwaną E(X|y) zależną od y . W związku z tym, E(X|Y) oznacza zmienną losową, któ rej wartościami są E(X|-y), dla y przebiegającego wszystkie możliwe wartości z Y, natomiast V(E(X|Y)) jest wariancją tej zmiennej losowej względem roz kładu zmiennej losowej Y. Podobnie, E(V(X|Y)) jest wartością średnią dla zmiennej losowej V(X|'y), przy zmieniającym się y . Po lewej stronie ( 8 . 1 0 6 ) m a m y VX, bezwarunkową wariancję dla X. Ponieważ wariancje są nieujemne, M (Teraz je st dobry moment, żeby zrobić na rozgrzewkę ćwiczenie 6.) dyskretne 470 zawsze otrzymujemy VX ^ V(E(X|Y)) P je st nadal liczbą porównań. i VX ^ E(V(X|Y)) (8.107) P rzy p a d ek 1 , je szcze raz : W yszu k iw an ie n ieu d an e Doprowadźmy do końca naszą wnikliwą analizę haszowania poprzez wykona nie jeszcze jednego obliczenia typowego dla analizy algorytmów. Tym razem będziemy analizowali całkowity czas działania związany z nieudanym wy szukiwaniem, zakładając, że komputer będzie wstawiał nie znany dotąd klucz do swojej pamięci. Proces wstawiania w algorytmie (8 .8 3 ) rozbija się na dwa przypadki, w zależności od tego, czy j jest ujemne, czy jest zerem. Przypadek j < 0 zachodzi wtedy i tylko wtedy, gdy P = 0, ponieważ wartość ujemna pochodzi z elementu FIRST pustej listy. Tak więc, jeśli lista była uprzednio pusta, mamy P = 0 i musimy podstawić FIRST [Hn+i] := n + 1 . (Nowy rekord zostanie wstawiony na pozycję n + 1.) W przeciwnym razie P > 0 i musimy ustawić wartość NEXT na n + 1. Te dwa przypadki mogą mieć różny czas trwania i dlatego całkowity czas działania podczas nieudanego wyszukiwania ma postać T = c t + p P + 6 [P = 0], ( 8 .1 0 8 ) gdzie a, p i 6 są stałymi, które zależą od używanego komputera i od sposobu, w jaki haszowanie jest kodowane w języku wewnętrznym maszyny. Dobrze by było znać wartość średnią i wariancję dla T, ponieważ taka informacja jest bardziej istotna w praktyce niż wartość średnia i wariancja dla P. Jak dotąd używaliśmy funkcji tworzących tylko w połączeniu ze zmien nymi losowymi przybierającymi nieujemne wartości całkowite. Ale okazuje się, że możemy praktycznie w taki sam sposób pracować z Gx {z) Vi{a))zX(o>) cu<EO gdy X jest dowolną zmienną losową o wartościach rzeczywistych, ponieważ istotne parametry X zależą tylko od zachowania się Gx w pobliżu z = 1, gdzie potęgi z są dobrze zdefiniowane. Na przykład czas działania (8 . 1 0 8 ) w nieudanym wyszukiwaniu jest zmienną losową zdefiniowaną nad prze strzenią losową jednakowo prawdopodobnych wartości funkcji haszujących ( H i , . . . Hn , Hn + i ), z 1 ^ Hj ^ m. Możemy rozważać szeregi Gj{z) = m n+ 1 Z Z z Hl—1Trn—1 łl-n+1—1 8.5. Haszowanie j jako ftp nawet wtedy, gdy a, |3 i 6 nie są całkowite. (W rzeczywistości pa rametry oc, (3, 6 są wielkościami fizycznymi mającymi swój wymiar czasowy; one nie są nawet po prostu liczbami! Ale nawet mimo to możemy ich używać w wykładniku dla z.) Tak jak poprzednio, możemy obliczać wartość średnią i wariancję dla T przez obliczenie G |(l) i Gy(1) i zastosowanie ich wartości w zwykły sposób. Funkcja tworząca dla P wygląda następująco: P(z) = ( ^ l ± £ ) = ^ Pr(P=p)zp. pÔ Stąd mamy Gt (z) = Pr(P = p ) z a + P p + 6 [p = 0 1 = z“ ((z5 —1)Pr(P = 0) + ^ P r ( P = p ) z Pp) pÔ Wyznaczenie Mean(Gy) i Var(Gj) jest teraz rutynowe: TL / TTL — 1 \ Tl Mean(Gj) — Gj(l) = oc+|3---- F6 ( ------- ) ; m V m (8.109) / Gj(l) = oc{oc - 1) + 2a(3 — + (3((3 —1) — + ft2 ^ m m m 2 -,,/ru —1 1\ \nu _ c / m — 11 \ n ............. /m — + 2<xó(------- ) + 6 6 - 1 1 -------- ) ; V m / V m / Var(GT) = G"( 1 ) + G | ( 1 ) - G | ( 1 ) 2 = p2 n ( m - 1 ) _ /m -lN nn m2 V mm / / mm ^m — 1 \ lrL\ , , 110 <8 W rozdziale 9 będziemy się uczyli, jak szacować wartości takie jak ta, gdy m i n są duże. Jeśli, na przykład, m = n i n ^ oo, to techniki z rozdziału 9 pokażą nam, że wartość średnia i wariancja dla T wynoszą odpowiednio a + P + 5e~1 + 0(tl_1) oraz |32 —2|36e-1 + 6 2 (e _1 —e~2) + 0(tl_1). Jeśli m = n /ln u + 0 (1) i tl —>00, to otrzymujemy odpowiednio Mean(Gj) = p I n n + a + 0 ( ( l o g r L ) 2/n ) ; Var(Gj) = p2 l n n + 0 ((logn ) 2/n ) . 8. Prawdopodobieństwo dyskretne * 472 Ć w iczenia Rozgrzewka 1 . Jakie jest prawdopodobieństwo wypadnięcia dubletu (tzn. że na obu ko Dlaczego tylko dziesięć liczb? ściach wypadnie tyle samo oczek) w rozkładzie zmiennej losowej Proi z ( 8 .3 ), gdy jedna kość jest wyważona, a druga nie? Jakie jest prawdopo dobieństwo, że wyrzuci się S = 7? 2 . Jakie jest prawdopodobieństwo, że pierwsza i ostatnia karta w losowo potasowanej talii kart to asy? (Wszystkie 52! permutacje kart mają to samo prawdopodobieństwo 1/52!.) 3. Studenci Matematyki Konkretnej na Uniwersytecie Stanforda byli pro szeni w 1979 roku o rzucanie monetami dopóty, dopóki nie wypadną dwa orły z rzędu, i następnie o przedstawienie liczby wykonanych rzutów. Otrzymali oni następujące wyniki: 3 , 2 , 3 , 5 , 1 0 , 2, 6 , 6 , 9 , 2 . Studenci Matematyki Konkretnej na Uniwersytecie Princeton byli pro szeni o zrobienie tego samego w 1987 roku, z następującymi wynikami: 10, 2, 10, 7, 5, 2, 10, 6 , 10, 2 . Oszacuj wartość średnią i wariancję opierając się na (a) próbce ze Stan forda; (b) próbce z Princeton. 4. Niech H(z) = F(z)/G(z), gdzie F(1) = G(1) = 1. Pokaż, że Mean(Fi) = Mean(F) — Mean(G), Var(H) = Var(F) —Var(G), analogicznie jak w (8 .3 8 ) i ( 8 .3 9 ), przy założeniu że odpowiednie pocho dne istnieją w z = 1 . 5. Przypuśćmy, że Alice i Bill grają w grę ( 8 .7 8 ) z monetami niewy ważo nymi, na których orzeł wypada z prawdopodobieństwem p. Czy istnieje wartość p, dla której gra staje się fair? 6 . Do czego redukuje się wzór ( 8 . 1 0 6 ), jeśli X i Y są niezależnymi zmiennymi losowymi? Podstaw y 7. Pokaż, że jeśli dwie kości są niewyważone, dając taki sam rozkład praw dopodobieństwa, to prawdopodobieństwo wyrzucenia dubletu wynosi za wsze co najmniej 8 . Niech A i B będą zdarzeniami takimi, że A U B = O. Udowodnij, że Pr(eu € A fi B) = Pr(o> G A) Pr(cu G B) —Pr(cu ^ A) Pr(cu ^ B ) . 9. Czy prawdziwe jest następujące zdanie: Jeśli X i Y są niezależnymi zmien nymi losowymi, to niezależne są również F(X) i G(Y), gdzie F i G są dowolnymi funkcjami? 10. Jaka jest maksymalna liczba elementów, które mogą być medianą zmien nej losowej X, zgodnie z definicją ( 8 .7 )? 1 1 . Skonstruuj zmienną losową, która miałaby skończoną wartość średnią i nieskończoną wariancję. 1 2 . a) Jeśli P(z) jest ftp dla zmiennej losowej X, to pokaż, że Pr(X <Cr) <C x~ rP(x) dla 0 < x ^ 1; Pr(X ^ r) ^ x_rP (x) dla x ^ 1. Te ważne relacje zwane są nierównościami ogonowymi. b) W szczególnym przypadku, gdy P(z) = (1 + z ) n/ 2 TLi zastosuj pierw szą z tych nierówności do pokazania, że Y.ic<ctn (£) ^ 1 /(x a n (1 — a ) ( 1 - a ) n d la 0 < OC < \. 13. Pokaż, że jeśli X i, . . . , Xzn są niezależnymi zmiennymi losowymi o takim samym rozkładzie i oc jest dowolną liczbą rzeczywistą, to zachodzi 14. Niech F(z) i G(z) będą funkcjami tworzącymi i niech H(z) = pF(z) + q G(z) gdzie p + q = 1. (Takie H nazywane jest m ieszaniną F i G. Odpowiada ona rzucaniu monetą i wybraniu rozkładu F lub G, w zależności od tego, czy wypadł orzeł, czy reszka.) Znajdź wartość średnią i wariancję dla FI jako funkcję p, q i wartości średnich i wariancji dla F i G. 15. Jeśli F i G są funkcjami tworzącymi, to możemy zdefiniować kolejne ftp H(z) przez „złożenie”: H(z) = F(G(z)). Wyraź wartości Mean(H) i Var(H) jako funkcje zależne od Mean(F), Var(F), Mean(G) i Var(G). (Nierówność ( 8 .9 3 ) jest szczególnym przy padkiem.) 16. Znajdź postać zwartą dla funkcji super tworzącej I ^ o ^ n W w 11, gdy Fn (z) jest funkcją tworzącą dla problemu podrzucanych kapeluszy, zde finiowaną w ( 8 .5 3 ). 17. Niech Xn>p i Yn>p mają, odpowiednio, rozkład dwumianowy i ujemny rozkład dwumianowy, z parametrami (rt,p). (Te rozkłady zdefiniowane są 8. Prawdopodobieństwo dyskretne Rozkład liczby ry b na jednostkę objętości w ody w 474 w równaniach ( 8 .5 7 ) i ( 8 .6 0 ).) Pokaż, że Pr(Yu>p ^ m) = Pr(Xm+U)P ^rt). Jaką tożsamość dotyczącą współczynników dwumianowych pociąga za sobą powyższa równość? 18. Mówimy że zmienna losowa X ma rozkład Poissona z wartością śred nią (j,, gdy Pr(X = k) = e~p-[i]c/k \ dla wszystkich k ^ 0. a) Jaka jest ftp dla takiej zmiennej losowej? b) Ile wynosi jej wartość średnia, wariancja i inne półniezmienniki tej zmiennej losowej? 19. Niech Xi ma rozkład Poissona z wartością średnią \i-[ i niech Xz ma nie zależny od Xi rozkład Poissona z wartością średnią \±2 (por. poprzednie ćwiczenie). a) Jakie jest prawdopodobieństwo tego, że Xi + Xz = rt? b) Ile wynosi wartość średnia, wariancja i inne półniezmienniki zmiennej 2X 1 + 3 X 2? 2 0 . Udowodnij zależności ( 8 .7 4 ) i ( 8 . 7 5 ), ogólne postacie dla wartości średniej i wariancji dla czasu oczekiwania na dany wzorzec orłów i reszek. 21. Co reprezentuje wartość N, jeśli we wzorze (8 .7 7 ) podstawimy \ za 0 i R? 2 2 . Udowodnij wzór ( 8 . 1 0 6 ), prawo warunkowych wartości średnich i warian cji. Ć w iczen ia d om ow e 23. Niech Proo będzie rozkładem losowym dla dwóch rzutów wyważoną ko ścią i niech Prn będzie rozkładem losowym dla dwóch rzutów kością niewyważoną, tak jak w ( 8 .2 ). Znajdź wszystkie zdarzenia A takie, że Proo (A) = Prn( A) . Które z tych zdarzeń zależą tylko od zmiennej lo sowej S? (Przestrzeń losowa z Cl = D 2 ma 2 36 elementów, ale tylko 2 11 spośród nich zależy jedynie od S.) 24. Gracz } rzuca 2n + 1 wyważonymi kośćmi i usuwa te, na których wypa dło J j . Gracz K wybiera potem liczbę pomiędzy 1 i 6 , rzuca pozostałymi kośćmi i usuwa kości z wyrzuconą liczbą oczek taką, jak liczba wybrana przez niego. Ten proces jest powtarzany dopóty, dopóki nie zostaną usu nięte wszystkie kości. Gracz, który usunął większość z kości (rt + 1 lub więcej), wygrywa. a) Jaka jest wartość oczekiwana i wariancja dla liczby kości usuniętych przez gracza J? Wskazówka: Kości są niezależne. b) Jakie jest prawdopodobieństwo, że gracz J wygra dla n = 2? 25. Rozważmy grę hazardową, w której zaczynasz z pulą A i rzucasz (wy ważoną) kością. Jeśli wypadnie k oczek, to mnożysz swoją pulę przez 2(k — l)/ 5. (W szczególności, podwajasz stawkę, gdy wyrzucisz j j , a tracisz wszystko, gdy wyrzucisz [•].) Możesz skończyć grę w dowolnym momencie, dostając aktualną pulę. Jaka jest wartość średnia i wariancja puli po n rzutach? (Zignoruj efekt zaokrąglania wartości stawki). ćwiczenia 26. Znajdź wartość średnią i wariancję dla liczby l-cykli w losowej permuta cji rt elementów. Problem podrzuconych kapeluszy omawiany w (8 .2 3 ), ( 8 .2 4 ) i ( 8 .5 3 ) jest tego szczególnym przypadkiem dla 1 = 1 . 27. Niech X i, X z 7 . . . , Xn będą niezależnymi próbkami zmiennej losowej X. Wzory ( 8 . 1 9 ) i ( 8 .2 0 ) wyjaśniają, jak szacować wartość średnią i wa riancję dla X, opierając się na tych wartościach. Podaj analogiczny wzór szacujący trzeci półniezmiennik K3 . Twój wzór nie powinien być „stron niczym” oszacowaniem, w takim sensie, że jego wartość średnia powinna wynosić K3 . 28. Jaka jest średnia długość gry w rzucanie monetą (8 .7 8 ), a) zakładając, że wygra Alice? b) zakładając, że wygra Bill? 29. Alice, Bill i komputer grają wyważonymi monetami, aż wypadnie po raz pierwszy jeden z wzorców A = 0 0 R0 , B = 0 R0 0 lub C = R0 0 0 . Jeśli wypadnie wzorzec A, to wygrywa Alice, jeśli wzorzec B, to wygrywa Bill, a jeśli C, to wygrywa komputer. Gdyby były tylko dwa wzorce, to pamiętając wzór ( 8 .8 2 ), wiedzielibyśmy, że A prawdopodobnie wygrałby z B, B wygrałby prawdopodobnie z C, a C wygrałby zapewne z A. Ale teraz są te trzy wzorce równocześnie. Jakie są szanse każdego z graczy, że wygra? 30. Omawialiśmy trzy rodzaje wariancji związanych z udanym wyszukiwa niem w tablicy haszującej. Tak naprawdę, to istnieją jeszcze dwie inne. Możemy rozważać średnią (względem k) z wariancji (po H i, . . . , Hn ) z P(Hi, . . . , Hn ; k), jak również wariancję (względem k) ze średnich (po H i, . . . , Hn.). Wyznacz te funkcje. 31. W wierzchołku A pięciokąta ABCDE znajduje się jabłko, a dwa wierz chołki dalej, w C, znajduje się robaczek. Każdego dnia robaczek pełza z takim samym prawdopodobieństwem do jednego z sąsiednich wierz chołków. Tak więc po jednym dniu znajdzie się on albo w wierzchołku B, albo w D, w każdym z prawdopodobieństwem j . Po dwóch dniach roba czek może wrócić do C, ponieważ nie zapamiętuje poprzedniej pozycji. Po osiągnięciu wierzchołka A robaczek zatrzymuje się na obiad. a) Jaka jest wartość oczekiwana i wariancja liczby dni, które upłyną do obiadu? b) Niech p będzie prawdopodobieństwem, że liczba dni wynosi 100 lub więcej. Co mówi nierówność Czebyszewa o p? c) Co mówią o p nierówności ogonowe (ćwiczenie 1 2 )? 32. Alice i Bill znajdują się w wojsku, którego oddziały stacjonują w pię ciu stanach: Kansas, Nebrasce, Missouri, Oklahomie i Colorado. Począt kowo Alice jest w Nebrasce, a Bill w Oklahomie. Każdego miesiąca każda osoba jest wysyłana do sąsiedniego stanu, przy czym wszystkie sąsiednie Robaczek Schródingera. 8. Prawdopodobieństwo dyskretne 476 stany są tak samo prawdopodobne. Diagram sąsiedztwa wygląda nastę pująco: Początkowe stany są zaznaczone kółkiem. Na przykład Alice może być przeniesiona po miesiącu do Colorado, Kansas lub do Missouri, wszędzie z prawdopodobieństwem 1/3 . Znajdź wartość oczekiwaną i wariancję dla liczby miesięcy, po jakiej Alice i Bill znajdą się w tej samej jednostce. (Możesz przeprowadzić eksperymenty na komputerze.) 33. Czy zmienne losowe Xi i Xz we wzorze ( 8 .8 9 ) są niezależne? 34. Gina jest golfistką, która z prawdopodobieństwem p = 0,05 przy każdym uderzeniu ma „superstrzał,” który daje jej dodatkowy punkt, z prawdo podobieństwem q = 0 , 9 1 wykonuje zwykłe uderzenie i z prawdopodo bieństwem r = 0,04 wykonuje beznadziejne uderzenie, które kosztuje ją jeden punkt. (Dla nie-golfistów: każdy strzał posuwa ją o 2,1 lub 0 kroków do celu, z prawopodobieństwem odpowiednio p, q i r. Na m-punktowym dołku uzyska ona rt punktów, jeśli w u strzałach, ale jeszcze nie w t l — 1, przesunie się o co najmniej m kroków do przodu, co oznacza, że piłeczka wpadnie do dołka. Im mniej punktów tym lepiej.) a) Pokaż, że gdy Gina gra z graczem, który zawsze wykonuje zwykłe uderzenia, wówczas wygra ona na 4-punktowym dołku częściej niż na nim przegra. (Innymi słowy, prawdopodobieństwo, że uzyska ona mniej niż 4 punkty jest większe niż prawdopodobieństwo, że uzyska więcej niż 4 punkty.) b) Pokaż, że jej średnia liczba punktów na 4-punktowym dołku jest więk sza niż 4. (Dlatego z reguły będzie przegrywała ze „stabilnym” gra czem w całkowitej sumie punktów, mimo że będzie wygrywała mecz na pojedynczej dziurze.) Zdecydowanie je s t to sytuacja skończonych stanów. Użyj komputera do obliczeń numerycznych potrzebnych w tym ćwiczeniu. Zadania eg za m in a cy jn e 35. Oczka na kości wypadają z rozkładem losowym określonym następująco: PrflZD = Pi ; Pr(H) = V2 ; Pr (Ul) = P 6 . Niech Sn będzie sumą wyrzuconych oczek po u rzutach kośćmi. Znajdź warunek wystarczający i konieczny na „niewyważony rozkład,” tak żeby "Pi,,. Ówiaztuia % 477 dwie zmienne losowe Sn mod 2 i Sn mod 3 były niezależne od siebie dla wszystkich rt. 36. Sześć ścian pewnej kości ma następujący wzorzec: II II zamiast standardowych [•] • • • [fH . a) Pokaż, że zawsze istnieje inne przypisanie oczek dla drugiej kości takie, że gdy rzucone są obie kości, to suma oczek ma taki sam roz kład prawdopodobieństwa jak suma oczek dla standardowych kości. (Załóż, że każdy z 36 możliwych układów ścian jest tak samo praw dopodobny). b) Uogólnij powyższy wynik, znajdując taki sposób przyporządkowania oczek dla 6 n ścian w rt kościach, że rozkład sumy oczek będzie taki sam jak przy rzucaniu rt standardowymi kośćmi. (Każda ściana po winna otrzymać dodatnią całkowitą liczbę oczek.) 37. Niech p n będzie prawdopodobieństwem, że potrzeba dokładnie rt rzutów wyważoną monetą aż do wypadnięcia po raz pierwszy dwóch orłów z rzędu i niech qn = Znajdź zwartą postać dla pn i qn jako funkcji liczb Fibonacciego. 38. Jaka jest funkcja tworząca prawdopodobieństwa dla liczby rzutów wy ważoną kostką potrzebnych do tego, żeby pojawiło się wszystkich sześć ścian? Uogólnij to do rt-ściennej kostki: Podaj zwarte postacie dla war tości średniej i wariancji dla liczby rzutów potrzebnych do uzyskania l spośród m ścian. Jakie jest prawdopodobieństwo, że ta liczba będzie wy nosiła dokładnie n? 39. Funkcja tworząca prawdopodobieństwa D irichleta ma następującą pos tać: n ^1 Tak więc P(0) = 1. Niech X będzie zmienną losową spełniającą warunek Pr(X = rt) = p n . Wyraź E(X), V(X) i E(lnX) jako funkcje zależne od P(z) i jej pochodnych. 40. Przedstawmy m-ty półniezmiennik Km rozkładu dwumianowego ( 8 .5 7 ) w postaci n f m(p), gdzie f m jest wielomianem stopnia m. (Na przykład fi (p) = p i f 2 (p) = p —p 2, ponieważ wartość średnia i wariancja wynoszą odpowiednio np i rtpq.) a) Znajdź zwartą postać dla współczynników p k w f m(p). b) Udowodnij, że f m(^) = (2m —1)Bm/ m + [ m = 1], gdzie Bm jest m-tą liczbą Bernoulliego. •^mmmmmm*** m '“mmmmmi' mm m -mmm# |8* Prawdopodobieństwo dyskretne Dziwny zestaw graczy. 478 41. Niech zmienna losowa Xrt oznacza liczbę rzutów wyważoną monetą aż do momentu, gdy orzeł wypadnie n razy. Pokaż, że H (X ~|1) = (—1)u (ln2 + H |n / 2 j —Hn ). Zastosuj metody z rozdziału 9 do oszacowania tej wartości z błędem bezwzględnym 0 (n - 3 ). 42. Pewien pan ma problem ze znalezieniem pracy. Jeśli jakiegoś poranka nie jest zatrudniony, to ze stałym prawdopodobieństwem pn (niezależnym od tego, co się działo dotąd) będzie on zatrudniony przed wieczorem. Ale jeśli zaczyna on dzień będąc już zatrudnionym, to istnieje stałe prawdo podobieństwo p f, że zostanie zwolniony przed zmrokiem. Znajdź średnią liczbę wieczorów, kiedy ma on pracę, przy założeniu, że początkowo był on zatrudniony i że analizujemy okres n dni. (Na przykład, dla n = 1 odpowiedzią jest 1 —pf.) 43. Znajdź zwartą postać dla ftp Gn (z) = 2Zk ^ 0 Pk,n£k, gdzie p k>n jest prawdopodobieństwem, że losowa permutacja n obiektów ma dokładnie k cykli. Jakie są wartość średnia i wariancja dla liczby cykli? 44. Wydział kultury fizycznej przeprowadza w roku akademickim „turniej pucharowy” (do pierwszej przegranej) dla 2 n tenisistów w następujący sposób. W pierwszej rundzie gracze są kojarzeni w losowe pary i gra się 2 n _ 1 meczy. Zwycięzcy awansują do drugiej rundy, gdzie ten sam proces daje następnie 2 n ~ 2 nowych zwycięzców, i tak dalej. W k-tej rundzie bę dzie rozegranych 2n~k losowych meczy między 2 n _ k + 1 graczami, którzy jeszcze ani razu nie przegrali. Runda n-ta wyłania mistrza. Organizatorzy nie wiedzieli jednak, że gracze są uporządkowani: xi jest najlepszy, x 2 jest zaraz po nim, . . . , x2n jest najgorszy. Gdy x3- gra z xk i j < k, zwycięzcą będzie Xj z prawdopodobieństwem p, a xk z prawdopodobieństwem 1 —p, niezależnie od innych meczy. Założymy, że takie samo prawdopodobień stwo p stosuje się do wszystkich j i k. a) Jakie jest prawdopodobieństwo, że xi wygra turniej? b) Jakie jest prawdopodobieństwo, że w n tej rundzie (w finale) spotkają się ze sobą dwaj najlepsi gracze xi i x2? c) Jakie jest prawdopodobieństwo, że 2k najlepszych graczy wygra k-tą od końca rundę? (Poprzednie pytania były dla k = 0 i k = 1.) d) Niech N(n) będzie liczbą istotnie różnych wyników turnieju. Dwa turnieje są istotnie takie same, gdy wszystkie mecze były pomiędzy tymi samymi graczami i miały tych samych zwycięzców. Udowodnij, że N (n) = 2 n !. e) Jakie jest prawdopodobieństwo, że x 2 wygra turniej? f) Udowodnij, że jeśli \ < p < 1, to prawdopodobieństwo, że wygra Xj, jest większe niż prawdopodobieństwo, że wygra Xj+ i , dla 1 ^ j < 2 n . 45. Prawdziwe sherry wyrabiane jest w Hiszpanii zgodnie z wielostopniowym systemem zwanym „Solera.” Dla uproszczenia założymy, mamy tylko trzy beczki, oznaczone A, B i C. Każdego roku jedną trzecią wina z beczki C rozlewamy do butelek i zastępujemy winem z beczki B. Potem beczkę B dopełniamy do pełna winem z beczki A i na końcu beczkę A dopełniamy nowym winem. Niech A(z), B(z) i C(z) będą ftp, dla których współczyn nik przy zn jest proporcją n-letniego wina w odpowiedniej beczce, tuż po dokonaniu przelewania. a) Załóżmy, że wszystkie te czynności były wykonywane od niepamięt nych czasów, tak że mamy ustabilizowany stan, w którym A(z), B(z) i C(z) są takie same na początku każdego roku. Znajdź postać zwartą dla tych funkcji tworzących. b) Znajdź wartość średnią i odchylenie standardowe dla wieku wina w każdej beczce, przy tych samych założeniach. Jaki jest średni wiek sherry, gdy się ją butelkuje? Jaka część ma dokładnie 25 lat? c) Weźmy teraz pod uwagę skończoność czasu: Przypuśćmy, że wszyst kie trzy beczki wina zawierają nowe wino na początku roku 0. Jaki jest średni wiek sherry, która jest butelkowana na początku roku n? 46. Stefan Banach nosił ze sobą stale dwa pudełka zapałek, każde zawiera jące początkowo n zapałek. Gdy chciał zapalić, wybierał losowe pudełko z prawdopodobieństwem \ , niezależnie od poprzednich wyborów. Po wy ciągnięciu zapałki wkładał z powrotem pudełko do kieszeni (nawet gdy pudełko stało się puste — wszyscy wielcy matematycy zwykli byli tak robić). Gdy wybrał puste pudełko, wówczas wyrzucał je i sięgał po nowe. a) Raz stwierdził, że również drugie pudełko było puste. Jakie jest praw dopodobieństwo wystąpienia takiego zjawiska? Na przykład dla rt = 1 zdarzy się to średnio w połowie przypadków, a dla n = 2 w 3 / 8 przypadków. Żeby odpowiedzieć na to pytanie, znajdź postać zwartą dla funkcji tworzącej P(w ,z) = ^ m n p m)TXw mzn , gdzie p m>TX jest prawdopodobieństwem, że zaczynając z rt zapałkami w jednym pu dełku i rt w drugim, kiedy wyciągniemy puste pudełko, w drugim nie będzie już też zapałek. Potem znajdź postać zwartą dla p n>n. b) Uogólniając odpowiedź z części (a), znajdź postać zwartą dla praw dopodobieństwa tego, że gdy wyrzucane jest jedno puste pudełko, w drugim jest dokładnie k zapałek. c) Znajdź postać zwartą dla średniej liczby zapałek w drugim pudełku. 47. Pewna grupa lekarzy współpracująca z fizykami odkryła ostatnio parę mikrobów rozmnażających się w szczególny sposób. Samiec mikroba, na zywany dwufagiem, ma dwa receptory na swojej powierzchni ciała, a samica, nazywana trójfagiem, ma trzy receptory: dwufag: trójfag: receptor: □ „Szybkie obliczenie arytmetyczne pokazuje, że sherry ma zawsze co najm niej trz y lata. Od dalszych obliczeń zacznie nam szumieć ju ż w głowie.” Revue du vin de France (listopad 1984) Również dla liczby zapałek w pustym pudełku. 8, Prawdopodobieństwo dyskretna 11. 480 t Gdy kulturę dwufagów i trójfagów napromieniujemy cząstką psi, wówczas dokładnie jeden z receptorów jednego z fagów absorbuje cząstkę, każdy z nich z jednakowym prawdopodobieństwem. Jeśli był to receptor dwufaga, to dwufag przemienia się trójfaga, a jeśli był to trójfag, to rozdziela się on na dwa dwufagi. Tak więc jeśli eksperyment zaczyna się z jednym dwufagiem, to pierwsza cząstka psi zmieni go w trójfaga, druga rozdzieli go na dwa dwufagi i trzecia cząstka przekształci jednego z dwufagów na trójfaga. Czwarta cząstka zostanie zaabsorbowana albo przez dwufaga, albo przez trójfaga i powstaną albo dwa trójfagi (prawdopodobieństwo | ) , albo trzy dwufagi (prawdopodobieństwo | ) . Znajdź zwartą postać dla średniej liczby dwufagów, jeśli zaczęliśmy z jednym dwufagiem i n razy napromieniowaliśmy kulturę pojedynczą cząstką psi. 48. Pięć osób stoi w wierzchołkach pięciokąta, rzucając między sobą latający krążek. Mają oni dwa krążki, które początkowo znajdują się w sąsiednich wierz chołkach, jak pokazano na rysunku. W każdej jednostce czasu, każdy krą żek rzucany jest na lewo lub na prawo (wzdłuż boków pięciokąta) z takim samym prawdopodobieństwem. Kontynuujemy ten proces, aż jedna osoba otrzyma obydwa krążki równocześnie. Wtedy kończymy grę. (Wszystkie rzuty są niezależne od poprzednich.) a) Znajdź wartość średnią i wariancję długości gry. b) Znajdź zwartą postać dla prawdopodobieństwa, że gra trwa ponad 1 0 0 kroków jako funkcję zależną od liczb Fibonacciego. 49. Lukę Snowwalker spędza zimowe ferie w swojej górskiej chatce. Na fron towej werandzie stoi u niego m par butów, a na tylnej rt par. Gdy Lukę chce wyjść z chaty, rzuca (wyważoną) monetą, żeby zdecydować, czy wyjść przez frontową werandę, czy też przez tylną, a potem zakłada parę butów z wybranej werandy. Z prawdopodobieństwem \ wróci przez tę samą werandę, niezależnie od tego, przez którą wyszedł, i zostawi buty na werandzie, przez którą wrócił. Tak więc po jednej przechadzce będzie m + [—1, 0 , lub + 1 ] par butów na frontowej werandzie i n — [—1 , 0 , lub + 1 ] par na tylnej. Jeśli wszystkie buty znajdą się na jednej z werand, a Lukę będzie chciał wyjść przez drugą, to wyjdzie bez butów i przemarznie, tak że skończy swoje ferie. Zakładamy, że Lukę chodzi na spacery aż przemarźnie. Niech Pis^r^n) będzie prawdopodobieństwem, że odbędzie on dokładnie N wędrówek bez przemarznięcia, zaczynając z m parami bu tów na frontowej werandzie i rt parami butów na tylnej. Tak więc, jeśli m i u są dodatnie, to PN(m,n) = + + ^P n - i (tu + 1 ,n — 1), co wynika z faktu, że pierwsza przechadzka jest albo front/tył, albo front/front, albo tył/tył, albo tył/front, każda z prawdopodobieństwem i pozostanie dalej N —1 wyjść. a) Dokończ rekurencję dla PN(m,n), znajdując wzory, które zachodzą też gdy m = 0 lub n = 0. Zastosuj tę rekurencję, żeby uzyskać równania pomiędzy funkcjami tworzącymi prawdopodobieństw gm,n(z) = ^ P N ( m , n ) z N . NÔ b) Zróżniczkuj swoje równania i podstaw z = 1, uzyskując w ten sposób związki pomiędzy wielkościami g^nO )- Rozwiąż te równania uzy skując wartość średnią na liczbę wędrówek przed przemarznięciem. c) Pokaż, że gm>TL ma zwartą postać, jeśli podstawimy z = 1/cos2 0: ( 1 \ Vcos2 0 / 9 m ,n ( sin(2m + 1)0 + sin(2n + 1)0 1 To TTn sm(2m + 2rt +i 2)0 * 50. Rozważmy funkcję H(z) = 1 + (z - 3 + ^(1 - z)(9 - z) ) • Celem tego zadania jest udowodnienie, że H(z) = jest funk cją tworzącą prawdopodobieństwa i uzyskanie podstawowych własności takiego rozkładu. a) Niech (1 —z)3/2(9 —z)1/2 = X.k$>ockzk- Udowodnij, że co = 3, ci = -1 4 /3 , c2 = 37/27 i c3+l = 3 ^ k (£) (3^ ) ( | ) k+3 dla wszystkich 1 ^ 0. Wskazówka: Zastosuj tożsamość (9 - z ) V 2 = 3 (1 - z ) V 2(1 + | z / ( 1 - * ) ) V 2 i rozwiń ostatni współczynnik w potęgi z/(1 —z). b) Zastosuj część (a) i ćwiczenie 5.81 do pokazania, że wszystkie współ czynniki funkcji H(z) są dodatnie. c) Udowodnij zaskakującą tożsamość y T = W ) ~ \ l ~ z + 1 - d) Jaka jest wartość średnia i wariancja dla H? 51. Loteria stanowa w El Dorado korzysta przy wypłatach z rozkładu lo sowego H zdefiniowanego w poprzednim ćwiczeniu. Każdy los kosztuje 1 dublon i wygraną jest k dublonów z prawdopodobieństwem Hic. Twoja szansa wygrania, gdy masz dany los, jest zupełnie niezależna od szansy dla innych losów. Innymi słowy, wygrana lub przegrana z jednym losem nie zmienia prawdopodobieństwa wygranej w przypadku, gdybyś nabył dowolny inny los na tej samej loterii. a) Przypuśćmy, że zaczynasz z jednym dublonem i grasz według nastę pującej strategii: Jeśli wygrasz k dublonów, to nabywasz k losów w drugiej grze. Bierzesz potem całą wygraną z drugiej gry i kupujesz za nią losy na trzecią grę, i tak dalej. Jeśli żaden z twoich losów nie wygrał, to jesteś bankrutem i kończysz grę. Pokaż, że ftp dla twojego aktualnego stanu posiadania po n rundach takiej gry wynosi 1 ____________ 4__________ _____________4___________ V(9 —z)/( 1 —z) + 2n —1 + V ( 9 - z ) / ( 1 - z ) + 2 n + 1 ' b) Niech g^ będzie prawdopodobieństwem tego, że przegrasz wszystkie pieniądze (po raz pierwszy i ostatni) w n-tej grze i niech G(z) = g!Z + g2^2 + • • •. Udowodnij, że G(1) = 1. (To oznacza, że z praw dopodobieństwem zbiegającym do 1 przegrasz wszystko prędzej czy później, chociaż możesz się nieźle bawić grając do tego czasu.) Jakie są wartość średnia i wariancja dla G? c) Jaka jest średnia liczba losów, które kupisz, jeśli grasz aż do bankruc twa? d) Jaka jest średnia liczba gier aż do bankructwa, gdy zaczynasz nie z jednym, lecz z dwoma dublonami? Zadania dodatkowe 52. Pokaż, że podane w tekście definicje mediany i dominanty dla zmiennych losowych odpowiadają w sensowny sposób definicjom mediany i domi nanty dla ciągów, gdy przestrzeń losowa jest skończona. 53. Udowodnij następujące stwierdzenie lub znajdź kontrprzykład: Jeśli X, Y i Z są zmiennymi losowymi, takimi że wszystkie trzy pary (X,Y), (X,Z) i (Y, Z) są niezależne, to X + Y jest niezależne od Z. 54. Wzór (8.20) dowodzi, że wartość średnia dla VX wynosi VX. Jaka jest wariancja dla VX? 55. Normalna talia kart zawiera 52 karty, po cztery wartości w zbiorze {A, 2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,1 0 , J,Q,K}. Niech X i Y oznaczają odpowiednio warto ści pierwszej i ostatniej karty w talii. Rozważmy następujący algorytm tasowania kart: 51) Przepermutuj wszystkie karty losowo tak, aby każda permutacja wy stąpiła z prawdopodobieństwem 1/52!. 52) Jeśli X / Y, to rzuć niewyważoną monetą, na której orzeł wypada z prawdopodobieństwem p, i przejdź z powrotem do kroku SI, gdy wypadł orzeł. W przeciwnym razie zatrzymaj się. Załóżmy, że każdy rzut monetą i każda permutacja są niezależne od in nych zdarzeń. Jaka wartość p uczyni X i Y niezależnymi po zakończeniu tej procedury? 56. Uogólnij problem rzucania krążkami z ćwiczenia 48, przyjmując, że za miast pięciokąta mamy m-kąt. Jaka jest wartość średnia i wariancja dla liczby bezkolizyjnych rzutów, gdy krążki znajdują się początkowo w są siednich wierzchołkach? Pokaż, że jeśli m jest nieparzyste, to ftp dla liczby rzutów może być przedstawiona jako iloczyn rozkładów dla rzuca nia monetą: (m-1)/2 Wskazówka: Zastosuj podstawienie z = 1/cos2 0. 57. Udowodnij, że w grze Penneya wzorzec Ti t 2 ... Ti_iTi zawsze jest gorszy niż wzorzec T2Ti t 2 ... t i - i dla wyważonych monet i l ^ 3. 58. Czy istnieje ciąg A = TiT2 ... Ti_iTi orłów i reszek taki, że obydwa ciągi 0ttT2 ... Ti-i i R tit2 .. .Ti_i będą jednakowo dobre przeciw A w grze Penneya? 59. Czy istnieją wzorce A i B składające się z orłów i reszek takie, że A jest dłuższe niż B, a mimo to A pojawi się przed B częściej niż w połowie gier wyważoną monetą? 60. Niech k i n będą ustalonymi liczbami dodatnimi z k < n. a) Znajdź postać zwartą dla funkcji tworzącej prawdopodobieństwa m m ...,HTX;k)zP(H1 dla rozkładu łącznego liczby porównań potrzebnych do znalezienia k-tego i n-tego obiektu wstawionego do tablicy haszującej o m listach. b) Chociaż zmienne losowe P (h i, . . . , k) i P (h i, . . . , Hn ;n) są zale żne, to pokaż, że są one jednak częściowo niezależne: E(P(h 1, . . . , h u ; k ) P ( H i , . . . , h 1l ;n)) = ( E P ( h i,...,h n ;k))(EP(H1........h n ;n ) ) . 61. Zastosuj wynik z poprzedniego ćwiczenia do udowodnienia wzoru (8.104). 62. Kontynuując ćwiczenie 47, znajdź wariancję dla liczby dwufagów po n napromieniowaniach. Problem y badawcze 63. Rozkład normalny jest ciągłym rozkładem losowym charakteryzującym się tym, że wszystkie jego półniezmienniki są zerowe, poza wartością śred nią i wariancją. Czy istnieje łatwy sposób na stwierdzenie, że demy ciąg półniezmienników ( ki , k2) K 3 , . . . ) pochodzi z rozkładu dyskretnego? (W rozkładzie dyskretnym wszystkie prawdopodobieństwa muszą być „ato mami.” ) 1P1 A sym ptotyka Dokładne odpowiedzi są doskonałe, kiedy możemy je uzyskać; jest coś fascy nującego w posiadaniu pełnej wiedzy. Niemniej istnieją przypadki, w których dopuszczamy rozwiązania przybliżone. Jeżeli natkniemy się na sumę czy rów nanie rekurencyjne, którego rozwiązanie nie ma postaci zwartej (przy naszej aktualnej wiedzy), chcielibyśmy jednak coś na temat tego rozwiązania wie dzieć. Nie możemy się upierać, że albo wszystko, albo nic. Zresztą, jeśli nawet mamy postać zwartą odpowiedzi, to w dalszym ciągu nasza wiedza może nie być całkowita, w przypadku, gdy nie wiemy, jak porównać odpowiedź z in nymi wzorami w postaci zwartej. Na przykład, nie jest (jak dotąd) znana postać zwarta sumy Niemniej dobrze wiedzieć, że mówimy, że wartość sumy jest „asymptotyczna do” 2(3t[l). Jeszcze lepiej jest jednak mieć dokładniejszą informacje, w stylu (9-i) która daje nam „błąd względny rzędu 1/ n 2.” Ale nawet ta postać nie mówi nam, jak duże jest Sn w porównaniu z innymi wartościami. Która z wartości jest większa, Sn czy liczba Fibonacciego F4n? Odpowiedź: prawdą jest, że S2 = 22 > Fg = 21, jeśli n = 2, ale dla odpowiednio dużych n liczba F4U jest większa, ponieważ F4n ~ <ł>4n/V5 oraz 4>4 s* 6,8541, podczas gdy Naszym zadaniem w trakcie lektury tego rozdziału będzie nauczenie się, jak rozumieć i wyprowadzać podobne wyniki bez wielkiego bólu. Słowo asymptotyczny ma grecki źródłosłów oznaczający „opadający ra zem.” Starożytni matematycy greccy, badając przecięcia stożka, rozważali krzywe hiperboliczne takie, jak wykres funkcji y = v/T+~x2, który ma dwie „asymptoty” y = x oraz y = —x. Krzywa przybliża się do swoich asymptot, lecz nigdy się z nimi nie styka. W dzisiejszych czasach używamy pojęcia „asymptotyczny” w znaczeniu znacznie szerszym, mając na myśli przybliżoną wartość zbiegającą w kierunku wartości prawdziwej, gdy pewien parametr zbiega do wartości granicznej. W naszym przypadku „asymptotyczne” oznacza „prawie opadające równocześnie.” Niektóre wzory mają bardzo trudne wyprowadzenia, znacznie wykracza jące poza zakres tej książki. My zadowolimy się przedstawieniem wstępnej wiedzy dotyczącej badanej dziedziny. Naszym celem będzie przekazanie wła ściwych podstaw, umożliwiających konstruowanie bardziej złożonych tech nik. W szczególności będziemy zainteresowani znaczeniami symboli oraz ‘O’, a także innych im. podobnych. Poznamy również podstawowe metody postępowania z wielkościami asymptotycznymi. 9.1. H ierarchia Stosowane w praktyce funkcje liczb całkowitych n mają zwykle różne „asym ptotyczne współczynniki przyrostu”. Jedne z nich osiągają nieskończoność szybciej, inne wolniej. Ściślej rzecz ujmując, f(n ) -< g (n ) lim n - fo o g ( n j = 0■ (9-3) Powyższa relacja jest przechodnia. Jeżeli f(n) -< g{n) oraz g(n) -< H(n), to f(rt) -< H(n). Możemy również napisać g(n) >- f(n), gdy f(n) -< g(n). Ta notacja została zaproponowana przez Paula du Bois-Reymonda w roku 1871 [35]. Na przykład, rt -< n 2. Nieformalnie mówimy, że n rośnie wolniej niż n 2. W rzeczywistości, n a -< n p <^=> oc < |3 , (9.4) gdzie oc i |3 są dowolnymi liczbami rzeczywistymi. Oczywiście istnieje wiele funkcji zmiennej n poza potęgami n. Relacji -< możemy użyć do określenia rzędu różnych funkcji i ich uszeregowania w porządku asymptotycznym zawierającym pozycje takie, jak: 1 -<: log log n -< lo g n -< n e -< n c -< rtlogn -< cu n n -< c°n . (Gdzie e i c są dowolnymi stałymi spełniającymi zależność 0 < e < 1 < c.) Wszystkie wymienione powyżej funkcje, poza funkcją stałą 1, zmierzają do nieskończoności przy rt dążącym do nieskończoności. Oznacza to, że gdy chcemy umieścić nową funkcję w tej hierarchii, nie staramy się rozstrzygnąć czy osiąga nieskończoność, ale raczej ja k szybko to robi. Pozytywny wpływ na nasze nastawienie podczas analizy asymptotycz nej może mieć m y ś l e n i e z r o z m a c h e m , gdy próbujemy wyobrazić sobie zmienną osiągającą nieskończoność. Na przykład zgodnie z powyższą hierar chią zachodzi lo g n -< ri0,0001, co może wydawać się bujdą, jeśli ograniczymy się do tyci-tyci liczb jak „jeden gigant”, n = IO100. Dla tego przypadku lo g n = 100, podczas gdy n 0,0001 to tylko IO0,01 « 1, 0233. Niemniej, gdy pójdziemy dalej do giganteksu, n = IO10 , to lo g n = IO100 wysiada w porównaniu z n 0’0001 = IO10' 6. Nawet gdy e jest niezwykle małe (powiedzmy, mniejsze niż 1/ 1010 ), wartość lo g n będzie zdecydowanie mniejsza niż wartość n e , dla n odpo wiednio dużych. I tak dla ustalonego n = IO10 , gdzie k jest tak duże, że e ^ 10_k, otrzymujemy lo g n = 102k, podczas gdy n e ^ IO10 . Zatem stosunek (log n ) / n e osiąga zero przy n —> 00 dla każdego e > 0. Powyższa hierarchia zajmuje się funkcjami rozbiegającymi do nieskoń czoności. Często jednak jesteśmy zainteresowani funkcjami zbiegającymi do zera, zatem przydatna będzie hierarchia je porządkująca. Hierachia otrzy mana przez użycie odwrotności funkcji jest dobrze zdefiniowana dla funkcji f (n) i g(n) zbliżających się do zera, ale nigdy zera nie osiągających, ponieważ f(n) -i g(n) ^ ^ -± -y (9.6) I tak, na przykład, następujące funkcje (poza ostatnią) wszystkie zbiegają do zera: _ 1_ c cn 1 Jł_ nn J_ cn _ J ____ J _ n los n nc _1_ ne ____1 lo g n log log n 1 Przyjrzyjmy się kilku innym funkcjom, próbując znaleźć ich miejsce w hierarchii. Liczba 7t(n) mówi nam, ile jest liczb pierwszych nie większych niż n. Jej wartość to w przybliżeniu n /ln n . Ponieważ l/r t e -< 1/ l n n X 1, więc mnożąc całe wyrażenie przez n otrzymujemy n 1_e -< 7t(n) -< u . Możemy teraz uogólnić wzór (9.4) zauważając, że n ai (lo g n )a2(loglogn )*3 -< n 131 (lo g n )132(loglogn)^3 [0i u 0i2, 0C3) < (P i,P 2,P 3). (9-6) Tu *(<xi, (X2 , 0C3) < ( P i, P2 , P3 )’ oznacza porządek leksykograficzny (porządek słownikowy). Innymi słowy, albo oci < Pi, albo oc1 = pi oraz ct2 < P2 , albo oc-[ = Pi oraz oc2 = P2 i <*3 < P3A co z funkcją eV logn, jakie jest jej miejsce w hierarchii? Na takie pytania możemy odpowiadać używając reguły e f(n) e g(n) 4=^ lim (f(n) — g(n)) = — 00, (9.7) którą można wyprowadzić biorąc logarytmy obu stron definicji (9.3). Zatem 1 -< f(n) -< g(n) => e |f(n)l e lg(n)l. Ponieważ 1 -< log lo g n -< ^ /\o g n -< e lo g n , mamy też lo g n -< e ^/l°SVi -< n e. W przypadku, gdy dwie funkcje f(n) oraz g(n) mają ten sam współ czynnik przyrostu, napiszemy *f(n) x g (n )’. Bardziej formalnie: f(n) x g(n) |f(n )| ^ C |g(n)| oraz |g(n)| ^ C |f(n )|, dla pewnej stałej C oraz wszystkich odpowiednio dużych n. (9.8) Powyższy przypadek zachodzi np. wtedy, gdy f (n) jest funkcją stałą, a g(n) = cosn + arctgn. Udowodnimy później, że zachodzi on zawsze dla dowolnych funkcji f(n) i g(n) będących wielomianami tego samego stopnia. Istnieje również silniejszy związek, odpowiadający regule f(n) ~ g(n) <*=*■ lim n->oo g(n) = 1. (9.9) W przypadku tym powiemy, że funkcja ,,f(n) jest asymptotyczna do g (n ).” G. H. Hardy [179] zaproponował ciekawe, ważne pojęcie nazywane klasą fun kcji logarytmiczno-wykładniczych , zdefiniowaną rekurencyjnie jako naj mniejsza rodzina funkcji £ spełniających następujące warunki: • • • • • Funkcja stała f (n) = oc należy do £, dla wszystkich rzeczywistych oc. Funkcja tożsamościowa f (n) = n należy do £. Jeżeli f(n) i g(n) należą do £, to również f(n) — g(n) należy do £. Jeżeli f(n) należy do £, to również należy do £. Jeżeli f(n) należy do £ oraz jest „w końcu dodatnia,” to również ln f(n ) należy do £. Funkcja f(rt) nosi miano „w końcu dodatniej”, jeżeli istnieje liczba cał kowita no taka, że f(rt) > 0 dla wszystkich n ^ no. Używając powyższych reguł możemy na przykład pokazać, że f(n) + g(n) należy do klasy £ , gdy f(n) i g(n) do niej należą, ponieważ f (n) + g(n) = f(n) — (0 — g(n)). Jeżeli f(n) oraz g(n) są w końcu dodatnimi funk cjami należącymi do £, to ich iloczyn f(n )g (n ) = e lnf(1x)+lll9(rL) oraz iloraz f(rt)/g(rt) = e lnf(TL) - ln9(TL) również należą do £, są zatem funkcjami po dobnymi do y / i (n) = e2 lnf(n)>itd. Hardy pokazał, że każda fukcja logarytmiczno-wykładnicza jest w końcu dodatnia, w końcu ujemna lub odpowiada tożsamościowo zeru. Stąd też zarówno iloczyn, jak i iloraz dowolnych dwóch £-funkcji należą do £, wykluczając dzielenie przez funkcję tożsamościowo równą zeru. Główne twierdzenie Hardy’ego dotyczące funkcji logarytmiczno-wykładniczych mówi, że funkcje te tworzą hierarchię asymptotyczną. Jeżeli f(n) oraz g(rt) są funkcjami z £, to albo f(rt) -< g(rt), albo f(n) >- g(n), albo f (rt) x g(n). W ostatnim przypadku, faktycznie, istnieje stała oc taka, że f(n) - ag(n). Dowód twierdzenia Hardy’ego wykracza poza zakres tej książki. Niemniej dobrze zdawać sobie sprawę z tego, że takie twierdzenie istnieje, ponieważ prawie wszystkie funkcje, z jakimi mamy do czynienia, należą do £. W prak tyce najczęściej możemy umieścić daną funkcję w hierarchii bez większych kłopotów. 9.2. N o ta cja O__________________________________ W roku 1894 matematyk niemiecki Paul Bachmann zaproponował znako mitą konwencję notacyjną w analizie asymptotycznej, spopularyzowaną w późniejszych latach przez Edmunda Landaua i innych. Jej użycie widzieli śmy w takich wzorach, jak Hn = lnrt + y + 0 ( 1 / r t ) , który mówi nam, że n-ta liczba harmoniczna jest równa sumie logarytmu naturalnego z n, stałej Eulera oraz wielkości będącej „Dużym O od 1 nad n.” „... wir durch das Zeichen 0 (n) eine GróSe ausdriicken, dereń Ordnung in Bezug auf n die Ordnung von n nicht uberschreitet; ob sie wirklich Glieder von der Ordnung n in sich enthalt, bleibt bei dem bisherigen SchluBverfahren dahingestellt.” P. Bachmann [17] Wartość ostatniego składnika nie jest sprecyzowana. Niemniej jednak, nieza leżnie od jego wartości, notacja ta zapewnia, że jego wartość bezwzględna nie przewyższa wartości 1/rt pomnożonej przez pewną stałą. Piękno notacji O wyraża się poprzez ukrycie nieistotnych szczegółów, co pozwala skoncentrować uwagę na cechach znaczących: Wielkość 0 (1/rt) jest pomijalnie mała, jeżeli stała stojąca przy 1/rt jest dla nas bez znaczenia. Również użycie O wewnątrz wzoru powinno być poprawne. Chcąc wy razić wzór (9.10) przy użyciu notacji z rozdziału 9.1, zmuszeni jesteśmy do przeniesienia ‘lnrt + y ’ na lewą stronę, otrzymując słabszy wynik Hu —Inn —y -< log logn n lub silniejszy Hn —ln n —y x To nie jest nonsens, ale sensu też nie ma. Notacja Dużego O zapewnia od razu odpowiedni poziom precyzji, pozwalając na uniknięcie przenoszenia. Rozważenie kilku dodatkowych przykładów powinno wyjaśnić przydat ność użycia niedoprecyzowanych wielkości. Czasami używamy oznaczenia ‘±1 ’ do określenia czegoś będącego +1 albo —1, nie wiedząc (czy może nie dbając o to), czym jest w rzeczywistości. Mimo to możemy tym manipulować wewnątrz wzorów. N. G. de Bruijn we wstępie do swojej książki Asymptotic Methods in Analysis [49] wprowadza notację Dużego L ułatwiającą zrozumienie Dużego O. Używając zapisu L(5) na określenie liczby, której wartość bezwględna jest mniejsza niż 5 (bez precyzowania jej dokładnej wartości), możemy wyko nywać różne obliczenia nie posiadając pełnej wiedzy. Na przykład, możemy wyprowadzać wzory takie, jak 1 +L (5) = L(6); L(2) + L(3) = L(5 ); L(2 )L(3) = L(6); eL^ = L(e5), i tak dalej. Nie możemy jednak wnioskować, że L(5) — L(3) = L(2), ponieważ lewa strona może odpowiadać 4 —0. W rzeczywistości, jedyne, co możemy powiedzieć, to L(5) —L(3) = L(8). Notacja O Bachmanna przypomina notację L, jest jednak jeszcze mniej precyzyjna: O (a) odpowiada liczbie, której wartość bezwzględna jest równa co najwyżej iloczynowi pewnej stałej i |a|. Nie precyzujemy wartości liczby, więcej, nie mówimy nic na temat stałej. Oczywiście pojęcie „stałej” nie ma sensu w przypadku, gdy nie ma żadnej zmiennej wewnątrz 0 (*)- Zatem rozsądne jest używanie notacji O wyłącznie w kontekście, w którym wartość przynajmniej jednej wielkości (powiedzmy n) jest zmienna. W powyższym kontekście wzór f(n) = 0 (g (n )) dla wszystkich n mówi nam, że istnieje stała C taka, że KM ^ C |g(n)| dla wszystkich rt; (9*12) w przypadku, gdy 0 (g (u )) użyte jest wewnątrz innego wzoru, reprezen tuje funkcję f(n) spełniającą wzór (9.12). Wartości f(n) pozostają nieznane, wiemy jednak, że nie są zbyt duże. Podobnie, wielkość L(n) powyżej repre zentuje nie sprecyzowaną funkcję f (rt), której wartości spełniają |f(rt)| < |n|. Główna różnica pomiędzy L i O jest taka, że notacja O wplata nie sprecy zowaną stałą C. Każde pojawienie się O może wpleść następne C, niemniej każde C jest niezależne od tl. Na przykład wiemy, że suma kwadratów pierwszych tl liczb naturalnych wyraża się wzorem □n ^ u ( n + l ) ( n + 1) = ^ n 3 + \ n 2 + \ n . Możemy zapisać □„ = 0 ( n 3) ponieważ | i n 3+ i n 2+ i n | ^ 5 |n |3+ | | n | 2+ | | n | ^ j |n 3|+ ^ |n 3| + | | n 3| = |n3| dla wszystkich całkowitych u. Podobnie prawdziwy jest bardziej precyzyjny wzór □n = j n 3 + O (n2) . Możemy być również mniej staranni, tracąc cześć informacji, mówiąc, że □ n = 0 ( n 10) . Definicja O nie zmusza nas do formułowania najlepszych oszacowań. Ale zaraz. Co się stanie, gdy zmienna n nie jest całkowita? Kiedy mamy wzór taki jak S(x) = ^x3 + ^x2 + |x , gdzie x jest liczbą rzeczywistą? Nie możemy teraz powiedzieć, że S(x) = 0 (x3), ponieważ stosunek S (x )/x 3 = j + ^x_1 + \ x ~ 2 przestaje być ograniczony przy x —>0. Nie możemy również powiedzieć, że S(x) = 0 (x), ponieważ stosunek S (x)/x = ^x2 + ^x + \ przestaje być ograniczony, gdy x —> 00. Najwyraźniej nie możemy używać notacji O wraz z S(x). Rozwiązaniem powyższego dylematu może być spostrzeżenie, że zmienne używane wewnątrz O podlegają zazwyczaj warunkowi strony. Na przykład jeżeli zastrzeżemy, że |x| ^ 1, albo że x ^ e, gdzie e jest dowolną stałą do datnią, albo że x jest całkowite, wtedy możemy napisać S(x) = 0 (x3). Jeżeli zastrzeżemy, że |x| ^ 1, albo że |x| ^ c, gdzie c jest dowolną stałą dodat nią, to możemy napisać S(x) = 0 (x). Notacja O podlega prawom swojego środowiska poprzez więzy nałożone na zmienne. Te więzy są często określone przez zależności graniczne. Na przykład możemy powiedzieć, że f(n) = 0 (g(n)) przy n OO. ( 9 - 13 ) Oznacza to, że warunek O jest spełniony dla rt „bliskich” 00. Nie dbamy o to, co się dzieje, dopóki rt nie jest odpowiednio duże. Ponadto, nie precyzujemy dokładnie pojęcia „bliski” . W takich przypadkach wystąpienie O niejawnie zakłada istnienie dwóch stałych, C oraz uq, takich że ^ C | g (rt) | You are the fairest of your sex, Let me be your hero; I love you as one over x, As x approaches zero. Positively. dla wszystkich rt ^ rio. Wartości C oraz no mogą być różne dla każdego O, nie zależą jednak od rt. Podobnie, notacja f(x) = 0 (g (x )) przy x —» 0 oznacza, że istnieją dwie stałe C oraz e takie, |f(x)| ^ C|g(x)| że dla wszystkich |x| ^ e. (915) Graniczna wartość nie musi odpowiadać 00 czy 0 . Równie dobrze możemy napisać ln z = z —1 + 0 ( ( z —I)2) „And to auoide the tediouse repetition of these woordes: is eąualle to: I will sette as I doe often in woorke use, a paire of paralleles, or Gemowe lines of one lengthe, thus: ■■■ , bicause noe .2. thynges, can be moare eąualle.” R. Recorde [306] 914) ( - przy z 1. ponieważ możemy udowodnić, że | ln z —z + 11 |z — 112, gdy |z — 11^ \ . Nasza definicja O stopniowo rozrosła się na tych kilku stronach z czegoś całkiem oczywistego do czegoś dość skomplikowanego. Mamy teraz O re prezentujące niezdefiniowaną funkcję oraz dodatkowe dwie niesprecyzowane stałe, zależne od środowiska. Może to wyglądać na wystarczająco skompliko waną definicję każdej rozsądnej notacji, ale na tym nie koniec! Nie powinni śmy pominąć czającego się w tle następującego problemu. Musimy zdać sobie sprawę, że możemy napisać ^rt3 + j n 2 + = 0 ( n 3) , podczas gdy nigdy nie wolno nam napisać powyższej równości z przesta wionymi stronami. W przeciwnym razie moglibyśmy wywnioskować absurd, taki jak rt = rt2, korzystając z równoważności rt = 0(rt2) oraz rt2 = 0(rt2). Kiedy korzystamy z notacji O, używając wzorów z nieprecyzyjnie określo nymi wielkościami, to mamy do czynienia z równościami jednostronnymi. Prawa strona równania nie dostarcza więcej informacji niż lewa, a może mniej. Prawa strona jest „rozmyciem” lewej. Ze ściśle formalnego punktu widzenia, zapis 0 (g(rt)) nie jest użyty do określenia jednej funkcji f(n ), lecz całego zbioru funkcji f(n) takich, że M l ^ C |g(n)|, dla pewnej stałej C. Zwykły wzór g(n) nie zawierający no tacji O odpowiada zbiorowi zawierającemu pojedynczą funkcję f(n) = g(n). Jeżeli S oraz T są zbiorami funkcji zmiennej n, to oznaczenie S + T odpo wiada zbiorowi wszystkich funkcji postaci f(n) + g(n), gdzie f (n) G S oraz g(n) G T. Inne oznaczenia, takie jak S — T, ST, S/T, y/S, es , InS definiujemy podobnie. Zatem „równość” umieszczona pomiędzy takimi zbiorami funkcji jest, ściśle mówiąc, zaw ieraniem zbiorowym. Znak ł=* w rzeczywistości re prezentuje znak ‘C \ Powyższe definicje formalne dają silną podstawę logiczną przekształceniom wyrażeń typu O. Na przykład przez „równanie” ^n3 + 0(rt2) = 0(rt3) rozumiemy, że Si C S2, gdzie Si jest zbiorem wszystkich funkcji postaci | n 3 + fi (n) takich, że istnieje stała Ci, dla której |fi(n )| ^ C-||n2|, oraz S2 jest zbiorem wszystkich funkcji f2(n) takich, że istnieje stała C2, dla której |f2 (ti) | ^ C2|rt3|. Możemy formalnie udowodnić powyższe „równanie” pokazując, że dowolny element lewej strony należy również do prawej. Przy danym | u 3+ f 1(n) takim, że |f 1(rt) | ^ Ci |n2|, musimy udowodnić, że istnieje stała C2 taka, że |^ n 3 + f i (rt)| ^ C2|rt3|. Użycie stałej C2 = \ + Ci okazuje się wystarczające, ponieważ n 2 ^ |n31, dla wszystkich naturalnych rt. Jeżeli znak ‘=* w rzeczywistości oznacza ‘C*, to dlaczego zamiast nad używać znak równości nie użyjemy ‘C’ ? Są ku temu cztery powody. Pierwszy— tradycja. Uczeni zajmujący się teorią liczb zaczęli używać notacji O ze znakiem równości i zwyczaj ten się utrwalił. Jest on obecnie na tyle uznany, że nie możemy mieć nadziei, iż społeczność matematyczna przyjmie jego zmianę. Drugi — tradycja. Ludzie pracujący z komputerami przyzwyczaili się cał kowicie do oglądania nadużytego znaku równości— od lat programiści języ ków FORTRAN oraz BASIC pisali znak przypisania w postaci ‘N = N + V. Jedno więcej nadużycie to mimo wszystko niedużo. Trzeci— tradycja. Często odczytujemy jako słowo ‘jest’. Na przykład wzór Hrt = O (logn) wyrażamy mówiąc, że „H en jest duże O od log n.” Po angielsku to ‘jest’ jest jednostronne. Mówimy, że ptak jest zwierzęciem, ale nie każde zwierzę jest ptakiem; „zwierzę” jest rozmyciem pojęcia „ptak” W końcu czwarty powód— zapis ten jest naturalny dla naszych potrzeb. Jeśli ograniczylibyśmy użycie notacji O do sytuacji, w których wypełnia ona cała prawą stronę wzoru— tak jak w przypadku przybliżenia liczby harmo nicznej Hu = O (log n) czy przy opisie złożoności czasowej T (n) = O (n log n) algorytmu sortującego— nie miałoby znaczenia, czy używamy *=’, czy czegoś „To oczywiste, że znak = jest niewłaściwym znakiem dla tego typu zależności, ponieważ sugeruje on symetrię, której nie ma. ... Po otrzymaniu tego ostrzeżenia, nie widać wielkich szkód, jakie miałoby spowodować użycie znaku—, więc będziemy go stosowali z tej choćby przyczyny, że jest to wygodne.” N. G. de Bruijn [49] innego. Lecz jeśli używamy notacji O wewnątrz wyrażenia, tak jak to zwykle czynimy w obliczeniach asymptotycznych, naszej intuicji odpowiada zarówno rozumienie znaku równości jako rzeczywistej równości, jak i interpretacji wy rażenia 0(1 /n ) jako bardzo małej wielkości. Będziemy więc kontynuować użycie znaku *=’, ale 0 (g(n)) będziemy rozumieć jako nie w pełni określoną funkcję, wiedząc, że w każdej chwili, gdy zostaniemy do tego zmuszeni, możemy powrócić do definicji teoriozbiorowej. Przyglądając się szczegółowo kruczkom definicyjnym, musimy zauważyć jeszcze jedną dodatkową trudność techniczną. Jeżeli środowisko wzoru za wiera więcej niż jedną zmienną, to notacja O odpowiada formalnie zbiorowi funkcji niejednej, lecz dwóch lub więcej zmiennych. Dziedziną dowolnej funk cji jest każda zmienna podlegająca rzeczywistym zmianom. Takie podejście może się okazać troszeczkę za sprytne, ponieważ zmienna może być zdefiniowana tylko w części wyrażenia, w której jest kontrolowana przez Y. CZY c°ś podobnego. Na przykład przyjrzyjmy się bliżej równaniu n ^ ( k 2 + 0 (k )) = -|n 3 + 0 ( n 2), dla całkowitych rt ^ 0. (9.16) k=0 Wyrażenie k2 + 0 (k), po lewej, odpowiada zbiorowi funkcji dwóch zmiennych postaci k2 + f(k,rt) takich, że istnieje stała C spełniająca |f(k ,n )| ^ Ck, dla 0 ^ k ^ n. Suma powyższego zbioru funkcji przy 0 ^ k ^ n jest zbiorem wszystkich funkcji g(ri) postaci n ^ 2 (k2+ f(k ,n )) = + \ n 2 + ^n + f(0,n ) + f ( l , n ) H-------|-f(n,T i), k=0 gdzie funkcja f ma znaną nam własność. Ponieważ mamy | \ n 2 4- + f (0, n) + f (1, rt) H-------1- f (n, rt) | ^ -jfTi2 -(- ^ti2 -ł- C •0 -|- C • 1 -j----- h C -n < rt2 + C(n2 + n )/2 < (C + l)rt2 , (Nadszedł właściwy czas na ćwiczenia rozgrzewające, 3 oraz 4.) więc wszystkie takie funkcje g(n) należą do prawej strony (9.16), pociągając za sobą prawdziwość (9.16). Ludzie nadużywają czasami notacji O, zakładając, że daje ona dokładny porządek przyrostu. Używają jej do określania zarówno górnych, jak i dolnych granic. Na przykład jakiś algorytm sortujący n liczb może być nazwany nie efektywnym, „ponieważ jego czas działania jest 0 (n2).” Z tego, że czas dzia łania jest 0 ( n 2) nie wynika jednak, że czas ten nie może być również 0 (n ). Przy dolnych granicach używamy innej notacji, Duże Omega : f(n) = Q (g (n )) |f(n )| ^ C |g(n)| dla pewnego C > 0.(9.17) Mamy f (n) = Q (g(n)) wtedy i tylko wtedy gdy g(rt) = 0(f(ri)). Algorytm sortujący, którego czas działania jest Q (n2), jest nieefektywny w porównaniu z pracującym w czasie O(rtlogrt), kiedy rt jest odpowiednio duże. Na koniec dochodzimy do Dużego Theta, określającego dokładny porzą dek przyrostu: f(n) = 0 (g(n)) 4=4- f(n) = 0 (g(n)) oraz f(n) = Q (g(n )). (9-18) Mamy f(n) = 0 (g (n )) wtedy i tylko wtedy, gdy f(n) g(n) w notacji użytej wcześniej w równaniu (9.8). Edmund Landau [238] zaproponował notację „małego o” , f(n) = o(g(n)) <=> |f(n)| ^ e|g(n)| dla wszystkich rt no(e) i wszystkich stałych e > 0. (919) Zasadniczo notacja małego o odpowiada relacji f(n) -< g(n) z (9.3). Dodat kowo mamy f(n) ~ g(n) f(n) = g(n) + o ( g ( n ) ) . ( 9 -2 ° ) Wielu autorów używa ‘o’ we wzorach asymptotycznych, lecz bardziej bezpośrednie wyrażenie ‘O’ jest prawie zawsze preferowane. Na przykład średni czas działania znanej metody zwanej „sortowaniem bąbelkowym” za leży od wartości asymptotycznej sumy P(n) = JL£=0 kTL_kk!/rt!. Podsta wowe metody asymptotyczne wystarczają, aby dowieść prawdziwości wzoru P(n) ~ y^7m /2, co oznacza, że stosunek V{n)/yJnn/2 osiąga 1, przy rt —>00. Jednak prawdziwe zachowanie się P(rt) można lepiej zrozumieć rozwijając różnicę , P(rt) — ^ J n u /2 , a nie ich iloraz: rt P (n )Ą /7tn/2 P(n) - y/nn/2 1 10 20 0, 798 0,878 0,904 30 40 50 0,918 0,927 0,934 -0,253 -0 ,4 8 4 -0 ,5 3 8 -0,561 -0,575 -0,585 Świadectwo liczbowe w środkowej kolumnie nie wzbudza zbytniego szacunku. Jest ono wyraźnie dalekie od dowodu, że ?{n)/y/nn/2 osiąga błyskawicznie 1, jeśli w ogóle osiąga. Za to prawa kolumna wskazuje, że P(n) jest rzeczywiście Ponieważ Cl oraz 0 są dużymi greckimi literami, więc O pojawiające się w notacji O musi odpowiadać dużemu greckiemu Omikron. Ostatecznie, to właśnie Grecy wprowadzili asymptotykę. bardzo bliskie y m i/Ż . Zachowanie P(rt) będziemy mogli opisać dokładniej, jeśli uda nam się wyprowadzić wzory postaci P(tl) = y /n n /2 + 0 ( 1 ) , czy nawet ostrzejsze przybliżenia jak P(n) = \J n n /2 - § + 0(1 / y / n ) . Dowody wzorów typu O wymagają silniejszych metod analizy asymptotycz nej, lecz dodatkowy nakład pracy związany z poznaniem zaawansowanych technik rekompensowany jest głębszym zrozumieniem płynącym z określenia granic typu O. Wiele algorytmów sortujących charakteryzuje się złożonością czasową po staci: T(n) = A n l g n + B n + O (logn) Zauważmy, że log log logn jest niezdefiniowane dla 10. przy pewnych stałych A oraz B. Analiza zakończona na etapie T (n) ~ A n lg n nie daje pełnego obrazu. Wybór algorytmu sortującego wyłącznie na podsta wie wartości stałej A nie jest najlepszą strategią. Algorytmy za dobre ‘A ’ płacą często złym ‘B \ Ponieważ n l g n nie rośnie dużo szybciej niż n, więc algorytm szybszy asymptotycznie (z niewiele mniejszą wartością A) może być szybszy wyłącznie dla wartości n zasadniczo nie pojawiających się w praktyce. Oznacza to, że niezbędne są metody asymptotyczne pozwalające dodatkowo wyliczyć wartość B, gdy chcemy podjąć właściwą decyzję przy wyborze rozwiązania. Zanim zaczniemy gruntowne studia notacji O, porozmawiajmy o jeszcze jednym, drobnym aspekcie matematycznego stylu. W rozdziale tym użyli śmy trzech różnych notacji rozważając logarytmy: lg, ln oraz log. Często, w połączeniu z metodami komputerowymi, używamy £lg’, ponieważ logarytmy dwójkowe najczęściej pojawiają się w tym kontekście. Równie często używa my ‘ln’ przy czysto matematycznych obliczeniach, ponieważ wzory dla logarytmów naturalnych są przyjemne i proste. A co w przypadku ‘log’? Czyż nie jest to „powszechny” logarytm z podstawą 10, który uczniowie poznają w szkole średniej — „powszechny” logarytm, który zdaje się być wyraźnie omi jany w matematyce i informatyce? Istotnie, wielu matematyków w rezultacie powoduje zamieszanie, używając ‘log’ w znaczeniu zarówno logarytmu natu ralnego, jak i dwójkowego. Nie ma tu powszechnej zgody. Możemy jednak odetchnąć z ulgą, gdy logarytm pojawia się wewnątrz notacji O, ponieważ O zaniedbuje stałe multiplikatywne. Nie ma żadnej różnicy pomiędzy O (lgn), O (Inn) oraz O (logn), przy n —> oo. Podobnie, nie ma różnicy pomiędzy O (lglgn ), O (lnlnn) oraz O (log logn). Możemy wybrać to, co jest dla nas najlepsze. I tak ‘log’ wydaje się być najwygodniejsze, ponieważ jest je najła twiej wymówić. Dlatego też, używamy zwykle ‘log’ we wszystkich tych sytu acjach, w których podwyższa to czytelność, bez wprowadzania dwuznaczno ści. 9.3. P rzek szta łcen ia ty p u O Podobnie jak każdy formalizm matematyczny, notacja O podlega regułom przekształceń uwalniającym nas od niemiłych szczegółów definicyjnych. Raz udowodniwszy poprawność reguł przy użyciu formalnych definicji, możemy później pracować na wyższym poziomie abstrakcji, zapominając o faktycz nym sprawdzaniu, czy jeden zbiór funkcji jest zawarty w drugim. Nie musimy nawet obliczać stałych C pojawiających się wraz z każdym O dopóty, dopóki postępujemy zgodnie z regułami gwarantującymi istnienie takich stałych. Na przykład możemy raz na zawsze udowodnić, że n 0 (nT ( 9 -21 ) 0 (f(n)) + 0 (g(n)) = 0 (|f(n)| + |g(n)|). Sekretem bycia nudnym jest powiedzenie wszystkiego. Yoltaire (9 -22 ) Później możemy natychmiast powiedzieć, że 31n 3 +, i2ni^2 +, i6n = 0 (n3) + 0 ( n 3) + 0 ( n 3) = 0 ( n 3), unikając żmudnych obliczeń z poprzedniego roz działu. Oto kilka następnych reguł wynikających wprost z definicji: f (n) c • 0 (f(n)) 0 ( 0 (f(n))) 0 (f(n)) 0 (g(n)) 0 (f(n)g(n)) 0 (f(n)); 0 (f (n ) ) , ( 9 -23 ) jeżeli c jest stałą; (9-24) 0 (f(n)); (9-25) 0 (f(n)g(n)); (9 -26 ) f(n) 0 (g(n)) . (9-27) Ćwiczenie 9 zawiera dowód reguły ( 9 . 2 2 ) , reszta dowodów jest analogiczna. Wzory o postaci z lewej strony możemy zawsze zastąpić ich prawostronnymi odpowiednikami, nie zważając na ograniczenia obowiązujące zmienną tl. Równania ( 9 . 2 7 ) oraz ( 9 . 2 3 ) implikują tożsamość 0 (f(n )2) = 0 (f(n ))2. Czasem pomaga to uniknąć zbędnych nawiasów, ponieważ możemy napisać O (logn) zamiast O ((logn)' Obie postacie są bardziej pożądane niż niejednoznaczne ‘0 (log n ) ’ używane przez niektórych autorów w celu uzyskania krótszego zapisu ‘O (loglogn )’. (Uwaga: wzór 0(f(n))2 nie oznacza zbioru wszystkich funkcji g{n)2 , gdzie g(n) jest 0(f(n)). Funkcje postaci g (n)2 nie mogą być ujemne, a zbiór 0(f(n))2 zawiera takie funkcje. W ogólności, jeżeli S jest zbiorem, notacja S2 oznacza zbiór wszystkich iloczynów S1S2, dla si i s2 należących do S, a nie zbiór wszystkich kwadratów s2, dla s e S .) Czy możemy również napisać O (logn) 1 zamiast O ((logn) *)? Nie! To byłoby już nadużyciem tej notacji, ponieważ zbiór funkcji 1/O (lo g n ) nie jest podzbiorem ani nadzbiorem 0 (1/lo g n ). Możemy legalnie zastąpić 0 ((lo g n )- 1 ) przez O (lo g n )- 1 , ale to może okazać się kłopotliwe. Ograni czymy więc użycie „wykładników na zewnątrz O” do dodatnich stałych całkowitych. Szeregi potęgowe dostarczają nam najbardziej użytecznych operacji. Je żeli suma S(z) - Y anZn n$>0 jest bezwzględnie zbieżna dla pewnej liczby zespolonej z = zo, to S(z) = 0 (1 ), dla wszystkich \z\ ^ \z q \. To jest oczywiste, ponieważ |S(z}| ^ ^ j a J l z r rtÔ = C < oo. nÔ W szczególności, S(z) = 0 (1), jeśli z —» O, oraz S(1 /n ) = 0 (1), jeśli n —> oo, pod jedynym warunkiem — szereg S(z) jest zbieżny dla przynajmniej jednej niezerowej wartości z. Możemy używać tej zasady do obcinania szeregu potę gowego na dowolnie wybranej pozycji, szacując resztę za pomocą wyrażenia typu O. Na przykład nie tylko S(z) = 0 (1), ale również S(z) = a 0 + O (z), S(z) = a0 + ai z + O (z2), 1 tak dalej, ponieważ S(z} = Y_ aiczk + zm n^m X. a nZn_m- O^kcm Ostatnia suma, podobnie jak szereg S(z), jest zbieżna bezwzględnie przy z = zo oraz jest 0 (1). Tabela 499 zawiera kilka najbardziej użytecznych wzorów asymptotycznych, których połowa oparta jest wprost na obcięciu szeregu potęgowego zgodnie z powyższą regułą. Szeregi Dirichleta, będące sumami postaci a k /k z, mogą być obci nane w podobny sposób. Jeżeli szereg Dirichleta jest zbieżny bezwzględnie T abela 4 9 9 . Przybliżenia asymptotyczne, ważne przy rt —» oo oraz z —> 0 j- t i—L—44. o f — ) 120tt4 \ n 6/ ni = 'y /h m ( U^ K e) l 1 + 12n ‘ 288n 2 % .* 51840n 3 przy z = zo, to możemy go obciąć na dowolnym wyrazie, otrzymując przy bliżenie Y aTc/kz + 0(m_z), 1< ;k < m prawdziwe dla 9łz ¥łzo. Asymptotyczna postać liczb Bernoulliego Bn w tabeli 499 obrazuje tę zasadę. Z drugiej strony, wzory asymptotyczne, w tabeli 499, dla liczb Hu , rt! oraz 7t(n) nie są obcięciami zbieżnych szeregów. Jeżeli rozwiniemy je nieograniczenie, mogą okazać się rozbieżne dla wszystkich wartości rt. Łatwo to zauważyć na przykładzie funkcji 7t(n). W podrozdziale 7.3 zaobserwowaliśmy już (przy kład 5), że szereg potęgowy k !/(ln n )k jest rozbieżny wszę dzie. Jednakże powyższe obcięcia okazują się użytecznymi przybliżeniami. Powiemy, że błąd bezwzględny przybliżenia asymptotycznego jest równy 0 (g (rt)), jeżeli jest ono postaci f(n) + 0 (g (rt)), gdzie f(rt) nie zawiera O. B łąd względny przybliżenia wynosi 0 (g(rt)), jeżeli jest ono postaci f(rt)(l + 0 (g(rt))), gdzie f(rt) nie zawiera O. Na przykład błąd bezwzględny przybli żenia liczby Hn. w tabeli 499 jest równy 0 (rt“ 6). Błąd względny przybliżenia rt! z tej samej tabeli wynosi 0 (rt~4). (W rzeczywistości prawa strona (9.29) nie jest przedstawiona w wymaganej postaci f (rt) (l + 0 ( n 4) ) , ale stanie się tak, jeśli tylko zechcemy zapisać ją jako 1 288rt2 (Rozważanie błędu względnego jest wygodne w przypadku odwrotności, ponieważ 139 ) ( l + 0 ( n - 4)); 51840rt3 podobne obliczenie jest treścią ćwiczenia 12.) Błąd bezwzględny tego przy bliżenia wynosi 0 (nn -3 ’5e-TL). Odpowiada on liczbie poprawnych cyfr w rozwinięciu dziesiętnym części ułamkowej, przy pominięciu wyrazu O. Błąd względny odpowiada liczbie poprawnych „cyfr znaczących.” W dowodzie ogólnych praw możemy użyć obcięcia szeregu potęgowego: 1 /(1 + 0 (e )) = 1 + 0 ( e ).j gdy f (n) -< 1; (9-36) gdy f(n) = 0 (1 ). (9-37) (Zakładamy tu, że rt 00. Podobne wzory są prawdziwe dla ln(l + 0 (f(x >0 (f (x)) orazprzy x —> 0.) Na przykład niech ln(l + g(rt)) będzie dowolną funkcją należącą do lewej strony (9.36). Istnieją wówczas stałe C, rto oraz c takie, że |g(n )| $ C |f( tl)| sC c < 1 dla wszystkich rt ^ rto. Wynika stąd, że suma nieskończona ln (1 + g(n)) = g(n) • (1 - |g(n) + jg (n )2 ----- ) jest zbieżna dla wszystkich rt ^ n 0, a zamknięty w nawiasy szereg jest ograni czony przez stałą 1+ ^ c + | c 2H---- . Otrzymujemy dowód (9.36). Dowód (9.37) przebiega analogicznie. Wykorzystując równania (9.36) oraz (9.37) otrzymu jemy użyteczny wzór (1+0(f(„)))<™ "» . , + 0(f<n),,|n|)p M ) Problem 1: Powrót do K oła Fortuny Spróbujmy teraz naszego szczęścia z kilkoma innymi problemami asympto tycznymi. W rozdziale 3 wyprowadziliśmy równanie (3.13) na liczbę wygry wających pozycji w pewnej grze: W = [N/KJ + ^K2 + | K - 3 , K = [v^ N J. Wówczas obiecaliśmy, że asymptotyczna wersja W zostanie wyprowadzona w rozdziale 9. Słowo się rzekło, jesteśmy w rozdziale 9. Spróbujmy zatem oszacować W, przy N —» 00. Głównym pomysłem będzie pozbycie się znaków podłogi, przez zastą pienie zmiennej K wyrażeniem N 1/3 + 0 (1). Kontynuując przekształcenia dochodzimy do K = N 1/3(1 + 0 ( N “ 1/3) ) . Nazywamy to „wyciąganiem większej części.” (Później będziemy często sto sować ten chwyt.) Mamy teraz K2 = N 2 /3 (1 + 0 (N -1 /3 ))2 = N 2/3( 1 + 0 ( N ~ 1/3)) = N2/3+ 0 ( N 1/3) dzięki (9.38) oraz (9.26). Podobnie [N/KJ = N 1_' /3(1 + 0 ( N - , / 3 ))-1 + 0 (1 ) = N2/3(1 + 0 ( N “ 1/3)) + 0 (1 ) = N2/3 + 0 ( N 1/3). Zatem liczba wygrywających pozycji wynosi W = N 2/ 3 + O fN 1/ 3) + 2 (N 2/3 + 0 (N ,//3)) + 0 (N 1/3) + 0 (1) = 3 N 2/3 + 0 ( N i / 3) (939) Zauważmy, jak wyrazy O pochłaniają inne do momentu, aż pozostaje tylko jeden. To jest bardzo typowa sytuacja. Obrazuje ona przydatność użycia notacji O wewnątrz wzoru. Problem 2: Zaburzenie wzoru Stirlinga Niewątpliwie przybliżenie Stirlinga dla liczby rt! jest najbardziej znanym wzo rem asymptotycznym. Poprawność przybliżenia udowodnimy w dalszej części rozdziału. Teraz zajmiemy się bliższym poznaniem jego własności. Jedna z wersji przybliżenia ma następującą postać: n! = y /ln n ^1 + ^ + 0 ( n - 3 )^ , jeżeli n —> 00, (9.40) dla pewnych stałych a i b. Ponieważ wzór ten jest prawdziwy dla wszystkich odpowiednio dużych rt, więc musi być prawdziwy również wówczas, gdy rt zastąpimy przez n — 1: ( n - 1 ) ! = i/27t(n — 1) x ( 1+ ~ T + ~ jy 2 + + °0 (( (( n 3) )) • n _—1) 1 ) 3) (9 4 i) Oczywiście wiemy, że (rt — 1)! = n l/n . Stąd prawa strona tego wzoru musi się uprościć do prawej strony wzoru (9.40), podzielonej przez n. Spróbujmy zatem uprościć (9.41). Pierwszy czynnik staje się łatwy w obróbce, jeśli użyjemy sztuczki z wyciąganiem największej części: y/2n[n —1) = V Inn (1 —n 1)1/2 Zastosowaliśmy tutaj równanie (9.35). Podobnie mamy 0 ( ( n —I)"3) = 0 ( n - 3 (1 —n - 1 )-3 ) = 0 (n ~ 3). Jedyną częścią wzoru (9.41), która wymaga sprytnego podejścia, jest czynnik (n — 1)n - 1 , o wartości równej n n 1(1 —n 1)n 1 = n u 1(1 —n 1)rL(l + t l 1 + n 2 + 0 (n 3) ) . (Rozwijanie kontynuujemy do momentu, w którym otrzymamy względny błąd rzędu 0 ( n 3), ponieważ błąd względny iloczynu jest sumą błędów względnych samodzielnych czynników. Wszystkie wyrazy 0 (n “ 3) zlewają się w jeden.) W celu rozwinięcia (1 — n _1)n , obliczamy najpierw ln(1 — n _1), a na stępnie tworzymy funkcję wykładniczą, euln^1-Tl (1 —rt-1 )n = exp(nln(l —n - 1 )) = exp(n(—n _1 — \n ~ 2 — \n ~ s + 0 (n ~ 4))) = exp(—1 — \n~^ —\n ~ 2 + O (u- 3 )) = exp(—1) • exp(—\ n ~ A) • exp(—^n- 2 ) • e x p (0 (n - 3 )) = e x p ( - l) • (1 \ n ~ ' + \ n ~ 2 + 0 ( n “ 3)) . (1 - l n ~ 2 + 0 ( n - 4)) • (1 + 0 ( n - 3)) = e"1 (1 - l n " 1 - ^ n - 2 + 0 (n " 3) ) . Używamy powyżej zapisu expz zamiast ez, ponieważ pozwala nam to pra cować ze złożonym wykładnikiem, w najbardziej widocznej części wyraże nia, unikając kłopotliwej pracy z indeksami. Musimy rozwinąć ln(1 — n _1) z błędem bezwzględnym 0 (n- 4 ). Działania zamierzamy zakończyć z błędem względnym O (u - 3 ), ponieważ logarytm jest wymnażany przez n. Prawa strona wzoru (9.41) została właśnie uproszczona do iloczynu y /ln n oraz n n-1/ eTL pomnożonego przez iloczyn następujących czynników: (1 — \ n ~ A — |r t ~ 2 + 0 ( n - 3 )) • (1 + U - 1 + n - 2 + 0 ( n - 3)) • (1 \ n ~ A - J fn “ 2 + 0 ( n ~ 3)) • (1 + art-1 + (a + b )n -2 + 0 ( n - 3 ) ) . Obliczenie całego iloczynu oraz umieszczenie wszystkich wyrazów pod jed nym 0 ( n - 3 ) daje nam 1 + an 1 + (a + b — T2 0 (^l 3) . Hmmm, mieliśmy przecież nadzieję na uzyskanie 1 + a n -1 + b n -2 + 0 (n- 3 ), ponieważ to jest to, czego potrzebujemy, aby otrzymać prawą stronę (9.40). Czy coś poszło nie tak? Nie, wszystko jest w porządku, pod warunkiem, że a + b - j ź = b. To rozumowanie, oparte na zaburzaniu, nie dowodzi prawdziwości przy bliżenia Stirlinga, dowodzi natomiast czego innego. Pokazuje, że wzór (9.40) może być prawdziwy wyłącznie wtedy, gdy a = j j . Jeżeli zastąpimy 0 (n- 3 ) w (9.40) przez c n -3 + 0 ( n - 4 ) oraz przeprowadzimy dalsze obliczenia do momentu uzyskania błędu względnego 0 ( n - 4 ), to możemy wydedukować, że b musi być równe ^ g , zgodnie z tabelą 499. (Nie jest to najprostsza droga wyznaczenia wartości stałych a i b, ale na pewno jest skuteczna.) Problem 3: n-ta liczba pierwsza Równanie (9.31) jest wzorem asymptotycznym na 7t(n), liczbę wszystkich liczb pierwszych nie przekraczających n. Jeżeli n zastąpimy przez p = Pn, czyli n-tą liczbę pierwszą, to otrzymamy 7r(p) = n. Stąd n = —^ - — \ - o ( .. — -r~\ lnp \(lo g p )2 / (9*42) przy n —» 00. Spróbujmy „rozwiązać” to równanie względem p, co pozwoli nam poznać przybliżoną wartość n-tej liczby pierwszej. W pierwszym kroku uprościmy wyraz O. Jeżeli podzielimy obie strony wzoru przez p /ln p , uzyskamy n ln p /p —> 1, stąd p /ln p = O(n) oraz #■ W drugim kroku przestawiamy obie strony wzoru (9.42), oprócz wyrazu O. Możemy to zrobić dzięki ogólnej regule a-n = bn + 0 (f (n ) ) <£=> bn = an+ 0 ( f ( n ) ) . (9.43) (Każde z tych równań wynika z drugiego, jeżelipomnożymy obie strony przez —1, a później dodamy an + bn do obu stron.) Stąd bk - n+0(ii) = i otrzymujemy p = n ln p (l+ 0 (1 /lo g n )). (9.44) To jest „przybliżona rekurencją” na wartość p = Pn , wyrażona przez nie samo. Naszym celem jest uzyskanie „przybliżonej postaci zwartej”, a możemy to zrobić rozwijając rekurencję asymptotycznie. Spróbujmy zatem rozwinąć wzór (9.44). Wyciągając z obu stron logarytmy, wnioskujemy, że lnp = ln n + ln ln p + 0 (1 / l o g n ) . (9-45) Wartość tę można podstawić zamiast lnp we wzorze (9.44), ale my chcieliby śmy się pozbyć wszystkich p po prawej stronie, zanim wykonamy odpowied nie podstawienie. Gdzieś po drodze, ostatnie p musi zniknąć. Nie możemy się go pozbyć w zwykły dla rekurencji sposób, ponieważ (9.44) nie precyzuje warunków wstępnych dla niedużych p. Jednym ze sposobów rozwiązania tego problemu jest rozpoczęcie od po kazania słabszego wyniku p = 0 (n2). Podnosząc do kwadratu obie strony wzoru (9.44), a następnie dzieląc przez p n 2, otrzymujemy £ = < ! £ £ ! ! ( ,+ 0 ( , / ! « „ ) ) , ponieważ prawa strona osiąga zero przy n —> 00. W porządku, wiemy, że p = 0 (n2). Zatem logp = O (logn) oraz log log p = O (log logn). Korzystając teraz ze wzoru (9.45), możemy wywnioskować, że ln p = ln n + O (log log n ) . Faktycznie, mając w ręku to oszacowanie wnioskujemy, że ln ln p = ln ln n + O (log log n /lo g n) i na podstawie (9.45) otrzymujemy lnp = Inn + ln Inn + 0(log log n /lo g n ) . Możemy to teraz wrzucić do prawej strony równania (9.44), otrzymując p = n ln n + n ln ln n + 0 ( n ) , przybliżony rozmiar n-tej liczby pierwszej. Możemy poprawić to oszacowanie, używając lepszego przybliżenia 7t(n) wewnątrz (9.42). Następny wyraz (9.31) mówi nam, że n = bk + +°((to^)' (9'46) Postępując podobnie jak wcześniej, otrzymujemy rekurencję p = n l n p (1 + (lnp)- 1 ) - ’ ( 1 + 0 ( 1 / l o g n ) 2) , Radzę znowu wyjąć brudnopis. (9.47) której błąd względny wynosi 0 (1/lo g n ) 2, zamiast 0(1 /lo g n ). Stosując lo garytm oraz zachowując odpowiedni (nie za duży) poziom dokładności otrzy mujemy lnp = Inn + ln ln p + 0(1 /lo g n ) = ln n (l + ln ln p ln ln p ^ l n l n n + ^ ln n + 0 ( 1 /lo g n ) 2) ; + 0 f ł g f l0 g n ) 2 . V log n / Powyższe wyniki podstawiamy do (9.47), uzyskując w końcu oczekiwaną od powiedź: „ , . , ln ln n / n \ Pn = n l n n + n ln l n n —n + n —-------- FO ------- . Inn \lo g n / , (9.48) Stosując powyższe oszacowanie dla n = 106, otrzymujemy 15631363,6 + O (n /log n). W rzeczywistości milionowa liczba pierwsza jest równa 15485863. Ćwiczenie 21 pokazuje, że można otrzymać jeszcze dokładniejsze przybliże nie Pn , gdy zaczniemy od precyzyjniejszego przybliżenia n [n ) niż wzór (9.46). P ro b lem 4 : S um a ze starego egzam inu końcow ego Kiedy w latach 1970-1971 na Uniwersytecie Stanforda pojawił się po raz pierwszy wykład z Matematyki Konkretnej, studenci dostali do policzenia wartość asymptotyczną sumy Sn = ^ ? T T + ^ ? T 2 + "' + ^ T ^ , (949) z błędem bezwzględnym 0 (n- 7 ). Wyobraźmy sobie, że dostaliśmy właśnie ten problem (do domu) na zaliczenie. Jaka jest nasza pierwsza instynktowna reakcja? Nie panikujmy. Pierwsza próba opiera się na m y ś l e n i u z r o z m a c h e m . Jeżeli weźmiemy, powiedzmy rt = 10lo°, i spojrzymy na sumę, widzimy, że składa się ona z rt składników, z których każdy jest trochę mniejszy niż 1/rt2. Oznacza to, że cała suma jest trochę mniejsza niż 1/n . Ogólnie, rozpoczy nając pracę z problemem asymptotycznym, warto posiadać dobry przegląd sytuacji oraz zgrubne oszacowanie odpowiedzi. Spróbujmy poprawić nasze zgrubne oszacowanie przez wyciągnięcie naj większej części każdego wyrazu. Otrzymujemy k2 k3 1 1 A / kk k2 k3 66 rt2( 1 + k / n 2) — n— 2yV \ ( 1 ---nrtJ 22 ----4 nn44 ----nn6 1 rt2 + k / /k 4 (V ' Vn* Zsumujemy teraz wszystkie otrzymane przybliżenia: 1 1 nz + I n * "" n ? 1 n2 + 2 ^ rtz + rt uz 1 2 _ n ri4 l3 n 6 '~ n 8 22 + “ n c l2 + 23 / 24 u 6 "“ n 8 n2 rt4 n3 (n>°) n n ( n + 1) , n2 2n 4 + "' ' Na podstawie sumy pierwszych dwóch kolumn wygląda tak, jakbyśmy uzyski wali Sn = n —1 —\ n ~ 2 + 0 (rt- 3 ). Niestety, obliczenia stają się coraz bardziej zawiłe. Jeżeli uparlibyśmy się przy tym podejściu, to cel zostałby osiągnięty. Nie będziemy się jednak kłopotać liczeniem sumy pozostałych kolumn, z dwóch powodów. Po pierwsze — ostatnia kolumna dostarczy nam wyrazy rozmia ru 0(rt- 6 ), gdy n /2 ^ k ^ u, co dawałoby błąd rzędu 0(rt- 5 ), a to już za dużo. Musimy dodatkowo uwzględnić jeszcze jedną kolumnę rozwinięcia. Czy egzaminator mógł być aż takim sadystą? Zaczynamy podejrzewać, że musi być jakieś inne rozwiązanie. Po drugie— rzeczywiście jest lepszy sposób, wprawiający nas w zdumienie. A mianowicie, znamy już postać zwartą Sn.: to jest Hn2+TL—Hn2. Znamy również dobre przybliżenie liczb harmonicznych, które właśnie zastosujemy teraz dwukrotnie: Hnz+n = ln(n2 + n) + y +2[J +n) - n(J +n)2 + O ( - 1 ) ; Hn2 = ^ 2 + y + ^ - ^ + o Q . Wyciągamy teraz duże wyrazy i upraszczamy, podobnie jak postępowaliśmy w przypadku przybliżenia Stirlinga. Otrzymujemy ^ --; ln(rt2 + n ) = Inn2 H-lnfl + —) = Inn2 + — — V n /n 2n z 3n 3 1 n2 + n _ J _____ 1_ n2 J_ _ n3 1 _ J__2_ (n2 + n )2 n4 n5 ^ n4 n6 Kilka przydatnych redukcji prowadzi do Sn = n _1 — ^ n “ 2 + ^ n -3 — ^ n - 4 + ^ n -5 — | n - 6 —^n -3 + \n ~ 4 —jn ~ 5 + jn ~ 6 + l n ~5 ~ i n ~6 plus wyrazy rzędu 0 (n - 7 ). Jeszcze trochę arytmetyki i jesteśmy w domu: Sn = rt-1 - \ n ~ 2 - \ n ~ 3 + \ n ~ Ą - j^ n ~ 5 + ^ n -6 + 0 ( n - 7 ) . (9.50) Dobrze byłoby otrzymaną odpowiedź sprawdzić liczbowo, tak jak to zro biliśmy przy wyprowadzaniu dokładnych odpowiedzi w poprzednich rozdzia łach. Sprawdzanie wzorów asymptotycznych jest trudniejsze. Wewnątrz wy razu O może ukrywać się dowolnie duża stała. Oznacza to, że żaden test licz bowy nie jest pewny. W praktyce jednak nie mamy podstaw do przypuszczeń, że przeciwnik stara się nas usidlić. Możemy więc założyć, że nieznana stała przy O jest rozsądnie mała. Używając kalkulatora kieszonkowego obliczamy, żeS 4 = y7 + yg + y^ + 2^j = 0)2170107. Nasze oszacowanie asymptotyczne przy n = 4 osiąga wartość 1 0 + ?(_ 2 + \ { ~ \ + \ ( \ + = 0,2170125. Jeżeli popełniliśmy błąd, powiedzmy j j , w wyrazie odpowiadającym n - 6 , różnica daje o sobie znać na piątej pozycji dziesiętnej. Nasza odpo wiedź jest najprawdopodobniej poprawna. Problem 5: Suma nieskończona Wrócimy teraz do asymptotycznego problemu postawionego przez Solomona Golomba [152]. Jaka jest przybliżona wartość sumy (9-51) gdzie N n (k) jest liczbą cyfr niezbędnych do zapisania k w zapisie pozycyjnym przy podstawie n? Zacznijmy od ponownej próby użycia pobieżnego oszacowania. Liczba cyfr N n (k), to w przybliżeniu logn k = log k/log rt. Kolejne wyrazy tej sumy odpowiadają z grubsza wartościom (logn )2/k (lo g k )2. Sumując po k kolej nych wyrazów otrzymujemy wartość « (logn )2 z k> 2 1/k (lo g k )2. Suma ta zbiega do pewnej stałej, na co wskazuje jej podobieństwo do całki Spodziewamy się zatem, że odpowiada mniej więcej C (logn)2, dla pewnej stałej C. Tego typu analiza, na oko, przydaje się do nabrania intuicji. Dla rozwią zania naszego problemu potrzebujemy jednak lepszych oszacowań. Jednym z pomysłów może być wyrażenie N n (k) precyzyjniej: N n (k) = l l o g n k j + l . (9-52) I tak, na przykład, k ma trzy cyfry w zapisie przy podstawie n, w przypadku gdy n 2 ^ k < n 3. Przypadek ten zachodzi dokładnie wtedy, kiedy [logn kj = 2 . Wynika z tego, że N n (k) > log^k, a stąd Sn = ^ k>1 1/k N n (k)2 < 1 + (logn.)2 Y . y.^2 1/k(logk)2. Postępując podobnie jak w problemie 1, możemy użyć zapisu N n (k) = logn k + 0 (1), podstawiając go później do wzoru na Sn . Wartość wyrazu odpowiadającego 0 (1 ) zawarta jest pomiędzy O a 1, a jego średnia wartość oscyluje w okolicy Zachowuje się zatem całkiem przyzwoicie. Niestety, wciąż nie jest to wystarczająco dobre przybliżenie, by mogło mówić nam coś o Sn . Nie dostarcza nam żadnych znaczących cyfr (co odpowiada znacznemu błędowi względnemu), gdy k jest małe, a to są wyrazy, których wkład do sumy jest największy. Potrzebujemy innego pomysłu. Kluczem do rozwiązania (podobnie jak w problemie 4) będzie wykorzy stanie naszej dużej wprawy w przekształcaniu, w celu sprowadzenia sumy do bardziej poręcznej postaci, zanim skorzystamy z asymptotycznych przybli żeń. Możemy wprowadzić nową zmienną sumacyjną, m = N n (k): c _ " 2 . k,m^1 Y_ k,m^1 [m —N TL(k)] i^ 2 [^m _1^ k < n ’ km2 Uzyskana suma może wyglądać na pierwszy rzut oka gorzej niż ta, od której rozpoczęliśmy. W rzeczywistości zrobiliśmy jednak krok naprzód, ponieważ dysponujemy bardzo dobrymi przybliżeniami na liczby harmoniczne. Wstrzymamy się jeszcze na chwilę i spróbujemy wykonać kilka dodatko wych uproszczeń. Nie ma pośpiechu z użyciem asymptotyki. Sumowanie przez części pozwala nam pogrupować wyrazy przybliżonych wartości wszystkich których potrzebujemy: Sn = ^ j Hnk-1( i ? _ ( k + i ) 2) ' Na przykład Hn2_i pomnożone jest najpierw przez 1/ 22, a później przez —1/ 32. (Skorzystaliśmy z tego, że Hno_1 = Ho = 0.) Jesteśmy już przygotowani do rozwinięcia liczb harmonicznych. Nasze doświadczenie w szacowaniu (rt —1)! nauczyło nas, że łatwiej jest przybliżyć Hnk niż HTtk_1, ponieważ operowanie wartościami (rtk — 1) byłoby kłopo tliwe. Otrzymujemy zatem Hnk_, = Hnk- ^ = lnnk + y + ^ + 0 ( ^ ) - ^ = klnn+1/-2^ +0( i ) ’ a nasza suma uzyskuje nową postać Sn = ( k l n n + Y _ 2 ^ + C)( ^ ) ) ( i ? _ (k + 1)2) = (lnn)Ii + y l 2 - ^ ( n ) + 0 ( l 3 (n2)) . (9 .53) Pozostały cztery proste części: I i , I2, £3(^1) oraz l3 (rt2). Zabierzemy się najpierw za I3 , ponieważ l3 (rt2) jest wyrazem typu O. Później zobaczymy, jakiego rzędu błąd otrzymamy. (Nie ma sensu wykony wanie dalszych, doskonale dokładnych obliczeń, jeżeli miałyby one okazać się W objęciach Dużego O. zbędne w świetle używanego O.) Suma ta jest zwykłym szeregiem potęgo wym 13 w = ( k + i) 2) x k ’ a szereg ten jest zbieżny przy x ^ 1. Możemy go zatem obciąć na dowolnie wybranej pozycji. Jeżeli zatrzymamy się w rozwinięciu L s [n 2) na wyrazie z k = 1, otrzymamy L s{n 2) = 0 (n - 2 ). Błąd bezwzględny (9.53) wynosi wtedy 0 (n- 2 ). (W celu zmniejszenia jego rozmiaru, możemy użyć lepszego przybliżenia Hnk, ale jak na razie 0 (n- 2 ) jest wystarczająco dobre.) Jeżeli obetniemy I3 (rt) na wyrazie z k = 2, to otrzymamy I 3 (n) = | n - i + 0 ( n - 2). To jest dokładność, której potrzebujemy. Możemy również od ręki poradzić sobie z sumą L 2, nie sprawiającą nam większego problemu 12 = £ (k+T)2) ' Jest to szereg teleskopowy 0 - * ) + ( * - £ ) + ( £ - ^ ) H-----= 1. Wreszcie suma 1 1 odpowiadająca czołowemu wyrazowi Sn — współczyn nikowi przy Inn we wzorze (9.53): Z’ = k(i? “ ' Powyższa suma wynosi (1 - \ ) + ( f - f ) + ( f - Ą ) + • • • = \ + \ + ^ + • • • = H {2) = 7t2/6. (Jeżeli nie zastosowalibyśmy wcześniej sumowa nia przez części, zobaczylibyśmy wprost, że Sn ~ ]Lic>i (ln n )/k 2, ponieważ Hnk_i —Hnk-i _i ~ Inn. Tak więc sumowanie przez części nie pomogło nam w wyliczeniu wyrazu wiodącego, ułatwiło zaś wykonanie pozostałej pracy.) Znamy już każdą z poszukiwanych sum Z w (9.53), możemy więc zebrać wszystko razem, otrzymując rozwiązanie problemu Golomba Sn = ^ ln n + y - A + o (_ L ). ( 9 .5 4 ) Zauważmy, że suma ta rośnie o wiele wolniej niż nasze początkowe oszaco wanie, na oko, C (logn)2. Nierzadko suma dyskretna nie poddaje się naszej intuicji ciągłości. Problem 6: D uże Fi Przed końcem rozdziału 4 zauważyliśmy, że liczba ułamków wewnątrz szeregu Fareya jFn wynosi 1 + ® (n), gdzie <D(n) = cp(1 ) + cp(2 )H---- + <p(n). Dodatkowo pokazaliśmy we wzorze (4.62), że ®(n) = i ^ n ( k ) L n / k J L l + n / k J (9-55) k^ 1 Spróbujmy teraz oszacować O (rt), gdy rt jest duże. (Sumy podobne do tych były głównym powodem wprowadzenia notacji O przez Bachmanna.) M y ś l e n i e z r o z m a c h e m owocuje wnioskiem, że <D(n) jest najprawdo podobniej proporcjonalne do rt2. Jeżeli wartość ostatniego czynnika byłaby równa [n/kJ zamiast [1 + n /k j , otrzymalibyśmy | O (rt) | ^ ^ H kî Ln A J 2 ^ l l k ^ i ( n / k)2 = TI n 2 ) ponieważ funkcja Mobiusa |x(k) przybiera wartość —1,0 lub + 1. Dodatkowe ‘1 + ’ występujące w ostatnim czynniku odpowiada Hicî [rt/kj. Wyrazy z k > n są równe zeru, zatem cała suma nie może mieć wartości bezwzględnej większej niż nH u = O (n lo g n ). Ta wstępna analiza podpowiada nam, że wygodnie będzie napisać ®(„) - + o,„ )2 - i | . , w ( ( = ) ! + o Q ) ) k=l = ? H ,xW ( r ) k= 1 + O(nlogn). k= 1 Usuwa to problem podłóg. Jedyne co pozostaje, to wyliczenie pozbawionej podłóg sumy ^ ^ k = i M W ^ /k 2 z dokładnością O (n lo g n ). Innymi słowy, chcemy wyliczyć ^ £ =1 |x(k)1/k 2 z dokładnością 0 (n-1 logn). A to nie jest trudne. Możemy rozszerzyć sumę aż do k = oo, ponieważ nowo dodane wy razy sumują się do (W roku 1960 Sałtykow pokazał [317], że wyraz błędu wynosi co najwyżej Udowodniliśmy w (7.89), że = 1/C(z). Zatem 1 /k 2) = 6/7T2 , a my otrzymujemy gotową odpowiedź: O 0(n(log n)2/3 x (log log n )1+e). Z drugiej strony, nie jest on tak mały, jak (u) = —r-n2 + O (n lo g n ). 7t mW A2 = (9.56) 9A. D w ie sztuczki a sy m p totyczn e______________ o (n.(log log Tl)1/2), zgodnie z Montgomerym [276].) Posiadając już pewne obycie z przekształceniami wyrażeń typu O, spójrzmy na to, co zrobiliśmy do tej pory, w trochę szerszej perspektywie. Dorzucimy teraz kilka ważnych technik do naszego arsenału asymptotycznego, potrzeb nych nam w radzeniu sobie z bardziej opornymi problemami. Sztuczka 1: K olejn e p rzy b liżen ia Kiedy oszacowywaliśmy n-tą liczbę pierwszą Pn zajmując się problemem 3 (rozdział 9.3), rozwiązywaliśmy asymptotyczną rekurencję postaci Pn = n ln P n (1 + 0 ( 1 /logTl)) . Udowodniliśmy, że Pn = T L l n u + 0 (tl), używając wstępnie rekurencji do po kazania słabszego wyniku 0 (n2). Jest to szczególny przypadek ogólnej tech niki zwanej metodą kolejnych przybliżeń , w której rozwiązujemy rekurencję asymptotycznie, stosując aktualnie posiadane oszacowanie wewnątrz mecha nizmu rekurencji. Proces rozpoczynamy od wstępnego, pobieżnego przybli żenia, otrzymując w kolejnych krokach coraz to lepsze oszacowania. Oto inny problem dobrze ilustrujący metodę kolejnych przybliżeń. Jaka jest wartość asymptotyczna współczynnika gn = [zn] G (z) w funkcji tworzą cej G(z) = exp(Y_ £ 2 ) > (9-57) k>1 przy tl —> 00? Jeżeli zróżniczkujemy to równanie względem z, to otrzymamy 00 k —1 G'(z) = ^ n g n zn _ ' = n=0 ( X . “T - ) G (Z)k$:l Przyrównanie po obu stronach współczynników przy zn 1 definiuje nowe równanie rekurencyjne ngn = V" > 0^k<n 9k ------r* tl — k (9-58) Nasz problem jest teraz równoważny znalezieniu wzoru asymptotycznego od powiadającego rozwiązaniu równania (9.58), z warunkiem początkowym go = 1. Kilka pierwszych wartości n gn 0 1 1 2 3 4 5 6 1 3 4 19 36 107 288 641 2400 51103 259200 nie mówi nam zbyt dużo o całkowitym schemacie, a ciąg liczb całkowitych (rt!2gn) niestety nie pojawia się w książce Sloane’a [331]. Zwarta postać na gn wydaje się więc być poza zasięgiem, a wiedza asymptotyczna jest naj prawdopodobniej wszystkim, czego możemy oczekiwać. Pracę nad naszym problemem rozpoczniemy od obserwacji, że 0 < gn ^ 1 dla wszystkich rt ^ 0, czego możemy łatwo dowieść przez indukcję. Mamy zatem bazę gn = 0 (1 ) . Faktycznie równanie to jest użyte jako „wstępne zalanie pompy” w metodzie kolejnych przybliżeń. Użycie go po prawej stronie (9.58) przynosi O (lo g n ); 0^k<TL a stąd mamy dla rt > 1. Możemy teraz wykonać kolejną rundę 0< k < n 0<k<n - + - H n_-|0 (logu) = —O (logn)2 , u n n otrzymując (9-59) Czy tak będziemy ciągnąć w nieskończoność? Może gn = 0 (rt-1 lo g n )m dla wszystkich m. Nic z tego, właśnie osiągnęliśmy punkt słabnących oszacowań. Próba uży cia kolejnego przybliżenia doprowadza nas do sumy 0 <k<TL k2(rt —k) v 1 0 - <k<n \n k 2 ^ rt2k n 2(n — k )/ v } 1 H(2) + 2 H będącej Q (n - 1 ). Nie możemy zatem otrzymać lepszego oszacowania na gn niż Q (n - 2 ). W rzeczywistości, wiemy wystarczająco dużo o gn , aby zastosować naszą starą sztuczkę z wyciąganiem największej części: ng! = O^kcn Z -+ _ z— n _Z ” 0^k<n n z— rt z— kÔ Vrt —k Ti/ n z— u —k k^n O^kcn Pierwsza suma odpowiada G(1) = e x p (| + ^ ^ ) = e71 /6 , ponieważ G(z) jest zbieżna dla wszystkich |z| ^ 1. Druga suma jest ogonem pierwszej. Na podstawie równania (9.59) możemy otrzymać jej górne ograniczenie £ * - o (k^ru £ ^ )-o (S si.). k^n. To ostatnie oszacowanie zachodzi, ponieważ y- 2— k>n (log k)2 k2 y y 2- m ^>1 n m< k ^ n m + 1 (logTlm+1)2 y (m + 1 )2 (log Tl)2 k(k — 1)Tim (Ćwiczenie 54 prezentuje ogólniejszą metodę szacowania podobnych ogonów.) Trzecia suma (9.60) ma postać "0 < k < n ze znanych już nam powodów. Na podstawie (9.60) wnioskujemy, że e7t2/6 3 9 n = — j - + 0 (logn/n) . (9 .61) Wreszcie, możemy ponownie wrzucić ten wzór do mechanizmu rekurencji, poszukując kolejnego przybliżenia. Jako wynik otrzymujemy 9rx = e7^ 6 —^2— (9.62) O (log n / n ) (Ćwiczenie 23 zajmuje się dokładniej resztą O.) Sztu czka 2: W y m ien n e ogon y Wyprowadzenie (9.62) wyglądało nieco podobnie do wyprowadzenia wartoś ci asymptotycznej liczby O(n) (9.56). W obydwu przypadkach obliczenia rozpoczęliśmy od sumy skończonej, jednak wartość asymptotyczną otrzyma liśmy rozważając sumy nieskończone. Nie mogliśmy zwyczajnie przejść do sumy nieskończonej, wprowadzając notację O do składnika. Musieliśmy być ostrożni, używając jednego podejścia w przypadku małego k, innego zaś, gdy k okazało się duże. Powyższe wyprowadzenia są szczególnymi przypadkami ważnej trzystop niowej sumacyjnej metody asymptotycznej, którą zajmiemy się teraz szerzej. Kiedykolwiek tylko chcemy oszacować wartość ]Tk ak(n), możemy spróbować następującego podejścia: 1. Najpierw dzielimy wyrazy sumy na dwa rozłączne zakresy, D n oraz Tn. Wynik sumowania wewnątrz D n powinien być składową „dominującą”, przez co rozumiemy, że zawiera ona wystarczającą liczbę elementów, przy dużych n, do wyznaczenia wszystkich cyfr znaczących sumy. Wynik su mowania wewnątrz drugiego zakresu Tn powinien być „ogonem” koń cowym, którego wartość całkowita jest niezauważalnie mała. 2. Znajdujemy oszacowanie asymptotyczne ak(n) = bk(n) + 0 (ck(n)) prawdziwe dla k e D n . Granica O nie musi zachodzić dla k e Tn. 3. Dowodzimy teraz, że każda z następujących trzech sum jest mała: £a(u) = Y. flk(n ) ; Zb(n) = IcgTtl £c{n) = bk(n); kGTn Y . M n )|- (9-63) keDn W przypadku, gdy wszystkie trzy kroki zakończą się sukcesem, otrzymujemy poprawne oszacowanie: Y keDÛTt, ak(n) = Y b*(n) + °(£a(^) + 0(lb(n)) + 0(lc(n)). kGDÛT^ (Ta ważna metoda została zainicjowana przez Laplace’a [240].) Oto dlaczego. Możemy „odrąbać” ogon danej sumy, otrzymując dobre osza cowanie dla zakresu D n , gdy takowe jest niezbędne: Y ak(n ) = lcGDrt X Y (bk(n ) + ° ( ck(n ))) = T cGDtl bkfn) + 0 ( I c(n)) . kGDn Ogon sumy możemy zastąpić innym, nawet jeśliby nowy ogon miał być bar dzo złym przybliżeniem starego, ponieważ ogony nie mają żadnego znacze nia: Asymptotyka to sztuka wiedzy, kiedy można być niedbałym, a kiedy należy być dokładnym. Y ik ( n ) = Y (bk ( n ) - b i c ( n ) + ak(n)) k£Tn kETn = Y b^ n ) + keT^ + O ( l 0(n)). Kiedy obliczaliśmy sumę (9.60), rozważaliśmy O-k(n) = [0 ^ k < n ]g k/ ( n - k ) , bk(n) .= gic/n, cic(n) = kgk/ n ( n - k ) ; z dwoma zakresami sumowania Dn = {0,1,... ,n —1}, Tn = {rt,n + 1,...}. Doszliśmy do tego, że I a(n) = 0, I b(rt) = 0((logn)2/ n 2) , I c(n) = 0((logn)3/ n 2) . To prowadzi do równania(9.6i). Podobnie, kiedy szacowaliśmy wartość O (u) w (9.55), mieliśmy ak(n) = M-(k)|u/kj [1 +n/kj , bk(n) = |ii(k)n2/k2 , Dn = {1,2, Tn = { n + 1 , n + 2, . ..}. Również kocie ogony podlegają zmianom, kiedy nadchodzi pora karmienia. ck(n) = n/k; Wyprowadziliśmy (9.56) zauważając, że = 0, I b M = O(n), oraz Xc (n) = O (n logn). Oto następny przykład, w którym zamiana ogonów okazuje się być bardzo pożyteczna. (Inaczej niż poprzednio, przykład ten ilustruje sztuczkę w całej swej okazałości, przy Zq(ti) 7^ 0-) Poszukujemy wartości asymptotycznej T _ ^ ln(n + 2*) “ 2_ fcj ' Duży wkład do wartości sumy wnoszą wyrazy z małym k, ze względu na k! występujące w mianowniku. Dla tego zakresu otrzymujemy 2k 22k / 23k \ ln(n + 2k) = l n n + - - ^ + 0 ( ^ ) (9.64) Możemy udowodnić, że to oszacowanie zachodzi przy 0 ^ k < [lgn j, po nieważ początkowe wyrazy, które obcięliśmy przez użycie O, ograniczone są przez zbieżne szeregi n~ m^3 m>3 rt (Dla tego zakresu 2k/ n < 21^ “ '/n sC { . ) Możemy zatem zastosować właśnie opisaną trzystopniową metodę, dla aic(n) = ln(rt + 2k) / k ! , b k(n) = (ln n + 2k/ n - 4k/ 2n 2)/k !, Ck(n) = 8k/ n 3k!; D n = {0, 1, . . . , [lgnj — 1), Tn = (LlgnJ, [lgnj + 1 , . . . } . Wszystko, co musimy zrobić, to znaleźć dobre ograniczenie dla każdej sumy I z (9.63), a będziemy pewni, że a k(n) js bk(n). Rozmiar błędu, na jaki możemy sobie pozwolić wewnątrz dominującej części sumy, I c(u) = H keDri 8k/rt3k!, jest w oczywisty sposób ograniczony przez Y.\cô — e8/™3- Możemy go więc zastąpić przez wyraz 0 (n ~3). Błąd związany z nowym ogonem wynosi |£b(n)| = bk(n ) k ^ [lg nj < L k ^ [lg nj ln n + 2k + 4k k! ln n + 2 ^ ^ + 4 ^ ^ LlgTlJ! "— ^ 4k / n2 \ -° y Ponieważ [lg tlJ ! rośnie szybciej niż dowolna potęga n , ten niewielki błąd gubi się w otchłani £ c (n) = 0 (n- 3 ). Błąd związany z początkowym ogonem, Ia(n ) = X. k ^ [lg nj jest jeszcze mniejszy. k ^ [lg nj k + ln u k! „Może nie jesteśmy duzi, ale jesteśmy mali.” Wreszcie, ponieważ łatwo wyliczyć postać zwartą sumy X k > o bk(n )» otrzymaliśmy żądany wzór asymptotyczny: ln(n + 2k) kÔ e2 e4 / 1 \ = e ln n + n - 2 ^ + ° f e ) ' (9'65) Metoda, której właśnie użyliśmy, precyzuje jasno, że w rzeczywistości kÔ k=1 dla każdego ustalonego m > 0. (Jest to obcięcie szeregu zbieżnego dla wszyst kich ustalonych u, w przypadku, gdy m —* oo.) Nasze rozwiązanie ma jedną wadę. Byliśmy zbyt uważni. Wyprowadzi liśmy (9.64) przy założeniu, że k < [lg n j, ale ćwiczenie 53 pokazuje, że otrzymane oszacowanie jest w rzeczywistości prawdziwe dla wszystkich k. Gdybyśmy wcześniej znali silniejszy, ogólniejszy wynik, nie musielibyśmy ko rzystać ze sztuczki z dwoma ogonami. Moglibyśmy przejść bezpośrednio do końcowego wzoru! Później napotkamy inne problemy, przy których jedynym rozsądnym podejściem będzie zamiana ogonów. 9.5. W zór sum acyjny Eulera Następna sztuczka, jaką poznamy— w rzeczywistości, ostatnia ważna tech nika przedstawiona w tej książce — to ogólna metoda przybliżania sum, za proponowana po raz pierwszy przez Leonharda Eulera [101] w roku 1732. (Powyższa technika kojarzona jest również z nazwiskiem Colina Maclaurina, profesora matematyki z Edynburga, który odkrył ją niezależnie, ale trochę później [263, strona 305].) Oto ów wzór: m T> Y_ f(k) = a^kcb I"b f(x)dx + £ - j T f (k“ 1)M + Rm > (9*^7) k=l Rm = (_ i r + i [b M M Ja m! f (m)M d x > ^ o w i t e a O ; całkowite m ^ 1. J Lewa strona wzoru jest typową sumą, której wyliczeniem jesteśmy zaintereso wani. Wyrażenie po prawej stronie, odpowiadające sumie, zawiera całki oraz pochodne. Jeżeli f (x) jest wystarczająco „gładką” funkcją i ma m kolejnych pochodnych f'(x), . . . , f (m^(x), to powyższy wzór okazuje się tożsamością. Prawa strona jest często doskonałym przybliżeniem sumy występującej po le wej, dzięki temu, że reszta Rm jest zazwyczaj niewielka. Zobaczymy wkrótce, że przybliżenie Stirlinga dla rt!, jak również nasze asymptotyczne przybliżenie na liczby harmoniczne Hn są następstwem wzoru sumacyjnego Eulera. Liczby Bk z (9.67) są liczbami Bernoulliego, z którymi spotkaliśmy się już w rozdziale 6. Funkcja Bm ({x}) z (9.68) jest wielomianem Bernoulliego, z którym zapoznaliśmy się w rozdziale 7. Notacja {x} jest użyta do oznaczenia ułamkowej części x —|_xj, podobnie jak w rozdziale 3. Wzór sumacyjny Eulera jest jednym z tych, które łączą wszystko razem. Przypomnijmy sobie wartości kilku niewielkich liczb Bernoulliego. Za wsze wygodnie jest je mieć wraz z ogólnym wzorem Eulera: \ Bo = 1 , Bi = — , B2 = l , B 4 = —3 ^ , B 6 = B 3 = B 5 = B7 = B9 = B n 41 > B8 = ; = ••• = 0. Jakub Bernoulli odkrył te liczby podczas prac nad sumami potęg liczb całko witych, a wzór Eulera wyjaśnia, jaki jest tego powód. Jeżeli weźmiemy f (x) = xm_1, to otrzymamy f (x) = 0, ponieważ Rm = 0, a wzór (9.67) redukuje się do Jeśli, na przykład, m = 3, to znów otrzymujemy nasz ulubiony przykład sumowania: (To jest już ostatnie wyprowadzenie tego znanego wzoru w naszej książce.) Zanim przejdziemy do dowodu wzoru Eulera, przyjrzyjmy się, które prawa ogólne (Lagrange [234]) wymuszają istnienie takiego wzoru. Rozdział 2 zawiera definicję operatora różnicowego A oraz wyjaśnienie, dlaczego Y. Jes^ odwrotnością A, tak jak / jest odwrotnością operatora różniczkowego D. Za pomocą wzoru Taylora możemy w następujący sposób wyrazić A przy ^ y S^ 0 co rfobre kiedyś się kończy. użyciu D: f(x + e) = f(x) + l M 6 + ! ^ W 62 + 1! 21 Biorąc e = 1, dostajemy Af(x) = f ( x + 1) - f ( x ) = f '(x)/1 ! + f "(x)/2! + f '"(x)/3! + • • • = ( D / l ! + D 2/ 2 ! + D 3/ 3! + • • •) f (x) = (eD - l ) f ( x ) . (9-69) Tutaj eD odpowiada operacji różniczkowania 1 + D / l ! + D 2/ 2 ! + D 3/ 3! H-----. Ponieważ A = eD — 1, więc operator odwrotny L = 1/A powinien być równy 1 / (eD —1). Z tabeli 390 wiemy, że z /{ e z —1) = Bkzk/k! jest szeregiem potęgowym zawierającym liczby Bernoulliego. Dlatego Bo £ - Bi B2 „ B3 y (9-70) ■E? + TT+ 2 f D + 3 f D + Po zastosowaniu tego równania operatorowego do f(x), i ustaleniu granic, otrzymujemy y~ Bi f(x) 6x = Z------CL „ f(x)dxH -V ~ -7-7 ^ ------ Ic k^1 (9-71) czyli wzór sumacyjny Eulera (9.67) pozbawiony składnika reszty. (Euler, w rzeczywistości, nie rozważał owej reszty, podobnie jak i inni. Dopiero w roku 1823 z.ajął się nią S. D. Poisson [296] w publikacji na temat przybli żonego sumowania. Człon reszty jest istotny, ponieważ suma nieskończona H kî (Bk/k!)f(k-1H*)|a Jest często rozbieżna. Niemniej nasze wyprowadze nie i bez założenia o zbieżności (9.71) było w pełni formalne.) Udowodnimy teraz (9.67) z uwzględnieniem reszty. Wystarczy udowodnić przypadek, w którym a = 0 oraz b = 1, czyli pi f(0) = m y, 1 f ( x ) d * + r 1^ f ‘k- i >(x) Jo k=1 K[ „1 -(-n m o ■’ Bm(x) Jo m! f (m)(x )d x , ponieważ możemy potem zastąpić f (x) przez f (x + l) dla każdego całkowi tego l, otrzymując 1+1 pl+1 m T> f(l) = f(x )d x + X T 7 f (’c_1)(x) k=1 * 1+1 • l Bm ({*}) f (m)(x)dx. m! Wzór ogólny (9.67) jest sumą tej tożsamości w przedziale a ^ l < b, ponieważ wyrazy pośrednie znoszą się wzajemnie. Dowód, przy a = 0 oraz b = 1, przeprowadzamy przez indukcję po m, rozpoczynając o d m = 1, f(0) = j 1 f(x) dx - 1 (f(1) - f(0)) + j 1(x- |)f'(x) dx. (Poniższe równanie jest ogólną definicją wielomianu Bernoulliego Bm(x) BmM = ( ^ B o x m + ( ^ B 1x m- ' + - + ( ™ ) B n x°, (9.72) w szczególności Bi (x) = x — A.) Innymi słowy, chcemy udowodnić, że f (x) dx + (x — dx. To jest szczególna postać wzoru u (x )v (x )| q = | u(x) dv(x) + | v(x) du(x) (9-73) na całkowanie przez części, przy u(x) = f(x) oraz v(x) = x — Czyli przy padek m = 1 jest prosty. Aby przejść od m — 1 do m, a więc otrzymać dowód dla m > 1, musimy udowodnić, że Rm- i = (Bm/ru !)f(m_1)(x)|J + Rm, czyli że Bm—1M _jr(m—1) (x) dx 0 iTU— 1j! 5 ^ f ( m - 1 ) ( x) 1 -(-i)"*- ['Bm(x) f {m)(x )d x . m! o Jc m! To równanie redukuje się do ( - 1)mBmf 'm- " ( x ) o = m [ 1Bm_ 1(x)f<™-’> (x )d x + f B m(x)f<m»(x)dx Jo Jo Ponownie równanie (9.73) stosuje się do powyższych dwóch całek, przy u(x) = f (m_1)(x) oraz v(x) = Bm(x), ponieważ pochodna wielomianu Ber- Czy autorzy nigdy nie spoważnieją? noulliego (9.72) jest równa k v k 7 = v 7 mz ( V ) Bkxm“1_,e = mBm_i(x). (9.74) (Przydała nam się tu tożsamość pochłaniania (5.7).) Zatem rozważany wzór jest poprawny wtedy i tylko wtedy, gdy Innymi słowy, potrzebujemy tożsamości (—1)mBm = Bm(1) = Bm(0) , dla m > 1. (9.75) Jest to trochę kłopotliwe, ponieważ Bm (0) jest równe Bm, a nie (—l ) mBm. Tak naprawdę jednak nie ma żadnego problemu, ponieważ m > 1. Wiemy, że Bm jest zerem, gdy m jest nieparzyste. (Niemniej, wróciliśmy z dalekiej podróży.) Aby zakończyć dowód wzoru sumacyjnego Eulera, musimy pokazać, że BmO) = Bm(0), co jest równoważne Bk = Bn k dla m > 1. v A to jest przecież definicja liczb Bernoulliego (6.79). Koniec! Tożsamość B^l (x) = mBm_i (x) implikuje Jo m +l ponadto wiemy, że całka ta jest równa zeru przy m ^ 1. Stąd składnik reszty we wzorze Eulera, Rm = j Bm ({x})f<m> M d x , wymnaża f (m)(x) przez funkcję Bm ({x}), której wartość średnia jest zerem. Oznacza to, że mamy prawo oczekiwać małego Rm. Przyjrzyjmy się bliżej wartościom Bm(x) dla 0 ^ x ^ 1, ponieważ Bm(x) rządzi zachowaniem się Rm. Oto wykresy Bm(x) dla pierwszych dwunastu wartości m: 9 *5 . W zór su m acyjn y E u leral m = 2 m = 3 m = 4 Bs+ml^) Chociaż Bs(x) aż do B 9M są niezbyt duże, wielomiany oraz liczby Ber noulliego zasadniczo rosną całkiem szybko. Szczęśliwie Rm ma wyrównujący czynnik l/m !, pozwalający nam się uspokoić. Wykres Bm(x) zaczyna się wyraźnie upodabniać do sinusoidy, gdy m ^ 3. Ćwiczenie 58 pokazuje, że w rzeczywistości poprawnym przybliżeniem Bm(x), jest ujemna wielokrotność cos(27tx—^7rm), przy czym błąd względny wynosi O (2-m maxx Bm ({x})). W ogólności, B4k+i M jest ujemne dla 0 < x < \ oraz dodatnie dla \ < x < 1. Zatem jego całka B4ic+2(x)/(4k. + 2 ) jest malejąca dla 0 < x < \ y a rosnąca dla i < x < 1. Ponadto, mamy B4k+i (1 - x) = -B41C+1 M , dla 0 ^ x ^ 1, z czego wynika, że B41C+2O-*) = B41C+2M, dla 0 ^ x 0 . Stały wyraz Bą^+2 powoduje, że całka B4k+2(x) dx przybiera wartość zero. Stąd B4ic+2 > 0. Całka funkcji 64^+2(x) jest równa B4i<+3(x)/(4k + 3), która musi być zatem dodatnia dla O < x < \ oraz ujemna, gdy \ < x < 1. Ponadto 64^+3 (1 —x) = —64^+3 (x), więc 64^+3 (x) ma takie własności, jak B41C+1 M , tyle że przeciwne. Podobnie 64^+4 (x) ma własności B4i<+2(x), rów nież przeciwne. Zatem 64^+5 (x) ma własności 64^+1 (x). Zamknęliśmy cykl, który przenosi indukcyjnie określone własności na wszystkie k. Zgodnie z powyższą analizą, maksymalna wartość B2mM musi pojawić się przy x = O albo przy x = W ćwiczeniu 17 będziemy mieli okazję udowodnić, że (9-76) A zatem mamy (9-77) Powyższą nierówność możemy wykorzystać do ustanowienia przydatnej gór nej granicy na składnik reszty we wzorze sumacyjnym Eulera, ponieważ wiemy z (6.89), że Możemy zatem zapisać wzór Eulera (9.67) w następujący sposób: Y_ f(k) = Jaf fMdx-lf(x)|^ +k=1 X!g^(2 k (*)la z IZKJ- ^k<b Ja Na przykład jeżeli f (x) = ex, to wszystkie pochodne są takie same, a powyż szy wzór mówi nam, że ^ a^k0 Bk/lc!. Jeżeli f (x) ^ Odla a ^ x ^ b, to całka |f(2m) (x)| dx jest równa po prostu f (2m_1)(x)|a, a my otrzymujemy Innymi słowy, składnik reszty jest, w tym przypadku, ograniczony przez war tość wyrazu końcowego (wyrazu poprzedzającego resztę). Możemy się nawet pokusić o dokładniejsze oszacowanie, kiedy wiemy, że f(2m+2)(x) ^ o i f (2m+4)(x) ^ O, Okazuje się, że implikuje to zależność dla a ^ x ^ b. (9-79) Innymi słowy, wartość reszty mieścić się będzie pomiędzy 0 a pierwszym wyrazem odrzuconym w (9.78) — wyrazem, który pojawi się tuż za wyrazem końcowym, gdy powiększymy m. Oto dowód. Wzór sumacyjny Eulera jest prawdziwy dla wszystkich m oraz B2m+i = 0 dla m > 0. Stąd R2m = R2m+i» a pierwszy wyraz odrzucony musi wynosić R2m R2m+2 • Chcemy zatem pokazać, że R2™. leży pomiędzy 0 oraz R2m —^2m+2} a to jest prawdą wtedy i tylko wtedy, gdy R2m oraz R2m+2 mają znaki przeciwne. Zauważamy, że f (2m+2)(x) ^ 0 d la a ^ x O implikuje ( - l ) mR2m ^ 0. (9.81) To wraz z (9.79) wystarcza, aby udowodnić, że R2m oraz R2m+2 mają znaki przeciwne, czyli zakończyć dowód (9.80). Nie jest trudno wykazać prawdziwość (9.81), jeżeli przypomnimy sobie definicje R2m+i oraz fakty, jakie udowodniliśmy o wykresie B2m+i (x). Mia nowicie, mamy a funkcja f {2m+1)(x) jest rosnąca, ponieważ jej pochodna f (2m+2)(x) jest dodatnia. (A dokładniej, f^2m+1^(x) jest niemalejąca, ponieważ jej pochodna jest nieujemną.) Wykres B2m+i (W ) przypomina iloczyn funkcji (—1)m+l oraz sinusoidy, jest więc geometrycznie oczywiste, że druga połowa każdej sinusoidy ma większy wpływ niż pierwsza, gdy cała sinusoida wymnożona jest przez funkcję rosnącą. To czyni (—1)mR2m+i ^ 0, tak jak chcieliśmy. Ćwiczenie 16 zawiera bardziej formalny dowód. 9.6. K ońcow e sum ow ania Zbliżamy się do końca książki, czas zatem na podsumowanie. Zastosujemy teraz wzór sumacyjny Eulera w kilku ważnych i interesujących przykładach. Sumowanie 1: Zdecydowanie za proste Zacznijmy od interesującego nieistotnego przykładu, a mianowicie sumy, z którą umiemy już sobie poradzić. Zobaczmy, jaki będzie efekt zastosowania wzoru sumacyjnego Eulera do składającej się sumy Możemy równie dobrze rozpocząć od zapisania funkcji f(x) = 1/x (x + 1) w postaci różnicy ułamków prostych, rr a 1 f(x) = - X 1 X+ 1 ponieważ ułatwia to proces całkowania oraz różniczkowania. I rzeczywiście, otrzymujemy f'(x) = —1/ x 2 + 1/ ( x + 1)2 oraz f"(x) = 2/ x 3 — 2/ ( x + 1)3, a w ogólności f <k >(X) = ( - 1 )*k ! ( - ± _ - ( x + 11 )fc + 1 ) , d la k > 0. Ponadto [ f(x) dx = ln x —ln(x + 1) Ji 2n = ln n + 1 Zastosowanie tego we wzorze sumacyjnym (9.67) daje nam 1 gdzie Rm(n) = dx ■ m +1 Dla m = 4 prawa strona przybiera postać ln 2tl 1 / 11 n+1 2 \n 1 1 1\1 \ 11 / / 11 11 3\ 2) 12 V n 2 (n + 1 )2 4) n + 1 W 1 1 15\ + 1 2 o ( ^ _ ( n T T F - 1?) + , ^n ) ' To jest jakiś bełkot. Z pewnością nie wygląda to na prawdziwą odpowiedź 1 — n _ 1 . Nie zatrzymujmy się jednak i przyjrzyjmy się temu, co otrzymali śmy. Wiemy już, w jaki sposób rozwinąć prawostronne wyrazy przy użyciu ujemnych potęg n , kończąc powiedzmy na 0 ( n - 5 ): = —n -1 + \n ~ 2 - ^n-3 + | n -4 + 0 ( n - 5 ) ; ln = 1 (n + 1)2 1 (n + 1)4 n -1 — n _2 + n-3 - n ~ 4 + 0 ( n - 5 }; n -2 —2n-3 + 3n-4 + 0 ( n - 5 ) ; n~4 + 0(n-5) Zatem prawostronne wyrazy naszego przybliżenia sumują się do ln2 + 4 + i6 128 + ( '1 2 \)n 1 + (2 2 12 12) Tl -2 + (“ 5 + 2 - ‘fe)n 3 + (i- 5 + T2 + TIĆ - T2o)n 4 + R4(n ) = ln2 + —rt-1 + R4(tl) + 0 ( n - 5 ) . Współczynniki przy n ~ 2, n ~3 oraz rt- 4 , tak jak powinny, zniosły się. Gdyby życie zawsze było proste, udowodnilibyśmy teraz, że R4(n) jest asymptotycznie małe, może 0 (rt_5), otrzymując w ten sposób przybliżenie dla całej sumy. Jednak nie jesteśmy w stanie tego pokazać, ponieważ tak się akurat składa, że wiemy, iż poprawnym stałym składnikiem jest 1, a nie ln 2 + (w przybliżeniu 0 , 9978). Czyli R4(n) jest w rzeczywistości równe — ln 2 + 0 (n “ 5), jednak wzór sumacyjny Eulera nie mówi nam tego. Innymi słowy, przegraliśmy. Jedną z prób naprawienia sytuacji może być zauważenie, że stałe wyrazy przybliżenia układają się według pewnego wzorca, jeśli bierzemy coraz to większe m: Być może uda nam się pokazać, że szereg ten osiąga wartość 1 przy nieskoń czonej liczbie wyrazów? Niestety nie. Liczby Bernoulliego rosną za szybko. Na przykład, B22 = 851435813 > 6192, zatem liczba |R22 ('tl) | będzie o wiele większa niż | R4 (rt) |. Przegrywamy na całej linii. Jest jednak pewne wyjście. Ucieczka ta okazuje się istotna również w in nych zastosowaniach wzoru Eulera. Kluczem do rozwiązania jest zauważenie, że R4 (rt) osiąga określoną granicę przy rt —» 00 I, B4({x}) ( i - u w ) dx=R4(00)- lim R4(rt) — n —>00 Całka J^50 Bm ({x})f(m)(x) dx istnieje zawsze, jeżeli tylko zachodzi f^m^(x) = 0 (x ~ 2), przy x —> 00, a w tym przypadku funkcja f^4^(x) spełnia te wyma gania. Ponadto, mamy R4 ( n ) R 4 (oo ) + £ = B 4 ({x}) dx / f°° \ = R4(oo) + Of x ~ 6 dxj = R4(oo) + 0 ( n - 5 ) . Jn Zatem użyliśmy wzoru sumacyjnego Eulera do udowodnienia, że T . l^ k < n wTZTT k (k + 1 ) = h l 2 + m ~ n ~ ' + R4(°°) + ° ( n - 5) v J = C —n _1 + 0 (n ~ 5) dla pewnej stałej C. Nie znamy wartości tej stałej— musimy użyć innej me tody do jej określenia— ale wzór sumacyjny Eulera zapewnia istnienie takiej stałej. Załóżmy, że wybraliśmy m o znacznie większej wartości. Wtedy takie samo rozumowanie wykazałoby, że Rm(n) = Rm(oo) + 0 (n_m_1), i otrzymalibyśmy wzór C — rt-1 + c 2n ~ 2+ c 3Ti-3 H-------h cmu “ m + 0 (n -TTL_1) WJ u Y l^ k cn ^ ^ dla pewnych stałych C2, C3, . . . . Wiemy, że w tym przypadku wszystkie stałe c okazują się zerami. Ale udowodnijmy to, przywracając trochę za ufania do wzoru Eulera (jeśli nie do samych siebie). Wyraz ln wnosi (—1)m/ m do cm, wyraz (—1)m+1 (Bm/m )u ~ m wnosi (—1)m+1 Bm/m , a wy raz (—l ) k(Bic/ k ) ( n + 1)_k jest równy (—1)m (1|^ri1)Bk/k. Zatem ( _ i ) - Cm = m m + z— V k — 1 k=l x - X ( k ) Bk = - ( 1 - B m + Bm( 1 } - 1 ) . k=1 x 7 Nabraliśmy już pewności, że otrzymujemy zero, gdy m > 1. Udowodniliśmy zatem, że Y vrv 11 = C -T i " 1 + 0 (n~m~1), 1 ^ < n KllC+ '> dlam^l. (9 .82) To jednak nie wystarczy, aby udowodnić, że dokładna wartość sumy wynosi C —n - 1 . Rzeczywista wartość może odpowiadać C —rt-1 + 2~u , albo jesz cze innej wartości. Wzór sumacyjny Eulera obciążony jest błędem rozmiaru 0 (n _m_1) dla dowolnie dużych m. Oznacza to, że nie udało nam się wyliczyć chociażby jednej reszty dokładnie. Sum ow anie 1, raz je szcz e. P o d su m ow a n ie i u o g óln ien ie Przypomnijmy sobie, co zrobiliśmy do tej pory, patrząc z trochę szerszej perspektywy. Rozpoczęliśmy od sumy Sn = Y l^k <n i po zastosowaniu wzoru sumacyjnego Eulera otrzymaliśmy m Su = F(n) - F(1) + X (Tic(n) - Tk(1)) + Rm( n ) , (9.83) k=1 gdzie F(x) odpowiadała J f(x) dx, a Tk(x) było pewnym wyrazem zawierają cym Bk oraz f^k_1^(x). Zauważyliśmy również pojawienie się stałej c speł niającej f (m)(x) = 0 ( x c-TTL) przy x —} oo, dla wszystkich dużych m. Mianowicie, f(k) było równe 1/k (k + 1), F(x) było równe ln ( x /( x + 1)), c było —2 , natomiast Tk(x) było równe (—1)k+1 (Bic/k)(x_k — (x + 1)~k). Oznaczało to, że dla wystarczająco dużych wartości m reszty miały niewielki ogon, Rm(n ) = R m (° o )-R m(n) = M ) m+1 f°° Bm^ Jn m! f (m)(x)dx = 0 ( n c+1_m) . Mogliśmy zatem stwierdzić, że istnieje stała C taka, że m Sn = F(n) + C + Y _ Tk(n) - R ^ n ) . (9-85) k=1 (Zauważmy, że C szczęśliwie pochłonęło wyrazy Tic(1), które były dla nas tak dokuczliwe.) Możemy zaoszczędzić sobie niepotrzebnej pracy na przyszłość, zakładając istnienie C w przypadku, gdy istnieje Rm(oo). Załóżmy teraz, że f<2m+2>(x) ^ 0 oraz f<2m+4>(x) ^ 0 dla 1 ^ x ^ n. Udowodniliśmy już, że zapewnia to proste ograniczenie (9.80) na wartość reszty, = ^m,u (^ Ira + lin ) T2m+2(1)) > gdzie 0m,n leży gdzieś pomiędzy 0 a 1. Tak naprawdę, to my nie jesteśmy za interesowani ograniczeniem zawierającym wyrażenia R2m(i'0 oraz T2m+2(1)Ostatecznie, wprowadzając stałą C pozbyliśmy się wyrazu Tic(1). To, czego oczekujemy, jest ograniczeniem postaci gdzie O < (j)ttl,n < 1* Pozwala nam to wywnioskować z (9.85), że m Sn = F(n) + C + Tl (n) + "^kM + <t>m,nT2m+2('n') , (9-86) k=1 zatem faktycznie reszta znajdzie się pomiędzy zerem a pierwszym odrzuco nym wyrazem. Lekka modyfikacja naszego poprzedniego rozumowania pozwoli nam po sklejać wszystko w jedną całość. Załóżmy, że f(2m+2)ęx j ^ 0 oraz f (2m+4) (x) ^ 0, przy x —> oo. (9*87) Prawa strona (9.85)wygląda tak samo, jak prawa strona wzoru sumacyjnego Eulera (9.67) z ujemnym znakiem, przy a = n oraz b = 0 0 , o ile weźmiemy pod uwagę składniki reszty, gdzie kolejne reszty tworzone są przez indukcję po m. Możemy teraz zastosować nasze poprzednie rozumowanie. Sumowanie 2: Zgrane liczby harm oniczne Teraz, kiedy nauczyliśmy się już tak dużo na banalnym (ale bezpiecznym) przykładzie, z ochotą zabierzemy się do przykładu mniej oczywistego. Uży jemy wzoru sumacyjnego Eulera do wyprowadzenia przybliżenia liczby Hn , którego domagaliśmy się od pewnego czasu. W przypadku tym f (x) = 1/x . Dzięki sumowaniu 1, wiemy już coś o całce oraz pochodnych funkcji f, również to, że f^m^(x) = 0 ( x _m_1), gdy x —* 0 0 . Możemy zatem bezpośrednio skorzystać ze wzoru (9.85), otrzymując 1 m R Y_ ^ = Inn 4- C + B m "1 - Y_ 2 j j k “ R2n » . 15Ck<n k=l dla pewnej stałej C. Suma po lewej stronie jest równa Hn- i , a nie Hn . Wygodniej jednak będzie nam operować na liczbie Hn- i , dodając wyraz 1 / n później, zamiast kłopotać się o (n + 1) po prawej stronie. Zatem B in -1 odpowiadać będzie (Bi + 1)n -1 = 1/ ( 2n). Stałą nazwijmy y zamiast C, ponieważ stała Eulera y jest rzeczywiście zdefiniowana jako limnôo(Hn — ln u ). Teoria, którą właśnie rozwinęliśmy, wystarczy nam, aby spokojnie osza cować składnik reszty, ponieważ f(2m) (x) = (2m )!/x2m+1 0, dla wszystkich x > 0. Zatem (9.86) mówi nam, że H“ - . (9 » ) gdzie 0m>n jest pewnym ułamkiem pomiędzy 0 a 1. Uzyskaliśmy wzór ogólny, którego kilka pierwszych wyrazów pojawia się w tabeli 499. Na przykład dla m = 2 otrzymujemy Hn ln n + Y + 2n Un2 + UOn4 252n6 ' Nawiasem mówiąc, ten wzór daje dobre przybliżenie y nawet dla n = 2 : y = H2 —ln 2 — ^ + ^g — + 6 - 0, 577165. . . + e , gdzie e jest stałą pomiędzy zerem a 16]28. Jeżeli przyjmiemy rt = 104 oraz m = 250, to otrzymamy poprawną wartość y aż do 1271 pozycji dziesiętnej, rozpoczynając od y = 0,57721 566490153286060651209008240243. . . . (9.90) Stała Eulera pojawia się również w innych wzorach, które pozwalają wyliczyć jej wartość jeszcze sprawniej [346]. S um ow anie 3 : P rz y b liże n ie S tirlinga Jeżeli f(x) = lnx, to f'(x) = 1/x . Możemy więc wyliczyć sumę logarytmów, używając prawie takich samych obliczeń, jakimi posłużyliśmy się sumując odwrotności. Wzór sumacyjny Eulera daje nam y Ink = , Inn n l n n — u + a ------ — l^kcn , y- B2k_____ ___________B2m+2_____ 2 k (2 k —1 )n 2k_1 m,n ( 2 m + 2 ) ( 2 m + 1 ) n 2m+1 gdzie a jest pewną stałą, „stałą Stirlinga”, oraz 0 < <pm>n < 1. (W tym przy padku f (2m^(x) jest ujemne, a nie dodatnie. Jednak w dalszym ciągu prawdą jest, że reszta zdominowana jest przez pierwszy odrzucony wyraz, ponieważ moglibyśmy rozpocząć od f(x) = —ln x zamiast f(x) = lnx.) Dodając Inn do obu stron, otrzymujemy Inn 1 Inn! = n l n n - n + — + a + — 1cp2n,. (9. 91) dla m = 2. Możemy teraz otrzymać przybliżenie z tabeli 499 biorąc funkcję ‘exp’ po obu stronach. (Wartość e° okazuje się równa \ / 27r, ale nie jesteśmy jeszcze całkiem gotowi do wyprowadzenia wzoru. Prawdę mówiąc, Stirling nie odkrył postaci zwartej a. Dopiero kilka lat później de Moivre [275] udowodnił, że taka stała istnieje.) Jeżeli m jest ustalone oraz n —> oo, to wzór ogólny daje coraz to lepsze co do błędu bezwzględnego przybliżenia Inn!. Daje zatem coraz to lepsze przy bliżenie n! co do błędu względnego. Ale jeśli n jest ustalone, a m zwiększa Kłania się nam Heisenberg. się, to granica błędu |B2m+2|/(2m + 2 )(2m + 1)n 2m+1 zmniejsza się tylko do pewnego momentu, aby później zacząć się zwiększać. Zatem przybliżenie osiąga punkt, poza którym pewnego rodzaju zasada nieoznaczoności ograni cza dokładność otrzymanego przybliżenia rt!. W rozdziale 5, równanie (5.83), rozszerzyliśmy pojęcie silni na dowolne liczby rzeczywiste oc dzięki definicji 1 = lim ( n + C V a! twoo \ n J a zaproponowanej przez Eulera. Przypuśćmy, że oc jest dużą liczbą, wtedy Ina! = n lim ( a l n n + Inn! — Y" ln (a + k ) j , n->oo V L— J k=1 a wzór sumacyjny Eulera może być użyty, wraz z f(x) = ln(x + a), do osza cowania wartości tej sumy: n 2 2 1n(k+<x) = Fm(o c ,n )-F m(cx,0) + R2m( a , n ) , k=l ln(x + a) Fra(a,x) = ( x + a )ln (x + a) —x + 2 B2k 2k(2k — 1) (x + a )2k_1 ’ k=1 [>TXB2m ({x}) a,TL Jo 2m dx (x + a )2 m ’ (Zastosowaliśmy tu (9.67) z a = 0 oraz b = n, dodając później ln(n + a) — In a do obu stron.) Jeżeli odejmiemy to przybliżenie dla £ £ = 1 ln(k + a) od przybliżenia Stirlinga dla Inn!, dodając później a ln n , oraz weźmiemy granicę przy n —> 00, to otrzymamy 1 oc m a! = a 1 ln a — a -|— — — h cr Y B21c (2Tc)(2łc —1Jcc2^ -1 r ° B 2m({x}) dx Jo 2m (x + ot)2™ ’ ponieważ a ł n n + n l n n —n + j I n n —(n+< x)ln(n+< x)+n—^ ln (n + a ) —> —<x a pozostałe, nie występujące tu wyrazy, zbiegają do zera. Oznacza to, że przybliżenie Stirlinga zachowuje się dla uogólnionej silni (również dla funkcji gamma F (a + 1) = a!) dokładnie tak samo jak w przypadku zwyczajnej. Sum ow anie 4 : S kład nik d zw on ow y Przyjrzyjmy się teraz sumie mającej zupełnie inne cechy: ©n = Y . e _k2/n (9 92) k = — t-e_ 9 /n + e _ 4 /n + e _ , / u + 1 + e _ 1 /n + e _ 4 /u + e _9/n H— . Jest to podwójnie nieskończona suma, której wyrazy osiągają maksymalną wartość e° = 1 przy k = 0. Suma ta nosi nazwę 0 n , ponieważ jest ona szere giem potęgowym zawierającym wielkości e~ ^ n podniesione do potęg p(k), gdzie p(k) jest wielomianem stopnia 2. Takie szeregi potęgowe tradycyjnie nazywamy „theta funkcjami.” Dlan = IO100 otrzymujemy r e - ° ’01 » 0,99005, d l a k - 1049; e_1c/n = < e - 1 0 , 36788, l e " 100 < IO”43, d l a k = 10so; dla k = 1051. Rzeczywiście wartość składnika jest bliska 1 do momentu, w którym k osiąga mniej więcej y/n. Później szybko opada, stając się bliska zeru. Możemy się domyślić, że 0 U będzie proporcjonalna do y/n. Poniżej wykres e~k / n dla rt = 10: Większe wartości rt rozprostowują wykres poziomo o czynnik y/n. Oszacowanie funkcji 0 n otrzymujemy podstawiając f(x) = e~x /n oraz a = —00, b = +00 we wzorze sumacyjnym Eulera. (Jeżeli nieskończoności są dla nas zbyt przerażające, niech a = —A oraz b = +B, a następnie bierzemy granice przy A,B —>00.) Całka f(x) jest równa '+00 J—OO r+00 e~x /n dx = y/n J—OO e~u du = y/n C , jeżeli zastąpimy x przez u-^rt. Wartość e_u2 du jest nam dobrze znana, ale pozostaniemy na razie przy nazwie C. Wrócimy do niej, kiedy zakończymy proces podłączania do wzoru sumacyjnego Eulera. Następnie powinniśmy poznać ciąg pochodnych f'(x), f "(x), . . . , a w tym celu wygodnie jest użyć funkcji f(x) = g (x A /r t), g(x) = e- *2 . Wówczas przez zróżniczkowanie funkcji złożonej dostajemy co odpowiada stwierdzeniu, że f'(x) = - ^ = g ' ( x / v / n ) . yn Przez indukcję otrzymujemy f (k)(x) = n ~ k/2g (k)( x / \ / n ) . Na przykład mamy: g'(x) = —2xe_x2 oraz g/;(x) = (4x2 —2)e_x2. Stąd f'w - - ś(4(^)2- 2)e"Vn- Łatwiej będzie zrozumieć, co się dzieje, jeśli rozważymy prostszą funkcję g(x). Nie musimy dokładnie obliczać pochodnych g(x), ponieważ będziemy niepokoić się wyłącznie o graniczne wartości przy x = ± 00.A w tymcelu wystarczy zauważyć, że każda pochodna g(x) jest równa e_x2 razy pewien wielomian zmiennej x: g(k)(x) = Pk(x)e-x2 , gdzie Pk jest wielomianem stopnia k. Dowód przeprowadzamy indukcyjnie. Funkcja wykładnicza e~x zbliża się do zera o wiele szybciej, niż Pk(x) dąży do nieskończoności, przy x —» ± 00, mamy zatem f ^ (+00) = f ^ ( —00) = 0 dla wszystkich k ^ 0. Oznacza to, że wszystkie wyrazy m T> k=1 znikają, @n amy zostajemy z wyrazem odpowiadającym J f (x) dx oraz resztą = c V ń + ( - 1 ) m+1 [+ dx J — OO (x = u J n ) m! = C y n + 0 (n (1- m)/2). pm(u )e du Oszacowanie O jest prawidłowe, ponieważ ^ ^ { ua/ tl}) | jest ograniczone, a całka du istnieje, gdy P jest wielomianem. (Stała ukryta pod O jest zależna od m.) Udowodniliśmy, że ©n = C y / n + 0 (n ~ M), dla dowolnie dużego M. Róż nica pomiędzy ©n a C y/n jest „wykładniczo mała.” Wyznaczmy zatem do kładną wartość stałej C, mającej duży wpływ na wartość ©n . Jednym ze sposobów wyznaczenia stałej C jest wyszukanie całki w odpo wiedniej tabeli. Ale my wolelibyśmy wiedzieć, jak taką wartość wyprowadzić, abyśmy mogli całkować nawet wtedy, gdy odpowiednia całka nie została stabelaryzowana. Do wyliczenia C wystarczy znajomość podstawowych rachun ków, jeżeli nie przerazi nas podwójna całka +00 p+oo +00 r + o o >~V‘ dy = dx C J—oo O - ( x 2+ y 2 ) dx dy Przechodząc do współrzędnych biegunowych otrzymujemy c = p>27T Z7T pOO nO O Jo Jo 1 e T rd r d0 (u = r2) f2n — I'2 "J - i2 fJo du tc 7t . Czyli C = y/n. Fakt, że x2 + y 2 = r2 jest równaniem koła o obwodzie 2n r , wyjaśnia nieco pojawienie się liczby n. Innym sposobem wyliczenia C jest zastąpienie x przez y /t oraz dx przez l f 1/ 2 dt: +O O dx = 2 dx = t - ^ 2e - l d t. Wartość całki wynosi F Q ) , ponieważ F(a) = J^° t a_1 e- t dt zgodnie ze wzo rem (5.84). Pokazaliśmy zatem, że r Q ) = y/n. Nasz końcowy wzór uzyskuje postać en = Y. - k z/n y/m v -\-0 [n ), dla ustalonych M. (9.93) Stała ukryta pod O jest zależna od M. Właśnie dlatego mówimy, że M. jest „ustalone.” Na przykład dla rt = 2, nieskończona suma @2 jest w przybliżeniu równa 2 , 506628288. To już jest bardzo blisko y/2m. w 2 , 506628275, mimo że rt jest małe. Wartość ©100 zgadza się z 10y/ń na pierwszych 427 dziesiętnych pozy cjach! Ćwiczenie 59 używa zaawansowanych metod do wyprowadzenia szybko zbiegającego szeregu dla 0 n . Okazuje się, że 0 n / V ^ = 1 + 2e-Tl7t2 + 0 ( e - w ). (9.94) Sum ow anie 5 : O sta tn ie słow o Zajmiemy się teraz już ostatnią sumą, która, jak się okaże, da nam wartość stałej Stirlinga a. Ta ostatnia suma pozwoli również zilustrować użycie tech nik poznanych nie tylko w tym rozdziale. Będzie to zatem właściwy sposób na zakończenie naszego spotkania z Matematyką Konkretną. Nasze końcowe zadanie na pierwszy rzut okiem wygląda niemalże na ab surdalnie proste. Będziemy próbowali znaleźć wartość asymptotyczną na podstawie wzoru sumacyjnego Eulera. To już kolejny przypadek, w którym z góry znamy odpowiedź (czyż nie tak?). Interesujące jest jednak wypróbowywanie nowych metod na starych problemach, pod warunkiem, że przyglądamy się dokładnie otrzymanym wy nikom - może jednak odkryjemy coś nowego. Zaczynamy m y ś l e ć z r o z m a c h e m i zdajemy sobie sprawę, że największy wkład do An dają wyrazy środkowe, bliskie k = rt. Prawie zawsze najwygod niej jest wybrać notację, w której największy wkład do sumy dają wyrazy pojawiające się blisko k = 0. Możemy zatem użyć sztuczki z zamianą ogonów w celu pozbycia się wyrazów z dużym |k|, co osiągamy zastępując k przez n + k: an = +y W( 2nv ) = +y (n + k)!(2n()!n - k ) ! ' Nasze położenie wydaje się być niezłe, gdyż wiemy, jak przybliżać (n ± k )!, gdy n jest duże, a k małe. Chcemy teraz wykonać trzykrokową procedurę opartą na sztuczce z za mianą ogonów. Mianowicie, chcielibyśmy napisać (n + k ^ n - k ) ! = a,c(n) = bk(n) + ° ( Ck{n)) ’ dla k e D " ’ pod warunkiem, że możemy otrzymać oszacowanie An = Y_bk(n) + o ( Y. ° k ( n )) + ° ( Y bk(n )) + I O ( c k( n ) ) . Ic k£D n keD n Postarajmy się zatem oszacować (^J^) w zakresie, w którym |k| jest małe. Moglibyśmy zastosować przybliżenie Stirlinga, które znajduje się w ta beli 499, ale łatwiej nam będzie poradzić sobie z jego logarytmicznym równo ważnikiem w (9.91): lncik(n) = ln(2n)! —ln(n + k)! —ln(n —k)! = 2n ln 2 n — 2n + \ ln 2n + a + O (rt- 1 ) — (n+k) ln(n+k) + n + k — \ ln(n+k) — cr + O ((n + k )- 1 ) — (n—k )ln (n —k) + n —k — \ ln(n—k) — cr + 0 ( ( n —k)_1) . (9-95) Powyższe wyrażenie chcemy przekształcić do przyjemnego, prostego oszaco wania typu O. Metoda zamiany ogonów pozwala nam pracować używając oszacowań, które są prawdziwe wyłącznie wtedy, gdy k znajduje się w zbiorze „dominu jącym” D n . Ale w jaki sposób powinniśmy zdefiniować D n? Musimy stworzyć na tyle małe D n , abyśmy mogli otrzymać dobre oszacowanie. Powinniśmy, na przykład, unikać zbliżania się k do n, w przeciwnym razie wyraz O ((n —k)_1) w równaniu(9.95) eksploduje. Z drugiej strony, zakres D n musi być odpo wiednio duży,tak aby wyrazy ogonowe (wyrazy z k ^ D n ) były pomijalnie małe w porównaniu z całą sumą. Zwykle metoda prób i błędów okazuje się niezastąpiona w procesie ustalania odpowiedniego zbioru D n . W tym przy padku obliczenia, jakie musimy wykonać, pokażą, że roztropnie jest użyć następującej definicji: k € Dn 4=^ | k | < n 1/2+ e. (9.96) Powyższe e jest małą, dodatnią stałą, którą dobierzemy później, zaraz po zakończeniu wstępnego rozpoznania. (Dokładność oszacowania O będzie za leżeć od wartości e.) Równanie (9.95) upraszcza się do lnaic(n) = (2n + ^) ln2 — a — ^ Inn + 0(n ~’1) — (n+k+^J ln (l+ k /n ) - ( n - k + 1 ) l n ( l - k / n ) . (9.97) (Wyciągnęliśmy duże części logarytmów, zapisując ln ( n ± k ) = Inn + ln(l ± k / n ) , co pozwoliło pozbyć się wielu wyrazów Inn.) Będziemy teraz rozwijać asymptotycznie wyrazy ln(1 ± k /n ), aż otrzy mamy wyraz błędu osiągający zero przy n —> 00. Mnożymy ln(l ± k /n ) przez (n ± k + j ] , powinniśmy zatem rozwijać logarytm aż osiągniemy o(rt 1), przy założeniu, że |k| ^ n 1//2+e: Mnożąc przez n ± k + k2 ±-i k — -k2 — I----Zn otrzymujemy 0 ( n _1/2+3e) , n poszerzone o pozostałe wyrazy, które zostają pochłonięte przez O (n 1/ 2+3e Zatem równanie (9.97) przybiera postać lnaicfn) — ( 2 n + ^ ) l n 2 — cr— ^ ln n —k2/ n + 0 ( r t -1/^2+3e) . Przechodząc do funkcji wykładniczych, otrzymujemy 22n+1/2 cik(n) = (9-98) eay/ń Oto otrzymane przez nas przybliżenie wraz z 22 TL+1/ 2 bic(n) = ck(n) = 22nn _1+3e e~k /n . Zauważmy, że wystąpienia k wewnątrz bk(n) oraz Ck(n) nie są zbyt skom plikowane. Mamy szczęście, ponieważ bedziemy sumować względem k. Sztuczka z zamianą ogonów pokazuje, że suma a k(n) będzie w przy bliżeniu równa b k M , pod warunkiem, że uzyskaliśmy dobre oszacowanie. Spróbujmy zatem obliczyć 2 > (n ) * = e ^ = ^ Cóż za przedziwny zbieg okoliczności. k eay /ń 0n = ^ eff (1 + O ( n - ) ) . v y (Następny łut szczęścia. Możemy wykorzystać sumę 0 n z poprzedniego przykładu.) Sytuacja wygląda bardzo zachęcająco, ponieważ wiemy, że po czątkowa suma w rzeczywistości jest równa An = Y _ 2n = (1 + 1 ) 2n = 2\2n Wygląda zatem, jak byśmy już mieli eCT= y /ln , zgodnie z oczekiwaniami. Jednak nie na tym koniec. Ciągle jeszcze nie udowodniliśmy, że nasze oszacowanie jest wystarczająco dobre. Przyjrzyjmy się zatem najpierw błę dowi wnoszonemu przez Ckfn): I c(n) = Y_ 22nn ~ 1+3ee~k2/n ^ 22nn ~ 1+3e0 n = 0(22nn ~ i +3e) . Ikl^n1/ 2+e Świetnie, wyrażenie to jest asymptotycznie mniejsze od poprzedniej sumy, gdy 3e < \ . Musimy jeszcze sprawdzić ogony. Mamy Y_ e“ k2/n < exp(—|u 1/2+eJ2/n)(1 + e“ 1/n + e“2/n + • • •) k > n 1/2+ e = 0 ( e - 2e) . 0 ( n ) , Mam już dość docierania do końca długich, trudnych książek nie otrzymując w zamian żadnego ciepłego słowa od autorów. Miło byłoby przeczytać „dziękujemy za lekturę książki, mamy nadzieję, że Ci się do czegoś przyda,” zamiast wpadać na twardą, zimną oprawę książki na samym końcu długiego, suchego dowodu. Czyż nie tak? które jest O (n ~ M) dla wszystkich M. Czyli 2Zk£Dn "^kM jest asymptotycz nie nieistotna. (Obcięcie ustalamy na n 1/2+e tak, aby e-k / n było wykład niczo małe poza D n . Inne rozwiązania, jak n 1//2 logn, mogłyby być również wystarczająco dobre, a otrzymane oszacowania mogłyby być nieco ostrzej sze. Mielibyśmy jednak do czynienia z bardziej skomplikowanymi wzorami. Nie potrzebujemy najsilniejszych z możliwych oszacowań, naszym głównym zadaniem jest ustalenie wartości stałej a.) Podobnie, drugi ogon ł C2+\)/ k>TX1/2 +e \ ograniczony jest przez iloczyn 2n oraz wartości jego największego wyrazu, który pojawia się w punkcie obcięcia k « n 1/2+e. Wartość tego wyrazu to w przybliżeniu bic(n), które jest wykładniczo małe w porównaniu z An , a wykładniczo mały mnożnik eliminuje czynnik 2n. Oznacza to, że sztuczka z zamianą ogonów powiodła się, a my otrzymu jemy oszacowanie 22n = Y _ ) = l P 22n + 0 (2 2nn - i +3e) , dla 0 < e < 1. (9.99) Bierzemy teraz e = \ i otrzymujemy <r = \ \ n l n . QED. Dziękujemy za lekturę książki, mamy nadzieję, że Ci się do czegoś przyda. Autorzy Ć w iczenia Rozgrzewka 1. Czy jest prawdą, że dla fi (rt) -< gi (n) oraz f z W -< gz{n) otrzymujemy fi (n) + h [ n ) -< gi (n) + g2(rt)? 2. Które z funkcji rosną szybciej: a) nJlnn) czy (lnrt)n ? b) rt^lnlnlnTL^ czy (lnrt)!? c) (rt!)! czy ((rt — 1)!)! (rt — 1)!n!? d) FrH.i czy H^ ? 3. Na czym polega błąd w następującym rozumowaniu? „Ponieważ rt = 0 (n ) oraz 2rt — 0 (n ) itd., stąd kn = ^ k = i 0 (n ) = 0 ( n 2).” 4 . Podaj przykład prawdziwej równości, w której wyłącznie lewa strona zawiera notację O. (Nie używaj sztuczki z mnożeniem przez zero, to zbyt proste.) Wskazówka: Rozważ użycie granic. 5 . Czy jest prawdą, że O (f (n) + g(n)) = f (n) + O (g (n )), w przypadku, gdy funkcje f (n) oraz g(n) są dodatnio określone dla wszystkich n? (Porównaj Z (9-27)-) 6 . Pomnóż (Inn + y + 0 ( 1/n ) ) przez (n + O (\ / n )) i wyraź odpowiedź używając notacji O. 7 . Oszacuj sumę 2Zk$>0 e-k/rL z błędem bezwzględnym 0 (n - 1 ). Podstaw y 8. Podaj przykład funkcji f(n) oraz g(n) takich, że żadna z trzech zależ ności f(n) -< g(n), f(n) >- g(n), f(n) x g(n) nie jest prawdziwa, przy dodatkowym założeniu, że funkcje f (n) i g(n) rosną monotonicznie do 00. 9 . Przeprowadź ścisły dowód (9.22), pokazując, że lewa strona jest podzbio rem prawej, zgodnie ze zbiorową definicją O. 10. Czy jest prawdą, że cosO(x) = 1 + 0 (x2) dla każdego x rzeczywistego? 11. Czy jest prawdą, że 0 (x + y ) 2 = 0 (x2) + 0 (y2)? 12. Udowodnij, że dla n —> 00 zachodzi 1 + ^ + 0 ( n - 2) = ( i + ^ ) ( 1 + 0 ( n - 2) ) . 1 3 . Oblicz (n + 2 + 0 (n -1 ))n z dopuszczalnym błędem względnym 0 (n _1). 14 . Udowodnij, że ( n + a )u+|3 = n n+êa'(l + a (|3 — ^ a )n _1 + 0 (n- 2 )). 1 5 . Podaj asymptotyczną postać „środkowego” współczynnika trójmianowego (n3rJvrL) , z dopuszczalnym błędem względnym O (n~3). 1 6 . Pokaż, że jeśli B(1 —x) = —B(x) ^ 0 dla 0 < x < to otrzymamy fb B ({x})f(x)dx ^ 0 Ja przy dodatkowym założeniu, że f'(x) ^ 0 dla a ^ x ^ b. 17. Pokaż, korzystając z funkcji tworzących, że Bm(^) = (21-m — 1)Bm, dla wszystkich m ^ 0 . 18. Oszacuj sumę (2^) z dopuszczalnym błędem względnym 0 ( n -1//4), dla oc > 0 . Z adania d om ow e 19. Porównaj, korzystając z pomocy komputera, lewe i prawe strony przy bliżeń w tabeli 499, dla n = 10, z = <x = 0,1 i 0 (f (n ) ) = 0 (f(z )) = 0. 2 0 . Udowodnij albo wykaż niepoprawność następujących oszacowań, przy n —> oo: b) e( i+ o ( i / n . ) ) 2 = e _j_ 0(1 / n ) . c) n! = o ( ( ( 1 - 1 / n ) nn )u) . 2 1 . Równość (9.48) daje przybliżoną wartość n-tej liczby pierwszej z błę dem względnym O (logn )- 2 . Popraw powyższe oszacowanie zmniejszając wartość błędu względnego do O (log n )- 3 . Wykorzystaj następny wyraz wzoru (9.31) w (9.46). 2 2 . Popraw oszacowanie we wzorze (9.54), osiągając dokładność 0 ( n - 3 ). 23. Dopracuj przybliżenie wzoru (9.62), uzyskując błąd bezwzględny 0 ( n - 3 ). Wskazówka: Niech gn = c /(n + 1 )(n + 2) + h^. Jakiej zależności reku rencyjnej podlega h n? 24. Przypuśćmy, że an = 0 ( f (n ) ) oraz bn = 0 ( f ( n ) ) . Sprawdź, czy splot L L o akbn-k jest również 0 (f(n )), w następujących przypadkach: a) f(n) = n - a , oc > 1 . b) f (n) = a -rL, a > 1 . 25. Udowodnij wzory (9.1) oraz (9.2), którymi rozpoczęliśmy ten rozdział. 26. Wzór (9.91) pokazuje, jak znaleźć oszacowanie liczby lnlO! z błędem bezwzględnym < 126oooooo- Zatem korzystając z własności funkcji wy kładniczej otrzymujemy wartość 1 0 ! z błędem względnym mniejszym niż e 1Z126000000 — 1 < 10- 8 . (W istocie to przybliżenie daje wynik 3628799,9714.) Jeśli zaokrąglimy tę liczbę do najbliżej liczby naturalnej, wiedząc, że 1 0 ! jest liczbą naturalną, uzyskamy dokładne rozwiązanie. Czy w podobny sposób zawsze możemy obliczyć n!, gdy odpowiednio duża liczba wyrazów przybliżenia Stirlinga jest znana? Oszacuj wartość m dającego najlepsze przybliżenie Inn!, dla ustalonego (dużego) natural nego n. Porównaj błąd bezwzględny przybliżenia z wartością n!. 27. Oblicz wartość asymptotyczną Hn_a) = X k =i ^ korzystając ze wzoru sumacyjnego Eulera, dla ustalonej liczby rzeczywistej oc. (W odpowiedzi możesz użyć stałej, której postać zwarta nie jest Ci znana.) 28. Ćwiczenie 5.13 definuje funkcję typu hipersilnia Qn = V 2 2 . . . n n . Wy znacz asymptotyczną wartość Qn z dopuszczalnym błędem względnym 0 ( n _1). (W odpowiedzi możesz użyć stałej, której postać zwarta nie jest Ci znana.) 29. Oszacuj funkcję 1 1Z12 1/ 2 . . . n 1/n podobnie jak w poprzednim ćwiczeniu. 30. Wyznacz wartość asymptotyczną sumy Y-\cô kl e_k /lx z błędem bez względnym O (n- 3 ), dla ustalonej dodatniej liczby naturalnej l. 31. Oblicz sumę Y.kô V ( ck + cTa) z błędem bezwzględnym 0 ( c _3m), dla dowolnego c > 1 oraz dodatniej liczby naturalnej m. Z adania eg zam in acyjn e 32. Oblicz eH^+H^2) z błędem bezwzględnym 0 ( n _1). 33. Oblicz (k)ALk z błędem bezwzględnym 0 ( n - 3 ). 34. Ustal wartości współczynników od A do F wiedząc, że (1 + 1 / n ) nHri jest równe A n + B (lnn )2 + C ln n + D + E(lnn)2 + ZjgJl + 0 ( n - ' ). n n 35. Oblicz 1/k H k z błędem bezwzględnym 0 (1 ). 36. Oblicz Sn = X!k=i 1/ ( n 2 + k2) z błędem bezwzględnym 0 ( n ~ 5). 37. Oblicz (n mod k) z błędem bezwzględnym O (n lo g n ). 38. Oblicz L k ^ o kk(£) z błędem względnym 0 ( n _1). 39. Oblicz ^ 0 <k<TLln(n — k )(ln n )k/k! z błędem bezwzględnym 0 ( n - 1 ). Wskazówka: Pokaż, że składniki dla k ^ 10Inn są nieznaczące. 40. Niech m będzie (ustaloną) dodatnią liczbą naturalną. Oblicz wartość sumy Y-k=] ( — 1 z błędem bewzględnym 0 ( 1 ). 41. Oblicz „silnię Fibonacciego” flk = i ^ z błędem względnym 0 ( n _1) albo mniejszym. W odpowiedzi możesz użyć stałej, której postać zwarta nie jest Ci znana. 42. Niech a będzie stałą z przedziału 0 < a < Jak mogliśmy zauważyć w poprzednim rozdziale, suma H k<can ( k ) n*e ma ogólnej postaci zwartej. Pokaż, że istnieje jej postać asymptotyczna y kârt = 2 nH(a)“ ^ lgn+° (1), dla H(a) = odg-^ + (1 — cx)lg(yr^). Wskazówka: Pokaż, że < d la O < k ^ a n . 4 3 . Pokaż, że Cn będące liczbą sposobów, na ile możemy rozmienić n centów (rozważane już w rozdziale 7), ma złożoność asymptotyczną cn 4 + 0 ( n 3) dla pewnej stałej c. Jaka to stała? 44. Udowodnij, że x l / i = X1/ 2 '1 / 2 ' _ x - I / 2 " 1 / 2 ' "1 /2 " + X" 3/ 2 -3 /2 .1 / 2 - 1 /2 0 (x~ -5/2- przy x —ł oo. (Przypomnij sobie definicję x-^- = x !/(x — \ ) \ w ( 5 .8 8 ), oraz definicje uogólnionych liczb Stirlinga w tabeli 304.) 45. Niech oc będzie liczbą niewymierną pomiędzy 0 a 1. W rozdziale 3 roz ważaliśmy wielkość D (a ,n ) określającą największą niezgodność, z jaką części ułamkowe {ka} dla 0 ^ k < rt odbiegają od rozkładu jednorod nego. Wzór rekurencjyjny D ( a ,n ) ^ D ( { a - 1 }, [ocrtj) + a -1 + 2 został udowodniony w ( 3 .3 1 ). Maimy również oczywiste ograniczenia 0 ^ D ( a ,r t) ^ tl . Udowodnij, że limrôo D ( a ,n ) /n = 0. W skazówka: W rozdziale 6 roz ważaliśmy ułamki łańcuchowe. 46. Pokaż, że liczba Bella CDn = e - 1 Y-h>o k^/k! z ćwiczenia 7.15 jest asymp totycznie równa m (n )n em (n )-n - 1/ 2 / \ / i n n , gdzie m (n) ln m (n ) = n — Oszacuj wielkość błędu względnego w powyższym przybliżeniu. 47. Niech m będzie liczbą naturalną ^ 2. Rozważmy dwie sumy X .L logm kJ oraz H r iogm ki k=l k=1 która z nich jest asymptotycznie bliższa logm tl! ? 48. Rozważmy tabelę liczb harmonicznych Hk dla 1 ^ k ^ n reprezentowaną w systemie dziesiętnym. Liczba jest zaokrągleniem liczby Hk do dk cyfr znaczących, gdzie liczba dk jest wystarczająco duża, aby odróżnić wartość Hk od Hk_i oraz Hk+i . Poniższy przykład odpowiada fragmen towi powyższej tabeli ilustrującemu przekroczenie 10 przez liczbę Hk k Hk Hk dk 12364 12365 12366 12367 12368 9,999800419,99988128+ 9,9999621510,0000430110,00012386+ 9,9998 9,9999 9,99996 5 5 1 0 ,0 0 0 0 6 10 ,00 0 1 6 6 Oszacuj całkowitą liczbę cyfr użytych w tabeli, ^ £ = 1 ^k, z błędem bez względnym 0 (rt). 49. W rozdziale 6 poznaliśmy opowieść o robaczku, który dociera do końca rozciąganej taśmy po rt sekundach, gdzie Hn_i < 100 ^ Hn . Udowodnij, że jeśli n jest dodatnią liczbą naturalną taką, że Hn_i ^ oc ^ Hu , to |_ea-yJ ^ n ^ fea_'Y] . Pewnego razu zarobiłem 0 (10 ~n) dolarów. 50. Odważni kapitaliści z Doliny Krzemowej otrzymali propozycję dającą im szansę wykładniczego zarobku w stosunku do ich inwestycji. Za każde za inwestowane n milionów dolarów, przy n ^ 2, konsorcjum GKP obiecuje zyski do N milionów dolarów po jednym roku, gdzie N = 10n . Oczywiście istnieje odpowiednie ryzyko inwestycji. Właściwa umowa mówi, że GKP płaci k milionów dolarów z prawdopodobieństwem 1 /(k 2 H j^), dla każ dego całkowitego k z przedziału 1 ^ k ^ N. (Wszystkie sumy wyrażone są w megadolcach, tzn. w dokładnych wielokrotnościach miliona dolarów. Każde rozliczenie jest ustalane w prawdziwie losowym procesie.) Zauważ, że inwestor otrzymuje po roku zwrot w wysokości co najmniej jednego miliona dolarów. a) Jaka jest asymptotyczna wartość średnia zwrotu po jednym roku, w przypadku zainwestowania n milionów dolarów? (Innymi słowy, jaka jest wartość średnia wypłaty?) Podaj odpowiedź z dopuszczalnym błędem bezwzględnym 0 ( 10 ~n ) dolarów. b) Jakie jest asymptotyczne prawdopodobieństwo uzyskania dodatniego zysku, przy zainwestowaniu rt milionów? (Innymi słowy, jaka jest szansa, że otrzymasz wiecej niż zainwestowałeś?) Podaj odpowiedź z dopuszczalnym błędem bezwzględnym 0 (rt- 3 ). Z adania d odatkow e 51. Czy jest prawdą, że J^° 0 ( x - 2 ) dx = 0 ( u _1), przy rt —> 0 0 . 52. Udowodnij, że istnieje szereg potęgowy A(z) = ^ k > 0 zbieżny dla wszystkich liczb zespolonych z, taki że A(n) X n a’> K 53. Udowodnij, że jeżeli f(x) jest funkcją, której pochodne spełniają f'(x K 0 , -f"(x K 0 , f" '(x K 0 , ( - i ) mf (m+1)(x) ^ o dla wszystkich x ^ 0 , to otrzymujemy f'fO) I! f (x) = f (0) + - ^ x + • • • + f (m - 1) (0 ) xm- ’ + 0 ( x m) , (m — IJ! dla x ^ 0. W szczególności, przypadek f(x) = —ln(1 + x) odpowiada dowodowi ( 9 .6 4 ) dla wszystkich k,!! > 0 . 54. Niech f (x) będzie dodatnią, różniczkowalną funkcją taką, że xf ;(x) -< f (x) przy x —ł 0 0 . Udowodnij, że k^n k1+K = 0 ( ^ V \ n“ / v 7 dla « > 0 . W skazówka: Rozważ wielkość f ( k — ^ ) /( k — j ) cc —f ( k + ^ )/(k + ^ )a . 55. Popraw wzór ( 9 .9 9 ), uzyskując błąd względny 0 ( n ~ 3/ 2+5e). 56. Wielkość Q(rt) = 1 + Ik^ - + + ••• = t l —/ n k pojawia się podczas analizy wielu algorytmów. Wyznacz jej wartość asymptotyczną, z dopuszczalnym błędem bezwzględnym o (l). 57. Asymptotyczna postać sumy Golomba 2Zk$;1 1/k|_1 +logn k j 2 została wy prowadzona w ( 9 .5 4 ). Wyznacz postać asymptotyczną dla analogicznej sumy ‘bez podłóg’, 1/k(1 + lo g n k)2. Rozważ użycie całki J^° u e _ 1Łk_tu du = 1 / ( 1 + t l n k ) 2. 58. Udowodnij, że « /r ^ m! M M ) = -2( ^ v— cos(27tkx — \n m ) L ~ — km ~ • dla m £ 2, używając reziduum. Scałkuj 1 2 7ti 27tie27tize dz 02 m z _1 2,m wzdłuż kwadratowego konturu z = x + iy, gdzie max(|x|, |-y|) = M. + biorąc całkowite M zbiegające do oo. 59. Niech 0 n (t) = / n będzie funkcją okresową względem t. Po każ, że rozwinięcie ©n (t) w szereg Fouriera wyraża się wzorem ©n (t) = + 2 e _7t2ll'(cos27rt)+2e~47t2Ti(cos47rt) + 2 e" 97t2n (cos 67r t)+ • • • ) . (Powyższy wzór odpowiada szybko zbiegającym szeregom dla sumy ©n = @n (0 ) w równaniu ( 9 -9 3 ) 0 60. Wyjaśnij, dlaczego w każdym współczynniku asymptotycznego rozwinię cia /2 n \ _ \ tl / y /n ri \ 8 tl _ J __ __ 5______ 21 128n2 1 0 2 4 tl3 w mianowniku występuje potęga 2 . 32768n4 _5 U 61. Ćwiczenie 45 dowodzi, że niezgodność D (a ,n ) jest o (u) dla wszystkich liczb niewymiernych oc. Zaproponuj niewymierne oc takie, że D (a ,n ) nie będzie 0 (n 1 -e ) dla każdego e > 0 . 62. Przy danym n, niech = maxk { £ } będzie największym elemen tem n-tego wiersza w podzbiorowym trójkącie Stirlinga. Pokaż, że dla wy starczająco dużych n, otrzymujemy m (n) = |_m(u)J lub m (n) = pm(n)], gdzie rfC (n)(m (n)+ 2 )ln (m (n )+ 2 ) = n ( m ( n ) + l ) . Wskazówka: To jest trudne zadanie. 63. Udowodnij, że samo definiujący się ciąg S. W. Golomba z ćwiczenia 2.36 spełnia zależność f(n) = c()2 — 1 + 0 (n^- 1 /logrt). 64. Udowodnij następującą tożsamość: v— COS 2lT7tX ------ 2— n^l ^ / 7 /7 == 7t (x —x + i\ .. A dla 0 ^ x ^ 1 , używając wyłącznie „eulerowskiej” (osiemnastowiecznej) matematyki. 65. Jakie współczynniki występują w szeregu asymptotycznym - 1 1 n — 71 1 7-------TT?------ TT “I-------- 1“ 7-------iTT (n —1 ) (n —2 ) (n —1 )! = CLl &7 a ° -------rt *—rt22 ------ _ ' P ro b lem y badaw cze 6 6 . Zaproponuj „interpretację kombinatoryczną” przybliżenia Stirlinga. (Za uważ, że rtn jest liczbą przekształceń zbioru {1 , 2 , . . . ,u} w siebie, a rt! jest liczbą odwzorowań zbioru { 1 , 2 , . . . ,u} na siebie.) 67. Rozważmy wypełnioną punktami kwadratową tablicę o wymiarach n x u , n ^ 3, w której każdy punkt ma czterech sąsiadów. (Zakładamy, że pierw sze i ostatnie punkty w każdym wierszu i kolumnie sąsiadują ze sobą.) Niech Xn będzie liczbą sposobów przyporządkowania punktom trzech ko lorów: czerwonego , białego oraz niebieskiego, tak aby każde dwa sąsiadu jące ze sobą punkty były pokolorowane różnymi kolorami. (Na przykład X3 — 12.) Udowodnij, że 4 \ 3 n 2/ 2 —7t /6 Xn ~ ( f ) ' 6 8 . Niech Qn będzie największą liczbą naturalną m taką, że Hm > n. Znajdź Dwie dziurki w nosie skończyło się. najmniejszą liczbę naturalną n taką, że Qn ^ [eTL-y + j \ , albo udowod nij, że takie rt nie istnieje. O dpow iedzi do ćw iczeń W rozdziale tym podamy odpowiedź (a przynajmniej krótki komentarz) do każdego ćwiczenia. Niektóre z odpowiedzi wykraczają poza postawione py tanie. Czytelnicy najlepiej zrobią, jeżeli spróbują najpierw sami rozwiązać zadania p r z e d z a j r z e n i e m do tego rozdziału. Autorzy są zainteresowani poznaniem jakichkolwiek rozwiązań (także rozwiązań częściowych) przedstawionych tu problemów badawczych, jak rów nież jakichkolwiek prostszych (czy poprawniej szych) rozwiązań pozostałych zadań. 1 .1 . Dowód jest w porządku poza przypadkiem n = 2. Gdyby wszyst kie dwuelementowe zbiory koni miały ten sam kolor, zdanie byłoby prawdziwe dla każdego zbioru koni. 1 .2 . Jeśli Xn jest liczbą ruchów, to Xo = 0 i Xn = Xn_i + 1 + Xn_i +1 + Xn_i dla n > 0. Stąd (na przykład przez dodanie 1 do obu stron) wynika, że Xn = 3n — 1. (Po ^Xn ruchach okaże się, że cała wieża będzie na środkowym pręcie. W połowie drogi do domu!) 1.3. Mamy 3n dopuszczalnych ułożeń, ponieważ każdy z krążków mo żemy położyć kolejno na każdym pręcie. Wszystkie te ułożenia mu simy napotkać podczas przenoszenia wieży, ponieważ najkrótsze roz wiązanie wymaga — 1 ruchów. (Konstrukcja ta jest równoważna „trójkowemu kodowi Graya”, który przebiega wszystkie liczby od (0 . . . 0 )3 do (2 . . . 2 ) 3 , zmieniając za każdym razem dokładnie jedną cyfrę.) 1 .4 . Takie konfiguracje nie istnieją. Jeżeli największego krążka nie trzeba ruszać, to wystarczy wykonać 2 n _1 — 1 ruchów (założenie induk cyjne), w przeciwnym razie wystarczy wykonać (2 n _ 1 — 1 ) + 1 + (2 n _ 1 — 1 ) ruchów (znowu założenie indukcyjne). 1.5. Nie. Dwa różne okręgi mogą się przeciąć w co najwyżej 2 punktach, więc czwarty okrąg może zwiększyć liczbę obszarów do co najwy (Pierwszy odkrywca każdego błędu dostanie nagrodę 2,56 dolara.) Czy to oznacza, że ja muszę znaleźć k a ż d y błąd? (Rozumieliśmy przez to „jakikolwiek” błąd.) Czy to więc oznacza, że tylko jedna osoba dostanie nagrodę? (Hmmm, spróbuj i przekonaj się.) żej 14. Można jednak to zadanie rozwiązać za pomocą innych kształ tów (np. wydłużonych okręgów, czegoś w rodzaju „fasolek”): Okazuje się, że chodziło tu o liczbę punktów przecięcia. Wypukłość była tylko zmyłką. Venn [360] twierdził, że nie da się tego wykonać za pomocą elips dla 5 zbiorów, jednak elipsoidalne rozwiązanie przypadku 5 zbiorów zostało podane przez Gninbauma [167]. 1.6. Jeśli n-ta prosta przecina pozostałe w k > 0 różnychpunktach, to dostaniemy k — 1 nowych obszarów ograniczonych (przy założeniu, że żadne 2 proste nie są równoległe) oraz 2 obszary nieskończone. Zatem maksymalna liczba obszarów ograniczonych wynosi (rt—2) + (rt—3) + • - - = S-n,_2 - ( n - 1 ) (n—2 ) / 2 = Ln - 2n. 1.7. Nie udowodnimy bazy: w rzeczywistości H(1) ^ 2 . 1.8. Q 2 = (1 + |3)/<x; Q 3 = (1 + a + |3)/a|3; Q4 = (1 + oc)/13; Qs = oc; Qs = p. W związku z tym nasz ciąg jest okresowy. 1.9. (a) Prawdziwość P(n — 1) dostajemy z nierówności Zakładamy tu, że n > 0. k ( x-\ H-------b xn- i \ n —1 ) ( xi H---------\~xri- i \ n —1 (b) X] . . . XlxXTL_|_i . . . X2ti^ (((^1 H-*' ((^ri+1 *,-H^2n)/T0) na mocy P(n); wewnętrzny iloczyn jest nie większy niż ((xi H-------h X2 n )/2 n ) 2 na mocy P(2). (c) Na przykład P(5) wynika z P( 6 ), z P(3), z P (4) i z P(2). 1.10. Pokaż najpierw, że Rn = !Rn _ 1 + 1 + Qn_i +. 1 + Rn- 1 , gdy n > 0. Jak zobaczymy, metody rozdziału 7 pozwolą nam wyliczyć, że = ((1 + V 3 r +1 - ( l - y / 3 ) n+' ) / ( 2 V 3 ) - 1 . 1 .1 1 . (a) Nie możemy uczynić nic lepszego, niż przenieść na pręt po mocniczy podwójną (n — 1 )-wieżę, następnie przenieść dwa rów nej wielkości największe krążki odwracając ich porządek, i w końcu znowu przenieść podwójną (n — l)-wieżę. Zatem An = 2An_i + 2 i An = 2Tn = 2 TX+1 — 2. Rozwiązanie to zamienia kolejność dwóch największych krążków, ale zachowuje porządek pozostałych 2 n —2. (b) Niech Bn będzie minimalną liczbą ruchów.. Wtedy Bi = 3 i można pokazać, że żadna strategia nie daje wyniku lepszego niż Bn = Atl_i + 2 + An_i + 2 + Bn_i dla n > 1. Zatem Bn = 2n + 2 —5, dla każdego n > 0. Zadziwiające, ale jest to po prostu 2An — 1, i mamy też Bn = An—i + 1 + An_i + 1 + An_i + 1 + A-rt—i . 1 .1 2 . Jeśli wszystkie > 0, to A (m i, . . . , m n ) = 2 A (m i>• • • > )+ m n . Jest to równanie typu „uogólnionego Flawiusza” z rozwiązaniem (mi . . . m n )2 = 2TV-1mi + • • • + 2m n_i + m n .Co ciekawe, okazuje się, że rozwiązanie uogólnienia ćwiczenia l l b spełnia rekurencję A(m -|, . . . ,m n ), jeśli ; mn = 1; 1, jeśli rt = 1 ; 2 A (m i, . . . , m n_ i ) + 2m n + jeśli rt > 1 i m n > 1 . I 2mn - 1.13. Wiedząc, że n prostych może wyznaczyć Ln obszarów, możemy je zastąpić bardzo wąskimi zygzakami z odcinkami wystarczająco dłu gimi, aby uzyskać 9 przecięć z każdym innym zygzakiem. W związku z tym ZZn = ZZn_i + 9n — 8 , dla wszystkich rt > 0, i dalej ZZn = 9Sn —8 rt + 1 = | u 2 — j n + 1. 1.14. Liczba nowych 3 -wymiarowych obszarów zdefiniowanych przez n-te cięcie jest równa liczbie 2 -wy miarowych obszarów wyznaczonych na płaszczyźnie cięcia przez jej przecięcia z innymi płaszczyznami. Za tem Pn = Pn_i + Ln_i i okazuje się, że P5 = 26. (Sześć cięć w sze ściennym kawałku sera czyni z niego 27 kostek, albo aż do Pę = 4 2 kawałki dziwniejszych kształtów.)Ciekawe, że rozwiązanie tej reku rencji pasuje do ładnego wzorca wyrażonego przez współczynniki dwumianowe (zob. rozdz. 5): Oczywiście Xn jest liczbą 1 -wymiarowych obszarów wyznaczonych przez n punktów na prostej. 1.15. Funkcja I spełnia tę samą rekurencję co J, gdy n > 1, ale 1(1) jest nieokreślone. Ponieważ 1(2) = 2 oraz 1(3) = 1, więc nie istnieje wartość 1( 1 ) = a, która pozwoliłaby nam zastosować ogólną metodę. „Końcówka” rozwijania zależy od 2 najstarszych bitów w dwójkowej reprezentacji n. Założę się, że wiem, co się będzie działo w 4 wymiarach! Jeśli rt - 2m + 2 m _ 1 + k , gdzie O <C k < 2 m + 1 + 2 m - (2m + 2™ -1) = > 2. Inną drogą wyrażenia tego za pomocą notacji n = 2m + l jest stwierdzenie, że 2 m + 2 m_1, to rozwiązaniem będzie I(n) = 2 k + 1 dla każdego n irni = l J(u) + 2 m _ l’ i e ś l i 0 ^ l < 2m -1; J 1 J(n) - 2 m, jeśli 2 ™ " 1 ^ l < 2 m. 1.16. Niech g(rt) = a(rt)a + b(n)|3o + c(rt)(3i + d(n)y. Z równania ( 1 . 1 8 ) wiemy, że dla każdego rt = (1 bm_i . ..b i bo )2 zachodzi a ( n ) a + b (n )p 0 + c (n ) 0 i = (a |3 b m_ 1 |3bm_ 2 . . . |3bl Pbota; to nam definiuje a(n), b(rt) i c(n). Po podstawieniu g(n) = n do naszego równa nia rekurencyjnego dostajemy a(n) + c(n) — d(n) = rt; wiemy więc wszystko. (Przyjmując g(n) = 1, uzyskujemy dodatkową tożsamość a (rt) — 2 b(rt) — 2 c(n) = 1 , którą można zastosować do wyrażenia b(u) za pomocą prostszych funkcji a(u) i a(n) + c(n).) 1.17. W ogólności mamy W m ^ 2Wm_ k + Tk, dla 0 ^ k ^ m. (Relacja ta odpowiada przeniesieniu wierzchnich m —k krążków na któryś z pomocniczych prętów, następnie bez użycia tego pręta przeniesieniu dolnych k krążków, i w końcu powtórnym przeniesieniu wierzchnich m — k krążków na pręt docelowy. Przedstawiona nierówność zależy od wartości k, która minimalizuje prawą stronę dla m = rt(n + 1)/2. (Nie możemy jednak stwierdzić, że zachodzi równość; istnieje wiele innych strategii wartych uwagi). Jeśli przyjmiemy, że Yn = (Wn(n+i ) / 2 — l ) / 2 n , to dojdziemy do wniosku, że Yn ^ Yn_i + 1; zatem W n (n + 1 ) / 2 < 2n (n - 1) + 1. 1.18. Wystarczy pokazać, że obie półproste wychodzące z [n 2\ 0 ) prze tną obie półproste wychodzące z (n 2 k, 0 ), i że wszystkie te punkty są różne. Półprosta wychodząca z (x3-, 0) przez (xj — a j, 1) prze cina półprostą wychodzącą z (xk>0 ) przez (xk — cik,1 ) w punkcie (xj — gdzie t = (xk — Xj)/(a.k — aj). Niech Xj = n 2^ oraz aj = ró + (0 lub n -1x). Wtedy współczynnik t = (n2k — rt2^)/ (rtk —ró + (—n _1x lub 0 lub rt-11)) leży dokładnie między ró + n k — 1 i ró + rtk + 1 ; tak więc współrzędna y punktu przecięcia jednoznacz nie określa j oraz k. Podobnie, cztery przecięcia mające te same j oraz k są różne. 1.19. Nie, gdy n > 5. Załamana linia, której ramiona rozchodzą się pod kątami 0 i 0 + 30°, może przeciąć inną, której ramiona rozchodzą się pod kątami c|) oraz + 30° 4 razy tylko wtedy, gdy 30° < |0 — 4>| < 150°. Nie możemy wybrać więcej niż 5 kątów tak bardzo oddalonych od siebie (ale można wybrać 5). 1 .2 0 . Niech H(n) = a(rt)oc+b(rt)|3o+ c(n)|3i +d(rt)yo + e ( u ) y i. Wiemy z ( 1 . 1 8 ), że a(n)<x+b(n)po + c ( n ) 0 i = ( a p bin_, Pbm_ 2 . - - 0 bl Pb0 )4 , kiedy rt = (1 bm_i .. .b i bo) 2 - To określa a(n), b(rt) i c(rt). Przyj mując H(n) = rt, uzyskujemy a(n) + c(n) — 2 d(n) — 2 e(n) = n; przyjmując H(n) = n 2, dostajemy a(n) + c(n) + 4 e(n) = n 2. Zatem d(n) = (3a(n) + 3c(n) —rt2 —2n )/4; e(n) = (rt2 — a(n) —c(n ))/4 . 1 .2 1 . Wystarczy wziąć jako m najmniejszą (lub jakąkolwiek) wspólną wie lokrotność 2n, 2 n —1, . . . , n + 1. (Nieformalnie można sobie wyobra zić, że „losowa” wartość m będzie dobra z prawdopodobieństwem n n —1 1 _ j ( 2ti\ 2n 2rt — 1 " n + 1 / \ n J 4n możemy się więc spodziewać istnienia takiego m mniejszego niż 4™.) 1 .2 2 . Weź 2n-kąt foremny i poetykietuj jego boki elementami „cyklu de Bruijna” długości 2n . (Cykl de Bruijna to cykliczny ciąg 0 i 1, w którym każdy podciąg kolejnych elementów jest inny; zob. [207, ćw. 2.3.4.2-23] i [208, ćw. 3.2.2-17].) Dodaj bardzo cienkie uzupełnienie każdego boku etykietowanego 1. Szukane n zbiorów, to kopie po wstającego wielokąta obróconego o długość k boków dla k = 0 , 1 , ..., n - 1 . 1.23. Tak. (Do dowodu potrzebujemy pewnych podstaw teorii liczb z roz działu 4). Niech L(n) = N W W (1, 2 , . . . ,n ). Możemy założyć, że rt > 2; więc zgodnie z postulatem Bertranda istnieje liczba pierw sza p między n /2 a n. Możemy również założyć, że ) > n /2 , gdyż q ' = L(n) + 1 —q pozostawia j ' = n + 1 —) wtedy i tylko wtedy, gdy q pozostawia j. Dobierz q tak, aby q = 1 (mod L (n)/p) i q = j+1 —rt (mod p). Osoby są teraz eliminowane w następującej kolejności: 1, 2 , . . . , n - p, ) + 1 , j + 2 , . . . , rt, n - p + 1 , . . . , j - 1 . 1.24. Jedynymi znanymi przykładami są: Xn = 2 i s in 7t r + 1/X n_ i , gdzie r jest wymierne, a 0 ^ r < | (w zależności od zmieniającego się r do stajemy wszystkie możliwe okresy większe od 1 ); rekurencją Gaussa o okresie 5 w ćw. 8 ; zaskakująca rekurencją H. Todda, o okresie 8 : XTL= (1 + X n_i + Xtv_ 2 )/X t l _ 3 , (zob. [261]); oraz wszystkie rekuren cje uzyskane z przedstawionych powyżej przez zastąpienie Xn przez stałą razy Xmn. Możemy założyć, że pierwszy niezerowy współczyn nik w mianowniku jest jednością i że pierwszy współczynnik nie zerowy w liczniku (o ile istnieje) ma nieujemną część rzeczywistą. Za pomocą algebry komputerowej można pokazać, że nie ma więcej rozwiązań o okresie nie przekraczającym 5, gdy k = 2. Teoria takich rekurencji została częściowo rozwinięta przez Lynessa [261, 262] oraz przez Kurshana i Gopinatha [231]. Interesującym przykładem o okresie 9 przy początkowych warto ściach rzeczywistych jest rekurencją Xn = |Xtl_i | — XTL_ 2 odkryta przez Mortona Browna [45]. Nieliniowe rekurencje dowolnej długości powyżej 4 mogą opierać się na kontynuantach [6 6 ]. 1.25. Jeśli T(k)(n) oznacza minimalną liczbę ruchów potrzebną do prze niesienia n krążków przy k pomocniczych prętach (w szczególno ści T(1 )(n) = Tn i T(2 )(n) = W n), to T ^ t ^ 1)) ^ 2 T ^ ( © ) + T (k—i ) ( i )). Nie są znane przykłady (rt, k), dla których ta nierów ność byłaby ostra. Dla małych k w stosunku do rt wzór 2 n +1 _k daje wygodne górne ograniczenie na ((£)). ) 1.26. Permutacje odpowiadające kolejności egzekucji można wyliczyć w O(rtlogn) krokach dla każdego m oraz n [209, ćw. 5.1.1-2 i 5.1.1-5]. Bjorn Poonen udowodnił, że niefławiuszowe zbiory z dokładnie 4 „złymi osobami” istnieją, jeśli rt = 0 (mod 3) oraz rt ^ 9; w rze czywistości liczba takich zbiorów jest równa co najmniej e(J) dla pewnego e > 0. Poonen odkrył też za pomocą żmudnych obliczeń, że poza tym jedyną liczbą poniżej 24 ze zbiorami nieflawiuszowymi jest rt = 20, dla której istnieje 236 takich zbiorów przy k = 14 oraz 2 przy k = 13. (Jednym z nich jest {1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,1 1 ,1 4 ,1 5 ,1 6 ,1 7 }; drugim— jego odbicie lustrzane względem 21.) W przypadku rt = 15 oraz k = 9 istnieje jedyny nieflawiuszowy zbiór, a mianowicie {3,4,5,6,8,10,11,12,13}. 2 .1 . Brak jest powszechnej zgody co do interpretacji tego zapisu. Sen sowne są trzy odpowiedzi: ( 1 ) Możemy przyjąć, że suma Xk=m jest równoważna sumie ^k, a w takim przypadku nasza suma jest równa zeru. ( 2 ) Można powiedzieć, że dana suma jest równa q4 +<l3 + c |2 + ęh H-qo» jeżeli będziemy sumowali względem ma lejących wartości k. To jednak pozostaje w sprzeczności z powszech nie przyjętą konwencją, że 5 Z£ =1 ^ = S^y n = (3) Można przyjąć, że w ogólności Hk=m ^ flk - L k < m ^ wówczas rozważana suma jest równa —q i — q2 —q3 - Konwencja ta może wy glądać dziwnie na pierwszy rzut oka, ale spełnia użyteczne prawo i L + l U + i = L L a dla wszystkich a ,b ,c . A najlepiej używać notacji tylko wtedy, gdy n — m ^ —1; wówczas obie konwencje (1) i (3) są zgodne. 2 .2 . Jest to po prostu |x|. Przy okazji: wartość ([x > 0]—[x < 0]) jest często nazywana sign(x) lub signum(x); jest ona równa + 1 , gdy x > 0 , 0 , gdy x = 0 i —1 , gdy x < 0 . 2.3. Pierwsza z sum, to oczywiście ao + ai + a 2 + a 3 + a 4 + as; druga to a 4 + ai 4 - ao + ai + a4, gdyż suma brana jest względem wartości k e {—2 , —1, 0, + 1 , + 2}. Prawo przemienności tu nie zachodzi, gdyż funkcja p(k) = k2 nie jest permutacją. Dla niektórych wartości rt (np. rt = 3) nie istnieje takie k, żeby p(k) = tl; dla innych (np. n = 4) istnieją dwie takie wartości k. 2-4. (a) L t , iL j+ i ^ = E?=i L i W , L L r , = ((tli 23 + 0-124) + a i 34) + 0-234(b) U L i L - r ; L i : ! aij]c = Z L s T . U L ł= i atjk = a i 23 + (a i2 4 + (a l 34 + 0-234)) • 2 .5 . Jest to [1 ^ j ^ rt] (n —j + 1). Pierwszy czynnik jest niezbędny, gdyż powinniśmy otrzymać O dla j < 1 lub j > u. 2.6. Ta sama zmienna ‘k’ została użyta jako indeks dwóch różnych sum, mimo że samo k jest związane z sumą wewnętrzną. Jest to częsty błąd w matematyce (i programowaniu komputerów). Wynik byłby prawidłowy, gdyby zachodziło aj = ak dla wszystkich j i k, 1 j,k ^ n . 2 .7 . m xm_1. Wariant rachunku różnicowego oparty na operatorze V za miast na A uprzywilejowałby zatem potęgi przyrastające. 2.8. O, jeśli m ^ 1; 1/|m|!, jeśli m ^ 0. 2 .9 . xTn+rt _ xm _j_ m )Tt} ęQa m oraz n całkowitych. Po podstawieniu m = —tl dostaniemy x - n = 1/(x —rt)71 = 1/(x — 1)—. 2.10. Prawą stronę można też zapisać jako EuAv + v Au. 2.11. Rozbij prawą stronę na 2 sumy i zmień k na k + 1 w drugiej z nich. 2.12. Jeśli p(k) = rt, to n + c = k + ((—1)k + 1)c, przy czym ((—1 )k + 1) jest parzyste. Zatem (—1)n+c = (—l ) k, i k = rt — (—1)lx+cc. Na odwrót, taka wartość k oznacza, że p(k) = rt. 2 .13 . Przyjmijmy R0 = a, Rn = Rn_i + (-1 )n (0 + n y + n 2b) dla n > 0. Wtedy R(n) = A (u) a + B (u)|3 + C {n )y + D(n)6. Podstawiając Rn = 1 otrzymujemy A(n) = 1. Podstawiając Rn = (—l ) n otrzy mujemy A(n) + 2B(n) = (—1)n . Podstawiając Rn = (—1)nu otrzy mujemy —B(n) + 2C(n) = (—1)nn. Podstawiając Rn = (—1)nu 2 otrzymujemy B(n) — 2C(n) + 2D (n) = (—1)nrt2. Wynika stąd, że 2D (n) = (—l ) n (rt2 + n ); szukana suma to D (u). 2 .14 . Sugerowane przedstawienie tej sumy jest prawidłowe, gdyż zachodzi k = Li<cj<ck 1 ^la 1 ^ k ^ rt. Po przesumowaniu najpierw względem k nasza podwójna suma upraszcza się do Y _ (2 n + 1 - 2 ’) = n 2 u + 1 - (2 n + 1 - 2 ). l^j^TL 2 .1 5 . W pierwszym kroku zastępujemy k ( k + 1) przez 2 ^ 1<;j<k j. W dru gim kroku zauważamy, że SPn + mn = (L k = i k) 2 + Dn. „Głęboko błędnym truizmem, powtarzanym we wszystkich podręcznikach i przez wszystkie sławy przy okazji rozmaitych wystąpień jest, że powinniśmy kultywować nawyk myślenia o tym, co robimy W istocie trzeba postępować dokładnie na odwrót. Postęp cywilizacji dokonuje się przez poszerzenie repertuaru ważnych operacji, które jesteśmy w stanie stosować bez myślenia o nich. Działanie myśli przypomina szarże kawalerii w bitwie. Ich liczba jest ściśle ograniczona; wymagają one 1 świeżych koni i powinny być dokonywane we właściwych momentach.” A.N. Whitehead [371] 2 .1 6 . x—(x —m )—= xm+n = x—(x —rt}—, na mocy ( 2 .5 2 ). 2 .1 7 . Skorzystaj z indukcji dla pokazania pierwszych dwóch równości i z równania ( 2 .5 2 ) dla pokazania trzeciej. Drugi zestaw równości wy nika z pierwszego. 2 .1 8 . Skorzystaj z tego, że (9lz)+ ^ |z|, {9\z)~ ^ |z|, (3z)+ ^ |z|, (3z)_ ^ |z| oraz |z| ^ (9ctz)+ + (£Kz)“ + (3z)+ + p z ) “ . 2 .1 9 . Przemnóż obie strony przez 2n _ 1/rt!, a następnie przyjmij, że Sn = 2nTn/rt! = Sn_i + 3 • 2 n _ 1 = 3(2n — 1) + So- Rozwiązaniem jest więc Tn = 3 •rt! + n!/2'a_1. (Jak zobaczymy to w rozdziale 4, Tn jest całkowite jedynie wtedy, gdy rt jest równe 0 lub jest potęgą 2 .) . . 2 20 Metodą zaburzania Sn + (TL+ 1 )Hn+i = Sft + f 2 .2 1 . H fc ^ + T l+ 1 . Wyciągnięcie ostatniego wyrazu przed sumę daje Sn +1 = 1 — Su ; wyciągnięcie pierwszego wyrazu daje nam Sn+l = ( - 1 ) n + 1 +l^k^n Y. (-1) n + 1 —k +1 = H ) n+1 n—k I h : = ( - 1) T l+ 1 O^k^n W związku z tym 2Sn = 1 + ( —1)n i otrzymujemy Sn = [rt parzyste]. Podobnie dostajemy n Tn+i = n + 1 —Tn = ^ ( - 1 )— k( k + 1 ) = T n + Sn> k=0 więc 2Tn = rt + 1 —Sn i ostatecznie Tn = ^ (tl + [rt nieparzyste]). W końcu to samo podejście daje nam Un +1 =(n + 1 )2 - U n = Un + 2Tn + Sn = Un + rt + [rt nieparzyste] + [rt parzyste] = Un. Un jest zatem liczbą trójkątną i(rt + 1 )rt. + Tl + 1 . 2 .22. Podwójna suma w ogólnej tożsamości Lagrange’a dwukrotnie po zwala nam zastosować sumowanie „waniliowe” względem 1 s: j .k s : n. Po rozdzieleniu dostaniemy w końcu ( £ k akAk) ( ^ k bkBk) — (L k a kBlc) (L k bkAlc). 2.23. (a) Podejście to daje 4 sumy, które upraszczają się do 2n + Hu — 2n + (Hn + — 1). (Byłoby prościej, gdyby udało się. wyrazić składniki przez 1/k + 1 / ( k + 1).) (b) Niech u(x) = 2x + 1 , a Av(x) = 1 /x (x+ 1 ) = (x—1)— ; wtedy Au(x) = 2 i v ( x ) = —(x—1)— = —1/x. Odpowiedzią jest 2HU — 2.24. Sumując przez części dostajemy ^ x ^ H x 6 x = x ^ ± iH x/( m + 1) — ^m+l /(m + I ) 2 + C; więc L o ^ k < n k~ H^ = - 1/(m + 1 ) ) / (ttl+ 1) + (m + 1)2. W naszym przypadku m = —2, więc poszukiwana suma sprowadza się do 1 — (Hn. + 1 ) /( n + 1 ). 2.25. Oto kilka podstawowych analogii: Y _ ca k = c Y _ ak kGK <- kGK ^ T (a k+ b k) = ^ a k + ^ b k kGK kGK X = kGK kGK ap<k) Yl = n kGK Y a j>k = YLYLa ^>k n je j kGK kGK Y _ Qk = J > * [kGK] 7 = ( r i ak) ( r i bk Xk G K 7 Vk G K ' kGK jG j kGK j€ j = ( n « ) ‘ Vk G K E K p(k)G K kGK 2.26. E K kGK ap(k) p (k)G K a).k = n n ^ .k jG j kGK n « * = r K €K] k kGK k : #K X 1 = #K ric = < kGK kG K p2 = (n sjj ,k<;n a i a k) (n SCj=k!;n Qi Qk) ■ Pierwszym czynnikiem 1 1 jest ( n L i a k )2i drugim: n L i a t- Zatem p = (F I L i a k)n + '2.27. A(’c£) = c-(c —x —1) — c^±V(c —x). Podstawiając c = —2 i zmniej szając x o 2 dostajemy A(—(—2)— -) = (—2 ) - /x t w związku z tym szukana suma jest równa (—2 )— — (—2 ) ^ 1 = (— 1 )nrt! — 1 . 2.28. Nie da się uzasadnić zamiany kolejności sumowania między drugim i trzecim wierszem wyprowadzenia. Składniki tych sum nie są zbieżne bezwzględnie. Wszystko poza tym jest bez zarzutu, może z wyjąt- kiem tego, że wynik sumy L k ^ i fr = j — l]lc/j powinno się raczej zapisać jako [j — 1 ^ 1 ](j — 1 )/j, a następnie od razu uprościć. 2.29. Zastosuj ułamki proste, aby uzyskać tożsamość Czynnik (—1)* sprawia, że dwie połowy każdego wyrazu kasują się ze swoimi sąsiadami. To co pozostaje, to —1/4 -f (—1)n/{S n + 4). 2.30. 21^ x 8x = j (b - — a-) = \ (b — a) (b + a — 1). Otrzymujemy więc (b — a)(b + a — 1) = 2100 = 2 2 -3-5 2 -7. Mamy jedno rozwiązanie dla każdego przedstawienia liczby 2100 jako iloczynu 2100 = x -y , gdzie x jest parzyste, a y nieparzyste. Przyj mijmy a = j \x —ul + \ i b = j [ x + y) + Liczba rozwiązań jest zatem liczbą dzielników liczby 3-5 2 -7, równa się więc 12. W ogólno ści liczbę n p Pnp możemy przedstawić na Y lv> 2^n v + ^) sposobów, gdzie iloczyny bierzemy względem wszystkich liczb pierwszych. 2 -3 1 - - l / i ) = L j > 2 1 /i(j - 1 ). W analogiczny sposób pokazujemy, że druga z sum jest równa 3/4. 2.32. Dla 2rt ^ x < 2rt+l rozważane sumy wynoszą OH------- |-n + (x —rt—1) + -----b (x—2rt) — rt(x—rt) = (x—1) + (x—3) H-------h (x—2rt+1). Podob nie, dla 2rt — 1 ^ x < 2rt obie te sumy są równe rt(x — rt). (Jeśli wybiegniemy nieco naprzód do rozdziału 3, to zobaczymy, że wzór I i( x + 1 )] (x — (x + 1 )J) obejmuje oba przypadki.) 2.33. Jeśli K jest puste, to AkeK ak = °°* Podstawowe analogie, to ^ (a ic + b ic ) = Y _ a k + Y . b !c kGK kGK <— > A m i n (a k , b k ) 2 .3 4 . Niech K+ = {k | ak ^ 0} i K = {k | < 0}. Jeśli teraz np. n jest nieparzyste, to wybieramy Fn równe Fn _ i U En , gdzie En C K_ jest wystarczająco duże, aby Zke(Fn_,nK+) a k “ L k 6 E„(_ a ic) < A _ - 2 .3 5 . Można pokazać, że suma Goldbacha może być przedstawiona jako 1 = Z Z m,n^ 2 m >2 m (m — 1 = 1 Permutacja zużywająca wyrazy jednego znaku szybciej niż drugiego może doprowadzić sumę do dowolnej zadanej wartości. Dowód: Rozpisując ciąg geometryczny dostajemy L keP iî k 1; do dowodu wystarczy więc znaleźć bijekcję między uporządkowanymi parami (m ,n ) takimi, że m,rt ^ 2 i uporządkowanymi parami (k, l), gdzie k £ P i l ^ 1, przy założeniu że m n = kl , kiedy pary odpowia dają sobie. Jeśli m i P, to przyjmijmy, że (m ,n) <— » (mn , 1); jeśli a -,b ) . natomiast m = a b e P, to przyjmijmy, że (m ,n) 2 .3 6 . (a) Na mocy definicji g(n) — g(rt — 1) = f( n ). (b) Na mocy (a), g ( g W ) - g ( g ( n - 1)) = L k f ( k ) [ 9 ( n - 1 ) < k ^ g ( n ) ] = n ( g ( n ) g(n — 1)) = n f(n ). (c) Znowu na mocy (a) mamy g(g(g(n}}) — g ( g ( g ( n - 1 ))) jest równe X . f (k) [g(g(n ~ 1 ) ) < k ^ 9 (g(n))] k = X . ’ [ j = f (k)][9 (9(n - ' I) ) < lc^ g ( g (n ))] ),k = X .) [ j = f ( k ) ] [ g ( n - 1)< K g ( n ) ] j,k = = (g (j)-g (j-i))[g (n -i)< j< g (n )] 2 1 ^ ) ) [9 ( ^ - 1 ) < K g ( n ) ] = n £ j [ g ( n - 1 ] < j < g ( n ) ] ) Colin Mallows zauważył, że ciąg Golomba może być zadany rekurencyjnie jako f(1) = 1; f(n + 1 ) = 1 + f ( n + 1 - f ( f ( u ) ) ) , d la n ^ O . 2 .3 7 . (RLG podejrzewa, że raczej nie pokryją, DEK sądzi, że raczej po kryją, OP nie włącza się w tę dyskusję.) 3 .1 - m = L lg n J ; 3 .2 . (a) |x + 0,5J. (b) r x - 0 ,5 1 . 3 .3 . Jest to [m n —{m a}n /aj = m n — 1, gdyż 0 < {ma} < 1. 3 .4 . Czasami, gdy nie jest potrzebny dowód, wystarczy tylko zgadnąć. l = n - 2 m = n - 2 L ' « uJ. Z takim samoopisem ciąg Golomba nie miałby większych szans w „Randce w ciemno”! 3.5. Wiemy, że [nxj = [n[xj +rt{x}J = n[xj + |_n{x}J z (3 .8 ) i (3 .6 ). Dla tego |_nxj = n[xJ <ś=> [n{x}J = 0 <ś=> 0 ^ rt{x} < 1 <=> {x} < 1/rt, przy założeniu, że rt jest dodatnią liczbą całkowitą. (Zauważ, że w tym przypadku dla wszystkich x mamy n[xj ^ |_nxj.) 3.6. [f(x)J = 3.7. [rt/mj + n mod m. 3.8. Jeśli wszystkie pudełka zawierają mniej niż [n /m ] przedmiotów, to n ^ ([n /m ] — l)m , zatem n / m + 1 ^ [n /m ], co przeczy wzorom (3 .5 ). Analogicznie dowodzimy drugiej nierówności. 3.9. Wiemy, że m /n — 1/q = (n antymod m )/q n . Algorytm musi się zakończyć, gdyż 0 ^ n antymod m < m. Ponieważ q n /(n antymod m) > q, to wyliczane mianowniki są różne, gdyż tworzą ciąg ściśle rosnący. 3.10. Jeśli {x} ^ j , to [x + j ] — [(2x + 1)/4 nie jest liczbą całkowitą] jest najbliższą do x liczbą całkowitą. W przeciwnym razie jest to naj bliższa liczba parzysta. (Zobacz zadanie 2 .) Stąd wzór ten daje nam metodę „zaburzonego” zaokrąglania. 3.11. Jeśli n jest liczbą całkowitą, to cc < n < (3 <=> [aj < n < [|3]. Liczb całkowitych spełniających warunek a < n a]. Dlatego możemy uzyskać złą odpowiedź, gdy oc = |3 i obie liczby są całkowite. 3 .12. Odejmijmy [n /m j od obu stron równości { 3 .6 ). Uzyskamy [(n m od m )/m ] = [(n mod m + m — 1)/m J . Ponieważ 0 ^ n mod m < m, więc obie strony są teraz równe [n mod m > 0 ]. Nieco krótszy, lecz mniej bezpośredni dowód wynika z obserwacji, że pierwszy składnik równości ( 3 .2 4 ) musi być równy ostatniemu składnikowi równości ( 3 .2 5 ). 3.13. Jeśli tworzą one podział, to z definicji N(ct,n) wynika, że 1 /a + 1 / |3 = 1 } ponieważ jeśli równanie N(<x,n) + N (|3,n) = n ma być prawdziwe dla dużych n, to współczynniki przy n po obu stronach . równania muszą być sobie równe. Zatem obie liczby oc i |3 są albo równocześnie wymierne, albo równocześnie niewymierne. Jeśli obie są niewymierne, to jak było pokazane w tekście, otrzymamy podział. Jeśli obie mogą być zapisane z licznikiem m, wartość m —1 nie pojawi się w żadnym z widm, a wartość m pojawi się w obu. (Jednakże Golomb [151] zaobserwował, że zbiory {[nctj | n ^ 1} i {[n|3] — 1 | n ^ 1} zawsze tworzą podział, gdy 1 / a + 1/(3 = 1.) 3.14. Gdy n y = O, wynika to z równości (3 .2 2 ). W przeciwnym razie wy nika z ( 3 .2 1 ) i ( 3 .6 ). 3.15. Wstaw [mx] zamiast rt we wzorze ( 3 .2 4 ): [mx] = |"x] + [x — 3.16. Sprawdź równość rt mod 3 = 1 + i ((cu — 1 )cun — (cu + 2)cu2n) dla 0^n<3. W zadaniu 7.25 można znaleźć ogólny wzór dla n mod m, gdzie m jest dowolną liczbą całkowitą. 3 -1 7 * L j )k [ ° ^ k < T n '] [ 1 + k/™J = [k ^ m(j —x )]. To wyrażenie jest równe + ^ M ] x ^ k < m] — L k [ ° ^ k < m 0 _ x )] = vn\x] - [m(|"x] - x ) ] = - \ - m x \ = |_mxj. 3.18. Wiemy, że S = L [ j c x - U k < ( j + v ) a - 1] . O^jc [net] k^n Jeżeli j ^ rux — 1 ^ noc —v, to (j + v ) a _1 ^ ri i wszystkie składniki sumy są równe zeru. Wystarczy zatem rozważyć przypadek, gdy j = |_na|, ale wtedy suma równa się |"(|naj + v ) a - 1 ] —rt ^ [va-1 ]. 3.19. Wtedy i tylko wtedy, gdy b jest liczbą całkowitą. (Jeśli b jest liczbą całkowitą, to logb x jest ciągłą i rosnącą funkcją o wartościach cał kowitych tylko w całkowitych punktach. Jeśli b nie jest liczbą cał kowitą, to dla x = b równość jest fałszywa.) 3.20. Mamy k x ^ |3 ] = x ^ k k [[a /x ] ^ k ^ |_PAJ]> co sumuje się do lx(|_|3/xj |_|3/x + 1 J — \oc/x\ \oc/x— 1 ]). 3.21. Niech 10™ ^ 2 M < 10n+1. Ponieważ tylko jedna z k-cyfrowyćh po tęg 2 zaczyna się od 1 , to dokładnie n + 1 potęg 2 zaczyna się od cyfry 1. Zatem odpowiedzią jest 1 + [M.log2J. Uwaga: Dużo trudniej jest policzyć liczbę potęg 2 zaczynających się od cyfry l, gdy l > 1: jest to Z o « ^ M (L n l ° g 2 ~ lo6 l J “ Ln l o g 2 log(l+ 1)J). 3 . 2 2 .Sumy o indeksach rt i rt—1 są identyczne, z wyjątkiem k-tego wyrazu, gdzie rt = 2 k_1 q i q jest liczbą nieparzystą. Stąd Sn = Sn_i + 1 i Tn = Tn_i + 2kq. Zatem Sn = n i = n (n + 1). 3.23* = m 2n < ^m (m — 1) < n ^ ^m (m + 1) <==> m 2 — m + \ < m2 + m + ^ 4=^ m — \ < \/2 ti < m + „Podczas próby przeprowadzenia dowodu indukcyjnego, może ci się nie powieść z dwóch przeciwstawnych powodów. Albo próbujesz dowieść za dużo: twoja teza indukcyjna P(n) jest za mocna, albo próbujesz dowieść za mało: twoje założenie indukcyjne P(rt) jest za słabe. Ogólnie musisz wypośrodkować treść twego twierdzenia tak, by założenie było wystarczająco silne do udowodnienia tezy.” G. Pólya [298] 3. 24. Niech |3 = <x/(oH-1). Wtedy liczba m pojawia się w Spec(P) dokład nie jeden raz więcej niż w Spec(ct). Dlaczego? Ponieważ N ((3,tl) = N (a ,n ) + n + 1 . 3.25. Zgodnie z rozważaniami z tekstu rozdziału, jeśli znajdziemy liczbę m spełniającą nierówność Km ^ m, to będziemy mogli zaprzeczyć nierówności dla rt + 1, gdzie rt = 2m + 1. (Także dla u = 3rrt + 1 lub rt = 3m + 2.) Istnienie takiego rrt = rt' + 1 wymaga, żeby była prawdziwa któraś z nierówności 2 K|_n //2j ^ rt' lub 3K^n // 3 j ^ rt', tzn. KLn'/2j [n'/2\ lub Aha! Schodzilibyśmy tak w dół i w dół, dochodząc w końcu do nie równości Ko ^ 0 , gdy tymczasem Ko = 1 . Tak naprawdę, to chcemy udowodnić, że dla każdego rt > 0, Kn jest ostro większe od rt. Faktycznie, tę nierówność jest łatwo udowodnić przez indukcję, choć jest ona mocniejsza od nierówności, której nie mogliśmy udowodnić w ten sposób! (To zadanie udziela nam ważnej lekcji. Więcej dowiadujemy się z niego o naturze indukcji niż o własnościach funkcji podłoga.) 3.26. Dowód indukcyjny, z silniejszą hipotezą indukcyjną ^ ~ 1 1> d la r O O . 3.27. Jeśli D i3* = 2mb —a, gdzie a równa się 0 lub 1, to 3.28. Jeśli an = m 2, to a n + 2 k + 1 = (m + k ) 2 + m - k i a n + 2 k + 2 = (m + k)2+ 2rrt, gdzie 0 ^ k m. Stąd a n + 2 m + 1 = (2rrt)2. Rozwiązanie może być zapisane w ładnej postaci znalezionej przez Carla W itty’ego: CLtl—1 — 2 l + 3.29. n -l = 3mb —a. 2 gdzie 2 l + 1 ^ rt < 2 l+ 1 + 1 + 1 . D (a ', |_artj) jest równy co najwyżej modułowi z największej wartości prawej strony równości s(ct', |n a j ,v ') = —s(a,rt,v) — S + e + {0 lub 1} + v' —{0 lub 1}. 3.30. Dowodzimy indukcyjnie, że Xn = oc2n + a 2*\ a Xri jest liczbą cał kowitą. 3.31. Oto „elegancki” i „imponujący” dowód, który nie daje żadnej wska zówki, jak został odkryty: L*J + LvJ + L * + y J = L * + L y J j + L * + y J ^ Lx + i L2yJJ + Lx + 1 L2 yJ + 2J -= [ 2x + [ 2y \ \ = [2xJ + \ 2 y \ . Istnieje również prosty, graficzny dowód oparty na obserwacji, że wy starczy tylko rozważyć przypadek 0 ^ x,tj < 1. Funkcje wyglądają tak, jak na rysunku: 1 2 0 1 Możemy udowodnić trochę silniejszą nierówność, mianowicie M + LyJ + I* + vj < [2x\+| y J . 2 Różnica zachodzi tylko dla {x} = j . Jeśli zastąpimy w tej nierówności (x,y) przez f—x, x + y) i zastosujemy wzór ( 3 .4 ), otrzymamy LyJ + L* + yJ + L2 *J < W + l2x + 2v\ ■ 3.32. Niech f(x) będzie sumą z pytania. Ponieważ f(x) = f(—x), możemy założyć, że x ^ 0. Wyrazy sumy są ograniczone przez 2k, gdy k —> — 00 i przez x 2/ 2 k, gdy k —» + 0 0 , zatem suma istnieje dla dowolnych liczb rzeczywistych-^ Mamy f(2x) = 2 £ lc2 k “ 1 \\x/2*-' ||2 = 2f(x). Niech f(x) = l(x) + r(x), gdzie l(x) jest sumą po k ^ 0 i r(x) jest sumą po k > 0. Wtedy dla wszystkich x zachodzi l(x + 1 ) = l(x) i l(x) ^ 1/2 . Gdy 0 ^ x < 1, otrzymujemy r(x) = x2/2 + x2/4 H-----= x 2 i r(x -f 1) = (x — 1)2/2 + (x + 1 )2/4 + (x + 1)2/S H-----= x 2 + 1. Zatem f (x + 1) = f (x) + 1, dla 0 ^ x < 1. Możemy teraz udowodnić przez indukcję, że jeżeli 0 ^ x < 1, to dla liczb naturalnych zachodzi f (x +mrt) = f (x) + n. W szczególności f(n) = n. Stąd f(x) = 2"mf(2mx) = 2"m |2mxJ + 2"mf({2mx}), ale f({ 2 mx}) = l({ 2 mx}) + r({ 2 mx}) ^ \ + 1 ; zatem |f (x) — x| ^ |2 _m | 2 mxJ — x| + 2 _TTL• | ^ 2 “ 171 • | dla wszystkich liczb całkowi tych m. Nieuchronnym wnioskiem jest, że dla wszystkich liczb rzeczywistych zachodzi f(x) = |x|. 3.33. Niech r = n —j będzie promieniem okręgu, (a) Pomiędzy polami sza chownicy przebiega dokładnie 2 u — 1 prostych pionowych i 2 n — 1 pro stych poziomych. Każda prosta przecina okrąg dwa razy. Ponieważ r2 nie jest liczbą całkowitą, to z twierdzenia Pitagorasa wynika, że okrąg nie przechodzi przez róg żadnego pola. Zatem okrąg przechodzi przez tyle pól, ile jest punktów przecięcia tzn. 8 n —4 = 8 r. (Jest to też wzór na liczbę pól na obwodzie szachownicy.) (b) f(rt,k) = 4 [v /r2^ -l? J . Z (a) i (b) wynika, że \ n T 2 —2r ^ l V r2 - k2J ^ \ ™ z , r = n —j. 0<k<r Problem znalezienia bardziej precyzyjnego oszacowania jest znanym problemem z teorii liczb i był rozważany przez Gaussa i wielu innych; patrz Dickson [79, tom 2 , rozdział 6 ]. 3.34. (a) Niech m = [lg n ]. By uprościć obliczenia, dodamy 2m —rt skład ników: 2 Tn f(n) + (2 m —n )m = ^ T l g k ] = k=1 = ^ k ^ 2 m] j,k j ,k m = 2j 2i_1 = 2 m( m - 1) + 1 . j= 1 Zatem f (n) = n m —2m + 1. (b) Wiemy, że [n/2] = [(n + 1)/2J. Z tego wynika, że rozwiązanie rekurencji g(n) = a ( n ) + g ( [ n / 2 ] ) + g ( [ n / 2 J) musi spełniać warunek Ag(n) = Aa(n) + A g ([n /2 J). W szczególności, gdy a(n) = n —1, to zależność Af(n) = 1 + A f([n /2J) jest spełniona przez liczbę bitów w binarnej reprezentacji liczby n tzn. [lg(n + 1)]. Teraz przejdźmy od A do Z. Bardziej bezpośrednie rozwiązanie otrzymamy z równości [lg 2j] = rigj] + 1 i [lg(2 j - 1 )] = [lgj] + [j > 1 ], gdzie j ^ 1 . 3.35. (n + 1)2 n! e = An + (n + 1) 2 + (n + 1) + Bn , gdzie _ (n + 1 )2 n! , ( n + l ) 2 n! , 0! 1! , ( n + 1 ) 2 n! + ( n - 1 )! jest wielokrotnością n, oraz _ n • - ( n + l ) 2 n! t(n + 1 )2 n! , (n + 2)! + (n + 3)! n + 1 (i 1 1 n + 2 \ ‘ ~^n + 3~*~ (n + 3)(n + 4) n + 1 / n + 2 y 1 1 n + 3 (n + 3) (n + 3) (n + 1) (n + 3) (n + 2 ) 2 = jest mniejsze niż 1. Zatem odpowiedzią jest 2 mod n. 3.36. Suma jest równa Y _ 2- l 4-m [m = Lig IJ ] [l = |_lg kj ] [1 < k < 2 2" ] k,l,m = Y . 2~l4~m [2m ^ l < 2 m+ 1 ][2l s ę k < 2 l + ,][0^ m .<n ] k )l,m = Y _ 4- m [2m ^ l < 2 m+1 ] [0 ^ m < n] l,m | = ^ 2 - m[0 ^ m < n ] = m 2 (1 - 2 ~u ). 3.37. Najpierw rozważ przypadek m < n, który rozbija się na dwa podprzypadki zależne od tego, czy m < \ n . Następnie pokaż, że gdy m rośnie o n, wówczas obie strony równości zmieniają się w ten sam sposób. 3.38. Co najwyżej jedno xk nie jest liczbą całkowitą. Pomińmy wszystkie liczby całkowite i załóżmy, że pozostało ich n. Gdy {x} ^ 0, średnia {mx} znajduje się między \ i j , gdy m —> oo. Zatem {m xi}+ ---- h{mxn}-{m x i H----- hmxu} nie może mieć średniej wartości równej zeru, gdy n > 1 . Powyższy argument opiera się na trudnym twierdzeniu o jednostaj nym rozkładzie. Można podać elementarny dowód, który naszkicu jemy tu dla n = 2. Niech Pm będzie punktem o współrzędnych ({mx},{rruj}). Podzielmy kwadrat jednostkowy 0 ^ x ,y < 1 na ob szary trójkątne A i B opisane równaniami x + y < 1 lub x + y ^ 1. Chcemy pokazać, że jeśli {x} i {y} są niezerowe, to dla pewnego m za chodzi Pm e B. Jeśli Pi G B, kończymy dowód. W przeciwnym razie istnieje koło D o promieniu e > 0 i środku w Pi takie, że D C A. Je śli N jest dostatecznie duże, to z zasady szufladkowej Dirichleta ciąg P i, . . . , Pn musi zawierać dwa takie punkty, że zachodzi |Pk~Pjl < e i k > j. Sformułowanie zadania jest mylące! Jest to zadanie rodzaju 4. Z tego wynika, że P k -j-i znajduje się w odległości od punktu (1,1) — Pi mniejszej niż e. Zatem P k -j-i € B. 3.39. Zastąp ) przez b — j i dodaj do sumy składnik j = 0. Można teraz skorzystać z zadania 15, by wysumować po j. Po zsumowaniu po k, otrzymamy Tx/bkl - rx/bk+1] + b — 1 . 3.40. segment wk Sic Hic Nic r m Niech [2^/n\ = 4k + r, gdzie —2 ^ r < 2. Podstawmy m = \y/n \. Następujące relacje mogą być udowodnione przez indukcję: X V wtedy i tylko wtedy, gdy - 2 2k—1 m (m +1 ) —n —k k (2k—1)(2k—1) ^ n ^ (2k-1)(2k) -1 2k—1 -k m (m +1) —n + k (2k—1)(2k) < n < (2k)(2k) 0 2k 'rt —m (m + 1 ) + k -k (2k)(2k)^ n^ (2k)(2k + 1) 1 2k k n —m (m + 1 ) —k (2k) (2k+1) < n < (2k+1 ) (2k+1 ) Stąd dla k ^ 1, jeśli ścieżka biegnie na zachód i y (n) = k, to W k jest segmentem długości 2k. Segment Sk ma długość 2k —2, jeśli ścieżka biegnie na południe, itd. (a) Zatem szukanym wzorem jest -y(u) = ( — 1 )m ^(n —m (m + 1 )) • [|_2 ^/nJ jest nieparzyste] — r* m l) • (b) Dla wszystkich segmentów k = m ax(|x(n)|,|‘y(n )|). W segmen tach W k i Sk mamy x < y i n + x + y = m (m + 1) = (2k) 2 —2k, w segmentach Ek i N k mamy x ^ y i n —x —y = m (m + 1 ) = (2k)2 +2k. Zatem znak jest równy (—l)W Tl)<‘y(n)]. 3.41. Ponieważ 1/c()+1 /(f >2 = 1, oba ciągi tworzą podział zbioru dodatnich liczb całkowitych. Zatem z warunku g(n) = f (f(n)) + 1 wyznaczymy jednoznacznie f i g . Potrzebujemy tylko udowodnić, że dla wszyst kich n > 0 zachodzi równość |_|_tlc|>J cj>J + 1 = |_ri4>2 J. Wynika to z zadania 3, jeżeli oc = 4> i n = 1. 3.42. Nie. Rozważania podobne do tych z zadania 13 pokazują, że podział na trzy części może zajść wtedy i tylko wtedy, gdy 1/ a + 1/(3 +1 / y = 1 i dla wszystkich rt > 0 zachodzi Ale jeśli a jest niewymierne, to wartość średnia { ( n + 1) /a } z twier dzenia o jednostajnym rozkładzie jest równa 1/2. Nie wszystkie jed nak zmienne mogą być wymierne. Jeśli y = m /n , to średnia jest I równa 3 /2 —1/ (2n). Zatem y musi być liczbą całkowitą, lecz to rów nież jest źle. (Istnieje również dowód elementarny, który nie korzysta z twierdzenia o jednostajnym rozkładzie, zobacz [155].) 3.43. Rozwinięcie rekurencji w jednym kroku dla Kn daje najmniejszą z czterech liczb 1 + a + a -b -K ^ ^ -i-a j/ia b )]) gdzie a i b są równe 2 lub 3. (Stosujemy tożsamość x + minCy, z) — min(x + y }x + z) i by usunąć nawiasy podłogi z wnętrza nawiasów podłogi korzystamy ze wzoru ( 3 . 1 1 ). Pomijamy też wyrazy z ujemnymi dolnymi indeksami, tzn. n — 1 — a < 0 .) Kontynuując to postępowanie, otrzymamy następującą interpretację: Kn jest najmniejszą liczbą większą od n w zbiorze z powtórzeniami S liczb postaci 1 + ai + ai a2+ ^ a a H------ 2 3 gdzie m ^ 0 i każda z liczb 1 a 2 a 3 ... am , równa się 2 lub 3. Stąd S = { 1 ,3 ,4 ,7 ,9 ,1 0 ,1 3 ,1 5 ,1 9 ,2 1 ,2 2 ,2 7 ,2 8 ,3 1 ,3 1 ,...}. Liczba 31 znajduje się w S „dwukrotnie,” gdyż ma dwie reprezentacje 1 + 2 + 4 + 8 + 1 6 = 1 + 3 + 9 + 18. (Nawiasem mówiąc, Michael Fredman [134] udowodnił, że lim ^ o o K^/rt = 1, tzn. zbiór S nie jest zbyt dziurawy.) 3 .4 4 . Niech d[?] = antymod (q - 1). Stąd D^q) = ( q D ^ + dl?]) / ( q - 1 ) i a iq) = [D|1q_]1/(q - 1)]. Zatem ^ (q - 1)n ^ rt, z czego wynika rozwiązanie. (Jest to rozwiązanie znale zione przez Eulera [116], który wyliczał kolejno liczby a i d. Nie wpadł na to, że wystarczy pojedynczy ciąg D ^ . ) 3 .4 5 . Niech oc > 1 spełnia warunek oc + 1/oc = 2m. Wtedy 2Yn = o/F' + oc~2n i z tego wynika, że Yn = |"o F /2 \ . 3 .4 6 . Podpowiedź wynika ze wzoru (3 .9 ), ponieważ 2n [n + 1) = [2{n + ^) 2 J. Niech n + 0 = ( \ / 2 l + \ / 2 l ] ) m i n ' + 0' = (s /2 W + v /2 l )m , gdzie 0 ^ 0 ,0 ' < 1. Wtedy 0' = 20 mod 1 = 20 — d, gdzie d równa się 0 lub 1. Chcemy udowodnić, że rt' = [\/2 (n + j ) \ . Równość ta zachodzi wtedy i tylko wtedy, gdy 0 ^ 0 ' ( 2 —V 2 ) + V5(1 - d ) < 2 . By rozwiązać rekurencję, zauważmy, że zbiory Spec(1 + 1 /^ /2 ) i Spec(1 + y/2) tworzą podział zbioru dodatnich liczb całkowitych. Zbyt łatwe. Zatem każda dodatnia liczba całkowita a może być zapisana jedno znacznie w postaci a = [( y /l + y /l )TnJ, gdzie l i m są licz bami całkowitymi) przy czym m jest nieparzyste, a l ^ 0. Stąd Ln = [ ( V 5 l+U + V 2 l + n _ , H - 3.47. (a) c = —j . (b) c jest liczbą całkowitą, (c) c = 0 . (d) c jest do wolna. Bardziej ogólne wyniki można znaleźć w odpowiedzi do za dania 1.2.4-40 w [207]. 3.48. Niech x :0 = 1 i x :^k+1^ = x [x :kJ oraz ak = {x:k} i bk = |x :kJ. Naszą tożsamość możemy teraz zapisać jako x 3 = 3x :3 + 3ai a 2 + a 3 — 3bi b 2 + b f . Ponieważ dla k ^ 0 mamy ak + bk = x :k = xbic_i, więc (1 —xz)(1 + b i z + b 2 z 2 H-----) = 1 — a-i z — a 2 z 2 ------ . Zatem 1 1 —xz 1 “l- b^ z H- b 2 z 2 ")“ ••• 1 — ai z — a 2 z 2 --* Zlogarytmujmy obie strony równości i oddzielmy liczby a od liczb b. Następnie zróżniczkujmy względem zmiennej z. Otrzymamy x 1 —xz ai + 2 a2z + 3 a 3Z2 H----1 — a-i z — a 2 z 2 ----- bi + 2 b2z + 3bsz 2 H----1 + b iz + b 2 z 2 Współczynnikiem przy zn_1 po lewej stronie jest X™, po prawej stro nie jest nim szukany wzór, który dla n = 3 zgadza się z podaną na początku zadania formułą. Możemy wyprowadzać (por. [170]) podobne równości dla ogólnych iloczynów XoXi . . . xn_ i . Oto bardziej interesujący (i ciągle nie rozwiązany) problem: Niech obie liczby oc i |3 będą mniejsze niż 1 . Kiedy z danego zbioru z powtórzeniami da się określić nieuporządkowaną parę {a, |3}? 3.49. (Rozwiązanie podane przez Heinricha Rolletschka.) Zastąpmy (oc, |3) przez ({|3},cx + [PJ)- Nie zmieniamy przy tym sumy |_naj + |_n|3 j . Zatem równość oc = {|3} jest warunkiem koniecznym. Jest też warun kiem dostatecznym: niech m = [f>J będzie najmniejszym elementem danego zbioru z powtórzeniami oraz S będzie zbiorem z powtórze niami otrzymanym z danego przez odjęcie, dla wszystkich rt, liczby m n od n-tego najmniejszego elementu. Jeśli a = {|3}, to kolejne elementy S różnią się albo o 0, albo o 2. Zatem ze zbioru z powtó rzeniami jS = Spec(oc) wyznaczymy oc. 3.50. Zgodnie z nie publikowanymi notatkami Williama A. Veecha, wy starczy, by liczby a|3, (3 i 1 były liniowo niezależne względem liczb wymiernych. 3.51. H. S. Wilf zauważył, że równanie funkcyjne f (x2 —1) = f(x ) 2 powinno wyznaczyć f (x) dla wszystkich x ^ cj>, jeśli znamy f (x) na dowolnym przedziale (cf>.. <$>+ e). 3.52. Dla liczb niew ym iernych istnieje nieskończenie wiele sposobów podziału zbioru liczb dodatnich za pomocą trzech lub więcej uogól nionych widm, na przykład Spec(2a; 0) U Spec(4a; —oc) U Spec(4ct; —3 a) U Spec(|3; 0) Powstają one przez „rozwinięcie” podstawowego podziału Spec (a) U Spec(P); por. [158]. Jedyne znane wymierne przykłady, jak: Spec(7;—3) U S p e c (|;—1) U S p e c ( |; 0 ) , opierają się na hipotezie sformułowanej w zadaniu wziętym od A. S. Fraenkela [128]. 3.53. Częściowe rezultaty były dyskutowane w [95, s. 30-31]. Zachłanny algorytm prawdopodobnie się nie zatrzyma. 4.1. 1,2, 4, 6 , 16, 12. 4.2. Zauważ, że m p + n p = min(mp ,n p) + max(mp)u p). Co prawda zachodzi rekurencją N W W (m ,n) = ( n /(n mod m ))N W W (n mod m ,m ), ale nie jest ona dobrą metodą wyliczania NWW. Najlep szą znaną metodą obliczenia N W W (m ,n ) jest podzielenie m n przez N W D (m ,n ). 4.3. Wzór ten zachodzi dla całkowitych x, ale funkcja n(x) zdefiniowana jest dla wszystkich liczb rzeczywistych x. Właściwym wzorem jest, jak łatwo sprawdzić, 7t(x) —7t(x — 1) = [|_xj jest pierwsza] . 4.4. Pomiędzy ^ a ~ mielibyśmy lustrzane odbicie drzewa Sterna-Bro cota z zanegowanymi mianownikami, itd. W rezultacie otrzymali byśmy w szystkie ułamki postaci m /n takie, że m 1 n. Warunek m /n —mn ' = 1 nadal byłby spełniony podczas konstrukcji. (Nazywa się to kolią S terna-B rocota, gdyż końcowy ułamek y możemy uznać za tożsamy z pierwszym y, zawijając drzewo na najwyższym pozio mie w coś co przypomina nieskończoną kolię. Kolia Sterna-Brocota ma interesujące zastosowania w grafice komputerowej, ponieważ re prezentuje wszystkie możliwe wymierne kierunki na płaszczyźnie. 4.5. Lk = (Jk) i Pk = ( i i ) 5 wzory te zachodzą nawet dla k < 0. (W rozdziale 6 wyprowadzimy ogólny wzór na dowolny iloczyn macierzy LiP.) 4.6. a = b. (W rozdziale 3 zdefiniowaliśmy x mod 0 = x, więc tak to powinno być.) 4.7. Aby tak było, musiałoby zachodzić m mod 10 = 0, m mod 9 = k i m mod 8 = 1. Liczba m nie może być jednak jednocześnie parzysta i nieparzysta. 4.8. I Chcielibyśmy, aby zachodziło 10x + 6y = 10x + -y (mod 15) więc 5y = 0 (mod 15); zatem y = 0 (mod 3). Musi więc być y = 0 lub 3 i x = 0 lub 1 . 4.9. 32k+1 mod 4 = 3, więc (32k+1 — 1)/2 jest nieparzyste. Zdefiniowana liczba jest podzielna przez (3 7 —1) / 2 i (3 11 —1 )/2 (i przez inne liczby także). 4.10. 999(1 - 1)(1 - 4.11. cr(O) = 1; c(1) = —1; <r(n) = 0 dla u > 1. (Uogólnione funkcje Mobiusa, które definiuje się dla dowolnych częściowo uporządkowa nych struktur mają interesujące i ważne własności, zbadane najpierw przez Weisnera [367], a następnie rozwinięte przez wielu badaczy, szczególne przez Gian-Carlo Rotę [314].) 4.12. Uwzględniając ( 4 .7 ) i ( 4 .9 ), uzyskujemy Z d\m E k \ d u(d/k) g(lc) = I k \ m l d \ ( m / k ) ^ d) 9(k) = H ic\m g(k)[tn/k = 1 ] = g(m). 4 .13. (a) u p ^ 1 dla każdego p; (b) |i(n) ^ 0. 4.14. Prawdziwe, gdy k > 0. Zastosuj równania (4 . 1 2 ), ( 4 . 1 4 ) i ( 4 . 1 5 ). 4.15. Nie, na przykład en mod 5 = [2lub 3]; en mod 11 = [2 ,3 ,7 lub 10]. 4.16. 1/ei + 1 / e 2 H 4 .17. Zachodzi f n mod f m = 2 , więc N W D (fn , f m) = N W D (2 ,fm) = 1. (Co ciekawe, relacja = fofi ...fn ,-! + 2 bardzo przypomina rekurencję definiującą liczby Euklidesa en .) 4.18. Jeśli n = qm i q jest nieparzyste, to 2™ + 1 = (2m + 1)(2TX_m — 2 n - 2 m + ------ 2 m + 1 ). 4.19. Pierwsza suma to 7t(n), poniewciż wyraz pod sumą to po prostu [k + 1 jest liczbą pierwszą]. Suma w środku to L i^ ic<m[lc\m], a więc jest większa niż 1 wtedy i tylko wtedy, gdy m jest liczbą złożoną i znów liiamy n{n). W końcu |"{m/n}] = [n\m ], więc aby uzyskać ostatnią równość, wystarczy zastosować twierdzenie Wilsona. Trzeba mieć nie wszystko po kolei, aby funkcję n (n) wyliczać za pomocą któregokolwiek z tych wzorów. 4 .20. Niech pi = 2, a p n niech będzie najmniejszą liczbą pierwszą więk szą od 2? ^ - '. Wtedy 2 P n ~ 1 < p n < 2Pn~1+1, więc wynika stąd, że 37) = 648. h 1 /e n = 1 — 1 / (en (en — 1)) = 1 — 1 /(en+i — 1). możemy przyjąć b = limn_ôo lg(Tl) p n , gdzie lg(n) jest funkcją lg iterowaną n razy. Podana wartość numeryczna pochodzi z przypadków P 2 = 5, P 3 = 37. Okazuje się, że p 4 = 2 37 + 9, co daje dokładniejszą wartość b w 1,2516475977905 (niestety nie mamy wiadomości na temat ps). 4.21. Zgodnie z postulatem Bertranda, Pn < 10n . Niech K = 10_k2Pk = 0,200300005... . k^1 Wtedy 10n2K = Pn + reszta (mod 102n_1). 4.22. (bmn —1)/(b —1) = ((bm —l ) / ( b —l))( b mTV_mH--------j-1). [Jedynymi liczbami pierwszymi postaci ( 1 0 p — l ) / 9 dla p < 20000 są te, które powstają dla p = 2, 19, 23, 317, 1031.] 4.23. p ( 2k + 1) = 0; p(2k) = p(k) + 1, dla k ^ 1. Za pomocą indukcji pokazujemy, że p(n) = p(n —2m), jeśli n > 2m i m > p(rt). Jeżeli ponumerujemy krążki od 0 do tl —1 , to w k-tym ruchu przeniesiemy krążek o numerze p(k). Jest to oczywiste dla k będącego potęgą 2, ale i w ogólnym przypadku, gdy 2m < k < 2m+1, to p(k) < Ta, ruchy zaś o numerach k i k —2 m odpowiadają sobie w sekwencjach przenoszących m + 1 krążków w Tm + 1 + Tm krokach. 4.24. Jeśli cyfra wnosi do n wartość dpm, to do ep (n!) wnosi również wartość dp m _ 1 + ••• + d = d(pm — 1 )/(p — 1 ), zatem ep (n!) — ( r t - T p ( n ) ) / ( p - 1 ). 4.25. m \\T L 4.26. Tak, ponieważ ciąg S n stanowi poddrzewo drzewa Sterna-Brocota. 4.27. Wydłuż krótszy z ciągów reprezentujących porównywane liczby za pomocą liter M. (ponieważ M. alfabetycznie leży pomiędzy L a P), aż do uzyskania jednakowej długości dwóch ciągów, a następnie użyj po rządku leksykograficznego. Górne poziomy drzewa Sterna-Brocota spełniają dla przykładu LL < LM. < LP < MM. m p = 0 lub m p = n p, dla każdej liczby pierwszej p. Wynika stąd, że (a) jest prawdziwe, (b) jednak nie zachodzi, np. dla naszego ulubionego przykładu Ta = 12, u = 18. (Jest to znana złuda.) 4.28. Do naszego celu nadaje się tylko kilkanaście początkowych symboli: P P P L L L L L L L P P P P P P 1 2 3 4 7 1 0 1 3 1 6 1 9 2 2 2 5 4 7 6 9 9 1 113 135 1 > 1 » 1 > 1 >2» 3 » 4 » 5 » 6 ’ 7 > 8 » 15 » 22 >29 » 36 ’ 43 > *** * Ułamek y znalazł się na tej liście nie dlatego, że jest lepszym przy bliżeniem 7T niż y, lecz dlatego, że jest lepszym górnym ogranicze niem niż Podobnie ^ jest lepszym ograniczeniem dolnym niż y. Wszystkie najprostsze ograniczenia górne i dolne występują, ale 22/7 jest na tyle dobrym górnym ograniczeniem, że następne, lepsze od niego, pojawi się tuż przed tym, jak ciąg 292 symboli P przestawi się znów na L. 4.29. 1/oc. Po to, żeby uzyskać 1 —x z x w notacji dwójkowej, zamieniamy zera i jedynki, natomiast w systemie Sterna-Brocota zamiana L i P oznacza otrzymanie odwrotności 1/oc z liczby oc (przypadki skoń czone oczywiście muszą być także wzięte pod uwagę, ale wszystko się zgadza, ponieważ opisana odpowiedniość zachowuje uporządkowanie liczb). 4 .30. Wszystkie m liczb całkowitych z przedziału x G [ A.. A + m) dają różne wyniki modulo m, więc ich reszty (x mod m i , . . . , x mod m r) przybierają wszystkie mi . . . m r = m możliwych wartości, z których jedna musi być równa (di mod m i , . . . , aT mod m r) na mocy zasady szufladkowej Dirichleta. 4.31. Liczba zapisana w systemie liczbowym o podstawie b jest podzielna przez d wtedy i tylko wtedy, gdy suma jej cyfr jest podzielna przez d zawsze wówczas, gdy b = 1 (mod d). Wynika to z następującego wzoru (am . . . a0)b = ambm H-------b d 0 b° = dm H-------h a 0. 4.32. Liczby {k n mod m | k l m i 0 ^ k < m}, których jest cp(m), są to liczby { k | k _ L m i 0 ^ k < m } w pewnym porządku. Przemnóż je przez siebie, a następnie podziel przez rio<k<m kim 4.33. Mamy H(1) = 1. Jeśli m _L n, to H(mn) = H d\ mn f(d )g (m n /d ) = ^-c\m,d\rL f ( c d ) g ( ( m /c ) ( n / d ) ) = £ c\m £ d\n f(c}g (m /c)f(d )g (n /d ); jest to H(m) H(n), ponieważ c _L d w każdym wyrazie sumy. 4 .34. g(m) = £ dym f (d) = Z d \ m f(™ /d) = £ < ^ 1 f (m /d ), jeśli f(x) jest zerem dla niecałkowitego x. 4.35. Przypadki bazowe, to 1 (0 , n) = 0 ; l(m , 0 ) = 1 . W przypadku gdy m, n > O, będą potrzebne dwa wzory: pierwszy z nich trywialny, gdy m > rt, a drugi trywialny dla m < n: I(m,rt) = I(m ,n mod m) — L'n/mJI(n mod m , m ) ; I(m, rt) = I ( m m o d n , n ) . 4 .36. Rozkład dowolnej z podanych wartości musiałby spełniać równanie m 2 — lOn2 = ± 2 lub ± 3 , ale jest to niemożliwe modulo 1 0 . 4 .37. Niech au = 2~n ln(en. — en = |E2" + iJ zaś bn = 2- n ln(en + j ) . Wtedy an ^ lnE < bn . Ponieważ an_i < a-^ < bn < bn_ i , więc można przyjąć, że E = limn_ôo e an. W rzeczywistości okazuje się, że Iloczyn ten szybko zbiega do (1,26408473530530111 . . . ) 2. Niestety te spostrzeżenia nie mówią nam, czemu jest równe eu , chyba że zna leźlibyśmy inne wyrażenie na E, nie zależące od liczb Euklidesa. 4 .38. Niech r = n mod m. Wtedy an — b™ = (am — bm)(aTL mb° + a n - 2 m b m _j-------+ Qr | , n - m - r j + b m | n / m J j Qr _ 4.39. ^ Jeśli ai . . . at i bi . . . bu są kwadratami liczb całkowitych, to takim kwadratem jest także liczba ci! . . . a tbi . . . b u/ c 2 . . . c l , gdzie {cii, . . . , at} fi { b i , . . . , bu} = { c i , . . . , cv}. (W rzeczywistości można pokazać, że ciąg ( S(l ), S(2), S(3), . . . , ) zawiera każdą dodat nią liczbę złożoną dokładnie raz.) 4 .40. Niech f(n) = n i ^ n , p X k k = n ! /p LTl/pJ [n /pj!, natomiast g(n) = n !/p e"(nl). Wtedy g(n) = f ( n ) f ( |n / p J ) f ( |n / p 2 J ) . . . = f ( n ) g ( | n / p j ) . Zachodzi również f(n) = ao!(p — 1)! = ao!(—1 )LnA’J (mod p) oraz ep (n!) = [n /pj + ep(|n/p_|!). Rekurencje te prowadzą do łatwego dowodu indukcyjnego. (Znanych jest parę innych rozwiązań tego zadania.) 4.41. (a) Jeśli n 2 = —1 (mod p), to (n2)(p 1 ) / 2 = —1; Fermat jednak twierdzi, że ma to być równe +1. (b) Niech n = ((p—1) / 2 ) !; zachodzi więc n = ( - I) Ip - 1) / 2 n isk < p /2 (p - k) = (p - 1 )!/n , zatem n 2 = ( p - 1 )!. 4.42. Zauważmy najpierw, że ze względu na otrzymaną z algorytmu Eu klidesa równość N W D (k ,l) = N W D ( k , l + ak), dla każdej liczby całkowitej a zachodzi k J_ l k ± l + ak. W takim razie m _L n i n ' _L rt <ś=> m n ' JL n <==> m n' + n m ' _L n . Podobnie m ' _L n ' i n J_ n ' <=> m n ' + n m ' _L n ' , i w związku z tym m _L n i m ' _L n ' i n _L n ' m n ' 4 -nm' _L n n ' . 4.43. Wyjściową macierz chcemy podzielić przez L- 1 P, następnie przez P_ 1L_ 1 PL, potem przez L_ 1 P, dalej przez P- 2 L- 1 PL2, itd.; n-ty czynnik to po prostu p - p(n)L- 1 PLp^n^, gdyż musimy skrócić p(n) macierzy P. A przy tym zachodzi p _Tni __1 PLm = (? 2 m+i)* 4.4 4 . Znajdźmy najprostszą liczbę wymierną leżącą w przedziale [0,3155. .0,3165) = [ ^ . . ^ 5) szukając liczb i w drzewie Sterna-Brocota i zatrzymując się tuż przed tym, jak pierwsza z nich będzie miała L, podczas gdy druga z nich będzie miała P. (mi ,n i ,rrt2 ,n 2 ) := (631,2000,633,2000); w h ile mi > n i or rrt2 < n2 do i f m 2 < n 2 th e n (wypisz(L); ( n i,n 2) := (ni ,n 2) — (m i, m2)) else (wypisz(P); (Tm ,m 2):= (m] ,m 2) - (ni ,n 2)). Wypisany ciąg to LLLPPPPP = ^ w 0,3158. Co ciekawe, aby uzy skać średnią równą 0,334 trzeba wykonać 287 rzutów. 4.45. x 2 = x (mod 10n ) x(x — 1) = 0 (mod 2n ) i x(x — 1) = 0 (mod 5n) x mod 2n = [Olub 1] i x mod 5n = [Olub 1]. (Ostatni krok wynika stąd, że skoro x(x — 1) mod 5 = 0, to albo x, albo x — 1 jest wielokrotnością 5, a w takim przypadku ten drugi czynnik jest względnie pierwszy z 5n i może zostać wyłączony z rozważanej kongruencji.) Mamy więc co najwyżej cztery rozwiązania, z których dwa: x = 0 i x = 1 nie mają szans na tytuł „liczby n-cyfrowej”, chyba że rt = 1 . Pozostałe dwa rozwiązania mają postać x i 10^ + 1 —x, przy czym przynajmniej jedna z liczb jest nie mniejsza niż 10n_1. W przypadku rt = 4 tym drugim rozwiązaniem jest 10001 — 9376 = 625, co z kolei nie jest liczbą czterocyfrową. Wygląda na to, że powinniśmy otrzymywać dwa n-cyfrowe rozwiązania w około 90% przypadków przy zmieniających się n, ale nie mamy dowodu na tę hipotezę. (Takie samoreprodukujące się liczby bywają nazywane „automorficznymi”.) 4.46. (a) Jeśli j'j - k'k = NWD(j,k), to n k,¥ WD(j-k) = n j,J' = 1 i rtk k = 1. (b) Niech rt = pq, gdzie p jest najmniejszym dzielnikiem pierwszym liczby n. Jeśli 2n = 1 (mod rt), to 2n = 1 (mod p). Podobnie, 2P_1 = 1 (mod p) i w związku z tym 2 NWD(p_1’TL) = 1 (mod p). Jednak, zgodnie z definicją p, zachodzi N W D ( p —1, n) = 1. 4.47. Jeśli n m _ 1 = 1 (mod m), to n J_ m. Jeśli natomiast n k = ró dla pewnego 1 ^ ) < k < m, to n k_:i = 1 , ponieważ możemy po dzielić obie strony przez n?. Dlatego jeżeli liczby rt1 mod m, . . . , n m _ 1 mod m nie są parami różne, to istnieje k < m — 1 takie, że rtk = 1. Najmniejsza z takich liczb k dzieli m — 1, zgodnie z ćwicze niem 46(a). Wtedy jednak zachodziłoby kq = (m —1)/p dla pewnej liczby pierwszej p i pewnej liczby całkowitej dodatniej q, co jest jed nak niemożliwe, gdyż n kq ^ 1. W związku z tym liczby rt1 mod m, . . . , n m - 1 mod m są różne i względnie pierwsze z m. Zatem liczby 1, . . . , m — 1 także są względnie pierwsze z m, więc m musi być liczbą pierwszą. 4.48. Parując kolejne liczby z ich odwrotnościami, możemy uprościć nasz iloczyn (mod m) do nis;n<m,n^modm=i n - Możemy teraz wykorzy stać naszą wiedzę o rozwiązaniach równania n 2 mod m = 1. Używając arytmetyki reszt dochodzimy do wniosku, że odpowiedzią jest m — 1, jeśli m = 4, p k lub 2pk (p > 2), a w przeciwnym razie odpowiedź wynosi + 1 . 4.49. (a) Albo m < n (O(N) — 1 przypadków) albo m = rt (jeden przy padek) albo m > n (znów <D(N) — 1 przypadków). Zatem R(N) = 2<D(N) — 1. (b) Zgodnie ze wzorem (4 .6 2 ) otrzymujemy 2 <D(N) - 1 = -1 + H(d) LN/ dJL1 + N/ dJ . d^l wynik ten zachodzi więc wtedy i tylko wtedy, gdy Y _ M-(d) LN/dJ = 1 , d^l dla N > 1, co stcinowi przypadek szczególny wzoru (4.61), jeśli tylko przyj miemy, że f(x) = [x ^ 1 ]. 4.50. (a) Dla dowolnej funkcji f zachodzi Z O ^kcm = Z Z f(k) [d = N W D (k,m )] d \m 0 ^ k < m Z z f(k) [k/d ± m /d] d \m O ^kcm = z z f(kd)[k_Lm/d] d\m 0^k<m/d = z z f(km /d ) [k_L d] , d\ra 0^k<d a szczególny przypadek zastosowania tego wzoru widzieliśmy przy wyprowadzaniu tożsamości (4.63). Analogiczne wyprowadzenie mo żemy przeprowadzić rozważając Yl zamiast Mamy więc zm~-\=0^k<m n u - k) = n n d\m 0^k<d k_Ld d\m ponieważ cum/d = e2m/d Część (b) wynika z części (a) ze względu na analogię do wzoru (4.56) dla iloczynów zamiast sum. Przy okazji wzór ten dowodzi, że wielo mian ^ m(z) ma współczynniki całkowite, jest on bowiem zdefinio wany za pomocą mnożenia i dzielenia wielomianów, których współ czynnik przy najwyższej potędze wynosi 1. (*i H------ l-*n)p = Z kl +...+!cn=p p !/(k 1 ! • • • kn!)*?' • • • *nn>i współczynnik ogólny jest podzielny przez p, chyba że kj = p dla pewnego j. W związku z tym (x H ------ bxn )p = x^ H\-x £ (mod p). Możemy teraz podstawić 1 w miejsce wszystkich x, otrzymując n p = n. 4.52. Gdy p > n, wówczas nie ma czego dowodzić. W przeciwnym razie x 1 p, więc xk(p- 1} = 1 (mod p). Oznacza to, że co najmniej |_(n — 1)/(p — 1)J spośród danych liczb, to wielokrotności p. Wobec tego (n - 1)/(p - 1) ^ n /p , gdyż n ^ p. - 4 .5 1 . 4.53. Zacznijmy od pokazania, że jeśli m ^ 6 i m nie jest liczbą pierwszą, to (m —2)! = 0 (mod m ). (Jeśli m = p 2, to iloczyn (m —2)! zawiera zarówno p, jak i 2 p, a w przeciwnym razie zawiera d i m /d , gdzie d < m /d .) Następnie zajmijmy się kolejno przypadkami: Przypadek 0 , rt < 5. Wzór zachodzi tylko dla rt = 1. Przypadek 1 , n ^ 5 i rt jest liczbą pierwszą. W tedy (n — 1) !/(n + 1) jest liczbą całkowitą i nie może być wielokrotnością rt. Przypadek 2 , rt ^ 5, u jest liczbą złożoną i n + 1 jest liczbą złożoną. W tedy n i rt + 1 dzielą (rt — 1)!, a zarazem rt _L n + 1, w związku z tym rt(rt + 1 ) \ ( t v — 1 )!. Przypadek 3 , rt ^ 5, rt jest liczbą złożoną i n + 1 jest liczbą pierwszą. Wtedy, zgodnie z twierdzeniem Wilsona, (n —1)! = 1 (mod n + 1) i f ( n — 1)!/(n + 1)] = ((n -1 )!+ n )/(n + 1 ); więc jest to podzielne przez rt. Ostatecznie odpowiedź jest taka: albo rt = 1, albo rt jest liczbą zło żoną różną od 4. 4.54. £2 ( 1000 !) > 500, a zarazem 6 5 (1000!) = 249, zatem 1000! — a x 10249 dla pewnej parzystej liczby a. Ponieważ 1000 = (1300)s, więc zgodnie z ćwiczeniem 40 widzimy, że a - 2 249 = 1000!/5 249 = —1 (mod 5). Podobnie, 2 249 = 2, zatem a = 2, czyli a mod 10 = 2 lub 7 i w związku z tym ostatecznie odpowiedzią jest 2 - 10 249. 4.55. Jedną z możliwości rozwiązania tego zadania jest udowodnić za po m ocą indukcji mocniejsze twierdzenie, że P 2n /P n (n + "0 j es^ liczbą całkowitą; dzięki niemu dowód indukcyjny upraszcza się. Innym spo sobem jest pokazanie, że każda liczba pierwsza dzieli licznik co naj mniej tyle razy, ile mianownik. W tym celu wystarczy pokazać, że zachodzi nierówność 2n Y_ IV H n > 4 Y . Lk/ m J ’ k=1 k=1 która wynika z |_(2 n — 1 )/m J + |_2 ri/m J ^ [r t/m j. O statnia nierówność zachodzi dla 0 ^ n < m, a obie strony zwięk szają się o 4 przy powiększaniu n o m . 4.56. Przyjmijmy, że f(m ) = m in (k ,2 n —k)[m \k], oraz g(m) = (2n—2k—1) [m \(2 k + 1)]. Liczba p dzieli licznik naszego wy rażenia f(p) + f(p 2) + f(p 3) H-----razy, a mianownik g(p) + g(p2) + „D/e ganzen Zahlen hat der Hebe Gott gemacht, alles andere ist Menschenwerk.” L. Kronecker [366] g(p3) + • • • razy. Ale f(m ) = g(m), jeśli liczba m jest nieparzysta (ćwiczenie 2.32). Rozważany iloczyn redukuje się wtedy do 2TL^n~ 1^, zgodnie z ćwiczeniem 3.22. 4.57. Wskazówka sugeruje standardową zamianę sumowania, gdyż y~ I^m ^n [d\m] = ^ [m = dk] = [ n / d j . 0 < k ^ n /d Oznaczając sumę ze wskazówki przez H(n), otrzymujemy I (m + n) — I(m ) —I (n ) = <p(d). deS(m,n) Z drugiej strony, ze wzoru ( 4 .5 4 ) wiemy, że I (n ) = ^ n ( n + 1). Zatem I (m + n) — I(m ) — I (n ) = mn. 4.58. Funkcja f (m) jest multiplikatywna, a dla m = pk jej wartość wynosi 1 + p H------- h p k. Liczba ta jest potęgą 2 wtedy i tylko wtedy, gdy p jest liczbą pierwszą Mersenne’a, a zarazem k = 1. Dzieje się tak ze względu na to, że k musi być nieparzyste i wtedy suma ta będzie równa (i + p ) 0 + p 2 + p 4 + --- + p k_')> tutaj zaś (k—1)/2 musi być nieparzyste, itd. Warunkiem koniecznym i wystarczającym jest zatem to, że m jest iloczynem różnych liczb pierwszych Mersenne’a. 4.59. Dowód wskazówki: Jeśli n = 1, to xi = oc = 2, więc nie ma problemu. Jeśli n > 1, to możemy założyć, że xi ^ xT1. Przypadek 1 : x f 1 H------- 1- x ~ ! 1 + (xn — 1) - 1 ^ 1 i xn > xn_ i . Możemy wtedy tak dobrać |3 ^ xn — 1 ^ xn_ 1 , że x ^ ] H------- 1- x “ ! 1 -f |3_1 = 1, zatem ^ (3+1 ^ en i Xt . . . xn ^ xt . . . xTV_i (p + 1 ) ^ ei . . . en , na mocy założenia indukcyjnego. Istnieje więc liczba całkowita dodatnia m taka, że oc = xi . . . xn/m , czyli a ^ ei . . . en = en+i —1 , mamy więc xi . . . xn(<x + 1) ^ ei . . . en en+i . Przypadek 2: x f 1 H------- b x “l 1 + (xn - 1) _1 ^ 1 i xn = xn_ i . Niech a = xn i a - 1 + (a — I ) - 1 = ( a —2 ) _1 +C _1 • Możemy więc pokazać, że a ^ 4 i ( a —2)(£+1) ^ a2. Istnieje zatem takie |3 ^ £, że x ^ 1 H------ hx“i 2 + ( a —2 ) _1 + |3- 1 = 1. Z założenia indukcyjnego wiemy, że xi . . . xn ^ xi . . . xrL_ 2 (a —2)(C+ l ) ^ x i . . .x u_ 2 ( a —2)(|3 + 1 ) ^ ei . . . eu , dalej wnioskujemy tak jak w przypadku 1 . Przypadek 3: x^j~1 + • • • + x “l 1 + (xn — 1) _1 < 1. Niech a = xn i niech a - 1 + ot- 1 = (a —1) _1 + |3_1. Można pokazać, że ( a—1)(P + 1) > a(<x+ 1 ), ponieważ ta nierówność jest równoważna następującej: aoc2 — a 2 a + aoc — a 2 + a + a > O, a ta z kolei jest konsekwencją aoc{oc — a) + (1 + a)oc ^ (1 + a)oc > a 2 — a. Możemy więc zastąpić xn i oc przez a — 1 i |3, powtarzając tę transformację, aż zajdzie któryś z poprzednich przypadków. Innym wnioskiem z tej wskazówki jest to, że z nierówności 1/x*\ H----- 11 /x-a < 1 wynika nierówność 1 /x i H ------- (-1 / x n ^ 1 /e i H-------hi / e n ; zob. ćwiczenie 16. 4.60. Sedno rozwiązania stanowi pokazanie, że 0 < | . W takim przypadku możemy wziąć wystarczająco dużą liczbę p i, aby zostały spełnione warunki podane poniżej, oraz liczbę pn będącą najmniejszą liczbą pierwszą większą niż p 3 . Dla tak zdefiniowanych liczb przyjmijmy a T1 = 3_TLln p n i bn = 3_ n ln(pn + 1). Gdybyśmy pokazali, że O-n-i ^ an < bu ^ bn-T, to moglibyśmy przyjąć P = lim ^ o o ea~, podobnie jak w ćwiczeniu 37. Hipoteza nasza jest teraz równoważna następującym nierównościom: p 3 _ 1 ^ p n < (pn- i + I)3- Jeśli w tych granicach nie istnieje liczba pierwsza p n , to musi istnieć liczba pierwsza p < taka>że p + cpe > (pn_i + 1)3. To jednak mu siałoby pociągać za sobą cp 0 > 3p2/3, co jest niemożliwe, gdy p jest wystarczająco duże. Prawie na pewno możemy przyjąć pi = 2, gdyż wszystko wskazuje na to, że znane ograniczenia na luki między licz bami pierwszymi są znacznie słabsze niż w rzeczywistości (zob. ćwi czenie 69). W takim razie p 2 = 11, p 3 = 1361, p 4 = 2521008887 i 1,306377883863 m '/n ' i N = ( ( n + N ) /n ') n '—n ^ n > (( n + N )/n ' —l ) n ' —n = N — n ' ^ 0 , jest więc spełniona następująca nierówność: m /n ^ m " /n" . Jeżeli równość ta nie zachodziłaby, to mielibyśmy n" = (m n' — m 'n)n" = n '(m n " — m"n) + n (m " n' — m 'n") ^ n ' + n > N — sprzeczność. Co ciekawe, z ćwiczenia tego wynika, że ( m + m " ) /( n + rt") = m '/n ', chociaż ułamek po lewej stronie nie zawsze jest w postaci uproszczonej. 4.62. 2-i + 2 - 2 + 2 - 3 - 2 " 6 - 2 - 7 + 2 - 12 + 2 - 13 - 2 ~ 20 - 2 ~ 21 + 2 ~ 30 + H-----, co można zapisać jako 2 ~ 31 —2 ~ 42 —2 - 4 3 - + 3 ^ ^2_ 4 k 2 “ 6 k _ 3 —2 - 4k2- 10k~ 7) k^ 0 Sumę tę można przedstawić w postaci zwartej za pomocą „funkcji „Człowiek stworzył liczby całkowite, wszystko poza tym—Dieudonne.” R.K. Guy theta” 0(z, A) = Y.]c e nAk2+2lzk, która nam daje odpowiedniość e <-> } + § 0 ( £ ln 2 , 3 iln 2 ) - ^ 0 ( 4 l n 2 , 5 i l n 2 ) . =.63. Każda liczba rt > 2 albo ma dzielnik pierwszy d, albo jest po dzielna przez d = 4. W każdym z tych przypadków istnienie roz wiązania o wykładniku n oznacza, że istnieje rozwiązanie równania (an/ d)d + (bTl/d)d = (cn /d )d o wykładniku d. Ponieważ dla d = 4 rozwiązań nie ma, więc d musi być liczbą pierwszą. Wskazówka wy nika z rozwinięcia dwumianu Newtona, ponieważ dla p nieparzystego zachodzi (ap + (x — a)p )/x = p a p_1 (mod x). Jeśli równanie ( 4 .4 6 ) nie jest spełnione, to najmniejszy kontrprzykład spełnia a _L x. Jeśli x nie jest podzielne przez p, to jest względnie pierwsze z cp/x , co oznacza, że dla każdej liczby pierwszej q spełniającej qe\\x i qf \\c zachodzi e = fp. W związku z tym dla pewnego m zachodzi x = mp . Z drugiej strony, jeśli x jest podzielne przez p, to cp/ x jest podzielne przez p, ale nie przez p 2, a cp nie ma innych dzielników wspólnych z x. .64. Równe ułamki w ciągu Peirce’a występują w następującym porządku: Odkryłem cudowny dowód twierdzenia Fermata, ale nie mam tu wystarczająco dużo miejsca, aby go przytoczyć. 2m 4m rm 3m m Załóżmy, że ciąg CPn jest poprawny. Chcemy pokazać, że ciąg CPn + i jest również poprawny. Oznacza to, że jeśli kN jest nieparzyste, to mamy pokazać, że natomiast gdy kN jest nieparzyste, to mamy pokazać, że W obu przypadkach warto poznać liczbę ułamków, które są ściśle mniejsze od (k — 1)/(N + 1) w ciągu P n i wynosi ona ze względu na wzór ( 3 .3 2 ), w którym d = N W D ( k - 1,N + 1). Wyrażenie to redukuje się z kolei do \(k N —d + 1), ponieważ N mod d = d —1 . Co więcej, liczba ułamków równych ułamkowi (k — 1)/(N + 1) w ciągu CPisi, które powinny go poprzedzać w ciągu Tn+i , wynosi, ze względu na specyfikę naszego porządku, \ (d — 1 — [d parzyste]). Jeśli kN jest nieparzyste, to liczba d jest parzysta i ułamek (k — 1)/(N + 1) występuje po ^(kN — 1) wyrazach ciągu jest to dokładnie tyle, aby wszystko grało. Jeśli kN jest parzyste, to d jest nieparzyste i ułamek (k —1)/ (N + 1 ) występuje po ^(kN) wyrazach ciągu Tn . W przypadku gdy d = 1, żaden z nich nie jest równy (k —1)/(N + 1) i IPn^n jest *<*; w przeciwnym razie (k —1)/(N + 1) wpada między dwa równe wyrazy i CPn,icN jest *=\ (C. S. Peirce [289] odkrył niezależnie drzewo Sterna-Brocota mniej więcej w tym samym czasie, kiedy odkrywał CPn-) 4 .6 5 . Analogiczne pytanie dla (analogicznych) liczb Fermata to znany, nie rozstrzygnięty do dziś problem. Ten może się okazać łatwiejszy albo trudniejszy. 4 .6 6 . Wiadomo, że żaden kwadrat mniejszy od 36 x 10 18 nie dzieli żad nej liczby Mersenne’a ani Fermata. Wciąż nie mamy jednak dowodu hipotezy Schinzla, że istnieje nieskończenie dużo bezkwadratowych liczb Mersenne’a. Nie wiadomo nawet, czy istnieje nieskończenie wiele takich liczb pierwszych p, że p \ \ ( a ± b ) , gdzie wszystkie dziel niki pierwsze liczb a i b nie przekraczają 31. 4 . 67. M. Szegedy pokazał, że hipoteza ta zachodzi dla wszystkich dosta tecznie dużych liczb n; zob. [349], [95, str. 78-79] i [59]. 4 .6 8 . Jest to znacznie słabsza hipoteza od tej, która jest sformułowana w następnym ćwiczeniu. 4 .6 9 . Cramer [67] pokazał, że na gruncie probabilistycznym można przyjąć tę hipotezę, a eksperymenty obliczeniowe to potwierdz

Matematyka Konkretna: Podręcznik

Related documents

Products

Support

Matematyka Konkretna: Podręcznik

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib