Uploaded by mumintrol

veroqtnosti

advertisement
ПЕТЪР КОПАНОВ
ВЕСКА НОНЧЕВА
СНЕЖАНА ХРИСТОВА
ВЕРОЯТНОСТИ
И
СТАТИСТИКА
РЪКОВОДСТВО ЗА РЕШАВАНЕ НА ЗАДАЧИ
Пловдив 2012
УНИВЕРСИТЕТСКО ИЗДАТЕЛСТВО
„ПАИСИЙ ХИЛЕНДАРСКИ“
Рецензент:
Проф. д-р Маргарита Бонева Димитрова,
ИПФ, Технически университет – София
© Петър Копанов, Веска Нончева, Снежана Христова – автори, 2012
© Университетско издателство „Паисий Хилендарски“, 2012
ISBN 978-954-423-796-7
2
ПРЕДГОВОР
В книгата са събрани 458 задачи по вероятности и по статистика. Основната цел на настоящото ръководство е да се даде възможност на студентите – бакалаври, обучавани във Факултета по математика и информатика при ПУ „П. Хилендарски“, да се запознаят с основните методи и
практическото приложение на тези два основни клона от приложната математика. Ръководството може да се използва също така от студенти –
магистри по приложна математика, както и от всички, които изучават вероятности и статистика и имат нужда от задълбочаване на знанията си в
тези области.
Практическото приложение на вероятностните и статистическите методи е представено с помощта на алгоритми, което улеснява както възприемането им, така и използването им от програмисти, информатици и специалисти в областта на компютърните и информационните технологии.
Конкретните пресмятания са направени основно със софтуерните продукти, използвани при работата със студентите във ФМИ: Mathematika
(Версия5.2), MicrosoftExcel и средата за статистически анализ на данни R
(Версия 2.11.1), което дава добра представа за връзката между приложните
математически методи и съвременните информационни технологии. С
това, от една страна се дава помагало в ръцете на студентите за семинарните упражнения и самостоятелната подготовка, а от друга се отговаря на
необходимостта от преподаване на класическите математически дисциплини, разглеждани в тази книга.
Голяма част от задачите са давани през последните 20 години на упражнения, семинари, текущи контролни, изпити и домашни работи на студентите от различните специалности на ФМИ. Включени са и задачи с повишена
трудност (заедно с решенията), които спомагат за по-задълбоченото разбиране и усвояване на материала. Групирането на задачите в 20 тематични
глави е в голяма степен условно (особено в частта СТАТИСТИКА), тъй като
много от задачите са с по няколко подусловия, отнасящи се до различни
глави. Все пак авторите са се опитали да поставят задачите в главите, които
в най-голяма степен ги покриват тематично.
В началото на всяка глава са дадени основни дефиниции и формули,
необходими за решаването на задачите от нея. В края на книгата като приложение са дадени таблици на основни вероятностни разпределения, необходими при конкретни пресмятания.
Пресмятанията в решенията на задачите от първата част на книгата са
направени с помощта на пакета Mathematika 5.2. for Students (възможно е и
използването на по-нови версии на пакета), като точността на отговорите в
десетичен вид е ограничена на 20 знака, и е напълно достатъчна за практически пресмятания. С реализирането на тези пресмятания се постига и една
от причините за написването на тази книга – да се разкрие по-добре връзката между приложните математически методи и съвременните софтуер и
хардуер.
3
За решаването на задачите от втората част (СТАТИСТИКА) са използвани програмите Microsoft Excel от пакета Microsoft Office и средата за
статистически анализ на данни R. Разбира се, за решаването им могат да
бъдат използвани и други специализирани статистически пакети (например
SPSS или Statistika). Причината за този избор е, че от една страна тези
програми са достъпни и популярни и позволяват всички необходими изчисления да бъдат извършени с тях, а от друга много от статистическите
данни, общодостъпни в Интернет, се публикуват именно във формата на
MicrosoftExcel.
септември, 2012
4
от авторите
Част първа.
ВЕРОЯТНОСТИ
1. Елементи на комбинаториката.
Основни методи за пресмятане.
Правило за събиране
Ако елементът а може да бъде избран по m начина, a елементът b по
n различни начина, изборът на „а или b“ може да се извърши по m + n
начина.
Правило за умножение
Ако елементът а може да бъде избран по m начина и при всеки избор
на а елементът b може да бъде избран по n начина, то изборът на наредената двойка (а,b) може да стане по m.n начина.
Извадка
Нека M={1,2,3,...,n}. Подмножеството {i1,i2,...,ik}, съставено от кои да е
k елемента на М ще наричаме извадка с обем k. Можем да образуваме
следните 4 различни множества от извадки с обем k:
{ненаредени извадки с обем k без повтаряне на елементи}, k=0,1,2,...,n;
{ненаредени извадки с обем k с възможно повтаряне на елементи},
k=0,1,2,..;
{наредени извадки с обем k без повтаряне на елементи}, k=0,1,2,...,n;
{наредени извадки с обем k с възможно повтаряне на елементи},
k=0,1,2,...
За всяко множество от n елемента можем да образуваме аналогични
подмножества, имащи специални имена:
Вариации
Вариации без повторение на n елемента от k-ти клас (k < n) се наричат
подмножествата от наредени извадки с обем k без повтаряне на елементи.
Пермутации
Пермутации без повторение на n елемента се наричат подмножествата
от наредени извадки с обем n без повтаряне на елементи. Пермутациите
могат да бъдат разглеждани като вариации без повторение на n елемента от
n-ти клас (k = n).
Комбинации
Комбинации без повторение на n елемента от k-ти клас (k ≤ n) се наричат подмножествата от ненаредени извадки с обем k без повтаряне на елементи.
5
Вариации с повторение
Вариации с повторение на n елемента от k-ти клас се наричат подмножествата от наредени извадки с обем k с възможно повтаряне на елементи.
Комбинации с повторение
Комбинации с повторение от n-елемента от k-ти клас се наричат n елемента от k-ти клас се наричат подмножествата от ненаредени извадки с
обем k с възможно повтаряне на елементи.
Освен тези извадки често се използва и друг вид извадки, наречени
Пермутации с повторение
Да разгледаме множеството М={a1,a2,...ak1,b1,b2,...bk2,...c1,c2,...,ckm}, където k1+k2+...+km=n. Образуваме всички пермутации на елементите на
множеството М, след което разглеждаме елементите a1,a2,...ak1като неразличими помежду си и правим същото за елементите b1,b2,...bk2,...,
c1,c2,...,ckm. Получените извадки се наричат пермутации с повторение.
Основни формули за пресмятане в комбинаториката:
факториел:
n!  1.2.3....n,
0!  1
брой на вариациите без повторение:
Vn k  n(n  1)(n  2)...(n  k  1) 
n!
(n  k )!
брой на вариациите с повторение:
~k
Vn  n k
брой на пермутациите без повторение:
Pn  n!
брой на пермутациите с повторение:
n!
Pn k1 ,k2 ,k3 ,...,km 
, k1  k2  ...  km  n
k1 ! k2 !k3 !... km !
брой на комбинациите без повторение:
Cn k 
n(n  1)(n  2)...(n  k  1)
n!

k!
k ! (n  k )!
брой на комбинациите с повторение:
(n  k  1)!
C n k  Cn k 1k 
k ! (n  1)!
Алгоритъм за решаване на комбинаторни задачи
1) определя се има ли наредба в извадката;
2) определя се има ли повторение на елементи в извадката;
3) ако извадката е наредена определя се дали в извадката участват
всички елементи на множеството;
6
4) в зависимост от отговора в 1), 2), 3) се определя видът на комбинаторната извадка (пермутация, комбинация или вариация, с повторение или без повторение);
5) в съответствие с отговора в 4) се избира формула за пресмятане;
6) в избраната формула се заместват числените стойности от условието;
7) извършват се пресмятанията.
1.1. Студентски стол предлага само комплексни менюта, съдържащи
задължително супа, основно ядене и десерт. Възможният избор е даден в
таблицата
Вид
Избор
Супа
Пилешка супа или таратор
Основно ядене
Печено пиле или кюфтета
Десерт
Паста или баклава
а) Колко различни комплексни менюта могат да се предложат?
б) Ако студент иска непременно в менюто му да има баклава, то измежду колко възможни менюта той може да избира?
в) Ако студент иска непременно в менюто му да има печено пиле, то
измежду колко възможни менюта той може да избира?
г) Ако студент иска непременно в менюто му да има и печено пиле и
баклава, то измежду колко възможни менюта той може да избира?
1.2. Аранжьор на витрина разполага с три манекена и с пет различни рокли, от които само една е черна. По колко различни начина може да изложи
роклите на витрината (местоположението на роклите на витрината е без значение)? А ако черната рокля трябва задължително да е на витрината?
1.3. За ръководството на Факултетния съвет са предложени трима членове. От тях трябва да се избере декан и заместник декан. По колко
различни начина може да стане това?
1.4. Разглеждаме множеството на четирицифрените цели числа, които
могат да се запишат с помощта на цифрите от 1 до 9, без цифрите да се
повтарят.
а) определете броя на тези числа;
б) определете броя на числата, за които цифрата на хилядите е 1;
в) определете броя на числата, за които цифрата на единиците е 3, а
цифрата на хилядите е 7;
г) определете броя на числата, които съдържат в десетичния си запис
последователно една до друга цифрите 6 и 7 и то в посочения ред.
1.5. Телефонен номер може да започва с коя да е от цифрите 0, 1, 2, 3, …,
9. Да се пресметне броят на шестцифрените телефонни номера, на които всички цифри са различни.Да се пресметне броят на шестцифрените телефонни
номера, на които номерът започва с 26.
7
1.6. Шест двойки приятели решават да се снимат. Те застават в две редици по 6 човека.
а) По колко различни начина могат да се подредят?
б) По колко различни начина могат да се подредят за снимката, ако отпред са момичетата, а отзад – момчетата?
в) По колко различни начина могат да се подредят за снимката, ако
пред всяко момче е неговата приятелка?
1.7. Иванчо има една банкнота по два лева, една бакнота по пет лева,
една банкнота по десет лева и една банкнота по 20 лева. Той решава да
даде някаква сума на своята по-малка сестричка. По колко различни начина може да го направи?
1.8. В магазин има 5 различни стоки, а пред него чакат за покупка 10
човека. По колко начина 5 от тях могат да купят петте стоки?
1.9. При регистриране за достъп в определена страница, трябва да си
изберем парола, която се състои само от буквите А, Б, В, Г, Д, Е, като всяка
буква се използва не повече от един път и дължината на паролата е от 2 до
6 символа.
а) Колко са различните възможни пароли?
б) Колко различни пароли, започващи с буквата А могат да се напишат?
в) Колко различни пароли, започващи с буквата А и завършващи с буквата Б могат да се напишат?
1.10. Четири символен код се състои от цифрите 1, 2, 3, 4, 5 като всяка
от тях се използва не повече от един път?
а) Колко са всички възможни кодове?
б) Колко са всички възможни кодове, формиращи четно число?
1.11. Номерът на кредитна карта представлява 16 цифрено цяло число
и дата, състояща се от ден и месец, представени като двуцифрени числа.
Да се пресметне броят на възможните номера на кредитни карти.
1.12. В азбуката на Морз всеки символ се представя като редица от
точки и тирета (къси и дълги сигнали). Колко сигнала могат да се кодират
с азбуката на Морз, ако могат да се използват до 7 точки и тирета?
1.13. По колко начина 5 човека могат да се запишат в списък? А 15 човека? A100 човека?
1.14. Десет души се нареждат в редица. Колко са подрежданията, при
които 3 фиксирани човека се намират един до друг?
1.15. Колко различни изхода има при хвърлянето на 2 зара, ако:
а) заровете са различими;
б) заровете са неразличими;
в) различаваме изходите според сумата от падналите се точки?
1.16. По колко начина могат да бъдат раздадени картите в игра на белот (32 карти се раздават на 4 партньора по 8)? А на бридж (52 карти се
раздават на 4 партньора по 13)?
8
1.17. Дядо купува 9 различни играчки за внучетата си Асен, Борис, Васил и Георги. По колко различни начина той може да даде 3 играчки на
едно от внучетата си, а останалите три да получат по две играчки?
1.18. По колко различни начина група от 6 момичета и 3 момчета може
да бъде разпределена в 3 групи по трима, така че във всяка тройка да има
по едно момче? Редът на групите и подреждането във всяка от тях не е от
значение.
1.19. Мария има 4 книги по математика, 5 книги по биология и 6 книги
по физика. Тя ги подрежда по случаен начин в библиотеката на един рафт.
По колко различни начина може тя да ги подреди? По колко различни начина може тя да ги подреди библиотеката на един рафт, ако в началото са
книгите по математика, след това по биология и накрая по физика? Колко
са тези начини, ако подредбата на книгите във всяка от трите групи няма
значение.
1.20. В зеленчуков магазин има ябълки, круши и още 5 други вида плодове. Петър решава да купи за децата си по един килограм от два различни
вида плода, които избира по случаен начин. По колко различни начина
може да го направи?
1.21. По колко начина може да се попълни един фиш от тотото в игрите
„6 от 49“, „6 от 42“ и „5 от 35“?
1.22. По колко начина могат да се изтеглят 5 карти от пълен комплект
от 52 карти при раздаване на покер?
1.23. От колода, състояща се от 36 карти произволно се изтеглят 3 карти.
а) По колко начина може да се направи това?
б) По колко начина могат да се изтеглят 3 карти, една от които е „дама“?
в) По колко начина могат да се изтеглят 3 карти с поне една „дама“ между тях?
г) По колко начина могат да се изтеглят 3 карти с най-много една „дама“ между тях?
1.24. Колко диагонала има правилен шестоъгълник? А десетоъгълник?
1.25. Колко най много триъгълника могат да се начертаят с върхове дадени 9 точки?
1.26. Ани, Борис и 6 техни приятели отиват в сладкарница, където масите са кръгли. По колко различни начина могат да седнат, ако Ани сяда
срещу Борис?
1.27. Колко са плочките в малък комплект домино? А в голям?
1.28. По колко начина колода от 32 карти може да се раздели на две
равни на брой части? А на четири равни части?
1.29. По колко начина колода от 32 карти може да се раздели на две
равни части, като във всяка една от двете части броят на черните карти е
равен на броя на червените? А на четири части при същите условия?
9
1.30. По колко начина 18топчета с различен цвят могат да се поставят в
две кутии с равен брой топчета във всяка? А в три кутии при същите условия?
1.31. а) Нека функцията F(x, y, z) e 10 пъти непрекъснато диференцируема. Колко различни частни производни от осми ред притежава?
б) Нека функцията f е функция на m аргумента, която е n пъти непрекъснато диференцируема. Колко са различните частни производни на f от
ред n?
1.32. На танцова забава идват m момичета и n момчета. По колко начина могат да се образуват k танцови двойки? (k≤min [m, n])
1.33. Разпределят се n червени и k сини топки в m различни кутии, като
всяка кутия побира най-много 1 топка и n+k≤m. На колко е равен броят на
различните разпределения, ако: а) топките са неразличими.; б) топките са
различими?
Приложение във физиката
Всяко тяло представлява съвкупност или още ансамбъл от голям брой
микрочастици.Всички частици принадлежат на един от двата големи класа
– фермиони и бозони. Фермионите са частици с полуцял спин –
 1 2  ,  3 2  ,  5 2  и т. н. Такива са електроните, протоните,
неутроните, ядрата с нечетен брой нуклони и др. Бозоните пък са частици с
цял спин – 0 ,  , 2  и т. н. Такива са фотоните, ядрата с четен брой нуклони и др. Основната разлика между тези частици е в тяхната „общителност“
– фермионите се подчиняват на т. н. „принцип на Паули“ според който в
една система не може да има две частици в едно и също енергетично състояние. Бозоните са много по-„общителни“ и съвсем спокойно съществуват по няколко на едно енергетично ниво.
За да изявят индивидуалността си частиците трябва да се срещат, т. е.
да се оказват в близки или дори еднакви енергетични нива. Ако имаме N
частици и K достъпни за тях нива важно се оказва отношението N K . Възможни са два случая: N K  1 и N K  1 . В първия случай на една частица
се падат толкова много свободни нива, че срещите между частиците са
пренебрежимо редки. Такъв ансамбъл се нарича неизроден и се подчинява
на класическата статистика на Максуел-Болцман. Такива са всички обекти
от класическата физика при които енергията е разпределена практически
непрекъснато и K   . Във втория случай ансамблите се наричат изродени. Такива са само квантовите обекти (и то не винаги), тъй като при тях
енергията се разпределя дискретно и K е крайно число. Тук вече се проявяват „индивидуалните“ свойства на фермионите и бозоните и съответно се
налага употребата на различни статистически модели. Моделът на ФермиДирак (от името Ферми – фермиони) предполага най-много по една частица на ниво, а този на Бозе-Айнщайн (Бозе – бозони) – произволен брой
частици на всяко енергетично ниво. Ако се намали броят на частиците N
10
или се увеличи броя на състоянията K (например чрез нагряване) изроденият ансамбъл може да премине в неизроден и така статистиката на Максуел-Болцман може да се разглежда като обща граница на Ферми-Дираковата и Бозе-Айнщайновата при N K  0 .
1.34. Да се намери броят на възможните начини за разпределение на
k електрона с еднакви енергии в n енергетични нива, ако във всяко енергетично ниво може да се намира най-много един електрон.
1.35. Да се намери броят на възможните начини за разпределение на
k електрона с еднакви енергии в n енергетични нива, ако във всяко енергетично ниво могат да попаднат произволен брой електрони.
1.36. Да се намери броят на възможните начини за разпределение на
k електрона с различни енергии в n енергетични нива като броят на електроните, които могат да попаднат в едно енергетично ниво е произволен.
11
2. Основни понятия в теорията на вероятностите.
Алгебра на събитията.
Елементарно събитие= {всеки изход на даден вероятностен опит}
Пространство от елементарни събития Ω={съвкупност от всички елементарни събития}
Събитие={Всяка съвкупност от елементарни събития (всяко подмножество на Ω)}
Един изход a е благоприятен за събитието А, ако е елемент на А, a  A.
Достоверното събитие Ω={състои се от всички елементарни събития}
Невъзможното събитие ={няма благоприятни изходи (празното
множество)}
Събитието Ac се нарича допълнение на събитието А, ако се състои от
всички изходи на пространството Ω, които не принадлежат на А
Сумата А+В (A или B) е събитие, което се състои от всички изходи,
които принадлежат или на A,или на B, или и на двете
Произведението А.В (A и B) е събитие, което се състои от всички изходи, които принадлежа както на A така и на B
Събитието А влече събитието В (AB), ако всички изходи на А принадлежат и на В
Монета се хвърля веднъж. Опишете множеството от елементарни изходи Ω.
2.1. Монета се хвърля 3 пъти. Опишете множеството от елементарни
събития Ω.
Отговор: Ω={EEE, EET, ETE, ETT, TEE, TET, TTE, TTT}
2.2. Монета се хвърля, докато се падне ези. Опишете множеството от
елементарни събития Ω.
Отговор: Ω={E, TE, TTE, TTTE, TTTTE, …}
2.3. Зар се хвърля веднъж. Опишете множеството от елементарни събития Ω.
Отговор: Ω={1, 2, 3, 4, 5, 6}
2.4. Зар се хвърля 3 пъти. Опишете множеството от елементарни събития Ω.
Отговор:Ω={(111), (112), (121), (211), (113), …, (666)}, |Ω|=63=216
2.5. Зар се хвърля, докато се падне 6. Опишете множеството от елементарни събития Ω.
2.6. Проверете верността на следните тъждества:
A+A=A, A.A=A, A+¢=A, A. ¢=¢, A+Ω= Ω, A. Ω=A
A+Ac= Ω, A.Ac=¢, ¢c= Ω, Ωc=¢
(¢ – невъзможното събитие, Ω – достоверното събитие)
2.7. Докажете, че ако А  В, то са верни тъждествата A.B = A, A+B=B.
Докажете, че ако е изпълнено кое да е от тези тъждества, то А  В.
12
2.8. Докажете,че за всеки 2 случайни събития А и В са в сила законите
на де Морган:
(А+В)c=Ac.Bc, (A.B)c=Ac+Bc.
2.9. Докажете,че за всеки 3 случайни събития А, В и С са в сила тъждествата
A.B+C=(A+C).(B+C), A-B = A.Bc, (A+B)–B = A–A.B=A.Bc=A–B.
2.10. Нека А и В са 2 събития. Покажете че събитието А+В може да се
разложи на сума от несъвместими събития по следните начини:
A+B=A+(B–A.B), A+B = A.B+A.Bc+Ac.B, A+B=A+B.Ac.
2.11. Покажете, че ако A  B, то Bc  Ac.
2.12. Нека А, В и С са три различни събития. Използвайки и трите събития А, В, С и действията между събитията: допълнение (c), обединение
(+) и сечение (.), напишете израз за събитието, при което
а) настъпва само А
б) настъпват двете събития А,В, но не настъпва С
в) настъпва поне едно от събитията А, В, С
г) настъпват поне две от събитията А, В, С.
д) настъпват всичките събития А, В, С.
е) никое от събитията А, В, С не настъпват
ж) настъпва най-много едно от събитията А, В, С
з) настъпват най-много две от събитията А, В, С
и) настъпват точно две от събитията А, В, С
к) настъпват най-много три от събитията А, В, С
13
3. Класическа вероятност. Свойства. Основни формули за
вероятност. Формули за сума на две и повече събития.
Най-простият модел на вероятностно пространство Ω е т.нар. класическа схема или схема на урните. При него пространството Ω представлява крайно множество от равновероятни изходи:
Ω={ω1, ω2,..., ωn}, P(ω1)=P(ω2)=....P(ωn)= .
Поради крайността на Ω алгебрата от събития F съвпада с множеството
от всички подмножества на Ω. Следователно всяко подмножество А  Ω е
наблюдаемо в такъв опит и неговата вероятност се дефинира с формулата
на класическата вероятност:
P(A)= | A | = k ,
||
n
където к=|A|={брой на благоприятните изходи за събитието А}, а
n=||= брой на всички възможни изходи}
От дефиницията на класическата вероятност следват следните
свойства:
1) 0≤P(A)≤1
2) P(Ω)=1
3) Ако А влече В (A⊆ ), то Р(А)≤Р(В);
4) За всяко събитие А е в сила формулата за вероятност на допълнението
P ( A C )  1  P ( A)
5) За всеки две събития А и В е в сила формулата за събиране на вероятностите
P ( A  B)  P ( A)  P ( B )  P( AB ),
Последното свойство се обобщава за произволен брой случайни събития A1, A2,..., An, n>1:
n
P( A1  A2  ...  An )   Р( Ак ) 
к 1
n
n
 P( A A )  
к , j 1
k j
k
j
к , j , i 1
k  j i
P( Ak Aj Ai )  ....  (1)n 1 P( A1 A2 ... An )
Алгоритъм за пресмятане на класическа вероятност
1) определя се видът на комбинаторната схема, определена от опита.
Най-често трябва да се определи дали има наредба в изходите или не
(вариации или комбинации) и дали има повторение в изходите или не;
2) прилага се Алгоритъм за решаване на комбинаторни задачи от
параграф 1 за пространството Ω;
3) прилага се Алгоритъм за решаване на комбинаторни задачи от
параграф 1 за зададеното случайно събитие A;
4) стойността, получена в 3) се дели на стойността получена в 2.
14
3.1. Каква е вероятността при хвърляне на зар да падне четно число? А
просто число?
3.2. Монета се хвърля 3 пъти. Каква е вероятността броят на езитата да
e повече от броя на турите?
3.3. Зар се хвърля веднъж. Каква е вероятността на следните събития:
A={паднало е четно число}, B={паднало е просто число}, C={паднало
е число кратно на 3}, D={паднала е 6}
3.4. Зар се хвърля два пъти. Каква е вероятността на следните събития:
А ={падат се 2 шестици}, B={падат се четни числа}, C={падат се прости числа}, D={падат се четно и нечетно число}, E={пада се чифт},
F={сумата от точките е четно число}.
3.5. Каква е вероятността броят на падналите ези да е равен на половината от общия брой хвърляния на правилна монета, ако броят на хвърлянията е:
a) 10 пъти; б) 100 пъти; в) 1000 пъти; г) 10 000 пъти?
3.6. Каква е вероятността броят на падналите шестици да е точно една
шеста от общия брой хвърляния на правилен зар, ако зарът е бил хвърлен:
А) 6 пъти; В) 60 пъти; С) 600 пъти; D) 6000 пъти?
3.7. В кутия има М бели и N-M черни топки. От кутията се вадят без
връщане n<N топки. Каква е вероятността точно m от изтеглените топки да
са бели?
3.8. В играта „6 от 49“ каква е вероятността за тройка, четворка, петица
и шестица?
3.9. В игра на покер каква е вероятността за различните фигури (2, 3, 2
двойки, фул, каре, кента и т.н.)?
3.10. От пълен малък комплект домино (28 плочки) се избират случайно 7 плочки. Намерете вероятността поне върху една от изтеглените плочки да има 6.
3.11. Група от n човека сядат по случаен нaчин на n стола, наредени в
редица. Намерете вероятността двама предварително избрани човека да
седнат един до друг.
3.12. Група от n човека сядат по случаен нaчин на n стола, наредени
около кръгла маса. Намерете вероятността двама предварително избрани
човека да седнат един до друг.
3.13. Група от 12 души, между които са Иван и Петър, се нареждат
случайно на опашка в стола. Каква е вероятността между Иван и Петър да
се окажат точно 5 човека?
3.14. 10 души, между които Иван и Петър, се настаняват в хотел в 2
триместни и един четириместен апартамент по случаен начин. Каква е
вероятността Иван и Петър да попаднат в четириместния апартамент? А в
един и същи апартамент?
15
3.15. 7 ябълки, 3 портокала и 5 лимона се поставят в 3 пакета, така че
във всеки пакет има по 5 плода. Намерете вероятността на събитията:
А={във всеки пакет има по един портокал}, В={всички лимони са в
един пакет}
3.16. N еднакви молива се чупят на по 2 части – къса и дълга. След това
получените 2. N части се обединяват в N двойки по случаен начин. Намерете вероятността на събитията:
А={двойките са обединени по първоначалния начин}, B={във всяка от
двойките има по едно дълго и по едно късо парче}
3.17. (Парадокс на де Мере) Хвърлят се 3 зара. Каква е вероятността
сумата от точките да е 11? А 12?
3.18. n топки по случаен начин се поставят в n кутии. Намерете вероятността на събитията A={във всяка кутия има по една топка}, B={всички
топки са в една кутия}, C={има точно една празна кутия}
3.19. На автомобилен паркинг има 12 места, разположени в редица. На
паркинга има 8 автомобила, а свободните 4 места са едно до друго. Каква е
вероятността това да е станало случайно?
3.20. В кутия има 90 изправни и 10 дефектни детайла. От кутията се
вземат 10 детайла. Каква е вероятността всичките избрани детайли да са
изправни?
3.21. Покажете, че е по-вероятно да се падне поне една единица при 4
хвърляния на зар, отколкото да се падне поне един чифт единици при 24
хвърляния на 2 зара.
Забележка. Според някои твърдения задачата е възникнала при игра на
зарове в игрална зала и де Мере я е предложил на Паскал. В действителност задачата е поставена от Джеронимо Кардано.
3.22. Дадени са пет отсечки с дължини съответно 1, 3, 5, 7 и 9 единици.
Каква е вероятността случайно взети три от тях да могат да бъдат страни
на триъгълник?
3.23. Хвърлят се n зара. Да cе пресметне вероятността сумата от падналите се точки да бъде не по-малка от 6n–1.
3.24. От числата 1, 2, …, n се избират случайно две числа. Каква е вероятността едното от тях да бъде строго по-малко, а другото – по-голямо
от дадено число k, където 1<k<n?
3.25. Числата 1, 2, 3, 4, 5 са написани на 5 картички. Случайно се избират една след друга 3 картички и изтеглените цифри се разполагат една до
друга в реда на изтеглянето. Да се пресметне вероятността полученото
трицифрено число да бъде четно.
3.26. Хвърлят се 2 зара. Да се пресметне вероятността произведението
от броя на падналите се точки да е четно число.
3.27. Случайно избрана плочка от домино (малък комплект от 28 плочки) съдържа различни числа на двете си половинки. Да се пресметне веро-
16
ятността при случаен избор на плочка от останалите тя да съдържа поне
едно от числата на първата плочка.
3.28. Каква е вероятността в случайно взета пермутация от n елемента 2
дадени елемента да не са един до друг?
3.29. По случаен начин m „нули“ и n „единици“ се подреждат в редица.
Каква е вероятността редицата да започва с k „нули“ и да завършва с
s „единици“ (k≤m, s≤n)?
3.30. Секретна ключалка съдържа на обща ос S диска, всеки от които е
разделен на М сектора с различни букви, нанесени в тях. Ключалката се
отваря само когато всеки диск заеме определено положение спрямо тялото
на ключалката. Да се пресметне вероятността за отваряне на ключалката
при поставяне на произволна комбинация от букви.
3.31. Върху 6 картончета са написани буквите Л, И, Т, Е, Р, А. Избират
се 4 картончета и се слагат едно до друго. Каква е вероятността да се получи думата ТИРЕ?
3.32. От урна, която съдържа топки с номера 1, 2,..., N, вадим n пъти по
една топка. Да се пресметне вероятността номерата на извадените топки,
записани по реда на изваждането, да образуват растяща редица, ако след
всяко изваждане извадената топка:
а) се връща в урната преди следващото изваждане;
б) не се връща в урната.
3.33. Десет книги се поставят случайно на един рафт. Да се пресметне
вероятността: а) 3 предварително набелязани книги да се окажат една до
друга; б) k предварително набелязани книги да се окажат една до друга,
2≤k≤10.
3.34. N книги се поставят случайно на един рафт. Да се пресметне вероятността k предварително набелязани книги да се окажат една до друга,
2≤k≤N.
3.35. Да се пресметне вероятността номерът на случайно избрана банкнота да не съдържа еднакви цифри, ако този номер може да бъде кое да е
седемцифрено число, започвайки от 0000001.
3.36. Девет пътника по случаен начин се качват в 3 вагона. Да се пресметне вероятността:
а) във всеки вагон да се качат по 3 пътници;
б) в един вагон да се качат 4, в друг – 3 и в третия – 2 пътници.
3.37. Хвърлят се n зара. Да се пресметне вероятността да се паднат n1
единици, n2 двойки,..., n6 шестици, като n1+n2+…+n6=n.
3.38. Вероятността рожденият ден на един човек да е през определен
месец на годината ще считаме еднаква за всички 12 месеца. При това условие да се пресметне вероятността: а) в дадена компания от 12 души всички
12 рождени дни да са в различни месеци; б) в дадена компания от 6 души
всички рождени дни да са само в някои 2 месеца.
17
3.39. На колко е равен най-малкият брой хора, избрани по случаен начин, за да може с вероятност, не по-малка от 1/2 да се твърди че рождените
дни на поне двама от тях съвпадат. (Годините на раждане могат да са различни. Предполага се, че 29 февруари, не може да бъде рожден ден, а останалите 365 дни се разглеждат като равновероятнн рождени дни.)
3.40. Група от n човека се нарежда в редица по случаен начин. Да се
пресметне вероятността между две предварително избрани лица А и B, да
има точно s души, (s≤n-2).
3.41. Група от 2*n+1 човека сядат около кръгла маса по случаен начин.
Да се пресметне вероятността между две предварително избрани лица А и
B, да има точно s души, (s≤n).
3.42. На всяка от n пейки по случаен начин сядат по m лицa. Да се
пресметне вероятността 2 дадени лица да седнат еднo до друго.
3.43. В зала с n+k места по случаен начин сядат n души. Да се пресметне вероятността да бъдат заети предварително определена m места, m≤n.
3.44. Да се определи вероятността контролният номер на първата
срещната лека кола:
а) да не съдържа еднакви цифри;
б) да има една двойка еднакви цифри;
в) Да има 3 еднакви цифри;
г) да има 2 двойки еднакви цифри;
д) да има една и съща сума от първите 2 и от последните 2 цифри;
е) да се състои от 4 еднакви цифри.
Приемаме, че номерата са четирицифрени от 0000 до 9999 и не се повтарят
3.45. Множеството 1, 2,..., 4N по случаен начин се разделя на две групи
с равен брой числа. Да се пресметне вероятността:
а) във всяка група да има по равен брой четни и нечетни числа;
б) всички числа, кратни на N, да попаднат в една група;
в) числата, кратни на N, да се разпределят по равно в двете групи.
3.46. Да се пресметне вероятността последните две цифри на куба на
случайно избрано цяло число N да са единици.
3.47. Хвърлят се 10 различими зара. Каква е вероятността да се паднат
по равен брой „единици“ и „шестици“?
3.48. Компания се състои от 5 мъже и 10 жени. Да се намери вероятността при случайното им групиране в 5 групи по трима души, във всяка
група да има мъж.
3.49. Хвърлят се 3 различими правилни зара. Какви е вероятността на,
събитието A={сумата и произведението на падналите се числа са равни
помежду си}?
3.50. От урна, съдържаща 10 бели, 7 зелени и 6 червени топки, се изважда 1 топка. Каква е вероятността извадената топка да е: а) бяла; б) зелена; в) червена?
18
3.51. Урна съдържа 8 бели и 4 черни топки. Изваждат се едновременно
2 топки. Кое е по-вероятно: двете топки да са бели или двете топки да са с
различен цвят?
3.52. От урна, съдържаща, 12 бели и 8 черни топки, се изваждат едновременно 2 топки. Да се намери вероятността на събитията: A={и двете да
са бели}; B={и двете да са черни}; C={двете топки да са с различен цвят}.
3.53. От урна, съдържаща, M бели и N черни топки, се изваждат едновременно 2 топки. Да се намери вероятността на събитията: A={и двете да
са бели}; B={и двете да са черни}; C={ двете топки да са с различен цвят}.
3.54. В една урна има 2.M бели и 2.N черни топки. Изваждат се едновременно M+N топки. Каква е вероятността в урната да са останали M бели
и N черни топки?
3.55. При регистриране за достъп в определена страница в Интернет се
избира парола, която задължително се състои от 5 различни символа: първите два – цифри, останалите три – букви, като се използват задължително
само цифрите 2, 3, 4 и само буквите B, C, D, K и F.
а) Колко различни пароли съществуват?
б) Каква е вероятността, ако изберем по случаен начин една парола измежду описаните, тя да започва с цифрата 2 и да завършва с буквата C?
в) Каква е вероятността, ако изберем по случаен начин една парола измежду описаните по-горе, тя да не съдържа буквата В?
г) Каква е вероятността, ако изберем по случаен начин една парола измежду описаните, тя да започва с четна цифра?
3.56. При регистриране за достъп в определена страница в Интернет
трябва да си изберем парола, която задължително се състои от 4 различни
символа и е позволено да се използват само буквите А, В, С, D, F и К.
а) Колко различни пароли съществуват?
б) Каква е вероятността, ако си изберем по случаен начин една парола
измежду описаните, тя да започва с буквата А?
в) Каква е вероятността, ако си изберем по случаен начин една парола
измежду описаните, тя да започва с буквата А и да завършва с буквата К?
г) Каква е вероятността, ако си изберем по случаен начин една парола
измежду описаните, тя да е с различни букви?
д) Каква е вероятността, ако си изберем по случаен начин една парола
измежду описаните, тя да не съдържа буквата К?
е) Каква е вероятността, ако си изберем по случаен начин една парола
измежду описаните, тя да съдържа буквата А?
3.57. В студентски клуб по Информатика има 5 второкурсника, 6 третокурсника и 7 четвъртокурсника. За участие в предстоящ семинар се избират по случаен начин 5 от тях.
а) По колко различни начина може да се избере групата за семинара?
б) Каква е вероятността да са избрани студенти само от 4 курс?
в) Каква е вероятността да е избран само един второкурсник?
19
г) Каква е вероятността да са избрани 3 второкурсника и по един от
другите курсове?
д) Каква е вероятността да е избран поне един от втори курс?
3.58. В студентския съвет на факултета са избрани 3 първокурсника,
5 второкурсника и 7 третокурсника. От този състав случайно се избират
5 студента за представители на общоуниверстетско събрание.
а) По колко различни начина може да се избере групата за семинара?
б) Каква е вероятността да са избрани студенти само от 3-ти курс?
в) Каква е вероятността сред избраните няма второкурсници?
г) Каква е вероятността да са избрани 1 първокурсник, 1 второкурсник
и трима третокурсника?
д) Каква е вероятността да е избран поне един от четвърти курс?
3.59. В кутия има 8 листчета с написани числата 3, 4, 5, 6, 7, 8, 9 и 10 на
тях. Със затворени очи избираме две листчета едновременно.
а) Каква е вероятността и на двете листчета да има четно число?
б) Каква е вероятността сумата от числата на двете листчета да е поголяма от 15?
в) Каква е вероятността числата на двете листчета да са равни?
г) Каква е вероятността числото на едното листче да е два пъти поголямо от числото на другото?
д) Каква е вероятността поне едно от числата на двете листчета да е
четно число?
е) Независими ли са двете събития
А={числата на двете листчета са равни помежду си};
В={сумата от числата на двете листчета е по-голяма от 18}?
Обосновете отговора си.
3.60. На стените на кубче са написани числата 5, 6, 7, 8, 9, 10. Кубчето
се подхвърля последователно два пъти на масата.
а) Каква е вероятността на горната стена и двата пъти да има четно
число?
б) Каква е вероятността сумата от числата на горната стена да е поголяма от 15?
в) Каква е вероятността на при първото подхвърляне на горната стена
да има число по-голямо от числото на горната стена при второто подхвърляне?
г) Каква е вероятността на горната стена и двата пъти да има едно и
също число?
д) Каква е вероятността поне един път на горната стена да се показва
четно число?
е) Независими ли са двете събития
А={числата на горната стена при двете хвърляния са равни помежду си};
В={сумата от числата при двете хвърляния е по-голяма от 18}?
Обосновете отговора си.
20
4. Геометрична вероятност.
Да разгледаме частния случай, когато пространството Ω е безкрайно,
т. е. Ω се състои от безброй много елементарни събития и на Ω може да се
съпостави взаимно еднозначно геометричен обект Λ, а на събитието А –
геометричен обект Ψ (Ψ  Ω). В този случай дефинираме вероятност, която
се нарича геометрична вероятност на А с равенството
мярката на 
P ( A) 
мярката на 
Пояснение: в по-простите случаи ако Λ е подмножество на правата
мярката ще бъде дължина, ако е подмножество на равнината мярката
ще бъде лице, ако е подмножество на пространството мярката ще бъде
обем. Разбира се възможни са и по-сложни примери, например Λ да бъде
окръжност и тогава мярката също ще бъде дължина.
Алгоритъм за пресмятане на геометрична вероятност
1) определя се броят на независимите параметри и съответно размерността на пространството Ω;
2) построява се геометричен модел Λ, съответстващ взаимно еднозначно на Ω;
3) намира се геометричният модел Ψ, съответстващ взаимно еднозначно на събитието А като подмножество на Ω;
4) намират се мерките (дължини, лица, обеми)на Λ и Ψ;
5) пресмята се вероятността Р(А) като отношение на тези мерки.
Важно: моделът Λ на пространството Ω в стъпка 2) на алгоритъма
често не е единствен – задача 4.2. показва че той зависи съществено от
начина на параметризиране на Ω! Задача 4.5. пък показва важността на
взаимната еднозначност и точността на формулировките, от които
зависи дори броят на независимите параметри в стъпка 1).
4.1. (Задача за срещата) Двама души уговарят среща пред киното
между 19 и 20 часа, при следното условие: всеки, изчаква другия не повече
от 15 минути. Ако другият не дойде до 15-тата минута или стане 20 часа,
чакащият влиза в киното. Каква е вероятността двамата да се срещнат пред
киното?
4.2. Върху отсечка се избират случайно 2 точки, които я разделят на 3
части. Каква е вероятността да може да се построи триъгълник със страни
тези 3 части?
4.3. Върху единична отсечка се избират случайно 2 точки, които я разделят на 3 части. Каква е вероятността всяка от трите части да има дължина поне s, s  (1, 1/3)?
4.4. Върху единична отсечка се избират случайно n-1 точки, които я
разделят на n части. Каква е вероятността всяка от тези части да има дължина поне s, s  (1, 1/n)?
21
4.5. (Парадокс на хордата, парадокс на Бертран) В кръг с радиус 1 се
прекарва по случаен начин хорда. Намерете вероятността дължината на
хордата да е поне 3 ?
4.6. Избират се 3 случайни отсечки с дължини в интервала (0, s). Каква
е вероятността сумата от дължините им да е по-голяма от s?
4.7. В равнината е прекарана квадратна мрежа с помощта на 2 семейства успоредни линии. Оценете размера s на квадратчетата от мрежата, ако
при многократно хвърляне на монета с диаметър d в 40% от случаите тя не
пресича нито една линия от мрежата.
4.8. В интервала [-1, 2] се избират случайно 2 числа. Каква е вероятността сумата им да е по-голяма от 1, а произведението им да е по-малко от 1?
4.9.Дадени са 2 концентрични окръжности с радиуси R и r, R>r. Върху
голямата окръжност случайно се избират 2 точки А и В. Каква е вероятността хордата АВ да не пресече малката окръжност?
4.10. (Задача на Бюфон за иглата) В равнината са прекарани успоредни прави на разстояние 2.а. Върху равнината се хвърля случайно игла с
дължина 2.s, s<a. Каква е вероятността иглата да пресече някоя от успоредните прави?
4.11. Върху отсечката АВ се избират по случаен начин 3 точки. Да се
намери вероятността да може да се построи триъгълник със страни, чиито
дължини са равни на разстоянията от А до избраните точки?
4.12. Каква е вероятността корените на квадратното уравнение
х2+2ах+b=0 да са реални, ако стойностите на коефициентите са равновероятни в правоъгълника -k≤a≤k, -m≤b≤m?
4.13. В равнината са прекарани 2 снопа успоредни прави, крито я разделят на правоъгълници със страни а и b (a≤b). Върху равнината случайно
се хвърля монета с диаметър 2r<а. Да се намери вероятността монетата да
не пресича нито една от правите.
4.14. Върху паркет, образуван от еднакви равностранни триъгълници
със страна а, се хвърля монета с радиус r (r<а 3 ) Да се намери вероят6
ността монетата да не пресича контура на нито един от триъгълниците.
4.15. От отсечка с дължина 1 случайно е избрана точка, която я разделя
на 2 части. Каква е вероятността от получените 2 части и отсечка с дължина 1/2 да може да се построи триъгълник?
4.16. От отсечката АВ случайно са избрани две точки С и D. Да се намери вероятността C да е по-близо до D, отколкото до А.
4.17. Върху окръжност случайно са избрани 3 точки А, В и С. Каква е
вероятността триъгълникът ABC да е остроъгълен?
4.18. (Задача на Лаплас за иглата) Равнината е покрита с правоъгълници със страни а и b. Върху нея се хвърля случайно игла с дължина s,
22
s<min (a, b). Да се намери вероятността иглата да не пресече нито една
страна на правоъгълник.
4.19. (Задача на звездната астрономия) В сфера с радиус R случайно
и независимо една от друга са разположени N точки. Да се намери вероятността разстоянието от центъра на сферата до най-близката точка да е не
по-малко от a, където 0<a<R. Каква е границата, на тази вероятност при
R→∞ и N/R3→4π.s/3?
4.20. В кръг е вписан квадрат. Да се намери вероятността на събитията:
A={случайно хвърлена точка в кръга да се окаже вътре в квадрата};
B={от 5 точки, случайно хвърлени в кръга, 1 да се окаже в квадрата и
по 1 във всеки от четирите сегмента}
4.21. Върху кълбо е нанесена географска координатна мрежа. Кълбото
се хвърля върху равнина. Да се намери вероятността на събитията:
А={точката на първия допир на кълбото с равнината да се намира между 0° и 90° източна дължина};
B={точката на първия допир на кълбото с равнината да се намира между 45° и 90° северна ширина};
C={точката на първия допир на кълбото с равнината да се намира в
общата част на областите от A и B}
23
5. Условна вероятност. Формула за умножение на вероятности.
Независимост на случайни събития.
P ( AB )
, P ( AB )  P( A | B ) P( B ),
P( B)
събития са независими, ако
P( A | B) 
Две
P ( A B)  P ( A)
или
ако
P( AB)  P( A) P( B).
Група от N събития A1, A2, …, AN са независими в съвкупност ако за
всяка комбинация от индекси е изпълнено:
P ( Ai Ak )  P ( Ai ) P( Ak )
P ( Ai Ak Aj )  P( Ai ) P ( Ak ) P ( Aj )
....................................................
P ( A1 A2 ... AN )  P ( A1 ) P ( A2 )...P( AN )
5.1. Хвърлят се 2 правилни монети. Разглеждаме събитията
Г1 ={първата монета пада ези}, Г2 ={втората монета пада ези},
А1 ={на първото хвърляне пада ези}, А2 ={на второто хвърляне пада ези}.
Намерете вероятността на събитията
Г1, Г2, Г1.Г2, Г1|Г2, Г2|Г1, Г1 + Г2,А1, А2, А1.А2, А1| А2, А2| А1, А1 + А2,
Независими ли са събитията А1, А2, Г1, Г2?
5.2. (Пример на Бернщайн) Стените на правилен тетраедър са боядисани по следния начин: една стена е бяла, една е зелена, една е червена, а
четвъртата е боядисана в бяло, зелено и червено. Пирамидата се хвърля и
пада на едната си стена. Разглеждаме събитията
А={върху стената, на която е паднала пирамидата, има бял цвят};
B={върху стената, на която е паднала пирамидата, има зелен цвят};
C={върху стената, на която е паднала пирамидата, има червен цвят}.
Независими ли са събитията А и В, В и С, А и С? Независими ли са събитията А, В и С в съвкупност?
5.3. Събитията А и В са с положителни вероятности. Докажете че
а) ако А и В са несъвместими, то те не са независими;
б) ако А и Б са независими, то те не са несъвместими.
5.4. В една урна има а бели и b черни топки. От урната се вадят последователно без връщане 2 топки. Какви са възможните изходи и каква е
вероятността на всеки от тях? А ако са извадени 3 топки?
5.5. В кутия има 10 бели и10 черни топчета. Иванчо вади по едно топче
и ако то е бяло, го връща в кутията, като добавя и още едно бяло.
а) Каква е вероятността при 2 такива опита, Иванчо да извади две черни топчета?
б) Каква е вероятността при 3 такива опита, Иванчо да извади едва третия път черно топче?
24
5.6. При определена игра на карти на един играч му се дават 8 карти
измежду колода от 52 карти. Ако поне три от тях са купи, то каква е вероятността всички избрани карти да са купи?
5.7. Избираме случайно число измежду всички естествени числа до 100
включително. Разглеждаме събитията
А={избраното число се дели на 2}; В={избраното число се дели на 3};
С={избраното число се дели на 5}.
Коя от следните двойки събития (А, В), (А, С) и (В, С) са независими?
А ако изборът на числото е от множеството на естествените числа до 300
включително?
5.8. Вашият приятел си избира по случаен начин две карти измежду
колода от 52 карти. Намерете вероятността да е извадил два попа, ако той
отговаря положително на зададения от вас въпрос, който е
а) Вярно ли е, че една от избраните карти е поп или пика?
б) Вярно ли е, че първата избрана карта е поп?
в) Вярно ли е, че втората избрана карта е поп?
5.9. Измежду всички семейства с по три деца е избрано по случаен начин едно и се оказва, че в това семейство има момче. Каква е вероятността
това момче да има
а) по-голям брат и по-голяма сестра?
б) по-голям брат?
в) брат и сестра?
Забележка: в тази и следващата задача се приема, че вероятността случайно избрано дете да е момче или момиче е 0.5.
5.10. В детската стая в апартамента на едно семейство живеят заедно
две деца.
а) Ако по-голямото е момче, то каква е вероятността по-малкото да е
момиче?
б) Ако поне едно от децата е момче, то каква е вероятността да има
момиче?
5.11. Кутия съдържа 5 червени и 8 бели топчета.
а) Едно по едно са извадени 4 топчета без връщане. Каква е вероятността всичките извадени топчета да са червени?
б) Без връщане едно по едно се вадят топчета, докато се извадят 4 червени. Намерете вероятността да са извадени общо 4топчета.
5.12. Две зарчета се подхвърлят едновременно, при което се оказва, че
сумата от падналите се точки се дели на 3.
а) Каква е вероятността поне на единия зар да има 3 точки?
б) Каква е вероятността само на един от зар да има 3 точки?
в) Каква е вероятността на двата зара да има различен брой точки?
5.13. В кутия има 5 бели и 5 черни топчета. По случаен начин се вадят
едно след друго без връщане две топчета.
а) Каква е вероятността и двете извадени топчета да са бели?
25
б) Ако първото извадено топче е бяло, то каква е вероятността и второто да е бяло?
Как се променят отговорите на горните въпроси, ако вадим топчетата с
връщане?
5.14. При игра на бридж всеки играч има по 13 карти. Ако един играч
няма поп, то
а) каква е вероятността неговият партньор да няма поп?
б) каква е вероятността неговият партньор да има поне 2 попа?
5.15. При определена игра на карти на един играч се дават 5 карти измежду колода от 52 карти. Ако поне три от тях са купи, то каква е вероятността всички избрани карти да са купи?
5.16. В кутия има 5 бели и 5 черни топчета. По случаен начин се вадят
едно след друго без връщане 4 топчета. Каква е вероятността първите две
извадени топчета да са бели, а последните две извадени да са черни?
5.17. Хвърлят се 2 зара. Каква е вероятността да се паднат две „тройки“, ако сумата от падналите се точки е кратна на 3?
5.18.Хвърлят се 3 зара. Каква е вероятността поне на един от тях да се
падне числото 3, ако сумата от трите числа е равна на 10?
5.19. Вероятността да се изработи първокачествен детайл на един струг
е 0.7. При изработването на същия детайл на друг струг тази вероятност е
0.8. На първия струг са изработени 2 детайла, а на втория 3. Каква е вероятността всички детайли да бъдат първокачествени?
5.20. Вероятността даден стрелец да улучи една мишена е 2/3. Ако улучи мишената при първия изстрел, той получава право на втори, изстрел по
втора мишена. Вероятността за улучване и на двете мишени при два изстрела е 0,5. Да се пресметне вероятността за улучване на втората мишена,
ако стрелецът е получил право на втори изстрел.
5.21. С помощта на 6 картички, на които е написана по 1 буква, е образувана думата „карета“. Картичките се разбъркват и след това се изваждат
случайно една след друга. Каква е вероятността в реда на изваждането на
картичките да се получи думата „ракета“?
5.22. Двете страни на единия от 3 жетона са бели, на другия са черни, а
третият жетон има една бяла и една черна страна. По случаен начин се
избира един жетон и се хвърля върху маса. Ако горната страна на падналия
жетон е бяла, каква е вероятността другата му страна, която не се вижда,
също да е бяла?
5.23. В урна има 2 топки – бяла и черна. Изваждаме по 1 топка, докато
се появи черна топка, като при изваждане на бяла топка тя се връща в урната исе добавят още 2 бели топки. Да се пресметне вероятността при първите 50 опита да не бъде извадена черна топка.
26
5.24. В урна има N топки с номера от 1 до N. Топките се изваждат случайно една по една без връщане. Каква е вероятността при първите K изваждания номерата на топките да съвпадат с номерата на изважданията?
5.25. Върху N картончета са написани имената на N момчета, а върху
други M картончета – имената на M момичета (N≤M). Картончетата се, слагат в кутия и добре се разбъркват, след което N пъти последователно се изваждат по 2 от тях, без да се връщат обратно в кутията. Каква е вероятността
всеки път да бъдат изваждани двойки картончета „момиче – момче“?
5.26. Абонат е забравил последната цифра на телефонен номер и я набира случайно:
а) Да се пресметне вероятността, че ще му се наложи да звъни на не
повече от 3 места;
б) Как се изменя тази вероятност, ако е известно, че последната цифра
е нечетна?
5.27. Вероятността за настъпване на събитието А поне веднъж при извършването на 4 независими опита е ½. Да се пресметне вероятността за
сбъдване на А при извършването на 1 опит, ако тя е една и съща във всички опити.
5.28. Вероятността за излизане от строя на k-тия блок на дадена машина за време Т е равна на рk(k=1, 2,..., n). Да се пресметне вероятността за
излизане от строя през посочения интервал от време поне на един от n-те
блока на машината, ако работата на всички блокове е взаимно независима.
5.29. При всеки опит едно събитие настъпва с вероятност р. Опитите се
провеждат последователно до настъпване на събитието. Да се пресметне
вероятността събитието да настъпи точно на (k+1)-вия опит, k=0, 1, 2,….
5.30. Прекъсване на електрическа верига може да стане поради излизане от строя на елемента К1 или и на двата елемента К2 и К3. Трите елемента
излизат от строя независимо един от друг съответно с вероятности 0.3, 0.2
и 0.15. Да се пресметне вероятността за прекъсване на веригата.
5.31. С какъв минимален брой случайно избрани хора трябва последователно да разговаряте, за да бъде по-голяма от 1/2 вероятността, че рожденият, ден на поне един от тях съвпада с вашия рожден ден? (Предполага,
че годината на раждане не е от значение, 29 февруари не е рожден ден, а
всичките останали 365 дни са равновероятни рождени дни.)
5.32. Колко пъти трябва да се хвърли зар, за да бъде вероятността за
падане на поне една шестица по-голяма от: а) 0,5; б) 0,8; в) 0,9?
5.33.Колко пъти трябва да се хвърлят два зара, за да може с вероятност
по-голяма от 1/2, да се очаква поне веднъж сумата от точките да е равна на
12 (задача на дьо Мере)?
5.34. Хвърлят се 2 зара. Дефинираме събитията:
A={нa първия зар се падане четно число},
B={на втория зар се пада нечетно число},
C={сумата от падналите се точки е нечетна}.
27
Независими ли са тези събития две по две? Независими ли са A, B и C
в съвкупност?
5.35. От колода, съдържаща 32 карти, случайно се изтегля карта. Разглеждаме събитията A={изтеглената карта е пика}, B={изтеглената карта е
поп}. Независими ли са тези събития? Какъв е отговорът, ако колодата
съдържа 52 карти?
5.36. Върху N картончета са записани N различни реални числа. Картончетата се слагат в кутия, добре се разбъркват и се изваждат едно след
друго без да се връщат. Нека Аk={k-тото извадено число е по-голямо от
предишните}. Да се покаже, че P(Ak)= 1 , k=l,..., N.
k
5.37. Правилна монета се хвърля последователно 3 пъти, Дефинираме
събитията А={при първото хвърляне се пада ези}, В=(падат поне 2 езита
при трите опита} и С={един и същ резултат при трите хвърляния}. Разглеждаме двойките А и В, А и С, В и С. Да се провери дали във всеки от
тези три случая събитията са независими.
5.38. От колода с 32 карти последователно без връщане са изтеглени 3
карти. Да се определят вероятностите на събитията:
A={измежду тях да има 2 дами};
B={всички да са от една боя, например 3 кари, 3 купи и т. н.};
C={първата изтеглена карта да е била купа, ако е известно, че втората е
купа}.
5.39. Конспект по „Вероятности и статистика“ съдържа 17 въпроса от
раздел „Вероятности“ и 9 въпроса от раздел „Статистика“. Студент се явява на изпита, като е научил само 12 от въпросите от раздел „Вероятности“
и 5 от въпросите от раздел „Статистика“.
а) Ако студентът тегли по един въпрос от двата раздела, да се определи
вероятността на събитията:
А={ сред падналите му се въпроси да няма въпрос, който да не е учен};
B={сред падналите му се въпроси да има поне един въпрос, който да не
е учен}.
б) Ако студентът тегли 3 случайни въпроса от конспекта (без да се разделя на „Вероятности“ и „Статистика“), да се определи вероятността на
събитията:
C={сред избраните въпроси няма въпрос, който да не е учен};
D={ сред избраните въпроси има поне 2 научени}.
5.40. На продавач на лотарийни билети са му останали само 10 билета,
от които 2 печеливши. Един клиент купува 2 билета и след него друг клиент купува още един билет. Да се определи вероятността на събитията:
A={билетът, купен от втория клиент, е печеливш};
B={и двата билета, купени от първия клиент са печеливши, ако е известно, че билетът на втория клиент е непечеливш}.
28
5.41. В склад има 2 каси с бутилки бира, като касите съдържат съответно:
I каса: общо 9 бутилки, от които 1 с изтекъл срок на годност;
II каса: общо 12 бутилки, от които 3 с изтекъл срок на годност.
а) Ако се вземе по 1 бутилка от всяка каса, да се определи вероятността
на събитията:
A={сред взетите бутилки да няма с изтекъл срок на годност}; и
B={сред взетите бутилки да има точно1 с изтекъл срок на годност}.
б) Ако се вземат 5 бутилки от I каса, да се определи вероятността на
събитията:
C={сред взетите бутилки да има точно 1 с изтекъл срок на годност}; и
D={сред взетите бутилки да има поне 2 с изтекъл срок на годност}.
в) Ако в I каса се добави още една бутилка, за която не се знае дали е с
изтекъл срок, и след това се избере по случаен начин една бутилка от тази
каса, то да се определи вероятността тази бутилка да не е с изтекъл срок на
годност.
5.42. В кутия има 3 ментови бонбона, 2 шоколадови, един дъвчещ и един
обикновен бонбон, които са с една и съща форма и в еднотипна опаковка.
Въпросите а) – г) са свързани с опита: Избира се един бонбон, запомня
се вида му и се връща обратно в кутията, после се избира още един.
а) Опишете пространството от елементарните изходи. Колко на брой са
елементарните събития?
б) Каква е вероятността да са избрани два ментови бонбона?
в) Каква е вероятността вторият избран бонбон да е ментов, ако първият
не е ментов?
г) Каква е вероятността да е избран поне един път ментов бонбон?
Въпросите д) – з) са свързани с опита: Избира се един бонбон, изяжда
се веднага и после се взема втори.
д) Опишете пространството от елементарните изходи. Колко на брой са
елементарните събития?
е) Каква е вероятността да са избрани два ментови бонбона?
ж) Каква е вероятността вторият избран бонбон да е ментов, ако първият
не е ментов?
з) Каква е вероятността да е избран поне един път ментов бонбон?
5.43. В трети курс информатика има 3 групи:
• в първа група има 15 момичета и 5 момчета
• във втора група има 5 момичета и 10 момчета
• в трета група има 10 момичета и 15 момчета
Въпросите а) – д) са свързани с опита: По случаен начин е избран един
третокурсник.
а) Каква е вероятността избраният студент да е от втора група?
б) Каква е вероятността избраният студент да е момиче от втора група?
в) Каква е вероятността избраният студент да е момиче?
г) Каква е вероятността студентът да е от втора група, ако този студент е
момиче?
29
д) Независими ли са събитията А={избраният студент е момиче}; и
Б А={избраният студент е от трета група}? Докажи отговора си.
Въпросите е) – з) са свързани с опита: По случаен начин са избрани
двама третокурсника, като на първия се дава награда от 20 лв., а на втория
– от 15 лв.
е) Каква е вероятността двамата избрани студенти да са момичета?
ж) Каква е вероятността вторият избран студент да е момиче, ако първият е момче?
з) Каква е вероятността поне един от избраните студенти да е момиче?
30
6. Формула за пълната вероятност. Формула на Бейс.
Нека събитията A1, A2, …, An образуват пълна група от събития.
n
Формулата за пълна вероятност: P ( B )   P ( B | Ak ) P( Ak )
k 1
Формула на Бейс: P( A j | B) 
P( B | Aj ) P ( Aj )
n
 P( B | A ) P( A )
k 1
k
k
Алгоритъм за пресмятане на вероятност по формулата за пълната вероятност
1) описва се пълната група от събития и се определя броят n и видът
на събитията, които я формират;
2) прилага се формулата за пълната вероятност и се разписват формулите, участващи в сумата;
Алгоритъм за пресмятане на вероятност по формулата на Бейс
1) описва се пълната група от събития и се определя броя n и видът
на събитията, които я формират;
2) пресмята се вероятността в знаменателя по Формулата за пълната вероятност (виж Алгоритъм за пресмятане на вероятност по
формулата за пълната вероятност до стъпка 4);
3) пресмятат се вероятностите в числителя за конкретния индекс,
взет от формулата за пълната вероятност;
4) извършва се делението във формулата на Бейс.
6.1. В 2 урни има съответно: а бели и b черни топки в първата и с бели
и d черни топки във втората. От първата урна вадим случайна топка и я
преместваме във втората урна. След това от втората урна вадим случайна
топка. Каква е вероятността извадената топка да е бяла?
6.2. В 2 урни има съответно: а бели и b черни топки в първата и с бели и
d черни топки във втората. От първата урна вадим случайно 3 топки и ги преместваме във втората урна. След това от втората урна вадим случайно 3 топки.
Каква е вероятността измежду извадените топки да има 1 бяла? А 2 бели?
6.3. Дадена марка телевизори се произвеждат в 3 завода. В първия 2%
от телевизорите имат скрит дефект, във втория 1% от телевизорите имат
скрит дефект, а в третия 3% от телевизорите имат скрит дефект. Магазин е
зареден със 100 телевизора от първия завод, 200 телевизора от втория завод и 300 телевизора от третия завод. Каква е вероятността ако си купим
телевизор от този магазин, той да се окаже изправен? Ако купеният от нас
телевизор се е оказал изправен, каква е вероятността той да е бил произведен в първия завод? А ако се е оказал с дефект, каква е вероятността да е
бил произведен в 3 завод?
6.4. Тест се състои от въпроси с по 4 отговора за всеки от тях (само
един от отговорите е верен). Студент или знае отговора на въпроса или го
31
избира случайно. Ако студентът знае верните отговори на 2/3 от въпросите
на теста, то каква е вероятността вярно маркиран от този студент отговор
да не е избран по случаен начин?
6.5. Как може 10 бели и 10 сини топчета да се поставят в две кутии, така че ако се избере случайно кутия и се извади от нея топче, вероятността
то да е бяло, да е възможно най голямата? Колко е тази вероятност?
6.6. В две кутии има съответно: 6 бели и 4черни топки в първата и 3
бели и 7 черни топки във втората. От първата кутия вадим случайна топка
и я преместваме във втората. След това от втората кутия вадим случайна
топка.
а) Ако извадената топка от първата кутия е бяла, то да се намери вероятността от втората кутия да е извадена също бяла топка.
б) Да се намери вероятността извадената топка от втората кутия да е
бяла.
в) Ако извадената топка от втората кутия се оказва бяла, то каква е вероятността от първата кутия да е била извадена също бяла топка.
6.7. В две урни има бели, зелени и червени топки. В едната им 5 бели,
11 червени и 8 зелени топки, а в другата – 10 бели, 8 червени и 6 зелени
топки. От двете урни по случаен начин се изважда по 1 топка. Каква е вероятността двете извадени топки да бъдат от един и същ цвят?
6.8. Вероятността даден спортист да подобри предишния си резултат
при 1 опит е равна на р. Да се пресметне вероятността спортистът да подобри резултата си, ако му се разрешава да направи: а) 2 опита, б) 3 опита.
6.9. Всяка от N урни съдържа по m бели и n черни топки. От първата
урна случайно се избира 1 топка и се прехвърля във втората урна. След
това от втората урна случайно се избира 1 топка и се прехвърля в третата и
т. н. Каква е вероятността от последната урна да бъде извадена бяла топка?
6.10. В урна има N еднакви топки с номера от 1 до N. Топките се изваждат по една без връщане. Да се пресметне вероятността поне при 1 изваждане номерът на топката да съвпадне с номера на опита.
6.11. Във влак, композиран от n вагона, се качват k пътници (n≤k), които си избират вагон по случаен начин. Да се пресметне вероятността във
всеки вагон да се качи поне по един пътник.
6.12. (Задача за четиримата лъжци) Играчът А получава информация, която се изразява с „да“ или „не“, и я съобщава на играча В. По същия
начин В предава информацията на С, а С я предава на D, който обявява
получената информация. Всеки от четиримата играчи казва истината в
1 случай от 3. Каква е вероятността А да е казал истината, ако е известно,
че D е обявил верен резултат?
6.13. Всяка от N+1 урни съдържа по N топки. Урната с номер k: съдържа k бели и N-k черни топки, k=0, 1,..., N. От случайно избрана урна n пъти
се вади с връщане случайно избрана топка. Каква е вероятността всички
извадени топки да са бели?
32
6.14. В един факултет има n студента, от които nk (k=1, 2, 3) учат в k-ти
курс. Единият от двама случайно избрани курсисти се оказва в по-горен
курс от другия. Каква е вероятността този в по-горния курс да учи в трети
курс?
6.15. Всички изделия в едната от две партиди са доброкачествени, а в
другата 1/4 от изделията са бракувани. Изделие, взето от случайно избрана
партида, се оказва доброкачествено. Да се пресметне вероятността второто
случайно избрано изделие от същата партида да се окаже бракувано, ако
след проверката на първото изделие то е било върнато обратно в своята
партида.
6.16. В урна има N топки, всяка от които с еднаква вероятност може да
бъде бяла или черна. Последователно са били извадени с връщане n топки.
Каква е вероятността урната да съдържа само бели топки, ако черни топки
не са се появили?
6.17. Двама играчи А и В хвърлят последователно правилна монета.
Играта започва А, а побеждава онзи играч, който пръв хвърли герб. Каква е
вероятността за победа на всеки от играчите А и В?
6.18. Трима души последователно хвърлят монета. Печели този, който
пръв хвърли герб. Да се пресметне Вероятността за печалба на всеки от
играчите.
6.19. В урна има n бели, m червени и k зелени топки, които се изваждат
по случаен начин една след друга: а) без връщане; б) с връщане. В двата
случая да се пресметне вероятността на събитието А={бяла топка се изважда преди червена топка}.
6.20. (Парадокс на топките). Урна съдържа n топки. Всички възможни предположения за броя на белите топки са равно вероятни. В урната
пускаме 1 бяла топка. Каква е вероятността случайно избрана след това
топка да бъде бяла?
6.21. В наблюдателна станция са монтирани 4 радиолокатора с различни конструкции. Вероятността за откриване на обект с помощта на първия
радиолокатор е 0,80, на втория – 0,85, на третия – 0,90 и на четвъртия –
0,95.
а) Наблюдател включва един от радиолокаторите. Каква е вероятността
да бъде открит обект.
б) След включването на един от радиолокаторите е регистриран обект.
Каква е вероятността да е бил включен втория радиолокатор?
в) С първия радиолокатор е извършено четирикратно наблюдение.
Каква е вероятността да е регистриран само един обект; 2) да са регистрирани 2 обекта.
г) Колко наблюдения трябва да се направят с първия радиолокатор, че
да се гарантира откриването на обект с вероятност 0,99.
6.22. Две урни съдържат топки, като в първата има 3 бели и 6 черни
топки, а във втората – 2 бели и 3 черни топки. От първата урна изтегляме
33
по случаен начин две топки и ги прехвърляме във втората урна. След това
от втората урна изтегляме една топка.
а) Намерете вероятността изтеглената топка да е бяла.
б) Ако знаем, че изтеглената топка е бяла, то каква е вероятността от първата урна да са били прехвърлени две бели топки.
в) Ако знаем, че изтеглената топка е черна, то каква е вероятността от
първата урна да е била прехвърлена повече от една черна топка.
г) Нека описаният по горе опит е повторен 3 пъти. Каква е вероятността поне веднъж да бъде изтеглена бяла топка.
6.23. При изпълнение на сервис тенисист избира топка от кошница с 30
топки, от които само 10 са нови. Вероятността за точен удар с нова топка е
1/3, а със стара топка – 1/4.
а) Да се намери вероятността за точен удар при случаен избор на топка.
б) Да се намери вероятността взетата топка да е стара, ако е известно че
ударът е сполучлив.
в) Направени са три опита. Каква е вероятността тенисистът да има
1) точно две попадения; 2) три попадения.
г) Колко опита трябва да направи тенисистът, че с вероятност 0,9 да
има поне едно попадение.
6.24. В 2 урни има бели и черни топки, които са разпределени съответно: в първата – 6 бели и 2 черни; във втората – 3 бели и 2 черни.От първата
урна е прехвърлена една топка във втората. Да се определят вероятностите
на събитията:
A={прехвърлената топка е черна};
B={изтеглената след прехвърлянето топка от втора урна е черна};
C={прехвърлената топка е черна, ако изтеглената след прехвърлянето
топка от втората урна е бяла}.
6.25. В магазин има 3 кашона електрически крушки, като кашоните съдържат съответно:
I кашон: 12 крушки, от които 3 с производствен дефект;
II кашон: 11 крушки, от които 1 с производствен дефект;
III кашон: 15 крушки, от които 2 с производствен дефект.
а) Ако магазинер изпробва по 1 крушка от всеки кашон, да се определят вероятностите на събитията:
A={сред изпробваните крушки всички са дефектни};
B={сред изпробваните крушки има поне 1 дефектна крушка}.
б) Ако магазинер изпробва 3 крушки от II кашон, да се определят вероятностите на събитията:
C={сред изпробваните да няма дефектни крушки};
D={сред изпробваните да има поне 2 дефектни}.
в) Ако магазинер е продал 1 крушка от IIIкашон без да я изпробва, да се определи вероятността случайно избрана крушка от същия кашон да е дефектна.
34
6.26. Три партиди изделия съдържат съответно:
I партида: общо 22 изделия, от които 3 дефектни;
II партида: общо 25 изделия, от които 4 дефектни;
III партида: общо 28 изделия, от които 5 дефектни.
а) Ако клиент избира по едно изделие от всяка партида, да се определи
вероятността на събитията
A={сред избраните да няма дефектни};
B={сред избраните да има поне едно дефектно}.
б) Ако клиент избира 4 изделия от I партида, да се определи вер вероятността на събитията
C={сред избраните няма дефектни};
D={сред избраните да има поне 2 дефектни}.
6.27. Два завода произвеждат живачни термометри. Некачествено произведените термометри с грешка при отчитането по-голяма от допустимото представляват съответно 0,3% и 0,2% от общия брой произвеждани термометри от I и II завод. Болнично отделение закупува общо 12 термометъра, от които 9 са произведени от I и 3 от II завод. Да се определят вероятностите на събитията:
A={случайно избран термометър измежду 12 в болничното отделение
се оказва некачествен};
B={случайно избран термометър да е произведен от II завод, ако се е
установило, че той е некачествен}.
6.28. Инспектор посещава часовете на V-те класове на едно училище.
Разпределението на пълните отличници в класовете е следното:
Vа клас: общо 25 ученика, от които 7 пълни отличника
Vб клас: общо 28 ученика, от които 6 пълни отличника
Vв клас: общо 24 ученика, от които 5 пълни отличника.
а) Ако инспекторът изпитва по един ученик от всеки клас, да се определят вероятностите на събитията
A={сред изпитаните ученици да няма пълен отличник};
B={сред изпитаните ученици да има един пълен отличник}.
б) Ако инспекторът изпитва трима ученика от Vв клас, да се определят
вероятностите на събитията А и
С={сред изпитаните ученици да има поне 2 пълни отличници}.
35
7. Биномна вероятност. Схема на Бернули. Приближение
на Поасон. Локална и интегрална гранична теорема
Разглеждаме схема на Бернули с n независими опита и вероятност за успех във всеки отделен опит р.
Тогава вероятността броят на успехите да е равен на k, 0≤k≤n, се дава с
формулата:
P ( Sn  k )  Cnk p k (1  p) nk ,
k  0,1,2,..., n.
По-нататък за удобство ще означаваме q=1-p.
Вероятността в схема на Бернули с дължина n броят на успехите да е в
интервала [а, b], 0≤a≤k≤b≤n, се дава с формулата
P ( a  S n  b )   k  a C nk . p k .q n  k
b
Приближение на Поасон
Разглеждаме случая на голям брой опити n и малка вероятност за „успех“ p, така че произведението n.p=λ е от порядъка на единица (т. е. близко
до 1). Тогава за вероятността броят на успехите да е равен на kе в сила
следното приближение:
P ( Sn  k ) 
k
k!
известно като „Приближение на Поасон“
.e 
Локална гранична теорема
При голям брой опити n за вероятността броят на успехите да е равен
на k е в сила следното приближение:
P(Sn  k ) 
1
2. .n. p.q
.e

( k  n. p ) 2
2.n. p .q
Интегрална гранична теорема
При голям брой опити n за вероятността броят на успехите да е в интервала [а, b], 0≤a≤k≤b≤n, е в сила следното приближение:
 b  n. p 
 a  n. p 
P ( a  S n  b)  Φ 
Φ
,

 n. p.q 
 n. p.q 




където
t2
x

1
2
.dt
Φ ( x) 
e
2. 
е функцията на разпределение на стандартното нормално разпределение.
Табулирана е в ПРИЛОЖЕНИЕ 1
Алгоритъм за пресмятане на биномна вероятност в даден интервал
1) определят се параметрите n и p в Схемата на Бернули;
36
2) определя се интервалът на изменение на броя на „успехите“ к, a≤k≤b;
b
3) пресмята се сумата
C
k 2
k
n
.p k .q nk .
Алгоритъм за пресмятане с помощта на приближение на Поасон
1) проверяват се условията за използване на Приближението на Поасон
(голямо n и малко р);
2) пресмята се произведението λ=n.p
3) заместват се параметрите във формулата за Приближението на Поасон и се извършват пресмятанията
Алгоритъм за пресмятане с помощта на Интегрална гранична теорема
1) проверяват се условията за използване на Интегрална гранична теорема (голямо n);
a  n. p
b  n. p
;
2) пресмятат се изразите
и
n. p.q
n. p.q
 b  n. p 
 a  n. p 
3) намират се стойностите  
и 

 (от таблицата
 n. p.q 
 n. p.q 
в ПРИЛОЖЕНИЕ 1 или с помощта на компютърна програма);
4) пресмята се търсената вероятност като разлика на тези стойности.
7.1. Правилна монета се хвърля 5 пъти. Каква е вероятността да са паднали
3 езита? А 4 езита?
7.2. Зар се хвърля 4 пъти. Намеретевероятносттанасъбитията:
A={дасепаднепървипът „шестица“}
B={дасепаднеедна „шестица“}
C={дасепаднатдве „шестици“}
D={дасепаднепонеедин път „шестица“ }
E={дасепаднатпонедва пъти „шестица“}
F={дасепаднатнай-многодве „шестица“}
G={да се паднат две „шестици“, ако се знае, че поне един път се е
паднала„шестица“}
7.3. Зар се хвърля 10 пъти.
а) Каква е вероятността само първия път да се падне „тройка“?
б) Каква е вероятността един път да се падне „тройка“?
в) Каква е вероятността пет пъти да се падне „тройка“?
г) Каква е вероятността поне осем пъти да се падне „тройка“?
д) Каква е вероятността поне един път да се падне „тройка“?
е) Каква е вероятността не повече от един път да се падне „тройка“?
7.4. Зар се хвърля 12 пъти. Каква е вероятността да паднат 2 шестици? А
една шестица? А 12 шестици?
37
7.5. Вероятността за успешен изход от операция е 0.8. Оперирани са 5 пациента. Каква е вероятността точно 4 от операциите да са успешни?
7.6. При игра на бридж (52 карти) единият от четири играчи 5 пъти подред
не е получавал нито едно асо. Има ли основание да се оплаква, че не му върви?
7.7. Кое е по-вероятно при игра, с равностоен противник, ако нее възможно игрите да завършат на равно: а) да бъдат спечелени 3 от 4 партии или 5 от 8
партии; б) да бъдат спечелени не по-малко от 3 от 4 партии или не по-малко от
5 от 8 партии?
7.8. Вероятността за отказ на отделно взет уред при проверка за надеждност е 0,2. Колко уреда трябва да се проверят, за да не бъде вероятността за
получаване на поне 3 отказа по-малка от 0,9?
7.9. Пунктът А трябва да бъде свързан с 10 абонати в пункт В. Всеки от
абонатите заема линията средно по 12 минути на час. Заявките на кои да са
двама абонати са независими. Какъв е минималният брой линии, които са
необходими, за да може в произволен момент с вероятност поне 0,99 да бъдат
обслужени всички заявки? Какъв е минималният брой линии, които са необходими, за да може в произволен момент с вероятност поне 0,999 да бъдат
обслужени всички заявки? Каква е вероятността 9 линии да се окажат недостатъчни?
7.10. Иванчо има 10 зелени, 6 червени и 4 жълти топчета. Той ги слага в
кутийка и започва да избира по случаен начин с връщане по едно топче. Каква
е вероятността измежду първите 8 избрани топчета да има точно 2 червени?
7.11. Колко опита по схемата на Бернули трябва да бъдат проведени, за да
бъде равен на 73 най-вероятният брой на успехите, ако вероятността за успех е
р=0.82?
7.12. Най-вероятният брой доброкачествени детайли в една партида от N
детайла е равен на K (K<N). Каква е вероятността произволно избран детайл
от партидата да бъде доброкачествен?
7.13. Иван и Петър изпълняват по 3 наказателни удара на баскетбол, като
вероятността за отбелязване на кош при всяко хвърляне за Иван е 0.6, а за
Петър е 0.7. Да се пресметне вероятността на събитията: A={двамата да имат
по равен брой попадения}; B={Иван да има повече попадения от Петър}. Решете задачата, ако вероятността за отбелязване на кош при всяко хвърляне за
Иван е 0.5, а за Петър е 0.8.
7.14. Извършват се серия опити по схемата на Бернули без ограничение на
броя на опитите и с вероятност за успех при всеки опит, равна на р. Да се
пресметне вероятността N-тият успех да настъпи точно на (K+N)-тия опит, K
= 0, 1, 2,…..
7.15. (Задача на Стефан Банах) Един пушач винаги носи в джоба си 2
кутии кибрит. Когато иска да запали, той взема клечка от случайно избрана от
двете кутии. След известно време, когато избира едната от тях, той ще устано-
38
ви, че тя е празна. Каква е вероятността в този момент другата кутия да съдържа К клечки, ако в началото всяка кутия е съдържала по N клечки (K<N)
7.16. Да се намери вероятността в схема на Бернули без ограничение на
броя на опитите и с вероятност за успех във всеки опит, равна на р, да настъпят М успеха, преди да са настъпили N неуспеха.
7.17. Нека преди опита в схема на Бернули съществуват 2 равно вероятни
и единствено възможни хипотези относно вероятността за успех при отделен
опит: р=1/2 и р=2/3. Коя от двете хипотези има по-голяма апостериорна вероятност, ако при провеждане на 200 независими опита в схемата на Бернули са
настъпили 116 успеха?
7.18. Каква е вероятността за четен брой успехи в схема на Бернули с
дължина N и вероятност за успех в отделния опит р? А за нечетен?
Приближение на Поасон
7.19. Вероятността за попадение в движещ се самолет при отделен изстрел
е 0.001. За да бъде свален самолетът са необходими поне 2 попадения. Каква е
вероятността самолетът да бъде свален, ако по него са стреляли 5000 пъти?
7.20. В кана с вода има 10 000 бактерии. От каната е взета проба с обем
1/1000 от водата. Каква е вероятността в пробата да се окажат 10 бактерии? А
нито една?
7.21. В играта „6 от 49“ на тотото са пуснати 20 000 000 фиша със случайни
комбинации. Каква е вероятността да бъда улучени 0, 1, 2, 3,4, 5, 10 шестици?
Локална и интегрална гранична теорема
7.22. Правилна монета се хвърля 1000 пъти. Каква е вероятността броят на
езитата да е:
а) между 450 и 550?
б) между 480 и 520?
в) между 490 и 510?
7.23. Правилна монета се хвърля 10 000 пъти. Каква е вероятността броят
на езитата да е:
а) между 4500 и 5500?
б) между 4800 и 5200?
в) между 4900 и 5100?
7.24. Зар се хвърля 6000 пъти. Каква е вероятността броят на шестиците
да е:
а) между 700 и 1300?
б) между 800 и 1200?
в) между 900 и 1100?
7.25. Вероятността за раждане на момче е 0.513. Каква е вероятността при
100 раждания броят на момчетата да не надхвърли броя на момичетата? А при
10 000 раждания?
39
8. Случайни величини. Функция на разпределение.
Основни свойства на функцията на разпределение.
Функция на разпределение на случайната величина Х се нарича функцията F ( x )  P : X ( )  x .
Основни свойства на функцията на разпределение:
1) lim F ( x)  0;
x 
2) lim F ( x)  1;
x 
3) F(x) е монотонно ненамаляваща;
4) F(x) е непрекъсната отдясно.
Основно правило за пресмятане на вероятности с помощта на функцията на разпределение:
Р ( а  X  b )  F (b )  F ( a )
8.1. Нека А е произволно събитие свързано с даден опит. Дефинираме
случайната величина, наречена индикатор на събитието А
1 при
I A ( )  
0 при
А
А
където ω е елементарно събитие, свързано със същия опит. Намерете функцията на разпределение на индикатора и начертайте графиката £.
8.2. Случайната величина Х има ф.р.
при x  1
0
0, 2 при 1  x  1

F ( x )  0,3 при 1  x  2
0,6 при 2  x  5

при x  5
1
а) Колко стойности има случайната величина и кои са те? Какъв тип е
случайната величина Х?
б) Намерете следните вероятности:
Р(-1<Х<2); Р(-1<Х≤2); Р(-1≤Х<2); Р(-1≤Х≤2).
в) Намерете Р(Х=2).
г) Начертайте графиката на функцията на разпределение.
8.3. Случайната величина Х има функция на разпределение
при х  3
0
0,5 при 3  х  1,2

F ( x )  c
при 1,2  х  2
0,6 при 2  х  10,4

при х  10,4
1
където с е константа. Намерете всички възможни стойности на с.
40
8.4. Случайната величина Х има функция на разпределение
при х  3
0
C
при 3  х  2

F ( x)  
0,4 при 2  х  10
1
при х  10
където C е константа. Намерете всички възможни стойности на C.
8.5. Случайната величина Х има функция на разпределение
при х  2
0
0,1 при 2  х  1

F ( x)  0,2 при 1  х  3
0,5 при 3  х  10

при х  10
1
а) Колко стойности има случайната величина и кои са те? Какъв тип е
случайната величина Х?
б) Намерете следните вероятности
Р(Х<3), Р(Х≤3), Р(Х>3), Р(Х>10), Р(Х≥10), Р(-2<Х<0),
Р(-2<Х≤0), Р(-2≤Х<0), Р(-2≤Х≤0), Р(Х=0), Р(-2<Х<3),
Р(-2<Х≤3), Р(-2≤Х<3), Р(-2≤Х≤3), Р(Х=3)
в) Начертайте графиката на функцията на разпределение.
8.6. Хвърляме два зара: Нека с X да означим абсолютната стойност на
разликата на двете числа, които са се паднали. Определете закона на разпределение на случайната величина X.
8.7. В една кутия имаме 7 червени и 3 сини топки. По случаен начин
изваждаме 5 топки, без връщане. Какъв е законът на разпределение на броя
на червените топки измежду извадените?
c
8.8. Може ли функцията P ( x)  , x  1, 2, ... да бъде закон на разпредеx
ление на случайна величина?
8.9. В детска касичка има общо 15 монети, от които: 1 монета от 1 ст.,
5 монети от 10 ст., 4 монети от 2 ст., 1 монета от 20 ст., 2 монети от 5 ст.,
2 монети от 50 ст.Дете се опитва да извади монета от касичката. Случайната величина ξ представлява стойността на случайно извадена монета. Да се
определят:
а) законът на разпределение на случайната величина ξ
б) функцията на разпределение на ξ
в) математическото очакване на величината ξ
41
9. Дискретни случайни величини. Ред на разпределение.
Числови характеристики. Основни видове дискретни
разпределения.
Случайна величина, която приема краен брой или изброимо много стойности се нарича дискретна.
Ред на разпределение на дискретна случайна величина се нарича съвкупността от стойности xi които тя приема и съответните вероятности pi с
които те се приемат.
Средна стойност (математическо очакване) E ( X )   xi pi
i
Дисперсия D ( X )     ( xi  E ( X )) pi ;
2
2
i
Стандартно отклонение   D ( X ) .
Основни дискретни рапределения:
Разпределение на Бернули:
ξ~Bе (p), k=0, 1, P{ξ=0}=q=1-p, P{ξ=1}=p;
Биномно разпределение:
k
ξ~Bi (n, p), k=0, 1,…n, P{ξ=k}= Cn .pk.qn-k;
Разпределение на Поасон:
ξ~Po (λ), k=0, 1,…∞, P{ξ=k}=λk.e-λ/k!;
Геометрично разпределение:
ξ~Ge (p), k=0, 1,…∞, P{ξ=k}=p.qk;
Хипергеометрично разпределение:
k
ξ~HG (N,M,n), k=0, 1,…n, P{ξ=k}= CN . CM
nk
/ CN  M
k
9.1. Монета се подхвърля до появата на лице, но не повече от три пъти.
Разглеждаме случайните величини Х={брой паднали се лица} и Y={брой
паднали се гербове}.
а) Напишете разпределението на случайната величина Х.
б) Напишете разпределението на случайната величина Y.
в) Намерете средната стойност и дисперсията на случайната величина
Х и средната стойност и дисперсията на случайната величина Y.
г) Намерете функцията на разпределение на случайната величина Y и
начертайте графиката £.
9.2. Жител на голям град решава да си застрахова недвижимото имущество в града, така че в случай на бедствие да му бъде изплатена сумата
от 15 000 лв. Известно е, че вероятността за бедствие в неговия район е 40,
9 на 10 000. Каква е очакваната печалба на застрахователната фирма, ако
тя продава тази полица за 100 лв.?
42
9.3. Нека Х е случайна величина, която приема стойности 2 и -2 с вероятности 0,3 и 0,7 съответно.
а) Намерете стандартното отклонение на Х.
X 2
? Колко е очакването Е(Y)?
б) Какво е разпределението сл. в. Y 
4
А дисперсията D (Y)?
9.4. Нека Х е случайна величина, такава че Р(Х=1)=р=1-Р(Х=-1). Намерете константата с≠1 така, че E (c X )  1 .
9.5.Иванчо вади топки от кутия с 8 бели, 4 черни и 2 червени топки. Той
печели по 20 ст. за всяка извадена черна топка и губи по 10 ст за всяка извадена бяла топка (ако извади червена топка, той нито печели, нито губи).
Нека с Х е означена неговата печалба. Напишете разпределението на Х, ако:
а) Иванчо вади само една топка. Колко е очакваната печалба на Иванчо?
б) Иванчо вади 5 пъти по една топка, като всеки път запомня цвета £ и
я връща обратно в кутията. Колко е очакваната печалба на Иванчо?
в) Иванчо вади n пъти по една топка, вижда цвета £ и я връща обратно
в кутията. Колко е очакваната печалба на Иванчо?
9.6. Случайната величина Х е зададена със следния ред на разпределение
стойност
вероятност
-1
0,2
0
0,1
1
а
2
0,3
а) Да се намери стойността на константата а.
б) Да се напише функцията на разпределение на сл. в. Х. Да се начертае
графиката й.
в) Да се намери Р(Х<0), Р(Х=0), Р(Х>0), Р(0<Х<3).
г) Да се намерят числовите характеристики на сл. в. Х.
9.7. Случайната величина Х е зададена със следната функция на разпределение
при х  2
0
0,1 при 2  х  1

F ( x)  0,2 при 1  х  3
0,5 при 3  х  10

при х  10
1
а) Да се напише реда на разпределение на сл. в. Х.
б) Да се намери Р(Х<1), Р(Х=1), Р(Х>1), Р(0<Х<3).
в) Да се намерят числовите характеристики на случайната величина Х.
9.8. В кутия има 8 бели, 4 черни и 2 червени топки.
а) Иванчо вади една топка по случаен начин. Да се напише редът на
разпределение, функцията на разпределение и се намерят числовите характеристики на случайната величина
Х={брой извадени бели топки}.
43
б) Иванчо вади по случаен начин две топки едновременно. Да се напише редът на разпределение, функцията на разпределение и се намерят числовите характеристики на случайната величина Х.
в) Иванчо вади по случаен начин две топки една след друга с връщане.
Да се напише редът на разпределение, функцията на разпределение и се
намерят числовите характеристики на случайната величина Х.
г) Иванчо вади една топка по случаен начин, като печели 20 ст., ако извади черна топка и губи 10 ст., ако извади бяла топка (ако извади червена
топка, той нито печели, нито губи). Да се напише редът на разпределение,
функцията на разпределение и се намерят числовите характеристики на
случайната величина У={„печалба“ на Иванчо}.
9.9. Иванчо подхвърля монета докато се падне герб. Да се напише редът на разпределение, функцията на разпределение и се намерят числовите
характеристики на случайната величина
а) Х={брой паднали се ГЕРБ}.
б) У={брой хвърляния}.
9.10. В партида от 10 изделия 1 е нестандартно. Изтеглят се 3 изделия с
връщане. Да се намери реда на разпределение на случайната величина
„Брой на стандартните изделия сред изтеглените 3“, като данните се представят и графично. Да се пресметнат числовите характеристики на случайната величина.
9.11.Случайната величина X има следното вероятностно разпределение:
xi
pi
-2
1/5
0
1/5
1
1/5
3
1/5
4
1/5
Намерете дисперсията и стандартното разпределение на Х.
9.12. Играч трябва да изтегли карта от тесте с 32 карти. Случайната величина ξ приема стойности, в зависимост от вида на изтеглената карта.
Ако картата е с цифра ξ приема стойността на цифрата, а ако е оньор (дама,
вале, поп или туз) ξ приема стойност 0.
а) да се определи закона на разпределение на случайната величина ξ;
б) да се определи функцията на разпределение на ξ;
в) да се определи математическото очакване на величината ξ.
9.13.По маршрута на автомобил има 9 светофара. Всеки от светофарите
с вероятност 1/3 позволява преминаването в даден момент. Ако случайната
величина ξ е равна на броя на светофарите, преминати от автомобила без
изчакване:
а) да се определи закона на разпределение на случайната величина ξ
б) да се определи вероятността поне 2 от светофарите да са преминати
от автомобила без изчакване;
в) да се определят математическото очакване и дисперсията на величината ξ.
44
Биномно разпределение
9.14. Извършени са n опити на Бернули и са намерени средна стойност 10
и стандартно отклонение 3 на случайната величина Х={брой успехи в тези
опити}. Намерете
а) броя на опитите n.
б) вероятността за успех във всеки отделен опит.
в) възможните стойности на случайната величина Х.
9.15.Тест се състои от 10 въпроси с по 4 отговора за всеки от тях (само
един от отговорите е верен). Студент не знае отговора на нито един въпрос и
избира всеки отговор на въпрос случайно и независимо един от друг. Нека
Х={брой верни отговори}.
а) Напишете разпределението на случайната величина Х?
б) Колко е очакваната стойност на верните отговори?
9.16. Играч решава да залага 5 лева на червено на ролетка, докато спечели
на 4 залагания (на ролетката има 0, 00, 18 червени и 18 черни позиции).
а) Каква е вероятността играчът да направи 9 залагания?
б) Колко е очакваната печалба, ако играчът е направил 9 залагания?
9.17. Баскетболист стреля в коша 5 последователни пъти. Предполагаме,
че стрелбата в коша е опити по схемата на Бернули с вероятност за улучване
при всяка отделна стрелба 0,7.
а) Каква е вероятността да улучи при третата стрелба.
б) Каква е вероятността да улучи точно три пъти.
в) Каква е вероятността да улучи поне три пъти.
г) От какъв тип е случайната величина Х={брой попадения в коша}?
д) Колко е очакваният брой попадения в коша?
9.18. Ако вероятността ново постъпил в „Бърза закуска“ да остане на работа поне една година е 0.6, то каква е вероятността измежду 8 новопостъпили
а) 5 да останат на работа поне една година?
б) поне 5 от тях да работят в закусвалнята след една година?
в) какъв е очакваният брой ново постъпили в „Бърза закуска“, които ще
останат на работа поне една година?
(Предполагаме, че оставането на работа на един новопостъпил не зависи
от оставането или напускането на друг).
9.19. В каталог на производствено предприятие се твърди, че бракът е 3%.
Изделията се опаковат в кутии по 10, като е желателно да няма повече от едно
дефектно в кутия.
а) каква е вероятността в произволно избрана кутия да има повече от едно
дефектно изделие?
б) какъв е очакваният брой дефектни изделия в една кутия?
9.20. Фирма произвежда изделия, като средно от 100 изделия 5 са дефектни. Всеки ден по случаен начин се избират 6 изделия и се тестват за дефектни.
Нека X е броя дефектни изделия измежду избраните.
а) Напишете закона на разпределение на случайната величина X.
б) Намерете математическото очакване и дисперсията на случайната величина X.
45
9.21. На болен от туберкулоза се прави рентгенова снимка, която се дава
на четирима лекари, които си дават мнението независимо един от друг. Ако
всеки лекар може да открие болестта по снимката в 80% от случаите, то каква
е вероятността поне един от тях да открие туберкулозата? А какъв е очакваният брой лекари, открили болестта?
9.22. Тест се състои от 10 въпроса, като на всеки въпрос са дадени по 5
възможни отговора, от които един е верен. Каква е вероятността, ако теста се
попълва по случаен начин, да се познаят поне 70% от отговорите? Какво е
разпределението на случайната величина X={брой на познатите отговори}?
9.23. Социологическо проучване е установило, че вероятността, за развод
през първите 10 години от брака е 0,4.
а) Намерете средната стойност и стандартното отклонение на броя на разводите в първите 10 години на 1000 семейства.
б) Каква е вероятността при случайно избрани 6 новобрачни двойки нито
една да не се разведе през първите 10 години?
9.24. Правят се изпитания относно изправността на 8 апарата. Вероятността един апарат да е изправен е 0,7. Ако случайната величина ξ се дефинира
като броя на изправните измежду осемте апарата, да се определят закона на
разпределение на ξ, математическото очакване Еξ, дисперсията Dξ, найвероятната стойност на ξ и P{2≤ ξ ≤ 4}.
9.25. Комисия по качеството в завод взема за проверка 8 случайно избрани
детайла, произведени от смяна работници. Известно е, че 1/12 от произведените от работниците детайли са некачествени. Ако случайната величина ξ се
дефинира като броя на некачествените измежду проверените детайли, да се
определят:
а) закона на разпределение на сл. величина ξ;
б) вероятността поне един от проверените детайли да е некачествен;
в) математическото очакване Еξ и стандартното отклонение σ на величината ξ.
9.26. От лотария са изтеглени 18 билета. Вероятността за печалба на всеки
от тях е 0.1. Да се определи законът на разпределение и да се пресметнат математическото очакване и дисперсията на случайната величина ξ, равна на
броя на изтеглените печеливши билети. Да се определи вероятността да бъде
изтеглен поне един печеливш билет.
9.27. В специалността Информатика II курс задочно обучение учат 50 студенти на различна възраст. В таблицата е показан броя на студентите за всяка
възраст:
възраст
брой студенти
20
20
24
22
33
4
35
3
40
1
По случаен начин е избран един студент. Каква е неговата очаквана
възраст?
9.28. Машина произвежда детайли като вероятността произведен детайл да се окаже дефектен е 0.1. Контрольор по качеството проверява про46
изведените детайли, докато се появи дефектен. Ако случайната величина ξ
е равна на броя на недефектните детайли, проверени от контрольора, да се
определят законът на разпределение на ξ, математическото очакване Eξ,
дисперсията Dξ и стойността Fξ(2).
9.29. Комисия по качеството взема 6 случайно избрани детайла, произведени от смяна работници. Известно е, че 20 от произведените общо 2000
от работниците детайли са некачествени. Ако случайната величина ξ представлява броя на некачествените измежду проверените 6 детайла, да се
определят:
а) законът на разпределение на случайната величина ξ;
б) вероятността поне 2 от проверените детайли да са некачествени;
в) Математическото очакване Еξ и дисперсията на величината ξ.
9.30. Монета се подхвърля няколко пъти. Дефинираме случайната величина Х={брой паднали се лица}.
а) Ако монетата се подхвърля 4 пъти, то:
AI. Напишете разпределението на случайната величина Х.
AII. Намерете средната стойност, дисперсията и стандартното
отклонение на случайната величина Х.
AIII. Намерете функцията на разпределение на случайната величина
Х и начертайте графиката £.
AIV. Намерете вероятността да се падне поне два пъти лице.
б) Ако монетата се подхвърля до появата на лице, то
В I. Напишете разпределението на случайната величина Х.
В II. Намерете средната стойност, дисперсията и стандартното отклонение на случайната величина Х.
В III. Намерете функцията на разпределение на случайната величина
Х и начертайте графиката £.
В IV. Намерете вероятността да се падне поне два пъти лице.
в) Ако монетата се подхвърля до появата на лице, но не повече от три пъти, то:
Г I. Напишете разпределението на случайната величина Х={брой
паднали се лица}.
Г II. Намерете средната стойност, дисперсията и стандартното отклонение на случайната величина Х.
Г III. Намерете функцията на разпределение на случайната величина
Х и начертайте графиката £.
Г IV. Намерете вероятността да се падне поне два пъти лице.
9.31. Търговец има в наличност 1000 лева, за да закупи стока, която в
момента се продава по 2 лева за килограм. Знае се, че след една седмица
цената на стоката ще бъде или 1 лева или 3 лева за килограм, като двете
възможности за равновъзможни. Ако е сигурно, че следващата седмица
търговецът ще може да продаде цялото количество закупена стока на пазарната £ цена, то
47
а) Напишете разпределението на случайната величина Х={печалба на
търговеца след една седмица}?
б) Намерете функцията на разпределение на печалбата на търговеца
след една седмица. Начертайте графиката £.
в) Намерете вероятността търговецът да спечели поне 200 лв. от покупкопродажбата.
г) Каква е очакваната печалба на търговеца след една седмица?
д) Колко е стандартното отклонение на печалбата на търговеца?
е) Ако търговецът реши да продаде само 90% от закупената стока, то
колко ще бъде неговата очаквана печалба?
48
10. Непрекъснати случайни величини. Плътност.
Функция на разпределение. Числови характеристики.
Основни видове непрекъснати разпределения.
x
Случайна величина X е непрекъсната, ако F ( x) 

f ( s)ds, където F(x)

е функцията на разпределение, а f(x) е плътността;
Дефиниции на основните числови характеристики:
Математическо очакване:

E ( Х )   s. f ( s ).ds

Дисперсия:

D( Х )     ( х  Е ( Х ))2 f ( s )ds
2

M
Медиана M е числото, за което
 f (s).ds =1/2

Основни непрекъснати разпределения:
Равномерно разпределение:
0 при х  a или х  b
ξ~U (a,b), f ( x )  
,
1 / (b  a ) при a  х  b
E(ξ)=(a+b)/2,
D(ξ)=(b-a)2/12;
Експоненциално разпределение:
0 при х  0
,
ξ~Exp (λ), f ( x)    . x
при 0  х
.e
Нормално разпределение:
2
2
1
.e ( x a ) /2. ,
ξ~N(a,σ2), f ( x) 
2 .
E(ξ)=1/λ, D(ξ)=1/λ2;
E(ξ)=a, D(ξ)=σ2;
10.1. Количеството ориз, продадено дневно в супермаркет „За всеки“ е
непрекъсната случайна величина Х (в хиляди килограма), на която функцията на разпределение е
при х  0
0
 2
 x / 18 при 0  х  3
F ( x)  
при 3  х  6
 k .x
1
при х  6
49
а) Намерете стойността на константата k.
б) Начертайте графиката на функцията на разпределение.
в) Каква е вероятността супермаркетът да продаде следващата сряда
между 200 и 400 кг ориз?
г) Каква е вероятността супермаркетът да продаде следващата сряда
повече от 300 кг ориз?
д) Ако е известно, че предишната сряда супермаркетът е продал над
300 кг ориз, то каква е вероятността да са продали повече от 400 кг?
10.2. Времето докато нова кола от определена марка се развали, е случайна величина Х, която има функция на разпределение F(х). Разглеждаме
 X при X  5
. Изразете функцията на разпслучайната величина Y  
5 при X  5
ределение на случайната величина Y чрез функцията на разпределение F(х)
на случайната величина Х.
10.3. Времето на безотказна работа (в часове) на определен вид транзистор е случайна величина, която има плътност
 0 при x  100

f ( x)  100
 x 2 при x  100
а) Каква е средната продължителност на безотказна работа на транзисторите от този тип?
б) Колко е стандартното отклонение на продължителността на безотказна работа?
в) Ако фирмата, която произвежда тези транзистори иска да даде 500
часа гаранция, какво бихте я посъветвали?
г) Намерете функцията на разпределение.
д) Каква е вероятността един случайно избран транзистор да не е необходимо да се заменя през първите 150 часа на работа?
е) Каква е вероятността точно 2 от 5 случайно избрани транзистори да
е необходимо да се сменят в първите 150 часа на работа?
10.4. Случайна величина Х има плътност
при х  0
или х  2
0
f ( x)   4
cx при 0  х  2
а) Намерете стойността на константата с.
б) Намерете функцията на разпределение на Х.
в) Намерете средната стойност на Х.
г) Намерете дисперсията и стандартното отклонение на Х.
д) Намерете Р(Х<0,5).
е) Намерете медианата на Х.
ж) Намерете модата на Х.
50
5

3
c(2 x  x ) при 0  х 
10.5.Разглеждаме функцията f ( x)  
2 .
0 в противен случай
a) Може ли тази функция да е плътност? Ако да, намерете константата с?
5

2
c(2 x  x ) при 0  х 
б) Може ли функцията f ( x)  
2 да е плътност
0 в противен случай
на случайна величина?
10.6. Дневната консумация на електроенергия (в милиони киловат/часа) в
големите градове е непрекъсната случайна величина X с плътност
a.(1  x) при 0  х  1
f ( x )  
0 в противен случай
а) Намерете константата a.
б) Намерете функцията на разпределение на сл. в. Х.
в) Каква е вероятността дневната консумация да е по-малка от 8 милиона киловат/часа?
г) Намерете средната стойност на дневната консумация.
10.7. Дневната консумация на петрол (в милиони галона) е непрекъсната случайна величина ξ с плътност
a.(5  x) при 0  х  5
f ( x )  
0 в противен случай
а) Намерете константата a.
б) Намерете функцията на разпределение на сл.в.ξ.
в) Намерете вероятността търсенето на петрол на 20 април да е помалко от 2 милиона галона.
г) Намерете средната стойност на дневната консумация.
10.8. Дневната консумация на електроенергия(в милиона kW/h) на големите градове е непрекъсната случайна величина ξ, с плътност:
a.x.(1  x) при 0  х  1
f ( x )  
0 в противен случай
а) Намерете константата a.
б) Намерете функцията на разпределение на сл. в. Х.
в) Да се определи вероятността дневната консумация да е по-малка от
0.8 [милиона kW/h];
г) Да се определи средната стойност на дневната консумация.
Равномерно разпределение
10.9. Цената на даден вид стока е равномерно разпределена в интервала
[35, 44]. Каква е вероятността през определен ден цената да е по-малка от
40? А между 40 и 42?
51
10.10. Брокер получава фиксирана такса от 50 лева плюс 6% комисионна върху печалбата. Ако печалбата е равномерно разпределена между 0
лева и 2000 лева, то намерете вероятностното разпределение на печалбата
на брокера. Пресметнете очакваната печалба.
10.11. Влакчетата на метрото пътуват на интервали от 10 минути. Случаен пътник пристига на определена спирка по случаен начин. Какъв тип е
разпределението на случайната величина = време на чакане на пътника до
следващото влакче? Колко е средното време на чакане?
10.12. По случаен начин е избрано реално число между 1 и 10. Каква е
вероятността числото да е по голямо от 6? А каква е вероятността числото
да е точно 6 (парадокс ли е това)? Ще се измени ли вероятността, ако числото, което се избира, е цяло число между 1 и 10 включително?
10.13. Времето [в минути], което автомобил трябва да изчака на кръстовище, докато светне зелена светлина, е непрекъсната случайна величина
ξ с плътност
1 / 4 при 0  х  4
f ( x )  
0 в противен случай
а) да се намери функцията на разпределение на случайната величина ξ;
б) да се определи вероятността времето на изчакване да е по-малка от
1 минута;
в) да се определи средната стойност на времето за изчакване.
Експоненциално разпределение
10.14. Времето, което определен клиент на банка „Мечта“ чака, за да
бъде обслужен, е експоненциално разпределено със средна стойност 5 мин.
Ако има клиент в банката, когато ти пристигнеш в нейния клон, каква е
вероятността този клиент все още да бъде обслужван и след 4 минути?
10.15. Определена компонента е изключително важна, за да работи
електрическа система и трябва веднага да се смени при повреда. Знае се, че
средната продължителност на безотказна работа на такъв вид компоненти
е експоненциално разпределена със средна стойност 100 часа. Каква е вероятността, ако сменим тази компонента, то в следващите 60 часа на работа на системата да не се налага отново да се сменя?
10.16. Продължителността на безотказна работа на електронна част от
оборудване е експоненциално разпределена случайна величина. Каква е
вероятността тази част да се развали преди очакваната продължителност
на безотказна работа?
10.17. Мениджър на фирма трябва да избере един от два производствени процеса за производство на един елемент. Първият процес има c лева
разходи за производство на всяка единица, а вторият – k.c лева, където k>1.
Времето за безотказна работа на елемента е експоненциално разпределено,
като при първия процес средната продължителност на безотказна работа е
200 часа, а при втория – 300 часа. Ако елементът работи безотказно по-
52
малко от 400 часа, то производителят ще има разходи от m лева за поправка. Кой производствен процес е за предпочитане?
10.18. Двигателят на една кола има гаранция една година. Средната
продължителност на живот на двигателя е оценена на 3 години, а времето
за безотказна работа е експоненциално разпределено. Реализираната печалба от продажбата на нова кола е 100 лева. Разходите за части и работа
при всяка поправка са 250 лева. Каква е очакваната печалба от кола?
10.19. Кинескоп има гаранция една година. Известно е, че времето на
безотказна работа е експоненциално разпределено със средно 3 години.
Колко процента от кинескопите ще се ремонтират в гаранционния срок?
10.20. Производител на монитори, които се използват в терминалите на
летищата за управление на полетите дава гаранция от една година (т. е. 8 760
часа). Продължителността на безотказна работа на мониторите е експоненциално разпределена със средна стойност 20 000 часа. Разходите за производство, продажба и доставка на мониторите са 300 лева, а цената на която
се продават е 400 лева. Разходите за материали и работа при всяка поправка
на повреден монитор са 150 лева. Производителят няма задължения и разходи след първата подмяна на монитор. Каква е очакваната печалба?
10.21. Кашон с бонбони съдържа 24 кутии. Времето между продажбите
на тези кутии е експоненциално разпределено със средно 10 минути. Каква
е вероятността кашон, отворен в 8 часа да е празен до обяд?
10.22. Ферибот тръгва, ако е натоварен с 10 коли. Опитът показва, че колите пристигат независимо една от друга и че средно пристигат 7 на час. Намерете вероятността времето между два курса на ферибота да е поне 1 час.
Нормално разпределение
10.23. Случайната величина ξ е нормално разпределена с параметри а=1 и
σ=2. Изразете функцията на разпределение на ξ чрез функцията на стандартното нормално разпределение Ф(х) и намерете вероятността P{0.5< ξ <2}.
10.24. В нормално разпределена съвкупност 15% от стойностите са помалки от 12, а 40% са по-големи от 16.2. Намерете параметрите на разпределението.
10.25. Точките на теста IQ са нормално разпределени със средна стойност 100 и стандартно отклонение 15. Каква е вероятността случайно избран човек, който е взел теста да има:
a) под 120 точки; б) над 125 точки; в) между 90 и 110 точки?
10.26. Ако е известно, че средната месечната заплата в страната е нормално разпределена случайна величина ξ~N(210,120). Да се определи вероятността Р{ξ> 400}.
10.27. Ръстът в сантиметри на завършващи 7 клас ученици е нормално
разпределена случайна величина ξ~N(150,20). Ръководството на баскетболен отбор е решило да потърси нови попълнения за отбора си измежду 30-
53
те % най-високи ученици. Да се определи какъв е минималния ръст, който
трябва да има ученик за да участва в избора.
10.28. Времето на безотказна работа на определен вид транзистори (измерено в стотици часа) е случайна величина Х, която има плътност от вида
при x  1
0

f ( x)   C
 x 4 при x  1
а) Намерете стойността на константата С.
б) Какъв тип е случайната величина Х (дискретна, непрекъсната или
нито дискретна нито непрекъсната)? Намерете функцията на разпределение на случайната величина Х.
в) Каква е средната продължителност на безотказна работа на транзисторите от този тип?
г) Колко е стандартното отклонение на продължителността на безотказна работа?
д) Колко е медианата и модата на случайната величина Х?
е) Ако фирмата, която произвежда тези транзистори иска да даде 500
часа гаранция, какво бихте я посъветвали?
ж) Каква е вероятността един случайно избран транзистор да не е необходимо да се заменя през първите 150 часа на работа?
з) Каква е вероятността точно 2 от 5 случайно избрани транзистори да е
необходимо да се сменят в първите 150 часа на работа?
10.29. На магистрала с дължина А км трябва да се построи сграда на
пожарната така, че очакваното разстояние между сградата и избухнал пожар на магистралата да е възможно най-малко.
а) Нека А=500 км и пожарите избухват в точки, които са равномерно
разпределени върху магистралата.
AI. Напишете плътността на случайната величина
Х={точка на избухване на пожар}.
AII. Намерете средната стойност, дисперсията и стандартното отклонение случайната величина Х.
AIII. Намерете функцията на разпределение на случайната величина
Х и начертайте графиката £.
AIV. Напишете плътността на случайната величина
Y={абсолютна стойност на разстоянието между точката на
избухване на пожар и сградата на пожарната}.
AV. Намерете средната стойност на случайната величина Y (тя зависи
от въведения в т. AIV параметър).
AVI. Къде е най-ефективно да се построи сградата (т. е. намерете стойността на въведения в т. AIV параметър?
б) Ако магистралата е изключително дълга (теоретично се счита, че
А=∞), и разстоянието на пожара до началото на магистралата е експонен54
циално разпределено, като средното разстояние е 100 км, то къде е найефективно да се построи сградата в този случай?
Б I. Напишете плътността на случайната величина Х=точка на избухване на пожар.
Б II. Намерете средната стойност, дисперсията и стандартното отклонение на случайната величина Х.
Б III. Намерете функцията на разпределение на случайната величина
Х и начертайте графиката £.
Б IV. Разглеждаме случайната величина Y={абсолютна стойност
на разстоянието между точката на избухване на пожар и
сградата на пожарната}. Намерете средната стойност на
случайната величина Y.
Б V. Къде е най-ефективно да се построи сградата (т. е. намерете
стойността на въведения в т. Б IV параметър?
55
11. Функции от случайни величини. Съвместно разпределение
на две и повече случайни величини. Пораждащи функции.
Характеристични функции. Гранични закони.
Забележка. Голяма част от съдържанието на този параграф излиза извън
рамките на стандартните курсове по Теория на вероятностите и математическа статистика, четени в ПУ. За пълнота в изложението, този параграф е включен в ръководството заедно с необходимите дефиниции и формули.
А) Функция от случайна величина.
Нека Х е случайна величина с функцията на разпределение FX ( x), а
g(х):М→N, където M и N са множества от реални числа. Тогава Y  g ( X )
също е случайна величина при доста общи изисквания за функцията g (тези общи условия, наречени най-общо „борелевост“ са предмет на изучаване на специалните курсове по Теория на вероятностите).
Тук за конкретност ще предполагаме, че
1. Множеството М съдържа множеството от стойности на случайната величина Х.
2. За всяко у множеството {g(X) ≤ y} е събитие.
3. Събитието {g(X) =∞} има вероятност 0.
Намиране функцията на разпределение на функция от случайна величина Y=g(X):
Дефинираме множеството I y   x : g ( x)  y , което зависи съществе-
но от у. Тогава FY ( y )  P(Y  y )  P( g ( X )  y )  P[ X  I y ].
В случая, когато Х е непрекъсната случайна величина с плътност fX(x)
и функцията g(х) притежава диференцируема обратна функция h(x)=g-1 (x),
то плътността на случайната величина Y=g(X) е fY(x)= fX(h(x)).|h'(x)|.
Математическо очакване на функция от случайна величина
а) ако Х е дискретна случайна величина, то
E ( g ( X ))   g ( xi ). pi
i

б) ако Х е непрекъсната случайна величина, то
E ( g ( X )) 
 g (s). f (s).ds

Б) Случаен вектор. Функция на разпределение на две и повече случайни величини.
Нека X 1 , X 2 ,..., X n са случайни величани, дефинирани над едно и също
вероятностно пространство. Векторът X  ( X 1 , X 2 ,..., X n ) се нарича n-мерна
случайна величина или случаен вектор. Функцията FX ( x1 , x2 ,..., xn ) 
 P  X 1  x1 , X 2  x2 ,..., X n  xn  се нарича функция на разпределение на случайния вектор Х (или съвместна функция на разпределение).
56
Казваме че случайния вектор Х е непрекъснат, ако съществува функция fX(x1,x2,...,xn) такава, че FX ( x1 , x2 ,..., xn ) 
x1
x2


 
xn
...  f X ( x1 , x2 ,..., xn ).dx,

където функцията f X ( x1 , x2 ,..., xn ) се нарича плътност на случайния вектор
Х (или съвместна плътност).
Случайните величини X 1 , X 2 ,..., X n се наричат независими, ако за всеки
n реални числа a1 , a2 ,..., an събитията  X k  ak  , k  1, 2,..., n, са независими
в съвкупност.
Условие за независимост: Необходимо и достатъчно условие случайните величини X 1 , X 2 ,..., X n да са независими е
FX ( x1 , x2 ,..., xn )  FX1 ( x1 ).FX 2 ( x2 )...FX n ( xn ),
а ако случайният вектор Х има плътност f X ( x1 , x2 ,..., xn ) , то
f X ( x1 , x2 ,..., xn )  f X1 ( x1 ). f X 2 ( x2 )... f X n ( xn ).
Условно разпределение на две случайни величини:
– Дискретен случай:
Нека Х и У са дискретни случайни величини с P( X  xi )  pi ,
P(Y  yr )  qr и съвместна вероятност P( X  xi , Y  yr )  pir . Тогава усp
ловното разпределение на Х при условие, че Y  yr е P( X  xi Y  yr )  ir
qr
– Непрекъснат случай:
Нека Х и У са непрекъснати случайни величини с плътности съответно f(x) и g(y) и съвместна плътност f(x,y). Тогава условната плътност
f ( x, y )
на Х при условие, че У=у е f X |Y  y ( x, y ) 
g ( y)
Числови характеристики на две случайни величини ковариация:
cov(X,Y)= E  X  EX Y  EY .
Ако cov(X,Y)  0, то величините Х и У се наричат корелирани.
Формула за дисперсия на сума на две зависими случайни величини:
D( X  Y  DX  DY  2cov(X,Y)
Ако X и Y са независими случайни величини, то cov(X,Y)= 0. (Ако за две
случайни величини cov(X,Y)= 0, не е задължително те да са независими) коcov(X,Y)
ефициент на корелация:  ( X , Y ) 
 2x  2 y
Свойства на коефициента на корелация:
1)  ( X , Y )  1.
57
2) ако Х и У са независими, то  ( X , Y )  0.
3) ако У =aХ+b, където a и b са константи, то  ( X , Y )  1.
В) Пораждащи функции
Нека Х е случайна величина, а t e реално число. Тогава etX е случайна
величина, чието очакване се нарича пораждаща функция, т. е.
M (t )  E (etX ).
Приложение на пораждащите функции: M ( k )  0   E ( X k ), k  1, 2,3...
Свойства на пораждащите функции:
1. Те са функции с реални стойности;
2. Дават възможност да се пресмятат всички моменти на дадена
случайна величина;
3. Те са единствени, т.е. две различни случайни величини имат и различни пораждащи функции.
Частни случаи:
– ако Х е дискретна случайна величина, то
M (t )   k etxk pk ;

– ако Х е непрекъсната случайна величина, то
M (t ) 
e
tx
f ( x)dx.

Пораждаща функция на сума от независими сл.в.:
Нека X 1 , X 2 ,..., X n са независими сл. в. с пораждащи функции
М1 (t ), М 2 (t ),..., М m (t ). Тогава пораждащата функция M (t ) на сумата
X 1  X 2  ...  X n е M (t )  М1 (t ), М 2 (t ),..., М m (t ).
Г) Характеристични функции
Нека Х е случайна величина. Функцията φ(t)=E(eitX), където i  1, се
нарича характеристична функция на случайната величина Х. Това е комплекснозначна функция на реален аргумент.
Основни свойства на характеристичната функция φ(t):
1) φ(0)=1, |φ(t)|≤1, t – реално;
2) ако Х има k-ти момент E(Xk), тогава φ(t) има k-та производна и
E(Xk)=i-k. φ(k)(0);
3) ако φ(t) има k-та производна в 0 и k е четно число, съществува и
E(Xk), а ако k е нечетно число, съществува E(Xk-1);
4) ако Х има k-ти момент E(Xk), тогава φ(t) при малки стойности на t
r
k E( X )
.(i.t )r  o(t k );
може да се представи във вида  (t )   r 0
r!
5) ако случайните величини Х и Y имат съответно функции на разпределение FX(x) и FY(x) и характеристични функции φX(t) и φY(t), тога58
ва FX(x) и FY(x) съвпадат върху реалната ос тогава и само тогава, когато φX(t) и φY(t) съвпадат върху реалната ос;
7) ако случайните величини Х и Y са независими, то φX+Y(t)= φX(t).φY(t). (обратното, т.е. ако за две случайни величини горното равенство е изпълнено, то не
е задължително двете случайни величини да са независими)
Д) Видове сходимост на редици от случайни величини
Нека {Xn}, n=1,2,3,...е редица от случайни величини. Най-използвани в
практиката са следните 4 вида сходимост на случайни величини:казваме че
редицата {Xn} клони към случайната величина Х
– почти сигурно, или с вероятност 1, ако
P{ω:lim →
}=1.
– в смисъл на моменти от ред r, r>0, ако
|
| =0;
X, XnLrи lim →
– по вероятност, ако lim →
:|
=0
за всяко ε>0;
– по разпределение, ако lim →
(x)=F(x)за всяко х,
в което F(x) е непрекъсната функция.
В сила са следните зависимости между различните видове сходимост:
– от сходимост с вероятност 1 следва сходимост по вероятност;
– от сходимост в смисъл на моменти следва сходимост по вероятност;
– от сходимост по вероятност следва сходимост по разпределение.
Обратните зависимости не са в сила.
Е) Закони за големите числа
Нека { X n }, n  1,2,3,... е редица от случайни величини, дефинирани над
фиксирано
вероятностно
пространство.
Означаваме
ak  E ( X k ),
Sn  X1  X 2  ...  X n , и An  a1  a2  ...  an .




Sn  An
клони към 0 по вероятност, казваме че редицата
n
{Xn} удовлетворява закона за големите числа (ЗГЧ).
S  An
клони към 0 с вероятност 1 (почти сигурно), казваАко редицата n
n
ме че редицата {Xn} удовлетворява усиления закон за големите числа (УЗГЧ).
В сила са редица теореми (на Хинчин, Колмогоров, Марко, Чебишов и други) които дават необходими или достатъчни условия за удовлетворяване на
законите за големите числа.
Ако редицата
Ж) Централна гранична теорема:
Нека { X n }, n  1,2,3,... е редица от независими случайни величини, дефинирани над фиксирано вероятностно пространство. Означаваме ak=E(Xk),
σk2=E(Xk2), Sn=X1+X2+...+Xn, An=a1+a2+...+an, и Bn=(σ12+ σ22+...+ σn2)1/2.
59
Казваме че редицата{Xn} удовлетворява централната гранична теорема
(ЦГТ), ако за всяко реално число х при n→∞ е изпълнено съотношението
2
1 x  t2
 S  An

P n
e .dt.
 x   ( x)
2 
 Bn

Има редица теореми (най-известните са на Линдеберг и на Ляпунов), които дават необходими или достатъчни условия за удовлетворяване на централната гранична теорема.
Един частен случай на ЦГТ:
Теорема. Нека Sn  X1  X 2  ...  X n e сумата на n независими еднакво
разпределени непрекъснати случайни величини с една и съща плътност f(x),
едно и също математическо очакване μ и дисперсия σ². Тогава за всеки две
реални числа a<b е изпълнено
b
x2

S  n
1
2
lim n  P(a  n
 b) 
e
dx .

 n
2 a
11.1. Нека X1, X2 и X3 са независими случайни величини със средно 0 и
дисперсия 1. Пресметнете математическото очакване на случайната величина
X 12 ( X 2  4 X 3 ) 2 .
11.2. (Вземане на решение в условия на несигурност) Всеки нов медицински продукт (лекарство, уред, апаратура) трябва да мине през клинични
изследвания.
Разглеждаме клиничното изследване на ново лекарство. Лечението на всеки пациент с това лекарство може да бъде успешно (т. е. пациентът да оздравее) или неуспешно (болестта на пациента да не се повлияе от това лекарство).
Нека p е вероятността лечението на пациента с това лекарство да е успешна. Нека Xi=1, ако лечението на i-тия пациент е успешно и Xi=0, ако то е неуспешно. Нека p0 e вероятността пациентът да оздравее без да използва това
лекарство.
Ние трябва да вземем решение:
t) да лекуваме пациента с това лекарство, или
nt) да не го лекуваме с това лекарство.
Кога вземането на решение t е разумно?
11.3. Много често трябва да вземем решение, при което можем да спечелим или да загубим. Тогава може да използваме функция полезност, която
измерва нашата печалба и загуба.
Дефинираме функция полезност по следния начин:
 x x  
U ( x)  
, където   0.
x x  
Използвайки тази функция искаме да вземем решение да купим или да не
купим билет от лотарията, който струва 1 лев. С този билет можем да спечелим 500 лева с вероятност 0.001.
60
Каква би трябвало да бъде стойността на  за да предпочетем да купим
билет?
11.4. Нека X и Y са две независими случайни величини с равни дисперсии DX=DY=3. Намерете D(X-Y) и D(2X-3Y+1).
11.5. Нека X е случайна величина за която EX=1, EX2=2 и EX3=5. Намерете третия централен момент на случайната величина X.
11.6. Ако непрекъснатата случайна величина ξ има функция на разпределение Fξ(x) да се намери функцията на разпределение на случайната величина η, ако:а) η=ξ-1 и P{ξ=0}=0; б) η=tg ξ.
11.7. Ако непрекъснатата случайна величина ξ има функция на разпределение Fξ(x) и плътност fξ(x) да се намери функцията на разпределение и
плътността на случайната величина η=ξ2.
2
1  x2
11.8. Ако случайната величина ξ има плътност f ( x) 
e да се на2
мери плътността на случайната величина η=4.ξ2.
11.9. Нека Х е равномерно непрекъснато разпределена случайна величина в интервала [1,7].
a) намерете плътността на случайната величина Y  X .
б) намерете функцията на разпределение на случайната величина
Y
X.
в) намерете математическото очакване на случайната величина Y  X .
г) намерете дисперсията на случайната величина Y  X .
д) намерете модата и медианата на случайната величина Y  X .
11.10. Ако случайната величина ξ има разпределение на Коши, което се
1
a
задава с плътността f ( x ) 
, да се намери плътността на случайна2
 a  x2
та величина    2 .
11.11. Нека случайната величина ξ има плътност fξ(x). Да се намери
плътността на случайната величина η=lnξ.
11.12. (Обобщено неравенство на Чебишов) Нека ξ е случайна величина, f(x) е ненамаляваща за x>0 неотрицателна функция, и съществува E(f(ξ)).
Тогава
E ( f ( ))
P   a 
.
f (a )
11.13. (Неравенство на Чебишов) Нека ξ е случайна величина, и съществува D(ξ). Тогава
D ( )
P    E ( )  a  2 .
a
11.14. Нека ξ е случайна величина и съществува E(eβξ), където β>0. Тогава
P   a  e   a .E (e   ).
61
11.15. (Закон за големите числа) Нека ξ1, ξ2,..., ξn са независими, еднакво
разпределени случайни величини, и E(ξi)=a, D(ξi)=b. Тогава за всяко   0.
1 n

lim P  .  i  a     0.
n
n
 i 1

11.16. (Теорема на Вайерщрас). Нека f(x) е непрекъсната в [0,1] функция.
Дефинираме полиномите
n
k
Bn ( x)   f  .Cnk .x k .(1  x) nk . (Наричат се Полиноми на Бернщайн за
n
k 0
функцията f(x)). Докажете, че
lim max f ( x)  Bn ( x)  0.
n 0 x 1
Забележка. Това е теоремата на Вайерщрас за равномерното приближаване на непрекъсната функция с полиноми в интервала [0,1]. Важните моменти в
тази нейна формулировка са два: първо, полиномите са дадени в явен вид, и
второ, доказателството ще бъде направено с помощта на неравенството на
Чебишов, т. е. с помощта на вероятностни методи.
11.17. Застрахователна компания има 10 000 застраховани, като очаква
средно на полица да бъдат изплатени през следващата година по 25 лв. със
стандартно отклонение 80 лв. Намерете вероятността следващата година сумата за изплатени злополуки да надвишава 270 000 лв.
11.18. Определен пощенски клон обработва дневно средно 10 000 писма с
дисперсия 2 000.
11.19. Определен пощенски клон обработва дневно средно 10 000 писма с
дисперсия 2 000. Какво може да кажете за вероятността в този клон да е необходимо утре да се обработят между 8 000 и 12 000 писма?
11.20. Биолог иска да оцени продължителността на живот на даден вид насекоми. За целта в лабораторни условия той измерва времето от раждането до
умирането на няколко насекоми от този вид. После изчислява средно аритметичното на получените числа. Знае се, че продължителността на живот на
всяко насекомо е случайна величина със стандартно отклонение 1,5 дни и че
тези случайни величини са независими. Колко насекоми трябва да наблюдава
биологът, за да е сигурен поне 98%, че неговата средно аритметична стойност
не се различава с повече от 0,2 часа от реалната средна стойност на продължителността на живот на този вид насекоми?
11.21. 20 числа се избират по случаен начин в интервала (0,1). Каква е вероятността тяхната сума да е по-голяма от 8?
11.22. Ръководството на една фирма решава да покани всички 300 служители на фирмата заедно с един придружител на коледното празненство. Вероятността всеки служител да отиде с придружител е 1/3, да отиде сам е 1/3 и да
не отиде изобщо на тържеството е 1/3. Каква е вероятността поне 320 човека
да отидат на партито?
62
11.23. Всеки път когато Иван отиде на кафе, плаща само сумата цяло число лева (стотинките ги оставя за бакшиш). Ако предния месец Иван е бил 20
пъти на кафе, то каква е вероятността общата сума, която е платил да надвишава поне с 15 лева реалната му сметка?
11.24. При хазартна игра играч може да загуби 1 лв. с вероятност 0,7; губи
2 лв. с вероятност 0,2 и печели 10 лв. с вероятност 0,1. Намерете приближение
на вероятността като цяло играчът да е загубил след като е играл 100 пъти.
11.25. Всяка година специалност Приложна математика и специалност
Информатика полагат един и същ тест за интелигентност, за който е известно,
че средният брой точки е 74 със стандартно отклонение 14 точки. Тази година
25 студента от специалност Приложна математика и 64 студента от специалност Информатика трябва да положат този тест. Каква е вероятността средният брой точки на специалност „Приложна математика“ да надвишава средния
брой точки на специалност Информатика с 2,2 точки?
11.26. Знае се, че цената Yn на акциите на една компания на n-тия ден е
случайна величина, за която Yn=Yn-1+Хn, където Хn е промяната в цената, като
Х1, Х2,...Хn са независими и еднакво разпределени случайни величини със
средна стойност 0 и стандартно отклонение 1. Нека цената на една акция днес
е 100 лв. Какво може да се каже за вероятността цената на акцията да е повече
от 105 лв. след 10 дни?
11.27. Нека случайният вектор (ξ,η) има плътност f(x,y). Да се намери
плътността на случайната величина ζ=ξ.η.
11.28. Нека независимите случайни величини ξ и η имат плътности съотy2
x2


1
2
ветно f ( x ) 
.e , x и f ( y )  y.e 2 , y  0. Да се намери плътността
2
на случайната величина ζ=ξ.η.
11.29. Нека случайният вектор (ξ,η) има плътност f(x,y). Да се намери
плътността на случайната величина ζ=ξ/η.
11.30. Нека случайните величини ξ и η са независими и ξ, η∈Exp (λ), където λ >0. Намерете плътността на случайната величина ζ=ξ/η.
11.31. Зар се подхвърля два пъти. Разглеждаме случайните величини
Х={брой паднали се точки при първото хвърляне} и Y={абсолютна стойност
на разликата между точките при двете хвърляния}.
а) намерете съвместното разпределение на Х и У.
б) намерете маргиналното разпределение на Х и маргиналното разпределение на У.
в) Независими ли са Х и Y? (Защо?)
г) Намерете условното разпределение на Х при дадено Y=1.
д) Намерете условното разпределение на У при дадено X=4.
е) Намерете условното очакване Е(Х|У=5)
cxy 2 при 0  х  1 и 0  у  1
11.32. Функцията f ( x, y )  
е съвместв противен случай
0
на плътност на двете непрекъснати случайни величини Х и Y.
63
а) Намерете стойността на константата с.
б) Намерете маргиналните разпределения на Х и Y съответно.
в) Независими ли са Х и Y?
г) Намерете условното разпределение на Y при дадено Х=х.
д) Намерете условното разпределение на Х при дадено Y=у.
е) Намерете очакването на ХY.
ж) Намерете Р(0,5<Х<1 и 0<Y<0,5)
з) Намерете условното очакване Е(X |У=y).
11.33. Нека X е равномерно разпределена случайна величина в интервала (0,1). При фиксирано X=x, нека Y е равномерно разпределена случайна величина в интервала (0,x).
а) Намерете условната плътност на У при дадено X=x (напишете и
множеството от допустими стойности).
б) Намерете E(Y | Х=x).
в) Намерете съвместната плътност на X и Y.
г) Намерете маргиналната плътност на Y.
д) Намерете Р(Y<0,5 | X=0,7)
е) Намерете E(X | У=y)
11.34. Фирма пакетира смесени ядки – бадеми, фъстъци и орехи в пакети
от 1 кг. Допускаме, че теглото на всеки пакет е точно 1 кг, но теглото на всеки
от трите вида ядки е случайно. Тъй като сумата от трите тегла е винаги 1 кг, то
съвместното разпределение на всеки два вида ядки е достатъчно, за да се знае
разпределението на третия вид. Нека Х е теглото на бадемите, а У е теглото на
фъстъците. Съвместната плътност на Х и Y се дава с
24 xy при 0  х  1, 0  у  1, х  у  1
f ( x, y )  
в противен случай
0
а) Намерете разпределението на теглото на бадемите в случайно избран
пакет.
б) Ако теглото на бадемите е дадено Х=х, какво е разпределението на
теглото на фъстъците?
в) Колко е очакваното тегло на бадемите в произволно избран пакет?
Нека Х=брой единици, а У= брой шестици при 100 хвърляния на зарче.
г) Намерете ковариацията на Х и У.
д) Намерете коефициентът на корелация на Х и У. Корелирани ли са
двете случайни величини?
11.35. Зар е подхвърлен два пъти, като Х=сума от точките при двете
хвърляния, а У= разликата от точките на първото и второто хвърляне.
а) Намерете ковариацията на Х и У.
б) Намерете коефициентът на корелация на Х и У. Корелирани ли са
двете случайни величини?
64
6 xy 2 при 0  х  1 и 0  у  1
11.36. Функцията f ( x, y )  
е съвмесв противен случай
0
тна плътност на двете непрекъснати случайни величини Х и Y.
а) Намерете ковариацията на Х и Y.
б) Намерете коефициентът на корелация на Х и У. Корелирани ли са
двете случайни величини?
11.37. Група студенти се състои от 10 момчета и 10 момичета. По случаен начин преподавател съставя 10 двойки, които да работят върху различни 10 проекта. Намерете очакването и дисперсията на броя двойки,
които се състоят от момче и момиче. Как ще се промени решението, ако
всички двойки са женени? Колко са в този случай очакването и дисперсията на броя двойки, които се състоят от съпруг и съпруга?
11.38. Ако 10 двойки сядат по случаен начин на кръгла маса, то намерете очакването и дисперсията на броя съпруги, които седят до своите
съпрузи.
11.39. Всички присъстващи 10 мъже на едно парти си хвърлили шапките си по средата на стаята, после ги разбъркали и на всеки мъж дали по
една случайно избрана шапка. Намерете очакването и дисперсията на случайната величина Х={брой мъже, получили своята шапка}.
t
11.40. Пораждащата функция на случайната величина Х е M (t )  e3( e 1) .
Намерете Р(Х=0).
11.41. Нека Х и Y са независими случайни величини, които са биномно
разпределени с параметри (n,p) и (m,p) съответно. Намерете пораждащата
функция на Х+Y. Какво е разпределението на Х+Y?
11.42. Случайната величина Y е равномерно разпределена в интервала
(0,1). При фиксирана стойност р на случайната величина Y, нека случайната величина Х е биномно разпределена с параметри (n,p).
a) Намерете пораждащата функция на случайната величина Х|Y=p.
б) Намерете пораждащата функция на случайната величина Х.
11.43. Пораждащата функция на случайната величина Х е
t
M X (t )  e2( e 1) , а пораждащата функция на случайната величина Y е
10
1
3
M Y (t )   et   . Ако случайните величини Х и Y са независими, то
4
4

намерете
а) Р(Х+Y=2)
б) Р(ХY=0)
в) Е(ХY)
11.44. Нека Х и Y са независими експоненциално разпределени случайни величини с параметри λ и μ, съответно. Как е разпределена случайната величина Х+Y?
11.45. Ана и Петър продават коли в автосалон. Броят продадени коли седмично от Ана са експоненциално разпределени със средно 5 коли на седмица,
а броят продадени коли седмично от Петър са експоненциално разпределени
65
със средно 4 коли на седмица. Каква е вероятността двамата общо да са продали точно 10 коли през определена седмица? А да са продали поне 10 коли?
11.46. Две монети се подхвърлят един път. Намерете
а) пораждащата функция;
б) характеристичната функция на сумата от точките на двата за брой
паднали се „герба“.
11.47. Нека Х е непрекъсната равномерно разпределена случайна величина в интервала [0,1], а g(x) = ax + b, където a >0 и b са константи. Намерете
а) функцията на разпределение на У= g(Х)
б) плътността на У= g(Х)
11.48. Нека Х е случайна величина с функция на разпределение FХ(х),
функцията g(x) = x² и Y = g(X) = Х². Намерете
а) Функцията на разпределение на Y;
б) плътността на Y.
11.49. Нека Х е случайна величина с функция на разпределение FX(х) и
скаларната функция
b x  b

g ( x)   x, b  x  b .
b, x  b

Дефинираме Y = g(X). Намерете
а) Функцията на разпределение на Y;
б) плътността на Y.
11.50. Нека Х={брой единици}, а У={брой шестици}при 100 хвърляния
на зарче.
а) Намерете ковариацията на Х и Y.
б) Намерете коефициентът на корелация на Х и Y. Корелирани ли са
двете случайни величини?
11.51. Двумерният случаен вектор (X,Y) има съвместно разпределение
Y|X
-1
0
1
-1
0
0.25
0
0
0.25
0
0.25
1
0
0.25
0
Намерете ковариацията на Х и Y. Зависими или независими са Х и Y?
Защо?
11.52. Имаме една правилна монета, едно правилно зарче и едно зарче,
за което вероятността да се паднат 1 или 6 точки е 1/4, а 2, 3, 4 или 5 точки
е 1/8. Извършва се следния опит: Първо се подхвърля монетата. Ако се
падне ези, се хвърля правилното зарче, ако се падне тура, хвърля се неправилното зарче. Да се намери съвместното разпределение на величините Х –
брой на падналите точки и У – брой на падане на ези.
66
Част втора.
СТАТИСТИКА
12. Основни понятия в статистиката. Описателна статистика.
Основни понятия: честотно разпределение, полигон, хистограма,
числови характеристики
Вариационен ред: Нека Х1, Х2,...Xn са независими наблюдения (извадка с обем n) от реализации на случайната величина Х. Наредената извадка
от същите наблюдения
Х(1)≤Х(2)≤Х(3)≤....≤Х(n)
се нарича вариационен ред (наредена статистика), а Х(k) се нарича k-та
поредна статистика за k=1,2,3,..,n.
Емпирична функция на разпределение
 0,
k

Fn ( x)   , X k
n
 1,
x  X (1)
 x  X ( k 1)
x  X ( n)
Теорема (на Гливенко-Кантели). Ако F(x) е функцията на разпределение на случайната величина Х, а Fn(x) е нейната емпирична функция на
разпределение, получена от независимите наблюдения Х1, Х2,...Xn, то
P sup Fn ( x )  F ( x )  0, n    1.

 x 

Алгоритъм за намиране честотно разпределение на извадка
1) сортиране на извадката и определяне на обема n;
2) намиране на минимума min, максимума max и размаха R=max-min на
извадката;
3) определяне броя на интервалите k (обикновено по формулата
k=min(30, 10. log10 n));
max - min
4) определяне големината на всеки интервал по формулата d 
;
k
5) определяне границите на интервалите по правилото (min+(i-1).d;
min+i.d], i=1,2,3,...k, и техните среди mi=min+(i-0.5).d;
6) намиране броя на елементите на извадката fi във всеки интервал.
Алгоритъм за построяване на полигон
1) изпълнява се Алгоритм за намиране честотно разпределение на извадка;
2) построяваме в равнината k точки с координати (mi, fi), i=1,2,3,..., k;
67
3) свързваме всяка от двойките точки (mi, fi) и (mi+1, fi+1), i=1,2..., k-1 с
отсечка.
Алгоритъм за построяване на хистограма
1) изпълнява се Алгоритъм за намиране честотно разпределение на извадка;
2) на абсцисната ос се нанасят границите на интервалите;
3) построяват се k правоъгълника с основи границите на интервалите и
височини честотите fi.
Основни функции на R: mean (); var(); sd(); summary (); hist ();
12.1. Случайно са избрани 1000 адвокати от САЩ и са записани техните годишни приходи. Тъй като практически е трудно в една таблица да се
представят тези голям брой числа, най-удобно е данните да се групират.
Доходи 20 000 – 30 000 – 40 000 – 50 000 – 60 000 – 70000 –
(в долари) 29 999
39 999
49 999
59 999
69 999
79 999
Брой
20
80
230
400
1700
70
(адвокати)
над
80 000
30
а) Напишете честотното разпределение на доходите;
б) Начертайте хистограма на разпределението на доходите;
в) Намерете средния доход на извадката от адвокати;
г) Намерете стандартното отклонение на доходите на извадката от адвокати;
д) Намерете медианата на доходите на извадката от адвокати.
12.2. Дадени са данните
3,7
3,3
3,3
3,0
3,0
3,0
3,0
2,7
2,7
2,3
а) Начертайте честотната хистограма;
б) Намерете дисперсията и стандартното отклонение на извадката.
12.3 Следната хистограма показва енергията (в мегатонове) на част от
големите метеорити, достигнали атмосферата на Земята (голям метеорит е
такъв, който има поне един мегатон енергия, еквивалентна на енергията на
малка атомна бомба).
68
а) намерете средната стойност на извадката;
б) намерете извадковата дисперсия.
12.4. В едно социологическо проучване в университета отговорите на
въпроса „ИЗПИТВАТЕ ЛИ ЧУВСТВО НА САМОТА?“ са дадени в таблица, където са използвани следните кодове:
1. Да, постоянно; 2. Да, често; 3. Да, но рядко; 4. Не, никога.
Отговори на въпроса „ИЗПИТВАТЕ ЛИ ЧУВСТВО НА САМОТА?“
4, 3, 2, 3, 3, 2, 3, 3, 2, 3, 2, 3, 3, 2, 3, 4, 3, 3, 4, 2, 3, 4, 4, 3, 4, 3, 3, 3, 4, 4, 3, 3,
4, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 3, 1, 3, 3, 3, 3, 3, 4, 4, 3, 2, 1, 3, 4, 4, 4, 4, 3, 2, 3, 3,
3, 3, 3, 3, 3, 3, 3, 4, 3, 4, 4, 4, 3, 2, 3, 3, 3, 4, 4, 3, 3, 3, 3, 2, 1, 4, 3, 3, 3, 4, 4, 4,
3, 3, 4, 3, 2, 3, 4, 3, 3, 4, 3, 3, 3, 2, 2, 3, 2, 3
омега 7
Намерете извадковата медиана. Интерпретирайте резултата.
12.5. Мононенаситените мазнини са вериги от въглеродни атоми, с
прикачени към тях водородни атоми. Това, което ги различава от другите
мазнини е фактът, че точно един от въглеродните им атоми няма прикачен
към себе си водороден атом, откъдето произлиза и името на този вид мазнини – мононенаситени. Те се срещат предимно в растенията. Мононенаситените мазнини се считат за изключително полезни за здравето. Процентното съдържание (в %x100) на омега 7 и омега 9 мононенаситени мазнини
в 120 проби зехтин е дадено в таблиците по-долу
а) Намерете минималната, максималната и средната стойност, първия,
втория и третия квартил. Интерпретирайте резултатите.
б) Представете данните графично.
90, 185, 169, 243, 120, 175, 100, 88, 92, 80, 175, 37, 100, 185, 90, 112,
189, 41, 180, 60, 179, 30, 232, 50, 187, 60, 108, 169, 87, 170, 173, 221,
197, 117, 52, 183, 198, 182, 53, 166, 130, 181, 73, 121, 147, 176, 104, 159,
86, 119, 157, 174, 100, 180, 90, 60, 157, 181, 86, 154, 95, 30, 159, 109, 70,
78, 246, 166, 160, 106, 237, 226, 236, 162, 93, 188, 201, 151, 80, 70, 96,
95, 58,165, 154, 58, 163, 100, 110, 167, 100, 104, 130, 231, 157, 90, 204,
108, 133, 167, 90, 76, 168, 106, 98, 175, 170, 55, 80, 255, 58, 158, 206, 85,
70, 159, 173, 90, 55, 166
69
омега 9
70
7800, 6842, 6875, 6962, 7600, 6876, 7045, 7353, 7356, 7760, 7129, 7955,
7710, 6956, 7780, 7007, 6752, 7815, 6895, 7945, 7034, 7995, 6715, 7900,
6861, 7945, 7343, 7011, 7144, 6804, 6843, 6415, 7003, 7351, 8018, 6867,
6681, 6965, 7703, 7190, 7550, 6813, 7709, 7285, 7197, 6909, 7355, 7017,
7359, 7130, 7018, 6993, 7520, 6752, 7580, 7955, 7140, 7147, 7403, 6917,
7405, 7955, 7019, 7335, 7975, 7421, 6444, 7006, 6911, 7025, 6571, 6595,
6607, 6772, 7324, 6697, 6803, 7319, 7520, 7955, 7351, 7035, 7940, 7025,
6991, 7743, 6888, 7600, 7720, 6883, 7620, 7375, 7530, 6437, 7132, 7700,
6732, 7403, 7425, 6959, 7780, 7553, 7100, 7209, 7320, 6883, 6838, 7329,
7800, 6628, 7950, 7160, 6953, 7445, 7977, 7009, 7038, 7680, 7900, 6902
13. Оценки на параметри на разпределението.
Точкови оценки. Интервални оценки.
извадково средно
1n
X   Xi
n i 1
при неизвестно
популационно средно
s2 
извадкова дисперсия
извадково стандартно
отклонение
доверителен
интервал
за средното

на нормална
популация
при известно
популационно средно 
1 n
2
(Xi  X )
n  1 i 1
sn2 
sn  sn2
s  s2
при известна дисперсия
на популацията 2
при неизвестна дисперсия
на популацията

 X  t1 ( n  1)

2
s
, X  t  ( n  1)
1
n
2
1 n
2
 (Xi  )
n i 1


n

X

s
Z 
1
2

,X Z 
1
n
2
 
n


доверителен
интервал
при неизвестно средно
на популацията
при известно средно 
на популацията
за дисперсията
2 на нормална
популация


 (n  1) s 2 ( n  1) s 2 
, 2
 2

 1  (n  1)   ( n  1) 
2
2




2
 nsn 2
nsn 
, 2
 2

 1  (n)   (n) 
2
 2

Основни функции на R: mean (); var(); sd(); t.test ()
Алгоритъм за намиране доверителен интервал за средна стойност
на нормална популация
1. намира се извадковото средно X ;
2. проверява се дали е известна дисперсията на популацията 2:
ако ДА тогава
2А1. по зададеното ниво α се определя Z  (от таблицата за нормал1
2
но разпределение или чрез други пресмятания);


2А2. намира се интервалът по формулата  X  Z 
,X
1

2 n
Z 
1
2

;
n

71
ако НЕ тогава
2.Б1. пресмята се извадковото стандартно отклонение s по форму1 n
2
2
лата s 2 
(Xi  X ) , и s  s
n  1 i 1
2.Б2. по зададеното ниво α се определя t  ( n  1) от таблицата за
1
2
t-разпределение с n-1 степени на свобода);
2.Б3. намира се интервалът по формулата
s
s 

 X  t1 (n  1) n , X  t1 (n  1) n  .


2
2
13.1. Нека случайната величина Х е нормално разпределена със средна
стойност 1,5 и дисперсия 4.
а) Намерете:
Р(X>1,2), Р(1,6<X< 1,8), Р(1,4<X< 2), Р(1,1<X<1,4).
б) Намерете точка, такава че 60% от стойностите на случайната величина да са по-малки от нея.
в) Намерете интервала с най-къса дължина, който съдържа 90% от
стойностите на разпределението.
г) Напишете случайна величина, която зависи от Х и е стандартно нормално разпределена. За новата случайна величина намерете квантилите
z0,05 и z0,975 .
13.2. Нека Т е t-разпределена случайна величина с 10 степени на свобода.
а) Намерете Р(Т>2,76), Р(0,7<Т<2,76), Р(-0,3<Т<2,76), Р(-2,76<Т<-1,81).
б) Намерете квантилите t0,05 и t0,975 , модата и медианата на разпределението.
в) Намерете точка, такава че 60% от стойностите на случайната величина са по-малки от нея.
г) Намерете интервала с най-къса дължина, който съдържа 90% от
стойностите на разпределението.
13.3. Нека е направена случайна извадка от 576 жители на дадена област с цел да се установи количеството портокалов сок, консумирано от
жителите дневно. Получено е, че средната дневна консумация на тези жители е 133 грама. Знае се, че дневната консумация е нормално разпределена със стандартно отклонение 96 грама на ден.
а) Построите 90% доверителен интервал на дневната консумация.
б) Построите 99% доверителен интервал за дневната консумация.
в) Сравнете интервалите, построени в т.а) и в т. б)
96
?
г) Колко е нивото на доверие на доверителния интервал 133  2,81.
576
72
13.4. Паста за зъби се опакова в разфасовки по 55 грама, като се знае,
че теглото е нормално разпределено. Избрани са по случаен начин 10 тубички и са претеглени прецизно, като са получени следните резултати:
55,95; 56,54; 57,58; 55,13; 57,48; 56,06; 59,93; 58,30; 52,57; 58,48.
а) Намерете точкова оценка на теглото.
б) Намерете точкова оценка на стандартното отклонение на теглото.
в) Намерете 95% доверителен интервал на теглото.
г) Като се основавате на тази много малка съвкупност от данни, намерете каква е вероятността отделна тубичка, избрана случайно, да тежи помалко от 55 грама?
13.5. За да се определи съдържанието на бактерии във водата на голямо
езеро, се вземат 37 проби от по 100 милилитра вода от различни места на
брега и в лабораторията се измерва количеството бактерии в пробите. Намерено е, че средното количество бактерии е 11,95 (в стотици) и стандартното отклонение е 11,8 (в стотици). Намерете 95% доверителен интервал за
броя бактериите в 100 милилитра от водата в това езеро.
13.6. В един супермаркет картофите се продават по 2 лева на пакет. Избрани са по случаен начин 24 пакета и са претеглени. Получените данни са:
4,4; 3,8; 5,1; 4,6; 4,5; 4,5; 4,8; 4,1; 3,9; 4,2; 4,4; 4,9; 5,0; 4,3; 4,4; 3,6; 5,2;
4,8; 4,4; 4,6; 4,6; 5,0; 4,0; 4,5
а) Намерете точкова оценка на теглото и на стандартното отклонение.
б) Намерете 90% доверителен интервал за теглото на картофите в пакет.
в) Изпълнено ли е предположението за нормално разпределение на теглото? Защо?
13.7. Направена е случайна извадка от 10 пакетчета с бонбони, претеглени са и е намерено, че средното тегло на тези пакетчета е 56 грама. Ако е
известно, че теглото на пакетчетата е нормално разпределена случайна
величина с дисперсия 4, то построите 98% доверителен интервал на теглото на пакетчетата.
13.8. Производител пакетира течен сапун в бутилки с тегло 500 мл. За
да се провери дали машината за пълнене е регулирана добре се избират
случайно 1219 бутилки и се претеглят. Намерено е, че средното тегло е
506 мл, а стандартното отклонение е 10 мл. Постойте 99% доверителен
интервал на средното тегло на бутилките. Може ли да се направи извод че
е необходимо машината да се регулирана по-прецизно?
13.9. От учебен отдел в Университета „Образование за всеки“ е направена случайна извадка от 25 първокурсници и е получено, че средния им
успех от първия семестър е 5,06, а стандартното отклонение е 0,59. Знае се,
че успехът е нормално разпределена случайна величина.
а) Параметър или точкова оценка е числото 0,59?
б) Намерете 90% доверителен интервал за средния успех на всички
първокурсници в този университет основан на тази извадка. Кое разпределение ще използвате? Защо?
73
13.10. Фирма пакетира маслини в 6-килограмови кутии. Извадка от тези кутии има средно тегло 6,09 кг и стандартно отклонение 0,02 кг. Ако
теглото се намали средно с 10 грама, годишно фирмата ще спести 14 000
лв. За целта са регулирани машините за пълнене, като се предполага, че
стандартното отклонение се запазва.
а) Колко голяма извадка трябва да се направи, за да може максималната грешка при оценяването на новото тегло с 90% доверителен интервал да
не е повече от 1 грам?
б) Ако случайна извадка от 1219 кутии има средно тегло 6,048 кг и
стандартно отклонение 22 грама, то намерете 90% доверителен интервал.
в) Оценете годишните спестявания на фирмата при новото регулиране
на машините.
г) Оценете пропорцията на кутиите, които са напълнени с регулираните машини и имат тегло по-малко от 6 кг.
13.11. За да предвиди приблизителния ръст на печалбата за следващия
месец, ресторантьор събира данни за средната стойност на направена поръчка на един човек в неговия ресторант. Известно е, че разпределението
на популацията е нормално. Направена е извадка от цената на поръчките
на 25 клиента на ресторанта (в лева):
0,79; 3,60; 6,83; 26,14; 1,38; 14,06; 10,83; 2.35; 0,06; 9,80; 24,69; 3,09; 15,20;
11,73; 21,80; 20,05; 6.89; 7,56; 0.14; 1,45; 5,96; 14,42; 1,53; 11,30; 6,05.
Да се намери доверителен интервал за средната стойност на поръчка на
човек с доверителна вероятност 0,99. Известно е, че разпределението на
популацията е нормално.
13.12. Комисия от 19 съдии оценява изпълненията на гимнастик, като
всеки съдия дава обща оценка за изпълнението. Получените 19 оценки за
изпълнението на случайно избран гимнастик са:
3,74; 5,34; 3,75; 4,29; 4,67; 4,51; 5,94; 5,84; 5,82; 5,11; 3,84; 5,69; 4,25; 5,38;
3,73; 5,98; 4,38; 5,10; 5,00.
Известно е, че разпределението на популацията е нормално. Да се намери доверителен интервал за точността на оценяване на съдиите с доверителна вероятност 0,99.
13.13. Разпределението на времето на престой на клиенти в даден ресторант е нормално със стандартно отклонение 30 минути. Чрез направени
наблюдения над 41 случайно избрани клиента през текущата година, са
пресметнати стойностите на средното време – 98 минути и на извадковото
стандартно отклонение – 26 минути. Да се намери доверителен интервал за
средното време на престой в ресторанта през текущата година с доверителна вероятност 0,98.
13.14. Една от дейностите на частна фирма е търговия със стоки от даден вид. За да се разпредели правилно съотношението при инвестиране в
дейностите на фирмата е необходимо да се направи изследване за ръста на
печалбите от тази търговия. Известно е, че печалбата от продажба на изде-
74
лието е нормално разпределена. Стойностите на печалбата от продажбата
на 36 случайно избрани изделия са:
0,20; 1,25; 1.28; 0,02; 1,62; 0.88; 1.02; 3,08; 2.63; 1,93; 2,04; 2,42; 2,45;
0,12; 0,28; 0,24; 2,48; 2,59; 0,35; 0.11; 1,04; 0,66; 0,39; 1,64; 1,29; 0,15;
2,74; 2,10; 2,36; 0,02; 2,16; 1.70; 1,24; 0,90; 2,96; 1.27
Да се намери доверителен интервал за дисперсията σ2 на печалбата с
доверителна вероятност 0,95.
13.15. Машина за пакетиране на брашно пълни пакети по 1 кг., като максималното допустимо отклонение в теглото на 1 пакет е 0,01 кг. Назначена е
комисия за проверка на точността на машината, която от направени измервания на 10 пакета е получила извадково средно 1,06 кг. и извадково стандартно
отклонение 0,015 кг. Ако е известно, че теглото на пакетите е нормално разпределено да се намери доверителен интервал за дисперсията на теглото на
изработените от машината пакети с доверителна вероятност 0,99.
13.16. Детайл трябва да се закали с цел повърхността му да добие твърдост 50 единици по Рокфел (HRC). Използват се 2 метода – първият е чрез
ток с висока честота, а вторият е чрез нагряване в пещ и охлаждане в машинно масло. Проверката на твърдостта на детайлите е показала следните
резултати:
49, 50, 51, 50, 52, 49, 50, 51 – за детайли обработени по първия метод;
51, 47, 53, 52, 50, 51, 49 – за детайли обработени по втория метод.
Ако е известно, че разпределенията на твърдостта на обработваните по
двата метода детайли са нормални да се построят доверителните интервали
за твърдостта на детайлите, обработвани по двата метода при доверителна
вероятност 0,95.
Отговор: а) (49,3846; 51,1154);
13.17. Зехтинът е един от най-добрите източници на ненаситени мастни
киселини и е неразделна част от популярна средиземноморска диета, на
която хората от региона дължат доказано по-доброто си здраве в сравнение
с народите, обитаващи по-северните краища на Европа. Олеиновата киселина е мононенаситена omega-9 мастна киселина. Данните се състоят от
процентното съдържание (%x100) на олеиновата киселина, открити в 33
шишета италиански зехтин, произведен на остров Сардиня.
7120, 7065, 7080, 7120, 6990, 7007, 6971, 7130, 6882, 7043, 7145, 7065,
7162, 7144, 7020, 7123, 7164, 7159, 7085, 7103, 7068, 7170, 7076, 7243,
7068, 7080, 7035, 7135, 7062, 7200, 7085, 7006, 7025
Построите 95% доверителен интервал за средното съдържание на олеиновата киселина в зехтина, произведен на остров Сардиня, при предположение за нормалност на изследваната популация.
13.18. Данните се състоят от процентното съдържание (%x100) на олеиновата киселина, открити в 36 шишета италиански зехтин, произведен в
Южна Италия.
75
7425, 6510, 6801, 6838, 7277, 7770, 7605, 7616, 7815, 7714, 7576, 7235,
7416, 7870, 7747, 7329, 7020, 7328, 7045, 6876, 6962, 6917, 6994, 7189,
7110, 7374, 7593, 7553, 7375, 7743, 7719, 7692, 7527, 7445, 7405, 7471
Построите 99% доверителен интервал за средното съдържание на олеиновата киселина в зехтина, произведен в Южна Италия.
13.19. Изследват се материал А и материал В, от които се прави токчето
на луксозна мъжка обувка. По случаен начин 20 мъже са били избрани да
носят в продължение на един месец чифт обувки с токове, направени от
материал А и 25 мъже са били избрани да носят през същия период чифт
обувки с токове, направени от материал В. След приключване на експеримента е измерена височината на всеки ток (в mm) в точката, където износването е най-голямо, и получените данни са представени в таблицата по-долу.
Материал А
Материал В
2.915, 2.6, 4.061, 4.398, 4.025, 2.84, 3.253, 2.25, 4.83,
2.406, 4.502, 4.547, 4.132, 2.812, 1.736, 4.403, 3.794,
4.396, 4.259, 3.132
4.39, 4.694, 3.388, 4.226, 4.505, 5.608, 2.75, 3.199, 3.604,
2.451, 2.469, 3.516, 4.323, 5.175, 5.004, 4.202, 4.41,
3.577, 4.946, 3.57, 4.492, 4.633, 3.368, 4.967, 3.378
Намерете точкови и интервални оценки на средното и на дисперсията
на височината на токовете, произведени от материал А и материал В.
13.20.Производствен цех произвежда вид детайли, за които се изисква
да бъдат с определен диаметър. Максимално допустимото отклонение от
този диаметър е 0,05 мм. Отговорникът по качествения контрол прави измервания на 11 случайно взети детайла, като получените резултати (в мм.)
са дадени в таблицата отляво:
Стойности Xj
Честота nj
7,85
1
7,9
2
7,95
3
8
2
8,05
3
Ако е известно, че разпределението на диаметрите на произвежданите
детайли е нормално, то
а) да се намери неизместена и състоятелна оценка за отклонението σ в
диаметрите на произвежданите детайли;
б) да се намери доверителен интервал за дисперсията с доверителна вероятност 0,99.
13.21. Произвеждани детайли трябва да бъдат с точен размер 25,15 см.
При проверка на качеството са направени измервания на 13 детайла и получените резултати са дадени в таблица.
Стойности Xj
Честота nj
24,85
2
24,95
3
25,00
4
25,10
2
25,15
1
25,20
1
Ако е известно, че размерите на детайлите са нормално разпределени,
да се намери:
76
а) неизместена и състоятелна оценка за средния размер на детайлите;
б) доверителен интервал за размера на детайлите с доверителна вероятност 0,98.
13.22.Клиент поръчва на шивашко ателие ушиването на партида панталони с дължина 110 см. При приемането на панталоните, клиентът прави
измервания на 10 случайно избрани панталона от партидата, при което е
получил следните стойности:
Стойности Xj
Честота nj
108
1
109
2
109,5
2
110
4
110,5
1
Ако е известно, че дължината на панталоните е нормално разпределена, то
а) да се намери неизместена и състоятелна оценка за дисперсията σ2 на
дължината на ушитите панталони;
б) да се намери доверителен интервал за средната дължина на ушитите
панталони с доверителна вероятност 0,98.
13.23. Детектор е използван, за да се измери енергията на тяло. За целта се
използва едно и също тяло, на което се измерва енергията с различни детектори. Стойностите от измерванията на 9 различни детектори, при едно и също
тяло, са
260; 216; 259; 206; 265; 284; 291; 229; 249;
а) Намерете точкова оценка на неизвестната енергия.
б) Намерете средното стандартно отклонение на извадката.
в) Намерете 95% доверителен интервал на неизвестната енергия, ако е
известно, че извадката е от нормално разпределена случайна величина.
г) Намерете 90% доверителен интервал на неизвестната енергия.
д) Сравнете интервалите, получени в точките в) и г). Как нивото на доверие се отразява на доверителния интервал?
е) Ако е включен и още един детектор, който е измерил, че енергията е
251, то как това се отразява на 95% доверителния интервал (намерете новия доверителен интервал и го сравнете с този от точка в)?
ж) Може ли да се твърди, че увеличението на обема на извадката винаги намалява дължината на интервала? Защо?
13.24. Цените (в лева) предложени от 13 случайно избрани застрахователни компании за онлайн застраховка Гражданска отговорност на лек автомобил с 5 места, с обем на двигателя до 1000 куб. см, регистриран за пръв
път 2009 г. и собственост на юридическо лице, са:
135,25; 186,09; 110,94; 211,20; 209,40; 159,54; 164,40; 154,90; 230,50;
207,10; 192,98; 210,90; 156,39.
Намерете средната цена и стандартното отклонение на извадката. Построите 90% доверителен интервал на средната цена.
77
14. Проверка на хипотези за средна стойност
на нормална популация.
Използват се два начина: чрез построяване на критична област или
чрез използване на p –стойността p_value.
Правило за избор:
Отхвърляме H0 в полза на H1 когато p_value<α или стойността на статистиката принадлежи на критичната област. Двете условия са еквивалентни.
В противен случай нямаме основание да отхвърлим основната хипотеза H0.
Критичните области са представени в таблиците.
Контрахипотеза за
Статистика при
Критична област
популационното средно неизвестна дисперсия
H1: >0
H1: <0
t
H1: ≠0
( x  0 )
 t (n  1)
s
n
 , t

2
 
( n  1)  t
1

( n  1), 
2

Критична област
 z1 , 
H1: >0
H1: ≠0
 , t1 (n 1)
1
Статистика при
Контрахипотеза за
популационното средно известна дисперсия 2
H1: <0
 t1 (n 1), 
z 
x  0

n
 N  0,1 
 , z1 

 

  ,  z1     z1  ,  

 2 
2 
Алгоритъм за проверка на хипотеза чрез определяне на критична
област
1. Избира се ниво на съгласие α;
2. Определя се извадковото разпределение на избраната статистика,
предполагайки че хипотезата Н0 е вярна;
3. Намира се критичната област К (виж таблицата по горе);
4. Вземане на решение: Ако извадковата статистика принадлежи на
критичната област,то хипотезата Н0 се отхвърля, ако не принадлежи,
то няма статистическо основание за отхвърляне на хипотезата Н0.
Алгоритъм за проверка на хипотеза чрез р-стойност
1. Избира се ниво на съгласие α;
2. Определя се извадковото разпределение на избраната статистика,
предполагайки че хипотезата Н0 е вярна;
3. Намира се р-стойността p_value;
78
4. Вземане на решение: Ако p_value<α, то хипотезата Н0 се отхвърля,
ако p_value α, то няма статистическо основание за отхвърляне на
хипотезата Н0.
Основни функции на R: t.test()
14.1. Предполагаме, че резултатите от психологически тест, измерващ
коефициента на интелигентност IQ са приблизително нормално разпределени с неизвестно средно μ и дисперсия 100. Данните от IQ теста, проведен
сред студенти в университета, са дадени в таблица. Тествайте хипотезата
H 0 :   110 че средния брой точки е 110, срещу алтернативата H 1 :   110
че средния брой точки е по-голям от 110. Работете с ниво на значимост 0.1.
Резултати от IQ теста
115, 124, 107, 106, 109, 99, 121, 95, 118, 111, 115, 114, 131, 119, 104, 125,
115, 119, 94, 122, 116, 116, 119, 124, 106, 107, 122, 113, 105, 120, 105, 110,
106, 119, 115
14.2. Направена е случайна извадка от 576 жители на дадена област с цел да
се установи дали консумираното количество портокалов сок в тази област е
поне 150 грама дневно. Получено е, че средната дневна консумация на портокалов сок от тези жители е 133 грама. Знае се, че дневната консумация е нормално
разпределена със стандартно отклонение 96 грама.
а) Тествайте хипотезата с ниво на значимост 0,05.
б) Тествайте хипотезата, като използвате р-стойност.
14.3. Паста за зъби се опакова в разфасовки по 55 грама. Знае се, че теглото
е нормално разпределено. За да се провери, дали машините не пълнят повече от
55 грама, са избрани са по случаен начин 10 тубички и са претеглени прецизно.
Получени са следните резултати в грамове:
55,95; 56,54; 57,58; 55,13; 57,48; 56,06; 59,93; 58,30; 52,57; 58,48;
а) Тествайте подходящата хипотеза с ниво на значимост 0,05.
б) Тествайте хипотезата, като използвате р-стойност.
14.4.За да се определи съдържанието на бактерии във водата на голямо езеро, за което се знае че е нормално разпределено, се вземат 37 проби от по 100
милилитра вода от различни места на брега и в лабораторията се измерва количеството бактерии в пробите. Намерено е, че средното количество бактерии е
11,95 (в стотици) и стандартното отклонение е 11,8 (в стотици). Има ли статистически значимо основание да се смята, че броят бактерии в 100 милилитра от
водата в това езеро е повече от 1 000?
14.5.В един супермаркет картофите се продават по 2 лв. на пакет. Избрани
са по случаен начин 24 пакета и са претеглени:
4,4; 3,8; 5,1; 4,6; 4,5; 4,5; 4,8; 4,1; 3,9; 4,2; 4,4; 4,9; 5,0; 4,3; 4,4; 3,6; 5,2; 4,8;
4,4; 4,6; 4,6; 5,0; 4,0; 4,5.
79
а) Изпълнено ли е предположението за нормално разпределение на теглото?
Защо?
б) Като използвате ниво на значимост 0,05, тествайте хипотезата, че пакетите съдържат поне 4,5 кг.
в) Като използвате р-стойност, тествайте хипотезата, че пакетите съдържат
поне 4,5 кг.
14.6. Производител пакетира течен сапун в бутилки с тегло 500 мл. За да се
провери дали машината за пълнене е регулирана добре се избират случайно
1219 бутилки и се претеглят. Намерено е, че средното тегло е 506 мл със стандартно отклонение 10 мл.Дават ли измерванията достатъчно основание да се
настоява за пренастройка на машината?
14.7. Производител на лютеница я пакетира в буркани с етикети, на които е
записано нето 400 г. Известно е, че теглото е нормално разпределено със стандартно отклонение 15 грама. Направена е извадка от 16 буркана и е получено, че
тяхното средно тегло е 412 г.
а) При ниво на значимост 0,05, трябва ли да се препоръча регулиране на
машината?
б) Трябва ли да се препоръча регулиране на машината, ако се използва рстойност?
14.8. От учебен отдел в Университета „Образование за всеки“ е направена
случайна извадка от 25 първокурсници и е получено, че средния им успех от
първия семестър е 5,06 със стандартно отклонение 0,59. Знае се, че успехът е
нормално разпределена случайна величина.
а) Като използвате ниво на значимост 0,05, тествайте хипотезата, че успехът
на студентите в този университет е над 5,00.
б) Като използвате р-стойност, тествайте хипотезата, че успехът на студентите в този университет е над 5,00.
14.9. Известно е, че разходът на бензин на определен вид автомобил е нормално разпределен. Производителят твърди, че определена марка автомобили
до 10 000 км имат разход не по-голям от 7,5 на сто на магистрала. Случайно са
избрани 9 коли от определения модел, всяка под 10 000 км, и е измерен тяхният
разход на бензин. Намерено е, че средният им разход на бензин на магистралата
София –Пловдив е 7,8 л на сто. При ниво на значимост 0,05 може ли да се твърди, че твърденията в каталога на производителят не са верни?
14.10. Агенция по здравословно хранене твърди, че дневната консумация на
натрий е повече от 2750 mg. Знае се, че разпределението на дневната консумация на натрий е нормално разпределено. Избрани са по случаен начин 24 жени и
е получено, че те приемат средно 2919 mg натрий дневно. Стандартното отклонение на извадката е 1359 mg. При ниво на значимост 0,02 може ли да се отхвърли твърдението на агенцията?
14.11. Министерството на образованието решава да тества дали учениците
със завършено начално образование могат да четат средно поне 150 думи в
минута със стандартно отклонение от 15 думи. Избрани са по случаен начин 200
80
ученици, завършващи средното си образование и на всеки ученик е даден да
прочете един и същ текст, като е измерено времето. Намерено е, че средно тези
ученици четат по 156 думи в минута, а стандартното отклонение на извадката е
18 думи. Тази информация дава ли статистическо основание да се отхвърли
твърдението при предположение за нормалност на изследваната популация?
14.12. Конструктор на микропроцесори решава на въведе нов процес за
тяхното производство, като твърди, че по този начин ще се удължи времето на
използване на микропроцесорите. По настоящем средната продължителност
на живот на микропроцесорите е 16 000 часа. Направена е извадка от 100 микропроцесора, произведени при новата технология, които са тествани. Изчислени са средната продължителност на използване 16 700 часа и стандартно
отклонение 2 500 часа. Дава ли ни тази информация достатъчно основание да
отхвърлим новата технология при предположение за нормалност на изследваната популация?
14.13. Фирма произвежда портокалов сок и го предлага в екологични опаковки на пазара. По стандарт съдържанието на всяка опаковка трябва да е 1
литър, а стандартното отклонение 0,05. Като използвате случайната извадка,
представена в таблица, проверете дали фирмата спазва установените стандарти.
1,006
0,997
0,996
0,999
0,995
1,009
0,989
0,995
1
1,006
1,009
0,996
0,992
0,986
1,005
0,988
0,997
0,993
1,014
0,991
1,008
0,988
1,013
0,988
0,997
1,013
1,002
0,997
0,993
0,992
0,992
1,007
0,998
0,997
0,987
0,988
0,994
0,995
1,001
1
1,009
1,008
1,001
1,006
1,001
1,008
0,988
1,009
0,988
0,995
1,015
1
0,986
0,986
0,994
0,999
0,997
0,989
1,008
0,998
0,999
0,99
1,012
0,99
0,999
0,993
1,011
0,986
1,001
0,993
1,012
0,99
1,014
1
1,008
0,987
1,006
0,99
1,003
1,012
1,013
0,987
0,993
1,008
0,994
1,003
0,988
1,013
1,008
1,002
0,99
1,007
0,987
0,986
1,01
0,989
0,987
0,989
0,99
1,013
1,006
1,013
1,012
0,986
1,003
1,002
1,001
0,996
1,006
1,002
0,992
0,992
0,997
1,004
1,008
1,01
1,006
1,002
1,009
1,007
0,999
0,996
0,993
1,007
1,011
81
0,996
1,008
1,002
0,988
1,013
1,014
1,005
1,013
1,01
0,996
1,006
0,993
0,996
0,991
0,991
0,996
0,989
0,989
0,993
1,014
14.14. Знаем, че броят на фъстъчените зърна в една фъстъчена черупка
е нормално разпределена случайна величина. Направена е случайна извадка от 80 фъстъчени черупки, за която броят на зърната в една фъстъчена
черупка е даден в таблицата по-долу:
6, 9, 7, 5, 11, 5, 10, 8, 7, 10, 8, 8, 7, 2, 9, 6, 5, 8, 4, 5, 4, 6, 8, 10, 6, 6, 6, 5,
8, 7, 9, 6, 9, 8, 8, 7, 10, 10, 9, 9, 8, 10, 3, 7, 4, 9, 4, 8, 5, 8, 12, 7, 6, 4, 10, 5,
7, 5, 11, 7, 9, 6, 5, 8, 6, 8, 9, 7, 9, 3, 7, 9, 8, 7, 8, 7, 9, 4, 4, 7
Може ли да твърдим, че очакваният брой фъстъчени зърна в една фъстъчена черупка е 7?
14.15. Чугунът е желязо-въглеродна сплав със съдържание на въглерод (С)
от 2,14% до 6.67%. Предполагаме, че резултатът от автоматично измерената
твърдост по Бринел на сферографитен чугун е нормално разпределена случайна величина Х с неизвестно средно μ и дисперсия 100 : X  N (  ,100). Като
се използват данните от таблицата да се тества хипотезата H 0 :   170 срещу
алтернативата H1 :   170. Използвайте ниво на значимост 0,05.
Твърдост по Бринел на сферографитен чугун
172,24; 179,88; 176,99; 191,35; 175,90; 179,92; 177,00; 187,77; 184,93;
182,19; 171,38; 181,13; 185,22; 175,30; 181,31; 201,29; 191,54; 151,34;
186,30; 165,46; 173,65; 177,61; 174,70; 179,30; 181,36; 176,29; 176,90;
161,14; 183,94; 179,57, 190,46; 188,39; 186,98; 177,08; 187,02;
14.16. Висококачествена изработка на стоманена нишка осигурява
якост на опън, за която е известно е, че ако тази нишка се изработва по
настоящия производствен процес, то якостта Х е нормално разпределена
случайна величина със средно 50 и стандартно отклонение 6: X~N(50,36). С
въвеждането на нов производствен процес се очаква якостта да се увеличи
средно на 55 без да се изменя стандартното отклонение: X~N(55,36). Като
използвате данните, дадени в таблицата, проверете дали очакваната якост е
достигната в новия производствен процес.
Якост на стоманена нишка след въвеждането
на новия производствен процес
61,05; 47,18; 48,41; 51,48; 53,55; 48,25; 55,07; 43,93; 47,78; 56,46;
56,93; 47,93; 52,01; 47,82; 49,61; 54,98; 65,29; 45,62; 50,80; 46,95;
57,68; 52,27; 53,92; 60,84; 59,50; 62,60; 59,27; 54,96; 42,76; 54,40;
50,66; 53,44; 56,63; 50,35; 43,24; 50,66; 60,32; 45,84; 54,88; 41,32;
82
15. Точкова оценка, доверителен интервал и проверка
на хипотези за алтернативни популации.
Използват се алгоритми, аналогични на тези, описани в параграф 14,
като формулите в този случай са:
точкова
оценка
доверителен
интервал
проверка на
хипотези
H 0 : p  p0
H1 : p  p0
вероятност за успех
y
pˆ  , където n е броя на опитите, y е честотата на
n
поява на събитието

pˆ (1  pˆ )
pˆ (1  pˆ ) 
, pˆ  z 
 pˆ  z1

1

n
n
2
2


pˆ  p0
, критична област:
статистика:
p0 (1  p0 )
n

 

 ,  z1    z1 ,  

 2 
2 
Основни функции на R: prop.test()
15.1. За in vitro развитие на растителни еспланти се приготвя хранителна среда. След като хранителна среда е приготвена, тя трябва да се разлее в
стерилни условия в обсега на ламинарбокса. При това разливане понякога
става заразяване на част от хранителните среди и те трябва да се изхвърлят. Този опит е проведен и е установено, че от 80 броя разляти среди в
културални съдове 10 броя бяха заразени. Да се оцени вероятността хранителната среда, разлята в културалния съд, да бъде чиста.
15.2. Урна А съдържа 100 червени топки и 200 бели топки, а урна В съдържа 200 червени и 100 бели топки. Нека р е вероятността да бъде изтеглена червена топка от урна. Доколкото не се знае от коя урна се изтегля
топката, стойността на р е неизвестна. За да се тества хипотезата
H 0 : p  1 3, (че тази вероятност е 1/3) срещу алтернативата H1 : p  2 3 (че
е 2/3), се избират 3 топки по случаен начин с връщане от една и съща урна.
Нека Х е броя извадени червени топки. Намерете критичната област, формулирайте грешката от първи род и грешката от втори род?
15.3. Фирма, произвеждаща дъвка, след една рекламна кампания сред
зъболекари решава да провери ефекта на рекламата. При случайно допитване до 390 зъболекари се установява, че 273 от тях са препоръчвали на
пациентите си дъвката. Може ли да се твърди, че поне 75% от зъболекарите препоръчват дъвката:
а) ако нивото на значимост е 0,05;
б) ако нивото на значимост е 0,01.
в) Намерете р-стойността на теста.
83
15.4. Съгласно международната здравна асоциация, в нормално развитите страни поне 7% от новородените са по-тежки от 2,500 кг. За да се
провери какво е състоянието в Судан са били избрани по случаен начин
209 новородени, от които се е оказало че 23 са с тегло под 2,500 кг. Какъв
извод може да се направи:
а) ако нивото на значимост е 0,05;
б) ако нивото на значимост е 0,01;
в) Колко е р-стойността на този тест?
15.5. Съгласно статистическо проучване в дадена страна, през 1990 година 30% от мъжете на възраст над 18 години са живели сами. За да се провери дали този процент се е увеличил, е направено социологическо проучване през 2005 година, като по случаен начин са избрани 100 мъже на възраст
над 18 години и се е оказало, че 38 от тях живеят сами. Дават ли резултатите
достатъчно основание да се потвърди тенденцията на увеличение?
15.6. За да се изследва дали повече от половината млади хора на възраст между 20 и 30 години пушат, се прави случайна извадка от 1000 младежи на тази възраст и се оказва, че 589 от тях пушат. Какъв статистически
извод може да се направи за броя пушачи?
15.7. В партида от кутии с разноцветни бонбонки се тества твърдението, че средно има по 20% жълти бонбонки.
а) Намерете критичната област за тестване на хипотезата H 0 : p  0,2
срещу H1 : p  0,2 с ниво на значимост 0,05.
б) За да се тества хипотезата, че средно има по 20% жълти бонбонки, на
20 студента са раздадени по една кутийка с бонбонки и всеки е изчислил
пропорцията жълти бонбонки. Получените данни са дадени в таблицата:
8/56 13/55 12/58 13/56 14/57 5/54 14/56 15/57 11/54 13/55
10/57 8/59 10/54 11/55 12/56 11/57 6/54 7/58 12/58 14/58
Ако всеки студент е тествал хипотезата за 20% жълти бонбонки, с ниво
на съгласие 0,05, то колко от тях са отхвърлили нулевата хипотеза?
в) Ако допуснем, че нулевата хипотеза е вярна, то колко процента от
студентите би се очаквало да отхвърлят нулевата хипотеза?
г) За всяка от 20-те пропорции в точка б) може да се намери 95% доверителен интервал. Колко процента от тези интервали ще съдържат р=0,2?
д) Ако намерим частното на сумата от всички жълти бонбонки и сумата от всички бонбонки в кутийките, то ще отхвърлим ли хипотезата за 20%
жълти бонбони?
15.8. При допитване на 400 гласоподаватели 215 отговарят, че ще гласуват за управляващата партия, а 185 отговарят, че няма да гласуват за
управляващата партия.
84
а) Колко е р-стойността на теста H 0 : p  0,5 срещу алтернативата
H1 : p  0,5?
б) Колко е р-стойността на теста H 0 : p  0,5 срещу алтернативата
H1 : p  0,5?
в) Защо се различават отговорите на а) и на б)?
г) Има ли достатъчно статистическо основание да се смята, че управляващите ще спечелят изборите, съгласно мнението на гласоподавателите в
момента?
15.9. Получаването на млади растения in vitro пипер сорт Стряма се
осъществява чрез посев на стерилизирани семена върху слой от определено количество хранителна среда, съдържаща необходимите за развитието
на растенията съответните макро и микро-соли, витамини, агар и захароза.
Семената се култивират (посяват) в културални съдове по 8 на брой във
всеки съд и се пренасят в климатични камери. От опита се вижда, че от 10
културални съда с по 8 семена (т. е. общо 80 стерилизирани семена) са
прорастнали (поникнали) 60 броя, а останалите не са и от тях не могат да
се образуват растения.
а) Да се оцени вероятността за получаване (образуване) на млади растения в in vitro среда.
б) Да се провери хипотезата на изследователите, че вероятността за in vitro
поникване на пипер сорт Стряма е 0,8.
15.10. Морските свинчета често боледуват от краста. Тя може да бъде
предизвикана от различни акари, като заразата става чрез контакт на болни
животни със здрави. Тези акари могат да паразитират и при човека. По
време на първия курс на Джеймс Кук с кораба Индевър от 25 човека екипаж, 16 човека биват изтормозени от краста. Да се провери хипотезата, че
вероятността моряк от екипажа да се зарази с краста е по-голяма от 0,5.
85
16. Проверка на хипотези за две популации
Често се налага да се проверяват хипотези за еднородност, т. е. за неразличимост на две популации: H0: F1(x)= F2(x)срещу алтернативата H1:
F1(x) F2(x) за някое х.
Трябва да разполагаме с две независими серии от независими помежду си
наблюдения X1, X2,..., Xn на случайната величина X с функция на разпределение F1(x) и Y1, Y2,..., Ym на случайната величина Y с функция на разпределение F2(x), с ниво на съгласие α проверяваме хипотезата H 0 : F1 ( x)  F2 ( x) за
всяко х,срещу алтернативата H1 : F1 ( x)  F2 ( x) за някое х.
Критериите за еднородност на Колмогоров-Смирнов и χ2-критерият се
основават на гранични теореми и надеждността им е висока при обеми на
извадката n 40.
Алгоритъм на Критерий на Колмогоров-Смирнов
1. избира се ниво на съгласие α;
2. намират се вариационните редове на извадките и вариационният ред
{Z(k)}, k=1,2,3,...,n+m на обединената извадка;
3. намират се емпиричните функции на разпределение Fn(x) и Fm(x);
4. определя се статистиката Dnm=sup{|Fm(Z(k)) – Fn(Z(k))|}в точките Z(k);
5. намира се квантилът С1-α на разпределението на Колмогоров;
n.m
и C1 :
6. сравняват се Dn .
nm
ако Dn .
n.m
 C1 , то хипотезата H0 се отхвърля в полза на H1;
nm
n.m
 C1 , то няма статистическо основание да се отхnm
върли хипотезата H0.
Забележка. Тъй като табулации на разпределението на Колмогоров се
намират сравнително трудно, даваме най-често използваните стойности за
α=0.1, 0.05, 0.025, 0.01:
С0.9=1.22; С0.95=1.36; С0.975=1.48; С0.99=1.63.
ако Dn .
Алгоритъм на χ2-тест за еднородност
1. избира се ниво на съгласие α;
2. намират се вариационните редове на извадките;
3. избира се брой на интервалите s>1;
4. реалната ос се разбива на m непресичащи се интервала i  (ai , ai 1 ],
i  1,2,..., s, a1  , as1  ;
5. намира се броят Мi1 и Мi2 на елементите от вариационния ред на двете извадки, принадлежащи на интервала Δi за i=1,2,...,s;
86
 M i1 M i 2 



n
m ;



6. пресмята се статистиката

M i1  M i 2
n.m
7. определя се квантилът 2 ( s  1);
2
s
i 1
8. сравняват се се статистиката χ2и квантилът 2 ( s  1) :
ако  2  2 ( k ) хипотезата H0 се отхвърля в полза на H1;
ако  2  2 ( k ) хипотезата H0 няма основание да се отхвърля.
Критерий на знаците (критерий на Фишер)
Критерият на знаците е въведен от сър Роналд Фишър в 1925 г. Той е
много удобен метод за проверка за еднородност при извадки с еднакъв
обем поради своята простота.
Алгоритъм на критерий на знаците (критерий на Фишер)
1. проверява се че извадките на случайните величини Х и Y са с еднакъв
обем n;
2. образуват се съответните разлики Si  X i  Yi , i=1,2,..,n;
3. намира се броят m на положителните разлики Si>0;
4. намира се броят s на отрицателните разлики Si>0;
5. прави се проверка на хипотезата H0={положителните и отрицателните разлики са биномно разпределени с параметри m+s и
р=0,5} срещу алтернативата H1={положителните и отрицателните разлики са биномно разпределени с параметри m+s и р 0,5}.
Основни функции на R: t.test(); var.test()
16.1. Белият щъркел (Ciconiaciconia) е вид водолюбива птица и е защитен от закона за защита на природата. В България гнездят около 10000 –
12000 двойки. Този щъркел е почти тих с изключение на шумното тракане
с клюн, когато възрастни индивиди се срещат при гнездото. Черният щъркел (Ciconianigra) е голяма мигрираща блатна птица. Възрастните са големи блатни птици с черни горни части (глава, шия, гърди, гръб и криле), по
които има златистопурпурни и зеленикави отблясъци. За разлика от белия
щъркел, който живее в провинцията и степите, черният щъркел обитава
тихи вековни гори. Смята се, че белият щъркел е по-голяма птица от черния.
С ниво на съгласие 0,05 да се провери твърдението, че теглото на белия
щъркел е по-голямо от теглото на черния. За тази цел са направени две
случайни извадки от двете популации, за които е известно, че са нормално
разпределени. Данните са представени в таблица.
87
Бял щъркел
Черен щъркел
4.58, 3.06, 2.45, 3.98, 1.40, 5.71, 4.08, 4.70, 2.55,
4.10, 2.12, 4.10,3.07, 4.20, 3.98, 2.46, 3.17, 3.94,
4.01, 2.49, 2.75, 3.44, 4.00, 3.40,2.61, 3.23, 4.87,
3.10, 0.81, 3.93, 3.43, 4.36, 3.76, 2.26, 3.54, 2.88
3.01, 2.96, 2.98, 2.92, 3.02, 3.04, 3.00, 3.03, 2.97,
3.04, 2.96, 2.97, 3.01, 2.82, 3.03, 3.03, 3.01, 3.02,
2.91, 2.98, 3.03, 3.02, 2.95, 3.04,3.06, 3.02, 3.08,
2.87, 2.97
2.37, 3.70,
2.67, 2.72,
3.04, 4.15,
2.97, 2.94,
2.92, 3.01,
2.97, 3.02,
16.2. Дилър продава две различни марки седан. Доколкото купувачите
се интересуват от безопасността на седана, дилърът иска да определи разликата между спирачния път (разстоянието, което колата изминава, след
като се натисне спирачката, за да намали скоростта на колата от 60 на
0 км/час) на двата вида коли. Петима шофьори са избрани по случаен начин, за да изпробват двете марки коли- всеки от тях трябва да натисне спирачката веднага след като достигне до 60 км/час. Разстоянието е измерено
и записано в таблицата (в метри).
Шофьор
Марка A
Марка B
1
150
152
2
146
145
3
160
160
4
155
157
5
152
154
Какво може да кажете за спирачния път на двете марки коли? Формулирайте хипотеза за спирачния път и я тествайте при предположение за
нормалност на изследваните популации.
16.3. Изпълнителен директор на компания за производство на телефонни апарати е притеснен от оплакванията за дефектни телефонни апарати,
получени в последно време. Компанията има два производствени клона и
директорът не е сигурен кой от двата клона произвежда повече дефектни
апарати. За да тества производството, той избира по случаен начин по 100
апарата, произведени в двата клона, изпробва ги и записва броя на дефектните и на редовните апарати в таблицата.
Брой телефони
Брой дефектни
Клон A
100
1
Клон B
100
5
Има ли статистическо основание да се направи извода, че има разлика
в процента дефектни апарати произвеждани от двата клона? Използвайте
ниво на значимост 0,01?
16.4. Учител се интересува дали има разлика в скоростта на четене при
момчетата и при момичетата. Той избира по случаен начин 40 петокласници и 40 петокласнички, дава им един и същ текст и измерва времето, за
което те го прочитат. Резултатите (в минути) са поместени в таблицата.
88
Момчета
40
10
3
брой
Средно време
Стандартно отклонение
Момичета
40
11
2
Използвайте 0,05 ниво на значимост, за да тествате твърдението че
средната скорост на четене при момчетата е по-малка от средната скорост
на четене при момичетата при предположение за нормалност на изследваните популации.
16.5. Мениджър на верига от хранителни магазини би желал да провери дали новата система на организация на касовите апарати увеличава броя
на таксуваните продукти. За целта са избрани по случаен начин седем касиера и са преброени продуктите, които могат да се таксуват при новата и
при старата система за 3 минути. Данните са:
касиер
стара
нова
1
60
65
2
70
71
3
55
55
4
75
75
5
62
65
6
52
57
7
58
57
Има ли статистическо основание да се твърди наличието на по-голяма
ефективност на новата система? Направете необходимите предположения.
16.6. Застрахователна компания изпробва сигурността на различни
елементи на колите. В един такъв тест, компанията тества броните на колите, движещи се с 10 км/час, при сблъсък с бариера. Следните данни дават разходите за поправка (в лева) след 4 различни сблъсъка на 2000 Dodge
Neon и на 2000 Honda Civic:
Вид сблъсък
Предна броня в бариера
Задна броня в бариера
Предна броня в наклонена бариера
Задна броня в стълб
разходи – Neon
363
88
420
1,131
разходи – Civic
420
462
409
236
Има ли статистическо основание да се счита, че има разлика в разходите за поправка? Използвайте ниво на значимост 0.01, при условие, че популацията е нормална.
16.7. Лаборатория прави проучване за ефекта на лекарството Zyprexa
върху пациенти с определен вид диагноза. За целта 115 пациенти със съответната диагноза са разделени на две групи по случаен начин и на едната
група се дават от 5 до 20 мг на ден от лекарството, а на другата група се
дава плацебо. Ефективността на лекарството се измерва по специална скала и резултатите са нанесени в таблицата
89
брой
Средно въздействие
Стандартно отклонение
Група с Zyprexa
55
14,8
12.5
Група с плацебо
60
8.1
12.7
Тествайте твърдението, че групата с лекарството има по-високи показатели от групата с плацебото. Използвайте ниво на значимост 0,01.
16.8. Gallup Organization е направила допитване миналата година до
535 пълнолетни жители на определена страна, на които бил зададен въпроса „Мислите ли, че има живот под някаква форма на други планети?“. От
тях 325 отговаряли ДА. Когато същият въпрос е зададен през януари тази
година, то 385 от 535 анкетирани отговорили ДА. Тествайте твърдението,
че пропорцията на пълнолетните, вярващи в съществуването на живот на
другите планети е намалял.
16.9. За да се тества дали нов серум оказва влияние върху левкемията,
са избрани пациенти, които са вече в напреднал стадии на болестта. Петима от тях получават лекарството, а останалите 4 – не. След провеждане на
експеримента са записаните годините от експеримента до смъртта им.
Данните са подредени в таблицата
С лекарство
Без лекарство
2.1
1.9
5.3
0.5
1.4
2.8
4.6
3.1
0.9
Може ли да се твърди, че серумът има ефект? Направете необходимите
предположения и проверки.
16.10. В проучване на Union Bank of Switzerland, която планира да открие клон в Сан Диего, е записано почасовото заплащане на белите и цветнокожите работници в областта. За целта по случаен начин са избрани по
20 работници от всяка от двете групи и данните са обработени и получени
следните резултати (в долари):
Средно заплащане на цветнокожите 6,65 и стандартно отклонение 1,20.
Средно заплащане на белите 8,30 и стандартно отклонение 2,1.
а) Може ли да се твърди, че средното почасово заплащане на цветнокожите не е повече от 6,6 долара? Използвайте ниво на значимост 0,01.
б) Колко е p-стойността на теста от точка a)?
в) Какво заключение може да се направи за хипотезата от точка а), ако
се използва р-стойността?
г) Може ли да се твърди, че средното почасово заплащане на белите е
повече от средното почасово заплащане на цветнокожите? Използвайте
ниво на значимост 0,05.
е) Може ли е да се използва теста за зависими извадки при проверка на
хипотезата за равенство на средното почасово заплащане на белите и цветнокожите работници в областта? Защо?
16.11. Министерството на образованието твърди, че в област А образованието е по-добро отколкото в област Б. За целта на случайно избрани ученици от
90
8 клас се дава един и същи общообразователен тест. В областта А издържалите
теста са 450 измежду избраните 500, а в областта Б издържалите теста са 700
измежду избраните 900. Може ли, използвайки данните, да се твърди, че учениците, които издържат общообразователния тест в областта А са поне 10% повече от учениците, които издържат общообразователния тест в областта Б.
а) Напишете хипотезата и алтернативата. Кое разпределение ще използвате, за да тествате хипотезата?
б) Колко е р-стойността на теста?
в) Колко е грешката от първи род, която се допуска, ако се използва рстойността за проверка на хипотезата.
г) Направете извод като използвате р-стойността за тестване на хипотезата?
д) Какъв е изводът, ако се използва ниво на значимост 0,1 за тестване
на хипотезата?
16.12. Доктор Lyle през 1987 г. (Lyleetal., 1987) е провел изследване на
влиянието на хранителни добавки, съдържащи калций (Ca), върху кръвното
налягане. За тази цел група от 10 пациента са получили хранителна добавка с
калций и друга група от 11 пациенти, наречена контролна група, са получили
хапче с плацебо ефект.Експериментът продължил 12 седмици. Кръвното налягане на всички пациенти било измерено преди и след експеримента. Данните
отчитащи промяната в кръвното налягане са дадени в таблицата:
Ca
Placebo
7
-1
-4
12
18
-1
17
-3
-3
3
-5
-5
1
5
10
2
11
-11
-2
-1
-3
Проверете твърдението, че промяната в кръвното налягане на пациентите, приемащи хранителна добавка с калций, е по-малка от тази на контролната група. Направете необходимите предположения.
16.13. Линоленовата киселина е незаменима мастна киселина, необходима за нормалната жизнена дейност на човека. В организма на човека и
животните тази киселина постъпва с храната. Тя се съдържа в соята, памука, слънчогледа, лена, конопа, китовата мас и другаде. Таблица съдържа
линоленовата киселина в зехтин, произведен в областите Източна Лигурия
и Калабрия в Италия.
Съдържание на линоленовата киселина в зехтин (в %x100)
Източна
Лигурия
Калабрия
1020, 1000, 1030, 990, 1050, 830, 880, 900, 970, 980, 990, 850,
860, 910, 1040, 940, 930, 1010, 730, 690, 960, 1020, 1010, 850,
1030, 940, 820, 810, 920, 1010, 930, 910, 900, 830, 840, 910, 850,
830, 800, 770, 760, 810, 750, 950, 870, 790, 810, 970, 870, 740
832, 950, 874, 940, 903, 892, 915, 870, 820, 823, 798, 829, 819,
840, 866, 870, 877, 928, 897, 757, 839, 786, 939, 925, 780, 743,
787, 872, 771, 819, 828, 618, 818, 633, 616, 923, 638, 609, 759,
869, 702, 855, 857, 823, 949, 790, 783, 738, 763, 780, 826, 810,
709, 898, 861, 848
91
а) Намерете неизместена и състоятелна оценка на средното съдържание на
линоленовата киселина в зехтин, произведен в Източна Лигурия и на средното
съдържание на линоленовата киселина в зехтин, произведен в Калабрия.
б) При предположение за нормалност на двете популации, докажете, че
средното съдържание на линоленовата киселина в зехтин от Източна Лигурия надвишава средното съдържание на линоленовата киселина в зехтин
от Калабрия.
в) При липса на информация за вероятностното разпределение на популациите, проверете дали средното съдържание на линоленовата киселина в зехтин от Източна Лигурия надвишава средното съдържание на линоленовата киселина в зехтин от Калабрия.
16.14. Глобалният феномен Ел Ниньо е отговорен за температурни колебания в тропическата част на Тихия океан, а според някои учени, и за
част от промените в климата. Тъй като това се случва по Коледа, явлението
е наречено Ел Ниньо (на испански „момченце“, което се свързва с Младенеца Исус). Явлението се проявява, когато температурата на водната повърхност се покачи с 0.5 градуса над средната. Температура на морската
вода, измерена на 1 метър под морската повърхност (в градуси по Целзий)
в 25 случайно избрани по време (около Коледа 1993 и 1997 година) и място
(около брега на Перу) точки, е дадена в таблица.
Формулирайте подходящи хипотези за да докажете посочените по-долу
твърдения. Работете с ниво на значимост 0.05.
а) Проверете твърдението, че средната температура на морската вода
през 1993 г. е била 23 градуса.
б) Докажете твърдението, че 1997 година е една Ел Ниньо година, т. е.
докажете, че средната температура на морската вода през 1997 г. се е покачила с повече от 0,5 градуса над средната температура на морската вода
през 1993 г. Предположете нормалност на вероятностните разпределения
на двете популации.
Година
1993
1997
Температура на морската вода
22,68; 24,01; 23,42; 22,89; 23,54; 23,91; 23,37; 21,84; 23,88; 22,81;
22,81; 24,43; 23,41; 24,05; 23,67; 23,93; 24,43; 23,95; 21,99; 24,55;
24,08; 22,59; 23,50; 24,62; 23,43;
28,08; 28,51; 28,78; 28,25; 28,35; 26,85; 26,64; 26,83; 27,68; 28,05;
27,59; 28,26; 28,03; 28,20; 26,64; 27,60; 27,62; 28,55; 28,81; 28,94;
27,51; 28,45; 28,28; 28,24; 28,24;
16.15. Районната прокуратура, съвместно с Ветеринарно-медицинската
служба, е направила проверка на фирмите, произвеждащи сухо мляко. И
производителите и проверяващите са измерили съдържанието на мазнини
във всяко пакетче от случайна извадка от 30 пакетчета сухо мляко. Има ли
значима разлика в двата вида измервания?
92
Съдържанието на мазнините в % за 100 гр. продукт
2,343; 1,922; 1,587; 1,736; 0,461; 1,800; 1,409; 0,884; 2,999; 3,519;
2,399, 1,037; 2,345; 0,865; 3,397; 2,744; 2,484; 2,828; 2,470; 3,136;
0,691, 0.865, 1,974; 2,150; 0,666; 1,409; 2,443; 1,658;
2,098; 1,689; 2,269; 3,579; 2,703; 3,327; 1,631; 2,778; 2,458; 1,899;
3,048; 2,375; 2,909; 1,757; 1,561; 0,480; 2,791; 2,353; 2,639; 1,896;
1,500; 1,220; 2,091; 3,863; 1,720; 2,041; 2,323; 1,065;
2,219;
1,403;
1,120;
2,116;
16.16. По стандарт съдържанието на белтъчините и въглехидратите в 100
грама натурално краве кисело мляко е съответно 3,5 и 4,2 грама. Измерено е
съдържанието на белтъчините и въглехидратите в 45 случайно избрани кофички кисело мляко от една марка и получените данни са представени в
таблица. Може ли да се безпокоим, че това мляко не се произвежда по установения стандарт?
Съдържание на белтъчини
Съдържание на въглехидрати
3,52; 3,52; 3,46; 3,60; 3,58; 3,54; 3,48;
3,50; 3,52; 3,35; 3,57; 3,43; 3,47; 3,45;
3,49; 3,49; 3,52; 3,59; 3,47; 3,49; 3,48;
3,54; 3,55; 3,45; 3,51; 3,44; 3,56; 3,65;
3,43; 3,47; 3,46; 3,47; 3,49; 3,44; 3,41;
3,42; 3,53; 3,47; 3,48; 3,57; 3,40; 3,48;
3,43; 3,46; 3,60
4,24; 4,19; 4,23;
4,30; 4,20; 4,12;
4,15; 4,16; 4,23;
4,17; 4,14; 4,26;
4,24; 4,16; 4,22;
4,20; 4,26; 4,24;
4,26; 4,12; 4,22
4,13;
4,06;
4,19;
4,24;
4,31;
4,14;
4,14;
4,23;
4,18;
4,34;
4,12;
4,22;
4,26;
4,17;
4,20;
4,21;
4,25;
4,27;
4,12;
4,16;
4,29;
4,21;
4,14;
4,24;
16.17. За да се провери дали глаукомата влияе на дебелината на роговицата на окото са избрани случайно 8 пациента, на които едното око е
засегнато от глаукома, а другото – не, и е измерена дебелината на роговицата на окото (в микрони), като данните са дадени в таблицата
пациент
Окото с глаукома
Окото без глаукома
1
488
484
2
478
478
3
480
492
4
426
444
5
440
436
6
410
398
7
458
464
8
460
476
Може ли да се твърди, че глаукомата влияе на дебелината на роговицата на окото? Използвайте ниво на значимост 0,1.
16.18. Известно е, че ръстът (в см.) на населението е нормално разпределена случайна величина. При статистическо изследване на населението в
3 различни области са получени следните резултати на ръста на случайно
избрани жители:
Северна област: 157; 202; 175; 174; 199; 194; 195; 201;178 179; 170;
194; 158; 180; 205; 204; 162; 203; 203; 181; 174; 198
Централна област: 186; 169; 159; 173; 177; 159; 160; 194; 177; 161;
185; 201; 165; 163; 171; 173; 189; 193; 195; 162; 156; 174; 178; 196; 161; 203;
180; 182; 176; 158; 191; 158; 194; 174; 203; 195; 155; 196; 177; 180; 158; 183
93
Южна област: 183; 190; 165; 184; 165; 179; 183; 180; 177; 192; 184;
167; 161; 188; 167; 186; 194; 190; 180; 194; 195; 168; 192; 180; 159; 182; 180;
157; 164; 192; 169; 170; 156
а) Ако е известно, че дисперсията навсякъде е еднаква, с ниво на значимост 0,05 да се провери предположението, че средният ръст на населението в Северната област не е по-висок от средния ръст на населението в
Централната област.
б) С ниво на значимост 0,03 да се провери предположението, че средния ръст на населението в Централната област не е по-нисък от средния
ръст на населението в Южната област.
94
17. Проверка на хипотези за нормалност на популация.
Най-често използваният тест за проверка на нормалност на популация
е тестът на Шапиро-Уилкс (Shapiro–Wilk test). Предложен е през 1965 г. от
Самюел Шапиро и Мартин Уилкс. Поради сложността му не го описваме
тук. Реализацията му в R е чрез командата shapiro.test().
Женски сурикат
45,05; 45,30; 46,19; 46,19;
45,26; 47,14; 46,03; 46,82;
46,06; 45,90; 45,65; 46,56;
46,80, 45,10; 47,99; 44,43;
46,14; 45,71; 44,52; 45,50;
46,44; 46,11; 43,88; 45,46;
47,80; 45,53; 46,87; 44,63;
46,72;
45,02;
46,16;
46,62;
46,95;
45,87;
46,14;
44,41;
45,88;
46,20;
46,37;
45,71;
46,94;
45,23;
45,59;
46,27;
47,11;
46,13;
Мъжки сурикат
Основни функции на R: shapiro.test();ks.test()
17.1. Сурикатите (Suricatasuricatta) са дребни хищници от семейство Мангусти, които се срещат само в западните покрайнини на пустинята Калахари,
Южна Африка. Те живеят в дупки в земята и могат да стоят подобно на хора
на два крака, за да наблюдават по-добре околността.
Направена е случайна извадка от 70 женски суриката и случайна извадка от 75 мъжки суриката, и са измерени техните дължини в сантиметри.
Получените данни са представени в таблица.
Да се проверят следните хипотези:
а) Дължината на тялото (с главата и опашката) на женския сурикат е
по-малка от дължината на тялото на мъжкия сурикат.
б) Двете популации са нормално разпределени.
44,72;
44,89;
48,29;
43,81;
45,24;
46,29;
45,09;
44,36;
46,30;
46,00;
45,38;
45,82;
44,86;
46,51;
45,65;
47,31;
44,58;
45,67;
44,25;
45,92;
45,63;
46,53;
46,59;
47,40;
50,84; 50,82; 48,36; 49,89; 49,49; 49,81; 51,28; 49,77; 48,79;
48,49; 51,39; 50,37; 49,74; 49,80; 49,97; 49,84; 50,55; 49,41;
50,78; 48,29; 47,63; 49,54; 49,67; 51,72; 51,08; 48,74; 49,32;
49,86; 50,24; 51,00; 49,67; 49,50; 50,05; 47,72; 52,26; 48,48;
48,71; 49,77; 50,07; 48,43; 47,95; 49,61; 49,38; 49,56; 51,83;
50,42; 47,58; 49,88; 49,82; 48,80; 50,30; 49,27; 47,42; 49,73;
50,49; 50,12; 48,80; 50,85; 49,74; 50,31; 50,54; 52,36; 49,92;
49,86;
48,58;
49,47;
50,60;
50,29;
49,60;
49,60;
50,32;
51,76;
49,99;
50,44;
51,12;
Африкански
слон
17.2. Слоновете са най-едрите сухоземни бозайници на планетата. Направена е случайна извадка от 67 африкански слона и 73 азиатски слона.
Получените данни са представени в таблица.
6,69; 6,25;
6,39; 6,29;
5,91; 6,12;
6,24; 6,08;
6,28; 6,37;
6,92; 6,94
6,02;
6,81;
6,32;
6,92;
6,64;
6,79;
6,74;
5,54;
6,48;
6,10;
6,41;
6,37;
6,36;
6,51;
6,62;
6,16;
6,47;
6,05;
6,74;
6,76;
6,25;
6,41;
5,96;
6,15;
6,24;
6,41;
6,59;
6,70;
6,57;
6,34;
6,19;
6,33;
6,90;
6,61;
5,33;
6,06;
6,35;
6,64;
6,39;
5,58;
6,04;
6,35;
6,36;
5,86;
6,47;
7,67;
6,10;
6,63;
6,49;
6,24;
6,89;
6,24;
6,51;
6,57;
6,23;
95
Азиатски слон
6,18; 6,16; 6,22; 6,26; 6,25; 6,262; 6,19; 6,20; 6,12; 6,19; 6,17; 6,20; 6,18;
6,16; 6,25; 6,20; 6,20; 6,17; 6,26; 6,26; 6,22; 6,25; 6,20; 6,28; 6,17; 6,21;
6,17; 6,21; 6,23; 6,19; 6,17; 6,16; 6,22; 6,13; 6,12; 6,23; 6,16; 6,19; 6,12;
6,16; 6,23; 6,15; 6,29; 6,18; 6,20; 6,16; 6,19; 6,20; 6,21; 6,17; 6,24; 6,21;
6,19; 6,23; 6,17; 6,17; 6,18; 6,22; 6,25; 6,16; 6,18; 6,26; 6,30; 6,17; 6,19;
6,27; 6,11; 6,19; 6,27; 6,23; 6,25; 6,24; 6,19;
Да се проверят следните хипотези:
а) Африканският слон е с по-голяма дължина от азиатския.
б) Двете извадки са направени от две нормални популации.
17.3. Ел Ниньо представлява периодично затопляне на обикновено
студените води в източната тропическа част на Тихия океан по дължината
на екватора. Тихият океан представлява нещо като топлинен резервоар,
който движи вятърните системи около Земята, като по този начин промяната на температурата на водата оказва влияние върху температура на въздуха (допълнителна информация за Ел Ниньо е дадена в задача 16.14.).
Измерена е температура на въздуха в 30 точки, случайно избрани по време
(около Коледа) и място (около брега на Перу и Еквадор), на 3 метра над
морската повърхност (в градуси по Целзий) е дадена в таблица:
Температура на въздуха около Коледа 1997 година
27.79, 27.13, 27.05, 28.30, 27.27, 26.91, 26.99, 27.23, 27.59, 26.36, 26.35,
27.79, 27.43, 26.94, 26.67, 28.18, 26.39, 26.74, 26.59, 28.40, 27.68, 26.91,
27.28, 26.98, 27.67, 27.09, 28.37, 27.74, 27.28, 27.67
а) Да се намери неизместена и състоятелна оценка на средната температура на въздуха през Ел Ниньо годината1997.
б) Да се провери твърдението, че температурата на въздуха през Ел Ниньо годината 1997 надхвърля 26 градуса по Целзий. Направете предположение за нормалност на популацията. Работете с ниво на значимост 0,01.
в) Таблицата по-долу съдържа данни за температурата на въздуха презедна обикновена година (1993 година). Да се провери твърдението, че
температурата на въздуха през Ел Ниньо годината е по-висока от температурата на въздуха през обикновената 1993 година. Направете предположение за нормалност на популацията. Работете с ниво на значимост 0.05.
Температура на въздуха около Коледа 1993 година
22.35, 22.83, 23.62, 24.42, 24.34, 23.62, 23.26, 22.22, 22.94, 23.78, 22.09,
22.19, 23.54, 23.20, 22.86, 22.69, 23.75, 22.35, 24.62, 23.94, 23.65, 22.55,
24.80, 22.24, 22.83, 24.80, 23.65, 23.38, 23.38, 22.98
г) Да се провери предположението за нормалност на двете популации.
д) Построите 90%, 95% и 99% доверителни интервали на средната температура на въздуха на тихоокеанското крайбрежие на Перу и Еквадор
през 1997г. Забележете как се променя дължината на доверителния интервал, когато доверителната вероятност нараства.
96
17.4. Данните се състоят от процентното съдържание (%x100) на олеиновата киселина, открити в случайна извадка от 60 шишета италиански
зехтин, произведен в остров Сардиня. Проверете твърдението, че извадката
е направена от популация, която има нормално разпределение.
Процентно съдържание на олеинова киселина (в %x100)
в 33 шишета италиански зехтин, произведен в остров Сардиня
7172, 7820, 7417, 7650, 6928, 6806, 7840, 7900, 6499, 6504, 7620, 6608,
7771, 7323, 7025, 7030, 7123, 7277, 7416, 7375, 7714, 7955, 6913, 7553,
7229, 7086, 6595, 7011, 7540, 8018, 6752, 7130, 7760, 6737, 7000, 6994,
7395, 7380, 7285, 6961, 7327, 6923, 7680, 7415, 7965, 7383, 7580, 7620,
7107, 6300, 7105, 6898, 7958, 7103, 7006, 6997
6948,
7650,
7955,
6630,
17.5. Изследват се материал А и материал В, от които се прави токчето
на луксозна дамска обувка. 30 жени са били избрани по случаен начин да
носят в продължение на шест месеца чифт обувки. За направата на токчето
на едната обувка е бил използван единият материал, а за другата – другият.
След приключване на експеримента е измерена височината на всеки ток в
точката, където износването е най-голямо, и получените данни са представени в таблица.
Материал А
Материал В
7,4; 6,25; 7,94; 7,47; 7,83; 9,5; 7,36; 7,34; 12,45; 9,53;
10,07; 6,97; 7,77; 7,88; 7,98; 6,6; 6,18; 10,29; 4,49; 6,66;
10,26; 9,35; 9,48; 6,34; 5,46; 6,71; 12,62; 7,03;
9,17; 10,65; 11,60; 11,36; 12,42; 9,6; 8,92; 11,48; 10,71;
8,29; 4,92; 9,57; 9,39; 6,42; 11,89; 9,35; 8,08; 8,58; 8,25;
7,88; 6,13; 11,03; 8,82; 11,65; 10,62; 5,01; 9,55; 12,69;
7,63;
8,07;
7,54;
6,91;
а) намерете точкови оценки на средното и на дисперсията на височината на токчетата, произведени от първия и от втория материал.
б) покажете, че разпределението на двете популации е нормално.
17.6. Една от дейностите на частна фирма е търговията със стоки. Направена е извадка със стойности на печалбата в лева при продажба на 20
изделия, която е:
2,20; 1,27; 1,28; 1,02; 1,42; 0,88; 1,65; 3,08; 2,63; 1,95; 2,44; 2,77; 2,45;
0,52; 0,28; 0,35; 2,48; 2,60; 0,45; 0.11.
Да се провери дали печалбата е нормално разпределена, като се използва χ2 критерия на Пирсън, като данните се групират в 4 интервала и се
използва ниво на значимост 0,05.
17.7. Използвайте χ2 критерия на Пирсън, за да проверите дали ръстът
(в см.) на 7-годишните деца е нормално разпределена случайна величина,
като се използват следните групирани данни:
интервали (aj-1,aj]
абсолютни честоти nj
(100;108] (108;116] (116;124] (124;132] (132;140]
3
7
12
6
2
97
17.8. При статистическо изследване върху теглото (в кг.) на 3-месечни
бебета са събрани данни, които са групирани и представени в таблица:
интервали (aj-1,aj]
абсолютни честоти nj
(3,8; 4,4]
1
(4,4; 5,0]
7
(5,0; 5,6]
9
(5,6; 6,2]
2
а) Използвайте χ2 критерия на Пирсън, за да проверите дали теглото на
3-месечните бебета е нормално разпределена величина;
б) Ако теглото е нормално разпределено, да се намери доверителен интервал за отклоненията в теглото на бебетата с доверителна вероятност
0,95.
98
18. Непараметрични тестове
Условие за използване: обеми на извадката n 40. (Пояснение: Критериите, описани по-долу се основават на гранични теореми и надеждността
им е висока при обеми на извадката n 40.)
Критерий на Колмогоров
Критерият на Колмогоров се основава на Теоремата на ГливенкоКантели. Той се използва за установяване вида на неизвестната функция
на разпределение F(x). Тестът за проверка се извършва по следния
Алгоритъм за проверка по критерия на Колмогоров
1. избира се ниво на съгласие α;
2. намира се вариационният ред на извадката;
3. намира се емпиричната функция на разпределение Fn(x);
4. изчислява се статистиката Dn=sup{|F(Х(k)) – Fn(Х(k))|}, разликите се
взимат като лява и дясна граница в точките Х(k);
5. намира се квантилът С1-α на разпределението на Колмогоров;
6. Вземане на решение:
ако Dn . n  C1 то хипотезата, че F(x) е търсеното разпределение, се
отхвърля;
ако Dn . n  C1 α то хипотезата, че F(x) е търсеното разпределение,
няма основание да се отхвърля.
Забележка. Тъй като табулации на разпределението на Колмогоров се
намират сравнително трудно, даваме най-често използваните стойности за
α=0,1; 0,05; 0,025; 0,01:
С0.9=1.22; С0.95=1.36; С0.975=1.48; С0.99=1.63.
χ2-тест за вида на разпределението
Хи-квадрат тестът е въведен от Карл Пирсън през 1899 г. и се използува за установяване вида на неизвестната функция на разпределение
F(x). Тестът се извършва по следния
Алгоритъм за хи-квадрат тест
1. избира се ниво на съгласие α;
2. намира се вариационният ред на извадката;
3. избира се брой на интервалите m>1;
4. реалната ос се разбива на m непресичащи се интервала i  (ai , ai 1 ],
i  1,2,..., m, a1  , am1  ;
5. намира се броят Мi на елементите от вариационния ред, принадлежащи на интервала  i за i  1,2,..., m;
6. намират се вероятностите pi  F (ai 1 )  F (ai );
7. намират се очакваните честоти Ei  n. pi ;
99
( M i  Ei ) 2
;
Ei
9. определя се броят на степените на свобода k=m-r-1, където r е
броят на оценените с помощта на извадката неизвестни параметри на разпределението F(x);
10. определя се квантилът 2 ( k );
11. Вземане на решение:
ако  2  2 (k ) то хипотезата, че F(x) е търсеното разпределение, се
отхвърля;
ако  2  2 (k ) то хипотезата, че F(x) е търсеното разпределение,
няма основание да се отхвърля.
8. пресмята се статистиката  2   im1
Основни функции на R:wilcox.test (); bartlett.test();ks.test().
18.1. Таблица съдържа данни за отклонението на нивото на водата на
язовир около желаното, измерено през 30 случайно избрани часа на изминалата седмица. Проверете хипотезата, че нивото на водата в язовира се е
понижило.
Данни за отклонението на нивото на водата на язовир около желаното
0,38; -1,04; -1,85; -0,43; 0,94; -0,77; -0,52; -1,57; -0,27; -1,80; -1,32; -0,30; 1,52; 0,68; -1,04; -1,46; -1,87; -2,13; -0,26; 2,89; 1,02; -1,59; 0,20; 0,28; -2,00;
-2,30; -2,12; -2,06; -0,12; 0,44;
18.2. Като използвате данните от задача 17,5 и при липса на информация
за вида на вероятностното разпределение на популацията проверете твърдението, че първият материал се износва по-бързо. Формулирайте подходящи
хипотези и ги тествайте при ниво на значимост 0,05.
18.3. Във връзка с профилактичните медицински изследвания, на случайно избрани 40 жени на възраст между18 и 24 години е измерена дневната доза калций (в милиграми), които те приемат с храната. Получените
данни са дадени в следната таблица:
808
61
626
1156
882
716
774
684
1062
438
1253
1933
970
1420
549
748
909
1425
1325
1203
802
948
446
2436
374
1050
465
1255
416
976
696
110
784
572
671
1025
997
403
1269
2610
а) Намерете числовите характеристики на извадката. Сравнете средното и медианата.
б) Визуализирайте данните графично.
в) Може ли твърдим, че извадката е направена от нормална популация?
При предположение, че случайната извадка е направена от популация,
чието вероятностно разпределение не е нормално:
г) проверете твърдението, че средната дневна доза калций, които жените приемат, е 900 милиграма.
100
д) Построите 99% доверителен интервал за средната доза калций, приеман от жените между 18 и 24 години.
18.4. Еритроцитите участват в регулацията на йонния състав на кръвта,
тъй като тяхната мембрана е пропусклива за аниони и непроницаема за катионите и хемоглобина. Искаме да проверим хипотезата,че съдържанието на
еритроцити в кръвта на мъжете е по голямо от съдържанието на еритроцити в
кръвта на жените. За тази цел сме направили случайна извадка от клинична
лаборатория на изследванията на 120 мъже и 173 жени. Нямаме информация
за вероятностните разпределения на популациите. Работим с ниво на съгласие
0,1. Получените данни са представени в таблица.
Съдържание на еритроцити в кръвта на мъжете:
0,52; 0,48; 0,58; 0,48; 0,40; 0,44; 0,42; 0,52; 0,48; 0,47; 0,43; 0,51; 0,43; 0,40;
0,39; 0,48; 0,42; 0,41; 0,37; 0,49; 0,40; 0,47; 0,54; 0,44; 0,44; 0,36; 0,40; 0,48;
0,40; 0,49; 0,43; 0,38; 0,46; 0,41; 0,50; 0,35; 0,61; 0,36; 0,43; 0,54; 0,41; 0,48;
0,52; 0,43; 0,49; 0,42; 0,44; 0,50; 0,52; 0,54; 0,45; 0,42; 0,53; 0,51; 0,44; 0,52;
0,43; 0,50; 0,47; 0,51; 0,49; 0,47; 0,38; 0,49; 0,53; 0,59; 0,47; 0,40; 0,42; 0,52;
0,45; 0,55; 0,44; 0,33; 0,31; 0,55; 0,40; 0,46; 0,54; 0,45; 0,49; 0,43; 0,56; 0,47;
0,41; 0,48; 0,52; 0,52; 0,42; 0,41; 0,33; 0,35; 0,40; 0,36; 0,41; 0,29; 0,50; 0,47;
0,57; 0,47; 0,44; 0,46; 0,51; 0,39; 0,49; 0,48; 0,46; 0,49; 0,49; 0,43; 0,49; 0,47;
0,54; 0,50; 0,46; 0,41; 0,40; 0,51; 0,48; 0,40
Съдържание на еритроцити в кръвта на жените:
0,41; 0,45; 0,49; 0,43; 0,38; 0,48; 0,47; 0,40; 0,43; 0,39; 0,48; 0,46; 0,38; 0,37;
0,45; 0,47; 0,39; 0,46; 0,40; 0,43; 0,39; 0,47; 0,49; 0,43; 0,39; 0,44; 0,49; 0,42;
0,43; 0,45; 0,49; 0,51; 0,53; 0,44; 0,43; 0,44; 0,46; 0,46; 0,35; 0,31; 0,46; 0,42;
0,37; 0,39; 0,49; 0,44; 0,49; 0,38; 0,41; 0,40; 0,45; 0,46; 0,35; 0,42; 0,33; 0,49;
0,42; 0,33; 0,41; 0,41; 0,33; 0,41; 0,39; 0,44; 0,40; 0,35; 0,44; 0,40; 0,44; 0,40;
0,37; 0,37; 0,44; 0,37; 0,45; 0,45; 0,39; 0,38; 0,49; 0,40; 0,43; 0,51; 0,46; 0,36;
0,47; 0,39; 0,46; 0,43; 0,30; 0,36; 0,54; 0,37; 0,45; 0,43; 0,35; 0,38; 0,42; 0,44;
0,50; 0,43; 0,44; 0,43; 0,43; 0,42; 0,49; 0,36; 0,34; 0,42; 0,41; 0,32; 0,42; 0,45;
0,47; 0,44; 0,54; 0,38; 0,53; 0,45; 0,40; 0,32; 0,41; 0,44; 0,44; 0,40; 0,42; 0,38;
0,47; 0,46; 0,41; 0,45; 0,49; 0,40; 0,39; 0,48; 0,35; 0,35; 0,35; 0,38; 0,44; 0,38;
0,50; 0,38; 0,44; 0,44; 0,38; 0,43; 0,47; 0,43; 0,48; 0,42; 0,46; 0,45; 0,41; 0,38;
0,38; 0,41; 0,40; 0,48; 0,49; 0,44; 0,48; 0,45; 0,47; 0,41; 0,42; 0,33; 0,46; 0,37;
0,38; 0,42; 0,41; 0,45; 0,30
18.5. Полипептидната верига е права и неразклонена верига от аминокиселини. Ще сравним дължините на полипептидните вериги на два организма, които често са обекти на изследвания в генетиката – плодовата мушица
(Drosophila melanogaster) и едно растение от семейство Кръстоцветни
(Arabidopsys thaliana). Дължините на полипептидните вериги варират. При
плодовата мушица (Drosophila melanogaster) генът AGO1 присъства в хромозома 2R като протеинът, който кодира, е с дължина 984 аминокиселини. В
хромозома 3L същият ген кодира белтък с дължина на полипептидната вери-
101
га 1214 аминокиселини. При Arabidopsys thaliana генът AGO1 присъства в
хромозома 1, като протеинът кодиран от съответния ген е с дължина на полипептидната верига 1048 аминокиселини. В хромозома 5, същият ген експресира синтезата на полипептидна верига с дължина 988 аминокиселини.
Да се провери статистически твърдението, че при Drosophila melanogaster
средната дължина на полипептидната верига е по голяма от тази при
Arabidopsys thaliana. Данните СА дадени в таблицата по-долу. Използвайте
95% ниво на съгласие.
Дължини на полипептидни верига при Drosophilamelanogaster
938; 940; 1014; 990; 1011; 1025; 1085; 1083; 1074; 961; 1143042; 1050; 974;
1045; 968; 995; 968; 989; 971; 1000; 963; 1160; 1101; 958; 1031; 1140; 1062;
959; 1095; 1110; 1046; 926; 961; 1048; 1028; 1085; 1029; 1020; 1046;
Дължини на полипептидни вериги при Arabidopsysthaliana
1055; 1073; 1033; 1103; 1180; 1169; 1037; 1133; 998; 1126; 1094; 1130; 1161;
1031; 1121; 1032; 1072; 1086; 1229; 996; 1144; 1069; 1051; 1056; 1133; 1137;
1017; 1178; 1151; 1125; 1125; 1056; 1075; 1014; 1172; 1100; 1160; 1085; 1196;
1043;
18.6. Клетката е структурна и функционална единица на всички живи
организми и понякога е наричана „най-малката единица на живот“. Има
два вида клетки: прокариотни и еукариотни. Прокариотните клетки не
притежават обособено ядро. Еукариотните са растителни и животински
клетки. Невронните клетки и мускулните влакна се отнасят към животинските клетки. Техните размери варират.
Данните от квантомеханичното измерване на размерите на 30 невронни
клетки и на 30 мускулни влакна с електронен микроскоп са дадени в таблицата по-долу.
Да се направи описателна статистика на данните и да се провери твърдението, че средният размер на невронните клетки е по-голям от средния
размер на мускулните влакна. Работете с ниво на значимост 0.05.
Размерите на невронните клетки от извадката:
31,50; 36,41; 40,80; 40,84; 37,83; 42,88; 41,08; 39,18; 38,92;
43,83; 39,20; 41,80; 35,95; 33,54; 35,13; 40,84; 43,42; 40,00;
36,17; 44,61; 40,41; 41,13; 35,81; 37,48; 38,97; 43,78;
Размерите на мускулните влакна от извадката:
11,03; 10,96; 11,01; 11,00; 10,98; 10,98; 11,00; 10,93; 11,06;
11,02; 10,90; 10,87; 10,96; 11,02; 11,01; 11,05; 11,03; 11,07;
10,96; 10,95; 10,96; 11,11; 11,10; 11,03; 11,07; 11,00;
36,46; 45,95;
38,22; 47,22;
11,03; 11,03;
11,03; 10,99;
18.7. Размножаването е една от основните характеристики на живота.
То осигурява възпроизводството на поколенията и запазването на вида.
102
Искаме да проверим хипотезата, че раждаемостта в градовете на България
е по-голяма от раждаемостта в селата. Работим с ниво на съгласие 0,01.
Данните от направената случайна извадка са представени в таблица. Данните за раждаемостта в градовете и селата са представени като „брой родени за една година на 1000 души от населението“.
Градове
Села
1970
18,0
14,6
1980
15,7
12,4
1990
12,6
10,9
1995
8,8
8,0
2000
9,5
8.,1
2005
9,6
8,1
2006
10,1
8,3
2007
10,4
8,5
2008
10,8
8,7
18.8.Плевенски кон е местна за България, но слабо разпространена полукръвна спортна порода коне създадена в резултат на многогодишна селекция. В миналото плевенските коне са използвани предимно за селскостопанска работа и за нуждите на армията.
Каракачанският кон е най-запазената порода от всички местни примитивни коне. Това се дължи на консервативните животновъдни традиции на
каракачаните. Конете, които не са били използвани в момента от хората, са
оставали през цялата година високо в планината на групички сами в табуни като сами са се грижели за себе си. Дори и през студените зими те са
намирали храна и са се защитавали от хищници. По този начин качествата
на породата са се закрепвали с помощта и на естествен подбор.
Направена е случайна извадка от 35 плевенски коня и 28 каракачански
коня, на които е измерена височината при холката. (Холката е част от
тялото на коня, която е дълга, добре изразена при повечето животни и е
свързана с гърба.) Получените данни са представени в таблицата по-долу.
Височина на плевенските коне от извадката:
161,48; 161,54; 161,21; 162,05; 163,20; 161,56; 159,94; 161,27; 161,71; 161,31;
161,53; 161,63; 162,23; 160,17; 161,22; 161,07; 162,96; 161,47; 161,50; 161,66;
161,35; 161,22; 161,74; 161,96; 162,18; 161,62; 162,46; 160,55; 161,17; 161,77;
161,94; 161,93; 162,53; 160,72; 161,60;
Височина на каракачанските коне от извадката:
127,70; 127,23; 128,07; 127,02; 127,57; 127,63; 127,69; 127,81; 128,07; 127,91;
127,80; 128,09; 128,62; 127,90; 128,72; 127,66; 127,94; 127,64; 127,92; 128,23;
128,32; 127,62; 127,70; 128,21; 127,75; 128,35; 127,89; 128,23;
Липсва информация за вида на вероятностните разпределения на популациите.Да се провери хипотезата, че височината на плевенския кон е поголяма от височината на каракачанския кон?
18.9. Като се използват данните от задача 18.7 да се провери хипотезата, че в България раждаемостта в градовете е различна от раждаемостта в
селата. Използвайте ниво на съгласие α=0,05.
18.10. Изследване във Великобритания е насочено към най-активните
„сърфисти“ в Интернет. Времето, което 50 случайно избрани пенсионери
103
прекарват седмично в интернет и за което 60 тийнейджъри стоят онлайн е
дадено в таблица.
пенсионери
тийнейджъри
39, 44, 44, 40, 42, 43, 44, 43, 38, 39, 39, 38, 43, 40, 40, 42, 38,
44, 41, 46, 44, 41, 45, 44, 42, 44, 40, 35, 45, 41, 47, 46, 40, 45,
43, 40, 41, 39, 38, 36, 41, 39, 42, 39, 40, 46, 39, 39, 39, 45
33, 13, 19, 27, 18, 30, 12, 33, 25, 24, 28, 26, 24, 29, 26, 27, 23,
23, 25, 26, 30, 21, 16, 24, 25, 26, 27, 21, 30, 26, 28, 28, 29, 20,
19, 27, 16, 23, 26, 29, 22, 20, 23, 24, 27, 27, 18, 20, 13, 30, 24,
25, 26, 27, 21, 30, 26, 28, 28, 29
Като използвате данните проверете хипотезата, че пенсионерите прекарват седмично повече време в Интернет отколкото тийнейджърите. Работете с ниво на значимост 0,05.
18.11. Морското свинче (Cavia porcellus) спада към сем. Свинчета
(Cavidae). Негова родина е Южна Америка, където обитава и днес в диво
състояние долините на Андите. Още преди 4000 години този кротък гризач
е бил напълно одомашнен от древните инки, които го използвали за храна.
Морските свинчета са пренесени през 18-ти век от Джеймс Кук през море
и заради това се казват „морски“, а се наричат свинчета, заради специфичните звуци, които издават. Един от лейтенантите на Кук, Джон Гор, прибрал тайно от склад на местно племе ковчеже с 22 морски свинчета. В таблицата по-долу са дадени стойностите за теглата на свинчетата, открити в
счетоводни записи същия моряк. Да се провери хипотезата, че женските
тежат по-малко от мъжките.
Пол
♂ (9)
♀ (14)
104
Тегло (g)
1234, 1080, 1182, 820, 1120, 1498, 929,1090, 1029
1080, 676, 981, 997, 1053, 739, 709, 1066, 1043,
760, 840, 888, 1015
19. Елементи на регресионен и дискриминантен анализ
Регресионен анализ
Задачата на регресионния анализ е да прогнозира стойностите на зависими количествени променливи в зависимост от зададени стойности на
независимите променливи. Линейният регресионен модел се представя с
формулата:
y=a+bx+e,
където a и b са коефициентите на модела, x е независимата променлива
(предиктор), y е зависимата променлива (отклик), а e е грешката, за която се изисква да е нормално разпределена случайна величина с нулево
очакване.
Разликите между наблюдаваните и оценените от регресионния модел
стойности на отклика се наричат остатъци. В модела те са нормално
разпределени и независими помежду си.
Алгоритъм на линейна регресия с R:
Вход:
Два вектора с еднакви дължини, съдържащи данните съответно за
независимата и зависимата променлива.
Данни за нови наблюдения, за които трябва да прогнозираме зависимата променлива
Изход: Прогнозираните стойности на отклика
1. Предварителен анализ на данни.
1.1. С функцията plot() визуализираме данните. Обикновено предикторът се визуализира върху абцисната ос, а отклика – върху ординатната ос.
1.2. С функцията cor() пресмятаме извадковия корелационен коефициент.
1.3. Ако точките от графиката са разпръснати около една хипотетична права и абсолютната стойност на корелационния коефициент е близка до 1, то преминаваме към следващата стъпка.
2. Построяване на модел.
2.1. С функцията lm() намираме оценките на коефициентите на модела.
2.2. С функцията summary() проверяваме хипотезите за нулева
стойност на коефициентите на модела.
3. Проверка за адекватност на модела: с помощта на остатъците.
3.1. С командата plot (lm(y~x), which=1) начертаваме т.н. графика
на остатъците. Тя ще ни даде информация доколко остатъците са случайни и независими.
3.2. С командата plot (lm(y~x), which=2) начертаваме т. н. нормална графикана остатъците. Тя ще ни даде информация доколко
вероятностното разпределение на остатъците е близко до
нормалното.
105
3.3. Ако точките от графиката на остатъците формират облак и
точките от нормалната графика лежат върху диагонала, то
приемаме, че моделът е адекватен и преминаваме към следващата сръпка.
4. Визуализиране на модела. С функциите plot() и abline() визуализираме модела.
5. Прогнозиране. С функцията predict() прогнозираме стойностите на
отклика при нови наблюдения на предиктора.
Дискриминантен анализ
Дискриминантният анализ се използва когато популацията, която изучаваме, се състои от няколко под-популации (класове) и целта е за дадено
наблюдение да открием под-популацията, към която то принадлежи.
В модела на дискриминантния анализ има една категорийна променлива, която разбива популацията на краен брой под-популации, и няколко
количествени променливи, които представят наблюдаваните характеристики на тези под-популации. Двата модела, които разглеждаме, изискват нормално разпределение на под-популациите.
Алгоритъм за прилагане на дискриминантен анализ:
Вход:
 Данните за всеки клас са представени като двумерна матрица. Броят
на редовете е равен на броя на наблюденията. Броят на стълбовете е
равен на броя на променливите.
 Данни за нови обекти, за които трябва да прогнозираме подпопулацията към която те принадлежат.
Изход:
Прогнозиранитепод-популации, към които принадлежат новите обекти.
1. Избор на предиктори. Ще изберем независимите променливи, които ще бъдат включени в модела. За всяка променлива проверяваме
нейното дискриминантно свойство по следния начин:
1.1 Ако вероятностното разпределение на под-популациите е неизвестно, проверяваме хипотези за нормалност. В дискриминантния анализ включваме всички променливи които са нормално
разпределени и продължаваме със стъпка 1.2. Ако нямаме такива променливи не можем да решим задачата с разгледаните тук
методи на дискриминантния анализ.
1.2 Проверяваме хипотези за равенство на дисперсиите на подпопулациитес функцията bartlett.test(). Ако дисперсиите на подпопулациите са равни, проверяваме хипотезата за равенство на
средните с функцията anova(). В противен случай използвамефункцията oneway.test().
1.3 Ако популационните средни са различни, то тази променлива е
предиктор.
106
1.4 С функцията cor() пресмятаме извадковитекорелационни коефициенти. Ако техните стойности са около нулата, то избраните предиктори са некорелирани. От това, че вероятностното разпределение е нормално следва и тяхната независимост.
2. Обучение. От данните ще генерираме правилата, които разделят
популацията на подпопулации, т.е.дискриминантните правила.
2.1 С командата library (MASS) зареждаме библиотеката, която
реализира дискриминантния анализ в R.
2.2 Ако популационните дисперсии са равни, използваме линеен дискриминантен анализ с функцията lda(). В противен случай използваме квадратичен дискриминантен анализ с функцията
qda(). Резултатът от тази стъпка е, че намерихме дискриминантните правила.
3. Тестване. Ще проверим дали получените дискриминантни правила
работят коректно.
3.1 С функцията predict() тестваме тези правила върху известните
ни обекти от извадката.
3.2 С функцията table() визуализираме прогнозираните и реалните
данни в таблица. Ако достатъчно много обекти са класифицирани правилно, можем да очакваме, че получените дискриминантни правилата са добри и коректно ще работят и за обекти
с неизвестен клас.
4. Прогнозиране. С функцията predict() проверяваме принадлежността на новите наблюдения към съответната група.
Основни функции на R: lm(); plot(); cor(); summary()
19.1. В таблицата по-долу е дадено съдържанието на две често срещани
наситени мастни киселини в извадка от 60 липидни фракции на италиански
зехтин (% x100). Постройте линеен регресионен модел на връзката между
палмитиновата и стеариновата киселина. Адекватен ли е модела? Защо?
Мастни
киселини
Съдържанието на палмитиновата и стеариновата мастни киселини в извадка от 60 липидни фракции на италиански зехтин
(% x100)
Палмитинова 1213, 1348, 1272, 1020, 1131, 1105, 1527, 1283, 1092, 1387, 1284,
киселина
1306, 1020, 1076, 1255, 1065, 1336, 1075, 1252, 1340, 1085, 961,
1590, 1463, 1355, 1290, 1176, 1267, 1160, 1412, 1107, 1514, 1100,
1040, 911, 1070, 1178, 1457, 1180, 1118, 1120, 1090, 1090, 1055p,
1387, 1394, 1360, 1220, 1393, 1090, 1438, 960, 1241, 1060, 905,
1517, 1400, 1419, 1207, 1140
Стеаринова 245, 183, 205, 220, 208, 373, 232, 196, 210, 204, 265, 226, 260,
киселина
202, 223, 245, 223, 200, 181, 189, 180, 195, 195, 183, 214, 260,
205, 300, 230, 217, 220, 298, 250, 250, 268, 188, 241, 267, 250,
199, 240, 190, 220, 175, 206, 223, 176, 240, 211, 192, 248, 200,
268, 175, 288, 249, 270, 207, 156, 220
107
x
y
4.11
56.2
5.18
40.0
4.52
45.9
5.49
45.3
4.89
38.5
1.11
32.4
x
y
5.35
31.0
2.09
50,0
0.6
18.2
6.53
30.1
1.40
45.8
3.80
56.1
19.2. В таблицата x са летните валежи през 1981 – 1991, а y е стойността на продукцията боровинки на холандски ферми (измерена в 1000 евро).
Представете данните графично. Подходящ ли е линейният регресионен
модел за описване на тези данни?
19.3. Да се построи линеен регресионен модел, описващ процентното
съдържание на палматиновата киселина в зехтина в зависимост от съдържанието на олеиновата киселина. Процентното съдържание на тези киселини, открито в 60 липидни фракции на италиански зехтин (% x100) е дадено в таблицата по-долу.
Мастна
киселина
Процентно съдържание на омега ненаситените мастни киселини,
открити в 60 липидни фракции на италиански зехтин (% x100)
112, 154, 207, 100, 87, 69, 260, 153, 37, 154, 93, 149, 90, 77, 103, 45,
Палматинова 185, 91, 180, 114, 70, 70, 241, 183, 144, 60, 75, 101, 70, 185, 75, 162,
киселина
90, 90, 49, 75, 92, 182, 80, 85, 90, 60, 60, 60, 182, 164, 163, 80, 128,
58, 206, 90, 97, 75, 49, 206, 90, 192, 151, 180
7007, 6917, 7152, 7530, 7170, 7714, 6488, 7107, 7955, 6991, 7235,
7082, 7620, 7243, 7395, 7779, 6956, 7410, 7055, 7337, 7955, 7958,
Олеинова
6705, 6747, 6972, 7550, 7396, 7230, 7860, 6842, 7399, 6725, 7680,
киселина
7780, 7924, 7980, 7006, 7020, 7870, 7415, 7068, 7950, 7890, 7985,
7100, 7086, 6901, 7610, 7189, 7950, 6806, 7810, 7499, 7975, 7747,
6680, 7420, 6996, 7159, 7610
19.4. Във вестник NY Times са публикувани цените (в долари) на продадените на търг през 1995 година имоти в щата Ню Йорк от агенция за
недвижими имоти (виж таблицата по-долу).
а) Проверете хипотезата, че обявената цена се различава от продажната
цена.
б) Построите линеен регресионен модел, предсказващ цените за продажба на имотите.
Обявена Продажна
Обявена Продажна
Продажна
№
№
цена
цена
цена
цена
цена
№
Обявена
цена
1
382000
399900
21
222000
249900
41
66400
69900
2
166000
189900
22
285000
323900
42
154000
158900
3
145000
154900
23
320000
379000
43
70900
70900
4
465000
479500
24
145000
154888
44
280000
299000
108
5
105000
107500
25
118000
139000
45
190000
205000
6
190000
199900
26
205000
214900
46
89900
89900
7
132000
139900
27
147500
159000
47
638000
675000
8
273000
289000
28
309000
319000
48
384900
384900
9
50000
50000
29
166000
174900
49
173000
184900
10
167000
189900
30
114500
117000
50
126000
134900
11
191150
191900
31
355000
369900
51
430000
439900
12
210000
219900
32
176000
179000
52
825000
875000
13
235000
243000
33
250000
250000
53
290000
314900
14
202500
225000
34
158000
165000
54
149000
149900
15
275000
295000
35
315000
315000
55
182000
182000
16
142750
145500
36
71000
75000
56
179000
179000
17
71900
73900
37
71000
79900
57
440000
459000
18
249900
249900
38
280000
289000
58
63750
74900
19
103000
105500
39
150000
159000
59
350000
359000
20
428000
439000
40
158000
165000
19.5. Данните (в mg/kg) от една случайна извадка за съдържанието на
олово в костите на рибите, в мускулите, в черния дроб и в кожата на рибите в язовир край комбинат за цветни метали са представени в таблицата подолу. Построите линеен регресионен модел прогнозиращ съдържанието на
олово в костите на рибите
а) в зависимост от съдържанието на олово в мускулите;
б) в зависимост от съдържанието на олово в черня дроб;
в) в зависимост от съдържанието на олово в кожата;
г) в зависимост от съдържанието на олово във всички изследвани органи.
д) Сравнете моделите и направете извод.
е) Можете ли да прогнозирате от кой орган на рибата е взета проба, която показва съдържание на олово 17,253 mg/kg?
№
Кости Мускули
[1]
[2]
[3]
[4]
[5]
[6]
[7]
1,755
1,886
1,780
0,790
1,278
1,687
1,906
1,617
1,671
1,578
0,657
1,629
2,231
1,060
Черен
дроб
7,389
10,347
5,036
3,439
10,426
14,749
8,401
Кожа
№
Кости Мускули
1,731
1,970
1,338
1,046
1,495
2,363
1,519
[37]
[38]
[39]
[40]
[41]
[42]
[43]
0,586
0,810
0,355
0,275
1,031
1,352
0,663
0,345
0,351
0,276
0,187
0,230
0,984
0,896
Черен
дроб
3,213
5,073
1,843
1,385
5,757
11,150
4,325
Кожа
0,420
0,473
0,265
0,182
0,801
0,709
0,680
109
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
[34]
[35]
[36]
0,875
1,467
1,776
1,199
1,056
1,871
1,796
1,192
1,379
1,856
2,189
0,859
1,039
1,741
2,877
2,024
0,934
0,316
1,050
1,180
0,430
0,505
0,892
0,480
0,347
0,218
0,339
0,270
0,219
0,905
1,102
1,085
0,903
0,760
1,193
1,212
0,540
0,950
1,338
1,846
1,313
0,690
1,543
1,717
1,585
0,777
0,187
1,022
0,588
0,116
0,182
0,521
0,112
0,096
0,151
0,108
0,127
0,050
3,658
3,357
5,624
2,043
3,017
4,122
8,270
3,233
3,273
3,977
13,911
10,788
6,519
4,893
16,344
11,233
5,331
1,888
2,395
2,003
1,999
1,833
3,200
1,321
1,160
2,005
2,615
2,378
2,335
1,229
1,603
1,887
1,633
1,046
2,081
2,926
1,962
1,679
1,295
1,723
1,253
1,154
2,109
2,646
1,670
1,063
0,778
1,200
0,801
0,894
0,998
1,112
0,996
0,979
0,546
0,566
0,519
0,345
[44]
[45]
[46]
[47]
[48]
[49]
[50]
[51]
[52]
[53]
[54]
[55]
[56]
[57]
[58]
[59]
[60]
[61]
[62]
[63]
[64]
[65]
[66]
[67]
[68]
[69]
[70]
[71]
[72]
0,346
1,401
1,778
0,911
0,920
0,422
1,230
0,686
0,518
0,975
1,075
1,619
1,545
0,280
0,969
0,873
0,491
0,381
0,610
0,998
0,695
1,060
1,467
1,436
1,680
1,072
1,419
1,505
1,529
0,913
0,700
1,220
0,700
0,550
0,048
0,258
0,095
0,097
0,162
0,101
0,446
0,123
0,045
0,338
0,305
0,148
0,212
0,251
0,885
0,413
0,085
0,679
0,255
0,214
0,261
0,750
1,091
1,175
3,175
7,805
17,003
4,325
4,400
0,620
2,664
2,606
1,887
3,798
3,868
9,206
4,497
0,816
3,309
3,207
1,900
2,214
2,762
4,900
3,759
2,400
5,610
3,142
2,483
4,521
5,011
7,932
7,252
0,777
0,992
1,042
0,854
0,645
0,603
0,820
0,864
0,778
1,095
1,209
1,962
1,859
0,270
0,539
0,510
0,396
1,087
1,253
1,295
1,383
1,070
1,788
1,414
1,398
2,175
2,109
1,764
1,485
19.6. Следващата таблица съдържа данни за седмичните разходи (Y) на
61 случайно избрани американски семейства и седмичните доходи (X) (в
долари).
X
Y
X
Y
110
80
55
140
103
80
60
140
108
80
65
140
113
80
70
140
115
80
75
160
102
100
65
160
107
100
70
160
110
X
Y
X
Y
X
Y
X
Y
X
Y
X
Y
X
Y
200
145
100
74
160
116
220
162
120
94
180
135
260
150
220
135
100
80
160
118
240
137
120
98
180
140
260
152
220
137
100
85
160
125
240
145
140
80
200
120
260
175
220
140
100
88
180
110
240
155
140
93
200
136
260
178
220
152
120
79
180
115
240
165
140
95
200
140
260
180
220
157
120
84
180
120
240
175
140
103
200
144
260
185
220
160
120
90
180
130
240
189
260
191
а) Пресметнете извадковия корелационен коефициент.
б) Представете данните графично.
в) Построите линеен регресионен модел, описващ данните.
19.7. Таблицата съдържа данни за дневната консумация на кафе (y) в
САЩ, измерена в брой чаши, и цената на една чаша кафе (x) в долари.
x
y
2,5; 0,5; 2; 3,5; 1; 0,5; 2,5; 2,6; 3; 2; 0,5; 0,4; 0,6; 4; 0,5; 3,5; 3,9; 4,7; 1,9; 0,9; 5;
1,5; 0,8; 1,5; 2,7; 1,7; 1,7; 0,7; 4; 5; 1,2; 1,9; 2,6; 3,6; 0,5; 3,6; 4,4; 4,8; 0,8; 5,2;
2; 3; 2; 1; 2; 3; 2; 2; 1; 2; 3; 3; 3; 1; 3; 1; 1; 1; 2; 2; 1; 2; 3; 2; 2; 2; 2; 3; 1; 1; 2; 2; 1;
1; 3; 1; 1; 1; 2; 1;
а) Построите линеен модел, описващ броя на изпитите кафета дневно в
зависимост от цената.
б) Интерпретирайте коефициентите на модела.
19.8. Всяка седмица се провежда проучване на настроението на инвеститорите от Американската асоциация на индивидуалните инвеститори
AAII. Настроението на инвеститорите се представя с числото i, където i(100,100). SP500 е индекс, който отразява състоянието на американската
икономика. За неговото определяне се използват 500-те най-големи американски компании. SP500 е положително число.
По случаен начин са избрани 39 седмици в периода март 2008 – март
2010 година и са записани тези два индекса. Резултатите са представени в
таблица.
Съществува ли линейна зависимост между променливите i и SP500?
Защо?
111
i
SP500
i
SP500
i
SP500
i
SP500
i
SP500
13.64
909.73
20
1150.24
15
1141.69
-33.34
1066.63
-8.25
906.83
-19.74
843.74
9.65
1122.97
26.23
1115.1
4.77
1092.91
-26.74
882.68
-19.11
827.5
5.37
1102.94
0
1126.48
13.52
1096.56
-30.67
931.8
-21.98
845.14
0.63
1106.75
13.69
1096.08
-6.14
1065.48
5.49
1165.83
-19.4
845.85
-5.13
1078.47
7.31
1102.35
8.07
1029.85
20.52
1148.46
-6.33
835.19
-13.85
1063.11
7.92
1099.92
-5.46
1050.78
0
1087.24
-35.08
778.94
-1.67
1084.53
0
1094.9
2.14
1065.49
-13.1
918.37
-30.84
752.83
5.26
1116.48
10.91
1094.9
-6.67
1044.14
Обективни текстове
68,864
47,560
62,940
61,560
59,920
56,761
48,759
53,988
61,865
65,738
47,212
51,237
44,335
44,454
36,847
57,047
59,077
99,415
64,516
125,00
94,203
103,175
45,801
48,544
71,428
43,165
58,394
22,857
64,327
72,464
55,118
68,965
52,636
109,375
212,121
391,304
111,111
266,667
411,765
263,158
384,615
76,923
400,00
200,00
416,667
434,783
230,769
424,242
380,952
111,111
444,444
11,041
42,105
26,570
38,235
30,812
13,698
26,981
27,778
29,851
22,039
24,752
19,464
34,146
45,34
11,521
11,655
36,796
1,577
5,263
9,662
11,765
14,006
2,283
15,177
0,000
0,000
16,529
4,95
2,433
14,634
5,038
0,000
9,324
17,316
12,618
18,421
21,739
23,529
22,409
15,982
15,177
21,825
29,851
19,284
17,327
19,465
14,634
10,076
16,129
13,986
23,809
637,824
633,176
657,498
664,946
647,645
582,611
561,177
623,462
619,322
648,236
618,695
639,155
642,414
649,50
608,835
617,122
614,052
Субективни
текстове
19.9.Целта на настоящето изследване е да проверим дали изказването
на един политик по ефира на Националната телевизия е обективно или
лобира за интересите на определена група. За тази цел сме анализирали
обективни и субективни текстове. За всеки текст сме измерили по 7 лингвистични характеристики. Получените данни са представени в таблицата:
27,284
42,927
34,541
34,774
27,448
29,49
48,517
52,239
41,667
23,923
219,298
182,927
295,775
308,824
174,419
16,598
15,686
16,778
38,076
23,881
4,149
0,000
1,678
4,008
5,970
12,448
11,7645
13,423
14,028
5,970
651,592
647,578
641,460
636,762
663,009
112
40,588
30,053
43,709
44,028
45,286
51,403
34,684
49,375
64,885
67,447
52,937
74,722
48,738
35,023
37,546
30,897
27,204
49,411
37,143
29,325
23,324
31,496
35,294
53,571
65,574
24,896
49,834
8,584
19,048
58,020
37,681
29,810
35,37
23,952
156,627
294,737
144,00
244,186
270,492
219,78
204,30
166,667
92,593
275,362
271,605
298,70
202,247
195,876
176,471
173,228
179,775
19,834
36,325
29,508
28,302
24,952
39,723
41,198
19,569
16,632
20,704
11,161
26,03
16,736
23,897
32,549
34,707
26,253
8,264
0,000
4,918
4,717
7,677
5,181
0,000
1,957
0,000
0,000
4,465
0,000
2,09
0,000
5,425
2,169
0,000
4,958
4,273
13,115
12,579
7,677
8,636
7,49
11,742
4,158
4,141
0,000
0,000
6,276
16,544
18,083
6,508
9,546
640,359
653,482
659,991
656,534
649,239
659,901
640,715
633,656
646,503
648,893
646,033
647,924
636,255
615,728
631,540
629,295
679,083
От текста на изказването на политика са пресметнати лингвистичните
характеристики и са получени следните данни:
27; 23,9; 174,4; 23,8; 5,97; 5,91; 663;
113
20. Комплексни задачи по статистика
Предложените в тази глава задачи обединяват различни дялове от
статистиката и са предназначени основно за самостоятелна работа.
20.1. Смартфон (smartphone – умен телефон) е мобилен телефон c разширена функционалност, сравнима с джобните компютри. Смартфоните се
отличават от обикновените мобилни телефони с наличието на достатъчно
развита операционна система. Най-често тя е отворена за разработка на
приложен софтуер от странични разработчици. Добавянето на допълнителни приложения позволява значително да се подобрят възможностите и
функционалностите на смартфоните в сравнение с обикновените мобилни
телефони.
Фондация за хора с наднормено тегло организира сбирки за членовете
си по градове. За да може всеки член лесно да открие местоположението и
да знае времето на срещата фондацията поръчала на софтуерна компания
да разработи приложение за смартфон, което всеки неин член лесно да
инсталира на мобилния си телефон и чрез него фондацията да изпраща до
всеки необходимата му информация. Компанията добавила функционалност, която при всяко използване на приложението да записва името на
потребителя (т. е. id на телефона на потребителя), часа и датата. Като използвате извадката на броя потребители за ден от случайно избрани 33
дни, представена в таблицата, построите 95% доверителен интервал за
средния брой потребители дневно и проверете твърдението на фондацията,
че средният брой потребители дневно е 30 човека.
Брой потребители в извадката: 15, 0, 2, 5, 10, 7, 12, 12, 14, 10, 20, 31, 18,
17, 18, 21, 23, 20, 16, 26, 27, 32, 38, 36, 43, 58, 0, 29, 55, 67, 72, 101, 115
20.2. Съдържанието на болестотворни бактерии в почвата може да доведе различни инфекциозни заболявания. Изследвани са картофи от замърсена почва в района на с. Стрелци, в които е намерено наличие на бактериите Micrococcus и на ентерококи, които са нормални обитатели на чревния
канал и присъствието им във почвата говори за прясно фекално замърсяване. Изследвана е почвата, където са виреели картофите и са намерени бактерии и там. Годността на почвата се определя от нейния колититър – наймалкото количество почва, изразено в кубични cm, което съдържа поне
една клетка от Micrococcus. Известно е, че при колититър по-голям от 100
см3 почвата е годна за садене.
Започнато е изследване на почвата в случайно избрани места от района
на цялото селище и са открити следните стойности (в кубични cm):
102, 100, 110, 95, 101, 105, 109, 89, 109, 111, 99, 97, 87, 96, 120, 112, 109,
121, 115, 112, 96, 102, 110, 109, 100, 105, 108, 83, 104, 102, 107, 99, 104,
114, 110, 94, 117, 123;
а) Пресметнете числовите характеристики на дадените данни.
б) Представете графично данните (постройте хистограма и плътност).
Разпределението нормално ли е?
114
в) Построите 98% доверителен интервал за колититъра.
г) Можем ли да твърдим, че почвата е годна за садене?
д) Направена е случайна извадка и за колититъра на почвата в друго
селище. Проверете дали е нормално разпределението. Там почвата почиста ли е, в сравнение с тази от първото селище?
133, 136, 120, 125, 109, 106, 102, 97, 120, 118, 119, 113, 114, 119, 124,
144, 137, 116, 118, 119, 120, 140, 115, 125, 127, 121, 109, 119, 130, 118,
114, 116, 126, 128, 117, 109, 111, 108;
20.3. Винената мушица, Drosophilamelanogaster, е космополитен вид.
Храни се от ферментиращи хранителни среди.
Имаго се нарича последната фаза в развитието на насекомите. Обикновено в тази фаза те вече са способни да се размножават и са достигнали
размерите и формата на възрастните индивиди. При оптимални условия
мушиците се развиват от яйце до имагинална форма за 10 дни. Нормалната
дължина на крилете им е около 5 мм.
25 случайно избрани мушици, Drosophilamelanogaster от вида Normal,
се отглеждат при оптимални условия, а 35 случайно избрани мушици от
същия вид са изложени на мутагенен фактор – UV лъчи, под действието на
който се намалява дължината на крилете. След това е измерена дължината
на крилата им. Когато средната дължина на крилата на тези мухи е под
3мм. твърдим, че при тях се наблюдава мутация.
Дължината на крилете на мухите, изложени на мутагенен фактор, е:
1.38, 1.42, 1.56, 1.48, 1.72, 2.42, 1.27, 3.12, 2.34, 3.18, 2.42, 5.23, 3.40,
1.40, 0.56, 1.88, 1.90, 0.95, 3.70, 0.91, 1.56, 1.92, 2.12, 2.14, 0.42, 1.23,
1.96, 4.73, 2.00, 0.59, 0.48, 4.96, 2.13, 2.20, 0.70
Дължината на крилете на мухите, които не са изложени на мутагенен
фактор, е:
4.8, 4.9, 5, 4.6, 4.7, 4.8, 4.6, 4.8, 4.9, 4.6, 4.3, 4.7, 4.5, 4.8, 5.1, 5.0, 4.9, 4.8,
5.2, 4.8, 4.9, 4.6, 4.8, 5.1, 5.0
а) Посочете числовите характеристики на зададените данни.
б) Представете графично данните (хистограма и плътност).
в) Построите 95% и 99% доверителен интервал за средната дължина на
крилете на мухите от вида Drosophilamelanogaster.
г) Може ли в случая да твърдим, че този фактор UV лъчи, под действието на който са изложени мушиците, намалява дължината на крилете им?
20.4. Лъвът е едър хищник от семейство Котки и един от четирите
представителя на род Пантери. Днес лъвовете се срещат главно на едно
място в Западна Индия и в разпокъсаните райони на Субсахарска Африка.
Дължината при лъвовете се измерва от главата до опашката. При индийските лъвове средната дължина на тялото достига до 150 – 165 см. В сравнение с индийските, африканските лъвове са по-дребни със средна дължина на тялото 100 – 128 см. Дължината на лъвовете зависи от генетичните
условия.
115
През лятото лъвицата може да се кръстосва с 2 или повече лъва. При
мъжките представители гените имат различни цели. Мъжките искат тяхното потомство да оцелее и да се развитие повече от конкурентните така, че
техните гени са програмирани за размер и сила. Лъвицата, обаче, иска
всички малки да оцелеят. Нейните гени са склонни да създадат равни условия и инхибиране на растежа, т.е. да даде на всичките си поколения поголям шанс за преживяемост.
Направени са случайни извадки от 35 индийски и 28 африкански лъва и
е измерена дължината им. Получените данни са представени в таблица.
а) Да се изчислят числовите характеристики и да се представят графично извадковите данни прииндийския и при африканския лъв;
б) Да се построи 90%, 95% и 99% доверителни интервали за средната
стойност на дължината на тялото при индийският лъв.
с) С ниво на съгласие 0.05 да се провери хипотезата, че дължината на
тялото при индийският лъв е по-голяма от дължината на тялото при африканския.
Дължината на тялото
при индийски лъвове
150,37; 151,33; 152,31; 154,03; 161,63; 152,59; 154,67;
155,57; 158,47; 160,67; 156,83; 152,33; 154,32; 150,30;
160,88; 150,81; 160,47; 163,67; 161,83; 159,33; 161,32;
155,30; 157,88; 159,81; 161,24; 158,47; 160,53; 152,98;
156,33; 158,96; 159,14; 163,02; 160,04; 164,05; 165,00
Дължината на тялото 100,00; 101,01; 102,00; 108,01; 128,00; 110,99; 111,99;
при африкански лъвове 127,99; 124,70; 114,02; 112,78; 118,99; 126,59; 102,05;
121,00; 126,99; 112,00; 111,99; 113,98; 127,65; 104,01;
117,00; 110,99; 118,00; 120,44; 125,87; 106,98; 113,99
20.5. Отделът за анализи на голяма европейска компания за произвеждане на компютърни системи изследва периодично времето, необходимо
на работниците, за сглобяване на една компютърна система. В продължение на един месец са извършени наблюдения върху работата на случайно
избрани работници и са регистрирани следните стойности в минути:
128, 95, 124, 142, 108, 113, 124, 97, 133, 120, 146, 103, 114, 100, 131, 124, 133,
88, 116, 112, 100, 111, 117, 97, 92, 119, 97, 129, 98, 120, 109, 132, 138, 135, 112,
128, 135, 109, 111, 113, 131, 131, 118, 98, 138, 112, 150, 122, 116, 122
След цялостно обновяване на оборудването във фирмата е направена
нова случайна извадка и са регистрирани следните нови резултати:
109, 101, 102, 99, 82, 108, 95, 102, 113, 108, 113, 111, 94, 103, 100, 116, 89,
100, 100, 111, 114, 130, 88, 112, 102, 98, 110, 100, 91, 92, 101, 105, 112, 93,
110, 103, 100, 120, 105, 102, 119, 115, 102, 101, 97, 120, 111, 100,98, 108
а) Да се пресметнат числовите характеристики на данните.
б) Представете графично данните от двете извадки.
116
в) Построите 96% доверителни интервали за средното време на сглобяване на една компютърна система преди и след обновяване на оборудването.
г) Проверете хипотезата, че средното време за сглобяване на една компютърна система преди обновяването превишава 110 минути. Работете с
ниво на съгласие 0,02. Направете статистически изводи и интерпретирайте
получените резултати.
д) Проверете хипотезата, че след обновяване на оборудването, времето,
необходимо за сглобяване на компютърните системи, се е намалило.
20.6. Континентален тайпан e змия със среден размер. Среща се в Централна Австралия. Цветът £ е от сиво-кафяв до кафяв и червено-кафяв. Активна е нощем, дневно време се крие от слънцето в пукнатини и дупки. Основно се храни с гризачи, рядко с други змии, гущери, птици. Хапе, после се
отдръпва, чакайки отровата да подейства. Отровните зъби са 2 предни, средно големи. Притежава най-силната отрова в света на змиите, мощен невротоксин.
Новогвинейски (крайбрежен) тайпан се среща на големия остров Нова Гвинея, северно от Австралия. Цветът е от оранжево кафяв до кафяв. Тя
е най-голямата отровна змия в региона. Храни се с дребни гризачи като е
активна през деня, което често я сблъсква с човека. Има 2 дълги, неподвижно разположени отровни зъба и отделя изключително силна отрованевротоксин. Обикновено е плаха змия, която се стреми да отбягва човека,
но е крайно агресивна при среща с него, нанася многократни ухапвания,
най-често в горната част на тялото.
Смята се, че континенталният тайпан е с по-къси зъби от новогвинейския тайпан. За да се провери тази хипотеза са направени две случайни извадки от двете популации змии – 17 континентални тайпана и 28 новогвинейски тайпана. Измерена е дължината на двата предни зъба в сантиметри.
Данните са представени в таблицата:
Континентален
тайпан
Новогвинейски
(крайбрежен)
тайпан
0,95; 0,67; 0,72; 0,77; 0,84; 0,79; 0,71; 0,68; 0,80; 0.78;
0,79; 0,98; 0,90; 0,82; 0,84; 0,83; 0,89;
1,19; 1,00; 1,03; 0,88; 1,10; 1,03; 1,08; 0,85; 1,00; 1,09; 0,96;
0,92; 0,90; 0,89; 0,84; 0,94; 0,93; 0,88; 0,81; 0,95; 1,05; 0,91;
0,97; 1,20; 1,12; 1,14; 0,98; 0,93;
Колкото дължината на зъбите е по-голяма, толкова количеството отрова в тях е повече и ухапването предизвиква много по-сериозни проблеми у
човека. Изследвайки дължината на зъбите може да установим кой вид змии
е по-опасен за човека.
а) Да се изчислят числовите характеристики и да се представят графично данните от извадките, съответно при континенталния и при новогвинейския тайпан;
б) Да се построят 90%, 95% и 99% доверителни интервали за средната
стойност на дължината на зъбите при новогвинейския тайпан;
117
в) С ниво на съгласие 0.05 да се провери хипотезата, че дължината на
зъбите при новогвинейския тайпан е по-голяма от дължината на зъбите при
континенталния тайпан.
20.7. Бактериите се делят на две големи групи „Грам+“ и „Грам–“, въз основа на устройството на тяхната клетъчна стена. При „Грам+“ тя е по-плътна,
което се дължи на многослоен пептидоглюкан (муреинова мрежа) за който е
доказано, че при по-високото му съдържание диаметърът е по-голям и е 30 –
80 nm, докато при „Грам–“ клетъчната стена е много по-рехава, защото се
състои само от един слой пептидоглюкан с диаметър 1 – 3 nm.
Направена е извадка от 50 случайно избрани „Грам+“ бактерии и е измерен диаметъра на клетъчната им стена:
30,0; 39,7; 67,8; 53,1; 43,8; 69,7; 80,0; 68,4; 56,7; 40,1; 61,8; 56,9; 30,9;
30,7; 69,1; 76,1; 38,4; 45,7; 48,1; 79,4; 48,3; 30,6; 80,0; 73,4; 48,7; 46,1;
83,1; 78,3; 67,5; 46,9; 56,7; 80,0; 79,8; 36,8; 36,9; 40,3; 78,9; 58,9; 39,8;
47,5; 42,6; 58,6; 69,9; 63,7; 40,8; 41,2; 74,6; 75,9; 39,9; 72,1;
Направена е извадка от 58 случайно избрани „Грам–“ бактерии. Диаметърът на клетъчната им стена е съответно:
1,3; 1,5; 3,0; 2,1; 2,2; 3,0; 2,8; 1,9; 1,9; 1,8; 2,0; 1,1; 1,2; 1,3; 1,5; 1,4; 2,1;
2,2; 2,3; 2,4; 2,1; 1,1; 1,5; 2,9; 2,8; 1,8; 2,8; 3,1; 2,9; 1,8; 1,7; 2,6; 2,7; 1,9;
1,0; 3,0; 2,6; 2,4; 1,8; 2,8; 2,4; 2,6; 2,5; 2,8; 1,6; 2,9; 2,7; 2,4; 1,5; 1,4; 1,9;
2,5; 2,6; 2,7; 3,0; 2,0; 1,0; 2,4; 2,9;
а) Пресметнете числовите характеристики на дадените данни.
б) Представете графично данните.
в) Построите 98% доверителен интервал за средната стойност на диаметъра на клетъчната стена.
г) Проверка на хипотезата, че средният диаметър на „грам+“ бактерии е
56 нанометра.
д) Проверете хипотезата, че средният диаметър на „грам-“ бактерии е 2
нанометра.
20.8. Еритроцитите (червени кръвни телца) са безядрени клетки с форма на двойно вдлъбнати дискове с диаметър 7µm. Сърповидно-клетъчната
анемия е наследствено заболяване, предизвикано от замяната на една аминокиселина с друга в първичната структура на хемоглобина, в резултат на
това се променят свойствата му и червените кръвни телца придобиват сърповидна форма с диаметър 1 – 3 µm. Хомозиготните индивиди често умират в ранна възраст, а хетерозиготните са със слабо изявени симптоми.
При хематологични изследвания на здрав човек на случаен принцип са
избрани 70 еротроцитни клетки и е измерен техния диаметър.
6,8; 6,9; 7,2; 7,0; 7,0; 6,4; 6,8; 7,2; 7,1; 6,9; 7,4; 7,0; 7,1; 6,8; 6,6; 6,7; 6,5;
7,1; 7,0; 6,9; 7,2; 6,5; 6,4; 7,1; 7,2; 7,0; 6,8; 6,8; 6,7; 7,0; 7,0; 6,7; 6,7; 6,7;
7,2; 7,1; 6,4; 6,5; 6,5; 6,5; 7,0; 7,1; 6,8; 6,8; 7,0; 6,9; 6,9; 6,7; 6,7; 7,0; 7,2;
6,4; 6,6; 6,6; 7,0; 7,1; 7,1; 6,5; 6,9; 6,8; 6,4; 6,4; 7,1; 7,0; 7,0; 6,9; 6,8; 6,5;
6,4; 6,4;
118
При хематологични изследвания на болен от сърповидно-клетъчна
анемия човек на случаен принцип са избрани 67 еротроцитни клетки и е
измерен техния диаметър.
1,1; 1,1; 2,3; 2,5; 2,9; 3,0; 3,0; 1,4; 1,3; 1,1; 2,1; 2,5; 2,8; 2,9; 2,9; 2,6; 2,7;
1,4; 1,5; 1,9; 1,9; 1,7; 1,6; 2,4; 2,1; 3,0; 2,9; 1,6; 1,4; 1,3; 1,7; 2,0; 2,0; 2,1;
2,5; 3,1; 3,0; 3,2; 3,0; 2,8; 1,2; 1,6; 2,1; 3,0; 3,0; 3,1; 2,5; 2,3; 2,8; 3,1; 3,2;
1,7; 1,7; 2,5; 2,6; 2,0; 2,1; 2,9; 2,8; 3,0; 1,5; 1,5; 2,4; 2,8; 3,0; 3,1; 1,5;
а) Пресметнете числовите характеристики на дадените данни.
б) Представете графично данните (начертайте хистограма, както и плътността).
в) Определете какво е разпределението и на двете извадки чрез shapiro.test.
г) Построите 98% доверителен интервал за среднота стойност на диаметъра на еритроцитите при болния и здравия човек.
д) Формулирайте и проверете подходяща хипотеза за диаметъра на
еретроцитите на здрав човек.
е) Формулирайте и проверете подходяща хипотеза за сравняване на
средните стойности на диаметъра на еретроцитите на двете популации.
20.9. Водата за пиене и домашни нужди не трябва да съдържа патогенни
микроорганизми, тъй като може да стане причина за различни инфекциозни
заболявания. Годността на водата за пиене се определя от наличието на бактериите E. coli и на ентерококи, които са нормални обитатели на чревния
канал и присъствието им във водата говори за прясно фекално замърсяване.
Годността на водата се определя от нейния колититър: най-малкото количество вода, изразено в кубични cm, което съдържа поне една клетка от E. coli.
Знаем, че е прието водопроводната вода на селище с население над 50 000
жители да се смята за годна за пиене при колититър над 100 кубични см., т.
е. в колкото по-малко количество вода се намира една бактерия, толкова позамърсена е тя. Взети са по случаен начин проби от различни места на водопроводи в едно селище с население над 50 000 жители:
99, 100, 110, 95, 105, 101, 109, 89, 109, 111, 102, 99, 87, 96, 120, 112, 109,
120, 115, 112, 96, 102, 110, 103, 100, 105, 108, 83, 104, 102, 107, 99, 104,
114, 110, 94, 117, 123;
а) Пресметнете числовите характеристики на дадените данни.
б) Представете графично данните. Може ли да направим предположение за вида на популационното разпределение?
в) Построите 98% доверителен интервал за колититъра.
г) Можем ли да твърдим, че водата е годна за пиене?
д) Направена е случайна извадка и за колититъра на водата в друго селище. Проверете дали е нормално разпределението. Там водата по-чиста
ли е, сравнение с първото селище?
123, 136, 120, 135, 109, 106, 102, 97, 120, 118, 119, 113, 114, 119, 124,
144, 137, 116, 118, 119, 120, 125, 115, 125, 127, 121, 109, 119, 130, 118,
114, 116, 126, 128, 117, 109, 108, 111;
119
20.10. Дадено е съдържанието на оловото в бъбреците на случайна извадка
от 72 рибки, отгледани в рибно стопанство по поречието на река Арда.
а) Пресметнете числовите характеристики на данните. Дайте подходяща интерпретация на получените резултати.
б) Представете графично данните. Има ли съмнителни наблюдения?
Има ли основание да се съмняваме в предположението за нормалност на
изследваната популация?
в) Построите 96% доверителен интервал за средното съдържание на
оловото в бъбреците на сладководните риби. Дайте подходяща интерпретация на получения резултат.
г) Проверете хипотезата, че средното съдържание на оловото в бъбреците на рибите в рибното стопанство не надвишава 14 mg/kg. Работете с
ниво на съгласие 0,1. Направете статистически изводи и ги интерпретирайте в съответната област.
Използвайте следното име за променливата: Kidney_Pb и данните:
11,9250; 20,9268; 7,9227; 2,5272; 13,5000; 22,5000; 8,2170; 3,0807;
14,4171; 9,0189; 5,9733; 5,1804; 6,0417; 12,9393; 6,4377; 5,5404; 14,1426;
28,8198; 13,9995; 4,6215; 14,7537; 30,9618; 15,3000; 5,4099; 2,9286;
4,4073; 2,9889; 3,1104; 3,4200; 5,8950; 3,8250; 2,8458; 3,0375; 3,8574;
2,6370; 2,3040; 3,3606; 6,1479; 2,3445; 1,9710; 6,3018; 14,3730; 4,0995;
3,3183; 32,6970; 33,750; 7,5357; 7,2018; 1,2438; 4,4622; 3,7179; 3,1635;
4,3659; 4,4622; 6,9480; 6,5115; 0,9900; 3,9600; 2,0862; 2,0790; 1,6065;
1,7100; 3,7098; 3,6360; 5,4000; 8,3808; 7,4250; 6,8175; 7,7274; 8,091;
19,9431; 16,4997;
120
ПРИЛОЖЕНИЕ 1
Стандартно нормално разпределение N (0,1)
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
16
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
31
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0,00
0,5
0,539827896
0,579259687
0,617911357
0,655421697
0,691462467
0,725746935
0,758036422
0,788144666
0,815939908
0,841344740
0,864333898
0,884930268
0,903199451
0,919243289
0,933192771
0,945200711
0,955434568
0,964069734
0,971283507
0,977249938
0,982135643
0,986096601
0,989275919
0,991802471
0,993790320
0,995338778
0,996532977
0,997444809
0,998134120
0,998650033
0,999032329
0,999312798
0,999516517
0999663019
0,999767327
0,999840854
0,999892170
0,999927628
0,999951884
0,01
0,503989379
0,543795364
0,583166134
0,621719457
0,659096986
0,694974281
0,729069152
0,761148006
0,791029974
0,818588775
0,843752345
0,866500443
0,886860491
0,904902018
0,920730109
0,934478263
0,946301077
0,956367097
0,964852162
0,971933461
0,977784475
0,982570884
0,986447466
0,989555950
0,992023745
0,993963425
0,995472853
0,996635789
0,997522864
0,998192789
0,998693692
0,999064496
0,999336262
0,999533462
0,999675135
0,999775903
0,999846865
0,999896341
0,999930493
0,999953833
0,02
0,507978354
0,547758470
0,587064387
0,625515770
0,662757237
0,698468229
0,73237J166
0,764237576
0,793892006
0,821213646
0,846135756
0,868643073
0,888767499
0,906582427
0,922196112
0,935744490
0,947383870
0,957283815
0,965620555
0,972571119
0,978308376
0,982997038
0,986790661
0,989829586
0,992239749
0,994132240
0,995603474
0,996735852
0,997598756
0,998249775
0,998736057
0,999095677
0,999358984
0,999549856
0,999686844
0,999784184
0,999852663
0,999900359
0,999933251
0,999955707
0,03
0,04
0,511966527 0,515953499
0,551716823 0,555670033
0,590954073 0,594834824
0,629299955 0,633071673
0,666402148 0,67003 J420
0,701944056 0,705401511
0,735652770 0,738913765
0,767304982 0,770350076
0,796730665 0,799545861
0,823814480 0,826391238
0,848494980 0,850830029
0,870761839 0,872856799
0,890651383 0,892512238
0,908240802 0,909877266
0,923641445 0,925066257
0,936991617 0,938219807
0,948449263 0,949497431
0,958184901 0,959070532
0,966375089 0,967115942
0,973196650 0,973810224
0,978821799 0,979324905
0,983414253 0,983822675
0,987126322 0,987454580
0,990096947 0,990358150
0,992450589 0,992656367
0,994296853 0,994457354
0,995730718 0,995854658
0,996833231 0,996927987
0,997672537 0,997744260
0,998305122 0,998358871
0,998777162 0,998817040
0,999125901 0,999155194
0,999380986 0,999402289
0,999565714 0,999581052
0,999698160 0,999709094
0,999792178 0,999799895
0,999858254 0,999863647
0,999904232 0,999907962
0,999935906 0,999938461
0,999957509 0,999959242
121
Стандартно нормално разпределение N (0,1)
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
122
0,05
0,519938873
0,559617712
0,598706274
0,636830590
0,673644759
0,708840345
0,742153956
0,773372720
0,802337508
0,828943888
0,853140919
0,874928011
0,894350161
0,911491948
0,926470700
0,939429229
0,950528549
0,959940886
0,967843287
0,974412010
0,979817852
0,984222449
0,987775567
0,990613313
0,992857185
0,994613830
0,995975369
0,997020181
0,997813974
0,998411062
0,998855724
0,999183581
0,999422914
0,999595887
0,999719659
0,999807344
0:999868846
0,999911555
0,999940919
0,999960908
0,06
0,523922253
0,563559473
0,602568057
0,640576374
0,677241874
0,712260318
0,745373154
0,776372779
0,805105527
0,831472403
0,855427672
0,876975542
0,896165253
0,913084979
0,927854925
0,940620050
0,951542794
0,960796142
0,968557300
0,975002175
0,980300797
0,984613720
0,988089412
0,990862548
0,993053143
0,994766365
0,996092924
0,997109875
0,997881730
0,998461736
0,998893246
0,999211088
0,999442878
0,999610233
0,999729865
0,999814533
0,999873859
0,999915017
0,999943285
0,999962509
0,07
0,527903240
0,567494933
0,606419814
0,644308699
0,680822481
0,715661192
0,748571176
0,779350124
0,807849842
0,833976760
0,857690314
0,878999459
0,897957619
0,914656492
0 929219087
0,941792438
0,952540341
0,961636477
0,969258155
0,975580885
0,980773894
0,984996631
0,988396244
0,991105971
0,993244339
0,994915046
0,996207393
0,997197128
0,997947576
0,998510932
0,998929637
0,999237740
0,999462202
0,999624105
0,999739724
0,999821470
0,999878692
0 999918350
0,999945562
0,999964048
0,08
0,531881440
0,571423709
0,610261186
0,648027240
0,684386299
0,719042736
0,751747842
0,782304631
0,810570386
0,836456943
0,859928875
0,880999834
0,899727366
0,916206622
0,930563344
0,942946563
0,953521368
0,962462069
0,969946026
0,976148306
0,981237299
0,985371321
0,988696189
0,991343692
0,993430871
0,995059954
0,996318845
0997281997
0,998011558
0,998558689
0,998964929
0,999263560
0,999480905
0,999637518
0,999749247
0,999828164
0,999883351
0,999921560
0,999947752
0,999965527
0,09
0,535856456
0,575345420
0,614091818
0,651731677
0,687933051
0,722404724
0,754902979
0,785236183
0,813267094
0,838912939
0,862143390
0,882976744
0,901474606
0,917735507
0,931887852
0,944082597
0,954486051
0,963273096
0,970621086
0,976704602
0,981691164
0,985737932
0,988989373
0,991575823
0,993612833
0,995201171
0,996427351
0,997364539
0,998073724
0,998605044
0,998999149
0,999288571
0,999499004
0,999650485
0,999758445
0,999834623
0,999887842
0,999924651
0,999949858
0,999966948
ПРИЛОЖЕНИЕ 2
Квантили t q (k) на симетричното t – разпределение на Стюдънт
k\q
I
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
45
50
55
60
120
∞
0,60
0,324919256
0,288674755
0,276670562
0,270722467
0,267181122
0,264834625
0,263166839
0,261920832
0,260955630
0,260184834
0,259556145
0,259032618
0,258590944
0,258212367
0,257884949
0,257599027
0,257347210
0,257123247
0,256923158
0,256742396
0,256579824
0,256432031
0,256296744
0,256173394
0,256059707
0,255954546
0,255857913
0,255767532
0,255683972
0,255605528
0,255532200
0,255463419
0,255399186
0,255338364
0,255281520
0,255038799
0,254850079
0,254699444
0,254576094
0,254473207
0,253909320
0,253346570
0,75
1,000000793
0,816496595
0,764891865
0,740697033
0,726686835
0,717558351
0,711141865
0,706386345
0,702722218
0,699811835
0,697444875
0,695482640
0,693829634
0,692417075
0,691196647
0,690132538
0,689194621
0,688363571
0,687621196
0,686954422
0,686352450
0,685805048
0,685306532
0,684849510
0,684430006
0,684042902
0,683685357
0,683352823
0,683044163
0,682755399
0,682485961
0,682233576
0,681997108
0,681774281
0,681563961
0,680672656
0,679980872
0,679427785
0,678976448
0,678600713
0,676540139
0,674490366
0,90
3,077684596
1,885618985
1,637745299
1,533205705
1,475884801
1,439755124
1,414923645
1,396815605
1,383028803
1,372184215
1,363430329
1,356218036
1,350172170
1,345031251
1,340605422
1,336757123
1,333379487
1,330390660
1,327728114
1,325340691
1,323187462
1,321236596
1,319460807
1,317835086
1,316345788
1,314972451
1,313703706
1,312525910
1,311434517
1,310415882
1,309463187
1,308573019
1,307737421
1,306950708
1,306211743
1,303076260
1,300650183
1,298712959
1,297134986
1,295820766
1,288645990
1,281550794
0,95
6,313748599
2,919987310
2,353363016
2,131846486
2,015049176
1,943180905
1,894577508
1,859548320
1,833113856
1,812461505
1,795883691
1,782286745
1,770931704
1,761309250
1,753051038
1,745884219
1,739606432
1,734063062
1,729131327
1,724718004
1,720743512
1,717144187
1,713870006
1,710882316
1,708140189
1,705616341
1,703288035
1,701130259
1,699127097
1,697260359
1,695518677
1,693888407
1,692360456
1,690923455
1,689572855
1,683852133
1,679427442
1,675905423
1,673033694
1,670648544
1,657649591
1,644853000
0,975
12,706150301
4,302655725
3,182449291
2,776450856
2,570577635
2,446913641
2,364622560
2,306005626
2,262158887
2,228139238
2,200986273
2,178812792
2,160368240
2,144788596
2,131450856
2,119904821
2,109818524
2,100923666
2,093024705
2,085962478
2,079614205
2,073875294
2,068654794
2,063898137
2,059537110
2,055530786
2,051829142
2,048409442
2,045230758
2,042270353
2,039514584
2,036931619
2,034516910
2,032243174
2,030110409
2,021074579
2,014103302
2,008559932
2,004044291
2,000297172
1,979929038
1,959961082
123
Квантили t q (k) на симетричното t – разпределение на Стюдънт
k\q
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
45
50
55
60
120
∞
124
0,99
31,820964068
6,964546628
4,540706868
3,746936272
3,364930308
3,142667993
2,997949196
2,896467777
2,821434464
2,763772500
2,718079486
2,680990292
2,650303941
2,624492481
2,602482709
2,583492460
2,566939656
2,552378646
2,539482011
2,527976903
2,517645044
2,508322723
2,499873517
2,492161002
2,485103323
2,478627721
2,472661436
2,467140803
2,462020348
2,457263690
2,452825356
2,448678060
2,444794518
2,441147444
2,437718649
2,423257683
2,412116373
2,403266990
2,396081982
2,390115696
2,357828635
2,326341928
0,995
0,9975
0,999
0,9995
63,655897975 127,321109176 318,288803101 636,577606201
9,924988262 14,089164324 22,328458726 31,599774957
5,840847734 7,453199942 10,214280337 12,924429029
4,604080459 5,597539712
7,172930054
8,610077202
4,032117431 4,773319233
5,893525667
6,868503988
3,707427823 4,316825652
5,207548384
5,958718248
3,499480954 4,029352567
4,785251804
5,408073775
3,355380613 3,832537914
4,500761861
5,041365512
3,249842848 3,689638106
4,296889529
4,780886229
3,169261618 3,581371857
4,143657861
4,586763680
3,105815267 3,496606951
4,024768714
4,436878953
3,054537956 3,428431228
3,929599188
4,317844287
3,012282832 3,372479114
3,852037480
4,220928531
2,976848918 3,325694706
3,787426976
4,140310921
2,946726454 3,286040737
3,732857294
4,072790034
2,920787665 3,251989256
3,686145646
4,014873412
2,898232196 3 222448868
3,645764082
3,965105861
2,878441592 3,196582838
3,610475687
3,921741154
2,860942914 3,173699952
3,579334589
3,883324098
2,845335985 3,153400030
3,551831469
3,849563655
2,831366146 3,135210136
3,527093213
3,81929567!
2,818760549 3 118839231
3,504974302
3 792229109
2,807337296 3,103996278
3,484965418
3,767636372
2,796950866 3,090535756
3,466775524
3,745371941
2,787437552 3,078203008
3,450186341
3,725144779
2,778724593 3,066888894
3,434979590
3,706663847
2,770684659 3,056520654
3,421009751
3,689492587
2,763263183 3,046952770
3,408204066
3,673922038
2,756387403 3,038039722
3,396271495
3,659515642
2,749984560 3,029781510
3,385212040
3,645982360
2,744036465 3,022105375
3,374880180
3,633467713
2,738488547 3,014938557
3,365275916
3 621826181
2,733286237 3,008244676
3,356326488
3,610912245
2,728393156 3,001950972
3,347959137
3,600725904
2,723809303 2,996057447
3,340028343
3,591121640
2,704455255 2,971173672
3,306922736
3,550958354
2,689594112 2,952074283
3,281456884
3,520253813
2,677788871 2936976671
3,261375241
3,495952114
2,668220986 2,924716682
3,245149856
3,476452548
2,660272003 2,914566721
3,231689334
3,460154403
2,617416612 2,859851520 3,15951 1834 3,373424988
2,575834515 2,807064448
3,090244718
3,290479071
ПРИЛОЖЕНИЕ 3
Квантили χq2(k) на асиметричното χ2 – разпределение на Пирсън
k\q
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
55
60
65
70
80
90
100
0,005
3,927Е-05
0,0100247
0,0717235
0,2069836
0,4117508
0,6757334
0,9892509
1,3444027
1,7349114
2,1558454
2,6032019
3,073785
3,565042
4,0746588
4,6008741
5,1421643
5,6972737
6,2647659
6,8439233
7,4338114
8,0336021
8,6426806
9,2603831
9,8861987
10,519647
11,160218
11,807655
12,461281
13,121067
13,786682
17,191729
20,706577
24,310982
27,990825
31,734894
35,534397
39,383227
43,275305
51,171933
59,196327
67,327533
0,010
0,025
0,0001571 0,0009821
0,0201004 0,0506357
0,1148316 0,2157949
0,2971068 0,484419
0,5542969 0,8312089
0,8720833 1,2373419
1,2390317 1,689864
1,6465062 2,1797247
2,0878894 2,7003887
2,5581988 3,2469635
3,0534957 3,8157424
3,5705513 4,4037775
4,1068996 5,0087376
4,6604155 5,6287238
5,2293559 6,2621229
5,8121968 6,9076641
6,407742 7,5641786
7,0149034 8,2307372
7,6326976 8,9065144
8,2603684 9,5907725
8,8971724 10,282907
9,5424944 10,98233
10,195689 1 1,688534
10,856349 12,401146
11,523951 13,119707
12,198177 13,843881
12,878468 14,573373
13,564666 15,307854
14,256406 16,047051
14,953464 16,790756
18,50887
20,56938
22,164201 24,433058
25,9012
28,366177
29,706725 32,357385
33,570516 36,398113
37,484796 40,481707
41,443554 44,60297
45,4417
48,757536
53,539983 57,153152
61,754019 65,646592
70,064995 74,221882
0,050
0,0039322
0,1025862
0,351846
0,7107241
1,1454773
1,6353805
2,1673492
2,7326326
3,3251151
3,9402953
4,574809
5,2260277
5,8918606
6,5706316
7,2609348
7,9616386
8,6717536
9,3904479
10,117006
10,850799
11,591316
12,338009
13,090505
13,848422
14,611396
15,379163
16,151395
16,927876
17,708381
18,492667
22,465009
26,509296
30,612259
34,764236
38,958051
43,187966
47,449572
51,739263
60,391459
69,126018
77,929442
0,100
0,0157907
0,2107208
0,5843755
1,0636243
1,6103091
2,2041303
2,8331052
3,4895374
4,1681557
4,8651783
5,5777883
6,3037959
7,0414997
7,7895377
8,5467531
9,3122353
10,085183
10,864937
11,650912
12,442601
13,239596
14,04149
14,847954
15,658679
16,473405
17,29188
18,113889
18,939235
19,76774
20,599245
24,796648
29,050516
33,350378
37,688637
42,05962
46,458885
50,882935
55,328945
64,277842
73,291079
82,358127
0,500
0,4549362
1,3862936
2,3659727
3,3566947
4,3514587
5,348119
6,3458093
7,3441201
8,342832
9,3418161
10,340996
11,340322
12,339753
13,339272
14,338857
15,338497
16,338179
17,337902
18,33765
19,33743
20,337228
21,337044
22,33688
23,33673
24,336584
25,336458
26,336341
27,336232
28,33613
29,336028
34,335635
39,335341
44,335118
49,334941
54,334787
59,334668
64,334557
69,334479
79,334325
89,334216
99,33413
125
Квантили χq2 на асиметричното χ2 – разпределение на Пирсън
k\q
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
55
60
65
70
80
90
100
126
0,900
2,7055406
4,6051761
6,2513945
7,779434
9,2363491
10,644637
12,017031
13,361562
14,683663
15,987175
17,275007
18,54934
19,811933
21,064141
22,307121
23,541821
24,769028
25,989418
27,203565
28,41197
29,615086
30,813285
32,00689
33,196235
34,381583
35,563164
36,741228
37,915907
39,087475
40,256017
46,058772
51,805044
57,505291
63,167113
68,796207
74,396999
79,97299
85,527036
96,578196
107,56501
118,498
0,950
3,8414553
5,9914764
7,8147247
9,4877285
11,070483
12,591577
14,067127
15,507312
16,91896
18,307029
19,675153
21,026055
22,362027
23,684782
24,995797
26,296221
27,5871
28,869321
30,143505
31,41042
32,670558
33,92446
35,17246
36,415026
37,652489
38,88513
40,113266
41,337152
42,556948
43,772954
49,801832
55,758487
61,656219
67,504805
73,311479
79,081954
84,82064
90,531262
101,87947
113,14523
124,3421
0,975
5,0239026
7,3777791
9,348404
11,143262
12,832492
14,449355
16,012774
17,534545
19,022778
20,483201
21 920023
23,33666
24,735581
26,118935
27,488365
28,845325
30,190983
31,52641
32,852337
34,169581
35 478856
36,780678
38,075609
39,36406
40,646498
41,923138
43,194521
44,46079
45,722279
46,979218
53,203308
59,341679
65,410131
71,420194
77,380436
83,297706
89,177163
95,023149
106,62854
118,13591
129,56125
0,990
6 6348913
9,210351
11,344882
13,276699
15,086317
16,811872
18,475324
20,090159
21,666048
23,209287
24,725022
26,216964
27,688184
29,141163
30,577951
31,999861
33,408717
34,805237
36,190775
37,566272
38,932232
40,289448
41,638334
42,979781
44,314014
45,641636
46,962837
48,278166
49,587829
50,892181
57,341988
63,690771
69,956901
76,153802
82,291977
88,37943
94,421996
100,42505
1 12,32879
124,1162
135,80689
0,995
7,8793998
10,59653
12,838073
14,860166
16,749648
18,547513
20,277738
21,954861
23,589275
25,188055
26,756864
28,29966
29,819318
31,319425
32,801491
34,267053
35,718378
37,156386
38,582122
39,996856
41,400943
42,795664
44,181385
45,558363
46,927966
48,289777
49,645035
50,993559
52,335495
53,671868
60,274592
66,766047
73,166036
79,489839
85,749058
91,951806
98,104916
104,21477
116,32093
128,29868
140,16971
ПРИЛОЖЕНИЕ 4
Общи сведения за R
4.1. Средата на R
R е езикова среда за статистически изчисления и графики. Тя е проект
с отворен код. Подобна е на езика S-plus. R може да се разглежда, като
друга, некомерсиална, реализация на езика S-plus. Има някои важни разлики между тях, но в повечето случаи код, писан на S-plus работи без промени под R.
R предоставя голямо разнообразие от статистически и графични техники. R е проектиран така, че да може да се надстройва лесно. Езикът Splus често е избраното средство за изследвания с методите и средствата на
статистиката, а R предоставя негова безплатна алтернатива с отворен код.
Една от силните страни на R е лекотата, с която могат да се създават
графики с високо качество. Друго предимство е, че има версии за много
UNIX платформи и подобни на тях (включително FreeBSD и Linux),
Windows и MacOS.
R е интегриран пакет от софтуерни средства за манипулиране на данни, изчисления и графична визуализация. Той включва:
 ефективни средства за съхраняване и използване на данни;
 пакет от оператори за изчисления върху масиви, и по-специално за
матрици;
 голяма интегрирана колекция от тясно свързани инструменти за анализ на данни;
 средства за графичен анализ и визуализация на данни;
 добре развит прост и ефективен език за програмиране, в който има
условни преходи, цикли, дефинирани от потребителя функции, които
могат да бъдат рекурсивни, средства за вход и изход.
Терминът „среда“ характеризира R като цялостно планирана и съгласувана система, а не като сбор от специфични гъвкави инструменти, какъвто е обикновено случаят с другите видове софтуер за анализ на данни.
R, както и S-plus, позволява на потребителя да добавя допълнителна
функционалност под формата на функции. Голяма част от системата е написана на самия език R, което улеснява потребителите при разбирането и
следването на направените алгоритмични решения.
Много потребители мислят за R като за статистическа система. Създателите на R обаче го определят като за среда, в която има реализирани
статистически техники. R може да се надстройва лесно чрез така наречените пакети. Има 8 пакета, които стандартно се инсталират. От Интернет
сайтове CRAN могат да бъдат свалени допълнителни пакети, които реализират голяма част от съвременните статистически методи.
4.2. Работа с R
На фиг. 3.1 е показан главния прозорец на R.
127
Фигура 3.1 Главен прозорец на R
Това е така наречената конзола, която служи за интерфейс с R. В нея могат да се въвеждат директно от клавиатурата програми и команди. Взаимодействието е интерактивно – след извикване на команда, в конзолата се извежда резултата от нея или съобщение за грешка, ако е възникнала такава.
4.3. Инсталиране на R. Първи стъпки в езика
Системата за статистическа обработка на данните R се инсталира от
сайта http://cran.r-project.org/. Посочете използваната от вас операционна
система, за да свалите (download) подходящата версия за R. Появяват се
няколко websites. Избираме по близък до България, за да се свали R побързо. Прочетете инструкциите за инсталиране на програмата. Освен ядрото можете да инсталирате и необходимите ви пакети.
Операторът за присвояване има вида <─. Коментарите се пишат след
знака #.
>x<- 2
Стойността на променливата се отпечатва като се изпише името £.
>x
[1] 2
>x+x
[1] 4
Векторът е обект в R. Дефинирането на вектор става с функцията c ().
>weight<- c(60,72,57,90,95,72)
>weight
[1] 60 72 57 90 95 72
Вие можете да работите с вектори в R така, както работите с обикновени числа.
128
Пример 1: Въведете теглото, измерено в килограми и ръста – в метри
на един пациент и на група пациенти. Пресметнете индексът на телесната
маса BMI на един пациент и на групата пациенти по формулата
BMI=weight / height2.
>weight.ii<- 60
>height.ii<- 1.75
>bmi.ii<- weight.ii/height.ii^2
> bmi.ii
[1] 19.59184
> height <- c(1.75, 1.80, 1.65, 1.90, 1.74, 1.91)
> weight <- c(60, 72, 57, 90, 95, 72)
>bmi<- weight/height^2
>bmi
[1] 19.59184 22.22222 20.93664 24.93075 31.37799 19.73630
Пресмятането на числовите характеристики на данните се реализира
със стандартни функции в R. Функцията mean(weight)пресмята извадковото средно, функцията sd(height)пресмята извадковото стандартно отклонение, а var (height) пресмята дисперсията на извадката.
Статистическите методи в R се реализират със стандартни процедури.
Пример 2: Стойността на индекса на телесната маса BMI би трябвало
да е 22.5. Проверете дали индексът на телесната маса на жителите на голям
град, от който е получена случайната извадка, е 22.5.
> ttest(bmi,mu=22.5)
One Sample t-test
data.: bmi
t = 0.3449, df = 5, p-value = 0.7442
alternative hypothesis: true mean is not equal to 22.5
95 percent confidence interval:
18.41734 27.84791
sample estimates:
meanofx
23.13262
Първата стъпка при анализа на едно множество от данни е да го представим графично. За визуално представяне на данните се използва функцията plot() с различни параметри.
> plot(height,weight)
> plot(height,weight,pch=2)
> plot(height,weight,pch=2,col="red")
129
90
80
60
70
weight
1.65
1.70
1.75
1.80
1.85
1.90
height
R работи като интерпретатор. Всяка команда се въвежда и веднага след
това се изпълнява. Командата се състои от един или повече оператори.
Всички команди на R връщат стойност, която може да се отпечата.
Командите работят с обекти. Обектът е абстрактен термин за всичко,
което може да се присвои на една променлива.
Функциите в R реализират математически и графични функции.
Синтаксис:
<име на функция>(<списък от аргументи>)
Пример 3: log(x)
plot (weight, height)
Аргументите могат да бъдат определени по два начина – със своята позиция и със своето име.
Пример 4: plot (weight, height, pch=2, col="red")
 функция, в която аргументите са определени със своята позиция:
plot(weight, height)
 функция, в която аргументите са определени със своето име:
plot (x=weight, y=height, pch=2, col="red")
Повечето от аргументите имат стойности по подразбиране. Някои от аргументите са задължителни, други са по избор. Например във функцията plot
(weight, height, pch=2, col="red") първите два аргумента са задължителни.
Обикновено многомерните данни се представят като матрици.
4.4. Някои важни функции в R
4.4.1. Функция mean()
Служи за изчисляване на извадковото средно. Например за 10 случайни числа от нормална популация със средно 0 и дисперсия 3 генерирани с
130
rnorm(), функцията mean() ще ни върне съответната средна стойност изчислена за десетте стойности:
> x <- rnorm(10,0,3)
> mean(x)
[1] -0.3585442
4.4.2. Функцията plot()
Това е много гъвкава функция за визуализация, която може да приема
много параметри освен данните, които да се визуализират, като например
тип и цвят на графиката, заглавие и имена на координатните оси и т.н. Да
илюстрираме работата на plot(), като използваме и функцията rnorm(). За
да визуализираме 10 случайни нормално разпределени числа със средна
стойност 0 и дисперсия 2, пишем следната команда в конзолата:
> x<- rnorm(10,0,2)
По този начин присвояваме масива с генерираните числа на променливата x. Визуализирането на така генерираните числа с плътни точки с червен цвят става със следната команда:
> plot (x, col="red", pch=20)
Резултатът от изпълнението на plot() е графика (фиг. 3.5), която се показва в отделен прозорец:
4.4.3. Функция read.table()
Използва се за импортиране на данни, получени от други програми.
Може да зарежда таблични данни от текстови файлове. С тази функция без
проблем се зареждат текстови данни в табличен вид, експортирани от
Excel или от произволна система за управление на бази данни. Задължителен параметър на функцията е пътят до текстовия файл, съдържащ данните. Като резултат се връща обект от тип dataframe. Особеното е, че този
обект има имена на колоните, които се използват при индексирането на
стойностите, съхранени в обекта. Тези имена се прочитат от текстовия
файл. Ако там те липсват, се присвояват стандартни такива. Например, ако
имаме файл с име data.txt, който има следния вид:
x
0.1
0.3
…
y
z
0.2 0.12
0.2 0.45
… …
131
фиг.5. Графика, изчертана от функцията plot()
За да го заредим като обект в R, използваме read.table():
> obj <- read.table („data.txt“)
Така obj става обект от тип data frame, който съдържа в себе си съдържанието на файла data.txt. Ако искаме да извлечем стойността на втория
елемент от колоната с име y, използваме следния синтаксис:
>obj$y[2]
Тази команда ще даде резултат 0.2. Символа ‘$’ се използва при избора
на обект, който се съдържа в dataframe. Това е доста близо до индексирането на матрици, с тази разлика, че символното име на обекта е по-удобно за
запомняне, отколкото числовия индекс в матрица. Тук обаче нещата са
малко разместени спрямо обектите-матрици, защото първият „индекс“,
който е от символен тип, ни дава колоната, а не реда.
4.4.4. Функция sd()
Функцията дава стандартното отклонение на извадката, дадена като аргумент(обикновено едномерен масив или вектор). Например за 10 случайни числа от гаусова популация със средно 0 и дисперсия 3 генерирани с
rnorm(), функцията sd() ще ни върне съответното стандартно отклонение,
изчислено по десетте стойности:
> x <- rnorm(10,0,3)
> sd(x)
[1] 4.402217
132
ОТГОВОРИ, РЕШЕНИЯ, УПЪТВАНИЯ:
Част първа. ВЕРОЯТНОСТИ
1. Елементи на комбинаториката. Основни методи за пресмятане
1.1. a) 8, б) 4, в) 4, г) 2; 1.2. V53  5.4.3  60, 3. V42  3.4.3  24; 1.3. V32  6;
1.4. а) V94  3024; б) V83  336; в) V72  42; г) 3V72  126; 1.5. V106 , V84 ;
10!
1.6. а) 12!, Б) (6!)(6!); 1.7. 15; 1.8. V105 
 30240; 1.12. 254;
5!
1.13. P5  5!  120, P15  15!  1307674368000, P100  100!  93326; 21544;
39441; 52681; 69923; 88562; 66700; 49071; 59682; 64381; 62146; 85929;
63895; 21759; 99932; 29915; 60894; 14639; 76156; 51828; 62536; 97920;
82722; 37582; 51185; 2109168640; 00000; 0000; 00000; 00000; 0000;
1.14. P8*P3=241920; 1.15. а) 62 = 36; б) C62 21  21; в) 11;
32!
1.16. За белот P328,8,8,8 
 99561092450391000,
8!*8!*8!*8!*
за бридж P5213,13,13,13 
52!
13!*13!*13!*13!
 53 644 737 765 488 792 839 237 440 000
4 *9!
6!
 30240 ;
P62,2,2 
 9;
1.18.
3!* 2!* 2!* 2!
2!* 2!* 2!
15!
7!
 630630; 1.20. C72 
 21;
1.19. 15!, 4!*5!*6!, P154,5,6 
4!*5!*6!
2!*5!
49!
6

 13983816, за играта „6 от 42“:
1.21. За играта „6 от 49“: C49
6!* 43!
42!
35!
C426 
 5245786, за „5 от 35“: C 355 
 324 6 32;
6!*36!
5!* 3 0 !
52!
5

 2598960; 1.23. а) C363 ; б) C41C322 ;
1.22. C52
5!* 47!
1
 C43 ; г) C323  4.C322 ; 1.24. C62  6, C102  10; 1.25. C93 ;
в) C41C322  C42C32
32!
16
1.26. P6=6!=720; 1.27. C72  28 плочки, 55 плочки; 1.28. C32
,
;
(8!)4
1.17.
P93,2,2,2 .4 
1.29. (C168 )2 , (C164 .C124 .C84 ) 2 ; 1.30. C189 , C186 .C126 ; 1.31. б) Cnnm1;
1.32. Cmk .Cnk .k !; 1.33. а) Cmn .Cmk n , б) Vmn .Vmk n ; 1.34. C nk ; Упътване: Модел
на Ферми-Дирак: Разпределят се k неразличими частици в n различими
клетки. Намерете броя на възможните начини за разпределяне, ако всяка клетка може да съдържа най-много 1 частица.
133
k
1.35. C n  Cnk k 1 , Упътване: Модел на Бозе-Анщайн: Разпределят се k
неразличими частици в n различими клетки. Намерете броя на възможните
начини за разпределяне, ако няма ограничение за броя на частиците, които
могат да попаднат в една клетка.
k
1.36 . V n  nk , Упътване: Модел на Максуел-Болцман: Разпределят се k
различими частици в n различни клетки. Намерете броя на възможните
начини за разпределяне, ако няма ограничение за броя на частиците, които
могат да попаднат в една клетка.
2. Основни понятия в теорията на вероятностите.
Алгебра на събитията
2.1. Ω={E, T} 2.13. а) А; б) A.B.Cc; в) A+B+C; г) A.B+A.C+B.C; д) A.B.C;
е) (A+B+C)c= Ac.Bc.Cc; ж) A.Bc.Cc+Ac.B.Cc+Ac.Bc.C+Ac.Bc.Cc;
з) A.B.Cc+ Ac.B.C+ A.Bc.C + A.Bc.Cc+ Ac.B.Cc+ Ac.Bc.C+ Ac.Bc.Cc;
и) A.B.Cc+Ac.B.C+Ac.B.C, k) 1.
3. Класическа вероятност. Свойства. Основни формули
за вероятност. Формули за сума на две и повече събития
3
4
1
 0,5; 3.2. P   0,5; 3.3. P ( A)  ,
6
8
6
2
3
3
P( D)   0,333 333 333 333 33;
P ( B )   0,5,
P (C )   0,5,
6
6
6
1
9
9
18
3.4. P( A)  , P ( B ) 
 0, 25, P (C ) 
 0, 25, P ( D ) 
 0,5,
36
36
36
36
6
1 3  5  5  3 1
P( E )  , P( F ) 
 0,5;
36
36
10!
63
5!*5!

 0,246 093 75,
3.5. а)
210
256
100!
50!*50!
б)
 0.079 589 237 387 178 761 498,
2100
1000!
50
0!* 500!  0.025 225 018 178 360 801 907,
в)
21000
10000!
*5000!  0.007 978 646 139 382 153 760 4;
г) 5000!10000
2
3.1.
134
P
3
 0,5;
6
P
6!
*55
1!*5!
3.6. P( A) 
 0.401 877 572 016 460 905 35,
66
60!
*550
10!*50!
P( B) 
 0.137 013 114 267 470 946 06,
660
600!
*5500
100!*5
00!
P(C ) 
 0.043 664 321 319 771 074 606,
6600
6000!
*55000
1000
!*50
00!
P( D) 
 0.013 818 575 994 724 363 625;
66000
C m .C nm
3.7. M nN  M ;
CN
6!
43!
*
3.8. P{3}  3!*3! 3!* 40!  0.017 650 403 866 870 101 838
49!
6!* 43!
6!
43!
*
P{4}  4!* 2! 2!* 41!  0.000 968 619 724 401 408 027 68,
49!
6!* 43!
6!
43!
*
5!*1!
1!*
42!  0.000 018 449 899 512 407 771 956,
P{5} 
49!
6!* 43!
6!
43!
*
P{6}  6!* 0! 0!* 43!  7.151123 842 018 516 2619 108 .
49!
6!* 43!
Упътване: Използвайте предната задача със стойности M=6, N=49,
n=6, m=3, 4, 5, 6.
3.9. P кент  флош 
P{каре}
4 *9
 0.000 013 851 694 523 963 431 526,
52!
5!* 47!
13* 48
 0.000 240 096 038 415 366 146 46,
52!
5!* 47!
135
13* 4 *12 * 6
 0.001 440 576 230 492 196 878 8,
52!
5!* 47!
13!
4*
 4 *9
5!*8!
P флош 
 0.001 966 940 622 402 807,
52!
5!* 47!
9 * 45  9 * 4
9
P кента 

 0.003 532 182 103 610 675 039 2,
52!
2548
5!* 47!
12!
13* 4 *
*4*4
2!*10!
P тройка 
 0.021 128 451 380 552 220 888,
52!
5!* 47!
12!
13* 4*
*6*6
198
2!*10!
P два  чифта 

 0.047 539 015 606 242 496 999,
52!
4165
5!* 47 !
12!
13* 6 *
*4*4*4
352
3!*9!
P чифт 

 0.422 569 027 611 044 417 77.
52!
833
5!* 47!
Упътване: При покера на всеки играч се раздават по 5 карти от пълно тесте от 52 карти. В играта се различават следните фигури, наредени по сила:
{кент флош}: петте изтеглени карти са от един цвят и следват по
големина;
{каре}: 4 от картите са от един вид (например 4 дами), а петата
е произволна;
{фул}: 3 от картите са от един вид, а 2 са от друг вид (например 3 попа и 2 седмици);
{флош}: петте карти са от един цвят, но не са 5 поредни;
{кента, цветна кента}: петте карти са поредни, но не са в един цвят;
{тройка}: 3 от картите са от един вид, а другите 2 са от два други
вида (иначе става фул);
{два чифта}: 2 карти от един вид, 2 карти от друг вид и една карта от
трети вид;
{чифт}: 2 карти от един вид, една карта от втори вид, една от
трети вид и една от четвърти вид.
P фул 
136
28!
21!

C287  C217 7!* 21! 7!*14! 2966


 0.901 793 858 315 597 446 03;
3.10.
28!
C287
3289
7!* 21!
2
2
7 * P10 * P2 7
3.11. ; 3.12.
; 3.13.

 0.106 060 606 1
n
n 1
P12
66
8!
2!*3!*3!
P82,3,3
2
10
3.14. P{в четериместния}  4,3,3 
  0.133 333 333 333
P10
4!*3!*3! 15
3.15. P( A) 
3!* P124,4,4 25

 0.274 725 274 725 274 725 27,
P155,5,5
91
P( B) 
3.16. P( A) 
3* C105
1

 0.000 999 000 999 001;
P155,5,5 1001
2 N .N !
2N
27
25
, P( B)  N ; 3.17. P{11} 
, P{12} 
;
(2.N )!
C2. N
216
216
Cn2 .n!
n!
n
9
1
,
P
{
B
}

,
P
{
C
}

; 3.19. 8 
 0.018 181 818;
n
n
n
n
n
n
C12 55
90!
10!*80!
520058680173
 100! 
 0.330 476 211 086 725 153 87;
10!*90! 1573664496040
3.18. P{ A} 
3.20.
10
C90
10
C100
3.21. P{поне една единица}  1 
54
671

 0.517 746 913 580 246 913 58,
64 1296
3524

3624
11033126465283976852912127963392284191


22452257707354557240087211123792674816
 0.491 403 876 130 903 259 58;
C1 .C1
2.V42
n 1
2.(k  1).(n  k )
 0,4;
3.22. 0.3; 3.23. n ; 3.24. k 1 2 nk =
; 3.25.
V53
6
n.(n  1)
Cn
P{поне един чифт}  1 
3.26.
Cmmnkk1l 2
3*3  6 *3
4
n2
;

0,75;
;
;
3.27.
3.28.
3.29.
Cmmn
62
9
n
CNk
1
1
1
1
k !* (10  k  1)!
; б) ; 3.33. a) , б)
;
;
;
3.31
.
3.32
.
a)
k
S
N
M
360
n!
15
10!
k !* ( N  k  1)!
;
3.34.
N!
3.30.
137
10!
V107
67200
3.35. 7
 3!

 0.060 480 006 048 000 604 800;
7
10  1 10  1 1111111
9!
560
3.36. a)

 0.085 352 842 554 488 645 024,
9
3!*3!*3!* 3 6561
9!*3!
280

 0.384 087 791 495 198 902 61;
б)
9
4!* 3!* 2!*3 729
n!
3.37.
n1 !* n2 !*...* n6 !* 6n
12!
1925
3.38. a) 12 
 0.000 053 723 217 092 478 280 750,
12
35831808
12!
* 26
11
2!*10!
б)

 0.001 414 609 053 497 942 386 8;
126
7776
3.39. Нека търсеното число е n. Тогава
365!
n
V365
Pn  1 
 0.475 695 307 662 550 068 91,
, P22  1  343!
365n
36522
365!
342!
P23  1 
 0.507 297 234 323 985 407 23. Следователно
36523
n=23.
1
2 * (n  k  1) * (n  2)! 2 * (n  k  1)
3.40.

; 3.41. ;
n!
n * (n  1)
n
3.42.
C m .C nm
2 * (m  1) * n * (m * n  2)!
2 * (m  1)

; 3.43. n nn k m ;
(m * n)!
m * (m * n  1)
Cnk
V104
10.C42 .V92
10.C43 .V91

0
.50
4,

0.
4
3
2
,
 0.036,
б)
в)
104
10 4
104
V101
C 2 .C 2
2.(12  22  ...  92 )  102

0.067,
 0.001;
e)
г) 4 4 10  0.027 д)
104
10 4
10
C N .C N
C 2 N 4
C 2 .C 2 N 2
3.45. а) 2 N 2 N 2 N б) 4 N2 N4 в) 4 24NN 4
C4 N
C4 N
C4 N
3.46. 0,01 (изходите са 100, а единственият благоприятен е да завършва
на 11)
3.44. а)
410 2*i *10!* (10  i )!
3308407


10
i  0 i !* (10  i )!* i !* (10  2 * i )!* 6
15116544
 0.218 860 011 918 068 045 18;
5
3.47. P  
138
P102,2,2,2,2 .P5
81

 0.080 919 080 919 080 919 081;
P153,3,3,3,3
1001
3! 1
3.49. P  3  ;
6 36
10
7
6
3.50. Pбяла  , Pзелена  , Pчервена  ;
23
23
23
C82 14
C1C1 16
 0.424 242 42, Pс различен цвят  8 2 4 
 0.484 848;
3.51. P2бели  2 
C12 33
C12
33
3.48. P 
3.52. P(A)= P( A) 
C122 33

 0.347 368 421 052 631 578 95,
C202 95
P( B) 
C82 14

 0.147 368 421 052 631 578 95,
C202 95
P(C ) 
C121 .C81 48

 0.505 263 157 894 736 842 11;
C202
95
C N2
CM1 .CN1
C2MM .C2NN
CM2
(
)


P
B
P
(
C
)
;
,
,
3.54
.
P=
CM2  N
CM2  N
C2MMN2 N
CM2  N
3.56. a) 6.5.4.3.=360; б) (5.4.3)/360=1/6; в) (4.3)/360=1/30; г) 1;
д) (5.4.3.2)/360=1/3; е) 4(5.4.3)/360=2/3
3.57. a) 8568; б) (7.6.5.4.3)/5!/ 8568=1/408; в) 5(13.12.11.10)/4!/
8568=3575/8568; г) 6.7. (5.4.3)/3!/ 8568=5/102; д) Допълнението на {поне един}= {нито един}, т. е. всички са от 3-ти или 4-ти с
Р=(13.12.11.10.9)/5!/
8568=1287/8568=143/952
Р(поне
един)=11287/8568=7281/8568=809/952
3.59. а) 4*3/(8*7)=3/14; б) 10+6, 10+7, 10+8, 10+9, 9+8, 9+7
6/(8*7)=3/28; в) 0; г) {8, 3+6, 5+10}, 3/56; д) Р{Поне едно} = 1-Р{нито
едно} =1-(4*3)/56=1-3/14=11/14; е) Р(А)=0, Р(В)=1/56, Р(АВ)=0,
Р(А)Р(В)=Р(АВ) => двете събития са независими;
3.60. а) ¼; б) 15/36=5/12; в) 15/36=5/12; г) 1/6; д) Допълнението на {поне
един}= {нито един}, т. е. всички са нечетни с Р=3.3/36=1/4, Р(поне едно
четно)=1-1/4=3/4;
е)
Р(А)=1/6,
P(В)=3/36=1/12,
(А|B)=P(AB)/P(B)=(1/36)/(1/12)=1/3. Зависими са.
3.53. P ( A) 
4. Геометрична вероятност
7
1
; 4.2. ; 4.3. (1-3.s)2; 4.4. P=(1-n.s)n-1
16
4
4.5. Не е уточнено как е прекарана хордата. Ето три възможни начина с
три различни отговора:а) Върху окръжността случайно се избират 2
точки, които са краищата на хордата, тогава P=⅓; б) В равнината се
прекарват успоредни прави на разстояние 2 между съседните. Избира
4.1.
139
се случайна точка от равнината и се прекарва окръжност с център избраната точка. Хордата е сечение между тази окръжност и най-близката
права, тогава P=½; в) В единичния кръг се избира по случаен начин
точка, която е център на хордата, тогава P=¼. Трите различни отговора
следват от трите различни случайни начина на прекарване на хордата.
5
5
.d ;
4.6. ; 4.7. s 
6
5 2
2
1
4.8. ln(2)   0.237 366 040 124 432 290 98
9
12
2
r
2.s
m
; 4.11. 0.5; 4.12. при m  k 2 P  1 
4.9. .arccos ; 4.10.
, при

 .a
R
3.k
2
m  k 2 P  0.5 
 r. 3 
k2
(a  r ).(b  r )
; 4.13.
; 4.14. 1 
 ; 4.15. 0.5;
6.m
a 
a.b

N

a3 
2.s   2.s 

-V.s
4.16. 0.75; 4.17. 0.25; 4.18. 1 
 .1 
 ; 4.19. P  1  3  , e
 R 
  .a    .b 
където V=4πa3/3;
2
4.20. P( A)   0.636 619 772 367 581 343 08,

4
1 1 
5!.2. 

 4 2   0.005 203 152 732 029 701 801 9;
P( B) 

4.21. P ( A)  0.25, P( B)  0.5 
P(C )  0.125 
1
 0.146 446 609 406 726 27,
2. 2
1
 0.036 611 652 351 681 57;
8. 2
5. Условна вероятност. Формула за умножение на вероятности.
Независимост на случайни събития
1
2
1
15 5
, б) P  ; 5.17. ; 5.18.
 ;
2
3
12
27 9
5.19. 0.7 *0.7 *0.8*0.8*0.8  0.25088; 5.20. 0.75;
1 2 1 1 1
1
2
; 5.22.
5.21. * * * * 
6 5 4 3 2 360
3
1 3 5
99 12611418068195524166851562157
5.23. * * *... *


2 4 6
100 158456325028528675187087900672
 0.079 589 237 387 178 761 498
5.10. а) P 
140
1
1
1
1
( N  K )!
*
*
*....*
=
,
N N 1 N  2
N  K 1
N!
M * N ( M  1) * ( N  1) ( M  2) * ( N  2)
5.25. 2
*
*
*….*
CM  N
CM2  N 2
CM2  N 4
5.24.
( M  N  1) * ( N  N  1) 2 N * M !* N !
=
( M  N )!
CM2  N  2
9 8 7
4 3 2
5.26. а) 1  * *  0.3, б) 1  * *  0.6;
10 9 8
5 2 3
n
5.27. 1  (1  p )4  0.5, p  0.159104...; 5.28. 1   1  pk 
k 1
5.29. (1  p ) k . p; 5.30. 1  (1  0.3) * (1  0.2 * 0.15)  0.321;
N
 364 
 364 
5.31. Трябва 
  0.5. 

365


 365 
 364 


 365 
252
 0.500 895 161 474 306 496 52,
253
 0.499 522 845 963 417 985 57 следователно търсеният брой е 253.
N
5
5.32. Трябва    1  p, където p=0.5, 0.8, 0.9 в съответните случаи.
6
Получаваме съответно а) 4≤N, б) 9≤N, в) 13≤N;
N
5.33.
Трябва
 35 
   0.5
 36 
24
 35 
   0.50859612386909674042,
 36 
25
 35 
   0.49446845376162183096, следователно заровете трябва да се хвър 36 
лят поне 25 пъти. 5.34.P(A) = P(B) = P(C) =0.5, P(AB) = P(AC) = P(BC) =
P(ABC)=0.25, следователно събитията са независими по двойки, но не са независими в съвкупност (виж и задачата на Бернщайн) 5.35. и в двата случая съ1
1
1
битията са независими: за 32 карти имаме P(A)= , P(B)= , P(AB)=
4
8
32
1
1
1
=P(A).P(B). Аналогично за 52 карти имаме P(A)= , P(B)= , P(AB)=
4
13
52
=P(A).P(B); 5.36. Решение: След като са извадени k картончета, възможните
изходи от тях са Pk=k!. Благоприятните са Pk-1=(k-1)!, тъй като най-голямото
число трябва да бъде последно. Интересното в задачата е,че отговорът не за3
1
виси от N; 5.37. P(A)=P(B)=0.5, P(C)=0.25, P(AB)= , P(AC)=P(BC)= , следо8
8
вателно А и С са независими, В и С са независими, но А и В не са независими;
21
7
7
, P(B)=
, P(C)= ; 5.42. а)7.7=49, б) (3.3)/49=9/49, в) 3/7,
5.38. P(A)=
620
155
31
141
г) Допълнението на {поне един} е{нито един}, т. е. всички не са ментови с
Р=4.4/49=16/49, Р(поне един)=1-16/49=33/49, д) 7.6=42, е) (3.2)/42=1/7,
ж) 3/6=1/2, з) Допълнението на {поне един} е{нито един}, т.е. всички не са
ментови с Р=4.3/42=2/7, Р{поне един}=1–2/7=5/7; 5.43. а) 15/60=1/4,
б) Р(Ми2)=Р(М ако 2) Р(2)=(5/15)(15/60)=1/12, в) 30/60=1/2, г) 5/30=1/6,
д) Р(А)=1/2 Р(А ако В)=10/25=2/3 зависими са, е) (30.29)(60.59)=29/118,
ж) (30)/ 59, з) Допълнението на {поне един} е {нито един}, т. е. всички са
момчета с Р=(30(29)/(60)(59)=29/118, Р(поне един)=1-29/118=89/118;
6. Формула за пълната вероятност. Формула на Бейс
a
c 1
b
c
.
.
;

a  b c  d 1 a  b c  d 1
3 C i .C 3i
C1 .C 2
6.2. Pедна бяла   a 3 b * ci 3 d 3i ,
i 0 C
Cc d 3
a b
6.1.
Cai .Cb3i Cc2i .Cd1 3i
*
;
3
i 0 C
Cc3 d 3
a b
5 10 11 8
8 6 31
*  *  * 
 0.322 916 666 7;
6.7.
24 24 24 24 24 24 96
3
Pдве бели  
6.8. а) p  1  p  . p  p. 2  p  , б ) p  1  p  . p  1  p  . p  p.(3 – p  p 2 )
2
m
. Решение: Дефинираме Hi1={от i-тата урна се вади бяла
mn
топка}, Hi2={от i-тата урна се вади черна топка}. Тогава P(H11)=
m
n
, P(H12)=
. По формулата за пълната вероятност пресмятаме
mn
mn
m
m
m 1
n
m
m
n
P(H21)=
*
+
*
=
, P(H22)=
*
m  n m  n 1 m  n m  n 1 m  n
mn mn
n
n 1
n
+
*
=
, откъдето индуктивно се пресмята, че P(Hi1)=
m  n m  n 1 m  n
m
n
, P(Hi2)=
mn
mn
N ( 1) k
. При големи стойности на N тази вероятност клони
6.10. PN  1  
k 0 k !
към 1-e-1= 0.632 120 558 828 557 678 40. Ето първите няколко стойности:
2
5
P2  0.5, P3   0.666 666 666 666 667, P4   0.625,
3
8
19
91
19
 P6 
 0.631 944 444 4,
P5 
 0.633 333 333, P5 
30
144
30
6.9.
142
177
 0.632 142 857 142 857 142 86,
280
3641
P8 
 0.632 118 055 555 555 555 56.
5760
Вижда се че много бързо вероятността клони към граничната си стойност.
k
k
k
k


1 ( n  1)
2 ( n  2)
3 ( n  3)
n 1
n 1  n  n  1 
6.11. 1  Cn .
 Cn .
 Cn .
 ...  (1) .Cn .
,
nk
nk
nk
nk
Упътване: Нека Aj={в j-тия вагон не се качва нито един пътник}. То(n  1) k
(n  2) k
(n  3)k
,
,
, …
.A
)=
.A
.A
)=
гава P(Aj)=
P(A
P(A
j
m
j
m
r
nk
nk
nk
P(A1.A2….An)=0;
6.12. Упътване: Нека А={Aказва истината}, D={Dказва истината}.
41
13
13
Търси се P(A|D). Но P(D)= 4 , P(D|A)= 3 , P(A.D)= 4 , и от дефини3
3
3
P7 
цията
получаваме
P(A|D)=
13
;
41
6.13.
1n  2n  3n  ...  N n
;
N n .( N  1)
Nn
3
1 1 1 1 1
;
; 6.16. n
6.14.        ; 6.15.
n
1  2  3n  ...  N n
28
 n1 n2   n1 n2 n3 
6.17. Решение: Първо се доказва че с вероятност 1 играта свършва след
краен брой ходове, тогава P(A)+P(B)=1, B(B)=0.5*P(A), следователно
2
1
4
2
1
P(A)= ; P(B)= ; 6.18. p1= , p2= , p3= , Упътване: аналогично
3
3
7
7
7
на предишната задача получаваме p1+p2+p3=1, p2=0.5*p1, p3=0.25*p1 и
n
;
след това решаваме системата; 6.19. и в двата случая Р 
nm
6.20. Решение: Hi={в урната е имало I бели топки}, i=1,2,3,…,n+1, от
1
i
, P  A Hi  
, тогава от формулата за пълна
условието P  H i  
n 1
n 1
n2
вероятност P ( A) 
. Пояснение на парадокса. Нека n=2.k. Тогава
2n  2
P(A)=(k+1)/(2k+1). Но ако една урна съдържа 2к+1 топки, то вероятността да извадим бяла топка oт нея е (к+1)/(2k+1) само когато точно
k+1 от топките са бели. Следователно, преди да пуснем бялата топка в
урната, там е имало точно к бели топки, а това противоречи на условието, че всички възможни предположения за броя на белите топки в урната са равновероятни. За по-голяма яснота може да се разгледа частният случай n=2. Грешката в горните разсъждения се състои в това, че
условието „урната има състав, който ние не знаем и който е един от изброените равновероятни“ предполага разглеждането на събитие, свързано с някакъв опит със случайни изходи. Такъв опит би могъл да бъде
143
например следният: Дадени са n+1 еднакви урни с по n+1 топки, броят
на белите топки във всяка урна е различен и е някое от числата 1,
2,...,n+1. Избираме по случаен начин една от урните. Тогава съставът
на тази урна може да бъде с еднаква вероятност всеки от възможните.
Случайният избор на топка от случайно избраната урна е опит, при
който с еднаква вероятност можем да попаднем на всяка от топките,
намиращи се в някоя от урните, а не само на топките, намиращи се в
една фиксирана урна. Затова вероятността (k+1)/(2k+ 1) означава, че от
всичките (2k+ I)2 топки белите са (2k+1).(k+1), а не че,в урната, която
сме избрали, има k+1 бели топки;
6.22. Решение: Дефинираме събитията А1={от първата кутия изтегляме
две бели топки}, А2={от първата кутия изтегляме бяла и черна топки},
А3={от първата кутия изтегляме две черни топки}, В={от втората кутия
изтегляме бяла топка}; Събитията А1, А2, А3 образуват пълна група от
събития, като
3.2
6.5
5
1
3.6 1
4
2!
Р  А1  
 , Р  А2  
 , Р  А3   2!  , Р  В | A1   ,
9.8 12
9.8 2
9.8 12
7
2!
2!
2!
3
2
Р  В | A2   , Р  В | A3   .
7
7
а) Използваме формулата за пълната вероятност:
8
Р  В   Р  В | A1  P  A1   Р  В | A2  P  A2   Р  В | A3  P  A3   ,
21
б) Използваме формулата на Бейс
1
Р(В|A1)P(A1)
21
P  A1 | B  
 8 
8
Р(В|A1)P(A1)+ Р(В|A2)P(A2)+ Р(В|A3)P(A3)
64
21
в) Oт формулата на Бейс
Р(В|A3)P(A3)
P( A3 | B ) 

Р(В|A1)P(A1)+ Р(В|A2)P(A2)+ Р(В|A3)P(A3)
5 5
.
25
7 12


3 1 4 1 5 5 52
.  .  .
7 12 7 2 7 12
г) Използваме биномна вероятност, като в случая събитието В наричаме „успех“ и р=8/21, n=3, k≥1. Тогава
144
Р  брой  успехи  1  1  Р  брой  успехи  1  1  Р  брой  успехи  0  
3
 13 
 1  C30 p 0 (1  p )3  1     1  0, 2372314005  0,7627685995.
 21 
1
9
, PB  ,
6.24. P(A)=0.25, P(B)=0.375, P(C)=0.2; 6.25. P  A  
330
22
8
2
1311
889
P  C   , P(D)=0, в) P  ; 6.26. P  A  
, P(B)=
,
2200
2200
11
15
204
4
11
2
P C  
, P  D   ; 6.27. P  A  
, P B  .
385
55
4000
11
7. Биномна вероятност. Схема на Бернули. Приближение на Поасон.
Локална и интегрална гранична теорема
7.1. P3 езита=
10
5
, P4 езита= ,
32
32
7.2. P  A   P  B   P  C   P  D   1  P  D c  
 1, P  E   1  P  D c   P  B   1  , P  F  
 P  Dc   P  B   P C  , P  G   P C | D  
 P  C.D  / P  D   P  C  / P  D 
C122 .510 107421875

 0.296 093 568 631 383 822 48,
612
362797056
C1 .511 48828125
P1 шестици  1212 
 0.269 175 971 483 076 202 25,
6
181398528
1
1
P12 шестици  12 
 4.5939365799778338517.1010 ,
6
2176782336
7.5. C54 *0.84*0.2=0.4096; 7.6. Решение: вероятността играчът да не по7.4. P2 шестици 
13
C48
6327

 0.30381752701080432173,
13
C52 20825
вероятността в схема на Бернули това да се случи 5 пъти поред е
10138861075067440407
0
P5  0   p 5 .1  p  

3916742769720634765625
 0.002 588 595 082 998 162 751 2,
и тъй като това събитие е малко вероятно (средно веднъж на около 386
такива опита с по 5 раздавания), играчът има основание да се оплаква.
1
7
7.7. Решение: а) P4  3   P8  5  , следователно по-вероятно е да
4
32
се спечелят 3 от 4 партии;
лучи асо в отделна игра е p 
145
5
80
93

 P8  5   P8  6   P8  7   P8  8  
, сле16 256
256
дователно по-вероятно е да се спечелят поне 5 от 8 партии. 7.8. Решение: Трябва Sn=Pn(0)+Pn(1)+Pn(2)≤0.1, следователно трябва да е изпъл n(n  1) 
нено неравенството Sn  0.8n * 1 
  0.1 . След пресмятане по32 

6825768185233408
лучаваме S 24 
 0.114 517 387 209 588 896 43,
59604644775390625
29273397577908224
S 25 
 0.098 225 222 843 688 620 445.
298023223876953125
Следователно трябва n≥25; 7.9. Решение: Вероятността даден абонат да
12 1
заеме линия в произволен момент е p 
 . Нека броят на линиите
60 5
е n. Тогава за да бъдат обслужени всички заявки в произволен момент,
1
трябва броят на успехите в схема на Бернули с дължина 10 и p= да не
5
надхвърля n. Вероятността за това трябва да е поне 0.99, следователно
получаваме, че трябва Sn  P10  0   P10 1  P10  2   ...  P10  n   0.99 или
б) P4  3  P4  4  
9445376
 0.967 206 502 400,
9765625
9703424
9757184
S5 
 0.993 630 617 600, S6 
 0.999 135 641 600,
9765625
9765625
9755624
S9 
 0.999 999 897 600,
9765625
1
 1.0240000000000000000.107.
1  S9 
9765625
Следователно за ниво на надеждност 0,99 са достатъчни 5 линии, а за
ниво на надеждност 0.999 са достатъчни 6 линии. За пълна надеждност са
73
 89.0244, следователно са необходинеобходими 10 линии. 7.11. n 
0.82
K
K 1
 p
7.13. P(A)=PИван,3(0).PПетър,3(0)+
ми 89 опита; 7.12.
;
N 1
N 1
PИван,3(1).PПетър,3(1)+ PИван,3(2).PПетър,3(2)+ PИван,3(3).PПетър,3(3) = 0.32076 при
вероятности 0.6 и 0.7 и = 0.245 при вероятности 0.5 и 0.8,
P(B)=PИван,3(1).PПетър,3(0)+
PИван,3(2).[PПетър,3(1)+
PПетър,3(0)]+
PИван,3(3).[PПетър,3(2)+ PПетър,3(1)+ PПетър,3(0)]= 0.243 при вероятности 0.6 и 0.7
и
=
0.
0.103
при
вероятности
0.5
и
0.8;
7.14.
N
C
P  PK  M 1  N  1 . p  CKN1N 1. p N .(1  p) K ; 7.15. 22NNKK ;
2
S n  0.999 съответно. Пресмятаме S 4 
146
М  N 1
7.16. P   CMk  N 1. p k .(1  p ) M  N k 1 , Упътване: Задачата е еквиваленкМ
тна на твърдението, че в схема на Бернули с дължина M+N-1 с вероятност за успех във всеки опит, равна на р, броят на успехите е поне M, а
на неуспехите е най-много N-1;
7.17. Решение: Нека H1={p=1/2}, H2={p=1/3}, A={116 успеха при 200
116 116
C116
C200
.2
,
P
A
|
H

,
опита}. Тогава P(H1)= P(H2)=0.5, P  A | H1   2200


1
00
200
2
3
P(H1|A) P(H1 ).P(A|H1 ) 3200


 1.989 629 969 913 055 211 9 следоваP(H 2 | A) P(H 2 ).P( A|H 2 ) 2316
телно е приблизително 2 пъти по-вероятно р да е равно на ½, отколкото
р да е равно на 1/3;
7.18. Решение: За четен брой успехи имаме: p0  1, p1  1  p,
индуктивно намираме pk  pk 1.1  p   1  pk 1  . p, откъдето
pk  1 / 2  1  2. p  . pk 1  1 / 2  , след почленно умножаване и
съкращаване получаваме pN  1 / 2  1  2 p  . P0  1 / 2  , следователно
N

. За нечетен брой вероятността е
 .1  1  2 p   ;
pN  1  1  2 p 
1  pN
N
N
7.19. Приближената стойност е   0.001* 5000  5, P  1  P0  P1 
 1  .e5  .e5  1  6.e5  0.959 572 318 005 487 197 42. Точната стойност е 1  0.9995000  5000 * 0.01* 0.9994999  0.959 639 689 041 808 2
8. Случайни величини. Функция на разпределение.
Основни свойства на функцията на разпределение
8.6. Решение: Построяваме множествата от всички 36 елементарни събития =(i,j): i=1, …, 6;j=1, …, 6 и забелязваме, че X=0 за 6 елементарни събития, X=1 за 10 елементарни събития, X=2 за 8 елементарни
събития, X=3 за 6 елементарни събития, X=4 за 4 елементарни събития
и X=5 за 2 елементарни събития. Тогава законът за разпределение на
случайната величина X има вида:
xi 0
1
2
3
4
5
pi 3/18 5/18 4/18 3/18 2/18 1/18
8.7. P ( x) 
 1
C 7xC35 x
63
, x  2,3,4,5 ; 8.8. Не, защото   ; 8.9. Eξ= .
5

x
1
x
5
C10
147
9. Дискретни случайни величини. Ред на разпределение.
Числови характеристики. Основни видове дискретни разпределения
9.11.Решение: =EX=1.2. Дефинираме случайната величина Y=(X-)2.
Нейният закон за разпределение е
yi 10.24 1.44 0.04 3.24 7.84
pi 1/5
1/5 1/5 1/5 1/5
Тогава DX=EY=4.56. Стандартното отклонение на Х е DX  2.135.
9.14. n=100, p=0.1, X=0,1,2,3,…,100; 9.19. а) Решение: Нека Х е броят
на дефектните изделия в една кутия. Тогава XBi (10, 0.03), P{X>1}=
1-P{X≤1}=1-P (0)-P(1), P (0)=C010 (0.03)0 (0.97)10; P(1)= C110 (0.03)1
(0.97)9; 9.20. а) XBi (6, 0.05), б) ЕХ=6. 0,05 = 0,3; DX=6. 0,05. 0,95 =
0,285; 9.21. Упътване: Нека X е броят на лекарите, открили болестта.
Тогава XBi (4, 0.8). P{X ≥1}=1- P{X = 0}; 9.22. Упътване: С Х означаваме броя на познатите отговори. XBi (10, 0.2); P{X≤7}= P{X= 7} +
P{X= 8} + P{X= 9}+ P{X= 10} 9.24. ξ~Bi(8,0.7), Eξ=5.6, Dξ=1.68, m=6,
P{2≤ ξ ≤4}=0.19281402; 9.25. а) ξ~Bi(8,0.7), б) Р=0.50147, в) Eξ=2/3,
11
22
9
81
Dξ= →σ=
9.26. ξ~Bi(18,0.1), Eξ= , Dξ= , P   1  1  0.918 ;
18
6
5
50
9.28. ξ~Ge(0.1), Eξ=9, Dξ=90, Fξ(2)=0.19 9.29.ξ~HG(2000,20), б) P=16
5
C1980
 20.C1980
296109
, в) Eξ=0.06, Dξ=
; 9.30. AI. Биномно, параметри
6
4997500
C2000
4 и 1/2
X
0
1
2
3
4
P 0,0625 0,25 0,375 0,25 0,0625
AII. ср.ст.=4(0,5)=2, дисп. = 4(0,5)(0,5)=1, ст.откл.=1,
0 x  0

0,0625 0  x  1
0,3125 1  x  2
AIII. Функцията е стъпаловидна: F ( x)  
0,6875 2  x  3
0,9375 3  x  4

4 x
1
AIV. Р  поне 2   Р  2   Р  3  Р  4   1  Р  0   Р 1  0,6875, В I. Само една стойност 1 с вер. 1, В II. ср.ст.=1, дисп. =0, ст.откл.=0,
0 x  1
, В IV. 0, Г I.
В III. F ( x)  
1 1  x
148
X
P
0
(0,5)3=0,125
1
0,5+0,52+0,53=7/8=0,875
Г II. ср.ст.=0,875, дисп.=(1-0,875)2(0,875)=1/64, ст.откл.=1/8=0,125,
0 x  0

Г III. F ( x)  0,125 0  x  1 , Г IV.0;
1 1  x

9.31. а) Дава 1000 лв., купува 500 кг и продава или за 500 лв. или за
1500лв
х
-500
500
р
0,5
0,5
0 x  500

б) F ( x)  0,5  500  x  500 , в) Р=Р(500)=0,5, г) 0, д) 0
1 x  500

е) Е= –100 лв.; губи 100 лв.
х -500 350
р 0,5 0,5
10. Непрекъснати случайни величини. Плътност. Функция на разпределение. Числови характеристики. Основни видове непрекъснати разпределения
10.8. а) Fξ(x)={0 при x<0, x.(2-x) при 0≤x≤1 и 1 при x>1}, б) 1, в) Eξ=1/3
10.18. Решение: Нека с X означим времето на безотказна работа. Тогава
EX=3
и
X~Exp(1/3).
Нека
с
Y
означим
печалбата.
10.19.
Упътване:
EY=1000.P{X>1}+750.P{X1}=…=250e-1/3+750;
X~Exp(1/3), P{X<1} = 1 – e-1/3 = 0,2811; 10.22. Упътване: Нека X е времето
между два курса на ферибота, а Yt – броя коли за време t. Тогава X=min{t,
Yt=10}, Yt~Po(7.t), P{X<1} = 1 – P{X≥1}; 10.26. Р{ξ> 400}=0.057053437;
10.27.
160,4
сантиметра;
10.28.
а)
С=3,
Решение:

 C
С  C
|1   1; б) Непрекъсната случайна
 f ( x)dx   4 dx  1 или
3 х 3
3

1 х
0 x  1

; в) Средната продължителност на безотказвеличина. F ( x)  
1
1  x 3 x  1
на
работа
е
3/2
или
1500
часа,
Решение:


 3
3
3 
3
EX   x f ( x)dx   x 4 dx   3 dx 
|1  ; г) стандартното откх
2
2 х 2

1
1 х
149
лонение на продължителността на безотказна работа е 0,866, Решение:

3 3
3
3
 2   ( x  ) 2 4 dx  , 
 0,866, д) Медианата=1,26 и модата=1,
2
x
4
4
1
M 3
1
Решение:  4 dx  0,5
 1 / 2 M 3  2 или M  1, 26 ; е) Решение:
M3
1 x
1
Р (да работи безотказно през първите 500 часа)= Р(Х<5)= F(5)= 1  3 =0,992
5
Р е много близко до 1, т. е. има шанс почти 99,2% да работи безотказно в
първите 500 часа, съвет-гаранция от 500 часа е добра; ж) Решение: Р(да работи безотказно през първите 150 часа)= Р(Х<1,5)= F(1,5)=1-1/(1,5)3
=0,70370; з) Биномна вероятност, Успех={да се смени в първите 150 часа}=
{да не работи безотказно през първите 150 часа}, Р(успех)=1- Р{да работи
безотказно през първите 150 часа}=1-Р(Х<1,5)=1-0,7037=0,2963≈0,3; 2 успеха при 5 опита с Р(успех) =0,3; P  C5 2 (0,3)2 (0,7)3 =0,3087;
10.29. AI. равномерно в (0,500), AII. ЕХ=250, Дисп.=250000/12 ст.откл.
0 x  0
 x

=144,34, AIII. F ( x)  
0  x  500 AIV.
 500
1 x  500
Упътване. Нека сградата се намира на разстояние С км от началото на
магистралата. Разпределението на У зависи от С. У=|Х-С| равномерно в
(С,500-С), AV. ЕУ=|ЕХ-ЕС|=|250-С|, AVI. мин ЕУ=ЕХ-ЕС=|250-С|= 0 при
0 при х  0
С=250, т.е. по средата на магистралата, БI. f ( x)  
,
0,01 x
при х  0
0,01e
при х  0
0
БII. ЕХ=100, дисп. =1/100, БIII. F ( x)  
;
0,01 x
при х  0
1  e
БIV. Упътване. Нека сградата се намира на разстояние N км от началото на магистралата. Средната стойност на У зависи от N. У=|Х-N|
 EX  N  100  N N  100
EY  
, БV . ЕУ  100  N ;
 N  EX  N  100 N  100
БV. ЕУ=|100-N|=0 при N=100 km.
150
11. Функции от случайни величани. Гранични закони.
Съвместно разпределение на две случайни величини.
Пораждащи функции. Характеристични функции.
Гранични закони.
11.1. Решение: Случайните величини X1, X2 и X3 са независими, откъдето следва, че и двете случайни величини X 12 и ( X 2  4 X 3 )2 също са независими. Тогава
E  X 12 ( X 2  4 X 3 ) 2   EX 12 .Е ( X 2  4 X 3 ) 2  E ( X 22  8 X 2 X 3  16 X 32 ) 
EX 22  8 E ( X 2 X 3 )  16 EX 32  1  8 EX 2 EX 3  16  17 , защото EX 12  DX  1.
11.2. Решение: Ако вземем решение t, то ще спечелим
6
ako p  p0
10
Xt  
6
10 ako p  p0
Ако вземем решение nt, то Xnt=0.
 x 0.8 ako x  0
Ще въведем функция полезност U. U ( x)  
ako x  0
x
Тогава очакваната полезност когато вземем решение t ще бъде EU(Xt).
Тогава U(0)=0 и EU  Xt   106.P  p  p0   106  0.8. P  p  p0  
 104.8  106  104.8  . P  p  p0 
Тогава условието EU(Xt)>0 ще е изпълнено, ако P ( p  p0 ) 
104.8
,
10  104.8
6
P( p  p0 )  0.0594
Извод: Решението t е по-добро от решението nt ако вероятността
P( p  p0 ) е малка.
11.3. Решение: Ако купим билет полезността е U(499) ако билетът е
печеливш и U(-1) ако билетът не печели. Тогава полезността е случайна величина със следния закон на вероятностно разпределение:
U(x) 499 -1
pi 0.001 0.999
Очакваната полезност е EU(x) = 0.001. 499 – 0.999.Ние ще предпочетем да купим билет, ако очакваната полезност е положително число,
т.е. когато 499 > 999 или >1.11.
11.4. D(X-Y)=6, D(2X-3Y+1)=39; 11.5. E(X-)3=1; 11.6. Решение:
а) Fη(x)=P{η<x}=P{ξ.x>1}. При x>0 Fη(x)= P{ ξ>x-1}=1-Fξ(x-1). При x<0
P{ξ<x-1}=Fξ(x-1).
При
x=0
Fη(x)=
P{
η<0}=Fξ(0);
Fη(x)=
б) Fη(x)=P{ξ<arctg(x)}=Fξ(arctg(x));
151
11.7. Решение:
F ( x)  P{  x}  P{ 2  x}  P{ x  x }  F ( x )  F ( x )
f ( x)  ( F ( x))'  F' ( x ).
1
2 x
 F' ( x ).
1
2 x

1

[ f ( x )  f ( x )];
2 x
11.10. f n ( x)  e x . f (e x ).
u
u  x. y x 
,
11.11. Решение: Извършваме смяната на променливите
v.
v y
yv
1
Тогава J  .
v
11.15. Решение:



a

E  f      f  x  .dF  x    f  x  .dF  x   f  a  .  dF  x  
 f  a  . P   a ;
11.16. Приложете резултата от предишната задача за функцията
f  x    x  E    ; 11.17. Приложете резултата от по-предишната за2
дача за функцията f(x)=eβx; 11.18. Решение: Прилагаме неравенството
n
на Чебишов за сумата  i :
i 1
n.b
b
P   i – n.a | n.   2 2  2 , откъдето веднага следва граничното
n
 i 1
 n
твърдение.
11.19. Решение:.f(x) е равномерно непрекъсната върху компактния интервал [0,1], следователно съществува константа М такава, че |f(x)|≤M за
всяко x  [0,1]. Освен това за всяко ε>0 съществува δ>0 такова, че за произволни x, y  [0,1], x  y    f  x   f  y    . Тогава за произволно
n
x  [0,1] имаме
n 
 k 
f ( x)  Bn ( x)    f ( x)  f    .Cnk .x k .(1  x)nk 
k 0 
 n 
 
k
 x 
n
  ( f  x   f ()).x k .(1  x) nk
k
 x 
n
Първата сума е по-малка или равна от ε, тъй като f  x   f  y    и
n
k
k
n k
n
 Cn .x .(1  x) ( x  1  x)  1.
k 0
152
Втората сума е по-малка от 2.M.
k k
nk
 Cn .x .(1  x) .
k
 x 
n
Нека сега ξ~Bi(n,x) (биномно разпределена случайна величина с параметри n и х). Тогава E  n.x, D  n.x.1  x  , от неравенството на Че1
за x   0,1 получаваме
4
n.x.(1  x)
1
k k
nk
.

 Cn .x .(1  x)  P    n.x  n.  
2 2
k
n
4.n. 2
 x 
бишов и x.(1-x)≤
n
M
 2. за доста2.n. 2
тъчно големи n. С това твърдението е доказано, тъй като ε е произволно положително число.
11.20. Решение: Нека Х1= сумата, която ще се изплати за злополука на
първия клиент. Дефинираме 10 000 сл.в., които са независими и еднакво разпределени. Общата сума, която ще изплати, е сумата от всички
тези 10 000 сл. в-ни, т.е.
От двете ограничения следва f ( x)  Bn ( x)   
10000
P (  X i  270 000)  ?
i 1
Съгласно ЦГТ, понеже 10 000 е достатъчно голямо число, можем да
използваме приблизително N(0,1).
10000
270000  10000(25) 

P  X i  270 000  P  Z 
  P( Z  2,5) 
i 1
80 10000


 1  P ( Z  2,5)  1  0,9938  0,0062
11.46. Решение: Нека Х1=брой „герб“ на едната монета, Х2= брой
„герб“ на другата монета. Двете случайни величини са независими и


Х=Х1+Х2. При това  X 1  t    X 2  t   E  eitX 1    0.5eitk  0.5(1  eit )
1
k 0
Тогава  X  t    X 1 X 2  t    X 1  t   X 2  t    0.5(1  e )   0.25(1  2eit  e 2it )
it
2
11.47. Решение:
a) FY  y   P(аX  b  y )  P( X  ( y  b) / а )  FX (( y  b) / а ).
0, x  0

Тъй като множеството от стойности на Х е [0,1] и Fx ( x)   x, x  [0,1] ,
1, x  1

153
то от неравенството 0≤(y-b)/а≤1 получаваме b≤y≤а+b. Тогава
yb
0,
 y  b
FY ( y )  
, у  [b, a  b] .
 a
1,
y  ab
б) Тъй като fY  x   f g ( X )  x   f X  h  x   . h '  x  , h  x    x  b  / a и
0, y  [b.a  b]
y  [0,1]

получаваме fY ( x)   1
у  [0,1]
 a , у  [b, a  b]
11.48. Решение: а) При y  0, тъй като няма стойности x за които
0,
f X ( x)  
1,
x ²  y, то FY  y   0, y  0.
При y  0, е изпълнено x ²  y, ако  y  x  y . Тогава,


I y   x : g  x   y  x :  y  x  y , и


FY  y   P  y  X  y  Fx  y   Fx   y  , у  0. ,
б) Ако y  0, тогава y  x ² няма реални решения, затова fY  x   0 при
y  0.
Ако y  0, тогава y  x ² има решения  y и
h x  g
 x   x . Следователно,
fY  x   f g ( X )  x   f X  h  x   . h '  x   FX'  h  x   .
11.49. Решение: a) Нека y≥b. Тогава g  x   y
FY  y   1 за y  b.
y . Освен това
1
за всякоx. Следователно,
Нека -b≤y<b. Тогава g(x) ≤y при x≤у. Следователно, FY (y) = P(g(X) ≤y)
= FX (y), -b≤y<b.
Нека y < -b, тогава g(x) < y за НИКОЕ x. Следователно, FY (y) = 0, y < -b.
11.51. Решение: Тъй като EХ=EУ=0. то cov(Х,У)=E[(Х−0)(У−0)]=E(ХУ).
За всички двойки (xi, y j) поне едно от числата xi, y j, pij е нула, откъдето
E(ХУ)=0 и cov(Х,У)=0, т.е. величините са некорелирани. Въпреки това те
са зависими.
11.52.
154
Y\X 1
2
3
4
5
6
0
1/8 1/6 1/6 1/6 1/6 1/8
1
1/12 1/12 1/12 1/12 1/12 1/12
Част втора. СТАТИСТИКА
12. Основни понятия в статистиката. Описателна статистика
12.1. Решение: б)
12.2. Решение: a)
б) Изчисляваме извадковото средно x  3.0 и попълваме таблицата
Тогава s 2 
xi
xi  x
 x  x
3.7
3.3
3.3
3.0
3.0
3.0
3.0
2.7
2.7
2.3
30.0
0.7
0.3
0.3
0
0
0
0
–0.3
–0.3
–0.7
0
0.49
0.09
0.09
0
0
0
0
0.09
0.09
0.49
1.34
2
i
1.34
 0.14888... и s  1.4888...  0.38586.
9
155
12.4. Упътване:
># Данните са записани във вектора loneliness
>median (loneliness)
[1] 3
12.5. Упътване:
># Променливите omega.7 и omega.9 съдържат данните.
а) summary (omega.9)
б) hist (omega.7); plot (density (omega.7)); plot (omega.9, omega.7)
13. Оценки на параметри на разпределението.
Точкови оценки. Интервални оценки
13.11. (4,73; 13,49) 13.12. (0,56; 1,36) 13.13. (83,4758; 112,5242)
13.14.(0,6093; 1,5760) 13.15. (0,0092; 0,0342) 13.16. (49,3846; 51,1154)
13.17. (7060.054; 7111.522) Решение наR:
# olive.oleic е променливата, в която са съхранени данните
t.test (olive.oleic)
846
13.23. а) x  251 , б) s²=846 s=29,0861, в) 251  t0,025, 8
=> (228,6425;
9
846
= (232,967; 269,033), д) интервалът в т. в)
9
е по-широк, по-голямо ниво води до по-широк интервал, е)
752
x  251 s 2  752
251  t0,025, 8
= (229,9211; 272,0788), ж) интер9
валът в т. е) е по-широк, това обаче не води до извод в общия случай,
понеже увеличаването на обема води до промяна и в дисперсията, която може да е по-голяма, но може и да е по-малка. 13.24.Решение на R:
> # Променливата price съдържа цените на застраховката.
>mean (price)
[1] 179.1992
>sd (price)
[1] 35.23228
273,3575), г) 251  t0,05 ,8
14. Проверка на хипотези за средна стойност на нормална популация
14.14. Решение на R:
f<- c(6, 9, 7, 5, 11, 5, 10, 8, 7, 10, 8, 8, 7, 2, 9, 6, 5, 8, 4, 5, 4, 6, 8, 10, 6, 6, 6, 5,
8, 7, 9, 6, 9, 8, 8, 7, 10, 10, 9, 9, 8, 10, 3, 7, 4, 9, 4, 8, 5, 8, 12, 7, 6, 4, 10, 5, 7, 5,
11, 7, 9, 6, 5, 8, 6, 8, 9, 7, 9, 3, 7, 9, 8, 7, 8, 7, 9, 4, 4, 7)
> t.test (f, mu=7)
One Sample t-test
data: f
t = 0.5864, df = 79, p-value = 0.5593
156
alternative hypothesis: true mean is not equal to 7
95 percent confidence interval:
6.670774 7.604226
sample estimates:
meanofx
7.1375
Извод: Нямаме основание да отхвърлим основната хипотеза. Приемаме я
за вярна. Очакваният брой фъстъчени зърна в една фъстъчена черупка е 7
15. Точкова оценка, доверителен интервал и проверка на хипотези
за алтернативни популации
15.2. С={х: х=2,3} 15.8. Решение на R:
а) > prop.test(x=215, n=400, p=0.5, alternative = „two.sided")$p.value
[1] 0.1470585
б) > prop.test(x=215, n=400, p=0.5, alternative = „greater")$p.value
[1] 0.07352926
Втори начин:
а) > prop.test(x=215, n=400, p=0.5, alternative = „two.sided")
1-sample proportions test with continuity correction
data: 215 out of 400, null probability 0.5
X-squared = 2.1025, df = 1, p-value = 0.1471
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.4872668 0.5870016
sample estimates:
p
0.5375
б)> prop.test(x=215, n=400, p=0.5, alternative = „greater")
1-sample proportions test with continuity correction
data: 215 out of 400, null probability 0.5
X-squared = 2.1025, df = 1, p-value = 0.07353
alternative hypothesis: true p is greater than 0.5
95 percent confidence interval:
0.4951306 1.0000000
sample estimates:
p
0.5375
Извод: Няма основание да се смята, че управляващите ще спечелят изборите.
157
16. Проверка на хипотези за две популации
16.1. Решение на R:
data.w<- c(4.58, 3.06, 2.45, 3.98, 1.40, 5.71, 4.08, 4.70, 2.55, 2.37, 3.70,
4.10, 2.12, 4.10,3.07, 4.20, 3.98, 2.46, 3.17, 3.94, 2.67, 2.72, 4.01, 2.49,
2.75, 3.44, 4.00, 3.40,2.61, 3.23, 4.87, 3.04, 4.15, 3.10, 0.81, 3.93, 3.43,
4.36, 3.76, 2.26, 3.54, 2.88)
data.b <- c(3.01, 2.96, 2.98, 2.92, 3.02, 3.04, 3.00, 3.03, 2.97, 2.97, 2.94,
3.04, 2.96, 2.97,3.01, 2.82, 3.03, 3.03, 3.01, 3.02, 2.92, 3.01, 2.91, 2.98,
3.03, 3.02, 2.95, 3.04, 3.06, 3.02,3.08, 2.97, 3.02, 2.87, 2.97)
t.test (data.w, data.b, alternative="great")
> data.w <- c(4.58, 3.06, 2.45, 3.98, 1.40, 5.71, 4.08, 4.70, 2.55, 2.37, 3.70,
4.10, 2.12, 4.10, 3.07, 4.20, 3.98, 2.46, 3.17, 3.94, 2.67, 2.72, 4.01, 2.49,
2.75, 3.44, 4.00, 3.40, 2.61, 3.23, 4.87, 3.04, 4.15, 3.10, 0.81, 3.93, 3.43,
4.36, 3.76, 2.26, 3.54, 2.88)
> data.b <- c(3.01, 2.96, 2.98, 2.92, 3.02, 3.04, 3.00, 3.03, 2.97, 2.97, 2.94,
3.04, 2.96, 2.97, 3.01, 2.82, 3.03, 3.03, 3.01, 3.02, 2.92, 3.01, 2.91, 2.98,
3.03, 3.02, 2.95, 3.04, 3.06, 3.02, 3.08, 2.97, 3.02, 2.87, 2.97)
> t.test (data.w, data.b, alternative="great")
Welch Two Sample t-test
data: data.w and data.b
t = 2.5347, df = 41.321, p-value = 0.007568
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
0.1254584 Inf
sample estimates:
mean of x mean of y
3.361190 2.988000
Извод: Теглото на белия щъркел е по-голямо от теглото на черния.
16.13. Решение на R: Първо ще проверим хипотезите, че двете популационни разпределения са нормални. В зависимост от резултата ще
стартираме функцията, реализираща критерий на Студент или критерий на Уилкоксон.
>olive.Liguria.linoleic<- c (1020, 1000, 1030, 990, 1050, 830, 880, 900, 970,
980, 990, 850, 860, 910, 1040,940, 930, 1010, 730, 690, 960, 1020, 1010, 850,
1030, 940, 820, 810, 920, 1010, 930, 910, 900, 830, 840,910, 850, 830, 800,
770, 760, 810, 750, 950, 870, 790, 810, 970, 870, 740)
>olive.Calabria.linoleic<- c (832, 950, 874, 940, 903, 892, 915, 870, 820, 823,
798, 829, 819, 840, 866, 870, 877, 928, 897, 757, 839, 786, 939, 925, 780, 743,
787, 872, 771, 819, 828, 618, 818, 633, 616, 923, 638, 609, 759, 869, 702, 855,
857, 823, 949, 790, 783, 738, 763, 780, 826, 810, 709, 898, 861, 848)
> alpha <- 0.05
> if ((shapiro.test (olive.Liguria.linoleic)$p.value > alpha)
+ &&
+ (shapiro.test (olive.Calabria.linoleic)$p.value > alpha)
158
+
+
+
+
+
){
print (“ Both samples likely to be from normal distributions.")
t.test (olive.Liguria.linoleic, olive.Calabria.linoleic, alternative ="great")
} else {
print ("At least one of the samples unlikely to be from normal
distribution.")
+ wilcox.test (olive.Liguria.linoleic, olive.Calabria.linoleic, alternative
="great")
+ }
[1] „At least one of the samples unlikely to be from normal distribution."
Wilcoxon rank sum test with continuity correction
data: olive.Liguria.linoleic and olive.Calabria.linoleic
W = 2010.5, p-value = 5.645e-05
alternative hypothesis: true location shift is greater than 0
Извод: p-value< 0.01 Следователно отхвърляме основната хипотеза в полза
на алтернативата. Средното съдържание на линоленовата киселина в зехтин
от Източна Лигурия надвишава средното съдържание на линоленовата киселина в зехтин от Калабрия.
16.14. а) Решение: Нека с 93 означим средната температура на морската
вода през 1993 г. Ще проверим хипотезата H 0 : 93  23 срещу алтернативата H1 : 93  23 .
Код на R:
> t.test (sample.tao.93, mu = 23)
One Sample t-test
data: sample.tao.93
t = 3.3969, df = 24, p-value = 0.002376
alternative hypothesis: true mean is not equal to 23
95 percent confidence interval:
23.20076 23.82244
sample estimates:
meanofx
23.5116
Извод: p-value<0.05. Следователно отхвърляме основната хипотеза в полза
на алтернативната. Средната температура на морската вода през 1993 година е различна от 23 градуса.
б) Решение: Нека с 93 и 97 означим средната температура на морската
вода през 1993 и 1997г. Ще проверим хипотезата H 0 : 93  97  0.5 срещу
алтернативата H1 : 93  97  0.5 .
Код на R:
>t.test (sample.tao.93, sample.tao.97, mu = 0.5, alternative ="less")
Welch Two Sample t-test
data: sample.tao.93 and sample.tao.97
159
t = -24.6444, df = 47.255, p-value < 2.2e-16
alternative hypothesis: true difference in means is less than 0.5
95 percent confidence interval:
-Inf -4.110776
sample estimates:
mean of x mean of y
23.5116 27.9592
Извод: p-value< 0.05. Следователно отхвърляме основната хипотеза в полза
на алтернативната. Средната температура на морската вода през 1997 г. се е
покачила с повече от 0.5 градуса над средната температура на морската вода
през 1993 г.
16.17. Решение: средната стойност на дебелината на окото с глаукома е
x  455, а на незасегнатото око е y  459. Средната стойност на разликата
е d  x  y  4, а извадковото средно е sd  10.74. Тестваме хипотезата
H 0 : 1   2 при алтернатива H1 : 1   2 при n=8, използваме t-теста при
d
4
n
8  1,053, докато t7, 0,05  1,895.
Sd
10,74
Доколкото 1.053  1.895 нямаме основание да отхвърлим H0, т.е. нямаме
достатъчно основание да твърдим, че глаукомата влияе на дебелината на роговицата на окото.
16.18. а) За H 0 : m1  m2 и Н1 : m1  m2 , няма основание да се отхвърли основната хипотеза, че средният ръст на населението в Северната област е
равен на средния ръст на населението в Централната област.
α=0,1. Статистиката е t 
17. Проверка на хипотези за нормалност на популация
17.3. а) Решение: Код на R:
> sample.tao.97 <- c (27.79, 27.13, 27.05, 28.30, 27.27, 26.91, 26.99, 27.23,
27.59, 26.36, 26.35, 27.79, 27.43, 26.94, 26.67, 28.18, 26.39, 26.74, 26.59,
28.40, 27.68, 26.91, 27.28, 26.98, 27.67, 27.09, 28.37, 27.74, 27.28, 27.67)
> mean (sample.tao.97)
[1] 27.29233
30
Извод: Извадковото средно е x   xi  27.29
i 1
б) Решение: Нека с 97 означим средната температура на въздуха през
1997 г. Ще проверим хипотезата H 0 : 97  26 срещу алтернативата
H1 : 97  26 .
Код на R:
> t.test (sample.tao.97, mu=26, alternative="great")
One Sample t-test
data: sample.tao.97
t = 12.1003, df = 29, p-value = 3.7e-13
160
alternative hypothesis: true mean is greater than 26
95 percent confidence interval:
27.11086 Inf
sample estimates:
meanofx
27.29233
Извод: p-value< 0.01 Следователно отхвърляме основната хипотеза в
полза на алтернативата. Средната температура на въздуха през 1997 година е по-висока от 26 градуса по Целзий.
в) Решение: Нека с 93 и 97 означим средната температура на въздуха
съответно през 1993 и 1997 г. Ще проверим хипотезата H 0 : 93  97
срещу алтернативата H1 : 93  97 .
Код на R:
> sample.tao.93 <- c (22.35, 22.83, 23.62, 24.42, 24.34, 23.62, 23.26, 22.22,
22.94, 23.78, 22.09, 22.19, 23.54, 23.20, 22.86, 22.69, 23.75, 22.35, 24.62,
23.94, 23.65, 22.55, 24.80, 22.24, 22.83, 24.80, 23.65, 23.38, 23.38, 22.98)
> t.test (sample.tao.93, sample.tao.97, alternative="less")
Welch Two Sample t-test
data: sample.tao.93 and sample.tao.97
t = -22.0938, df = 53.128, p-value < 2.2e-16
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -3.69384
sample estimates:
mean of x mean of y
23.29567 27.29233
Извод: p-value< 0.05 Следователно отхвърляме основната хипотеза в
полза на алтернативната. Средната температура на въздуха през 1997 година е по-висока от температурата на въздуха през 1993 година.
г) Решение: Ще проверим хипотезата H 0 : разпределението на случайната величина, която моделира температурата на въздуха, е нормално (гаусово) срещу алтернативата
H1 : разпределението на случайната величина, която моделира температурата на въздуха, не е нормално.
> shapiro.test (sample.tao.97)
Shapiro-Wilk normality test
data: sample.tao.97
W = 0.9608, p-value = 0.3246
> shapiro.test (sample.tao.93)
Shapiro-Wilk normality test
data: sample.tao.93
W = 0.9525, p-value = 0.197
161
Извод: p-value> 0.05 Следователно нямаме основание да отхвърлим основната хипотеза. Разпределението на случайната величина, която моделира температурата на въздуха, е нормално (гаусово).
д) Решение:
>t.test (sample.tao.97, conf.level=0.9)
One Sample t-test
data: sample.tao.97
t = 255.5422, df = 29, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
90 percent confidence interval:
27.11086 27.47380
sample estimates:
meanofx
27.29233
Извод: С 90% сигурност може да твърдим, че средната температура на
въздуха на тихоокеанското крайбрежие на Перу и Еквадор през 1997г. е
била между 27.11 и 27.47 градуса по Целзий.
> t.test (sample.tao.97)
One Sample t-test
data: sample.tao.97
t = 255.5422, df = 29, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
27.07390 27.51077
sample estimates:
meanofx
27.29233
Извод: С 95% сигурност може да твърдим, че средната температура на
въздуха на тихоокеанското крайбрежие на Перу и Еквадор през 1997г. е
била между 27.07 и 27.51 градуса по Целзий.
> t.test (sample.tao.97, conf.level=0.99)
One Sample t-test
data: sample.tao.97
t = 255.5422, df = 29, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
99 percent confidence interval:
26.99795 27.58672
sample estimates:
meanofx
27.29233
Извод: С 99% сигурност може да твърдим, че средната температура на
въздуха на тихоокеанското крайбрежие на Перу и Еквадор през 1997г. е
била между 26.99 и 27.58 градуса по Целзий.
162
С нарастване на доверителната вероятност дължината на доверителния
интервал расте.
17.4. Решение на R:
>data.oleic<- c (7172, 7820, 7417, 7650, 6928, 6806, 7840, 7900, 6499,
6504, 7620, 6608, 6948, 7771, 7323, 7025, 7030, 7123, 7277, 7416, 7375,
7714, 7955, 6913, 7553, 7650, 7229, 7086, 6595, 7011, 7540, 8018, 6752,
7130, 7760, 6737, 7000, 6994, 7955, 7395, 7380, 7285, 6961, 7327, 6923,
7680, 7415, 7965, 7383, 7580, 7620, 6630, 7107, 6300, 7105, 6898, 7958,
7103, 7006, 6997)
> shapiro.test (data.oleic)
Shapiro-Wilk normality test
data: data.oleic
W = 0.9749, p-value = 0.2508
17.6. Решение: Първо данните трябва да се групират. Стойностите са в
интервала [0; 3,2], който удобно може да се раздели на 4 равни по дължина подинтервала. Вариационния ред е 0,11 ≤ 0,28 ≤ 0,35 ≤ 0,45 ≤ 0,52
≤ 0,88 ≤ 1,02 ≤ 1,27 ≤1,28 ≤ 1,42 ≤ 1,65 ≤ 1,95 ≤ 2,20 ≤ 2,44 ≤ 2,45 ≤ 2,48
≤ 2,60 ≤ 2,63 ≤ 2,77 ≤ 3,08.
интервали (aj-1,aj]
абсолютни честоти nj
(0; 0,8] (0,8; 1,6] (1,6; 2,4] (2,4; 3,2]
5
теоретична честота npj 3,096
5
3
7
6,014
5,91
3,08
2
2
Пресмятаме  емп
 7.7638. От таблицата определяме квантила  0.95
за
.
2
2
2
 3.8414553. Понеже  емп
  0.95
хипотезата Н0
k=4, r=2 →k-r-1=1:  0.95
.
се отхвърля – съвкупността не е нормално разпределена.
18. Непараметрични тестове
18.3. д) Решение на R:
# Векторът x съдържа данните
mean (x); var(x)
summary (x)
hist(x); plot (density(x))
shapiro.test(x)
wilcox.test (x, mu=900)
wilcox.test (x, conf.int = TRUE, conf.level = 0.99)
18.4. Съдържанието на еритроцитите в кръвта на мъжете е по голямо от
съдържанието на еритроцити в кръвта на жените.
19. Елементи на регресионен и дискриминантен анализ
19.2. Код на R:
# Данните са записани в променливите palmitic и stearic.
plot (palmitic, stearic)
163
19.3. Решение:
> palmitoleic <- c (112, 154, 207, 100, 87, 69, 260, 153, 37, 154, 93, 149,
90, 77, 103, 45, 185, 91, 180, 114, 70, 70, 241, 183, 144, 60, 75, 101, 70,
185, 75, 162, 90, 90, 49, 75, 92, 182, 80, 85, 90, 60, 60, 60, 182, 164, 163,
80, 128, 58, 206, 90, 97, 75, 49, 206, 90, 192, 151, 180)
> oleic <- c (7007, 6917, 7152, 7530, 7170, 7714, 6488, 7107, 7955, 6991,
7235, 7082, 7620, 7243,7395, 7779, 6956, 7410, 7055, 7337, 7955, 7958,
6705, 6747, 6972, 7550, 7396, 7230, 7860, 6842, 7399, 6725, 7680, 7780,
7924, 7980, 7006, 7020, 7870, 7415, 7068, 7950, 7890, 7985, 7100, 7086,
6901, 7610, 7189, 7950, 6806, 7810, 7499, 7975, 7747, 6680, 7420, 6996,
7159, 7610)
> lm (palmitoleic ~ oleic)
Call:
lm(formula = palmitoleic ~ oleic)
Coefficients:
(Intercept) oleic
920.2874 -0.1091
> summary (lm (palmitoleic ~ oleic))
Call:
lm(formula = palmitoleic ~ oleic)
Residuals:
Min 1Q Median 3Q Max
-63.616 -20.452 1.134 18.390 90.308
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 920.287386 69.874119 13.17 <2e-16 ***
oleic -0.109145 0.009479 -11.51 <2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 30.37 on 58 degrees of freedom
Multiple R-squared: 0.6957, Adjusted R-squared: 0.6904
F-statistic: 132.6 on 1 and 58 DF, p-value: < 2.2e-16
Кодна R:
# Данните са съхранени в променливите (обектите) palmitoleic и oleic.
lm (palmitoleic ~ oleic)
summary (lm (palmitoleic ~ oleic))
19.6. > X <c(80,80,80,80,80,100,100,100,100,100,100,120,120,120,120,120,140,140,14
0,140,140,140,140,140,160,160,160,160,160,160,180,180,180,180,180,180,
200,200,200,200,200,220,220,220,220,220,220,220,240,240,240,240,240,24
0,260,260,260, 260,260,260,260)
> Y <c(55,60,65,70,75,65,70,74,80,85,88,79,84,90,94,98,80,93,95,103,103,108,11
3,115,102,107,110,116,118,125,110,115,120,130,135,140,120,136,140,144,
164
145,135,137,140,152,157,160,162,137,145,155,165,175,189,150,152,175,17
8,180,185,191)
> plot (X,Y)
> cor (X,Y)
[1] 0.9516158
> model <- lm (Y~X)
> model
Call:
lm(formula = Y ~ X)
Coefficients:
(Intercept) X
17.0906 0.5997
> summary (model)
Call:
lm(formula = Y ~ X)
Residuals:
Min 1Q Median 3Q Max
-24.010 -8.044 1.996 7.976 27.990
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 17.09060 4.59482 3.72 0.000447 ***
X 0.59967 0.02521 23.79 < 2e-16 ***
19.7. y=2.9176 – 0.4533 x
> x <- c(2.50, 0.50, 2, 3.50, 1, 0.50, 2.50, 2.60, 3, 2,0.50, 0.40, 0.60, 4, 0.50,
3.50, 3.90, 4.70, 1.90, 0.90, 5, 1.50, 0.80, 1.50, 2.70, 1.70, 1.70, 0.70, 4.0,
5.0, 1.20, 1.90, 2.60, 3.60, 0.50, 3.60,4.4, 4.8, 0.8, 5.2)
> y <- c(2, 3, 2, 1, 2, 3, 2, 2, 1, 2, 3, 3, 3, 1, 3, 1, 1, 1, 2, 2, 1, 2, 3, 2, 2, 2, 2,
3, 1, 1, 2, 2, 1, 1, 3, 1, 1, 1, 2, 1)
> cor(x,y)
[1] -0.9043049
> plot(x,y)
> lm(y~x)
Call:
lm(formula = y ~ x)
Coefficients:
(Intercept) x
2.9176 -0.4533
> summary (lm(y~x))
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-0.73893 -0.24960 -0.01093 0.30907 0.44507
Coefficients:
165
lowess(i, sp500)$y
900
1000
sp500
800
900
800
800
900
sp500
1000
1000
1100
1100
1100
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.91760 0.09723 30.01 < 2e-16 ***
x -0.45333 0.03472 -13.06 1.27e-15 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3328 on 38 degrees of freedom
Multiple R-squared: 0.8178, Adjusted R-squared: 0.813
F-statistic: 170.5 on 1 and 38 DF, p-value: 1.266e-15
19.8. Код на R:
cor (i,sp500)
op <- par(mfrow = c(1, 3))
plot(i,sp500);
plot(i,sp500); lines (lowess (i,sp500), col = „dark green", lwd=2)
plot (lowess(i, sp500))
Решение:
> cor (i,sp500)
[1] 0.740779
Извод: Извадковият корелационен коефициент не е близко до 1. Следователно не съществува линейна зависимост между променливите.
> op <- par(mfrow = c(1, 3))
> plot(i,sp500);
> plot(i,sp500); lines (lowess (i,sp500), col = „dark green“, lwd=2)
> plot (lowess(i, sp500))
-30
-20
-10
0
i
10
20
-30
-20
-10
0
i
10
20
-30
-20
-10
0
10
20
low ess(i, sp500)$x
Извод: Графиките допълнително показват, че точките не лежат върху
права, т. е. не съществува линейна зависимост между променливите.
19.9. Код на R:
От файла на Excel копираме данните в клипборда, а оттам в променливата data. В първите 7 колони от таблицата с имена от F1 до F7 са записани стойностите на лингвистичните характеристики. Колоната с име
166
Class съдържа категорийната променлива, която има две нива, кодирани с 1 и 2, съответно за обективните и субективните текстове.
> data <- read.table ("clipboard", head=TRUE)
Ще запишем данните за обективните текстове в матрицата ot, а данните
за субективните текстове в матрицата st.
> ot <- as.matrix (data[1:17,1:7])
> st <- as.matrix (data[18:39,1:7])
1. Ще проверим предположението за нормалност на под-популациите
при ниво на значимост 0.05
> shapiro.test(ot[,1])
Shapiro-Wilk normality test
data: ot[, 1]
W = 0.9709, p-value = 0.8347
> shapiro.test(ot[,2])
Shapiro-Wilk normality test
data: ot[, 2]
W = 0.9573, p-value = 0.5813
> shapiro.test(ot[,3])
Shapiro-Wilk normality test
data: ot[, 3]
W = 0.8684, p-value = 0.02075
> shapiro.test(ot[,4])
Shapiro-Wilk normality test
data: ot[, 4]
W = 0.9529, p-value = 0.5047
> shapiro.test(ot[,5])
Shapiro-Wilk normality test
data: ot[, 5]
W = 0.8973, p-value = 0.06114
> shapiro.test(ot[,6])
Shapiro-Wilk normality test
data: ot[, 6]
W = 0.9775, p-value = 0.9315
> shapiro.test(ot[,7])
Shapiro-Wilk normality test
data: ot[, 7]
W = 0.9261, p-value = 0.187
> shapiro.test(st[,1])
Shapiro-Wilk normality test
data: st[, 1]
W = 0.9138, p-value = 0.05672
> shapiro.test(st[,2])
Shapiro-Wilk normality test
data: st[, 2]
167
W = 0.975, p-value = 0.8235
> shapiro.test(st[,3])
Shapiro-Wilk normality test
data: st[, 3]
W = 0.9447, p-value = 0.247
> shapiro.test(st[,4])
Shapiro-Wilk normality test
data: st[, 4]
W = 0.9478, p-value = 0.2861
> shapiro.test(st[,5])
Shapiro-Wilk normality test
data: st[, 5]
W = 0.8757, p-value = 0.01002
> shapiro.test(st[,6])
Shapiro-Wilk normality test
data: st[, 6]
W = 0.9686, p-value = 0.6792
> shapiro.test(st[,7])
Shapiro-Wilk normality test
data: st[, 7]
W = 0.9824, p-value = 0.9487
Извод: Отхвърляме хипотезата за нормалност на третата подпопулация с обективни текстове и петата под-популация със субективни текстове. Затова ще отстраним тези променливи от анализа.
> bartlett.test(data[,1]~data$Class)
Bartlett test of homogeneity of variances
data: data[, 1] by data$Class
Bartlett's K-squared = 2.8368, df = 1, p-value = 0.09213
> bartlett.test(data[,2]~data$Class)
Bartlett test of homogeneity of variances
data: data[, 2] by data$Class
Bartlett's K-squared = 7.3663, df = 1, p-value = 0.006646
> bartlett.test(data[,4]~data$Class)
Bartlett test of homogeneity of variances
data: data[, 4] by data$Class
Bartlett's K-squared = 0.8018, df = 1, p-value = 0.3705
> bartlett.test(data[,6]~data$Class)
Bartlett test of homogeneity of variances
data: data[, 6] by data$Class
Bartlett's K-squared = 0.0013, df = 1, p-value = 0.9713
> bartlett.test(data[,7]~data$Class)
Bartlett test of homogeneity of variances
data: data[, 7] by data$Class
Bartlett's K-squared = 8.071, df = 1, p-value = 0.004498
168
> anova (lm(data[,1]~data$Class))
Analysis of Variance Table
Response: data[, 1]
Df
1
37
Sum Sq Mean Sq
1295.0 1295.00
4923.4
133.06
F value
9.7321
Pr(>F)
0.0035 **
data$Class
Residuals
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Извод: р-стойността, означена с Pr(>F), е 0.0035. Популационните
средни са различни и затова включваме тази променлива в дискриминантния анализ като предиктор.
> oneway.test (data[,2]~data$Class)
One-way analysis of means (not assuming equal variances)
data: data[, 2] and data$Class
F = 21.6938, num df = 1.000, denom df = 22.697, p-value = 0.0001126
Извод: р-стойността, р-стойността, означена с p-value, е 0.0001126.
Популационните средни са различни и затова включваме тази променлива в дискриминантния анализ като предиктор.
> anova (lm(data[,4]~data$Class))
Analysis of Variance Table
Response: data[, 4]
data$Class
Residuals
Df
1
37
Sum Sq Mean Sq F value
14.3
14.291 0.1535
3443.7
93.072
Pr(>F)
0.6974
Извод: Средните са равни затова изключваме тази променлива от дискриминантния анализ.
> anova (lm(data[,6]~data$Class))
Analysis of Variance Table
Response: data[, 6]
Df
Sum Sq Mean Sq F value
Pr(>F)
data$Class
1
923.73
923.73
37.939 3.82e-07 ***
Residuals
37
900.86
24.35
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Извод: Средните са различни и затова включваме тази променлива в
дискриминантния анализ като предиктор.
> oneway.test(data[,7]~data$Class)
One-way analysis of means (not assuming equal variances)
data: data[, 7] and data$Class
F = 7.0578, num df = 1.000, denom df = 22.302, p-value = 0.01431
169
Извод: Средните са различни и затова включваме тази променлива в
дискриминантния анализ като предиктор.
Първата, втората, шестата и седмата лингвистични характериристики
могат да бъдат включени в дискриминантния анализ. В променлива
data.da ще запишем данните, необходими за пресмятане на извадковия
корелационен коефициент.
> data.da <- data[,-8]
> data.da <- data.da[,-3:-5]
> cor (data.da)
F1
F2
F6
F7
F1
1.0000000
0.3947732
0.2059053
-0.1053393
F2
0.39477320
1.00000000
0.58014191
-0.09238649
F6
0.2059053
0.5801419
1.0000000
-0.3053774
F7
-0.10533926
-0.09238649
-0.30537745
1.00000000
Извод: Ще изпълним дискриминантния анализ с независимите предиктори F2 и F7. Подготвяме данните:
> data.da <- data.da[,-3]
> data.da <- data.da[,-1]
> library (MASS)
> data.qda <- qda (data.da, data$Class)
> predicted.clas <- predict (data.qda,data.da)$class
> table (data$Class, predicted.class)
predicted.class
1 2
1 14 3
2 2 20
Извод: От всичките 39 наблюдения 5 са класифицирани неправилно.
Ще приемем, че точността е задоволителна и ще прогнозираме като
вместо 7 лингвистични характеристики използваме само 2 – F2 и F7.
> new.data <- data.frame(F2=23.9,F7=663)
> predict (data.qda,new.data)$class
[1] 2
Levels: 1 2
Извод: Изказването на този политик е субективно.
170
СЪДЪРЖАНИЕ
ПРЕДГОВОР ....................................................................................................... 3
Част първа. ВЕРОЯТНОСТИ .................................................................. 5
1. Елементи на комбинаториката.
Основни методи за пресмятане. .............................................................. 5
2. Основни понятия в теорията на вероятностите.
Алгебра на събитията. ............................................................................ 12
3. Класическа вероятност. Свойства. Основни формули
за вероятност. Формули за сума на две и повече събития. ..................... 14
4. Геометрична вероятност. ....................................................................... 21
5. Условна вероятност. Формула за умножение
на вероятности. Независимост на случайни събития. ......................... 24
6. Формула за пълната вероятност. Формула на Бейс. ........................... 31
7. Биномна вероятност. Схема на Бернули. Приближение
на Поасон. Локална и интегрална гранична теорема .............................. 36
8. Случайни величини. Функция на разпределение.
Основни свойства на функцията на разпределение. ............................ 40
9. Дискретни случайни величини. Ред на разпределение.
Числови характеристики. Основни видове дискретни
разпределения. ........................................................................................ 42
10. Непрекъснати случайни величини. Плътност.
Функция на разпределение. Числови характеристики.
Основни видове непрекъснати разпределения..................................... 49
11. Функции от случайни величини. Съвместно
разпределение на две и повече случайни величини.
Пораждащи функции. Характеристични функции.
Гранични закони. .................................................................................... 56
Част втора. СТАТИСТИКА ................................................................... 67
12. Основни понятия в статистиката.
Описателна статистика. .......................................................................... 67
13. Оценки на параметри на разпределението.
Точкови оценки. Интервални оценки. .................................................. 71
14. Проверка на хипотези за средна стойност
на нормална популация. ......................................................................... 78
171
15. Точкова оценка, доверителен интервал и проверка
на хипотези за алтернативни популации. ............................................. 83
16. Проверка на хипотези за две популации .............................................. 86
17. Проверка на хипотези за нормалност на популация. .......................... 95
18. Непараметрични тестове ........................................................................ 99
19. Елементи на регресионен и дискриминантен анализ ........................ 105
ПРИЛОЖЕНИЕ 1 ....................................................................................... 121
ПРИЛОЖЕНИЕ 2 ....................................................................................... 123
ПРИЛОЖЕНИЕ 3 ....................................................................................... 125
ПРИЛОЖЕНИЕ 4 ....................................................................................... 127
ОТГОВОРИ, РЕШЕНИЯ, УПЪТВАНИЯ:................................................ 133
172
ПЕТЪР КОПАНОВ • ВЕСКА НОНЧЕВА • СНЕЖАНА ХРИСТОВА
ВЕРОЯТНОСТИ И СТАТИСТИКА
РЪКОВОДСТВО ЗА РЕШАВАНЕ НА ЗАДАЧИ
Българска, второ преработено и допълнено издание
Предпечатна подготовка: Цветелина Сотирова
Печат и подвързия: УИ „Паисий Хилендарски“
Пловдив, 2012
ISBN 978-954-423-796-7
173
174
Download