МИНИСТЕРСТВО ТРАНСПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «УЛЬЯНОВСКИЙ ИНСТИТУТ ГРАЖДАНСКОЙ АВИАЦИИ ИМЕНИ ГЛАВНОГО МАРШАЛА АВИАЦИИ Б.П. БУГАЕВА» МАТЕМАТИКА Методические рекомендации для самостоятельной работы курсантов при изучении раздела «Математическая статистика» Ульяновск 2019 Математика. Методические рекомендации для самостоятельной работы курсантов при изучении раздела «Математическая статистика»: учеб.-метод. пособие / сост. С.П. Никонова, Л.И. Поленищенко, Е.Н. Емельянова. – Ульяновск : УИ ГА, 2019. – … с. Содержит краткое изложение теоретического материала, подробные решения типовых задач с перечислением используемых формул и соответствующими методическими указаниями, контрольные вопросы, индивидуальные задания для курсантов. Может использоваться в качестве методического руководства в одном из возможных вариантов проведения лабораторной работы. Разработано в соответствии с Федеральным государственным образовательным стандартом и рабочей программой учебной дисциплины «Математика». Предназначено для организации самостоятельной работы курсантов второго курса УИ ГА, обучающихся по всем специальностям и профилям подготовки. ФГБОУ ВО «Ульяновский институт гражданской авиации имени Главного маршала авиации Б. П. Бугаева» ОГЛАВЛЕНИЕ Введение …………………………………………………………………….. Часть 1. Статистическая обработка одномерной выборки ……………… §1. Основные теоретические сведения …………..…………………… §2. Решение типового задания …………………………………………… Часть 2. Статистическая обработка двумерной выборки …………….. §1. Основные теоретические сведения …………..…………………. §2. Решение типового задания ………………………………………… Часть 3. Индивидуальные задания для самостоятельного решения…… Задача 1. Статистическая обработка одномерной выборки …………..…… Задача 2. Статистическая обработка двумерной выборки ………………… Контрольные вопросы ………………………………………………………. Рекомендуемая литература …………………………………………………. Библиографический список ………………………………………………… Приложения …………………………………………………………………… ВВЕДЕНИЕ Математическая статистика – наука о принятии решений в условиях неопределенности. Предметом математической статистики является разработка методов регистрации, описания и анализа опытных данных, получаемых в результате наблюдения. Наиболее типичными задачами математической статистики будут: - задача нахождения закона распределения некоторой случайной величины по статистическим данным; - задача проверки статистических гипотез; - задача нахождения неизвестных параметров распределения. Часть 1. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ОДНОМЕРНОЙ ВЫБОРКИ §1. Основные теоретические сведения 1. Вариационный ряд, группированная выборка, полигон и гистограмма Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали. Сплошное обследование всех объектов далеко не всегда возможно из-за или большого их количества, или их недоступности, или значительных материальных затрат и т.п. В таких случаях из совокупности всех объектов, подлежащих изучению (так называемой генеральной совокупности) отбирают ограниченное число объектов – выборочную совокупность или просто выборку. Число объектов совокупности, генеральной или выборочной, называется её объёмом. Рассмотрим выборку объёма n . Наблюдаемые в выборке значения x1 , x2 , …, xk называются вариантами; число ni повторений каждой из вариант в вы- борке (i 1,2,..., k ) – её частотой ( n1 n2 ... nk n ); отношение частоты к объёму выборки – относительной pi частотой ni n ( i 1,2,..., k ; p1 p2 ... pk 1). Совокупность расположенных в порядке возрастания различных вариант с учётом всех повторений образует вариационный ряд или, по-другому, сортированную выборку. Статистическим распределением сортированной выборки называется перечень вариант и соответствующих им частот или относительных частот, то есть таблица вида x1 n1 xi ni x2 n2 … … xk nk или xi x1 x2 … xk pi p1 p2 … pk Для графического изображения статистического распределения служит полигон частот или полигон относительных частот (рис. 1) – это ломаная с вершинами в точках ( xi , ni ) или ( xi , pi ) . p* i p3* p 2* p1* 0 x1 x2 x3 x4 x5 x6 xᵢ Рис. 1. Полигон относительных частот сортированной выборки При большом объёме выборки и разнообразии её вариант удобнее бывает использовать так называемую группированную выборку, то есть совокупность непересекающихся числовых промежутков [a0 , a1 ) , [a1, a2 ) , …, [al 1, al ] , на которые разбит весь диапазон возможных значений вариант выборки [a0 , al ] , где a0 x1 , al xk . Частотой mi , соответствующей разряду [ai 1, ai ) , явля- ется сумма частот попавших в него вариант, а относительной частотой – число pi mi n (i 1,2,..., l ) , при m1 m2 ... ml n , этом p1 p2 ... pl 1 . Статистическим распределением группированной выборки называется перечень разрядов [ai 1, ai ) и соответствующих им частот mi или относительных частот pi (i 1,2,..., l ) . При дальнейшей обработке такой выборки понадобятся ещё представитель zi ai 1 ai разряда [ai 1, ai ) , являющийся его середи2 ной, а также плотность относительной частоты f i pi (i 1,2,..., l ) . ai ai 1 Расширенная таблица статистического распределения группированной выборки выглядит так: Таблица 1 Плотность Разряд Частота Представитель Относительная относительной Номер разряда zi частота pi mi интервала [ai 1, ai ) частоты f i 1 [a0 , a1 ) m1 z1 p1 f1 2 … [a1, a2 ) m2 z2 p2 f 2 … … … … … l [al 1, al ] ml zl pl f l Статистическое распределение группированной выборки можно также наглядно представить графически – с помощью гистограммы и полигона. Гистограммой называется диаграмма (рис. 2), состоящая из прямоугольников с основаниями [ai 1, ai ) и высотами f i , то есть суммарная площадь всех прямоугольников составляет l i 1 f i l (ai ai 1 ) pi 1 . Полигон же для группироi 1 ванной выборки есть ломаная, последовательно соединяющая середины верх них оснований указанных прямоугольников – это точки ( zi , f i ) . f* a0 x a1 a2 a3 0 a4 a5 a6 a7 a8 Рис. 2. Гистограмма и полигон группированной выборки По виду гистограммы и полигона статистического распределения можно составить представление о плотности распределения вероятностей f (x ) изучаемого количественного признака (случайной величины) и выдвинуть гипотезу о типе его распределения. Некоторые законы распределения случайных величин и типичные гистограммы (полигоны), получающиеся при этих распределениях, приведены в Приложении 1. 2. Выборочная средняя и выборочная дисперсия Пусть для выборки объёма n составлены статистические распределения: 1) по сортированной выборке ( xi , ni , p i ) , где i 1,2,..., k ; 2) по группированной выборке ([ai 1 , ai ), mi , pi ) , где i 1,2,..., l . Выборочной средней количественного признака (случайной величины) Х называется число k xв1 xi pi i 1 1 k ni xi (для сортированной выборки) n i 1 или l xв2 zi pi i 1 a ai 1 l mi zi , где zi i 1 (для группированной выборки). 2 n i 1 Выборочной дисперсией количественного признака Х является число k k 1 k 2 1 Dв1 ( xi xв ) pi ni ( xi xв ) ni xi 2 xв 2 n i 1 n i 1 i 1 2 (для сортированной выборки) или l l 1 l 2 1 Dв 2 ( zi xв ) pi mi ( zi xв ) mi zi 2 xв 2 n i 1 n i 1 i 1 2 (для группированной выборки); выборочное среднее квадратическое отклонение Х вычисляется по формуле в Dв . Число S 2 n Dв называется исправленной выборочной дисперсией коn 1 личественного признака Х: S1 2 n n Dв1 или S 2 2 Dв 2 ; тогда исправn 1 n 1 ленным выборочным средним квадратическим отклонением Х будет S n Dв . n 1 3. Точечные и интервальные оценки параметров теоретического распределения Предположим, что уже удалось установить или предположить по гистограмме и полигону, какое именно распределение имеет изучаемый признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. Например, если заранее известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и дисперсию этого признака. Если же есть основание считать, что признак имеет, например, показательное распределение, то необходимо оценить параметр (см. Приложение 1). В нашем распоряжении имеются лишь данные выборки, через которые и нужно оценить требуемые параметры. Пусть требуется оценить некоторый параметр , и по выборке объема n была найдена его оценка . Значения выборки случайны, поэтому и сама оценка является случайной величиной. Можно построить множество раз- личных оценок, но желательно при этом получить « хорошие» приближения оцениваемого параметра. Поэтому к оценке предъявляют следующие три основных требования: 1. Несмещенность. Математическое ожидание оценки должно быть равно оцениваемому параметру при любом объеме выборки, т.е. M . Другими словами, оценка не должна иметь систематической ошибки. 2. Состоятельность. При бесконечном увеличении объема выборки оценка должна сходиться к точному значению , т.е. при n . 3. Эффективность. Оценка называется эффективной, если она не смещена и имеет минимально возможную дисперсию. В этом случае наблюдается наименьший разброс относительно точного значения параметра , и оценка, в определенном смысле, является наиболее точной. Доказано, что оценка xв является несмещенной, эффективной и состоятельной оценкой математического ожидания случайной величины X , а S 2 является несмещенной и состоятельной оценкой ее дисперсии. Оценке соответствует точка числовой оси, поэтому такая оценка называется точечной оценкой параметра (рис. 3). * Рис. 3. Точечная оценка параметра В силу случайности практически всегда . Можно только надеяться, что находится где-то вблизи параметра , но насколько близко? Отсутствие меры надежности результата – недостаток всех точечных оценок. Более определенными в этом отношении являются интервальные оценки. Интервальной называют оценку, которая определяется двумя числами – концами интервала. Она позволяет установить точность и надежность оценки. Пусть по выборке получена оценка неизвестного параметра . Ясно, что тем точнее определяет параметр , чем меньше модуль их разности . Если , то число характеризует точность полученной оценки. Соответственно можно записать: , или , или . Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству , можно лишь говорить о вероятности , с которой это неравенство осуществляется. Надежностью (доверительной вероятностью) оценки параметра по выборке называется вероятность , с которой осуществляется неравенство , то есть имеет место формула p . Это равенство следует понимать так: вероятность того, что интервал , заключает в себе (покрывает) неизвестный параметр , равна . Обычно надежность оценки задается заранее, причем в качестве берут число, близкое к единице. Наиболее часто задаются надежностью, равной 0,95, или 0,99, или 0,999. Доверительным интервалом называют интервал I , , который покрывает неизвестный параметр с заданной надежностью (рис. 4). I * Рис. 4. Доверительный интервал для параметра Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера. В качестве конкретного примера рассмотрим задачу нахождения такого интервала для математического ожидания количественного признака X при известной дисперсии D ( X ). При этом будем рассматривать xв как случайную величину X , имеющую нормальное распределение (что вполне допустимо в силу центральной предельной теоремы [1]) с параметрами M X a, D( X ) (X ) D( X ) , (X ) . n n n Необходимо, чтобы выполнялось соотношение p X a , где – заданная надежность. Тогда для нормального распределения можно записать p X a 2(t ) , где t t , в результате получим n n . Из последнего равенства находим t p X a 2 (t ) , и, приняв во вниn мание, что вероятность р задана и равна , запишем: t t p x в a xв 2 (t ). n n Таким образом, в качестве доверительного интервала для математического ожидания изучаемого признака X с заданной надежностью нужно взять интервал t t I ( x в ; xв ) xв ; xв . n n При этом число t определяется из равенства 2 (t ) или (t ) 2 с исполь- зованием таблицы значений функции Лапласа (x) (см. Приложение 2). Например, при 0,95 t 1,96; при 0,99 t 2,58. При выводе вышеуказанных формул предполагалось, что известно значение дисперсии изучаемого признака, но в большинстве случаев это не выполня- ется. Поэтому при расчетах используют в качестве ее оценки исправленную выборочную дисперсию, и доверительный интервал для математического ожидания принимает вид tS tS I xв ; xв . n n Если же объём выборки достаточно мал, то при нахождении доверительного интервала для неизвестного математического ожидания используют распределение Стьюдента [1], которое определяется формулой X a , задающей плотность этого распреS (n, t ) P( T t ) , где T S/ n деления для выборки объема n. В этом случае получаем допустимый интервал I ( xв t S n ; xв t S n ) , где t находится из специальной таблицы по за- данным n и (см. Приложение 3). 4. Статистическая проверка гипотезы о предполагаемом теоретическом распределении генеральной совокупности с помощью критерия Пирсона Пусть имеется выборка, и требуется определить закон распределения количественного признака X генеральной совокупности. Как уже отмечалось, тип распределения можно предположить по виду гистограммы и полигона. Будем называть выбранное таким образом (или по каким-то другим соображениям) распределение теоретическим. Параметры его выбираются так, чтобы полученное распределение как можно лучше согласовывалось с имеющейся выборкой. Чаще всего для определения параметров используют метод моментов [1], согласно которому параметрами нормального распределения являются a xв , S; для показательного распределения выбираем 1 ; xв в случае равномерного распределения принимаем a min xi x1 , b max xi xk (для группированной выборки a левая граница первого разряда, b правая граница последнего разряда). Статистической называют гипотезу (предположение) о виде неизвестного теоретического распределения или о параметрах известного распределения. Выдвигаемую гипотезу называют нулевой или основной и обозначают H 0 . Гипотезу, которая противоречит основной, называют конкурирующей или альтернативной и обозначают H 1. Методы проверки гипотез в математической статистике называют критериями. Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Рассмотрим критерий Пирсона или критерий 2 (хи-квадрат). Его достоинство состоит в том, что он не критичен к типу проверяемого распределения. В основу критерия положено сравнение эмпирических (наблюдаемых) и теоретических (рассчитанных согласно предполагаемому распределению) частот. Пусть по выборке объема n получено эмпирическое распределение xi ni x1 n1 x2 n2 … … xk nk , где xi – варианты, ni – частоты вариант. Соответственно, если выборка группированная, то берутся разряды [ai 1, ai ) и частоты mi ( i 1,2,..., l ). [ai 1, ai ) mi [a0 , a1 ) m1 [a1, a2 ) m2 … … [al 1, al ] ml Выдвигаем гипотезу H 0 , состоящую в том, что изучаемый признак имеет конкретный тип распределения, и записываем его функцию распределения F x или плотность распределения f x . Определяем параметры закона и рассчитываем для каждого разряда [ai 1, ai ) теоретические частоты mi n pi , где pi – теоретическая вероятность попадания значений признака X в разряд, ai 1 и ai – границы i го разряда. Используя свойства функций F x и f x [1], получим: pi F (ai ) F (ai 1 ) . Проще можно найти теоретические вероятности для конкретного типа распределения с помощью известных формул: ai ai 1 – для равномерного распределения; ba pi p(ai 1 X ai ) e ai 1 e ai – для показательного распределения; a xв a x pi p(ai 1 X ai ) i i 1 в – для нормального расS S pi p(ai 1 X ai ) пределения. В качестве меры близости теоретического и статистического распределений в случае критерия Пирсона предлагается брать сумму нормированных разностей между частотами mi и mi , возведя их предварительно в квадрат для устранения возможности взаимного погашения положительных и отрицательных значений. Полное обоснование критерия Пирсона дается в [1]. Таким образом, для выборки рассчитывается сумма 2 l m np 2 m m 2 i i i набл i , l i 1 mi i 1 npi где l число разрядов группированной выборки. Значение 2 набл зависит от выборки и, следовательно, является случайной величиной. Чем меньше 2 набл , тем лучше согласуются эмпирическое и теоретическое распределения. Решающее правило критерия Пирсона состоит в следующем: - гипотеза H 0 о предполагаемом теоретическом распределении изучаемого количественного признака X согласуется с результатами наблюдений на уровне значимости , если 2 набл < 2 k p ; - гипотеза H 0 отклоняется, если 2 набл > 2 k p . Здесь 2 k p – критическое значение (или порог испытания), для определения которого существуют специальные таблицы распределения 2 kp 2 , r (см. Приложение 4). Пирсон доказал, что при n закон распределения случайной величины независимо от того, какому распределению подчинена генеральная совокупность, стремится к закону распределения хи-квадрат с r степенями свободы. При этом число степеней свободы находится как r l 1 t , где l число разрядов группированной выборки, t число параметров теоретического распределения, которые оценены по данным выборки. В частности, если предполагаемое распределение нормальное или равномерное, r l 3; то для показательного распределения r l 2. Уровень значимости есть вероятность, с которой нулевая гипотеза H 0 по результатам проверки будет отвергнута. Уровень значимости выбирается или задается предварительно. Для расчета значения 2 набл по группированной выборке составляют таблицу вида (четвертый и пятый столбцы заполнять не обязательно): Таблица 2 Разряд Частота N mi п/п [ai 1, ai ) 1 [a0 , a1 ) m1 F ai 1 F ai F a0 F a1 pi p1 mi = = n pi m1 mi mi m1 m1 hi mi mi h1 2 hi mi* h1 m 1 2 [a1, a2 ) m2 F a1 … … … … l [al 1, al ] ml F a2 p2 … F al 1 F al … pl n m2 ml h2 h2 … … … hl … m2 m2 ml ml hl m2 ml 2 набл 1 Следует обратить внимание на то, чтобы в каждый разряд группированной выборки попало не меньше шести значений вариант. Если это условие нарушено, то нужно или изменить границы интервалов, или объединить соседние. В результате по заданному и найденному числу степеней свободы r из Приложения 4 определяется критическое значение 2 kp и проверяется выполнение одного из неравенств решающего правила, после чего делается вывод о согласованности или несогласованности выдвинутой гипотезы о предполагаемом теоретическом распределении с опытными данными. §2. Решение типового задания Задача №1. Выборка задана таблицей 85 79 60 64 57 75 69 63 72 37 40 80 66 89 67 44 69 58 79 56 78 51 56 43 68 63 59 74 57 44 58 70 77 60 73 76 50 64 65 67 76 56 79 70 64 90 78 58 78 56 Требуется: 63 49 75 64 47 42 76 71 37 57 44 68 62 63 62 88 51 61 30 64 55 71 59 55 74 53 50 68 59 50 43 60 60 74 67 72 69 76 62 49 60 65 68 52 44 44 54 41 50 50 1) составить расширенную таблицу статистического распределения группированной выборки, разбивая диапазон возможных значений случайной величины на 10 разрядов; 2) построить гистограмму и полигон относительных частот группированной выборки и сформулировать гипотезу о предполагаемом теоретическом законе распределения исследуемой случайной величины; 3) найти точечные оценки математического ожидания и дисперсии исследуемой случайной величины по сортированной и группированной выборке; построить доверительный интервал для математического ожидания; 4) записать формулу плотности вероятностей принятого теоретического закона распределения и построить соответствующую кривую распределения; 5) используя критерий Пирсона, проверить гипотезу о правильности выбора теоретического распределения случайной величины. Решение задачи №1. 1) Переписываем варианты в порядке возрастания и получаем вариационный ряд для случайной величины Х: 30 37 37 40 41 42 43 43 44 44 44 44 44 47 49 49 50 50 50 50 50 51 51 52 53 54 55 55 56 56 56 56 57 57 57 58 58 58 59 59 59 60 60 60 60 60 61 62 62 62 63 63 63 63 64 64 64 64 64 65 65 66 67 67 67 68 68 68 68 69 69 69 70 70 71 71 72 72 73 74 74 74 75 75 76 76 76 76 77 78 78 78 79 79 79 80 85 88 89 90 Построим по нему группированную выборку. Для этого весь диапазон значений вариант выборки (от 30 до 90) первоначально разбиваем на 10 частичных разрядов так, чтобы в любой из них попало не менее 5-7 чисел. Для каждого из этих разрядов подсчитаем число чисел, попавших в него, определим представителя интервала, относительную частоту и плотность относительной частоты, составив по результатам всех вычислений расширенную таблицу статистического распределения группированной выборки. Таблица 3 Плотность Разряд Частота Представитель Относительная относительной Номер разряда zi частота pi mi интервала [ai 1, ai ) частоты f i [30; 44) 1 [44; 50) 2 [50; 56) 3 [56; 59) 4 [59; 63) 5 [63; 65) 6 [65; 69) 7 [69; 74) 8 [74; 78) 9 [78; 90] 10 2) Используя данные 8 37 0,08 0,006 8 47 0,08 0,013 12 53 0,12 0,020 10 57,5 0,10 0,033 12 61 0,12 0,030 9 64 0,09 0,045 10 67 0,10 0,025 10 71,5 0,10 0,020 10 76 0,10 0,025 11 84 0,11 0,009 группированной выборки (второй и шестой столбцы расширенной таблицы), построим на одном графике гистограмму и полигон (рис. 3). Если сравнить эти графики с аналогичными эталонными, приведенными в Приложении 1, то можно предположить, что случайная величина X имеет нормальное распределение. Рис. 5. Гистограмма, полигон и плотность вероятностей для случайной величины X 3) Найдем точечные оценки математического ожидания и дисперсии случайной величины Х по сортированной и группированной выборкам соответственно: 1 k 1 44 1 xв1 ni xi ni xi (30 1 37 2 40 1 41 1 42 1 43 2 n i 1 100 i 1 100 1 44 5 ... 79 3 80 1 85 1 88 1 89 1 90 1) 6191 61,95; 100 1 l 1 10 1 xв2 mi zi mi zi (37 8 47 8 53 12 57,5 10 61 12 n i 1 100 i 1 100 1 64 9 67 10 71,5 10 76 10 84 11) 6260 62,6; 100 1 k 1 2 2 Dв1 ni xi xв1 (30 2 1 37 2 2 40 2 1 412 1 42 2 1 43 2 2 n i 1 100 44 2 5 ... 79 2 3 80 2 1 85 2 1 88 2 1 89 2 1 90 2 1) 61,95 2 n 100 2 3993,95 3837 ,8025 156,1475 S1 Dв1 156,1475 157,72; n 1 99 Dв 2 1 l 1 2 2 mi zi xв2 (37 2 8 47 2 8 53 2 12 57,5 2 10 612 12 n i 1 100 64 2 9 67 2 10 71,5 2 10 76 2 10 84 2 11) 62,6 2 n 100 2 4082,99 3918,76 164,23 S 2 Dв 2 164,23 165,89. n 1 99 Вычислим исправленные выборочные средние квадратические отклонения Х: S1 157 ,72 12,56; S 2 165,89 12,88. Построим доверительный интервал для математического ожидания случайной величины X с доверительной вероятностью 0,95 . Для этого воспользуемся формулой tS tS I x в ; xв , n n определив значение параметра t из условия 2(t ) 0,95 : t 1,96 (Приложение 2). По сортированной и группированной выборкам соответственно получим: 1,96 12,56 1,96 12,56 I 1 61,95 ; 61,95 (60,14; 65,06); 100 100 1,96 12,88 1,96 12,88 I 2 62,6 ; 62,6 (60,08; 65,12). 100 100 4) Найдем значения параметров предполагаемого теоретического закона распределения случайной величины X . Для нормального распределения принимаем a xв2 62,6 , S2 12,88 . Таким образом, предполагаемое тео- ретическое распределение случайной величины X имеет плотность распределения x 62,6 2 f ( x) 0,03 e 331, 7 и функцию распределения F x x 62,6 /12,88 0,5 . График плотности теоретического распределения (кривую распределения) полезно изобразить на том же рисунке, где построены гистограмма и полигон статистического распределения. 5) Для проверки выдвинутой гипотезы о нормальном распределении случайной величины X применим критерий Пирсона. Число степеней свободы здесь r l 3 10 3 7 , и уровню значимости 0,05 при r 7 соответствует 2 kp 14,1 (Приложение 4). Для вычисления наблюдаемого значения 2набл составляем специальную таблицу (см. таблицу 2), второй и третий столбцы которой заполняем по группированной выборке. В результате получим 2набл =3,62. Поскольку выполняется неравенство 3,62 < 14,1, то гипотеза о нормальном распределении случайной величины X принимается, так как согласуется с опытными данными на уровне значимости 0,05 . Таблица 4 Разряд Частота N mi п/п [ai 1, ai ) 1 2 3 4 5 [30; 44) [44; 50) [50; 56) [56; 59) [59; 63) 8 8 12 10 12 F ai 1 F ai 0,01 0,08 0,16 0,31 0,39 0,08 0,16 0,31 0,39 0,51 pi mi 0,07 0,08 0,15 0,08 0,12 7 8 15 8 12 mi mi hi 1 0 –3 2 0 1 0 9 4 0 hi m i 0,14 0,00 0,60 0,50 0,00 6 7 8 9 10 [63; 65) [65; 69) [69; 74) [74; 78) [78; 90] 9 10 10 10 11 0,51 0,58 0,70 0,81 0,88 0,58 0,70 0,81 0,88 0,98 0,07 0,12 0,11 0,07 0,10 7 12 11 7 10 2 –2 –1 3 1 4 4 1 9 1 0,57 0,33 0,09 1,29 0,10 2 набл 3,62 Проверить таблицы и расчеты можно на компьютере с помощью программы «static.exe». В главном меню программы раскрыть пункт «Выборка» и подменю «Прочитать выборку», переместить указатель на имя файла с номером нужного варианта (например, для 15-го варианта - t15.txt), нажать клавишу ввода. Убедиться, что нужная выборка загружена в программу, раскрыв ее с помощью клавиши F2. Затем клавишу Esc нажать два раза и в главном меню выбрать пункт «Работа». Последовательно выполняют все пункты этого меню, после сортировки выборки (клавиши Esc и F2) нужно переписать вариационный ряд в отчет. В подменю «Число интервалов» задайте требуемое число интервалов для группированной выборки (первый раз рекомендуется оставить число 10), выполнить ввод границ разрядов (можно взять крайние числа в каждой строке вариационного ряда). При ошибках вернуть курсор на нужное место и повторить ввод. Затем нажать Esc и войти в подменю «Группированная выборка», программа выведет на экран нужную таблицу. Далее нужно перейти в подменю построения гистограммы, и если гистограмма на экране дает возможность сделать выбор предполагаемого теоретического закона распределения случайной величины X , то с помощью Приложе- ния 1 следует выдвинуть гипотезу о законе распределения. Если интервалы были выбраны неудачно, то необходимо повторить и выбор интервалов, и построение группированной выборки, и гистограммы. Проверить расчеты выборочных значений среднего и дисперсии, а также доверительные интервалы для математического ожидания можно в подменю «Доверительные интервалы». Расчет выборочной средней и выборочной дисперсии выполняется программой по сортированной выборке (значения m1, D1) и по группированной выборке (значения m2, D2). Соответственно выводятся и два доверительных интервала для математического ожидания. Для проверки правильности выбора теоретического закона нужно раскрыть подменю «Закон распределения», выбрать закон и ввести рассчитанные параметры предполагаемого распределения. Нажать клавишу Esc два раза и выбрать подменю «Расчет хи-квадрат», программа выведет расчетную таблицу. С помощью Приложения 4 найти критическое значение 2 k p и сравнить его с наблюдаемым. Окончательные результаты и вывода записать в отчет по самостоятельной работе. Часть 2. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДВУМЕРНОЙ ВЫБОРКИ §1. Основные теоретические сведения Пусть X и Y – статистически зависимые случайные величины (то есть изменение случайной величины X влечет за собой изменение случайной величины Y). Приближенное представление Y в виде Y X b YX X называется наилучшим приближением Y в смысле метода наименьших квадратов (МНК), если математическое ожидание M [(Y Y X ) 2 ] принимает наименьшее возможное значение. Само выражение Y X b YX X называется уравнением линейной среднеквадратической регрессии Y на X, а число YX – коэффициентом регрессии Y на X. Аналогично представление X Y c XY Y является уравнением линейной среднеквадратической регрессии X на Y. Пусть система случайных величин описывается так называемой двумерной выборкой, заданной с помощью таблицы Х x1 x2 x3 … x n Y y1 y2 y3 … y n Тогда получаются выборочные уравнения линейной регрессии y X b YX x и xY c XY y , где YX и XY – выборочные коэффициенты регрессии. При этом совокупность точек с координатами ( xi , yi ) задает поле корреляции двумерной выборки. Рассмотрим теорему о нахождении параметров линейной регрессии двумерной выборки методом наименьших квадратов. Пусть дана двумерная выборка Х x1 x2 x3 … x n Y y1 y2 y3 … y n 1) Выборочное уравнение линейной регрессии Y на X имеет вид y X b YX x , где b и YX определяются при решении системы нормальных уравнений n n n b YX xi y i , i 1 i 1 n n n b xi YX xi 2 xi y i . i 1 i 1 i 1 2) Выборочное уравнение линейной регрессии X на Y имеет вид xY c XY y , где c и XY определяются при решении системы нормальных уравнений n c XY n c y i XY i 1 n n i 1 n i 1 n y i xi , y i 2 xi y i . i 1 i 1 Доказательство теоремы можно найти в [1]. Решая полученную систему линейных уравнений, получим формулы для непосредственного вычисления параметров линейной регрессии: 1) для уравнения y X b YX x YX ( xy) в xв yв ( x ) в ( xв ) 2 2) для уравнения xY c XY y : 2 , b yв YX xв ; XY ( xy) в xв yв ( y ) в ( yв ) 2 2 , c xв XY yв . В этих формулах участвуют средние выборочные случайных величин X , Y , X 2 , Y 2 , XY . Следует отметить, что указанные прямые регрессии пересекаются в точке с координатами ( xв , yв ) . Выборочным коэффициентом корреляции называется среднее геометрическое коэффициентов регрессии rв YX XY , где знак rв совпадает со знаком коэффициентов регрессии YX и XY . Выборочный коэффициент корреляции можно вычислить и по другой формуле: rв ( xy) в xв yв ( x ) в ( xв ) ( y ) в ( yв ) 2 2 2 . 2 Коэффициент rв принимает значения, удовлетворяющие условию 1 rв 1, и характеризует близость зависимости между X и Y к линейной. Если rв 1, то между X иY имеет место линейная зависимость: Y b YX X . В случае 0 rв 1 признаки X и Y будут положительно коррелированными, то есть с ростом одной из них другая в среднем увеличивается. При условии 1 rв 0 речь идет об отрицательной корреляции. Если rв 0 , то признаки X и Y являются некоррелированными. §2. Решение типового задания Задача №2. Двумерная выборка задана таблицей x y 2,4 1,5 Требуется: 5,2 2,8 7,7 2,1 10,1 –1,7 12,3 –2,1 14,2 –5,7 16,4 –7,4 18,7 –6,9 19,4 –9,2 23,5 –8,4 1) записать выборочные уравнения линейной среднеквадратической регрессии Y на X и X на Y, используя решение соответствующих систем нормальных уравнений; 2) получить аналогичные уравнения с помощью готовых формул для нахождения параметров линейной регрессии и сравнить результаты; 3) найти выборочный коэффициент корреляции; 4) построить поле корреляции и прямые регрессии. Решение задачи № 2 1) Для удобства вычислений составим расчетную таблицу Таблица 5 № п/п 1 2 3 4 5 6 7 8 9 10 xi yi xi2 yi2 xi yi 2,4 5,2 7,7 10,1 12,3 14,2 16,4 18,7 19,4 23,5 129,9 1,5 2,8 2,1 –1,7 –2,2 –5,7 –7,4 –6,9 –9,2 –8,4 –35,1 5,76 27,04 59,29 102,01 151,29 201,64 268,96 349,69 376,36 552,25 2094,29 2,25 7, 84 4,41 2,89 4,84 32,49 54,76 47,61 84,64 70,56 312,29 3,60 14,56 16,17 –17,17 –27,06 –80,94 –121,36 –129,03 –178,48 –197,40 –717,11 Запишем первую систему нормальных уравнений – для нахождения выборочного уравнения линейной среднеквадратической регрессии Y на X: 10b 129,9 YX 35,1; 129,9b 2094,3YX 717,1. Решим систему линейных уравнений, используя правило Крамера: 35,1 b 129,9 717,1 2094,3 (35,1) 2094,3 129,9 (717,1) 4,83; 10 129,9 10 2094,3 129,9 2 129,9 2094,3 35,1 10 YX 129,9 717,1 10 (717,1) 129,9 (35,1) 0,64; 10 129,9 10 2094,3 129,9 2 129,9 2094,3 тогда выборочное уравнение линейной среднеквадратической регрессии Y на X имеет вид: y X 4,83 0,64 x . Аналогично составим и решим вторую систему нормальных уравнений – для нахождения выборочного уравнения линейной среднеквадратической регрессии X на Y: 10c 35,1 XY 129,9; 35,1c 312,3 XY 717,1; 129,9 c 35,1 717,1 312,3 129,9 312,3 (35,1) (717,1) 8,14; 10 35,1 10 312,3 (35,1) 2 35,1 312,3 10 XY 129,9 35,1 717,1 10 (717,1) 129,9 (35,1) 1,38; 10 35,1 10 312,3 (35,1) 2 35,1 312,3 получим xY 8,14 1,38 y – выборочное уравнение линейной среднеквадратической регрессии X на Y. 2) С целью проверки правильности приведенных выше расчетов найдем значения параметров уравнений линейной регрессии по готовым формулам, в которых участвуют средние выборочные случайных величин X , Y , X 2 , Y 2 , XY . Поэтому сначала определим именно эти значения: 1 n 1 1 n 1 xв xi 129,9 12,99; yв yi (35,1) 3,51; n i 1 10 n i 1 10 ( x 2 )в 1 n 2 1 1 n 2 1 2 x 2094 , 29 209 , 43 ; ( y ) i yi 312,29 31,23; в n i 1 10 n i 1 10 1 n 1 ( xy) в xi yi (717,11) 71,71. n i 1 10 Используя полученные результаты, найдем YX ( xy) в xв yв ( x 2 ) в ( xв ) 2 71,71 12,99 (3,51) 209,43 12,99 2 26,12 0,64; 40,69 b yв YX xв 3,51 (0,64) 12,99 4,80; XY ( xy) в xв yв ( y 2 ) в ( yв ) 2 71,71 12,99 (3,51) 31,23 (3,51) 2 26,12 1,38; 18,91 c xв XY yв 12,99 (1,38) (3,51) 8,15. Тогда: y X 4,80 0,64x – выборочное уравнение линейной среднеквадратической регрессии Y на X; xY 8,15 1,38 y – выборочное уравнение линейной среднеквадратической регрессии X на Y. 3) Найдем выборочный коэффициент корреляции: rв YX XY (0,64) (1,38) 0,88. Коэффициент корреляции указывает на то, что исследуемые случайные величины (количественные признаки) X и Y являются отрицательно коррелированными, то есть с возрастанием значений одной из них среднее значение другой убывает. В то же время зависимость между случайными величинами X и Y достаточно близка к линейной. 4) Корреляционная связь между X и Y выглядит нагляднее, если изобразить на одном рисунке поле корреляции системы (X , Y) и пару линий регрессии y X 4,80 0,64x и xY 8,15 1,38 y , пересекающихся в точке с координатами ( xв , yв ) (12,99;3,51) (рис. 6). Рис. 6. Поле корреляции и линии регрессии Часть 3. ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ Задача 1. Статистическая обработка одномерной выборки Для данной выборки требуется: 1) составить расширенную таблицу статистического распределения группированной выборки, разбивая диапазон возможных значений случайной величины на 10 разрядов; 2) построить гистограмму и полигон относительных частот группированной выборки и сформулировать гипотезу о предполагаемом теоретическом законе распределения исследуемой случайной величины; 3) найти точечные оценки математического ожидания и дисперсии исследуемой случайной величины по сортированной и группированной выборке; построить доверительный интервал для математического ожидания; 4) записать формулу плотности вероятностей принятого теоретического закона распределения и построить соответствующую кривую распределения; 5) используя критерий Пирсона, проверить гипотезу о правильности выбора теоретического распределения случайной величины. Вариант 1 Вариант 2 63 48 60 42 77 15 11 19 8 31 91 34 33 93 7 10 19 12 79 79 12 44 17 10 27 7 7 18 49 1 3 1 2 4 49 4 30 91 74 39 25 77 90 93 53 28 43 2 2 22 16 66 59 64 22 93 86 62 44 40 46 17 46 36 0 6 12 46 24 13 10 6 0 0 50 4 36 18 10 9 4 9 5 27 42 49 3 19 16 18 11 3 11 8 27 33 13 44 32 42 15 64 76 43 74 93 82 48 31 83 2 32 76 11 5 7 2 10 24 49 32 12 9 32 3 0 43 87 50 72 45 80 79 33 89 96 10 38 12 23 11 29 28 7 40 60 47 61 62 89 73 53 83 11 17 18 40 24 14 33 1 48 24 95 3 20 7 92 73 99 22 11 49 56 22 37 16 67 7 4 2 7 6 12 14 4 8 4 2 1 6 28 28 18 26 10 7 26 2 1 Вариант 3 Вариант 4 57 58 62 53 79 50 75 66 72 71 80 73 66 82 81 68 66 70 52 68 75 90 51 47 84 69 78 44 13 1 68 97 6 45 67 16 80 69 61 14 67 57 36 53 90 65 60 71 60 54 60 56 56 61 57 67 50 83 74 55 75 80 48 79 61 66 66 66 52 74 81 7 17 99 86 14 76 71 81 1 28 51 52 12 73 13 27 29 80 41 93 57 44 80 34 92 66 5 16 95 58 72 68 73 51 68 54 57 84 62 53 54 53 70 78 83 62 51 61 78 48 87 57 8 31 59 22 15 63 75 58 84 31 75 32 7 42 19 79 54 46 64 49 69 93 67 65 88 78 73 68 65 72 60 58 66 35 59 74 63 57 60 84 58 82 59 70 60 70 65 92 29 15 80 90 98 34 78 98 94 36 40 47 28 8 3 77 11 10 40 85 64 72 91 7 16 74 77 24 51 Вариант 5 Вариант 6 26 21 32 6 43 13 12 34 22 28 11 2 0 67 1 11 20 3 31 22 17 2 1 3 99 38 2 27 23 31 0 13 14 2 25 2 5 6 31 10 53 88 64 51 70 62 76 53 34 78 98 83 38 69 60 59 70 56 64 41 76 74 64 53 49 69 73 55 68 87 76 64 71 66 62 70 79 70 44 54 52 12 16 48 8 36 16 38 35 6 9 19 61 56 39 53 65 59 56 54 51 49 71 53 65 79 72 43 71 68 54 74 61 68 83 57 78 66 56 73 49 76 52 63 67 80 56 46 71 66 71 92 47 49 61 69 55 50 70 85 64 74 77 68 54 66 60 50 53 52 44 47 0 3 20 11 16 7 3 11 24 30 7 47 20 1 3 59 1 7 16 4 3 19 26 26 7 1 10 4 29 14 30 44 75 8 28 79 53 6 1 0 28 2 2 9 45 1 3 25 28 5 13 Вариант 7 31 3 64 46 0 25 9 Вариант 8 4 19 75 5 0 14 9 0 4 1 48 7 31 22 28 23 68 87 20 68 9 1 5 3 4 3 16 30 3 16 36 33 42 71 5 44 94 60 73 21 25 30 84 99 24 34 90 32 57 45 6 4 5 5 7 18 26 97 0 4 8 6 43 13 19 34 5 12 3 8 52 37 60 36 36 52 82 30 25 3 13 50 98 19 79 44 80 7 36 97 44 12 53 19 49 85 16 4 84 86 10 6 13 2 10 56 8 1 11 6 3 3 6 10 24 22 8 23 9 28 2 31 62 39 24 77 27 35 85 70 12 55 46 97 47 7 8 82 58 42 63 5 14 7 11 9 51 3 9 21 1 4 1 6 28 17 1 25 12 7 14 37 18 94 36 70 31 30 85 86 86 6 6 17 5 5 2 42 5 1 0 4 0 6 55 27 28 27 28 28 Вариант 9 Вариант 10 81 84 72 73 56 58 70 73 71 61 61 65 67 65 55 59 61 75 43 61 88 56 63 59 34 76 75 33 37 25 61 54 19 84 12 43 71 22 59 42 57 72 58 73 57 51 55 17 49 62 2 82 15 67 63 86 65 76 64 65 55 68 53 66 75 67 73 77 60 73 68 75 80 71 61 58 65 63 68 68 76 76 64 63 64 59 75 68 87 67 73 58 82 80 68 58 78 61 69 69 65 84 72 72 47 45 61 56 81 87 83 73 75 76 50 54 43 78 73 80 46 55 73 49 69 66 72 57 23 11 99 69 20 23 38 45 87 57 68 62 30 89 61 42 34 72 11 8 77 40 16 70 83 16 79 19 68 26 51 57 74 10 56 55 3 70 10 17 41 39 37 60 13 14 36 60 6 0 84 Вариант 11 41 15 18 17 18 3 12 18 0 7 27 25 3 4 21 5 9 8 0 72 8 26 37 62 84 17 25 97 33 85 92 33 48 Вариант 12 7 8 5 14 3 34 2 10 23 4 16 10 16 9 1 24 5 41 28 4 15 5 11 1 1 71 18 9 21 15 2 36 13 5 7 10 3 5 0 97 15 12 8 36 7 23 13 22 32 22 21 8 6 51 48 2 70 36 18 48 24 33 15 72 85 66 59 72 67 48 62 34 47 83 58 55 53 72 70 60 53 73 39 42 57 72 49 75 49 66 47 56 79 66 35 50 76 75 80 68 73 69 90 76 74 64 75 65 60 90 66 70 60 51 48 62 65 52 50 72 56 34 72 2 72 60 62 63 44 70 45 67 61 64 18 23 35 7 2 3 25 3 6 8 3 12 1 29 2 10 17 2 2 8 17 1 0 34 58 74 77 93 64 64 71 61 54 64 66 64 28 56 59 66 63 69 65 68 67 73 83 53 53 58 57 68 79 72 Вариант 13 Вариант 14 41 83 51 30 29 64 51 98 48 51 87 85 45 77 66 96 67 15 83 6 78 74 34 63 29 86 41 86 23 28 11 39 16 7 7 22 15 97 14 15 46 42 13 32 23 75 24 3 39 1 33 30 9 22 7 43 11 43 5 7 84 12 13 2 3 0 31 73 8 34 33 25 59 8 64 74 21 17 49 33 18 80 76 47 25 29 91 29 2 4 15 9 8 9 4 6 19 2 22 30 5 36 31 14 6 7 53 56 22 14 17 47 54 28 15 58 55 19 76 37 28 94 63 25 29 93 77 67 53 9 60 8 66 3 19 86 83 18 5 3 4 14 17 7 31 10 7 65 22 24 16 2 20 2 23 44 83 84 39 90 71 47 44 70 89 12 40 41 10 52 27 14 12 26 49 Вариант 15 Вариант 16 54 74 50 73 52 86 67 67 55 71 68 47 57 68 40 56 73 84 70 62 79 41 83 92 43 79 1 51 63 99 66 38 95 19 81 95 93 20 67 28 52 56 83 71 58 87 64 84 63 49 75 70 85 64 73 64 73 63 79 90 16 0 82 77 83 46 77 38 83 36 30 45 93 17 44 96 24 48 37 46 60 68 65 66 57 54 42 97 73 49 98 61 53 73 68 34 49 62 81 71 58 81 71 54 0 76 29 57 69 54 62 76 73 72 78 56 44 65 83 57 53 51 70 66 65 43 76 64 80 83 68 92 53 78 82 67 81 48 66 54 62 49 46 71 76 68 64 77 75 58 72 96 90 41 64 48 66 68 33 20 14 95 71 18 19 44 Вариант 17 22 7 15 6 2 0 5 7 51 18 9 24 35 7 22 0 43 2 23 42 38 24 21 25 8 21 3 1 12 15 13 3 8 22 4 9 3 6 83 43 89 91 42 1 31 19 23 74 71 4 91 74 87 23 65 13 67 71 48 89 63 0 67 71 7 6 0 56 39 92 4 45 99 3 7 4 10 71 18 65 62 35 19 17 58 32 44 39 23 35 13 2 1 26 68 74 81 9 25 82 13 96 15 4 25 6 78 64 64 89 78 73 79 64 89 76 65 71 56 64 85 66 58 74 51 78 74 74 67 71 64 78 33 90 74 55 5 3 6 1 0 8 16 19 23 1 71 79 65 61 65 62 75 72 75 66 75 93 67 68 70 67 66 69 70 73 74 58 62 83 74 73 58 67 89 79 76 77 65 53 64 61 81 86 53 73 73 83 75 65 86 66 50 55 66 69 8 13 0 4 74 63 85 60 87 54 68 69 81 55 17 70 6 4 24 60 80 64 77 71 71 70 62 62 57 Вариант 19 99 43 13 29 36 84 50 49 50 58 27 18 26 17 21 Вариант 18 8 39 2 8 46 3 9 14 2 3 25 9 11 1 9 43 16 9 31 7 17 15 17 10 9 14 36 2 16 2 4 9 0 0 14 61 5 23 69 54 26 9 80 7 90 31 70 51 97 67 31 79 91 5 Вариант 20 44 24 1 68 92 70 86 92 15 98 90 19 19 14 4 98 11 2 7 9 36 0 11 7 45 4 48 5 11 27 25 5 48 22 11 0 21 7 7 5 49 2 24 31 0 27 22 14 49 23 41 24 77 1 52 24 47 40 4 53 4 3 3 86 0 88 57 92 93 31 1 34 37 71 61 43 17 51 53 7 0 8 9 25 19 84 73 45 18 79 51 74 44 28 51 35 49 14 41 64 47 50 7 65 7 37 27 12 4 31 14 27 11 6 18 8 13 3 10 20 12 14 1 21 1 19 98 69 23 31 92 22 60 35 83 32 15 23 74 75 43 42 67 75 96 4 7 84 24 5 7 51 5 18 8 36 3 5 27 28 11 11 22 28 65 Вариант 21 Вариант 22 65 76 43 64 67 75 81 70 72 77 64 46 51 76 61 66 56 66 69 54 56 33 16 58 23 56 84 26 54 45 14 42 7 80 34 86 67 59 21 34 79 93 75 75 69 51 64 71 70 67 67 69 36 75 82 59 77 47 84 86 45 19 6 96 62 6 28 81 30 91 47 87 92 77 21 12 24 97 66 82 99 82 61 75 50 92 86 60 84 91 63 70 60 72 82 60 82 74 75 62 67 37 90 97 86 10 44 85 34 88 51 69 8 27 72 35 76 2 82 7 88 86 80 59 70 21 10 92 90 48 99 70 50 53 67 94 64 70 53 88 92 76 87 88 84 77 81 98 51 56 56 97 76 67 62 66 96 87 74 67 76 78 55 62 75 85 20 15 15 54 34 80 78 73 89 8 23 82 6 89 88 65 58 97 Вариант 23 18 9 3 19 5 18 42 71 46 34 88 84 60 72 38 98 86 58 92 92 20 51 31 Вариант 24 6 17 13 69 64 61 89 69 68 64 69 76 70 3 13 14 24 12 1 36 9 44 25 4 1 75 21 1 7 46 57 33 5 2 6 10 53 80 44 2 13 20 5 9 37 8 54 78 24 39 43 9 48 62 77 63 38 59 88 44 68 41 61 71 50 74 57 51 62 72 70 51 60 79 80 60 69 63 60 69 81 65 64 75 80 45 59 69 77 56 56 78 59 16 26 5 2 57 26 2 7 28 9 31 43 4 3 3 17 9 36 34 29 49 1 6 38 1 50 48 23 19 78 0 41 20 28 10 70 48 60 66 71 40 67 59 83 61 72 53 73 92 66 49 76 52 70 57 82 57 78 77 65 56 72 41 59 67 36 57 83 78 68 72 48 71 67 62 56 66 53 76 72 71 78 56 58 69 10 18 5 2 7 15 5 82 1 4 1 28 22 39 22 12 40 25 39 13 6 4 3 31 11 30 23 20 7 0 39 26 58 9 24 10 9 71 18 28 17 11 56 2 22 2 31 49 20 77 30 1 23 48 5 18 35 2 14 5 16 7 20 32 27 13 9 48 38 1 87 58 45 5 19 16 57 8 Вариант 25 87 15 33 97 84 65 56 35 97 62 17 26 35 91 55 7 43 15 2 34 9 19 17 82 75 81 95 62 10 8 67 39 68 55 9 26 71 82 73 92 71 74 49 62 44 63 33 53 88 Вариант 26 20 82 24 58 66 40 58 96 73 7 64 88 19 54 78 10 45 19 50 28 58 47 3 9 84 42 24 19 94 11 87 74 23 0 31 74 21 28 65 2 47 31 6 0 8 31 5 7 36 31 7 27 43 22 29 29 46 93 71 4 82 56 5 48 90 12 22 38 10 28 8 0 1 7 13 5 8 39 19 1 15 52 8 2 14 61 5 11 Вариант 27 Вариант 28 71 79 54 49 42 55 77 65 71 59 76 80 58 48 69 75 30 82 68 68 72 86 89 12 10 3 61 97 34 70 60 30 23 22 52 99 99 11 99 81 71 64 62 63 49 47 59 76 62 75 43 61 57 55 63 56 63 47 53 72 50 89 6 46 77 60 97 44 92 94 51 97 10 57 93 74 51 43 61 56 43 53 45 50 47 69 37 58 63 77 67 48 38 88 60 61 76 53 62 59 11 59 46 78 15 65 30 68 4 11 16 42 67 69 68 93 85 0 68 33 68 56 60 48 61 42 73 55 85 62 60 72 59 43 69 58 64 74 67 71 89 72 3 25 90 51 81 55 98 84 0 89 79 2 67 71 75 59 87 90 76 51 62 66 71 78 62 54 64 55 59 59 75 46 56 53 41 66 63 59 28 32 13 89 26 5 99 31 40 54 24 6 38 61 34 86 62 74 84 17 Вариант 29 Вариант 30 17 27 31 12 5 3 1 3 1 0 13 52 5 16 10 75 94 1 66 23 64 67 83 64 71 57 70 71 70 49 72 82 81 75 62 73 63 58 70 69 9 31 8 20 12 49 67 66 76 63 74 69 68 64 76 33 10 1 2 31 0 8 36 39 53 1 11 38 19 9 7 13 11 12 8 21 2 14 5 16 0 1 7 15 16 15 37 26 0 16 5 17 0 4 32 10 23 11 54 25 0 31 21 0 15 17 19 12 28 33 4 5 2 31 4 0 83 5 7 10 3 0 6 13 5 28 13 18 25 2 84 80 62 63 61 91 47 71 75 62 57 58 64 70 67 66 60 74 99 66 81 48 74 63 85 74 62 73 74 51 60 74 73 74 54 63 83 54 69 74 56 58 70 80 73 77 78 64 73 69 55 70 58 65 59 70 93 67 43 40 84 55 74 69 54 71 61 43 58 59 Задача 2. Статистическая обработка двумерной выборки Для заданных двумерных выборок требуется: 1) записать выборочные уравнения линейной среднеквадратической регрессии Y на X и X на Y, используя решение соответствующих систем нормальных уравнений; 2) получить аналогичные уравнения с помощью готовых формул для нахождения параметров линейной регрессии и сравнить результаты; 3) найти выборочный коэффициент корреляции; 4) построить поле корреляции и найденные прямые регрессии. Вариант 1 2.6 x 2.4 y 4.6 2.3 7.3 3.9 10.1 4.1 13.1 2.3 15.3 2.1 18.0 7.8 20.4 6.7 22.7 5.7 25.3 7.0 27.7 5.1 Вариант 2 2.2 x 5.7 y 5.0 12.8 8.0 14.0 10.1 12.1 18.2 21.0 14.4 26.9 16.9 30.6 19.6 34.9 22.5 39.8 24.5 41.0 26.9 48.1 4.6 6.9 9.7 14.1 17.0 19.1 21.4 24.0 26.6 -10.5 -13.9 Вариант 3 x 2.0 y -3.7 Вариант 4 2.1 x 4.7 y 4.5 4.5 7.0 4.3 11.9 -18.2 -27.1 -31.7 -39.5 -44.7 -50.0 -56.4 -59.1 9.1 3.5 12.1 9.1 14.3 6.4 Вариант 5 x 2.7 5.1 7.6 10.3 12.6 15.4 y -2.2 -4.5 -6.7 -8.3 -10.3 -17.4 16.4 9.8 18.3 -21.2 18.9 11.1 20.9 -23.5 21.5 13.0 23.6 11.6 25.6 13.7 23.4 -25.7 25.6 -27.2 28.5 -32.2 Вариант 6 2.6 x 4.5 y 4.8 9.9 7.6 16.6 10.0 17.0 12.0 21.0 14.4 29.0 17.0 29.7 19.5 38.0 22.1 39.4 24.8 47.6 26.9 49.4 Вариант 7 2.8 x 4.0 y 4.8 11.2 7.5 14.7 9.7 20.7 12.6 25.5 14.7 26.8 17.0 32.7 19.2 36.0 22.0 41.1 24.7 45.3 27.5 51.3 Вариант 8 2.3 x 4.6 7.0 9.2 11.7 14.3 16.4 19.2 21.3 23.7 26.1 y -5.1 -6.6 Вариант 9 2.1 x 0.2 y 4.4 1.3 Вариант 10 -14.2 -20.8 -25.4 -28.6 -34.5 -40.8 -44.0 -52.5 -56.3 7.0 2.4 9.2 3.3 11.8 4.9 14.4 4.9 17.3 5.0 19.6 5.1 22.0 5.3 24.1 5.6 26.3 6.8 x y 2.3 4.8 7.8 10.2 -0.4 -5.5 -9.7 -12.6 -18.8 -21.0 4.4 4.1 6.7 5.3 Вариант 11 2.0 x 1.1 y 9.7 3.4 13.0 12.3 3.3 15.9 15.1 1.5 Вариант 12 x 2.8 5.4 7.6 9.8 12.5 14.7 y -0.4 -0.2 -6.6 -9.6 -8.7 -13.0 Вариант 13 2.8 x 7.3 y Вариант 14 2.9 x 8.1 y 18.1 25.6 28.4 -25.2 -30.8 -35.0 -41.4 -42.1 17.4 0.6 27.5 4.0 17.4 -16.3 20.9 19.7 4.9 19.6 -12.9 23.3 22.3 3.1 22.1 -17.5 25.3 1.0 24.6 26.7 -21.0 -20.5 5.7 14.5 8.1 19.2 11.1 25.2 13.4 31.1 16.4 40.2 18.7 43.0 20.9 49.1 23.0 50.9 25.9 59.4 28.0 64.6 5.2 10.0 7.3 13.0 9.6 16.1 12.3 15.2 23.2 26.2 17.8 30.7 20.5 38.4 23.5 42.4 26.2 49.8 29.0 52.1 Вариант 15 2.7 x 7.2 y 5.3 9.0 7.7 10.3 10.1 16.6 12.5 16.8 15.4 22.6 17.6 28.1 19.7 31.5 22.3 34.5 24.4 35.4 26.6 37.2 Вариант 16 2.3 x -0.3 y 4.9 -2.5 7.0 -2.9 9.2 -1.7 12.2 -2.0 14.8 -4.3 17.5 -6.9 19.7 -7.7 22.1 -6.6 24.9 -9.3 27.3 -9.5 Вариант 17 2.0 x 9.8 y 5.0 17.1 7.1 22.6 9.3 30.2 11.6 35.1 13.9 40.9 16.1 47.3 18.8 53.6 21.1 63.3 23.3 67.4 25.7 73.3 Вариант 18 2.9 x 8.7 y 5.8 19.7 8.4 22.9 10.7 31.4 13.2 40.3 16.0 47.5 18.5 56.9 21.3 63.3 23.8 68.3 26.6 78.3 29.5 86.1 Вариант 19 2.9 x 5.6 7.9 10.2 12.6 15.2 18.0 20.6 23.0 25.5 27.8 -3.9 -3.1 -6.2 -12.3 -16.1 -17.5 -23.4 -22.9 -28.0 -33.0 -33.2 Вариант 20 2.8 x 5.7 y 5.6 6.6 8.5 10.2 10.6 14.2 y 13.4 18.8 16.0 17.3 18.4 24.6 20.9 24.9 23.5 28.9 25.6 30.2 27.8 32.7 Вариант 21 x 2.3 4.6 6.7 y -4.4 -7.6 -16.4 Вариант 22 x 2.4 5.2 y 1.4 2.7 9.7 -22.2 7.7 10.1 -2.5 -2.6 11.9 -30.2 12.1 -5.8 14.9 -35.3 14.9 -6.1 17.1 19.6 -42,0 -51.5 17.2 -6.7 19.4 -7.5 22.6 -55.9 22.4 -8.6 24.9 27.0 -60.4 -65.5 24.5 -6.2 26.9 -10.1 Вариант 23 2.6 4.9 x y 1.4 1.2 7.0 -0.2 9.8 -3.0 11.9 -3.3 14.2 -3.5 16.4 -6.1 18.7 20.8 23.4 26.1 -8.2 -6.1 -8.7 -11.1 Вариант 24 2.8 x 10.9 y 5.2 13.5 7.7 21.3 10.0 30.7 12.1 32.5 14.8 41.0 17.6 50.3 19.9 54.1 22.8 59.6 24.9 66.0 Вариант 25 3.0 x 5.9 7.9 10.7 13.5 15.7 17.9 20.0 22.6 25.3 27.6 -1.9 -0.3 -2.8 -4.3 -10.8 -12.8 -10.7 -13.5 -14.2 -17.2 -20.0 Вариант 26 2.5 x 6.0 y 4.7 10.0 7.5 19.3 9.7 22.9 12.6 32.0 15.3 35.1 17.4 40.5 20.2 48.9 23.0 57.0 25.0 61.7 27.8 68.4 Вариант 27 2.1 4.7 x 5.4 14.6 y 7.1 22.2 9.9 27.0 12.8 31.9 14.9 41.4 17.2 42.7 19.5 50.0 22.0 56.1 24.6 62.5 26.7 65.4 5.0 7.5 9.8 12.1 14.5 17.4 19.7 21.7 23.8 26.7 -0.9 -6.2 -8.9 -11.6 -17.3 -20.6 -23.1 -27.6 -31.1 -33.7 -36.1 Вариант 29 2.8 x 4.6 y 4.9 9.5 7.4 11.1 9.6 17.8 11.8 19.7 14.5 24.2 16.6 31.7 18.8 31.2 21.1 34.6 24.0 43.4 26.4 46.3 Вариант 30 2.6 x 3.4 y 4.7 7.6 7.4 15.6 10.4 16.7 12.9 21.3 15.3 27.9 17.9 32.3 20.3 37.4 23.2 38.2 25.9 45.5 27.9 47.1 y Вариант 28 2.1 x y КОНТРОЛЬНЫЕ ВОПРОСЫ 27.7 76.3 1. Определение случайной величины. Функция распределения и плотность распределения вероятностей случайной величины, их основные свойства. 2. Числовые характеристики случайной величины: математическое ожидание, дисперсия и среднее квадратическое отклонение; их основные свойства. 3. Основные законы распределения непрерывных случайных величин: равномерное, показательное, нормальное распределения. 4. Выборка, вариационный ряд и группированная выборка. Статистическое распределение сортированной и группированной выборок. 5. Гистограмма и полигон, их использование для выбора теоретического распределения случайной величины. 6. Точечные оценки неизвестного параметра случайной величины. Выборочное среднее и выборочная дисперсия. 7. Определение параметров теоретического распределения; требования к оценкам параметров. 8. Интервальные оценки. Доверительный интервал и доверительная вероят ность. Доверительный интервал для математического ожидания. 9. Статистическая проверка гипотезы о предполагаемом теоретическом распределении случайной величины. Критерии согласия. Критерий Пирсона 2 . 10. Корреляционная зависимость между случайными величинами. Уравнения выборочной линейной регрессии X на Y и Y на X. Выборочный коэффициент корреляции. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА 1. Гмурман, В. Е. Теория вероятностей и математическая статистика: учебное пособие для вузов / В. Е. Гмурман. – 11-е изд., стер. – М.: Высшая школа, 2005. – 479 с. 2. Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике: учебное пособие для вузов / В. Е. Гмурман. – 11-е изд., перераб. – М.: Высшее образование, 2007. – 404 с. 3. Математика. Высшая математика. Математическая статистика: метод. указания по выполнению лаб. работы "Статистическая обработка одномерной выборки" / сост. О. Е. Кочеткова, А. В. Синдяев. – Ульяновск: УИ ГА, 2017. – 36 с. 4. Знаенко, Н.С. Опорные схемы по теории вероятностей и математической статистике: учебное пособие / Н.С. Знаенко. – Ульяновск: УВАУГА (И), 2011. 56 с. БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Гмурман, В. Е. Теория вероятностей и математическая статистика: учебное пособие для вузов / В. Е. Гмурман. – 11-е изд., стер. – М.: Высшая школа, 2005. – 479 с. 2. Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике: учебное пособие для вузов / В. Е. Гмурман. – 11-е изд., перераб. – М.: Высшее образование, 2007. – 404 с. 3. Смирнов, Н.В. Курс теории вероятностей и математической статистики для технических приложений: учебное пособие для втузов / Н.В. Смирнов, И.В. Дунин-Барковский. – 2-е изд., испр. и доп. – М.: Наука, 1965. – 512 с. 4. Солодовников, А.С. Теория вероятностей: учебное пособие для пед. инст. / А.С. Солодовников. – М.: Просвещение, 1983. – 208 с. 5. Методические указания к лабораторной работе по разделу «Математическая статистика» / сост. Л.И. Поленищенко, В.В. Селиванов. – Ульяновск : УВАУ ГА, 1999. – 37 с. 6. Никонова, С.П. Основные понятия математической статистики: учебное пособие / С.П. Никонова. – Ульяновск: УВВИУС, 1994. – 32 с. ПРИЛОЖЕНИЯ Приложение 1 Законы распределения случайных величин 1. Равномерное распределение 0, x a x a F x ,a xb b a 1, x b. 1 , x a; b, (рис. 7) f ( x) b a 0, x a; b. ab (b a) 2 математическое ожидание M ( X ) , дисперсия D( X ) . 2 12 Рис. 7. Кривая равномерного распределения и гистограмма 2. Показательное распределение e x , x 0, f ( x) где 0 – параметр распределения (рис. 8) 0 , x 0 , 0, x 0 F x 1 e x , x 0 M (X ) 1 , D( X ) 1 2 . Рис. 8. Кривая показательного распределения и гистограмма 3. Нормальное распределение f ( x) x a 2 1 2 e 2 2 (рис. 9), a M (X ) , D(X ) , xa F x 0,5 , где x – функция Лапласа (Приложение 2), Рис. 9. Кривая показательного распределения и гистограмма Таблица значений функции Лапласа Фх x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 Ф х 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 x 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 Ф х 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 x 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 Ф х 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 Приложение 2 x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 Ф х 0,3849 0,3869 0,3883 0,3907 0,3925 0,3944 0,3962 0,3980 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,1844 0,1879 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 0,3106 0,3133 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 1,59 0,3997 0,4015 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 Окончание приложения 2 x 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 Ф х 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 x 1,96 1,97 1,98 1,99 2,00 2,01 2,02 2,03 Ф х 0,4750 0,4756 0,4761 0,4767 0,4772 0,4778 0,4783 0,4788 x 2,32 2,33 2,34 2,35 2,36 2,37 2,38 2,39 Ф х 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 x 2,68 2,69 2,70 2,71 2,72 2,73 2,74 2,75 Ф х 0,4963 0,4964 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 1,68 1,69 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91 1,92 1,93 1,94 1,95 0,4535 0,4545 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 2,12 2,13 2,14 2,15 2,16 2,17 2,18 2,19 2,20 2,21 2,22 2,23 2,24 2,25 2,26 2,27 2,28 2,29 2,30 2,31 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 0,4893 0,4896 2,40 2,41 2,42 2,43 2,44 2,45 2,46 2,47 2,48 2,49 2,50 2,51 2,52 2,53 2,54 2,55 2,56 2,57 2,58 2,59 2,60 2,61 2,62 2,63 2,64 2,65 2,66 2,67 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 2,76 2,77 2,78 2,79 2,80 2,81 2,83 2,85 2,87 2,89 2,91 2,93 2,95 2,97 2,99 3,00 3,05 3,10 3,20 3,30 3,40 3,50 3,70 3,80 3,90 4,00 4,50 5,00 0,4971 0,4972 0,4973 0,4974 0,4974 0,4975 0,4977 0,4978 0,4979 0,4981 0,4982 0,4983 0,4984 0,4985 0,4986 0,4987 0,4989 0,4990 0,4993 0,4995 0,4997 0,4998 0,4999 0,4999 0,499952 0,499968 0,499997 0,500000 Приложение 3 Таблица значений t n γ 5 6 7 8 9 10 0,95 0,99 2,78 2,57 2,45 2,37 2,31 2,26 4,60 4,03 3,71 3,50 3,36 3,25 n γ 20 25 30 35 40 45 0,95 0,99 2,093 2,064 2,045 2,032 2,023 2,016 2,861 2,797 2,756 2,729 2,708 2,692 11 12 13 14 15 16 17 18 19 2,23 2,20 2,18 2,16 2,16 2,13 2,12 2,11 2,10 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88 50 60 70 80 90 100 120 2,009 2,001 1,996 1,001 1,987 1,984 1,980 2,679 2,662 2,649 2,640 2,633 2,627 2,617 Приложение 4 Критические точки распределения хи-квадрат Число степеней свободы, r 1 2 3 4 5 6 7 8 9 10 Уровень значимости, 0,01 0,025 0,05 0,095 6,6 9,2 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 5,0 7,4 9,4 11,1 12,8 14,4 16,0 17,5 19,0 20,5 3,8 6,0 7,8 9,5 11,1 12,6 14,1 15,5 16,9 18,3 0,0039 0,103 0,352 0,711 1,15 1,64 2,17 2,73 3,33 3,94