Справочник Автор24
Лекторий Автор24
Лекционные и методические материалы по теории вероятности
Статистическая проверка гипотез о виде закона распределения

Статистическая проверка гипотез о виде закона распределения

👀 2108 просмотров
📌 2044 загрузки

Выбери формат для чтения

Конспект лекции по дисциплине «Статистическая проверка гипотез о виде закона распределения», docx

Загружаем конспект в формате docx

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Статистическая проверка гипотез о виде закона распределения», Word формат

Лиховодова Т.Б. Лекция. Статистическая проверка гипотез о виде закона распределения 1.1. Задача выравнивания статистического распределения. Задача определения вида закона распределения случайной величины состоит из двух этапов. На первом этапе решается задача «выравнивания» статистического распределения. Порядок решения этой задачи может быть следующим: 1. На основании статистических данных, оформленных в виде интервальной таблицы частот P*, строят полигон или гистограмму и по внешнему виду этих графиков выдвигают гипотезу (делают предположение) о возможном теоретическом законе распределения случайной величины (кривой распределения). Замечание: В некоторых случаях вид теоретической кривой распределения выбирается заранее из соображений, связанных с существом задачи. 2. Выясняют, от каких параметров зависит аналитическое выражение выбранной кривой распределения, и находят статистические оценки этих параметров. В этом случае задача выравнивания статистического распределения переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистическим и теоретическим распределениями оказывается наилучшим. Например, если выдвигается гипотеза о нормальном законе распределения X ~ N(α; σ), то он зависит только от двух параметров: математического ожидания а и среднего квадратического отклонения σ. Их наилучшими статистическими оценками будут соответственно среднее выборочное и выборочное среднее квадратическое отклонение то есть , 3. С учетом выдвинутой гипотезы о законе распределения случайной величины находят вероятности рi, попадания случайной величины в каждый из интервалов, указанных в статистической таблице распределения, записывают их в третьей строке таблицы и сравнивают полученные значения вероятностей рi, с соответствующими данными частотами рi* (для наглядности можно изобразить графически). Проводя такое сравнение, делается приблизительная оценка степени согласования статистического и теоретического распределений. На этом первый этап решения задачи об определении закона распределения случайной величины заканчивается. Пример 2. Для разумного планирования и организации работы ремонтных мастерских специальной техники оказалось необходимым изучить длительность ремонтных операций, производимых мастерскими. Результаты (сгруппированные по интервалам) соответствующего статистического обследования (фиксированы длительности операций в 100 случаях) представлены таблицей: li 0-20 20-40 40-60 60-80 80 -100 100-120 120-140 ni 36 24 16 10 7 4 3 Требуется выровнять это статистическое распределение с помощью показательного закона (при ), где λ - длительность операции в единицу времени. Решение. 1. По данной таблице абсолютных частот построим таблицу относительных частот и соответствующую ей гистограмму. . Гистограмма относительных частот имеет вид: Высоты прямоугольников гистограммы равны: ; ; ; ; 2. По внешнему виду гистограммы выдвигаем гипотезу, что случайная величина T (время ремонта) подчиняется показательному закону , который зависит только от одного параметра λ (длительность операции в единицу времени). Параметр , где mi- математическое ожидание (среднее время ремонта) случайной величины T. Следовательно, для выравнивания статистического распределения с помощью кривой показательного распределения найдем статистическую оценку параметра mi: (числа 10, 30, 50, 70, 90, 110, 130 – это середины интервалов). Тогда параметр . 3. Запишем теоретический закон распределения в виде функции плотности вероятности с учетом значения : . По формуле вероятности попадания случайной величины (распределенной по показательному закону) на заданный интервал (α, β) найдем теоретические вероятности рi, попадания случайной величины Т в каждый из семи интервалов и сравним их с соответствующими статистическими частотами pi *. ; ; ; ; ; ; . Для удобства сравнения теоретических вероятностей pi с частотами рi* запишем полученные вероятности pi в третью строку таблицы: li 0-20 20-40 40-60 60-80 80-100 100-120 120-140 pi* 0,36 0,24 0,16 0,10 0,07 0,04 0,03 pi 0,40 0,23 0,15 0,08 0,06 0,03 0,02 Замечаем, что расхождение между опытными частотами рi* и теоретическими вероятностями рi незначительны. Следовательно, вполне допустима гипотеза о показательном законе распределения изучаемой случайной величины Т. 4. Построим на одном графике с гистограммой выравнивающую ее кривую распределения f(t) . Для этого вычислим значения например, на правых концах интервалов. ; ; ; ; ; ; . Построим график полученной кривой распределения f(t), в той же системе координат, что и гистограмма относительных частот. Из рисунка видно, что теоретическая кривая f(t) сохраняет, в основном, существенные особенности статистического распределения. Пример 3. При массовых стрельбах из пушек для одинаковых общих условий были зафиксированы продольные ошибки (в метрах) попадания снарядов в цель: 4,8; -3,2; -15,0; 9,5; 36,6; 12,1; 20,9; 8,4; -4,0; 30,5; 22,3; 7,5; 12,7; 23,4; 8,4; 28,4; -8,5; 6,5; -16,5; 2,5; 14,9; 31,2; 4,3; 21,2; 27,5; 20,6; 2,0; -38,5; 3,8; 18,0; 16,8; 0,6; -22,5; 1,5; -9,0; 12,4; 3,5; -22,5; 5,8; -12,6; 7,7; 8,0; 17,0; 26,1; 8,0; -32,0; 9,8; -9,8; 0,8; 2,6; 32,4; 3,9; 11,7; 35,5; 5,0; -14,6;-3,8; -36,0; -26,0; 8,2; 19,6; -9,2; 38,0; 3,4; 6,7; 11,4; -6,6; 19,4; 45,5; 2,3; -13,1; -2,5; 3,8; 26,3; 12,7; 39,0; -25,0; 4,0; 1,8; -11,0; 17,2; 1,2; 51,0; 25,8; 1,0; 22,3; -3,5; -10,5; 37,4; 14,7; 24,8; -1,0; 0,9; -20,5; 56,4; -0,8; 5,0; 0,4; -0,3; 17,1; 25,0; 13,3; 15,5;-19,4; -9,5; 19,7; 32,5; 15,7; 20,1; -1,5; 25,0; 27,5; -7,5; 32,0; 17,3; 58,2; 9,5; -15,7; 6,2; -8,4; 21,1; 18,9; 14,0; 28,8; 25,5; -16,8; 3,4;-4,7; 40,5; 16,3; -5,4; 28,9; 59,5; 14,4; 11,9; 24,6; 13,5; -12,9; 10,9; -24,9;-7,4; 11,0; 42,0; 2,1; 12,4; 22,0; 22,8;-8,0; 29,6; 5,8; -6,8; -4,5; 10,5; 44,0; 21,4; -5,0; 10,2; -8,2; -9,0; -23,7. Построить гистограмму, выдвинуть гипотезу о наиболее подходящем законе распределения изучаемой случайной величины и произвести выравнивание статистического распределения с помощью предложенного теоретического распределения. Решение. 1. Построим интервальный статистический ряд и гистограмму случайной величины X - продольных ошибок попадания снарядов в цель. В данном случае наименьшая ошибка равна (-38,5 м), наибольшая - (59,5 м). Диапазон изменения ошибок разобьем на 10 равных интервалов. Для простоты расчета возьмем диапазон изменения ошибок от - 40 м до 60 м. Объем выборки n=160. Интервальная таблица частот примет вид: li (-40;-30) (-30;-20) (-20;-10) (-10;0) (0;10) (10;20) (20;30) (30;40) (40;50) (50; 60) ni 4 5 11 24 39 31 28 9 5 4 pi* 0,025 0,031 0,069 0,15 0,24 0,19 0,175 0,056 0,031 0,025 Построим гистограмму относительных частот: 2. Внешний вид гистограммы статистического распределения случайной величины X позволяет нам выдвинуть гипотезу о нормальном законе распределения: . Нормальный закон зависит от двух параметров: от математического ожидания α и среднего квадратического отклонения σ. Найдем оценки этих параметров с помощью выборочных данных. С учетом полученных оценок параметров α и σ запишем функцию плотности нормального закона распределения: . 3. Найдем теоретические вероятности рi, попадания случайной величины X на каждый из 10 интервалов по следующей формуле: и сравним их с данными частотами pi*. ; ; ; ; ; ; ; ; ; . Внесем значения рi, для сравнения с рi* в таблицу: li (-40; -30) (-30; -20) (-20; -10) (-10; 0) (0; 10) (10; 20) (20; 30) (30; 40) (40; 50) (50; 60) pi* 0,025 0,031 0,069 0,15 0,24 0,19 0,175 0,056 0,031 0,025 pi 0,012 0,037 0,087 0,158 0,206 0,205 0,155 0,085 0,036 0,012 Поскольку расхождения статистического и теоретического распределений незначительны, то вполне может быть правдоподобной гипотеза о нормальном распределении изучаемой случайной величины X. Справедливость выдвинутого предположения проверяется с помощью «критерия согласия» Пирсона. 1.2. Задача проверки правдоподобия гипотез о законе распределения с помощью «критерия согласия» (критерия Пирсона) При изучении многих статистических данных необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен и есть основания предположить, что он имеет определенный вид, то выдвигают гипотезу: генеральная совокупность распределена по закону А. В данной гипотезе речь идет о виде предполагаемого распределения. Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр θ равен определенному значению , то выдвигают гипотезу: θ =.Здесь речь идет о предполагаемой величине параметра одного известного распределения. Возможны гипотезы о равенстве параметров двух или нескольких распределений, о независимости выборок и др. Все выводы, которые делаются в математической статистике, вообще говоря, являются гипотезами, т.е. предположениями о неизвестных параметрах известных распределений, об общем виде неизвестного теоретического распределения или функции распределения изучаемой случайной величины. Такие гипотезы называют статистическими гипотезами. Различают простые и сложные, параметрические и непараметрические статистические гипотезы. Статистическая гипотеза называется простой, если она однозначно определяет закон распределения случайной величины. Сложной называют гипотезу, состоящую из конечного или бесконечного числа простых гипотез. Например, гипотезы "вероятность появления события A в схеме Бернулли равна 0,4 ", "закон распределения случайной величины– нормальный с параметрами α=0, σ=1" являются простыми в отличие от сложных гипотез: "вероятность появления события A в схеме Бернулли заключена между значениями 0,3 и 0,6", "закон распределения случайной величины не является нормальным". Гипотеза называется параметрической, если в ней содержится некоторое условие о значении параметра известного распределения. Гипотезу, в которой сформулированы предположения относительно вида распределения, называют непараметрической. Если исследовать всю генеральную совокупность, то, естественно, можно было бы наиболее точно установить справедливость выдвигаемой гипотезы. Однако такое исследование не всегда возможно, и суждение об истинности статистических гипотез проверяется на основании выборки. Выдвигаемую (проверяемую) гипотезу называют основной или нулевой гипотезой H0. Если, например, по полигону или гистограмме частот, построенным по некоторой выборке, можно предположить, что случайная величина распределена по нормальному закону, то может быть выдвинута гипотеза H0: α=α0, σ=σ0. Одновременно с гипотезой H0 выдвигается альтернативная (конкурирующая) гипотеза H1. Если гипотеза H0 будет отвергнута, то имеет место конкурирующая ей гипотеза. Конкурирующей (альтернативной) называют гипотезу H1, являющуюся логическим отрицанием H0. Выдвинутая гипотеза может быть правильной или неправильной, в связи с чем возникает необходимость ее проверки. Поскольку проверку осуществляют статистическими методами, ее называют статистической. В результате статистической проверки гипотезы неправильное решение может быть принято в двух случаях: с одной стороны, на основании результатов опыта можно отвергнуть правильную гипотезу; с другой– можно принять неверную гипотезу. Очевидно, последствия этих ошибок могут оказаться различными. Отметим, что правильное решение может быть принято также в двух случаях: 1) гипотеза принимается, и она в действительности является правильной; 2) гипотеза отвергается, и она в действительности не верна. По полученным значениям статистики основная гипотеза принимается или отклоняется. При этом, так как выборка носит случайный характер, могут быть допущены два вида ошибок: – может быть отвергнута правильная гипотеза, в этом случае допускается ошибка первого рода; – может быть принята неверная гипотеза, тогда допускается ошибка второго рода. Вероятность α совершить ошибку 1 рода, т.е. отвергнуть гипотезу H0, когда она верна, называется уровнем значимости критерия. Обычно принимают α= 0,1; 0,05; ; 0,01. Смысл α: при α= 0,05 в 5 случаях из 100 имеется риск допустить ошибку 1 рода, т.е. отвергнуть правильную гипотезу. Вероятность допустить ошибку 2 рода, т.е. принять гипотезу H0, когда она неверна, обозначают β. Вероятность 1–β не допустить ошибку 2 рода, т.е. отвергнуть гипотезу H0, когда она ошибочна, называется мощностью критерия. Для проверки справедливости нулевой гипотезы используют специально подобранную случайную величину K, точное или приближенное распределение которой известно. Эту случайную величину K, которая служит для проверки нулевой гипотезы, называют статистическим критерием (или просто критерием). Для проверки статистической гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и получают частное (наблюдаемое) значение критерия Kнабл. После выбора определенного статистического критерия для решения вопроса о принятии или непринятии гипотезы множество его возможных значений разбивают на два непересекающихся подмножества, одно из которых называется областью принятия гипотезы (или областью допустимых значений критерия), а второе – критической областью. Критической областью называется совокупность значений статистического критерия K, при которых нулевую гипотезу H0 отвергают. Областью принятия гипотезы (областью допустимых значений критерия) называется совокупность значений статистического критерия K, при которых нулевую гипотезу H0 принимают. Основной принцип проверки статистических гипотез: если наблюдаемое значение статистического критерия Kнабл принадлежит критической области, то основная гипотеза отвергается в пользу альтернативной; если оно принадлежит области принятия гипотезы, то гипотезу принимают. Поскольку статистический критерий K – одномерная случайная величина, то все ее возможные значения принадлежат некоторому интервалу. Следовательно, и критическая область, и область принятия гипотезы – также интервалы. Тогда должны существовать точки, их разделяющие. Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы. В отличие от интервального оценивания параметров, в котором имелась лишь одна возможность ошибки – получение доверительного интервала, не накрывающего оцениваемый параметр – при проверке статистических гипотез возможна двойная ошибка (как I рода α, так и II рода β). Вероятности оценок I и II рода (α и β ) однозначно определяются выбором критической области. Естественным является желание сделать α и β сколь угодно малыми. Однако эти требования являются противоречивыми, ибо при фиксированном объеме выборки можно сделать сколь угодно малой лишь одну из величин – α или β, что сопряжено с неизбежным увеличением другой. Одновременное уменьшение вероятностей α и β возможно лишь при увеличении объема выборки. При разработке статистических критериев необходимо уменьшать как ошибку I рода, так и ошибку II рода. Поскольку одновременное уменьшение ошибок I и II рода невозможно, то при нахождении критических областей для данной статистики уровень значимости задают, стараясь подобрать такой критерий, чтобы вероятность ошибки II рода была наименьшей. Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области. Правосторонней называют критическую область, определяемую неравенством K>kкр, где kкр>0. Левосторонней называют критическую область, определяемую неравенством Kk2, где k2>k1. Если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами K<-kкр, K>kкр, где kкр>0 или, что равносильно, |K|>kкр. Как найти критическую область? Пусть K=K(x1,x2,…,xn)– статистический критерий, выбранный для проверки нулевой гипотезы H0, k0– некоторое число, . Найдем правостороннюю критическую область, определяемую неравенством K>kкр, где kкр>0. Для ее отыскания достаточно найти критическую точку kкр. Рассмотрим вероятность P(K>k0) в предположении, что гипотеза H0 верна. Очевидно, что с ростом k0 вероятность P(K>k0) уменьшается. Тогда k0 можно выбрать настолько большим, что вероятность P(K>k0) станет ничтожно малой. Другими словами, при заданном уровне значимости α можно определить критическое значение kкр из неравенства P(K>kкр)=α. Критическую точку kкр ищут из требования, чтобы при условии справедливости нулевой гипотезы H0 вероятность того, что критерий K примет значение, большее kкр, была равна принятому уровню значимости α: . Для каждого из известных статистических критериев (нормального, Стьюдента, критерия Пирсона χ2 , Фишера-Снедекора, Кочрена и др.) имеются соответствующие таблицы, по которым находят kкр, удовлетворяющее этим требованиям. После нахождения kкр по данным выборок вычисляют реализовавшееся (наблюдаемое) значение Кнабл критерия K. Если окажется, что Kнабл>kкр, (т.е. реализовалось маловероятное событие), то нулевая гипотеза Н0 отвергается. Следовательно, принимается конкурирующая гипотеза H1. Если же Kнаблk2, где k2>k1. Критические точки k1, k2 находят из требования, чтобы при условии справедливости нулевой гипотезы Н0 сумма вероятностей того, что критерий K примет значение, меньшее k1 или большее k2, была равна принятому уровню значимости α: . Если распределение критерия симметрично относительно нуля, и для увеличения его мощности выбрать симметричные относительно нуля точки– kкр и kкр, kкр>0, то , и из следует . Это соотношение и служит для отыскания критических точек двусторонней критической области. Отметим, что принцип проверки статистической гипотезы не дает логического доказательства ее верности или неверности. Принятие гипотезы Н0 следует расценивать не как раз и навсегда установленный, абсолютно верный содержащийся в ней факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение. Если проверка статистических гипотез основана на предположении об известном законе распределения генеральной совокупности, из которого следует определенное распределение критерия, то критерии проверки таких гипотез называют параметрическими критериями. Если закон распределения генеральной совокупности неизвестен, то соответствующие критерии называются непараметрическими. Понятно, что непараметрические критерии обладают значительно меньшей мощностью, чем параметрические. Отсюда следует, что для сохранения той же мощности при использовании непараметрического критерия по сравнению с параметрическим необходимо иметь значительно больший объем наблюдений. В случае если закон распределения генеральной совокупности неизвестен, но имеются основания предположить, что предполагаемый закон имеет определенный вид (например, А), то проверяют нулевую гипотезу H0: генеральная совокупность распределена по закону A. Проверка гипотезы о предполагаемом законе распределения так же, как и проверка гипотезы о неизвестных параметрах известного закона распределения, производится при помощи специально подобранной случайной величины – критерия согласия. Как бы хорошо ни был подобран теоретический закон распределения, между эмпирическим и теоретическим распределениями неизбежны расхождения. Поэтому возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, что теоретический закон распределения подобран неудачно. Для ответа на этот вопрос и служат критерии согласия. Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Одним из основных критериев согласия является критерий χ2 (критерий Пирсона). Критерий Пирсона позволяет, в частности, проверить гипотезу о нормальном распределении генеральной совокупности. Для проверки этой гипотезы будем сравнивать эмпирические (т.е. наблюдаемые) и теоретические (т.е. вычисленные в предположении нормального закона распределения) частоты, которые, как правило, различаются. Случайно (незначимо) или неслучайно (значимо) это расхождение? Ответ на этот вопрос и дает критерий согласия Пирсона. Для проверки предположения о нормальном распределения с помощью критерия Пирсона обычно выполняют следующий алгоритм. 1. Весь интервал наблюдаемых значений случайной величины X (выборки объема n) делят на k частичных интервалов (одинаковой длины, находят середины частичных интервалов . В качестве частоты ni варианты xi*принимают число вариант, попавших в i -ый интервал. Получают последовательность равноотстоящих вариант и соответствующих им частот: xi* x1* x2* … xl* ni n1 n2 … nl 2. Вычисляют в * и выборочное среднее квадратическое отклонение σ*. 3. Нормируют случайную величину X, т.е. переходят к величине и вычисляют концы интервалов (:, , причем полагают наименьшее значение z1 =−∞, а наибольшее zк = +∞. 4. Вычисляют теоретические вероятности pi попадания случайной величины в интервалы ( по формуле , где Φ(x) – функция Лапласа. Находят теоретические частоты ni'=npi. Пусть по выборке объема нормально распределенной генеральной совокупности получено эмпирическое распределение xi x1 x2 … xl ni n1 n2 … nl и вычислены теоретические частоты ni’. Необходимо при уровне значимости α проверить справедливость нулевой гипотезы H0: {генеральная совокупность распределена нормально}. В качестве критерия проверки гипотезы H0 примем случайную величину (2.18) Величина, определенная формулой (2.18)– это случайная величина, т.к. в различных опытах она принимает различные, неизвестные заранее значения. Ясно, что χ2→0 при ni→ni', т.е. чем меньше различаются эмпирические ni и теоретические ni' частоты, тем меньше значение критерия χ2. Таким образом, критерий характеризует близость эмпирического и теоретического распределения. Известно, что при n→∞ закон распределения случайной величины χ2 стремится к закону распределения χ2 с k степенями свободы. Поэтому случайная величина в формуле (2.18) обозначается через χ2, а сам критерий называют критерием согласия χ2. Число степеней свободы k находят из равенства k =l–r–1, где l число групп (частичных интервалов), r– число параметров предполагаемого распределения, которые оценены по данным выборки (для нормального закона распределения r=2, поэтому k=l–3). Построим правостороннюю критическую область (т.к. односторонний критерий более "жестко" отвергает гипотезу H0), исходя из требования, чтобы, в предположении справедливости гипотезы H0, вероятность попадания критерия в эту область была равна принятому уровню значимости α : . Следовательно, правосторонняя критическая область определяется неравенством , а область принятия гипотезы H0 – неравенством . Значение критерия, вычисленное по данным наблюдений, обозначим χ2набл. Сформулируем правило проверки нулевой гипотезы H0. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу H0: {генеральная совокупность распределена нормально}, необходимо вычислить теоретические частоты ni' и наблюдаемое значение критерия согласия χ2 Пирсона . По таблице критических точек распределения χ2 по заданному уровню значимости α и числу степеней свободы k=l–3 найти критическую точку . Если наблюдаемое значение критерия χ2набл попало в область принятия гипотезы , то нет оснований отвергнуть нулевую гипотезу H0. (рис. 2.6). Рис.2.6. Иллюстрация принятия нулевой гипотезы с помощью критерия Пирсона Если наблюдаемое значение критерия χ2набл попало в критическую область , то нулевую гипотезу H0 отвергают (рис.2.7). Рис. 2.7. Иллюстрация случая, когда отвергают нулевую гипотезу с помощью критерия Пирсона Для контроля вычислений наблюдаемого критерия χ2набл можно использовать равенство Пример 3. Используя критерий Пирсона при уровне значимости 0,05, установить, случайно или значимо расхождение между эмпирическими и теоретическими частотами, которые вычислены, исходя из предположения о нормальном распределении признака Х генеральной совокупности: ni 14 18 32 70 20 36 10 ni’ 10 24 34 80 18 22 12 Решение. Выдвигаем нулевую гипотезу Н0 и ей конкурирующую Н1. Н0: признак Х имеет нормальный закон распределения. Н1: признак Х имеет закон распределения, отличный от нормального. В данном случае рассматривается правосторонняя критическая область. Проверим гипотезу с помощью случайной величины , которая имеет распределение χ2 c k=l–3=7–3=4 степенями свободы. Вычислим наблюдаемое значение критерия χ2 по выборочным данным. Расчеты представим в таблице: ni ni’ 14 10 1,6 18 24 1,5 32 34 0,118 70 80 1,25 20 18 0,222 36 22 8,909 10 12 0,333 , (по таблице приложения 1). Сравниваем и . Так как >, то есть наблюдаемое значение критерия попало в критическую область, нулевая гипотеза отвергается. Справедлива конкурирующая гипотеза, то есть признак Х имеет закон распределения, отличный от нормального, расхождение между эмпирическими и теоретическими частотами значимо. Пример 4. Задача о бомбардировках Лондона. Задача возникла в связи с бомбардировками Лондона во время Второй мировой войны. Для улучшения организации оборонительных мероприятий, необходимо было понять цель противника. Для этого территорию города условно разделили сеткой из 24-х горизонтальных и 24-х вертикальных линий на 576 равных участков. В течение некоторого времени в центре организации обороны города собиралась информация о количестве попаданий снарядов в каждый из участков. В итоге были получены следующие данные: Число попаданий 1 2 3 4 5 6 7 Количество участков 229 211 93 35 7 1 Решение. Гипотеза H0: стрельба случайна (нет "целевых" участков). Закон редких событий– распределение Пуассона. , где S– число попаданий, . . Вычислим pi по формуле : ; ; ; ; ; ; ; ; Вычислим n∙pi: ; ; ; ;; ; ; . хi ni n∙рi ni – n∙рi (ni – n∙рi)2 1 2 3 4 5 6 7 229 211 93 35 7 1 226,36 210,81 98,49 30,52 6,91 1,15 0,23 0,027 2,63 0,18 -5,5 4,47 0,09 -1,15 -0,23 0,97 6,93 0,03 30,21 20 0,01 1,33 0,05 0,95 0,03 0,307 0,655 0,001 1,152 0,23 34,197 Итого = 36,57 Определим критическое . Число степеней свободы r = l – k – 1, где k=1, l = 8. По таблице приложения 1 находим критическое при r = 8–1–1=6 и α = 0,05: = 12,59. Так как , т. е. 36,57 > 12,59, то имеем все основания считать расхождения между эмпирическими и теоретическими частотами не случайными и отвергнуть гипотезу о пуассоновском законе распределения. Таким образом, статистическое определение вида закона распределения случайной величины позволяет исследователям получать данные, которые возможно использовать для последующих научных выводов и решения практических задач с достаточно высокой степенью достоверности. 1.3. Задачи для самостоятельного решения. Задача 1. В таблице приведены результаты измерения роста (в см.) случайно отобранных 100 студентов: интервалы роста 154-158 158-162 162-166 166-170 170-174 174-178 178-182 число студентов ni 10 14 26 28 12 8 2 Произвести выравнивание статистического распределения с помощью нормального закона распределения. С помощью «Критерия Пирсона» при уровне значимости а = 0,05 проверить правдоподобие гипотезы о нормальном распределении роста студентов. Задача 2. При уровне значимости α= 0,01 проверить гипотезу о показательном законе распределения признака X генеральной совокупности по выборке, данные которой приведены в таблице: xi 3,0-3,6 3,6-4,2 4,2-4,8 4,8-5,4 5,4-6,0 6,0-6,6 6,6-7,2 ni 43 35 22 15 8 5 2