Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 8. Статистическая оценка связей между количественными и
качественными признаками
При проведении научных исследований в результате экспериментов
получаем массивы опытных данных. В ряде случаев оказывается более
удобным иметь дело с аналитическим видом функции y=f(x), связывающей
входные и выходной параметр исследуемого объекта (процесса). Такая
форма не только более компактна, но и позволяет дальнейшие исследования
проводить аналитически.
Таким образом, возникает задача сглаживания экспериментальных
данных с помощью некоторой функции, заданной аналитически. Эта
функция должна, по возможности, максимально точно отражать общую
тенденцию зависимости y=f(x) и сглаживать случайные отклонения.
Для решения подобных задач используют различные расчетные
методы, наиболее популярным из которых является метод наименьших
квадратов (МНК).
Наиболее часто встречающийся вид точечной аппроксимации на
дискретном наборе данных – аппроксимация полиномом, линейным
относительно своих параметров – коэффициентов a0, a1,…, am:
f ( xi ) = a0 + a1 xi + a2 xi2 +…+ am xim , i = 1, …, n.
Коэффициенты аппроксимирующей функциии вычисляются из условия
минимизации суммы квадратов отклонений экспериментальных данных от
найденной аппроксимирующей функции:
n
F ( a0 , a1 ,…, am ) = ∑ ( yi − f ( xi ) ) → min. (1)
2
i =1
Таким образом, задача построения аппроксимирующей кривой
сводится к задаче нахождения минимума функции нескольких переменных.
Находим частные производные функции F (a0,a1,… ,am) по переменным
,
,…,
и приравниваем их к нулю:
∂ n y − f (x ) 2
i )
∑ i =1 ( i
= 0,
∂a0
……………………………
2
n
∂ ∑ i =1 ( yi − f ( xi ) )
= 0.
∂an
Решая систему уравнений, находим значения a0, a1, … ,am.
По возможности, следует отдавать предпочтение линейным
аппроксимирующим зависимостям. Однако могут быть выбраны и
нелинейные аппроксимирующие функции. Если в этой ситуации
непосредственно применить МНК, то мы получим систему нелинейных
уравнений, для решения которой потребуется применение численных
методов. Чтобы избежать этого, применяется линеаризация, или
выравнивание эмпирической формулы. Несмотря на приближенность метода
выравнивания, он широко применяется потому, что позволяет сводить
сложные нелинейные задачи к более простым линейным.
Рассмотрим применение метода выравнивания на примерах
конкретных зависимостей.
а) Степенная функция y=axb.
Для ее выравнивания применим преобразование lgy=lga+blgx. После
замены переменных X=lgx, Y=lgy получим Y=a1X+b1, где a1=b, b1=lga.
б) Показательная функция y=aebx.
Применим преобразование lgy=lga+blge ·x. После замены переменных
X=x, Y=lgy получим Y=a1X+b1, где a1=blge, b1=lga.
в) Функция вида x/(ax+b).
Используем преобразование Y=1/y=a+b/x и замену переменных X=1/x,
Y=1/y, что приводит к линейной зависимости Y=a1X+b1, где a1=b, b1=a.
МНК с соотношением (1) является классическим МНК, в котором
предполагается, что все значения ряда являются равноправными. В
противном случае все слагаемые ряда умножаются на коэффициент
значимости βi<1, i=1,…,n;
n
∑βi = 1.
i=1
Такая модификация носит название «Метод взвешенных наименьших
квадратов» (МВНК). В этом случае соотношение (1)принимает вид:
n
F ( a0 , a1 ,…, am ) = ∑βi ( yi − f ( xi ) ) → min.
2
i =1
Коэффициенты βi могут быть заданы в числовой форме или в виде
функции. Обычно строят возрастающие последовательности, показывая, что
будущее поведение системы в большей степени определяется поздними
наблюдениями, чем ранними.
Для исследования связей между статистическими совокупностями
применяются методы дисперсионного, корреляционного и регрессионного
анализа.
Методы дисперсионного анализа устанавливают наличие влияния
одновременно действующих факторов на изучаемый процесс. С целью
выбора наиболее значимых факторов и оценки их влияния на исследуемый
процесс устанавливаются изменения дисперсии результатов эксперимента
при изменении уровней факторов. При значимом отличии дисперсий
делается вывод о значимом влиянии факторов на среднее значение
результативного признака, характеризующего изучаемый процесс.
Дисперсионный анализ позволяет подтвердить влияние тех или иных
факторов на рассматриваемый результативный признак, но не дает
возможности определить силу и форму этого влияния. Корреляционный
анализ позволяет оценить силу взаимосвязи признаков, а методами
регрессионного анализа можно выбрать конкретную математическую модель
и оценить адекватность отражения ею установленной взаимосвязи признаков.
Корреляция – зависимость между случайными величинами X и Y
(признаками), не имеющая, вообще говоря, строго функционального
характера. В отличие от функциональной зависимости корреляция, как
правило, рассматривается тогда, когда одна из величин зависит не только от
данной другой, но и от ряда случайных факторов.
Стохастическая составляющая связи между X и Y характеризуется
коэффициентом корреляции
r=
M {[ X − MX ][Y − MY ]}
DX ⋅ DY
,
где MX(MY) и DX(DY) – математическое ожидание и дисперсия X(Y).
Если величины X и Y независимы, то r=0 (обратное утверждение в
общем случае неверно) и величины некоррелированы; r=1 тогда и только
тогда, когда величины связаны линейной функциональной зависимостью.
Вспомогательными средствами при анализе выборочных двумерных
данных являются корреляционное поле и корреляционная таблица. При
нанесении на координатную плоскость выборочных точек получают
корреляционное поле. По характеру расположения точек поля можно
выдвинуть предположение о форме зависимости случайных величин.
Для численной обработки данных результаты эксперимента обычно
группируют и представляют в форме корреляционной таблицы. В каждой
клетке этой таблицы приводятся численности nij тех пар (x, y), компоненты
которых попадают в соответствующие интервалы группировки по каждой
переменной. Предполагая длины интервалов группировки по каждой из
переменных равными между собой, выбирают центры xi и yj этих интервалов
для дальнейших расчетов.
Выборочный коэффициент корреляции определяется по формуле
rв =
∑ i ∑ j ( xi − x )( y j − y )nij
,
2
2
n
(
x
−
x
)
n
(
y
−
y
)
∑ i ii i
∑ j ij j
(2)
где
ni i = ∑ j nij , ni j = ∑ i nij , n = ∑ i ∑ j nij , x =
или после преобразования
∑ i nii xi ,
n
y=
∑ j ni j y j
n
.
,
rв =
∑ ij nij xi y j − nx y
nσ x σ y
,
(3)
где σx, σy – выборочные средние квадратические отклонения.
При большом числе независимых наблюдений, подчиненных одному и
тому же закону распределения, близкому к нормальному, выборочный
коэффициент корреляции близок к истинному коэффициенту корреляции.
Во всех других случаях в качестве характеристики силы связи
рекомендуется использовать корреляционное отношение, интерпретация
которого не зависит от вида исследуемой зависимости.
Выборочное значение корреляционного отношения Y по X вычисляется
по формуле:
ηˆ Y2 | X
1
∑ i ni i ( yi − y )2
n
=
,
1
2
(
)
n
y
−
y
∑ j ij j
n
где числитель характеризует рассеяние условных средних значений
yi
около
безусловного среднего y . Аналогично определяется выборочное значение
корреляционного отношения X по Y.
В любом случае справедливо неравенство r2≤η2≤1. Равенство
достигается только при строгой линейной связи между Y и X . Разность η2-r2
может служить мерой нелинейности корреляционной связи.
Проверка гипотезы о значимости корреляционной связи основывается
на распределениях выборочных корреляционных зарактеристик. Так, в
случае нормального распределения величина выборочного коэффициента
корреляции считается значимо отличной от нуля, если выполняется
неравенство:
−1
rв2
n− 2
> 1 + 2 ,
tα
(4)
где tα - критическое значение t-распределения Стьюдента с (n-2) степенями
свободы, соответствующее выбранному уровню значимости α (табл. П.1).
Проверка значимости корреляционного отношения производится с
помощью статистики
Fнабл =
ηˆ 2 (n − m)
,
(1 − ηˆ 2 )(m − 1)
где m –число интервалов по группировочному признаку.
При выбранном уровне значимости α по табл. П.2 находим табличное
значение критерия Фишера Fкр=Fкр(α, k1, k2), где k1=m-1, k2 =n-m. Если
Fнабл>Fкр(α, k1, k2), то корреляционное отношение значимо.
При необходимости исследования связи между тремя и более
случайными величинами используются частные и множественные
коэффициенты корреляции. Так зависимость между двумя переменными X и
Y при фиксированной третьей переменной Z оценивается с помощью
частного коэффициента корреляции:
rxy , z =
rxy − rxz ryz
(1 − rxz2 )(1 − ryz2 )
.
Аналогично определяются частные коэффициенты корреляции по
остальным парам переменных.
Множественная корреляция исследуется в случае, когда необходимо
установить существенность взаимосвязи одной переменной с совокупностью
остальных. Зависимость между X и Y,Z определяется с помощью
множественного коэффициента корреляции:
rx , yz =
rxy2 + rxz2 − 2rxy rzx ryz
1 − ryz2
.
Зависимости между Y и X, Z, а также между Z и X,Y определяются
аналогично. Так же, как и обычные коэффициенты корреляции, частные и
множественные коэффициенты корреляции принимают значения от -1 до +1.
Для распределения случайных величин (признаков), отличных от
нормального, более эффективны методы изучения связи между величинами,
основанные на замене наблюдаемых величин их рангами. Под рангом
выборочного значения случайной величины понимается его номер в
упорядоченной по возрастанию выборке. Такие методы обладают
повышенной устойчивостью к отклонениям распределения от нормального и
оставляют на приемлемом уровне статистические характеристики
получаемых заключений по гипотезам.
Существуют различные способы оценки ранговой корреляции величин
X и Y. Один из самых распространенных - способ Спирмена.
Пусть Ri и Rj∗ - последовательности рангов значений xi и yj величин X и
Y. Найдем разность рангов di=Ri-Ri∗, соответствующую паре (xi , yi). Тогда
коэффициент ранговой корреляции Спирмена определяется формулой:
n
6∑ di2
ρ = 1−
i =1
n(n 2 − 1)
.
Его значения находятся в интервале от -1 до +1. Значение ρ=0
указывает на отсутствие корреляции.
В качестве статистики для проверки значимости ρ используется сумма
квадратов отклонений рангов
n
S = ∑ di2 .
i =1
При n≥10 распределение S аппроксимируется нормальным
распределением с параметрами:
M (S ) =
n(n 2 − 1)
n 2 (n + 1)2 (n − 1)
, D( S ) =
.
6
36
Корреляция считается значимой, если S >Sкр , где
Sкр =
n(n 2 − 1)
n(n + 1)
+ uα
n − 1,
6
6
uα - α-квантиль стандартного нормального распределения (табл. П.4).
Приведенные выше показатели оценивают связь между
количественными признаками.
Рассмотрим методы статистической оценки связи между
качественными признаками. Предположим, что наблюдаемая случайная
величина может изменяться в зависимости от некоторых признаков.
Например, долговечность электронного прибора может зависеть от
технологии изготовления, применяемых материалов. По результатам
наблюдений над случайной величиной, классифицированным по наличию
или отсутствию исследуемых признаков, необходимо определить,
существует ли взаимосвязь между ними, т. е. существует ли связь между
технологией изготовления и применяемыми материалами.
Таблицы, в которых представлены значения исследуемой случайной
величины, классифицированные по качественным признакам, называются
таблицами сопряженности признаков.
Если исследуется взаимосвязь двух признаков A и B, то таблица
сопряженности имеет вид
a b
c d,
где a – число элементов выборки, обладающих признаками A и B
одновременно; b- число элементов выборки, обладающих признаком A, но не
обладающих признаком B; c - число элементов выборки, обладающих
признаком B, но не обладающих признаком A; d - число элементов выборки,
не обладающих ни одним из признаков A и B.
Рассмотрим меры связи, позволяющие грубо оценить ее наличие.
Коэффициент ассоциации находится по формуле:
Q=
ad − bc
.
ad + bc
Если признаки A и B независимы, то Q=0. В случае полной связи между
признаками Q=±1.
Дисперсия коэффициента ассоциации равна
D(Q) =
1
1 1 1 1
(1 − Q2 ) + + + .
4
a b c d
Сравнение Q со среднеквадратическим значением позволяет получить
первое приближение по оценке связи: чем больше коэффициент ассоциации
по сравнению со своим среднеквадратическим значением, тем существеннее
связь между признаками.
Коэффициент контингенции находится по формуле:
V=
ad − bc
(a + b)(a + c)(b+ d)(c+ d)
.
Для проверки гипотезы о существовании взаимосвязи между
изучаемыми признаками используется величина χ2=nV2, имеющая при
отсутствии связи распределение χ2 с f=1 степенью свободы (табл. П.5).
Наблюдаемое значение критерия контингенции для проверки связи
признаков имеет вид:
2
2
χнабл
n
n ad − bc −
2
=
,
(a + b)(a + c)(b + d)(c+ d)
где n=a+b+c+d.
Если
2
2
χ набл
> χ кр
(α,1), то
с достоверностью α зависимость признаков A и B
признается значимой.
Заметим, что критерий χ2=nV2 применим, когда n≥40 и a, b, c, d≥5.
Таким образом, корреляционный анализ статистических данных
заключает в себе следующие основные практические приемы:
1) построение корреляционного поля и составление
корреляционной таблицы;
2) вычисление выборочных коэффициентов корреляции или
корреляционныхотношений;
3) проверка статистической гипотезы значимости связи.
Дальнейшее исследование заключается в установлении конкретного
вида зависимости между величинами.
Влияние одной случайной величины на другую характеризуется
условными распределениями одной из них при фиксированных значениях
другой. Если для каждого возможного значения X=x определено условное
математическое ожидание y(x)=M[YX=x] величины Y, функция y(x)
называется регрессией величины Y по X, а ее график – линией регрессии Y по
X. Зависимость Y от X проявляется в изменении средних значений Y при
изменении X.
Функция регрессии y(x) обозначается
yx .
Выборочное уравнение прямой линии регрессии Y на X имеет вид:
yx − y = rв
σy
σx
( x − x ).
(5)
Регрессионный анализ объединяет практические методы исследования
регрессионной зависимости между величинами по статистическим данным и
решает следующие основные задачи:
1) выбор модели регрессии;
2) оценка параметров в выбранной модели методом наименьших
квадратов;
3) проверка статистических гипотез о регрессии.
По выборочным данным можно найти только оценку истинной
регрессии, содержащую ошибку, связанную со случайностью выборки.
В основе лежит принцип наименьших квадратов, в соответствии с
которым в качестве уравнения регрессии y=f(x) выбирается функция,
доставляющая минимум сумме квадратов разностей
2
n
s = ∑ yi − f ( xi ) .
i =1
Как правило, вид функции f(x) определяется заранее, а методом
наименьших квадратов определяются ее коэффициенты, минимизирующие s.
Количественной мерой рассеяния значений yi вокруг регрессии f(x) является
дисперсия
D=
1
n−k
n
2
∑ yi − f ( xi ) ,
i =1
где k – число коэффициентов, входящих в аналитическое выражение
регрессии.
Вид функции f(x) выбирается исходя из особенностей исследуемого
явления (процесса), а также из графического анализа зависимости между y и
x. Чаще всего используется линейная регрессионная модель, а при
нелинейной зависимости y=f(x) используют различные линеаризующие
преобразования.
Для оценки коэффициентов регрессии применяется также метод
наименьших модулей (МНМ), в соответствии с которым оценки ищутся из
условия минимизации суммы абсолютных величин отклонений
экспериментальных точек от выборочной регрессии. Задача отыскания
минимума является задачей кусочно-линейного программирования.
Замена квадратов отклонений абсолютными величинами в ряде случаев
может оказаться предпочтительнее. Прежде всего, использование МНМ
позволяет ослабить влияние больших отклонений (в МНК они возводятся в
квадрат).
Разработанный в настоящее время аппарат регрессионного анализа
предполагает, что значения yi взаимно независимы и нормально
распределены. Выполнение этих условий должно быть предварительно
проверено с помощью критериев нормальности и критериев сравнения
дисперсий.
Регрессионный анализ является одним из наиболее распространенных
методов обработки экспериментальных данных при изучении зависимостей в
технике, физике, биологии, экономике и других областях. На моделях
регрессионного анализа основаны такие разделы математической статистики,
как дисперсионный анализ и планирование эксперимента.
Таблица П.1.
Критические значения распределения Стьюдента (t-распределения)
k – число степеней свободы
Уровень значимости α
k
0,1
0,05
0,02
0,01
0,002
0,001
1
6,3138
12,7062
31,8205
63,6567
318,3088
636,6192
2
2,9200
4,3027
6,9646
9,9248
22,3271
31,5991
3
2,3534
3,1824
4,5407
5,8409
10,2145
12,9240
4
2,1318
2,7764
3,7469
4,6041
7,1732
8,6103
5
2,0150
2,5706
3,3649
4,0321
5,8934
6,8688
6
1,9432
2,4469
3,1427
3,7074
5,2076
5,9588
7
1,8946
2,3646
2,9980
3,4995
4,7853
5,4079
8
1,8595
2,3060
2,8965
3,3554
4,5008
5,0413
9
1,8331
2,2622
2,8214
3,2498
4,2968
4,7809
10
1,8125
2,2281
2,7638
3,1693
4,1437
4,5869
11
1,7959
2,2010
2,7181
3,1058
4,0247
4,4370
12
1,7823
2,1788
2,6810
3,0545
3,9296
4,3178
13
1,7709
2,1604
2,6503
3,0123
3,8520
4,2208
14
1,7613
2,1448
2,6245
2,9768
3,7874
4,1405
15
1,7531
2,1314
2,6025
2,9467
3,7328
4,0728
16
1,7459
2,1199
2,5835
2,9208
3,6862
4,0150
17
1,7396
2,1098
2,5669
2,8982
3,6458
3,9651
18
1,7341
2,1009
2,5524
2,8784
3,6105
3,9216
19
1,7291
2,0930
2,5395
2,8609
3,5794
3,8834
20
1,7247
2,0860
2,5280
2,8453
3,5518
3,8495
21
1,7207
2,0796
2,5176
2,8314
3,5272
3,8193
22
1,7171
2,0739
2,5083
2,8188
3,5050
3,7921
23
1,7139
2,0687
2,4999
2,8073
3,4850
3,7676
24
1,7109
2,0639
2,4922
2,7969
3,4668
3,7454
25
1,7081
2,0595
2,4851
2,7874
3,4502
3,7251
26
1,7056
2,0555
2,4786
2,7787
3,4350
3,7066
27
1,7033
2,0518
2,4727
2,7707
3,4210
3,6896
28
1,7011
2,0484
2,4671
2,7633
3,4082
3,6739
29
1,6991
2,0452
2,4620
2,7564
3,3962
3,6594
30
1,6973
2,0423
2,4573
2,7500
3,3852
3,6460
40
1,6839
2,0211
2,4233
2,7045
3,3069
3,5510
Продолжение табл. П.1.
Уровень значимости α
k
0,1
0,05
0,02
0,01
0,002
0,001
50
1,6759
2,0086
2,4033
2,6778
3,2614
3,4960
50
1,6759
2,0086
2,4033
2,6778
3,2614
3,4960
60
1,6706
2,0003
2,3901
2,6603
3,2317
3,4602
70
1,6669
1,9944
2,3808
2,6479
3,2108
3,4350
80
1,6641
1,9901
2,3739
2,6387
3,1953
3,4163
90
1,6620
1,9867
2,3685
2,6316
3,1833
3,4019
100
1,6602
1,9840
2,3642
2,6259
3,1737
3,3905
110
1,6588
1,9818
2,3607
2,6213
3,1660
3,3812
120
1,6577
1,9799
2,3578
2,6174
3,1595
3,3735
200
1,6525
1,9719
2,3451
2,6006
3,1315
3,3398
Таблица П.2.
Критические значения распределения Фишера – Снедекора
(F-распределения)
k1 – число степеней свободы большей дисперсии,
k2 – число степеней свободы меньшей дисперсии
Уровень значимости α=0,01
k2
k1
1
2
3
4
5
6
7
8
9
10
11
12
1
4052
4999
5403
5625
5764
5889
5928
5981
6022
6056
6082
6106
2
98,49
99,01
99,17
99,25
99,30
99,33
99,34
99,36
99,38
99,40
99,41
99,42
3
34,12
30,81
29,46
28,71
28,24
27,91
27,67
27,49
27,34
27,23
27,13
27,05
4
21,20
18,00
16,69
15,98
15,52
15,21
14,98
14,80
14,66
14,54
14,45
14,37
5
16,26
13,27
12,06
11,39
10,97
10,67
10,45
10,27
10,15
10,05
9,96
9,89
6
13,74
10,92
9,78
9,15
8,75
8,47
8,26
8,10
7,98
7,87
7,79
7,72
7
12,25
9,55
8,45
7,85
7,46
7,19
7,00
6,84
6,71
6,62
6,54
6,47
8
11,26
8,65
7,59
7,01
6,63
6,37
6,19
6,03
5,91
5,82
5,74
5,67
9
10,56
8,02
6,99
6,42
6,06
5,80
5,62
5,47
5,35
5,26
5,18
5,11
10
10,04
7,56
6,55
5,9S
5,64
5,39
5,21
5,06
4,95
4,85
4,78
4,71
11
9,86
7,20
6,22
5,67
5,32
5,07
4,88
4,74
4,63
4,54
4,46
4,40
12
9,33
6,93
5,95
5,41
5,06
4,82
4,65
4,50
4,39
4,30
4,22
4,16
13
9,07
6,70
5,74
5,20
4,86
4,62
4,44
4,30
4,19
4,10
4,02
3,96
14
8,86
6,51
5,56
5,03
4,69
4,46
4,28
4,14
4,03
3,94
3,86
3,80
15
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,89
3,80
3,73
3,67
16
8,53
6,23
5,29
4,77
4,44
4,20
4,03
3,89
3,78
3,69
3,61
3,55
17
8,40
6,11
5,18
4,67
4,34
4,10
3,93
3,79
3,68
3,59
3,52
3,45
Продолжение табл. П.2.
Уровень значимости α =0,05
k2
k1
1
2
3
4
5
6
7
8
9
10
11
12
1
161
200
216
225
230
234
237
239
241
242
243
244
2
18,51
19,00
19,16
19,25
19,30
19,33
19,36
19,37
19,38
19,39
19,40
19,41
3
10,13
9,55
9,28
9,12
9,01
8,94
8,88
8,84
8,81
8,78
8,76
8,74
4
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,93
5,91
5
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,78
4,74
4,70
4,68
6
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
4,06
4,03
4,00
7
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
3,63
3,60
3,57
8
5,32
4,45
4,07
3,84
3,69
3,58
3,50
3,44
3,39
3,34
3,31
3,28
9
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
3,13
3,10
3,07
10
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
2,97
2,94
2,91
11
4,84
3,98
3,59
3,36
3,20
3,09
3,01
2,95
2,90
2,86
2,82
2,79
12
4,75
3,88
3,49
3,26
3,11
3,00
2,92
2,85
2,80
2,76
2,72
2,69
13
4,67
3,80
3,41
3,18
3,02
2,92
2,84
2,77
2,72
2,67
2,63
2,60
14
4,60
3,74
3,34
3,11
2,96
2,85
2,77
2,70
2,65
2,60
2,56
2,53
15
4,54
3,68
3,29
3,06
2,90
2,79
270
2,64
2,59
2,55
2,51
2,48
16
4,49
3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,54
2,49
2,45
2,42
17
4,45
3,59
3,20
2,90
2,81
2,70
2,62
2,55
2,50
2,45
2,41
2,38
Таблица П.4.
Квантили uα стандартного нормального распределения
α
uα
α
uα
α
0,50
0,000000
0,70
0,524401
0,90 1,281552 0,983 2,120072
0,51
0,025069
0,71
0,553385
0,91 1,340755 0,984 2,144411
0,52
0,050154
0,72
0,582842
0,92 1,405072 0,985 2,170090
0,53
0,075270
0,73
0,612813
0,93 1,474791 0,986 2,197286
0,54
0,100434
0,74
0,643345
0,94 1,554774 0,987 2,226212
0,55
0,125661
0,75
0,67449
0,95 1,644854 0,988 2,257129
0,56
0,150969
0,76
0,706303
0,96 1,750686 0,989 2,290368
0,57
0,176374
0,77
0,738847
0,97 1,880794 0,99 2,326348
0,58
0,201893
0,78
0,772193 0,971 1,895698 0,991 2,365618
0,59
0,227545
0,79
0,806421 0,972 1,911036 0,992 2,408916
0,60
0,253347
0,80
0,841621 0,973 1,926837 0,993 2,457263
0,61
0,279319
0,81
0,877896 0,974 1,943134 0,994 2,512144
0,62
0,305481
0,82
0,915365 0,975 1,959964 0,995 2,575829
0,63
0,331853
0,83
0,954165 0,976 1,977368 0,996 2,652070
0,64
0,358459
0,84
0,994458 0,977 1,995393 0,997 2,747781
0,65
0,385320
0,85
1,036433 0,978 2,014091 0,998 2,878162
0,66
0,412463
0,86
1,080319 0,979 2,033520 0,999 3,090232
0,67
0,439913
0,87
1,126391 0,980 2,053749
0,68
0,467699
0,88
1,174987 0,981 2,074855
0,69
0,495850
0,89
1,226528 0,982 2,096927
uα
α
uα
Таблица П.5.
Критические значения распределения хи-квадрат
k – число степеней свободы
Уровень значимости α
k
0,99
0,98
0,95
0,90
0,80
0,20
0,10
0,05
0,02
0,01
0,001
1
0,00016
0,00063
0,00393
0,0158
0,0642
1,642
2,706
3,841
5,412
6,635
10,827
2
0,0201
0,0404
0,103
0,211
0,446
3,219
4,605
5,991
7,824
9,210
13,815
3
0,115
0,185
0,352
0,584
1,005
4,642
6,251
7,815
9,837
11,341
16,268
4
0,297
0,429
0,711
1,064
1,649
5,989
7,779
9,488
11,668
13,277
18,465
5
0,554
0,752
1,145
1,610
2,343
7,289
9,236
11,070
13,388
15,086
20,517
6
0,872
1,134
1,635
2,204
3,070
8,558
10,645
12,592
15,033
16,812
22,457
7
1,239
1,564
2,167
2,833
3,822
9,803
12,017
14,067
16,622
18,475
24,322
8
1,646
2,032
2,733
3,490
4,594
11,030
13,362
15,507
18,679
20,090
26,125
9
2,088
2,532
3,325
4,168
5,380
12,242
14,684
16,919
19,679
21,666
27,877
10
2,588
3,059
3,940
4,865
6,179
13,442
15,987
18,307
21,161
23,209
29,588
11
3,053
3,609
4,575
5,578
6,989
14,631
17,275
19,675
22,618
24,725
31,264
12
3,571
4,178
5,226
6,304
7,807
15,812
18,549
21,026
24,054
26,217
32,909
13
4,107
4,765
5,892
7,042
8,634
16,985
19,812
22,362
25,472
27,688
34,528
14
4,660
5,368
6,571
7,790
9,467
18,151
21,064
23,685
26,873
29,141
36,123
15
5,229
5,985
7,262
8,547
10,307
19,311
22,307
24,996
28,259
30,578
37,697
16
5,812
6,614
7,962
9,312
11,152
20,465
23,542
26,296
29,633
32,000
39,252
17
6,408
7,255
8,672
10,085
12,002
21,615
24,769
27,587
30,995
33,409
40,790
18
7,015
7,906
9,390
10,865
12,857
22,760
25,989
28,869
32,346
34,805
42,312
19
7,633
8,567
10,117
11,651
13,716
23,900
27,204
30,144
33,687
36,191
43,820
20
8,260
9,237
10,851
12,443
14,578
25,038
28,412
31,410
35,020
37,566
45,315
21
8,897
9,915
11,591
13,240
15,445
26,171
29,615
32,671
36,343
38,932
46,797
22
9,542
10,600
12,338
14,041
16,314
27,301
30,813
33,924
37,659
40,289
48,268
23
10,196
11,298
13,091
14,848
17,187
28,429
32,007
35,172
38,968
41,638
49,728
24
10,856
11,992
13,848
15,659
18,062
29,553
33,196
36,415
40,270
42,980
51,179
25
11,542
12,697
14,611
16,473
18,940
30,675
34,382
37,652
41,566
44,314
52,620
26
12,198
13,409
15,379
17,292
19,820
31,795
35,563
38,885
42,856
45,642
54,052
27
12,879
14,125
16,151
18,114
20,703
32,912
86,741
40,113
44,140
46,963
55,476
28
13,565
14,847
16,928
18,939
21,588
34,027
37,916
41,337
45,419
48,278
56,893
29
14,256
15,574
17,708
19,768
22,475
35,139
39,087
42,557
46,693
49,588
58,302
30
14,953
16,306
18,493
20,599
23,364
36,250
40,256
43,773
47,962
50,892
59,703