Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 5. Параметрические и непараметрические критерии
В
математической
статистике
применяются
процедуры
проверки
статистических гипотез с помощью статистических критериев.
Критерии бывают:
1. Параметрические критерии – позволяют оценить РАЗЛИЧИЯ по
какому-либо из параметров (среднее арифметическое, дисперсия), являются
трудоемкими, так как вычисляются на
количественных
данных,
измеряются на интервальной шкале или шкале отношений, используют
свойства нормального распределения. Параметрические критерии –
более точные, чем непараметрические!!!!!
2.
Непараметрические критерии - позволяют оценить различия в
РАНГАХ, ЧАСТОТНЫХ РАСПРЕДЕЛЕНИЯХ, ЗНАКАХ РАЗЛИЧИЙ!!!
Они менее сложные, более универсальные, поэтому данные могут быть
измерены в любой шкале и возможно любое распределение признаков по
частоте.
ПАРАМЕТРИЧЕСКИЙ t –критерий Стьюдента
- является параметрическим критерием РАЗЛИЧИЯ, служит для
проверки гипотезы о ДОСТОВЕРНОСТИ ИЛИ НЕДОСТОВЕРНОСТИ
РАЗЛИЧИЯ между двумя выборочными СРЕДНИМИ ЗНАЧЕНИЯМИ.
Обычно он изучается в двух вариантах - когда сравниваемые выборки были
независимы
(не связаны) и когда они
зависимы
(связаны), т.е.
состоят из попарно связанных вариант.
Рассмотрим вариант применения критерия Стьюдента для
независимых выборок. В этом случае применяется формула:
1. Формула для независимых выборок (две выборки).
t=
x y
x y
=
S y2 S y2
S y2
2
x
S
nx n y
x y
=
при nx= ny = n
Dx D y
nx
ny
Число степеней свободы определяется по формуле:
df= nx + ny - 2
2. Формула для ЗАВИСИМЫХ (связанных) выборок,
сравниваются данные, полученные в одной группе.
когда
Рассмотрим пример для зависимых (связанных выборок):
а) Для зависимых выборок:
t=
t=
x y
S x y
S x y
;
d
i
n d ( d i ) 2
2
i
(
i
)
2
n( n 1)
df = n - 1; где n - число пар
;
n 1
Задача для зависимых выборок
(два среза полученных на одной группе).
x y
S x y
В одном классе дважды определялась способность определять
эмоциональное
состояние
эмоциональной
экспрессией.
испытуемых.
по
фотоизображению
В
исследовании
лиц
приняли
с
различной
участие
10
оценивалась их средняя способность определить состояние
человека по набору фотографий. Определить достоверность различия средних
значений, полученных в обоих исследованиях.
X: 36,40,44,41,38,36,40,45,43,38
Y: 44,36,40,37,35,35,39,40,44,36
Сразу смотрим!!! Так как в исследовании приняли участие две группы
испытуемых, и в каждой было по 10 испытуемых, то степень свободы
9
соответственно будет: df = n – 1=10-1=
Степень свободы необходима для поиска в таблице граничных
значений на 5% и 1% уровне значимости для критерия Стьюдента!
Для удобства решения расписываем формулу для зависимых выборок в
таблицу!!!!!
№
xi
1.
36
2.
40
3.
44
4.
41
5.
38
6.
36
7.
40
8.
45
9.
43
10. 38
401
среднее 40,1
yi
44
36
40
37
35
35
39
40
44
36
386
38,6
Di
-8
4
4
4
3
1
1
5
-1
2
15
d=1,5
di - d
-9,5
2,5
2,5
2,5
1,5
0,5
0,5
3,5
-2,5
0,5
(di - d)2
90,25
6,25
6,25
6,25
2,25
0,25
0,25
12,25
6,25
0,25
130,5
Находим:
1. Сумму и среднее арифметическое Х и Y;
2. Di – это разность (Х-Y)!!!!! Поэтому вычитаем из значения Х – Y, то
есть: 36-44=-8 40-36=4 и тд.
3. Затем di – d, то есть -8-1,5=-9 4-1,5=2,5 и тд.
4. Далее полученную разность di – d возводим в квадрат:
-9,5*-9,5=90,25
2,25*2,25=6,25 и тд.
5. Находим сумму (di - d)2= 130,5
Теперь подставляем данные в формулу и находим tфактическое!!!
tф=
d
(di d )
n(n 1)
2
=
1,5
= 1,25 это и есть t фактическое!!!
130,5
90
В таблице граничных значений t критерия Стьюдента ищем df =9
Так для df =9
t
граничное на 5% уровне значимости =2,26 и t
граничное на 1% уровне значимости =3,25
Н0
Н1
1,25
2,26
3,25
Статистический вывод: Поскольку tф =1,25 , что меньше t граничного
значения на 5% уровне значимости, то принимается нулевая гипотеза Hо,
согласно которой нет статистически достоверных различий между двумя
средними выборочными значениями x =40,1 и Y=38,6 в одной группе.
Психологический вывод: Поскольку принимается гипотеза Но, то не
существует достоверных различий средних выборочных значений
импрессивной способности за время, прошедшее между исследованиями в
одной группе.
Пример 2. Решить ту же задачу исходя из предположения, что
данные в таблице получены для независимых выборок.
Находим:
1. Сумму и среднее арифметическое x и среднее Y;
2.
Затем находим дисперсию D
Расчет дисперсий дает Dх = 10.1 и Dy=11.6.
Значение фактического критерия t =1.25, что меньше
граничного значения на 5% уровне, равного 2.26, поэтому
принимается нулевая гипотеза Но.
Итак, первоначально рассмотрим пример, исходя из предположения, что
обследовались 2 различные группы, т. е. случай несвязанных выборок.
Необходимо определить, достоверны ли различия выборочных средних в двух
группах, принять или опровергнуть. Ho таким образом, согласно условию, nx =
10 и ny = 10, df = nx + ny − 2 = 18 Расчеты показывают, что x =40.1; y = 38,6; Dx
= 10,1; Dy = 11,6:
40,1 38,6
1,02 , это фактическое значение критерия,
10,1 11,6
Dx D y
nx
ny
10
равное 1,02 при граничных значениях, равных, соответственно tгр. (5%) = 2,10
и tгр. (1%) = 2,88 (см. рис. 12) приводит к принятию нулевой гипотезы.
t=
x y
=
Н1 ―наличие
различий
H0 — отсутствие
различий
tф = 1,02
tгр.(5%) = 2,10
tгр.(1%) = 2,88
|t|
Рис. 12
Cтатистический вывод: поскольку фактическое значение критерия,
равное 1,02, меньше граничного значения критерия на 5% уровне значимости,
равного 2,10, то принимается нулевая гипотеза H0, согласно которой нет
статистически достоверных различий между двумя средними выборочными
значениями x = 40,1 и y =38,6.
Психологический вывод: поскольку принимается нулевая гипотеза, не
существует достоверных различий средних выборочных значений
импрессивной способности в обеих группах.
Вопрос? Почему не выявили различий??????
Ответ: выборка МАЛА и не отражает генеральную савокупность!!!!!
2. Оценка достоверности различий выборочной средней и генеральной
средней.
В некоторых случаях значение генеральной средней известно, например, оно
получено в процессе стандартизации психодиагностического теста с помощью
большой по объему выборки стандартизации. В ходе проведения выборочного
исследования с помощью этого теста может возникнуть проблема сравнения
генерального параметра и выборочной оценки х.
К примеру,
в тесте, измеряющем уровень умственного развития Векслера,
значение генерального среднего =100. Допустим, на выборке в 25 человек получено
выборочное среднее x =115 и стандартное отклонение s=15. Достоверно ли отличие
генерального среднего и выборочного? С помощью критерия Стьюдента можно
ответить на этот вопрос.
Для этой цели используется формула:
t
15
x 115 100
=
= 15
= 5,00
15
3
Sx
25
Н0
df=n-1
Н1
2,06
2,80
3. Проверка сомнительных переменных.
Другая задача - о принадлежности переменной к совокупности, когда в
эмпирических данных обращает на себя внимание значения переменных, очень
сильно отклоняющихся от средних. Рассмотрим на примере как это делается.
Допустим, имеем выборку всего из 5 вариант, сведенных в таблицу.
В таблице дано число подтягиваний на перекладине, которое смогли сделать
студенты 2 курса физкультурного института.
№
1
2
3
4
5
xi
21
17
6
24
18
Сомнение вызывает x3=6. Возможно, что это не спортсмен, а представитель другой
генеральной совокупности?
x =17,2 ; S'=6,8.
Для того, чтобы проверить Н0, нужно рассчитать величину
Z = xi - xcр/ и сравнить Zф с граничным значением Z (это т.1) (Лакин с. 341
U0,05=1,96).
Z0,01=2,58 и Zф= 6 -17,2 / 6,8 =1,64 < Z0,05=1,96
Значит, различия малы и Но подтверждается.
Поэтому варианту х3 нельзя отбросить как принадлежащую другой выборке.
Существуют и непараметрические критерии проверки сомнительных вариант.
На практическом занятии я дам упрощенный способ проверки, без расчета .