Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 3 Генеральные параметры и их выборочные оценки
На прошлой лекции говорилось, что выборочные характеристики (это
могут быть оценки генеральных параметров или частоты) являются оценками
соответствующих
характеристик
генеральной
совокупности
(Г.С.),
в
частности, оценками генеральных параметров, то есть, их приближенными
значениями. Точные характеристики Г.С. при выборочном исследовании
остаются неизвестными.
Например,
выборочное
значение
арифметического
среднего,
обозначаемое как Х , является оценкой генеральной средней М.
Х М.
Х -М =
, статистическая ошибка измерения.
Эти ошибки можно оценить по своим формулам для каждого параметра. Но
все они подчиняются общим закономерностям:
а) статистические ошибки уменьшаются при увеличении объема выборки и в
пределе стремятся к нулю, когда выборка по своей численности
приближается к Г.С.
То есть, при n выб
nг.с.
Ошибка репрезентативности или стандартная ошибка среднего -
Sх
Ошибка репрезентативности или стандартная ошибка стандартного
отклонения
Ss
Ошибка репрезентативности или стандартная ошибка дисперсии Ss2 Sd
Обязательным, наличие выборочной ошибки, которую содержат
данные выборочного исследования, - факт математический. Но за ним стоит
и соответствующее психологическое содержание, и важно обладать умением
его раскрыть.
Например:
Вы работаете в 7-м классе. Ваша выборка из n испытуемых, равное
числу школьников в классе. Пусть n = 35. Вы измеряете с помощью теста
Векслера коэффициент умственного развития (IQ). У вас 35 индивидуальных
значений. IQ X.
IQ = =
1
n
n
i 1
Х1.......Х2........Х35.
35
xi =
= 112. Само по себе это число мало что говорит, его
i1
нужно сопоставить с чем-то. С чем? Если вы хотите узнать, отличается ли IQ
от IQГ.С. , нужно взять из литературы IQГ.С. 115= IQГ.С.
112 и 115.
????
Это различие существенно или нет. Действительно ли IQ в вашем
классе достоверно существенно ниже, чем в Г.С. Или различие =3 в
пределах ошибки измерения.
Это задача 1-го типа - отличия наших выборочных данных от Г.С.
Отличие
может
оцениваться
не
только
по
параметру
среднего
арифметического, но и по стандартному отклонению, дисперсии, частотному
распределению, по исходным сырым значениям.
Другой вид статистических задач возникает при исследовательских
ситуациях, примером которых может быть следующее сравнительное
исследование.
Вы, как и в первом примере, проводили исследование и измеряли с
помощью теста Векслера коэффициент умственного развития IQ. Вы
работали в 7А классе. Ваши данные и
IQ
=120. А в 7А классе другой школы
работал ваш сокурсник. У него в выборке было 42 человека и он по
индивидуальным данным определил
IQ
= 112. Ваше выборочное среднее
выше. Но лежит ли это превышение в пределах ошибки измерения? Если да,
то различия несущественны. И ваши усредненные значения IQ, и значения
IQ, полученные в исследовании вашего коллеги, относятся к одной Г.С. Вы
оба имели дело с одной Г.С (семиклассники государственных средних школ)
без усиленной подготовки по естественно-научным дисциплинам. Две
выборки - из 35 и 42 человек- принадлежали к одной Г.С.
Но может быть и другой факт. Если индивидуальный разброс Q
IQ
невелик (дисперсия маловыраженная) , это различие двух
в 8 баллов
может оказаться существенным и тогда вы оба имели дело выборками из
разных Г.С. Это статистический факт, и он проверяется методами
математической статистики. Но за ним стоит некое содержание, требующее
уже
не
статистического,
а
содержательного,
в
нашем
случае,
психологического, анализа. Почему выборки разные? Или в одной шкое
слишком слабая подготовка, или в другой - слишком сильная.
За статистической гипотезой, ее проверкой, следует психологическая
гипотеза, ее проверка.
Задачи 3-го вида. Обратимся к данным (по IQ) в 1-м примере. Допустим,
среди значений, не слишком выделяющихся по сравнению со средним
IQ
=112, одно было очень низкое IQ=80, а одно - очень высокое IQ =148.
Принадлежат ли эти крайние значения к той Г.С., к которой
принадлежат остальные, или нет?
Если да, их можно оставить для дальнейшего анализа; если нет (не
принадлежат), их следует исключить.
Для решения перечисленных задач в математической статистике
применяются некие формальные процедуры проверки статистических
гипотез с помощью статистических критериев.
Статистические
гипотезы
делятся
на
два
типа:
нулевые
и
альтернативные (экспериментальные), направленные и ненаправленные.
Нулевые гипотезы (H0 - hypotesis ) - гипотезы об отсутствии различий
(различия = 0). В разных вариантах задач различия могут быть в
статистических параметрах ( среднее, дисперсия, стандартное отклонение,
коэффициент корреляции, распределения частот и др.). Могут быть различия
исходных данных.
Нулевая гипотеза в ходе проверки или опровергается и тогда различия
достоверны, или не опровергается, и тогда различий нет.
А альтернативная гипотеза (Н1) - это гипотеза о достоверности
различий.
Направленные и ненаправленные статистические гипотезы:
Направленные гипотезы:
Н0: Х1 Х2 (Х1 не превышает Х2 ). ).
Здесь Х1 и Х2 -
Н1: Х1 Х2 (Х1 превышает Х2
сравниваемые параметры.
Ненаправленные гипотезы:
Н0: Х1 не отличается от Х2
Н1: Х1 отличается от Х2
Чаще работают с ненаправленными гипотезами. Но если мы видим
четкую тенденцию, что в одной группе больше значение параметра, можем
работать с направленной гипотезой.
Статистические гипотезы проверяются с помощью статистических
критериев.
Статистический
критерий
-
это
решающе
правило,
обеспечивающее надежное принятие решения о статистической гипотезе, то
есть, ее принятие или отклонение с низкой вероятностью ошибки.
Статистическим критерием называют и метод расчета и само
полученное числовое значение критерия (сам полученный результат).
Допустим, мы используем критерий Стьюдента и в соответствии с
формулой его вычислений получим на своих эмпирических данных значение
критерия tэ tф Это много или это мало. Мы должны сравнить наше tэ с
неким граничным значением (критическим, табличным). Это значение
берется из таблицы. Но сначала для этого нужно вспомнить объем выборки
или связанное с ним число степеней свободы ( k df ) так как граничные
значения в таблице даются как функции df . Число степеней свободы равно
числу классов вариационного ряда (числу независимых переменных) минус
число условий, при которых он был сформирован (уравнения, связывающие
эти переменные). Зная число степеней свободы, а в разных критериях оно
вычисляется по-разному, мы можем определить граничные значения.
В большинстве критериев значения критерия
превышении
фактического
эмпирического
значения
.............. и при
над
граничным
(табличным) Н0 отвергается, то есть, различия признаются достоверными. Но
есть и исключения,
другие
критерии, работающие в противоположную
сторону - критерий знаков, Манна-Уитни, Т-критерий Вилкоксона.
Статистическое
решение
Принять Н0
Отвергнуть Н0
фактически
нет различий
правильное
решение
ошибка
1-го
рода
есть различия
ошибка
2-го
рода
правильное
решение
Ошибка 1-го рода -
ошибка 2-го рода -
невинный человек
настоящий преступник
признан преступником
признан невиновным
(ложная тревога)
? (пропуск цели)
Н0: подсудимый являлся невиновным
=5% - риск ошибки 1 рода, определяемый на языке вероятности ( =0,05)
то есть, когда фактически Н0 верна, а мы ее отвергли - ложная тревога. Н0 не
отврегают, если в результате исследования окажется, что вероятность
ошибочности оценки относительно правильно принятой гипотезы превышает
5%.
Критерии применяются для тех или ингых уровней значимости.
Уровень значимости - это вероятность ошибки 1-го рода, допускаемый при
оценке принятой гипотезы, то есть, вероятность того, что мы сочли различия
существенными, а они на самом деле случайны, то есть, фактически верна Н0,
а мы ее отклонили. В исследовательской практике принято работать с одним
из трех уровней значимости:
Ошибка в
1
случ. =0,05 (5%)
20
5% уровень значимости.
Ошибка в
1
случ. =0,01 (1%)
100
Ошибка в
1
случ. =0,001 (0, 01%)
1000
1% уровень значимости.
0,1% уровень значимости.
Когда мы говорим, что различия достоверны на 1% уровне
значимости, (р 0, 01), то имеется в виду, что вероятность того, что они всетаки недостоверны, составляет 1% ( =0,01).
Ошибка, состоящая в том, что мы отклонили в то время, как она
фактически верна, называется ошибкой 1-го рода.
Тогда вероятность правильного решения 1-
В психологии принято работать с двумя уровнями статистической
значимости:
5% ( 0,05)
1% ( 0,01)
В медицине иногда 0,1 ( 0,001)
Ошибка 2-го рода - принять Н0, если она фактически ошибочна.
Существует следующее правило отклонения Н0 и принятия Н1 (для
случая тех критериев, для
которых величина различий возрастает с
увеличением значения критерия (Стьюдента, Ван-дер Вардна? , Фишера, Х2 ).
Н0 зона
незначимости
Н1 зона
значимости
?
зона
неопределенности
Р=0,05
Здесь может
быть совершена
ошибка 1 рода
Ошибки:
мы говорим
различия есть
(сигнала и шума)
ошибка, ложная
тревога
Р=0,01
Здесь может
быть совершена
ошибка 2 рода
Мы ошибочно
говорим: различий
нет (сигнала и
шума)
пропуск цели
Если эмпирическое значение критерия равняется критическомцу значению Э,
соответственно р 0,05, или превышает его, Н0 отклоняется, по определению
принять Н1 мы еще не можем. Мы находимся в зоне неопределенности.
Если эмпирическое значение равняется критическому значению,
соответственно р 0,01 или превышает его,то принимается Н1. (Исключения
- критерий знаков, Т-критерий Вилкоксона, и Манна-Уитни).
Различают параметрические и непараметрические критерии.
Параметрические критерии
1.позволяют
прямо
оценить
различия в средних, полученных в
двух
выборках
(t-критерий
Стьюдента)
2.позволяют
прямо
оценить
различия в дисперсии (критерий
Фишера)
3.позволяет выявить тенденции
изменения признака при переходе от
условия (градации) фактора к
условию
(однофакторный
дисперсионный анализ)
4.позволяет оценить взаимодействие
2-х и более факторов (2-хфакторный
дисперсионный анализ ANOVA
5.Экспериментальные
данные
должны отвечать 2-м, иногда 3-м
условиям:
а) Значения признаков измерены по
интервальной шкале
б) распределение признака является
нормальным
6.Сложные расчеты
непараметрические критерии
позволяют оценить лишь средние
тенденции о частоте встречаемости
в одной выборке более высоких .....
более низких значений (Q , U, )
позволяют оценить лишь различия в
диапазонах вариативности признака
(критерий )
позволяет
выявить
тенденции
изменения признака при переходе от
градации к градации при любом
распределении признака (критерии
тенденций L и S)
эти возможности отсутствуют
экспериментальные данные могут
не отвечать ни одному из условий:
а) признак может быть измерен в
шкале,
начиная
от
шкалы
наименований
б) может быть любое распределение
признака
математические расчеты несложны
(кроме Х2 и Х)
7.Если условия 5 соблюдаются, Если условия п.5 не выполняются,
параметрические критерии более непараметрические
критерии
мощные
оказываются более мощными.