Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 5
Метод статистической
выборки и его приложения
План
1.
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
2.
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
3.
ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ
4.
ЭМПИРИЧЕСКИЙ КОЭФФИЦИЕНТ
ДЕТЕРМИНАЦИИ
Проверка статистических гипотез
Статистическая гипотеза – любое
предположение о значениях или свойствах
характеристик, а также предположение о
виде закона распределения
Схема проверки статистической
гипотезы
1.
2.
3.
4.
5.
Формулируется основная гипотеза 𝐻0
Выдвигаются одна или несколько конкурирующих
гипотез 𝐻1 , 𝐻2 , …
Вычисляется значение статистического параметра
по данным выборки
Определяется критическое значение
статистического параметра
Сравниваются наблюдаемое и критическое
значения параметра
Задача 1
Гипотеза
о равенстве генерального среднего 𝑥
заранее определенному числовому значению 𝑎
𝜃=
𝑥−𝑎 ∙ 𝑛−1
𝑠
> 𝜃1−𝛼; 𝑛−1
В соответствии с технической документацией заводаизготовителя автомобилей расход топлива составляет
11,5 литров на 100 километров. При проверке 15 автомобилей
партии получены следующие статистические данные.
Проверить гипотезу о соответствии автомобилей технической
документации.
Задача 2
Гипотеза
о равенстве двух генеральных средних
𝑥1 и 𝑥2 выборок из одной генеральной совокупности
𝜃=
𝑑∙ 𝑛
𝑠𝑑
> 𝜃1−𝛼; 𝑛−1
Для подтверждения результатов эксперимента было проведено
повторное исследование расхода топлива. На уровне значимости 0,05
проверить гипотезу о несущественности отличия оценок генеральной
средней, если в ходе второго опыта получен следующий ряд: 10,8; 10,8;
10,6; 11,4; 10,6; 11; 12,2; 12,2; 10,6; 12,2; 12; 10,7; 12,2; 11,5; 10,9
Задача 3
Гипотеза
о равенстве двух генеральных средних
𝑥 и 𝑦 выборок из разных генеральных совокупностей
𝑥−𝑦
𝜃=
>𝜃
1−𝛼; 𝑛1 +𝑛2 −2
2
2
𝑥𝑖 −𝑥 + 𝑦𝑗 −y
𝑛1 +𝑛2 −2
∙
1
1
+
𝑛1 𝑛2
При исследовании уровня заработной платы
работников одной сферы в двух регионах получены
следующие данные. проверить гипотезу об
одинаковом уровне дохода работников сферы в этих
двух регионах.
Задача 4
Гипотеза
о равенстве генеральных средних величин
нескольких (более двух) выборок, каждая из которых
имеет одинаковый объем
Критерий согласия Пирсона 𝜒
𝑚
2
𝜒набл
=
𝑖=1
𝑛𝑖 − 𝑛𝑝𝑖
𝑛𝑝𝑖
2
2
где 𝑚 – число интервалов эмпирического распределения,
𝑛 – число значений эмпирического распределения,
𝑛𝑖 –наблюдаемая частота 𝑖 − го интервала,
𝑝𝑖 – теоретическая вероятность того, что случайная
величина примет значение из 𝑖 − го интервала
2
2
𝜒крит
= 𝜒𝛼;𝑚−𝑟−1
𝑟 – число
параметров
выбранного закона
распределения
𝛼 – уровень
значимости
2
2
𝜒набл
< 𝜒крит
ХИ2.ОБР.ПХ(𝛼; 𝑚 − 𝑟 − 1)
Вероятность того, что случайная величина
примет значения из интервала 𝑥𝑖 ; 𝑥𝑖+1 , равна
𝑝𝑖 = 𝐹 𝑥𝑖+1 − 𝐹 𝑥𝑖
Для нормального распределения
1 1
𝑥−𝑥
𝐹 𝑥 = + Φ
2 2
𝜎
Φ 𝑥 – функция Лапласа
(НОРМ.СТ.РАСП(нормализованные значения признака;1)-0,5)*2
Однофакторный дисперсионный
анализ
Дисперсионный анализ – статистический
метод, направленный на выявление
существенности влияния одного или
нескольких факторов на изучаемый
признак
j
1
2
…
n
…
Эксперимент n
𝑥𝑗
i
Эксперимент 1 Эксперимент 2
𝐹𝑖
1
Уровень фактора 1
𝑥11
𝑥12
𝑥1𝑛
2
Уровень фактора 2
𝑥21
𝑥22
𝑥2𝑛
…
…
m
Уровень фактора m
𝑥𝑚1
𝑥𝑚2
𝑥𝑚𝑛
Этапы дисперсионного анализа
1. Вычисляются частные средние:
𝑥𝑖 =
𝑛
𝑗=1 𝑥𝑖𝑗
𝑛
2. Определяется общая средняя вариант:
𝑥общ =
𝑚
𝑖=1 𝑥𝑖
𝑚
3. Вычисляются частные (внутригрупповые)
дисперсии:
2
𝜎𝑖
=
𝑛
𝑗=1
𝑥𝑖𝑗 − 𝑥𝑖
𝑛
2
4. Определяется средняя внутригрупповая
дисперсия:
𝜎2 =
𝑚
2
𝑖=1 𝜎𝑖
𝑚
5. Вычисляется межгрупповая дисперсия:
𝛿2 =
𝑚
𝑖=1
𝑥𝑖 − 𝑥общ
𝑚
2
6. Определяется значение статистики:
𝑚 ∙ 𝑛 − 1 ∙ 𝛿2
𝐹=
𝑚 − 1 ∙ 𝜎2
7. Определяется критическое значения
критерия Фишера-Снедекор:
𝐹 > 𝐹𝛼; 𝑚−1; 𝑚𝑛−𝑚
F.ОБР(1- 𝛼; первый_параметр; второй_параметр)
Правило сложения дисперсий
Общая дисперсия равна сумме
средней из внутригрупповых и
межгрупповой дисперсии
2
𝜎
=
2
𝜎
+
2
𝛿
Внутригрупповая (частная) дисперсия 𝜎𝑖2
характеризует ту часть вариации, которая
обусловлена влиянием неучтенных факторов
Межгрупповая дисперсия 𝛿 2 определяет
систематическую вариацию результативного
признака, обусловленную влиянием группировочного
признака
Общая дисперсия 𝜎 2 характеризует вариацию
результативного признака под воздействием всех
факторов
Методика использования правила
сложения дисперсий
1. Вычисляются частные средние:
𝑥𝑖 =
𝑛
𝑗=1 𝑥𝑖𝑗 𝑛𝑖𝑗
𝑛
𝑗=1 𝑛𝑖𝑗
2. Определяется общая средняя
арифметическая вариант:
𝑥общ =
𝑚
𝑖=1 𝑥𝑖 𝑛𝑖
𝑚
𝑖=1 𝑛𝑖
3. Вычисляются частные (внутригрупповые)
дисперсии:
2
𝜎𝑖
=
𝑛
𝑗=1
2
𝑥𝑖𝑗 − 𝑥𝑖 𝑛𝑖𝑗
𝑛
𝑗=1 𝑛𝑖𝑗
4. Определяется средняя внутригрупповая
дисперсия:
𝜎2 =
𝑚
2
𝜎
𝑖=1 𝑖 𝑛𝑖
𝑚
𝑖=1 𝑛𝑖
5. Вычисляется межгрупповая дисперсия:
2
𝛿 =
𝑚
𝑖=1
𝑥𝑖 − 𝑥общ
𝑚
𝑖=1 𝑛𝑖
2
∙ 𝑛𝑖
6. Находится общая дисперсия:
2
𝜎 =
𝜎2
+𝛿
2
Полученный
результат
целесообразно
проверить, вычислив общую дисперсию по
формуле:
𝜎2 =
𝑚
𝑖=1
2
𝑛
𝑗=1 𝑥𝑖𝑗 − 𝑥общ
𝑚
𝑛
𝑖=1 𝑗=1 𝑛𝑖𝑗
∙ 𝑛𝑖𝑗
Эмпирический коэффициент
детерминации
Эмпирический коэффициент
2
детерминации 𝜂 – доля межгрупповой
дисперсии в общей дисперсии
результативного признака
2
𝛿
2
𝜂 = 2
𝜎
Эмпирическое корреляционное
отношение 𝜂 – корень квадратный из
эмпирического коэффициента
детерминации
𝜂=
2
𝛿
𝜎2
Таблица Чеддока
η
Теснота
связи
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9→1
Слабая
Умеренная Заметная
Тесная
Очень
тесная
Проверка на значимость
2
𝜂 𝑛−𝑚
>
𝐹
𝛼;𝑚−1;𝑛−𝑚
2
1−𝜂 𝑚−1
где 𝐹𝛼;𝑚−1;𝑛−𝑚 – функция Фишера-Снедекора