Справочник от Автор24
Поделись лекцией за скидку на Автор24

Статистическая гипотеза

  • 👀 224 просмотра
  • 📌 196 загрузок
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Статистическая гипотеза» pdf
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Лекция 11 СТАТИСТИЧЕСКАЯ ГИПОТЕЗА Статистическая гипотеза – любое предположение о свойствах и характеристиках исследуемых генеральных совокупностей, которое может быть проверено на основе анализа выборок. В ходе проверки гипотезы делается один из следующих выводов: 1) рассматриваемая гипотеза не верна, следует ее отклонить; 2) можно принять рассматриваемую гипотезу, т.к. нет причин ее отклонить. 2 ГИПОТЕЗЫ H0 Проверяемая гипотеза в статистике называется основной или нулевой гипотезой. H1 Противоречащая ей гипотеза называется альтернативной. В результате проверки имеется две возможности: 1. Принять основную гипотезу H0, отклонив при этом альтернативную гипотезу H1 2. Отклонить основную гипотезу H0 и принять альтернативную гипотезу H1 3 ПРИМЕРЫ ПРИМЕР 1 ПРИМЕР 2 ПРИМЕР 3 Изменится ли успеваемость студентов по языку из-за перевода в онлайн-формат? Вырастет ли узнаваемость кандидата после предвыборной кампании? Снизился ли доля курящих после коммуникативной кампании? Средний балл - 80 Узнаваемость 20% Доля курящих 25% ГИПОТЕЗЫ H0: μ = 80 H1: μ ≠ 80 H0: р ≤ 20% H1: р > 20% H0: р ≥ 25% H1: р < 25% Двусторонний критерий Правосторонний критерий Левосторонний критерий 4 ОШИБКИ Основная гипотеза верна Основная гипотеза неверна Мы приняли основную гипотезу Верное решение Ошибка II рода Мы отклонили основную гипотезу Ошибка I рода Верное решение Ошибка первого рода происходит в случае, когда мы отвергаем нулевую гипотезу, если она верна. Ошибка второго рода происходит, если мы принимаем нулевую гипотезу, когда она неверна. 5 УРОВЕНЬ ЗНАЧИМОСТИ Уровень значимости гипотезы (α) – вероятность совершить ошибку первого рода, то есть принять гипотезу Н0, когда она неверна. Пример α = 0,05 существует вероятность 5% отвергнуть истинную нулевую гипотезу. 6 СТАТИСТИКА Статистика или статистический критерий – специальная функция от элементов выборки, по значениям которой принимают решение о принятии или отклонении основной гипотезы. Область принятия гипотезы Критическая область Значение статистики попало в зеленую зону – принимаем H0 Критические значения Критическая область Возможные значения статистики 7 КРИТИЧЕСКАЯ ОБЛАСТЬ Критическая область Область принятия гипотезы Критические значения Критическая область Возможные значения статистики Область принятия гипотезы – множество значений статистики, при которых основную гипотезу следует принять. Критическая область – множество значений статистики, при которых основную гипотезу следует отклонить. Критические значения отделяют критическую область от области принятия гипотезы. 8 ПРИМЕРЫ ПРИМЕР 1 ПРИМЕР 2 ПРИМЕР 3 Изменится ли успеваемость студентов по языку из-за перевода в онлайн-формат? Вырастет ли узнаваемость кандидата после предвыборной кампании? Снизился ли доля курящих после коммуникативной кампании? Средний балл - 80 Узнаваемость 20% Доля курящих 25% ГИПОТЕЗЫ H0: μ = 80 H1: μ ≠ 80 H0: р ≤ 20% H1: р > 20% H0: р ≥ 25% H1: р < 25% Двусторонняя Правосторонняя Левосторонняя 9 ЭТАПЫ ПРОВЕРКИ ГИПОТЕЗЫ 1. Сформулировать основную и альтернативную гипотезы. 2. Задать уровень значимости α. 3. По таблице найти критические значения и построить критическую область. 4. По выборке посчитать значение статистики. 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять. 6. Сделать вывод 10 ВОЗМОЖНЫЕ ГИПОТЕЗЫ О СРЕДНЕМ σ известно или n ≥ 30 О ДОЛЕ О ДИСПЕРСИИ σ неизвестно и n≤30 11 ГИПОТЕЗЫ О СРЕДНЕМ σ известно или n ≥ 30 12 РЕШЕНИЕ В качестве статистики используется следующая случайная функция: гипотетическое генеральное среднее 𝑥 − 𝜇𝑜 𝑧= 𝜎/ 𝑛 Если σ неизвестна, используем s. Эта величина имеет стандартное нормальное распределение. Для нахождения критических значений пользуемся таблицами функции нормального распределения. 13 РЕШЕНИЕ Рассмотрим три варианта: 1 𝛼/2 2 3 H 0 : μ = μ0 H 1 : μ ≠ μ0 H0 : μ ≤ μ0 H1: μ > μ0 H 0 : μ ≥ μ0 H 1 : μ < μ0 Двусторонняя Правосторонняя Левосторонняя 1−𝛼 −𝑧𝛼Τ2 𝛼/2 +𝑧𝛼Τ2 1−𝛼 +𝑧𝛼 𝛼 𝛼 1−𝛼 −𝑧𝛼 14 РЕШЕНИЕ: ПРАВОСТОРОННЯЯ КРИТИЧЕСКАЯ ОБЛАСТЬ 2 1. H 0 : μ ≤ μ0 H 1 : μ > μ0 Правосторонняя Сформулировать основную и альтернативную гипотезы. 2. Задать уровень значимости α. 𝛼 = 0.05 3. По таблице найти критические значения и построить критическую область. 4. По выборке посчитать значение статистики. 𝑧 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять. 1−𝛼 𝛼 𝑧 < 𝑧𝛼 принимаем H0 𝑧 > 𝑧𝛼 отвергаем H0 +𝑧𝛼 15 НАХОДИМ Z𝛼 1−𝛼 𝛼 +𝑧𝛼 Если α=0.05, то площадь слева от z𝛼 равна 0.95. Ищем 0.95 в таблице и смотрим, чему равно z𝛼. z𝛼 =1.65 16 РЕШЕНИЕ: ЛЕВОСТОРОННЯЯ КРИТИЧЕСКАЯ ОБЛАСТЬ 3 H 0 : μ ≥ μ0 H 1 : μ < μ0 Левосторонняя 1. Сформулировать основную и альтернативную гипотезы. 2. Задать уровень значимости α. 𝛼 = 0.05 3. По таблице найти критические значения и построить критическую область. 4. По выборке посчитать значение статистики. 𝑧 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять. 𝛼 1−𝛼 𝑧 > 𝑧𝛼 принимаем H0 𝑧 < 𝑧𝛼 отвергаем H0 −𝑧𝛼 17 НАХОДИМ Z𝛼 𝛼 1−𝛼 −𝑧𝛼 Помня о свойстве симметрии, находим z𝛼. –zα равен z𝛼 с отрицательным знаком, то есть -1.65 18 РЕШЕНИЕ: ДВУСТОРОННЯЯ КРИТИЧЕСКАЯ ОБЛАСТЬ Рассмотрим три варианта: 1. 1 H 0 : μ = μ0 H 1 : μ ≠ μ0 Сформулировать основную и альтернативную гипотезы. 2. Задать уровень значимости α. Двусторонняя 𝛼 = 0.05 3. По таблице найти критические значения и построить критическую область. 4. По выборке посчитать значение статистики. 𝑧 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять. 𝛼/2 1−𝛼 −𝑧𝛼Τ2 𝛼/2 −𝑧𝛼/2 < 𝑧 < +𝑧𝛼/2 𝑧 > +𝑧𝛼 ИЛИ +𝑧𝛼Τ2 𝑧 < −𝑧𝛼/2 принимаем H0 отвергаем H0 19 НАХОДИМ Z𝛼/2 𝛼/2 1−𝛼 −𝑧𝛼Τ2 𝛼/2 +𝑧𝛼Τ2 Если α=0.05, то α/2=0.025, значит площадь слева от z𝛼/2 равна 0.975. Ищем 0.975 в таблице и смотрим, чему равно z𝛼/2. z𝛼/2 =1.96 Значит -z𝛼/2 =-1.96 20 ПРИМЕР В одном исследовании утверждается, что студенты в среднем меньше смотрят телевизор. Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со стандартным отклонением 2 часа. Случайная выборка из 35 студентов имеет среднее 27 часов. Необходимо проверить утверждение на уровне значимости α = 0,01. Сформулировать основную и альтернативную гипотезы. H 0 : μ ≥ μ0 H 1 : μ < μ0 H0: μ ≥ 29.4 H1: μ < 29.4 Задать уровень значимости α. По условию дано α = 0,01. По таблице найти критические значения и построить критическую область. Помня о свойстве симметрии, находим z𝛼. –zα = -2.33 𝛼 1−𝛼 −𝑧𝛼 21 ПРИМЕР В одном исследовании утверждается, что студенты в среднем меньше смотрят телевизор. Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со стандартным отклонением 2 часа. Случайная выборка из 35 студентов имеет среднее 27 часов. Необходимо проверить утверждение на уровне значимости α = 0,01. По выборке посчитать значение статистики. 𝑥 − 𝜇𝑜 27 − 29.4 𝑧= = = −7.1 𝜎/ 𝑛 2/ 35 Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять. 1−𝛼 𝑧 = −7 −𝑧𝛼 = −2,33 Сделать вывод Значение z=-7 попадает в критическую область. Значит, отклоняем нулевую гипотезу о том, что студенты смотрят телевизор не меньше, чем все люди в среднем. Принимаем альтернативную гипотезу о том, что студенты смотрят телевизор меньше других. 22 ГИПОТЕЗЫ О СРЕДНЕМ σ неизвестно или n < 30 23 РЕШЕНИЕ В качестве статистики используется следующая случайная функция: 𝑥 − 𝜇𝑜 𝑡= 𝑠/ 𝑛 Эта величина имеет t-распределение с числом степеней свободы df = n – 1. Для нахождения критических значений пользуемся таблицами t-распределения. 24 РЕШЕНИЕ Также имеется три варианта: 1 𝛼/2 2 3 H 0 : μ = μ0 H 1 : μ ≠ μ0 H0 : μ ≤ μ0 H1: μ > μ0 H 0 : μ ≥ μ0 H 1 : μ < μ0 Двусторонняя Правосторонняя Левосторонняя 1−𝛼 −𝑡𝛼Τ2 𝛼/2 +𝑡𝛼Τ2 1−𝛼 +𝑡𝛼 𝛼 𝛼 1−𝛼 −𝑡𝛼 25 ПРИМЕР В исследовании, проведенном среди студентов МГИМО, утверждается, что студенты МЖ читают больше книг в сравнении с другими. Среднее количество книг, прочитанных студентами за год, составило 15. Опрос среди 25 студентов МЖ показал, что они читают, в среднем, 16 книг в год, стандартное отклонение равно 2. Справедливо ли утверждение на уровне значимости α = 0,01? Сформулировать основную и альтернативную гипотезы. H 0 : μ ≤ μ0 H 1 : μ > μ0 H0: μ ≤ 15 H1: μ > 15 Задать уровень значимости α. По условию дано α = 0,01. По таблице найти критические значения и построить критическую область. 1−𝛼 +𝑡𝛼 𝛼 26 Найдем t По условию дано α = 0,01. df=n-1=25-1=24 На пересечении ищем t t=2.797 27 ПРИМЕР В исследовании, проведенном среди студентов МГИМО, утверждается, что студенты МЖ читают больше книг в сравнении с другими. Среднее количество книг, прочитанных студентами за год, составило 15. Опрос среди 25 студентов МЖ показал, что они читают, в среднем, 16 книг в год, стандартное отклонение равно 2. Справедливо ли утверждение на уровне значимости α = 0,01? 𝑥 − 𝜇𝑜 16 − 15 𝑡= = = 2.5 𝑠/ 𝑛 2/ 25 𝛼 = 0.01 Значение 𝑡=2.5 не попадает в критическую область. Значит, принимаем нулевую гипотезу о том, что студенты МЖ читают не больше книг, чем студенты в среднем. 𝑡 = 2.5 +𝑡𝛼 = 2.797 28 ГИПОТЕЗА О ДОЛЕ 29 РЕШЕНИЕ Также имеется три варианта: 1 𝛼/2 2 3 H0: p = p0 H 1 : p ≠ p0 H 0 : p ≤ p0 H 1 : p > p0 H0: p ≥ p0 H1: p < p0 Двусторонняя Правосторонняя Левосторонняя 1−𝛼 −𝑧𝛼Τ2 𝛼/2 +𝑧𝛼Τ2 1−𝛼 +𝑧𝛼 𝛼 𝛼 1−𝛼 −𝑧𝛼 30 РЕШЕНИЕ В качестве статистики используется следующая случайная функция: доля признака в выборке 𝑧= 𝑝ො − 𝑝 𝑝𝑞/𝑛 доля признака в ГС Или: 𝑚 − 𝑛𝑝 𝑧= 𝑛𝑝𝑞 Условие: np ≥ 5 и nq ≥ 5 31 ПРИМЕР Кандидат в мэры утверждает, что его поддерживает не менее половины горожан. Исследовательская компания провела опрос и выяснила, что из 500 опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что кандидат преувеличивает? Проверьте на уровне значимости 1%. Сформулируем основную и альтернативную гипотезы H0: p ≥ p0 H 1 : p < p0 Задаем уровень значимости: 𝛼 = 0.01 Найдем критическое значение и построим критическую область. 32 НАХОДИМ Z𝛼 𝛼 1−𝛼 −𝑧𝛼 Помня о свойстве симметрии, находим z𝛼. –zα равен z𝛼 с отрицательным знаком, то есть -2.33 33 ПРИМЕР Кандидат в мэры утверждает, что его поддерживает не менее половины горожан. Исследовательская компания провела опрос и выяснила, что из 500 опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что кандидат преувеличивает? Проверьте на уровне значимости 1%. Сформулируем основную и альтернативную гипотезы H0: p ≥ p0 H 1 : p < p0 Задаем уровень значимости: 𝛼 = 0.01 Найдем критическое значение и построим критическую область. -2.33 34 ПРИМЕР Кандидат в мэры утверждает, что его поддерживает не менее половины горожан. Исследовательская компания провела опрос и выяснила, что из 500 опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что кандидат преувеличивает? Проверьте на уровне значимости 1%. Найдем критическое значение и построим критическую область. -2.33 По выборке вычисляем значение статистики 𝑧= 𝑝Ƹ − 𝑝 𝑝𝑞/𝑛 = 0.48 − 0.5 −0.02 = = −0.91 0.5 ∗ 0.5/500 0.022 35 ПРИМЕР Кандидат в мэры утверждает, что его поддерживает не менее половины горожан. Исследовательская компания провела опрос и выяснила, что из 500 опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что кандидат преувеличивает? Проверьте на уровне значимости 1%. Значение статистики – 0.91 не попадает в критическую область. -2.33 -0.91 По выборке вычисляем значение статистики 𝑧= 𝑝Ƹ − 𝑝 𝑝𝑞/𝑛 = 0.48 − 0.5 −0.02 = = −0.91 0.5 ∗ 0.5/500 0.022 36 ПРИМЕР Кандидат в мэры утверждает, что его поддерживает не менее половины горожан. Исследовательская компания провела опрос и выяснила, что из 500 опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что кандидат преувеличивает? Проверьте на уровне значимости 1%. Значение статистики – 0.91 не попадает в критическую область. -2.33 -0.91 Вывод: значение статистики попадает в область принятия гипотезы, значит, принимаем нулевую гипотезу о том, что кандидата поддерживает не менее половины горожан. Кандидат не преувеличивает. 37
«Статистическая гипотеза» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач

Тебе могут подойти лекции

Смотреть все 938 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot