Справочник от Автор24
Поделись лекцией за скидку на Автор24

Построение нулевой гипотезы; t- критерий Стьюдента

  • 👀 829 просмотров
  • 📌 797 загрузок
Выбери формат для чтения
Статья: Построение нулевой гипотезы; t- критерий Стьюдента
Найди решение своей задачи среди 1 000 000 ответов
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Построение нулевой гипотезы; t- критерий Стьюдента» doc
ЛЕКЦИЯ по дисциплине эконометрика Тема . Методы регрессионного анализа Занятие 3. Проверка гипотез 1. . Содержание Введение. Учебные вопросы: 1. Понятие статистической гипотезы. 2. t- критерий Стьюдента. 3. Доверительные интервалы для коэффициентов регрессии. 4. F- тест на качество оценивания. Заключение. Литература 1. Доугерти К. Введение в эконометрику. – М: ИНФРА, 1997, с.89-114. 2. Кремер Н.Ш. Эконометрика. Текст лекции Введение. Мы научились, используя статистические данные строить по МНК уравнение линейной регрессии. Далее встает вопрос верификации модели. Например, мы получили ненулевую оценку коэффициента регрессии. Случаен или нет этот результат? Оцениванию значимости как уравнения регрессии в целом, так и отдельных его параметров посвящена данная лекция. 1. Построение нулевой гипотезы. t- критерий Стьюдента. Рассмотрим следующий пример. Можно считать, что темпы общей инфляции (р) зависят от темпа инфляции, вызванной ростом заработной платы (w): , где u – случайный член. Можно построить гипотезу о том, что без учета эффектов, вносимых случайным членом, общая инфляция равна инфляции, определенной ростом заработной платы. Гипотеза, которую мы собираемся проверить, считается нулевой и обозначается Н0: Мы также определяем альтернативную гипотезу Н1, которая в данном случае состоит в том, что Если считать, что гипотеза Н0 верна, мы надеемся (на основе статистических данных) защитить её, подвергнув максимально жесткой проверке. Однако на практике обычно в качестве гипотезы Н0 принимают гипотезу альтернативную той, которая предполагается верной. Рассмотрим простую модель спроса: где у – величина спроса (на продукты питания), х – доход. Мы предполагаем, что спрос зависит от дохода. В качестве нулевой гипотезы принимается утверждение о том, что величина y не зависит от х. Нулевая и альтернативная гипотезы примут вид: и Если можно отвергнуть нулевую гипотезу, то тем самым устанавливается наличие зависимости у от х. Проверка статистической значимости гипотез для коэффициента  (а также ) осуществляется с помощь t - критерия. Мы делаем стандартные предположения о том, что случайный член u удовлетворяет условиям Гаусса-Маркова, а также имеет нормальное распределение. Тогда оценка на коэффициент , вычисленная по МНК, является нормально распределенной случайной величиной, с математическим ожиданием и дисперсией : Но в подавляющем большинстве реальных задач дисперсия случайного члена неизвестна. Её заменяют исправленной выборочной дисперсией, которая является несмещенной оценкой на . Используя величину можно получить оценку дисперсии для , квадратный корень из которой служит оценкой для стандартного отклонения и называется стандартной ошибкой: (1) Величина имеет распределение Стьюдента с n - 2 степенями свободы (напомним с этим фактом мы уже встречались в разделе математической статистики). Мы задаемся уровнем значимости  (на практике обычно выбирают значение  = 5%, 1%) и по таблице находим критическое значение tкр. статистики t (при заданном уровне значимости). Справедливо следующее соотношение Таким образом, с большой вероятностью значение статистики t находятся в пределах: - Если значение величины рассчитанное по выборке, оказывается в указанных пределах, то нет оснований отвергать нулевую гипотезу о независимости у от х, если же практическое значение статистики t, удовлетворяет неравенству то нулевая гипотеза отвергается и принимается альтернативная гипотеза о зависимости у от х. При этом вероятность того, что мы отвергаем истинную гипотезу при уровне значимости 5% равна 0,05, а при уровне значимости 1% - 0,01. Пример. Сформулируем гипотезу, что расходы на питание зависят (линейно) от величины личного дохода. На основании совокупных данных для США за 25 лет (1959-1983 гг.) было получено уравнение регрессии Убедимся, что результаты исследований подтверждают эту гипотезу. В качестве нулевой гипотезы сформулируем гипотезу о независимости расходов на питание от величины доходов: По статистическим данным вычисляем Находим критическое значение tкр. при уровне значимости  = 5% (число степеней свободы равна n-2 = 23). По таблице критических значений находим tкр. = 2,069. Так как tфак.> tкр., то нулевая гипотеза отвергается и принимается предположение о зависимости расходов на питание от личных доходов. Рассмотрим пример, когда Вернемся к модели зависимости темпов общей инфляции от темпов инфляции, инфляции вызванной ростом заработной платы:. Сформулируем гипотезу о равенстве общей инфляции, инфляции обусловленной ростом заработной платы: Предположим, что на основании 20 наблюдений было рассчитано уравнение регрессии. и . Тогда tкрит. при уровне значимости  = 5% : tкр.=2,101. Получаем, что и мы не отвергаем нулевую гипотезу. Оценивание значимости коэффициента  осуществляется аналогичным образом, при этом стандартная ошибка для оценки вычисляется по формуле: (2) 2. Доверительные интервалы для коэффициентов регрессии Предположим, что при оценивании регрессии нулевая гипотеза была отвергнута. Естественно задаться вопросом о том, какие гипотезы о значении  совместны с результатами оценивания. Еще раз вернемся к модели спроса на продукты питания Мы отвергли нулевую гипотезу 0 = 0. А какие гипотезы не будут отвергнуты? Например, 0 = 0,093, 0 = 0,09301 очевидно будут совместимы с результатами оценивания. Из результатов предыдущего раздела следует, что гипотетическое значение  является совместимыми с результатом оценивания регрессии, если величина tфакт. удовлетворяет двойному неравенству: - или (3). Любое значение , которое удовлетворяет соотношению (3) будет совместимо с оценкой в и, следовательно, не будет опровергаться результатами оценивания. Интервал называется доверительным интервалом для величины  при заданном уровне значимости. Отметим, что серединой доверительного интервала является оценка в. С увеличением уровня доверия (с уменьшением ) величина tкр. возрастает и, следовательно, доверительный интервал расширяется. Пример. В рассмотренном выше примере при  = 5% tкр. = 2,069 и доверительный интервал составляет : 0,087 <  < 0,099; при  = 1% tкр. = 2,807 и доверительный интервал составляет: 0,085 <  < 0,101. Доверительный интервал дает так называемую интервальную оценку параметра. Он определяет собой диапазон значений, в котором с вероятностью 1-  находится истинное значение оцениваемого параметра. 3. Односторонние t-тесты. До сих пор мы рассматривали применения t-тестов в ситуациях, когда альтернативная гипотеза была простым отрицанием нулевой гипотезы. Сейчас мы рассмотрим три других случая. Для определенности мы будем считать, что гипотеза строится относительно параметра  и уровня доверия  = 5%. Случай I: По каким-то причинам существуют только два возможных истинных значения коэффициента и 1. Для определенности допустим, что Применяя обычную процедуру, мы проверяем истину Н0. Область принятия гипотезы: . Гипотеза Н0 отклоняется, если значение в находится справа от точки В0 или слева от точки А0: Если значение в находится справа от точки В0 , то оно намного лучше согласуется с гипотезой Н1 и мы должны отвергнуть гипотезу Н0 и принять гипотезу Н1. Если же значение в находится слева от точки А0 оно согласуется с гипотезой Н1 еще хуже, чем с гипотезой Н0: вероятность того, что гипотеза Н0 верна в этом случае равна 0,025, и вероятность справедливости Н1 намного меньше. В этом случае мы не должны отвергать гипотезу Н0 ради принятия Н1. Следовательно мы отвергаем гипотезу Н0, только если в оказывается в правом 2,5% «хвосте» распределения, т.е. если Отметим, что в данном случае мы получим уровень значимости 2,5%, т.е. вероятность отклонения гипотезы Н0 в случае когда она верна равна 0,025. Если мы хотим задаться обычным уровнем значимости в 5% (или 1%), то надо сдвинуть точку в по сравнению с двусторонним критерием (или просто обратиться к таблице критических значений Стьюдента одностороннего теста). Случай II: В этом случае альтернативная гипотеза выражается в виде без указания конкретного значения. Очевидно, что так же как и в случае I из критической области следует исключить левый «хвост»: так как « низкое» значение более вероятно при гипотезе Н0, чем при гипотезе Н1 и, следовательно, такое значение будет говорить в пользу гипотезы Н0, а не против неё. Поэтому в этом случае следует применять односторонний критерий проверки, рассматривая только правый «хвост» как область непринятия гипотезы Н0. Случай III: Аналогично предыдущему случаю, проверка гипотезы основывается на одностороннем критерии, использующем левый «хвост» распределения Стьюдента в качестве области отклонения гипотезы. Пример. Обратимся к примеру зависимости между общей инфляцией и инфляцией, вызванной ростом заработной платы. Нулевая гипотеза, состояла в том, что инфляция, вызванная заработной платой, полностью отражена в общей инфляции: В данном случае целесообразно рассмотреть альтернативную гипотезу ( повышение производительности труда привести к более низкому уровню общей инфляции по сравнению с инфляцией определенной ростом заработной платы. В результате расчетов получаем = 0,82 и стандартную ошибку s(в) = 0,1. Следовательно, tфакт .= -1,8. При уровне значимости  = 5% и использовании двустороннего критерия получаем tкр. = 2,1. Таким образом, |tфакт| < tкр. и Н0 не отвергается. Однако, если мы используем односторонний критерий, то tкр = 1,73 и |tфакт| > tкр. и теперь можно отвергнуть нулевую гипотезу и сделать вывод о том, что общая инфляция будет значимо ниже инфляции, вызванной ростом заработной платы. 4. F – тест на качество оценивания. Напомним, что оценивание значимости уравнения регрессии в целом проводится с помощью коэффициента детерминации R2. Однако этот коэффициент вычисляется на конкретной выборке и его значение представляет случайную величину. Как узнать, действительно ли полученное значение R2 отражает истинную зависимость или оно появилось случайно? Для проверки статистической значимости полученного значения коэффициента R2 используют F- тест, основанный на анализе дисперсии. Вспомним, что при определенных условиях дисперсия зависимой переменной раскладывается на «объясненную» и «необъясненную» составляющие: Умножим обе части уравнения на n, получаем: Левая часть уравнения представляет собой сумму квадратов отклонений зависимой переменной от ее выборочного среднеквадратического. Первый член в правой части уравнения является объясненной суммой квадратов отклонений, а второе слагаемое – необъясненной суммой квадратов отклонений ( суммарноя ошибка). По данной выборке ( объема n) расчитывается F- статистика: , где к- число независимых переменных (F- статистика – это отношение объясненной суммы квадратов ( в расчете на одну независимую переменную) к суммарной ошибке ( в расчете на одну степень свободы). В нашем случае к = 1 и, следовательно, или, после деления числителя и знаменателя на , Справедливо следующее утверждение: F- статистика имеет F- распределения Фишера-Снедекора. Вычислив значения F- статистики Fфакт., мы по таблице критичесикх значений F – распределения при заданном уровне значимости определяем критическое значение Fкр.. Если Fфак.> Fкр., то нулевая гипотеза о статистической незначимости коэффициента R2 отвергается и делается вывод о том, что имеющееся объяснение поведения величины у лучше, чем можно было бы получить чисто случайно. Пример: В примере с расходами на питание коэффициент R2 = 0,9775, n = 25, Пусть  = 1%, тогда Fкр.=7,88 и F > F кр. В данном случае мы отклоняем предположение о том, что значение коэффициента R2 могло появиться случайно. Заключение: В заключении следует отметить, что для случая модели парной регрессии t - критерий для гипотезы  = 0, F - критерий для коэффициента R2, а так же t - критерий для гипотезы (подробности можно посмотреть в учебнике Доугерти) эквивалентны.
«Построение нулевой гипотезы; t- критерий Стьюдента» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач

Тебе могут подойти лекции

Смотреть все 207 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot