Линейная регрессия с одной объясняющей переменной

👀 491 просмотр
📌 425 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Линейная регрессия с одной объясняющей переменной», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Линейная регрессия с одной объясняющей переменной», Word формат

Институт математики и информационных технологий ИГУ ЭКОНОМЕТРИКА 2020-21 уч.г. Тюрнева Т.Г.,к.ф.-м.н., доцент, кафедра теории вероятностей и дискретной математики Эконометрика Лекция 2 План презентации 1. 2. Линейная регрессия с одной объясняющей переменной 1. Постройте поле корреляции и сформулируйте гипотезу о форме связи 2. Рассчитайте параметры выборочного уравнения линейной регрессии с помощью МНК 3. Оцените тесноту связи с помощью показателей корреляции (выборочный коэффициент корреляции) и детерминации 4. Используя критерий Стьюдента оцените статистическую значимость коэффициентов регрессии и корреляции 5. Интервальные оценки параметров регрессии 6. Таблица дисперсионного анализа 7. Прогноз Решение задачи в программе Microsoft Excel 3 Линейная регрессия с одной объясняющей переменной 4 Модель парной линейной регрессии (задание) Парная регрессия – это уравнение, описывающее корреляционную связь между зависимой переменной (результатом) и независимой переменной (фактором). 1. Постройте поле корреляции и сформулируйте гипотезу о форме связи. 2. Рассчитайте параметры выборочного уравнения линейной регрессии с помощью МНК. 3. Оцените тесноту связи с помощью показателей корреляции (выборочный коэффициент корреляции) и детерминации. 4. Используя критерий Стьюдента оцените статистическую значимость коэффициентов регрессии и корреляции. 5. Постройте интервальные оценки параметров регрессии. Проверьте, согласуются ли полученные результаты с выводами, полученными в предыдущем пункте. 6. Постройте таблицу дисперсионного анализа для оценки значимости уравнения в целом. 7.!!! С помощью теста Гольдфельда – Квандта исследуйте гетероскедастичность остатков. Сделайте выводы. 8. В случае пригодности линейной модели рассчитайте прогнозное значение результата, если значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости =0,05. 9. Оцените полученные результаты, проинтерпретируйте полученное уравнение регрессии. 5 С чего начать? Постановка задачи. Формулируем цель исследования, определяем набор показателей, взаимосвязи между которыми нас интересуют. Число факторов не менее четырех, два количественных и два качественных. Априорный. Предмодельный анализ содержательной сущности моделируемого явления состоит в формировании и формализации имеющейся априорной информации об этом явлении в виде ряда гипотез и исходных допущений; Информационно-статистический этап – получение данных, анализ их качества. › Число наблюдений не менее 7-10 на каждый оцениваемый параметр! 6 7 Задача За осенний семестр 2019-20 уч.г. собраны данные о количестве пропусков и результатах итогового теста по теории вероятностей десяти студентов группы. Оценить регрессионную модель зависимости результатов теста (в баллах) от количества пропусков (в часах). Обратите внимание! Пример учебный! Число наблюдений мало! 8 1. Постройте поле корреляции и сформулируйте гипотезу о форме связи 9 Пусть имеется два ряда эмпирических данных X (x1, x2, …, xn) и Y (y1, y2, …, yn), соответствующие им точки с координатами (xi, yi), где i=1,2,…,n, отобразим на координатной плоскости. Такое изображение называется корреляции. полем Визуальный анализ корреляционного поля позволяет сделать предположение о форме взаимосвязи двух исследуемых показателей. По форме взаимосвязи корреляционные зависимости принято разделять на линейные и нелинейные. 10 Связь по направлению – обратная, по форме – близка к линейной. 11 2. Рассчитайте параметры выборочного уравнения линейной регрессии с помощью МНК 12 Пусть имеется два ряда эмпирических данных X (x1, x2, …, xn) и Y (y1, y2, …, yn). В общем виде теоретическую линейную парную регрессионную модель можно , представить в виде: Y=  0 + 1 X +  • Предположим, что связь между X и Y описывается линейной функцией • 𝑌𝑖 =𝛽0 + 𝛽1 ∙ 𝑋𝑖 +𝜀𝑖 i=1,2,….n. • Парное уравнение регрессии может быть записано в матричной форме! Эмпирическое уравнение регрессии: 𝑦=𝑏 ො 0 +𝑏1 ∙ 𝑥 13 Уравнение парной линейной регрессии Задача: по выборке (𝑋𝑖, 𝑌𝑖 ) получить статистические оценки параметров модели. 𝑦=𝑏 ො 0 +𝑏1 ∙ 𝑥 𝑌𝑖 =𝛽0 +𝛽1 ∙ 𝑋𝑖 +𝜀𝑖 i=1,2,….n МНК Эмпирическое или оцененное уравнение регрессии Отклонение, оценка 𝜀𝑖 14 МНК позволяет минимизировать сумму квадратов остатков 1. Решить систему нормальных уравнений; 2. Использовать формулы; 3. Excel или другой ППП 2. Оценка параметров регрессии МНК Система нормальных уравнений МНКоценки 1 b0 = y − b1 x b1 = cov( x , y )  x2 Свободный коэффициент = x y − y x x − 2 x 2 2 Коэффициент регрессии 15 Решение системы нормальных уравнений; 10𝑏0 + 60𝑏1 = 50 ቊ 60𝑏0 + 390𝑏1 = 256 𝑏0 = 13,8 𝑏1 = -1,47 y 1 2 3 4 5 6 7 8 9 10 ∑ x x∙ 𝒚 𝒚𝟐 10 3 30 100 64 8 4 32 49 7 5 35 36 6 5 30 16 4 6 24 25 5 6 30 16 4 7 28 4 2 7 14 9 3 8 24 9 1 1 9 50 60 256 320 𝒙𝟐 ෝ 𝒚 Остатки 9 16 25 25 36 36 49 49 64 81 390 9,4 7,9 6,5 6,5 5 5 3,5 3,5 2,1 0,6 50 0,6 0,1 0,5 -0,5 -1 0,5 -1,5 0,9 0,4 Ошибки округления!!! 𝒆𝟐𝒊 0,36 0,01 0,25 0,25 1 0,25 2,25 0,81 0,16 5,47 5,34 Excel 16 Использование формул: Оценка параметров регрессии МНК Количество Результаты пропусков теста 3 10 4 8 5 7 5 6 6 4 6 5 7 4 7 2 8 3 9 1 𝑦=𝑏 ො 0 +𝑏1 ∙ 𝑥 b0 = y − b1 x = 5 – (- b1 = cov( x , y )  2 x = 22 )6 15 x y − y x x2 − x2 = 13,8 = 25,6 −30 39 −36 =- 22 15 ෝ = −𝟏, 𝟒𝟕𝒙+13,8 𝒚 17 ППП Excel Стандартная tНижние Коэффициенты ошибка статистика P-Значение 95% Y-пересечение Количество пропусков 13,8 0,942514 14,64169 4,65E-07 -1,46667 0,150923 -9,71797 1,05E-05 Верхние 95% 11,62656 15,97344 -1,8147 -1,11864 18 𝑦=5 𝑥=6 19 3. Оцените тесноту связи с помощью показателей корреляции (выборочный коэффициент корреляции) и детерминации 20 Показатели тесноты связи: линейный коэффициент корреляции и коэффициент детерминации Линейный коэффициент корреляции  x cov( x, y ) x  y − y  x rxy = b1 = = y  x  y  x  y rxy = n n n i =1 i =1 i =1 n   yi xi −  yi   x i n n n n (n   x − ( xi ) )  (n   y − ( y i ) 2 ) 2 i i =1 2 i =1 2 i i =1 b1 = cov( x , y )  x2 0,960159 rxy ≈ -0,96 Excel i =1 Коэффициент детерминации характеризует долю дисперсии результативного признака Y, объясняемую регрессией, в общей дисперсии результативного признака. Соответственно величина 1- R2 характеризует долю дисперсии Y, вызванную влиянием остальных, не учтенных в модели факторов. Коэффициент детерминации R2 = rxy2 0,921905 R2 = rxy2 ≈ 0,92 Excel 21 Линейный коэффициент корреляции •Коэффициент корреляции принимает значения на отрезке [-1; 1], т.е. -1 ≤ r ≤1. •Если переменные X и Y умножить на одно и то же число, то коэффициент корреляции не изменится. •Если 𝑟 = ±1, то корреляционная связь между X и Y представляет собой линейную зависимость. •Если 𝑟 = 0, то линейной корреляционной связи между X и Y нет (а нелинейная может существовать). Коэффициент детерминации 𝑆𝑆общ = σ(𝑦𝑖 − 𝑦)2 70 𝑆𝑆ост = σ(𝑦𝑖 − 𝑦ෝ𝑖 )2 5,466667 𝑆𝑆𝑅 = σ(𝑦ො𝑖 − 𝑦)2 64,53333 R2 = 1− SS ост SS общ = SS R SS общ Общая сумма квадратов Мера общего разброса относительно 𝑦 Остаточная (необъясненная) сумма квадратов Мера остаточного, не объясненного уравнением регрессии разброса точек вокруг линии регрессии Регрессионная (объясненная) сумма квадратов Мера разброса, объяснимая с помощью регрессии 22 Показатель тесноты связи 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 Характеристика силы связи 0,9 – 0,99 Весьма Слабая Умеренная Коэффициент корреляции R-квадрат Уравнением регрессии объясняется 92% дисперсии результативного признака, а на долю прочих факторов приходится 8% дисперсии. Заметная Высокая высокая - 0,96 0,92 92% вариации результатов теста объясняется вариацией числа пропусков и 8% вариации приходится на долю прочих факторов. 23 ПРОВЕРКА АДЕКВАТНОСТИ МОДЕЛИ Определение значимости модели (F – критерий) и отдельных коэффициентов (критерий Стьюдента) Установление наличия или отсутствия систематической ошибки (свойства остатков) 24 4. Используя критерий Стьюдента оцените статистическую значимость коэффициентов регрессии и корреляции 25 Реализация принципа проверки статистических гипотез 1. Сформулировать проверяемую Н0 и альтернативную Н1 гипотезы. 2. Назначить уровень значимости α. 3. Выбрать статистику Z для проверки гипотезы Н0. 4. Определить выборочное распределение статистики Z критерия при условии, что верна гипотеза Н0. 5. Множество значений статистики Z разбить на непересекающиеся подмножества – критическую область и область принятия гипотезы Н0. 6. Получить выборку наблюдений и вычислить выборочное значение статистики критерия. 7. Принять статистическое решение. Критерий, основанный на использовании заранее заданного уровня значимости α, называют критерием значимости. Проверка статистических гипотез может соответствующих доверительных интервалов. быть проведена на основе 26 Проверка гипотезы о равенстве параметра нулю (обычно при двусторонней альтернативной гипотезе) называется проверкой гипотезы о значимости параметра Н 0 : b1 = 0 Н0 : β1=0 Процедура оценивания значимости параметра 𝑏0 проводится аналогично. Н 1: b1 ≠ 0 t = S b1 = S 2 Статистика критерия при нулевой гипотезе имеет распределение Стьюдента с (n-2) степенями свободы b1 S b1 S  (x = i − x)2 e 2 i n−2 Стандартная ошибка коэффициента регрессии Несмещенная оценка дисперсии случайных отклонений Если вычисленное значение t – статистики - |tфакт| при заданном уровне значимости α больше критического (табличного) t табл , т.е. |tфакт| > t табл = t(α ; n-2), то гипотеза Н 0 : b1 = 0, отвергается в пользу альтернативной при выбранном уровне значимости. Это подтверждает статистическую значимость коэффициента регрессии b1. 27 Критерий Стьюдента 1.Оценить параметры регрессии. 𝑏0 = 13,8 𝑏1 = -1,47 2. Оценить дисперсию возмущений 𝑆 2 = 5,34 8 = 0,6675 ⇒ 𝑠 = 0,82 0,82664 Excel 3. Оценить стандартные ошибки оценок параметров 0,9315 t = b1 S b1 = -9,86 -9,71797 S b1 = S  (x i − x)2 0,14916 Критические точки: t 1-α/2 (n-2) = t0,975 (8)=2,306 |tфакт| > t табл = t(α ; n-2) 9,86 > 2,306 𝑏0 𝑡= = 14,81 14,64169 𝑆𝑏0 гипотеза Н 0 : b1 = 0, отвергается в пользу альтернативной при выбранном уровне значимости 0,05 Статистическое решение: если принимается нулевая гипотеза, то есть основания считать, что величина Y не зависит от Х – коэффициент b1 статистически незначим (он слишком близок к нулю). При отклонении Н0 коэффициент считается статистически значимым, что указывает на наличие определённой линейной зависимости между Y и X. 28 Критические значения t – критерия Стьюдента при уровне значимости 0,10, 0,05, 0,01 (двухсторонний) Число степеней свободы 1 2 3 4 5 6 7 8 9 10 11 12 Уровень значимости α=0,10 6,3138 2,9200 2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125 1,7959 1,7823 Уровень значимости α=0,05 12,706 4,3027 3,1825 2,7764 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281 2,2010 2,1788 Уровень значимости α=0,01 63,657 9,9248 5,8409 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693 3,1058 3,0545 Критические точки: t 1-α/2 (n-2) = t0,975 (8)=2,306 29 5. Интервальные оценки параметров регрессии 30 5. Постройте интервальные оценки параметров регрессии. Проверьте, согласуются ли полученные результаты с выводами, полученными в предыдущем пункте Формулы для расчета доверительных интервалов имеют следующий вид: (b 0 − t ( ; n − 2) S b0 ; b 0 + t ( ; n − 2)  S b0 ) , (b 1− t ( ; n − 2)  S b1 ; b 1+ t ( ; n − 2) S b1 ) , которые с надёжностью (1 – α) накрывают определяемые параметры 0 и 1 . Если в границы доверительных интервалов попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр признается статистически незначимым. (b 0 − t ( ; n − 2) S b0 ; b 0 + t ( ; n − 2)  S b0 ) 13,8 ± 2,306 · 0,9315 (11,65; 15,95) (b 1− t ( ; n − 2)  S b1 ; b 1+ t ( ; n − 2) S b1 ) 31 6. Таблица дисперсионного анализа 32 6. Постройте таблицу дисперсионного анализа для оценки значимости уравнения в целом Оценка значимости уравнения в целом дается с помощью F – критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т.е. H0 : β1=0, следовательно, фактор не оказывает влияния на результат.  ( уi − y ) 2   ( yi − y ) 2 = i + i i Общая сумма квадратов отклонений  2 ( y − y  i i) Сумма квадратов Остаточная сумма = отклонений, объясненная + квадратов регрессией отклонений Обозначим SSобщ =  ( у i i − y)2 , SSR =  ( y i − y ) 2 и SSост =  ( y i − y i ) 2 . i i Любая сумма квадратов отклонений связана с числом степеней свободы df (degree of freedom), т.е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Число степеней свободы остаточной суммы квадратов при линейной парной регрессии составляет n - 2 , общей суммы квадратов – n -1 и число степеней свободы для факторной суммы квадратов, т. е. объясненной регрессией равно единице. Имеем равенство: n – 1 = 1+ (n – 2). Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений или дисперсию на одну степень свободы. 33 Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F –отношения или F – критерий, статистика которого F при нулевой гипотезе F = MS R MS ост  =  ( y − y) 2 1  2  ( y − y ) ( n − 2) ~ F(1,n-2) распределена по закону Фишера со степенями свободы (1, n-2). Если вычисленное значение F –отношения - F факт при заданном уровне значимости α больше критического (табличного) F табл , т.е. F факт > F табл = F(α;1,n-2), то гипотеза Н0 : β1=0 отвергается, признаётся статистическая значимость уравнения регрессии, т.е. связь между рассматриваемыми признаками есть и результаты наблюдений не противоречат предположению о её линейности. 34 Таблица значений F – критерия Фишера при уровне значимости  = 0,05 F табл = F(α;1,n-2)= 5,32 k2 1 2 3 4 5 6 8 12 24 1 161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32 2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,61 2,40 12 4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50 2,30 13 4,67 3,80 3,41 3,18 3.02 2,92 2,77 2,60 2,42 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35 2,13  35 Таблица дисперсионного анализа F - отношение Источники Число Сумма Дисперсия на вариации степеней квадратов одну степень свободы отклонений свободы Объясненная 1   (y i MS R i n– 2  − yi ) 2 i i Остаточная n– 1 Общая  (y  (у i  − y)2  ( y − y) = ское ное Fфакт = 2 MS R MS ост 1  MS ост фактиче- таблич-  ( y − y) = n−2 2 F табл = F(α;1,n-2) − y)2 i Величина F – критерия связана с коэффициентом детерминации R2. 2 R Значение F – критерия можно выразить следующим образом: F =  ( n − 2) 2 1− R . 36 Суммы квадратов отклонений N 1 2 3 4 5 6 7 8 9 10 y ෝ 𝒚 10 8 7 6 4 5 4 2 3 1 9,4 7,9 6,5 6,5 5 5 3,5 3,5 2,1 0,6 𝒆𝒊 0,6 0,1 0,5 -0,5 -1 0,5 -1,5 0,9 0,4 𝒆𝟐𝒊 0,36 0,01 0,25 0,25 1 0,25 2,25 0,81 0,16 5,34 𝒚𝒊 − 𝒚 (𝒚𝒊 −𝒚)2 𝒚ෝ𝒊 − 𝒚 ෢𝒊 − 𝒚)2 (𝒚 5 25 4,4 19,36 3 9 2,9 8,41 2 4 1,5 2,25 1 1 1,5 2,25 -1 1 -1 1 -1,5 2,25 -3 9 -1,5 2,25 -2 4 -2,9 8,41 -4 16 -4,4 19,36 70 64,54 Excel 64,53333 37 Если Р-значение меньше Альфа (т.е. F > Fкр), то нулевая гипотеза отвергается и влияние фактора принимают существенным Число Сумма Дисперсионный степеней квадратов анализ свободы отклонений df SS Регрессия 1 64,53333 64,53333 94,43902 Остаток 8 5,466667 0,683333 Итого 9 70 F факт > F табл = F(α;1,n-2) MS F Значимость F 1,05E-05 94,44 > 5,32 Гипотеза Н0 : β1=0 отвергается, признаётся статистическая значимость уравнения регрессии, т.е. связь между рассматриваемыми признаками есть и результаты наблюдений не противоречат предположению о её линейности. 38 Тест Гольдфельда – Квандта см. лекцию 12 39 7. Анализ остатков Количество пропусков График остатков 2 Наблюдение Предсказан ное результаты теста Остатки 1 9,4 0,6 2 7,933333 0,066667 3 6,466667 0,533333 4 6,466667 -0,46667 5 5 -1 6 5 7 3,533333 0,466667 8 3,533333 -1,53333 9 2,066667 0,933333 10 0,6 0,4 ОСТАТКИ ВЫВОД ОСТАТКА 1 -1 0 -2 2 4 6 8 10 КОЛИЧЕСТВО ПРОПУСКОВ 40 N 1 2 3 4 5 6 7 8 9 10 ෝ 𝒚 9,4 7,9 6,5 6,5 5 5 3,5 3,5 2,1 0,6 𝒆𝒊 0,6 0,1 0,5 -0,5 -1 0,5 -1,5 0,9 0,4 Наблюдение Предсказанное результаты теста Остатки 1 9,4 0,6 2 7,933333 0,066667 3 6,466667 0,533333 4 6,466667 -0,46667 5 5 -1 6 5 7 3,533333 0,466667 8 3,533333 -1,53333 9 2,066667 0,933333 10 0,6 0,4 Ошибки округления!! 41 8. В случае пригодности линейной модели рассчитайте прогнозное значение результата, если значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости = 0,05. Точечный прогноз по уравнению регрессии.  y р = b0 + b1 x р Интервальный прогноз среднего значения по уравнению регрессии b0 + b1 x р − t ( n − 2 ) S 1 n + (x − x p )2  (x i − x) 2 ; 1 b0 + b1 x р + t ( n − 2 ) S n + (x − x p )2  (x i − x)2 Интервальный прогноз индивидуальных значений зависимой переменной. ( b0 + b1 x р  t ( n − 2 ) S 1 + 1 n + (x − x p )2  (x i − x) 2 ) 42 Оцените полученные результаты, проинтерпретируйте полученное уравнение регрессии Интерпретация линейного уравнения регрессии. Можно сказать, что увеличение х на одну единицу (в единицах измерения переменной х) приведёт к увеличению в среднем значения y на b1 единиц (в единицах измерения переменной y). Постоянная b0 дает прогнозируемое значение у (в единицах у), если х=0. Это может иметь или не иметь ясного смысла в зависимости от конкретной ситуации. 𝑹𝟐 =0,92 Увеличение числа пропусков на 1 час приведет к снижению результатов теста в среднем на полтора балла. 43 Решение задачи в программе Microsoft Excel 44 45 1. Встроенная статистическая функция ЛИНЕЙН определяет параметры выборочного уравнения линейной регрессии y i = b0 + b1 xi . Порядок вычисления: 1) введите исходные данные; 2) выделите область пустых ячеек 5х2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики; 2) в главном меню выберите ВСТАВКА/ФУНКЦИЯ; 3) в окне Категория выберите СТАТИСТИЧЕСКИЕ, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК; 4) заполните аргументы функции: 5) чтобы раскрыть таблицу 5х2, нажмите на клавишу , а затем – на комбинацию клавиш ++. формулы другие функции линейн статистические 46 Значение коэффициента b1 Значение коэффициента b0 Стандартная ошибка Стандартная ошибка коэффициента b1 – коэффициента b0 – S S b1 =  (x i S b0 = − x)2 2 Коэффициент детерминации R R2 = 1− SS ост SS общ = SS R F = MS ост  =  ( y − y) 2 Регрессионная сумма квадратов – i − y)2 0,150923 0,942514 0,921905 0,82664 94,43902 8 64,53333 5,466667 Стандартная ошибка регрессии – S 2 e = 2 i n−2 Число степеней свободы 1  2  ( y − y ) ( n − 2) SSR =  ( y i 13,8 2 i n  ( xi − x ) 2 SS общ F - статистика MS R x S -1,46667 n-2 Остаточная сумма квадратов – SSост =  ( y i i  − yi ) 2 47 МНК 𝑦ො = −1,47𝑥+13,8 -1,46667 Стандартная ошибка коэффициента b1 Коэффициент детерминации F - статистика Регрессионная сумма квадратов отклонений 0,150923 0,921905 94,43902 64,53333 Уравнение парной линейной регрессии 13,8 0,942514 0,82664 8 5,466667 Стандартная ошибка коэффициента b0 Стандартная ошибка регрессии!!!! Число степеней свободы Остаточная сумма квадратов отклонений 48 Порядок действий: 1) в главном меню выберите СЕРВИС/ АНАЛИЗ ДАННЫХ / РЕГРЕССИЯ. Щелкните по кнопке ОК; 2) заполните диалоговое окно ввода данных. Если необходимо получить информацию и графики остатков, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК. По окончанию расчета на рабочий лист выводится три группы результатов. Первая группа, Регрессионная статистика. Вторая группа результатов – Дисперсионный анализ. Третья группа результатов включает в свой состав значения коэффициентов регрессии, а также статистики, на основании которых проверяется значимость влияния фактора для каждого коэффициента, включенного в модель. При необходимости есть возможность вывести таблицу стандартных и простых остатков. Кроме вывода табличной информации, есть возможность просмотреть графики остатков, что позволяет визуально проконтролировать качество подбора модели и отсутствие закономерности в остатках. данные анализ данных 49 ЗНАК!!! Регрессионная статистика Множественный R 0,960159 R-квадрат 0,921905 Нормированный Rквадрат 0,912143 Стандартная ошибка 0,82664 Наблюдения 10 Коэффициент корреляции Коэффициент детерминации ෢𝟐 =1 – (1 – R2 ) 𝑹 𝒏−𝟏 𝒏−𝒎−𝟏 ⇒S 50 Стандартная tКоэффициенты ошибка статистика P-Значение Y-пересечение Количество пропусков Нижние 95% Верхние 95% 13,8 0,942514 14,64169 4,65E-07 11,62656 15,97344 -1,46667 0,150923 -9,71797 1,05E-05 -1,8147 -1,11864 Для тестовой статистики вычисляется р-значение – минимальный уровень значимости, при котором основная гипотеза отвергается. Если р- значение превышает выбранный уровень значимости, то основная гипотеза НЕ ОТВЕРГАЕТСЯ! 51 ВЫВОД ОСТАТКА Предсказанное Y 1 9,4 2 7,933333333 3 6,466666667 4 6,466666667 5 5 6 5 7 3,533333333 8 3,533333333 9 2,066666667 10 0,6 Переменная X 1 График остатков Остатки 0,6 0,066667 0,533333 -0,46667 -1 0,466667 -1,53333 0,933333 0,4 2 Остатки Наблюдение -2 2 4 6 8 10 Переменная X 1 52 ПРИМЕР X 10 6 8 8 6 7 6 7 9 6 5 7 7 4 4 5 4 5 3 4 7 3 4 5 Y 53 x y 5 6 6 6 6 7 7 7 8 8 9 10 4 4 4 3 3 5 4 5 4 5 7 7 54 55 1 2 3 4 5 6 7 8 9 10 11 12 ∑ y x 4 4 4 3 3 5 4 5 4 5 7 7 55 5 6 6 6 6 7 7 7 8 8 9 10 85 x∙ 𝒚 𝒚𝟐 𝒙𝟐 20 16 25 24 16 36 24 16 36 18 9 36 18 9 36 35 25 49 28 16 49 35 25 49 32 16 64 40 25 64 63 49 81 70 49 100 407 271 625 ෝ 𝒚 Остатки 3 3,76 3,76 3,76 3,76 4,52 4,52 4,52 5,28 5,28 6,04 6,8 55 1 0,24 0,24 -0,76 -0,76 0,48 -0,52 0,48 -1,28 -0,28 0,96 0,2 56 0,76 -0,8 0,157434 1,136182 0,699736 0,753658 23,30399 10 13,23667 5,68 57 Значение коэффициента b1 Значение коэффициента b0 Стандартная ошибка Стандартная ошибка коэффициента b1 – коэффициента b0 – S S b1 =  (x i S b0 = − x)2 2 Коэффициент детерминации R R2 = 1− SS ост SS общ = SS R F = MS ост  =  ( y − y) 2 Регрессионная сумма квадратов – i Стандартная ошибка регрессии – S 2 e = − y)2 2 i n−2 Число степеней свободы 1  2  ( y − y ) ( n − 2) SSR =  ( y i 2 i n  ( xi − x ) 2 SS общ F - статистика MS R x S n-2 Остаточная сумма квадратов – SSост =  ( y i  − yi ) 2 i 58 ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,836502052 R-квадрат 0,699735683 Нормированный Rквадрат 0,669709251 Стандартная ошибка 0,753657747 Наблюдения 12 0,76 -0,8 0,157434 1,136182 0,699736 0,753658 23,30399 10 13,23667 5,68 Дисперсионный анализ df Регрессия Остаток Итого SS MS F Значимость F 1 13,23666667 13,23666667 23,30399061 0,000694458 10 5,68 0,568 11 18,91666667 59 0,76 -0,8 0,157434 1,136182 0,699736 0,753658 23,30399 10 13,23667 5,68 Коэффициен Стандартная tНижние Верхние ты ошибка статистика P-Значение 95% 95% Y-пересечение -0,8 1,136181804 -0,70411267 0,49743115 -3,3316 1,73157 Переменная X 1 0,76 0,157433969 4,8274207 0,00069446 0,40922 1,11078 60 Наблюдение 1 2 3 4 5 6 7 8 9 10 11 12 Предсказанное Y 3 3,76 3,76 3,76 3,76 4,52 4,52 4,52 5,28 5,28 6,04 6,8 Остатки 1 0,24 0,24 -0,76 -0,76 0,48 -0,52 0,48 -1,28 -0,28 0,96 0,2 Стандартные остатки 1,391624848 0,333989964 0,333989964 -1,05763488 -1,05763488 0,667979927 -0,72364492 0,667979927 -1,78127981 -0,38965496 1,335959854 0,27832497 61

ЭКОНОМЕТРИКА

#Лекция

Линейная регрессия с одной объясняющей переменной

Тебе могут подойти лекции

Эконометрика

Множественная регрессия

Эконометрика

Множественная регрессия

Эконометрика как наука. Проблемы эконометрического моделирования

Парная регрессия

Модель множественной линейной регрессии

Парная линейная регрессия

Основы регрессионного анализа. Множественная регрессия. Линеаризация нелинейной регрессии

Эконометрика. Задачи и модели.

Линейная регрессия с одной объясняющей переменной

Тебе могут подойти лекции

Другие экономические предметы

Помощь с написанием учебных работ