Эконометрика; линейная модель множественной регрессии; матричный метод
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Институт математики и информационных технологий ИГУ
ЭКОНОМЕТРИКА
2020-21 уч.г.
Тюрнева Т.Г.,к.ф.-м.н., доцент,
кафедра теории вероятностей и дискретной математики
Эконометрика
Лекция
2
Линейная модель множественной
регрессии
3
План презентации
1.
2.
Практическая работа по эконометрике «Линейная модель множественной регрессии».
Задание
Линейная модель множественной регрессии
1.
2.
3.
Отбор факторов при построении множественной регрессии
Оценка параметров линейного уравнения множественной регрессии МНК
Показатели качества множественной регрессии
4.
5.
Оценка значимости уравнения в целом и каждого параметра в отдельности
Проверка выполнимости предпосылок МНК
4
С чего начать?
Постановка задачи. Формулируем цель исследования, определяем набор показателей,
взаимосвязи между которыми нас интересуют.
Число факторов не менее четырех, два количественных и два качественных.
Априорный. Предмодельный анализ содержательной сущности моделируемого явления
состоит в формировании и формализации имеющейся априорной информации об этом
явлении в виде ряда гипотез и исходных допущений;
Информационно-статистический этап – получение данных, анализ их качества.
›
Число наблюдений не менее 7-10 на каждый оцениваемый параметр!
Эконометрика: Учебник / Под ред. И. И. Елисеевой. –
М.: Финансы и статистика, 2005. – 576 с.
5
Эконометрика
1. Модель парной линейной регрессии
2. Модель множественной линейной регрессии
3. Итоговый коллоквиум
4. Итоговая контрольная работа
5. Модель временного ряда
ПРАКТИКА
Апрель: 20,21 (14-я неделя)
27,28 (15-я неделя)
Май: 4,5
11,12
18,19
6. Презентация
Лекции
Апрель: 16, 23, 30
Май: 7,14,21,28
Июнь: 4
Лекции13-14 Линейная модель множественной регрессии.
Лекция 15. Множественная регрессия с фиктивными переменными
Лекция 16. Нелинейная регрессия
Лекция 17-18. Системы одновременных уравнений
Лекция 19-20. Анализ временных рядов
6
Практическая работа по эконометрике
«Линейная модель множественной регрессии»
задание (1-й вариант)
1. Провести отбор факторов в модель множественной линейной регрессии
(использовать метод исключения факторов; анализ матрицы парных
коэффициентов корреляции).
2. Построить линейное уравнение множественной регрессии, оценить значимость
его параметров, пояснить их экономический смысл.
3. Оценить надежность уравнения в целом.
4. Записать уравнение множественной линейной регрессии в стандартизованном
масштабе; сделайте выводы.
7
Практическая работа по эконометрике
«Линейная модель множественной регрессии»
задание (2-й вариант)
1. Постановка задачи. Описать зависимую (указать единицы измерения) и независимые переменные:
количественные (указать единицы измерения) и качественные. С учетом числа градаций качественной
переменной ввести фиктивные переменные.
Число наблюдений не менее 7-9 на каждый оцениваемый параметр (число оцениваемых параметров = число
переменных+1).
2. Построить и проанализировать матрицу парных и частных коэффициентов корреляции.
3. Записать уравнение множественной линейной регрессии для всех переменных в натуральном и
стандартизованном масштабе; сделайте выводы.
4. Оценить значимость коэффициентов регрессии (t-критерий Стьюдента и доверительные интервалы).
5. Оценить значимость уравнения регрессии – F-критерий.
6. Если в модели есть статистически незначимые коэффициенты, то перейти к п.7, если модель
прогнозирования, то перейти к п.9-10.
пригодна для
7. Найти наилучшую модель методом последовательного исключения незначимых факторов.
8. Интерпретировать полученные результаты.
9. В случае пригодности линейной модели построить точечный прогноз зависимой переменной.
8
Множественная регрессия характеризует связь между
результативным признаком и двумя и более
факторными признаками.
Множественная регрессия представляет собой
модель, где теоретическое (среднее) значение
зависимой переменной Y рассматривается как функция
нескольких независимых переменных X1, X2,...Xm.
Y
Отклик,
зависимая величина,
результативный признак
Х1
Х2
Х3
Хm
Ф
а
к
т
о
р
ы
п
р
е
д
и
к
т
о
р
ы
9
Выбор формы уравнения регрессии
Модель множественной регрессии
Y = f ( x1 , x 2 , x3 ,... x m ) +
нелинейные
Наиболее широко
используются линейная и
степенная функции ввиду
четкой интерпретации
параметров.
линейные
Y = a + b1 x1 + b2 x 2 + ... + bm x m +
Линейная модель множественной
регрессии
➢ См. дополнительно [1], пример 3.3, стр. 120.
10
Линейная модель множественной регрессии и
оценка ее параметров
Y = f ( x1 , x 2 , x3 ,... x m ) +
Модель множественной регрессии
Y = a + b1 x1 + b2 x 2 + ... + bm x m +
Линейная модель множественной
регрессии
y = a + b1 x1 + b2 x 2 + ... + bm x m + e
Эмпирическое уравнение
регрессии
yˆ = a + b1 x1 + b2 x 2 + ... + bm x m
Оцененное уравнение регрессии
11
Линейная модель множественной регрессии
Y = a0 + b1 x1 + b2 x2 + ... + bm xm +
Условия Гаусса –
Маркова
Нормальность
распределения остатков
Классическая нормальная модель
множественной регрессии
12
Отбор факторов при построении множественной регрессии
– Построение уравнения множественной регрессии начинается с решения вопроса о
спецификации модели.
– Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде
всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими
экономическими явлениями.
Факторы, включаемые во множественную регрессию, должны отвечать следующим
требованиям.
1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный
фактор, не имеющий количественного измерения, то ему нужно придать количественную
определенность (см. лекцию 15).
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной
связи.
– Включение в модель факторов с высокой интеркорреляцией, может привести к нежелательным
последствиям – система нормальных уравнений может повлечь за собой неустойчивость и
ненадежность оценок коэффициентов регрессии.
– Если между факторами существует высокая корреляция (взаимосвязь), то нельзя определить их
изолированное влияние на результативный показатель и параметры уравнения регрессии
оказываются неинтерпретируемыми.
13
Отбор факторов при построении множественной регрессии
Отбор факторов производится на основе качественного теоретико-экономического анализа.
При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых
факторов обычно в 6-7 раз меньше объема совокупности, по которой строится регрессия.
Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной
взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому
отбор факторов обычно осуществляется в две стадии:
• на первой подбираются факторы исходя из сущности проблемы;
• на второй – на основе матрицы показателей корреляции.
✓Считается, что две переменные явно коллинеарны, т. е. находятся между собой в линейной
зависимости, если 𝒓 ≥ 𝟎, 𝟕.
✓Если факторы явно коллинеарны, то они дублируют друг друга и один из них
рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору,
более тесно связанному с результатом, а тому фактору, который при достаточно тесной
связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом
требовании проявляется специфика множественной регрессии как метода исследования
комплексного воздействия факторов в условиях их независимости друг от друга.
✓Коэффициенты интеркорреляции (т. е. коэффициенты корреляции между объясняющими
переменными) позволяют исключать из модели дублирующие факторы.
➢ См. дополнительно [1], пример 3.2, стр. 113.
14
Оценка параметров линейного уравнения множественной регрессии
МНК
Матричный метод
Скалярный метод
Р.М. в стандартизованном масштабе
15
Матричный метод
Представим данные наблюдений и параметры модели в матричной форме.
Y = [ y1 , y 2 ,..., y n ]'
1
⋮
1
⋯
⋱
⋯
-
n – мерный вектор – столбец наблюдений зависимой переменной;
х1р
⋮ - матрица значений независимых переменных, размерности n ( p + 1)
х𝑛𝑝
B = [ a, b1 , b2 ,..., b p ]' - (p+1) – мерный вектор – столбец параметров уравнения регрессии;
Y = XB + e
МНК
B = ( X ' X ) X 'Y
−1
16
Скалярный метод. Система уравнений МНК
ei = y i − a 0 − b1 x1 − ... − bm x m
n
n
m
i =1
j =1
Q = ei = ( y i − ( a 0 + b j xij )) 2 → min
2
i =1
y = n a 0 + b1 x1 + b2 x 2 + ... + bm x m ,
2
y x1 = a 0 x1 + b1 x1 + b2 x1 x 2 + ... + bm x m x1 ,
......
2
y
x
=
a
x
+
b
x
x
+
b
x
x
+
...
+
b
x
m
0 m
1 1
m
2 2
m
m m
17
Р.М. в стандартизированном масштабе
t y = 1 t x 1 + 2 t x 2 + ... + m t xm +
ty =
y− y
y
; t xj =
xj − xj
x
;
j
Бета-коэффициенты –
стандартизованные коэффициенты
регрессии
Оценивание - МНК
t y = t x j = 0; ty = tx = 1
1. β-коэффициенты сравнимы между собой.
2. Стандартизованные коэффициенты регрессии показывают, на сколько сигм
изменится в среднем результат, если соответствующий фактор xj изменится на одну
сигму при неизменном среднем уровне других факторов.
3. В парной зависимости стандартизованный коэффициент регрессии есть линейный
коэффициент корреляции: = rxy
4. Во множественной регрессии зависимость следующая: b j =
j
y
x
j
18
Показатели качества множественной регрессии
Показатели качества множественной регрессии:
– индекс множественной корреляции;
– коэффициент детерминации.
– скорректированный коэффициент детерминации.
19
Индекс множественной корреляции
Индекс множественной корреляции оценивает тесноту совместного влияния
факторов на результативный признак Y. При правильном включении факторов в
регрессионную модель величина индекса множественной корреляции будет
существенно отличаться от индекса корреляции парной зависимости.
R yx1 x 2 ... x m =
(y − y
1−
( y − y)
x1 x 2 ... x m
)2
2
0 R yx1 x 2 ... x m 1
R yx1 x2 ... xm =
x ryx
j
R yx1 x 2 ... x m =
j
1−
r
r11
➢ См. дополнительно [1], стр. 136 -145.
20
Коэффициенты частной корреляции первого порядка
Коэффициенты частной корреляции первого порядка:
ryx1 x2 = x1
1 − r 2 x1 x2
1− r
2
yx 2
; ryx 2 x1 = x 2
ryx j x1 x2 ... x j −1 x j +1 ... xm = 1 −
1 − r 2 x1 x2
1 − r 2 yx1
1 − R 2 yx1 x2 ... x j ... xm
Порядок частного коэффициента
корреляции определяется количеством
факторов, влияние которых исключается
1 − R 2 yx1 x2 ... x j −1 x j +1 ... xm
21
Коэффициент детерминации
Коэффициент детерминации:
R 2 yx1 x2 ... xm = 1 −
2
(
y
−
y
)
x1 x 2 ... x m
2
(
y
−
y
)
1. К-т детерминации – неубывающая функция
числа объясняющих переменных.
2. Добавление новой объясняющей переменной
никогда не уменьшает значение R2
Скорректированный коэффициент детерминации
(y − y
) /( n − m − 1)
= 1−
( y − y ) /( n − 1)
2
R
x1 x 2 ... x m
2
yx1 x 2 ... x m
2
Несмещенная оценка остаточной дисперсии –
дисперсии случайных отклонений
Несмещенная оценка общей дисперсии – дисперсии
отклонений переменной Y от своего среднего
При дополнительном включении в регрессию фактора
коэффициент детерминации должен возрастать, а остаточная
дисперсия уменьшаться. Если же этого не происходит и данные
показатели практически не отличаются друг от друга, то
включаемый в анализ фактор не улучшает модель и практически
является лишним фактором.
22
Скорректированный коэффициент детерминации
𝟐 =1 – (1 – R2 )
𝑹
𝒏−𝟏
𝒏−𝒎−𝟏
2 < 𝑅2 .
1. Очевидно, 𝑅
2 = 𝑅2 , только при 𝑅2 =1.
2. 𝑅
2 может принимать отрицательные значения.
3. 𝑅
4. Скорректированный к-т детерминации увеличивается при добавлении
новой объясняющей переменной тогда и только тогда, когда t-статистика
для этой переменной по модулю больше единицы.
23
Оценка значимости уравнения в целом и каждого
параметра в отдельности
➢ Значимость уравнения множественной регрессии в целом оценивается с помощью Fкритерия Фишера
➢ Оценка значимости коэффициентов регрессии выполняется с помощью t- критерия
Стьюдента
Статистический вывод о пригодности (значимости) уравнения обычно проверяется
в следующей последовательности.
1. Сначала проводится общая проверка методом F-критерия, целью которой является
выяснение, объясняют ли включенные в модель факторы значимую долю вариации у, т.е.
превалирует ли влияние факторов на изменение функции у над её колебаниями случайного
порядка.
2. Если регрессия оказывается значимой, то можно продолжить анализ, используя t-критерий
Стьюдента для отдельных коэффициентов регрессии; в этом случае пытаются выяснить,
насколько значимым является влияние той или иной переменной х на у при условии, что все
другие факторы остаются неизменными.
Построение доверительных интервалов и проверки гипотез на адекватность для отдельного
коэффициента регрессии основывается на определении стандартной ошибки коэффициентов
регрессии.
3. Проверка выполнимости предпосылок МНК.
24
Методы построения уравнения множественной регрессии:
метод исключения (отсев факторов из полного его набора);
метод включения (дополнительное включение факторов);
шаговый регрессионный анализ (исключение ранее введенного фактора).
Сущность метода шаговой регрессии заключается в реализации алгоритмов
последовательного «включения», «исключения» или «включения-исключения»
факторов в уравнение регрессии и последующей проверке их статистической
значимости.
Алгоритм «включения» заключается в том, что факторы поочередно вводятся
в уравнение так называемым «прямым методом». При проверке значимости
введенного фактора определяется, на сколько уменьшается сумма квадратов
остатков и увеличивается величина множественного коэффициента корреляции
(R2).
Одновременно используется и алгоритм последовательного «исключения»,
сущность которого заключается в том, что исключаются факторы, ставшие
незначимыми по статистическим критериям.
25
Пример
№
магазина
Два количественных
фактора
Годовой
Торговая
товарооборот, площадь,
млн. руб.
тыс.м.кв.
Среднее число
посетителей в
день,тыс.чел.
1
19,76
0,24
8,25
2
38,09
0,31
10,24
3
40,95
0,55
9,31
4
41,08
0,48
11,01
5
56,29
0,78
8,54
6
68,51
0,98
7,51
7
75,01
0,94
12,36
8
89,05
1,21
10,81
9
91,13
1,29
9,89
10
91,26
1,12
13,72
11
99,84
1,29
12,27
12
108,55
1,49
13,92
Анализ зависимости годового товарооборота от
размеров торговых площадей
Анализ зависимости годового товарооборота от
среднего числа посетителей в день
Анализ зависимости годового товарооборота
от размеров торговых площадей от среднего
числа посетителей в день
Наилучшей является модель,
имеющая значимые параметры
и максимальный показатель
тесноты связи
26
Матрица парных коэффициентов корреляции
Годовой
товарооборот,
млн.р.
Торговая площадь,
тыс.м.кв.
Годовой
товарооборот, млн.р.
1
Торговая
площадь,тыс.м.кв.
0,984304
1
Среднее число
посетителей в
день,тыс.чел.
0,651409
0,542404391
Среднее число
посетителей в
день,тыс.чел.
1
Матрица межфакторной корреляции
27
Регрессионная
статистика
Множественный R 0,984304
R-квадрат
0,968855
Нормированный Rквадрат
0,965741
Стандартная
ошибка
5,306363
Наблюдения
12
Анализ зависимости годового товарооборота от размеров
торговых площадей
Дисперсионный анализ
Регрессия
Остаток
Итого
Y-пересечение
Торговая
площадь,тыс.м.кв.
df
1
10
11
SS
8759,227
281,5749
9040,801
MS
8759,227
28,15749
F
311,0799
Коэффициен Стандартная
ты
ошибка t-статистика P-Значение
7,873778 3,752527
2,09826
0,062259
67,88714
3,849032
17,63746
7,31E-09
Значимость
F
7,31E-09
Нижние
95%
-0,48737
Верхние
95%
16,23493
59,31096
76,46332
28
Регрессионная статистика
Множественный R
R-квадрат
Нормированный Rквадрат
0,651409006
0,424333693
Стандартная ошибка
Наблюдения
22,81333993
12
Анализ зависимости годового товарооборота от среднего
числа посетителей в день
0,366767063
Дисперсионный анализ
Регрессия
Остаток
Итого
Y-пересечение
Среднее число
посетителей в
день,тыс.чел.
df
1
10
11
SS
3836,317
5204,485
9040,801
MS
3836,317
520,4485
F
7,371175
Значимость F
0,021746513
Стандартная
Коэффициенты
ошибка t-статистика P-Значение
-26,5117651
35,53471
-0,74608 0,472793
Нижние 95%
-105,6880429
Верхние
95%
52,66451
8,899798026
1,595910965
16,20369
3,278021
2,714991
0,021747
29
Регрессионная
статистика
Множественный R
R-квадрат
Нормированный Rквадрат
0,994194295
0,988422297
Стандартная ошибка
Наблюдения
3,410306484
12
Анализ зависимости годового товарооборота от размеров
торговых площадей от среднего числа посетителей в день
0,985849474
Дисперсионный анализ
Регрессия
Остаток
Итого
Y-пересечение
Торговая
площадь,тыс.м.кв.
Среднее число
посетителей в
день,тыс.чел.
df
2
9
11
SS
8936,1298
104,67171
9040,8015
MS
4468,065
11,63019
F
384,1781
Значимость
F
1,93E-09
Коэффициенты
-10,81529683
Стандартная
ошибка
t-статистика P-Значение
5,3646178
-2,01604
0,074597
Нижние
95%
-22,9509
Верхние
95%
1,320321
61,65832405
2,9444759
20,94034
6,05E-09
54,99745
68,3192
2,274838935
0,5832789
3,900088
0,003619
0,955369
3,594309
30
Анализ результатов
При дополнительном включении в регрессию фактора
коэффициент детерминации должен возрастать, а
остаточная дисперсия уменьшаться.
Множественный R
0,651409006
Множественный R
0,984304
Множественный R
0,994194295
R-квадрат
0,424333693
R-квадрат
0,968855
R-квадрат
0,988422297
0,965741
Нормированный Rквадрат
0,985849474
5,306363
Стандартная
ошибка
3,410306484
12
Наблюдения
12
Нормированный Rквадрат
0,366767063
Нормированный Rквадрат
Стандартная ошибка 22,81333993
Наблюдения
Стандартная ошибка
12
Наблюдения
однофакторная
двухфакторная
Какой модели стоит отдать предпочтение!?
31
Прогнозирование по модели множественной регрессии
См. практику
32
Проверка выполнимости предпосылок МНК
Для проведения анализа в рамках линейной модели множественной регрессии необходимо выполнение ряда
предпосылок МНК. В основном это те же предпосылки, что и для парной регрессии, однако здесь нужно
добавить предположения, специфичные для множественной регрессии:
Отсутствие мультиколлинеарности: между объясняющими переменными отсутствует строгая линейная
зависимость, что играет важную роль в отборе факторов при решении проблемы спецификации модели.
Мультиколлинеарность
Мультиколлинеарность - это линейная взаимосвязь двух или нескольких объясняющих
переменных (х1, х2, … хm).
На практике
«наличие тесных статистических связей между объясняющими
переменными»
Совершенная мультиколлинеарность - это линейная взаимосвязь двух или нескольких
объясняющих переменных (х1, х2, … хm), в которой объясняющие переменные связаны строгой
функциональной зависимостью.
33
Последствия мультиколлинеарности
Большие дисперсии (с.о.) оценок
• Расширение интервальных оценок
• Ухудшение точности
Уменьшение t-статистик
коэффициентов
• Неоправданный вывод о
существенности влияния
соответствующей объясняющей
переменной на зависимую
переменную
Оценки коэффициентов по МНК и
их с. о. очень чувствительны к
малейшим изменениям данных
• Затрудняется определение вклада
каждой из объясняющих
переменных
• Возможно получение неверного
знака у коэффициента регрессии
34
Способы обнаружения мультиколлинеарности
Анализ корреляционной
матрицы
Расчет множественных коэффициентов
корреляции (коэффициентов детерминации)
для объясняющих переменных
Коэффициент детерминации высок, но
некоторые из коэффициентов регрессии
статистически незначимы
Признаки
мультиколлинеарности
Парная корреляция между малозначимыми
объясняющими переменными достаточно
высока
Высокие частные коэффициенты
корреляции
35
Методы устранения мультиколлинеарности
Исключение переменной из модели
Получение дополнительных данных
Изменение спецификации модели
Преобразование переменных
36
Пример
37
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
цена квартиры
13,00
16,50
17,00
15,00
14,20
10,50
23,00
12,00
15,60
12,50
11,30
13,00
21,00
12,00
11,00
11,00
22,50
26,00
18,50
13,20
25,80
17,00
18,00
21,00
14,50
23,00
19,50
14,30
13,30
16,10
общая
площадь
37,00
60,00
60,00
53,00
35,00
30,00
43,00
30,00
35,00
32,00
31,00
33,00
53,00
32,00
31,00
36,00
48,00
55,00
48,00
44,00
80,00
60,00
50,00
55,00
43,00
66,00
54,00
45,00
45,00
51,00
жилая
площадь
21,50
27,00
30,00
26,20
19,00
17,50
25,50
17,80
18,00
17,00
18,00
19,60
26,00
18,00
17,30
19,00
29,00
35,00
28,00
30,00
51,00
38,00
30,00
32,00
27,00
39,00
29,50
29,00
30,00
30,80
площадь
кухни
6,50
22,40
15,00
13,00
9,00
5,60
8,50
5,50
5,30
6,00
5,50
7,00
16,00
6,30
5,50
8,00
8,00
8,00
8,00
6,00
13,00
10,00
8,70
10,00
5,50
12,00
7,00
6,00
05.май
7,90
тип дома
0,00
0,00
0,00
0,00
0,00
1,00
0,00
1,00
1,00
1,00
1,00
0,00
1,00
0,00
1,00
1,00
1,00
0,00
0,00
1,00
0,00
0,00
1,00
1,00
1,00
1,00
1,00
1,00
0,00
0,00
Данные о продаже
квартир
Тип дома
1 - кирпичный
0 – другой
38
цена
квартиры
общая
площадь
площадь
кухни
жилая
площадь
Матрица парных коэффициентов
корреляции
цена
квартиры
1
общая
площадь
0,772844712
1
площадь
кухни
0,425727046
0,671633963
1
жилая
площадь
0,756234201
0,932507555
0,399748274
1
цена квартиры общая площадь
две переменные явно коллинеарны, т. е.
находятся между собой в линейной
зависимости, если 𝒓 ≥ 𝟎, 𝟕
цена квартиры
общая
площадь
площадь
кухни
тип дома
1
0,772844712
1
площадь кухни 0,425727046
0,671633963
жилая
площадь
0,932507555 0,399748274
тип дома
жилая
площадь
0,756234201
-0,166785778 -0,275013877
1
1
-0,3198065 0,242686779
1
39
цена квартиры
30
y = 0,2817x + 3,4651
R² = 0,5973
25
Цена квартиры
20
15
10
5
10
20
30
40
50
60
70
80
90
общая площадь
40
30
цена квартиры
25
Название оси
20
15
10
y = 0,433x + 4,8909
R² = 0,5719
5
10
20
30
40
50
60
Жилая площадь
41
жилая площадь
60
y = 0,5936x - 0,6826
R² = 0,8696
50
40
30
20
10
10
20
30
40
50
60
70
80
90
42
Регрессионная статистика
Множественный R
0,783199477
R-квадрат
0,613401421
Нормированный Rквадрат
0,568793892
Стандартная ошибка
2,977050042
Наблюдения
30
Анализ модели зависимости цены квартиры от
количественных факторов
Дисперсионный
анализ
df
Регрессия
Остаток
Итого
3
26
29
SS
MS
F
Значимость
F
365,6202 121,8734 13,75107 1,44E-05
230,4335 8,862827
596,0537
43
Анализ модели зависимости цены квартиры от
количественных факторов
Стандартная
Нижние
tPКоэффициенты
ошибка
статистика Значение
95%
Y-пересечение
Верхние
95%
3,196480447
2,188336
1,46069 0,156081 -1,30171 7,69467
общая площадь 0,358868332
0,286188
1,253961 0,221014 -0,2294 0,947136
жилая площадь -0,046141576
0,363395
-0,12697 0,899938 -0,79311 0,700828
площадь кухни -0,235226385
0,357911
-0,65722 0,516815 -0,97092 0,50047
Все
коэффициенты
статистически
незначимы
44
Регрессионная статистика
Множественный R
R-квадрат
Нормированный Rквадрат
0,783484326
0,613847689
Стандартная ошибка
Наблюдения
3,034254445
30
Анализ модели зависимости цены квартиры от
количественных факторов и типа дома
0,552063319
Дисперсионный анализ
df
Регрессия
Остаток
Итого
Y-пересечение
общая площадь
жилая площадь
площадь кухни
тип дома
4
25
29
SS
365,8862
230,1675
596,0537
MS
91,47154
9,2067
Все
коэффициенты
статистически
незначимы
F
Значимость F
9,9353233
5,92457E-05
Стандарт
tная
статисти
Коэффициенты ошибка
ка
P-Значение
3,010600959 2,484048 1,211974
0,2368529
0,348251209
0,2983 1,167454
0,2540417
-0,031159199 0,380722 -0,08184
0,9354237
-0,216181543 0,381607
-0,5665
0,5761033
0,205528855 1,209161 0,169976
0,8663967
Нижние 95%
-2,105390749
-0,266108653
-0,815270477
-1,002116891
-2,284784099
Верхние
95%
8,126593
0,962611
0,752952
0,569754
2,695842
45
Регрессионная статистика
Множественный R
0,768128142
R-квадрат
0,590020842
Нормированный Rквадрат
0,559652015
Стандартная ошибка
Наблюдения
3,008442322
30
Дисперсионный анализ
Регрессия
Остаток
Итого
Y-пересечение
жилая площадь
площадь кухни
df
2
27
29
SS
MS
351,6841 175,842
244,3696 9,050725
596,0537
Стандар
тная
Коэффициенты ошибка
4,305832277
2,022645
0,399417314
0,076981
0,169960396
0,155539
tстатист
ика
2,128812
5,188531
1,092718
Значимос
F
ть F
19,4285 5,92E-06
PЗначение
0,042542
1,84E-05
0,284172
Нижние Верхние
95%
95%
0,155707 8,455957
0,241466 0,557369
-0,14918
0,4891
46
Регрессионная статистика
Множественный R
R-квадрат
0,78304642
0,613161695
Нормированный Rквадрат
0,584507006
Стандартная ошибка
Наблюдения
2,922304962
30
Дисперсионный анализ
Регрессия
Остаток
Итого
df
SS
MS
F
Значимость
F
2
27
29
365,4773
230,5764
596,0537
182,7386
8,539866
21,39830206
2,7018E-06
Коэффициенты
Стандарт
tная
статисти
ошибка
ка
P-Значение
Нижние 95% Верхние 95%
Y-пересечение
общая площадь
3,266767407
0,323337452
2,078233
0,05889
1,571897
5,490576
0,127621029
8,17728E-06
-0,99741471
0,20250611
7,53094952
0,4441688
площадь кухни
-0,196747292
0,186924
-1,05255
0,301875937
-0,58028411
0,18678952
47
Какую модель можно использовать для прогнозирования?
1.
2.
3.
4.
5.
6.
Цена квартиры – общая площадь;
Цена квартиры – жилая площадь
Цена квартиры – общая, жилая, площадь кухни;
Цена квартиры – общая, жилая, площадь кухни, тип дома;
Цена квартиры – жилая, площадь кухни;
Цена квартиры – общая, площадь кухни.
-
48