Справочник от Автор24
Поделись лекцией за скидку на Автор24

Учет качественных признаков в моделях регрессии. Фиктивные переменные. Тест Чоу. Учет сезонности в моделях регрессии.

  • 👀 428 просмотров
  • 📌 387 загрузок
Выбери формат для чтения
Статья: Учет качественных признаков в моделях регрессии. Фиктивные переменные. Тест Чоу. Учет сезонности в моделях регрессии.
Найди решение своей задачи среди 1 000 000 ответов
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Учет качественных признаков в моделях регрессии. Фиктивные переменные. Тест Чоу. Учет сезонности в моделях регрессии.» pdf
Лекция №5 Учет качественных признаков в моделях регрессии. Фиктивные переменные. Тест Чоу. Учет сезонности в моделях регрессии. Фиктивные переменные – переменные, которые искусственно вводятся в модель для того, чтобы учесть некоторые качественные изменения моделируемого процесса. Фиктивные переменные принимают значения 0, если качественный признак отсутствует у наблюдаемого объекта и 1, если качественный признак присутствует у наблюдаемого объекта. 1. Предположим, что в момент времени 𝑡 ∗ , произошло параллельное смещение процесса вверх или вниз, при этом тенденция не изменилась. 𝑦𝑡 𝛼0 + 𝛼2 𝛼2 𝛼0 ∗ t 𝛼0 𝑡∗ Рисунок 1 Тогда 𝑦𝑡 = 𝛼0 ∗ + 𝛼3 𝑡 + 𝜀𝑡 (1) Для учета параллельного смещения, вводим фиктивные переменные: 1, 𝑧1 = { 0, 𝑡 ≤ 𝑡∗ 𝑡 > 𝑡∗ 1, 𝑧2 = { 0, 𝑡 > 𝑡∗ 𝑡 ≤ 𝑡∗ 𝑦𝑡 = 𝛼0 + 𝛼1 𝑧1 + 𝛼2 𝑧2 + 𝛼3 𝑡 + 𝜀𝑡 В этом случае, матрица исходных данных – вырожденная. 1 1 𝑋= 1 1 (1 𝑧1 𝑧2 1 0 1 0 1 0 0 1 0 1 𝑡 1 ⋮ 𝑡∗ - матрица исходных данных 𝑛) 1-й столбец матрицы равен сумме второго и третьего столбцов, поэтому матрица вырожденная и ее определитель равен 0. Поэтому делаем важный вывод, что вводить необходимо на 1 переменную фиктивную меньше, чем количество градаций признака. 𝑦𝑡 = 𝛼0 + 𝛼2𝑧𝑡 + 𝛼3 𝑡 + 𝜀𝑡 , 1 0 1 0 1 0 𝑋= 1 … (1 1 1 2 … ∗ 𝑡 - матрица исходных данных 𝑛) где 1, 𝑧𝑡 = { 0, 𝑡 > 𝑡∗ 𝑡 ≤ 𝑡∗ Или модель можно переписать в виде: 𝛼0 + 𝛼3 𝑡 + 𝜀𝑡 , 𝑡 ≤ 𝑡∗ 𝑦𝑡 = { 𝛼0 + 𝛼2 + 𝛼3 𝑡 + 𝜀𝑡 , 𝑡 > 𝑡∗ Параметр регрессии 𝛼3 показывает влияния фактора t на процесс 𝑦𝑡 , причем динамика не меняется. Параметр 𝛼2 показывает приращение, связанное с тем, что процесс сместился во времени. При 𝛼2 > 0, процесс сместился параллельно вверх, при 𝛼2 < 0, процесс сместился параллельно вниз. По критерию Стьюдента можем проверить гипотезу, что параметр 𝛼2 значим и не равен 0. 𝐻0 : α ̂2 = 0 ↔ 𝐻1 : α ̂2 ≠ 0 𝛼2 − 𝛼 ̂2 ~Стьюдент(𝛼 = 0,05; 𝑛 − 2 − 1) 𝜎𝛼2 𝑡α̂2 |α ̂| 2 = 𝜎𝛼2 𝑡крит = Ст(𝛼; 𝑛 − 2 − 1) Где: 𝑡крит = 𝑡𝛼,𝑛−2−1 – квантиль распределения Стьюдента на уровне 𝛼, с числом степеней свободы n-2-1; n- количество наблюдений; 2- количество факторов в модели; 𝛼 (обычно принимают равным 0,05) – уровень значимости. При 𝑡α̂2 >𝑡крит с вероятностью 1- 𝛼 параметр α ̂2 признается значимым и не равным 0, что подтверждает, что произошло параллельное смещение процесса в момент времени 𝑡 ∗ . При 𝑡α̂2 ≤ 𝑡крит с вероятностью 1- 𝛼 параметр α ̂2 признается незначимым и равным 0, что говорит о том, что параллельного смещения процесса в момент времени 𝑡 ∗ не было и необходимо строить единую модель: 𝑦𝑡 = 𝛼0 ∗ + 𝛼3 𝑡 + 𝜀𝑡 без учета смещения. 2. Предположим, что в момент времени 𝑡 ∗ , произошло изменение тенденции процесса, при этом он не сместился и параметр 𝛼0 сохранился. 𝑡𝑔 = 𝛼3 + 𝛼4 𝑦𝑡 𝑡𝑔 = 𝛼3 ∗ 𝛼0 t 𝑡𝑔 = 𝛼3 𝑡∗ Рисунок 2. Тогда 𝑦𝑡 = 𝛼0 + 𝛼3 ∗ 𝑡 + 𝜀𝑡 Для учета изменении тенденции, вводим фиктивную переменную: 𝑡 > 𝑡∗ 𝑡 ≤ 𝑡∗ 1, 𝑧𝑡 = { 0, 𝑦𝑡 = 𝛼0 + 𝛼3 𝑡 + 𝛼4 𝑧𝑡 ∗ 𝑡 + 𝜀𝑡 𝑋= 𝑧𝑡 𝑡 𝑡 1 0 1 1 0 2 1 0 … ( 1 - матрица исходных данных 𝑡…∗ 𝑡∗ 𝑛 𝑛 ) Или модель можно переписать в виде: 𝛼0 + 𝛼3 𝑡 + 𝜀𝑡 , 𝑡 ≤ 𝑡∗ 𝑦𝑡 = { 𝛼0 + (𝛼3 + 𝛼4 ) ∗ 𝑡 + 𝜀𝑡 , 𝑡 > 𝑡∗ Проанализируем изменение параметра 𝛼3 (Рисунок 2). 𝛼3 является тангенсом угла наклона модели и показывает влияние фактора времени на процесс до момента 𝑡 ∗ , 𝛼3 + 𝛼4 является тангенсом угла наклона модели и показывает влияние фактора времени на процесс после момента 𝑡 ∗ . Параметр 𝛼4 показывает изменение тангенса угла наклона прямой, связанное с тем, что процесс изменил тенденцию в момент времени 𝑡 ∗ . Если |𝛼3 + 𝛼4 | > 𝛼3 , то темп роста процесса увеличился после момента времени 𝑡 ∗ . Параметр регрессии 𝛼3 показывает влияния фактора t на процесс 𝑦𝑡 до момента 𝑡 ∗ , параметр 𝛼3 + 𝛼4 после момента 𝑡 ∗ . По критерию Стьюдента можем проверить гипотезу, что параметр 𝛼3 значим и не равен 0. 𝐻0 : α ̂4 = 0 ↔ 𝐻1 : α ̂4 ≠ 0 𝛼4 − 𝛼 ̂4 ~Стьюдент(𝛼 = 0,05; 𝑛 − 2 − 1) 𝜎𝛼4 𝑡α̂4 = |α ̂| 4 𝜎𝛼4 𝑡крит = Ст(𝛼; 𝑛 − 2 − 1) Где: 𝑡крит = 𝑡𝛼,𝑛−2−1 – квантиль распределения Стьюдента на уровне 𝛼, с числом степеней свободы n-2-1; n- количество наблюдений; 2- количество факторов в модели; 𝛼 (обычно принимают равным 0,05) – уровень значимости. При 𝑡α̂4 >𝑡крит с вероятностью 1- 𝛼 параметр α ̂3 признается значимым и не равным 0, что подтверждает, что произошло изменение тенденции процесса в момент времени 𝑡 ∗ . При 𝑡α̂4 ≤ 𝑡крит с вероятностью 1- 𝛼 параметр α ̂3 признается незначимым и равным 0, что говорит о том, что изменения тенденции процесса в момент времени 𝑡 ∗ не было и необходимо строить единую модель: 𝑦𝑡 = 𝛼0 + 𝛼3 ∗ 𝑡 + 𝜀𝑡 без учета смещения. 3. Предположим, что в момент времени 𝑡 ∗ , произошло изменение тенденции процесса при одновременном его смещении (изменился параметр 𝛼0 ). 𝑦𝑡 𝛼2 𝛼0 ∗ 𝛼0 𝛼0 + 𝛼2 Рисунок 3. Тогда 𝑦𝑡 = 𝛼0 ∗ + 𝛼3 ∗ 𝑡 + 𝜀𝑡 t 𝑡∗ Для учета смещения и изменения тенденции, вводим фиктивную переменную: 𝑡 > 𝑡∗ 𝑡 ≤ 𝑡∗ 1, 𝑧𝑡 = { 0, 𝑦𝑡 = 𝛼0 + 𝛼2𝑧𝑡 + 𝛼3 𝑡 + 𝛼4 𝑧𝑡 ∗ 𝑡 + 𝜀𝑡 𝑋= 𝑧𝑡 1 0 1 0 1 0 1 0 1 1 (1 1 𝑡 1 2 3 … 𝑡∗ 𝑡∗ + 1 … 𝑛 𝑧𝑡 𝑡 𝑡∗ - матрица исходных данных 𝑡∗ + 1 𝑛) Или модель можно переписать в виде: 𝛼0 + 𝛼3 𝑡 + 𝜀𝑡 , 𝑡 ≤ 𝑡∗ 𝑦𝑡 = { 𝛼0 + 𝛼2 + (𝛼3 + 𝛼4 ) ∗ 𝑡 + 𝜀𝑡 , 𝑡 > 𝑡∗  Проанализируем сначала изменение параметра 𝛼0 (Рисунок 3). Параметр 𝛼2 показывает изменение 𝛼0 после момента времени 𝑡 ∗ . По критерию Стьюдента можем проверить гипотезу, что параметр 𝛼2 значим и не равен 0. 𝐻0 : α ̂2 = 0 ↔ 𝐻1 : α ̂2 ≠ 0 𝛼2 − 𝛼 ̂2 ~Стьюдент(𝛼 = 0,05; 𝑛 − 3 − 1) 𝜎𝛼2 𝑡α̂2 = |α ̂| 2 𝜎𝛼2 𝑡крит = Ст(𝛼; 𝑛 − 3 − 1) Где: 𝑡крит = 𝑡𝛼,𝑛−3−1 – квантиль распределения Стьюдента на уровне 𝛼, с числом степеней свободы n-3-1; n- количество наблюдений; 3- количество факторов в модели; 𝛼 (обычно принимают равным 0,05) – уровень значимости. При 𝑡α̂2 >𝑡крит с вероятностью 1- 𝛼 параметр α ̂2 признается значимым и не равным 0, что подтверждает, что произошло изменение параметра 𝛼0 после момента времени 𝑡 ∗ . При 𝑡α̂2 ≤ 𝑡крит с вероятностью 1- 𝛼 параметр α ̂2 признается незначимым и равным 0, что говорит о том, что параметра 𝛼0 не изменился после момента времени 𝑡 ∗ . и необходимо строить модель: 𝑦𝑡 = 𝛼0 ∗ + 𝛼3 𝑡 + 𝛼4 𝑧𝑡 ∗ 𝑡 + 𝜀𝑡 без учета смещения.  Проанализируем теперь изменение параметра 𝛼3 (Рисунок 4). 𝑦𝑡 𝑡𝑔 = 𝛼3 + 𝛼4 𝑡𝑔 = 𝛼3 𝑡𝑔 = 𝛼3 ∗ t 𝑡∗ Рисунок 4. 𝛼3 является тангенсом угла наклона модели и показывает влияние фактора времени на процесс до момента 𝑡 ∗ , 𝛼3 + 𝛼4 является тангенсом угла наклона модели и показывает влияние фактора времени на процесс после момента 𝑡 ∗ . Параметр 𝛼4 показывает изменение тангенса угла наклона прямой, связанное с тем, что процесс изменил тенденцию в момент времени 𝑡 ∗ . Если |𝛼3 + 𝛼4 | > 𝛼3 , то темп роста процесса увеличился после момента времени 𝑡 ∗ . Параметр регрессии 𝛼3 показывает влияния фактора t на процесс 𝑦𝑡 до момента 𝑡 ∗ , параметр 𝛼3 + 𝛼4 после момента 𝑡 ∗ . По критерию Стьюдента можем проверить гипотезу, что параметр 𝛼4 значим и не равен 0. 𝐻0 : α ̂4 = 0 ↔ 𝐻1 : α ̂4 ≠ 0 𝛼4 − 𝛼 ̂4 ~Стьюдент(𝛼 = 0,05; 𝑛 − 3 − 1) 𝜎𝛼4 𝑡α̂4 = |α ̂| 4 𝜎𝛼4 𝑡крит = Ст(𝛼; 𝑛 − 3 − 1) Где: 𝑡крит = 𝑡𝛼,𝑛−3−1 – квантиль распределения Стьюдента на уровне 𝛼, с числом степеней свободы n-3-1; n- количество наблюдений; 3 количество факторов в модели; 𝛼 (обычно принимают равным 0,05) – уровень значимости. При 𝑡α̂4 >𝑡крит с вероятностью 1- 𝛼 параметр α ̂4 признается значимым и не равным 0, что подтверждает, что произошло изменение тенденции процесса в момент времени 𝑡 ∗ . При 𝑡α̂4 ≤ 𝑡крит с вероятностью 1- 𝛼 параметр α ̂4 признается незначимым и равным 0, что говорит о том, что изменения тенденции процесса в момент времени 𝑡 ∗ не было и необходимо строить единую модель: 𝑦𝑡 = 𝛼0 + 𝛼2 𝑧2 + 𝛼3 ∗ 𝑡 + 𝜀𝑡 без учета изменения тенденции. 4. Тест Чоу для подтверждения или опровержения наличия структурных сдвигов. Структурное изменение – одномоментное изменение тенденции временного ряда, связанное со структурным сдвигом в экономике или другими факторами. В этом случае происходит изменение тенденции процесса в момент времени 𝑡 ∗ . В этот момент времени произошли сильные изменения в тенденциях факторов, влияющих на процесс, что может быть обусловлено изменением экономической ситуацией в стране, кризисом, изменениями на фондовых рынках, политическими событиями. (2) (3) 𝑦𝑡 (1) t 𝑡∗ Рисунок 5. Если эти изменения значимо повлияли на моделируемый процесс, необходимо разделить совокупность данных на 2 части (до момента времени 𝑡 ∗ и после). В данном случае, получим кусочно-линейную модель, состоящую из моделей (1) и (2) (Рисунок 5). Если эти изменения не повлияли на моделируемый процесс, необходимо необходимо строить единую модель по всей совокупности наблюдений. В данном случае, получим единую модель (3) (Рисунок 3). Каждый из этих вариантом имеет свои достоинства и недостатки. В первом случае при моделировании кусочно-линейной функцией происходит снижение остаточной суммы квадратов, за счет уменьшения ошибок. Но при этом также снижается число степеней свободы модели, что особенно существенно при прогнозировании, когда в расчет будет приниматься только вторая модель Во втором случае при моделировании единой моделью, происходит увеличение остаточной суммы квадратов за счет увеличении ошибок, но при этом число степеней свободы сохраняется. Выбор из двух вариантов осуществляется с использованием теста Чоу на основании сопоставления снижения остаточной суммы квадратов и потере в числе степеней свободы при моделировании процесса кусочно-линейной функцией вместо единой. Вид модели Кусочнолинейная =(1)+(2) (1) (2) Единая модель (3) Уравнение модели 𝑦̂1𝑡 = 𝛼01 + 𝛼11 ∗𝑡 𝑦̂2𝑡 = 𝛼02 + 𝛼12 ∗𝑡 𝑦̂3𝑡 = 𝛼03 + 𝛼13 ∗𝑡 Количе Сумма ство квадратов наблюд остаточная ений 𝑛 = 𝑛1 𝑆кл = 𝑆1 + 𝑆2 + 𝑛2 Количество факторов в модели Число степеней свободы 𝑚1 + 𝑚2 𝑛−(𝑚1 + 𝑚2 ) 𝑚1 𝑛1 − 𝑚1 𝑚2 𝑛2 − 𝑚2 𝑚3 𝑛 − 𝑚3 = (𝑛1 + 𝑛2 ) − 𝑚3 𝑛1 𝑛1 𝑆1 = ∑ 𝑒𝑡 2 𝑡=1 𝑛−𝑛2 𝑛2 𝑛 = 𝑛1 + 𝑛2 𝑆2 = ∑ 𝑒𝑡 2 𝑡=𝑛1 +1 𝑛 𝑆3 = ∑ 𝑒𝑡 𝑡=1 2 ∆ =(3)((1)+(2) - ∆𝑆 = 𝑆3 − (𝑆1 + 𝑆2 ) 𝑚3 − (𝑚1 + 𝑚2 ) (𝑛1 + 𝑛2 ) − 𝑚3 − 𝑛1 + 𝑚1 − 𝑛2 + 𝑚2 = (𝑚1 + 𝑚2 ) − 𝑚3 Расчетное значение теста Чоу: 𝐹расч 2 𝜎∆𝑆 ∆𝑆/[(𝑚1 + 𝑚2 ) − 𝑚3 ] = 2 = 𝑆кл /[𝑛−(𝑚1 + 𝑚2 )] 𝜎𝑆кл Fкрит=F(α; (𝑚1 + 𝑚2 ) − 𝑚3 ; 𝑛−(𝑚1 + 𝑚2 )) – квантиль распределения Фишера на уровне значимости α, с числом степеней свободы первым (𝑚1 + 𝑚2 ) − 𝑚3 и вторым 𝑛−(𝑚1 + 𝑚2 )., где n – общее число наблюдений; 𝑚1 - количество факторов в модели первой (1); 𝑚2 – количество факторов в модели второй (2); 𝑚3 – количество факторов в модели единой (3). Если 𝐹расч > Fкрит, то гипотеза о наличии структурных изменений подтверждается. В этом случае при моделировании ряда, следует использовать кусочно-линейную модель: 𝑦̂кл𝑡 𝛼01 + 𝛼11 ∗ 𝑡, ={ 2 𝛼0 + 𝛼12 ∗ 𝑡, 𝑡 ≤ 𝑡∗ 𝑡 > 𝑡∗ Если 𝐹расч ≤ Fкрит, то гипотеза о наличии структурных изменений отклоняется. В этом случае при моделировании ряда, следует использовать единую модель: 𝑦̂3𝑡 = 𝛼03 + 𝛼13 ∗ 𝑡. 5. Моделирование сезонных колебаний с использованием фиктивных переменных. Сезонные колебания – периодические изменения в тенденции временного ряда, связанные с определенным сезоном. Например, выручка и прибыль различных компаний, может носить сезонный характер. 𝑦𝑡 t 1 кв 2 года 3 кв 1 года 1 кв 3 года 3 кв 2 года 1 кв 4 года 3 кв 3 года Для учета сезонных колебаний вводим на одну фиктивную переменную меньше чем период колебаний для того, чтобы матрица исходных данных была обратима. В случае, если данные ежеквартальные, период колебаний равен 4, тогда вводим 3 фиктивные переменные: 1, 0, 𝑡 = 1кв в остальных случаях 𝑆2 = { 1, 0, 𝑡 = 2кв в остальных случаях 𝑆3 = { 1, 0, 𝑡 = 3кв в остальных случаях 𝑆1 = { 𝑦𝑡 = 𝛼0 + 𝛼1𝑆1 + 𝛼2𝑆2 + 𝛼3 𝑆3 + 𝛼4 𝑡 + 𝜀𝑡 Матрица исходных данных в этом случае имеет вид: 1 1 𝑋= 1 1 1 1 (1 𝑆1 1 1 𝑆2 1 1 𝑆3 1 𝑡 1кв1г 2кв1г 3кв1г 4кв1г 1кв2г 2кв2г ) Модель может быть представлена в виде 𝛼0 + 𝛼1 + 𝛼4 𝑡 + 𝜀𝑡 ; 𝛼 +𝛼 +𝛼 𝑡+𝜀 ; 𝑦𝑡 = { 𝛼0 + 𝛼2 + 𝛼4 𝑡 + 𝜀𝑡 ; 3 4 𝑡 𝛼0 +𝛼4 𝑡 + 𝜀𝑡 ; для 1 кв для 2 кв для 3 кв для 4 кв ; 𝛼0 – показывает уровень процесса в 4 квартале; 𝛼0 + 𝛼1 - показывает уровень процесса в 1 квартале; 𝛼0 + 𝛼2 – показывает уровень процесса во 2 квартале; 𝛼0 + 𝛼3 - показывает уровень процесса во 3 квартале. При 𝛼1 > 0 уровень процесса выше в 1 квартале по сравнению с четвертым, при 𝛼2 > 0 уровень процесса выше во втором квартале по сравнению с четвертым; при 𝛼3 < 0 уровень процесса ниже в третьем квартале по сравнению с четвертым. По критерию Стьюдента также можно проверить каждый параметр на значимость. Если параметр значим, это говорит о том, что в соответствующем квартале уровень процесса действительно отличается от четвертого квартала.
«Учет качественных признаков в моделях регрессии. Фиктивные переменные. Тест Чоу. Учет сезонности в моделях регрессии.» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти

Тебе могут подойти лекции

Смотреть все 207 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot