Многомерный регрессионный анализ
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 4. Моделирование смысловых нагрузок понятий и терминов (Многомерный регрессионный анализ)
Лекция 1. Многомерный регрессионный анализ
План лекции
1. Классификация многомерных методов
2. Множественный регрессионный анализ (МР)
1. Классификация многомерных методов
Наиболее часто в исследованиях человека применяются следующие многомерные методы: множественный регрессионный анализ (МР), факторный анализ (ФА), многомерное шкалирование (МШ), кластерный анализ (КА), дискриминантный анализ (ДА).
Эти методы можно классифицировать по трем основаниям: 1) в соответствии с интеллектуальной операцией (по способу преобразования исходной информации) – по назначению метода; 2) по способу сопоставления данных – по сходству (различию) или пропорциональности (корреляции); 3) по виду исходных эмпирических данных.
Необходимость знаний многомерных методов, их возможностей и ограничений требуются уже на стадии общего замысла исследования. Например, ориентируясь только на факторно-аналитическую модель, исследователь ограничен в выборе процедуры диагностики: она должна состоять в измерении признаков у множества объектов. При этом исследователь ограничен и в направлении поиска: он изучает либо взаимосвязи между признаками, либо межгрупповые различия по измеряемым признакам. Общая осведомленность о других многомерных методах позволит исследователю использовать более широкий круг психодиагностических процедур, решать более широкий спектр не только научных, но и практических задач.
Классификация методов по назначению
1. Методы предсказания (экстраполяции): МР и ДА. МР предсказывает значения метрической «зависимой» переменной по множеству известных значений «независимых» переменных, измеренных у множества объектов (испытуемых). ДА предсказывает принадлежность объектов (испытуемых) к одному из известных классов (номинативной шкале) по измеренным метрическим (дискриминантным) переменным.
2. Методы классификации: варианты КА и ДА. КА («классификация без обучения») по измеренным характеристикам у множества объектов (испытуемых) либо по данным об их попарном сходстве (различии) разбивает это множество объектов на группы, в каждой из которых содержатся объекты, более похожие друг на друга, чем на объекты из других групп. ДА («классификация с обучением», «распознавание образов») позволяет классифицировать объекты по известным классам, исходя из измеренных у них признаков, пользуясь решающими правилами, выработанными предварительно на выборке идентичных объектов, у которых были измерены те же признаки.
3. Структурные методы: ФА и МШ. ФА направлен на выявление структуры переменных как совокупности факторов, каждый из которых – это скрытая, обобщающая причина взаимосвязи группы переменных. МШ выявляет шкалы как критерии, по которым поляризуются объекты при их субъективном попарном сравнении.
Классификация методов по исходным предположениям о структуре данных
1. Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. На корреляционной модели основаны ФА, МР, отчасти – ДА.
2. Методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними. На дистантной модели основаны КА и МШ, частично – ДА. МШ и ДА подтверждают предположение о том, что исходные различия между объектами можно представить как расстояния между ними в пространстве небольшого числа шкал (функций).
Классификация методов по виду исходных данных
1. Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов (МР, ДА и ФА).
2. Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами (КА и МШ). МШ, кроме того, может анализировать данные о попарном сходстве между совокупностью объектов, оцененном группой экспертов. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами.
2. Множественный регрессионный анализ (МР)
МР предназначен для изучения взаимосвязи одной переменной (зависимой) и нескольких других переменных (независимых) в интересах предсказания некоторого результата или существенности влияния той или иной переменной на предсказываемый результат.
Исходные данные для МР представляют собой матицу «объект-признак».
Связь одной переменной (зависимой) Y и нескольких других переменных (независимых) Xn выражают линейным уравнением
y = b0 + b1 x1 + b2 x2+ … + bn xn+ e,
где: y – зависимая переменная; x1, 2 … n – независимые переменные; b1, 2 … n – параметры модели; e – ошибка предсказания.
Небезынтересно знать, что используя данные тестирования по 16-фактороному опроснику, Р. Кеттелл, с помощью МР выявил профессиональные портреты для:
• психотерапевта у = 0,72A + 0,29B + 0,29H + 0,29N,
• психодиагноста у = 0,31A + 0,78B + 0,47N,
из которых следует, что для психотерапевта важна общительность (А), а для психодиагноста – интеллект (В).
Условия получения приемлемых результатов МР
Регрессия, как и корреляция, анализирует линейные зависимости. Ранее была рассмотрена процедура оценки криволинейных зависимостей в контексте простого регрессионного анализа. Если теория или статистический расчет показывает, что между критерием и одним или несколькими предикторами существует криволинейная зависимость, то можно применить процедуру линеаризации.
Основные условия применения МРА:
1. Исследование должно быть продумано по форме и исполнению. Анализ регрессии для не связанных по смыслу величин приводит к бесполезным результатам.
2. Объем выборки желательно иметь n ≥ 50.
3. Данные должны быть корректными и записаны в таблицу без ошибок.
4. Распределение значений предикторов должно быть близким к нормальному (значения асимметрий и эксцессов по модулю не превосходят 1).
5. Нормальность распределения зависимой переменной также желательна, однако допустимы как отклонения от нормальности, так и использование дискретных переменных с малым числом значений.
6. Наиболее жестким требованием является запрет на использование независимых переменных, корреляции между которыми близки к 1 (-1). Поэтому перед проведением регрессионного анализа никогда не бывает лишним вычисление корреляций между предикторами.
7. Не желательно задействовать предикторы, совпадающие по смыслу.
Задача 1. Для решения требуется программа SPSS и файл данных MR.sav. Число объектов в файле данных MR.sav n = 46. Переменные файла, которые мы будем использовать: помощь – зависимая переменная, интерпретируемая как время (в секундах) оказания помощи партнеру (среднее – 30, стандартное отклонение – 10); симпатия – оценка своей симпатии к партнеру, нуждающемуся в помощи (по 20-балльной шкале); агрессия – оценка своей агрессивности к партнеру (по 20-балльной шкале); польза – оценка пользы от своей помощи (по 20-балльной шкале); проблема – оценка серьезности проблемы своего партнера (по 20-балльной шкале); эмпатия – оценка эмпатии (склонности к сопереживанию) как результат тестирования (по 10-балльной шкале).
1. Запустите программу SPSS. После выполнения этого шага на экране появится окно редактора данных SPSS. Откройте файл данных MR.sav, выполнив следующие действия: выберите в меню File (файл) команду Open ► Data (открыть ►данные) или щелкните на кнопке Open File (открыть файл) панели инструментов. В открывшемся диалоговом окне дважды щелкните на имени MR.sav или введите его с клавиатуры и щелкните па кнопке ОК.
2. В меню Analyze (анализ) выберите команду Regression ► Linear (регрессия ► линейная). На экране появится диалоговое окно Linear Regression (линейная регрессия) (рис. 1).
3. Щелкните сначала на переменной помощь, чтобы выделить се, а затем – на верхней кнопке со стрелкой, чтобы переместить переменную в поле Dependent (зависимая переменная). Выделите переменные симпатия, проблема, эмпатия, польза и агрессия, затем переместите их в список Independent(s) (независимые переменные).
4. В раскрывающемся списке Method (метод) выберите пункт Forward (прямой). Щелкните на кнопке ОК, чтобы открыть окно вывода.
5. В результате программа сгенерирует данные, показывающие, какая из независимых переменных оказывает наибольшее влияние на зависимую переменную. Метод Forward (прямой) обеспечит включение в уравнение регрессии всех предикторов, имеющих значимую частную корреляцию с критерием β в порядке убывания значимости.
Задача 2. Для решения требуется программа SPSS и файл данных MR.sav.
1. Откройте диалоговое окно Linear Regression (линейная регрессия), показанное на рис. 1. Если Вы уже успели поработать с этим окном, очистите его щелчком на кнопке Reset (сброс) и выполните следующие действия.
2. Щелкните сначала на переменной помощь, чтобы выделить се, а затем – на верхней кнопке со стрелкой, чтобы переместить переменную в поле Dependent (зависимая переменная). Выделите переменные симпатия, проблема, эмпатия, польза и агрессия, затем переместите их в список Independent(s) (независимые переменные).
3. В раскрывающемся списке Method (метод) выберите пункт Stepwise (по шагам).
4. Щелкните па кнопке Statistics (статистики), чтобы открыть диалоговое окно Linear Regression: Statistics (линейная регрессия: статистики), (рис. 2). Установите флажок Descriptives (описательные статистики) и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Linear Regression (линейная регрессия).
5. Щелкните па кнопке Save (сохранение), чтобы открыть диалоговое окно Linear Regression: Save (линейная регрессия: сохранение) (рис. 3). Установите флажок Unstandardized (нестандартизированные значения) и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Linear Regression (линейная регрессия).
6. Щелкните на кнопке Options (параметры), чтобы открыть диалоговое окно Linear Regression: Options (линейная регрессия: параметры), показанное на рис. 4. В поле Entry (включение) введите значение 0,1, в поле Removal (удаление) введите значение 0,2 и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Linear Regression (линейная регрессия).
7. Щелкните на кнопке ОК, чтобы открыть окно вывода.
В результате выполнения приведенных инструкций будут сгенерированы данные, позволяющие судить о том, какая из независимых переменных оказывает наибольшее влияние на критерий.
На основе этих данных можно составить уравнение регрессии:
(помощь) = – 5 ,315 + 1,257 (польза) + 1,168 (агрессия) + 1,033(симпатия).
Вопросы и задания для самоконтроля
1. Приведите классификацию методов многомерной регрессии по назначению.
2. Приведите классификацию методов многомерной регрессии по исходным предположениям о структуре данных.
3. Приведите классификацию методов многомерной регрессии по виду исходных данных.
4. Что является результатом множественного регрессионного анализа является?