Психометрические основы психодиагностики
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема лекции по психодиагностике «Психометрические основы психодиагностики»
Вопросы, рассматриваемые на лекции:
1. Понятие психометрии
2. Психометрические основы психодиагностики
3. Понятие дифференциальной и общей психометрии
4. Основные понятия, используемые в психометрии
5. Вопросы объективности психологического тестирования
Вступительное слово. Каждый человек уникальный, поэтому изучение человеческой психики уже на протяжении многих столетий представляет интерес для исследователей. Но сами по себе методы и способы диагностики были бы несовершенными, а их результаты весьма спорными без такой науки как психометрия.
Понятие психометрии
Психометрия или психометрика является областью психологии, связанной с теорией и практикой измерения психических явлений. Понятие психометрии ввел в 1734 г. Христиан Вольф, впервые указавший на возможность измерения в психологии. Одним из первых измерений в психологии было измерение времени реакции, поэтому изначально под психометрией понимали измерение временных характеристик психических процессов. Позже по мере развития психологического эксперимента, строящегося по образцу и подобию естественных наук, к психометрии начали относить все, что касается количественного определения психических явлений. Сегодня к психометрии относят весь спектр психологических измерений – как психофизические, так и личностные.
Создание любого инструмента психологического измерения осуществляется в соответствии с определенными требованиями. Эти требования связаны с точностью, надежностью и адекватностью (валидностью) методики измерений, сопоставимостью результатов, полученных с ее помощью. Соблюдение этих требований устанавливается путем применения специальных математических и статистических процедур, совершенствование и развитие которых в основном связаны с построением психологических тестов. Поэтому во многом благодаря разработке тестов в 20-30-е годы 20-го века сформировалась особая область психометрии, которая касается индивидуальных психологических различий в психодиагностике - дифференциальная психометрия.
Психометрические основы психодиагностики
Основные психометрические свойства
Основными психометрическими свойствами тестирования являются валидность, надежность. Это не удивительно, поскольку без этих свойств тест нельзя было бы вообще рассматривать как достоверный метод диагностики. Также проблемным является вопрос о репрезентативности норм и стандартизации теста.
Репрезентативность норм. Стандартизация.
Нормы понимаются как показатели для различных групп субъектов, полученные путем стандартизации теста. Репрезентативность стандартов - это соответствие стандартов тестирования стандартизации стандартам тестирования населения, в котором этот тест применяется.
Стандартизация теста - это унификация, процедура регулирования, которая приводит к единому стандарту процедуры и оценки теста. Стандартизация помогает достичь сопоставимости результатов, полученных между различными субъектами. Благодаря этому можно выразить результаты тестов в стандартизированных показателях по отношению к выборке, сравнивая эти показатели различными способами.
При психодиагностике различают две формы стандартизации:
1) стандартизация порядка выполнения инструкций, форм, способа регистрации, условий и т.д. Без стандартизации теста невозможно получить нормативное распределение контрольных точек и, следовательно, норм теста;
2) стандартизация шкалы, то есть линейное преобразование шкалы от нормальной (или искусственно) нормализованной шкалы. Смысл преобразований исходных оценок теста заключается в изменении характера их распределения для облегчения понимания и интерпретации результатов теста. Например, через расчет процентилей.
Процентиль - это процент субъектов, чей балл ниже определенной первичной оценки (конкретный балл, который субъект получает за тест).
Алгоритм расчета выглядит следующим образом:
1) сортировка сырых баллов (по возрастанию или по убыванию);
2) частота встречаемости конкретных точек;
3) расчет накопленных частот (группировка в определенный интервал);
4) расчет процентиля.
Преимущества: 1) они легко рассчитываются; 2) подходит для любого теста.
Недостатки: неровность данных единиц.
Очень часто используются три основных типа преобразований:
1) приведение к нормальному виду;
2) приведение к стандартной форме;
3) квантильная стандартизация.
Стандартизация психодиагностических тестов основана на так называемой аксиоме нормальности, то есть основана на предположении, что все психические характеристики распределены в популяции в соответствии с законом Гаусса. При таком распределении большинство значений группируются вокруг определенного среднего значения, с обеих сторон которого частота наблюдений равномерно уменьшается. Нормальное распределение имеет форму симметричной колоколообразной кривой, вытянутой до бесконечности в положительном и отрицательном направлениях.
Интерпретация результатов теста невозможна без знания того, к какой кривой распределения они принадлежат. Это означает, что для оценки размера теста и частоты его выполнения необходимо соотнести их с общим средним значением и стандартным отклонением. Без этого начальные результаты тестов ничего не скажут нам о серьезности изученного признака и вероятности того, что такое значение появится у других людей.
Предположение о нормальности в распределении результатов испытаний является идеализацией. Практика показывает, что многие тесты дают результаты, распределение которых отличается от нормального. Поэтому часто необходимо найти способ преобразовать данные в их нормальную форму. В начале поиска метода конвертации очень полезно создать гистограмму и полигон распределения. Они облегчают выявление асимметрии левой или правой стороны, неровностей и других отклонений от нормы. Следовательно, можно преобразовать результаты тестов, которые не подчиняются нормальному закону распределения, так что распределение новых и преобразованных показателей становится нормальным.
Таким образом, недостатки начальных тестов включают в себя:
1) Согласно первоначальным оценкам, мы можем только судить, что: чем выше рейтинг, тем более ярко выражена соответствующая характеристика, но мы не можем ничего сказать о том, каково это по отношению к средней стоимости этого имущества в популяции.
2) невозможность сравнения результатов, полученных с использованием разных тестов. Как правило, разные тесты имеют разные средние значения и стандартные отклонения, поэтому их результаты имеют разные размеры. Чтобы сравнить результаты и устранить различия в размерах, необходимо нормализовать тестовые оценки, введя шкалу, единую для всех оценок. Для этого максимум фактической кривой распределения выравнивается по оси ординат. Эта операция называется центрированием случайной величины и выполняется путем вычитания ее среднего значения из начальной оценки теста.
Таким образом, на практике психолог-исследователь может рассчитать параметры любого распределения, если единицы измерения, используемые в измерении, признаны разумными в научном сообществе.
Понятие надежности. Виды надежности
Надежность можно рассматривать как характеристику методики, которая отражает точность психодиагностических измерений, а также устойчивость результатов к действию странных случайных факторов. Следовательно, его можно определить как внутреннюю согласованность и стабильность во времени.
Дисперсия результатов:
- наиболее измеримое свойство;
- нестабильность процедуры измерения;
- влияние исследуемого образца:
а) репрезентативность образца (описание образца по стандартизации);
б) достоверность определяется в однородной выборке (сходство);
в) для каждого образца свои факторы надежности.
Доступны следующие виды надежности:
- параллельные формы: характеристика надежности психодиагностического метода, который использует взаимозаменяемые тестовые формы, представленные одной и той же группе субъектов;
- достоверность нового теста: характеристика надежности психодиагностической техники при повторном обследовании субъектов, использующих один и тот же тест во времени. Одним из методов его измерения является соотношение показателей для выборки субъектов, оцененных в двух случаях. Наименьшее удовлетворительное значение для надежности нового теста составляет 0,7;
- части теста: достоверность психодиагностической техники, полученной путем анализа стабильности результатов отдельных наборов тестовых заданий или отдельных тестовых заданий.
Особый интерес представляет значение и важность надежности с точки зрения внутренней согласованности. Фактически, чтобы тест был действительным, он должен быть последовательным. Поэтому общепринятый взгляд на психометрию заключается в том, что на практике валидные тесты являются в высокой степени согласованными.
Гомогенность теста свидетельствует о том, что все задания теста устойчиво измеряют одну и ту же психологическую характеристику. Это означает, что если испытуемые имеют одинаковые тестовые оценки, то и степень выраженности у них измеряемого качества одинакова. Таким образом, гомогенность теста — обязательное условие того, чтобы результаты измерения имели однозначную трактовку: в случае негомогенного теста один и те же оценки у разных испытуемых допускают различное объяснение.
Коэффициент надежности = коэффициент корреляции между двумя замерами (больше 0,8).
Понятие валидности. Виды валидности
Классическим определением валидности в психометрической литературе является определение Анны Анастази: «валидность теста - это концепция, связанная с тем, что тест измеряет и насколько хорошо он работает». Инвалидные, то есть недействительные тесты не подходят для практического использования. Следовательно, валидность является неотъемлемой чертой теста, который включает информацию о области исследуемых явлений и репрезентативность диагностической процедуры, которая изучается в этом отношении.
В психометрической литературе выбранные типы валидности различаются. Несмотря на свое разнообразие, существуют основные виды валидности:
1) дифференциальная валидность – это достоверность, которая учитывает внутренние взаимосвязи между психологическими факторами, диагностируемыми с использованием методики (при профессиональном отборе);
2) инкрементная валидность – это тип валидности критерия, который отражает практическую ценность методологии при выборе. Показатель показывает роль теста в улучшении отбора лиц для реальной деятельности, степень эффективности (отбор, профессиональный отбор);
3) консенсусная валидность – это тип валидности, который основан на установлении взаимосвязи данных испытаний с данными, полученными от внешних экспертов, которые хорошо знают диагностированных людей.
4) конструктивная или внутренняя обоснованность. Психологическая конструкция – это теоретическая идея, предназначенная для объяснения и организации существующих знаний. Отражает степень репрезентации психологической конструкции, изученной в результатах теста. Процедура установления сложна (постепенное накопление знаний, информации о динамике развития измеряемого свойства и его взаимодействия с другими явлениями). Метод измерения сравнивает результаты испытаний с другими методами, конструктивное содержание которых уже известно. Слишком высокие корреляции невозможны, потому что в этом случае возможно дублирование или создание параллельных фигур. Установление сходства и различий психологических признаков проходит в таком порядке:
- конвергентная проверка степени близости прямой или обратной связи;
- дискриминационное установление отсутствия.
Плюсы: возможно обновление.
5) очевидная валидность. Представления о тесте, его объеме, эффективности и прогностической ценности, возникающие у субъекта, человека, не имеющего информации о цели, характере теста. Следовательно, это повышает мотивацию субъектов для исследования. Для изучения взрослых степень сложности техники играет важную роль.
Избегайте излишне распространенных имен в формах (лучше всего использовать нейтральные). Возможно, появление критерия загрязнения представляет собой комплекс явлений, связанных с влиянием информации на результаты проверки субъекта на субъективное отношение респондента других людей. Этот тип валидности помогает только добиться сотрудничества с субъектами.
6) Содержательная или логическая валидность. Характеризует степень репрезентативности содержания заданий тестовой зоны по измеряемым свойствам. Маркерные этапы:
1) определение групп изучаемых свойств, расчленение по элементам;
2) разработка реальной тестовой модели деятельности;
3) анализ степени соответствия разработанной модели с помощью обращения к экспертам;
7) критериальная валидность - это связь между показателями методологии и внешним критерием полезности показателя. Она включает:
- прогностическую достоверность или информативный показатель степени, в которой надежность и точность методики позволяют нам судить об свойстве через некоторое время. Определяется по надежному внешнему критерию (показатели реального поведения, ожидаемые результаты деятельности, упражнения, образование);
- текущая или конкурентная действительность, или действительность одновременности. Характеристика, которая отражает способность теста различать предметы на основе диагностического признака, который является предметом исследования во время процедуры. Он определяется с использованием внешнего критерия (текущая успеваемость, производительность труда). Эта валидность измеряется путем сопоставления результатов этого теста с измерениями, в которых используются другие тесты, предназначенные для измерения той же переменной. Конкурентная валидность полезна, когда есть неудовлетворительные данные для измерения определенных переменных, и создаются новые тесты в попытке улучшить качество измерения.
- ретроспективность. Он определяется на основе критериев отраженного события или статуса качества в прошедшем времени (сопоставимость прошлой оценки).
8) экологическая валидность – это обоснованность в отношении измеряемого свойства. Связна она с проблемой влияния ситуации на результаты теста. Проверка переносимости возможна в разных ситуациях.
Существует 2 класса валидности (как процесс):
- теоретическое отношение к самой технике как к инструменту измерения (само психологическое свойство);
- прагматичный относится к цели использования методики (независимый внешний критерий, и результаты методики сравниваются с ним).
Экологическая валидность действует, когда:
1) когда то, что она измеряет, очевидно;
2) когда теория, на которой она строилась, очень характерна.
Критерии валидности – это мера психического свойства, изучение которого направлено на психодиагностическую технику. Критерии проверки:
- объективные, социально-демографические, биографические данные (стаж работы, образование, профессия)
- показатели успеваемости (тесты интеллекта)
- показатели эффективности производства для реализации отдельных видов деятельности (профессиональный отбор, профессиональная ориентация)
- результаты реальной деятельности (рисование, лепка, музыка; тесты на общие и специальные навыки, личность)
- медицинский диагноз (клиническая психология)
- контроль знаний и навыков испытуемых, данные других методов или тестов, валидность которых считается уже установленной.
Характерные критерии:
- цель;
- субъективный анализ (оценки, экспертные оценки).
Существует также 4 метода для проведения процедуры валидации:
1) коллективная оценка (рейтинговая шкала, условия развития; общее компромиссное решение;
2) средневзвешенный метод оценки (каждая тема оценивается несколькими экспертами, результаты усредняются);
3) классификация (распределение членов выборки по шкале);
4) метод сравнения по парам (расположение по парам согласно альтернативным характеристикам.
Выбор критериев валидации является очень важным и решающим шагом. Чем сложнее психическое явление, тем больше критерий.
Соотношение понятий «валидность» и «надежность»
Мы можем сразу заметить тот факт, что это связанные понятия. Обоснованность (или валидность) любой процедуры измерения заключается в уникальности (стабильности) результатов, полученных по отношению к измеренным свойствам объектов, то есть по отношению к измерительным элементам. Надежность - это стабильность процедуры относительно объектов. Надежность не обязательно означает валидность. Стабильность теста по отношению к объектам (субъектам) является необходимым, но недостаточным условием его стабильности по отношению к измеренным атрибутам (свойствам) объектов.
Основное соотношение психометрии: НАДЕЖНОСТЬ ≤ НАДЕЖНОСТЬ.
Это означает, что надежность теста не может превышать его валидность. Однако это соотношение неправильно интерпретируется как указание на прямую пропорциональную связь между валидностью и надежностью. Например, чтобы расширить охват теста (значительная валидность), психодиагностика должна избегать ненужного увеличения внутренней согласованности. Она может быть предельна, а валидность минимальна.
Требования к психометрической подготовке психолога
Эффективное развитие практической психодиагностики сегодня требует резкого роста психометрической культуры всех психологов, использующих психодиагностические методы измерения.
Рекомендуемая литература
1. Ануфриев, А.Ф. Психодиагностика: основы решения диагностических задач / А.Ф. Ануфриев. - М.: Ось-89, 2012. - 144 c.
2. Глуханюк, Н.С. Психодиагностика: Учебник / Н.С. Глуханюк. - М.: Академия, 2018. - 272 c.
3. Перепелкина, Н.О. Психодиагностика: Учебное пособие для бакалавров / Н.О. Перепелкина, Е.П. Мутавчи и др. - М.: Дашков и К, 2016. - 224 c.
4. Психодиагностика: Учебное пособие / Под ред. Белоусовой А.К., Юматовой И.И.. - Рн/Д: Феникс, 2018. - 256 c.
5. Сотников, М.А. ВПС: Психодиагностика. Конспект лекций / М.А. Сотников. - М.: А-Приор, 2008. - 96 c.
6. Юматова, И.И. Психодиагностика: учебное пособие / И.И. Юматова. - РнД: Феникс, 2017. - 254 c.