Параметрические процедуры статистического анализа данных
Параметрическая статистика – это научная дисциплина, изучающая количественную сторону массовых общественных явлений, представленных в числовой форме, и выявляющая отношения между ними.
Основанием параметрических методов являются вполне вероятные предположения о характере распределения случайной величины. Чаще всего эти методы используются в анализе экспериментальных данных и предположении нормальности распределения этих данных.
Данное предположение имеет следствие – необходимость оценки исследуемых параметров распределения. Например, в t-тесте Стьюдента, оцениваемыми параметрами являются математическое ожидание и дисперсия.
Этот тест довольно часто используют для того, чтобы сравнить средние значения двух рядов данных на однородность или неоднородность. Кроме этого делается дополнительное предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях – данные извлечены были из них.
Метод параметрического анализа имеет достоинство, заключающееся в том, что обладает высокой мощностью, т.е. способностью избегать ошибки второго рода или β-ошибки.
Чем меньше ошибки второго рода, тем мощность теста будет выше.
Параметрические тесты требуют специальных метрических шкал для описания имеющихся данных. Интервальная шкала и шкала отношений, которую называют абсолютной шкалой, относятся к метрическим шкалам.
С помощью интервальной шкалы исследователь может выяснить отношения равенства или неравенства элементов выборки, может оценить эквивалентность интервалов.
Абсолютная шкала оценивает эквивалентность отношений между элементами множества, которые получают в ходе измерения.
Исходя из этого, метрические шкалы относятся к сильным измерительным шкалам, поэтому параметрические методы точно выражают различия в распределении случайной величины при условии истинности гипотез.
Параметрические методы статистики применяются значительно шире, потому что в теории математической статистики они лучше разработаны. С другой стороны, использование методов параметрического анализа имеет свои трудности, которые состоят в том, что априорные предположения о характере исследуемых случайных величин, могут быть неверными.
Подобные случаи являются характерными для психологических исследований каких-либо ситуаций.
Использование параметрического теста Стьюдента может в какой-то степени исказить выводы – это может произойти тогда, когда сравниваются две выборки, и обнаруживается, что распределение данных отличается от нормального и дисперсии в двух выборках значительно разнятся.
Но, в большинстве случаев, некоторые отклонения от теоретически заданных предположений являются некритичными для окончательного статистического вывода, хотя серьезная угроза сохраняется.
Для смягчения жестких требований параметрических моделей, назначают специальные процедуры для коррекции принятия решения по поводу истинности статистических гипотез.
Параметрическая статистика
Параметрическая статистика является отраслью статистики и предполагает, что данные берутся из типа распределения вероятности и делаются выводы о параметрах распределения.
Основная часть известных элементарных статистических методов относится к параметрическим.
Рисунок 1. Статистические методы. Автор24 — интернет-биржа студенческих работ
Параметрическая статистика имеет постоянное число параметров и делает больше предположений. При правильности дополнительных предположений, параметрические методы дают более точные оценки.
При неправильности предположений параметрические методы могут исследователя ввести в заблуждение.
Параметрические формулы, однако, просты, их можно быстро записать и так же быстро вычислить.
Объем выборки, является одним из факторов, который ограничивает применение статистических критериев, основанных на предположении нормальности. Если выборка большая, допустим 100 и более наблюдений, то в этом случае выборочное распределение можно считать нормальным.
При малой выборке использовать параметрические критерии можно только при наличии уверенности в том, что переменная точно имеет нормальное распределение.
Методы параметрической статистики, которые рассматриваются во всех руководствах по статистике, относятся к рабочим инструментам в решении многих задач.
Для решения этих задач требуется большой статистический материал, что на практике оказывается недостаточно эффективно.
Гипотезы о законе распределения и согласования выборки проверяются при помощи различных критериев.
Параметрическая статистика предполагает наличие математической модели поведения рассматриваемых переменных и одно из них составляет группа статистики, предполагающая, что переменные происходят в основном из популяции, которая описывается функцией нормального распределения. Его удобство состоит в том, что оно имеет разработанную теорию, поэтому при проведении исследований легко обрабатывается.
Исследователя, чаще всего при решении прикладных задач методами математической статистики, интересуют значения восстанавливаемых параметров, поэтому методам параметрической статистики уделяется наибольшее внимание.
При использовании параметрических критериев заключение о случайности или неслучайности различий между выборочными совокупностями происходит на основании сравнения параметров распределений.
Каждый из этих параметров, отражает характерные свойства распределения данной случайной величины в виде единственного числа – это количественные меры этих свойств.
На практике рассматривают два параметра – среднее значение и дисперсию, но чаще всего, стандартное отклонение, которое является мерой вариации. Оба эти параметра имеют два популярных параметрических критерия:
- критерий Стьюдента,
- критерий Фишера.
Непараметрические методы математической статистики
Непараметрическими называются такие методы, при которых не происходит выдвижение каких-либо предположений о характере распределения исследуемых данных.
Кроме того, непараметрические методы не предполагают каких-либо допущений о соотношении параметров распределения анализируемых величин – в этом состоит основное достоинство непараметрических методов.
Преимущество непараметрической статистики полно раскрывается тогда, когда полученные в эксперименте результаты, оказываются представлены в слабой неметрической шкале, представляя собой результаты ранжирования.
Эта шкала носит название шкалы порядка.
В некоторых случаях исследователь может преобразовать данные к сильной интервальной шкале, используя при этом, процедуры нормализации данных. Но, в данной ситуации оптимальным вариантом является применение непараметрических тестов, созданных специально для статистического анализа.
Тесты непараметрической статистики, как правило, предполагают оценивание имеющихся отношений ранговых сумм в нескольких выборках, на основании чего формулируется вывод о соотношении этих выборок. Например, тест критерий знаков, критерий знаковых рангов Уилкоксона.
Если результаты измерения представить в более сильной шкале, то использование непараметрической статистики будет означать отказ от части информации, содержащейся в данных.
При этом следствием будет опасность возрастания ошибки второго ряда, свойственной этим методам.
Если сравнивать методы параметрической и непараметрической статистики, то вторые более консервативны и их использование в большей мере вызывает ошибки второго ряда, что означает – исследователь не может обнаружить отличия двух выборок, но они на самом деле имеют место.
Таким образом, непараметрические методы оказываются не такими мощными, поэтому их использование менее предпочтительно.