Понятие независимой выборки
Независимые выборки - это выборки, все элементы которых выбираются случайным образом.
Многие статистические анализы основаны на предположении, что выборки являются независимыми. Другие предназначены для оценки параметров, которые не являются независимыми.
Например, предположим, что инспекторы хотят сравнить две лаборатории по качеству, чтобы определить, дают ли их анализы крови схожие результаты. Они отправляют образцы крови, взятые у 10 детей, в обе лаборатории для анализа.
Поскольку обе лаборатории тестировали образцы крови одних и тех же 10 детей, результаты теста не являются независимыми. Чтобы сравнить средние результаты анализа крови в двух лабораториях, инспекторам потребуется выполнить парный t-тест, основанный на предположении, что образцы являются зависимыми.
Чтобы получить независимые образцы, инспекторам необходимо было бы случайным образом отобрать и проверить 10 детей в лаборатории А, а затем случайным образом выбрать и проверить другую группу из 10 разных детей в лаборатории В. Затем они могли бы сравнить средние результаты анализа крови из двух лабораторий, используя t-критерий с двумя выборками, основанный на предположении, что выборки независимы.
Статистические тесты основаны на предположении, что каждый субъект (или каждая экспериментальная единица) были отобраны независимо от остальных. Данные независимы тогда, когда любой случайный фактор, обладающий слишком высоким или слишком низким значением, влияет только на это значение. Если случайный фактор (тот, который не учитывался при анализе данных) может повлиять на несколько значений (но не на все), то данные не являются независимыми.
Понятие независимости довольно трудно определить. Рассмотрим следующие три ситуации:
- Человек измеряет кровяное давление у животных. У него есть пять животных в каждой группе, и измерить кровяное давление необходимо три раза у каждого. У него нет 15 независимых измерений. Если одно животное имеет более высокое кровяное давление, чем остальные, все три измерения у этого животного, вероятно, будут высокими. Нужно усреднить три измерения у каждого животного. Теперь у него есть пять средних значений, которые не зависят друг от друга;
- Проводится биохимический эксперимент три раза, каждый раз в трех экземплярах. У исследователя нет девяти независимых значений, так как ошибка в подготовке реагентов для одного эксперимента может повлиять на все три. Если усреднить данные, то у него появится три независимых средних значения;
- Проводится клиническое исследование, для которого набирают 10 пациентов из городской больницы и еще 10 пациентов из пригородной клиники. Иными словами, не было произведено независимой выборки 20 субъектов из одной популяции. Данные, полученные от 10 пациентов в центре города, могут быть более схожи друг с другом, чем данные, полученные от пациентов в пригороде. Таким образом, была выбрана выборка из двух популяций, и в дальнейшем при анализе нужно учитывать это.
T-критерий для независимых выборок
T-критерий для двух независимых выборок может быть использован для определения наличия статистически значимой разницы между средними значениями двух независимых выборок. Иными словами, t-критерий подходит для проверки гипотезы о разнице между двумя независимыми выборками. Таким образом, тестируемая переменная должна иметь интервальное масштабирование (связь с уровнем масштабирования) и нормальное распределение. В отличие от Т-теста для парных переменных, в этом случае они не обязательно должны быть одинакового размера.
Т-критерий для двух независимых выборок используется для ответа на вопрос о том, различаются ли две группы по определенному признаку (потребительское поведение, стрессоустойчивость, отношение к различным проблемам и др.), или в случае, когда экспериментальная группа дает результаты, отличающиеся от результатов контрольной группы (успех в лечении, результаты некоторых тестов и т. д.). Поэтому этот t-тест подходит для таких вопросов, как «отличается ли потребительское поведение мужчин и женщин?» или «экспериментальная группа и контрольная группа по-разному реагируют на метод лечения?».
Процедура проведения t-теста для двух независимых выборок осуществляется на основе вопроса, взятого из маркетингового исследования.
Группу респондентов, состоящую примерно из половины мужчин и половины женщин, просят оценить качество продукта по шкале от 0 до 10, где 0 – это «очень плохо», а 10 – это «очень хорошо». Исследовательский вопрос можно сформулировать следующим образом: «По-разному ли оценивают качество продукта женщины и мужчины?». Цель исследования состоит в том, чтобы выяснить, как качество продукта влияет на его выбор у мужчин и женщин.
Чтобы проверить вопрос исследования статистически, необходимо сформулировать гипотезы. Другими словами, должно быть возможно выяснить, может ли разница в средних выборок быть обобщена на все популяцию, лежащую в основе выборок.
T-тесты являются параметрическими тестами, что подразумевает под собой возможность указания распределения вероятностей для совокупности переменных, из которой были взята выборка. Параметрические (и непараметрические) тесты имеют ряд допущений. Если эти предположения нарушаются, исследователь не может быть уверен в том, что тестовая статистика соответствует распределению t, и в этом случае p-значения могут быть неточными.
Предположения теста:
- Нормальное распределение данных. Следует обратить внимание на то, что t-тесты достаточно устойчивы к нарушениям нормальности (хотя следует учитывать влияние выбросов);
- Дисперсии каждого образца предполагаются примерно равными. t-тесты также достаточно устойчивы к нарушениям равной дисперсии, если размеры выборки одинаковы, но могут возникнуть проблемы, если размеры выборки сильно различаются. В случае неравных отклонений может быть лучше выполнить t-критерий Уэлча, который не допускает таких отклонений;
- Независимость. Наблюдения должны были быть выбраны случайным образом из популяции так, чтобы два выборочных средних позволили дать объективную оценку средних по населению. Если отдельные данные связаны каким-либо образом, то допущение независимости будет нарушено.
Представление результатов теста:
- Письменное. Как минимум, следует отметить наблюдаемую t-статистику, P-значение и количество степеней свободы. Например, можно написать «рН был значительно выше в реке А, чем в реке В (независимые образцы t- тест: t = 6,98, df = 18, P
- Визуальное. Графики или столбчатые диаграммы с полосами ошибок являются эффективными способами сообщения об изменении одной переменной в сравнении с другой.