Понятие выборки
Выборка или выборочный набор - это часть общего набора элементов, охватываемого экспериментом (наблюдение, опрос).
Характеристики выборки:
- качественные характеристики выборки - что мы выбираем и какие методы отбора проб мы используем для этой цели;
- количественные характеристики выборки — какое количество случаев выбирается, иными словами, размер выборки.
Выборка необходима, когда:
- Объект социологического исследования довольно обширный. Например, потребители продукции глобальной компании - это огромное количество географически разбросанных по миру рынков.
- Есть необходимость сбора вторичной информации.
Размер выборки – это количество дел, событий, действий, включенных в выборку
Образцы можно разделить на большие и маленькие, поскольку в математической статистике используются разные подходы в зависимости от размера выборки. Считается, что, если объем выборки более 30, то такую выборку можно отнести к большим.
Вообще, выделяют два типа выборок: вероятностные и невероятностные.
Вероятностная выборка делится на:
- простую вероятностную,
- простую случайную,
- простую неповторяющуюся.
Простая вероятностная выборка. Применение данной выборки основано на предположении о том, что каждый респондент с одинаковой вероятностью будет включен в выборку. На основании списка населения в целом составляются карточки с номерами респондентов. Они помещаются в колоду, перетасовываются и из них случайным образом извлекается карта, записывается номер, а затем возвращается обратно. Далее процедура повторяется столько раз, сколько нам нужно. Минус: повторение выбора единиц.
Простая случайная выборка. Она имеет очевидные преимущества. Этот метод чрезвычайно прост для понимания. Результаты исследования могут быть распространены на изучаемую популяцию. Большинство подходов к статистическому выводу включают сбор информации путем простой случайной выборки.
Однако простой метод случайной выборки имеет четыре очень важных ограничения:
- часто бывает трудно установить кадр выборки, который позволял бы простую случайную выборку;
- простая случайная выборка может привести к большой популяции или распространению на большой географической территории, а это, в свою очередь, сильно увеличивает стоимость и время поиска данных;
- итоги простой случайной выборки практически всегда характеризуются довольно низкой точностью и стандартными ошибками;
- в результате использования SRS может быть сформирована нерепрезентативная выборка.
Выборки, которые были получены с помощью простого случайного отбора, обычно адекватно представляют общую популяцию, но некоторые из них представляют исследуемую популяцию некорректно. Это особенно заметно при небольшом размере выборки.
Простая неповторяющаяся выборка. Порядок построения выборки тот же, только карточки с номерами респондентов не возвращаются обратно в колоду.
Репрезентативность выборки в социологическом исследовании
Проблема ошибок репрезентативности характерна для вероятностных выборок, она связана, прежде всего, с прерывистым характером выбора единиц наблюдения. Эти ошибки называются случайными. Они не опасны для исследований, поскольку существуют математические средства определения их величины и, соответственно, способы их устранения.
Одним из способов является увеличение размера выборки. Чем больше размер выборки, тем меньше ошибка (и размер выборки, равный совокупности, полностью исключает случайные ошибки). Систематические ошибки более опасны. Это ошибки другого рода, они могут встречаться не только в выборочных исследованиях. Их иногда называют ошибками смещения. Их причины кроются в том, что в исследовании была неправильно составлена структура выборки (использовались устаревшие данные, неполная или отсутствовала статистика по некоторым важным характеристикам выборки), плохо выбран метод выбора единиц наблюдения, респондентов по разным причинам ", выпал опроса (отсутствует, отказался отвечать) и т. д.
Для устранения этих ошибок математические инструменты бесполезны. Это требует, во-первых, логического анализа причин систематических ошибок, а во-вторых, разработки системы мер по их устранению. Это меры, направленные на улучшение основы выборки, разработку плана ее поэтапного формирования, меры по устранению недостатка данных, ошибок в сборе и обработке информации.
Если образец построен правильно, исследование дает довольно точные результаты даже при небольшом объеме. Но когда в его конструкции допускаются систематические ошибки, большой объем не может быть сохранен. Вот классический пример ошибки такого рода, взятый из истории исследований общественного мнения в Соединенных Штатах.
Поскольку массовые опросы общественного мнения стали своего рода модой в стране, многие СМИ склонны делать выводы об общественных настроениях в целом на основе результатов опросов зрителей, слушателей, читателей и подписчиков. Однако есть как минимум три причины, которые не позволяют полностью доверять опубликованным материалам:
- Во-первых, подписчики и читатели любых, даже самых массовых изданий, не представляют репрезентативную группу по отношению ко всему населению. Среди них, как правило, преобладают городские жители, лица с более высоким уровнем образования и т. д.
- Во-вторых, только часть заинтересованных людей, в том числе те, у кого есть на это время, отвечают на запросы и призывы СМИ принять участие в опросе.
- В-третьих, поскольку такой опрос выступает в качестве телефона или почты, процент «возврата» мнений и анкет обычно не очень высок. Кроме того, значительная часть из них является неполной или неполноценной (на ряд вопросов нет ответов, некоторые анкеты заполнены с нарушениями, часто в соответствии с условиями опросов от респондентов не требуется аргументов в пользу своего мнения).
Все это было сказано для того, чтобы доказать, что конструкция выборки - достаточно ответственная и сложная, и ее качество во многом зависит от достоверности результатов исследования. Задача построения образца должна решаться каждый раз заново в зависимости от конкретных условий. На этом подготовительный этап социологических исследований заканчивается, и начинается следующий - сбор данных, полевые исследования.