Основные этапы обработки и анализа социологической информации
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Основные этапы обработки и анализа социологической информации
Экспериментальные данные, собранные в ходе исследования необходимо привести
в соответствующий для дальнейшего анализа вид.
Первый этап работы с полученными материалами состоит в их первичной
статистической обработке. Все анкеты должны быть проверены на качество заполнения.
Анкеты, в которых информация не полная, по мнению некоторых исследователей
отсутствует более 30% ответов, выбраковываются. Также подвергаются выбраковке и
анкеты, в которых нет данных «паспортички», если эти данные являются значимыми для
нашего исследования.
Затем, все сведения желательно сгруппировать по заранее разработанным схемам,
которые в свою очередь сформированы вокруг одного или нескольких значимых
признаков исследования. Например, массив анкет может быть сгруппирован по
социально-демографическим признакам – мужчины, женщины, рабочие отдельных цехов,
бригад, студенты отдельных факультетов и пр. В другом случае массив анкет может
формироваться относительно даты опроса, периода исследования и пр. Данная
группировка способствует облегчению работы с материалом, заранее классифицирует
ответы респондентов, позволяя социологу уже в процессе статистической обработки
осуществлять дополнительные выводы по полученным данным, усматривать явные
закономерности.
Необходимо пронумеровать анкеты, чтобы в ходе процедуры введения данных в
базу компьютера одна и та же анкета не была введена дважды или не осталась за
пределами анализа.
Для облегчения ввода данных необходимо, чтобы в анкете была задана кодировка.
Другими словами, необходимо, чтобы каждый вопрос, и каждый из вариантов ответов
анкеты имел собственный числовой код. Числовая кодировка может быть сплошной через
всю анкету, тогда каждый из вариантов ответов будет иметь собственный
идентификационный числовой код, или варианты ответов могут быть подчинены
порядковому номеру вопроса, например, вопрос 1, варианты ответов – 1.1., 1.2. и т.д. Хотя
при машинной обработке такая кодировка менее удобна, лучше заранее разработать
анкету со сплошным типом кодирования, тогда возникнет меньше ошибок в
распознавании ответов и переносе данных с листа анкеты в матрицу компьютера.
Разработка матрицы для ввода данных, если под рукой нет программного
обеспечения, представляет собой логическое распределение информации по одному или
одновременно по нескольким признакам. В случае, если обработка информации
осуществляется по одному признаку – количественному - тип обработки получил
название «линейной» или «линейки». В этом случае информация из каждой анкеты
вносится в соответствующую ячейку как единица. Суммарное число внесенной в ячейку
информации и служит результатом статистического подсчета.
В случае ручной обработки информации не по одному, а сразу по двум или
нескольким признакам процедура имеет название двумерного или многомерного
распределения информации. Матрица для двумерного распределения информации может
выглядеть как на рисунке ниже.
Вопрос: «Как часто вы бываете в доме культуры?» Пол респондентов
1.1.Ежедневно
1.2. Часто, раз в неделю
1.3.Иногда несколько раз в месяц
1.4. Не посещаю дом культуры
1.5. Затрудняюсь ответить
Итого:
всего
муж
жен
абс
%
3
25
16
6
50
5
15
30
50
5
18
55
16
6
100
5
18
55
16
6
100%
Здесь представлен образец двумерного распределения информации по признакам:
«интенсивность посещения дома культуры» и «пол». Было опрошено по пятьдесят
респондентов мужского и женского пола, жителей условного населенного пункта. Пять
позиций интенсивности посещения дома культуры и распределение информации
относительно пола респондентов позволяют выяснить общую ситуацию популярности
местного дома культуры у жителей. На основании полученных данных можно сделать
вывод о низкой популярности досуга в учреждении среди мужчин и достаточно высокой –
у женщин.
3.2.Способы и программы обработки статистической информации
В стандартном программном оснащении Microsoft имеется возможность
построения подобного вида матрицы двумерного распределения информации в программе
Excel, которая к тому же способна делать линейный расчет данных. Информация может
быть распределена относительно одного признака или нескольких признаков, в
зависимости от потребностей социолога и характера полученных данных.
Первая версия Excel была выпущена в 1985 году, а первая версия для Windows
была выпущена в ноябре 1987 года. С 1988 года Excel повысила свои продажи, что в
конечном итоге помогло Microsoft достичь позиций ведущего разработчика программного
обеспечения. Microsoft укрепляла свое преимущество с выпуском каждой новой версии,
что имело место примерно каждые два года.
В сравнении с первыми табличными процессорами Excel представляет множество
новых функций пользовательского интерфейса, но суть остается прежней: как и в
программе-родоначальнике, VisiCalc, ячейки расставляются в строки и столбцы и могут
содержать данные или формулы с относительными или абсолютными ссылками на другие
клетки.
Excel был первым табличным процессором, позволявшим пользователю менять
внешний вид таблицы (шрифты, символы и внешний вид ячеек). Он также первым
представил метод умного пересчета ячеек, когда обновляются только те ячейки, которые
зависят от измененных ячеек (раньше табличные процессоры либо постоянно
пересчитывали все ячейки или ждали команды пользователя).
В программном обеспечении Statistica или программе обработки данных SPSS
также можно успешно осуществлять статистическую обработку информации.
Пакет Statistica разработан фирмой StatSoft (США). Первоначально он входил в
качестве модуля в состав самых популярных в то время электронных таблиц Lotus. Как
самостоятельный продукт пакет впервые заявил о себе в 1991 г. Наиболее популярная
версия продукта совместима с Windows 95/98, в ней поддерживаются графический
интерфейс пользователя и динамический обмен данными. Благодаря этому пакет может
работать в сочетании с другими Windows-приложениями.
Statistica позволяет проводить исчерпывающий, всесторонний анализ данных,
представлять результаты анализа в виде таблиц и графиков, автоматически создавать
отчеты о проделанной работе. С помощью удобной системы подсказок можно обучаться
не только работе с самим пакетом, но и современным методам статистического анализа.
Данные в системе Statistica организованы в виде электронных таблиц, как в
привычной для пользователей программе Excel. Файл содержит наблюдения и
переменные. Наблюдения можно рассматривать как эквивалент записей в базах данных
(или строк электронной таблицы), а переменные - как эквивалент полей (столбцов
электронной таблицы). Каждое наблюдение состоит из набора значений переменной.
В пакете Statistica все операции, включая копирование, перетаскивание и
автоматическое заполнение ячеек, производятся так же, как в популярных электронных
таблицах. При нажатии правой кнопки мыши появляется всплывающее меню, где точно
так же предлагается перечень операций, которые можно выполнить над выделенным
объектом (см. рисунок ниже). Система Statistica предоставляет всесторонние возможности
по импорту и экспорту данных, в том числе и из таблиц Excel.
SPSS - одна из старейших систем статистического анализа и управления данными,
продукт фирмы SPSS Inc. (Statistical Products and Service Solution - Статистические
продукты и сервисные решения), сегодня SPSS является одним из лидеров среди
универсальных статистических пакетов.
Интерфейс пакета SPSS построен как традиционная база данных: накопление
массива информации, его формализация и представление результатов статистической
обработки массива в виде отчета. Но так как пакет предназначен для выполнения
специализированной функции - обработки результатов опросов - он имеет структурное
отличие от традиционных баз данных, выраженное в принципах формализации
накопляемого массива исходной информации, принципах статистической обработки и
представления результатов информации. Но внешних отличий интерфейса от
традиционных баз данных или электронных таблиц (MS Access, MS Excel и т.п.) нет, что
значительно упрощает первое знакомство с пакетом и позволяет достаточно быстро
начать процедуру ввода или импорта данных, кроме того, пакет включает справочник и
глоссарий статистических терминов. Внешний вид файлового окна представлен на
рисунке ниже.
Пакет обладает огромными возможностями построения графиков. В средстве
Charts Carousel этой программы выводятся все типы возможных диаграмм и графиков.
Строить их можно поочередно или щелчком мыши выбирая имя нужного графика в
прокручиваемом блоке Carousel. Диалоговое окно запрашивает спецификацию списка
независимых переменных и любых факторных переменных. После этого можно выбрать
различные варианты: прямоугольные диаграммы с выбросами (box-and-whisker),
древовидные диаграммы (stem-and-leaf), графики нормального распределения и графики
разброса точек.
Стандартные средства включают в себя столбчатые диаграммы, закрашенные
графики, круговые диаграммы, графики минимальных/максимальных значений и
гистограммы.
Таким образом, при помощи программных разработок сегодня вариативность
работы с социологическими данными многократно увеличивается.