Справочник от Автор24
Поделись лекцией за скидку на Автор24

Методы формализованного анализа массовой текстовой информации

  • 👀 317 просмотров
  • 📌 288 загрузок
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Методы формализованного анализа массовой текстовой информации» doc
Лекция № 11: Методы формализованного анализа массовой текстовой информации (контент-анализ) Сам термин «Анализ содержания» (content analysis), как и пер­вые попытки провести статистически точные измерения содержа­ния материалов массовой информации, ведет свое начало от ис­следований в области американской журналистики на рубеже про­шлого и нынешнего веков. Одна из первых работ в этой области — исследование Дж. Спи­да «Дают ли сейчас газеты новости?», опубликованное в 1893г. Дж. Спид проанализировал воскресные выпуски нью-йоркских га­зет за 1881 и 1893 гг. Сравнивая содержание материалов, он решил выяснить, какие изменения произошли в американской прессе за прошедший период. Именно в это время одна из крупнейших сей­час газет «Нью-Йорк Тайме» увеличила свой тираж, снизив цену номера с трех до двух центов и одновременно значительно увели­чив свой объем. Дж. Спид классифицировал содержание материа­лов по темам: литература, религия, сплетни и т. д., измерил длину газетных колонок (в дюймах), отводимую для освещения этих тем, и пришел к следующему выводу: после проведенной «реформы» га­зета стала публиковать больше материалов (как построчно, так и в пропорции по количеству материалов), содержащих пересказ раз­личных скандальных историй, сплетен и слухов. В 1900г. Д. Уилкокс проанализировал содержание номеров 210 газет за один день, применив следующую классификацию ма­териалов: 1. Новости, подразделяющиеся на военные и общие, послед­ние подразделялись на международные, политические, крими­нальные новости, преступления, различные новости; 2. Иллюстрации; 3. Литература; 4. Мнения (редакционные статьи, письма); 5. Реклама. В 1926г. в исследовании «Провинциальная газета» Д. Уилли использовал классификацию газетных сообщений по трем критериям: тема, или сфера действительности (политика, экономик литература и проч.), форма (новости, передовицы и проч.), комбинация того и другого (политические новости). Эти группы, вне зависимости от способа их образования, получили в американской социологии название категории. Основываясь на этом, Уилли, разработал систему классификаций, которая насчитывала 49 категорий: внутриполитические и внешнеполитические новости, дипломатическая корреспонденция, цены и проч. Однако категории были слишком общими. Ранние американские методики, направленные на выяснение соотношений между различного рода материалами, полагались главным образом на количество слов. По этим методикам можно было, например, установить, что газета Н за один год дала сто тысяч строк, подпадающих под категорию «экономика», а на другой год эта цифра возросла до двухсот тысяч. Однако материалы, вошедшие в раздел «экономика», мо­гут освещать различные проблемы и быть связаны с вопросами нравственности, семьи, политики. Американские социологи, в частности Г. Лассуэлл, проводя исследования, часто стремились зафиксировать в материалах слова ставшие ключевыми политическими символами, — «свобода», «правда», «демократия», «равноправие» и т. п. Но эти термины фигурируют в трактатах профессоров, в решениях судов и т. д., поэтому во всех материалах они адекватны по содержанию и единообразно понимаются всеми членами общества. С другой стороны в каждом конкретном случае одно и то же слово наполняется актуальным содержанием. Часто зафиксировать содержание (смысловое) слова как единицы измерения недостаточно, появляется необходимость отмечать суждения, мнения, высказывания, оценки. Это может быть выражено как в отдельных предложениях, так и в целых абзацах. Другая количественная характеристика содержания — частота появления выделенных элементов содержания — характеризует, ту регулярность, с которой коммутатор обращается к пропаганде той или иной идеи. Практика показала, что одна и та же идея, повторенная несколько раз в одном и том же материале, воспринимается как одно суждение, и, следовательно, по эффективности восприятия четыре раза повторенная в двухчасовой программе идея почти экви­валентна одному упоминанию в получасовой программе. Анализ содержания необходимо вести многомерно, многопланово, это позволяет, несмотря на формализацию текста, выявить особенности и скрытые причины провалов или низкой эффектив­ности пропагандистских кампаний. В годы второй мировой войны американские пропагандисты решили увеличить эффект антигитлеровской агитации среди цвет­ных. Это решение базировалось на следующей идее: цветные, хо­тя и страдают от расовой дискриминации, все же кое-чего доби­лись, живя в США, а фюрер, известный своей ненавистью к цвет­ным, в случае победы лишит их всего, что они имеют. По этой проблеме была дана обширная статья одного цветного, которая, как выяснилось, не оправдала себя: простое количественное со­поставление тематических элементов материала показало, что первая тема, т.е. описание того, что цветные получили при амери­канской демократии, составляла 84% от всего материала, а вторая (лишения, которые несет Гитлер) — только 16%. При анализе массовой текстовой информации, прежде всего, из личных источников автора (письма, дневники, мемуары и т.д.) возникает проблема их достоверности. Здесь необходим тщательный анализ мотивов, побуждений, целей и установок ав­тора, реальных ситуаций, в которых он действовал, характера его окружения и т.д. Как правило, можно верить информации, если: • она не затрагивает интересов автора; • наносит ущерб автору; • достоверны сведения, которые в момент составления были общеизвестны; • достоверны детали событий, несущественные с точки зре­ния автора документа; • она содержит сведения, к которым автор относится недобро­желательно. Виды формализованного анализа содержания документов: В зависимости от целей исследования, его объекта можно вы­делить несколько типов анализа содержания. В книге американского социолога Р. Мертона «Социальная теория и социальная структура» выделяется 6 типов контент-анализа: 1. Основан на подсчете символов (ключевых слов), содержащихся в материалах массовой информации; 2. Второй есть дальнейшая разработка первого; его можно назвать классификацией символов по отношению. Символы классифицируются в соответствии с использованием в положительном (благоприятном) или отрицательном (неблагоприятном) аспекте; 3. Третий — это анализ по элементам; он заключается в классификации отдельных частей пропагандистского материала (сцен в фильмах, песен в радиопрограммах и т.д.) Этот ана­лиз требует выбора главных и второстепенных частей, определения того, какие части затрагивают центральные, а какие — периферийные интересы аудитории; 4. Четвертый — тематический анализ, предполагающий выявление явных и скрытых тем текстов; Любопытное исследование провели, применяя тематический анализ, Торренс и Медоу. Они попытались выяснить, что, по мнению иностранцев, характерно для американцев. Были выбраны статьи об Америке 11 иностранных авторов, опубликованных в 1908-1948 гг. В этих материалах они зафиксировавали 307 тем, которые были объединены в 12 классов. Учтя частоту появления, в текстах тем по классам они получили таблицу, характеризующую наиболее, популярные представления иностранцев об Америке и американцах. 5. Пятый — структурный анализ, имеющий дело с взаимоотношениями различных тем в пропаганде. Эти взаимоотношения могут быть как взаимодополняющими (враг жесток, мы милосердны), объединенными (враг жесток, вероломен, аг­рессивен), сталкивающимися (когда темы работают на пере­секающиеся цели); Например: во время войны упор на тему о силе нацистов вызвал в США не столько чувство необходимости отпора, сколько настроения беспокойст­ва и страха. 6. Шестой анализ пропагандистской компании имеет дело с взаимоотношениями различных пропагандистских документов, которые все направлены на достижение одной общей цели. Кроме этих шести типов анализа, часть которых относится скорее к технике проведения пропаганды, Лассуэлл разработал несколько тестов, которые базировались на анализе содержания. Цель этих тестов — обнаружение пропаганды определенного типа в тех или иных материалах. Он предложил своеобразный ва­риант процедуры анализа содержания, основанный на сравнении и назвал его методом «обнаружения» (detection). Метод «обнаружения» включал 8 тестов: • прямое признание — очевидная идентификация себя с враж­дебной стороной; • параллелизм — совпадение содержания материалов исследуе­мого канала с содержанием материалов враждебного канала; • связанность — соответствие потока материалов с объявлен­ными целями враждебной пропаганды. Во время войны нацистские пропагандисты ставили задачу «разоблачать слабость и упадок врагов Германии». Оказалось, что в подозреваемой в про­немецких настроениях газете 71% статей касались слабости союзников, в ло­яльной газете материалы, затрагивающие эту тему, составляли лишь 6%. • презентация — баланс отрицательного и положительного отно­шения к каждому символу, принадлежащему одной из сторон; • источник — предпочтение какого-нибудь одного источника; • скрытый источник — частая публикация материалов без ука­зания источника; • своеобразие — использование слов и оборотов, характерных для пропаганды враждебной стороны; • искажения — постоянные искажения тех или иных высказы­ваний на общие темы и направления, выгодные лишь одной стороне. Когда против подозреваемых в пронацистских настроениях газет в США был начат судебный процесс, Лассуэлл и ряд других социологов выступили в суде и представили свои исследования, основанные на упомянутых тестах, в качестве неопровержимого доказательства подрывного характера этих газет. • Приемы качественно-количественного анализа документов В каких случаях не следует прибегать к квантификации (количественное выражение, измерение качественных признаков (например, оценка в баллах знаний учащихся) текстов: • при анализе уникальных документов (содержательная интер­претация); • если перед нами описание сложных явлений; • документальные данные неполны или недостаточны для мас­совой обработки. • Когда квантификация текстов необходима: • если требуется высокая точность при сопоставлении однопорядковых данных; • значителен массив материала, чтобы оправдать затраченные усилия; • очень значительный объем материала и его невозможно охватить без суммарных оценок; • квантификация возможна, если изучаемые качественные характеристики появляются с достаточной частотой. Наиболее целесообразно использовать количественный анализ, если квалифицированные тексты сопоставимы с другими, также количественными характеристиками. Контент-анализ — перевод в количественные показатели текстовой информации с последующей статистической ее обработкой. Основные операции были разработаны американскими социологами X. Лассуэллом и Б. Берельсоном и их отечественными коллегами: А. Алексеевым, Ю. Вооглайдом, П. Вахалеммом, Б. Грушиным, Т. Дридзе, М. Лауристинем. • Основные процедуры контент-анализа Контент-анализ начинается с выделения единиц анализа, которыми могут выступать: • Понятия, выраженные в словах и отдельных терминах: из области экономики (интенсификация, НТП, методы хозяйствования, управление и самоуправление и т.д.); из области политики (демократия, плюрализм, партия и т.д.); из области нравственности, права (долг, добро, зло, справедливость, законность и т.д.); • Тема, выраженная в целых смысловых абзацах, частях текстов, статьях и т.д; • Имена исторических деятелей, политиков, ученых, деятелей искусства, «передовиков и новаторов производства» и т.д.; • Целое общественное событие, официальный документ, факт, случай и т.п. несут специфическую смысловую нагрузку могут быть приняты за единицу анализа. Единицы анализа выделяются на основе содержания гипотез исследования. Далее выделяются единицы счета, в качестве которых могут вы­ступать: слова, словосочетания, абзацы, квадратные сантиметры и т.д. Осуществляется подсчет указанных единиц и сравнение ана­лизируемых материалов. Например: Единица анализа — международная жизнь. По каждой зарубежной стране материалы рассматриваются с точки зре­ния: объема, частоты информации, содержания, знака информации, типа материалов. Объем информации фиксируется двумя единицами: числом строк тек­ста и удельным весом информации по данной стране от общего объема га­зетного текста. Частота информации определяется частотой упоминания данной стра­ны в тексте. Содержание информации группируется в таких смысловых единицах как промышленность, транспорт, связь, культура и т.д. Знак информации определяется как «положительное», «отрицатель­ное», «сбалансированное», «нейтральное» отношение и соответственно ко­дируется как -, +, 0, ±. По типу и характеру информация подразделяется на фактографическую из неопределенного источника; комментаторскую; комментаторскую без указания автора; художественно фактографическую с указанием автора; об­щетеоретическую и т.д. Надежность информации, получаемой контент-анализом, обес­печивается следующим способом: Первоначально выделяются все смысловые единицы первого анализируемого текста, далее из второго, плюс — дополнитель­ные, ранее не встречающиеся в тексте, из третьего — те же, что и из первых двух, плюс дополнительные и т.д. После изучения 2—5 текстов, в которых не встречаются новые смысловые единицы, можно считать, что поле исчерпано. Контроль за обоснованностью содержания смысловых единиц можно осуществляеть также с помощью экспертов, что значитель­но повышает его надежность. Данные контент-анализа иногда дополняются данными опро­са, что также повышает надежность социологического измерения. Устойчивость данных определяется при помощи кодирования од­ного текста разными кодировщиками на основе одной инструкции.
«Методы формализованного анализа массовой текстовой информации» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты

Тебе могут подойти лекции

Смотреть все 36 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot