logo
Лекции Общ

11.2. Процедура и этапы контент-анализа

Контент-анализ представляет измерения социальных объектов. В социологии измерение означает поиск упорядоченной классификации. Существует множество способов измерения (ранжирование, шкалирование и т.д.). Контент-анализ есть приспособление процедуры измерения к содержанию различных документов.

Первое упоминание о применении специальной техники для анализа содержания текстов относится к середине XVII столетия. В это время внимание исследователей было направлено, в основном, просто на подсчет тем. Объектом исследования долгое время служили, в основном, тексты, связанные с религиозной жизнью населения. Например, в XVH-XVIII вв. измерялась частота появления тем, связанных с именем Иисуса Христа (данные исследований использовались для принятия решений о еретичности книги).

В дальнейшем при измерении содержания документов начинают использовать относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. При этом в зависимости от того, что является переменной содержания, под длиной текста может пониматься как количество слов в данном тексте, так и количество предложений, количество абзацев, количество любых других единиц анализа текста.

Затем появилось понятие категории. В качестве категории может выступать набор слов, объединенных по определенному основанию. Посредством категорий уже представляются определенные концептуальные образования. Например, в посланиях того или иного президента можно выделить категории ЭКОНОМИКА (слова -безработица, инфляция и др.), СЕМЬЯ (родители, мать, отец, ребенок и др.) и т.д. Вычисление частоты встречаемости категорий позволяет судить о внимании, которое уделяется в послании тем или иным вопросам.

Как отмечает В.И. Шалак, по мере развития и масштабов применения данного метода были внесены и другие категории. Так, относительные частоты требуют сравнения двух и более текстов, но иногда требуется вывести то или иное заключение на основе исследования всего лишь одного текста. При этом вводится некоторая норма, которая служит нулевой отметкой измеряемой характеристики данного текста (степени лояльности, степени агрессивности и т.д.). Исчисление нормы основывается на частоте проявления лояльности, частоте употребления агрессивно окрашенных слов средним носителем данного языка и т.д. Основой для расчета нормы могут быть частотные словари.

При сравнении нормы с проявляемой лояльностью, агрессивностью и т.п. в данном тексте мы получаем отклонения в ту или иную сторону, по которым можем судить о большей или меньшей лояльности, агрессивности или любой другой характеристике текста (выступления политика и т.п.). Кроме того, статистическая оценка (z-score = N-E/стандартное отклонение, где N - количество слов данной категории, реально встретившихся в тексте, Е - ожидаемое число вхождений слов данной категории в текст, которое вычисляется умножением нормальной частоты категории на число слов в анализируемом тексте) позволяет определить значимость отклонения частот. «Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного. Очевидно, что норма для него будет отличаться от нормы для среднего человека. Поэтому для оценки агрессивности профессионального военного требуются другие нормы, которые могут быть получены путем дополнительной статистической обработки представительной выборки текстов, характерных для военной среды».

Последующее развитие контент-анализа характеризуется введением все более тонких методов анализа текстов. Например, к середине ХГХ в. внимание исследователей сосредотачивается не на простом наличии или отсутствии категорий в тексте, а на связях между ними. Для этого исчисляется совместная встречаемость слов различных категорий (обычный коэффициент корреляции). «Во второй половине XX в. западными авторами был предложен ряд ставших классическими вариантов методики контент-анализа, наиболее интересными среди которых являются «Анализ неслучайных связей» (Ч. Осгуд); «Система саов» (Р. Икера); «Анализ регрессии» (К. Лоранца); «Анализ высказываний» (С. Вейман), автоматизированная система «Дженерал Инквайрер» (Гарвардский университет), а также более поздние работы ГДалера и Г. Лаклера (анализ речей канадских и французских политиков) и работы Д. Рулофа и Д. Фрайа (анализ отношений Восток-Запад в период разрядки)».6

Широко известен случай применения данных контент-анализа для судебного преследования некоторых редакторов газет в США за информационное пособничество нацистам. В частности, Г. Лассуэлл и ряд других социологов выступили на суде и представили результаты своих исследований как доказательство подрывной работы ряда газет (так, было подсчитано: в одной из подозреваемых в пронемецких настроениях газет 71% статей описывали слабость союзников по антигитлеровской коалиции).

Другие известные примеры применения контент-анализа в исследовании общественно-политической жизни той или иной страны. В 50-е гг. прошлого столетия западные аналитики на основе контент-анализа передовых статей газеты «Правда» выявили резкое снижение числа ссылок на Сталина. Был сделан вывод о том, что преемники его власти стремятся дистанцироваться от этой фигуры. Далее. В одном из исследований была замечена смена одного из терминов китайской периодики, что послужило индикатором для вывода о переходе к более агрессивному этапу действий Пекина (затем действительно последовала война).

В настоящее время метод контент-анализа продолжает развиваться: большое распространение находит контекстный анализ, или метод нахождения контекстов употребления слов (collocations), появилось множество версий автоматической категоризации (группа Т. Амака из ФРГ, проект «ВААЛ»7 в России и т.д.).

Как правило, контент-анализ применяется тогда, когда необходимо исследовать обширный (по объему) и несистематизированный (по какому-либо основанию) текстовый материал. Это означает, что квантификация оправдана, если текстового материала очень много (его нельзя даже охватить без суммарных оценок) и изучаемые качественные характеристики проявляются в тексте достаточно часто. Таким образом, контент-анализ - это перевод массовой документальной информации в количественные показатели с последующей статистической обработкой этой информации.

Суть контент-анализа заключается в переводе вербальной информации в невербальную форму, которая дает некоторые дополнительные объективные измерения того или иного текста. В этом методе содержание коммуникации служит основой для выводов. Как пишет Л.Н. Федотова, «социологический анализ содержания коммуникации состоит в своеобразной «перегруппировке» текста согласно концептуальной схеме исследователя... раздвигаются рамки текста, как объекта анализа для исследователя. Отдельное сообщение перестает быть равным самому себе, перестает иметь (для исследователя!) самодовлеющую ценность, а оценивается как реализация намерений коммуникатора, как характеристика коммуникативной ситуации, как потенциал определенных характеристик аудитории и т.д.».8 С помощью выявления частоты появления в тех или иных документах определенных характеристик (переменных) исследователь получает точные и объективные данные о намерениях создателя текста, а также о возможных реакциях коммуниканта.

Надо отметить, что анализ документов направлен на изучение общественного мнения не прямо, а опосредованно: через исследование характеристик субъектов (политических партий, политических лидеров, средств массовой информации и т.д.), влияющих на общественное мнение, через изучение применяемых ими средств (публикаций, речей и т.д.), характера и эффективности их воздействия на общественное мнение. Так, контент-анализ широко используется в электоральных социологических исследованиях с целью изучения программных позиций политических партий и общественно-политических организаций, участвующих в избирательных кампаниях, выявления и описания личностных характеристик кандидатов, особенностей «подачи» этих кандидатов в различных СМИ.

На данный момент времени существует множество определений данного метода: статистическая (квантитативная) семантика, техника для объективного количественного анализа содержания коммуникации, техника качественных выводов при помощи установления количественных характеристик сообщения. Каждая из подобных формулировок делает акцент на количественных параметрах анализа текста, но не отражает качественной характеристики контент-анализа. Попытка интегрального определения дается в Социологическом энциклопедическом словаре: «1. Метод качественно-количественного анализа содержания документов с целью выявления имеющихся тенденций развития социальных факторов. 2. Формализованный метод исследования содержания социальной информации посредством выявления устойчиво повторяющихся смысловых единиц текста (названий, понятий, имен, суждений и т.д.)».

Процедура контент-анализа - это последовательность отдельных операций контент-анализа, каждая из которых основана на определенной технике.

Процедура исследования состоит из ряда последовательных операций:

- разработка программы исследования;

- выбор объекта и материала исследования;

- разработка модели выборки;

- разработка категориальной модели;

- разработка системы единиц анализа;

- разработка модели представления содержания текста;

- проведение выборочной операции;

- разработка полевого документа;

- разработка инструкции по проведению полевых работ;

- проведение пилотажных копировочных работ;

- уточнение логической модели предмета анализа, полевого документа и инструкции по проведению полевых работ;

- проведение основных копировочных работ, в том числе разбиение содержания текста на единицы содержания и классификация их по категориям анализа;

- разработка программы обработки полевой информации;

- обработка полевой информации;

-разработка макета представления количественных результатов исследования;

- изготовление итоговых таблиц;

- первичный анализ полученной аналитической информации.

Существуют три вида операций, которые реализуют процедуру контент-анализа: 1) по разработке документов исследования; 2) по реализации документов; 3) по обеспечению надежности процедуры.

Центральным элементом контент-анализа является логическая модель предмета анализа, в которой выделяются три элемента.

1. Категориальная модель предмета анализа, которая включает параметры и категории анализа, отражающие признаки объекта исследования и их различные аспекты. Каждому признаку соответствует свой параметр исследования, а значению признака - своя категория анализа. При этом каждый параметр анализа может быть представлен в виде системы категорий анализа.

Разработка категориальной модели начинается с определения параметров анализа. Параметры анализа могут быть одномерными и многомерными. Так, параметр «тип автора данного материала» является одномерным параметром, если он характеризуется категорией «журналисты», и становится многомерным параметром, если мы вводим еще какой-либо признак (например, пол автора). Параметры подразделяются также на исчерпывающие (полностью измеряют все аспекты соответствующих признаков) и неисчерпывающие (измеряют лишь некоторые аспекты признака) и т.д.

Вот пример расклада «структуры жизненных ситуаций противостоящих социальных субъектов» на совокупность показателей, с помощью которых определялась как разница между официальными и альтернативными СМИ, так и существенные различия внутри этих групп: оценка ситуации (+, -, +/-, 0), цель деятельности (сохранить ситуацию полностью, изменить ситуацию частично, изменить ситуацию полностью), средство достижения цели (давление сверху, диалог, компромисс, другие средства, давление снизу), модальность действий (возможность, необходимость), политическая позиция (консервативная, либеральная, демократическая), конструктивность отношения к сопернику (сотрудничество, диалог, конфронтация), результат оценки своих действий (положительный, сбалансированный или нулевой, отрицательный).10

После установления всех параметров, каждый из них расчленяется на категории анализа, к которым предъявляется ряд требований: они должны отражать цель исследования, быть исчерпывающими,

взаимоисключающими, независимыми, выводиться из одного принципа классификации. По степени соответствия выделенных категорий исследуемой социальной реальности определяется обоснованность методики контент-анализа. Если выбор категорий и единиц анализа

то методика проводимого контент-анализа считается объективной.

2. Система единиц анализа, которая призвана зафиксировать интенсивность проявления того или иного признака и его значения. Данные смысловые единицы фиксируют фрагменты содержания документов. Если расхождение результатов кодировки разными кодировщиками (одних и тех же документов и по одной и той же инструкции) не превышает пяти процентов, то методика проводимого контент-анализа считается надежной.

Выделение смысловых единиц анализа осуществляется на основе сформулированных гипотез. Основными требованиями к подбору единиц анализа являются: единица анализа должна быть достаточно большой, чтобы выражать определенное смысловое значение; одновременно она должна быть достаточно малой, чтобы не выражать слишком много значений; в результате единица анализа должна легко и свободно идентифицироваться; при этом число единиц анализа должно быть таким, чтобы из него можно было сделать выборку.

В качестве единиц анализа могут использоваться: понятие (знак, термин и т.д.), сообщение, тема, суждение, ситуация, действие и т.д. Наименьшей единицей анализа является слово или символ.

Сообщение - одна из наиболее часто используемых единиц анализа. Оно характеризуется целостностью. Наиболее часто используется при анализе небольших текстов.

Тема - это такая единица анализа, которая представляет собой отдельное высказывание об отдельном предмете. Она очень широко применяется в социологических исследованиях. Тема может быть выражена суждением, словом и словосочетанием (наименование рубрики в газете и т.п.).

Суждение является наиболее мощной и одновременно наиболее сложной (для использования) единицей анализа.

Ситуация - это такая единица анализа, которая представляет содержание текста в виде структуры, отражающей фрагменты действительности.

Все единицы анализа классифицируются по трем основаниям:

- языковые и тематические единицы: языковые единицы (элементы структуры языка) редко используются в социологическом исследовании; тематические единицы (элементы структуры содержания текста) находят широкое применение в контент-анализе (тема сообщения, ситуация и т.д.);

- объектные и необъектные единицы анализа: объектные единицы в тексте представлены непосредственно (сообщение, рубрика, слово, предложение - единицы протяженности); к необъектным единицам относятся все тематические единицы;

- коммуникационные и структурные единицы.

3. Меры (единицы) измерения, фиксирующие регулярность появления смысловых единиц в документе. Определив единицу анализа, надо решить, что при этом следует подсчитывать. Это может быть время, место, частота и т.д. Следует помнить, что любой текст обладает такими признаками, как протяженность и дискретность, поэтому в контент-анализе используется два типа количественных мер (единиц измерения) - единицы протяженности (объем текста в квадратных сантиметрах, объем передачи в минутах эфирного времени и т.д.) и единицы частоты (единичное присутствие какого-либо элемента содержания текста).

Единицы протяженности характеризуют анализируемое содержание в целом, без учета деления этого содержания на элементы. В качестве единиц измерения здесь чаще всего используются: квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Единица частоты, в отличие от меры протяженности (которая может быть представлена большим количеством единиц измерения), представляется всего лишь одной единицей измерения - единичным присутствием элемента содержания. Выделение большего количества единиц измерения считается нестрогим или эклектичным, так как единицы протяженности и частоты составляют весь необходимый арсенал измерения содержания по его протяженности и дискретности.

Так, Б.Н. Миронов, разбирая ошибки одного из анализов содержания исторических документов российской истории, пишет: «Но самый большой просчет автора программы заключался в том, что он взялся анализировать всего 46 небольших текстов с помощью контент-анализа, тогда как в данном случае для решения поставленной задачи более подходящим является традиционный монографический подход к каждому указу и манифесту. Крестьянская война представляла собой событие неординарное, исключительное, к тому же продолжавшееся всего около двух лет. Это время было наполнено множеством событий, в которых участвовали - не по шаблону, не по трафарету ~ сотни тысяч людей. Естественно, каждый указ и манифест являлся уникальным - или во всяком случае не типичным, не массовым документом, - отражая накал социальной борьбы, состояние дел в повстанческом и правительственном лагерях, настроение, мнения, потребности, осознание происходящего в рядах восставших в данный момент, в данную историческую секунду. Поэтому классический интенсивный анализ указов и манифестов, направленный на то, чтобы до конца проникнуть в суть документа, исчерпать его содержание, для которого важно каждое слово и даже буква, каждый поворот мысли и аргументации, словом, каждый элемент документа, более уместен в данном случае. Контентный же анализ как анализ экстенсивный, обобщающий успешнее всего работает с источником массовым, отличительные признаки которого - массовость; способность отражать массовые явления исторической действительности; ординарность

обстоятельств происхождения; однородность, повторяемость содержания; однотипность формы, тяготеющей к стандарту. Именно в массовой исторической документации частота повторения смысловой единицы, категорий анализа имеет тенденцию отражать ее значимость. В повествовательном источнике связь между частотой и значимостью нередко нарушается, а может и вообще не наблюдаться, поэтому развернутость, пространство, занимаемое смысловой единицей, более соответствует ее важности, чем частота».11

При проведении контент-анализа используются такие исследовательские инструменты, как классификатор, протокол, кодировальная матрица, инструкция, список проанализированных документов.

Классификатором контент-анализа является общая таблица, в которую сведены все категории анализа и единицы счета. Основное предназначение подобного классификатора — четко зафиксировать, в каких единицах дана каждая категория. Классификатор можно также использовать в социологической анкете (категории анализа играют роль вопросов, а единицы анализа играют роль ответов). Классификатор является основным методическим документом.

Бланк (протокол) контент-анализа включает в себя различные сведения о документе (автор, объем, время издания и т.д.). Кроме этого, протокол контент-анализа содержит итоги проведенного анализа. Протоколы обычно заполняются в закодированном виде для сжатия информации.

Инструкция кодировщика содержит описание единиц анализа и мер измерения, а также описание подсчета выделяемых характеристик.

Регистрационная карточка (кодировальная матрица) служит для учета количества единиц счета. Она содержит все классификационные единицы анализа - параметры и категории, обозначаемые обычно определенным кодом. При этом каждый вертикальный столбец в карточке означает отдельный документ (присвоенный ему номер), а каждая горизонтальная строка означает классификационные единицы и меры измерения, выраженные в определенных кодах.

Существуют специальные процедуры подсчета, которые приспособлены именно для нужд контент-анализа. Так, формула Яниса призвана исчислять соотношение между благоприятными и неблагоприятными суждениями, оценками, аргументами.1 Применяется также построение шкал для оценки выделенных характеристик текста. Подсчет в контент-анализе аналогичен стандартным приемам классификации по выделенным группировкам, ранжирования и шкального изменения. «Например, изучая тематику газеты, мы произведем процентовку по сгруппированным смысловым единицам разного содержания. Можно предпринять перекрестную классификацию (содержание выдвигаемых идей, средства, предложенные для их осуществления, аргументы».14

На заключительных этапах исследования методом контент-анализа осуществляется содержательная интерпретация результатов декомпозиции текста и квантификации выделенных элементов. При этом используются возможности и преимущества герменевтического и иных подходов. Выявляется, что хотел автор(ы) текста скрыть, подчеркнуть и т.д. Делаются определенные аналитические выводы (на основе некоторых концептуальных построений глубинной психологии и т.д.). При этом выводы и постулируемые положения, естественно, должны быть нацелены на решение поставленных в данном исследовании задач.

Квалифицированно проводимое исследование предполагает применение процедуры верификации полученных исследовательских результатов. Эта процедура совершается, как правило, путем соотнесения и сопоставления новых данных с теми, которые были получены ранее другими исследователями. Часто также используется метод повторения данной исследовательской процедуры (но уже другой группой исследователей). Если же полученная информация хорошо коррелирует с данными, которые были произведены в рамках других исследовательских процедур, то верификация полученных результатов считается вполне успешной.