logo
Свитич_ Социология журналистики

Кодирование информации, подготовка информации к обсчету, обработка информации

Иногда все эти процедуры проходят одновременно. Если анкета состоит из закрытых вопросов, необходимости в кодировке нет, информацию сразу можно посчитать сначала в абсолютных единицах, то есть количестве ответов на каждый вопрос, а потом пересчитать абсолютные цифры в процентах, либо к числу опрошенных в целом, либо к числу опрошенных в группе, либо к числу ответивших на вопрос и т. п.

Если массив небольшой и исследователя интересуют только данные по всему массиву или по нескольким группам, нет смысла считать данные на компьютере – возможна ручная обработка информации.

Когда количество полевых документов велико и нужен счет по большому количеству групп, тут без компьютера не обойтись. Создается специальное задание программисту, каким образом, по каким группам, в каком виде должна быть выдана информация.

Но прежде всего ее нужно подготовить к вводу в компьютер. Если вопросы закрытые, то есть с вариантами ответов, это не представляет особого труда. Но если в анкете есть открытые вопросы, то есть человек сам записал на оставленных строчках свои ответы, тут придется применить операцию кодирования этой информации.

Но сначала провести процедуру, которая называется «частотный анализ». Для этого из всего массива, например в 1 000 анкет, выбирается каждая 10-я, потому что обычно частотный анализ при большой выборке проводится на 100 документах. Выписываются все ответы на определенный вопрос. Те, которые повторяются, подсчитываются вместе. Остальные, после того как выписывание закончено, объединяются в более крупные смысловые связки, которые и называются кодовыми позициями или признаками. Желательно, чтобы их было не больше 15–20. Те варианты ответов, которые набирают 1–2 %, не учитываются. Их затем кодируют в позицию «другое».

Например, на вопрос, почему вы читаете газету «МК», могут ответить: интересно; по привычке; мои родители выписывают; читают мои друзья; посоветовала Маша из моего класса; больше читать нечего; круто; отвязно; нравятся статьи Е. Деевой; стал читать после убийства Холодова; в семье всегда читали эту газету; пишет про взаимоотношения подростков; читаю про секс; читаю про музыку; тащусь от Троицкого; разнообразная тематика; газета очень творческая; всегда что-то выдумают; с ней не соскучишься; заставляет думать; есть о чем поговорить с друзьями; не пропускаю «Срочно в номер»; прикольно; развлекает и так далее. Мнения очень разные, но некоторые повторяются или имеют сходное значение, например, круто, прикольно, отвязно и т. п. На основе частотного анализа с применением контент-аналити­ческих процедур, делается кодификатор, или код, в котором позиции объединяются по смыслу. Например:

1) дает острую, актуальную информацию;

2) креативная, творческая, небанальная, интересная по темам и по форме, не похожа на другие издания;

3) выражает интересы своей аудитории;

4) разнообразна по тематике, в ней можно прочесть обо всем;

5) привлекает познавательная информация;

6) привлекает развлекательная информация;

7) газета «моего круга»;

8) традиционное чтение моей семьи;

9) другое.

В позицию «другое» отошли в данном случае встречающиеся один-два раза суждения типа «стал читать “МК” после убийства Холодова».

Это только приблизительный перечень признаков, он будет зависеть как от реальных ответов, так и от задач исследования, поименованных в программе. Например, если интересует мнение аудитории о различной тематике, в коде могут быть более подробно разработаны темы, привлекающие внимание: политика, экономика, спорт, музыка и пр.

В результате этой операции составляется кодификатор, по которому затем, как и в случае с закрытыми вопросами, кодируются все 1 000 анкет.

После того как массив полевых документов готов к обработке, он обсчитывается и выдается в том виде, как это необходимо исследователю. Обычно в виде двухмерных таблиц, где по горизонтали обозначены группы респондентов (мужчины, женщины, молодые люди, средних лет, пожилые, горожане, сельчане и т. п.), и это называется подлежащее, а по вертикали – признаки, варианты ответов на те или иные вопросы, например, о мотивах чтения газет – это называется сказуемым. В квадратах пересечения подлежащего и сказуемого печатаются цифры, как правило, в процентах к числу опрошенных в целом и к числу опрошенных в каждой из групп подлежащего.

Но очень часто информация выдается в таблицах не только в процентах, но и в абсолютных числах, то есть количестве текстов, людей, которые ответили на тот или иной вопрос, и т. п. Нередко бывает еще одна позиция: процент людей, ответивших на данный вопрос. Например, опрошенных было – 1 000, а на какой-то вопрос, может быть в силу его трудности или потому, что он не относится к компетенции опрашиваемого, ответило только 750 человек. Тогда процент к числу ответивших на какой-то вопрос будет считаться не к 1 000 опрошенных, а к 750 ответивших на вопрос. Предположим, на вопрос, адресованный всем, «Есть ли у вас дети?» ответило «есть» 750 человек из 1 000 опрошенных. Тогда ответы на вопрос «Сколько у вас детей?» (1, 2, 3, 4 и более) логично считать к числу только тех, у кого есть дети, то есть к 750. Предположим, что 1 ребенок у 450 человек, два – у 200 человек, три у 50 человек, четыре и более у 50 человек. Чтобы узнать проценты, делим число людей, имеющих 1, 2, 3, 4 и более детей на общее число ответивших на этот вопрос и умножаем на 100 (или нажимаем функцию % на калькуляторе). Можно посчитать в нашем примере и ответы к общему числу опрошенных, то есть 1 000 человек. Тогда получим такие данные (табл. 5).

Таблица 5

Разные варианты подсчета процентов

Варианты ответов

Абсолютное число ответов

% к общему числу опрошенных (n = 1 000 чел.)

% к числу ответивших на вопрос (n = 750 чел.)

%

% (округлены до целых)

%

% (округлены до целых)

Один

449

44,9

45

59,9

60

Два

195

19,5

20

26,0

26

Три

64

6,4

6

8,5

9

Четыре и более

42

4,2

4

5,6

6

Нет детей

250

25,0

25

Всего

1 000 чел.

100 %

100 %

100 %

101 %

Заметьте, что проценты в обоих случаях значительно разнятся в связи с тем, что считаются в первом случае к 1 000, а во втором к 750, хотя абсолютные цифры ответов одинаковы.

Особо следует запомнить, что если мы округляем десятые до целого числа в процентах, то 5 десятых и более округляются до единицы. Например, вы посчитали, что три ребенка – у 8,5 % ответивших на вопрос, при необходимости писать проценты без десятых вы запишете 9 %, а не 8 %. Естественно, так же вы поступите, если будет 8,6; 8,7 и 8,9. Если же получите 8,1; 8,2; 8,3; 8,4 %, то округлите до 8 %.

При этом получается, что если вы округляете проценты до целых, сумма взаимоисключающих ответов может быть больше 100 %. Например, в последней колонке приведенной таблицы сумма округленных процентов составляет 101 %. Поэтому в таких случаях иногда пишут примечание: сумма процентов больше ста, потому что данные округлены до целых.