logo
Опорні конспекти СМК / Підручники / 417__

Глава 10 Анализ содержания массовой коммуникации_____________297

Проблемы машинной обработки информации

Здесь мы должны коснуться возможностей машинной обработки материалов способом контент-анализа. Из всех возможностей кон-тент-анализа, которые суммированы в группах I и II, ЭВМ можно поручить те задачи анализа текстов, когда в качестве единицы анализа выступает слово. Когда мы говорим, что речь идет о достаточно ограниченном наборе слов, мы имеем в виду ограниченность с точки зрения человеческого мышления. Память компьютера оперирует списком, состоящим из тысяч слов, но машинный анализ текста возможен, когда эти тысячи слов заложены в память ЭВМ. И тогда машина при обработке текстов занимается ни чем иным, как подсчитывает число материалов, в которых встречаются слова, интересующие исследователя. Подобные операции находят все большее применение, и предложениями провести такой анализ уже пестрят рекламные странички профессиональных журналов. Самое большее, чего можно ожидать от компьютера в плане усложнения задач, — выявление связки ключевых слов с близлежащими прилагательными, лексические цепочки. Иногда это вполне исчерпывающая задача для исследователя, и скорость считывания информации компьютером делает его незаменимым. Прибавим сюда возможности сканирования рукописного текста.

Более сложные случаи, когда речь идет о генерализации вывода, не обеспеченного симметричным рядом известных слов, пока неподвластны компьютеру. Другое дело, что экран компьютера может выступать в роли машинописного листа фиксации результатов, к которым приходит кодировщик. Но и тут существует соображение контроля за этим выводом. Думается, именно возможность контроля пока сдерживает применение компьютера в таком качестве.

Вспомним, как все это начиналось. Группа ученых Гарвардского университета в США (руководитель Ф. Стоун) в 1961 г. начала разработку принципов машинной обработки материала, проведя серию анализов самых различных текстов: газет, сочинений членов малых групп, программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партий США, документов личного характера (писем, дневников, автобиографий)'.

С самых первых попыток использования электронно-счетных устройств для работы с текстом становились ясными преимущества и не-

298 Часть III Социологические исследования звеньев коммуникативного процесса

достатки обработки текстового материала с помощью машин — они обеспечивали адекватность анализа огромных текстовых материалов, но требовали огромных усилий по составлению программы — собственно «словника», с учетом всех синонимических вариантов понятий, которые надо будет отыскивать в этом море пропускаемых через машину слов.

Авторы отлично понимали перспективы развития компьютерного дела — их размышления о том, что наборная клавиатура, связанная с компьютером, будет обычной принадлежностью школьного класса и делового офиса учителя, бухгалтера, психотерапевта, библиотекаря (ясно видно, что эти размышления относились к дореволюционной эпохе — до революции, связанной с изобретением персонального компьютера), звучат сегодня, как предвидение. Но для того чтобы выполнять все эти ожидаемые операции, нужно было, чтобы компьютер мог различать не только слова, но и смысл более пространных языковых единиц. Для этого нужно было решение проблемы синтаксического анализа. К сегодняшнему дню частично такие проблемы решены, коль скоро мы доверяем своему компьютеру — при наличии в нем специфических программ — проверку ошибок набранного текста.

С тех пор машинный метод обработки текстовых массивов все больше находит себе применение. Уже через десять лет после этого пионерского проекта Стоуна и его коллег практически повсеместно стали осуществляться проекты контент-аналитических исследований с применением ЭВМ.

Как ни странным это покажется на первый взгляд, именно пример с машинной обработкой текстов иллюстрирует очень важную для понимания сущности контент-анализа мысль. И в другом месте учебника эта мысль не прозвучала бы так явственно. Анализ содержания, как метод, не обладает магическими качествами — вы не получите из него больше, чем вложили. Если нечто значительное, важное, необычное не предусмотрено процедурой, то оно не появится в результате анализа, каким бы сложным и кропотливым он ни был.

Выбор единиц наблюдения

Даже только начинающие овладевать методом контент-анализа исследователи начинают с вопроса: сколько текстов надо исследовать, чтобьг исследование считалось корректным?

Вопрос этот вполне логичен. Методология многих наук основана на том, что целое описывается по его части. Например, такая отрасль социологии, как зондирование общественного мнения, смогла встать