Расчет характеристик простой случайной выборки.
Цель любого выборочного исследования состоит в том, чтобы, сформировав выборку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.
Наиболее распространенной в социологических исследованиях задачей является оценка среднего значения признака (или доли в случае качественного признака) в генеральной совокупности.
Проиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. Предположим, что оценивается среднее число газет и общественно-политических журналов, выписываемых сотрудниками некоторого производственного коллектива. Рассмотрим по порядку все необходимые операции и их результаты.
Составляется основа выборки, т. е. список всех единиц отбора. В качестве такой основы может быть взят алфавитный список всех сотрудников, пронумерованных последовательно (табл. 15). В целях наглядности вместе с основой выборки приводятся и все истинные значения единиц отбора, еще неизвестные исследователю. В дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.
Общая сумма выписываемых газет и журналов равна 150. Среднее число выписываемых газет и журналов на каждого сотрудника равно = 150/50 = 3.
Среднее квадратическое отклонение для генеральной совокупности равно
Сумма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонения, а именно от единицы отбора 28, было исключено из суммы. Это значение, равное 49, резко увеличивает сумму, будучи нетипичным для генеральной совокупности.
Такое «исключение» экстремального отклонения нередко применяется при обработке первичной социальной информации в том случае, когда предусмотрено возведение в квадрат, а само отклонение в 2—3 раза превышает среднее значение параметра.
Однако ни среднее значение параметра, ни среднее квадратическое отклонение перед началом исследования не известны. В противном случае само исследование было бы излишним.
Естественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюдения) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследования потребовалось определить, скажем, объем личных библиотек, положение исследователя осложнилось бы). Исходя из этих соображений, полагаем достаточной выборку, состоящую из пяти респондентов. Проверить правильность определения объема выборки можно только после обработки результатов пилотажного исследования.
Предположим, что случайный выбор из табл., 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют Значениям признаков 4, 0, 10, 4, 4.
Среднее арифметическое но выборке х = 22/5 = 4,4, дисперсия
Такое значительное отклонение от истинного значения средней объясняется тем, что в выборку попал респондент № 28, исключенный при подсчете дисперсии для генеральной совокупности как нетипичный. Однако при формировании выборки еще неизвестно, что данный респондент нетипичен. Но сам факт, что среднее квадратическое отклонение приближается по величине к средней, должен насторожить исследователей.
Для большей наглядности выразим s в процентах от величины средней: (3,5:4,4) • 100%= 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины «оставляет 79%. В таких случаях целесообразно увеличить объем выборки, например, в 2 раза. В результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значения признака 5, 2, 4, б, 1, -3,2,5,3, 4.
Среднее арифметическое — 3,6, дисперсия s2= 2,26, среднее квадратическое отклонение s = 1,5. Теперь оно составляет приблизительно 40% от величины средней. При больших дисперсиях объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперсия не перестает уменьшаться. Дальнейшее увеличение объема выборки является нецелесообразным. Обычно исследователь приходит к некоторому компромиссному решению относительно объема выборки в зависимости от требуемой точности, а также средств и времени, которыми он располагает.
Сводка необходимых формул для простой случайной выборки. В рассмотренном гипотетическом примере легко было оценить качество выборочной оценки среднего (перед глазами была информация дня обо всей генеральной совокупности). Но как провести его оценку в реальном исследовании, когда имеется только информация, полученная из выборки?
На помощь приходит статистическая теория выборочного метода. Она позволяет при условии реализации случайного отбора достичь, по крайней мере, следующих двух целей:
1. По заданной априори необходимой степени точности выводов (формализуемой с помощью понятия доверительной вероятности) найти возможные интервалы, изменения характеристик генеральной; совокупности (доверительные интервалы). И наоборот, рассчитать доверительную вероятность отклонения характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.
2. Найти объем планируемой выборки, позволяющей достигнуть в пределах требуемой точности расчета выборочных характеристик необходимую доверительную вероятность.
Дадим сводку необходимых для достижения этих целей формул3. Чтобы уметь применять приведенные формулы при планировании выборки в эмпирическом социологическом исследовании, познакомимся несколько подробнее с основными понятиями выборочного метода— «доверительная вероятность» и «доверительный интервал».
Теоретико-вероятностные теоремы, восходящие к закону больших чисел, позволяют с определенной вероятностью, обозначаемой (1 —а), утверждать, что для изучаемого признака отклонения выборочной средней от генеральной не превысят некоторой величины D, называемой предельной ошибкой выборки.
В одной из формулировок это утверждение записывается следующим образом:
Смысл приведенного соотношения следующий: с доверительной вероятностью (1-a) можно утверждать, что генеральное среднее лежит в интервале
который и называется доверительным интервалом, а определяет как бы степень доверия к данным, получаемым по рассчитанным с его помощью выборочным характеристикам. Отсюда и название а — уровень значимости.
Принятие того или иного уровня значимости, например 5%-ного (a = 0,05), зависит от целей данного социологического исследования, требований к степени гарантии его результатов. Социолог должен четко понимать, что, выбрав, скажем, уровень значимости, равный 5 %, и, рассчитав на основе его выборочные характеристики, мы будем утверждать наличие некоторого эффекта, который на самом деле может оказаться несправедливым приблизительно в пяти процентах случаев.
Пример. При обследовании 900 человек — лиц трудоспособного возраста — определен их средний возраст. Для вероятности (1 —a) =0,90 необходимо найти доверительный интервал, в котором содержится генеральное среднее. Поскольку дисперсия признака неизвестна, оценим ее приблизительно по значению размаха для генеральной совокупности.
С этой целью воспользуемся соотношением связи среднего квадратичного отклонения с размахом
справедливым в предположении нормального характера распределения. Здесь Хmax — Хmin — вариационный размах генеральной совокупности, а V— величина, зависящая от объема выборки, значения которой можно найти в табл. 17.
Так как по всей генеральной совокупности верхняя граница трудоспособности в СССР — 60 лет, а нижняя — 16, то хmax — хmin =60—16 = 44, следовательно (дляп> 100 — последний столбец
табл. 17), получим приближенное значение среднеквадратичного отклонения s=44:5= 8,8.
Величина Z находится по табл. А приложения приa/2. Таким образом, если 1 —a= 0,9, то Z= 1,64,
Подставляя найденные значения М и Z в формулу предельной ошибки, получаемD= ZM = 1,64 • 0,29 = 0,48.
Таким образом, округляя значение ошибки до половины года (0,5), можно утверждать, что с вероятностью 0,9 генеральное среднее не выйдет за пределы интервала х — 0,5 <М <х + 0,5, т. е. точность выборочной оценки среднего, рассчитанной по нашей выборке (если она организована методом простого случайного повторного отбора), оказывается равной половине года. Утверждать это мы можем с вероятностью 0,9. Интервал(х — 0,5, х + 0,5) и задает доверительный, интервагй, рассчитанный по доверительной вероятности, равной 0,9.
Теперь рассмотрим методику нахождения доверительного интервала по заданной доверительной вероятности для качественного Признака.
Пример. Выборочное обследование 900 человек, организованное до способу простого случайного повторного отбора, показало, что 18 человек не информированы о крупном событии в стране. Для Доверительной вероятности 0,95 нужно найти доверительный интервал.
Пользуясь выражением для формулы средней ошибки (см.
табл. 16)
получаем
Далее по табл. А приложения, как уже описывалось выше, для a/2 находим Z= 1,96.
Теперь можно определить величину предельной ошибки (см табл. 16):
Таким образом, доверительные границы для доли не информированных в генеральной совокупности равны 0,02 ± 0,009, или от 1,1 до 2,9%.
Приведем иллюстративный пример определения объема простой повторной случайной выборки. Как видно из формул, чтобы определить объем (см. табл. 16), для его оценки необходимо знать дисперсии генеральной средней или хотя бы ее оценки.
Для применения соответствующей формулы необходимо оценить значение дисперсии, что можно сделать (при отсутствии информации о ней и о размахе значений признака в генеральной совокупности) путем проведения одной-двух пилотажных (пробных) выборок.
Допустим, что в результате пилотажа выборочная оценка дисперсии равна 12,24. Определим каким должен быть объем выборки чтобы с вероятностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпляра газет. При этих условиях получаем численность планируемой выборки
Таким образом, объем выборки должен составлять 24 человека.
- Оглавление
- Глава вторая структура социологического знания
- 1. Общая социологическая теория. Уровни социологического познания.
- Общая социологическая теория и материалистическое понимание истории.
- Исторический материализм и теория научного коммунизма.
- Основные структурные элементы общества и их взаимодействие.
- Общественные отношения и социальная деятельность людей.
- 2. Теоретический и эмпирический уровни социологического познания. Теоретическая и прикладная социология Эмпирические социологические исследования
- Теоретические социологические исследования.
- Теоретическая и прикладная социология.
- 3. Специальные социологические теории и эмпирические исследования Понятие конкретной социальной, ситуации.
- Основные функции специальных социологических теорий.
- Компоненты специальных социологических теорий.
- Литература для дополнительного чтения
- Глава третья
- Социалистический образ жизни как объект социологического анализа.
- Социальное значение научно-технической революции
- Социология труда
- Социологические исследования трудовых коллективов.
- Функции трудового коллектива.
- Структура трудового коллектива.
- Виды трудовых коллективов.
- Социология быта Понятие внепроизводственной деятельности.
- Классификация занятий.
- Показатели условий жизненной обстановки.
- Методические схемы изучения быта.
- Социологическое исследование бюджетов времени
- 2. Социальная структура и социальные отношения Понятие социальной структуры
- Социально-классовая структура. Социальные группы и социальные слои
- Общественное разделение труда и социально-профессиональная структура общества
- Социально-этническая структура общества. Этносоциология
- Социально-демографическая структура общества
- Возрастная структура общества Социальные проблемы молодежи
- Геронтосоциология.
- 3. Социально-территориальные, общности Понятие территориальных общностей
- Расселение людей. Социология города и деревни
- Социальные проблемы миграции населения
- 4. Социально-политическая организация общества и социальные институты Социально-политическая организация
- Понятие социального института.
- Социология права.
- Социология политики.
- Социология образования
- Социология науки
- Социология брака и семьи
- 5. Духовная жизнь общества. Средства массовой информации и пропаганды Социальные проблемы идеологической деятельности
- Социология средств массовой информации Социальная роль средств массовой информации.
- Эффективность средств массовой информации
- Общественное мнение
- Структура и функции общественного мнения.
- Характеристики общественного мнения.
- 6. Социальное планирование. Социальные показатели Экономическое и социальное планирование
- Показатели социального планирования
- Социальная деятельность и социальные показатели
- Литература для дополнительного чтения
- Глава четвертая Организация и проведение эмпирического социологического исследования
- 1. Постановка проблемы. Цели и задачи Место и роль программы в социологическом исследовании
- Проблемная социальная ситуация и научная проблема.
- Научная и практическая проблемы.
- Цели и задачи социологического исследования.
- 2. Определение объекта и предмета исследования Объект исследования и единица наблюдения.
- Системный анализ объекта социологического исследования.
- Метод восхождения от абстрактного к конкретному.
- 3. Интерпретация и операционализация понятий Теоретическая и эмпирическая, интерпретация понятий.
- Граница операциональных определений.
- I. Управление развитием общества.
- IV. Уровень поселений и трудовых коллективов.
- V. Уровень первичной социальной группы.
- VI. Уровень личности.
- VII. Уровень развития социальной группы.
- 5. Организационно-методический план исследования Стратегический план исследования.
- 6. Рабочий план исследования и подготовка исполнителей
- Литература для дополнительного чтения
- Статистические методы в социологическом исследовании. Измерение социальных характеристик.
- Глава пятая Методы статистики в социологическом исследовании.
- 1. Понятие измерения в социологии. Уровни измерения Определение измерения.
- Неоднозначность шкальных значений. Допустимые преобразования и типы шкал.
- Адекватность математических методов.
- 2. Группировка материала статистических наблюдений
- Ряды распределения.
- Статистические таблицы.
- 3. Графическая интерпретация эмпирических зависимостей
- Гистограмма.
- Полигон распределения.
- Кумулята.
- Вид (форма) кривых распределений.
- Теоретическое распределение.
- 4. Средние величины и характеристики рассеяния значений признака
- Среднее значение признака.
- Показатели колеблемости (вариации) значений признаков.
- 5. Нормальное распределение. Статистические гипотезы
- Статистические гипотезы.
- 6. Статистические взаимосвязи и их анализ
- Коэффициенты взаимозависимости для порядкового уровня измерения.
- Коэффициенты взаимозависимости для номинального уровня измерения.
- 7. Новые подходы к анализу данных, измеренных по порядковым и номинальным шкалам
- Литература для дополнительного чтения
- Глава шестая Выборочный метод в социологическом исследовании
- 1. Основные понятия выборочного метода
- Единица отбора и единица наблюдения.
- 2. Простой случайный отбор
- Процедура простого случайного отбора.
- Расчет характеристик простой случайной выборки.
- 3. Систематическая и серийная выборки. Систематический отбор.
- Серийная (гнездовая) выборка.
- 4. Стратифицированный отбор Понятие стратифицированной выборки.
- Организация стратифицированной выборки.
- Расчет характеристик стратифицированной выборки.
- 5. Многоступенчатые и комбинированные способы, формирования выборочной совокупности
- Многофазовый отбор.
- Комбинированные выборки.
- 6. Неслучайные методы отбора и другие подходы к построению выборки
- Другие сложности и, проблемы построения выборки.
- Литература для дополнительного чтения
- Глава седьмая Измерение в социологическом исследовании.
- 1. Виды шкал
- 2. Некоторые методы измерения
- Построение шкал методом экспертных оценок.
- Метод суммарных оценок.
- Шкалограммный анализ.
- Семантический дифференциал.
- 3. Надежность измерения социальных характеристик
- Устойчивость измерения.
- Обоснованность измерения.
- Литература для дополнительного чтения
- Раздел третий
- Методы сбора данных в социологическом исследовании.
- Глава восьмая
- Анализ документов и существующих данных
- 1. Понятие документа. Классификация документов. Понятие документа.
- Архивы эмпирических данных в машиночитаемой форме.
- Иконографические документы.
- Фонетические документы.
- Другие способы классификации документов.
- 2. Методы анализа документов
- Традиционный анализ.
- Формализованный анализ.
- 3. Выборка документов и проблемы качества документальной информации
- Необходимость критического отношения к документам.
- Литература для дополнительного чтения
- Глава девятая Наблюдение
- 1. Понятие наблюдения
- Особенности наблюдения в социологии.
- Планирование наблюдения.
- 2. Программа наблюдения
- Рамки соотнесения.
- Определение ситуации и условий деятельности наблюдаемого объекта.
- Цели, задачи я структура деятельности изучаемой группы.
- Определение предмета наблюдения.
- Выбор признаков и единиц наблюдения.
- Определение понятий и разработка категорий.
- 3. Виды наблюдения
- Определение вида наблюдения.
- 4. Фиксация результатов. Подготовка наблюдателя Фиксация результатов.
- Требования к наблюдателю.
- Подготовка наблюдателей. Разработка инструкции.
- Преимущества и недостатки метода наблюдения.
- Литература для дополнительного чтения
- Глава десятая Опрос как метод сбора социологических данных
- 1. Понятие опроса
- Понятие опроса.
- 2. Критерий качества данных опроса.
- 3. Основные фазы опроса
- 4. Типы и виды вопросов
- Содержание вопросов.
- Формулировка вопросов.
- Последовательность вопросов.
- Расслоение совокупности опрашиваемых.
- 5. Разновидности опроса
- 6. Эмпирическое обоснование методики опроса
- Эмпирическая проверка вопросника.
- Литература для дополнительного чтения
- Глава одиннадцатая Социометрические методы изучения структуры межличностных отношений.
- 1. Социометрический опрос
- Процедура социометрического опроса.
- Социометрическая карточка.
- 2. Обработка и анализ результатов социометрического опроса.
- Виды социограмм.
- 2. Социометрические индексы
- Литература для дополнительного чтения
- Глава двенадцатая Эксперимент в социологическом исследовании.
- 1. Понятие, эксперимента
- 2. Экспериментальные переменные
- Выбор зависимых и независимых переменных.
- Условия проведения эксперимента.
- Измерение переменных.
- Контроль переменных.
- Воспроизводимость эксперимента.
- Основные требования к проведению эксперимента.
- 3. Виды экспериментов
- Параллельный и последовательный эксперименты.
- 4. Обработка экспериментального материала
- Репрезентативность экспериментальных данных.
- Ошибки эксперимента.
- Литература для дополнительного чтения
- Обобщение результатов исследования Глава тринадцатая Анализ данных и обобщение результатов социологического исследования.
- 1. Подготовка данных к анализу на эвм
- Редактирование.
- Кодирование.
- Контроль данных и исправление ошибок.
- Построение новых переменных.
- 2. Описание и объяснение в социологическом исследовании
- Понятие описания.
- Группировка.
- Понятие объяснения, в социологии.
- 3. Способы проверки гипотез
- Глава четырнадцатая Отчет о результатах исследования. Отчет и пояснительная записка.
- Разделы отчета.
- Рекомендации.
- 1616 Труды по социологии, с. 32—34. О технике телефонного интервью см.: Методические проблемы сравнительного анализа социологических данных. М. 1982.