logo
Лекции по статистике

Понятие выборки

Выборкой называется любая подгруппа элементов (испытуемых, респондентов), выделенная из генеральной совокупности для проведения эксперимента. При этом отдельный индивид из выборки, с которым работает психолог, называется испытуемым (респондентом).

Полное или сплошное исследование всей генеральной совокупности – задача нереальная. Поэтому исследования проводятся на репрезентативных выборках.

Варианта (х ) – это единица выборки, каждое отдельное х – результат отдельного измерения.

Объем выборки (n) – общее число вариант в выборке. Объем выборки может быть любым, но не меньшим чем два респондента. В статистике различают малую (n <30), среднюю (30 < n <100) и большую выборку n >100

Частота (f)- число, показывающее сколько раз встречается в выборке каждая варианта х .

Частость (ω) – это доля каждой частоты в общем объеме выборки, т.е. ω = f /n.

Выборки могут быть независимыми (несвязными) и зависимыми (связными).

Выборки называются независимыми (несвязными), если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых (респондентов) другой выборки.

Выборки называются зависимыми (связными), если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых (респондентов) другой выборки.

К выборке применяется ряд обязательных требований, определенных прежде всего целями и задачами исследования. Одним из важных требований является требование однородности выборки. Оно означает, что психолог, изучая, например, подростков, не может включить в эту же выборку взрослых людей.

Все требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе психологом должна быть получена наиболее полная, неискаженная информация об особенностях генеральной совокупности, из которой взята эта выборка. Иными словами, выборка должна быть репрезентативной. Репрезентативная выборка, или представительная выборка, - это такая выборка, в которой все основные признаки генеральной совокупности представлены приблизительно в той же пропорции и стой же частотой, с которой данный признак выступает в данной генеральной совокупности. Репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать. Репрезентативность выборки позволяет распространить полученные на ней выводы на всю генеральную совокупность.

Репрезентативность выборки очень важна, тем не менее по объективным причинам соблюдать ее крайне сложно. Так, хорошо известен факт, что 70 – 90% всех психологических исследований человека проводились в США со студентами психологами. В лабораторных исследования, выполняемых на животных, наиболее распространенным объектом изучения являются крысы. Поэтому неслучайно психологию раньше называли «наукой о студентах-второкурсниках и белых крысах». Выборка студентов нерепрезентативна в качестве модели, претендующей на представительство всего населения страны.

Возникает закономерный вопрос, как сформировать репрезентативную выборку? Рассмотрим два метода, обеспечивающих репрезентативность выборки.

Первый метод формирования простой случайной выборки. Получить простую случайную выборку можно путем обычной жеребьевки (по аналогии с лотореей) или с помощью специальных таблиц случайных чисел. В последнем случае элементы генеральной совокупности перенумеровываются и из таблицы случайных чисел выписываются номера элементов, которые должны быть взяты в выборку. Данная процедура трудно осуществима, поскольку для ее реализации необходимо учитывать каждого представителя генеральной совокупности.

Второй метод основывается на понятии стратифицированной случайной выборки. Для этого необходимо разбить элементы генеральной совокупности на страты (группы) в соответствии с некоторыми характеристиками (возраст, пол, социальная принадлежность, национальность, место жительства (город, деревня)). Случайная выборка производится отдельно из каждой группы (страты).

Объем выборки зависит от задач исследования и от статистических методов, которые предполагается использовать. Некоторые непараметрические методы могут использоваться при сравнении групп численностью в 5-7 человек, а факторный анализ наиболее адекватен, если объем выборки составит около 100 человек.

Для психологических исследований рекомендуется использовать экспериментальную и контрольную группы, так чтобы численность обеих сравниваемых групп была не менее 30-35 испытуемых в каждой.