Статистический анализ разводов в Амурской области за 2002 – 2011 гг.
2.5 Корреляционно-регрессионный анализ разводов
Одним из факторных признаков влияющих на разводы является рождение детей. Используя официальные статистические данные о численности рожденных и числом разводов на 1000 жителей в Амурской области на протяжении 2004 - 2011 гг. проведем корреляционный анализ взаимосвязи между этими показателями. Необходимые статистические данные представлены в виде таблицы (таблица 11).
Таблица 11 - Количество родившихся и число разводов на 1000 человек
Год |
Родилось на 1000 человек, чел. |
Число разводов на 1000 человек, ед. |
|
2004 |
12,5 |
5,0 |
|
2005 |
12,3 |
4,8 |
|
2006 |
12,1 |
5,3 |
|
2007 |
12,9 |
6,0 |
|
2008 |
13,3 |
6,0 |
|
2009 |
13,6 |
6,1 |
|
2010 |
13,8 |
5,4 |
|
2011 |
13,6 |
6,2 |
Для определения формы связи между показателями построим эмпирическую линию регрессии. Так как независимым признаком является рождаемость, а результативным - число разводов, то ось X - количество родившихся на 1000 человек, ось Y - число разводов на 1000 человек. Построим график зависимости (рисунок 3).
Рисунок 3 - Зависимость между рождаемостью и разводами
Для выражения зависимости между признаками можно использовать линейное уравнение регрессии (формула 28). Для определения параметров уравнения построим вспомогательную таблицу (таблица 12).
Таблица 12 - Исходные и расчетные данные
Год |
Число рожденных на 1000 жителей, чел. (X) |
Число разводов на 1000 жителей, ед. (Y) |
X2 |
XЧY |
Y2 |
Y (x) |
|
2004 |
12,5 |
5,0 |
156,25 |
62,5 |
25 |
4,07 |
|
2005 |
12,3 |
4,8 |
151,29 |
59,04 |
23,04 |
3,47 |
|
2006 |
12,1 |
5,3 |
146,41 |
64,13 |
28,09 |
2,87 |
|
2007 |
12,9 |
6,0 |
166,41 |
77,4 |
36 |
5,27 |
|
2008 |
13,3 |
6,0 |
176,89 |
79,8 |
36 |
6,47 |
|
2009 |
13,6 |
6,1 |
184,96 |
82,96 |
37,21 |
7,37 |
|
2010 |
13,8 |
5,4 |
190,44 |
74,52 |
29,16 |
7,97 |
|
2011 |
13,6 |
6,2 |
184,96 |
84,32 |
38,44 |
7,37 |
|
Итого |
104,1 |
44,8 |
1357,6 |
584,67 |
252,94 |
44,86 |
8 Ч a + 104,1 Ч b = 44,8
104,1 Ч a + 1357,6 Ч b = 584,67
Освободимся от коэффициентов при параметре a, для чего разделим первое уравнение на 8, а второе на 104,1:
a + 13,01 Ч b = 5,60
a + 13,04 Ч b = 5,61
Вычтем из первого уравнения второе и получим:
0,03 Ч b = - 0,01
b = 0,03/0,01 = 3
тогда a = 5,6 - 13,01 Ч 3 = - 33,43
Полученные данные из вспомогательной таблицы в систему уравнений (формула 28) и решим ее для определения параметров уравнения регрессии.
Уравнение регрессии будет иметь вид:
Y (x) = - 33,43 + 3 Ч x
Параметр уравнения b говорит о том, что при увеличении рождаемости на 1 человека на 1000 жителей, количество разводов увеличится на 3 развода на 1000 жителей. Рассчитаем все значения Y (x) и заполним последний столбец вспомогательной таблицы. Поскольку выполняется равенство: ? y = ? Y (x), то уравнение регрессии составлено верно. На рисунке 3 построим теоретическую линию регрессии. Определим линейный коэффициент корреляции:
r = = 0,68
Рассчитаем коэффициент детерминации (R):
R = 0,682 Ч 100 % = 46 %
Так как коэффициент корреляции равен 0,68 можно сделать вывод, что в соответствии с таблицей Чеддока, связь между анализируемыми признаками заметная.
Коэффициент детерминации показывает, что на 46 % вариация количества разводов обусловлена рождаемостью, а на остальные 54 % - другими факторами, неучтенными в уравнении регрессии.