Статистический анализ разводов в Амурской области за 2002 – 2011 гг.

курсовая работа

2.5 Корреляционно-регрессионный анализ разводов

Одним из факторных признаков влияющих на разводы является рождение детей. Используя официальные статистические данные о численности рожденных и числом разводов на 1000 жителей в Амурской области на протяжении 2004 - 2011 гг. проведем корреляционный анализ взаимосвязи между этими показателями. Необходимые статистические данные представлены в виде таблицы (таблица 11).

Таблица 11 - Количество родившихся и число разводов на 1000 человек

Год

Родилось на 1000 человек, чел.

Число разводов на 1000 человек, ед.

2004

12,5

5,0

2005

12,3

4,8

2006

12,1

5,3

2007

12,9

6,0

2008

13,3

6,0

2009

13,6

6,1

2010

13,8

5,4

2011

13,6

6,2

Для определения формы связи между показателями построим эмпирическую линию регрессии. Так как независимым признаком является рождаемость, а результативным - число разводов, то ось X - количество родившихся на 1000 человек, ось Y - число разводов на 1000 человек. Построим график зависимости (рисунок 3).

Рисунок 3 - Зависимость между рождаемостью и разводами

Для выражения зависимости между признаками можно использовать линейное уравнение регрессии (формула 28). Для определения параметров уравнения построим вспомогательную таблицу (таблица 12).

Таблица 12 - Исходные и расчетные данные

Год

Число рожденных на 1000 жителей, чел. (X)

Число разводов на 1000 жителей, ед. (Y)

X2

XЧY

Y2

Y (x)

2004

12,5

5,0

156,25

62,5

25

4,07

2005

12,3

4,8

151,29

59,04

23,04

3,47

2006

12,1

5,3

146,41

64,13

28,09

2,87

2007

12,9

6,0

166,41

77,4

36

5,27

2008

13,3

6,0

176,89

79,8

36

6,47

2009

13,6

6,1

184,96

82,96

37,21

7,37

2010

13,8

5,4

190,44

74,52

29,16

7,97

2011

13,6

6,2

184,96

84,32

38,44

7,37

Итого

104,1

44,8

1357,6

584,67

252,94

44,86

8 Ч a + 104,1 Ч b = 44,8

104,1 Ч a + 1357,6 Ч b = 584,67

Освободимся от коэффициентов при параметре a, для чего разделим первое уравнение на 8, а второе на 104,1:

a + 13,01 Ч b = 5,60

a + 13,04 Ч b = 5,61

Вычтем из первого уравнения второе и получим:

0,03 Ч b = - 0,01

b = 0,03/0,01 = 3

тогда a = 5,6 - 13,01 Ч 3 = - 33,43

Полученные данные из вспомогательной таблицы в систему уравнений (формула 28) и решим ее для определения параметров уравнения регрессии.

Уравнение регрессии будет иметь вид:

Y (x) = - 33,43 + 3 Ч x

Параметр уравнения b говорит о том, что при увеличении рождаемости на 1 человека на 1000 жителей, количество разводов увеличится на 3 развода на 1000 жителей. Рассчитаем все значения Y (x) и заполним последний столбец вспомогательной таблицы. Поскольку выполняется равенство: ? y = ? Y (x), то уравнение регрессии составлено верно. На рисунке 3 построим теоретическую линию регрессии. Определим линейный коэффициент корреляции:

r = = 0,68

Рассчитаем коэффициент детерминации (R):

R = 0,682 Ч 100 % = 46 %

Так как коэффициент корреляции равен 0,68 можно сделать вывод, что в соответствии с таблицей Чеддока, связь между анализируемыми признаками заметная.

Коэффициент детерминации показывает, что на 46 % вариация количества разводов обусловлена рождаемостью, а на остальные 54 % - другими факторами, неучтенными в уравнении регрессии.

Делись добром ;)