Т.к. коэффициент в интервале от 0,3 до 0,7 связь средняя, прямая.
Определим коэффициент детерминации:
(0,456)2
= 0,208
Т.е. вариация пенсий на 20,8% объясняется вариацией прожиточного минимума.
Найдем среднюю ошибку аппроксимации:
26,7%
Средняя ошибка аппроксимации имеет значение меньше 30% – это говорит о среднем уровне надежности уравнения регрессии.
Рассчитаем F-критерий:
2,628
Критическое значение распределения Фишера определяют либо по таблицам распределения Фишера, либо расчетным путем с использованием функции FРАСПОБР() табличного процессора Excel. Для уровня доверия 0,95, одного фактора и 12 значений:
Fкр
= F(0,05; 1; 10) = 4,964
Т.к. Fкр
> Fфакт
, то необходимо отклонить гипотезу о статистической значимости параметров уравнения. Т.е. использовать данную функцию для аппроксимации нельзя.
Найдем стандартную ошибку остаточной компоненты по формуле:
=
=
= 55,14
Найдем средние квадратичные (стандартные) ошибки оценивания коэффициента b и свободного члена а уравнения регрессии:
39,99
0,411
Найдем t – критерий Стьюдента для обоих параметров:
137,91 / 39,99 = 3,448
0,667 / 0,411 = 1,623
Сравнивая значения t-статистики для каждого из коэффициентов линейной регрессии с табличным значением (α = 0,05; k = 12) tтабл
= 2,228, можно сказать, что с вероятностью 95% коэффициент а надёжен, коэффициент b ненадёжен при данном уровне значимости.
Для расчета доверительного интервала определяем предельную ошибку Δ:
= tтабл
·
= 2,228 * 39,99 » 89,1
= tтабл
·
= 2,228 * 0,411 » 0,916
Доверительные интервалы для коэффициентов регрессии:
a – Δa
< a < a + Δa
48,81 < a < 227,01
b – Δb
< b < b + Δb
– 0,249 < b < 1,583
Таким образом, полученные оценки коэффициента регрессии b не являются эффективными и состоятельными, а само уравнение
= 137,91 + 0,667·х не может использоваться для моделирования и прогнозирования динамики.
Это обусловлено большой ошибкой уравнения регрессии.
Для построения уравнения показательной кривой у = а · еbх
линеризуем переменные логарифмированием обеих частей уравнения:
ln у = ln а + b·x
Y = A + b·x
ГдеY = ln y, A = ln a.
Для расчетов будем использовать данные таблицы 4.
Таблица 4
№
y
Y
x
Yx
x2
Y2
у –
(у –
)2
–
(
-
)2
1
131
4,875
100
487,52
10000
23,7675
194,81
-63,81
4071,1
-2,025
4,1
0,487
2
110
4,700
90
423,043
8100
22,0945
188,78
-78,78
6206,8
-8,047
64,7
0,716
3
170
5,136
150
770,37
22500
26,3764
227,92
-57,92
3354,9
31,091
966,7
0,341
4
141
4,949
31
153,412
961
24,4902
156,86
-15,86
251,5
-39,972
1597,8
0,112
5
150
5,011
60
300,638
3600
25,1065
171,81
-21,81
475,8
-25,018
625,9
0,145
6
160
5,075
39
197,932
1521
25,7574
160,85
-0,85
0,7
-35,982
1294,7
0,005
7
200
5,298
40
211,933
1600
28,0722
161,35
38,65
1493,5
-35,476
1258,6
0,193
8
230
5,438
70
380,666
4900
29,5727
177,29
52,71
2778,1
-19,538
381,7
0,229
9
240
5,481
80
438,451
6400
30,0374
182,95
57,05
3255,0
-13,882
192,7
0,238
10
260
5,561
150
834,102
22500
30,9212
227,92
32,08
1029,0
31,091
966,7
0,123
11
270
5,598
120
671,811
14400
31,3423
207,43
62,57
3914,8
10,601
112,4
0,232
12
300
5,704
130
741,492
16900
32,5331
214,05
85,95
7387,8
17,218
296,5
0,287
Итого
2362
62,83
1060
5611,37
113382
330,0715
2272,02
90,0
34219,0
-89,938
7762,4
3,109
Среднее
196,83
5,235
88,33
467,614
9448,5
27,506
Обозначение среднего
Найдем дисперсию переменных:
= 9448,5 – 88,332
= 1646,31
= 27,506 – 5,2352
= 0,0955
Найдем параметров А и В регрессии составили:
b =
0,00314
5,325 – 0,00314 · 88,33 = 4,958
Получено линейное уравнение:
= 4,958 + 0,00314 · х
Произведем потенцирование полученного уравнения и запишем его в обычной форме:
= e4,958
· e0,00314 · х
= 142,31 · e0,00314 х
Тесноту связи оценим через индекс корреляции рху
:
0,436
Связь средняя.
Определим коэффициент детерминации:
0,1838
Т.е. вариация результативного признака на 18,38% объясняется вариацией факторного признака.
Найдем среднюю ошибку аппроксимации:
25,9%
Средняя ошибка аппроксимации имеет значение меньше 30%, т.е. надежность уравнения средняя.
Рассчитаем F-критерий: (m – число параметров при переменной x)
1,8378
Fкр
= 4,964
Т.к. Fкр
> Fфакт
, т.е. необходимо отклонить гипотезу о статистической значимости параметров уравнения.
Найдем стандартную ошибку остаточной компоненты по формуле:
=
=
= 55,77
Найдем средние квадратичные (стандартные) ошибки оценивания коэффициента b и свободного члена а уравнения регрессии:
40,45
0,416
Найдем t – критерий Стьюдента для обоих параметров:
142,31 / 40,45 = 3,518
0,00314 / 0,411 = 0,0076
Сравнивая значения t-статистики для каждого из коэффициентов линейной регрессии с табличным значением (α = 0,05; k = 12) tтабл
= 2,228, можно сказать, что с вероятностью 95% коэффициент а надёжен, коэффициент b ненадёжен при данном уровне значимости.
Для расчета доверительного интервала определяем предельную ошибку Δ:
= tтабл
·
= 2,228 * 40,45 » 90,12
= tтабл
·
= 2,228 * 0,0076 » 0,0169
Доверительные интервалы для коэффициентов регрессии:
a – Δa
< a < a + Δa
52,19 < a < 232,43
b – Δb
< b < b + Δb
– 0,01376 < b < 0,02004
Построим линию показательной зависимости на поле корреляции:
Рис. 2. Рассчитанные линии регрессий
У линейной зависимости меньше стандартная ошибка и больше значение F-критерия. Поэтому из двух уравнений регрессий линейное более достоверно. Но низкая надежность коэффициента регрессии b, говорит, что результаты аппроксимации будут иметь достаточно низкую надежность (80%).