8. Проверить гипотезы о значимости вычисленных коэффициентов b0, b1 .
9. Построить доверительные интервалы для коэффициентов b0, b1.
10. Построить доверительные интервалы для дисперсии случайной составляющей эконометрической модели.
11. Построить доверительную область для условного математического ожидания М(
)( по оси Х откладывать месяцы январь - декабрь). Нанести границы этой области на диаграмму рассеяния.
12. С помощью линейной парной регрессии сделать прогноз величины прибыли на ноябрь и декабрь месяц и нанести эти значения на диаграмму рассеяния. Сопоставить эти значения с границами доверительной области для условного математического ожидания М()
и сделать вывод о точности прогнозирования с помощью построенной регрессионной модели.
Решение.
Используя исходные данные, строим диаграмму рассеяния:
На основе анализа диаграммы рассеяния убеждаемся в наличии тенденции увеличения прибыли фирмы и выдвигаем гипотезу о линейном тренде.
Полагаем, что связь между факторами Х
и У может быть описана линейной функцией
. Решение задачи нахождения коэффициентов b0, b1
основывается на применении метода наименьших квадратов исводится к решению системы двух линейных уравнений с двумя неизвестными b0, b1
:
b0
n + b1
Уxi
= Уyi
,
b0
Уxi
+ b1
Уxi2
= Уxi
yi
.
Составляем вспомогательную таблицу:
№
х
y
x2
ху
y2
1
1
367
1
367
134689
2
2
418
4
836
174724
3
3
412
9
1236
169744
4
4
470
16
1880
220900
5
5
485
25
2425
235225
6
6
470
36
2820
220900
7
7
525
49
3675
275625
8
8
568
64
4544
322624
9
9
538
81
4842
289444
10
10
558
100
5580
311364
сумма
55
4811
385
28205
2355239
Для нашей задачи система имеет вид:
Решение этой системы можно получить по правилу Крамера:
Получаем:
,
.
Таким образом, искомое уравнение регрессии имеет вид:
y =364,8 + 21,145x.
4. Нанесем график регрессии на диаграмму рассеяния.
5. Вычислим значения статистики F
и коэффициента детерминации R2.
Коэффициент детерминации рассчитаем по формуле R2
= rxy2
= 0,9522
= 0,907. Проверим адекватность модели (уравнения регрессии) в целом с помощью F-критерия. Рассчитаем значение статистики F
через коэффициент детерминации R2
по формуле:
Получаем:
. Зададим уровень значимости б =0,01, по таблице находим квантиль распределения Фишера F0,01;1;8
= 11,26, где 1 – число степеней свободы.
Fфакт.
> F0,01;1;8
, т.к. 78,098 > 11,26.
Следовательно, делаем вывод о значимости уравнения регрессии при 99% - м уровне значимости.
6. Вычислим выборочный коэффициент корреляции и проверим гипотезу о ненулевом его значении.
Рассчитаем выборочный коэффициент корреляции по формуле:
Получаем:
Проверка существенности отличия коэффициента корреляции от нуля проводится по схеме:если
, то гипотеза о существенном отличии коэффициента корреляции от нуля принимается, в противном случае отвергается.
Здесь t1-б/2,n-2
– квантиль распределения Стьюдента, б - уровень значимости или уровень доверия, n – число наблюдений, (n-2) – число степеней свободы. Значение б задается. Примем б = 0,05, тогда t1-б/2,n-2
= t0,975,8
= 2,37. Получаем:
.
Следовательно, коэффициент корреляции существенно отличается от нуля и существует сильная линейная связь между х и у.
С использованием табличного процессора Ехсеl проведем регрессионную статистику:
Вывод итогов:
Регрессионная статистика
Множественный R
0,952409
R-квадрат
0,907083
Нормированный R-квадрат
0,895468
Стандартная ошибка
21,7332
Наблюдения
10
Дисперсионный анализ
df
SS
MS
F
Значимость F
Регрессия
1
36888,245
36888,25
78,09816
2,119E-05
Остаток
8
3778,6545
472,3318
Итого
9
40666,9
Коэфф.
Станд. ошибка
t-статистика
P-Значение
Нижние 95%
Верхние 95%
Y-пересечение
364,8
14,846599
24,57128
8,04E-09
330,56368
399,0363
Переменная X 1
21,14545
2,3927462
8,837316
2,12E-05
15,627772
26,66314
Вычисленные значения коэффициентов b0, b1,
значения статистики F,
коэффициента детерминации R2
выборочного коэффициента корреляции rxy
совпадают с выделенными в таблице.
7. Оценка дисперсии случайной составляющей эконометрической модели вычисляется по формуле
.
Используя результаты регрессионной статистики, получаем:
.
8. Проверим значимость вычисленных коэффициентов b0, b1
по t-критерию Стьюдента. Для этого проверяем выполнение неравенств:
и
,
где
,
,
, .
Используем результаты регрессионной статистики:
Коэффициенты
Стандартная ошибка
t-статистика
P-Значение
Нижние 95%
Верхние 95%
Y-пересечение
364,8
14,846599
24,57128
8,04E-09
330,56368
399,0363
Переменная X 1
21,14545
2,3927462
8,837316
2,12E-05
15,627772
26,66314
Получаем:
;
Примем б = 0,05, тогда t1-б/2,n-2
= t0,975,8
= 2,37.
Так как
и
, делаем вывод о значимости коэффициентов линейного уравнения регрессии.
9. Доверительные интервалы для коэффициентов b0, b1
получаем с помощью результатов регрессионной статистики.
Доверительный интервал для коэффициента b0
уравнения регрессии:
Доверительный интервал для коэффициента b1
уравнения регрессии:
10. Построим доверительный интервал для дисперсии случайной составляющей эконометрической модели по формуле:
.
Примем б = 0,05, тогда по таблице для 10-элементной выборки q
= 0,65.
Получаем:
,
.
11. Построим доверительную область для условного математического ожидания М(
).
Доверительные интервалы для уравнения линейной регрессии:
находятся по формуле:
где
соответственно верхняя и нижняя границы доверительного интервала;
значение независимой переменной
для которого определяется доверительный интервал,
квантиль распределения Стьюдента,
доверительная вероятность, (n-2) – число степеней свободы;
Рассмотрим уравнение: y =364,8 + 21,145x. Пусть
тогда
. Зная
и
, заполним таблицу:
12. С помощью линейной парной регрессии сделаем прогноз величины прибыли на ноябрь и декабрь месяц:
597,4,
618,55.
Нанесем эти значения на диаграмму рассеяния.
Эти значения сопоставимы с границами доверительной области для условного математического ожидания М().
Точность прогнозирования: с вероятностью 0,95 прибыль в ноябре находится в интервале (487,292; 515,508); прибыль в декабре находится в интервале (497,152; 526,376).