Главная      Учебники - Экономика     Лекции по экономике - часть 17

 

поиск по сайту            

 

 

 

 

 

 

 

 

 

содержание   ..  475  476  477   ..

 

 

Лабораторная работа: Построение и эконометрический анализ однофакторных регрессионных моделей

Лабораторная работа: Построение и эконометрический анализ однофакторных регрессионных моделей

Уфимский Государственный Авиационный Технический Университет

1 Цель работы

3 Задание на лабораторную работу

1. Провести качественный анализ целей, объекта и предмета исследования. Целью исследования является выявление количественной зависимости показателей экономического явления (процесса), которая позволит принимать обоснованные решения по управлению этим экономическим явлением (процессом). Объект и предмет исследования выбираются в соответствии с заданием. Исходные данные следует брать из официальных источников статистики – статистических сборников, публикуемых Госкомстатом.

2. Подготовка исходных данных для исследования. Занести исходные данные для проведения однофакторного регрессионного анализа в программу Statistica.

3. Определить значения описательных статистик: по каждой переменной и объяснить их содержательный смысл.

4. Построить диаграмму рассеяния зависимой и независимой переменных. Объяснить возможные причины корреляции между этими переменными.

5. Найти значение линейного коэффициента корреляции rxy и пояснить его смысл.

6. Построить линию регрессии и определить точечные значения оценок параметров линейного уравнения регрессии а и b и дать их интерпретацию. Какими достоинствами и недостатками с точки зрения экономической теории и практики исследуемых данных обладает построенная регрессия.

7. Определить стандартные ошибки параметров уравнения и записать доверительные интервалы для этих параметров. Сравнить точечные значения оцененных параметров с их интервальными оценками. Сделать выводы.

8. Оценить статистическую значимость параметров линейной регрессии и уравнения в целом. Все справочные данные приведены в приложениях. Сделать выводы.

9. Найти коэффициент детерминации R 2 и прокомментировать его значение.

10. Построить график остатков ε i и проанализировать его.

11. Для заданного x =xk построить точечный и интервальный (с вероятностью р =0,95) прогноз и сделать выводы.

12. Представить зависимость между исследуемыми переменными графически. Есть ли основание для использования нелинейных форм зависимостей?

13. Построить регрессии, использующие различные формы связи: обратную, показательную, экспоненциальную, логарифмическую.

14. Для каждой из рассматриваемых форм регрессий провести анализ качества уравнения регрессии. В качестве вспомогательного приема провести расчет эластичностей (там, где их значение не является очевидным из простроенных регрессий).

15. Проанализировать, улучшились ли статистические характеристики уравнения регрессии для каждой из реализованных форм регрессий (моделей) по сравнению между собой (а также по сравнению с линейной регрессионной моделью).

16. Выбрать одну из форм регрессии как наилучшую на основе нескольких критериев. Обосновать свой выбор.

17. Сделать выводы по работе.

Исходные данные

Число предприятий и организаций
17636
19023
15736
25814
13000
13014
15926
20974
17082
18486
12952
104392
11728
21628
16874
28230
23165
24121
24392
49246
21689
31617
17523
13982
16120
14385
51174
17989
61549
44602
17323
Объем промышленного производства, млн. руб.
19609
36594
24926
23011
10247
3596
6785
16161
6758
7988
6418
56443
6844
11245
13172
12881
19461
22636
16126
50927
21893
16532
13676
27638
6234
6701
28284
9199
76228
21215
14552

1)исходные данные

2) корреляционная матрица:


корреляционная матрица показывает, что значение коэффициента парной корреляции между переменными равно 0,77, т.е. связь между переменными функциональная.

3) график зависимости результативной и факторной переменной:

Полученный график показывает, что между числом предприятий и объемами промышленного производства наблюдается сильная зависимость, т. е. можно использовать модель линейной регрессии. Над графиком дается само вычисленное уравнение линейной регрессии

4) Анализ значимости модели и ее компонентов

- множественный коэффициент корреляции, в нашем случае равен 0,77237617

F – значение критерия Фишера, составляет 42,88270

Значимость множественного коэффициента корреляции проверяется по таблице F-критерия Фишера. В нашем случае табличное значение F-критерия Фишера для степеней свободы ν1 =1, ν2 =19 (21 наблюдений минус 2 равно 19) при уровне значимости α=0,05 равно 0,89, а рассчитанное значение равно 42,88270. Расчетное значение значительно больше табличного, поэтому признается статистическая значимость найденного коэффициента парной корреляции между переменными.

- R2 – множественный коэффициент детерминации, равен 0,59656495.

- df – число степеней свободы F-критерия, составляет 1,29.

- adjusted R2 – скорректированныйкоэффициент детерминации, равен 0, 58265340.

- Standard error of estimate – среднеквадратическая ошибка, в примере 12306,573821.

- Intercept (Разрыв) – оценка свободного члена модели регрессии, равна –7867,1847755.

- Std. Error – стандартная ошибка оценки, составляет 3525,225.

t(29)=2,2317 и р<0,0335 – значения t-критерия и критического уровня значимости, используемые для проверки гипотезы о равенстве нулю свободного члена регрессии. в нашем случае гипотеза должна быть принята, если уровень значимости равен 0,0335 или ниже. Примем уровень значимости α = 0,05, тогда гипотеза о равенстве нулю свободного члена регрессии отклоняется.

- в 4-ом столбце В содержатся оценки параметров модели регрессии –7867,185 и 0,908

Уравнение принимает вид: ОРГАН ( y)= 7867.185+0.908 * выпуск( x).

- в пятом столбце St. Err. of В – значения стандартной ошибки параметров модели регрессии, соответственно 3525.225 и 0,139

- в 6-ом и 7-ом столбцах t(29) и p- level – значения t-критерия и минимального уровня значимости, используемые для проверки гипотез о равенстве 0 коэффициентов регрессии. В данном примере р-значения близки к нулю, т.е. оба параметра модели значимы. Расчетные значения t-критерия Стьюдента для каждого параметра, отраженные в столбце t(29), сравниваем с табличным значением t-критерия для числа степеней свобода, равного 19. tтабл = 2,231683 при уровне значимости α=0,05. рассчитанные значения t-критерия для обоих параметров больше табличного, что свидетельствует о значимости найденных значений.

5)Анализ остатков

В нашем примере распределение остатков достаточно близко к нормальному, остатки располагаются близко к аппроксимирующей линии, что также говорит об адекватности модели.

6)Построение доверительных интервалов

- Dep. Var. (Подчиненный) – имя зависимой переменной, в примере – ОРГАНИЗАЦИИ.

- Multiple R (Умножение R) – множественный коэффициент корреляции, в нашем случае равен 0,77237617.

- F – значение критерия Фишера, составляет 42,88270.

Значимость множественного коэффициента корреляции проверяется по таблице F-критерия Фишера. В нашем случае табличное значение F-критерия Фишера для степеней свободы ν1 =1, ν2 =19 (21 наблюдений минус 2 равно 19) при уровне значимости α=0,05 равно 0,89, а рассчитанное значение равно 42,88270. Расчетное значение значительно больше табличного, поэтому признается статистическая значимость найденного коэффициента парной корреляции между переменными. Как правило, считается, что уравнение пригодно для практического использования, если Fрасч > Fтабл минимум в 4 раза. В нашем случае это условие соблюдается.

- R2 – множественный коэффициент детерминации, равен 0,59656495.

- df – число степеней свободы F-критерия, составляет 1,29.

- No. of cases (Число случаев) – количество наблюдений, равно 31.

- adjusted R2 – скорректированныйкоэффициент детерминации, равен 12306,57.

- р – критический уровень значимости модели, в примере р = 0,000000 показывает, что зависимость числа предприятий и организаций области от численности населения значима.

- Standard error of estimate – среднеквадратическая ошибка, в примере 12306,57

- Intercept (Разрыв) – оценка свободного члена модели регрессии, равна –7867,18

- Std. Error – стандартная ошибка оценки, составляет 3525,225

t(29)=2,2 и р<0,0335 – значения t-критерия и критического уровня значимости, используемые для проверки гипотезы о равенстве нулю свободного члена регрессии. в нашем случае гипотеза должна быть принята, если уровень значимости равен 0,0335 или ниже. Примем уровень значимости α = 0,05 тогда гипотеза о равенстве нулю свободного члена регрессии отклоняется.

Для вывода оценок всех коэффициентов модели регрессии и результатов проверки их значимости

- в 4-ом столбце В содержатся оценки параметров модели регрессии –7867,185 и 0,139 .

Уравнение принимает вид: ОРГАН[ y]=7867,185+0,139 * выпуск[ x].

- в пятом столбце St. Err. of В – значения стандартной ошибки параметров модели регрессии, соответственно 3525,225 и 0,139

- в 6-ом и 7-ом столбцах t(29) и p- level – значения t-критерия и минимального уровня значимости, используемые для проверки гипотез о равенстве 0 коэффициентов регрессии. В данном примере р-значения близки к нулю, т.е. оба параметра модели значимы. Расчетные значения t-критерия Стьюдента для каждого параметра, отраженные в столбце t(29), сравниваем с табличным значением t-критерия для числа степеней свобода, равного 19. tтабл = 0,89 при уровне значимости α=0,05. рассчитанные значения t-критерия для обоих параметров больше табличного, что свидетельствует о значимости найденных значений.

7)Анализ остатков

В нашем примере распределение остатков достаточно близко к нормальному, остатки располагаются близко к аппроксимирующей линии, что также говорит об адекватности модели.

8)Построение доверительных интервалов

X y y с ^ A
1 19609 7867,185 0,908 17847,697 17636 0,012004 42,725
2 36594 7867,185 0,908 33227,352 19023 0,746694
3 24926 7867,185 0,908 22632,808 15736 0,438282
4 23011 7867,185 0,908 20893,988 25814 0,190595
5 10247 7867,185 0,908 9304,276 13000 0,284286
6 3596 7867,185 0,908 3265,168 13014 0,749103
7 6785 7867,185 0,908 6160,78 15926 0,613162
8 16161 7867,185 0,908 14674,188 20974 0,300363
9 6758 7867,185 0,908 6136,264 17082 0,640776
10 7988 7867,185 0,908 7253,104 18486 0,607643
11 6418 7867,185 0,908 5827,544 12952 0,550066
12 56443 7867,185 0,908 51250,244 104392 0,50906
13 6844 7867,185 0,908 6214,352 11728 0,470127
14 11245 7867,185 0,908 10210,46 21628 0,527905
15 13172 7867,185 0,908 11960,176 16874 0,291207
16 12881 7867,185 0,908 11695,948 28230 0,585691
17 19461 7867,185 0,908 17670,588 23165 0,237186
18 22636 7867,185 0,908 20553,488 24121 0,147901
19 16126 7867,185 0,908 14642,408 24392 0,399704
20 50927 7867,185 0,908 46241,716 49246 0,061006
21 21893 7867,185 0,908 19878,844 21689 0,08346
22 16532 7867,185 0,908 15011,056 31617 0,525222
23 13676 7867,185 0,908 12417,808 17523 0,291342
24 27638 7867,185 0,908 25095,304 13982 0,794829
25 6234 7867,185 0,908 5660,472 16120 0,648854
26 6701 7867,185 0,908 6084,508 14385 0,577024
27 28284 7867,185 0,908 25681,872 51174 0,498146
28 9199 7867,185 0,908 8352,692 17989 0,535678
29 76228 7867,185 0,908 69215,024 61549 0,124552
30 21215 7867,185 0,908 19263,22 44602 0,568109
31 14552 7867,185 0,908 13213,216 17323 0,237244
13,24722
31
100

9)Нелинейные модели

В верхнем поле этого окна отображается информация по подбору модели:

- ее математическое описание,

- число искомых параметров,

- тип функции потерь,

- название переменных,

- автоматическое исключение строки при отсутствии в ней одной из переменных,

- количество обрабатываемых строк.

В верхнем поле отражена сумма Final loss (Конечная остаточная сумма квадратов ), корреляционное отношение R и доля Variance explained (Доля объясненного рассеяния в % ). Величина t (13) – t-отношение Std. Err. (Стандарт погрешности для асимптотической оценки параметра ) к Estimate (Сама оценка ) при 13 степенях свободы. Естественно, вероятность такого t-отношения и ошибки отклонения гипотезы о нулевой величине параметра практически равна нулю.

10 Вывод и анализ второго приближения зависимости

В данном случае получена большая вероятность (0,00002) ошибки отклонения гипотезы о нулевой величине второго параметра. Иными словами, эту гипотезу следует принять и оставить первое приближение.

ВЫВОД:

В линейной модели коэффициент корреляции равен 0,77. Коэффициент аппроксимации равен 42,725 .В нелинейной коэффициент аппроксимации - 94,35

Следовательно, величина отклонения теоретического значения от эмпирического в первой модели меньше ,чем во второй и наиболее оптимальной для выбора модели является первая модель, так как статистические характеристики ее уравнения регрессии для каждой из реализованных форм регрессий наиболее подходящие.

 

 

 

 

 

 

 

содержание   ..  475  476  477   ..