По статистическим данным для 9 предприятий общественного питания за год построить линейную двухфакторную модель, которая характеризует зависимость между уровнем рентабельности (%), относительным уровнем затрат оборота (%) и трудоемкостью предприятий. Прогнозные значения факторов выбрать самостоятельно. Сделать экономический анализ характеристик взаимосвязи.
Исходные данные
№ п/п
Рентабельность
Затраты оборота
Трудоемкость
1
2,48
16,8
117,7
2
2,62
16,9
97,5
3
2,88
16,1
113,7
4
2,68
15
122,3
5
2,52
18
102
6
2,74
17,2
106,7
7
2,56
17,1
108,5
8
2,68
16,4
114,3
9
2,55
16,7
94,3
Построение и анализ классической многофакторной линейной эконометрической модели
1. Спецификация модели
1.1 Идентификация переменных
Многофакторная линейная эконометрическая модель устанавливает линейную зависимость между одним показателем и несколькими факторами.
Y – рентабельность – результирующий показатель;
Х1 – затраты оборота – показатель-фактор;
Х2 – трудоемкость – показатель-фактор.
Таблица 1 – Исходные данные и элементарные превращения этих данных для оценки модели.
№ п/п
Y
X1
X2
Y*X1
Y*X2
X1*X2
Y*Y
X1*X1
X2*X2
1
2,48
16,8
117,7
41,664
291,896
1977,4
6,1504
282,24
13853,29
2
2,62
16,9
97,5
44,278
255,45
1647,8
6,8644
285,61
9506,25
3
2,88
16,1
113,7
46,368
327,456
1830,6
8,2944
259,21
12927,69
4
2,68
15
122,3
40,2
327,764
1834,5
7,1824
225
14957,29
5
2,52
18
102
45,36
257,04
1836
6,3504
324
10404
6
2,74
17,2
106,7
47,128
292,358
1835,2
7,5076
295,84
11384,89
7
2,56
17,1
108,5
43,776
277,76
1855,4
6,5536
292,41
11772,25
8
2,68
16,4
114,3
43,952
306,324
1874,5
7,1824
268,96
13064,49
9
2,55
16,7
94,3
42,585
240,465
1574,8
6,5025
278,89
8892,49
∑
23,71
150,2
977
395,311
2576,513
16266
62,5881
2512,16
106762,64
Средн.
2,63444
16,6889
108,555556
43,92344
286,27922
1807,3
6,9542333
279,129
11862,516
1.2 Оценка тесноты связи между показателем Y и факторами Х1 и Х2, а также межу факторами. (Диаграмма рассеяния).
Для оценки тесноты связи между показателем Y и факторами Х1 и Х2, а также между факторами вычисляем парные коэффициенты корреляции, а потом составляем корреляционную матрицу, учитывая ее особенности:
- корреляционная матрица является симметричной;
- на главной диагонали размещены единицы.
Парные коэффициенты корреляции вычисляем по формулам:
В многомерной модели коэффициенты парной корреляции измеряют нечистую связь между факторами и показателем. Поэтому при построении двухфакторной модели целесообразно оценить связь между показателем и одним фактором при условии, что влияние другого фактора не считается. Для измерения такой чистой связи вычисляют коэффициенты частичной корреляции.
Формула частичного коэффициента корреляции между признаками Хi и Xj
имеет вид:
где
- алгебраические дополнения соответствующих элементов корреляционной матрицы.
Во время построения двухфакторной модели коэффициенты частичной корреляции рассчитываются по формулам:
Для проверки полученных коэффициентов рассчитаем их матричным методом по формуле:
где
- элементы матрицы
обратной корреляционной матрицы R.
Значения коэффициентов, полученные двумя методами, совпали.
1.2.3 Выводы о том, являются ли факторы ведущими и возможной мультиколлинеарности
С помощью полученных корреляционной матрицы и коэффициентов частичной корреляции можно сделать выводы о значимости факторов и проверить факторы на мультиколлинеарность - линейную зависимость или сильную корреляцию.
1)Поскольку коэффициент парной корреляции между затратами оборота и рентабельностью rух1=-0,46107 и соответствующий коэффициент частичной корреляции ryx1(х2)=-0,37946,это значит, что затраты оборота имеют обратное не значительное влияние на рентабельность.
2)Поскольку коэффициент парной корреляции между трудоемкостью и рентабельностью rух2=0,28319,а соответствующий коэффициент частичной корреляции rух2(х1)=-0,00823, то это свидетельствует о том, что трудоемкость не существенно влияет на рентабельность.
3)Поскольку коэффициент парной корреляции между существует средняя близкая к сильной обратная корреляционная зависимость, чистая связь между показателями отъемлемая факторами rх1х2=-0,62656,то это свидетельствует, что между факторами rх1х2(у)=-0,5828 также обратная средняя.
1.3 Общий вид линейной двухфакторной модели и её оценка в матричной форме
В общем виде многофакторная линейная эконометрическая модель записывается так:
В матричной форме модель и ее оценка будут записаны в виде:
и
,
где У - вектор столбец наблюдаемых значений показателя;
У- вектор столбец оцененных значений фактора;
Х - матрица наблюдаемых значения факторов;
А - вектор столбец невидимых параметров;
А - вектор столбец оценок параметров модели;
е - вектор столбец остатков (отклонений).
2,48
1,0
16,8
117,7
2,62
1,0
16,9
97,5
2,88
1,0
16,1
113,7
2,68
1,0
15,0
122,3
Y=
2,52
X=
1,0
18,0
102,0
2,74
1,0
17,2
106,7
2,56
1,0
17,1
108,5
2,68
1,0
16,4
114,3
2,55
1,0
16,7
94,3
1,0
1,0
1,0
1,0
1,0
1,0
1,0
1,0
1,0
Xtrans=
16,8
16,9
16,1
15,0
18,0
17,2
17,1
16,4
16,7
117,7
97,5
113,7
122,3
102,0
106,7
108,5
114,3
94,3
2. Оценка параметров модели 1МНК в матричной форме
Предположим, что все предпосылки классической регрессионной модели выполняются и осуществим оценку параметров модели по формуле:
Алгоритм вычисления параметров модели
1. Вычисляем матрицу моментов Xt*X, но сначала найдем транспонированную матрицу Хt.
1,0
1,0
1,0
1,0
1,0
1,0
1,0
1,0
1,0
16,8
16,9
16,1
15,0
18,0
17,2
17,1
16,4
16,7
117,7
97,5
113,7
122,3
102,0
106,7
108,5
114,3
94,3
Xt*X
9
150,2
977
150,2
2512,16
16266,1
977
16266,1
106763
2. Вычисляем матрицу ошибок
171,3396
-6,807
-0,53086
-6,80699
0,29993
0,0166
-0,53086
0,0166
0,00234
3. Находим матрицу-произведение Xt*Y
23,71
395,311
2576,513
4. Вычисляем вектор оценок параметров модели как произведение матрицы
на матрицу Xt*Y
По формуле
Регрессия коэффициенты
3,826004
а0
У- пересечение
3,826
-0,07058
а1
Х1
-0,07058
-0,00013
а2
Х2
-0,00013
Таким образом, оценка эконометрической модели имеет вид
y=3,826004-0,07058x1-0,00013x2
3. Коэффициенты множественной детерминации и корреляции для оцененной модели
3.1 Расчет коэффициентов множественной детерминации и корреляции
Для оценки степени соответствия полученной модели наблюдаемым данным, то есть предварительной оценки адекватности модели, вычисляем коэффициенты множественной детерминации и множественной корреляции.
Коэффициент множественной корреляции является степень соответствия оцененной модели фактическим данным и рассчитывается как коэффициент корреляции между y и
.
Квадрат коэффициента множественной корреляции называется коэффициентом множественной детерминации. Коэффициент множественной детерминации характеризует часть дисперсии показателя у, что объясняется регрессией, т.е. вариацией факторов, которые входят в модель:
Коэффициент множественной корреляции удобно рассчитывать как корень из коэффициента множественной детерминации, т.е.
Алгоритм вычисления коэффициентов множественной детерминации и корреляции:
1. Скопируем с итогового листа инструмента анализа Регрессия
– Регрессия значения столбцов Предсказанное У и Остатки в таблицу 4.
2. Вычислим среднее значение у расчетного
3. В третий столбец введем формулу общих отклонений у-уср. и просчитаем ее для всех наблюдений.
4. Вычислим суммы квадратов общих отклонений и отклонений, которые не объясняются регрессией (остатков).
6. Рассчитаем коэффициент множественной корреляции R .
7. Для проверки полученных коэффициентов скопируем с итогового листа Регрессия значения ячеек R-квадрат и Множественный R . Значения совпали.
Таблица 4 – Расчет коэффициентов
и
Факт.
Предсказанное Y
Остатки
Y-Y
2,48
2,625457299
-0,1455
-0,1544
2,62
2,620926931
-0,0009
-0,0144
2,88
2,675366933
0,20463
0,24556
По формуле
Регрессия
2,68
2,751933387
-0,0719
0,04556
R-квадрат
2,52
2,54272099
-0,0227
-0,1144
0,2126
0,212637
2,74
2,598600237
0,1414
0,10556
Коеф. мн. корреляций
2,56
2,605433397
-0,0454
-0,0744
0,4611
0,461126
2,68
2,654116545
0,02588
0,04556
2,55
2,635444281
-0,0854
-0,0844
СРЗНАЧ
2,6344
2,634444444
СУММКВ
0,09875
0,12542
3.2 Разложение коэффициента множественной детерминации на коэффициенты отдельной детерминации
Для определения доли влияния каждого фактора на показатель используют коэффициенты отдельной детерминации.
Коэффициентом отдельной детерминации
для фактора
называется произведение коэффициента корреляции
между фактором
и показателем У на стандартизованный параметр регрессии :
,
Сумма коэффициентов отдельной детерминации равняется коэффициенту множественной детерминации:
Во время анализа двухфакторной модели коэффициенты отдельной детерминации рассчитываются по формулам:
Теперь рассчитаем коэффициенты отдельной детерминации по этим формулам. Полученное значение
совпало с тем, которое рассчитали ранее.
Таблица 5 – Расчет коэффициентов отдельной детерминации
d12
0,2153
d22
-0,003
R2
0,2126
3.3 Предварительные выводы об адекватности модели
С помощью полученных коэффициентов множественной детерминации, корреляции и отдельной детерминации можно сделать предварительные выводы об адекватности модели.
1)Поскольку коэффициент множественной детерминации R =0,2126,то это свидетельствует про то, что вариация общих затрат на предприятиях на 21,26% определяется вариацией затрат оборота и трудоемкостью и на 78,74% вариацией показателей, которые не учитываются в модели.
2)Поскольку коэффициенты отдельной детерминации d1=0,2153, определяется вариацией затрат оборота.,027,то это свидетельствует о том, что вариация общих затрат на предприятиях на 21,53% определяется вариацией затрат3)Коэффициент множественной корреляции R =0,2126 характеризует слабую связь между общими затратами и факторами, которые их обуславливают. оборота.
4. Оценка дисперсионно-ковариационной матрицы оценок параметров модели
4.1 Оценка дисперсии отклонений
Вычислим оценку дисперсии отклонений по формуле
,
где
- сумма квадратов отклонений;
n – количество наблюдений;
m – количество факторов модели.
Полученное значение проверим копированием с итогового листа Регрессии
значение ячейки Остаток с таблицы дисперсийного анализа. Значения совпали.
Таблица 6 – Оценка дисперсии остатков
По формуле
Регрессия
MS
0,0160563
Остаток
0,0164588
4.2 Расчет дисперсии и ковариации оценок параметров модели
Для получения оценок ковариаций и дисперсий оценок параметров модели необходимо сложить ковариационную матрицу по формуле:
Таблица 7 – Оценка ковариационной матрицы оценок параметров модели
171,339642
-6,806989292
-0,5309
2,82
-0,1120349
-0,00874
0,0164588
-6,80698929
0,29993041
0,0166
-0,112
0,0049365
0,000273
-0,53085669
0,016595042
0,00234
-0,009
0,0002731
3,85E-05
Мы получили дисперсии оценок параметров модели, которые расположены по главной диагонали:
σ =
2,82
σ =
0,0049365
σ =
3,85E-05
4.3 Вычисление стандартных ошибок параметров и выводы о смещенности оценок параметров модели
Стандартные ошибки параметров модели рассчитаем по формуле
,
,
. Для получения стандартной ошибки оценки параметров а0 введем формулу возведения в степень 0,5. И аналогично получим стандартные ошибки оценок параметров а1 и а2. Для проверки полученных ошибок скопируем с итогового листа Регрессия
значения ячеек столбца Стандартная ошибка. Значения совпали.
Сравним каждую стандартную ошибку с соответствующим значением оценки параметра с помощью формулы:
Таблица 8 – Расчет стандартных ошибок оценок параметров модели. Выводы о смещении оценок параметров модели
Регрессия
По формуле
Стандартная ошибка
Выводы о смещённости оценок параметров модели
1,67929891
1,67929891
38,967585
Оценка смещена
0,070260191
0,070260191
-132,1707
Оценка не смещена
0,006204513
0,006204513
425,3525
Оценка смещена
5. Проверка гипотез о статистической значимости оценок параметров модели на основе F- и t-критериев
5.1 Проверка адекватности модели по критерию Фишера
Проверку адекватности модели по критерию Фишера проведем по представленному алгоритму.
Шаг 1.
Формулирование нулевой и альтернативной гипотез.
, т.е. не один фактор модели не влияет на показатель.
Хотя бы одно значение
отменно от нуля, т.е.
Шаг 2.
Выбор соответствующего уровня значимости.
Уровнем значимости
называется вероятность сделать ошибку 1-го рода, т.е. отвергнуть правильную гипотезу. Величина
называется уровнем доверия или доверительной вероятностью.
Выбираем уровень значимости
, т.е. доверительная вероятность – Р=0,95
Шаг 3.
Вычисление расчетного значения F-критерия.
Расчетное значение F-критерия определяется по формуле:
Для проверки полученного значения скопируем с итогового листа Регрессия расчетное значение F-критерия. Значения совпали
Шаг 4.
Определение по статистическим таблицам F-распределения Фишера критического значения F-критерия.
Критическое значение F-критерия находим по статистическим таблицам F-распределения Фишера по соответствующим данным:
- доверительной вероятности Р=0,95 ;
- степеней свободы
Определяем табличное значение критерия
=5,14
Шаг 5.
Сравнение рассчетного значения F-критерия с критическим и интерпритация результатов.
Вывод о принятии нулевой гипотезы, т.е. об адекватности модели делаем с помощью встроенной логической функции ЕСЛИ.
Поскольку
,то отвергаем нулевую гипотезу про незначимость факторов с риском ошибиться не больше чем на 5% случаев, т.е. с надежностью Р=0,95 можно считать, что принятая модель адекватна статистическим данным и на основе этой модели можно осуществлять экономический анализ и прогнозирование.
5.2 Проверка значимости оценок параметров модели по критерию Стьюдента
Проверку гипотезы о значении каждого параметра модели проведем в соответствии с представленным алгоритмом.
Шаг 1.
Формулирование нулевой и альтернативной гипотез.
- оценка j-го параметра является статистически незначимой, т.е. j-й фактор никак не влияет на показатель у;
- оценка j-го параметра является статистически значимой, т.е. j-й фактор влияет на показатель у.
Шаг 2.
Выбор соответствующего уровня значимости.
Выбираем уровень значимости
, т.е. доверительная вероятность – Р=0,95.
Шаг 3.
Вычисление расчетного значения t-критерия.
Расчетное значение t-критерия определяется по формуле:
Во время анализа двухфакторной модели расчетные значения t-критерия определяются по формулам:
=-3,2333
=3,4264
=4,9937
Для проверки полученного значения t-критерия скопируем с итогового листа Регрессия значения ячеек столбца t-статистика. Значения совпали.
Шаг 4.
Определение по статистическим таблицам t-распределения Стьюдента критического значения t-критерия.
Критическое значение t-критерия находим по статистическим таблицам t-распределения Стьюдента по соответствующим данным:
- доверительной вероятности Р=0,95 ;
- степеней свободы
Определяем табличное значение критерия
=2,45
Шаг 5.
Сравнение рассчетного значения t-критерия с критическим и интерпритация результатов.
Выводы о принятии нулевой гипотезы, т.е. о значимости оценок параметров
,
и
делаем с помощью встроенной логической функции ЕСЛИ. С надежностью Р=0,95 можно считать, что
- оценки 1-го и 2-го параметров модели значимые, т.е. оба фактора существенно влияют на показатель;
- оценка 0-го параметра модели не является статистически значимой.
Таблица 9 – Проверка гипотез о статистической значимости оценок параметров модели на основе F- и t- критериев
F-критерий Фишера
По формуле
Регресия
Р=0.95
F
2,45
0,810187427
0,810187
Модель не адекватна
t-критерий Стьюдента
По формуле
Регресия
Р=0.95
t-статистика
5,14
2,278334309
2,278334
а0
Параметр не значимый
-1,00461334
-1,00461
а1
Параметр не значимый
-0,02017108
-0,02017
а2
Параметр не значимый
6. Построение интервалов доверия для параметров модели
Интервалом доверия
называется интервал, который содержит неизвестный параметр с заданным уровнем доверия.
Интервалы доверия для параметров находим аналогично процедуре тестирования нулевой гипотезы по t-критерию Стьюдента:
- выбираем уровнем значимости
=0,05 и соответственно уровень доверия будет составлять - Р=0,95;
- для каждого параметра вычисляем нижнюю и верхнюю границы интервала доверия по формуле, при этом делаем абсолютную ссылку на табличное значение t-критерия
:
где
- стандартная ошибка параметров модели
Для проверки полученных значений границ скопируем с итогового листа Регрессия значения ячеек столбцов Нижнее 95% и Верхнее 95%. Значения совпали.
Таблица 10 – Доверительные интервалы для оценок параметров
По формуле
Регресия
Нижние 95%
Верхние 95%
Нижние 95%
Верхние 95%
-0,283092
7,9351007
-0,28309207
7,935100718
-0,242504
0,1013362
-0,24250482
0,101336169
-0,015307
0,0150567
-0,01530705
0,015056745
Исходя из этого, 95% интервалы доверия для параметров модели имеют вид:
-0,283092≤а0≤7,9351007
-0,242504≤а1≤0,1013362
-0,015307≤а2≤0,0150567
7. Расчет прогнозного значения рентабельности на основании оцененной модели
Так как оцененная модель является адекватной статистическим данным, то на основании этой модели можно осуществлять прогнозирование рентабельности для одного из предприятий объединения, деятельность которого исследовалась.
7.1 Точечный прогноз рентабельности
Сделаем точечный прогноз рентабельности для одного из предприятий при условии того, что затраты оборота составят 7 г.о. и трудоемкость – 50 г.о., т.е.
, по формуле:
Хр1
Хр2
1
16
100
3,826004322
-0,070584325
Ур=2,684139944
-0,000125152
Т.е. Ур=3,826-0,07*160,000125*100=2,684
7.2 Доверительный интервал для прогноза математического ожидания рентабельности
Рассчитаем значения верхней и нижней границ прогнозного интервала, используя табл. значения критерия Стьюдента 2,45, по формуле:
Оценку дисперсий матожидания вычислим по формуле:
Интервальный прогноз матожидания рентабельности:
Стандартная ошибка матожидания:
2,820044828
-0,11203
-0,00874
1
1
16
100
-0,112034872
0,00494
0,00027
16
-0,008737264
0,00027
3,8E-05
100
1
0,153760481
-0,005737513
-0,000518
16
0,01021
100
оценка дисперсионного прогноза
нижняя граница
2,436594351
верхняя граница
2,931685538
Таким образом, 95% интервал доверия для прогноза матожидания рентабельности имеет вид 2,437
2,932.
7.3 Доверительный интервал для прогноза рентабельности
Для нахождения интервального прогноза индивидуального значения рентабельности вычислим стандартную ошибку прогноза индивидуального значения по формуле:
А значение нижней и верхней границ по формуле:
Стандартная ошибка прогноза индивидуального значения