Главная      Учебники - Экономика     Лекции по маркетингу - часть 5

 

поиск по сайту            

 

 

 

 

 

 

 

 

 

содержание   ..  745  746  747   ..

 

 

Классификация регионов РФ по доходам от услуг связи

Классификация регионов РФ по доходам от услуг связи

Содержание.

Введение………………………………………………………………………..…3

Глава 1. Теоретические аспекты кластерного анализа. Метод k -средних.4

Глава 2. Кластерный анализ регионов России.....................…………….…..7

2.1. Евклидова Метрика…...………………………………………………….......9

2.2. Метод k-средних.............................................................................................11

Глава 3. Регрессионный анализ в кластерах……....……………………….16

Глава 4. Дискриминантный анализ………....……………………………….29

Заключение……………………………………………………………………...35

Список литературы.......………………………………………………………..37

Приложения……………………………………………………………………..38

Введение.

Необходимость развития сферы услуг требует существенной перестройки структуры потребления населения, значительного возрастания доли услуг и сокращения удельного веса материального потребления.

На современном этапе социально-экономического развития сфера сервиса становится одним из наиболее обширных секторов развития рыночных отношений, вовлечения населения в экономическую деятельность. Она теснейшим образом связана со всеми другими областями общественной жизни. Соответственно сфера сервиса является одним из важнейших источников мобилизации потенциала национального роста, повышения качества и уровня жизни.

Социальная значимость эффективности сферы услуг очевидна: она непосредственно служит увеличению доли свободного времени населения и, следовательно, создает возможности для всестороннего гармоничного развития личности.

Прогресс в отрасли определяется развитием всех видов электрической связи, среди которых наиболее распространенной является телефонная связь.

Телефонная связь приносит более половины всех доходов, получаемых от услуг связи. Одним из важнейших направлений обслуживания населения в области связи является телевидение и радиовещание, которые несет не только важную информационную и политическую нагрузку, но и являются в некоторых отдаленных районах области почти единственным средством культурного досуга.

Цель данной курсовой работы - статистическое изучение предоставления услуг связи населению в регионах России в 2008 году и влияние их на доход от услуг связи населению в расчете на одного жителя.


Глава 1. Теоретические аспекты кластерного анализа. Метод k -средних.

При большом количестве наблюдений иерархические методы кластерного анализа не пригодны. В таких случаях используют неиерархические методы, основанные на разделении, которые представляют собой итеративные методы дробления исходной совокупности. В процессе деления новые кластеры формируются до тех пор, пока не будет выполнено правило остановки.

Такая неиерархическая кластеризация состоит в разделении набора данных на определенное количество отдельных кластеров. Существует два подхода. Первый заключается в определении границ кластеров как наиболее плотных участков в многомерном пространстве исходных данных, т.е. определение кластера там, где имеется большое "сгущение точек". Второй подход заключается в минимизации меры различия объектов.

Наряду с иерархическими методами классификации, существует многочисленная группа так называемых итеративных методов кластерного анализа (метод k - средних.).

Сущность их заключается в том, что процесс классификации начинается с задания некоторых начальных условий (количество образуемых кластеров, порог завершения процесса классификации и т.д.). Название метода было предложено Дж. Мак-Куином в 1967 г. В отличие от иерархических процедур метод k - средних не требует вычисления и хранения матрицы расстояний или сходств между объектами. Алгоритм этого метода предполагает использование только исходных значений переменных. Для начала процедуры классификации должны быть заданы k выбранных объектов, которые будут служить эталонами, т.е. центрами кластеров. [1]

Считается, что алгоритмы эталонного типа удобные и быстродействующие. В этом случае важную роль играет выбор начальных условий, которые влияют на длительность процесса классификации и на его результаты. Метод k - средних удобен для обработки больших статистических совокупностей.

Математическое описание алгоритма метода k - средних.

Пусть имеется n наблюдений, каждое из которых характеризуется m признаками X1 , X2 , , X n . Эти наблюдения необходимо разбить на k кластеров.

Для начала из n точек исследуемой совокупности отбираются случайным образом или задаются исследователем исходя из каких-либо априорных соображений k точек (объектов). Эти точки принимаются за эталоны.

Каждому эталону присваивается порядковый номер, который одновременно является и номером кластера.

На первом шаге из оставшихся (n -k ) объектов извлекается точка X i с координатами ( xi 1 , xi 2 , ... , xim ) и проверяется, к какому из эталонов (центров) она находится ближе всего. Для этого используется одна из метрик, например, евклидово расстояние. Проверяемый объект присоединяется к тому центру (эталону), которому соответствует минимальное из расстояний. Эталон заменяется новым, пересчитанным с учетом присоединенной точки, и вес его (количество объектов, входящих в данный кластер) увеличивается на единицу. Если встречаются два или более минимальных расстояния, то i -ый объект присоединяют к центру с наименьшим порядковым номером.

На следующем шаге выбираем точку X i +1 и для нее повторяются все процедуры. Таким образом, через (n-k ) шагов все точки (объекты) совокупности окажутся отнесенными к одному из k кластеров, но на этом процесс разбиения не заканчивается. Для того чтобы добиться устойчивости разбиения по тому же правилу, все точки X1 , X2 ,…, Xn опять подсоединяются к полученным кластером, при этом веса продолжают накапливаться. Новое разбиение сравнивается с предыдущим. Если они совпадают, то работа алгоритма завершается. В противном случае цикл повторяется.

Окончательное разбиение имеет центры тяжести, которые не совпадают с эталонами, их можно обозначить C1 ,C2 , ,C k . При этом каждая точка X i будет относиться к такому кластеру (классу) l , для которого расстояние минимально. Возможны две модификации метода k - средних. Первая предполагает пересчет центра тяжести кластера после каждого изменения его состава, а вторая – лишь после того, как будет завершен просмотр всех данных. В обоих случаях итеративный алгоритм этого метода минимизирует дисперсию внутри каждого кластера, хотя в явном виде такой критерий оптимизации не используется.

Достоинства алгоритма k-средних:

• простота использования;

• быстрота использования;

• понятность и прозрачность алгоритма.

Недостатки алгоритма k-средних:

• алгоритм слишком чувствителен к выбросам, которые могут искажать среднее. Возможным решением этой проблемы является использование модификации алгоритма - алгоритм k-медианы;

• алгоритм может медленно работать на больших базах данных. Возможным решением данной проблемы является использование выборки данных.

Глава 2. Кластерный анализ регионов России.

Нами исследуется совокупность 62 регионов, каждый из которых характеризуется по 5 замеренным на нем признакам Х. Четыре признака из них характеризуют степень оснащенности населения средствами связи и среднедушевой доход населения, а пятый – показатель дохода от услуг связи, предоставляемых населению. Данные по эти признакам приведены в Приложении 1. Вот эти признаки:

X1 – доходы от услуг связи населению в расчете на одного жителя (рублей);

Х2 – число квартирных телефонных аппаратов сети общего пользования на 1000 человек населения (на конец года; штук);

Х3 – средства связи (пользовательское оборудование) для оказания услуг передачи данных и телематических служб на 1000 человек (на конец года;штук);

Х4 – число абонентских терминалов сотовой связи на 1000 человек населения (на конец года; штук);

Х5 – среднедушевые доходы населения (рублей).

Перед началом работы и анализа данных необходимо выявить наличие выбросов, и если они могут повлиять на результаты анализа, удалить их из таблицы исходных данных. Графики исследования на выбросы по признакам X1 и X2, по признакам X1 и X3, и, наконец, по признакам X4 и X5 приведены на рисунках в Приложении 2 . Проведя анализ по этим диаграммам можно сделать следующие выводы.

Камчатская область является выбросом по трем признакам: X1, X2, X5, следовательно, наличие данных по этому региону может повлиять на результаты дальнейшего анализа. Поэтому, Камчатская область будет удалена из массива исходных данных.

Остальные выбросы определяются по одному или по двум признакам, поэтому можно сделать вывод о том, что эти выбросы обусловлены влиянием посторонних факторов и они не окажут воздействия на результаты дальнейшего анализа. Поэтому из таблицы исходных данных они удалены не будут.

В результате для дальнейшей работы будут использованы данные, указанные в таблице Приложения 3 . . Перед началом исследования и разбиения объектов на кластеры необходимо провести проверку данных на мультиколлинеарность. Парные коэффициенты корреляции приведены в Табл. 1.1.

Табл. 1.1

X1

X2

X3

X4

X5

X1

1

0,26315

0,25601

0,26674

0,68608

X2

0,26315

1

0,19883

0,18494

0,31769

X3

0,25601

0,19883

1

0,05359

0,21421

X4

0,26674

0,18494

0,05359

1

0,3323

X5

0,68608

0,31769

0,21421

0,3323

1

Табл 1.1 Парные коэффициенты корреляции.

Как видно из таблицы (Табл. 1.1), между данными нет слишком сильных взаимосвязей, следовательно, построенные кластерные модели будут адекватно отображать действительность.

Так как наши показатели имеют разные меры измерения, то для дальнейшего кластерного анализа нам требуется простандартизировать исходные данные. Таблица стандартизированных данных представлена в Приложении 3.

2.1 Евклидова Метрика

Теперь, когда наши данные готовы к использованию, можно провести кластерный анализ. Для этого используем методы ближнего и дальнего соседа, а также методы Варда и k-средних.

В кластерном анализе, как известно более распространены иерархические процедуры. Расстояние между исследуемыми объектами будет определяться по обычному невзвешенному Евклидову расстоянию.

После проведенного кластерного анализа было получено три дендрограммы. Наиболее точное разбиение на кластеры дает метод Варда, которая приведена ниже на рис. 2.1.1.

Рис 2.1.1

Рис 2.1.1 Дендрограмма метода Варда.

Проанализировав рисунок 2.1.1, можно прийти к выводу, что здесь наблюдается три кластера. Рассмотрим более подробно какие объекты принадлежат каждому из кластеров:

К первому кластеру относятся Сахалинская область, Республика Саха (Якутия) Хабаровский край, Приморский край, Челябинская область, Самарская область, Пермский край, Мурманская область, Республика Коми, Кемеровская область, Красноярский край, Алтайский край, Ростовская область, Республика Башкортостан, Волгоградская, Новосибирская, Томская и Воронежская области.

Во второе объединение включены Амурская область, Республика Хакасия, Иркутская область, Калининградская область, Тверская область, Волгоградская область, Архангельская область, Новгородская область, Республика Карелия, Смоленская область, Республика Мордовия, Псковская, Костромская, Ульяновская, Астраханская, Ярославская, Калужская, Саратовская, Пензенская область, Тульская, Рязанская, Владимирская области.

В третий кластер вошли Республика Алтай, Республика Адыгея, Забайкальский край, Кабардино-Балкарская Республика, Карачаево-Черкесская Республика, Республика Бурятия, Курская область, Республика Калмыкия, Чувашская Республика, Республика Марий Эл, Ивановская область, Республика Северная Осетия-Алания, Липецкая, Курганская, Кировская, Орловская, Брянская, Оренбургская, Тамбовская, Белгородская области и Удмуртская Республика.

Результаты, полученные методами ближнего и дальнего соседа, приведены на рисунках Приложения 4 . Причем, метод ближнего соседа не дал четкого разбиения данных на кластеры, а с помощью метода дальнего соседа мы получили всего 2 кластера. Очевидно, что более целесообразно использовать проанализированную выше дендрограмму метода Варда (рис.2.1.1).


2.2. Метод k -средних.

После того, как мы выяснили количество кластеров, можно использовать для дальнейшего анализа метод k-средних. Особенность метода k-средних состоит в том, что он строит k насколько можно различных кластеров. С помощью Евклидовой метрики и метода Варда мы получили разбиение на 3 объединения. Но я считаю, что более целесообразным будет разбить данные на 4 кластера.

Графическое изображение метода указано на рисунке 2.1.2, приведенном ниже. На нем представлены график средних значений каждого и 4х полученных кластеров.

Рис 2.2.1.

Рис 2.2.1. График средних для каждого кластера.

Определим принадлежность каждого из показателей к нужной группе и соответствующие расстояния до центра объединения. Соответствующие таблицы представлены в Приложении 5 в таблицах 1, 2, 3 и 4. Ниже представлена сводная таблица (табл.2.2.1) , в которой представлены все кластеры и расстояния.

Табл. 2.2.1

X1

X2

X3

X4

X5

CASE_NO

CLUSTER

DISTANC

Белгородская область

-0,8131352

0,004701

-0,2307317

-0,4534437

0,2923749

1

1

0,46

Брянская область

-0,5913546

-0,6507491

-0,4627552

-1,0226327

-0,5713877

2

2

0,27

Владимирская область

-0,1888711

-0,8146117

-0,2686726

0,2366258

-0,7135984

3

2

0,51

Воронежская область

0,2590349

2,6265014

2,0493733

-1,6559409

-0,4880339

4

1

1,39

Ивановская область

-0,5783203

-1,1112028

-0,6918601

0,5398779

-1,108734

5

2

0,57

Калужская область

0,5040206

0,4618774

-0,3066136

0,6423635

-0,026406

6

3

0,29

Костромская область

-0,2101012

0,6667056

-0,6736193

0,4931024

-0,7718189

7

3

0,57

Курская область

-0,486389

-1,4536755

-0,5940892

-0,4240119

-0,1361659

8

2

0,37

Липецкая область

-0,0039223

1,1206048

-0,4284624

-1,0073912

0,1383929

9

1

0,59

Орловская область

-0,6052776

-0,087062

-0,5802262

-0,5895655

-0,6439247

10

2

0,44

Рязанская область

-0,3097347

-0,4819707

-0,4160586

0,5377756

-0,1679804

11

3

0,40

Смоленская область

0,2129211

1,4450526

-0,5794965

1,2299473

-0,1005337

12

3

0,63

Тамбовская область

-0,7343369

0,5274224

-0,4985072

-0,4655317

-0,1864327

13

1

0,45

Тверская область

1,6961655

-0,694992

-0,5532297

0,9734706

-0,3127362

14

3

0,86

Тульская область

-0,122021

0,3094853

-0,1687128

-0,3199497

-0,1431651

15

1

0,29

Ярославская область

0,1330367

0,8059887

-0,1169088

0,7874199

0,2379722

16

3

0,32

Республика Карелия

-0,5992542

1,1074958

-0,3927103

0,8615249

0,1240764

17

3

0,53

Республика Коми

0,9897458

1,9710513

-0,2971283

1,0365387

2,162429

18

4

0,92

Архангельская область

-0,4832291

0,5356156

-0,3285026

0,9356298

0,9496617

19

3

0,46

Вологодская область

-1,2570915

0,109573

-0,3700917

1,1821207

0,1129413

20

3

0,60

Калининградская область

0,9657509

-0,9129292

-0,4467032

1,4874751

0,3445506

21

3

0,67

Мурманская область

0,0409078

0,9157766

-0,2613763

2,5853845

2,2060148

22

3

1,22

Новгородская область

-0,7687001

1,0009851

-0,445244

1,305629

-0,0614019

23

3

0,57

Псковская область

-0,7074784

0,6404876

-0,7108306

0,5598494

-0,4924879

24

3

0,57

Республика Адыгея

-1,989876

-1,5011956

-0,737827

-3,104929

-1,2258112

25

2

1,26

Кабардино-Балкарская Республика

-0,7031336

-1,5536316

-0,7254233

-1,7946906

-1,03397

26

2

0,56

Республика Калмыкия

-1,4852905

-0,5737337

-0,8822945

-0,2269243

-1,9686789

27

2

0,71

Карачаево-Черкесская Республика

-0,6048826

-1,1833023

-0,8326794

-0,4996936

-1,0062914

28

2

0,17

Республика Северная Осетия - Алания

0,5064892

0,5225066

-0,7268825

-1,4220636

-0,6366074

29

1

0,75

Астраханская область

0,3634081

-0,1313049

-0,1935204

1,0086836

-0,228746

30

3

0,26

Волгоградская область

-0,522727

-0,1706319

2,167574

-0,0072373

-0,3095547

31

1

0,87

Ростовская область

0,0316258

-0,642556

0,8753929

-1,040502

0,1024426

32

1

0,57

Республика Башкортостан

-0,2358736

0,1259592

1,5612484

-0,0797656

0,7680011

33

1

0,74

Республика Марий Эл

-0,9572038

-0,563902

-0,6816452

0,0805324

-1,2713059

34

2

0,47

Республика Мордовия

-0,406307

1,4253891

-0,5794965

-0,0550639

-1,0991897

35

1

0,79

Удмуртская Республика

-0,5852324

-0,2918902

0,2807415

-0,7209573

-0,7183706

36

1

0,37

Чувашская Республика

-1,1169727

-0,6097835

-0,341636

0,0085297

-1,0323793

37

2

0,44

Пермский край

0,024615

-0,0198784

0,327438

0,1945804

1,361659

38

3

0,69

Кировская область

-0,5039655

-0,0018535

-0,4554588

-0,7656304

-0,5494358

39

1

0,44

Оренбургская область

-0,9777427

0,345535

-0,0614567

-0,4345233

-0,5265294

40

1

0,38

Пензенская область

-0,2787288

0,0489439

-0,2737801

-0,1607029

-0,5300289

41

1

0,39

Самарская область

0,8135852

0,4684319

0,9002004

1,4301883

1,2617616

42

4

0,67

Саратовская область

-0,101877

0,3357033

0,4325053

0,0994528

-0,8834876

43

1

0,42

Ульяновская область

0,4976022

0,2177223

-0,4554588

0,3322789

-0,6626953

44

3

0,51

Курганская область

-0,6422081

0,0210872

-0,5218555

-0,6179461

-0,2157021

45

1

0,45

Челябинская область

0,004866

-0,4278961

0,9600304

1,1768651

0,7387318

46

3

0,67

Республика Алтай

-1,7628619

-0,8015027

-0,7772272

-1,5345349

-0,5300289

47

2

0,63

Республика Бурятия

-0,4625915

-1,1833023

-0,6728896

-0,2847367

-0,1717981

48

2

0,35

Республика Хакасия

0,7034849

-1,0489351

-0,2154094

0,5803466

-0,3420055

49

3

0,67

Алтайский край

-0,3866568

0,8535089

1,181839

-0,9096358

-0,6649223

50

1

0,49

Забайкальский край

0,2759203

-2,0206398

-0,7422048

-1,4677879

-0,2758314

51

2

0,75

Красноярский край

0,9006781

-0,314831

2,4747497

0,4610428

1,1981327

52

4

0,95

Иркутская область

0,313542

-1,5716565

-0,1621461

1,0906721

0,3318248

53

3

0,78

Кемеровская область

-0,0240662

-1,4258189

2,2813968

-0,3320377

0,827176

54

1

1,26

Новосибирская область

1,6268467

0,8567861

4,3973343

0,2087707

0,3178265

55

4

1,65

Томская область

0,8873476

2,339742

0,695903

-0,3467536

0,5227116

56

4

0,92

Республика Саха (Якутия)

2,0954892

0,9567422

-0,4802664

-1,7920627

2,1958342

57

4

1,17

Приморский край

1,9378926

0,1915043

0,9541933

1,2236405

0,3082821

58

4

0,74

Хабаровский край

2,0348599

-0,0362647

0,0771737

0,0915693

1,2299471

59

4

0,57

Амурская область

0,5284105

-1,7240487

-0,5641742

-0,0119674

0,03086

60

2

0,79

Сахалинская область

3,8591686

1,0468666

-0,7108306

0,1667253

4,0445726

61

4

1,67

Табл. 2.2.1 Сводная таблица метода k-средних.

Укажем какие регионы к какому кластеру относятся.

1й кластер: Белгородская область, Воронежская область, Липецкая область, Тамбовская область, Тульская область, Республика Северная Осетия – Алания, Волгоградская область, Ростовская область, Республика Башкортостан, Республика Мордовия, Удмуртская Республика, Кировская область, Оренбургская область, Пензенская область, Саратовская область, Курганская область, Алтайский край, Кемеровская область.

2й кластер: Брянская область, Владимирская область, Ивановская область, Курская область, Орловская область, Республика Адыгея, Кабардино-Балкарская Республика, Республика Калмыкия, Карачаево-Черкесская Республика, Республика Марий Эл, Чувашская Республика, Республика Алтай, Республика Бурятия, Забайкальский край, Амурская область.

3й кластер: Калужская область, Костромская область, Рязанская область, Смоленская область, Тверская область, Ярославская область, Республика Карелия, Архангельская область, Вологодская область, Калининградская область, Мурманская область, Новгородская область, Псковская область, Астраханская область, Пермский край, Ульяновская область, Челябинская область, Республика Хакасия , Иркутская область.

4й кластер: Республика Коми, Самарская область, Красноярский край, Новосибирская область, Томская область, Республика Саха (Якутия), Приморский край, Хабаровский край, Сахалинская область.

Опираясь на рисунок 2.2.2 и данные, приведенные в сводной таблице k-метода (табл. 2.2.2.) проанализируем каждый из полученных кластеров.

Самыми высокими показателями среднедушевого дохода населения, число квартирных телефонных аппаратов сети общего пользования на 1000 человек, средства связи для оказания услуг передачи данных и телематически служб на 1000 человек, и что вполне логично, доходов от услуг связи населению на одного жителя обладает кластер 4.

В регионах группы 3 наблюдается самое большое число абонентов сотовых терминалов. Также в регионах данной группы наблюдается второй по величине среднедушевые доходы населению. Оставшиеся два показателя находится на среднем уровне.

Что же касается регионов, принадлежащих первой группе, то степень оснащенности населения данных областей и Республик услугами связи, можно охарактеризовать как средний уровень.

Самым же низким уровнем оказываемых услуг связи отличается четвертый кластер. Данному объединению принадлежит и самый низкий среднедушевой доход населения. То есть, люди проживающие на данных территориях, часто просто не могут позволить такую вроде бы простую вещь как мобильный телефон у каждого члена семьи. Совокупность влияния этих факторов также влечет за собой самый низкий из 4 групп доход от услуг связи населению.


Глава 3. Регрессионный анализ.

Регрессионный анализ – это статистический метод исследования зависимости случайной величины Y от переменных Xj (j = 1, 2, ..., k), рассматриваемых в регрессионном анализе как неслучайные величины независимо от истинного закона распределения Xj.[2]

Важной предпосылкой построения регрессионной модели является оценка мультиколлинеарности. Как видно из парных коэффициентов корреляции (табл. 2.1.1), приведенной выше, в наших данных мультиколлинеарности не наблюдается.

Следующим шагом моей курсовой работы является проведение регрессионного анализа по каждому из кластеров. Для начала рассмотрим группу регионов, в которых наименее всего развито оказание услуг связи населению. Это группа под номером 2. Данные этого кластера приведены в таблице 3.1.

Табл. 3.1

X1

X2

X3

X4

X5

Брянская область

-0,59135

-0,65075

-0,46276

-1,02263

-0,57139

Владимирская область

-0,18887

-0,81461

-0,26867

0,236626

-0,7136

Ивановская область

-0,57832

-1,1112

-0,69186

0,539878

-1,10873

Курская область

-0,48639

-1,45368

-0,59409

-0,42401

-0,13617

Орловская область

-0,60528

-0,08706

-0,58023

-0,58957

-0,64392

Республика Адыгея

-1,98988

-1,5012

-0,73783

-3,10493

-1,22581

Кабардино-Балкарская Республика

-0,70313

-1,55363

-0,72542

-1,79469

-1,03397

Республика Калмыкия

-1,48529

-0,57373

-0,88229

-0,22692

-1,96868

Карачаево-Черкесская Республика

-0,60488

-1,1833

-0,83268

-0,49969

-1,00629

Республика Марий Эл

-0,9572

-0,5639

-0,68165

0,080532

-1,27131

Чувашская Республика

-1,11697

-0,60978

-0,34164

0,00853

-1,03238

Республика Алтай

-1,76286

-0,8015

-0,77723

-1,53453

-0,53003

Республика Бурятия

-0,46259

-1,1833

-0,67289

-0,28474

-0,1718

Забайкальский край

0,27592

-2,02064

-0,7422

-1,46779

-0,27583

Амурская область

0,528411

-1,72405

-0,56417

-0,01197

0,03086

Табл. 3.1. Группа регионов №2.

Где:

X1 – доходы от услуг связи населению в расчете на одного жителя (рублей);

Х2 – число квартирных телефонных аппаратов сети общего пользования на 1000 человек населения (на конец года; штук);

Х3 – средства связи (пользовательское оборудование) для оказания услуг передачи данных и телематических служб на 1000 человек (на конец года;штук);

Х4 – число абонентских терминалов сотовой связи на 1000 человек населения (на конец года; штук);

Х5 – среднедушевые доходы населения (рублей).

Далее приведена корреляционная матрица для данных показателей (таблица 3.2.):

Табл 3.2.

X1

X2

X3

X4

X5

X1

1

-0,40043

0,324542

0,437464

0,640113

X2

-0,40043

1

0,256279

0,360102

-0,41142

X3

0,324542

0,256279

1

0,358174

0,321892

X4

0,437464

0,360102

0,358174

1

0,024324

X5

0,640113

-0,41142

0,321892

0,024324

1

Табл. 3.2. Корреляционная матрица для группы регионов 2.

В качестве результативного признака для регрессионного анализа возьмём показатель X1 (доходы от услуг связи населению в расчете на одного жителя), факторными же признаками будут являться все остальные признаки. Данный выбор основан на том, что довольно интересно насколько доход от услуг связи населению в каждой группе зависит от оснащенности населения средствами связи и их среднедушевого дохода.

Теперь проделаем регрессионный анализ с исключением. Все результаты представлены рисунке (Рис.3.1).

Рис. 3.1.

Рис. 3.1. Результаты регрессионного анализа для кластера 2.

Исходя из рисунка 3.1. можно построить следующее уравнение регрессии:

X1=0,114351+0,300196*X4+0,807374*X5

Необходимо проверить значимость уравнения регрессии. Для этого находим наблюдаемое значение статистики F. И получаем, что F=8,5576. Теперь найдем критическое значение статистики F на уровне значимости 0,1, оно равно 2,807. Так как наблюдаемое значение статистики F превосходит его критическое, то на уровне значимости 0,1 можно утверждать, что полученное уравнение регрессии значимое.

Далее необходимо проверить значимость коэффициентов уравнения. С вероятностью 0,1 можно утверждать, что коэффициенты при X4 и Х5 значимы. Коэффициент детерминации составил 58,8%. Следовательно, на долю вариации факторных признаков приходится большая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. А значит данная регрессионная модель имеет высокое практическое значение.

Увеличение числа абонентских терминалов сотовой связи в регионах страны с самым маленьким среднедушевым доходом на единицу ведет к увеличению дохода от услуг связи населению на одного жителя на 0,3002 единиц в этих регионах. Это обусловлено тем, что в современной ситуации от услуг связи населению, основная доля дохода приходится именно на доход от пользователей аппаратами сотовой связи. А увеличение среднедушевого дохода населения единицы своего измерения приводит к увеличению дохода от услуг связи населению на 0,8074 единицы.

Далее рассмотрим 3 кластер, в котором собраны регионы с самым высоким числом зарегистрированных сотовых терминалов на 1000 человек. Они представлены в таблице 3.3.

Табл. 3.3.

 

 

 

 

 

 

 

содержание   ..  745  746  747   ..

 

X1

X2

X3

X4

X5

Калужская область

0,504021

0,461877

-0,30661

0,642363

-0,02641

Костромская область

-0,2101

0,666706

-0,67362

0,493102

-0,77182

Рязанская область

-0,30973

-0,48197

-0,41606

0,537776

-0,16798

Смоленская область

0,212921

1,445053

-0,5795

1,229947

-0,10053

Тверская область

1,696166

-0,69499

-0,55323

0,973471

-0,31274

Ярославская область

0,133037

0,805989

-0,11691

0,78742

0,237972

Республика Карелия

-0,59925

1,107496

-0,39271

0,861525

0,124076

Архангельская область

-0,48323

0,535616

-0,3285

0,93563

0,949662

Вологодская область

-1,25709

0,109573

-0,37009

1,182121

0,112941

Калининградская область

0,965751

-0,91293

-0,4467

1,487475

0,344551

Мурманская область

0,040908

0,915777

-0,26138

2,585385

2,206015

Новгородская область

-0,7687

1,000985

-0,44524

1,305629

-0,0614

Псковская область

-0,70748

0,640488

-0,71083

0,559849

-0,49249

Астраханская область

0,363408

-0,1313

-0,19352

1,008684

-0,22875

Пермский край

0,024615

-0,01988

0,327438

0,19458

1,361659