Full text

В условиях экономического кризиса и усиливающейся международной конкуренции устойчивость российской экономики во многом зависит от способности каждого региона успешно развиваться и конкурировать на рынках. Изменения в мире, вызванные политическими и экономическими причинами, требуют новых подходов к социально-экономическому развитию российских регионов. Социально-экономичес­кое положение регионов неоднородно. По одним показателям регион может находиться в числе передовых, а по другим, наоборот, имеет средние или вообще низкие значения. Каждый регион обладает своими уникальными природно-климатическими условиями, географическим и геополитическим положением, в каждом – особая демографическая ситуация. В таких условиях для учета региональных различий по уровню социально-экономических показателей целесообразно воспользоваться статистическими методами многомерной классификации субъектов РФ, в частности методом кластерного анализа.

Главная особенность кластерного анализа состоит в том, что различия между объектами, входящими в выделенную группу (кластер), незначительны, а различия между группами существенны.

Методы кластерного анализа позволяют:

-          объединять объекты в группы (кластеры) все более высокой общности на основе критерия минимума расстояния в пространстве изучаемых показателей, описывающих эти объекты;

-          разбивать множество объектов на заданное число кластеров [1–3].

Дискриминантный анализявляетсяразделом многомерного стати­стического анализа, который включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков. В кластерном анализе рассматриваются методы многомерной классификации без обучения. В дискриминантном анализе новые класте­ры не образуются, а формулируется правило, по которому объекты подмножества, подлежащего классификации, относятся к одному из уже существую­щих (обучающих) подмножеств (классов) на основе сравнения ве­личины дискриминантной функции классифицируемого объекта, рассчитанной по дискриминантным переменным, с некоторой константой дискриминации. Дискриминантная функция в общем виде запишется так:

 

У = b0 + b1x1+ b2x2 +…+ bkxk.                                            (1)

 

В качестве зависимой переменной выступает номинальная переменная, идентифицирующая принадлежность объектов (регионов) к одной из нескольких групп (кластеров). Независимые переменные (x1, x2 … xk) такие же, как и в регрессионном анализе (количественные и качественные).

В данной статье рассматривается применение кластерного и дискриминантного анализа для решения задачи классификации регионов Приволжского ФО по социально-экономическим показателям за 1-й квартал 2015 г. Для этого используется новая статистическая информация, приведенная на сайте Росстата (www.gks.ru), а именно ежеквартальное электронное издание «Статистическое обозрение» № 3 (94) 2015 г. [4] Статистические данные отдельных социально-экономических показателей регионов Приволжского ФО приведены в табл. 1. Для выделения однородных регионов Приволжского ФО по уровню отдельных социально-экономических показателей используется кластерный анализ [5]. Общая модель кластеризации имеет вид:

 

dab = αldlb + αf dfb + βdlf + γ(dlb – dfb),                                         (2)

 

где αl, αf, β, γ – параметры, определяющие алгоритм образования кластеров;

dlb, dfb, dlf – расстояние между соответствующими кластерами.

При определенных значениях параметров αl, αf, β, γ общее уравнение (2) преобразуется в конкретный алгоритм. В данном исследовании использовался алгоритм «средняя связь»:

 

          dab = Nl/(Nl + Nf) dlb + Nf/(Nl + Nf) dfb,                               (3)

 

где – Nl, Nf соответственно кластеры «l» и «f» с числом объектов N.

Зависимость (3) получена из общего уравнения (2) при следующих значениях параметров:

 

αl = Nl/(Nl + Nf); αf = Nf/(Nl + Nf) и β = γ = 0.

 

Для классификации регионов на однородные группы используется пакет прикладных программ “Statistiсa” (модуль – кластерный анализ). Схема работы следующая: Ввод исходных данных в таблицу – Анализ – Многомерный анализ – Кластерный анализ – Иерархическая классификация – ОК – Файл данных (исходные данные). Переменные строки. Правило объединения: метод полной связи. Мера близости: евклидово расстояние – ОК – Выбор переменных (Var1-Var5) – ОК – Вертикальная дендрограмма – Результат: дендрограмма классификации 14 регионов Приволжского ФО по пяти переменным (х15). На рисунке: по оси абсцисс – номера регионов, по оси ординат – евклидово расстояние. Для выделения кластеров используется граничное значение евклидова расстояния, которое задается в пределах dгр = (0,5 – 0,9)dmax. Из рисунка видно, что dmax= 18,0. Задаемся коэффициентом, равным 0,6. Следовательно, граничное значение равно 10,8. Для этого значения проведем на рисунке линию, параллельную оси абсцисс, которая позволит выделить три кластера (см. табл. 2).

 

Таблица 1 

Социально-экономические показатели регионов Приволжского ФО

за 1-й квартал 2015 г.

 

Регионы Приволжского ФО

Уровень безработицы, в процентах от экономи- чески активного населения, х1

Среднедуше- вые денеж- ные доходы населения (в месяц), тыс. рублей, х2

Среднедуше- вые денежные расходы населения на покупку товаров и оплату услуг (в месяц), тыс. рублей, х3

Среднемесяч- ная номинальная начислен- ная заработ- ная плата, тыс. рублей, х4

Средний размер на- значенных пенсий (на 1 апреля 2015 г.), тыс. рублей, х5

С1. Республика Башкортостан

6,5

21,225

18,721

24,166

11,432

С2. Республика Марий Эл

5,2

15,628

11,285

19,880

10,732

С3. Республика Мордовия

4,6

14,954

10,725

20,249

10.823

С4. Республика Татарстан

4,8

25,840

21,080

27,208

11,601

С5. Удмуртская Республика

4,9

20,957

14,186

23,524

11,807

С6. Чувашская Республика

5,7

16,559

12,681

19,901

10,911

С7. Пермский край

6,0

29,351

19,363

26,271

11,983

С8. Кировская область

5,2

19,208

14,319

20,637

11,779

С9. Нижегородская область

4,2

26,974

18,975

25,137

11,884

С10. Оренбургская область

5,8

18,459

14,502

22,794

11,000

С11. Пензенская область

4,7

18,420

14,601

21,767

11.039

С12. Самарская область

4,3

22,072

17,981

25,067

11,816

С13. Саратовская область

5,1

16,787

13,044

21,250

10,958

С14. Ульяновская область

5,5

20,452

13,889

21,139

11,069

 

Таблица 2

Номера регионов в кластерах

 

Номер кластера

Номер региона

1

9, 7, 4

2

13, 6, 3, 2

3

11, 10, 14, 8, 5, 12, 1

Первый кластер характеризуется низким уровнем безработицы и высокими показателями х2–х5 по сравнению с другими кластерами. Второй кластер – средний уровень безработицы, но в регионах низкие доходы, заработная плата и пенсия. Третий кластер имеет более высокую безработицу, но средние социально-экономи­ческие характеристики. К этому кластеру относится Пензенская область. Поэтому по уровню отдельных социально-экономических показателей первый кластер характеризуется как кластер с хорошими показателями, третий – со средними и второй – с удовлетворительными.

 

 

Результаты кластеризации регионов по социально-экономическим показателям

 

Следующим этапом исследования является решение задачи отнесения «нового» региона к определенному кластеру. Новый регион – это регион, не участвующий в кластеризации, например Тамбовская область. Такую задачу можно решить, используя дискриминантный анализ [6]. Построив дискриминантные функции и подставив в них социально-экономические характеристики Тамбовской области, можно определить, к какому кластеру она относится. Показатели Тамбовской области приведены в табл. 3.

Таблица 3 

Показатели Тамбовской области

 

Х1

Х2

Х3

Х4

Х5

4,6

19,853

16,135

20,016

10,751

 

По данным табл. 1 и дискриминантного анализа в ППП “Statistiсa” построены три модели для каждого кластера:

 

Y1 = – 1168,94 + 42,14Х1 – 23,34Х2 – 10,59Х3 + 23,34Х4 + 199,75Х5.

Y2 = – 1241,78 + 49,80Х1 – 34,92Х2 – 12,59Х3 + 25,26Х4 + 219,93Х5.

Y3 = – 1256,87 + 48,24Х1 – 30,55Х2 – 11,61Х3 + 24,65Х4 + 218,21Х5.

 

В каждую модель подставим характеристики Тамбовской области (см. табл. 3) и определим дискриминантные функции. Имеем: Y1 = 1004,821; Y2 = 1000,67; Y3 = 1010,568. По максимальному значению функции выбирается кластер, к которому принадлежит «новый» объект. В данном случае Тамбовская область входит в третий кластер. Принадлежность региона к кластеру можно определить на основе апостериорной вероятности (табл. 4). Из таблицы видно, что Тамбовская область (15) относится к третьему кластеру с вероятностью 0,995.

Таблица 4

Вероятности отнесения регионов к кластеру

 

Апостериорные вероятности (Таблица.sta) Неправильные классификации отмечены *

Номер

Наблюдения

G_1:1

G_2:2

G_3:3

1

G_3:3

0,000000

0,000141

0,999859

2

G_2:2

0,000000

0,997006

0,002994

3

G_2:2

0,000000

0,999385

0,000615

4

G_1:1

1,000000

0,000000

0,000000

5

G_3:3

0,000000

0,002394

0,997606

6

G_2:2

0,000000

0,965815

0,034185

7

G_1:1

1,000000

0,000000

0,000000

8

G_3:3

0,000000

0,033395

0,966605

9

G_1:1

1,000000

0,000000

0,000000

10

G_3:3

0,000000

0,296256

0,703744

11

G_3:3

0,000000

0,040532

0,959468

12

G_3:3

0,000007

0,000004

0,999989

13

G_2:2

0,000000

0,917579

0,082421

14

G_3:3

0,000000

0,001775

0,998225

15

---

0,004909

0,000057

0,995034

 

Таким образом, применение кластерного анализа позволило выявить однородные регионы Приволжского ФО по социально-экономическим показателям, установить кластеры с хорошими, средними и удовлетворительными характеристиками. Для кластера с удовлетворительными показателями целесообразно разработать сценарий развития этих субъектов с целью перехода в третий или первый кластер. На основе дискриминантного анализа построены дискриминантные модели и выявлена принадлежность Тамбовской области к кластеру со средними показателями.

Рассмотренные отдельные социально-экономические показатели регионов Приволжского ФО в значительной степени зависят от инвестиций в основной капитал. Эти инвестиции сильно связаны с валовым региональным продуктом (ВРП). Поэтому возникает необходимость в разработке статистической модели связи инвестиций в основной капитал с ВРП. Статистические данные приведены в табл. 5.

Таблица 5

Инвестиции в основной капитал и ВРП регионов Приволжского ФО

за 1-й квартал 2015 г.

 

Регион

Инвестиции в основной капитал, млн руб. (у)

Валовой региональный

 продукт, млн руб. (z)

Республика Башкортостан

152842,1

1154 056

Республика Марий Эл

30603,6

117 598

Республика Мордовия

35320,4

132 474

Республика Татарстан

322327,6

1 436 933

Удмуртская Республика

60236,7

371 498

Чувашская Республика

34853,9

217 034

Пермский край

183029,7

897 598

Кировская область

39683,3

212 370

Нижегородская область

175091,0

838 599

Оренбургская область

118522,1

629 370

Пензенская область

53535,0

240 335

Самарская область

226694,2

941 611

Саратовская область

89561,6

477 352

Ульяновская область

42080,2

244 230

 

По статистическим данным (табл. 5) с использованием MS Excel (этап – регрессия) построена однофакторная модель (табл. 6).

Таблица 6

Результаты построения однофакторной модели

ВЫВОД ИТОГОВ

       
         

Регрессионная статистика

     

Множественный R

0,953491729

     

R-квадрат

0,909146477

     

Нормированный R-квадрат

0,90157535

     

Стандартная ошибка

27966,55242

     

Наблюдения

14

     
         

Дисперсионный анализ

       

 

 df

SS

MS

F

Регрессия

1

93918510877

93918510877

120,080734

Остаток

12

9385536650

782128054,1

Значим. F

1,32Е-07

Итого

13

1,03304E+11

 

 

         

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-1834,883389

12778,52472

-0,143591176

0,88820642

Переменная X 1 (Z)

0,200993314

0,018341926

10,95813552

1,32127E-07

 

Эконометрическая модель имеет вид:

 

У = – 1834,883 + 0,201 Z.

 

Из табл. 6 видно, что коэффициент детерминации (R2) равен 0,909 и по критерию Фишера модель является значимой. Полученная эконометрическая модель может быть использована для прогнозирования объема инвестиций в зависимости от валового регионального продукта.

Без вложения инвестиций в основной капитал не может быть эффективного развития региональной экономики.