В условиях экономического кризиса и усиливающейся международной конкуренции устойчивость российской экономики во многом зависит от способности каждого региона успешно развиваться и конкурировать на рынках. Изменения в мире, вызванные политическими и экономическими причинами, требуют новых подходов к социально-экономическому развитию российских регионов. Социально-экономическое положение регионов неоднородно. По одним показателям регион может находиться в числе передовых, а по другим, наоборот, имеет средние или вообще низкие значения. Каждый регион обладает своими уникальными природно-климатическими условиями, географическим и геополитическим положением, в каждом – особая демографическая ситуация. В таких условиях для учета региональных различий по уровню социально-экономических показателей целесообразно воспользоваться статистическими методами многомерной классификации субъектов РФ, в частности методом кластерного анализа.
Главная особенность кластерного анализа состоит в том, что различия между объектами, входящими в выделенную группу (кластер), незначительны, а различия между группами существенны.
Методы кластерного анализа позволяют:
- объединять объекты в группы (кластеры) все более высокой общности на основе критерия минимума расстояния в пространстве изучаемых показателей, описывающих эти объекты;
- разбивать множество объектов на заданное число кластеров [1–3].
Дискриминантный анализявляетсяразделом многомерного статистического анализа, который включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков. В кластерном анализе рассматриваются методы многомерной классификации без обучения. В дискриминантном анализе новые кластеры не образуются, а формулируется правило, по которому объекты подмножества, подлежащего классификации, относятся к одному из уже существующих (обучающих) подмножеств (классов) на основе сравнения величины дискриминантной функции классифицируемого объекта, рассчитанной по дискриминантным переменным, с некоторой константой дискриминации. Дискриминантная функция в общем виде запишется так:
У = b0 + b1x1+ b2x2 +…+ bkxk. (1)
В качестве зависимой переменной выступает номинальная переменная, идентифицирующая принадлежность объектов (регионов) к одной из нескольких групп (кластеров). Независимые переменные (x1, x2 … xk) такие же, как и в регрессионном анализе (количественные и качественные).
В данной статье рассматривается применение кластерного и дискриминантного анализа для решения задачи классификации регионов Приволжского ФО по социально-экономическим показателям за 1-й квартал 2015 г. Для этого используется новая статистическая информация, приведенная на сайте Росстата (www.gks.ru), а именно ежеквартальное электронное издание «Статистическое обозрение» № 3 (94) 2015 г. [4] Статистические данные отдельных социально-экономических показателей регионов Приволжского ФО приведены в табл. 1. Для выделения однородных регионов Приволжского ФО по уровню отдельных социально-экономических показателей используется кластерный анализ [5]. Общая модель кластеризации имеет вид:
dab = αldlb + αf dfb + βdlf + γ(dlb – dfb), (2)
где αl, αf, β, γ – параметры, определяющие алгоритм образования кластеров;
dlb, dfb, dlf – расстояние между соответствующими кластерами.
При определенных значениях параметров αl, αf, β, γ общее уравнение (2) преобразуется в конкретный алгоритм. В данном исследовании использовался алгоритм «средняя связь»:
dab = Nl/(Nl + Nf) dlb + Nf/(Nl + Nf) dfb, (3)
где – Nl, Nf соответственно кластеры «l» и «f» с числом объектов N.
Зависимость (3) получена из общего уравнения (2) при следующих значениях параметров:
αl = Nl/(Nl + Nf); αf = Nf/(Nl + Nf) и β = γ = 0.
Для классификации регионов на однородные группы используется пакет прикладных программ “Statistiсa” (модуль – кластерный анализ). Схема работы следующая: Ввод исходных данных в таблицу – Анализ – Многомерный анализ – Кластерный анализ – Иерархическая классификация – ОК – Файл данных (исходные данные). Переменные строки. Правило объединения: метод полной связи. Мера близости: евклидово расстояние – ОК – Выбор переменных (Var1-Var5) – ОК – Вертикальная дендрограмма – Результат: дендрограмма классификации 14 регионов Приволжского ФО по пяти переменным (х1-х5). На рисунке: по оси абсцисс – номера регионов, по оси ординат – евклидово расстояние. Для выделения кластеров используется граничное значение евклидова расстояния, которое задается в пределах dгр = (0,5 – 0,9)dmax. Из рисунка видно, что dmax= 18,0. Задаемся коэффициентом, равным 0,6. Следовательно, граничное значение равно 10,8. Для этого значения проведем на рисунке линию, параллельную оси абсцисс, которая позволит выделить три кластера (см. табл. 2).
Таблица 1
Социально-экономические показатели регионов Приволжского ФО
за 1-й квартал 2015 г.
Регионы Приволжского ФО |
Уровень безработицы, в процентах от экономи- чески активного населения, х1 |
Среднедуше- вые денеж- ные доходы населения (в месяц), тыс. рублей, х2 |
Среднедуше- вые денежные расходы населения на покупку товаров и оплату услуг (в месяц), тыс. рублей, х3 |
Среднемесяч- ная номинальная начислен- ная заработ- ная плата, тыс. рублей, х4 |
Средний размер на- значенных пенсий (на 1 апреля 2015 г.), тыс. рублей, х5 |
С1. Республика Башкортостан |
6,5 |
21,225 |
18,721 |
24,166 |
11,432 |
С2. Республика Марий Эл |
5,2 |
15,628 |
11,285 |
19,880 |
10,732 |
С3. Республика Мордовия |
4,6 |
14,954 |
10,725 |
20,249 |
10.823 |
С4. Республика Татарстан |
4,8 |
25,840 |
21,080 |
27,208 |
11,601 |
С5. Удмуртская Республика |
4,9 |
20,957 |
14,186 |
23,524 |
11,807 |
С6. Чувашская Республика |
5,7 |
16,559 |
12,681 |
19,901 |
10,911 |
С7. Пермский край |
6,0 |
29,351 |
19,363 |
26,271 |
11,983 |
С8. Кировская область |
5,2 |
19,208 |
14,319 |
20,637 |
11,779 |
С9. Нижегородская область |
4,2 |
26,974 |
18,975 |
25,137 |
11,884 |
С10. Оренбургская область |
5,8 |
18,459 |
14,502 |
22,794 |
11,000 |
С11. Пензенская область |
4,7 |
18,420 |
14,601 |
21,767 |
11.039 |
С12. Самарская область |
4,3 |
22,072 |
17,981 |
25,067 |
11,816 |
С13. Саратовская область |
5,1 |
16,787 |
13,044 |
21,250 |
10,958 |
С14. Ульяновская область |
5,5 |
20,452 |
13,889 |
21,139 |
11,069 |
Таблица 2
Номера регионов в кластерах
Номер кластера |
Номер региона |
1 |
9, 7, 4 |
2 |
13, 6, 3, 2 |
3 |
11, 10, 14, 8, 5, 12, 1 |
Первый кластер характеризуется низким уровнем безработицы и высокими показателями х2–х5 по сравнению с другими кластерами. Второй кластер – средний уровень безработицы, но в регионах низкие доходы, заработная плата и пенсия. Третий кластер имеет более высокую безработицу, но средние социально-экономические характеристики. К этому кластеру относится Пензенская область. Поэтому по уровню отдельных социально-экономических показателей первый кластер характеризуется как кластер с хорошими показателями, третий – со средними и второй – с удовлетворительными.
Результаты кластеризации регионов по социально-экономическим показателям
Следующим этапом исследования является решение задачи отнесения «нового» региона к определенному кластеру. Новый регион – это регион, не участвующий в кластеризации, например Тамбовская область. Такую задачу можно решить, используя дискриминантный анализ [6]. Построив дискриминантные функции и подставив в них социально-экономические характеристики Тамбовской области, можно определить, к какому кластеру она относится. Показатели Тамбовской области приведены в табл. 3.
Таблица 3
Показатели Тамбовской области
Х1 |
Х2 |
Х3 |
Х4 |
Х5 |
4,6 |
19,853 |
16,135 |
20,016 |
10,751 |
По данным табл. 1 и дискриминантного анализа в ППП “Statistiсa” построены три модели для каждого кластера:
Y1 = – 1168,94 + 42,14Х1 – 23,34Х2 – 10,59Х3 + 23,34Х4 + 199,75Х5.
Y2 = – 1241,78 + 49,80Х1 – 34,92Х2 – 12,59Х3 + 25,26Х4 + 219,93Х5.
Y3 = – 1256,87 + 48,24Х1 – 30,55Х2 – 11,61Х3 + 24,65Х4 + 218,21Х5.
В каждую модель подставим характеристики Тамбовской области (см. табл. 3) и определим дискриминантные функции. Имеем: Y1 = 1004,821; Y2 = 1000,67; Y3 = 1010,568. По максимальному значению функции выбирается кластер, к которому принадлежит «новый» объект. В данном случае Тамбовская область входит в третий кластер. Принадлежность региона к кластеру можно определить на основе апостериорной вероятности (табл. 4). Из таблицы видно, что Тамбовская область (15) относится к третьему кластеру с вероятностью 0,995.
Таблица 4
Вероятности отнесения регионов к кластеру
Апостериорные вероятности (Таблица.sta) Неправильные классификации отмечены * |
||||
Номер |
Наблюдения |
G_1:1 |
G_2:2 |
G_3:3 |
1 |
G_3:3 |
0,000000 |
0,000141 |
0,999859 |
2 |
G_2:2 |
0,000000 |
0,997006 |
0,002994 |
3 |
G_2:2 |
0,000000 |
0,999385 |
0,000615 |
4 |
G_1:1 |
1,000000 |
0,000000 |
0,000000 |
5 |
G_3:3 |
0,000000 |
0,002394 |
0,997606 |
6 |
G_2:2 |
0,000000 |
0,965815 |
0,034185 |
7 |
G_1:1 |
1,000000 |
0,000000 |
0,000000 |
8 |
G_3:3 |
0,000000 |
0,033395 |
0,966605 |
9 |
G_1:1 |
1,000000 |
0,000000 |
0,000000 |
10 |
G_3:3 |
0,000000 |
0,296256 |
0,703744 |
11 |
G_3:3 |
0,000000 |
0,040532 |
0,959468 |
12 |
G_3:3 |
0,000007 |
0,000004 |
0,999989 |
13 |
G_2:2 |
0,000000 |
0,917579 |
0,082421 |
14 |
G_3:3 |
0,000000 |
0,001775 |
0,998225 |
15 |
--- |
0,004909 |
0,000057 |
0,995034 |
Таким образом, применение кластерного анализа позволило выявить однородные регионы Приволжского ФО по социально-экономическим показателям, установить кластеры с хорошими, средними и удовлетворительными характеристиками. Для кластера с удовлетворительными показателями целесообразно разработать сценарий развития этих субъектов с целью перехода в третий или первый кластер. На основе дискриминантного анализа построены дискриминантные модели и выявлена принадлежность Тамбовской области к кластеру со средними показателями.
Рассмотренные отдельные социально-экономические показатели регионов Приволжского ФО в значительной степени зависят от инвестиций в основной капитал. Эти инвестиции сильно связаны с валовым региональным продуктом (ВРП). Поэтому возникает необходимость в разработке статистической модели связи инвестиций в основной капитал с ВРП. Статистические данные приведены в табл. 5.
Таблица 5
Инвестиции в основной капитал и ВРП регионов Приволжского ФО
за 1-й квартал 2015 г.
Регион |
Инвестиции в основной капитал, млн руб. (у) |
Валовой региональный продукт, млн руб. (z) |
Республика Башкортостан |
152842,1 |
1154 056 |
Республика Марий Эл |
30603,6 |
117 598 |
Республика Мордовия |
35320,4 |
132 474 |
Республика Татарстан |
322327,6 |
1 436 933 |
Удмуртская Республика |
60236,7 |
371 498 |
Чувашская Республика |
34853,9 |
217 034 |
Пермский край |
183029,7 |
897 598 |
Кировская область |
39683,3 |
212 370 |
Нижегородская область |
175091,0 |
838 599 |
Оренбургская область |
118522,1 |
629 370 |
Пензенская область |
53535,0 |
240 335 |
Самарская область |
226694,2 |
941 611 |
Саратовская область |
89561,6 |
477 352 |
Ульяновская область |
42080,2 |
244 230 |
По статистическим данным (табл. 5) с использованием MS Excel (этап – регрессия) построена однофакторная модель (табл. 6).
Таблица 6
Результаты построения однофакторной модели
ВЫВОД ИТОГОВ |
||||
Регрессионная статистика |
||||
Множественный R |
0,953491729 |
|||
R-квадрат |
0,909146477 |
|||
Нормированный R-квадрат |
0,90157535 |
|||
Стандартная ошибка |
27966,55242 |
|||
Наблюдения |
14 |
|||
Дисперсионный анализ |
||||
|
df |
SS |
MS |
F |
Регрессия |
1 |
93918510877 |
93918510877 |
120,080734 |
Остаток |
12 |
9385536650 |
782128054,1 |
Значим. F 1,32Е-07 |
Итого |
13 |
1,03304E+11 |
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Y-пересечение |
-1834,883389 |
12778,52472 |
-0,143591176 |
0,88820642 |
Переменная X 1 (Z) |
0,200993314 |
0,018341926 |
10,95813552 |
1,32127E-07 |
Эконометрическая модель имеет вид:
У = – 1834,883 + 0,201 Z.
Из табл. 6 видно, что коэффициент детерминации (R2) равен 0,909 и по критерию Фишера модель является значимой. Полученная эконометрическая модель может быть использована для прогнозирования объема инвестиций в зависимости от валового регионального продукта.
Без вложения инвестиций в основной капитал не может быть эффективного развития региональной экономики.