Задача типологизации

Задача типологизации регионов РФ определяется необходимостью разделения различных субъектов РФ на однородные группы при проведении межрегиональных сопоставлений, исследовании социально-экономических процессов и явлений на региональном уровне.

Рассмотрим общую постановку задачи типологии.

Пусть имеется N объектов, характеризуемых двумя группами показателей:

показатели Х,..., хп — результирующие показатели, характеризующие поведение объектов с точки зрения исследуемой проблемы;

показатели уi,___, у,„ — факторные показатели, характеризующие

состояние объекта с точки зрения его основных характеристик.

Таким образом, каждый объект можно представить в виде точки в n-мерном пространстве по результирующим показателям, а по факторным — в w-мерном. При этом, как правило, и в том, и в другом пространстве, полученные точки не образуют однородного множества, а имеют некоторые области сгущения.

Множество объектов, представимых точками, принадлежащими одной области сгущения, являются более однородным по сравнению со всей совокупностью исследуемых объектов. Следовательно, все множество изучаемых объектов разбивается на классы двумя способами — по множеству результирующих показателей и по множеству факторных показателей. Задача типологии (с формальной точки зрения) заключается в установлении взаимосвязей между двумя полученными классификациями исследуемого множества объектов. Другими словами, нужно установить диапазоны совместного изменения факторных показателей, определяющих то или иное поведение (диапазоны совместного изменения результирующих показателей) исследуемых объектов.

Таким образом, проведение типологии было разбито на три этапа.

На первом этапе проводилась классификации множества исследуемых объектов по результирующим и факторным показателям. На этом этапе предполагается использование методов кластерного анализа.

Второй этап проверялось качество полученных классификаций.

На третьем этапе выявлялось наличие общих закономерностей распределения отдельных регионов в рамках полученных классификаций, и определялись однородные группы (типы) регионов. Таким образом, в итоге строилась новая классификация (на всем наборе показателей), объясняющая поведение объектов в зависимости от значений факторных переменных, т.е. проводилась типологизация регионов РФ.

На каждом из перечисленных этапов проводился содержательный анализ полученных формальных результатов. Отсутствие качественной интерпретации на каком-либо из этапов свидетельствует либо о необходимости выбора другого формального метода анализа, либо (в худшем случае) о невозможности построения соответствующей типологии по анализируемым наборам результирующих и факторных показателей. В такой ситуации необходимо менять постановку задачи или, хотя бы, корректировать наборы исследуемых показателей.

На первом этапе используются методы кластерного анализа. Эти методы позволяют разбить изучаемую совокупность объектов на группы «схожих» (в том или ином смысле) объектов, называемых кластерами.

Второй этап построения типологии заключается в проверке качества полученных на первом этапе классификаций. Необходимость этого этапа определяется тем, что методы кластерного анализа не дают какого-либо способа проверки статистической гипотезы об адекватности полученных классификаций. Результаты кластеризации можно обосновать с помощью построения особых индикаторов.

В результате проведения кластеризации на первом этапе построения типологии мы получаем для каждого набора показателей совокупность объектов, разбитую на несколько групп (т.е. для каждого объекта мы можем сказать, к какой группе он относится). При этом каждый объект характеризуется значениями нескольких количественных характеристик. Проблема заключается в определении способа, с помощью которого на основании значений этих характеристик можно узнать группу, к которой принадлежит объект. Это позволит, в частности, при изменении значений показателей для некоторого объекта предсказать класс, в который он перейдет.

Для решения этой задачи применяются методы дискриминантного анализа. Они позволяют строить функции, зависящие от измеряемых характеристик, значения которых и объясняют разбиение объектов на классы. Желательно, чтобы этих функций (дискриминирующих признаков) было немного — в этом случае результаты анализа легче содержательно интерпретировать. Особую роль, благодаря своей простоте, играет линейный дискриминантный анализ, в котором функции, объясняющие разбиение объектов на классы, строятся как линейные функции от первичных показателей.

Третий этап типологии заключается в установлении соответствия между построенными классификациями. Для этого нужно определить, как соотносится между собой принадлежность объекта к некоторому классу по одному набору показателей с принадлежностью этого же объекта к различным классам по другим наборам показателей. Построенные на первых двух этапах классификации задают типологию, если для всех классов классификации по одним признакам, объекты, принадлежащие к одному классу, с высокой вероятностью принадлежат одному и тому же классу в классификации по другим показателям.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >