Автор работы: Пользователь скрыл имя, 12 Апреля 2012 в 21:29, курсовая работа
В настоящее время перед экономической наукой встает задача познания, описания и разработки механизма промышленной политики, основными целями которого должны являться вопросы обеспечения темпов устойчивого роста и повышения конкурентоспособности на всех уровнях. Этим целям отвечает создание и развитие кластерных схем, которые, являясь, по сути, межотраслевыми комплексами, играют роль «точек роста» региональной и национальной экономики, при этом кластеры позволяют преодолеть структурные ограничения, а также сложившуюся в ряде хозяйственных субъектов многоотраслевую структуру производства.
ВВЕДЕНИЕ 3
ЭКОНОМИЧЕСКИЙ КЛАСТЕР: СУЩНОСТЬ, ПРЕДПОСЫЛКИ ФОРМИРОВАНИЯ 4
Основные понятия, виды экономического кластера 4
Особенности реализации экономического кластера 8
1.2.1. Условие возникновения функционирования кластера 8
Достоинства экономического кластера 11
Недостатки экономического кластера 13
АДАПТАЦИЯ МЕТОДОВ КЛАССИФИКАЦИИ К ЗАДАЧАМ ФОРМИРОВАНИЯ ЭКОНОМИЧЕСКИХ КЛАСТЕРОВ 16
Основные методы кластерного анализа 16
Развитие методов формирования экономических кластеров на основе анализа совместной конкурентоспособности 26
ЗАКЛЮЧЕНИЕ 28
СПИСОК ЛИТЕРАТУРЫ 29
В случаях, когда формализовать цель задачи не удается, критерием качества классификации может служить возможность содержательной интерпретации найденных групп.
Рассмотрим следующую задачу. Пусть исследуется совокупность n объектов, каждый из которых характеризуется по k замеренным на нем признакам Х. Требуется разбить эту совокупность на однородные в некотором смысле группы (классы).
При
этом практически отсутствует
Полученные в результате разбиения группы обычно называются кластерами , методы их нахождения – кластерным анализом (соответственно численной таксономией или распознаванием образов с самообучением).
При этом необходимо с самого начала четко представить, какая из двух задач классификации подлежит решению. Если решается обычная задача типизации, то совокупность наблюдений разбивают на сравнительно небольшое число областей группирования (например, интервальный вариационный ряд в случае одномерных наблюдений) так, чтобы элементы одной такой области находились друг от друга по возможности на небольшом расстоянии.
Решение другой задачи заключается в определении естественного расслоения исходных наблюдений на четко выраженные кластеры, лежащие друг от друга на некотором расстоянии.
Если первая задача типизации всегда имеет решение, то при второй постановке может оказаться, что множество исходных наблюдений не обнаруживает естественного расслоения на кластеры, т.е. образует один кластер.
Хотя многие методы кластерного анализа довольно элементарны, основная часть работ, в которых они были предложены, относится к последнему десятилетию. Это объясняется тем, что эффективное решение задач поиска кластеров требует большого числа арифметических и логических операций и поэтому стало возможным только с возникновением и развитием вычислительной техники.
Обычной
формой представления исходных данных
в задачах кластерного анализа
служит прямоугольная таблица:
(
каждая строка которой представляет результат измерений k рассматриваемых признаков на одном из обследованных объектов. В конкретных ситуациях может представлять интерес как группировка объектов, так и группировка признаков. В тех случаях, когда разница между двумя этими задачами не существенна, например при описании некоторых алгоритмов, мы будем пользоваться только термином «объект», включая в это понятие и «признак».
Матрица Х не является единственным способом представления данных в задачах кластерного анализа. Иногда исходная информация задана в виде квадратной матрицы
R=(rij), i,j=1, 2, ..., n,
элемент rij который определяет степень близости i-го объекта к j-му.
Большинство алгоритмов кластерного анализа полностью исходит из матрицы расстояний (или близостей) либо требует вычисления отдельных ее элементов, поэтому если данные представлены в форме Х, то первым этапом решения задачи поиска кластеров будет выбор способа вычисления расстояний, или близости, между объектами или признаками.
Относительно проще решается вопрос об определении близости между признаками. Как правило, кластерный анализ признаков преследует те же цели, что и факторный анализ – выделение групп связанных между собой признаков, отражающих определенную сторону изучаемых объектов. Мерами близости в этом случае служат различные статистические коэффициенты связи, например /rmj/, mj =1, 2, ...,к. Элемент rmj определяет степень близости m-го признака к j-му.
Рассмотрим
некоторые формулы расчета
Наиболее
трудным и наименее формализованным
в задаче классификации является
определение понятия
В общем случае понятие однородности объектов задается либо введением правила вычисления расстояний ρ(xi,xj) между любой парой исследуемых объектов (х1,х2,...,хn), либо заданием некоторой функции r(xi,xj), характеризующей степень близости i-го и j-го объектов. Если задана функция ρ(xi,xj), то близкие с точки зрения этой метрики объекты считаются однородными, принадлежащими к одному классу. Очевидно, что необходимо при этом сопоставлять ρ(хi,xj) с некоторыми пороговыми значениями, определяемыми в каждом конкретном случае по-своему.
Аналогично используется и мера близости r(xi,xj), при задании которой мы должны помнить о необходимости выполнения следующих условий: симметрии r(xi,xj)= r(xj,xi); максимального сходства объекта с самим собой , при 1≤ i,j≤n, и монотонного убывания r(xi,xj) по мере увеличения ρ(xi,xj), т.е. из ρ(xk,xl)≥ρ(xi,xj) должно следовать неравенство r(xk,xl)≤r(xi,xj).
Выбор метрики или меры близости является узловым моментом исследования, от которого в основном зависит окончательный вариант разбиения объектов на классы при данном алгоритме разбиения. В каждом конкретном случае этот выбор должен производиться по-своему в зависимости от целей исследования, физической и статистической природы вектора наблюдений Х, априорных сведений о характере вероятностного распределения Х.
Рассмотрим наиболее широко используемые в задачах кластерного анализа расстояния и меры близости.
где хil ,, xjl – величина l -ой компоненты у i-го (j-го) объекта ( l =1,2,...,к; i,j=1,2,..., n)
Использование этого расстояния оправдано в следующих случаях:
а) наблюдения берутся из генеральной совокупности, имеющей многомерное нормальное распределение с ковариационной матрицей вида σ2Ек, т.е. компоненты Х взаимно независимы и имеют одну и ту же дисперсию, где Ек – единичная матрица;
б)
компоненты вектора наблюдений Х
однородны по физическому смыслу
и одинаково важны для
в) признаковое пространство совпадает с геометрическим пространством.
Естественное
с геометрической точки зрения евклидово
пространство может оказаться бессмысленным
(с точки зрения содержательной интерпретации),
если признаки измерены в разных единицах.
Чтобы исправить положение, прибегают
к нормированию каждого признака
путем деления центрированной величины
на среднее квадратическое отклонение
и переходят от матрицы Х к
нормированной матрице с
где – значение l-го признака у i-го объекта;
– среднее значение l-го признака;
(4)
Однако эта операция может привести к нежелательным последствиям. Если кластеры хорошо разделены по одному признаку и не разделены по другому, то после нормирования дискриминирующие возможности первого признака будут уменьшены в связи с увеличением «шумового» эффекта второго.
(5)
применяется в тех случаях, когда каждой компоненте xl вектора наблюдений X удается приписать некоторый «вес» ωl , пропорционально степени важности признака в задаче классификации. Обычно принимают 0≤ωl ≤1, где l =1,2,...k.
Определение
«весов», как правило, связано с
дополнительными
Используется
как мера различия объектов, задаваемых
дихотомическими признаками. Это
расстояние определяется по формуле
и равно числу несовпадений значений соответствующих признаков в рассматриваемых i-м и j-м объектах.
В
некоторых задачах
В данной задаче объектом классификации является отрасль народного хозяйства, а матрица межотраслевого баланса представлена элементами sij, характеризующими сумму годовых поставок i-ой отрасли в j-ю в денежном выражении. В качестве меры близости {rij} принимают симметризованную нормированную матрицу межотраслевого баланса.
С
целью нормирования денежное выражение
поставок i-ой отрасли в j-ю заменяют
долей этих поставок по отношению
ко всем поставкам i-ой отрасли. Симметризацию
же нормированной матрицы
Как правило, решение задач классификации многомерных данных предусматривает в качестве предварительного этапа исследования реализацию методов, позволяющих выбрать из компонент х1, х2, ..., хк наблюдаемых векторов Х сравнительно небольшое число наиболее существенно информативных, т.е. уменьшить размерность наблюдаемого пространства.
В ряде процедур классификации (кластер-процедур) используют понятия расстояния между группами объектов и меры близости двух групп объектов.
Пусть si – i-я группа (класс, кластер), состоящая из ni объектов;
– среднее арифметическое
ρ (sl ,sm) – расстояние между группами sl и sm.
Наиболее употребительными расстояниями и мерами близости между классами объектов являются:
– расстояние, измеряемое по принципу «ближайшего соседа»,
(7)
(8)
(9)
(10)
Академиком А.Н. Колмогоровым было предложено «обобщенное расстояние» между классами, которое включает в себя в качестве частных случаев все рассмотренные выше виды расстояний.
Расстояния между группами элементов особенно важно в так называемых агломеративных иерархических кластер-процедурах, так как принцип работы таких алгоритмов состоит в последовательном объединении элементов, а затем и целых групп, сначала самых близких, а затем все более и более отдаленных друг от друга.
При этом расстояние между классами и , являющиеся объединением двух других классов Sm и Sq, можно определить по формуле (11)
где
– расстояния между классами sl , sm и sq;
– α, β, δ и γ – числовые коэффициенты, значения которых определяют специфику процедуры, ее алгоритм.
Например, при α= β=-δ=1/2и γ=0 приходим к расстоянию, построенному по принципу «ближайшего соседа». При α= β=δ=1/2 и γ=0 – расстояние между классами определяется по принципу «дальнего соседа», то есть как расстояние между двумя самыми дальними элементами этих классов.
И, наконец, при
; ,
соотношение (3.8) приводит к расстоянию ρср между классами, вычисленному как среднее из расстояний между всеми парами элементов, один из которых берется из одного класса, а другой из другого.
Рассмотрим некоторые методы кластерного анализа
Информация о работе Кластерный подход в управлении экономическими системами