Автор работы: Пользователь скрыл имя, 15 Января 2012 в 18:05, лабораторная работа
Цель: изучение методов кластерного анализа и применение их для классификации экономических объектов.
Таблица
№1
Воспользуемся математической программой Matlab.
Y=pdist(X) функция позволяет рассчитать вектор Евклидовых расстояний Y между парами объектов исходного множества данных, заданных матрицей Х. Размерность матрицы Х равна m×n, где m – число наблюдений n-мерной случайной величины. При помощи функции squareform вектор Y можно конвертировать в квадратную матрицу.
>> >>
x=[14956,11295,12830,
x
=
14956 11295 12830 20158 8578 9650
16905 11190 14691 23393 8024 10399
18246 11051 14937 22382 8278 10097
32061 16809 24481 36279 11744 16010
42075 24651 33018 49524 16900 23903
49942 30110 42075 60015 22176 31860
62404 37374 50360 83001 26981 37283
76055 43700 61819 100143 33215 48793
114409 51003 74207 117198 40159 57994
144988 66692 86927 133587 44415 70954
178846 82100 112842 166177 55090 86151
237013 102706 146663 222812 74752 111869
317656 125834 175396 287072 86980 150394
304343 126199 188466 302510 86573 156646
345755 158657 192000
316020 56275 214235
>>
y=pdist(x)
>>
s=squareform(y)
Приняв, что расстояния будут рассчитываться по методу ближайшего соседа все весовые коэффициенты равны 1 («взвешенное» Евклидово пространство), получим матрицу расстояний и матрицу кластеров.
R1 =
0 0.0431 0.0453 0.2773 0.4956 0.6856 0.9691 1.2538 1.6729 2.0827 2.6686 3.6259 4.7788 4.8498 5.4306
0.0431 0 0.0175 0.2384 0.4577 0.6482 0.9308 1.2156 1.6350 2.0454 2.6311 3.5883 4.7411 4.8115 5.3929
0.0453 0.0175 0 0.2356 0.4562 0.6471 0.9307 1.2154 1.6327 2.0425 2.6283 3.5855 4.7382 4.8094 5.3907
0.2773 0.2384 0.2356 0 0.2234 0.4159 0.6986 0.9832 1.3979 1.8082 2.3935 3.3506 4.5038 4.5744 5.1587
0.4956 0.4577 0.4562 0.2234 0 0.1936 0.4772 0.7612 1.1792 1.5907 2.1753 3.1324 4.2871 4.3559 4.9422
0.6856 0.6482 0.6471 0.4159 0.1936 0 0.2928 0.5723 0.9951 1.4078 1.9907 2.9474 4.1038 4.1702 4.7589
0.9691 0.9308 0.9307 0.6986 0.4772 0.2928 0 0.2869 0.7233 1.1408 1.7193 2.6725 3.8295 3.8921 4.4892
1.2538 1.2156 1.2154 0.9832 0.7612 0.5723 0.2869 0 0.4584 0.8744 1.4449 2.3946 3.5521 3.6110 4.2120
1.6729 1.6350 1.6327 1.3979 1.1792 0.9951 0.7233 0.4584 0 0.4240 1.0013 1.9547 3.1102 3.1782 3.7840
2.0827 2.0454 2.0425 1.8082 1.5907 1.4078 1.1408 0.8744 0.4240 0 0.5884 1.5456 2.6985 2.7731 3.3728
2.6686 2.6311 2.6283 2.3935 2.1753 1.9907 1.7193 1.4449 1.0013 0.5884 0 0.9596 2.1179 2.1900 2.8079
3.6259 3.5883 3.5855 3.3506 3.1324 2.9474 2.6725 2.3946 1.9547 1.5456 0.9596 0 1.1673 1.2381 1.9110
4.7788 4.7411 4.7382 4.5038 4.2871 4.1038 3.8295 3.5521 3.1102 2.6985 2.1179 1.1673 0 0.2502 0.8944
4.8498 4.8115 4.8094 4.5744 4.3559 4.1702 3.8921 3.6110 3.1782 2.7731 2.1900 1.2381 0.2502 0 0.8484
5.4306 5.3929 5.3907
5.1587 4.9422 4.7589
4.4892 4.2120 3.7840
3.3728 2.8079 1.9110
0.8944 0.8484
0
“1”
“2”
“3”
“4”
“5”
“6”
C1= “7”
“8”
“9”
“10”
“11”
“12”
“13”
“14”
“15”
Также можно используя евклидову метрику,
вычислить матрицу межобъектных расстояний,
состоящую из величин dij - расстояние
между i-тым и j-тым объектами. В нашем случае
i и j - номер объекта, наблюдения. Поскольку
объем выборки равен 15, то соответственно
i и j могут принимать значения от 1 до 15.
Очевидно также, что количество всех возможных
по парных расстояний будет равно 15*15=225.
Действительно, для первого объекта это
будут следующие расстояния: 1-1; 1-2; 1-3; 1-4…..1-15.
Для объекта 2 также будет 15 возможных
расстояний: 2-1; 2-2; 2-3; 2-4…. 2-15 и т.д. Однако
число различных расстояний будет меньше
225, поскольку необходимо учесть свойство
неразличимости тождественных объектов
- dij = 0 при i = j. Это означает, что расстояние
между объектом №1 и тем же самым объектом
№1 будет равно нулю. Такие же нулевые
расстояния будут и для всех остальных
случаев i = j. Кроме того, из свойства симметрии
следует, что dij = dji для любых
i и j. Т.е. расстояние между объектами №1
и №2 равно расстоянию между объектами
№2 и №1. К примеру, симметричная (dij
= dji) квадратная матрица с нулевой
(dij = 0 при i = j) диагональю.
Объединение кластеров.
Перед началом работы алгоритма рассчитывается матрица расстояний между объектами. На каждом шаге в матрице расстояний ищется минимальное значение, соответствующее расстоянию между двумя наиболее близкими кластерами. Найденные кластеры u и v объединяются, образуя новый кластер k. Строки и столбцы, соответствующие кластерам u и v, выбрасываются из матрицы расстояний, и добавляется новая строка и новый столбец, соответствующие кластеру k. В результате матрица сокращается на одну строку и один столбец. Эта процедура повторяется до тех пор, пока не будут объединены все кластеры.
Пусть
кластеры u, v и k содержат Tu,
Tv и Tk объектов, соответственно.
Кластер k образован путем объединения
кластеров u и v, тогда Tk = Tu+
Tv. Необходимо рассчитать удаленность
кластера k от некоторого кластера w. Расстояние
между этими кластерами определяется
согласно формуле:
D((u,v),w)
=
Рассмотрим матрицу расстояний.
R1 =
0 0.0431 0.0453 0.2773 0.4956 0.6856 0.9691 1.2538 1.6729 2.0827 2.6686 3.6259 4.7788 4.8498 5.4306
0.0431 0 0.0175 0.2384 0.4577 0.6482 0.9308 1.2156 1.6350 2.0454 2.6311 3.5883 4.7411 4.8115 5.3929
0.0453 0.0175 0 0.2356 0.4562 0.6471 0.9307 1.2154 1.6327 2.0425 2.6283 3.5855 4.7382 4.8094 5.3907
0.2773 0.2384 0.2356 0 0.2234 0.4159 0.6986 0.9832 1.3979 1.8082 2.3935 3.3506 4.5038 4.5744 5.1587
0.4956 0.4577 0.4562 0.2234 0 0.1936 0.4772 0.7612 1.1792 1.5907 2.1753 3.1324 4.2871 4.3559 4.9422
0.6856 0.6482 0.6471 0.4159 0.1936 0 0.2928 0.5723 0.9951 1.4078 1.9907 2.9474 4.1038 4.1702 4.7589
0.9691 0.9308 0.9307 0.6986 0.4772 0.2928 0 0.2869 0.7233 1.1408 1.7193 2.6725 3.8295 3.8921 4.4892
1.2538 1.2156 1.2154 0.9832 0.7612 0.5723 0.2869 0 0.4584 0.8744 1.4449 2.3946 3.5521 3.6110 4.2120
1.6729 1.6350 1.6327 1.3979 1.1792 0.9951 0.7233 0.4584 0 0.4240 1.0013 1.9547 3.1102 3.1782 3.7840
2.0827 2.0454 2.0425 1.8082 1.5907 1.4078 1.1408 0.8744 0.4240 0 0.5884 1.5456 2.6985 2.7731 3.3728
2.6686 2.6311 2.6283 2.3935 2.1753 1.9907 1.7193 1.4449 1.0013 0.5884 0 0.9596 2.1179 2.1900 2.8079
3.6259 3.5883 3.5855 3.3506 3.1324 2.9474 2.6725 2.3946 1.9547 1.5456 0.9596 0 1.1673 1.2381 1.9110
4.7788 4.7411 4.7382 4.5038 4.2871 4.1038 3.8295 3.5521 3.1102 2.6985 2.1179 1.1673 0 0.2502 0.8944
4.8498 4.8115 4.8094
4.5744 4.3559 4.1702
3.8921 3.6110 3.1782
2.7731 2.1900 1.2381
0.2502 0
0.8484 5.4306 5.3929 5.3907
5.1587 4.9422 4.7589
4.4892 4.2120 3.7840
3.3728 2.8079 1.9110
0.8944 0.8484
0
Согласно
критерию классификации, объединение
происходит между кластерами, расстояние
между которыми наименьшее. Т.о. на этом
шаге объединяются кластеры 2и 3. Расстояние
объединения – 0,0175. Необходимо произвести
перерасчет матрицы расстояний с учетом
нового кластера.
Получаем
на втором шаге:
R2 =
0 0,0442 0.2773 0.4956 0.6856 0.9691 1.2538 1.6729 2.0827 2.6686 3.6259 4.7788 4.8498 5.4306
0,0442 0 0.237 0.4569 0.6476 0.9307 1.2155 1.6338 2.0439 2.6297 3.5869 4.7396 4.8104 5.3918
0.2773 0.237 0 0.2234 0.4159 0.6986 0.9832 1.3979 1.8082 2.3935 3.3506 4.5038 4.5744 5.1587
0.4956 0.4569 0.2234 0 0.1936 0.4772 0.7612 1.1792 1.5907 2.1753 3.1324 4.2871 4.3559 4.9422
0.6856 0.6476 0.4159 0.1936 0 0.2928 0.5723 0.9951 1.4078 1.9907 2.9474 4.1038 4.1702 4.7589
0.9691 0.9307 0.6986 0.4772 0.2928 0 0.2869 0.7233 1.1408 1.7193 2.6725 3.8295 3.8921 4.4892
1.2538 1.2155 0.9832 0.7612 0.5723 0.2869 0 0.4584 0.8744 1.4449 2.3946 3.5521 3.6110 4.2120
1.6729 1.6338 1.3979 1.1792 0.9951 0.7233 0.4584 0 0.4240 1.0013 1.9547 3.1102 3.1782 3.7840
2.0827 2.0439 1.8082 1.5907 1.4078 1.1408 0.8744 0.4240 0 0.5884 1.5456 2.6985 2.7731 3.3728
2.6686 2.6297 2.3935 2.1753 1.9907 1.7193 1.4449 1.0013 0.5884 0 0.9596 2.1179 2.1900 2.8079
3.6259 3.5869 3.3506 3.1324 2.9474 2.6725 2.3946 1.9547 1.5456 0.9596 0 1.1673 1.2381 1.9110
4.7788 4.7396 4.5038 4.2871 4.1038 3.8295 3.5521 3.1102 2.6985 2.1179 1.1673 0 0.2502 0.8944
4.8498 4.8104 4.5744
4.3559 4.1702 3.8921
3.6110 3.1782 2.7731
2.1900 1.2381 0.2502
0 0.8484 5.4306 5.3929 5.3918
4.9422 4.7589 4.4892
4.2120 3.7840 3.3728
2.8079 1.9110 0.8944
0.8484 0
“1”
“2”, “3”
“4”
“5”
Информация о работе Применение кластерного анализа для классификации экономических объектов