Применение кластерного анализа для классификации экономических объектов

Автор работы: Пользователь скрыл имя, 15 Января 2012 в 18:05, лабораторная работа

Краткое описание

Цель: изучение методов кластерного анализа и применение их для классификации экономических объектов.

Содержимое работы - 1 файл

Лабораторная работа №8.doc

— 429.00 Кб (Скачать файл)
     
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    Таблица №1 

    Воспользуемся математической программой Matlab.

    Y=pdist(X) функция позволяет рассчитать вектор Евклидовых расстояний Y между парами объектов исходного множества данных, заданных матрицей Х. Размерность матрицы Х равна m×n, где m – число наблюдений n-мерной случайной величины. При помощи функции squareform вектор Y можно конвертировать в квадратную матрицу.

  

  1. Вводим массив Х, в соответствии с исходными данными
 

    >> >>

    x=[14956,11295,12830,20158,8578,9650;16905,11190,14691,23393,8024,10399;18246,11051,14937,22382,8278,10097;32061,16809,24481,36279,11744,16010;42075,24651,33018,49524,16900,23903;49942,30110,42075,60015,22176,31860;62404,37374,50360,83001,26981,37283;76055,43700,61819,100143,33215,48793;114409,51003,74207,117198,40159,57994;144988,66692,86927,133587,44415,70954;178846,82100,112842,166177,55090,86151;237013,102706,146663,222812,74752,111869;317656,125834,175396,287072,86980,150394;304343,126199,188466,302510,86573,156646;345755,158657,192000,316020,56275,214235] 
 
 

    x = 

           14956       11295      12830       20158        8578       9650

           16905       11190      14691       23393        8024       10399

           18246       11051      14937       22382        8278     10097

           32061       16809      24481       36279      11744       16010

           42075       24651       33018       49524      16900       23903

           49942       30110      42075       60015     22176       31860

           62404       37374       50360       83001     26981       37283

          76055       43700        61819     100143     33215         48793

         114409       51003      74207     117198     40159       57994

         144988       66692      86927    133587     44415         70954

         178846       82100      112842     166177    55090        86151

         237013     102706      146663    222812    74752      111869

         317656    125834      175396     287072   86980      150394

         304343     126199      188466     302510   86573      156646

         345755     158657      192000     316020   56275       214235 

  1. Затем функцию pdist
 

    >> y=pdist(x) 

 

  1. После этого вводим функцию  squareform
 

    >> s=squareform(y) 

 

     Приняв, что расстояния будут рассчитываться по методу ближайшего соседа все весовые  коэффициенты равны 1 («взвешенное» Евклидово пространство), получим матрицу расстояний и матрицу кластеров.

      R1 =

         0    0.0431    0.0453    0.2773    0.4956    0.6856    0.9691    1.2538    1.6729    2.0827    2.6686    3.6259    4.7788    4.8498    5.4306

    0.0431         0    0.0175    0.2384    0.4577    0.6482    0.9308    1.2156    1.6350    2.0454    2.6311    3.5883    4.7411    4.8115    5.3929

    0.0453    0.0175         0    0.2356    0.4562    0.6471    0.9307    1.2154    1.6327    2.0425    2.6283    3.5855    4.7382    4.8094    5.3907

    0.2773    0.2384    0.2356         0    0.2234    0.4159    0.6986    0.9832    1.3979    1.8082    2.3935    3.3506    4.5038    4.5744    5.1587

    0.4956    0.4577    0.4562    0.2234         0    0.1936    0.4772    0.7612    1.1792    1.5907    2.1753    3.1324    4.2871    4.3559    4.9422

    0.6856    0.6482    0.6471    0.4159    0.1936         0    0.2928    0.5723    0.9951    1.4078    1.9907    2.9474    4.1038    4.1702    4.7589

    0.9691    0.9308    0.9307    0.6986    0.4772    0.2928         0    0.2869    0.7233    1.1408    1.7193    2.6725    3.8295    3.8921    4.4892

    1.2538    1.2156    1.2154    0.9832    0.7612    0.5723    0.2869         0    0.4584    0.8744    1.4449    2.3946    3.5521   3.6110    4.2120

    1.6729    1.6350    1.6327    1.3979    1.1792    0.9951    0.7233    0.4584         0    0.4240    1.0013    1.9547    3.1102    3.1782    3.7840

    2.0827    2.0454    2.0425    1.8082    1.5907    1.4078    1.1408    0.8744    0.4240         0    0.5884    1.5456    2.6985    2.7731    3.3728

    2.6686    2.6311    2.6283    2.3935    2.1753    1.9907    1.7193    1.4449    1.0013    0.5884         0    0.9596    2.1179    2.1900    2.8079

    3.6259    3.5883    3.5855    3.3506    3.1324    2.9474    2.6725    2.3946    1.9547    1.5456    0.9596         0    1.1673    1.2381    1.9110

    4.7788    4.7411    4.7382    4.5038    4.2871    4.1038    3.8295    3.5521    3.1102    2.6985    2.1179    1.1673         0    0.2502    0.8944

    4.8498    4.8115    4.8094    4.5744    4.3559    4.1702    3.8921    3.6110    3.1782    2.7731    2.1900    1.2381    0.2502         0    0.8484

    5.4306    5.3929    5.3907    5.1587    4.9422    4.7589    4.4892    4.2120    3.7840    3.3728    2.8079    1.9110    0.8944    0.8484         0 

      “1”

      “2”

            “3”

      “4”

    “5”

    “6”

  C1=   “7”

    “8”

    “9”

      “10”

      “11”

      “12”

      “13”

      “14”

      “15”

        Также можно используя евклидову метрику, вычислить матрицу межобъектных расстояний, состоящую из величин dij - расстояние между i-тым и j-тым объектами. В нашем случае i и j - номер объекта, наблюдения. Поскольку объем выборки равен 15, то соответственно i и j могут принимать значения от 1 до 15. Очевидно также, что количество всех возможных по парных расстояний будет равно 15*15=225. Действительно, для первого объекта это будут следующие расстояния: 1-1; 1-2; 1-3; 1-4…..1-15. Для объекта 2 также будет 15 возможных расстояний: 2-1; 2-2; 2-3; 2-4…. 2-15 и т.д. Однако число различных расстояний будет меньше 225, поскольку необходимо учесть свойство неразличимости тождественных объектов - dij = 0 при i = j. Это означает, что расстояние между объектом №1 и тем же самым объектом №1 будет равно нулю. Такие же нулевые расстояния будут и для всех остальных случаев i = j. Кроме того, из свойства симметрии следует, что dij = dji для любых i и j. Т.е. расстояние между объектами №1 и №2 равно расстоянию между объектами №2 и №1. К примеру,  симметричная (dij = dji) квадратная матрица с нулевой (dij = 0 при i = j) диагональю.   

    Объединение кластеров.

    Перед началом работы алгоритма рассчитывается матрица расстояний между объектами. На каждом шаге в матрице расстояний ищется минимальное значение, соответствующее расстоянию между двумя наиболее близкими кластерами. Найденные кластеры u и v объединяются, образуя новый кластер k. Строки и столбцы, соответствующие кластерам u и v, выбрасываются из матрицы расстояний, и добавляется новая строка и новый столбец, соответствующие кластеру k. В результате матрица сокращается на одну строку и один столбец. Эта процедура повторяется до тех пор, пока не будут объединены все кластеры.

    Пусть кластеры u, v и k содержат Tu, Tv и Tk объектов, соответственно. Кластер k образован путем объединения кластеров u и v, тогда Tk = Tu+ Tv. Необходимо рассчитать удаленность кластера k от некоторого кластера w. Расстояние между этими кластерами определяется согласно формуле: 
 

    D((u,v),w) =  
 

    Рассмотрим  матрицу расстояний.

      R1 =

         0        0.0431    0.0453    0.2773    0.4956    0.6856    0.9691    1.2538    1.6729    2.0827    2.6686    3.6259    4.7788    4.8498    5.4306

    0.0431         0      0.0175    0.2384    0.4577    0.6482    0.9308    1.2156    1.6350    2.0454    2.6311    3.5883    4.7411    4.8115    5.3929

    0.0453    0.0175         0        0.2356    0.4562    0.6471    0.9307    1.2154    1.6327    2.0425    2.6283    3.5855    4.7382    4.8094    5.3907

    0.2773    0.2384    0.2356         0        0.2234    0.4159    0.6986    0.9832    1.3979    1.8082    2.3935    3.3506    4.5038    4.5744    5.1587

    0.4956    0.4577    0.4562    0.2234         0       0.1936    0.4772    0.7612    1.1792    1.5907    2.1753    3.1324    4.2871    4.3559    4.9422

    0.6856    0.6482    0.6471    0.4159    0.1936         0       0.2928    0.5723    0.9951    1.4078    1.9907    2.9474    4.1038    4.1702    4.7589

    0.9691    0.9308    0.9307    0.6986    0.4772    0.2928         0      0.2869    0.7233    1.1408    1.7193    2.6725    3.8295    3.8921    4.4892

    1.2538    1.2156    1.2154    0.9832    0.7612    0.5723    0.2869         0       0.4584    0.8744    1.4449    2.3946    3.5521    3.6110    4.2120

    1.6729    1.6350    1.6327    1.3979    1.1792    0.9951    0.7233    0.4584         0       0.4240    1.0013    1.9547    3.1102    3.1782    3.7840

    2.0827    2.0454    2.0425    1.8082    1.5907    1.4078    1.1408    0.8744    0.4240         0        0.5884    1.5456    2.6985    2.7731    3.3728

    2.6686    2.6311    2.6283    2.3935    2.1753    1.9907    1.7193    1.4449    1.0013    0.5884         0        0.9596    2.1179    2.1900    2.8079

    3.6259    3.5883    3.5855    3.3506    3.1324    2.9474    2.6725    2.3946    1.9547    1.5456    0.9596         0         1.1673    1.2381    1.9110

    4.7788    4.7411    4.7382    4.5038    4.2871    4.1038    3.8295    3.5521    3.1102    2.6985    2.1179    1.1673         0    0.2502    0.8944

    4.8498    4.8115    4.8094    4.5744    4.3559    4.1702    3.8921    3.6110    3.1782    2.7731    2.1900    1.2381    0.2502         0    0.8484 5.4306    5.3929    5.3907    5.1587    4.9422    4.7589    4.4892    4.2120    3.7840    3.3728    2.8079    1.9110    0.8944    0.8484         0 

    Согласно  критерию классификации, объединение  происходит между кластерами, расстояние между которыми наименьшее. Т.о. на этом шаге объединяются кластеры 2и 3. Расстояние объединения – 0,0175. Необходимо произвести перерасчет матрицы расстояний с учетом нового кластера. 

    Получаем  на втором шаге: 

      R2 =

         0        0,0442    0.2773    0.4956    0.6856    0.9691    1.2538    1.6729    2.0827    2.6686    3.6259    4.7788    4.8498    5.4306

    0,0442           0      0.237    0.4569    0.6476    0.9307    1.2155    1.6338    2.0439    2.6297    3.5869    4.7396    4.8104    5.3918

    0.2773    0.237         0        0.2234    0.4159    0.6986    0.9832    1.3979    1.8082    2.3935    3.3506    4.5038    4.5744    5.1587

    0.4956    0.4569     0.2234         0       0.1936    0.4772    0.7612    1.1792    1.5907    2.1753    3.1324    4.2871    4.3559    4.9422

    0.6856    0.6476    0.4159    0.1936         0       0.2928    0.5723    0.9951    1.4078    1.9907    2.9474    4.1038    4.1702    4.7589

    0.9691    0.9307    0.6986    0.4772    0.2928         0      0.2869    0.7233    1.1408    1.7193    2.6725    3.8295    3.8921    4.4892

    1.2538    1.2155    0.9832    0.7612    0.5723    0.2869         0       0.4584    0.8744    1.4449    2.3946    3.5521    3.6110    4.2120

    1.6729    1.6338    1.3979    1.1792    0.9951    0.7233    0.4584         0       0.4240    1.0013    1.9547    3.1102    3.1782    3.7840

    2.0827    2.0439    1.8082    1.5907     1.4078    1.1408    0.8744    0.4240         0        0.5884    1.5456    2.6985    2.7731    3.3728

    2.6686    2.6297   2.3935     2.1753      1.9907     1.7193      1.4449    1.0013    0.5884         0        0.9596    2.1179    2.1900    2.8079

    3.6259    3.5869    3.3506    3.1324      2.9474      2.6725   2.3946    1.9547    1.5456    0.9596         0         1.1673    1.2381    1.9110

    4.7788   4.7396  4.5038    4.2871    4.1038   3.8295   3.5521   3.1102   2.6985    2.1179    1.1673         0         0.2502    0.8944

    4.8498    4.8104    4.5744      4.3559      4.1702      3.8921    3.6110    3.1782    2.7731      2.1900    1.2381    0.2502        0    0.8484 5.4306   5.3929    5.3918  4.9422    4.7589    4.4892    4.2120    3.7840    3.3728    2.8079    1.9110    0.8944    0.8484         0 
 
 
 
 
 

      “1”

             “2”, “3”

      “4”

    “5”

Информация о работе Применение кластерного анализа для классификации экономических объектов