Применение кластерного анализа для классификации экономических объектов

Автор работы: Пользователь скрыл имя, 15 Января 2012 в 18:05, лабораторная работа

Краткое описание

Цель: изучение методов кластерного анализа и применение их для классификации экономических объектов.

Содержимое работы - 1 файл

Лабораторная работа №8.doc

— 429.00 Кб (Скачать файл)

      R8 =

         0      0,8583    2,7452    1,8295    2,4145    4,8716     4.5602    5.2178                            

    0,8583          0      0.5908    1.0076    1.5821    2.5335   3.7211    4.3506

    2,7452    0.5908         0       0.4240    1.0013    1.9547    3.1442     3.7840

    1,8295   1.0076    0.4240         0        0.5884    1.5456    2.7358    3.3728

    2,4145    1.5821    1.0013    0.5884         0         0.9596   2.1539    2.8079

    4,8716    2.5335    1.9547    1.5456    0.9596         0       1.2027    1.9110

    4.5602  3.7211    3.1442     2.7358    2.1539    1.2027         0       0.8714

    5.2178     5.0309      3.7840      .3728     2.8079       1.9110    0.8714        0 
 
 
 
 
 
 
 
 

      

                                       “1”,“2”, “3”, “4”,“5”,“6”

                                                                                      “7”,“8”

    “9”

                                                                             C8 =   “10”

      “11”

      “12”

                                                                                      “13”, “14”

      “15” 

    На  девятом шаге:

    Согласно  новой матрицы расстояний, кластеры “10” и “9” наиболее близкие. Расстояние объединения – 0.4240. Необходимо произвести перерасчет матрицы расстояний с учетом полученного кластера:

      R9 =

         0       0,8583    2,4399    2,4145    4,8716     4.5602    5.2178                            

    0,8583          0      0.7297    1.5821    2.5335   3.7211    4.3506

    2,4399    0.7297         0        0,8636    1.8183    3.0080     3.6469

    2,4145    1.5821    0,8636         0         0.9596    2.1539    2.8079

    4,8716    2.5335    1.8183     0.9596         0       1.2027    1.9110

    4.5602  3.7211    3.0080   2.1539    1.2027         0       0.8714

    5.2178     5.0309      3.6469       2.8079       1.9110    0.8714        0 
 

      

                                       “1”,“2”, “3”, “4”,“5”,“6”

           “7”,“8”,

              “9”, “10”

                                                                             C9 =   “11”

      “12”

                                                                                      “13”, “14”

      “15” 
 
 

    На  десятом шаге:

    Согласно  новой матрицы расстояний, кластеры “9”,“10” и “7”,“8” наиболее близкие. Расстояние объединения – 0.7297. Необходимо произвести перерасчет матрицы расстояний с учетом полученного кластера:

      R10 =

         0       1,6491    2,4145    4,8716     4.5602    5.2178                            

    1,6491          0      1.2228    2,1759   3.3645    3,9987

    2,4145    1.2228         0         0.9596   2.1539    2.8079

    4,8716    2,1759     0.9596         0       1.2027    1.9110

    4.5602  3.3645      2.1539    1.2027         0       0.8714

    5.2178     3,9987       2.8079       1.9110    0.8714        0 
 

      

                                       “1”,“2”, “3”, “4”,“5”,“6”

                                                                                       “7”,“8”,“9”,“10”

                                                                           C10 =   “11”

      “12”

                                                                                      “13”, “14”

      “15” 
 

    На  одиннадцатом шаге:

    Согласно  новой матрицы расстояний, кластеры “13”, “14” и  “15” наиболее близкие. Расстояние объединения – 0.8714. Необходимо произвести перерасчет матрицы расстояний с учетом полученного кластера:

      R11 =

         0       1,6491    2,4145    4,8716     4,8072                            

    1,6491          0       1.2228    2,1759   3.5759

    2,4145    1.2228         0         0.9596    2.3719

    4,8716    2,1759     0.9596         0       1.4388

    4,8072  3.5759      2.3719    1.4388         0      

     
 

      

                                       “1”,“2”, “3”, “4”,“5”,“6”

                                                                                       “7”,“8”,“9”,“10”

                                                                            C11  =   “11”

      “12”

                                                                                      “13”, “14”, “15” 
 

    На  двенадцатом шаге:

    Согласно  новой матрицы расстояний, кластеры “12” и   “11”  наиболее близкие. Расстояние объединения – 0.9596. Необходимо произвести перерасчет матрицы расстояний с учетом полученного кластера:

      R12 =

         0         1,6491    3,64305     4,8072                            

   1,6491          0          1.6993       3.5759

  3,64305    1.6993         0            1,9053

   4,8072    3.5759      1,9053         0      

     
 
 
 

      

                                       “1”,“2”, “3”, “4”,“5”,“6”

                                                                                       “7”,“8”,“9”,“10”

                                                                            C12  =   “11”, “12”

                                                                                      “13”, “14”, “15” 

    На  тринадцатом шаге:

    Согласно  новой матрицы расстояний, кластеры “1”,“2”, “3”, “4”,“5”,“6”, и   “7”,“8”,“9”,“10” наиболее близкие. Расстояние объединения – 1,6491. Необходимо произвести перерасчет матрицы расстояний с учетом полученного кластера:

      R13 =

         0    3,6208     5,0203                            

  3,6208         0            1,9053

   5,0203      1,9053         0      

     
 

    

                                                              “1”,“2”, “3”, “4”,“5”,“6”, “7”,“8”,“9”,“10”

                                                     C13  = “11”, “12”

                                                               “13”, “14”, “15” 
 

    На  четырнадцатом шаге:

    Согласно  новой матрицы расстояний, кластеры “11”, “12” и   “13”, “14”, “15” наиболее близкие. Расстояние объединения – 1,9053. Необходимо произвести перерасчет матрицы расстояний с учетом полученного кластера: 
 

     R14 =

     

        0    4,0873                                 

  4,0873         0     

  

     

    

                                                              “1”,“2”, “3”, “4”,“5”,“6”, “7”,“8”,“9”,“10”

                                                     C13  = “11”, “12”, “13”, “14”, “15” 
 
 
 

    Заметим что с каждым шагом расстояние между объединяющимися кластерами увеличивается. Это будет хорошо видно если построить дентограмму 

    

   4,0873

   1,9053

   1,6491

   0,9596

   0,8714

   0,7297

   0,4240

   0,4601

   0,2502

   0,3047

   0,2928

     0,2234

     0,0442

      0,0175

            1996    97      98        99      00     01    02       03    04        05     06         07       08          09     10                г.

    Рис. 1  Дентограмма

     

    Как видно из дентограммы, наиболее высокий и стабильный уровень ВВП в регионах Центрального федерального округа наблюдался в промежутке с 2001 по 2008 гг. В промежутке с 1996 по 2001 гг. наблюдаются наиболее низкие показатели. В 2002 году ставилась задача по удвоению валового внутреннего продукта страны за 10 лет. ЦФО эту задачу выполнил, как видно из рис. в 2005 году.

    На  долю Центрального округа приходится 27,4% ВВП страны и 21,8% выпуска промышленной продукции. Такое соотношение определяется тем, что здесь наиболее развита непроизводственная сфера, занимающая самый высокий удельный вес в структуре ВВП.

1.3  Задание на лабораторную  работу

  1. На основе исходных данных рассчитать матрицу  расстояний и матрицу кластеров. X1, X2, X3, X4 – взять из лабораторной работы «Множественный регрессионный анализ». X5 = U4*U4*10.
  2. Провести классификацию объектов. При этом расстояние рассчитывать по методу ближайшего соседа. Рассчитывать функционал качества Q2(S) для каждого шага.
  3. Провести классификацию объектов. При этом расстояние рассчитывать по методу дальнего соседа. Рассчитывать функционал качества Q2(S) для каждого шага. Результаты сравнить с результатами задания 3.
 

   При выполнении данной лабораторной работы рекомендуется  использовать программу Mathcad.

    1. Содержание  отчёта

    Отчёт должен содержать:

  • титульный лист
  • задание
  • постановку задачи
  • результаты выполнения задания
  • выводы с экономической трактовкой.
    1. Контрольные вопросы
  1. Что такое  кластер?
  2. Какие есть формы представления начальных данных в кластерном анализе?
  3. Что представляет собой расстояние между кластерами ?
  4. Что представляет собой мера близости ?
  5. Что такое обычное Евклидово расстояние и в каких случаях его используют?
  6. Что такое «взвешенное» Евклидово расстояние и в каких случаях его используют?
  7. Что представляет собой Хеммингово расстояние?
  8. Какие расстояния и меры близости между группами объектов наиболее употребляемые?
  9. Что представляет собой «обобщённое расстояние» Колмогорова?
  10. Какие существуют функционалы качества разбиения кластеров на группы?

Информация о работе Применение кластерного анализа для классификации экономических объектов