Автор работы: Пользователь скрыл имя, 02 Октября 2012 в 18:15, контрольная работа
Цель работы – изучение методов и процедур кластеризации и формирования интерпретаций в системах анализа бизнес-информации на примере технологии сегментирования с использованием метода K-means, а также исследование возможностей совершенствования управления взаимоотношениями с клиентами.
Задание.
Выполнить сравнительный анализ процедур сегментирования по переменным и по факторам с заменой количества факторов и с расчетом коэффициентов важности с использованием алгоритма Черчмена-Акоффа путем сопоставления по вариантам кластеризации профилей сегментов и карт восприятия.
6. На вкладке Advanced выполнила установку значений параметров. Количество кластеров (Number of clusters) – 2, количество итераций (Number of iterations) – 10. Установила Choose the first N observations. Щелкнула «ОК».
7. В окне k-Means Clustering Results (результаты кластеризации) на вкладке Advanced щелкнула кнопку Members of each cluster & distances (члены кластера и расстояния).
8. Результат для 2-го кластера представлен в таблице 18, данные не совпадают с представленными данными в таблице 19
Таблица 18
Members of Cluster Number 2 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 3 variables
Variable 5 (Х5) |
Variable 6 (Х6) |
Variable 7 (Х7) | |
Distance |
0,430331 |
0,922958 |
1,186342 |
Таблица 19
Members of Cluster Number 2 (Spreadsheet3-Par-KM.sta)
and Distances from Respective Cluster Center
Cluster contains 3 variables
Variable 5 (Var 5) |
Variable 6 (Var 6) |
Variable 7(Var 7) | |
Distance |
0,455623 |
0,935018 |
1,223535 |
9. Результат для 1-го кластера представлен в таблице 20, данные совпали с представленными данными в таблице 21.
Таблица 20
Members of Cluster Number 1 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 4 variables
Variable 1 (Х1) |
Variable 2 (Х2) |
Variable 3 (Х3) |
Variable 4 (Х4) | |
Distance |
0,456435 |
0,456435 |
0,456435 |
0,456435 |
Таблица 21
Members of Cluster Number 1 (Spreadsheet3-Par-KM.sta)
and Distances from Respective Cluster Center
Cluster contains 4 variables
Variable 1 |
Variable 2 |
Variable 3 |
Variable 4 | |
Distance |
0,456435 |
0,456435 |
0,456435 |
0,456435 |
Рисунок 25 - Многоуровневая структура системы S для 2-х кластеров
10. Результаты выполнения кластеризации на 3 кластера представлены в таблицах 22, 23, 24.
Таблица 22
Members of Cluster Number 1 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 4 variables
Variable 1 (X1) |
Variable 2 (X2) |
Variable 3 (X3) |
Variable 4 (X4) | |
Distance |
0,456435 |
0,456435 |
0,456435 |
0,456435 |
Таблица 23
Members of Cluster Number 2 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 1 variables
Variable 7 (X7) | |
Distance |
0,00 |
Таблица 24
Members of Cluster Number 3 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 5 (X5) |
Variable 6 (X6) | |
Distance |
0,408248 |
0,408248 |
Рисунок 26 - Многоуровневая структура системы S для 3-х кластеров
11. Результаты выполнения кластеризации на 4 кластера представлены в таблицах 25, 26, 27, 28.
Таблица 25
Members of Cluster Number 1 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 1 (X1) |
Variable 2 (X2) | |
Distance |
0,204124 |
0,204124 |
Таблица 26
Members of Cluster Number 2 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 1 variables
Variable 7 (X7) | |
Distance |
0,00 |
Таблица 27
Members of Cluster Number 3 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 3 (X3) |
Variable 4 (X4) | |
Distance |
0,204124 |
0,204124 |
Таблица 28
Members of Cluster Number 4 (Spreadsheet8)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 5 (X5) |
Variable 6 (X6) | |
Distance |
0,408248 |
0,408248 |
Рисунок 27 - Многоуровневая структура системы S для 4-х кластеров
Решение:
1. Выполнила команду File|New с параметром As a stand-alone window.
2. Выполнила подготовку данных с использованием табл. 9. Обозначения Var1– Var7 соответствуют переменным Х1–Х7, обозначающим функциональные процессы. Каждый столбец содержит числовые значения из соответствующей строки табл. 9.
3. Выполнила команду File|Save As и сохранила таблицу с исходными данными.
4. Выделила мышью все
Statistics|Multivariate Explorary Techniques|Cluster Analysis.
5. В окне Clustering Method выбрала Joining (tree сlustering). Щелкнула «ОК».
6. На вкладке Advanced выполнила установку значений параметров (Input file – Raw data). Щелкнула «ОК».
7. В окне Joining Results щелкнула кнопку Vertical icicle plot.
8. Результат выполнения представлен на рисунке 28.
Рисунок 28 - графическое представление функциональной структуры
9. Развернула окно Joining Results.
10. Щелкнула кнопку Distance matrix. получила матрицу расстояний как на рисунке 29.
Рисунок 29 – Матрица расстояний
12. В табл. 9, добавила 2 параметра, характеризующих процессы, получила новые расчеты и новую матрицу расстояний.
Для 2-х кластеров:
Members of Cluster Number 1 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 4 variables
Variable 1 (Х1) |
Variable 2 (Х1) |
Variable 3 (Х3) |
Variable 4 (Х4) | |
Distance |
0,395285 |
0,395285 |
0,395285 |
0,395285 |
Members of Cluster Number 2 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 3 variables
Variable 5 (Х5) |
Variable 6 (Х6) |
Variable 7 (Х7) | |
Distance |
0,408248 |
0,816497 |
1,080123 |
Для 3-х кластеров:
Members of Cluster Number 1 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 4 variables
Variable 1 (Х1) |
Variable 2 (Х2) |
Variable 3 (Х3) |
Variable 4 (Х4) | |
Distance |
0,395285 |
0,395285 |
0,395285 |
0,395285 |
Members of Cluster Number 2 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 1 variables
Variable 7 (Х7) | |
Distance |
0,00 |
Members of Cluster Number 3 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 5 (Х5) |
Variable 6 (Х6) | |
Distance |
0,353553 |
0,353553 |
Для 4-х кластеров
Members of Cluster Number 1 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 1 (Х1) |
Variable 2 (Х2) | |
Distance |
0,176777 |
0,176777 |
Members of Cluster Number 2 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 1 variables
Variable 7 (Х7) | |
Distance |
0,00 |
Members of Cluster Number 3 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 3 (Х3) |
Variable 4 (Х4) | |
Distance |
0,176777 |
0,176777 |
Members of Cluster Number 4 (Spreadsheet82)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 5 (Х5) |
Variable 6 (Х6) | ||
Distance |
0,353553 |
0,353553 |
Многоуровневые структуры
Рисунок 30 - графическое представление функциональной структуры для 8 параметров
Рисунок 31 – Матрица расстояний для 8 параметров, характеризующих процессы
1. Методические указания к выполнению лабораторных работ по спецкурсу бизнес-информатики для студентов специальностей «Прикладная информатика в экономике» и «Математические методы в экономике» дневной формы обучения. Сост. О. Д. Богомолов. – Хабаровск: Изд-во Тихоокеан. гос. ун-та. 2011.
.