Автор работы: Пользователь скрыл имя, 02 Октября 2012 в 18:15, контрольная работа
Цель работы – изучение методов и процедур кластеризации и формирования интерпретаций в системах анализа бизнес-информации на примере технологии сегментирования с использованием метода K-means, а также исследование возможностей совершенствования управления взаимоотношениями с клиентами.
Задание.
Выполнить сравнительный анализ процедур сегментирования по переменным и по факторам с заменой количества факторов и с расчетом коэффициентов важности с использованием алгоритма Черчмена-Акоффа путем сопоставления по вариантам кластеризации профилей сегментов и карт восприятия.
КВic – объем выпуска i-го иделия с-м цехом;
НВijvclrq – норма времени на операцию с деталью по i-му изделию, j-й детали, v-й операции, с-му цеху, l-й профессии, r-му разряду работ, q-му виду условий труда;
КДИij – количество деталей j-го вида в i-м изделии;
НРИip – норма расхода материала p-го вида на i-е изделие;
НРДijp – норма расхода материала p-го вида на j-ю деталь в i-м изделии;
КСИik – количество сборочных единиц k-го типа в i-м изделии;
КДСkj – количество деталей j-го вида в k-й сборочной единице.
В табл. 6 представлены обозначения функциональных процессов, определенных приведенными ранее формулами.
Таблица 6
Содержание процесса обработки данных |
Обозначение процесса |
|
Х1 |
|
Х2 |
|
Х3 |
|
Х4 |
|
Х5 |
Из содержания рис. 6 следует, что таким описанием может быть определение множеств показателей на входе функционального процесса и на его выходе. Описание элементов исходного множества функциональных процессов через используемые показатели представлено в табл. 7.
Таблица 7
Показатель |
Функциональный процесс (вход) |
Функциональный процесс (выход) |
КСИik |
Х1 |
|
КДСkj |
Х1 |
|
КДИij |
Х2, Х3 |
Х1 |
НРДijp |
Х2 |
|
НРИip |
Х2 | |
НВijvclrq |
Х3 |
|
ОТИijvclrq |
Х4 |
Х3 |
КВic |
Х4 |
|
ОТИНijvclrq |
Х5 |
Х4 |
ТПНКclrq |
Х5 |
Приведенное в табл. 7 параметрическое описание функциональных процессов можно представить в виде ориентированного графа, дуги которого соответствуют функциональным процессам, а узлы их входам и выходам. Основой построения такого графа, представленного на рис. 21, является операция Ожидать P(Z1, Z2, …, Zn).
Рисунок 21. Граф информационно-алгоритмической взаимосвязи составных единиц технико-экономической информации определенной функциональной области
Для анализа и синтеза
В информационных системах бизнес-систем технико-экономические показатели используют во взаимосвязи с финансово-аналитическими и учетно-аналитическими показателями. В связи с этим рассмотрим алгоритмические модели формирования показателей бухгалтерской отчетности, представленные в табл. 8.
Таблица 8
№ |
Идентификатор группы показателей использования основных средств |
Формализованное представление показателей использования основных средств | |||
1 |
2 |
3 |
4 | ||
1 |
Здания |
SdTн01.1 (b=1) |
Оdт01.1 (b=1) |
Оkт01.1 (b=1) |
SdTк01.1 (b=1) |
Х1 |
Х2 |
Х5 | |||
2 |
Сооружения |
SdTн01.1 (b=2) |
Оdт01.1 (b=2) |
Оkт01.1 (b=2) |
SdTк01.1 (b=2) |
Х3 |
Х4 |
Х6 | |||
Всего основных средств |
SdTк01.1 (b=1) + +SdTк01.1 (b=2) | ||||
Х7 |
В верхних отделениях клеток табл. 8 записаны формализованные представления показателей бухгалтерской отчетности. Например, запись «SdTн01.1 (b=1)» обозначает сальдо начальное дебетовое по субсчету 01.1, исчисленное в суммарном выражении по объектам группы основных средств «Здания» в прошедшем периоде как сальдо конечное, запись «Оdт01.1 (b=1)» – соответствующие обороты по дебету субсчета 01.1 за отчетный период, запись «Оkт01.1 (b=1)» – соответствующие обороты по кредиту субсчета 01.1 за отчетный период, запись «SdTк01.1 (b=1)» – соответствующее конечное сальдо отчетного периода.
В нижних отделениях клеток табл. 8 представлены
обозначения соответствующих
Таблица 9
Функциональный процесс обработки данных |
Субсчет |
Вид результирующего показателя |
Группа ОС |
Вид технологии |
Стадия вычислительного процесса |
Уровень показателя |
Х1 |
01.1(1,1) |
Обороты по дебету (1) |
Здания (2) |
Расчет оборотов (1) |
1 |
1 |
Х2 |
01.1(1,1) |
Обороты по кредиту (2) |
Здания (2) |
Расчет оборотов (1) |
1 |
1 |
Х3 |
01.1(1,1) |
Обороты по дебету (1) |
Сооружения (4) |
Расчет оборотов (1) |
1 |
1 |
Х4 |
01.1(1,1) |
Обороты по кредиту (2) |
Сооружения (4) |
Расчет оборотов (1) |
1 |
1 |
Х5 |
01.1(1,1) |
Сальдо конечное (4) |
Здания (2) |
Расчет сальдо (2) |
2 |
2 |
Х6 |
01.1(1,1) |
Сальдо конечное (4) |
Сооружения (4) |
Расчет сальдо (2) |
2 |
2 |
Х7 |
01.1(1,1) |
Сальдо конечное итоговое (6) |
Здания и сооружения (0) |
Расчет итогов (0) |
3 |
3 |
Числа, записанные в табл. 9 в скобках, соответствуют текстовых значениям параметров, записанным рядом с ними.
Описание функциональных процессов, приведенное в табл. 9, не является единственно возможным. С использованием других параметров можно получить после кластеризации другие функциональные составляющие.
Алгоритмы кластеризации принято подразделять на эталонные и неэталонные. В процедурах эталонного типа на множестве объектов задается несколько эталонов – исходных зон, с которых начинает работу алгоритм. Эталоны могут быть следующих видов: подмножество исходного множества; отдельные объекты; отдельные точки евклидова пространства (например, центр тяжести). После задания эталонов алгоритм производит классификацию. Существуют и другие процедуры, например, алгоритмы разрезания графов. В любом случае исследователь подбирает соответствующие процедуры для решаемой им задачи.
Метод k-средних (k-Means) заключается в том, что сначала выбираются k случайных эталонов, затем точка относится к ближайшему классу, центр которого пересчитывается как новый центр тяжести. Следующий объект снова относится к ближайшему классу с пересчетом центра и т. д. Критерием останова является стабилизация центров классов.
На наш взгляд, самой лучшей процедурой является выполнение алгоритма k-средних таким образом, чтобы сумма квадратов евклидовых расстояний от центров кластеров до входящих в них точек на каждом шаге уменьшалась. Такой алгоритм по качеству близок к оптимизационному.
После выполнения каждого из следующих далее заданий необходимо представить в графическом виде функциональную структуру системы. Одноуровневая структура представлена на рис. 22. В качестве одноуровневой может быть представлена структура, состоящая из кластеров, если при попытке увеличить или уменьшить их количество был получен другой состав кластеров. Состав каждого кластера следует оценить по затратам и результатам. Если каждый функциональный процесс имеет связь подчинения и входит только в один кластер на одном уровне, то такая функциональная структура системы является многоуровневой (модель механизма). Пример многоуровневой структуры представлен на рис. 9. Здесь символом S обозначена система, процесс Х5 является системным элементом в ее составе. Системы (кластеры) S1 и S2 являются подсистемами в составе системы S.
Рисунок 22. Одноуровневая структура системы S
Рисунок 23. Многоуровневая структура системы S
Решение:
1. Выполнила запуск приложения STATISTICA.
2. Выполнила команду File - New с параметром As a stand-alone window.
3. Заполнила ячейки таблицы
При этом предполагается, что соответствующие узлы соединены дугами на рис. 20.
Таблица 10
Var1 |
Var2 |
Var3 |
Var4 |
Var5 | |
1 |
1 |
0 |
0 |
0 |
0 |
2 |
1 |
1 |
1 |
0 |
0 |
3 |
0 |
1 |
0 |
0 |
0 |
4 |
0 |
0 |
1 |
1 |
0 |
5 |
0 |
0 |
0 |
1 |
1 |
6 |
0 |
0 |
0 |
0 |
1 |
4. Выполнила команду File - Save As и сохранить таблицу с исходными данными как файл в папке учебной группы.
5. Выделила мышью все
Statistics|Multivariate Explorary Techniques|Cluster Analysis.
6. В окне Clustering Method выбрать K-means сlustering. Щелкнула «ОК».
7. На вкладке Advanced выполнила установку значений параметров. Количество кластеров (Number of clusters) – 2, количество итераций (Number of iterations) – 10. Установила Choose the first N observations. Щелкнула «ОК».
8. В окне k-Means Clustering Results (результаты кластеризации) на вкладке Advanced щелкнула кнопку Members of each cluster & distances (члены кластера и расстояния).
9. Полученные данные совпали с данными представленными в табл. 11.
Таблица 11
Members of Cluster Number 2 (Spreadsheet1.sta)
and Distances from Respective Cluster Center
Cluster contains 2 variables |
Variable 4 (Var4) |
Variable 5 (Var5) |
Distance |
0,288675 |
0,288675 |
10. Полученные данные
Результат: Таблица 12
Members of Cluster Number 1 (Spreadsheet2)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 4 (X4) |
Variable 5 (X5) | |
Distance |
0,288675 |
0,288675 |
Результат: Таблица 13
Members of Cluster Number 2 (Spreadsheet2)
and Distances from Respective Cluster Center
Cluster contains 3 variables
Variable 1 (X1) |
Variable 2 (X2) |
Variable 3 (X3) | |
Distance |
0,333333 |
0,333333 |
0,333333 |
Данные из таблицы 13 совпали с представленными данными в таблице 14
Таблица 14
Members of Cluster Number 1 (Spreadsheet1.sta)
and Distances from Respective Cluster Center
Cluster contains 3 variables
Variable 1 (Var1) |
Variable 2 (Var2) |
Variable 3 (Var3) | |
Distance |
0,333333 |
0,333333 |
0,333333 |
Рисунок 23 - Многоуровневая структура системы S
11. Развернула окно k-Means Clustering Results и щелкнула Cancel.
12. В окне Clustering Method выбрать K-means сlustering. Щелкнула «ОК».
13. На вкладке Advanced выполнила установку значений параметров. Количество кластеров (Number of clusters) – 3.
Результат выполнения для 3-х кластеров:
Таблица 15
Members of Cluster Number 3 (Spreadsheet2)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 3 (Х3) |
Variable 4 (Х4) | |
Distance |
0,288675 |
0,288675 |
Таблица 16
Members of Cluster Number 2 (Spreadsheet2)
and Distances from Respective Cluster Center
Cluster contains 2 variables
Variable 1 (Х1) |
Variable 2 (Х2) | |
Distance |
0,288675 |
0,288675 |
Таблица 17
Members of Cluster Number 1 (Spreadsheet2)
and Distances from Respective Cluster Center
Cluster contains 1 variables
Variable 5 (Х5) | |
Distance |
0,00 |
Рисунок 24 - Многоуровневая структура системы S для 3-х кластеров
Решение:
1. Выполнила команду File|New с параметром As a stand-alone window.
2. Выполнила подготовку данных с использованием табл. 9. Обозначения Var1– Var7 соответствуют переменным Х1–Х7, обозначающим функциональные процессы обработки данных. Каждый столбец содержит числовые значения из соответствующей строки табл. 9.
3. Выполнила команду File|Save As и сохранила таблицу с исходными данными как файл.
4. Выделила мышью все
Statistics|Multivariate Explorary Techniques|Cluster Analysis.
5. В окне Clustering Method выбрала K-means сlustering. Щелкнула «ОК».