Экономическая информатика

Автор работы: Пользователь скрыл имя, 02 Октября 2012 в 18:15, контрольная работа

Краткое описание

Цель работы – изучение методов и процедур кластеризации и формирования интерпретаций в системах анализа бизнес-информации на примере технологии сегментирования с использованием метода K-means, а также исследование возможностей совершенствования управления взаимоотношениями с клиентами.
Задание.
Выполнить сравнительный анализ процедур сегментирования по переменным и по факторам с заменой количества факторов и с расчетом коэффициентов важности с использованием алгоритма Черчмена-Акоффа путем сопоставления по вариантам кластеризации профилей сегментов и карт восприятия.

Содержимое работы - 1 файл

КР эконом информатика.doc

— 1.57 Мб (Скачать файл)

КВic – объем выпуска i-го иделия с-м цехом;

НВijvclrq – норма времени на операцию с деталью по i-му изделию,  j-й детали, v-й операции, с-му цеху,  l-й профессии, r-му разряду работ, q-му виду условий труда;

КДИij – количество деталей j-го вида в i-м изделии;

НРИip – норма расхода материала p-го вида на i-е изделие;

НРДijp – норма расхода материала p-го вида на j-ю деталь в i-м изделии;

КСИik – количество сборочных единиц k-го типа в i-м изделии;

КДСkj – количество деталей j-го вида в k-й сборочной единице.

В табл. 6 представлены обозначения функциональных процессов, определенных приведенными ранее формулами.

Таблица 6

Содержание процесса обработки данных

Обозначение процесса

Х1

Х2

Х3

Х4

Х5


 

Из содержания рис. 6 следует, что  таким описанием может быть определение  множеств показателей на входе функционального  процесса и на его выходе. Описание элементов исходного множества  функциональных процессов через  используемые показатели представлено в табл. 7.

Таблица 7

Показатель

Функциональный процесс (вход)

Функциональный процесс (выход)

КСИik

Х1

 

КДСkj

Х1

 

КДИij

Х2, Х3

Х1

НРДijp

Х2

 

НРИip

 

Х2

НВijvclrq

Х3

 

ОТИijvclrq

Х4

Х3

КВic

Х4

 

ОТИНijvclrq

Х5

Х4

ТПНКclrq

 

Х5


 

Приведенное в табл. 7 параметрическое  описание функциональных процессов  можно представить в виде ориентированного графа, дуги которого соответствуют  функциональным процессам, а узлы их входам и выходам. Основой построения   такого   графа,   представленного на   рис. 21,    является     операция Ожидать P(Z1, Z2, …, Zn).

                                                                                         


 

 

 

 

 

 

 

Рисунок 21. Граф информационно-алгоритмической взаимосвязи составных единиц технико-экономической информации определенной функциональной области

 

Для анализа и синтеза функциональной структуры системы требуется  использовать алгоритм кластерного  анализа и соответствующие данные, пригодные для разрезания этого  графа.

В информационных системах бизнес-систем технико-экономические показатели используют во взаимосвязи с финансово-аналитическими и учетно-аналитическими показателями. В связи с этим рассмотрим алгоритмические модели формирования показателей бухгалтерской отчетности, представленные в табл. 8.

Таблица 8                                                                                                     

Идентификатор группы показателей  использования основных средств

Формализованное представление  показателей использования основных средств

1

2

3

4

1

Здания

Sd01.1 (b=1)

Оdт01.1 (b=1)

Оkт01.1 (b=1)

Sd01.1 (b=1)

 

Х1

Х2

Х5

2

Сооружения

Sd01.1 (b=2)

Оdт01.1 (b=2)

Оkт01.1 (b=2)

Sd01.1 (b=2)

 

Х3

Х4

Х6

 

Всего основных средств

 

Sd01.1 (b=1)

        +

+Sd01.1 (b=2)

Х7


В верхних отделениях клеток табл. 8 записаны формализованные представления показателей бухгалтерской отчетности. Например, запись «Sd01.1 (b=1)» обозначает сальдо начальное дебетовое по субсчету 01.1, исчисленное в суммарном выражении по объектам группы основных средств «Здания» в прошедшем периоде как сальдо конечное,  запись «Оdт01.1 (b=1)» – соответствующие обороты по дебету субсчета 01.1 за отчетный период, запись «Оkт01.1 (b=1)» – соответствующие обороты по кредиту субсчета 01.1 за отчетный период, запись «Sd01.1 (b=1)» – соответствующее конечное сальдо отчетного периода.

В нижних отделениях клеток табл. 8 представлены обозначения соответствующих показателям  функциональных процессов обработки  данных. В табл. 9 представлено описание этих процессов, необходимое для выполнения процедуры кластеризации.

Таблица 9

Функциональный процесс  обработки данных

Субсчет

Вид результирующего  показателя

Группа ОС

Вид технологии

Стадия вычислительного  процесса

Уровень

показателя

Х1

01.1(1,1)

Обороты по дебету (1)

Здания (2)

Расчет оборотов (1)

1

1

Х2

01.1(1,1)

Обороты по кредиту (2)

Здания (2)

Расчет оборотов (1)

1

1

Х3

01.1(1,1)

Обороты по дебету (1)

Сооружения (4)

Расчет оборотов (1)

1

1

Х4

01.1(1,1)

Обороты по кредиту (2)

Сооружения (4)

Расчет оборотов (1)

1

1

Х5

01.1(1,1)

Сальдо конечное (4)

Здания (2)

Расчет сальдо (2)

2

2

Х6

01.1(1,1)

Сальдо конечное (4)

Сооружения (4)

Расчет сальдо (2)

2

2

Х7

01.1(1,1)

Сальдо конечное итоговое (6)

Здания и сооружения (0)

Расчет итогов (0)

3

3


 

Числа, записанные в табл. 9 в скобках, соответствуют текстовых значениям параметров, записанным рядом с ними.

Описание функциональных процессов, приведенное в табл. 9, не является единственно возможным. С использованием других параметров можно получить после кластеризации другие функциональные составляющие.

Алгоритмы кластеризации принято  подразделять на эталонные и неэталонные. В процедурах эталонного типа на множестве  объектов задается несколько эталонов – исходных зон, с которых начинает работу алгоритм. Эталоны могут быть следующих видов: подмножество исходного множества; отдельные объекты; отдельные точки евклидова пространства (например, центр тяжести). После задания эталонов алгоритм производит классификацию. Существуют и другие процедуры, например, алгоритмы разрезания графов. В любом случае исследователь подбирает соответствующие процедуры для решаемой им задачи.

Метод k-средних (k-Means) заключается в том, что сначала выбираются k случайных эталонов, затем точка относится к ближайшему классу, центр которого пересчитывается как новый центр тяжести. Следующий объект снова относится к ближайшему классу с пересчетом центра и т. д. Критерием останова является стабилизация центров классов.

На наш взгляд, самой лучшей процедурой является выполнение алгоритма  k-средних таким образом, чтобы сумма квадратов евклидовых расстояний от центров кластеров до входящих в них точек на каждом шаге уменьшалась. Такой алгоритм по качеству близок к оптимизационному.    

После выполнения каждого из следующих  далее заданий необходимо представить  в графическом виде функциональную структуру системы. Одноуровневая структура представлена на рис. 22. В качестве одноуровневой может быть представлена структура, состоящая из кластеров, если при попытке увеличить или уменьшить их количество был получен другой состав кластеров. Состав каждого кластера следует оценить по затратам и результатам. Если каждый функциональный процесс имеет связь подчинения и входит только в один кластер на одном уровне, то такая функциональная структура системы является  многоуровневой (модель механизма). Пример многоуровневой структуры представлен на рис. 9. Здесь символом S обозначена система, процесс Х5 является системным элементом в ее составе. Системы (кластеры) S1 и S2 являются подсистемами в составе системы S.

 

 

 

 


    Рисунок 22. Одноуровневая структура системы S

Рисунок 23. Многоуровневая структура  системы S

Задание 2. 1. Анализ и синтез функциональной структуры с применением метода k-Means на основе использования графа информационно-алгоритмической взаимосвязи

 

Решение:

 

1. Выполнила запуск приложения  STATISTICA.

2. Выполнила команду File - New с параметром As a stand-alone window.

3. Заполнила ячейки таблицы значениями  из табл. 10. Обозначения Var1– Var5 соответствуют переменным Х1–Х5, обозначающим функциональные процессы. Адреса ячеек, в которых размещены единицы, определяют связи.

При этом предполагается, что соответствующие  узлы соединены дугами на рис. 20.

                                                                        

 

     

   Таблица 10

 

Var1

Var2

Var3

Var4

Var5

1

1

0

0

0

0

2

1

1

1

0

0

3

0

1

0

0

0

4

0

0

1

1

0

5

0

0

0

1

1

6

0

0

0

0

1


 

4. Выполнила команду File - Save As и сохранить таблицу с исходными данными как файл в папке учебной группы.

5. Выделила мышью все заполненные  ячейки таблицы. Выполнила команду

 Statistics|Multivariate Explorary Techniques|Cluster Analysis.

6. В окне Clustering Method выбрать K-means сlustering. Щелкнула «ОК».

7. На вкладке Advanced выполнила установку значений параметров. Количество кластеров (Number of clusters) – 2, количество итераций (Number of iterations) – 10. Установила Choose the first N observations. Щелкнула «ОК».

8. В окне k-Means Clustering Results (результаты кластеризации) на вкладке Advanced щелкнула кнопку Members of each cluster & distances (члены кластера и расстояния).

9. Полученные данные совпали с данными представленными в табл. 11.

 Таблица 11

Members of Cluster Number 2 (Spreadsheet1.sta)

and Distances from Respective Cluster Center

 

Cluster contains 2 variables

Variable 4 (Var4)

Variable 5 (Var5)

Distance

0,288675

0,288675


 

10. Полученные данные представлены  в таблицах 12 и 13, структура системы в графическом виде представлена на рисунке 23.

Результат: Таблица 12

Members of Cluster Number 1 (Spreadsheet2)

and Distances from Respective Cluster Center

Cluster contains 2 variables

 

Variable 4 (X4)

Variable 5 (X5)

Distance

0,288675

0,288675


 

Результат: Таблица 13

Members of Cluster Number 2 (Spreadsheet2)

and Distances from Respective Cluster Center

Cluster contains 3 variables

 

Variable 1 (X1)

Variable 2 (X2)

Variable 3 (X3)

Distance

0,333333

0,333333

0,333333


Данные из таблицы 13 совпали с представленными данными в таблице 14

Таблица 14                                                                                         

Members of Cluster Number 1 (Spreadsheet1.sta)

and Distances from Respective Cluster Center

Cluster contains 3 variables

 

Variable 1 (Var1)

Variable 2 (Var2)

Variable 3 (Var3)

Distance

0,333333

0,333333

0,333333


Рисунок 23 - Многоуровневая структура  системы S

11. Развернула окно k-Means Clustering Results и щелкнула Cancel.

12. В окне Clustering Method выбрать K-means сlustering. Щелкнула «ОК».

13. На вкладке Advanced выполнила установку значений параметров. Количество кластеров (Number of clusters) – 3.

Результат выполнения для 3-х кластеров:

Таблица 15

Members of Cluster Number 3 (Spreadsheet2)

and Distances from Respective Cluster Center

Cluster contains 2 variables

 

Variable 3 (Х3)

Variable 4 (Х4)

Distance

0,288675

0,288675


Таблица 16

Members of Cluster Number 2 (Spreadsheet2)

and Distances from Respective Cluster Center

Cluster contains 2 variables

 

Variable 1 (Х1)

Variable 2 (Х2)

Distance

0,288675

0,288675


 

Таблица 17

Members of Cluster Number 1 (Spreadsheet2)

and Distances from Respective Cluster Center

Cluster contains 1 variables

 

Variable 5 (Х5)

Distance

0,00


 

Рисунок 24 - Многоуровневая структура  системы S для 3-х кластеров

Задание 2.2. Анализ и синтез функциональной структуры с применением метода k-Means на основе параметрического описания функциональных

процессов

 

Решение:

1. Выполнила команду File|New с параметром As a stand-alone window.

2. Выполнила подготовку данных  с использованием табл. 9. Обозначения  Var1– Var7 соответствуют переменным Х1–Х7, обозначающим функциональные процессы обработки данных. Каждый столбец содержит числовые значения из соответствующей строки табл. 9.

3. Выполнила команду File|Save As и сохранила таблицу с исходными данными как файл.

4. Выделила мышью все заполненные  ячейки таблицы. Выполнила команду

 Statistics|Multivariate Explorary Techniques|Cluster Analysis.

5. В окне Clustering Method выбрала K-means сlustering. Щелкнула «ОК».

Информация о работе Экономическая информатика