Классификация IT-анализа по режиму и темпу

Автор работы: Пользователь скрыл имя, 28 Октября 2013 в 17:09, реферат

Краткое описание

Различают два вида информационно-аналитических систем по режиму и темпу анализа:
статические — имеют заранее разработанный сценарий обработки данных при весьма
ограниченных возможностях вариаций запросов — так называемые информационные
системы руководителя (Exequtive Information system EIS);
динамические — обеспечивают обработку нерегламентированных запросов и гибкую
систему подготовки отчетов.

Содержимое работы - 1 файл

Информация.doc

— 69.00 Кб (Скачать файл)

Информация, извлекаемая  из информационных хранилищ и предоставляемая  ее конечным

потребителям независимо от архитектуры ИХ, способов представления  в базах данных, должна

отвечать предъявляемым  требованиям по форме представления, содержанию, своевременности,

достоверности, воспринимаемости и т.д. Применяемые методы анализа  должны обеспечивать не-

обходимое содержание и достоверность  предоставляемой пользователям  информации.

 

4.1.1. Классификация IT-анализа  по режиму и темпу

Различают два вида информационно-аналитических систем по режиму и темпу анализа:

 статические — имеют заранее разработанный сценарий обработки данных при весьма

ограниченных возможностях вариаций запросов — так называемые информационные

системы руководителя (Exequtive Information system EIS);

динамические  — обеспечивают обработку нерегламентированных запросов и гибкую

систему подготовки отчетов.

 Статические  ИАС при всей кажущейся простоте  и соответственно привлекательности для ЛПР имеют ограниченные возможности по информационной поддержке принятия решений.

Зачастую полученная в отчетах информация порождает  вытекающие из ее содержания вопро-

сы, на которые  в допустимое время ответ не может  быть получен.

Динамические  ИАС предназначены для обработки  незапланированных заранее, не-

ожиданных (ad hoc) запросов. Пользователи системы работают с такой ИАС в интерактивном

режиме. Обрабатывается серия непредусмотренных заранее  запросов, которые возникают в

ходе полготовки и принятия решения. Заранее может  быть подготовлена некоторая цепочка

действий или сценарий, который может корректироваться.

Поддержка принятия управленческих решений осуществляется в следующих режимах

или базовых  сферах (23):

– сфера детализированных данных;

– сфера агрегированных показателей;

– сфера закономерностей.

В сфере детализированных данных подсистемы ИАС или автономные ИС нацелены на

поиск данных. Эту  задачу отлично выполняют реляционные  СУБД. В качестве языка манипули-

рования данными, ставшего стандартным, используется, как  правило, SQL. Для поиска детали-

зированной  информации используются информационно-поисковые системы, которые могут ра-

ботать с  операционными, локальными или региональными  базами и хранилищами данных, а

также и совместно  с центральным ИХ.

Сфера агрегированных показателей отличается агрегацией данных, оперативной ана-

литической  обработкой, многомерным представлением в виде гиперкубов, многомерным ана-

лизом. В этой сфере используются специальные  многомерные СУБД. Допустимо использование

реляционных представлений  данных. При правильном применении реляционных СУБД, показа-

тели эффективности  ИАС сопоставимы со специализированными  многомерными. Агрегирован-

ные массивы  при реляционном подходе представлены в виде описанных выше схем: «звезды» и

других. Агрегация  может производиться также «на  лету» при обработке запроса.

Анализ детализированных данных и агрегированных показателей  относится к оператив-

ному или OLAP-анализу.

Сфера закономерностей связана или основана на интеллектуальной обработке дан-

ных. Главной  задачей здесь выступает выявление  закономерностей в исследуемых процессах,

взаимосвязей  и взаимовлияния различных факторов, поиск крупных «непривычных»  отклонений,

прогноз хода различных существенных процессов. Эта сфера относится к интеллектуальному

анализу (Data mining).

Оперативный анализ — это функция ИАС, обеспечивающая быстрый, в соответст-

вии с правилами FASMI, доступ к любой необходимой  информации, содержащей-

ся в ИХ или, точнее в факт-таблице, представляемой также в виде многомерного

куба (на практике трехмерных комбинаций кубов). Извлечение информации, как

правило, сопровождается обработкой ее по несложным алгоритмам, как то:

производится  суммаризация, определение процентов  от заданных величин, полу-

чение относительных  показателей, вычисление величин с  заданными коэффициен-

тами и другие действия над данными на разных уровнях детализации. Анализ про-

изводится с  данными, представленными в виде электронных таблиц, над которыми

предоставляется возможность оперативно производить  различные более сложные

вычисления.

Извлечение  необходимой информации для построения отчетов производится путем ис-

пользования ряда процедур.

К ним относятся:

− сечение или срез (slice and dice) — извлечение данных из факт-таблицы по каким-либо

определенным  значениям одного или нескольких измерений, например из гипер-куба

 (факт-таблицы), содержащей сведения об издержках; в отчет (раздел отчета) помещают

данные только по какому-либо одному виду или группе издержек;

− поворот, под которым понимают изменение координат, их порядка или добавление из-

мерений; эта  процедура обеспечивает замену в готовом отчете «Издержки», к примеру,

аргумента —  время на регионы или центры затрат; если рассматривалась взаимозави-

симость «возраст — семейное положение» то можно  в качестве аргумента брать любое

из этих измерений  и менять их местами;

− свертка (drill up) — агрегируются данные по заданным признакам и алгоритмам; можно

группировать  необходимые данные, содержащиеся в  ИХ в детальном виде; так при  за-

несении сведений в операционную БД ежесуточно в ИХ их можно передавать в агреги-

рованном виде — еженедельно или ежемесячно, соответственно агрегированные данные

можно помещать в отчеты;

− развертка или раскрытие (roll up) — процедура, обратная свертке, данные детализиру-

ются, например группы товаров представляются по конкретным товарам, более круп-

ные временные  периоды разбиваются на мелкие и  т.д.

− создание кросс-таблиц — то есть совмещение данных из разных таблиц по заданным

признакам; например создается отчет, в котором сводятся данные об издержках и вы-

ручке по одним  и тем же изделиям и временным периодам;

− проекция — конструирование отчетов, являющихся подмножествами из множества единичных

реквизитов  или атрибутов, содержащихся в операционных базах или в ИХ;

− построение трендов — зависимость числовых или качественных значений показателя от

тех или иных параметров, например времени, технологии и т.д.

Многомерные OLAP-системы

В многомерных  СУБД данные организованы не в виде реляционных таблиц, а в виде

упорядоченных многомерных массивов в виде гиперкубов, когда все хранимые данные должны

иметь одинаковую размерность, что означает необходимость  образовывать максимально пол-

ный базис измерений. Данные могут быть организованы в  виде поликубов, в этом варианте

значения каждого  показателя хранятся с собственным  набором измерений, обработка данных

производится  собственным инструментом системы. Структура хранилища в этом случае упро-

щается, так  как отпадает необходимость в  отдельной зоне хранения данных в  многомерном

или объектно-ориентированном  виде. Снижаются огромные трудозатраты на создание реляци-

онных моделей  и систем преобразования данных из реляционной модели в объектную (см. рис.

3.1).

Достоинствами MOLAP являются:

− более быстрое, чем при ROLAP получение ответов на запросы — затрачиваемое время

на один-два  порядка меньше;

− из-за ограничений SQL затрудняется реализация многих встроенных функций.

К ограничениям MOLAP относятся:

− сравнительно небольшие размеры баз данных — предел десятки Гигабайт,

− за счет денормализации и предварительной агрегации многомерные массивы использу-

ют в 2,5-100 раз больше памяти, чем исходные данные (расход памяти при увеличении

числа измерений  растет по экспоненциальному закону);

− отсутствуют стандарты на интерфейс и средства манипулирования данными;

− имеются ограничения при загрузке данных.

Реляционные OLAP-системы

В настоящее  время в массовых средствах, обеспечивающих аналитическую работу,

преобладает использование  инструментов на основе реляционного подхода. Структура храни-

лища остается в том виде, как представлено на рис. 3.1. Трудозатраты на создание зоны мно-

гомерных данных резко увеличиваются, так как  практически отсутствуют в этой ситуации спе-

циализированные средства объективизации реляционной  модели данных, содержащихся в ин-

формационном  хранилище. Время отклика на запросы  часто не может уложиться в рамки тре-

бований к OLAP-системам.

Достоинствами ROLAP-систем являются:

− возможность оперативного анализа непосредственно содержащихся в хранилище дан-

ных, так как большинство  исходных баз данных — реляционного типа;

− при переменной размерности задачи выигрывают ROLAP, так как не требуется физиче-

ская реорганизация  базы данных;

− ROLAP-системы могут использовать менее мощные клиентские станции и серверы, в ви-

ду того, что  на серверы ложится основная нагрузка по обработке сложных SQL-

запросов;

− уровень защиты информации и разграничения прав доступа в реляционных СУБД не-

сравненно выше, чем в многомерных.

Недостатком ROLAP-систем является меньшая производительность, необходимость тща-

тельной проработки схем базы данных, специальная настройка индексов, анализ статистики

запросов и  учет выводов анализа при доработках схем баз данных, что приводит к  значитель-

ным дополнительным трудозатратам.

Выполнение  же этих условий позволяет при  использовании ROLAP-систем добиться схо-

жих с MOLAP-системами показателей в отношении времени доступа, а также превзойти в эко-

номии памяти.

Гибридные OLAP-системы

Представляют  собой сочетание инструментов, реализующих  реляционную и многомерную

модель данных. Структура хранилища остается в  основном такой же, как на рис. 3.1, однако

зона многомерных  данных создается специализированными  средствами. Это позволяет резко

снизить затраты  ресурсов на создание и поддержание  такой зоны, время отклика на запросы, в

том числе незапланированные  резко снижается, выполняются требования к OLAP-системам.

При таком подходе  используются достоинства первых двух подходов и компенсируются

их недостатки. В наиболее развитых программных  продуктах такого назначения реализован

именно этот принцип.

Использование гибридной архитектуры в OLAP-системах — это наиболее приемлемый

путь решения  проблем, связанных с применением  программных инструментальных средств  в

многомерном анализе.

Тем не менее  встречаются обстоятельства, когда  применение ROLAP— и HOLAP-cистем

становится  невозможным из-за чрезвычайно жестких требований со стороны объектов управ-

ления или соответственно контролируемых процессов. Такие ситуации характерны для крупных

промышленных, транспортных, энергетических комплексов, на финансовых рынках, при управ-

лении объектами  в критических ситуациях или их моделировании.

Для такого класса применения ИАС становится безальтернативным  применение много-

мерных или  объектно-ориентированных инструментальных средств и методов.

К специфическим  методам интеллектуального анализа относятся:

— методы нечеткой логики;

— системы рассуждений  на основе аналогичных случаев;

— классификационные  и регрессионные деревья решений;

— нейронные  сети;

— генетические алгоритмы;

— байесовское  обучение (ассоциации);

— кластеризация  и классификация;

— эволюционное программирование;

— алгоритмы  ограниченного перебора.

Методы нечеткой логики используются для описания плохо формализуемых объектов из

состава «мягких» знаний. Над ними также совершаются  мягкие вычисления. Используется поня-

тие «лингвистическая переменная», значения которой определяются через нечеткие множества,

а они представляются базовым набором значений или  базовой числовой шкалой.

Системы рассуждений  на основе аналогичных случаев case based reasoning (CBR) осно-

ваны на том, что принятие решения осуществляется по прецеденту, наиболее подходящему к

данной ситуации с учетом определенных корректив. Иногда решение принимается на основе

учета всех примеров, находящихся в хранилище данных.

Деревья решений основаны на иерархической древовидной структуре классифицирующих

правил. Решения  об отнесении того или иного объекта  или ситуации к соответствующему классу

принимается по ответам на вопросы, стоящие в  узлах дерева. Положительный ответ  означает пе-

реход к правому  узлу следующего уровня, отрицательный  — к левому узлу. Процесс разделения

продолжается  до полного ответа на все поставленные вопросы.

Нейронные сети — это упрощенная аналогия нервной системы живого организма. Раз-

работаны модели нейронных сетей. Распространенной моделью является многослойный пер-

септрон с обратным распространением ошибки. Нейроны работают в составе иерархической

сети, в которой  нейроны нижележащего слоя своими выходами соединены с входами нейронов

вышележащего  слоя. На нейроны нижнего слоя подаются значения входных параметров, кото-

рые являются сигналами, те передаются в следующий слой. При этом они ослабляются или

усиливаются в  зависимости от числовых значений, которые придаются межнейронным связям,

называемых  весами. На выходе нейрона верхнего слоя вырабатывается сигнал, являющийся

ответом сети на введенные значения входных параметров. Для получения необходимых значе-

Информация о работе Классификация IT-анализа по режиму и темпу