Автор работы: Пользователь скрыл имя, 28 Октября 2013 в 17:09, реферат
Различают два вида информационно-аналитических систем по режиму и темпу анализа:
статические — имеют заранее разработанный сценарий обработки данных при весьма
ограниченных возможностях вариаций запросов — так называемые информационные
системы руководителя (Exequtive Information system EIS);
динамические — обеспечивают обработку нерегламентированных запросов и гибкую
систему подготовки отчетов.
Информация, извлекаемая из информационных хранилищ и предоставляемая ее конечным
потребителям независимо от архитектуры ИХ, способов представления в базах данных, должна
отвечать предъявляемым требованиям по форме представления, содержанию, своевременности,
достоверности, воспринимаемости и т.д. Применяемые методы анализа должны обеспечивать не-
обходимое содержание и достоверность предоставляемой пользователям информации.
4.1.1. Классификация IT-анализа по режиму и темпу
Различают два вида информационно-аналитических систем по режиму и темпу анализа:
статические — имеют заранее разработанный сценарий обработки данных при весьма
ограниченных возможностях вариаций запросов — так называемые информационные
системы руководителя (Exequtive Information system EIS);
динамические — обеспечивают обработку нерегламентированных запросов и гибкую
систему подготовки отчетов.
Статические
ИАС при всей кажущейся
Зачастую полученная в отчетах информация порождает вытекающие из ее содержания вопро-
сы, на которые в допустимое время ответ не может быть получен.
Динамические
ИАС предназначены для
ожиданных (ad hoc) запросов. Пользователи системы работают с такой ИАС в интерактивном
режиме. Обрабатывается
серия непредусмотренных
ходе полготовки и принятия решения. Заранее может быть подготовлена некоторая цепочка
действий или сценарий, который может корректироваться.
Поддержка принятия управленческих решений осуществляется в следующих режимах
или базовых сферах (23):
– сфера детализированных данных;
– сфера агрегированных показателей;
– сфера закономерностей.
В сфере детализированных данных подсистемы ИАС или автономные ИС нацелены на
поиск данных. Эту задачу отлично выполняют реляционные СУБД. В качестве языка манипули-
рования данными, ставшего стандартным, используется, как правило, SQL. Для поиска детали-
зированной информации используются информационно-поисковые системы, которые могут ра-
ботать с операционными, локальными или региональными базами и хранилищами данных, а
также и совместно с центральным ИХ.
Сфера агрегированных показателей отличается агрегацией данных, оперативной ана-
литической обработкой, многомерным представлением в виде гиперкубов, многомерным ана-
лизом. В этой сфере используются специальные многомерные СУБД. Допустимо использование
реляционных представлений данных. При правильном применении реляционных СУБД, показа-
тели эффективности ИАС сопоставимы со специализированными многомерными. Агрегирован-
ные массивы
при реляционном подходе
других. Агрегация может производиться также «на лету» при обработке запроса.
Анализ детализированных данных и агрегированных показателей относится к оператив-
ному или OLAP-анализу.
Сфера закономерностей связана или основана на интеллектуальной обработке дан-
ных. Главной
задачей здесь выступает
взаимосвязей
и взаимовлияния различных
прогноз хода различных существенных процессов. Эта сфера относится к интеллектуальному
анализу (Data mining).
Оперативный анализ — это функция ИАС, обеспечивающая быстрый, в соответст-
вии с правилами FASMI, доступ к любой необходимой информации, содержащей-
ся в ИХ или, точнее в факт-таблице, представляемой также в виде многомерного
куба (на практике трехмерных комбинаций кубов). Извлечение информации, как
правило, сопровождается обработкой ее по несложным алгоритмам, как то:
производится суммаризация, определение процентов от заданных величин, полу-
чение относительных показателей, вычисление величин с заданными коэффициен-
тами и другие действия над данными на разных уровнях детализации. Анализ про-
изводится с данными, представленными в виде электронных таблиц, над которыми
предоставляется возможность оперативно производить различные более сложные
вычисления.
Извлечение необходимой информации для построения отчетов производится путем ис-
пользования ряда процедур.
К ним относятся:
− сечение или срез (slice and dice) — извлечение данных из факт-таблицы по каким-либо
определенным значениям одного или нескольких измерений, например из гипер-куба
(факт-таблицы), содержащей сведения об издержках; в отчет (раздел отчета) помещают
данные только по какому-либо одному виду или группе издержек;
− поворот, под которым понимают изменение координат, их порядка или добавление из-
мерений; эта процедура обеспечивает замену в готовом отчете «Издержки», к примеру,
аргумента — время на регионы или центры затрат; если рассматривалась взаимозави-
симость «возраст — семейное положение» то можно в качестве аргумента брать любое
из этих измерений и менять их местами;
− свертка (drill up) — агрегируются данные по заданным признакам и алгоритмам; можно
группировать необходимые данные, содержащиеся в ИХ в детальном виде; так при за-
несении сведений в операционную БД ежесуточно в ИХ их можно передавать в агреги-
рованном виде — еженедельно или ежемесячно, соответственно агрегированные данные
можно помещать в отчеты;
− развертка или раскрытие (roll up) — процедура, обратная свертке, данные детализиру-
ются, например группы товаров представляются по конкретным товарам, более круп-
ные временные периоды разбиваются на мелкие и т.д.
− создание кросс-таблиц — то есть совмещение данных из разных таблиц по заданным
признакам; например создается отчет, в котором сводятся данные об издержках и вы-
ручке по одним и тем же изделиям и временным периодам;
− проекция — конструирование отчетов, являющихся подмножествами из множества единичных
реквизитов или атрибутов, содержащихся в операционных базах или в ИХ;
− построение трендов — зависимость числовых или качественных значений показателя от
тех или иных параметров, например времени, технологии и т.д.
Многомерные OLAP-системы
В многомерных СУБД данные организованы не в виде реляционных таблиц, а в виде
упорядоченных многомерных массивов в виде гиперкубов, когда все хранимые данные должны
иметь одинаковую размерность, что означает необходимость образовывать максимально пол-
ный базис измерений. Данные могут быть организованы в виде поликубов, в этом варианте
значения каждого показателя хранятся с собственным набором измерений, обработка данных
производится собственным инструментом системы. Структура хранилища в этом случае упро-
щается, так как отпадает необходимость в отдельной зоне хранения данных в многомерном
или объектно-ориентированном виде. Снижаются огромные трудозатраты на создание реляци-
онных моделей и систем преобразования данных из реляционной модели в объектную (см. рис.
3.1).
Достоинствами MOLAP являются:
− более быстрое, чем при ROLAP получение ответов на запросы — затрачиваемое время
на один-два порядка меньше;
− из-за ограничений SQL затрудняется реализация многих встроенных функций.
К ограничениям MOLAP относятся:
− сравнительно небольшие размеры баз данных — предел десятки Гигабайт,
− за счет денормализации и предварительной агрегации многомерные массивы использу-
ют в 2,5-100 раз больше памяти, чем исходные данные (расход памяти при увеличении
числа измерений растет по экспоненциальному закону);
− отсутствуют стандарты на интерфейс и средства манипулирования данными;
− имеются ограничения при загрузке данных.
Реляционные OLAP-системы
В настоящее время в массовых средствах, обеспечивающих аналитическую работу,
преобладает использование инструментов на основе реляционного подхода. Структура храни-
лища остается в том виде, как представлено на рис. 3.1. Трудозатраты на создание зоны мно-
гомерных данных резко увеличиваются, так как практически отсутствуют в этой ситуации спе-
циализированные средства объективизации реляционной модели данных, содержащихся в ин-
формационном хранилище. Время отклика на запросы часто не может уложиться в рамки тре-
бований к OLAP-системам.
Достоинствами ROLAP-систем являются:
− возможность оперативного анализа непосредственно содержащихся в хранилище дан-
ных, так как большинство исходных баз данных — реляционного типа;
− при переменной размерности задачи выигрывают ROLAP, так как не требуется физиче-
ская реорганизация базы данных;
− ROLAP-системы могут использовать менее мощные клиентские станции и серверы, в ви-
ду того, что на серверы ложится основная нагрузка по обработке сложных SQL-
запросов;
− уровень защиты информации и разграничения прав доступа в реляционных СУБД не-
сравненно выше, чем в многомерных.
Недостатком ROLAP-систем является меньшая производительность, необходимость тща-
тельной проработки
схем базы данных, специальная настройка индексов
запросов и учет выводов анализа при доработках схем баз данных, что приводит к значитель-
ным дополнительным трудозатратам.
Выполнение же этих условий позволяет при использовании ROLAP-систем добиться схо-
жих с MOLAP-системами показателей в отношении времени доступа, а также превзойти в эко-
номии памяти.
Гибридные OLAP-системы
Представляют собой сочетание инструментов, реализующих реляционную и многомерную
модель данных. Структура хранилища остается в основном такой же, как на рис. 3.1, однако
зона многомерных данных создается специализированными средствами. Это позволяет резко
снизить затраты ресурсов на создание и поддержание такой зоны, время отклика на запросы, в
том числе незапланированные резко снижается, выполняются требования к OLAP-системам.
При таком подходе используются достоинства первых двух подходов и компенсируются
их недостатки. В наиболее развитых программных продуктах такого назначения реализован
именно этот принцип.
Использование гибридной архитектуры в OLAP-системах — это наиболее приемлемый
путь решения проблем, связанных с применением программных инструментальных средств в
многомерном анализе.
Тем не менее встречаются обстоятельства, когда применение ROLAP— и HOLAP-cистем
становится невозможным из-за чрезвычайно жестких требований со стороны объектов управ-
ления или соответственно контролируемых процессов. Такие ситуации характерны для крупных
промышленных, транспортных, энергетических комплексов, на финансовых рынках, при управ-
лении объектами в критических ситуациях или их моделировании.
Для такого класса применения ИАС становится безальтернативным применение много-
мерных или
объектно-ориентированных
К специфическим методам интеллектуального анализа относятся:
— методы нечеткой логики;
— системы рассуждений на основе аналогичных случаев;
— классификационные
и регрессионные деревья
— нейронные сети;
— генетические алгоритмы;
— байесовское обучение (ассоциации);
— кластеризация и классификация;
— эволюционное программирование;
— алгоритмы ограниченного перебора.
Методы нечеткой логики используются для описания плохо формализуемых объектов из
состава «мягких» знаний. Над ними также совершаются мягкие вычисления. Используется поня-
тие «лингвистическая переменная», значения которой определяются через нечеткие множества,
а они представляются базовым набором значений или базовой числовой шкалой.
Системы рассуждений на основе аналогичных случаев case based reasoning (CBR) осно-
ваны на том, что принятие решения осуществляется по прецеденту, наиболее подходящему к
данной ситуации с учетом определенных корректив. Иногда решение принимается на основе
учета всех примеров,
находящихся в хранилище
Деревья решений основаны на иерархической древовидной структуре классифицирующих
правил. Решения об отнесении того или иного объекта или ситуации к соответствующему классу
принимается по ответам на вопросы, стоящие в узлах дерева. Положительный ответ означает пе-
реход к правому узлу следующего уровня, отрицательный — к левому узлу. Процесс разделения
продолжается до полного ответа на все поставленные вопросы.
Нейронные сети — это упрощенная аналогия нервной системы живого организма. Раз-
работаны модели нейронных сетей. Распространенной моделью является многослойный пер-
септрон с обратным распространением ошибки. Нейроны работают в составе иерархической
сети, в которой нейроны нижележащего слоя своими выходами соединены с входами нейронов
вышележащего слоя. На нейроны нижнего слоя подаются значения входных параметров, кото-
рые являются сигналами, те передаются в следующий слой. При этом они ослабляются или
усиливаются в зависимости от числовых значений, которые придаются межнейронным связям,
называемых весами. На выходе нейрона верхнего слоя вырабатывается сигнал, являющийся
ответом сети на введенные значения входных параметров. Для получения необходимых значе-
Информация о работе Классификация IT-анализа по режиму и темпу