Автор работы: Пользователь скрыл имя, 26 Сентября 2011 в 23:37, лекция
Интеллектуальный анализ данных (англ. Data Mining) — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [1] . Подразделяется на задачи классификации, моделирования и прогнозирования, распознавания и др.
Интеллектуальный анализ данных (англ. Data Mining) — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [1] . Подразделяется на задачи классификации, моделирования и прогнозирования, распознавания и др.
Одна из главных тенденций на рынке учетно-управленческих систем - постоянное повышение спроса на применение средств аналитической обработки данных, обеспечивающих принятие обоснованных решений. Характерный пример: система ПО "1С:Предприятие" с постоянным расширением возможностей экономической и аналитической отчетности. Однако сегодня заказчикам уже недостаточно традиционных инструментов, позволяющих формировать разнообразные отчеты, сводные таблицы и диаграммы, которые создаются на основе заранее определенных показателей и связей и которые можно анализировать вручную. Предприятиям все чаще нужны качественно иные средства, позволяющие автоматически искать неочевидные правила и выявлять неизвестные закономерности (рис. 1). Именно так можно генерировать качественно новые знания на основе накопленной информации и принимать нетривиальные решения для повышения эффективности экономической или хозяйственной деятельности, применяя методы интеллектуального анализа данных (ИАД).
Рис. 1. Логика развития "интеллектуальности" решаемых аналитических задач. |
Выпуск летом
2003 г. новой версии технологической
платформы "1С:Предприятие 8.0" позволил
существенно расширить
Механизм
ИАД представляет собой набор
взаимодействующих друг с другом
объектов встроенного языка, благодаря
чему разработчик может использовать
его составные части в
Рис.
2. Общая схема функционирования
механизма интеллектуального |
В текущей версии подсистемы реализованы методы, получившие наибольшее коммерческое распространение в мировой практике, а именно:
Рассмотрим суть и возможности практического применения этих методов ИАД.
Кластеризация
Цель кластеризации - выделение из множества объектов одной природы некоторого количества относительно однородных групп (сегментов или кластеров). Объекты распределяются по группам таким образом, чтобы внутригрупповые отличия были минимальными, а межгрупповые - максимальными (рис. 3). Методы кластеризации позволяют перейти от пообъектного к групповому представлению совокупности произвольных объектов, что существенно упрощает оперирование ими. Ниже описаны несколько возможных сценариев применения кластеризации на практике.
Сегментация клиентов по определенной совокупности параметров позволяет выделить среди них устойчивые группы, имеющие сходные покупательские предпочтения, уровни продаж и платежеспособности, что значительно упрощает управление взаимоотношениями с клиентами.
При классификации товаров очень часто используются достаточно условные принципы классификации. Выделение сегментов на основе группы формальных критериев позволяет определить действительно однородные группы товаров. В условиях широкой и довольно разнородной номенклатуры товаров управление ассортиментом на уровне сегментов по сравнению с управлением на уровне номенклатуры существенно повышает эффективность продвижения, ценообразования, мерчендайзинга, управления цепочками поставок.
Сегментация менеджеров позволяет эффективнее спланировать организационные изменения, улучшить мотивационные схемы, скорректировать требования к нанимаемому персоналу, что в конечном счете позволяет повысить управляемость компании и стабильность бизнеса в целом.
факторов. Способ измерения расстояния зависит от метрики, которая указывает принцип определения сходства/различия между объектами выборки. Текущая реализация поддерживает следующие метрики:
Способ формирования кластеров на основе информации о расстоянии между кластеризуемыми объектами определяется методом кластеризации. Например,в текущей версии "1С:Предприятие 8.0" реализованы следующие методы кластеризации:
Любой из реализованных
в платформе методов
В результате
анализа с помощью
Алгоритмы кластеризации позволяют не только провести кластерный анализ объектов на множестве заданных атрибутов, но и спрогнозировать значение одного или нескольких из них для актуальной выборки на основании отнесения объектов этой выборки к тому или иному кластеру.
Поиск ассоциаций
Этот метод предназначен для выявления устойчивых комбинаций элементов в определенных событиях или объектах. Результаты анализа представляются в виде групп ассоциированных элементов. Здесь же, помимо выявленных устойчивых комбинаций элементов, приводится развернутая аналитика по ассоциированным элементам.
Применительно к этому сценарию в качестве ассоциируемых элементов, как правило, выступают товарные группы или отдельные товары. А группирующим объектом, объединяющим элементы выборок, может быть любой объект информационной системы, идентифицирующий сделку: например, заказ покупателя, акт об оказании услуг или кассовый чек.
Информация
о закономерностях в товарных
предпочтениях покупателей
Дерево решений
В результате
применения этого метода к исходным
данным создается иерархическая (древовидная)
структура правил вида "если... то...",
а алгоритм анализа обеспечивает
вычленение на каждом этапе наиболее
значимых условий и переходов
между ними. Данный алгоритм получил
наибольшее распространение при
выявлении причинно-
Алгоритм "Дерево
решений" формирует причинно-
Распознавание образов
Роль распознавания образов при обработке данных. Цель и задачи РО, краткие исторические сведения о развитии методов распознавания образов. Общая характеристика проблемы распознавания объектов и явлений. Понятие образа. Качественное описание задачи распознавания образов. Типы задач распознавания и их характерные черты. Структура системы распознавания образов. Задача распознавания образов как одна из задач анализа даннях
Основные
задачи, возникающие при разработке
систем распознавания. Понятия
об алфавите классов, словаре признаков,
описании классов на языке признаков,
априорной и апостериорной
ЛИТЕРАТУРА
Рузайкин Г.И. Орудие Data Mining: успех в анализе данных // Мир ПК, 1997. - № 1. - С. 102-103.
Аркадьев А. Г., Браверман Э. М. Обучение машины классификации объектов. — М., 1971. — 192 с.
Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания. М.: Радио и связь, 1985, 160 с.
Бонгард М.М. Проблема узнавания. - М.: Наука, 1967.- 320 с.
Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: Наука, 1974.- 415 с.
Информация о работе Интеллектуальный анализ данных. Интеллектуальные технологии