Автор работы: Пользователь скрыл имя, 26 Сентября 2011 в 01:52, контрольная работа
Управление любым бизнесом основано на постоянном сборе и анализе информации, необходимой для принятия своевременных решений. Качество управления напрямую зависит как от полноты исходной информация, так и от глубины ее анализа.
1. ВВЕДЕНИЕ 3
2. ФУНКЦИОНАЛЬНАЯ СТРУКТУРА СИСТЕМЫ 4
2.1. ПОЛУЧЕНИЕ И ПЕРВИЧНАЯ ОБРАБОТКА ИНФОРМАЦИИ 5
2.1.1. Получение информации из источников и ее очистка 5
2.1.2. Рубрикация информации 7
2.1.3. Создание рубрикаторов экспертами. Авто-рубрикация 9
2.1.4. Расширение рубрикатора пользователями. Персональные профили 10
2.1.5. Рубрикатор как средство мониторинга. Рассылка документов 11
2.2. ВЫБОРКА ИНФОРМАЦИИ. РАБОТА С КОНТЕКСТОМ 12
2.2.1. Поиск документов в Internet Analyst 13
2.2.2. Поиск известного (сужение контекста) 14
2.2.3. Поиск неизвестного (расширение контекста) 16
2.2.4. Поиск связей (пересечение контекстов) 18
2.2.5. Использование временных рядов 19
2.3. АНАЛИЗ РЕЗУЛЬТАТОВ И ПОДГОТОВКА ОТЧЕТНОСТИ 21
2.3.1. Выявление фактов 21
2.3.2. Подсветка ключевых и контекстных терминов 22
2.3.3. Аннотирование документов 22
2.3.4. Выявление дубликатов 23
2.3.5. Поиск похожих документов 25
2.3.6. Работа с Корзиной и подготовка итогового Отчета 26
Федеральное агентство по образованию
Филиал Санкт-Петербургского государственного
инженерно-экономического
университета в г. Череповце
Кафедра
естественнонаучных дисциплин
Контрольная
работа
По дисциплине «Информационные системы в экономике»
Тема
№ 14: «Информационно-аналитическая
система Internet Analyst»
Студента 3 курса
Группы 2ФКП-06
Саввина
А.М.
Череповец
2008
СОДЕРЖАНИЕ:
1. ВВЕДЕНИЕ 3
2. ФУНКЦИОНАЛЬНАЯ СТРУКТУРА СИСТЕМЫ 4
2.1. ПОЛУЧЕНИЕ И ПЕРВИЧНАЯ ОБРАБОТКА ИНФОРМАЦИИ 5
2.1.1.
Получение информации из
2.1.2. Рубрикация информации 7
2.1.3.
Создание рубрикаторов
2.1.4.
Расширение рубрикатора
2.1.5.
Рубрикатор как средство
2.2. ВЫБОРКА ИНФОРМАЦИИ. РАБОТА С КОНТЕКСТОМ 12
2.2.1. Поиск документов в Internet Analyst 13
2.2.2. Поиск известного (сужение контекста) 14
2.2.3. Поиск неизвестного (расширение контекста) 16
2.2.4.
Поиск связей (пересечение контекстов)
2.2.5.
Использование временных рядов
2.3. АНАЛИЗ
РЕЗУЛЬТАТОВ И ПОДГОТОВКА
2.3.1. Выявление фактов 21
2.3.2.
Подсветка ключевых и
2.3.3.
Аннотирование документов
2.3.4. Выявление дубликатов 23
2.3.5.
Поиск похожих документов
2.3.6.
Работа с Корзиной и
1. Введение
Управление любым бизнесом основано на постоянном сборе и анализе информации, необходимой для принятия своевременных решений. Качество управления напрямую зависит как от полноты исходной информация, так и от глубины ее анализа.
При этом должны учитываться как внутренние факторы бизнеса, так и параметры внешней бизнес среды, т.е. необходимую для принятия решений информацию можно разделить на две категории:
Причем, характер информации о внешних и внутренний объектах бизнеса качественно различается. Это обусловлено как степенью нашего влияния на источники информации, так и степенью ее структурированности.
Информация о внутренних объектах организации является структурированной (все объекты имеют соответствующие им наборы формальных атрибутов) и контролируемой (мы сами можем определять ее структуру, формат и источники). Это позволяет организовать ее систематический учет и анализ с помощью различных модулей систем класса ERP и CRM.
Информация о внешних объектах, напротив неструктурированна (представлена в виде текстов на естественном языке, рассчитанных на восприятие человеком, а не машиной) и неконтролируема (ее формат, место и время появления определяется не нами). Оба этих обстоятельства чрезвычайно затрудняют создание автоматических систем для систематического учета и анализа внешней информации, аналогичных по своим возможностям ERP системам.
Между тем, количество информации в открытых источниках так велико, что ее просто невозможно обработать и систематизировать без специализированных инструментов, помогающих выделить в информационном потоке информацию, критически важную для ведения каждого конкретного бизнеса. В итоге, решения принимаются на основе неполной информации, что оборачивается для бизнеса потерями из-за упущенных возможностей и не замеченных вовремя угроз.
Непрерывный процесс систематического мониторинга, обработки и анализа информации из внешних источников, позволяет осуществить специализированная информационная система - Internet Analyst. Это программа позволяет без особых усилий:
Система
Internet Analyst является информационным «фильтром»,
который позволит охватив весь объем доступной
внешней информации, выбрать самое необходимо
и важное для обеспечения процесса принятия
решений (Рис. 1).
Рис. 1. Применение
системы Internet Analyst
2. Функциональная структура системы
Внешняя информация в ходе ее получения и переработки в системе Internet Analyst
проходит три стадии:
Ниже
мы рассмотрим содержание всех трех этапов
более подробно.
2.1. Получение и первичная обработка информации
Цель данного этапа - получение необходимой информации, ее очистка, сортировка, рассылка и архивация.
Последовательно решаются следующие задачи:
2.1.1. Получение информации из источников и ее очистка
Система
Internet Analyst позволяет полностью
Рис. 2. Получение
и очистка информации
Модуль очистки производит извлечение содержательной информации из поступающих в различных форматах документов. А именно:
Для работы Модуля очистки в ходе внедрения системы разрабатываются сценарии очистки (различные для различных источников), которые, при необходимости, могут изменяться в процессе эксплуатации.
На
рисунке (рис. 3.) приведен вид документа
до, и после его обработки модулем
очистки.
Рис. 3. Документ,
обработанный модулем очистки
2.1.2. Рубрикация информации
Для удобства работы с большим количеством документов, получаемых из внешних источников, полезно сразу же по поступлении в систему разбивать их по темам корпоративного рубрикатора. Структура последнего определяется на этапе внедрения и отражает основные темы или субъекты рынка, мониторинг которых необходим для понимания внешней ситуации.
В
зависимости от своего содержания,
какие-то документы могут попасть
одновременно в несколько рубрик, а какие-то
не попасть ни в одну из них. Таким образом
происходит «фильтрация» информации и
снижение уровня информационного шума
от внешних источников (Рис. 4.).
Рис.
4. Рубрикация информации
Например:
сообщение о назначении нового полномочного
представителя президента в регионе, может
относиться как к категории «Регионы/Полпреды»,
так и к категории «Макроэкономика и структурные
реформы» (Рис. 5).
Рис.
5. Размещение документа в нескольких
рубриках
Над
одним и тем же Хранилищем данных
можно развернуть несколько рубрикаторов,
так чтобы, например, каждое подразделение
фирмы видело свой специфический срез
внешней информации.
2.1.3. Создание рубрикаторов экспертами. Авто-рубрикация
Рубрикатор представляет собой иерархический набор информационных фильтров, которые формируются на этапе внедрения (а затем могут модифицироваться в процессе эксплуатации).
Фильтрация происходит с учетом атрибутов документов и их содержания. Содержание документов, в свою очередь, задается как обязательными фразами (и их сочетаниями), так и тематикой документа, определяемой произвольно большим списком контекстных терминов и словосочетаний, взвешенных в соответствии с их значимостью. Можно, например, отбирать все документы, в которых упоминается интересующая фирма или субъект (в любом варианте его написания). А можно отслеживать любые документы по определенной, причем весьма узкой, тематике.
Гибкое сочетание обязательных и контекстных терминов и словосочетаний позволяет производить точную настройку информационных фильтров.
Настройка рубрикатора производится экспертами совместно с предметными специалистами - пользователями Системы - на этапе ее внедрения. Создание рубрик кардинально упрощается тем, что происходит в диалоговом режиме, когда Система сама подсказывает эксперту понятия, уточняющие описание рубрики.
Для облегчения процесса создания больших рубрикаторов, в Системе предусмотрен Модуль кластеризации, способный автоматически строить тематические рубрикаторы. На вход этого модуля подается обучающий массив документов из заданной предметной области. Модуль автоматически организует эти документы в иерархическую систему кластеров, содержащих документы со схожей тематикой. Сформированная таким образом иерархическая структура тематик экспортируется в формате тематического рубрикатора и может быть загружена в Систему «как есть» или в качестве первого приближения для ее тонкой настройки экспертами (Рис. 6).
Информация о работе Информационно-аналитическая система Internet Analyst