Информационно-аналитическая система Internet Analyst

Автор работы: Пользователь скрыл имя, 26 Сентября 2011 в 01:52, контрольная работа

Краткое описание

Управление любым бизнесом основано на постоянном сборе и анализе информации, необходимой для принятия своевременных решений. Качество управления напрямую зависит как от полноты исходной информация, так и от глубины ее анализа.

Содержание работы

1. ВВЕДЕНИЕ 3
2. ФУНКЦИОНАЛЬНАЯ СТРУКТУРА СИСТЕМЫ 4
2.1. ПОЛУЧЕНИЕ И ПЕРВИЧНАЯ ОБРАБОТКА ИНФОРМАЦИИ 5
2.1.1. Получение информации из источников и ее очистка 5
2.1.2. Рубрикация информации 7
2.1.3. Создание рубрикаторов экспертами. Авто-рубрикация 9
2.1.4. Расширение рубрикатора пользователями. Персональные профили 10
2.1.5. Рубрикатор как средство мониторинга. Рассылка документов 11
2.2. ВЫБОРКА ИНФОРМАЦИИ. РАБОТА С КОНТЕКСТОМ 12
2.2.1. Поиск документов в Internet Analyst 13
2.2.2. Поиск известного (сужение контекста) 14
2.2.3. Поиск неизвестного (расширение контекста) 16
2.2.4. Поиск связей (пересечение контекстов) 18
2.2.5. Использование временных рядов 19
2.3. АНАЛИЗ РЕЗУЛЬТАТОВ И ПОДГОТОВКА ОТЧЕТНОСТИ 21
2.3.1. Выявление фактов 21
2.3.2. Подсветка ключевых и контекстных терминов 22
2.3.3. Аннотирование документов 22
2.3.4. Выявление дубликатов 23
2.3.5. Поиск похожих документов 25
2.3.6. Работа с Корзиной и подготовка итогового Отчета 26

Содержимое работы - 1 файл

Контрольная работа.doc

— 1.11 Мб (Скачать файл)

     Например: существует контекст «Александр Семеняка» - известный управленец, работавший на различных позициях в компании Газпром, и контекст «Ипотечное кредитование», содержащий документы по данной тематике. Между этими двумя контекстами существует соединяющий контекст «АИЖК» (в настоящий момент Александр Семеняка является генеральным директором компании АИЖК). Internet Analyst позволяет выявлять связи между различными объектами за счет выявления связующих контекстов (рис. 14). 

     Рис. 14. Соединяющий контекст 

     Как видно на рисунке (рис. 15) , в запросе  задано два различных контекста («Александр Семеняка» и «Ипотечное кредитование») при выполнении запроса, в качестве контекстных подсказок выдаются контексты наиболее «сильно» связанные с указанными в запросе. Как видно на схеме наиболее явной связью между заданными объектами является компания АИЖК. 

     Рис. 15 Поиск связей 

     2.2.5. Использование временных рядов

     В системе Internet Analyst выборки документов можно представлять в виде временных рядов, показывающих каким образом документы распределены во времени. Это позволяет отслеживать информационные «всплески» и тренды в любых выборках выдаваемых системой.

     На  рисунке ниже, представлено временное  распределение документов по запросу  «Дилог-оптим» за 2004 год. Как видно  из графика, наиболее количество документов по данной теме было получено в июле (время кризиса банка Диалог-оптим) (рис. 16). 

     Рис. 16. Годовая динамика количества документов выборки. 

     При необходимости можно детализировать информацию о распределении документов с точностью до дня. Кроме того, непосредственно в окне диаграммы можно просмотреть отобразить наиболее характерные фразы, создающие «портрет дня» (месяца, года) в контексте данного запроса (рис. 17).

     Рис. 17. Месячная динамика количества документов выборки. 

     Непосредственно из временного ряда можно сделать  и запрос документов за определенный период (рис. 18). Например, если мы нашли интересное с нашей точки зрения событие и хотим выяснить все подробности. 

     Рис. 18. Документы, отобранные за определенный период. 

     2.3. Анализ результатов  и подготовка отчетности

     На  этом результирующем этапе эксперт  работает с документами из выборки, сформированной в ходе интерактивного уточнения запроса.

     2.3.1. Выявление фактов

     Панель  результатов системы Internet Analyst предоставляет  пользователю необходимый инструментарий для поиска фактической информации в документах из результирующей выборки.

     Для каждого документа выборки указывается:

    • Релевантность документа запросу
    • Заголовок документа
    • Источник документа
    • Дата создания документа (или его получения от источника)
    • Список категорий рубрикатора с указанием степени соответствия документа этой категории (документ может присутствовать в нескольких категориях рубрикатора или не принадлежать ни одной из них)
    • Набор наиболее насыщенных в контексте данного запроса фраз

     Выборку можно отсортировать как по релевантности, так и по дате документов (рис.  19).

Рис. 19. Список фактов 

     При нажатии на заголовок документа  в отдельном окне открывается  оригинал документа.

     Однако  пользователю нет необходимости  просматривать каждый документ целиком. Частично фактический материал можно просматривать прямо в Панели результатов. Это существенно экономит время при просмотре содержания выборки. 

     2.3.2. Подсветка ключевых  и контекстных  терминов

     Если  какой-то документ заинтересовал пользователя, его можно просмотреть, выделив  в тексте ключевые (и контекстные) слова. Это помогает быстро найти в документе пассажи, относящиеся к интересующему пользователя контексту. 

     2.3.3. Аннотирование документов

     Существует и другая возможность - выделить в документе предложения, содержащие основные мысли документа (безотносительно к запросу). Такая аннотация помогает пользователю быстро понять, о чем говорится в данном документе (рис. 20). 

     Рис. 20. Выделение важной информации (аннотирование  документа) 

     Обе описанных опции помогают просматривать  гораздо больше документов и находить в них фактическую информацию в несколько раз быстрее, чем при чтении документов целиком. Это особенно важно в условиях жесткого лимита времени, отведенного на подготовку аналитических отчетов и принятие решений. 

     2.3.4. Выявление дубликатов

     При работе с большим числом источников многие документы выборки могут освещать одно и то же событие, повторяя одну и ту же информацию зачастую почти дословно. Чтобы избавить экспертов от просмотра избыточной информации, в Internet Analyst реализован механизм выявления дубликатов (рис. 21).

     При наличии дубликатов, Система отображает лишь один из них, помечая количество дубликатов. При желании всегда можно просмотреть (аннотированный) текст всех дубликатов, например, чтобы понять разницу в освещении одних и тех же событий разными источниками. 

     Рис. 21. Выявление дубликатов. 

     В зависимости от регулируемых пользователем  настроек, дубликатами могут признаваться документы разной степени похожести. 
 
 

     2.3.5. Поиск похожих  документов

     При работе с документами зачастую возникает  необходимость в получении дополнительной информации - «поднять архивы» по данному вопросу. Система Internet Analyst предоставляет возможность выбрать из Хранилища данных все документы похожие по содержанию на заинтересовавший эксперта документ (рис. 22). 

     Рис. 22. Поиск похожих документов. 

     2.3.6. Работа с Корзиной  и подготовка итогового  Отчета

     Незаменимым инструментом для подготовки итогового  отчета является Корзина. В нее по мере работы можно складывать все документы, содержащие ту или иную информацию, которая должна быть отражена в отчете (рис. 23).

     Корзина может накапливать документы  из разных поисковых сессий, аккумулируя  самые важные результаты из различных выборок, имеющих отношение к данной проблеме. В нее можно поместить любой найденный Системой документ, например, полученный при анализе временных рядов.

     Когда в Корзине будет собран весь необходимый  для подготовки отчета материал, эксперт может начать его обработку и осмысление в соответствующей панели. Для этого в Корзине предусмотрены сортировка документов по датам, удаления ненужных, и, главное - возможность выгрузить все документы корзины в MS Word. 

     Рис. 23. Работа с корзиной.

     Итоговый  документ MS Word представляет собой компиляцию всех отобранных документов с подчеркнутыми Системой наиболее содержательными фразами. Его можно распечатать для дальнейшего ознакомления с предметом (например в транспорте по пути на переговоры), отослать по электронной почте или использовать в качестве «полуфабриката» для его дальнейшей переработки в аналитический отчет.

     Например, в итоговом документе можно оставить лишь отрывки, содержащие необходимую для отчета информацию (со ссылками на первоисточники), отсортировать их в нужной последовательности, снабдить собранный фактический материал своими комментариями и соответствующими выводами.

     Стартуя с содержащего всю фактическую  информацию «полуфабриката» эксперт радикально ускоряет работу над итоговым отчетом и минимизирует риск что-нибудь упустить или оставить без внимания некоторые факты.

Информация о работе Информационно-аналитическая система Internet Analyst