Курс лекций по "Информационные системы"

Автор работы: Пользователь скрыл имя, 28 Декабря 2011 в 18:35, курс лекций

Краткое описание

9. Свойства ИС

Информационная система - взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки, выдачи информации в интересах достижения поставленной цели.

Содержимое работы - 1 файл

Информационные системы.doc

— 400.00 Кб (Скачать файл)

      Информационно - решающие системы.

      В таких ИС по результатам поиска вычисляют  значения арифметических функций. Осуществляют все операции переработки информации по определенному алгоритму. Среди  них можно провести классификацию по степени воздействия выработанной совместной результатной информации на процесс принятия решений и выделить два класса: управляющие и советующие.

      Управляющие ИС - информационные системы 

      Информационно-управляющие, или управленческие, системы (известные в отечественной литературе под названием «автоматизированной системы организационные управления») представляют собой организационно-технической системы, которые обеспечивают получение решения на основе автоматизации информационных процессов в сфере управления, на основе которой человек принимает решение. Итак, они предназначены для автоматизированного решения широкого круга задач управления.

      Для этих систем характерны тип задач  расчетного характера и обработка  больших объемов данных. Примером могут служить система оперативного планирования выпуска продукции, система бухгалтерского учета.

      Советующие  ИС

      Вырабатывают  информацию, которая принимается  человеком к сведению и не превращается немедленно в серию конкретных действий. Эти системы обладают более высокой степенью интеллекта, так как для них характерна обработка знаний, а не данных.  
 

 

Тема 5 

      2. Информационно-поисковый  язык 

      Информационно-поисковый  язык (ИПЯ) - искусственный язык, предназначенный для формализованного описания смыслового содержания документов, данных, отдельных понятий или терминов и обеспечения последующего их поиска в информационно-поисковых массивах.

      Формализация  лексики и создание различных  ИПЯ вызвано необходимостью устранения "избыточности" и "недостаточности" естественного языка для целей информационного поиска, а также ликвидации присутствующий в нем синонимии и омонимии (см. ниже) для реализации "однозначности" информационного поиска.

      Различают языки описания (декларативные языки ), которые в свою очередь подразделяются на языки предкоординатные (классификационные) и посткоординатные (координатные), а также - процедурные языки (языки запросов и манипулирования данными )..

      Каждый  тип языковых средств включает в  себя: алфавит и микро синтаксис (графические средства представления данных), лексику с парадигматикой (отражаемых словарями) и синтаксис, который для языков описания может быть представлен в виде наборов форматов.

      По  области или по сфере применения информационно-поисковых языков можно  выделить:

      1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

      2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

      3. Внешние ИПЯ - используемые в  других системах и предназначенные  для взаимодействия только с  ними. 
 

      9. Методы семантического  поиска 

      В последнее время в технологии поиска все чаще стали внедряться элементы контент-анализа, методологии возникших в конце XIX — начале ХХ вв. Эта методология, изначально ориентированная на применение в психологии и социологии, сегодня все чаще используется в разного типа автоматизированных системах. Различают количественный и качественный контент-анализ. Если качественный контент-анализ базируется на глубоком лингвистическом и семантическом анализе отдельных предложений и всего текста, то основой количественного контент-анализа являются статистические подходы.

      В последнее время получили развитие такие направления контент-анализа, как «Data Mining» и «Text Mining», которые  предполагают автоматическое выявление  нового смысла из текстовых массивов, новых данных, феноменов, фактов —  знаний. Все чаще возникают попытки привлечения методов контент-анализа, а точнее Text Mining в реальные поисковые системы. И эти попытки не умозрительны — они обусловлены объемами и темпами роста Сети. Во многие современные сетевые поисковые системы внедрены такие компоненты, как:

    • автоматическая группировка документов, по определенному заранее классификатору;
    • автоматическое определение новых, не заданных заранее классов, на основе неструктурированных или слабо структурированных документов;
    • ранжирование документов по смысловой релевантности;
    • выявление семантически подобных документов — поиск подобных документов на основе эталона;
    • автоматический анализ и смысловое преобразование запросов пользователей.

      При методе семантического поиска процесс поиска документов происходит по их содержанию.

      Условия семантического поиска таковы:

    • Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
    • Составление поискового описания, в котором указывается дополнительное условие поиска.

      Принципиальная  разница между адресным и семантическим  поисками состоит в том, что при  адресном поиске документ рассматривается  как объект с точки зрения формы, а при семантическом поиске — с точки зрения содержания.

      При семантическом поиске находится  множество документов без указания адресов. В этом принципиальное отличие каталогов и картотек. 

 

Тема 6 

      2. Диаграмма «сущность  - связь». 

      Очень важным свойством модели "сущность-связь" является то, что она может быть представлена в виде графической схемы. Это значительно облегчает анализ предметной области. Существует несколько вариантов обозначения элементов диаграммы "сущность-связь", каждый из которых имеет свои положительные черты. Здесь мы будем использовать некий гибрид нотаций Чена (обозначение сущностей, связей и атрибутов) и Мартина (обозначение степеней и кардинальностей связей). В таблице 1 приводится список используемых здесь обозначений.

      Таблица 1

Обозначение Значение
Набор независимых  сущностей
Набор зависимых  сущностей
Атрибут
Ключевой атрибут
Набор связей
 

      Атрибуты  с сущностями и сущности со связями  соединяются прямыми линиями.

      В процессе построения диаграммы можно выделить несколько очевидных этапов:

  1. Идентификация представляющих интерес сущностей и связей.
  2. Идентификация семантической информации в наборах связей (например, является ли некоторый набор связей отображением 1:n).
  3. Определение кардинальностей связей.
  4. Определение атрибутов и наборов их значений (доменов).
  5. Организация данных в виде отношений "сущность-связь".

      В качестве примера построим диаграмму, отображающую связь данных для подсистемы учета персонала предприятия.

      Выделим интересующие нас сущности и связи:

  1. Прежде всего преприятие состоит из отделов, в которых работают сотрудники. Оклад каждого сотрудника зависит от занимаемой им должности (инженер, ведущий инженер, бухгалтер, уборщик и т.д.). Далее предположим, что на нашем предприятии допускается совместительство должностей, т.е. каждый сотрудник может иметь более чем одну должность (и работать более чем в одном отделе), причем может занимать неполную ставку. В то же время, одну и ту же должность могут занимать одновременно несколько сотрудников. В результате этих рассуждений мы должны ввести наборы сущностей
    • ОТДЕЛ(ИМЯ_ОТДЕЛА),
    • СОТРУДНИК(ТАБЕЛЬНЫЙ_НОМЕР, ИМЯ),
    • ДОЛЖНОСТЬ(ИМЯ_ДОЛЖНОСТИ, ОКЛАД),

      и набор связей РАБОТАЕТ_В с атрибутом  ставка между ними. Атрибут ставка может принимать значения из интервала ]0,1] (больше нуля, но меньше или равен единице), он определяет какую часть должностного оклада получает данный сотрудник.

      Как уже отмечалось выше, каждый n-арный набор связей можно заменить несколькими бинарными наборами. Сейчас как раз представляется удобный случай, чтобы оценить преимущества каждого из этих способов представления связей.

      - Тренарная связь, показанная здесь, безусловно несет более полную информацию о предметной области. Действительно, она однозначно отображает тот факт, что оклад сотрудника зависит от его должности, отдела, где он работает, и ставки. Однако, в этом случае возникают некоторые проблемы с определением степени связи. Хотя, как было сказано, каждый работник может занимать несколько должностей, а в штате каждого отдела существуют вакансии с различными должностями, тем не менее класс принадлежности сущности ДОЛЖНОСТЬ на приведенном рисунке установлен в (1,1). Это объясняется тем, что ДОЛЖНОСТЬ ассоциируется фактически не с сущностями СОТРУДНИК и ОТДЕЛ, а со связью между ними. Обозначать этот факт предлагается так, как это показано на следующей диаграмме:

 

      Здесь сущности СОТРУДНИК, ОТДЕЛ и связь  РАБОТАЕТ_В агрегируются в некую  новую абстрактную сущность, которая  ассоциируется с сущностью ДОЛЖНОСТЬ  с помощью связи степени n:1.

      - Попытаемся отобразить ассоциации сотрудников, отделов и должностей с помощью бинарных связей.

        

      В этом случае для адекватного описания семантики предметной области необходимо ввести еще одну сущность ШТАТНАЯ_ЕДИНИЦА, которая фактически заменяет собой связь РАБОТАЕТ_В в абстрактной сущности и поэтому имеет атрибут ставка.

      Переход от n-арной связи через аггрегацию сущностей к набору бинарных связей можно рассматривать как последовательные этапы одного процесса, который приводит к однозначному порождению реляционной модели данных. При построении диаграммы "сущность- связь" можно использовать любой из этих трех способов представления данных.

  1. Перечисли ряд объектов, описанных в предыдущем праграфе, которые будут полезны при моделировании данных рассматриваемого предприятия. Им соответствуют следующие сущности:
    • ЗАКАЗЧИК(ИМЯ_ЗАКАЗЧИКА,АДРЕС)
    • КОНТРАКТ(НОМЕР,СРОК_НАЧАЛА,СРОК_ОКОНЧАНИЯ,СУММА)
    • РАБОЧАЯ ГРУППА(ПРОЦЕНТ_ВОЗНАГРАЖДЕНИЯ)

      Атрибут "процент_вознаграждения" отражает ту долю стоимости контракта, которая предназначена для оплаты труда членов соответствующей рабочей группы. Смысл остальных атрибутов понятен без дополнительных пояснений.

      Как правило, один из членов рабочей группы является руководителем по отношению к другим сотрудникам, входящим в ее состав. Для отражения этого факта мы должны ввести связь "руководит" с кардинальностью 1,1:0,n между сущностями СОТРУДНИК и РАБОЧАЯ_ГРУППА (сотрудник может руководить в произвольном числе рабочих групп, но каждая рабочая группа имеет одного и только одного руководителя).

  1. Рассмотрим теперь более внимательно информационный объект "заказчик". На практике очень часто возникает необходимость различать национальную прнадлежность юридических лиц, с которыми предприятие вступает в договорные отношения. Это свзано с тем, что для зарубежных фирм необходимо хранить, например, сведения о валюте, в которой осуществляются расчеты, языке, на котором подписан контракт и т.д. В свою очередь, для отечественных компаний необходимо иметь сведения о их форме собственности (частная или государственная), поскольку от этого может зависеть порядок налогообложения средств, полученных за выполнение работ по контракту.

Информация о работе Курс лекций по "Информационные системы"