Моделирование систем баз данных

Автор работы: Пользователь скрыл имя, 19 Декабря 2012 в 16:47, лекция

Краткое описание

База данных (БД) - это совокупность интегрированных, не дублированных и логически взаимосвязанных данных, организованных на машинном носителе средствами СУБД в соответствии со структурами данных и моделью, которые она поддерживает. Создание базы - определение её структуры, загрузка и корректировка данных, а также многоаспектный доступ обеспечиваются эффективными средствами СУБД. На основе данных из БД могут решаться все задачи ИС. БД, как правило, отражает некоторую логическую модель взаимосвязанных информационных объектов, представляющих конкретную предметную область.

Содержимое работы - 1 файл

Обзор_пр_БД.doc

— 960.50 Кб (Скачать файл)

1.1. Основные понятия БД и СУБД

База данных (БД) - это совокупность интегрированных, не дублированных и логически взаимосвязанных данных, организованных на машинном носителе средствами СУБД в соответствии со структурами данных и моделью, которые она поддерживает. Создание базы - определение её структуры, загрузка и корректировка данных, а также многоаспектный доступ обеспечиваются эффективными средствами СУБД. На основе данных из БД могут решаться все задачи ИС. БД, как правило, отражает некоторую логическую модель взаимосвязанных информационных объектов, представляющих конкретную предметную область.

Система управления базами данных (СУБД) - это универсальное средство, предназначенное для создания и ведения (обслуживания) БД различного назначения на внешних запоминающих устройствах компьютера, а также доступа к данным и их обработки.

СУБД обеспечивают многоаспектный доступ к данным базы и выборку  по любым критериям, т.е. многоцелевое использование одних и тех  же данных в разных задачах. СУБД, как  правило, имеет средства защиты и восстановления данных, а также их реорганизации на машинном носителе для улучшения объемно-временных характеристик. Создание БД средствами СУБД предполагает подготовку решений по структуре БД. Важнейшим условием корректного построения структуры БД является разработка информационно-логической модели, отражающей логическую структуру информации предметной области.

Дублирование данных означает повторение одних и тех же не ключевых данных в разных массивах (таблицах).

Целостность и непротиворечивость данных означает такое наполнение базы данными, при котором все записи из разных массивов имеют корректные логические связи с записями других массивов, в случае если такие связи определены в логической структуре БД.

Однократность ввода данных означает, что при вводе идентификационных данных их не приходится вводить в логически связанные массивы повторно.

Средства СУБД - это отдельные относительно автономные программные компоненты, выполняющие определенные функции, например конструктор (мастер) формы ввода-вывода, конструктор запросов, отчетов и т.п.

Диалоговые средства СУБД - этой средства, которые позволяют пользователю, не прибегая к программированию, выполнить нужную функцию в процессе диалога.

Запросы к БД - это способ формирования обращения пользователя к БД для выборки данных в соответствии с задаваемыми условиями.

Модель данных определяет способ логической организации данных, реализуемой СУБД. Модели данных, поддерживаемые в различных СУБД, - иерархические, сетевые, реляционные, обеспечивают отображение информационно-логической модели предметной области и структуры данных выбранной СУБД.

Независимость программ от данных означает возможность модификации структуры БД, без необходимости переработки программ обработки баз данных.

назад | содержание | далее 

 

1.2. Требования к организации БД и её обработке

Существуют следующие требования к организации БД и ее обработке:

  1. отсутствие дублирования данных в различных объектах модели данных, обеспечивающих однократный ввод данных и простоту внесения изменений данных;
  2. непротиворечивость целостность данных;
  3. возможность многоаспектного доступа, всевозможные выборки из массивов недублированной информации их использования различными задачами и приложениями пользователя;
  4. защиту и восстановление данных при аварийных ситуациях, аппаратных и программных сбоях, ошибках пользователя;
  5. защиту данных от несанкционированного доступа использованием паролей и другими средствами разграничения доступа для различных пользователей;
  6. возможность модификации структуры БД без повторной загрузки данных;
  7. обеспечение независимости программ от данных, позволяющей сохранить программы при модификации структуры БД, физической реорганизации данных.

3.1. Основные положения проектирования БД  

 

Цель  моделирования данных состоит в  обеспечении разработчика ЭИС концептуальой  схемой базы данных в форме одной модели или нескольких локальных моделей, которые относительно легко могут быть отображены в любую систему баз данных.

Выделяют несколько подходов к  проектированию данных. Например, в  РФ используются три этапа проектирования данных: инфологический, даталогический и физический; на Западе - два этапа: инфологическое (логическое или концептуальное) и физическое проектирование данных.

Существует множество способов представления реального мира в  виде моделей. Инфологическое моделирование, как способ отражения объектов и процессов реального мира отличают:

а) селективность. Не все объекты и процессы реального мира можно отразить с помощью инфологических моделей (ИЛМ), более того разные методологии ИЛМ могут быть предназначены для различных сфер реального мира. Изначально на объекты и процессы предметной области накладываются некоторые ограничения (чаще всего они довольно нестрогие и "размыты") для того, чтобы построить модель. Это связано с тем, что в ИЛМ отражается не весь реальный мир, и не все объекты и процессы, которые можно отразить аппаратом данной ИЛМ, а только те, которые входят в предметную область и самое главное важны для предметной области. Предметная область - это часть реального мира, информация о которой является объектом рассматриваемой информационной системы;

б) язык. Синтаксические и семантические правила построения ИЛМ. По используемому языку ИЛМ можно разделить на два вида (рисунок 12) - аналитические и графовые.

Аналитические модели используют различные  математические и другие аналитические  языки, представление предметной области в виде формул и зависимостей. Наиболее часто в инфологическом моделировании применяют аппарат реляционной алгебры и теории множеств, возможны также и другие аналитические представления предметной области. В графовых ИЛМ алфавитом являются различные графические символы. Наиболее известной методикой проектирования баз данных, использующей аналитическую ИЛМ, является методика проектирования Дейта.

Рисунок 12 - Классификация инфологических моделей данных  

Методологии проектирования с применением  аналитических моделей имеют  строгий аналитический аппарат, что позволяет их легко автоматизировать, однако программные средства автоматизации проектирования на основе этих моделей не нашли на сегодняшний день достаточно широкого распространения. Тем не менее, эти модели могут использоваться проектировщиками, имеющими хорошую математическую подготовку и достаточно большой опыт.

Аналитические модели практически невозможно использовать для целей проектирования баз данных ЭИС вследствие их сложности, громоздкости, неадаптивности и большой трудоемкости разработки при отображении большого количества разнотипных процессов, объектов, свойств и ограничении. Такие модели идеально подходят для систем с небольшим количеством разнотипных объектов и процессов (не более пяти), имеющих малое количество свойств. Кроме того, моделируемая предметная область должна быть относительно статична, что нехарактерно для экономических систем.

В графических ИЛМ может быть использован различный математический графический аппарат. Существуют ИЛМ, использующие различные виды математических сетей: например, бинарные или семантические.

Распространение сетевых инфологических моделей сдерживается из-за объективных сложностей в создании и реализации алгоритма перехода от них к физическим моделям, описанным на широко применяемых языках описания данных.

Отдельным классом графовых ИЛМ являются ER-модели. В настоящее время они наиболее широко распространены, вследствие своей эффективности, возможности использования для отображения многих областей реального мира, относительной простоты построения и наглядности. Широкое применение ER-моделей привело к появлению сначала алгоритмов перехода от них к иерархическим, сетевым и реляционным физическим моделям, а затем средств автоматизации, как процесса построения ER-модели, так и процесса получения по ней физической модели.

В таблице 1 предложен анализ различных  типов инфологических моделей по семантическим и технологическим аспектам их применения.

Цель моделирования данных состоит  в обеспечении разработчика ИС концептуальной схемой базы данных в форме одной модели или нескольких локальных моделей, которые относительно легко могут быть отображены в любую систему баз данных.  

 

Таблица 1 - Сравнительный  анализ различных типов инфологических моделей

Наименования характеристик

Аналитические

модели

Сетевые модели

ER-модели

1.Используемый математический  аппарат

Теория множеств, аналитические  формулы, теория графов

Бинарные и семантические сети, теории графов

Начала теории графов, реляционная  алгебра, теория множеств

2. Язык

Аналитический

Графический

Графический

3. Наличие алгоритма преобразования  в физическую модель

+

+

+

4. Средства автоматизации:

     

а) построение модели;

-

-

+

б) ведения словарей, пулов;

+

-

+

в) преобразования в физическую модель;

+

-

+

г) разработки программных средств  администрирования базы данных.

-

-

+

5. Наглядность

Низкая

Высокая

Очень высокая

6. Требуемая квалификация проектировщика

Очень высокая

Высокая

Средняя


Диаграммы "сущность-связь" (ERD) предназначены для разработки моделей данных и отношений между ними. Фактически с помощью ERD осуществляется детализация хранилищ данных проектируемой системы, а также документируются сущности системы и способы их взаимодействия, включая идентификацию объектов, важных для предметной области (сущностей), свойств этих объектов (атрибутов) и их отношений с другими объектами (связей).

ER-модель - это отражение реального  мира в виде сущностей (Entity) и связей между ними (Relationship). Сегодня ER-моделирование является самым распространенным методом построения инфологических моделей ЭИС. Многие из методик ER-моделирования легли в основу современных автоматизированных систем проектирования баз данных либо используются при неавтоматизированной разработке.

Различные методики построения ER-моделей  анализируются по следующим основным аспектам:

- терминологический аппарат, лежащий  в основе методики;

- семантические возможности модели для отображения различных ситуаций реального мира;

- наличие алгоритма перехода от ER-модели к различным физическим и конкретно к реляционной физической модели;

- эффективность алгоритма перехода;

- технология построения модели, сложность процесса моделирования. В связи с тем, что построение ER-модели производится на этапе инфологического моделирования, преобразование ее в структуры данных - на этапе физического, анализ моделей производится отдельно от анализа алгоритмов перехода. Кроме того, модель может быть построена с использованием одной методики, а преобразована в структуры таблиц - с помощью другой.

Фактически с помощью ERD осуществляется детализация хранилищ данных проектируемой системы, а также документируются сущности системы и способы их взаимодействия, включая идентификацию объектов, важных для предметной области (сущностей), свойств этих объектов (атрибутов) и их отношений с другими объектами (связей).

Сущность представляет собой множество экземпляров реальных или абстрактных объектов (людей, событий, состояний, идей, предметов и т.п.), обладающих общими атрибутами или характеристиками. Любой объект может быть представлен только одной сущностью, которая должна быть уникально унифицирована. При этом имя сущности должно отражать тип или класс объекта, а не его конкретный экземпляр (например, АЭРОПОРТ, а не ВНУКОВО).

Каждая сущность обладает одним  или несколькими атрибутами, которые однозначно идентифицируют каждый экземпляр сущности. При этом любой атрибут может быть определен как ключевой. Ключ - один или несколько атрибутов, однозначно определяющих каждый экземпляр объекта. Например, атрибут КОД КЛИЕНТА является идентификатором объекта КЛИЕНТ. Графически объект может быть представлен в виде прямоугольника, содержащего имя объекта и список атрибутов, в котором ключевые атрибуты выделены, например, подчеркиванием.

Для идентификации требований, в  соответствии с которыми сущности вовлекаются  в отношения, используются связи. Практика показала, что для большинства приложений достаточно использовать следующие типы отношений:

1) Связь 1:1 (один-к-одному) предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует не более одного экземпляра информационного объекта В и наоборот. Отношения данного типа используются, как правило, на верхних уровнях иерархии модели данных, а на нижних уровнях встречаются сравнительно редко.

2) При связи 1:n (один-ко-многим) одному экземпляру информационного объекта А соответствует любое количество экземпляров объекта В, но каждый экземпляр объекта В связан не более, чем с одним экземпляром объекта А. Отношения данного типа являются наиболее часто используемыми.

Информация о работе Моделирование систем баз данных