Проектирование реляционных баз данных

Автор работы: Пользователь скрыл имя, 15 Ноября 2012 в 14:32, реферат

Краткое описание

Управление информацией всегда было основной сферой применения компьютеров и, надо думать, будет играть еще большую роль в будущем. Базы данных и системы управления ими (СУБД, DBMS – Database Management System) на протяжении всего пути развития компьютерной техники совершенствовались, поддерживая все более сложные уровни абстрактных данных, заданных пользователем, и обеспечивая взаимодействие компонентов, распределенных в глобальных сетях и постепенно интегрирующихся с телекоммуникационными системами.

Содержание работы

ВВЕДЕНИЕ......................................................................................................................... 3
ОСНОВНАЯ ЧАСТЬ
1. Проектирование реляционных баз данных с использованием нормализации ….. 4
1.1. Вторая нормальная форма………………………………………………………....... 5
1.2. Третья нормальная форма……………………………………………………….…... 7
1.3. Нормальная форма Бойса-Кодда…………………………………………….……… 8
1.4. Четвертая нормальная форма……………………………………………….……..... 9
1.5. Пятая нормальная форма…………………………………………………..……….. 10
2. Семантическое моделирование данных, ER-диаграммы…………………..…………. 12
2.1. Семантические модели данных………………………………………...…………... 13
2.2. Основные понятия модели Entity-Relationship (Сущность-Связи)….…. 14
2.3. Нормальные формы ER-схем………………………………………………………. 16
2.4. Более сложные элементы ER-модели…………………………………………........ 16
2.5. Получение реляционной схемы из ER-схемы ……………………………………….. 18
ЗАКЛЮЧЕНИЕ……………………………………………………………………………...... 22

Содержимое работы - 1 файл

Проектирование реляционных баз данных.doc

— 128.00 Кб (Скачать файл)

Ниже изображена сущность АЭРОПОРТ с примерными объектами Шереметьево  и Хитроу:

Каждый экземпляр сущности должен быть отличим от любого другого экземпляра той же сущности (это требование в некотором роде аналогично требованию отсутствия кортежей-дубликатов в реляционных  таблицах).

Связь - это графически изображаемая ассоциация, устанавливаемая между двумя сущностями. Эта ассоциация всегда является бинарной и может существовать между двумя разными сущностями или между сущностью и ей же самой (рекурсивная связь). В любой связи выделяются два конца (в соответствии с существующей парой связываемых сущностей), на каждом из которых указывается имя конца связи, степень конца связи (сколько экземпляров данной сущности связывается), обязательность связи (т.е. любой ли экземпляр данной сущности должен участвовать в данной связи).

Связь представляется в виде линии, связывающей две сущности или ведущей от сущности к ней же самой. При это в месте "стыковки" связи с сущностью используются трехточечный вход в прямоугольник сущности, если для этой сущности в связи могут использоваться много (many) экземпляров сущности, и одноточечный вход, если в связи может участвовать только один экземпляр сущности. Обязательный конец связи изображается сплошной линией, а необязательный - прерывистой линией.

Как и сущность, связь - это типовое  понятие, все экземпляры обеих пар связываемых сущностей подчиняются правилам связывания.

В изображенном ниже примере связь  между сущностями БИЛЕТ и ПАССАЖИР связывает билеты и пассажиров. При  том конец сущности с именем "для" позволяет связывать с одним  пассажиром более одного билета, причем каждый билет должен быть связан с каким-либо пассажиром. Конец сущности с именем "имеет" означает, что каждый билет может принадлежать только одному пассажиру, причем пассажир не обязан иметь хотя бы один билет.

Лаконичной устной трактовкой изображенной диаграммы является следующая:

  • Каждый БИЛЕТ предназначен для одного и только одного ПАССАЖИРА;
  • Каждый ПАССАЖИР может иметь один или более БИЛЕТОВ.

На следующем примере изображена рекурсивная связь, связывающая  сущность ЧЕЛОВЕК с ней же самой. Конец связи с именем "сын" определяет тот факт, что у одного отца может быть более чем один сын. Конец связи с именем "отец" означает, что не у каждого человека могут быть сыновья.

Лаконичной устной трактовкой изображенной диаграммы является следующая:

  • Каждый ЧЕЛОВЕК является сыном одного и только одного ЧЕЛОВЕКА;
  • Каждый ЧЕЛОВЕК может являться отцом для одного или более ЛЮДЕЙ ("ЧЕЛОВЕКОВ").

Атрибутом сущности является любая  деталь, которая служит для уточнения, идентификации, классификации, числовой характеристики или выражения состояния сущности. Имена атрибутов заносятся в прямоугольник, изображающий сущность, под именем сущности и изображаются малыми буквами, возможно, с примерами.

Пример:

Уникальным идентификатором сущности является атрибут, комбинация атрибутов, комбинация связей или комбинация связей и атрибутов, уникально отличающая любой экземпляр сущности от других экземпляров сущности того же типа.

2.3. Нормальные  формы ER-схем

Как и в реляционных схемах баз  данных, в ER-схемах вводится понятие нормальных форм, причем их смысл очень близко соответствует смыслу реляционных нормальных форм. Заметим, что формулировки нормальных форм ER-схем делают более понятным смысл нормализации реляционных схем. Мы приведем только очень краткие и неформальные определения трех первых нормальных форм.

В первой нормальной форме ER-схемы  устраняются повторяющиеся атрибуты или группы атрибутов, т.е. производится выявление неявных сущностей, "замаскированных" под атрибуты.

Во второй нормальной форме устраняются атрибуты, зависящие только от части уникального идентификатора. Эта часть уникального идентификатора определяет отдельную сущность.

В третьей нормальной форме устраняются  атрибуты, зависящие от атрибутов, не входящих в уникальный идентификатор. Эти атрибуты являются основой отдельной сущности.

 

2.4. Более сложные элементы ER-модели

Мы остановились только на самых  основных и наиболее очевидных понятиях ER-модели данных. К числу более  сложных элементов модели относятся  следующие:

  • Подтипы и супертипы сущностей. Как в языках программирования с развитыми типовыми системами (например, в языках объектно-ориентированного программирования), вводится возможность наследования типа сущности, исходя из одного или нескольких супертипов. Интересные нюансы связаны с необходимостью графического изображения этого механизма.
  • Связи "many-to-many". Иногда бывает необходимо связывать сущности таким образом, что с обоих концов связи могут присутствовать несколько экземпляров сущности (например, все члены кооператива сообща владеют имуществом кооператива). Для этого вводится разновидность связи "многие-со-многими".
  • Уточняемые степени связи. Иногда бывает полезно определить возможное количество экземпляров сущности, участвующих в данной связи (например, служащему разрешается участвовать не более, чем в трех проектах одновременно). Для выражения этого семантического ограничения разрешается указывать на конце связи ее максимальную или обязательную степень.
  • Каскадные удаления экземпляров сущностей. Некоторые связи бывают настолько сильными (конечно, в случае связи "один-ко-многим"), что при удалении опорного экземпляра сущности (соответствующего концу связи "один") нужно удалить и все экземпляры сущности, соответствующие концу связи "многие". Соответствующее требование "каскадного удаления" можно сформулировать при определении сущности.
  • Домены. Как и в случае реляционной модели данных бывает полезна возможность определения потенциально допустимого множества значений атрибута сущности (домена).

Эти и другие более сложные элементы модели данных "Сущность-Связи" делают ее существенно более мощной, но одновременно несколько усложняют ее использование. Конечно, при реальном использовании ER-диаграмм для проектирования баз данных необходимо ознакомиться со всеми возможностями.

Сущность может быть расщеплена на два или более взаимно исключающих  подтипа, каждый из которых включает общие атрибуты и/или связи. Эти  общие атрибуты и/или связи явно определяются один раз на более высоком  уровне. В подтипах могут определяться собственные атрибуты и/или связи. В принципе подтипизация может продолжаться на более низких уровнях, но опыт показывает, что в большинстве случаев оказывается достаточно двух-трех уровней.

Сущность, на основе которой определяются подтипы, называется супертипом. Подтипы должны образовывать полное множество, т.е. любой экземпляр супертипа должен относиться к некоторому подтипу. Иногда для полноты приходится определять дополнительный подтип ПРОЧИЕ.

Пример: Супертип ЛЕТАТЕЛЬНЫЙ АППАРАТ 

Как полагается это читать? От супертипа: ЛЕТАТЕЛЬНЫЙ АППАРАТ, который должен быть АЭРОПЛАНОМ, ВЕРТОЛЕТОМ, ПТИЦЕЛЕТОМ или ДРУГИМ ЛЕТАТЕЛЬНЫМ АППАРАТОМ. От подтипа: ВЕРТОЛЕТ, который относится к типу ЛЕТАТЕЛЬНОГО АППАРАТА. От подтипа, который является одновременно супертипа: АЭРОПЛАН, который относится к типу ЛЕТАТЕЛЬНОГО АППАРАТА и должен быть ПЛАНЕРОМ или МОТОРНЫМ САМОЛЕТОМ.

Иногда удобно иметь два или  более разных разбиения сущности на подтипы. Например, сущность ЧЕЛОВЕК может быть разбита на подтипы по профессиональному признаку (ПРОГРАММИСТ, ДОЯРКА и т.д.), а может - по половому признаку (МУЖЧИНА, ЖЕНЩИНА).

 

2.5. Получение реляционной  схемы из ER-схемы

Шаг 1. Каждая простая сущность превращается в таблицу. Простая сущность - сущность, не являющаяся подтипом и не имеющая подтипов. Имя сущности становится именем таблицы.

Шаг 2. Каждый атрибут становится возможным  столбцом с тем же именем; может  выбираться более точный формат. Столбцы, соответствующие необязательным атрибутам, могут содержать неопределенные значения; столбцы, соответствующие обязательным атрибутам, - не могут.

Шаг 3. Компоненты уникального идентификатора сущности превращаются в первичный  ключ таблицы. Если имеется несколько возможных уникальных идентификатора, выбирается наиболее используемый. Если в состав уникального идентификатора входят связи, к числу столбцов первичного ключа добавляется копия уникального идентификатора сущности, находящейся на дальнем конце связи (этот процесс может продолжаться рекурсивно). Для именования этих столбцов используются имена концов связей и/или имена сущностей.

Шаг 4. Связи многие-к-одному (и один-к-одному) становятся внешними ключами. Т.е. делается копия уникального идентификатора с конца связи "один", и соответствующие столбцы составляют внешний ключ. Необязательные связи соответствуют столбцам, допускающим неопределенные значения; обязательные связи - столбцам, не допускающим неопределенные значения.

Шаг 5. Индексы создаются для первичного ключа (уникальный индекс), внешних ключей и тех атрибутов, на которых предполагается в основном базировать запросы.

Шаг 6. Если в концептуальной схеме  присутствовали подтипы, то возможны два  способа:

  • все подтипы в одной таблице (а)
  • для каждого подтипа - отдельная таблица (б)

При применении способа (а) таблица  создается для наиболее внешнего супертипа, а для подтипов могут  создаваться представления. В таблицу  добавляется по крайней мере один столбец, содержащий код ТИПА; он становится частью первичного ключа.

При использовании метода (б) для  каждого подтипа первого уровня (для более нижних - представления) супертип воссоздается с помощью  представления UNION (из всех таблиц подтипов выбираются общие столбцы - столбцы  супертипа).

Все в одной таблице

Таблица - на подтип

Преимущества

 

Все хранится вместе 
Легкий доступ к супертипу и подтипам 
Требуется меньше таблиц

Более ясны правила подтипов 
Программы работают только с нужными таблицами

Недостатки

 

Слишком общее решение 
Требуется дополнительная логика работы с разными наборами столбцов и разными ограничениями 
Потенциальное узкое место (в связи с блокировками) 
Столбцы подтипов должны быть необязательными 
В некоторых СУБД для хранения неопределенных значений требуется дополнительная память

Слишком много таблиц 
Смущающие столбцы в представлении UNION 
Потенциальная потеря производительности при работе через UNION 
Над супертипом невозможны модификации


 

Шаг 7. Имеется два способа работы при наличии исключающих связей:

  • общий домен (а)
  • явные внешние ключи (б)

Если остающиеся внешние ключи  все в одном домене, т.е. имеют  общий формат (способ (а)), то создаются  два столбца: идентификатор связи  и идентификатор сущности. Столбец  идентификатора связи используется для различения связей, покрываемых дугой исключения. Столбец идентификатора сущности используется для хранения значений уникального идентификатора сущности на дальнем конце соответствующей связи.

Если результирующие внешние ключи  не относятся к одному домену, то для каждой связи, покрываемой дугой исключения, создаются явные столбцы внешних ключей; все эти столбцы могут содержать неопределенные значения.

Общий домен

Явные внешние ключи

Преимущества

 

Нужно только два столбца

Условия соединения - явные 

Недостатки

 

Оба дополнительных атрибута должны использоваться в соединениях

Слишком много столбцов


 

Альтернативные модели сущностей:

Вариант 1 (плохой)  

Вариант 2 (существенно лучше, если подтипы действительно существуют)  

Вариант 3 (годится при наличии  осмысленного супертипа D).

 

 

ЗАКЛЮЧЕНИЕ

При проектировании базы данных решаются две основных проблемы:

1. Каким образом отобразить объекты предметной области в абстрактные объекты модели данных, чтобы это отображение не противоречило семантике предметной области и было по возможности лучшим (эффективным, удобным и т.д.)? Часто эту проблему называют проблемой логического проектирования баз данных.

2. Как обеспечить эффективность  выполнения запросов к базе  данных, т.е. каким образом, имея  в виду особенности конкретной  системы управления базами данных, расположить данные во внешней  памяти, создание каких дополнительных  структур (например, индексов) потребовать и т.д.? Эту проблему называют проблемой физического проектирования баз данных.

Проблема проектирования реляционной  базы данных состоит в обоснованном принятии решений о том, из каких отношений должна состоять база данных и какие атрибуты должны быть у этих отношений.




Информация о работе Проектирование реляционных баз данных