Проектирование баз данных методом нормализации

Автор работы: Пользователь скрыл имя, 24 Марта 2012 в 02:13, дипломная работа

Краткое описание

Цель моей дипломной работы: Создание структуры базы данных на примере «Школьного журнала» с использованием метода нормализации.


Задачи:
 Изучение литературы по теме дипломной работы
 Изучение принципов нормализации
 Изучение предметной области БД
 Создание концептуальной модели

Содержание работы

ВВЕДЕНИЕ
Глава I Проектирование базы данных
Основные понятия Баз данных
Архитектура Базы Данных
Проектирование базы данных
Глава II Нормализация
Принципы нормализации
Теорема Фейджина
Глава III Создание структуры БД «Классный журнал» методом нормализации
Описание предметной области
Создание структуры БД «Классный журнал» методом нормализации.
Создание приложения для работы с базой данных
TTable и TQuery
Приложение
Заключение
Список литературы

Содержимое работы - 1 файл

Диплом.doc

— 644.00 Кб (Скачать файл)

1. Информация в таблице не должна дублироваться. Не должно быть повторений и между таблицами. Когда определенная информация хранится только в одной таблице, то и изменять ее придется только в одном месте. Это делает работу более эффективной, а также исключает возможность несовпадения информации в разных таблицах. Например, в одной таблице должны содержаться адреса и телефоны клиентов.

2. Каждая таблица должна содержать информацию только на одну тему. Сведения на каждую тему обрабатываются намного легче, если они содержатся в независимых друг от друга таблицах. Например, адреса и заказы клиентов лучше хранить в разных таблицах, с тем, чтобы при удалении заказа информация о клиенте осталась в базе данных.

3. Каждая таблица должна содержать необходимые поля. Каждое поле в таблице должно содержать отдельные сведения по теме таблицы. Например, в таблице с данными о клиенте могут содержаться поля с названием компании, адресом, городом, страной и номером телефона. При разработке полей для каждой таблицы необходимо помнить, что каждое поле должно быть связано с темой таблицы. Не рекомендуется включать в таблицу данные, которые являются результатом выражения. В таблице должна присутствовать вся необходимая информация. Информацию следует разбивать на наименьшие логические единицы (Например, поля "Имя" и "Фамилия", а не общее поле "Имя").

4. База данных должна иметь первичный ключ. Это необходимо для того, чтобы СУБД могла связать данные из разных таблиц, например, данные о клиенте и его заказы.

Стадия 3 Создание экранных форм.

Первоначально необходимо указать таблицу, на базе которой будет создаваться форма. Ее можно создавать при помощи мастера форм, указав, какой вид она должна иметь, или самостоятельно. При создании формы можно указывать не все поля, которые содержит таблица, а только некоторые из них. Имя формы может совпадать с именем таблицы, на базе которой она создана. На основе одной таблицы можно создать несколько форм, которые могут отличаться видом или количеством используемых из данной таблицы полей. После создания форму необходимо сохранить. Созданную форму можно редактировать, изменяя местоположение, размеры и формат полей.

 

Стадия 4 Заполнение БД.

Процесс заполнения БД может проводиться в двух видах: в виде таблицы и в виде формы. Числовые и текстовые поля можно заполнять в виде таблицы, а поля типа МЕМО и OLE – в виде формы.

VI этап.

Работа с созданной базой данных:

Работа с БД включает в себя следующие действия:

      поиск необходимых сведений;

      сортировка данных;

      отбор данных;

      вывод на печать;

      изменение и дополнение данных.


Формализация реляционной модели

Основные определения:

Появление теоретико-множественных моделей в системах баз данных было предопределено настоятельной потребностью пользователей в переходе от работы с элементами данных, как это делается в графовых моделях, к работе с некоторыми макрообъектами. Основной моделью в этом классе является реляционная модель данных. Простота и наглядность модели для пользователей-непрограммистов, с одной стороны, и серьезное теоретическое обоснование, с другой стороны, определили большую популярность этой модели. Кроме того, развитие формального аппарата представления и манипулирования данными в рамках реляционной модели сделали се наиболее перспективной для использования в системах представления знаний, что обеспечивает качественно иной подход к обработке данных в больших информационных системах.

Теоретической основой этой модели стала теория отношений, основу которой заложили два логика — американец Чарльз Содерс Пирс (1839-1914) и немец Эрнст Шредер (1841-1902). В руководствах по теории отношений было показано, что множество отношений замкнуто относительно некоторых специальных операций, то есть образует вместе с этими операциями абстрактную алгебру. Это важнейшее свойство отношений было использовано в реляционной модели для разработки языка манипулирования данными, связанного с исходной алгеброй. Американский математик Э. Ф. Кодд в 1970 году впервые сформулировал основные понятия и ограничения реляционной модели, ограничив набор операций в ней семью основными и одной дополнительной операцией. Предложения Кодда были настолько эффективны для систем баз данных, что за эту модель он был удостоен престижной премии Тьюринга в области теоретических основ вычислительной техники.

Основной структурой данных в модели является отношение, именно поэтому модель получила название реляционной (от английского relation — отношение).

N-арным отношением R называют, подмножество декартова произведения Dx, D2x ... Dnx множеств D1, D2, ..., Dn (n > 1), необязательно различных. Исходные множества D1, D2, ..., Dn называют в модели доменами.

R D1x, D2x...Dxn

где D1, D2x ... Dnx— полное декартово произведение.

Полное декартово произведение — это набор всевозможных сочетаний из n элементов каждое, где каждый элемент берется из своего домена. Например, имеем три домена: D1 содержит три фамилии, D2 — набор из двух учебных дисциплин и D3 — набор из трех оценок. Допустим, содержимое доменов следующее:

D1 = (Иванов, Крылов, Степанов)

D2 = (Теория алгоритмов, Базы данных}

D3 = (3, 4, 5)

Тогда полное декартово произведение содержит набор из 18 троек, где первый элемент — это одна из фамилий, второй — это название одной из учебных дисциплин, а третий — одна из оценок.

<Иванов. Теория алгоритмов. 3>: <Иванов. Теория алгоритмов. 4>: <Иванов. Теория алгоритмов. 5>; <Крылов. Теория алгоритмов. 3>: <Крылов. Теория алгоритмов. 4>: <Крылов. Теория алгоритмов. 5>; <Степанов. Теория алгоритмов. 3>: <Степанов. Теория алгоритмов. 4>: <Степанов. Теория алгоритмов. 5>; <Иванов, Базы данных. 3>: <Иванов. Базы данных. 4>: <Иванов. Базы данных. 5>; <Крылов. Базы данных. 3>: <Крылов. Базы данных. 4>: <Крылов. Базы данных. 5>; <Степанов. Базы данных. 3>: <Степанов, Базы данных. 4>: <Степанов, Базы данных. 5>;

Отношение R моделирует реальную ситуацию, и оно может содержать, допустим, только 5 строк, которые соответствуют результатам сессии (Крылов экзамен по «Базам данных» еще не сдавал):

<Иванов. Теория алгоритмов. 3>; <Крылов. Теория алгоритмов. 4>; <Степанов. Теория алгоритмов. 5>; <Иванов. Базы данных. 3>; <Степанов. Базы данных. 4>;

Отношение имеет простую графическую интерпретацию, оно может быть представлено в виде таблицы, столбцы которой соответствуют вхождениям доменов в отношение, а строки — наборам из n значений, взятых из исходных доменов, которые расположены в строго определенном порядке в соответствии с заголовком. Такие наборы из n значений часто называют n-ками.

R

 

 

Фамилия

Дисциплина

Оценка

Иванов

Теория алгоритмов

3

Иванов

Базы данных

3

Крылов

Теория алгоритмов

4

Степанов

Теория алгоритмов

5

Степанов

Базы данных

4

 

Данная таблица обладает рядом специфических свойств:

      В таблице нет двух одинаковых строк.

      Таблица имеет столбцы, соответствующие атрибутам отношения.

      Каждый атрибут в отношении имеет уникальное имя.

      Порядок строк в таблице произвольный.

      Вхождение домена в отношение принято называть атрибутом. Строки отношения называются кортежами.

      Количество атрибутов в отношении называется степенью, или рангом, отношения.

Следует заметить, что в отношении не может быть одинаковых кортежей, это следует из математической модели: отношение — это подмножество декартова произведения, а в декартовом произведении все n-ки различны.

В соответствии со свойствами отношений два отношения, отличающиеся только порядком строк или порядком столбцов, будут интерпретироваться в рамках реляционной модели как одинаковые, то есть отношение R и отношение R1, изображенное далее, одинаковы с точки зрения реляционной модели данных.

R1

Дисциплина

Фамилия

Оценка

Теория алгоритмов

Крылов

5

Теория алгоритмов

Степанов

4

Теория алгоритмов

Иванов

3

Базы данных

Иванов

3

Базы данных

Степанов

4

 

Любое отношение является динамической моделью некоторого реального объекта внешнего мира. Поэтому вводится понятие экземпляра отношения, которое отражает состояние данного объекта в текущий момент времени, и понятие схемы отношения, которая определяет структуру отношения.

Схемой отношения R называется перечень имен атрибутов данного отношения с указанием домена, к которому они относятся:

SR = (А1, А2, Аn) Аi Di

Если атрибуты принимают значения из одного и того же домена, то они называются Q-сравнимыми, где Q — множество допустимых операций сравнения, заданных для данного домена. Например, если домен содержит числовые данные , то для него допустимы все операции сравнения, тогда Q = {=, <>,>=,<-,<,>}. Однако и для доменов, содержащих символьные данные, могут быть заданы не только операции сравнения по равенству и неравенству значений. Если для данного домена задано лексикографическое упорядочение, то он имеет также полный спектр операций сравнения.

Схемы двух отношений называются эквивалентными, если они имеют одинаковую степень и возможно такое упорядочение имен атрибутов в схемах, что на одинаковых местах будут находиться сравнимые атрибуты, то есть атрибуты, принимающие значения из одного домена.

SR1 = (A1, A2, ..., An) — схема отношения R1.

SR2 = (Bi1, Bi2,..., Bin) — схема отношения R2 после упорядочения имен атрибутов.

Тогда:

sR1~sR2<=>1. n=m, или 2. Аj,BijDj

Как уже говорилось ранее, реляционная модель представляет базу данных в виде множества взаимосвязанных отношений. В отличие от теоретико-графовых моделей в реляционной модели связи между отношениями поддерживаются неявным образом. Какие же связи между отношениями поддерживаются в реляционной модели? В этой модели, так же как и в остальных, поддерживаются иерархические связи между отношениями. В каждой связи одно отношение может выступать как основное, а другое отношение выступает в роли подчиненного. Это означает, что один кортеж основного отношения может быть связан с несколькими кортежами подчиненного отношения. Для поддержки этих связей оба отношения должны содержать наборы атрибутов, по которым они связаны. В основном отношении это первичный ключ отношения (PRIMARY KEY), который однозначно определяет кортеж основного отношения. В подчиненном отношении для моделирования связи должен присутствовать набор атрибутов, соответствующий первичному ключу основного отношения. Однако здесь этот набор атрибутов уже является вторичным ключом, то есть он определяет множество кортежей подчиненного отношения, которые связаны с единственным кортежем основного отношения. Данный набор атрибутов в подчиненном отношении принято называть внешним ключом (FOREIGN KEY).

Информация о работе Проектирование баз данных методом нормализации