Автор работы: Пользователь скрыл имя, 09 Декабря 2012 в 23:19, курсовая работа
Целью теоретической части курсовой работы является раскрытие предназначения информационных хранилищ.
В ходе работы в теоретической части мы ставим перед собой такие задачи:
– Изучение общих теоретических сведений об информационных хранилищах.
– Анализ свойств и компонентов информационного хранилища.
– Ознакомление с понятием интеграции данных.
Введение……………………………………………………………….…………..3
Глава 1. Общие теоретические сведения об информационных хранилищах…5
1.1. Назначение информационного хранилища………………...…………….5
1.2. Свойства информационного хранилища……………………….………...6
1.3. Компоненты информационного хранилища……………………………..8
Глава 2. Проблемы, их решение и реализация информационных хранилищ..10
2.1. Проблемы разработки и эксплуатации……………………………….....10
2.2. Подходы решения проблем……………………….……………………..14
2.3. Реализация информационных хранилищ…...…………………………..17
Глава 3. Проектирование базы данных рекламного агентства……………….19
3.1. Описание предметной области…………...……………………………..19
3.2. Проектирование базы данных методом нормальных форм…………...22
3.3. Проектирование базы данных методом «сущность–связь»…………...24
Глава 4. Реализация базы данных в среде СУБД MS Access…………………29
4.1. Создание таблиц………………………………………………………….29
4.2. Создание запросов и отчетов……………………………………………30
4.3. Создание форм, макросов и модуля…...……………………………..…32
Заключение………………………………………………………………………35
Список использованной литературы…………………………………………...36
Приложения...……………………………………………………………………38
Витрина данных (Data Mart) по
своему исходному определению –
это набор тематически
Глобальное хранилище данных. В последнее время все более популярной становится идея совместить концепции хранилища и витрины данных в одной реализации и использовать хранилище данных в качестве единственного источника интегрированных данных для всех витрин данных. Тогда естественной становится такая трехуровневая архитектура системы:
На первом уровне реализуется корпоративное хранилище данных на основе одной из развитых современных реляционных СУБД. Это хранилище интегрированных в основном детализированных данных. Реляционные СУБД обеспечивают эффективное хранение и управление данными очень большого объема, но не слишком хорошо соответствуют потребностям OLAP-систем, в частности, в связи с требованием многомерного представления данных.
На втором уровне поддерживаются витрины данных на основе многомерной системы управления базами данных (примером такой системы является Oracle Express Server). Такие СУБД почти идеально подходят для целей разработки OLAP-систем, но пока не позволяют хранить сверхбольшие объемы данных (предельный размер многомерной базы данных составляет 10-40 Гбайт). В данном случае это и не требуется, поскольку речь идет о витринах данных. Заметим, что витрина данных не обязательно должна быть полностью сформирована. Она может содержать ссылки на хранилище данных и добирать оттуда информацию по мере поступления запросов. Конечно, это несколько увеличивает время отклика, но зато снимает проблему ограниченного объема многомерной базы данных.
Наконец, на третьем уровне находятся клиентские рабочие места конечных пользователей, на которых устанавливаются средства оперативного анализа данных.
Глава 3. Проектирование рекламного агентства
3.1. Описание предметной области
Требуется разработать информационную систему для автоматизации учета заказов в рекламном агентстве.
Система должна предусматривать режимы ведения системного каталога, отражающего перечень областей знаний, по которым имеются заказы в рекламном агентстве.
Внутри рекламного агентства области знаний могут иметь уникальный внутренний номер и полное наименование. Каждый заказ может содержать сведения из нескольких областей знаний. Каждый заказ, хранящийся в базе данных рекламного агентства, характеризуется следующими параметрами:
Каждый заказ имеет своего заказчика, который имеет следующие параметры:
Каждому заказу присваивается свой индивидуальный счет, который характеризуется следующими параметрами:
В рекламном агентстве
числится картотека специалистов. На
каждого специалиста в
В рекламном агентстве
ведется картотека
В случае материалов для оказания услуг в рекламном агентстве хранится специальный вкладыш, в котором должны быть записаны следующие сведения:
С данной информационной системой должны работать следующие группы пользователей:
При работе с системой агент по приему заказов должен иметь возможность решать следующие задачи:
Заказчик должен иметь возможность решать следующие задачи:
Специалисты должны иметь право просматривать сведения о поступивших заказах на выполнение определенных услуг.
Администрация рекламного агентства должна иметь возможность получать сведения:
Таким образом, мы разработали структуру для будущей базы данных рекламного агентства. Теперь мы знаем, для чего нужен каждый атрибут в нашей базе данных.
3.2. Проектирование базы данных методом нормальных форм
Процесс проектирования базы данных методом нормальных форм заключается в последовательном переводе отношений из первой нормальной формы в нормальные формы более высокого порядка по определенным правилам. Каждая следующая нормальная форма ограничивает определенный тип функциональных зависимостей, устраняет соответствующие аномалии при выполнении операций над отношениями базы данных и сохраняет свойства предшествующих нормальных форм.
Реляционная база данных считается эффективной, если все ее таблицы находятся как минимум в 3НФ. Приведение к 3НФ осуществляется, если есть основание для этого.
Отношение в 1 НФ должны отвечать таким требованиям:
Построим схему зависимостей между атрибутами (рисунок 1, приложение 1).
В данном отношении присутствует явное и неявное избыточное дублирование данных. Следствием избыточного дублирования данных является проблема редактирования. Часть избыточности устраняется при переводе отношения в 2НФ.
Отношение находится во второй нормальной форме, если оно находится в первой нормальной форме, и при этом любой его атрибут, не входящий в состав потенциального ключа, функционально полно зависит от каждого потенциального ключа. Для устранения частичной зависимости и перевода отношения в 2НФ необходимо использовать операцию проекции, разложить на несколько отношений следующим образом:
В результате получим четыре отношения R1, R2, R3, R4 (рисунок 2, приложение 1).
В отношении R1 ключ – № счета, в отношении R2 – атрибут Заказчик, в R3 – Исполнитель, а в R4 – Код товара.
Исследование отношений показывает, что переход к 2НФ позволил исключить явную избыточность в таблицах R1, R2, R3. В R4 по-прежнему имеет место неявное дублирование данных.
Для дальнейшего
совершенствования отношения
Таблица находится в 3НФ, если она удовлетворяет требованиям 2НФ и не содержит транзитивных зависимостей.
Транзитивной зависимостью называется функциональная зависимость между неключевыми полями.
В отношении R4 есть транзитивные зависимости:
Заказы → Вид услуги→ №, Диапазон стоимости, Материал;
Заказы → Вид услуги → Материал;
Заказы → Материал → Поставщики, Объем поставки.
Транзитивные
зависимости также продолжают избыточное
дублирование информации. Устраним их.
Для этого преобразуем
На практике построение 3НФ схем отношений в большинстве случаев является достаточным и приведением к ним процесс проектирования реляционной базы данных заканчивается. Приведение отношений к 3НФ в нашем примере привело к устранению избыточного дублирования. Результат проектирования базы данных представлен на рисунке 9 (приложение 4).
3.3. Проектирование
базы данных методом «сущность–
Модель «сущность–связь» в 1976 году предложил Петер Чен. Она является наиболее известным представителем класса семантических (концептуальных, инфологических) моделей предметной области. ER-модель обычно представляется в графической форме.
Эта модель в наибольшей степени согласуется с концепцией объектно-ориентированного проектирования, которая в настоящий момент несомненно является базовой для разработки сложных программных систем.
Основные преимущества ER-моделей:
Приступаем к проектированию базы данных рекламного агентства методом «сущность–связь», содержащую следующие атрибуты:
№ счета – номер счета заказа (возможность совпадения номера счета исключена).
Заказчик – ФИО (название организации) заказчика (возможность совпадения ФИО (названия организации) заказчика исключена).
Исполнитель – фамилия специалиста, выполняющего заказ.
Дата заказа – дата поступления заказа.
Дата выполнения – дата выполнения заказа.
Количество – количество заказанной услуги.
Сумма – сумма, на которую сделан заказ.
ФИО (название организации) – заказчик (возможность совпадения ФИО (название организации) исключена).
Дата рождения – дата рождения заказчика.
Адрес – адрес заказчика.
Телефон – номер телефона заказчика.
Дата открытия – дата открытия счета (дата, когда сделан заказ).
Фамилия – фамилия сотрудника (возможность совпадения фамилии специалиста исключена).