Архитектура хранилищ данных

Автор работы: Пользователь скрыл имя, 19 Декабря 2012 в 13:31, курсовая работа

Краткое описание

В настоящее время хранилища данных – такой же необходимый атрибут ит-архитектуры практически любой современной организации, как обслуживание компьютеров или работа электронной почты . Хранилища призваны обеспечить надежное хранение жизненно важной информации компании на протяжении всей ее жизнедеятельности. Но поскольку любой несанкционированный доступ в подобное хранилище может повлечь за собой серьезные финансовые потери, к тому же, форматы надежного долгосрочного хранения плохо соответствуют требованиям быстрого своевременного информационного обслуживания, применяются так называемые витрины данных, содержащие требуемые подмножества данных из хранилища.

Содержание работы

Введение……………………………………………………………………….......3
Глава 1. Архитектура хранилищ данных
Централизованная ETL с параллельными хранилищами и витринами данных…………………………………………………………………........4
Хранилище с накоплением данных в витринах………………………......7
Хранилище данных с интеграционной шиной………………………….11
Рекомендованная архитектура КХД……………………………………..14
Заключение……………………………………………………………….............18
Список использованной литературы……………………………………….......19

Содержимое работы - 1 файл

архитектура.doc

— 966.50 Кб (Скачать файл)

В случае замены SRD на интеграционную шину последствия  не столь драматичны. Но для того, чтобы ЦХД могло отвечать на запросы  витрин данных, направленных через шину, оно должно быть преобразовано в сервис. Это значит, что хранилище должно соответствовать наиболее распространенному стилю web – сервисов, и поддерживать протоколы HTTP/ HTTPS и SOAP и XML – формат сообщений. Такой подход работает для коротких сообщений, но в витрины необходимо передавать большой объем данных, что может быть решено с помощью передачи двоичных объектов. Необходимая реструктуризация данных не может быть возложена на шину, и должна выполняться либо в ЦХД, либо в витрине. Эта функция может быть решена с помощью сервиса-посредника, принимающего данные, и передающего их в витрины данных после реструктуризации. То есть, мы возвращаемся к идее средства SRD с шинным интерфейсом.

Таким образом, интеграционная шина может быть использована в архитектуре КХД как транспортная среда между источниками данных и ETL и между SRD и витринами данных в тех случаях, когда компоненты КХД территориально разнесены и находятся за межсетевыми экранами в соответствии со строгими требованиями к защите информации. В этом случае для обеспечения взаимодействия достаточно, чтобы был разрешен обмен по протоколам HTTP/ HTTPS. Вся логика сбора и преобразования информации должна быть по-прежнему сосредоточена в ETL и SRD.

 

4. Рекомендованная архитектура КХД

 

Архитектура корпоративного хранилища данных (КХД) должна удовлетворять многим функциональным и нефункциональным требованиям, которые  зависят от конкретных задач, решаемых КХД. Как нет универсального банка, авиакомпании, или нефтяного концерна, так нет и единого решения КХД, пригодного на все случаи жизни. Но основные принципы, которым должно следовать КХД, все же можно сформулировать.

Прежде  всего, это качество данных, которое  можно понимать, как полные, точные и воспроизводимые данные, доставленные в срок туда, где они нужны. Качество данных трудно измерить напрямую, но о нем можно судить по принимаемым решениям. То есть, качество данных требует инвестиций, но и само способно приносить прибыль.

Во-вторых, это защищенность и надежность хранения данных. Ценность информации, накопленной в КХД, может быть сравнима с рыночной стоимостью компании. Несанкционированный доступ к КХД чреват серьезными последствиями, поэтому должны быть приняты меры, адекватные ценности данных.

В-третьих, данные должны быть доступны сотрудникам в объеме, необходимом и достаточном для выполнения своих функциональных обязанностей.

В-четвертых, сотрудники должны иметь единое понимание  данных, то есть должно быть установлено  единое смысловое пространство.

В-пятых, необходимо, по возможности, устранить конфликты в кодировках данных в системах источниках.

 

Рис. 4. Рекомендованная архитектура КХД

 

 

 

Предлагаемая  архитектура следует проверенным  принципам модульного конструирования  «непотопляемых отсеков». Стратегия «Разделяй и властвуй» применима не только в политике. Разделяя архитектуру на модули, мы одновременно концентрируем в них определенную функциональность, получая власть над неуправляемой ИТ стихией. Средства ETL обеспечивают полный, надежный, точный сбор информации из источников данных благодаря сосредоточенной в ETL логике сбора, обработки и преобразования данных и взаимодействию с системами ведения метаданных и НСИ.

Система ведения метаданных является главным  «хранителем мудрости», к которому можно обратиться за советом. Система ведения метаданных поддерживает актуальность бизнес-метаданных, технических, операционных и проектных метаданных.

Система ведения НСИ является третейским судьей при разрешении конфликтов кодировок  данных.

Центральное хранилище данных (ЦХД) несет только нагрузку по надежному защищенному хранению данных. В зависимости от поставленных задач, надежность программно-технического комплекса (ПТК) ЦХД может достигать 99,999%, то есть обеспечивать бесперебойную работу с простоем не более 5 мин в год. ПТК ЦХД может обеспечивать защиту данных от несанкционированного доступа, саботажа и стихийных бедствий. Структура данных в ЦХД оптимизирована исключительно с целью обеспечения эффективного хранения данных.

Средства  выборки, реструктуризации и доставки данных (SRD) в такой архитектуре являются единственным пользователем ЦХД, беря на себя всю работу по заполнению витрин данных и, тем самым, снижая нагрузку на ЦХД по обслуживанию запросов пользователей.

Витрины данных содержат данные в структурах и форматах, оптимальных для решения задач пользователей данной витрины. В настоящее время, когда даже ноутбук может быть оснащен терабайтным диском, проблемы, связанные с многократным повторением данных в витринах, не имеют значения. Главное преимущество этой архитектуры – предоставление доступа для удобной работы пользователей с необходимым объемом данных, возможность быстрого восстановления содержимого витрин из ЦХД при сбое витрины, обеспечение работы пользователей при отсутствии связи с ЦХД.

Достоинство этой архитектуры заключается в  возможности раздельного проектирования, создания, эксплуатации и доработки  отдельных компонентов без радикальной  перестройки всей системы. Это означает, что начало работ по созданию КХД  не требует сверхусилий или сверхинвестиций. Достаточно начать с ограниченного по своим возможностям программно-технического комплекса, и следуя предложенным принципам, создать работающий и действительно полезный для пользователей прототип. Далее необходимо выявить узкие места и развивать соответствующие компоненты.

Применение  этой архитектуры вместе с тройной  стратегией интеграции данных, метаданных и НСИ 4, позволяет сократить сроки  и бюджет проекта внедрения КХД  и развивать его в соответствии с изменяющимися требованиями бизнеса.

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

В курсовой работе обсуждаются достоинства и ограничения следующих архитектур: ХД с накоплением данных в ВД, централизованная ETL с параллельными ХД и ВД, ХД с интеграционной шиной, а также рекомендованная архитектура хранилища данных.

Рекомендованная архитектура корпоративного хранилища  данных позволяет создать в короткие сроки и с минимальными инвестициями работоспособный прототип, полезный для бизнес-пользователей. Ключевым моментом этой архитектуры, обеспечивающим эволюционное развитие КХД, является внедрение на ранних этапах систем ведения метаданных и НСИ.

 

 

 

 

 

 

 

 

 

 

 

 

Список использованной литературы:

 

    1. Асадуллаев С. «Архитектуры хранилищ данных – I», 19.10.2009
    2. Асадуллаев С. «Архитектуры хранилищ данных – II», 23.10.2009.
    3. Асадуллаев С. «Данные, метаданные и НСИ: тройная стратегия создания хранилищ данных», 09.07.2009

Информация о работе Архитектура хранилищ данных