Автор работы: Пользователь скрыл имя, 21 Сентября 2011 в 15:55, лекция
Термин информация происходит от латинского informatio, что означает разъяснение, осведомление, изложение. С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). Сообщение — это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков. таблиц и т.п. В широком смысле информация - это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.
Парадигма - это пространство идей и законы движения в этом пространстве. В рамках парадигмы определены аксиомы, на которых выстраивается своя логика. Решения, вырабатываемые в рамках парадигмы, непротиворечивы и логичны.
Преимуществами объектных СУБД модно считать:
объектные СУБД – открытые системы. Несложно добавить новый тип данных;
Большинство производителей ООБД предоставляют визуальные средства создания прикладных программ ОСУБД. Если раньше созданием прикладных программ для ОСУБД занимались специалисты в C++, Smaltalk, то теперь использовать ООБД стало намного проще
· Объектные СУБД быстрее, чем реляционные, если в программе многократно осуществляется переход от объекта к объекту по ссылке. Поскольку ссылка на объект есть идентификатор, однозначно определяющий его расположение в базе, то переход по такой ссылке происходит быстрее, чем ссылка между кортежами отношений по первичному ключу. ОСУБД устраняют необходимость в языке запросов
Традиционные области применения ОСУБД – САПР, моделирование, мультимедиа. ОСУБД широко используются в телекоммуникациях, различных аспектах автоматизации предприятия, издательском деле, геоинформационных проектах.
Интеграция неоднородных информационных ресурсов. Информационная неоднородность ресурсов заключается в разнообразии понятий, словарей; отображаемых реальных объектов; правил, определяющих адекватность моделируемых объектов реальности; видов данных, способов их сбора и обработки; интерфейсов пользователей и т.д.
Реализационная неоднородность источников проявляется в использовании разнообразных компьютерных платформ, средств управления базами данных, моделей данных и знаний, средств программирования, операционных систем, и т.п. Системы обеспечивающие совместимость различных компонентов называются интероперабельными системи.
Традиционные системы баз данных, используемые в информационных системах для сопровождения бизнес - процессов поддерживают большие объемы информации с помощью технологий оперативная обработка транзакций – OLTP. В OLTP-технологии обрабатывается детализированные данные, главные свойства данных здесь, их полнота и актуальность.
Для поддержки принятия решений нужны другие технологии. Необходимо объединять данные из различных источников (как из корпоративной информационной системы, так и из внешней среды), накапливать данные, делая их срезы во времени. Анализ таких данных позволяет оценивать состояние и динамику развития организации, делать обоснованные прогнозы и принимать обоснованные решения. Программные продукты, необходимые для обеспечения управленческих решений, должны обеспечивать хранение больших объемов данных, эффективный доступ к ним, а так же располагать развитыми средствами анализа данных и представления результатов в удобной для специалистов и руководства форме. Информационная технология, которая предоставляет руководителям различного уровня возможность получения необходимой информации для принятия управленческих, финансовых и кадровых решений называется OLAP (On-Line Analytical Processing- оперативной аналитической обработкой) -технологией.
OLAP –технологии базируются на технологиях хранилищ данных (Data warehouses). Хранилище данных обеспечивает накопление с течением времени данные для содействия в принятии решений. Хранилище это данных репозиторий (склад) информации содержащий объединенные, проверенные данные, отражающие работа организации за длительный период. Объемы данных в хранилищах данных в несколько раз превосходят объемы данных в OLTP-системах.
Хранилища
данных отличаются от баз данных или
систем оперативной обработки
хранилище содержит данные, позволяющие проводить анализ деловых операций;
хранилища обычно представляют собой системы, доступные только для чтения;
в хранилищах же накапливаются данные, не меняющиеся со временем и избавленные от ошибок.
Из-за большого объема данных в хранилищах одной из основных проблем создания хранилищ является обеспечение высокой производительности обработки запросов. Запросы в хранилище отличаются высоким уровнем сложности.
Создание хранилищ данных – трудоемкий и длительный процесс. Наряду с хранилищами данных существуют и часто используются компаниями витрины данных (Data Mart), называемые также киосками данных. Такие системы создаются для отдельных подразделений компаний или для обеспечения отдельных видов деятельности. Объемы данных и требования к вычислительным ресурсам в витринах данных существенно меньше по сравнению с хранилищами. Витрины данных могут строиться как независимо, так и на основе хранилищ данных компании. Хранилища данных имеют двухуровневую или трехуровневую архитектуру. В двухуровневых хранилищах на верхнем уровне поддерживается объединенная информация. На нижнем уровне - различные источники баз данных. В трехуровневой архитектуре предусматривается поддержка витрин данных для отдельных подразделений компании над ее единым хранилищем.
ТРАНЗАКЦИЯ
Под транзакцией понимается неделимая с точки зрения воздействия на БД последовательность операторов манипулирования данными (чтения, удаления, вставки, модификации) такая, что либо результаты всех операторов, входящих в транзакцию, отображаются в БД, либо воздействие всех этих операторов полностью отсутствует. Лозунг транзакции – «Все или ничего». Поддержание механизма транзакций - показатель уровня развитости СУБД. Корректный механизм поддержания транзакций одновременно является основой обеспечения целостности баз данных.
Удаленный доступ – доступ к базе данных через модемную связь.
Распределенная обработка.
В
современном бизнесе очень
Существуют два подхода к организации обработки распределенных данных.
технология распределенной базы данных. Такая база включает фрагменты данных, расположенные на различных узлах сети. С точки зрения пользователей она выглядит так, как будто все данные хранятся в одном месте. Естественно, такая схема предъявляет жесткие требования к производительности и надежности каналов связи.
технология тиражирования. В этом случае в каждом узле сети дублируются данные всех компьютеров. При этом передаются только операции изменения данных, а не сами данные. Передача может быть асинхронной (неодновременной для разных узлов), данные располагаются там, где обрабатываются.
Использование технологии тиражирования позволяет снизить требования к пропускной способности каналов связи. При выходе из строя линии связи какого-либо компьютера, пользователи других узлов могут продолжать работу. Однако при этом допускается неодинаковое состояние базы данных для различных пользователей в один и тот же момент времени. Следовательно, невозможно исключить конфликты между двумя копиями одной и той же записи.
В основе распределенной обработки лежит запрос к собственной локальной БД или удаленной (БД сервера). Запрос - формализованное задание на поиск и обработку информации. Удаленный запрос – единичный запрос к одному серверу. Несколько удаленных запросов к одному серверу объединяются в удаленную транзакцию. Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределенной.
Распределенная база данных и распределенная обработка не синонимы. Распределенная БД размещается на нескольких серверах, работа с ней, для получения доступа к удаленным данным, требует использования сетевой СУБД. При распределенной обработке один запрос транзакции обрабатывается одним сервером. Распределенная СУБД позволяет обрабатывать один запрос несколькими БД. Такой запрос называется распределенным.
Как правило, компьютеры и программы, входящие в состав информационной системы, не являются равноправными. Некоторые из них владеют ресурсами (файловая система, процессор, принтер, база данных и т.д.), другие имеют возможность обращаться к этим ресурсам. Компьютер (или программу), управляющий ресурсом, называют сервером этого ресурса (файл-сервер, сервер базы данных, вычислительный сервер...). Клиент и сервер какого-либо ресурса могут находится, как в рамках одной вычислительной системы, так и на различных компьютерах, связанных сетью.
Существует два подхода к организации коллективного доступа к базам данных. 1 - файл-сервер и 2 - СУБД-сервер, сервер баз данных, клиент-сервер.
При первом подходе файлы баз данных располагаются на файл-серверах, и все рабочие станции получают к ним доступ. При работе нескольких программ, эти программы должны блокировать записи с которыми они работают от параллельного чтения и изменения другой программой. Однако если применяется однопользовательская версия СУБД, нормальной блокировки не будет. Поэтому при установке СУБД в
сеть необходимо убедится, что устанавливаемая версия сетевая что предназначена для работы именно с теми сетевыми средства, которые будут использованы.
Мощность сетевых СУБД, основанных на файл-сервере в настоящее недостаточна. При большом количестве обрабатываемой информации производительность сети падает, нарушается безопасность и целостность данных.
С точки зрения обработки
В зависимости от расположения СУБД различают локальные и распределённые СУБД. Все части локальной СУБД размещаются на компьютере пользователя базы данных. Если к одной локальной СУБД обращаются несколько пользователей одновременно, каждый пользовательский компьютер должен иметь свою копию локальной СУБД. В отличие от этого, значительная часть программно-аппаратных средств распределённой СУБД централизована и находится на одном, достаточно мощном компьютере (сервере), в то время, как компьютеры пользователей несут относительно небольшую часть СУБД, которая называется клиентом. Локальные СУБД могут работать в сети, но могут и не использовать её, в то время как распределённые СУБД обязательно работают в компьютерной сети. Заметим, местонахождение баз данных никак не влияет на специфику СУБД: в локальных СУБД сама БД может располагаться как на компьютере пользователя, так и на удаленном сетевом компьютере. Безусловным достоинством клиент-серверных систем является возможность централизованного управления доступом к БД. В таких системах база данных в значительной мере защищена как от случайных, так и от намеренных искажений, в них проще реализовать целостность и непротиворечивость данных.