Шпаргалка по "Программированию и компьютеру"

Автор работы: Пользователь скрыл имя, 26 Января 2011 в 14:35, шпаргалка

Краткое описание

Работа содержит ответы на вопросы по дисциплине "Программирование и компьютеры".

Содержимое работы - 1 файл

шпоры БД.doc

— 405.00 Кб (Скачать файл)

  система должна быть объектно-ориентированной  и представлять собой БД.

  Три класса характеристик:

  • Обязательные.
  • Необязательные.
  • Открытые — позволяют пользователю выбирать свойства.

  СУБД

  ОО  характеристики

  1. Поддержка сложных объектов. В системе должна быть предусмотрена возможность создания составных объектов за счет применения конструкторов составных объектов. Необходимо, чтобы конструкторы объектов были ортогональны, то есть любой конструктор можно было применять к любому объекту.
  2. Поддержка индивидуальности объектов. Все объекты должны иметь уникальный идентификатор, который не зависит от значений их атрибутов.
  3. Поддержка инкапсуляции. Корректная инкапсуляция достигается за счет того, что программисты обладают правом доступа только к спецификации интерфейса методов, а данные и реализация методов скрыты внутри объектов.
  4. Поддержка типов и классов. Требуется, чтобы в ООБД поддерживалась хотя бы одна концепция различия между типами и классами. (Термин «тип» более соответствует понятию абстрактного типа данных. В языках программирования переменная объявляется с указанием ее типа. Компилятор может использовать эту информацию для проверки выполняемых с переменной операций на совместимость с ее типом, что позволяет гарантировать корректность программного обеспечения. С другой стороны класс является неким шаблоном для создания объектов и предоставляет методы, которые могут применяться к этим объектам. Таким образом, понятие «класс» в большей степени относится ко времени исполнения, чем ко времени компиляции.)
  5. Поддержка наследования типов и классов от их предков. Подтип, или подкласс, должен наследовать атрибуты и методы от его супертипа, или суперкласса, соответственно.
  6. Перегрузка в сочетании с полным связыванием. Методы должны применяться к объектам разных типов. Реализация метода должна зависеть от типа объектов, к которым данный метод применяется. Для обеспечения этой функциональности связывание имен методов в системе не должно выполняться до времени выполнения программы.
  7. Вычислительная полнота. Язык манипулирования данными должен быть языком программирования общего назначения.
  8. Набор типов данных должен быть расширяемым. Пользователь должен иметь средства создания новых типов данных на основе набора предопределенных системных типов. Более того, между способами использования системных и пользовательских типов данных не должно быть никаких различий.

  Необязательные:

  • Множественное наследование
  • Проверка типов
  • Распределение
  • Проектные транзакции

  Открытые

  • Парадигмы программирования (процедурное, декларативное)
  • Система представления
  • Система типов
  • Однородность. Реализация — язык программирования — интерфейс.
 
 
 
 
 

  38 Распределенные БД 

  Распределённые  базы данных (РБД) — совокупность логически взаимосвязанных баз данных, распределённых в компьютерной сети

  РБД состоит  из набора узлов, связанных коммуникационной сетью, в которой:

  • каждый узел — это полноценная СУБД сама по себе;
  • узлы взаимодействуют между собой таким образом, что пользователь любого из них может получить доступ к любым данным в сети так, как будто они находятся на его собственном узле.

  Каждый  узел сам по себе является системой базы данных. Любой пользователь может выполнить операции над данными на своём локальном узле точно так же, как если бы этот узел вовсе не входил в распределённую систему. Распределённую систему баз данных можно рассматривать как партнёрство между отдельными локальными СУБД на отдельных локальных узлах.

  Фундаментальный принцип создания распределённых баз  данных («правило 0»): Для пользователя распределённая система должна выглядеть  так же, как нераспределённая система.

  Фундаментальный принцип имеет следствием определённые дополнительные правила или цели. Таких целей всего двенадцать:

  1. Локальная независимость. Узлы в распределённой системе должны быть независимы, или автономны. Локальная независимость означает, что все операции на узле контролируются этим узлом.
  2. Отсутствие опоры на центральный узел. Локальная независимость предполагает, что все узлы в распределённой системе должны рассматриваться как равные. Поэтому не должно быть никаких обращений к «центральному» или «главному» узлу с целью получения некоторого централизованного сервиса.
  3. Непрерывное функционирование. Распределённые системы должны предоставлять более высокую степень надёжности и доступности.
  4. Независимость от расположения. Пользователи не должны знать, где именно данные хранятся физически и должны поступать так, как если бы все данные хранились на их собственном локальном узле.
  5. Независимость от фрагментации. Система поддерживает независимость от фрагментации, если данная переменная-отношение может быть разделена на части или фрагменты при организации её физического хранения. В этом случае данные могут храниться в том месте, где они чаще всего используются, что позволяет достичь локализации большинства операций и уменьшения сетевого трафика.
  6. Независимость от репликации. Система поддерживает репликацию данных, если данная хранимая переменная-отношение — или в общем случае данный фрагмент данной хранимой переменной-отношения — может быть представлена несколькими отдельными копиями или репликами, которые хранятся на нескольких отдельных узлах.
  7. Обработка распределённых запросов. Суть в том, что для запроса может потребоваться обращение к нескольким узлам. В такой системе может быть много возможных способов пересылки данных, позволяющих выполнить рассматриваемый запрос.
  8. Управление распределёнными транзакциями. Существует 2 главных аспекта управления транзакциями: управление восстановлением и управление параллельностью обработки. Что касается управления восстановлением, то чтобы обеспечить атомарность транзакции в распределённой среде, система должна гарантировать, что все множество относящихся к данной транзакции агентов (агент — процесс, который выполняется для данной транзакции на отдельном узле) или зафиксировало свои результаты, или выполнило откат. Что касается управления параллельностью, то оно в большинстве распределённых систем базируется на механизме блокирования, точно так, как и в нераспределённых системах.
  9. Аппаратная независимость. Желательно иметь возможность запускать одну и ту же СУБД на различных аппаратных платформах и, более того, добиться, чтобы различные машины участвовали в работе распределённой системы как равноправные партнёры.
  10. Независимость от операционной системы. Возможность функционирования СУБД под различными операционными системами.
  11. Независимость от сети. Возможность поддерживать много принципиально различных узлов, отличающихся оборудованием и операционными системами, а также ряд типов различных коммуникационных сетей.
  12. Независимость от типа СУБД. Необходимо, чтобы экземпляры СУБД на различных узлах все вместе поддерживали один и тот же интерфейс, и совсем необязательно, чтобы это были копии одной и
  13. той же версии СУБД.

39. Коммерческие базы данных

представляют  собой базы данных, специально предназначенные  для продажи пользователям. Эти БД могут передаваться пользователям на машинных носителях либо к ним может обеспечиваться доступ в режиме «он-лайн». Кроме того, могут предоставляться печатные аналоги базы данных. В качестве машинных носителей используются как магнитные носители, так и оптические диски.

Классификация коммерческих баз  данных. С некоторой степенью условности рынок электронной информации можно разделить на три крупных сектора:

• 1)сектор деловой информации;2)сектор профессиональной (патентной, научно-технической и т. п.) информации;3)сектор массовой потребительской информации.

Тематический  охват коммерческих баз данных практически  безграничен, а их пользователем  может быть практически каждый: в  процессе своей профессиональной деятельности каждый индивид может быть потребителем или поставщиком информации первых двух секторов, а в повседневной жизни — пользователем информации третьего сектора.

Различают пользователей  коллективных и индивидуальных. Среди  коллективных выделяются: правительственные  органы, неправительственные организации, средства массовой информации, учебные заведения, научные организации, предприятия и др.

Существуют  коммерческие БД, ориентированные на определенный круг пользователей; могут  вводиться и более жесткие  ограничения на доступ к информации (такие, как обоснованность запроса).

Источники информации о базах  данных. Во всем мире наблюдается рост числа коммерческих и других общедоступных баз данных. В мире насчитываются тысячи диалоговых баз данных, поэтому должны быть средства, обеспечивающие пользователю возможность ориентироваться в этом множестве информации.

Источниками информации о коммерческих базах  данных являются:

• рекламные  объявления в средствах массовой информации;

• каталоги баз данных;

• специализированные базы данных, содержащие информацию о  базах данных;

• дайджесты  рекламы;

•  специализированные выставки;

• специальная  литература;

• специализированные организации, занимающиеся посреднической деятельностью по продаже или  предоставлению доступа к базам  данных.

  40.Информационное  хранилище (data warehouse) – это автоматизированная система, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию как единую. Оно обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования и реорганизации бизнеса и необходима специалисту, ответственному за принятие решений

  Особенность новой технологии в том, что она  предлагает среду накопления данных, которая не только надежна, но по сравнению с распределенными СУБД оптимальна с точки зрения доступа к данным и манипулирования ими.

  Для данных информационного хранилища характерны:

1 предметная ориентация – данные организованы в соответствии со способом их применения; 2интегрированность – данные согласуются в соответствии с определенной системой наименований, хотя могут принадлежать различным источникам, и их формы представления могут не совпадать; 3упорядоченность во времени – данные согласуются во времени для использования в сравнениях, идентификациях трендов и прогнозах; 4неизменяемость и целостность – данные не обновляются и не изменяются, а только перезагружаются и считываются, поддерживая концепцию «одного правдивого источника».

  Использование метабазы для описания и управления данными, операции суммирования для уменьшения объема данных увеличивают скорость доступа к данным, позволяя руководителю быстро получить обзор ситуации или в деталях рассмотреть нужный предмет. При этом обеспечивается секретность данных, предназначенных различным уровням руководителей.

  Для преобразования данных из хранилища в предметно-ориентированную форму требуются языки запросов нового поколения. Язык SQL не обеспечивает выборку требуемых данных из хранилища. Для уменьшения размера информационного хранилища до минимума при сохранении максимального количества информации применяются эффективные методы сжатия данных.

  Для управленческого  персонала метабаза предлагает предметно-ориентированный  подход, показывая, какая информация имеется в наличии, как она  получена, как может быть использована. Для работы приложений метабаза поддерживает интеллектуальный выбор информации, относящейся только к задаче.

  Для руководителей  предприятия данные доступны посредством SQL-запросов, создания интерактивных  отчетов на экране, использования более развитых систем поддержки принятия решений, многомерного просмотра данных посредством гипертекстовой технологии.

  При организации  хранения данных обычно используются выделенные серверы или кластеры серверов (группа накопителей, видеоустройств с общим контроллером

  Примером  информационного хранилища может  служить Oracle VLM 

  Использование информационных хранилищ дает существенный выигрыш по производительности в  системах принятия решений, в системах обработки большого числа транзакций с большим объемом обновления данных.

  41. Технология комплексного  многомерного анализа  данных получила  название OLAP (On-Line Analytical Processing). OLAP — это ключевой компонент организации хранилищ данных. Концепция OLAP была описана Эдгаром Коддом, известным исследователем баз данных и автором реляционной модели данных  В 1995 году на основе требований, изложенных Коддом, был сформулирован так называемый тест FASMI (Fast Analysis of Shared Multidimensional Information — быстрый анализ разделяемой многомерной информации), включающий следующие требования к приложениям для многомерного анализа:

  • предоставление пользователю результатов анализа за приемлемое время (обычно не более 5 с), пусть даже ценой менее детального анализа;
  • возможность осуществления любого логического и статистического анализа, характерного для данного приложения, и его сохранения в доступном для конечного пользователя виде;
  • многопользовательский доступ к данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа;
  • многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий (это — ключевое требование OLAP);
  • возможность обращаться к любой нужной информации независимо от ее объема и места хранения.

  Следует отметить, что OLAP-функциональность может быть реализована различными способами, начиная с простейших средств анализа данных в офисных приложениях и заканчивая распределенными аналитическими системами, основанными на серверных продуктах. Но прежде чем говорить о различных реализациях этой функциональности, давайте рассмотрим, что же представляют собой кубы OLAP с логической точки зрения.  

  

  OLAP-кубы  содержат бизнес-показатели, используемые  для анализа и принятия управленческих  решений, например: прибыль, рентабельность продукции, совокупные средства (активы), собственные средства, заемные средства и т.д.  
   Бизнес-показатели хранятся в кубах не в виде простых таблиц, как в обычных системах учета или бухгалтерских программах, а в разрезах, представляющих собой основные бизнес-категории деятельности организации: товары, магазины, клиенты, время продаж и т. д.

Информация о работе Шпаргалка по "Программированию и компьютеру"