Технология подготовки электронных документов с использованием программных средств

Автор работы: Пользователь скрыл имя, 15 Декабря 2010 в 21:43, реферат

Краткое описание

Прежде чем рассматривать технологию подготовки электронного документа мы должны разобрать, что же собственно представляет из себя эл. документ.
Э.Д - информация, зафиксированная на материальном носителе в виде набора символов, звукозаписи или изображения и предназначенная для передачи во времени и пространстве с использованием средств вычислительной техники и электросвязи с целью хранения и общественного использования.

Содержимое работы - 1 файл

Технология подготовки электронных документов с использованием программных средств.doc

— 94.00 Кб (Скачать файл)

ЭЛЕКТРОННЫЙ ДОКУМЕНТ

Прежде чем рассматривать  технологию подготовки электронного документа  мы должны разобрать, что же собственно представляет из себя эл. документ.

Э.Д - информация, зафиксированная на материальном носителе в виде набора символов, звукозаписи или изображения и предназначенная для передачи во времени и пространстве с использованием средств вычислительной техники и электросвязи с целью хранения и общественного использования.

Э.Д - Форма представления информации в целях ее подготовки, отправления, получения или хранения с помощью электронных технических средств, зафиксированная на магнитном диске, магнитной ленте, лазерном диске и ином электронном материальном носителе.

Э.Д - Документ, в котором информация представлена в электронно-цифровой форме.

Документом может  быть и сообщение электронной  почты, и звуковой файл, и видеофильм. Как же свести воедино эти разрозненные понятия? Наилучшим представляется определение, предложенное отделением XSoft компании Xerox, согласно которому "документ - это совокупность информации, доступная человеческому восприятию".

ФОРМАТЫ ЭЛ. ДОКУМЕНТОВ.

В мире существует сейчас только один зрелый стандарт на формат электронного документа — это  ODF, который в 2006 г. принят под № ISO 26300.

ODF – это формат хранения документов изначально создан в 1999 г. как открытая и свободная альтернатива закрытым форматам и с соблюдением всех процедур и формальностей, в 2006 г. формат был принят как международный стандарт,полное описание формата занимает 738 страниц.

На сегодня, формат ODF не зависит ни от конкретной компании, ни от конкретного приложения. Формат доступен для чтения и записи всем без каких-либо ограничений, связанных с лицензиями или патентами.

Такой подход даёт ODF ряд существенных преимуществ. Разработка формата некоммерческой организацией гарантирует обратную совместимость. Формат поддерживается уже более чем в 30 пакетах, работающих не только под Windows, но и под Linux.

Наряду с этим, компания Microsoft затратила колоссальные усилия и средства на продвижения своего формата OOXML. Его описание занимает 6 546 страниц, и, при этом, является не полным. Однако даже сама Microsoft не смогла реализовать данный формат. Процесс принятия данного формата в ISO сопровождался громкими международными скандалами. Принятая в спешке спецификация MS OOXML содержит более 300 нерешённых проблем технического характера.

Напротив, в России в настоящее время заканчиваются  работы по принятию ODF в качестве ГОСТа. Принимая его государство преследует цель предоставить бизнесу и гражданам возможность использовать электронные документы без отчислений третьим фирмам, сократить риски потери документов за счёт гарантии обратной совместимости.

Некоторые предприятия  регламентируют для внутреннего  обращения правила форматирования электронного документа.

В отличие от электронной копии страницы, отсканированной или посланной на принтер, в электронном документе отсутствуют поля и связано это с тем, что по правилам этикета работа по форматированию сводится к минимуму. Зачастую документы в организацию принимаются только в таком виде.

Например размер копии листа А4 без полей с  текстовой информацией должен быть равен 3200x2200 пикселей.

По сравнению с  другими документами, электронный  документ имеет ряд следующих  преимуществ:

1)Даёт возможность поиска по ключевым словам.

2)Не изнашивается с течением времени.

3)Может содержать URL-ссылки, выпадающие подсказки и множество других информационных дополнений.

4)Электронный документ легче использовать в системах автоматизации процессов.

5)Меньше трудоёмкость редактирования, тиражирования, перевода и множество других функциональных усовершенствований.

ЭЛЕКТРОННАЯ ЦИФРОВАЯ ПОДПИСЬ

Каждый эл. документ оснащен цифровой подписью ,позволяющий установить отсутствие искажения информации в электронном документе с момента формирования ЭЦП(Электронная цифровая подпись) и проверить принадлежность подписи владельцу сертификата ключа ЭЦП. Значение реквизита получается в результате криптографического преобразования информации с использованием закрытого ключа ЭЦП

Использование цифровой подписи позволяет осуществить:

  1. Контроль целостности передаваемого документа: при любом случайном или преднамеренном изменении документа подпись станет недействительной, потому что вычислена она на основании исходного состояния документа и соответствует лишь ему.
  2. Защиту от изменений (подделки) документа: гарантия выявления подделки при контроле целостности делает подделывание нецелесообразным в большинстве случаев.
  3. Невозможность отказа от авторства. Так как создать корректную подпись можно, лишь зная закрытый ключ, а он должен быть известен только владельцу, то владелец не может отказаться от своей подписи под документом.
  4. Доказательное подтверждение авторства документа: Так как создать корректную подпись можно, лишь зная закрытый ключ, а он должен быть известен только владельцу, то владелец пары ключей может доказать своё авторство подписи под документом. В зависимости от деталей определения документа могут быть подписаны такие поля, как «автор», «внесённые изменения», «метка времени» и т. д.

Теперь мы знаем что из себя представляет эл. документ и можем рассмотреть какие же технологии используются в его подготовке

Основные  разновидности систем создания электронных  документов

Несмотря на свое разнообразие, современные средства подготовки электронных документов служат единой цели: созданию документов, которые можно просматривать, аннотировать и распространять с помощью компакт-дисков, сетей или служб оперативного доступа к информации. В зависимости от используемой ими технологии эти продукты можно разделить на четыре категории.

1 категория

Наиболее развитыми  являются средства подготовки документов на базе гипертекстового языка описания документов Hypertext Markup Language (HTML). Именно эта технология лежит в основе сервисной системы доступа к информации World-Wide Web, применяемой в сети Internet. 
 

2 категория

Продукты на базе промышленного стандарта Standard Generalized Markup Language (SGML). Он представляет собой набор правил для описания структуры и управления содержанием любого электронного документа и служит для создания платформно-независимых документов, а также для описания их экранного представления. 
 

3 категория

Продукты, которые преобразуют документы из любого приложения в переносимый формат, благодаря чему можно читать, печатать и распространять документы на любой платформе без применения приложений, шрифтов и графических средств, с помощью которых они были созданы. К данной группе принадлежат такие популярные системы создания электронных документов, как Acrobat компании Adobe и Common Ground фирмы No Hands Software 

4 категория

И наконец, существует четвертая категория продуктов  подготовки документов с использованием гипертекстовых средств. К ней относятся  системы, позволяющие собрать из различных файлов информацию, записанную в свободной форме, и объединить ее в единую структуру. Полученный в результате документ содержит множество ссылок на исходные файлы. Это дает возможность организовывать связи между соответствующими материалами, благодаря которым читатель может легко просматривать взаимосвязанные главы, секции и разделы различных документов.

ИСТОРИЯ СОЗДАНИЯ И РАЗРАБОТКИ,ОПИСАНИЕ СТАНДАРТОВ

  1. HTML - язык службы World-Wide Web HTML - это относительно новый стандарт, используемый программами-броузерами службы World-Wide Web (WWW) в сети Internet. Благодаря ему можно не только форматировать документы, но и осуществлять связь текста и изображений с документом, расположенным на другом сервере WWW. Создатель языка HTML - Тим Бернерс-Ли (Tim Berners-Lee), решивший в 1991 г. создать для Европейского центра ядерных исследований (CERN) эффективное средство работы в сетях Internet и USENET. Он разработал службу WWW, язык HTML, протокол HyperText Transport Protocol (HTTP) и указатели Uniform Resource Locator (URL). Основное достоинство данных средств заключается в высокой степени согласованности и интеграции. HTML позволяет создавать документы, совместимые с броузерами WWW (такими, как Mosaic), путем вставления управляющих кодов (тегов) в ASCII-текст для обозначения заголовков, названий, графических изображений и гипертекстовых связей. Большинство тегов языка HTML - это команды форматирования текста. Исключение составляют специальные теги гипертекстовых связей, или "якоря" (anchor), отличающиеся от остальных тем, что они содержат атрибуты, являющиеся гипертекстовыми ссылками на другие документы. По мнению некоторых аналитиков, "якорь" стал наиболее важным вкладом языка HTML в информационную революцию, так как именно этот тег обеспечивает связь документов с внешними приложениями, такими как сообщения электронной почты. В качестве гипертекстовых ссылок могут использоваться и указатели URL, определяющие путь доступа к ресурсам Internet. С помощью этих указателей, а также других средств HTML строятся ссылки к любым типам данных. URL может указывать на другой гипертекст, изображение, звуковой файл или, например, на документ редактора Microsoft Word. Помимо изображений, HTML поддерживает и формы, которые позволяют собирать и обрабатывать информацию, вводимую различными пользователями. Стандарт HTML продолжает развиваться, поэтому не все продукты подготовки HTML-документов соответствуют самой последней версии языка. В настоящее время существует четыре уровня совместимости с HTML: 0, 1, 2 и 3, причем уровни 0 и 1 являются соответственно подмножествами уровней 1 и 2, а уровень 3 (известный также как HTML+) находится пока на стадии разработки.
  2. Standard Generalized Markup Language (SGML) - наиболее зрелый стандарт подготовки электронных документов, действующий на протяжении многих лет. До недавнего времени из- за сложности реализации он применялся в основном в военной промышленности и прочих крупных приложениях. Однако сегодня в информационной технологии наблюдается рост его популярности. Такие крупные компании, как Microsoft, Novell, Xerox и другие разрабатывают продукты для работы с SGML. Для современного общества характерен огромный объем информации, представленной в электронном виде в библиотеках, хранилищах данных, БД или размещенной в дисковых файлах. Чтобы воспользоваться достижениями информационной революции, нужны средства быстрого доступа к информации, позволяющие объединять взаимосвязанные материалы и обладающие широкими возможностями поиска данных. Именно для этого и был разработан стандарт SGML представляющий собой набор правил для описания структуры и управления содержанием электронных документов. Это открытый стандарт, которым можно пользоваться бесплатно, но он требует времени на обучение и применения приложений, облегчающих работу с ним и расширяющих его возможности. Из чего состоит SGML-документ Система подготовки документов в стандарте SGML включает в себя модули для создания, редактирования и распространения документов. Так как в настоящее время на рынке отсутствуют законченные решения, пользователь вынужден подбирать отдельные продукты самостоятельно. Для этого необходимо предварительное изучение их возможностей и приобретение общих навыков работы с SGML-документами. Документ в стандарте SGML состоит из трех частей: описания, определения типа (Document Type Definition - DTD) и содержания. Фактически они представляют собой текст в формате ASCII.

    А) Описание - это заголовок файла, содержащий информацию о системе, в которой будет использоваться документ. Определение типа задает структуру документа. Это программа в коде SGML, создание которой представляет наиболее трудный этап процесса подготовки SGML-документа. При этом основной задачей является определение иерархии элементов документа.

    Б) DTD- определение точно отражает структуру создаваемого документа (связь между элементами) и содержит информацию об обработке таких объектов, как графические изображения, звуковая и видеоинформация.

    В) Третья часть документа - его текстовое содержание, помеченное тегами, точно соответствующими спецификациям, заданным в DTD- определении. Графические и другие нетекстовые объекты не входят в данный файл и обрабатываются как внешние компоненты.

 Еще недавно подготовка SGML-документов требовала немало усилий и, как правило, выполнялась с помощью сторонних консультантов. Однако в последнее время в продаже появились новые, ориентированные на ПК продукты, автоматизирующие процесс создания документов. Многие поставщики разрабатывают стандартные DTD-определения для различной технической документации и распространенных видов отчетов. После создания DTD-определения следует воспользоваться SGML- редактором, который позволяет вводить данные и осуществлять навигацию документа в зависимости от структуры тегов. SGML- редактор содержит синтаксический анализатор, проверяющий соответствие DTD-определения содержанию документа. В продаже имеется немало SGML-редакторов, таких как Author/Editor компании SoftQuad или Adept фирмы ArborText. В ближайшее время подобные средства войдут в состав Word for Windows, WordPerfect и других популярных текстовых процессоров.

Кроме того, можно  преобразовать существующий документ в SGML- документ. Для этого требуется либо создать собственную программу-конвертор, либо купить готовый продукт, как например FastTag компании Avalanche Development, либо обратиться в фирму, предоставляющую подобные услуги. Чтобы воспользоваться SGML-документом, необходим специальный продукт - преобразователь. Он преобразует SGML-документ в формат, в котором его можно печатать, редактировать, просматривать, организовывать поиск или вставлять в другие приложения, например в базу данных. Наиболее простые преобразователи представляют собой программу просмотра, или броузер, но в продаже имеются и более развитые средства, такие как TagWrite Alchemy компании Zandar или DynaText фирмы EBT. Перспективы технологии SGML Хотя ориентированные на ПК средства подготовки SGML-документов и не получили пока широкого признания, потенциал этой технологии высок. Ее возможности не ограничиваются только созданием и использованием электронных документов. Стандарт SGML может служить основой для подготовки интеллектуальных документов, став неотъемлемым средством быстро развивающейся информационной технологии.

Ведущие компании начинают выпуск продуктов для создания SGML- документов. Например, Microsoft анонсировала SGML Author for Word - дополнение к Word, позволяющее с помощью этого редактора готовить документы в стандарте SGML. Интерес к SGML связан также с ростом популярности гипертекстового формата записи файлов HTML, который является подмножеством SGML и предназначен для доступа к информации в сети Internet через службу World-Wide Web.

Упрощение SGML

XML (Extensible Markup Language) - это новый SGML- производный язык разметки документов, позволяющий структурировать информацию разного типа, используя для этого произвольный набор инструкций.

Что такое XML?

Сегодня XML может  использоваться в любых приложениях, которым нужна структурированная информация - от сложных геоинформационных систем, с гигантскими объемами передаваемой информации до обычных "однокомпьютерных" программ, использующих этот язык для описания служебной информации. При внимательном взгляде на окружающий нас информационный мир можно выделить множество задач, связанных с созданием и обработкой структурированной информации, для решения которых может использоваться XML:

а)В первую очередь, эта технология может оказаться полезной для разработчиков сложных информационных систем, с большим количеством приложений, связанных потоками информации самой различной структурой. В этом случае XML - документы выполняют роль универсального формата для обмена информацией между отдельными компонентами большой программы.

б)XML является базовым стандартом для нового языка описания ресурсов, RDF, позволяющего упростить многие проблемы в Web, связанные с поиском нужной информации, обеспечением контроля за содержимым сетевых ресурсов, создания электронных библиотек и т.д.

в)Язык XML позволяет описывать данные произвольного типа и используется для представления специализированной информации, например химических, математических, физических формул, медицинских рецептов, нотных записей, и т.д. Это означает, что XML может служить мощным дополнением к HTML для распространения в Web "нестандартной" информации. Возможно, в самом ближайшем будущем XML полностью заменит собой HTML, по крайней мере, первые попытки интеграции этих двух языков уже делаются (спецификация XHTML).

г)XML-документы могут использоваться в качестве промежуточного формата данных в трехзвенных системах. Обычно схема взаимодействия между серверами приложений и баз данных зависит от конкретной СУБД и диалекта SQL, используемого для доступа к данным. Если же результаты запроса будут представлены в некотором универсальном текстовом формате, то звено СУБД, как таковое, станет "прозрачным" для приложения. Кроме того, сегодня на рассмотрение W3C предложена спецификация нового языка запросов к базам данных XQL, который в будущем может стать альтернативой SQL.  
 

Информация о работе Технология подготовки электронных документов с использованием программных средств