Автор работы: Пользователь скрыл имя, 09 Декабря 2011 в 12:19, реферат
Я выбрала эту тему в связи с тем, что часто пользуюсь Интернетом и сталкиваюсь с информацией заархивированной различными программами архиваторами. По этому я решила разобраться в том, что из себя представляет такие программы и как ими пользоваться. При эксплуатации компьютера по самым разным причинам возможны порча или потеря информации на магнитных дисках. Это может произойти из-за физической порчи магнитного диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерным вирусом и т.д. Для того чтобы уменьшить потери в таких ситуациях, следует иметь архивные копии используемых файлов и систематически обновлять копии изменяемых файлов.
1.ВВЕДЕНИЕ 3
2.ИСТОРИЯ РАЗВИТИЯ ТЕОРИИ СЖАТИЯ ИНФОРМАЦИИ 4
3.Архиваторы MS DOS. 5
4.ЗАКЛЮЧЕНИЕ 13
5.СПИСОК ЛИТЕРАТУРЫ 14
Министерство транспорта Российской Федерации
Федеральное агентство железнодорожного транспорта
Государственное образовательное учреждение
высшего профессионального образования
Омский
государственный университет
Кафедра
«Прикладной математике и механике»
Реферат по теме
«Программы-архиваторы»
Омск 2011
Содержание:
Список иллюстраций:
Предметный
указатель:
1.ВВЕДЕНИЕ
Я выбрала эту тему в связи с тем, что часто пользуюсь Интернетом и сталкиваюсь с информацией заархивированной различными программами архиваторами. По этому я решила разобраться в том, что из себя представляет такие программы и как ими пользоваться. При эксплуатации компьютера по самым разным причинам возможны порча или потеря информации на магнитных дисках. Это может произойти из-за физической порчи магнитного диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерным вирусом и т.д. Для того чтобы уменьшить потери в таких ситуациях, следует иметь архивные копии используемых файлов и систематически обновлять копии изменяемых файлов. Для копирования файлов можно, разуметься, использовать команды COPY или XCOPY. Но, например, для копирования файлов с жесткого диска емкостью 28 Мбайт необходимо 20 дискет стандартного формата по 1.46 Мбайт. В таком большом количестве дискет даже разобраться довольно трудно, поэтому трудоемкость создания и обновления архива будет весьма значительной. Поэтому для создания архивов употребляются специализированные программы. Архиваторы - это программы, позволяющие уменьшить размер файла для экономии места на диске.
Работа
их заключается в следующем найти
повторяющиеся фрагменты в
2.ИСТОРИЯ РАЗВИТИЯ ТЕОРИИ СЖАТИЯ ИНФОРМАЦИИ
История развития MS DOS1 весьма похожа на историю развития всех информационных технологий. Более того, концепция MS DOS непосредственно заимствована из операционной системы UNIX. UNIX, в свою очередь, базируется на самых первых операционных системах типа OS360 и даже IBM704. Основные алгоритмы архивации данных вначале были опробованы на UNIX, а затем и1ногда процесс развития тех или иных алгоритмов осуществлялся параллельно в MS DOS. В принципе, большинство используемых в настоящее время утилит для архивации начали свою жизнь, начиная с MS DOS 0. Итак, в сороковых годах ученые, работающие в области информационных технологий, ясно поняли, что можно разработать такой способ хранения данных, при котором пространство будет расходоваться более экономно. Клод Шеннон, изучая нюансы различий между семантикой semantics что значит некая сущность и синтаксисом syntax выражается как некая сущность, разработал большинство базовых понятий этой теории.
Понимание того, что одно и то же значение семантика может быть реализовано различными способами, синтаксис, приводит к закономерному вопросу. Какой способ выражения чего-либо является наиболее экономичным. Поиск ответа на этот вопрос привел Шеннона к мысли об энтропии, которая, проще говоря, соотносится с количеством, содержащейся в файле полезной информации. Методы сжатия пытаются увеличивать энтропию файла, то есть уменьшать длину файла, сохраняя при этом всю информацию. Однако Шеннон не был первым, кто задумывался о сущности информации и определении ее количества. Первый шаг на этом пути сделал в 1928 г. Хартли. Основной полученный им результат можно сформулировать примерно так если в заданном множестве, содержащем N элементов, выделен некоторый элемент x, о котором известно лишь, что он принадлежит этому множеству, то, чтобы найти x, необходимо получить количество информации, равное log2N. Эту формулу обычно называют формулой Хартли. Формула Хартли является частным случаем более общей формулы Шеннона, позволяющей найти количество информации в случайном сообщении фиксированного алфавита. Пусть X1, Xn - символы этого алфавита, P1, Pn - вероятности их появления в тексте сообщения, тогда формула Шеннона принимает вид H P1log2 1 P1 Pnlog2 1 Pn, где H - количество бит информации в одном символе сообщения, или энтропия символа сообщения. Это число показывает минимальное среднее число бит, необходимых для представления одного символа алфавита данного сообщения. В некоторых случаях алфавит сообщения может быть неизвестен, тогда выдвигаются гипотезы об алфавите сообщения. Имея разные алфавиты, можно достичь разных коэффициентов сжатия. Например, текстовый файл, если его рассматривать как последовательность битов, имеет энтропию порядка 0.7- 0.9, если как последовательность байтов 0.5 -0.7, хотя популярные программы сжатия уменьшают размеры текстовых файлов до 0.3 - 0.4 от исходного размера. Доказательство Шеннона не было конструктивным, т.е. не содержало способа построения этих оптимальных кодов, а лишь показывало их существование. До появления работы Шеннона, кодирование символов алфавита при передаче сообщения по каналам связи осуществлялось одинаковым количеством бит, получаемым по формуле Хартли. С появлением этой работы начали появляться способы, кодирующие символы разным числом бит в зависимости от вероятности появления их в тексте. Например, часто в файлах некоторые значения байта встречаются чаще других. Таким образом, за счет использования для каждого значения байта кода различной длины можно значительно уменьшить общий размер данных. Эта базовая идея лежит в основе алгоритмов сжатия Шеннона-Фано Shannon-Fano и Хаффмана Huffman. Подобные алгоритмы выбирают более короткие коды для часто встречающихся и более длинные для редко встречающихся значений байта. Обычно текстовые файлы в которых одни значения байтов повторяются гораздо чаще других они сжимают довольно хорошо. Более тридцати лет алгоритм сжатия Хаффмана и его варианты оставались наиболее популярными методами.
3.Архиваторы MS DOS.
С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество программ осуществляющих архивацию информации. Однако в работе с этой информацией иногда нежелательно раскрывать полный архив, чтобы взять один или два требуемых файла или же просто посмотреть, что в архиве за информация. Программы-архиваторы, за исключением единиц, не предоставляют удобных оболочек позволяющих просто, быстро и в наглядной форме разобраться с содержимым архивов. Архиваторы - это программы, позволяющие создавать и обрабатывать архивные копии файлов. При этом из архивные копии имеют меньший размер, чем оригиналы. С помощью специальных алгоритмов сжатия из файлов удаляется вся избыточная информация, а при применения обратных алгоритмов распаковки архивная копия восстанавливается в первоначальном виде. Наиболее известные программы-архиваторы для MS-DOS ARJ разработчик - Robert K. Jung, pkzip компания PKWARE Inc lha Haruyasu Yoshizaki, zoo Rahul Dhesi. Безусловным лидером во всем мире за последние 5 лет стал архиватор RAR. В настоящее время RAR активно вытесняет ZIP как основную утилиту сжатия FTP архивов в сети INTERNET.
RAR2 является единственной всемирно используемой программой, созданной русским программистом за исключением TETRIS. Все архиваторы отличаются используемыми алгоритмами сжатия, форматами архивных файлов, скоростью работы и т.д. Архиватор ARJ Работает из командной строки. Выполняет все функции по обслуживанию архивов .arj , в т.ч. поддержку многотомных архивов. Получить справку по ключам архиватора arj с помощью командarjобычная справка arj подробная справка Arj имеет очень большое число ключей. Можно автоматизировать много действий - создание резервной копии диска, архивирование, начиная с какой-то даты, добавление к имени архива текущей даты arh970821.arj, архивирование файла с конкретного места, несколько уровней сжатия и так далее. В версии 2.55 возможна работа с длинными именами. Достоинства очень большое количество ключей, что дает возможность автоматизировать большое число функций. Защита архива от повреждений. Недостатки отсутствие диалогового режима, некоторое неудобства работы при наличии какого-то ключа в переменной окружения ARJSW и строке запуска - взаимное уничтожение. PKZIP Работает из командной строки. Различные функции по обслуживанию ар2хивов .zip выполняются разными программами pkzip - помещение файлов в архив pkunzip - извлечение файлов из архива zip2exe - создание самораспаковывающегося архива pkzipfix - восстановление поврежденного архива. Изучить справку по работе с архиватором pkzip с помощью команд pkzip h pkunzip h zip2exe h RAR Архиватор RAR v2.50 для DOS - Интегрированная программа управления архивами RAR- это очень мощное средство для создания архивов и управления ими.
Возможности RAR. Полноэкранный интерактивный интерфейс отключаемый. Поддержка мыши и меню. Поддержка не-RAR архивов. Стандартный интерфейс командной строки . Оригинальный высокоэффективный алгоритм сжатия данных. Специальный алгоритм для сжатия мультимедийных файлов. Лучшая степень упаковки, чем у аналогичных продуктов, за счет использования режима непрерывного сжатия. Информация об авторе архива только в зарегистрированной версии. Самораспаковывающиеся SFX обычные и многотомные архивы. Восстановление физически поврежденных архивов. Язык программирования для инсталляционных SFX-архивов. Блокировка, шифрование, список порядка файлов, метки томов и др.
QUARK Quark является архиватором классического типа, использующим LZ77-алгоритм для уплотнения исходных данных путем кодирования повторяющихся последовательностей байт RSE-алгоритм с последующим вторичным уплотнением сжатого потока кодами Хаффмана. Подобные методы используют все три лидера в области упаковки данных - архиваторы ARJ, LHA, PkZIP.Тем не менее, Quark добивается лучших результатов в компактности данных при скорости лучшей, чем LHA, не меньшей чем у ARJ и не сильно отличающейся от скорости PkZIP, при использовании им т.н. максимальной компрессии данных.
Это
обусловлено несколькими
1 Quark работает с плавающим размером окна от 32Kb до 64Kb против фиксированных 16Kb у LHA, и 32Kb у PkZIP и ARJ.
2
Quark выполняет оптимизацию Первого
рода оптимальность адресов
3 Quark использует текстовую редукцию для текстовых файлов.
4 Quark заносит в архив минимум служебной информации, не претендуя на иные аппаратные платформы и операционные системы.
GZIP Gzip сокращает размер заданных файлов, используя кодирование Зива-Лемеля LZ77. Когда возможно, каждый файл замещается файлом с расширением .gz, при этом сохраняются владелец, режимы, доступ и времена модификации Другие расширения –gz для VMS, z для MSDOS, OS2, FAT и Atari. Если никаких файлов не указано или имя файла то пакуется стандартный ввод и выдается на стандартный вывод. Gzip пытается паковать только обычные файлы, в частности GZip игнорирует символические ссылки. Gzip использует алгоритм Зива-Лемеля также как Zip, PKZIP. Итоговый размер, полученного файла после сжатия, зависит от размера исходного файла и наличия в нем общих подстрок. Обычно, такой текст, как исходный код или английский текст сокращается на 60-70. Паковка с использованием этого алгоритма обычно лучше, чем при использовании LZW его использует Compress, кодирование Хаффмана его использует Pack или адаптированное кодирование Хаффмана Compact. Упаковка происходит независимо от того, увеличился ли размер упакованного файл в сравнении с оригиналом или нет. Причина расширения - несколько байтов для заголовка Gzip файла, плюс 5 байтов для каждого 32К блока, или отношение расширения 0.015 от длины файла. Заметим, что фактическое число занятых на диске блоков уже никогда не возрастает. Gzip сохраняет режимы доступа, владельцев и время модификации файлов при упаковке и распаковке ARJZ ARJZ по воле автора программы произносится как арж-зет - это архиватор, основанный на известной программе ARJ Роберта Юнга. В отличие от таких современных средств архивирования, как ARJем. По этому параметру ARJZ находится на уровне RARUC2 4. Так называемый полуэкранный интерфейс. ARJZ может во время работы выводить на экран окошко с двумя индикаторами процесса, именем архива и именем пакуемого файла - это замечательная особенность предназначена специально для таких программ, как ARC- или ARJVIEW, SHEZ, ARJMENU, NC 4.0, DN и др.
5. Здесь, конечно не место для описания преимуществ UNARJZа, но тем не менее Высокая скорость распаковки. Даже на XT UNARJZ работает в среднем в 1.5-2 раза быстрее, чем ARJ, а при использовании специальной опции см. UNARJZ.DOC разница возрастает ещ в два раза. Важно отметить, что процедуры деархиватора оптимизированы отдельно под процессоры 286, 386, 486 и Pentium.
6. ARJZ написан таким образом, что его можно использовать и как отдельный архиватор и как надстройку над ARJем если он не может распознать команд или опций командной строки, то запускает оригинальную программу. Это, фактически, означает, что, используя ARJZ, вы, тем не менее, не теряете ни одной опции ARJа. Недостатки ARJZ 1 В ARJZ по крайней мере, пока нет поддержки многотомных multi volume, резервных backup и самораспакующихся SFX архивов. Заметьте, что UNARJZ распаковывает любые архивы, созданные ARJ.2 ARJZ не является полноценным архиватором в том смысле, что он самостоятельно не удаляет и не переименовывает файлы в архивах, не может сливать архивы и т.д. Всю эту работу можно сделать с помощью оригинальной программы, поэтому нельзя говорить, что пара ARJZUNARJZ полностью заменяет собой ARJ. Далее будут кратко рассмотрены менее популярные архиваторы, которые, однако, все еще используются в среде MS DOS.
Arhangel - этот архиватор базируется на архиваторе HA, но несовместим с ним. По заявлению создателей этот архиватор наиболее подходит для сжатия изображений TIFF,BMP. Достоинства хорошее сжатие графической информации. Недостатки обилие ключей для установки максимального сжатия. JAR - новый архиватор из семейства ARJ. У меня он показал более плохие результаты, нежели WinRAR, хотя в документации сказано, что это лучший архиватор в терминах компрессии. Другие тесты тоже, вроде, подтверждают, что этот архиватор лучше WinRAR и других подобных, но он, безусловно, не занимает первое место. Возможности примерно такие же, какие у ARJ. Достоинства достаточно быстрая работа, поддержка recovery record возможность восстановления сбойных архивов. Недостатки нет диалогового режима работы. HA - Архиватор, написанный Harry Hirvola в 1993 году. Работает медленно но, по результатам тестов, хорошо. В данном тесте он не на первом месте по степени сжатия. Но, он особенно хорошо сжимает текстовые файлы, была проведена отдельная проверка, которая подтвердила данный факт - несмотря на солидный возраст, этот архиватор неплохо сжимает на 20 меньше, чем PKZIP. Таким образом, для сжатия больших текстовых файлов лучше пользоваться HA LGHA чем WinRAR. Появился архиватор LGHA, который создает точно такие же архивы, но немного быстрее. Недостатки Малое количество ключей, несколько нестандартные команды. Невозможность создания архивов на несколько дискет и самораспаковывающиеся архивов. Не поддерживает шифрование. UC II Ultra compress программа, работающая из командной строки, но имеющая диалоговое меню для настройки различных параметров.