Автор работы: Пользователь скрыл имя, 16 Декабря 2011 в 10:06, реферат
Информация – сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.
Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т. е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
2. Технологии работы с информацией.
2.1. Технология кодирования информации
Кодирование информации — представление сведений в стандартной форме. Одни и те же сведения могут быть представлены в нескольких разных формах, и наоборот, разные сведения можно представить в похожей форме. Например, можно использовать словесное описание новой марки автомобиля, а можно представить его вид в нескольких детальных фотографиях. Другой пример — медицинские справки одной формы имеют одинаковый внешний вид, но описывают разные болезни, так как выданы разным людям.
С появлением компьютеров возникла необходимость кодирования всех видов информации, с которой имеет дело и отдельный человек и всё человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров: грандиозные достижения человечества — письменность и арифметика — не что иное, как системы кодирования речи и числовой информации.
Кодирование чисел
Чтобы использовать
числа, нужно их как-то называть и
записывать, нужна система нумерации.
Различные системы счёта и
записи чисел тысячелетиями
Заметим, что выбор числа 10 в качестве основания системы счисления объясняется традицией, а не какими-то замечательными свойствами числа 10. Вообще, представление числа N в р-ричной системе счисления, это:
N=an*pn+an-l*pn-l+...+al*pl+ao
В Вавилоне, например, использовалась 60-ричная система счисления, алфавит содержал цифры от 1 до 59, числа 0 не было, таблицы умножения были очень громоздкими, поэтому очень скоро она была забыта, но отголоски её былой распространённости можно наблюдать и сейчас — деление часа на 60 минут, деление круга на 360 градусов.
Двоичная система счисления
Двоичная система счисления была придумана математиками и философами ещё до появления компьютеров (XVII — XIX вв.). Выдающийся математик Лейбниц говорил: "Вычисление с помощью двоек... является для науки основным и порождает новые открытия... При сведении чисел к простейшим началам, каковы 0 и 1, везде появляется чудесный порядок". Позже двоичная система была забыта, и только в 1936 — 1938 годах американский инженер и математик Клод Шеннон нашёл замечательные применения двоичной системы при конструировании электронных схем. Рассмотрим пример представления числа в двоичной системе счисления:
Пример 2.1.1. Переведём число 2000 в двоичную систему.
1. Делим 2000 на основание новой системы счисления — 2:
2000:2=1000(0 - остаток),
1000:2=500(0),
500:2=250(0),
250:2=125(0),
125:2=62(1),
62:2=31(0),
31:2=15(1),
15:2=7(1),
7:2=3(1),
3:2=1(1)
2. Собираем последнее частное от деления (всегда равно 1) и остатки от деления и записываем их по порядку, начиная снизу :
200010==111110100002
Для проверки переведём полученное число в десятичную систему счисления, для этого:
1. Выделим двоичные разряды числа, то есть, степени числа 2, начиная с 0-й:
1 | 1 | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 0 | 0 |
210 | 29 | 28 | 27 | 26 | 25 | 24 | 23 | 22 | 2' | 2° |
2. Запишем сумму произведений 0 и 1 на соответствующую степень числа 2 (см. представление числа в р-ричной системе счисления):
0*20+0*21+0*22+0*23+l*24+0*25+
Существуют системы счисления, родственные двоичной. При работе с компьютерами иногда приходится иметь дело с двоичными числами, так как двоичные числа заложены в конструкцию компьютера. Двоичная система удобна для компьютера, но неудобна для человека — слишком длинные числа неудобно записывать и запоминать. На помощь приходят системы счисления, родственные двоичной — восьмеричная и шестнадцатеричная.
Например, в шестнадцатеричной системе для записи чисел предназначены 10 арабских цифр и буквы латинского алфавита {А, В, С, D, Е, F}. Чтобы записать число в этой системе счисления, удобно воспользоваться двоичным представлением числа. Возьмём для примера то же число — 2000 или 11111010000 в двоичной системе. Разобьём его на четвёрки знаков, двигаясь справа налево, в последней четвёрке слева припишем незначащий 0, чтобы количество знаков в триадах было по четыре: 0111 1101 0000. Начнём перевод — числу 0111 в двоичной системе соответствует число 7 в десятичной (710=1*20+1*21+1*22), в шестнадцатеричной системе счисления цифра 7 есть; числу 1101 в двоичной системе соответствует число 13 в десятичной (13=1*20 + 0*21 + 1*22 + 1*23), в шестнадцатеричной системе этому числу соответствует цифра D, и, наконец, число 0000 — в любой системе счисления 0. Запишем теперь результат:
111110100002 = 7D016.
Кодирование координат
Закодировать можно не только числа, но и другую информацию. Например, информацию о том, где находится некоторый объект. Величины, определяющие положение объекта в пространстве, называются координатами. В любой системе координат есть начало отсчёта, единица измерения, масштаб, направление отсчёта, или оси координат. Примеры систем координат — декартовы координаты, полярная система координат, шахматы, географические координаты.
Кодирование музыки
Как всякий звук,
музыка является не чем иным, как
звуковыми колебаниями, зарегистрировав
которые достаточно точно, можно
этот звук безошибочно воспроизвести.
Нужно только непрерывный сигнал,
которым является звук, преобразовать
в последовательность нулей и
единиц. С помощью микрофона звук
можно превратить в электрические
колебания, измерить амплитуду колебаний
через равные промежутки времени (несколько
десятков тысяч раз в секунду).
Каждое измерение записывается в
двоичном коде. Этот процесс называется дискретизац
Кодирование текста
Текст закодировать довольно просто. Для этого достаточно как-нибудь перенумеровать все буквы, цифры, знаки препинания и другие используемые при письме символы. Для хранения одного символа чаще всего используется восьмиразрядная ячейка — один байт, иногда два байта (иероглифы, например). В байт можно записать 256 различных чисел, значит, это позволит закодировать 256 различных символов. Соответствие символов и их кодов задаётся в специальной таблице. Коды записываются в шестнадцатеричной системе, так как для записи числа из восьми разрядов нужно всего две шестнадцатеричных цифры.
Кодирование изображений
Цифровые персональные компьютеры хорошо работают с числами, но не умеют обрабатывать непрерывные величины. Но человеческий глаз можно обмануть: изображение, составленное из большого числа отдельных мелких деталей, воспринимается как непрерывное. Если разбить картинку вертикальными и горизонтальными линиями на маленькие мозаичные квадратики, получим так называемый растр — двумерный массив квадратиков. Сами квадратики — элементы растра или пиксели (picture's element) — элементы картинки. Цвет каждого пикселя кодируется числом, тогда, задав по порядку номера цветов (слева направо или сверху вниз), можно описать любую картинку. Часть информации неизбежно потеряется, но чем больше растр (мельче пиксели), тем точнее воспроизводится картинка.
Для описания черно-белых изображений используются оттенки серого цвета, то есть при кодировании учитывается только яркость. Она описывается одним числом, поэтому для кодирования одного пикселя требуется от 1 до 8 бит: чёрный цвет — 0, белый цвет — N=2k-l, где k — число разрядов, которые отводятся для кодирования цвета. Например, при длине ячейки в 8 бит это 256-1=255. Человеческий глаз в состоянии различить от 100 до 200 оттенков серого цвета, поэтому восьми разрядов вполне хватает.
Цветные изображения
воспринимаются нами как сумма трёх
основных цветов — красного, зелёного
и синего. Например, сиреневый = красный
+ синий; жёлтый = красный + зелёный; оранжевый
= красный + зелёный, но в другой пропорции.
Поэтому достаточно закодировать цвет
тремя числами — яркостью его
красной, зелёной и синей составляющих.
Этот способ кодирования называется RGB (
Кодирование фильмов
Фильм представляет собой последовательность быстро сменяющих друг друга кадров, на которых изображены последовательные фазы движения. Поскольку известны принципы кодирования отдельных кадров, то закодировать фильм как последовательность таких кадров ничего не стоит. Звук записывают независимо от изображения. При демонстрации фильма важно только добиться синхронизации звука и изображения (в кино для этого используют хлопушку — по щелчку хлопушки совмещаются звук и изображение).
Закодированный
фильм несёт в себе информацию
о размере кадра в пикселях
и количество используемых цветов;
частоте и разрешении для звука;
способе записи звука (покадровый или
непрерывный для всего фильма). После этого
следует последовательность закодированных
картинок и звуковых фрагментов.
2.2. Технология упаковки информации
Упаковка нужна для сокращения длины сообщения и уменьшения времени для его передачи по каналам связи. Все используемые методы упаковки информации можно разделить на два класса: упаковка без потери информации и упаковка с потерей информации.
Упаковка без потери информации — исходное сообщение можно точно восстановить по упакованному. Первый способ такой упаковки представлен в 1952 году Хаффманом, он основан на том, что в обычном тексте частота появления разных символов различна. При стандартном кодировании “I символ = 1 байт” кодировка достаточно проста, но перед длительным хранением или при передаче по каналам связи можно использовать более сложную кодировку. По методу Хаффмана часто встречающиеся символы кодируются короткими последовательностями битов (то есть меньше 8), а редко встречающиеся — длинными (больше 8). В общей сложности, при такой кодировке в среднем требуется меньше 8 бит на символ.
Пример 2.2.1.
Пусть в тексте из 1000 символов 50% пробелов, закодируем текст по такому правилу:
если встретился пробел — допишем в конец последовательности О, если не пробел — допишем 1, за ней двоичный код этого символа.
Таким образом, для пробела нужен 1 бит, для остальных символов 8 + 1 = 9 бит. При обычной кодировке на хранение текста нужно 1000 * 8 = 8000 бит, при кодировке методом Хаффмана — 500+500х9= 5000 бит.
Второй способ — учёт повторений. Он состоит в том, что в сообщениях часто встречаются несколько подряд идущих одинаковых байтов, а некоторые последовательности байтов повторяются многократно. При упаковке такие последовательности можно заменить на специальные команды “повторить данный байт N раз” или “взять часть текста длиной К байт, которая уже встречалась М байтов назад”. Для упаковки текстов используется как раз такой способ упаковки, а для упаковки изображений — первый способ.