Автор работы: Пользователь скрыл имя, 23 Февраля 2011 в 16:19, реферат
Решая различные задачи, человек вынужден использовать информацию об окружающем нас мире. И чем более полно и подробно человеком изучены те или иные явления, тем подчас проще найти ответ на поставленный вопрос. Так, например, знание законов физики позволяет создавать сложные приборы, а для того, чтобы перевести текст на иностранный язык, нужно знать грамматические правила и помнить много слов.
Введение 6
Глава 1. Объемный способ измерения информации 7
Таб. 1 пример объемного измерения 7
Таб. 2 Единицы измерения информации в вычислительной технике 8
Глава 2. Алфавитный подход 9
Глава 3. Вероятностный подход к измерению информации 10
Таб. 3 Частотный словарь русского языка 12
Глава 4. Теория разнообразия Р. Эшби 13
Глава 5. Алгоритмический подход А. Н. Колмогорова 16
Глава 6. Другие подходы к измерению информации 20
Глава 7. Единицы измерения информации. 26
Таб. 4 Таблица логарифмов 29
Заключение 31
Список использованной литературы: 33
Приложение
Решая
различные задачи, человек вынужден
использовать информацию об окружающем
нас мире. И чем более полно
и подробно человеком изучены
те или иные явления, тем подчас проще
найти ответ на поставленный вопрос. Так,
например, знание законов физики позволяет
создавать сложные приборы, а для того,
чтобы перевести текст на иностранный
язык, нужно знать грамматические правила
и помнить много слов.
Часто приходится слышать, что сообщение
или несет мало информации или, наоборот,
содержит исчерпывающую информацию. В
информатике используются различные подходы
к измерению информации. Задача данного
реферата – осветить основные подходы
к измерению информации.
Глава1. Объемный
способ измерения информации
Технический способ измерения количества информации (или, точнее, информационного объема сообщения) основан на подсчета количества символов, из которых образовано сообщение. При этом не учитывается смысловое содержание сообщения. Например, многократное повторение одного и того же текста не несет новой информации, однако в результате занимает больший объем памяти, требует большего времени для передачи и т.п. Поэтому этот способ удобен в технических расчетах
За 1 бит в этом случае принимается один двоичный символ в сообщении.
Информационный
обьем сообщения (информационная емкость
сообщения) - количество информации в сообщении,
измеренное в битах, байтах или производных
величинах .
|
|
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. С позиций computer science носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. Согласно Колмогорову, информативность последовательности символов не зависит от содержания сообщения, а определяется минимально необходимым количеством символов для ее кодирования. Алфавитный подход является объективным, т.е. он не зависит от субъекта, воспринимающего сообщение. Смысл сообщения учитывается на этапе выбора алфавита кодирования либо не учитывается вообще.
Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода.
При алфавитном подходе к измерению информации количество информации зависит от т объёма текста и от мощности, а не от содержания.
Мощность алфавита — полное число символов алфавита (N). Каждый символ несёт i бит информации; число i можно определить из уравнения: 2i = N.
Количество информации, содержащееся в символьном сообщении, равно К х i, где К – число символов в тексте сообщения а i – информационный вес символа, который находится из уравнения 21 = N, где N – мощность используемого алфавита.
Применение алфавитного подхода удобно при использовании технических средств работы с информацией.
Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 году. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем x выражается формулой: x=log2 (1/p). Качественную связь между вероятностью события и количеством информации в сообщении об этом событии можно выразить следующим образом - чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии.
Рассмотрим некоторую ситуацию. В коробке имеется 50 шаров. Из них 40 белых и 10 черных. Очевидно, вероятность того, что при вытаскивании "не глядя" попадется белый шар больше, чем вероятность попадания черного. Можно сделать заключение о вероятности события, которые интуитивно понятны. Проведем количественную оценку вероятности для каждой ситуации. Обозначим pч - вероятность попадания при вытаскивании черного шара, рб - вероятность попадания белого шара. Тогда: рч=10/50=0,2; рб40/50=0,8. Заметим, что вероятность попадания белого шара в 4 раза больше, чем черного. Делаем вывод: если N - это общее число возможных исходов какого-то процесса (вытаскивание шара), и из них интересующее нас событие (вытаскивание белого шара) может произойти K раз, то вероятность этого события равна K/N. Вероятность выражается в долях единицы. Вероятность достоверного события равна 1 (из 50 белых шаров вытащен белый шар). Вероятность невозможного события равна нулю (из 50 белых шаров вытащен черный шар).
Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем x выражается формулой: . В задаче о шарах количество информации в сообщении о попадании белого шара и черного шара получится: .
Рассмотрим некоторый алфавит из m символов: и вероятность выбора из этого алфавита какой-то i-й буквы для описания (кодирования) некоторого состояния объекта. Каждый такой выбор уменьшит степень неопределенности в сведениях об объекте и, следовательно, увеличит количество информации о нем. Для определения среднего значения количества информации, приходящейся в данном случае на один символ алфавита, применяется формула . В случае равновероятных выборов p=1/m. Подставляя это значение в исходное равенство, мы получим
Рассмотрим следующий пример. Пусть при бросании несимметричной четырехгранной пирамидки вероятности выпадения граней будут следующими: p1=1/2, p2=1/4, p3=1/8, p4=1/8, тогда количество информации, получаемое после броска, можно рассчитать по формуле:
Для симметричной четырехгранной пирамидки количество информации будет: H=log24=2(бит).
Заметим, что для симметричной пирамидки количество информации оказалось больше, чем для несимметричной пирамидки. Максимальное значение количества информации достигается для равновероятных событий.
|