Видеокомпрессия

Автор работы: Пользователь скрыл имя, 30 Ноября 2011 в 02:50, курсовая работа

Краткое описание

Без сжатия большинство локальных сетей, по которым передаются видео данные, были бы заблокированы в течение нескольких секунд. Стандарт CCIR-601 для цифрового телевидения устанавливает что размер передаваемого TV изображения без компрессии в течении одной секунды составляет 165 Mbit, в минуту - 9.900 Mbit (9.9 Gbit), в час - 594 Gbit.

Содержание работы

1.Введение………………………………………….2стр.
2.Видеокомпрессия………………………………...6стр.
3.Принципы кодирования видеосигналов…..…..15стр.
4.Избыточность ТВ изображений……………….20стр.
5.Заключение……………………………………..21стр.
6.Список литературы…………………………….22стр.

Содержимое работы - 1 файл

Видеокомпрессия.docx

— 130.27 Кб (Скачать файл)

Содержание:

1.Введение………………………………………….2стр.

2.Видеокомпрессия………………………………...6стр.

3.Принципы кодирования  видеосигналов…..…..15стр.

4.Избыточность  ТВ изображений……………….20стр.

5.Заключение……………………………………..21стр.

6.Список литературы…………………………….22стр. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Введение: 

 
Без сжатия большинство локальных сетей, по которым передаются видео данные, были бы заблокированы в течение нескольких секунд. Стандарт CCIR-601 для цифрового телевидения устанавливает что размер передаваемого TV изображения без компрессии в течении одной секунды составляет  165 Mbit, в минуту - 9.900 Mbit (9.9 Gbit), в час - 594 Gbit. Для 24 часовой записи потребуется 14.256 Gbit (14,3 Tbit). Что соответствует примерно двадцати двум  жестким дискам емкостью 80Гб. Если, к примеру, использовать модем со скоростью передачи 56 Kbit/s, то ему потребуется около 8 лет для передачи одного дня видео съемки. Для ускорения передачи и более рационального использования дискового пространства цифровое видео, передаваемое по сетям Ethernet, всегда сжимается. Именно поэтому, очень важно правильно выбрать формат сжатия.

Компрессия статического или видео изображения может  быть осуществлено двумя основными  методами – с потерей или без  потери качества.

Сжатие без  потерь данных - полученное после декомпрессии изображение будет в точности (побитно) совпадать с оригиналом. Примером такого сжатия может служить  формат GIF для статической графики  и GIF89a для видео. Поскольку коэффициент  сжатия, при использовании таких  видов компрессии, небольшой, их использование  достаточно затруднительно, т.к. в сетевых  видео решениях передаются большие  объемы видео информации.

Сжатие с потерями качества - потери качества могут наблюдаться  в случае, если в процессе сжатия информация была утеряна. Однако с точки  зрения человеческого восприятия сжатием  с потерями следует считать лишь то сжатие, при котором на глаз можно  отличить результат сжатия от оригинала. Таким образом, несмотря на то, что  два изображения – оригинал и  результат сжатия с использованием того или иного компрессора —  побитно могут не совпадать, разница  между ними будет совсем незаметной. Основная идея – значительно увеличить  коэффициент сжатия, пренебрегнув незначительными деталями, не заметными для человеческого глаза. Примерами здесь могут служить алгоритмы JPEG для сжатия статической графики и алгоритм M-JPEG для сжатия видео.

Все стандарты  сжатия статического изображения направлены на обработку одного единственного  образа. Самый известный и широко распространенный стандарт - JPEG.

JPEG – сокращение от Joint Photographic Experts Group (Объединенная Фотографическая Группа Экспертов) – качественный и очень популярный стандарт для статических изображений, который поддерживается практически всеми современными программами. Для просмотра JPEG файлов достаточно стандартных Web-браузеров, которые осуществляют их декомпрессию и отображение на мониторе. 
При JPEG компрессии могут использоваться различные уровни сжатия, устанавливаемые пользователем,   которые определяют насколько изображение должно быть сжато. Выбранный уровень непосредственно связан с качеством картинки и размером файла.  
На степень сжатия (размер файла) помимо уровня сжатия непосредственно влияет и само изображение. Например, размер файла с изображением белой стены будет относительно невелик и иметь более высокую степень сжатия, в то время, размер файла, с тем же самым уровнем сжатия, отображающий сложную сцену с большим количеством деталей и цветовых переходов, будет иметь больший размер с более низкой степенью сжатия.

Некоторые основные принципы JPEG компрессии: 
-Чем больше изображение, тем больше данных оно содержит.  
-Чем выше уровень сжатия, тем меньше данных сохраняется и тем более «размытым» становится изображение. 
-Чем больше деталей на изображении, тем больше требуется данных для их сохранения. Например: красочное изображение дерева содержит значительно больше данных чем изображение однотонной стены.

JPEG-2000  
Еще один формат сжатия, разработанный той же Группой экспертов, JPEG-2000. Он разрабатывался специально для медицинских приложений и цифровой фотографии. При низких уровнях компрессии, обработка изображения происходит аналогично формату JPEG, а при больших степенях сжатия, благодаря новым, прогрессивным, но более сложным алгоритмам, изображение получается более качественным, чем при JPEG. Из-за того, что большинство ПО, в том числе и web-браузеры, не поддерживают этот стандарт, использование JPEG-2000 сильно ограниченно.

Методы  компрессии видео  изображения.

MotionJPEG предcтавляет видео как последовательность JPEG кадров. MotionJPEG один из основных стандартов, используемых в сетевых видео системах. Сетевая видеокамера, подобно цифровому фотоаппарату, обрабатывает отдельные изображения, сжимая их в формат JPEG. Сетевая камера может обрабатывать несколько кадров в течении одной секунды (Axis 221 до 60 кадров в секунду), а затем, создав непрерывный поток, транслировать их в сеть.  При скорости 16 кдр/сек и выше, человеческий глаз воспринимает поток образов как непрерывное видео. Поскольку MotionJPEG представляет собой поток отдельных JPEG картинок, его можно сравнить с кинопленкой - каждый кадр имеет четкое изображение, качество которого определяется только уровнем сжатия, выбранным для отдельной сетевой видеокамеры или видео сервера.

H.263 – формат сжатия предназначенный для передачи видео с постоянной, фиксированной скоростью. Основным недостатком фиксированной скорости является то, что при движении объекта качество изображения падает. H.263 был разработан для видео конференц-связи, а не для наблюдения, где отображение деталей являются более критичным, чем скорость передачи данных.

MPEG 
Основы разработки стандарта MPEG были заложены группой ученых из MPEG (Motion Picture Experts Group)  еще в 80х годах прошлого века. Основной принцип MPEG сжатия это сравнение двух последовательных образов и передача по сети только небольшого количества кадров (так называемые I-frame или ключевые кадры), содержащих полную информацию об изображении. Остальные кадры (промежуточные кадры, P-frame) содержат только отличия этого кадра от предыдущего. Иногда применяют двунаправленные кадры (B-frame), информация в которых кодируется на основании предыдущего и последующего кадров, что позволяет дополнительно повысить степень сжатия видео. Во всех форматах MPEG используетсят метод компенсации движения. 
Несмотря на большую сложность при кодировании/декодировании видео сигнала, MPEG сжатие позволяет значительно снизить (в разы) объемы передаваемой по сети информации по сравнению с MotionJPEG.

Естественно, это  достаточно схематичное объяснение, алгоритмы MPEG намного сложнее. При  кодировании учитывается текстура изображения, используются методы предсказания движения, квантизация и статистическое кодирование.

Основа кодирования  у группы алгоритмов MPEG общая. Основные идеи, применяемые в ходе сжатия видеоданных с ее помощью, следующие: 

-устранение  временной избыточности видео,  учитывающее тот факт, что в  пределах коротких интервалов  времени большинство фрагментов  сцены оказываются неподвижными  или незначительно смещаются  по полю.  
-устранение пространственной избыточности изображений путем подавления мелких деталей сцены, несущественных для визуального восприятия человеком.  
-использование более низкого цветового разрешения при yuv-предеставлении изображений (y — яркость, u и v — цветоразностные сигналы) — установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.  
-повышение информационной плотности результирующего цифрового потока путем выбора оптимального математического кода для его описания (например, использование более коротких кодовых слов для наиболее часто повторяемых значений).

На данный момент существует три стандарта MPEG для  передачи видео информации:

   

MPEG-1 был стандартизован и начал использоваться в 1993. Он был предназначен сжатия и хранения видео на компакт дисках. Большинство кодирующих устройств MPEG-1 и декодеров разработаны для скорости передачи данных порядка 1.5Mbit/s при разрешении CIF. Основной упор при его разработке делался на сохранении постоянной скорости передачи, при переменном качестве видео изображения, сравнимым с качеством VHS. При кодировании используется дискретно-косинусное преобразование - выполняется апроксимация внутри блока 8х8 пикселей волновыми функциями. Скорость передачи видео изображения в MPEG-1 ограничена 25 кадрами в секунду в стандарте PAL и 30 в NTSC. В данный момент этот стандарт практически не используется.

   

MPEG-2 был принят в качестве стандарта в 1994 для применения в высококачественном цифровом видео (DVD), цифровом телевидении высокого качества (HDTV), интерактивных носителях информации (ISM), цифровом радиовещательном видео (DBV) и кабельном телевидении (CATV). При разработке MPEG-2 усилия были сосредоточены на расширении техники сжатия MPEG-1, позволяющей обрабатывать большие изображения с более высоким качеством при более низкой степени сжатия и более высокой скорости побитной передачи данных. . Так же, как и в MPEG-1 при кодировании используется дискретно-косинусное преобразование, но обрабатываемые блоки увеличены в 4 раза - 16х16 пикселей. Скорость передачи видео изображения ограничена 25 кадрами в секунду в стандарте PAL и 30 в NTSC, так же, как в MPEG-1.

   

MPEG-4 – дальнейшее развитие стандарта MPEG-2. Основы разработки стандарта MPEG-4 были заложены группой ученых из MPEG еще в 1993 году, и уже к концу 1998 года произошло утверждение первого стандарта. Впоследствии стандарт неоднократно дорабатывался, в 1999 году получил официальный статус и затем был стандартизован со стороны ISO/IEC. 

Целью создания MPEG-4 была выработка стандарта кодирования, который обеспечил бы разработчиков универсальным средством сжатия видеоданных, позволяющим обрабатывать аудио- и видеоданные как естественного (снятого с помощью видеокамеры или записанного с помощью микрофона), так и искусственного (синтезированного или сгенерированного на компьютере) происхождения.  Это обстоятельство кардинальным образом отличает MPEG-4 как видеостандарт от его предшественников MPEG-1 и MPEG-2, в которых эффективное сжатие данных достигается лишь применительно к естественному видео и аудио. 

MPEG-4 обеспечивает  необходимые средства для описания  взаимного расположения объектов (элементов) сцены в пространстве  и времени с целью их последующего  представления потенциальным зрителям  в ходе воспроизведения. Разумеется, такая трактовка предполагает  разделение сцены на составляющие  ее объекты, что само по себе  является весьма трудоемкой задачей,  к которой по сути и сводится MPEG-4-кодирование. Кроме того, при разработке стандарта MPEG-4 решались проблемы обеспечения воспроизведения объектов сцены в различных условиях пропускной способности сетей передачи данных. Был разработан формат, допускающий «универсальный доступ» к мультимедийной информации с учетом возможных ограничений полосы пропускания, возникающих в сетях при самых разных условиях. Другими словами, один и тот же видеофрагмент может быть представлен с различным качеством для различных каналов в зависимости от их пропускной способности.

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Видеокомпрессия

Видеокомпрессия - сокращение объема памяти, необходимой для хранения цифровых видеоданных и передачи их по каналам связи. Цель видеокомпрессии - более компактное представление изображений.

 

 Концепция.

Видеоданные по своей природе занимают чрезвычайно  большой объем. Над задачей возможно более эффективного сжатия видео  уже много лет бьются специалисты в этой области. В начале третьего тысячелетия в связи с острой необходимостью передавать большие объемы видео по различным сетям, задача оптимального по соотношению качество/объем способа кодирования видео стала еще более актуальной.

Концепция сжатия видео в MPEG очень проста - определить, какая именно информация в потоке повторяется хотя бы в  течении какого-то отрезка времени и принять меры к избежанию дублирования этой информации. Наиболее ценное достоинство MPEG кодирования, особенно удобное для передачи по различным сетям - возможность гибкой настройки качества изображения в зависимости от пропускной способности сети. Это и сделало MPEG-2 фактическим стандартом для приема/передачи цифрового телевидения по различным сетям.

Эффективное кодирование изображений обычно выполняется за три этапа: 
1.    На первом этапе находится представление изображения в виде набора коэффициентов некоторого преобразования. Эта операция как правило обратна. 
2.    На втором этапе уменьшается точность представления компонент изображения, но так, чтобы выполнялись заданные требования к качеству изображения. Такая операция приводит к потерям информации, поэтому не является обратной. 
3.    На третьем этапе устраняется статистическая избыточность в изображении, полученном после выполнения первых двух этапов. Для выполнения этого этапа может применяться кодирование Хаффмана, арифметическое кодирование и другие. Эта операция обратна.

 
Наиболее интенсивные исследования ведутся в направлении поиска новых методов для выполнения первого и второго этапов, поскольку  при этом тратится больше всего вычислительных ресурсов. Также ведутся исследования связанные с поиском математического  преобразования изображений, способного более эффективно уменьшать исходную избыточность изображений. Перспективными являются исследования особенностей  зрительного восприятия  изображений и особенностей помехоустойчивой передачи изображений по существующим каналам связи.  
 

 
 

Как реализуется.

Для удобства кодирования видеоданных весь видеопоток разбивается на группы, называемые GOP (Group of Pictures - группой изображений). Такая группа строится следующим образом:

где:

I - Intra кадры, которые обычно называются опорными и содержат всю информацию об изображении. MPEG последовательности без этих кадров быть не может в принципе. При компрессии I кадров происходит удаление только пространственной избыточности. Именно с этого кадра начинается декодирование изображения в последовательности.

P - Predictive кадры. "Предсказанные" кадры, при формировании которых используется метод предсказания изображения на следующем кадре с учетом компенсации движения от последнего I или P кадра перед формируемым. P кадр также служит для дальнейшего предсказания изображения. P кадр создается с помощью межкадровой компрессии, уменьшающей как пространственную, так и временную избыточность. Изображение P кадра вычитается из следующего изображения и эта разница кодируется и вместе с вектором движения добавляется к сжатым данным.

B - Bi-directional, "двунаправленные" кадры. Они названы так потому, что хранят наиболее существенную информацию с окружающих их I и P кадров. B кадры имеют наивысшую степень компрессии, но требуют предыдущего и последующего изображения для компенсации движения объектов на изображении.

Такую структуру MPEG потока обычно описывают  в виде дроби M/N, для которой M сообщает общее число кадров в GOP, а N - каким  по счету будет очередной P кадр после  предыдущего. Таким образом, GOP последовательность, изображенная на рисунке выше, может  быть записана как 12/3.

Поток данных MPEG состоит из 6-ти иерархических уровней:

  • Блок - данные по яркости и цветности для блоков 8х8 изображения. Блоки анализируются по значениям Y (яркость), CB и CR (цветоразностные сигналы).
  • Макроблок - как следует из названия, состоит из 4 простых блоков в окне 16х16 пикселей соответственно. В формате 4:2:0 макроблок содержит 4 блока яркостных данных Y и по одному CB и CR.
  • Слой - содержит несколько смежных макроблоков.
  • Кадр - состоит из группы слоев, содержащих изображение, которое, в свою очередь, может быть как I, так P или B.
  • Группа изображений (она же GOP) - содержит последовательность кадров. Может включать до 15 кадров и должна обязательно начинаться с I кадра.
  • Видеопоследовательность - должна содержать минимум одну GOP, а также заголовок в начале последовательности и код конца последовательности.
 

Уровни  и профили MPEG.

Под профилем MPEG понимается подмножество структуры  битового потока сжатого видеоизображения. В пределах такого подмножества возможен широкий разброс параметров потока и, соответственно, кодеров и декодеров  для них.

Под уровнем  понимается ряд ограничений, применяемых  к параметрам MPEG потока, например, разрешение выходного изображения, частота  кадров и т.п.

Таблица ниже иллюстрирует максимальные значения ограничений, накладываемых на уровни и профили MPEG:

Профиль/уровень   Простой  I, P 4:2:0 (Simple Profile) Основной  I, P, B 4:2:0 (Main Profile) I, P, B   4:2:2  
 
I, P, B 4:2:0 
(SNR Scalable Profile)
Пространственный 
I, P, B 4:2:0 (Spatially Scalable Profile)
Высокий 
I, P, B 4:2:0 
или 4:2:2 
(High Profile)
                   
Самый высокий 
(High Level)
 
 
  1920x1152 80Mbit/s         1920x1152 100Mbit/s
                 
Высокий 
(High 1440 Level)
 
 
  1440x1152 60Mbit/s       1440x1152 60Mbit/s 1440x1152 80Mbit/s
                 
Основной 
(Main Level)
 
 
720x576 15Mbit/s    720x 576 15Mbit/s 720x608 50Mbit/s 720x576 15Mbit/s   720x608 20Mbit/s
               
Низкий 
(Low Level)
 
 
  352x288 4Mbit/s  
  352x288 4Mbit/s    

Эта таблица  нужна в первую очередь, для понимания  часто встречающихся обозначений  формата конкретной записи или описаний возможности какого-либо кодера. Например, вот так может характеризоваться  запись в формате MPEG:

      Название Обозначение Что есть что
      Standard PAL **Система телевидения
      Resolution 720*576 Разрешение  изображения
      Profile and level  MP@ML Main Profile и Main Level
      Frame rate 25 Частота кадров
      Bitrate around 5 Mbit avg Скорость потока 5Mbit
      GOP structure IBBPBBPBBPBB Структура GOP
       
 
 

Практическое  использование.

 
  • С цифровой видеокамеры на компьютер сбрасывается уже компрессированное, сжатое изображение. DV в сущности представляет собой частный случай JPEG компрессии - это поток, состоящий из сжатых по немного измененному алгоритму JPEG кадров. От идеи (но не принципов сжатия) MPEG в DV используется только то, что при сжатии в DV учитывается информация с двух полей одного кадра - так называемая intrafield компрессия. Поэтому для сжатия в MPEG DV изображение сначала декомпрессируется, а затем подвергается повторному сжатию, что качества не улучшит никогда.
  • Параметры компрессии были заданы неверно с точки зрения качества изображения.
  • Используется быстрый, но не очень качественный кодер MPEG.
 

Качество  видео на DVD дисках очень высокое. Объясняется оно двумя основными  факторами - в качестве исходного  видеоматериала для создания MPEG-2 варианта фильма используется несжатое видео  профессионального качества, и, кроме  этого, для кодирования в MPEG-2 применяются  аппаратные кодеры с очень высоким  качеством кодирования изображения. Стоимость таких кодеров доходит  до нескольких десятков тысяч долларов США. Поэтому получить в домашних условиях подобное качество с DV фильма невозможно.

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Системы видеокомпрессии: от MPEG-1 до AVC и VC-1

Sunniwell 5100/6100 (H.264/VC-1) представляет собой компактную по размеру и доступную по цене телевизионную приставку, поддерживающую многочисленные кодеки, включая HDTV (телевидение высокой четкости), и предназначенную для реализации сервисов IP-телевидения, «видео по запросу» и доступа в Интернет. Устройство обеспечивает эффективную трансляцию IP-телевидения и передачу «видео по запросу» по широкополосным сетям.

Sunniwell 5100/6100 — это настраиваемая аппаратная платформа, обеспечивающая захват и передачу видеоинформации стандартного и высокого разрешения телевизионного качества для услуг «видео по запросу» и IР-телевидения в форматах МРЕG-1, МРЕG-2, МРЕG-4, VC-1 с поддержкой протоколов Unicast и Multicast. Аппаратное ускорение обеспечивается за счет процессора Sigma Designs.

Устройство содержит два Ethernet-порта, предназначенных для  подключения к сети или другому  устройству, что позволяет применять  Sunniwell 6100 в качестве стандартного шлюза.

Основные характеристики Sunniwell 6100:

* захват и  кодирование видеопотока с помощью любого из кодеков МРЕG-1, МРЕG-2, МРЕG-4, VC-1 SD и HD с аппаратным ускорением, обеспечивающим высокое качество сигнала;  
* поддержка многочисленных PIO-кодов;  
* многоадресная передача видео с помощью протокола IGМР2;  
* захват с потоком до 8 Мбит/с (в зависимости от качества сети);  
* поддержка разрешения экрана 704і576 (РАL) и 640і480 (NTSC) с 16-разрядным цветом и прозрачностью;  
* поддержка форматов экрана 4:3 и 16:9;  
* поддержка до 1000 установленных каналов;  
* время смены каналов в режиме Multicast менее 1,5 с (в зависимости от качества сети).

Для работы с IP-сетями предусмотрен модуль VoIP (опция), основанный на технологии SIP. В нем использован аналоговый интерфейс RJ11, обеспечивающий возможность применения телефонных аппаратов, подключенных к обычной аналоговой телефонной линии (РОТS — Plain Old Telephone Service).

Устройство содержит многопортовый LAN-коммутатор с поддержкой виртуальной локальной сети и возможностью присвоения множественных IР-адресов.

Sunniwell 6100 может работать с промежуточным ПО и приложениями сторонних производителей.

Компрессия MPEG-2 была очень успешной как в техническом, так и в коммерческом плане  в течение всех 10 лет своего существования. Тем не менее, ограничения, свойственные этому алгоритму, стали очевидны, как только MPEG-2 приблизился к  своему пределу эффективности кодирования  в смысле стоимости его применения. Развитие методов сжатия контента и удаления артефактов привело к появлению интенсивно обсуждаемых форматов SMPTE VC-1 (Windows Media Video 9) и MPEG-4 AVC. Эти технологии позволяют снизить требуемую полосу пропускания в диапазоне 30…60% по сравнению с MPEG-2, обеспечивая при этом доставку видео такого же качества или даже выше.

Компания Tandberg Television занималась разработкой и строительством сетей на основе MPEG-2 с момента появления этого стандарта. В 2003 году она стала первой компанией, публично продемонстрировавшей улучшенное кодирование, и движение в этом направлении продолжалось, приведя к появлению в начале 2004 года технологии ICE (Intelligent Compression Engine — Интеллектуальный движок компрессии), разработанной для MPEG-4 AVC и VC-1. Разумеется, с тех пор индустрия смогла в полной мере оценить возможности этих новых кодеков. Но компания Tandberg Television шаг за шагом доказывала, что очень хорошо понимает особенности улучшенного кодирования. На сегодня в мире более 40 систем кодирования по стандартам MPEG-4 AVC или VC-1 компании Tandberg уже работают в тестовом или полнофункциональном режиме. Это еще раз подтверждает, что Tandberg является одним из пионеров в области всеобщего применения улучшенных схем кодирования и, как утверждают в компании, пока единственной, выпускающей системы для кодирования по стандартам MPEG-4 AVC и VC-1 материала как стандартного, так и высокого разрешения.  

Tandberg ICE представляет собой сочетание модульного аппаратного устройства и обновляемой программной архитектуры, поддерживающей стандарты VC-1 и MPEG-4 AVC. Гибкость программных и аппаратных средств гарантирует, что новые функции и инструменты могут быть легко добавлены к системе, повышая ее производительность. А ведь именно это было основной проблемой на ранних стадиях развития алгоритмов.

Технология ICE была разработана на основе опыта, приобретенного компанией во время работы с MPEG-2. Этим объясняется тот факт, что  новые устройства в смысле входов, управления и предварительной обработки  практически не изменились. Изменилось только кодирование видео и звука (опционально). Это снижает риск оператора, поскольку жизненно важные компоненты системы, такие как, например, интерфейсы, построены на базе систем MPEG-2, уже доказавших свою надежность за время эксплуатации в сотнях инсталляций по всему миру.

Модуль ICE базируется на сочетании процессоров обработки  цифрового сигнала и программируемых  массивов коммутационных элементов (FPGA — Field-programmable gate array). Этим обеспечивается специализированная схема коммутации аппаратных средств, выполняющих интенсивные алгоритмические вычисления. Обусловленная этими факторами большая мощность точной обработки формирует программную архитектуру и позволяет выполнять кодирование видео.

Пользователи, реализующие  новые сервисы, могут применять  аппаратный кодер Tandberg EN5920 для работы в форматах SMPTE VC-1/Windows Media 9 Series, поддерживающий кодирование в соответствии с Main Profile и Advanced Profile, либо использовать кодер EN5930 MPEG-4 part 10. Обе платформы поставляются с модулем ICE, и пользователи могут изменять алгоритм путем простого обновления ПО. Такая гибкость является ключевым достоинством для пользователей, которые еще не определились со стандартом, в котором хотели бы работать в будущем.

Существующие  на сегодня обладатели систем MPEG-2 от Tandberg Television, планирующие провести модернизацию, имеют два варианта на выбор. Тот, кто собирается прекратить вещание в формате MPEG-2, может добавить модуль ICE к кодеру Tandberg Television E5710, избавляясь от необходимости приобретать новое аппаратное обеспечение, которое необходимо устанавливать в и без того плотно набитые стойки. Пользователи сохранят схемы резервирования и другие системные компоненты и технологические звенья, имеющиеся в их комплексах MPEG-2: мультиплексирование, модуляцию, шифрование и декодирование.

Иные вещатели, использующие MPEG-2, могут захотеть продолжить работу с этим форматом, одновременно начав параллельное вещание на базе улучшенного алгоритма кодирования. Эти пользователи могут добавить модуль ICE к своим кодерам E5710 MPEG-2, обеспечив им возможность выполнять  кодирование по двум стандартам сразу. В этом режиме модернизированный  кодер будет выдавать на выходах  поток MPEG-2 и либо поток MPEG-4 AVC, либо SMPTE VC-1 для одного и того же входа  видео, причем в том же самом корпусе.

Вне зависимости  от способа модернизации, вещатели всех типов могут применять ICE. Как  минимум три группы вещателей  могут извлечь из этого пользу. Провайдеры видео по сетям DSL (в основном это телекоммуникационные компании) могут повысить эффективность ограниченной полосы частот своих инфраструктур  за счет снижения скоростей потоков. Кабельные, спутниковые и наземные вещатели могут повысить число транслируемых  в выделенной им полосе каналов (потенциально мигрируя в сторону мультиканальных  систем), а также начать вещание  ТВЧ, не страдая от технических и  экономических ограничений. А в  сфере поставки контента и сбора новостей, где работа ведется с недорогими, низкоскоростными наземными и спутниковыми линиями связи на основе IP, можно получить изображения высокого качества в режиме реального времени. Новостные компании избавятся от блочного шума при кодировании, связанного с доставкой «живого» видео при помощи компрессии MPEG-2. Благодаря применению улучшенного кодирования то же самое изображение доставляется без блочного шума с потоком не выше 2 Мбит/с.

Алгоритмы, определенные организациями SMPTE и ISO/IEC для VC-1 и MPEG-4 AVC соответственно, реализованы в платформе ICE. Многочисленные возможности, созданные  Tandberg Television, такие как расширенная предварительная обработка, также присущи этой платформе. Предварительная обработка сочетается с шумопонижением, выполняемым на профессиональном уровне, что обеспечивает очистку сигнала от шумов еще до начала кодирования. Исключение артефактов позволяет еще больше уменьшить скорость потока по сравнению с изображением, не очищенным от шумов.

Профессиональная  схема преобразования чересстрочной  развертки в прогрессивную еще  больше улучшает предварительную обработку, позволяя модулю ICE эффективно сжимать  изображения, предназначенные для  демонстрации на экранах с прогрессивной  разверткой. Пространственные и временные  чересстрочные фильтры убирают  большинство артефактов во время  преобразования типа развертки, поэтому  некоторые искажения остаются только в тех фрагментах, где имеет  место быстрое панорамирование. Это обеспечивает высокое качество компрессии при отображении на экранах  компьютеров, плоских экранах и  плазменных дисплеях. Еще большая  экономия полосы пропускания достигается  за счет применения процессов преобразования развертки до декодирования изображения  на приемной стороне.

Платформа ICE была запрограммирована на улучшение  использования обоих алгоритмов. Аппаратная часть осуществляет жесткое  управление скоростью потока для  видео и звука. Это очень важно  для сетей с ограниченной полосой  пропускания, таких как ADSL, где изображение  и/или звук просто теряются, если превышаются  допустимые пределы полосы пропускания.

Управлять скоростью  потока можно несколькими способами. Режим Capped VBR (с переменной скоростью потока, ограниченной по максимальному значению) позволяет пользователю установить максимальную скорость потока и требуемое качество изображения. ICE использует только ту часть потока, которая необходима для выбранного качества, без превышения заданного верхнего предела, но никогда не будет использовать скорость, большую, чем это необходимо. В режиме с постоянной скоростью потока (CBR) дополнительные биты используются даже тогда, когда в них нет необходимости для достижения заданного качества. И третий вариант, это статистически мультиплексированный VBR-поток. В статистически мультиплексированных системах заданная общая скорость потока распределяется между группой кодеров, и в рамках группы каждый кодер получает постоянно меняющуюся скорость потока, управляемую ассоциированной системой управления. Поэтому группа кодеров может выдать средний поток, меньший по скорости, чем в случае, если бы каждый кодер работал независимо.

ICE также позволяет  избавиться от выпадения кадров. При помощи этой платформы  сжимается каждый кадр в отличие  от программных кодеров на  базе PC, где кадр может просто  потеряться, когда изображение становится  сложным. Определение точки смены  сцены выполняется по входу,  что позволяет выявить момент  смены плана и вставить новый  опорный кадр в случае необходимости.  Это минимизирует погрешности  кодирования, обусловленные быстрыми  сменами планов. Добавление выявления  точки смены плана обеспечивает  более плавный переход от кадра к кадру и более комфортный просмотр кодированного контента для зрителя.  
Характеристики кодеров Tandberg по компрессии и разрешению Варианты модернизации кодеров Tandberg Television

Отличительная особенность новых кодеров серии EN59xx в сравнении с существовавшими  ранее устройствами серии Е57хх заключается  только в типе компрессии. Управление, дизайн меню и процесс настройки  остались неизменными. Это достаточно удобно, потому что избавляет от необходимости проводить дополнительное обучение персонала, требующее определенного времени и затрат. Кроме этого, уже хорошо известная система управления оборудованием Tandberg TV nCompass Control также поддерживает управление кодерами EN59xx, обеспечивая возможность плавной миграции в сторону нового формата компрессии.  
2005-й — год улучшенной компрессии  

В течение последних  лет в сетевом видеонаблюдении  и других приложениях цифрового  ТВ резко возросли требования к эффективности  использования существующей полосы пропускания транспортной среды. Для  этого есть несколько причин:

  • постоянно увеличивается число ТВ-камер в устанавливаемых системах;
  • возрастает число интегрированных решений, когда в одном канале с видеоинформацией передаются разнообразные данные;
  • повышаются требования к качеству изображения.

Это привело  к внедрению в охранное ТВ различных  способов оптического мультиплексирования  и цифрового сжатия видеопотока. Ниже рассматриваются особенности компрессии видеосигналов в стандарте MPEG-4 и реализация на его основе сетевых кодеков с волоконно-оптическим выходом.

 

Основные  ппинцыпы кодирования видеосигналов

Определим понятия  стандарта и кодека видеосигнала. Стандарт описывает группу технических  приемов, которые могут использоваться при сжатии (например, кодирование  с предсказанием, компенсация движения), и допустимые параметры цифрового  потока (разрешение, битрейт, частота кадров и т.д.). По мере совершенствования методик сжатия, увеличения быстродействия компьютеров и возможностей аппаратных средств вынужден развиваться и стандарт. Кодек — это аппаратный или программный метод преобразования информации, позволяющий на выходе получить цифровой поток, соответствующий стандарту. Кодеки, в свою очередь, делятся на кодеки с покадровым сжатием и кодеки с межкадровым сжатием.

В кодеках с  покадровым сжатием каждый кадр записывается как отдельная фотография. К таким кодекам относятся кодеки группы MJPEG (Motion JPEG), широко используемые в цифровых рекордерах видеосигналов. К кодекам с межкадровым сжатием, в первую очередь, относятся кодеки стандартов MPEG. В кодеках с межкадровым сжатием только часть кадров (так называемые I-frame или ключевые кадры) содержит полную информацию об изображении. Остальные кадры (промежуточные кадры, P-frame) содержат только отличия этого кадра от предыдущего. Иногда применяют двунаправленные кадры (B-frame), информация в которых кодируется на основании предыдущего и последующего кадров, что по¬зволяет дополнительно повысить степень сжатия видео. Последовательность между двумя ключевыми кадрами называется группой кадров (GOP, Group Of Pictures).

Межкадровое сжатие позволяет дополнительно сократить битрейт в несколько раз при сохранении качества. Особенностью кодеков с межкадровым сжатием является зависимость битрейта или качества видео от "динамичности"сцены. Например, при кодировании с постоянным битрейтом (CBR, Constant Bit Rate) статичные сцены, где соседние кадры мало отличаются друг от друга, будут смотреться лучше, чем динамичные. При кодировании с переменным битрейтом (VBR, Variable Bit Rate) кодек будет автоматически увеличивать битрейт на динамичных сценах, чтобы обеспечить примерно одинаковое качество изображения для статичных и подвижных объектов.

Процесс разработки стандартов компрессии видеосигналов  идет под руководством двух организаций  — ISO (International Standards Organization) и ITU (International Telecommunications Union). Большинство этих стандартов базируется на документах H.261 и Н.263, разработанных ITU около десяти лет тому назад. Параллельно с этими работами группа экспертов ISO Motion Picture Experts Group (MPEG) представила стандарт MPEG-1, предназначенный для использования в сфере персональных компьютеров и компакт-дисков (скорость передачи данных — до 1,5 Мбит/c). Следующий за ним стандарт MPEG-2 предназначен для сферы вещания, в которой применяются изображения высокого разрешения и скорость одного видео¬потока достигает 10 Мбит/с. В дополнение к кодированию видеостандарт MPEG-2 включает в себя кодирование звука и транспортный уровень для передачи нескольких программ и является основным для вещательного телевидения. Высокое качество изображения обуславливает использование MPEG-2 в охранном телевидении для решений класса hi-end.

Стандарт  сжатия MPEG-2 основан на удалении избыточной информации. Для этого используются такие процессы, как дискретно-косинусное преобразование (DCT), предсказание движения, квантизация и статистическое кодирование .Уменьшение скорости потока при сохранении высокого качества видео обеспечивают и дополнительные технологии — предварительная обработка, шумопонижение и коррекция ошибок за счет предсказания и двойного прохода, а также последующая обработка. На рис. 1 показано, как кодер MPEG-2 использует технологию MPEG-2.

К настоящему времени  стандарт MPEG-2 практически достиг своего предела в плане степени сжатия и не позволяет обеспечить качественную передачу видео на скоростях менее 1 Мбит/с. Поэтому возникла необходимость  разработки более эффективных, чем MPEG-2, алгоритмов компрессии. Та же группа экспертов ISO разработала новый стандарт — MPEG-4, первая версия которого была готова уже в октябре 1998 года, а через  год вышла его знаменитая вторая версия, вскоре ставшая международным  стандартом.

Добиться такого результата удалось за счет принципиально  иного, так называемого объектно-ориентированного метода компрессии. К тому времени  стало ясно, что традиционные методы устранения информационной избыточности себя исчерпали, поэтому был предложен  оригинальный алгоритм:

  • в исходной аудиовизуальной сцене выделяют так называемые "медийные объекты", которыми могут быть статический фон, крупные фигуры (человек, автомобиль и т.п.), аудио, текст, графика и т.д.;
  • для каждого медийного объекта формируется собственный цифровой поток, затем они суммируются и передаются по каналу связи в едином потоке;
  • на приемной стороне исходный аудиовизуальный образ собирается в обратном порядке.

Таким образом, за счет применения более изощренных алгоритмов кодирования и организации  информационных потоков по иерархическому принципу в MPEG-4 обеспечивается более  чем двукратное повышение эффективности  сжатия, по сравнению с MPEG-2.

Первоначально MPEG-4 разрабатывался как формат для  передачи мультимедийного контента по узкополосным линиям связи. Поэтому основным профилем MPEG-4 для видео был простой профиль SP (Simple Profile), предназначенный для работы с разрешением до 352х288 пикселей при битрейте до 384 кбит/с (15 кадров в секунду). Однако в процессе работы выяснилось, что этот алгоритм прекрасно работает и с видеосигналами, имеющими разрешение 720х576 пикселей, требуя при этом в 2–3 раза меньших скоростей, чем MPEG-2. Поэтому в 2002 году был принят расширенный стандарт MPEG-4, названный Advanced Simple Profile (то есть простой, но "продвинутый»). Теперь MPEG-4 мог работать со стандартными видеосигналами, имеющими скорость до 8 Мбит/с, в устройст¬вах с высоким качеством изображения. Однако официальное включение спецификации MPEG-4 в базовый стандарт ITU-T-H.264 произошло только через год.

MPEG-4 стандарт  может быть использован для  достижения разных целей и  включает в себя различные  инструменты кодирования. Например, для создания потокового видео с очень низким битрейтом требуются инструменты, отличные от тех, которые используются при кодировании видеосигнала с DVD-качеством. Чтобы обеспечить эти потребности, стандарт MPEG-4 определяет множество различных профилей и уровней (Profiles and Levels). Каждый профиль или уровень — это уровень совместимости, обеспечивающий слаженную работу продуктов, ему соответствующих.

Эти уровни стандартизуют  не только инструменты, которые могут  быть использованы при кодировании, но и задают видеопараметры: ограничение  битрейта, размер изображения, частоту смены кадров и т.д. Наибольший интерес для охранного ТВ представляют следующие профили MPEG-4:

  • профиль ASP (Advanced Simple Profile), ISO 14496 2;
  • профиль AVC (Advanced Video Coding), ISO 14496 10.

Информация о работе Видеокомпрессия