Методы сжатия и архивации оцифрованного видеосигнала E-mail
В настоящее время в мире разработано огромное количество методов сжатия цифровой информации, данная статья написана для того, чтобы помочь читателю разобраться в механизмах работы самых распространенных из них.

Общие сведения о сжатии

В первую очередь необходимо ответить на вопрос: "Почему необходимо сжимать информацию?"

Каждый кадр (полукадр), поступающий от аналоговой камеры, оцифровывают с помощью специальных плат видеозахвата. В результате оцифровки информация о каждой точке (pixel) изображения представляется с помощью нескольких бит. Количество точек по горизонтали и вертикали называют цифровым разрешением кадра. Так как любой цвет можно получить с помощью комбинации красного, зеленого и голубого, то простейший способ представления точки - это раздельное кодирование трех цветов, каждый из которых кодируется с помощью нескольких бит. Чем большим количеством бит кодируется каждый цвет, тем больше различных оттенков может быть закодировано и тем лучше качество картинки. При непосредственной оцифровке изображения с разрешением 320x240 в 24 bit RGB (без сжатия по 8 бит на каждый цвет), 25 кадров/с, скорость записи на носитель составляет - 46 Мбит/с, (каждый кадр занимает приблизительно 230 Кбайт). Скорость записи на жесткий диск оцифруемого изображения называют также скоростью оцифровки.

При скорости оцифровки рассмотренной в данном примере - на жесткий диск объемом 40 Гб можно записать лишь 2 часа видео, а при работе с видеофайлами удаленно (по сети), потребуется значительное время для скачивания даже небольших фрагментов, о "живом" видео по сети в данном примере можно только мечтать.

Для того, чтобы уменьшить большие объемы видеофильмов, требуются алгоритмы, которые позволили бы сжать видео. Кроме экономии места на жестком диске, алгоритмы сжатия также призваны уменьшать скорость оцифровки, для того, чтобы можно было транслировать видео по локальным вычислительным сетям с низкой пропускной способностью.

Скорость оцифровки, которую обеспечивают алгоритмы сжатия, особенно важна при трансляции видео по сетям Ethernet/Internet.

Классификация алгоритмов сжатия

Алгоритмы сжатия в первую очередь разделяют на:

  1. Потоковые и статические, то есть работающие с последовательностями кадров (потоком), или с каждым из кадров отдельно.
  2. По признаку отличия декомпрессованного видеоизображения от оригинала на следующие: сжатие без потерь данных, сжатие с потерями данных.

В статических алгоритмах сжатие достигается с помощью методов обработки изображений, при этом может обрабатываться либо все изображение целиком, либо разбиваться на отдельные блоки. Одними из самых распространенных на сегодняшний момент являются алгоритмы группы Wavelet и Jpeg.

В потоковых алгоритмах учитывается тот факт, что, как правило, близкорасположенные кадры не сильно отличаются друг от друга и сжатие достигается также за счет кодирования лишь разницы между кадрами (избыточность во времени), а также за счет работы с отдельными объектами присутствующими в нескольких кадрах, причем положение объекта в каждом из кадров - разное. Работа с отдельными объектами внутри кадра усложняет алгоритм, но и позволяет добиться значительного сжатия потокового видео.

Одними из самых распространенных в потоковых алгоритмах являются алгоритмы групп MPEG и MJPEG.

Сжатие без потерь данных: Полученное после декомпрессии изображение в точности (побитно) совпадает с оригиналом.

Сжатие с потерей данных: Большинство алгоритмов, широко используемых в настоящее время, работают так, что два оцифрованных изображения -от оригинала и от сжатого и восстановленного с использованием того или иного декомпрессора файла побитно не совпадают. Так например работают JPEG для сжатия статической графики и алгоритм M-JPEG для сжатия видео.

Сжатие с потерей данных делят на:

а) Сжатие без заметных потерь с точки зрения восприятия

Данные после декомпрессии побитно не совпадают с исходными, однако из-за особенностей восприятия человек не способен отличить разницу на статическом и тем более на "живом" изображении. Для субъективной характеристики применяют так называемый фактор качества сжатия, варьирующийся в пределах от 0 до 100. При факторе, равном 100, характеристики декомпрессированного видео по восприятию почти неотличимы от оригинала.

6) Сжатие с естественной потерей качества:

JPEG, MPEG и другие технологии сжатия с потерей качества иногда "сжимают", переступая за грань сжатия без потерь с точки зрения восприятия видеоинформации. Тем не менее сжатые видео- и статические изображения вполне приемлемы для адекватного восприятия их человеком.

Иными словами, в данном случае наблюдается так называемая естественная деградация изображения, при которой теряются некоторые мелкие детали сцены. Похожее может происходить и в естественных условиях, например при дожде или тумане. Изображение в таких условиях, различимо, однако уменьшается его детализация.

в) Сжатие с неестественными потерями качества:

Низкое качество сжатия, в значительной степени искажающее изображение и вносящее в него искусственные (не существующие в оригинале) детали сцены, называется неестественным сжатием с потерей качества. Примером тому может служить "блочность" в сильно сжатом MJPEG'e и в других компрессорах, использующих технологию блочного дискретно-косинусного преобразования.

Неестественность заключается в первую очередь в нарушении самых важных с точки зрения восприятия человеком характеристик изображения - контуров. Опыт показывает, что именно контуры позволяют человеку правильно идентифицировать тот или иной визуальный объект.

Сжатие Wavelet

В данном типе сжатия изображение представляется как дискретизованная функция яркостного и цветоразностного сигнала от координаты, далее эта функция раскладывается по специфическим функциям, получившим название wavelet-ы. При этом часть коэффициентов разложения отбрасывается, а остальные кодируются Количество учитываемых и отбрасываемых коэффициентов и определяет качество сжатой картинки. При сжатии wavelet-изображения с разрешением 320x240 (размер исходного файла 230 Кбайт) получаются следующие размеры сжаого файла: высокое качество (ФКС = 75) - 11 Кбайт; среднее качество (ФКС = 50) - 8,9 Кбайт; низкое качество (ФКС = 30) - 6,9 Кбайт. Для работы с потоковым видео, используют также разновидность данного метода - delta-wavelet. Отказоустойчивость алгоритма, возможность хорошего сжатия, при относительно высоком качестве изображения позволили использовать данный алгоритм во многих задачах, в задачах видеонаблюдения, например, используются такие устройства, как DVR1, DIVAR производство Philips.

JPEG и М-JPEG

Основная идея JPEG-сжатия -разбить изображение на блоки 8*8 пикселей и применить к каждому из блоков отдельно дискретное косинусное преобразование. Основной недостаток данного алгоритма - заметная блочность изображения при высоких коэффициентах сжатия. Степень сжатия данного алгоритма при равном визуальном качестве изображения в 1,5-2 раза хуже чем у Wavelet. При работе с видео в реальном времени иногда используется непосредственно JPEG, то есть каждый кадр сжимается отдельно с использованием стандарта JPEG. Безусловным достоинством этого метода является возможность редактирования видео без потерь качества, так как кадры являются независимыми. Однако чаще используется разновидность этого алгоритма MJPEG - кодируются разностные кадры.

MPEG-алгоритмы

MPEG-алгоритмы изначально задумывались и создавались для работы с "живым", потоковым видео. Цветное цифровое изображение переводится в "цветовое пространство" YUV. Компонента Y представляет собой интенсивнось, a U и V - цветность. Так как человеческий глаз менее восприимчив к цветности, чем к интенсивности (в первую очередь важны границы, то есть резкие перепады), то разрешение цветовых компонент может быть уменьшено в 2 раза по вертикали, или и по вертикали и по горизонтали.

Кадры, в закодированной MPEG-последовательности подразделяются на следующие типы:

  • I (intra) , играющие роль опорных при восстановлении остальных изображений по их разностям;
  • Р (predicted) , содержащие разность текущего изображения с предыдущим I или Р с учетом смещений отдельных фрагментов;
  • В (bidirectionally predicted) , содержащие разность текущего изображения с предыдущим и последующим изображениями типов I или Р с учетом смещений отдельных фрагментов.

Отдельные изображения каждого из типов состоят из макроблоков. Макроблок - блок 16x16 точек из Y-компонент и соответствующие блоки 8x8 в случае отношения YUV 4:2:0. Основная идея всей схемы -это предсказывать движение от кадра к кадру, то есть, другими словами, блок 16x16 точек в текущем кадре ищется в соответствующей области большего размера в предыдущих или последующих кадрах. Блоки являются базовыми структурными единицами, над которыми осуществляются основные операции кодирования, в том числе дискретное косинусное преобразование. Закодированные данные складываются в пакеты, которые формируют поток согласно синтаксису MPEG.

Стандартные параметры оцифровки при алгоритмах сжатия MPEG-1 и MPEG-2

MPEG-1, позволяет передавать 25 кадров/с с разрешением 352x240 (SIF1) при величине потока менее 1,86 Мбит/с (стандарт videoCD с форматом 4:2:0).

MPEG-2 в основном два стандарта качества 352x240 и 720x480. Величина потока для SIF - 1,15 Мбит/с, для CCIR2 - 4,2 Мбит/с (формат 4:2:0).

Однако следует иметь в виду, что как MPEG-1, так и MPEG-2, могут быть применены к широкому классу потоков, частот и размеров кадров. Так, например, такое устройство, как HI-Q, производство Philips, позволяет записывать видео сжатое MPEG-2, в высоком качестве 720x576, 50 кадр/с.

MPEG-4

Данный алгоритм создавался так, чтобы сжатое с его помощью видео имело минимальную ширину полосы оцифровки, при этом визуальное качество картинки не должно было ухудшаться по сравнению с MPEG-2. Алгоритм был призван, в том числе, решать задачи трансляции видео по локальным и глобальным вычислительным сетям, в различных условиях пропускной способности сетей передачи данных.

Данный алгоритм получил широкое распространение также благодаря тому, что с его помощью фильм DVD качества, умещавшийся ранее на 1,3 Гбайт (два CD-диска), можно было записать без визуального ухудшения на 700 Мбайт (один CD-диск). Ширина полосы оцифровки данного алгоритма в два раза меньше, чем у ближайшего конкурента MPEG-2!

В основу стандарта MPEG-4 был положен целый арсенал алгоритмов сжатия, применяемых как в зависимости от исходного качества и природы сжимаемого видеофрагмента, с возможностью последовательной обработки различными по природе алгоритмами сжатия. Это методы прогрессивного и словарного кодирования, кодирования с использованием чересстрочного сканирования, технологии RLE (Run Length Encoding), технологии векторной квантизации (Vector Quantization), а также всевозможные преобразования (Фурье, Дискретное Косинусное, Wavelet).

Первоначальное кодирование видео (имеющего естественную природу) в MPEG-4 осуществляется аналогично MPEG-1 и MPEG-2. В этом смысле основа кодирования у группы алгоритмов MPEG общая, однако MPEG-4, кроме рассмотренного традиционного MPEG-кодирования, основанного на прямоугольных кадрах, использует технологию контурно-основанного кодирования изображений. Контурно-основанное кодирование изображений представляет изображения как контуры, огибающие текстурные области (области, заполненные текстурами). А так как контуры, как правило, совпадают с границами изображаемых объектов сцены, то задача контурно-основанного кодирования сводится к задаче объектно-основанного кодирования изображений. MPEG-4 обеспечивает возможность индивидуально кодировать специфические элементы в рамках видеосюжета. Поскольку разные объекты, используемые в видеосюжете, как правило, имеют различную природу (текстурный фон, персонажи переднего плана, мелкие детали сцены), то совокупность различных по природе способов сжатия, используемых для разных типов данных, в зависимости от их природы, позволяет добиться наиболее высокой степени сжатия.

Высокая степень сжатия MPEG-4 позволяет архивировать большие объемы видео, например, такое устройство, как Vicoder (MPEG-4 архиватор и транслятор видео по кабельным сетям), позволяет записывать видео с визуальным качеством DVD в реальном времени (720x576, 25 кадр/с) непрерывно в течение недели! Однако самое главное преимущество, обеспечиваемое MPEG-4 алгоритмом - это вещание по сети.

Задача контурно-основанного кодирования в настоящее время является одной из наиболее перспективных и одной из очень трудоемких (с точки зрения вычислений). Специалисты группы MPEG утверждают, что данный алгоритм в 2003 году практически полностью заменит другие алгоритмы группы MPEG и будет использоваться в решении широкого круга задач мультимедиа. o

ЛИТЕРАТУРА

  1. Официальные документы ISO/IEC JTC1/SC29 WG11.
  2. Фоминов О. Мультимедиа и сети. "Мультимедиа. Цифровое видео", № 5-6, 7, 8,1997

Об авторе: Ю.Н.Гуркин, специалист ЗАО "Компания Безопасность"

Источник: Защита информации. Кофидент

 
« Пред.   След. »