Кодирование видеоинформацииРефераты >> Программирование и компьютеры >> Кодирование видеоинформации
После того как контуры и текстуры вычленены из изображения, контуры могут быть представлены как контрольные точки «сплина» (spline) – полиномиальной функции, используемой для представления кривых, «обтягивающих» тот или иной контур. Текстуры же, в свою очередь, могут быть представлены в качестве коэффициентов какого-либо пространственного преобразования частоты (например, дискретного косинусного или дискретного wavelet-преобразования). Сжатие же может быть достигнуто путем скалярной или векторной квантизации контрольных параметров «сплина» и коэффициентов преобразования, используемых для представления текстуры. Но не будем вдаваться в математические детали, используемые в ходе кодирования видео.
Что и говорить, задача контурно-основанного кодирования в настоящее время является одной из наиболее перспективных и, пожалуй, одной из весьма трудоемких (с точки зрения вычислений).
Говоря простыми словами, MPEG-4 обеспечивает возможность индивидуально кодировать специфические элементы в рамках видео сюжета. Поскольку разные объекты, используемые в видео сюжете, как правило, имеют различную природу (текстурный фон, персонажи переднего плана, мелкие детали сцены), то совокупность различных по природе способов сжатия, используемых для разных типов данных, в зависимости от их природы, позволяет добиться наиболее высокой степени сжатия.
1.4 Индивидуальные объекты
Основным отличием MPEG-4 сжатия от предшествующих алгоритмов сжатия видео MPEG-1 и MPEG-2 является не сжатие последовательности прямоугольных кадров, а использование принципа кодирования индивидуальных объектов произвольной формы. Кодирование формы, или альфа канала, означает, что произвольная форма в сцене MPEG-4 может отслеживаться посредством двоичной альфа карты, определяющей принадлежность данного пиксела к объекту. Это особенно полезно для разработчиков интерактивного кон тента по нескольким причинам. Во-первых, видеоинформация не обязательно должна быть оформлена в виде прямоугольных кадров. Во-вторых, индивидуально закодированные видео формы можно интегрировать с другими объектами, такими как 2D-, 3D- или естественный видеофон, образуя сцены. Наконец, особый интерес для разработчиков представляет возможность использования отдельных объектов в качестве элементов интерактивного действия. Примерами могут служить простые взаимосвязи в рамках сюжета или смоделированные персонажи, реагирующие на действия пользователя.
Результатом такого объектного подхода стала возможность интеграции естественных и синтетических видеоисточников. Стандарт MPEG-4 содержит средства интеграции для кодирования растровых видео изображений и средства создания и интеграции синтезированных 2D- и 3D-элементов, включая геометрические формы и объекты, текст и синтезированную графику.
1.5 Что такое DivX?
История возникновения этой аббревиатуры весьма таинственна. Дело в том, что изначально аббревиатурой DivX назывались обычные DVD-диски с ограниченным количеством возможностей просмотра видеофильма, однако не так давно ее смысл значительно изменился. Итак, речь идет о совершенно иной технологии, для обозначения которой используется аббревиатура DivX.
Как утверждают источники (www.news.com), двое хакеров явили миру новый формат сжатия видео файлов, названный ими DivX. На самом деле DivX является всего лишь взломанной версией Microsoft MPEG-4 Video Codec (Low-Motion-кодек — это взломанная версия 4.1.00.4920 MPEG4v3, а High-Motion-кодек – 4.1.4917 MPEGv3). Как утверждают авторы, они его слегка доработали и улучшили. В частности, они сделали возможным вывод файлов после компрессии в формате *.avi, в то время как кодек MPEG-4 Video Codec поддерживает формат *.asf и устанавливается вместе с Windows Media Player или Windows Media Tools.
То есть фактически данный алгоритм официально не поддерживается, по крайней мере, в таком исполнении, тем не менее, DivX базируется на формате MPEG-4.
Прелесть алгоритма DivX заключается в том, что фильм длительностью до трех часов можно сжать до объема, умещающегося на одном CD, что вдвое меньше, чем у MPEG-1, при этом результатом будет более качественная картинка, особенно в плане разрешения. Появившиеся на рынках диски с записью фильмов в стандарте MPEG-4 — случай подобного использования алгоритма DivX. Их стоимость сегодня составляет от 50 до 100 рублей в зависимости от качества и содержимого. В качестве источника, как правило, используется DVD. Большинство фильмов записано в формате 16:9, дает не лучшую картинку на мониторе, однако качество таких фильмов, как правило, выше, чем фильмов с обычным форматом 4:3. Кроме того, чем меньше продолжительность фильма, тем большую скорость цифрового потока можно использовать, заполняя все пространство диска CD. Разумеется, и качество в этом случае будет выше.
Предположим, к вам какими-то загадочными путями попал DVD-диск с хорошим фильмом. Благодаря технологии DivX вы можете сохранить файл фильма у себя, скажем, на жестком диске, да еще и прилично сжать его по объему, правда, с некоторой потерей качества. В дальнейшем полученный сжатый файл можно записать на CD-R, как и любой другой файл, и использовать его в нужное время.
Если говорить о недостатках DivX, то нельзя не отметить отсутствие возможности просмотра полученного фильма на обычном домашнем телевизоре. Правда, ситуация может оказаться разрешимой, если у вас имеется видео карта с неплохим TV выходом, однако даже в этом случае изображение будет слегка размытым и далеким от совершенства.
1.6 MPEG Layer 3, и не только
Для эффективного кодирования аудиоданных применяются наиболее прогрессивные методы, в основе которых лежит свойство их универсальности и независимости от качества исходного звукового фрагмента, равно как и результирующего, в зависимости от установок, применяемых в ходе сжатия.
В настоящее время наиболее известны mp3, wma и divx audio . Все они используют так называемое кодирование для восприятия (perceptual coding), при котором из звукового сигнала удаляется информация, малозаметная для слуха. В результате, несмотря на изменение формы, и спектра сигнала, его слуховое восприятие практически не меняется, а степень сжатия оправдывает незначительное уменьшение качества. Такое кодирование относится к методам сжатия с потерями, когда из сжатого сигнала уже невозможно точно восстановить исходную волновую форму.
Приемы удаления части информации базируются на особенностях человеческого слуха, называемой маскированием: при наличии в спектре звука выраженных пиков (преобладающих гармоник) более слабые частотные составляющие в непосредственной близости от них на слух практически не воспринимаются (маскируются). При кодировании весь звуковой поток разбивается на мелкие кадры, каждый из которых преобразуется в спектральное представление и делится на ряд частотных полос. Внутри полос происходит определение и удаление маскируемых звуков, после чего каждый кадр подвергается адаптивному кодированию прямо в спектральной форме. Все эти операции позволяют значительно (в несколько раз) уменьшить объем данных при сохранении качества, приемлемого для большинства слушателей.