Из слона муху: теория
 
09.03.2004
Тарас Бризицкий


 
<< стр. 3
стр. 4
стр. 5 >>

Транскодирование: зло или благо

Транскодирование (от англ. transcode), или преобразование из одного аудиоформата в другой, равно как и перекодирование (от англ. reencode), то есть повторная компрессия кодированного файла, являются наиболее распространенными ошибками начинающих меломанов.

По своей природе каждое lossy-преобразование аудиофайла необратимо ухудшает качество звука. То, насколько велики потери, зависит от исходного формата и степени компрессии. Ясно, что повторное кодирование MP3-файла с битрейтом 64 кбит/с ради «улучшения качества» звука в файл с битрейтом 320 кбит/с как минимум неразумно, ведь при этом качество звука ухудшается, а размер файла увеличивается. Так что армия поклонников OGG Vorbis, WMA или AAC, переводящая свои коллекции MP3 в новомодный формат для того, чтобы получить «в два раза меньший файл при таком же качестве», заслуживает лишь сочувствия. К слову, битрейт 128 кбит/с для MP3 и так является предельно низким, при котором файлы еще имеют сносное звучание, а повторное выкидывание большей части этих данных приводит к резкому снижению и без того невысокого качества.

При повышении битрейта «устойчивость» к транскодированию повышается, то есть появляется некоторая вероятность того, что после повторного кодирования восприятие фрагмента на слух не изменится или изменится незначительно. Впрочем, даже высокий битрейт и идеальный исходный материал не являются панацеей: достаточно несколько раз перекодировать MP3-файл с битрейтом 320 кбит/с, чтобы от исходного качества не осталось и следа.

Тем не менее, в некоторых ситуациях транскодирование или перекодирование имеет смысл. Например, владельцы плейеров на flash-картах наверняка предпочтут небольшое снижение качества увеличению количества песен, размещенных на флэшке. Иногда транскодирование — практически единственная возможность прослушать композицию. Так, если любимая песня хранится в одном из «вымерших» форматов, вроде VQF, можно воспользоваться транскодированием, разумеется, при условии, что владелец файлов не станет экономить на битрейте. С похожими целями любители слушать музыку в дороге иногда переводят некоторые треки из Musepack или wavpack lossy в MP3.

Если качество для вас действительно важно, постарайтесь провести повторное кодирование композиции в нужный формат, вместо того чтобы перекодировать ее.

Разумеется, все вышесказанное не относится к преобразованиям loseless ® lossy, когда исходный материал сжат без потерь.



OGG Vorbis

В Интернете не раз появлялись сообщения о том, что MP3 вот-вот станет платным. В конечном счете так оно и вышло: Fraunhoffer все же решил «подоить» производителей коммерческого софта и плейеров, что, правда, не слишком сказалось на рядовых пользователях, для которых остались бесплатные Winamp, Windows Media Player, Foobar и множество других проигрывателей, а свободно распространяемый LAME хоть и является «не-MP3-кодировщиком» (LAME — LAME Ain’t an MP3 Encoder), вполне подходит для сжатия музыки. Тем не менее, вопрос о создании свободно распространяемого бесплатного кодека становился актуальным…

В отличие от MP3/AAC/WMA и им подобных, OGG Vorbis был изначально заявлен, как бесплатный открытый формат, не использующий патентованных технологий, а потому любой желающий мог бесплатно использовать его в собственных разработках. Впрочем, ситуация с патентами Vorbis ясна не до конца. Конечно, юристы AOL потратили немало времени и денег, проведя соответствующий поиск, прежде чем сделать вывод о «чистоте» формата. Тем не менее, от ошибки никто не застрахован, а создать современную технологию, в которой не используется ни один патент, вряд ли возможно. Так что не исключена возможность, что в будущем появится какая-нибудь компания, клятвенно заверяющая нас, что популярный кодек использует в своей работе их патентованные алгоритмы… Ну да ладно, вернемся к нашим баранам…

Таким образом, OGG Vorbis (сам кодек называется Vorbis, а OGG — всего лишь контейнер, так что не следует их путать; ведь есть же OGG FLAC или OGM, формат, позволяющий хранить внутри OGG контейнера звук, видео и текст; далее мы будем говорить об OGG в основном применительно к кодеку Vorbis) стал чем-то вроде «бесплатного MP3» (как будто MP3 для обычного пользователя сейчас платный…) в мире аудиоформатов, быстро заполучив огромную армию поклонников. OGG Vorbis имеет немало отличий от MP3. Прежде всего он является VBR-кодеком, ориентированным на качество. Разумеется, можно создавать CBR-файлы и даже «втискивать» композицию в заданный объем, не заботясь о качестве, но главным режимом сжатия для Vorbis-файлов является именно VBR. Как и многие современные кодеки, OGG Vorbis сжимает файлы с учетом их реальной длительности (длина исходного и MP3-файла может отличаться, а во избежание подобных проблем приходится использовать нестандартные решения, не поддерживаемые многими популярными декодерами) и имеет гибкий формат тегов, значительно превосходящий по возможностям популярный в мире MP3 «костыль» ID3v2.

Качество звучания Vorbis заметно выше, чем MP3 при использовании параметров кодирования (ключ Q) от –1 до 4 (45–128 кбит/с); с повышением битрейта картина меняется не так сильно. Как и MP3, OGG Vorbis подвержен разнообразным артефактам (особенно вышеупомянутому преэхо), поэтому, когда речь идет о «прозрачном» кодировании, о достоинствах или недостатках каждого из форматов можно спорить. Ситуацию усугубляет то, что Xiph.org довольно халатно отнеслась к настройке работы кодера на высоких битрейтах, предпочтя заняться более популярным диапазоном <128 кбит/с. В результате увеличение битрейта Vorbis-файла может не принести желаемого результата, и кодек будет ошибаться как ни в чем не бывало. Еще одним не до конца понятным аспектом является наличие «сложных» сэмплов, сжатие которых сопровождается значительными проблемами. И если в случае MP3 или Musepack список «критических» сэмплов хорошо известен, то от новых форматов, вроде OGG или AAC, вполне можно ожидать неприятных сюрпризов.

Альтернативой «официальному» кодировщику от Xiph.org стала серия кодеков GT (Garf tuned), призванных улучшить качество звучания файлов при использовании средних и высоких битрейтов. Настройкой кодека занялся некто под псевдонимом Garf, сумевший в значительной степени избавить Vorbis от эффекта преэхо в последнем своем кодере GT3 beta 1. Таким образом, если вы предпочитаете хранить музыку в OGG Vorbis с высоким качеством, этот кодировщик является «must have». Кстати, помимо GT, Garf демонстрировал возможности формата на еще одном кодере — Floggy (floppy OGG). Для загрузки на сайте (www.users.pandora.be/sjeng/floggy.html ) разработчика доступны несколько композиций, кодированных в Vorbis с совершенно запредельными битрейтами: от 6 до 4 (sic!) кбит/с, что следует признать действительно большим достижением. Можно понять скептиков, которые лишь ухмыльнутся, увидев подобные цифры. Настоятельно рекомендуем им загрузить и прослушать файлы; для такого битрейта — качество звучания более чем приемлемое. Чего стоит одна лишь квиновская «Who Wants to Live Forever» размером менее 200 Кбайт! К сожалению (или к счастью?), несмотря на все уговоры, Garf так и не выпустил отдельный кодировщик, сославшись на его бесполезность (код floggy был включен в GT3, а для доступа к нему нужно использовать параметры кодирования -q-2 --resample 8000).

Кстати, как и многие другие современные форматы (AAC, WMA9pro), Vorbis может компрессировать многоканальный звук. Эта функция еще не доведена до ума, однако факт остается фактом: возможность просмотра DivX/Xvid-фильмов с многоканальной Vorbis-дорожкой, ужатой до 128 кбит/с, выглядит привлекательнее, чем перспектива прослушивания стереофонического саундтрека с тем же битрейтом формата MP3.

Помимо вышеназванных, OGG Vorbis имеет еще несколько интересных особенностей, в том числе возможность деления и «сращивания» OGG-файлов без перекодирования потока (в принципе подобное можно проделать и при помощи MP3 Direct Cut). К примеру, весь альбом (с разбиением на треки, сохранением тегов и т. д.) можно хранить в виде единственного файла, который, если нужно, без потерь режется на отдельные дорожки.

Долгое время в форумах мусолили тему bitrate peeling — возможности создания Vorbis-файлов, позволяющих извлекать из них «компоненты» с меньшим битрейтом, обходясь без повторной компрессии. Этот подход, позволит, например, создавать файлы 128 кбит/с, из которых в последующем можно извлечь и версию 64 кбит/с, не прибегая к перекодировке и не тратя места на хранение нескольких версий одной и той же композиции. Жаль, но слухи так и остались слухами, а с bitrate peeling в OGG Vorbis возникли проблемы, так что эта технология пока не реализована.

Мы говорили про аппаратную поддержку? Уже начинавшие бить тревогу пользователи формата получили-таки в нынешнем году возможность приобрести несколько устройств с поддержкой воспроизведения OGG Vorbis-файлов. В частности, компания iRiver не только обновила прошивки для новых линеек своих плейеров, но и постаралась включить поддержку формата в ранее выпущенные модели (см. www.iriver.com ).



 
<< стр. 3
стр. 4
стр. 5 >>

<<Из слона муху: практика
Все материалы номера
Микрофишки >>