КОМПЬЮТЕРРА / БУМАЖНАЯ КОМПЬЮТЕРРА / 2003 / №37 / Аналоговый блюз

Аналоговый блюз

30.09.2003
Александр Радзишевский

стр. 2

В соответствии с теоремой Котельникова (Найквиста) частота дискретизации устанавливает верхнюю границу частот, информация о которых сохраняется в оцифрованном сигнале. А именно: максимальная частота спектральных составляющих сигнала равна половине частоты дискретизации. На практике это означает, что аудио-CD, несущий данные, дискретизованные с частотой 44,1 кГц, несет информацию об оригинальной записи в полосе частот от 0 Гц до 22050 Гц. Человеческий слуховой аппарат, кстати, способен улавливать частоты в диапазоне (приблизительно) 0–20 кГц.

Еще одним нежелательным эффектом оцифровки является так называемый джиттер (от англ. jitter — дрожание). Джиттер — это шум, возникающий вследствие нестабильности АЦП. Нестабильность этого электронного устройства выражается в том, что оцифровка проходит не с точно установленным шагом дискретизации, а с небольшими отклонениями от его номинального значения. Такое «дрожание АЦП» вносит в спектр сигнала паразитные высшие гармоники.

Для уменьшения объемов цифровых данных было предложено много разных способов их записи. Самый простой способ уплотнения заключается в записи не абсолютных значений амплитуды сигнала, а относительных изменений величины амплитуды (на запись которых можно тратить меньше бит, чем в случае ИКМ). Такой формат хранения данных носит название «адаптивная относительная импульсно-кодовая модуляция» или АОИКМ⁶ (ADPCM — Adaptive Delta PCM). Однако, несмотря на свою простоту и достаточно широкую распространенность, этот способ оказывается не слишком удачным, поскольку ограничение числа бит, используемых для записи величины изменения амплитуды, как правило, приводит к искажению сигнала.

Can you hear the music ringin’ in your ear?

На сегодняшний день существуют другие способы сжатия цифровых аудиоданных, которые в целом можно разделить на два принципиально различных типа: способы сжатия данных без потерь (lossless compression) и с потерями (lossy compression).

Цель сжатия без потерь заключается в достижении как можно более эффективного уплотнения цифровых данных с обязательным условием возможности последующего стопроцентного восстановления оригинальных данных. В целом, lossless-компрессор — это архиватор (как ZIP, RAR или другой), внутренний механизм сжатия которого адаптирован специально на сжатие аудиоинформации. Компрессоры этого типа на большинстве типов аудио данных обеспечивают в лучшем случае двойное сжатие, что является чаще всего наилучшим результатом сжатия даже теоретически.

Коэффициента уплотнения данных, обеспечиваемого lossless-компрессией, часто оказывается недостаточно. В таком случае прибегают к более эффективной компрессии — сжатию данных с потерями. Основная идея в том, что формат ИКМ избыточен и ИКМ данные могут быть уплотнены.

Человеческий слух не идеален: он инертен, его реакция и чувствительность конечны. Существует множество тому доказательств. Например: при звучании тихого тона на фоне близкого к нему по частоте громкого тона, слух воспримет только более громкий из них; слух вообще не способен различить два тона, отличающихся друг от друга меньше чем на 3 Гц; слух абсолютно не способен различить резкое пропадание звучания высоких частот, если этот провал произошел меньше чем на 2 мс. Эти и многие другие особенности слуха называются психоакустическими.

Цель кодирования с потерями заключается в достижении как можно более эффективного сжатия при сохранении схожести звучания закодированного сигнала с несжатым цифровым. Lossy-сжатие в общем проходит по следующей схеме: «упрощение» цифрового аудио сигнала (с учетом целого ряда психоакустических особенностей), а затем сжатие упрощенных данных каким-нибудь lossless-алгоритмом. Примеров lossy-алгоритмов и их реализаций существует много. Lossy-алгоритмы это: MPEG-1 Layer 1, 2, 3 (Layer 3 — это всем известный MP3), MPEG-2/4 AAC, Real Audio (файлы .RA), Ogg Vorbis (файлы .OGG), MusePack (два последних основаны на MPEG-1 Layer 2), Windows Media Audio (файлы .WMA) и многие-многие другие. Здесь нужно отметить, что как бы разработчики ни рекламировали свои компрессоры, lossy-кодирование — это всегда кодирование с потерями качества, и звучание закодированных таким образом данных уже не является звучанием оцифрованного оригинального сигнала, а лишь очень на него похоже. При этом степень «схожести» звучания зависит от «агрессивности» упрощения сигнала при сжатии: чем больше упрощается сигнал в процессе сжатия, тем более высокий коэффициент компрессии может быть достигнут, но тем хуже звучат закодированные таким образом данные.

6 (назад) Или дельта-модуляция.

стр. 1

стр. 2

стр. 3

<<	Быт или не быт?

Все материалы номера

Бархатная эволюция