Сравнениe аудио форматов. Разница, которую можно увидеть! - Мои статьи - Каталог статей - Всё, что связано с хорошим звуком!
Главная
Регистрация
Вход
Понедельник
05.12.2016
21:34
Приветствую Вас Гость | RSS
RoNikEr - всё, что связано с хорошим звуком!

Меню сайта

Категории раздела
Мои статьи [39]

Наш опрос
Оцените мой сайт
Всего ответов: 1545

Поделиться!

WebMoney - $пасибо! От Вас для roniker.ru

Статистика

Онлайн всего: 2
Гостей: 1
Пользователей: 1
sserpan

 Каталог статей 
Главная » Статьи » Мои статьи

Сравнениe аудио форматов. Разница, которую можно увидеть!
Сравнение аудио форматов. Разница, которую можно увидеть!

Сегодня я хочу сравнить несколько разновидностей цифровых аудио форматов на предмет "насколько отличаются аудио файлы разных форматов от несжатого *.wav?". Не хотелось бы никаких эфемерных и сугубо субъективных результатов этого теста, типа "мне больше понравилось то, но меньше это". Хочется наглядно увидеть и продемонстрировать, что же отличает друг от друга разные форматы - как сжатые с потерями (lossy), так и без потерь (lossless) от оригинального, несжатого файла. Возьмём для примера, как образец и эталон, файл wav и сравним его с остальными. Методика измерений до смешного проста - будет применен эффект вычитания с помощью противофазы. Подробней - дальше.

ВЫБОР ТЕСТОВОГО ТРЕКА.

Для теста нужен оригинальный Audio CD, и в нашем случае, не обязательно аудиофильский, любой. Главное, он должен содержать звуковую информацию с ярко выраженным ВЧ-спектром. Так как lossy файлы отличаются в большей степени как раз проблемами с высокими частотами (ВЧ). Для этого теста я выбрал диск из собственной коллекции - Pet Shop Boys - Alternative, двойник, выпущенный в 1995 году английским лейблом Parlophone. Да вот именно он, на Discogs - ЗДЕСЬ. Вот как выглядит в разобранном состоянии:



Иллюстрация 01. Двойной альбом Pet Shop Boys - Alternative с буклетом.

Для теста выбрал трек со второго диска - Decadence. Просто он мне больше нравится... Судя по показаниям TAU аналайзера, с ВЧ и с подлинностью там всё в порядке:



Иллюстрация 02. АЧХ трека Decadence (оригинал, Audio CD).



Иллюстрация 03. Спектральный анализ трека Decadence (оригинал,  Audio CD).

С помощью известной и многими любимой программы - звукового редактора Sony Sound Forge 10, извлечём данные с диска и сохраним в файл *.wav. Назовём его, дабы не путаться потом - Pet Shop Boys - Decadence (WAV, 1411 Kbps).wav. Теперь, определившись с нашим оригиналом-эталоном, рассмотрим подробней методику измерения качества звука,  в нечто, что можно оценить визуально. 

АКУСТИЧЕСКАЯ ПРОТИВОФАЗА.

Всем известно (если Вам нет - подключайтесь!), что при сложении двух абсолютно одинаковых звуковых (теоретически - любых) волн, одна из которых находится в противофазе по отношению к другой, в результате получается полная тишина. На практике такое практически невозможно, но в звуковом редакторе - легко выполнимо. 

Почему в окружающей нас обстановке, в реальном мире, невозможно добиться такого идеального противофазного эффекта на практике? Чтобы было два излучающих звук источника, а мы бы их не слышали, хотя были бы уверены при этом, что они точно работают, излучают звук? Потому, что невозможно создать таких идеальных условий, чтобы мы слышали две абсолютно одинаковых звуковых волны одновременно. Виной тому отражения звука от различных предметов, земли, пола, потолка и т. д. Но приблизиться к этому эффекту можно. Яркий пример - так называемые "кардиоидные" сабвуферы, сабвуферы с кардиоидной характеристикой направленности, довольно широко применяющиеся в профессиональном звукоусилении. Только они пока не столь распространены, как обычные, с направленностью "омни", благодаря своей сравнительно высокой стоимости. Нужны такие АС для того, чтобы управлять направленностью инфра-низких частот.

Принцип действия. В таких сабвуферах, помимо привычных излучателей - динамиков, которые излучают вперёд, устанавливаются дополнительные, которые излучают назад. Если добиться наиболее близкой к идеалу противофазе, такой сабвуфер будет излучать вперёд намного сильнее, чем в стороны и назад. Хотя всем известно, что инфра НЧ не могут излучаться направленно. С помощью этой технологии, можно добиться направленности в работе сабвуферов, ослабления излучения НЧ назад на несколько десятков дБ, что довольно много и очень ощутимо.

МЕТОДИКА ИСПЫТАНИЙ.

В нашем случае, в звуковом редакторе, можно добиться идеального противофазного эффекта. То есть, если взять файл, скопировать его, повернуть копию по фазе на 180°, то в результате сложения, вместо изображения волны получим прямую - полную тишину. Теперь самое главное. Если два файла будут хоть чем-то, хоть даже совсем немного отличаться, идеальной тишины в итоге мы не получим никак.

Теоретически, в результате таких действий, мы должны получить то, чем и отличаются файлы разных форматов друг от друга.

Известно, что программы - аудио кодеки вносят небольшие временные изменения в полученный на выходе файл. То есть, при кодировании, в начало каждого трека, почти все кодеки (и lossless тоже) добавляют 1 фрейм, который составляет несколько миллисекунд (или несколько десятков, даже сотен сэмплов, у каждого кодека своя длина фрейма), на которые смещается дорожка относительно исходника при декодировании потока. Что такое фрейм и сэмпл - ТУТ. Для чистоты эксперимента, нам нужно идеально выровнять два складываемых файла по времени начала трека - для этого будем ориентироваться в звуковом редакторе графическим представлением формы волны. Для наглядности вышесказанного посмотрим на две иллюстрации ниже:


Иллюстрация  04. Определяем начало трека.



Иллюстрация  05. Определяем начало трека-оригинала - на скриншоте - максимальное графическое разрешение редактора. Ставим маркер.

Теперь остаётся сделать следующее - перекодировать исходный файл-образец в разные форматы. В случае с mp3 - воспользоваться разными кодеками и разными битрейтами, так как даже субъективно, на слух, без всяких замеров кодек Lame отличается от Fraunhofer IIS. Для кодировки в mp3 кодеком Fraunhofer IIS, воспользуемся встроенным в редактор Sound Forge 10 (SF10) кодеком, кодек  Lame есть в пакете Nero и мне лично он больше нравится. Найти можно так: Nero -> Дополнительно -> Кодировать файлы. Файлы mp3 будут 2-х битрейтов, 128 и 320 kbps, ogg - 128 и 350 kbps, lossless будем сжимать насколько возможно сильно.

У меня получился такой список из 10 файлов + оригинал, которые мы и будем сравнивать вышеописанным методом:

01.  (APE, 882 Kbps).ape                  - Monkey's Audio         - 25 410 KБ
02.  (FLAC, 925 Kbps).flac                 - FLAC                       - 26 649 KБ
03.  (Fraunhofer IIS, 128 Kbps).mp3   - MPEG layer 3            - 3 690 KБ
04.  (Fraunhofer IIS, 320 Kbps).mp3   - MPEG layer 3            - 9 222 KБ
05.  (LAME, 128 Kbps).mp3               - MPEG layer 3            - 3 690 KБ
06.  (LAME, 320 Kbps).mp3               - MPEG layer 3            - 9 223 KБ
07.  (xrecode II MP3, 128 Kbps).mp3  - MPEG layer 3            - 3 689 KБ
08.  (xrecode II MP3, 320 Kbps).mp3  - MPEG layer 3            - 9 222 KБ
09.  (OGG, 128 Kbps).ogg                 - Ogg Vorbis               - 3 684 KБ
10.   (OGG, 350 Kbps).ogg                - Ogg Vorbis               - 10 044 KБ
11.  (WAV, 1411 Kbps).wav               - WAV                       - 40 655 KБ

После перекодировки, так как звуковые редакторы не все форматы "понимают" (например, мой WaveLab не понимает flac, а Sound Forge - ape), перекодируем результаты опять в wav (16 бит - 44,100 Гц) и будем дальше работать с ними. Теоретически, измениться при перекодировке из любого из представленных выше форматов в wav 16 бит - 44,100 Гц  наши "претенденты" не должны. То есть потери в этом случае односторонние, при конвертировании из несжатых форматов (или сжатых без потерь - lossless) в lossy.  

Конвертировать в wav я решил самым простым способом, с помощью foobar2000, запустив кодирование сразу всех испытуемых файлов одновременно. Благо, foobar2000 отлично "понимает" все форматы из нашего списка.

ВАЖНО: За три сэмпла до того, как волна начнёт подниматься вверх (Иллюстрация 05), ставим маркер на каждом из испытуемых треков, перекодированных в wav из lossless и lossy. Всё, что от этого маркера до начала каждого из треков (помечено чёрным) удаляем у всех испытуемых wav-файлов. В результате имеем одинаковое начало у всех конкурсантов - для лучшей синхронизации и точности.

Обратите внимание, wav-файлы, полученные из lossy, уже ощутимо отличаются по размеру с оригиналом! Вот скрин папки с аудио файлами:



Иллюстрация  06. Папка с испытуемыми. Верхний, один, выделенный красным - оригинал. По размеру с ним совпадают только то, что получилось из lossless и ogg 350 Kbps. Остальные, из lossy форматов отличаются, и немало...

НЕПОСРЕДСТВЕННО ТЕСТ.

Начал с первого файла  (APE, 882 Kbps).ape. Как и ожидал, получилась идеальная прямая - полная тишина:



Иллюстрация  07. Картинка после сложения файлов wav и ape. Красным выделена шкала, показывающая, что выставлено максимальное разрешение редактора.

После сложения wav и flac получилось то же самое. Оно и понятно - сжатие без потерь, оно и есть без потерь. Теперь самое интересное, вот скрин оригинального файла:



Иллюстрация  08. Скриншот оригинального файла.

Обратите внимание на разрешение (отмечено красным) - максимум вместимости информации в одном месте, показана вся волна. Теперь то, что получилось при сложении оригинала с файлом  03.  (Fraunhofer IIS, 128 Kbps).mp3:



Иллюстрация 09. Какой кошмар! Скриншот смикшированных оригинала с mp3 (Fraunhofer IIS, 128 Kbps)

Глядя на иллюстрацию 09 мы видим, сколько музыкальной информации мы "недополучаем", слушая сильно сжатые, с низким битрейтом аудио файлы )) Дальше приведу точные замеры в редакторе WaveLab, там для этого есть хороший инструмент, тогда и будут видны все потери в цифрах. Посмотрим, что же у нас с этим же кодеком, но 320-м битрейтом:



Иллюстрация 10. Скриншот смикшированных оригинала с mp3 (Fraunhofer IIS, 320 Kbps)
 
Уже лучше, намного лучше, но отличия "налицо". Поглядим, что же получится, если смикшировать оригинал с результатом работы программы-конвертера xrecode II (07.  (MP3, 128 Kbps).mp3). Не смог выяснить, какой там кодек используется, да и не к чему это )). Скорее всего, тот же Fraunhofer, потому что скрины похожи, как 2 капли воды, не имеет смысла выкладывать. Это касается также файла  08.  ( xrecode II  MP3, 320 Kbps).mp3. А вот кодек Lame, думаю, преподнесёт сюрприз... Да, есть маленько... Хоть и не особо, но отличаются результаты:





Иллюстрация 11-12. Скриншот смикшированных оригинала с mp3 - LAME, 128 - вверху и 320 Kbps. 

Надеюсь, с OGG будет интересней. Звучит-то и вправду лучше mp3:




Иллюстрация 13-14. Скриншот смикшированных оригинала с OGG, 128 - вверху и 350 Kbps - внизу.

Результаты сохранил в wave-формате, для дальнейшей работы в редакторе Steinberg WaveLab 6. Сейчас мы всё точно замеряем с помощью функции "Global analysis"! Вот точные данные анализа разных файлов:

   

Иллюстрация 15-16. Скриншот анализатора - LAME 320 Kbps и Fraunhofer IIS, 320 Kbps 

  

Иллюстрация 17-18. Скриншот анализатора - OGG 128 Kbps и 350 Kbps.

   

Иллюстрация 19-20. Скриншот анализатора - LAME 128 Kbps и FLAC\APE (одинаковый результат).

ВЫВОДЫ.

На иллюстрациях с 15-й по 20-ю видны числовые значения RMS уровней наших "остатков". Чем меньше число - тем хуже; то есть значение "-18", в нашем случае, намного хуже, чем "-34". Просто поражает RMS уровень файла mp3 с кодеком LAME - -18.83 (left ch.) и -18.55 (right ch.) dB!!! Сравнительно неплохой результат получился у lossy на больших битрейтах, особенно из микса с файлом OGG с битрейтом 350 - -34.43 (left ch.) и -34.53 (right ch.) dB. Но результат с lossless просто оправдал ожидания - бесконечность! Полная тишина, что и требовалось доказать.

Отсюда сделаем главный вывод - все lossy форматы в большей или меньшей степени ухудшают звучание. Особенно на низких битрейтах, просто убивают звук! Оно и понятно - сжатие с потерями, это не секрет. Чего нельзя сказать о lossless форматах - они просто ничего не делают с оригинальным звуком, оставляя его таким, каким он был изначально! Lossless сохраняет оригинальный wav без каких-либо изменений абсолютно! С чем и поздравляю людей, предпочитающих Lossless форматы форматам Lossy - mp3, ogg и иже с ними.

ДОПОЛНЕНИЕ ОТ 2 СЕНТЯБРЯ 2013 ГОДА:

Решил проверить разницу между WAV-файлом с параметрами формата CDDA (44,100 Hz\16 bit) и WAV-файлом в Hi-Res (96,000 Hz\24 bit) с помощью той же методики.

Для этого взял любезно предоставленный участником нашего форума sergesha звуковой файл в ХайРезе - Muse - Save Me (альбом 2012 года The 2nd Law) .



Иллюстрация 21. Скриншот анализатора спектра, встроенного в Adobe Audition. Можно увидеть на скриншоте, что звуковой спектр простирается примерно до 30 кГц. Судя по теореме Котельникова, могло быть и до 48 кГц, на радость летучим мышам ))

Чтобы сравнение было наиболее корректным, выбрал следующую методику. Файл в Hi-Res даунсемплируем (понижаем параметры) до формата CDDA (делаем динамические и частотные характеристики звукового файла такими же, как у CDDA). Далее возвращаем параметры до оригинального Hi-Res'а, подгоняем начало каждого из образцов с точностью до сэмпла, переворачиваем фазу на 180 градусов у одного из них и складываем (микшируем друг с другом два получившихся образца) в звуковом редакторе Sound Forge. Методика та же практически. Только вот получение образцов для сравнения немного отличается.

Так как мастеринг альбомов вполне может быть абсолютно разным для разных носителей информации, не стал искать эту вещь от Muse в CDDA формате. Чистота эксперимента бы просто потерялась.

Вот что получилось после сложения волн в Sound Forge:



Иллюстрация 22. Скриншот смикшированных в противофазе файлов Hi-Res и 16\44,100. 

После анализа в редакторе Steinberg WaveLab 6, получились следующие данные:



Иллюстрация 23. Скриншот анализатора - уровень разницы, получившейся при сложении звукового файла в Hi-Res (24bit\96kHz) и файла в формате CDDA (16bit\44,100Hz).



Иллюстрация 24. Скриншот анализатора спектра программы Adobe Audition - разница, оставшаяся при сложении двух волн разных форматов в противофазе.

ВЫВОДЫ:

Разница в этих звуковых файлах есть, и не маленькая. Другое дело, что эта разница лежит за пределами возможностей человеческого слуха. По крайней мере, проигрывая файл, получившийся при сложении, в звуковом редакторе, мне не удалось услышать ничего. Хоть индикатор показывал наличие сигнала. Это и не удивительно - судя по показаниям анализатора спектра программы - звукового редактора Adobe Audition, наличие звука в этом аудио файле начинается только примерно от 22 кГц (44,100 разделить на 2, согласно теореме Котельникова (Найквиста - Шеннона), как раз 22,500 Гц и получается.  В попытке что-то услышать, делать громче обычного уровня не стал даже и пытаться, стало жалко ВЧ драйвера... 

Не знаю, как кому, а лично мне формата  CDDA (44,100 Hz\16 bit), а стало быть и lossless с теми же показателями вполне хватает для удовлетворения моих эстетических потребностей...


5 июня 2013 (дополнения 2 сентября 2013) © RoNikEr™

Нажимаем, чтобы поделиться этой новостью:



Категория: Мои статьи | Добавил: RoNikEr (05.06.2013)
Просмотров: 10600 | Рейтинг: 5.0/60
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Форма входа


Google translate

Интересное в сети

Кизел
free counters
Free counters reinstalled 11.05.11
Copyright MyCorp © 2016
Яндекс.Метрика Анализ интернет сайта
Яндекс цитирования