Сайт Юрия Макарова

   

 

Мифы о виниле

 

Написать эту статью я решил после общения на некоторых форумах меломанов, где сам процесс обсуждения нередко бывает пронизан эгоцентризмом и дремучим невежеством. Неудивительно, что восприятие таких невидимых явлений, как звук, сопровождается вымыслами. Попробуем в этом разобраться.


 

Это не очередной опус дилетанта на давно уже неактуальную тему, а попытка поделиться опытом, накопленным мной за годы разработки и изготовления радиоизмерительных приборов. Отношения с винилом не сложились у меня с самого начала, о чём я всегда сожалел. На закате эпохи аналогового звука, на которую пришёлся самый расцвет пластиночной индустрии в мире, фирменные диски не доходили до прилавков наших магазинов по идеологическим причинам и на чёрном рынке стоили очень дорого. Денег не было, но был интерес к музыке, поэтому приходилось ограничиваться перезаписью у знакомых в лучшем случае первой копии диска с катушки на катушку. Магнитофонная культура тех времён была развита необычайно, и благодаря ей все желающие могли приобщиться к мировым музыкальным шедеврам, пусть и с худшим, чем у пластинок, качеством звука. Термин «винил» тогда ещё не был в ходу, его стали употреблять гораздо позже, когда появились компакт-диски.

Примерно на рубеже веков возникла индустрия High-End, что означает высший предел качества, концепция которой строилась на субъективном восприятии звука и заоблачных ценах. Для тех, кого не устраивала «мёртвая цифра», режущая звук на кусочки, был предложен духоподъёмный лозунг «Возрождение винила». Людям внушалась мысль о том, что цифровой звук компакт-дисков содержит лишь часть информации об исходном аналоговом сигнале (что является абсолютной правдой), и это должно быть оскорбительно для слуха истинных ценителей музыки. Кодекс аудиофила гласит: хочешь настоящего звука, - ставь вертушку в песок, неделю прогревай усилитель и используй соединительные шнуры из чистого золота. Считается, что если оцифровать пластинку с бескомпромиссным качеством 24 бита 192 кГц, то можно сохранить её «живую аналоговость» и «теплоту звучания», недоступную компакт-дискам. Для большей драматургии ниже дана звуковая подборка высказываний известных и весьма уважаемых людей об их представлениях о звуке и о модной нынче «виниловой» теме.

 

Мнения мэтров о звуке

 

Действительно ли винил настолько хорош, что о нём так много говорят? В акустике, как и в любой другой области знаний, сложилась своя система измерений характеристик звука, основанная на законах физики. Аудиофилы считают, что музыку надо слушать ушами, а не осциллографом, ставя оппонентов в тупик этим демагогическим заявлением. Однако истина всегда конкретна, и речь идёт совсем не о музыке. Столь упорное нежелание проводить интереснейшие тесты я объясняю подсознательным страхом разоблачения с потерей влияния на окружающих, что бывает вызвано элементарной безграмотностью на фоне завышенных амбиций. Эта статья носит общеобразовательный характер, её тема, - обычное человеческое любопытство как двигатель прогресса. Каждый из нас делает свой выбор: либо стремиться к истине, умножая печали на пути познания, либо жить в гармонии со своими заблуждениями в постоянно меняющемся мире. Примерами реального и выдуманного восприятия действительности могут служить исследовательская деятельность Николы Теслы, создавшего всю современную электротехнику, и движение спиритизма того же периода времени, не оставившего после себя практически ничего.

Что касается соединительных шнуров, то направление их подключения никак не сказывается на звуке. В аналоговых кабелях, которые представляют из себя два электрических проводника, симметрично распаянные на концах, переменный ток звуковой частоты движется одинаково в обоих направлениях. В цифровых коаксиальных кабелях, которые устроены точно так же, передаётся цифровой поток в виде электрических импульсов постоянной амплитуды с высокой частотой. Для уменьшения эффекта «джиттера» (jitter - в данном случае дрожание фронта импульсов во времени, которое может привести к искажению всего цифрового потока) они имеют волновое сопротивление 75 Ом, что подразумевает строго нормированную геометрию сечения на протяжении всей длины, как у телевизионных или любых других высокочастотных кабелей. В оптических кабелях SPDIF (Sony Philips Digital InterFace, или Interconnect Format), а также в физически совместимом с ними формате TOSLINK (TOSHIBA LINK), для передачи световых импульсов используется гибкое оптоволокно. Они отличаются малыми потерями при передаче сигнала на большие расстояния и обеспечивают полную гальваническую развязку соединяемых блоков. Поскольку все аналоговые и цифровые кабели являются пассивными проводящими элементами, т.е. не имеют усилителя сигнала, то нет никакой разницы при подключении их в любом направлении.

Формат виниловой пластинки в нынешнем её виде появился в 50-х годах прошлого века. Сначала записывается мастер-диск, представляющий из себя твёрдую алюминиевую основу с нанесённым на ней тонким слоем лака нитроцеллюлозы, в котором при помощи сапфирового резца формируется звуковая дорожка. Далее через промежуточные этапы методом прессования под высоким давлением при высокой температуре осуществляется печать пластинок. С одной пресс-матрицы можно сделать около 500 копий, после чего качество звука падает. Недаром существует термин «первопресс», который в зависимости от точки зрения можно рассматривать как удачный экземпляр диска, или как нестабильность воспроизводства конечного результата. Благодаря низкой себестоимости и технологичности производства пластинки завоевали огромную популярность. Природа звука такова, что энергия низких частот гораздо больше, чем высоких, поэтому амплитуда сигнала на краях звукового диапазона отличается в тысячи раз. Это хорошо видно на спектрограмме любой музыкальной записи. Но тогда ширина колебаний звуковой дорожки была бы слишком большой на низких частотах, либо слишком маленькой на высоких. В первом случае это не позволит игле с ограниченной гибкостью её подвижной системы следовать по канавке. Во втором случае структура зерна виниловой основы, сопоставимая по размерам с высокочастотными колебаниями микроканавки, может сильно исказить звук. Чтобы обойти это технологическое ограничение, решено было пойти на компромисс: во время записи мастер-диска низкие частоты ослабляются на 20 дБ, а высокие на столько же поднимаются, точкой перехода при этом служит частота 1 кГц. Во время воспроизведения амплитудно-частотная характеристика (АЧХ) имеет зеркально отражённый вид, что в результате даёт близкую к линейной полосу частот всего звукового тракта.

 

Звук записи и воспроизведения

 

Этот метод используется в стандарте RIAA (Recording Industry Association of America, - Американская ассоциация звукозаписывающих компаний). Благодаря ему, а также применению нового для того времени материала полихлорвинил (сокращённо винил), качество механической записи звука заметно выросло по сравнению со старыми патефонными пластинками на 78 об/мин на основе более крупнозернистого щеллака. На каждой стороне диска теперь помещалось примерно по 20 минут музыки, и вместо двух стандартных композиций можно было слушать полноценные концертные записи, аудиопостановки и музыкальные сборники. В 1964 году Международная электротехническая комиссия IEC предложила использовать фильтр, ослабляющий частоты в районе 20 Гц на 3 дБ для уменьшения рокот-эффекта, вызванного короблением поверхности пластинок. Аппаратура того времени, особенно ламповая, плохо справлялась с инфранизкими частотами. В конце 70-х годов фирма Teldec запатентовала технологию DMM (Direct Metal Mastering), в которой звуковые дорожки на мастер-диске нарезались в тонком слое аморфной меди поверх гладкого стального основания. Такой способ исключал промежуточный этап гальванопластики, при этом качество записанного звука повысилось ещё больше, максимально приблизившись к студийному. Общее развитие технологий со временем довело звучание винила практически до совершенства, и для расширения полосы частот от фильтра IEC решили отказаться. 

Давайте посмотрим на характеристики эталонного станка для записи мастер-диска. Полоса частот от 5 до 25 000 Гц, коэффициент гармоник на пиках сигнала 1,5%, минимальное разделение каналов 35 дБ, уровень рокот-эффекта (паразитных низкочастотных вибраций) -40 дБ, уровень шумов -60 дБ, коэффициент детонации 0,0025%.

 

Виниловые пластинки

АЧХ RIAA

Станок для записи мастер-диска

 

А теперь возьмём линейку и немного посчитаем. Диаметр виниловой пластинки формата 12 дюймов равен 300 мм, расстояние от центра диска до крайней внешней дорожки 146 мм, от центра до крайней внутренней дорожки 60 мм (зависит от общего времени звучания). Игла звукоснимателя перемещается по спирали от края диска к центру, и диаметр дорожки при этом плавно уменьшается с 292 до 120 мм. Если перевести диаметр окружности в её длину по формуле L=πD, то мы получим 917 мм снаружи и 377 мм внутри. При постоянной угловой скорости 33⅓ об/мин линейная скорость движения звукоснимателя относительно диска плавно снижается по мере приближения к его центру. 33,(3) / 60 = 0,(5) об/сек, умножаем это значение на 917 и 377, и получаем 509 мм/сек на внешней дорожке и 209 мм/сек на внутренней.

Зачем нам всё это нужно знать? Звуковая дорожка виниловой пластинки представляет из себя микроскопическую канавку, v-образная форма которой промодулирована звуковой волной. На каждой из её стенок, расположенных под углом 90
° друг к другу, «отпечатаны» сигналы левого и правого каналов. Поперечные смещения канавки параллельно плоскости диска дают сумму амплитуд обоих каналов, что обеспечивает совместимость с моно записями, а вертикальное смещение вверх-вниз даёт их разность для получения стереоэффекта. Чем выше громкость, тем шире канавка, и наоборот. Это свойство механической записи звука легло в основу метода переменного шага дорожки. В громких местах сервопривод автоматически увеличивает обороты электродвигателя, перемещающего каретку с записывающим резцом, и расстояние между центрами широких дорожек становится больше, сохраняя минимальный технологический зазор между ними. В тихих местах обороты падают, и узкие дорожки располагаются плотнее, увеличивая общее время звучания. Одним из первых альбомов, записанных таким способом в 1981 году, был "Boonoonoonoos" группы Boney M, который имел время звучания по полчаса на каждой стороне. Между композициями скорость перемещения каретки увеличивается настолько, чтобы можно было их визуально различить.

Механические вибрации иглы преобразуются в электрические колебания звуковой частоты. Чтобы игла смогла отследить поперечные смещения канавки относительно её центра с частотой 20 кГц, радиус этих смещений должен быть не меньше радиуса заточки иглы, который равен 15 мкм (0,015 мм). Это примерно равно толщине пищевой алюминиевой фольги. Чтобы обеспечить такую плотность механической записи, линейная скорость движения диска относительно иглы должна быть достаточно высокой. Наружную скорость 509 мм/сек делим на 20 000 (количество механических колебаний в секунду, за которую игла проходит по дорожке 509 мм), получаем радиус одного смещения 0,025 мм на частоте 20 кГц, что превышает радиус иглы. Но поскольку частота колебаний резца во время записи ограничена полосой в 25 кГц, минимальный радиус смещения канавки на этой частоте в начале диска составит 0,02 мм, поэтому игла 0,015 мм вполне способна её воспроизвести, и здесь аудиофилы правы. Но дело тут не в самой ультразвуковой частоте, которая может и отсутствовать в записи, а в способности без искажений передавать обертоны малой амплитуды во всём слышимом диапазоне частот. У компакт-диска верхняя полоса всегда ограничена частотой 20 кГц, и это один из главных аргументов противников цифрового звука.

Если разделить внутреннюю скорость 209 мм/сек на 20 000 Гц, то мы получим радиус одного смещения микроканавки 0,01 мм на этой частоте, что в полтора раза меньше радиуса иглы. Смещения эти будут уменьшаться в размерах по мере приближения к центру диска, что приведёт к ограниченной амплитуде вибраций иглы, и как следствие, - к завалу в области высоких частот. Внутреннюю скорость 209 мм/сек делим на радиус иглы 0,015 мм, получаем частоту 14 кГц, выше которой неизбежен спад АЧХ. Таким образом, полоса частот пластинки с более-менее гладкой АЧХ плавно снижается с 25 кГц на внешней дорожке до 14 кГц на внутренней. Это примерно то же самое, как если бы частота дискретизации цифрового звука постепенно падала с 50 до 30 кГц. И хотя теоретически уменьшение амплитуды вибраций иглы на высоких частотах в 2-2,5 раза в конце диска соответствует падению звукового давления на 6-8 дБ, на практике оно гораздо больше.

Из-за разницы формы резца для записи диска игла не совсем точно следует всем изгибам канавки, и считывает искажённую форму сигнала. В узких местах игла приподнимается вверх, а в широких опускается вниз, из-за чего возникает так называемый пинч-эффект, который является следствием удвоения частоты боковых отклонений и приводит к наложению на исходный сигнал второй гармоники. Иглы звукоснимателей выполнены из алмаза и бывают как с простой сферической, так и с эллиптической формой заточки. Большая часть эллипса в иглах второго типа ориентирована поперёк звуковой дорожки и имеет с ней увеличенную площадь контакта, за счёт чего обеспечивается более достоверное звучание. Их применяют в проигрывателях высокого класса. При записи диска резец станка движется строго по радиусу от края к центру. Во время воспроизведения игла звукоснимателя движется по дуге, из-за чего возникает угловая погрешность, вызывающая нелинейные и фазовые искажения звукового сигнала, особенно на высоких частотах. Чтобы свести их к минимуму, хорошие тонармы имеют достаточно большую длину и изогнутую форму, за счёт чего достигается минимальный угол поворота в 24°. Точка контакта иглы с пластинкой, в которой звукосниматель расположен под прямым углом к её радиусу, выбрана равноудалённой от начала и конца всей записи, поэтому максимальная угловая погрешность составляет ±12°. Такие тонармы называются радиальными, или поворотными. Существуют также проигрыватели с тангенциальным тонармом, который всегда ориентирован перпендикулярно радиусу пластинки, но из-за высокой цены они не получили широкого распространения.

Механизм тонарма имеет сложную конструкцию, балансирующую его во всех плоскостях. Он позволяет регулировать величину давления иглы на диск. Механизм антискейтинга устраняет неравномерность прижимной силы, направленной в сторону центра диска, чтобы уменьшить искажения звука. Весь проигрыватель подвешен на демпфирующих пружинах, которые гасят внешние механические вибрации. На самых лучших моделях стоят тихоходные шаговые двигатели с прямым приводом и кварцевой стабилизацией частоты вращения, массивные диски, гасящие неравномерность движения, и имеют коэффициент детонации, т.е. «плавание» звука, порядка 0,08-0,1%. Всё это требует бережного обращения с пластинками и проигрывателем, настройка которого превращает процесс прослушивания музыки в весьма утомительное занятие.

 

Компенсация угловой погрешности

Вибрации иглы и сдвиг фазы

Сферическая и эллиптическая иглы

Механизм тонарма

 

У компакт-диска считывание информации происходит от центра к краю с постоянной линейной скоростью за счёт плавного снижения частоты его вращения с 400 до 200 об/мин. Это обеспечивает постоянный цифровой поток, не зависящий от места расположения считывающей головки, что гарантирует одинаковое качество звука в любом месте диска. Со считывающего лазера сигнал в виде прямоугольных импульсов попадает в буфер оперативной памяти, после которого подаётся на вход цифро-аналогового преобразователя (ЦАП) с частотой синхронизации 44,1 кГц, задаваемой высокоточным кварцевым генератором. Тем самым исправляются неточности частоты вращения диска, а коэффициент детонации, в отличии от виниловых пластинок, находится ниже предела измерений. Алгоритм восстановления ошибок, в основе которого лежит код Рида-Соломона (Reed-Solomon codes), при помощи перестановки блоков данных защищает звук от искажений при появлении на диске небольших царапин. Такие же царапины на виниловой пластинке неизбежно приводят к появлению щелчков, которые невозможно устранить. Кроме того, статический заряд, накапливающийся на поверхности винила, притягивает микрочастицы пыли, содержащиеся в воздухе, что является причиной потрескивания звука. Игла со временем изнашивает звуковые дорожки, срок службы которых ограничен.

В цифровом звуке применяется двоичная система кодирования, измеряемая в битах. Bit, - это сочетание слов bi(nary) (digi)t, т.е. двоичное число, минимальная единица измерения количества информации. В ней используется всего два логических состояния: 0 и 1, что на аппаратном уровне соответствует отсутствию либо наличию электрического импульса. Для оцифровки звука в системе импульсно-кодовой модуляции (PCM - Pulse Code Modulation) нужно измерять его амплитуду через фиксированные промежутки времени, частота следования которых называется частотой сэмплирования, или частотой дискретизации. Согласно теореме Найквиста-Шеннона, частота сэмплирования звука должна как минимум вдвое превышать максимальную частоту преобразуемого сигнала, что необходимо для полноценной регистрации двух его полуфаз. Если период синусоиды с частотой 20 кГц равен 0,00005 секунды, то для измерения амплитуды её положительной и отрицательной полуволн, переходящих через ноль, нужен вдвое меньший период следования импульсов оцифровки, равный 0,000025 секунды, что соответствует частоте 40 кГц.

В формате CD Audio частота дискретизации равна 44,1 кГц, при том что максимальная частота, которую способен передать этот формат, равна 20 кГц. Запас по частоте (44,1 / 2 - 20 = 2,05 кГц) применяют для фильтрации сигнала. Поскольку аналоговый сигнал бесконечен во времени, при резком его обрезании на частоте 20 кГц неизбежно появление гармонических искажений. Плавный спад амплитуды после 20 кГц до нуля на частоте 22,05 кГц обеспечивает минимально допустимый уровень искажений. Это так называемый фильтр высокого порядка, в основе которого лежит принцип работы фильтра Баттерворта. Он имеет плоскую АЧХ в полосе пропускания и крутой спад на частоте подавления. Но в современных цифро-аналоговых преобразователях применяют более сложные алгоритмы фильтрации, поэтому даже скромный по нынешним меркам 16-битный формат может звучать очень хорошо.

Реальный звуковой сигнал динамически меняется по амплитуде и частоте. Результирующая огибающая в виде непрерывной волны, состоящей из цепочки сэмплов, и есть оцифрованный звук. Изменение амплитуды сэмплов во времени эквивалентно изменению амплитуды вибраций иглы проигрывателя пластинок. Выборка амплитуды представляет из себя один сэмпл, что в 16-битном разрешении соответствует пачке из 16 импульсов. Это создаёт цифровой поток со скоростью 16 * 44 100 = 705 600 бит/сек для каждого канала, его также называют битрейтом. В отличии от скорости передачи данных, объём передаваемой информации измеряется в байтах (byte), каждый из которых состоит из 8 бит. Он рассчитывается следующим образом: 16 бит * 44 100 Гц * 2 канала = 1 411 200 бит/сек, или 1,4112 Мбит/сек, делим на 8, получаем 0,1764 Мб/сек (мегабайт в секунду). Блоки данных левого и правого каналов поочерёдно представлены в общем цифровом потоке. Они определяются при помощи тайм-кода и служебных команд.

Наиболее продвинутые аудиофилы справедливо замечают, что «мёртвые зоны» между двумя соседними сэмплами удаляют из цифрового потока часть информации о непрерывной звуковой волне, что приводит к упрощению формы исходного сигнала. Но они умалчивают о том, что возникающие при этом искажения гораздо меньше, чем у виниловых пластинок. Как их можно измерить, я покажу ниже. Для любителей всего аналогового приведу пример смены статических изображений на киноплёнке, считающейся эталоном качества. При частоте обновления картинки 24 кадра в секунду зрение человека не может зафиксировать дискретность движения объектов, скорость перемещения которых примерно соответствует частоте кадров. Скорость звуковых колебаний гораздо выше, но и частота оцифровки совсем другая. Поэтому говорить о потери целостности звуковой волны, всё равно что переживать по поводу пропущенных сцен между кадрами.

В формате DVD Audio частоты дискретизации 96 и 192 кГц применяют совсем не для расширения полосы частот, которые человеческое ухо всё равно не сможет услышать, а для повышенной выборки на единицу времени, когда относительное расстояние между сэмплами сокращается вдвое и вчетверо по сравнению с CD Audio, ещё больше приближая звук к оригиналу.

 

Принцип теоремы Найквиста-Шеннона

4-разрядное двоичное кодирование

Оцифровка с разным разрешением

 

Квантизацию сигнала по амплитуде задаёт цифровое слово (Digital Word). Оно состоит из нескольких последовательных ячеек, или разрядов, в каждый из которых может быть записан один бит информации в виде 0 или 1. Количество всех возможных комбинаций этих элементов определяет количество уровней измерения амплитуды сигнала. Например, в 4-разрядном слове всего 16 комбинаций 0 и 1, следовательно, оно описывает сигнал с 16 уровнями громкости, который является 4-битным. Для более простого понимания разрядности её можно представить как степень двойки: 22 = 4 уровня амплитуды, 23 = 8 уровней, 24 = 16 уровней, и т.д. Умножая двойку, или пару из 0 и 1 на саму себя определённое количество раз, мы получаем разные количества их сочетаний в разных разрядностях. Чем больше разрядов, тем точнее можно измерить аналоговый сигнал.

Двоичная система счисления основана на таблице степеней основания числа 2, в которой десятичное значение младшего значащего разряда, расположенного справа, равно 1. Умножая его на 2, получаем десятичное значение следующего за ним более старшего разряда, расположенного левее, и т.д. справа налево. Для преобразования из двоичной системы в десятичную суммируются десятичные значения только тех разрядов, в которых записана логическая единица. В 4-разрядном слове десятичный ряд будет выглядеть так:

0 = 0000 (0+0+0+0)
1 = 0001 (0+0+0+1)
2 = 0010 (0+0+2+0)
3 = 0011 (0+0+2+1)
4 = 0100 (0+4+0+0)
5 = 0101 (0+4+0+1)
6 = 0110 (0+4+2+0)
7 = 0111 (0+4+2+1)
8 = 1000 (8+0+0+0)
9 = 1001 (8+0+0+1)
и т.д. до 15
15 = 1111 (8+4+2+1)

Всего 16 значений от 0 до 15. При увеличении разрядности всего на один бит количество десятичных значений удваивается. Разрядов может быть сколь угодно много, но для качественной передачи звука в PCM считается достаточным количество разрядов от 16 до 24.

 

Разряд     10** 9 8 7 6 5 4 3 2   1*
Десятичное значение 512 256 128 64 32 16 8 4 2 1
Двоичное значение 0 0 1 0 1 1 0 0 1 0
Суммируемое значение 0 0 128 0 32 16 0 0 2 0
Примечание 10-разрядное двоичное число 0010110010 равно десятичному 178 (128+32+16+2)
** старший значащий разряд, * младший значащий разряд

Таблица двоичного кодирования на примере 10-разрядного числа

 

На примере этой таблицы легко понять теорию двоичного кодирования. У нас есть 10-разрядное цифровое слово, которое должно описывать максимальное количество комбинаций 0 и 1, равное 210 = 1024. Запишем во все ячейки 1 и просуммируем их десятичные значения. Складывать можно в любом направлении, но в двоичном виде старший значащий разряд и соответствующее ему максимальное десятичное значение всегда находится слева.

512 + 256 + 128 + 64 + 32 + 16 + 8 + 4 + 2 + 1 = 1 023

Но мы пропустили ещё одно состояние, когда во всех ячейках может быть записан логический ноль, который в двоичной системе счисления имеет такой же вес, как и единица. Поэтому нулевой отсчёт, при котором сумма десятичных значений всех разрядов также равна нулю, является равнозначным всем остальным вычислениям.  Таким образом, 10-разрядное цифровое слово оперирует 1024 отсчётами, из которых наша пачка импульсов 0010110010 формирует сэмпл амплитудой 178 отсчётов при максимальном значении 1023 (с учётом нуля 1024). Начало каждой пачки, или старший значащий разряд цифрового слова, идущих один за другим в общем потоке, синхронизируется импульсами, следующими с частотой дискретизации. По этим сэмплам восстанавливается непрерывная звуковая волна исходного аналогового сигнала. Примерно так работают все многоразрядные PCM цифро-аналоговые преобразователи.

Аналого-цифровой преобразователь (АЦП) в простейшем случае представляет из себя микросхему с N-количеством компараторов напряжения, равных количеству уровней квантизации шкалы громкости и ступенчато настроенных каждый на свой уровень. Они сравнивают амплитуду входного аналогового сигнала с опорным напряжением в своей точке. Если амплитуда не совпадает с референсной, компаратор закрыт, а если совпадает, компаратор открывается и АЦП за один такт частоты дискретизации выдаёт пачку импульсов, эквивалентную амплитуде двоичного кодирования в этой точке шкалы громкости.

 

Пример 4-разрядного кодирования. В левом столбике показано соответствие десятичного и двоичного представления амплитуды сигнала

 

 

Динамический диапазон показывает разницу между уровнем минимального и максимального звукового давления и измеряется в децибелах (дБ). Децибел, - это логарифмическая величина, выражающая степень звукового давления в зависимости от амплитуды сигнала. Дело в том, что достаточно большие изменения амплитуды на слух могут восприниматься как незначительные, и только логарифмическая шкала даёт наиболее адекватное слуховым ощущениям соответствие уровня амплитуды сигнала его субъективной громкости. Поэтому на графиках её принято отображать не в милливольтах, а в децибелах. Уровень звукового давления рассчитывается по формуле: D = 20log(L), где D - величина в децибелах, L - амплитуда сигнала. Чтобы не искать в интернете онлайн-калькуляторы перевода в децибелы, посмотрим, как это делается на примере 16 уровней амплитуды 4-битного сигнала. Запускаем калькулятор Windows: Вид / Инженерный, набираем последовательно 16 log * 20 =, получится 24 дБ. Для перевода из децибел в уровни амплитуды применяем обратную формулу: L = 10(D/20). На калькуляторе набираем 10 xy ( 24 / 20 ) =, получится 15,8489, округляем до ближайшего целого значения 16.

 

Разрядность, бит

Амплитуда, уровней

Динамический диапазон, дБ

1 2 6
2 4 12
4 16 24
8 256 48
10 1 024 60
12 4 096 72
16 65 536 96
24 16 777 216 144
32 4 294 967 296 192

 

Интерес к винилу был подогрет неудачными попытками создания ЦАП первого поколения для CD проигрывателей. Они строились по принципу аналоговых резисторных матриц, преобразующих последовательные 16-битные числа в звуковые сэмплы со ступенчатой структурой амплитуды. Это требовало прецизионного исполнения с минимальным разбросом характеристик пассивных элементов преобразователя, что было достаточно дорого и не обеспечивало хорошее качество звука. Наложение спектров друг на друга вызывает интермодуляционные искажения, которые лежат выше порога чувствительности слуха, но оказывают негативное воздействие на звуковой тракт. Сигналы амплитудой меньше одного бита невозможно восстановить, их звук равен белому шуму, для 16 бит это -96 дБ, а тихие звуки содержат большие нелинейные искажения. Дальнейшее развитие алгоритмов обработки привело к созданию более совершенных и недорогих ЦАП с передискретизацией частоты, однобитных сигма-дельта преобразователей и цифровых фильтров с большой крутизной спада, которые потом перебрались из CD Audio в DSD с широтно-импульсной модуляцией.

Когда внешний ЦАП на цифровом выходе 16-битного оборудования показывает "STREAM=PCM 24 BITS", не стоит слишком сильно этому радоваться. Интерфейс SPDIF поддерживает цифровые сигналы разных форматов, поэтому для совместимости протоколов передачи данных 16-битные потоки удобнее передавать в искусственно увеличенном разрешении. Для преобразования их в 24 бита достаточно в конце каждого цифрового слова добавлять по 8 младших разрядов, заполненных нулями.

16 bit: 0010100110001001 = 10 633 (8 192 + 2 048 + 256 + 128 + 8 + 1) = 16,22% от 216
24 bit: 001010011000100100000000 = 2 722 048 (2 097 152 + 524 288 + 65 536 + 32 768 + 2 048 + 256) = 16,22% от 2
24

Любое двоичное число, сдвинутое влево на N разрядов с добавлением нулей в пустых ячейках справа, будет эквивалентно его исходному десятичному значению, умноженному на 2N. Громкость исходного и конечного сэмплов в этом случае не изменится. Поэкспериментировать с переводом чисел из одной системы счисления в другую можно на этом сайте.

 

Преобразование двоичного числа из 16 в 24 бита

Исходное 16 бит

Конечное 24 бита

Двоичное

Десятичное

Громкость, % Двоичное

Десятичное

Громкость, %

0000000000000000

0 0 000000000000000000000000 0 0
0000000000000001 1 0,001526 000000000000000100000000 256 0,001526
0000000000000010 2 0,003052 000000000000001000000000 512 0,003052
0000000000000011 3 0,004578 000000000000001100000000 768 0,004578
0000000000000100 4 0,006104 000000000000010000000000 1 024 0,006104
0000000001100100 100 0,152590 000000000110010000000000 25 600 0,152588
0011001001000111 12 871 19,639887 001100100100011100000000 3 294 976 19,639588
1111111111111111 65 535 100 111111111111111100000000 16 776 960 99,998480

 

Поскольку в максимальном двоичном значении амплитуды 24-битного сэмпла 8 младших разрядов равны нулю, общая шкала громкости будет меньше на сумму десятичных значений этих разрядов, т.е. на 255. Определить на слух разницу в 0,00152% невозможно, т.к. на логарифмической шкале она ничтожно мала. Такое преобразование не несёт дополнительной информации о звуке. Чтобы в этом убедиться, нужно переписать сигнал с цифрового выхода на внешнее записывающее устройство в wav, и проанализировать файл в программе Adobe Audition. Он определится как 24-bit Packed Int (type 1 (24-bit)). При анализе статистики амплитуды все разряды сканируются на предмет смены нулей и единиц, но поскольку 8 из них всегда равны нулю, чего в реальной жизни не бывает, то параметр Actual Bit Depth будет равен 16, а не 24.

 

Определение фактической разрядности в Adobe Audition

 

Для каждого типа носителей, будь то виниловая пластинка, компакт-диск, DVD Audio, или SACD, делается свой отдельный мастеринг, учитывающий свойства их динамических диапазонов. Чем меньше динамический диапазон носителя, тем больше амплитуда сигнала подвергается компрессии, и наоборот. Это помогает избежать искажений. Но среднестатистический человек на обычной аппаратуре вряд ли услышит разницу между CD Audio 16/44 и DVD Audio 24/192, и самое время будет вспомнить о разумном компромиссе. Но если не слышно разницы, это не значит, что её нет. Просто увеличение качества звука, определяемое на слух, растёт здесь непропорционально увеличению сложности технологического процесса. Это один из главных недостатков многоразрядного кодирования в PCM. Сглаживание ступенчатого сигнала требует применения высококачественных ЦАП, при этом возникают шумы квантования, а также фазовые искажения на высоких частотах, растущие по мере приближения к частоте дискретизации за счёт сопоставимой длины волны. С уменьшением амплитуды сигнала за счёт погрешности измерений растёт уровень искажений, который напрямую зависит от количества разрядов.

Однобитное кодирование в формате Direct Stream Digital (DSD) свободно от этих недостатков. Его принцип действия напоминает поведение аналогового сигнала. При росте амплитуды синусоиды плавно увеличивается плотность её модуляции импульсами в виде 1 относительно 0, а при падении амплитуды плотность модуляции уменьшается. Смена фазы звукового сигнала меняет 0 и 1 местами. По сути это та же частотная модуляция, которая применяется в FM-радиовещании, только не аналоговая, а цифровая с частотой дискретизации 2,8224 МГц, что в 64 раза больше, чем на компакт-дисках. Полученный таким образом однобитный сигнал не нуждается в дополнительном многоразрядном преобразовании, что значительно упрощает аппаратную часть и положительно сказывается на качестве звука. Фильтр низкой частоты выделяет звуковую составляющую, а многоуровневые дельта-сигма преобразователи с цепью обратной связи эффективно подавляют шумы квантования, сдвигая их за пределы слышимого диапазона. Фазовый сдвиг на высоких частотах здесь практически отсутствует, перегрузка сигнала не приводит к его искажениям. При полосе частот вплоть до 100 кГц динамический диапазон достигает 120 дБ. Однобитное кодирование используется в формате Super Audio CD (SACD). Дальнейшее увеличение качества звука достигается за счёт увеличения частоты дискретизации. В форматах DSD64, DSD128, DSD256 и DSD512 цифры показывают, во сколько раз частота дискретизации увеличена по отношению к базовой частоте 44,1 кГц. Её иногда указывают в мегагерцах: 2,8224 мГц, 5,6448 мГц, 11,2896 мГц, 22,5792 мГц. Такое разрешение позволяет добиться практически идеального звучания, поэтому оно применяется в студийных системах звукозаписи.

 

Принцип кодирования PCM и DSD

 

На этом теоретическая часть заканчивается. Чтобы развеять некоторые распространённые мифы, будем безжалостно измерять характеристики звука. Современные программы и оборудование позволяют это делать с высокой точностью. Самым лучшим способом было бы сравнение «лоб в лоб» пластинок и CD с тестовыми сигналами частот. Но если найти такие компакт-диски ещё можно, то тестовый винил, а тем более рипы с него, оказалось просто невозможно, поэтому придётся двигаться окольными путями. Для измерения амплитудно-частотных характеристик будем использовать программу Adobe Audition. Если какие-то файлы не поддерживаются по умолчанию, отсюда скачиваем плагины и распаковываем их в директорию программы. После выделения мышью всего файла или его части из меню Окно (Window) применяем команду Частотный анализ (Frequency Analysis), а затем Статистика Амплитуды (Amplitude Statistics). Я протестировал три звуковых файла с разных носителей: виниловой пластинки, компакт-диска и DVD Audio. По сути все они являются lossless-файлами, т.е. при кодировании применено сжатие аудио без потери качества.

Vinyl-Rip 24/192 Mylene Farmer, L'Ame Stram Gram, 1999 (12" maxi single 33).
CD-Rip 16/44 James Blunt, Best Laid Plans, 2010.
Lossless 24/96 Paul McCartney, Monkberry Moon Delight, Remastered Deluxe Edition 2012 (DVD Audio).

 

 

Vinyl-Rip 24/192 Учитывая разницу линейной скорости чтения в начале и в конце диска, я снял АЧХ первого и последнего треков на стороне A. Чтобы не было ошибки, мышью нужно выделить часть сигналограммы со звуковыми данными, и при этом захватить область между треками, там где слышно только шуршание иглы, но ни в коем случае не выделять места, где тонарм ещё не опущен на пластинку и уровень сигнала равен нулю. Смотрим на скриншот, нас интересует параметр Minimum RMS Power (Root Mean Square Power), минимальная среднеквадратичная мощность звукового сигнала, которая учитывает изменения амплитуды относительно постоянной плотности шумов. В начале диска она равна -65 дБ, что соответствует максимальной частоте 19 кГц. Всё, что ниже, - это сильные нелинейные искажения, сопоставимые со звуком бензопилы «Дружба».

В конце диска параметр Minimum RMS Power равен -62 дБ, и можно увидеть резкий провал спектра в районе 13-14 кГц на этом уровне, что подтверждает теоретические выкладки, изложенные выше. Если принять за максимум перепад звукового давления в 65 дБ, то отношение максимальной амплитуды сигнала к минимальной составит 10(65/20) = 1 778. Это значение даже меньше эквивалента разрядности в 11 бит, т.к. 211 = 2 048, хотя из-за разницы формы аналогового и цифрового сигналов оно подходит лишь для сравнения динамических диапазонов CD и винила. Пусть вас не смущает параметр Actual Bit Depth, который показывает разрешающую способность звуковой карты-оцифровщика. Формат 16 бит 44,1 кГц был бы здесь более уместен, но остаётся открытым вопрос о точности передачи формы самого сигнала. Может быть у винила он действительно настолько хорош, что 16 бит для него будет мало? Но об этом чуть позже.

 

 

CD-Rip 16/44 Параметр Minimum RMS Power -81 дБ соответствует частоте 18 кГц. Это предел минимальных искажений, характерных для 16-битного звука, о котором я писал выше. Частота 20 кГц плавно падает на уровне -96 дБ, что полностью соответствует спецификации стандарта CD Audio. Вывод: абсолютно честный звук 16 бит 20 кГц.

 

 

 

Lossless 24/96 Параметр Minimum RMS Power равен -140 дБ, что гарантирует качество звука в полосе вплоть до 48 кГц во всём динамическом диапазоне. Обратите внимание на уровень звукового давления -96 дБ на частоте 20 кГц, амплитуда которой меньше максимального уровня 0 дБ в 10(96/20) = 63 096 раз. Чтобы оцифровать такой слабый сигнал с хорошим качеством, в 24-битном формате ещё есть приличный запас по измерению, равный 144 - 96 = 48 дБ. Т.е. частота 20 кГц измеряется 10(48/20) = 251 градацией амплитуды, вместо 1-2 градаций в 16-битном формате. Вывод: звук для хорошей аппаратуры 24 бита 20 кГц+.

В истории рок-музыки есть один любопытный технический момент, который связан с группой The Beatles. Как наверняка знают многие меломаны, на альбоме Sgt. Pepper's Lonely Hearts Club Band в самом конце песни A Day In The Life есть коротенький кусочек длиной в несколько секунд с частотой 16 кГц. Как утверждают музыкальные критики, Пол Маккартни в качестве шутки записал его специально для своей собаки Марты, хотя в англоязычной Википедии написано, что идея «dog whistle», т.е. свистка для собак, была предложена Джоном Ленноном. Фокус был в том, чтобы при прослушивании собаки реагировали на ультразвук, который они хорошо слышат, а люди ничего бы не замечали, поскольку для них эта частота находится на пороге слышимости. Этот фрагмент как будто специально находится в критической для винила зоне с маленькой линейной скоростью, и сам напрашивается на то, чтобы его измерили. Я снял АЧХ этого фрагмента с винил-рипа и с CD-рипа, и совместил их на одном скриншоте. Чтобы графики точно совпадали, рипы были с одинаковой частотой дискретизации 44,1 кГц.

 

A Day In The Life, ультразвук на разных носителях

 

На всех виниловых изданиях альбома и на старых компакт-дисках записана частота 15 кГц, а на ремастированных CD и DVD Audio 16 кГц. На картинке для наглядности даны как раз оба этих варианта, разница уровней громкости между ними составляет 37 дБ. Сам характер спектра носителей уже о многом может сказать даже неискушённому читателю. Теоретически радиус смещений микроканавки на частоте 15 кГц на внутренних дорожках равен 0,014 мм, что на 7% меньше радиуса иглы 0,015 мм. Это приведёт к уменьшению амплитуды вибраций иглы примерно в полтора раза относительно внешних дорожек. Ожидаемое расчётное падение звукового давления при этом должно составить 20log(1,5) = 3,5 дБ, но никак не катастрофические 37 дБ, что соответствует уменьшению амплитуды в 10(37/20) = 70 раз. Если даже допустить, что для запаса по перегрузке уровень сигнала мастер-диска снижен на несколько децибел, то разница всё равно получается слишком большой. Так в чём же здесь дело?

Динамические нагрузки в станке для записи мастер-диска растут пропорционально частоте, и при одной и той же амплитуде сигнала ускорение движения резца будет больше на высоких частотах. При этом потребляемая станком мощность составляет несколько сотен ватт. Чтобы не сжечь управляющие катушки электромагнитов и сам резец, температура которых достигает 300°C, применяют многополосные ограничители уровня, автоматически снижающие высокие частоты на больших амплитудах сигнала. Видимо, причина падения уровня высоких частот нашего винил-рипа заключается именно в этом. К сожалению, говорить о равномерности АЧХ винила не приходится, т.к. механической записи звука компромиссы свойственны в гораздо большей степени, чем цифровой. Не стоит забывать и о том, что из-за нечётких требований стандарта RIAA пластинки разных производителей могут звучать по-разному.

 

Разница формы сигнала CD и винила

 

На этом скриншоте уровень сигнала CD специально уменьшен с -11 до -48 дБ для точного сравнения двух синусоид. Сигнал винила нестабилен по амплитуде и фазе, его форма на пиках заметно отличается от синусоидальной. На сжатом по времени отрезке видно, что частота 15 кГц промодулирована низкочастотной составляющей. На фон переменного тока это не похоже, т.к. частота модуляции ниже 50 Гц. Причина заключается в так называемом рокот-эффекте, вызванном короблением поверхности пластинки и вибрациями электродвигателя, которые улавливаются чувствительной иглой звукоснимателя. Для борьбы с этим явлением применяют фильтры, подавляющие инфранизкие частоты. Но полностью избавиться от рокот-эффекта таким способом невозможно, поскольку он имеет механическое происхождение. Синусоида компакт-диска гораздо стабильнее, но на большом отрезке времени её амплитуда всё ещё далека от совершенства. Небольшая модуляция скорее всего вызвана периодически неплотным прилеганием аналоговой мастер ленты к воспроизводящей головке, что особенно критично для высоких частот. Уровень сигнала ремастированного издания на CD уже практически идеален во времени, однако при большом увеличении картинки и здесь можно рассмотреть слабую неравномерность порядка ±0,05 дБ, что для 16-битного формата очень хороший результат.

 

A Day In The Life, ультразвук и его гармоники на Vinyl Rip 24/192

 

На АЧХ винил-рипа гораздо лучшего качества 24 бита 192 кГц можно увидеть гармоники гигантской амплитуды, кратные основной частоте 15 кГц. Их появление вызвано формой звуковой волны, отличной от синусоидальной, которая видна на предыдущей картинке, что приводит к неприятным на слух искажениям звука. Измерив амплитуду каждой из них, можно рассчитать коэффициент гармонических искажений для этой частоты по формуле:

Здесь U1 соответствует амплитуде основной частоты 15 кГц, она же первая гармоника, U2 - амплитуде второй гармоники 30 кГц, U3 - амплитуде третьей гармоники 45 кГц, и т.д. Это основные частоты, у каждой из которых есть по две дополнительных, которые тоже нужно измерить. Не будем учитывать гармонику на низкой частоте, которая не имеет прямого отношения к нашему сигналу и скорее всего вызвана какой-то инфранизкой наводкой типа рокот-эффекта. Для перевода из децибел в амплитуды берём перепад между минимальным звуковым давлением и уровнем каждой из гармоник, и переводим их в условные единицы по формуле L=10(D/20). Например, первая гармоника лежит на уровне -48 дБ, что выше минимального звукового давления -144 дБ (для 24 бит) на 96 дБ, и соответствует амплитуде 10(96/20) = 63 096 условных единиц. Глядя на график, теперь можно рассчитать амплитуды всех гармоник.

 

Гармоника

Частота, кГц

Уровень, дБ

U, у.е.

U2, у.е.

Основные

1 15 -48 63 096 -
2 30 -63 11 220 125 892 541
3 45 -76 2 512 6 309 573
4 60 -73 3 548 12 589 254
5 75 -80 1 585 2 511 886
6 90 -92 398 158 489

Дополнительные

1a 13 -74 3 162 10 000 000
1b 17 -87 708 501 187
2a 28 -85 891 794 328
2b 32 -89 562 316 228
3a 43 -92 398 158 489
3b 47 -96 251 63 096
4a 58 -91 447 199 526
4b 62 -89 562 316 228
5a 73 -94 316 100 000
5b 77 -97 224 50 119
6a 88 -102 126 15 849
6b 92 -108 63 3 981
Un = U22 + U32 + U42 + U52 + U62 + ... + U6a2 + U6b2 159 980 776
√‾Un 12 648

 

Все расчёты велись в программе Excel и для наглядности здесь не показаны десятичные значения, поэтому промежуточные данные здесь имеют визуальную погрешность, хотя в целом они точны. Квадратный корень из суммы квадратов амплитуд 12 648 делим на амплитуду основной гармоники 63 096, получаем 0,20046. Но поскольку формула возвращает безразмерный коэффициент, для перевода в проценты это значение нужно умножить на 100. Таким образом, коэффициент гармонических искажений виниловой пластинки на внутренних дорожках на частоте 15 кГц равен 20%. Поскольку данный параметр применяют для количественной оценки уровня искажений, это означает, что форма измеренного сигнала лишь на 80% соответствует оригиналу, что подтверждают предыдущие скриншоты. С учётом низкочастотной гармоники, которую я специально не считал, коэффициент гармоник вырастет до 54%. И хотя это один из наихудших показателей в спектре, и с увеличением длины волны уровень искажений будет падать, правильная передача формы сигнала даже в неслышимом диапазоне частот имеет решающее значение при субъективной оценке качества звука. Для сравнения я также подсчитал коэффициент гармоник CD-рипа на этом скриншоте, с учётом спектра шума в полосе до 4 кГц у меня получилось 0,016%.

Мне стало интересно, какой разрядности столь высокий процент искажений винила теоретически может соответствовать? В программе Adobe Audition я сгенерировал эталонную синусоиду с частотой 15 кГц на уровне -48 дБ в формате 192 кГц 32 bit float. Программа позволяет задавать исходную разрядность, равную только 8, 16 и 32 битам, поэтому её пришлось потом понижать при помощи команды Convert Sample Type из меню Edit. Амплитуды возникающих при этом гармоник подсчитываем описанным выше способом. Наиболее близкий к винилу результат в 18,04% мне удалось получить при понижении разрядности до 10 бит. Любопытно, что это значение практически соответствует динамическому диапазону самой пластинки: 20log(210) = 60 дБ.

 

 

A Day In The Life, ультразвук 16 кГц и его гармоники на DVD Audio Rip 24/96

 

Теперь протестируем DVD Audio рип высокого разрешения с качеством 24 бита 96 кГц. С учётом спектра шума в области до 4 кГц коэффициент гармоник составляет 0,013%. В итоге, форма сигнала одиночной синусоиды у DVD Audio на 99,987% соответствует студийному оригиналу против 80% у винила и 99,984% у компакт-диска.

Для прямого сравнения АЧХ компакт-диска и виниловой пластинки я взял одну и ту же композицию с разных носителей. Чтобы быть в одной системе координат с винил-рипом высокого разрешения, CD-рип был предварительно конвертирован в формат 24 бита 192 кГц без применения обработки типа Dithering и Noise Shaping.

 

АЧХ композиции Highway Star группы Deep Purple

 

И хотя АЧХ обоих носителей практически совпадают в наиболее чувствительной для слуха области спектра вплоть до 15 кГц, и на вскидку оба файла звучат одинаково, параметр Minimum RMS Power гарантирует качество звука винила в полосе частот лишь до 3 кГц, с большой натяжкой, - до 10 кГц, в то время как у CD она доходит до 18 кГц. Причина столь низкого качества заключается в шипении «запиленной» пластинки, которое сопоставимо по уровню с высокочастотным спектром звука. Оно маскирует полезный сигнал, сужая динамический диапазон. И всё это в зоне высокой линейной скорости движения звукоснимателя, т.к. композиция Highway Star, - самая первая на стороне A. Чтобы представить, как могла бы звучать пластинка более высокого качества, нужно посмотреть, какой частоте соответствует сигнал на уровне минимального звукового давления винила в районе -65 дБ, в данном случае это 15 кГц. Огромный хвост длиной до 96 кГц является бесполезной тратой ресурсов. Повышенная выборка на единицу времени здесь себя не оправдывает по причине относительно грубой структуры зерна виниловой основы, непригодной для оцифровки в высоком разрешении. Расширение динамического диапазона свыше 60-65 дБ при том же размахе колебаний звуковой дорожки привело бы к появлению сильных искажений на малых амплитудах сигнала.

Если существует достаточно большое количество людей, которых такой звук устраивает, получается, что слух является не очень точным инструментом, который легко можно обмануть. Кроме того, мозг человека имеет свойство адаптироваться к любому звуку при длительном прослушивании, и определить без специальных приборов качество сигнала бывает очень сложно.

Ярким примером этого является формат 90-х годов MiniDisc, до сих пор популярный у профессиональных музыкантов. Фирма Sony поставила перед собой задачу совместить в одном формате качество звука и удобство CD Audio с возможностью перезаписи, как у компакт-кассет. На 2,5 дюймовом магнито-оптическом диске, заключённом в пластиковый корпус, помещается 175 Мб информации, при этом время звучания в стандартном режиме (SP - Standard Play) составляет 80 минут. Чтобы уместить на таком скромном по нынешним меркам объёме столько музыки (формата mp3 тогда ещё не было), специально для минидиска был разработан алгоритм сжатия данных ATRAC (Adaptive TRansform Acoustic Coding - преобразование с адаптивным акустическим кодированием). При частоте дискретизации 44,1 кГц и разрядности 16 бит в нём применяется разделение спектра звука на 52 поддиапазона на основе преобразования Фурье с индивидуальным анализом сигнала в каждом из них. Используя эффект маскирования тихого звука более громким, психоакустический фильтр удаляет «лишние» данные, сокращая цифровой поток до 1/5 от исходного размера.

 

АЧХ белого шума в формате MiniDisc

 

Среди поклонников MiniDisc особое место занимают владельцы топовой серии ES фирмы Sony, которые по сей день на полном серьёзе обсуждают «мягкость» и «прозрачность» её звучания, хотя речь идёт всего лишь о сжатии аудио с потерями качества. Они подвержены тем же заблуждениям, что и любители оцифровки винила, убеждающие себя в неких мифических его свойствах.

Параметр Minimum RMS Power больше подходит для оцифрованного аналогового звука и lossy форматов с относительно узким динамическим диапазоном. В несжатом аудио он может принять значение -inf dB, т.е. минус бесконечность. В этом случае лучше воспользоваться таблицей, которая показывает реальные значения коэффициента гармоник на разных уровнях сигнала. Эти данные получены при помощи уже знакомого нам способа генерации синусоиды. Визуальный подсчёт гармоник занимает слишком много времени и является неточным. Есть гораздо более быстрый и удобный способ, о котором я догадался не сразу. В окне Frequency Analysis есть кнопка Copy to Clipboard, при помощи которой можно скопировать значения уровней всех гармоник в буфер обмена и работать с ними, например, в программе Excel. При внутренней разрядности 32 бита Adobe Audition подсчитывает уровни 32 768 гармоник и позволяет получить результат с точностью до 0,000000001%.

 

Коэффициент гармоник одиночной синусоиды формата 16 бит 44,1 кГц, %

Бит Уровень, дБ Средний 20 Гц 1 кГц 10 кГц 20 кГц
16  0 0,0047       0,0052*** 0,0036 0,0053       0,0046***
15 -6 0,0078 0,0080 0,0064 0,0075 0,0094
14 -12 0,0133 0,0132 0,0129       0,0129*** 0,0141
13 -18 0,025 0,025 0,025 0,025 0,025
12 -24 0,049 0,049 0,049 0,049 0,049
11 -30 0,100 0,106 0,097 0,100 0,097
10 -36 0,19 0,20 0,19 0,19 0,19
9 -42 0,39 0,39 0,38 0,39 0,41
8 -48 0,78* (20**) 0,77 0,76 0,77 0,81
7 -54 1,60 1,62 1,53 1,68 1,55
6 -60 3,14 3,11 3,25 3,14 3,07
5 -66 6,23 6,14 6,53 6,14 6,12
4 -72 12,9* (>200**) 12,7       12,3*** 12,7 13,7
3 -78 25,7 27,2 24,4 24,9 26,3
2 -84 57,3 58,7 57,6 58,5 54,4
1 -90 110 109 112 110 108
0 -96 221 221 220 222 219

* у компакт-диска, ** у винила, *** порог слышимости
Оранжевым цветом выделена область пиков сигнала

 

Как мы видим, искажения звука практически не связаны с его частотой, но напрямую зависят от уровня громкости. При падении звукового давления на 6 дБ, что соответствует уменьшению амплитуды сигнала вдвое, примерно во столько же раз увеличится коэффициент гармоник. В таблице белым цветом показан динамический диапазон среднестатистической АЧХ, измеренный у 17 композиций в разных жанрах. Например, частота 20 кГц никогда не поднимается выше отметки -60 дБ, и минимальный уровень её искажений составляет 6%. Это следствие малой энергии сигнала в ВЧ диапазоне, о которой я уже здесь упоминал. Но относительный порог слышимости для этой частоты расположен гораздо выше, и мозг человека не способен воспринять её как звук. АЧХ даже на самых низких частотах не достигает максимума потому, что оставшийся промежуток заполняют кратковременные пики сигнала. Диапазон слышимой части спектра намного меньше полного динамического диапазона звука, поэтому основная часть искажений возникает в недосягаемой для слуха области. Вот почему так важны именно инструментальные методы оценки качества.

Одним из них является параметр Average RMS Power, который показывает средний уровень звукового давления. У компакт-диска его среднестатистическое значение равно -13 дБ, у винила -17 дБ, и можно посмотреть в таблице, какому значению коэффициента гармоник они соответствуют. К тому же надо помнить о том, что на нижнем пределе динамического диапазона винила -72 дБ искажения будут эквивалентны их значению у CD на уровне -96 дБ. Другое дело, что музыку на уровне -60 дБ расслышать уже практически невозможно, тем более говорить о её качестве. Если проанализировать соотношения результатов на уровнях -48 и -72 дБ, то с большой долей осторожности можно предположить, что для винила все расчётные значения будут больше примерно в 20 раз. Тогда гипотетический коэффициент гармоник на уровне Average RMS Power у компакт-диска составит 0,015% против 0,46% у винила, и на слух отличить их друг от друга практически невозможно. С целью дальнейшего улучшения качества звука на помощь приходят форматы высокого разрешения, которые сдвигают уровень искажений вниз по шкале на 8 бит у 24-битного сигнала и на 16 бит у 32-битного. Но у кого-то всегда найдётся самый главный с их точки зрения козырь в виде слуховых ощущений, и здесь никакие аргументы уже не работают, поэтому можно смело подводить итоги.

Если вам нравится винил, ставший частью нашей культуры, то такая приверженность традициям заслуживает уважения. В конце концов на восприятие звука, который мы слышим, подсознательно влияет совокупность многих факторов. Лёгкое шуршание иглы проигрывателя навевает ностальгические воспоминания, а визуальный эффект вращающегося диска даёт ощущение «аналоговости». Для кого-то важна полиграфия пластинок и тактильные ощущения от контакта с ними, чего нет в звуковых файлах, существующих лишь в форме абстрактных невидимых импульсов. А жизненный опыт нам подсказывает: внушает доверие лишь то, что можно увидеть своими глазами и потрогать руками. Благодаря техническому прогрессу качественный звук стал доступен огромному количеству людей, и чтобы как-то выделиться из общей массы, люди состоятельные или просто замороченные на технике с удовольствием расскажут вам сказку про «живой аналоговый звук». Надеюсь, я наглядно показал, что он из себя представляет. Винил был хорош для своего времени, и для меня он навсегда остался в прошлом.