Сайт Юрия Макарова

   

 

Мифы о виниле

 

Написать эту статью я решил после общения на некоторых форумах меломанов, где споры о килогерцах и децибелах зачастую носят оскорбительный характер. Аудиофилия в крайних своих проявлениях основана на слепом чувстве веры, отрицании законов физики, эгоцентризме и дремучем невежестве. Люди склонны к мифотворчеству, и неудивительно, что восприятие таких малопонятных явлений, как звук, сопровождается вымыслами. Попробуем в этом разобраться.


 

Отношения с винилом не сложились у меня с самого начала, о чём я всегда сожалел. На закате эпохи аналогового звука, на которую пришёлся самый расцвет пластиночной индустрии в мире, фирменные диски не доходили до прилавков наших магазинов по идеологическим причинам, и на чёрном рынке стоили очень дорого. Денег не было, но был интерес к музыке, поэтому приходилось ограничиваться перезаписью у знакомых в лучшем случае первой копии диска с катушки на катушку. Магнитофонная культура тех времён была развита необычайно, и благодаря ей все желающие могли приобщиться к мировым музыкальным шедеврам, пусть и с худшим, чем у пластинок, качеством звука. Термин «винил» тогда ещё не был в ходу, его стали употреблять гораздо позже, когда появились компакт-диски.

Примерно на рубеже веков возникла гигантская индустрия High-End, что означает высший предел качества. Её концепция основана на субъективном восприятии звука. В специализированных изданиях непонятно откуда взявшиеся «эксперты» описывали свои впечатления от прослушивания дорогого аппарата примерно так: "Бриллиантовые и чуть задумчивые верха бесстрастно парили над умеренно отзывчивой серединой на фоне бесцеремонно бьющих по подсознанию басов". Людям внушалась мысль о том, что цифровой звук компакт-дисков содержит лишь часть информации об исходном аналоговом сигнале (что является абсолютной правдой), и это должно быть оскорбительно для слуха истинных ценителей музыки. Так появилось отдельное направление в развитии звуковой аппаратуры под лозунгом «Возрождение винила». Кодекс аудиофила гласит: не хочешь быть лузером, ставь вертушку в песок, неделю прогревай усилитель и используй соединительные шнуры из чистого золота. Считается, что если оцифровать пластинку с повышенным качеством 24 бита 192 кГц, то можно сохранить её «живую аналоговость» и «теплоту звучания», недоступную для компакт-дисков. Для большей драматургии ниже дана звуковая подборка высказываний известных и весьма уважаемых людей об их представлениях о звуке и о модной нынче «виниловой» теме.

 

Мнения мэтров о звуке

 

Чтобы понять, насколько эти представления соответствуют действительности, я решил провести своё расследование. Его результаты можно легко проверить, поскольку речь здесь пойдёт не о слуховых ощущениях, а исключительно о технической стороне вопроса. Выводы для себя вы сможете сделать сами. Главным для меня был вопрос: действительно ли звук винила настолько хорош, что о нём так много говорят? Ведь прошло уже много десятилетий с момента его появления, и с тех пор в мире кое-что изменилось. Сегодня у нас есть возможность сравнивать разные звуковые форматы.

Что касается соединительных шнуров, то направление их подключения никак не сказывается на звуке. В аналоговых кабелях, которые представляют из себя два электрических проводника, симметрично распаянные на концах, переменный ток звуковой частоты движется по ним одинаково в обоих направлениях. В цифровых коаксиальных кабелях, которые устроены точно так же, передаётся цифровой поток в виде электрических импульсов постоянной амплитуды с высокой частотой. Для уменьшения эффекта «джиттера» (jitter - в данном случае дрожание фронта импульсов во времени, которое может привести к искажению всего цифрового потока) они имеют волновое сопротивление 75 Ом, что подразумевает строго нормированную геометрию сечения на протяжении всей длины, как у телевизионных или любых других высокочастотных кабелей. В оптических кабелях SPDIF (Sony Philips Digital InterFace, или Interconnect Format), а также в физически совместимом с ними формате TOSLINK (TOSHIBA LINK), для передачи световых импульсов используется гибкое оптоволокно. Они отличаются малыми потерями при передаче сигнала на большие расстояния и дают полную гальваническую развязку соединяемых блоков. Поскольку все аналоговые и цифровые кабели являются пассивными проводящими элементами, т.е. не имеют усилителя сигнала, то нет никакой разницы при подключении их в любом направлении. Здесь могла иметь место путаница с фазой подключения громкоговорителей, которая действительно важна, и то лишь для сигналов низкой частоты.

Формат виниловой пластинки в нынешнем её виде появился в 50-х годах прошлого века. Сначала записывается мастер-диск, представляющий из себя твёрдую алюминиевую основу с нанесённым на ней тонким слоем лака нитроцеллюлозы, в котором при помощи нагретого до 300°C сапфирового резца формируется звуковая дорожка. Далее через промежуточные этапы методом прессования под высоким давлением и при высокой температуре осуществляется печать пластинок. В силу несовершенства устройств механической грамзаписи решено было пойти на компромисс. Звук на мастер-диск записывается с предыскажениями: при записи низкие частоты ослабляются, а высокие поднимаются, точкой перехода служит частота 1 кГц. Если этого не делать, ширина колебаний звуковой дорожки на низких частотах будет слишком большой, что не позволит игле с ограниченной гибкостью её подвижной системы следовать по канавке. При воспроизведении амплитудно-частотная характеристика (АЧХ) имеет зеркально отражённый вид, что в результате даёт близкую к линейной полосу частот звукового тракта. Такой метод получил стандарт под названием RIAA (Recording Industry Association of America, - Американская ассоциация звукозаписывающих компаний). Благодаря ему, а также применению новых полимерных материалов качество механической записи звука заметно выросло по сравнению со старыми щеллачными пластинками на 78 об/мин. На каждой стороне диска теперь помещалось примерно по 20 минут музыки, и вместо двух стандартных композиций можно было слушать полноценные концертные записи, аудиопостановки и музыкальные сборники. В 1964 году Международная электротехническая комиссия IEC предложила использовать фильтр, подавляющий частоты ниже 30 Гц для уменьшения «бубнения» звука, т.к. аппаратура того времени плохо справлялась с низкими частотами. В конце 70-х годов фирма Teldec запатентовала технологию DMM (Direct Metal Mastering), в которой звуковые дорожки на мастер-диске нарезались в тонком слое аморфной меди поверх гладкого стального основания. Качество записанного таким образом звука повысилась ещё больше, максимально приблизившись к студийному. Общее развитие технологий со временем довело звучание винила практически до совершенства, и для расширения полосы частот от фильтра IEC решили отказаться. 

Давайте посмотрим на характеристики эталонного станка для записи мастер-диска. Полоса частот от 5 до 25 000 Гц, коэффициент гармоник на пиках сигнала 1,5%, минимальное разделение каналов 35 дБ, уровень рокот-эффекта (паразитных низкочастотных вибраций) -40 дБ, уровень шумов -60 дБ, коэффициент детонации 0,0025%.

 

Виниловые пластинки

АЧХ RIAA

Станок для записи мастер-диска

 

А теперь возьмём линейку и немного посчитаем. Диаметр виниловой пластинки формата 12 дюймов равен 300 мм, расстояние от центра диска до внешней дорожки 146 мм, от центра до внутренней дорожки 60 мм (зависит от общего времени звучания). Игла звукоснимателя перемещается по спирали от края диска к центру, и диаметр дорожки при этом плавно уменьшается с 292 до 120 мм. Если перевести диаметр окружности в её длину по формуле L=πD, то мы получим 917 мм снаружи и 377 мм внутри. При постоянной угловой скорости 33 и 1/3 об/мин линейная скорость движения звукоснимателя относительно диска плавно снижается по мере приближения к его центру. 33,(3) / 60 = 0,(5) об/сек, умножаем это значение на 917 и 377, и получаем 509 мм/сек на внешней дорожке и 209 мм/сек на внутренней.

Зачем нам всё это нужно знать? Звуковая дорожка виниловой пластинки представляет из себя микроскопическую канавку, v-образная форма которой промодулирована звуковой волной. На каждой из её стенок, расположенных под углом 90
° друг к другу, «отпечатаны» сигналы левого и правого каналов. Поперечные смещения канавки параллельно плоскости диска дают сумму амплитуд обоих каналов, что обеспечивает совместимость с моно-записями, а вертикальное смещение вверх-вниз даёт их разность. Механические вибрации иглы преобразуются в электрические колебания звуковой частоты. Чтобы игла звукоснимателя смогла отследить поперечные смещения канавки относительно её центра с частотой 20 кГц, радиус этих смещений должен быть не меньше радиуса иглы, который равен 15 мкм (0,015 мм). Чтобы обеспечить такую плотность механической записи, линейная скорость движения диска относительно иглы должна быть достаточно высокой. Наружную скорость 509 мм/сек делим на 20 000 (количество механических колебаний в секунду, за которую игла проходит по дорожке 509 мм), получаем радиус одного смещения 0,025 мм на частоте 20 кГц, что превышает радиус иглы. Но поскольку частота колебаний резца во время записи ограничена полосой в 25 кГц, минимальный радиус смещения канавки на этой частоте в начале диска составит 0,02 мм, поэтому игла 0,015 мм вполне способна её воспроизвести, и здесь аудиофилы правы. Но дело тут не в самой ультразвуковой частоте, которая может и отсутствовать в записи, а в способности без искажений передавать обертоны малой амплитуды во всём слышимом диапазоне частот. У компакт-диска верхняя полоса всегда ограничена частотой 20 кГц, и это один из главных аргументов противников цифрового звука.

Если разделить внутреннюю скорость 209 мм/сек на 20 000 Гц, то мы получим радиус одного смещения микроканавки 0,01 мм на этой частоте, что в полтора раза меньше радиуса иглы. Смещения эти будут уменьшаться в размерах по мере приближения к центру диска и становиться соизмеримыми со структурой зерна виниловой основы. Игла не сможет полноценно их отслеживать, что приведёт к ограниченной амплитуде её колебаний, а следовательно, - к завалу в области высоких частот. Внутреннюю скорость 209 мм/сек делим на радиус иглы 0,015 мм, получаем частоту 14 кГц, выше которой неизбежен спад АЧХ. Производители пластинок знают об этом, и когда-то старались размещать наиболее «звонкие» треки ближе к внешней стороне диска. Таким образом, полоса частот пластинки с более-менее гладкой АЧХ плавно снижается с 25 кГц на внешней дорожке до 14 кГц на внутренней. Это примерно то же самое, как если бы частота дискретизации цифрового звука постепенно падала с 50 до 30 кГц.

Из-за разницы формы резца для записи диска игла не совсем точно следует всем изгибам канавки, и считывает искажённую форму сигнала. В узких местах игла приподнимается вверх, а в широких опускается вниз, из-за чего возникает так называемый пинч-эффект, который является следствием удвоения частоты боковых отклонений и приводит к наложению на исходный сигнал второй гармоники. Иглы звукоснимателей выполнены из алмаза и бывают как с простой сферической, так и с эллиптической формой заточки. Большая часть эллипса в иглах второго типа ориентирована поперёк звуковой дорожки и имеет с ней увеличенную площадь контакта, за счёт чего обеспечиваются лучшие частотные и фазовые характеристики. Их применяют в проигрывателях высокого класса. При записи диска резец станка движется строго по радиусу от края к центру. Во время воспроизведения игла звукоснимателя движется по дуге, из-за чего возникает угловая погрешность, вызывающая нелинейные искажения до 0,5%. Чтобы свести их к минимуму, хорошие тонармы имеют достаточно большую длину и изогнутую форму, за счёт чего достигается минимальный угол поворота в 24°. Точка контакта иглы с пластинкой, в которой звукосниматель расположен под прямым углом к её радиусу, выбрана равноудалённой от начала и конца всей записи, поэтому максимальная угловая погрешность составляет ±12°. Такие тонармы называются радиальными, или поворотными. Существуют также проигрыватели с тангенциальным тонармом, который всегда ориентирован перпендикулярно радиусу пластинки, но из-за высокой цены они не получили широкого распространения.

Механизм тонарма имеет сложную конструкцию, балансирующую его во всех плоскостях. Он позволяет регулировать величину давления иглы на диск. Механизм антискейтинга устраняет неравномерность прижимной силы, направленной в сторону центра диска, чтобы уменьшить искажения звука. Весь проигрыватель подвешен на демпфирующих пружинах, которые гасят внешние механические вибрации. На самых лучших моделях стоят тихоходные шаговые двигатели с прямым приводом и кварцевой стабилизацией частоты вращения, массивные диски, гасящие неравномерность движения, и имеют коэффициент детонации, т.е. «плавание» звука, порядка 0,08-0,1%. Всё это требует бережного обращения с пластинками и проигрывателем, настройка которого превращает процесс прослушивания музыки в весьма утомительное занятие.

 

Компенсация угловой погрешности

Амплитуда вибраций иглы

Сферическая и эллиптическая иглы

Механизм тонарма

 

У компакт-диска считывание информации происходит от центра к краю с постоянной линейной скоростью за счёт плавного снижения частоты его вращения с 400 до 200 об/мин. Это обеспечивает постоянный цифровой поток, не зависящий от места расположения считывающей головки, что гарантирует одинаковое качество звука в любом месте диска. Со считывающего лазера сигнал в виде прямоугольных импульсов попадает в буфер оперативной памяти, после которого подаётся на вход цифро-аналогового преобразователя (ЦАП) с частотой синхронизации 44,1 кГц, задаваемой высокоточным кварцевым генератором. Тем самым исправляются неточности частоты вращения диска, а коэффициент детонации, в отличии от виниловых пластинок, находится ниже предела измерений. Алгоритм восстановления ошибок, в основе которого лежит код Рида-Соломона (Reed-Solomon codes), при помощи перестановки блоков данных защищает звук от искажений при появлении на диске небольших царапин. Такие же царапины на виниловой пластинке неизбежно приводят к появлению щелчков, которые невозможно устранить. Кроме того, статический заряд, накапливающийся на поверхности винила, притягивает микрочастицы пыли, содержащиеся в воздухе, что является причиной потрескивания звука. Игла со временем изнашивает звуковые дорожки, срок службы которых ограничен.

В цифровом звуке применяется двоичная система кодирования, измеряемая в битах. Bit, - это сочетание слов bi(nary) (digi)t, т.е. двоичное число, минимальная единица измерения количества информации. В ней используется всего два логических состояния: 0 и 1, что на аппаратном уровне соответствует отсутствию либо наличию электрического импульса. Для оцифровки звука в системе импульсно-кодовой модуляции (PCM - Pulse Code Modulation) нужно измерять его амплитуду через фиксированные промежутки времени, частота следования которых называется частотой сэмплирования, или частотой дискретизации. Согласно теореме Найквиста-Шеннона, частота сэмплирования звука должна как минимум вдвое превышать максимальную частоту преобразуемого сигнала, что необходимо для полноценной регистрации двух его полуфаз. Если период синусоиды с частотой 20 кГц равен 1/20000=0,00005 секунды, то для измерения амплитуды её положительной и отрицательной полуволн, переходящих через ноль, нужен вдвое меньший период следования импульсов оцифровки, равный 0,000025 секунды, что соответствует частоте 40 кГц.

В формате CD Audio частота сэмплирования равна 44,1 кГц, при том что максимальная частота, которую способен передать этот формат, равна 20 кГц. Запас по частоте (44,1 / 2 - 20 = 2,05 кГц) применяют для фильтрации сигнала. Поскольку аналоговый сигнал имеет бесконечную полосу частот, при резком его обрезании на частоте 20 кГц неизбежно появление гармонических искажений. Плавный спад амплитуды после 20 кГц до нуля на частоте 22,05 кГц обеспечивает минимально допустимый уровень искажений. Это так называемый фильтр высокого порядка, в основе которого лежит принцип работы фильтра Баттерворта. Он имеет плоскую АЧХ в полосе пропускания и крутой спад на частоте подавления.

Реальный звуковой сигнал динамически меняется во времени по амплитуде и частоте. Результирующая огибающая в виде непрерывной звуковой волны, состоящей из цепочки сэмплов, и есть оцифрованный звук. Выборка амплитуды во времени представляет из себя один сэмпл, что в 16-битном разрешении соответствует пачке из 16 импульсов в виде нулей и единиц. Это создаёт цифровой поток со скоростью 16 * 44 100 = 705 600 бит/сек для каждого канала, его также называют битрейтом. В отличии от скорости передачи данных, объём хранимой и обрабатываемой информации измеряется в байтах (byte). Каждый байт состоит из 8 бит и может принимать одно из 28=256 значений, размер машинного слова также кратен 8 битам. Зная скорость битрейта, легко подсчитать объём передаваемой информации: 16 бит * 44 100 Гц * 2 канала = 1 411 200 бит/сек, или 1,4112 Мбит/сек, делим на 8, получаем 0,1764 Мб/сек (мегабайт в секунду).

В формате DVD Audio при разрядности в 24 бита применяют частоты сэмплирования 96 и 192 кГц, которые способны передать звук частотой около 48 и 96 кГц соответственно. Человеческое ухо не может услышать эти частоты, но принцип сверхмелкого дробления важен для качественной оцифровки звука. В начале статьи я упоминал о том, что цифровой звук содержит лишь часть информации об исходном аналоговом сигнале. Форматы высокого разрешения как раз и предназначены для того, чтобы эта часть была больше, приближая звук к оригиналу. Наиболее продвинутые аудиофилы справедливо замечают, что «мёртвые зоны» между соседними измерениями аналогового сигнала «вырезаются» из цифрового потока, что приводит к ухудшению качества звука. Но они умалчивают о том, что возникающие при этом искажения в процентном отношении в сотни и даже в тысячи раз меньше искажений звука виниловых пластинок. Как их можно измерить, я покажу ниже.

 

Принцип теоремы Найквиста-Шеннона

4-разрядное двоичное кодирование

Оцифровка с разным разрешением

 

Для квантизации сигнала по амплитуде применяется так называемое цифровое слово. Оно состоит из нескольких последовательных ячеек, или разрядов, в каждый из которых может быть записан один бит информации в виде 0 или 1. Количество всех возможных комбинаций этих элементов определяет количество уровней измерения амплитуды сигнала. Например, в 4-разрядном слове всего 16 комбинаций 0 и 1, следовательно, оно описывает сигнал с 16 уровнями громкости, который является 4-битным. Для более простого понимания разрядности её можно представить как степень двойки: 22 = 4 уровня амплитуды, 23 = 8 уровней, 24 = 16 уровней, и т.д. Умножая двойку, или пару из 0 и 1 на саму себя определённое количество раз, мы получаем разные количества их сочетаний в разных разрядностях. Чем больше разрядов, тем точнее можно измерить аналоговый сигнал.

Двоичная система счисления основана на таблице степеней основания числа 2, в которой десятичное значение младшего значащего разряда, расположенного справа, равно 1. Умножая его на 2, получаем значение следующего за ним старшего разряда, расположенного левее, и т.д. справа налево. Для преобразования из двоичной системы в десятичную суммируются десятичные значения всех разрядов с соблюдением правила: если в соответствующей ячейке записана единица, суммируется её десятичное значение, а если записан ноль, её десятичное значение обнуляется. В 4-разрядном слове десятичный ряд будет выглядеть так: 0 = 0000 (0+0+0+0), 1 = 0001 (0+0+0+1), 2 = 0010 (0+0+2+0), 3 = 0011 (0+0+2+1), 4 = 0100 (0+4+0+0), 5 = 0101 (0+4+0+1), 6 = 0110 (0+4+2+0), 7 = 0111 (0+4+2+1), 8 = 1000 (8+0+0+0), 9 = 1001 (8+0+0+1), и т.д. до 15 = 1111 (8+4+2+1). Всего 16 значений от 0 до 15. Если добавить слева всего один старший разряд, количество отсчётов удваивается. Разрядов может быть сколь угодно много, но для качественной передачи звука в PCM считается достаточным количество разрядов от 16 до 24.

 

Разряд     10** 9 8 7 6 5 4 3 2   1*
Двоичное значение 0 0 1 0 1 1 0 0 1 0
Десятичное значение 512 256 128 64 32 16 8 4 2 1
Суммируемое значение +0 +0 +128 +0 +32 +16 +0 +0 +2 +0
Примечание 10-разрядное двоичное число 0010110010 равно десятичному 128+32+16+2=178
** старший значащий разряд, * младший значащий разряд

Таблица двоичной системы счисления на примере 10-разрядного кодирования

 

На примере этой таблицы легко понять теорию двоичного кодирования. У нас есть 10-разрядное цифровое слово, которое должно описывать максимальное количество комбинаций 0 и 1, равное 210 = 1024. Запишем во все ячейки 1 и просуммируем их десятичные значения. Складывать можно в любом направлении, но в двоичном виде старший значащий разряд и соответствующее ему максимальное десятичное значение всегда находится слева.

512 + 256 + 128 + 64 + 32 + 16 + 8 + 4 + 2 + 1 = 1023

Но мы пропустили ещё одно состояние, когда во всех ячейках может быть записан логический ноль, который в двоичной системе счисления имеет такой же вес, как и единица. Поэтому нулевой отсчёт, при котором сумма десятичных значений всех разрядов также равна нулю, является равнозначным всем остальным вычислениям.  Таким образом, 10-разрядное цифровое слово оперирует 1024 отсчётами, из которых наша пачка импульсов 0010110010 формирует сэмпл амплитудой 178 отсчётов при максимальном значении 1023 (с учётом нуля 1024). Начало каждой пачки, или старший значащий разряд цифрового слова, идущих один за другим в общем потоке, синхронизируется импульсами, следующими с частотой дискретизации. По этим сэмплам восстанавливается непрерывная звуковая волна исходного аналогового сигнала. Примерно так работают все многоразрядные PCM цифро-аналоговые преобразователи.

Аналого-цифровой преобразователь (АЦП) в простейшем случае представляет из себя микросхему с N-количеством компараторов напряжения, равных количеству уровней квантизации шкалы громкости и ступенчато настроенных каждый на свой уровень. Они сравнивают амплитуду входного аналогового сигнала с опорным напряжением в своей точке. Если амплитуда не совпадает с референсной, компаратор закрыт, а если совпадает, компаратор открывается и АЦП за один такт частоты дискретизации выдаёт пачку импульсов, эквивалентную амплитуде двоичного кодирования в этой точке шкалы громкости.

 

Пример 4-разрядного кодирования. В левом столбике показано соответствие десятичного и двоичного представления амплитуды сигнала

 

 

Динамический диапазон показывает разницу между уровнем минимального и максимального звукового давления и измеряется в децибелах (дБ). Децибел, - это логарифмическая величина, выражающая степень звукового давления в зависимости от амплитуды сигнала. Дело в том, что достаточно большие изменения амплитуды при аппаратном декодировании на слух могут восприниматься как незначительные. И только логарифмическая шкала даёт наиболее адекватное слуховым ощущениям соответствие уровня амплитуды сигнала его субъективной громкости. Она рассчитывается по формуле: D = 20log (L), где D - величина в децибелах, L - амплитуда сигнала. Чтобы не искать в интернете онлайн-калькуляторы перевода в децибелы, посмотрим, как это делается на примере 16 уровней амплитуды 4-битного сигнала. Запускаем калькулятор Windows: Вид / Инженерный, набираем последовательно 16 log * 20 =, получится 24 дБ. Для перевода из дБ в разы, или уровни амплитуды, применяем обратную формулу L=10(D/20). На калькуляторе последовательно набираем 10 xy ( 24 / 20 ) =, получится 15,8489, округляем до ближайшего целого значения 16.

 

Разрядность, бит

Квантизация по амплитуде, уровней

Динамический диапазон, дБ

1 2 6
2 4 12
4 16 24
8 256 48
10 1 024 60
12 4 096 72
16 65 536 96
24 16 777 216 144
32 4 294 967 296 193

 

Интерес к винилу был подогрет неудачными попытками создания ЦАП первого поколения для CD проигрывателей. Они строились по принципу аналоговых резисторных матриц, преобразующих последовательные 16-битные числа в звуковые сэмплы со ступенчатой структурой амплитуды. Это требовало прецизионного исполнения с минимальным разбросом характеристик пассивных элементов преобразователя, что было достаточно дорого и не обеспечивало хорошее качество звука. Наложение спектров друг на друга вызывает интермодуляционные искажения, которые лежат выше порога чувствительности слуха, но оказывают негативное воздействие на звуковой тракт. Сигналы амплитудой меньше одного бита невозможно восстановить, их звук равен белому шуму, для 16 бит это -96 дБ, а тихие звуки содержат большие нелинейные искажения. Дальнейшее развитие алгоритмов обработки привело к созданию более совершенных и недорогих ЦАП с передискретизацией частоты, однобитных сигма-дельта преобразователей и цифровых фильтров с большой крутизной спада, которые потом перебрались из CD Audio в DSD с широтно-импульсной модуляцией. Это позволило раскрыть весь потенциал цифрового звука, избавившись от его детских болезней и оставив далеко позади конкурирующие форматы.

Иногда внешний ЦАП, подключенный к цифровому выходу 16-битного оборудования, может показать "STREAM=PCM 24 BITS". Однако не стоит сильно этому радоваться, поскольку увеличенное разрешение применяют для совместимости протоколов передачи данных разных типов внешних ЦАП. Чтобы преобразовать цифровой поток из 16 в 24 бита, в вычислениях нет необходимости, достаточно в конце каждого слова добавлять по 8 младших разрядов, заполненных нулями.

16 bit: 0010100110001001
24 bit: 001010011000100100000000

Любая комбинация единиц, сдвинутая влево на N разрядов относительно самого младшего из них, будет эквивалентна исходному десятичному значению, умноженному на 2N. В первом случае амплитуда равна 10 633, во втором 10 633 * 256 = 2 722 048, поскольку 28 = 256. ЦАП определит цифровой поток как 24-битный, но по сути это будет та же «лесенка», гармошкой растянутая на весь новый динамический диапазон с тем же количеством ступенек. Такое преобразование не несёт дополнительной информации о звуке. Чтобы в этом убедиться, нужно переписать сигнал с цифрового выхода на внешнее записывающее устройство в wav, и проанализировать файл в программе Adobe Audition. Он определится как 24-bit Packed Int (type 1 (24-bit)). При анализе статистики амплитуды все разряды сканируются на предмет смены нулей и единиц, но поскольку 8 из них всегда равны нулю, то параметр Actual Bit Depth равен 16.

 

Определение фактической разрядности в Adobe Audition

 

Для каждого типа носителей, будь то виниловая пластинка, компакт-диск, DVD Audio, или SACD, делается свой отдельный мастеринг, учитывающий свойства их динамических диапазонов. Чем меньше динамический диапазон носителя, тем больше амплитуда сигнала подвергается компрессии, и наоборот. Это помогает избежать искажений. Но среднестатистический человек на обычной аппаратуре вряд ли услышит разницу между CD Audio 16/44 и DVD Audio 24/192, и самое время будет вспомнить о разумном компромиссе. Но если не слышно разницы, это не значит, что её нет. Просто увеличение качества звука, определяемое на слух, растёт здесь непропорционально увеличению сложности технологического процесса. Это один из главных недостатков многоразрядного кодирования в PCM. Сглаживание ступенчатого сигнала требует применения высококачественных ЦАП, при этом возникают шумы квантования, а также фазовые искажения на высоких частотах, растущие по мере приближения к частоте дискретизации за счёт сопоставимой длины волны. С уменьшением амплитуды сигнала за счёт погрешности измерений растёт уровень искажений, который напрямую зависит от количества разрядов.

Однобитное кодирование в формате Direct Stream Digital (DSD) свободно от этих недостатков. Его принцип действия напоминает поведение аналогового сигнала. При росте амплитуды синусоиды плавно увеличивается плотность её модуляции импульсами в виде 1 относительно 0, а при падении амплитуды плотность модуляции уменьшается. Смена фазы звукового сигнала меняет 0 и 1 местами. По сути это та же частотная модуляция, которая применяется в FM-радиовещании, только не аналоговая, а цифровая с частотой дискретизации 2,8224 МГц, что в 64 раза больше, чем на компакт-дисках. Полученный таким образом однобитный сигнал не нуждается в дополнительном многоразрядном преобразовании, что значительно упрощает аппаратную часть и положительно сказывается на качестве звука. Фильтр низкой частоты выделяет звуковую составляющую, а многоуровневые дельта-сигма преобразователи с цепью обратной связи эффективно подавляют шумы квантования, сдвигая их за пределы слышимого диапазона. Фазовый сдвиг на высоких частотах здесь практически отсутствует, перегрузка сигнала не приводит к его искажениям. При полосе частот вплоть до 100 кГц динамический диапазон достигает 120 дБ. Однобитное кодирование используется в формате Super Audio CD (SACD). Дальнейшее увеличение качества звука достигается за счёт увеличения частоты дискретизации. В форматах DSD64, DSD128, DSD256 и DSD512 цифры показывают, во сколько раз частота дискретизации увеличена по отношению к базовой частоте 44,1 кГц. Её иногда указывают в мегагерцах: 2,8224 мГц, 5,6448 мГц, 11,2896 мГц, 22,5792 мГц. Такое разрешение позволяет добиться практически идеального звучания, поэтому оно применяется в студийных системах звукозаписи.

 

Принцип кодирования PCM и DSD

 

На этом теоретическая часть заканчивается. Чтобы развеять некоторые распространённые мифы, будем безжалостно измерять характеристики звука. Современные программы и оборудование позволяют это делать с высокой точностью. Для измерения амплитудно-частотных характеристик будем использовать программу Adobe Audition. Если какие-то файлы не поддерживаются по умолчанию, отсюда скачиваем плагины и распаковываем их в директорию программы. После выделения мышью всего файла или его части из меню Окно (Window) применяем команду Частотный анализ (Frequency Analysis), а затем Статистика Амплитуды (Amplitude Statistics). Я протестировал три звуковых файла с разных носителей: виниловой пластинки, компакт-диска и DVD Audio. По сути все они являются lossless-файлами, т.е. при кодировании применено сжатие аудио без потери качества.

Vinyl-Rip 24/192 Mylene Farmer, L'Ame Stram Gram, 1999 (12" maxi single 33 1/3).
CD-Rip 16/44 James Blunt, Best Laid Plans, 2010.
Lossless 24/96 Paul McCartney, Monkberry Moon Delight, Remastered Deluxe Edition 2012 (DVD Audio).

 

 

Vinyl-Rip 24/192 Учитывая разницу линейной скорости чтения в начале и в конце диска, я снял АЧХ первого и последнего треков на стороне A. Чтобы не было ошибки, мышью нужно выделить часть сигналограммы со звуковыми данными, и при этом захватить область между треками, там где слышно только шуршание иглы, но ни в коем случае не выделять места, где тонарм ещё не опущен на пластинку и уровень сигнала равен нулю. Смотрим на скриншот, нас интересует параметр Minimum RMS Power (Root Mean Square Power) - минимальная среднеквадратичная, или средневзвешенная мощность звукового сигнала. В начале диска она равна -65 дБ, что соответствует максимальной частоте 19 кГц. Всё, что ниже, - это сильные нелинейные искажения, сопоставимые со звуком бензопилы «Дружба». В конце диска этот параметр равен -62 дБ, и можно увидеть резкий провал спектра в районе 13-14 кГц на этом уровне, что подтверждает теоретические выкладки, изложенные выше. Смотрим в верхнюю таблицу: динамический диапазон 62-65 дБ соответствует разрядности 11 бит (примерно между 10 и 12 бит), как и написано в Википедии.  Пусть вас не смущает параметр Actual Bit Depth, он показывает разрешающую способность звуковой карты, при помощи которой производилась оцифровка. Вместо ожидаемой аналоговой ультравысокой частоты мы получили звук с качеством 11 бит 14-19 кГц (в зависимости от линейной скорости), с которым вполне могла бы справиться оцифровка в формате 16 бит 44,1 кГц без потери качества. Справедливости ради надо признать, что из-за разницы формы аналогового и цифрового сигналов разрядность в 11 бит здесь не является эквивалентом разрядности цифрового звука в привычном смысле, она лишь говорит о динамическом диапазоне виниловой пластинки.

 

 

CD-Rip 16/44 Параметр Minimum RMS Power -81 дБ соответствует частоте 18 кГц. Это предел минимальных искажений, характерных для 16-битного звука, о котором я писал выше. Частота 20 кГц плавно падает на уровне -96 дБ, что полностью соответствует спецификации стандарта CD Audio. Вывод: абсолютно честный звук 16 бит 20 кГц.

 

 

 

Lossless 24/96 Параметр Minimum RMS Power равен -140 дБ, что гарантирует качество звука в полосе вплоть до 48 кГц во всём динамическом диапазоне. Обратите внимание на уровень звукового давления -96 дБ на частоте 20 кГц, амплитуда которой меньше максимального уровня 0 дБ в 10(96/20) = 63 096 раз. Природа звука такова, что энергия низких частот всегда больше, чем высоких. Чтобы оцифровать такой слабый сигнал с хорошим качеством, в 24-битном формате ещё есть приличный запас по измерению, равный 144 - 96 = 48 дБ. Т.е. частота 20 кГц измеряется 10(48/20) = 251 градацией амплитуды, вместо 1-2 градаций в 16-битном формате. Вывод: звук для хорошей аппаратуры 24 бита 20 кГц+.

В истории рок-музыки есть один любопытный технический момент, который связан с группой The Beatles. Как наверняка знают многие меломаны, на альбоме Sgt. Pepper's Lonely Hearts Club Band в самом конце песни A Day In The Life есть коротенький кусочек длиной в несколько секунд с частотой 16 кГц. Как утверждают музыкальные критики, Пол Маккартни в качестве шутки записал его специально для своей собаки Марты. Фокус был в том, чтобы при прослушивании собаки реагировали на ультразвук, который они хорошо слышат, а люди ничего бы не замечали, поскольку для них эта частота находится на пороге слышимости. Этот фрагмент как будто специально находится в критической для винила зоне с маленькой линейной скоростью, и сам напрашивается на то, чтобы его измерили. Я снял АЧХ этого фрагмента с винил-рипа и с CD-рипа, и совместил их на одном скриншоте. Чтобы графики точно совпадали, рипы были с одинаковой частотой дискретизации 44,1 кГц.

 

A Day In The Life, звук 16 кГц на разных носителях

 

Здесь для наглядности даны АЧХ только правого канала. На картинке видно, что частота 16 кГц на CD находится на уровне -11 дБ, на виниле она смещена в сторону 15 кГц на уровне -48 дБ. Вероятнее всего, сдвиг частоты и наложение боковых частот вызваны тем, что смещения микроканавки на частоте 16 кГц на внутренних дорожках имеют радиус примерно 0,013 мм, что несколько меньше радиуса заточки иглы 0,015 мм, которая считывает искажённую форму сигнала при критической для этой частоты угловой погрешности 12°. Катастрофическая разница в 37 дБ на CD и виниле говорит о пределе качества механических носителей.

 

A Day In The Life, ультразвук и его гармоники на Vinyl Rip 24/192

 

 

Есть разные издания на LP и CD с разными уровнями громкости. Поэтому я решил перепроверить сам себя, проанализировав винил-рип другого издания с гораздо лучшим качеством 24 бита 192 кГц. На графике видна всё та же частота 15 кГц на том же уровне -48 дБ. Тщательная оцифровка привела к обратному эффекту: появилась возможность увидеть гармоники гигантской амплитуды, кратные основной частоте 15 кГц. Так как в исходном аналоговом сигнале эти частоты отсутствуют, их появление приводит к неприятным на слух искажениям звука. На идеальном носителе их вообще быть не должно, но на практике они всегда присутствуют в той или иной степени. Измерив амплитуду каждой из них, можно рассчитать коэффициент гармонических искажений для этой частоты по формуле:

Здесь U1 соответствует амплитуде основной частоты 15 кГц, она же первая гармоника, U2 - амплитуде второй гармоники 30 кГц, U3 - амплитуде третьей гармоники 45 кГц, и т.д. При частоте дискретизации 192 кГц можно измерить полосу частот вплоть до 96 кГц, поэтому мы имеем возможность наблюдать максимум шестую гармонику с частотой 90 кГц. Но поскольку амплитуда сигнала в этой области спектра быстро стремится к нулю, этого вполне достаточно для получения точного результата. Для перевода из дБ в амплитуды берём перепад между нулевым звуковым давлением и уровнем каждой из гармоник, и переводим их в условные единицы по формуле L=10(D/20). Например, первая гармоника лежит на уровне -48 дБ, что выше нулевого звукового давления -144 дБ (для 24 бит) на 96 дБ, и соответствует амплитуде 10(96/20) = 63 096 условных единиц. Глядя на график, теперь можно рассчитать амплитуды всех гармоник.

 

Гармоника

Частота, кГц

Уровень, дБ

U, у.е.

U2, у.е.

1 15 -48 63 096 -
2 30 -63 11 220 125 888 400
3 45 -76 2 512 6 310 144
4 60 -73 3 548 12 588 304
5 75 -80 1 585 2 512 225
6 90 -92 398 158 404
Un = U22 + U32 + U42 + U52 + U62 147 457 477
√‾Un 12 143

 

Квадратный корень из суммы квадратов амплитуд 12 143 делим на амплитуду первой гармоники 63 096, получаем 0,1924. Но поскольку формула возвращает безразмерный коэффициент, для его перевода в проценты это значение нужно умножить на 100. Таким образом, коэффициент гармонических искажений виниловой пластинки на внутренних дорожках на частоте 15 кГц равен 19,24%. Рискну предположить, что в это значение входит суммарный коэффициент гармоник всего звукового тракта: самой пластинки, фонокорректора и в гораздо меньшей степени оцифровщика аналогового сигнала.

 

A Day In The Life, ультразвук 16 кГц и его гармоники на DVD Audio Rip 24/96

 

Для чистоты эксперимента теперь следовало бы измерить коэффициент гармоник того же фрагмента на CD Audio. Но сделать это невозможно, поскольку все гармоники интересующей нас частоты лежат выше полосы частот компакт-диска. Нужен формат высокого разрешения. Я нашёл DVD Audio Rip с качеством 24 бита 96 кГц. Фильтр низкой частоты здесь отсекает частоты как раз в районе третьей гармоники 48 кГц. Поэтому придётся ограничиться лишь второй гармоникой на частоте 32 кГц, она хорошо видна на графике на уровне -122 дБ. Аналогичным образом подсчитываем амплитуды первой и второй гармоник, которые равны 4 466 836 и 13 условным единицам соответственно. Возводить в квадрат амплитуду одной единственной гармоники и извлекать из этого значения квадратный корень не имеет смысла, поэтому оставляем её в первоначальном виде и подсчитываем коэффициент гармоник DVD Audio: (13 / 4 466 836) * 100 = 0,00029%. Как говорится, почувствуйте разницу. Насколько она слышна, - оценивать не берусь, но цифры говорят сами за себя.

Мне не удалось найти DVD Audio с частотой дискретизации 192 кГц, который мог бы дать картину спектра с бо́льшим количеством высших гармоник, поэтому полученный выше результат будет не совсем корректным. Но можно экстраполировать это значение в худшую сторону, взяв за основу результаты предыдущих измерений винил рипа. Если брать амплитуды всех шести гармоник, то коэффициент гармоник составит 19,24%, а если только первой и второй, то 17,78%. Таким образом, погрешность в сторону увеличения равна 8,2%. Тогда коэффициент гармоник DVD Audio 24 бита 96 кГц с учётом этой погрешности возрастёт до 0,00031%. Это значение будет справедливо лишь для частоты 16 кГц для прямого сравнения с искажениями винил-рипа. Параметр THD (Total Harmonic Distortion), который учитывает все гармонические искажения сигнала, будет несколько больше. В нижней сводной таблице даны наиболее важные технические характеристики разных носителей, как измеренные мной, так и типовые значения, найденные в интернете.

 

Формат

Разрядность, бит Динамический диапазон, дБ

Коэффициент гармоник, %

Полоса частот, кГц

Vinyl 12"   11* 62 19     14-25**
CD Audio 16 96 0,0045 20
DVD Audio 24/96 24 140 0,00031 48
DVD Audio 24/192 24 144 - 96
Super Audio CD 1 120 0,0008 100
* условное значение, ** в зависимости от линейной скорости

 

Как мы видим, сравнение честно измеренных характеристик звука говорит не в пользу аналоговых носителей. Исключением является лишь лучшая передача винилом высоких частот на внешних дорожках по сравнению с CD Audio. К тому же надо помнить о том, что одни и те же пластинки разных фирм могут звучать по-разному, что вызвано нечёткими требованиями стандарта RIAA. Но у радикально настроенных аудиофилов всегда остаётся самый главный с их точки зрения козырь в виде слуховых ощущений. И здесь никакие аргументы уже не работают, поэтому можно смело подводить итоги. Если кому-то нравится винил, то подобная приверженность традициям заслуживает уважения. В конце концов на восприятие звука, который мы слышим, оказывает влияние совокупность многих факторов. Лёгкое шуршание иглы проигрывателя навевает ностальгические воспоминания, а визуальный эффект вращающегося диска даёт ощущение «аналоговости». Винил можно пощупать и убедиться в его материальном существовании, чего нельзя сказать о звуковых файлах, которые существуют лишь в форме абстрактных невидимых импульсов. Немалую роль в возрождении популярности винила сыграла DJ-культура. Благодаря техническому прогрессу качественный звук стал доступен огромному количеству людей. Чтобы как-то выделиться из общей массы, люди состоятельные или просто замороченные на технике с радостью ведутся на маркетинговые трюки типа «180-граммового аудиофильского винила». Существующие физические ограничения формата не позволяют добиться радикального улучшения качества звука. Винил был хорош для своего времени, когда лучше просто ничего не было. Для меня этот носитель навсегда остался в прошлом.