Данный ресурс предназначен для тех, кому интересна тема создания музыки на компьютере

Главная    Полезные материалы    Программы для создания музыки    Учебники    Радио    Карта сайта

Оцифровка звука


Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. К параметрам, от которых это зависит, относятся, в первую очередь:
  • Разрядность аналого-цифрового и цифроаналогового преобразователей звуковой карты;
  • Диапазон частот дискретизации.
Разрядность звуковой карты существенно влияет на качество звука. Однако перед тем как перейти к более детальному обсуждению этого вопроса, следует пояснить, что речь идет о разрядности аналого-цифрового преобразователя (АЦП) (Analog/Digital Converter — ADC) и цифроаналогового преобразователя (ЦАП) (Digital/Analog Converter — DAC).

Звуковые карты двойного назначения имеют в своем составе одновременно два функционально независимых узла: синтезатор и устройство оцифровки звуковых сигналов, поступающих с внешнего источника. В каждый из узлов входит как минимум по одному ЦАП. В устройстве оцифровки, кроме того, имеется АЦП. Некоторые полупрофессиональные звуковые карты оборудованы 24-битными ЦАП/АЦП. Звуковые редакторы, работая с любыми звуковыми картами, в том числе и 16-битными, в процессе преобразований отсчетов сигнала используют арифметику с разрядностью двоичного представления числа, превышающей 16. Это позволяет уменьшить погрешность, накапливающуюся в процессе выполнения сложных алгоритмов обработки, которая в противном случае проявлялась бы как искажение звука.

Аналого-цифровое преобразование

Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования в свою очередь зависит от разрядности АЦП/ЦАП. Погрешности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования.

Шум квантования представляет собой разность соответствующих значений реального и квантованного по уровню сигналов.

В случае превышения сигналом значения самого верхнего уровня квантования ("старшего" кванта), а также в случае, когда значение сигнала оказывается меньше нижнего уровня квантования ("младшего" кванта), т. е. при цифровом ограничении сигнала, возникают искажения, более заметные по сравнению с шумом квантования. Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу: значения сигнала должны располагаться между уровнями, соответствующими младшему и старшему квантам. При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет в разд. 1.10.2.

В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего кванта. Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант.

Для нормированного сигнала относительная величина максимальной погрешности квантования равна 1/N, где N — число уровней квантования. Этой же величиной, представленной в логарифмических единицах (децибелах), оценивается уровень шумов квантования АЦП звуковой карты. Уровень шумов квантования определяется по формуле: D = 201g (1/N). Для восьмиразрядного АЦП N = 256, D = -48 дБ; для шестнадцатиразрядного — N = 65536,; D= -96 дБ и для двадцатиразрядного АЦП N = 1648576, D = -120 дБ. Эти цифры наглядно демонстрируют, что с ростом разрядности АЦП шум квантования уменьшается. Приемлемым считается шестнадцатиразрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП особого смысла не имеет, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схемы компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем -96 дБ.

Однако увеличение разрядности АЦП обусловлено еще одним условием — стремлением расширить его динамический диапазон. Динамический диапазон некоторого устройства обработки может быть определен выражением D = 201g (Smax/Smin), где Smax и Smin — максимальное и минимальное значения сигнала, который может быть преобразован в цифровую форму без искажения и потери информации. Вы уже, наверное, догадались, что минимальное значение сигнала не может быть меньше, чем напряжение, соответствующее одному кванту, а максимальное — не должно превышать величины напряжения, соответствующего N квантам. Поэтому выражение для динамического диапазона АЦП звуковой карты примет вид: D = 201g (N). Ведь можно считать, что Smax= kN, a Smin = k1, где k — некоторый постоянный коэффициент пропорциональности, учитывающий соответствие электрических величин (тока или напряжения) номерам уровней квантования.

Из сравнения выражений для А и D становится ясно, что при одинаковой разрядности АЦП эти величины будут отличаться лишь знаками. Поэтому динамический диапазон для шестнадцатиразрядного АЦП составляет 96 дБ, для двадцатиразрядного — 120 дБ. Иными словами, для записи звучания некоторого источника звука, динамический диапазон которого равен 120 дБ, требуется двадцатиразрядный АЦП. Если такого нет, а имеется только шестнадцатиразрядный, то динамический диапазон звука должен быть сжат на 24 дБ: со 120 дБ до 96 дБ.

В принципе, существуют методы и устройства сжатия (компрессии) динамического диапазона звука, и мы еще будем говорить о них (см. разд. 1.10.2). Но то, что они проделывают со звуком, как ни смягчай формулировки, все равно, представляет собой его искажение. Именно поэтому так важно для оцифровки звука использовать АЦП, имеющий максимальное количество разрядов. Динамические диапазоны большинства источников звука вполне соответствуют динамическому диапазону 16-битной звуковой карты. Кроме того, 24-битное или 32-битное представление сигнала применяется в основном на этапе обработки звука. Конечная аудиопродукция (CD Digital Audio и DAT) реализуется в 16-битном формате.

После того как мы немного разобрались с разрядностью АЦП звуковой карты, пришло время поговорить о частоте дискретизации.

В процессе работы АЦП происходит не только квантование сигнала по уровню, но и его дискретизация во времени. Сигнал, непрерывно изменяющийся во времени, заменяют рядом отсчетов этого сигнала. Обычно отсчеты сигнала берутся через одинаковые промежутки времени. Интуитивно ясно, что если отсчеты отстоят друг от друга на слишком большие интервалы, то при дискретизации может произойти потеря информации: важные изменения сигнала могут быть "пропущены" преобразователем, если они произойдут не в те моменты, когда были взяты отсчеты. Получается, что отсчеты следует брать с максимальной частотой. Естественным пределом служит быстродействие преобразователя. Кроме того, чем больше отсчетов приходится на единицу времени, тем больший размер памяти необходим для хранения информации.

Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое принято называть теоремой Найквиста — Котельникова.

Если поставить перед собой задачу обойтись без формул и использования серьезных научных терминов типа "система ортогональных функций", то суть теоремы Найквиста — Котельникова можно объяснить следующим образом. Сигнал, представленный последовательностью дискретных отсчетов, можно вновь преобразовать в исходный (непрерывный) вид без потери информации только в том случае, если интервал межу соседними отсчетами не превышает половины периода самого высокочастотного колебания, содержащегося в спектре сигнала.

Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой Fmax. Теоретически все реальные сигналы имеют бесконечные спектры. Спектры реальных сигналов, хотя и не бесконечны, но могут быть весьма широкими. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmax, и лишь затем производят дискретизацию. Согласно теореме Найквиста — Котельникова частота дискретизации, с которой следует брать отсчеты, составляет Fд = 2Fmax. Теорема получена для идеализированных условий. Если учесть реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.

В стандарте CD Digital Audio частота дискретизации равна 44,1 кГц. Для цифровых звуковых магнитофонов (DAT) стандартная частота дискретизации составляет 48 кГц. Звуковые карты, как правило, способны работать в широком диапазоне частот дискретизации.

В последнее время становится все более популярным стандарт DVD-audio, где частота дискретизации может быть равной 44,1/48/88.2/96 кГц, разрешающая способность 16/20/24 бит, количество каналов — до 6.

Цифроаналоговое преобразование

Для воспроизведения звукового сигнала, записанного в цифровой форме, необходимо преобразовать его в аналоговый сигнал.

Цифроаналоговое преобразование в общем случае происходит в два этапа. На первом этапе из потока цифровых данных с помощью цифро-аналогового преобразователя выделяют отсчеты сигнала, следующие с частотой дискретизации. На втором этапе путем сглаживания (интерполяции) из дискретных отсчетов формируется непрерывный во времени аналоговый сигнал.

На выходе простейшего ЦАП сигнал представляет собой последовательность узких импульсов, имеющих многочисленные высокочастотные спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (например, 20 Гц — 20 кГц) и по возможности наиболее полно подавить ненужные высокочастотные компоненты. К сожалению, аналоговому фильтру выполнить такие противоречивые требования не под силу. Поэтому цифровой сигнал сначала интерполируют, то есть вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам, и тем самым резко увеличивают частоту дискретизации. При этом исходный спектр полезного сигнала не искажается, а сигнал оказывается дискретизированным на значительно более высокой частоте. Это приводит к тому, что побочные спектральные компоненты на выходе ЦАП далеко отстоят от частотных компонентов основного сигнала и, чтобы отфильтровать их, достаточно простого аналогового фильтра.

После первого этапа цифроаналогового преобразования информация о величине звукового сигнала имеется только в определенные моменты, соответствующие частоте дискретизации АЦП. Дополнительная информация о форме сигнала между отсчетами отсутствует. Задачей второго этапа цифро-аналогового преобразования является восстановление значения сигнала между отсчетами, или интерполяция.

Наибольшее распространение получили линейные методы интерполяции формы сигнала по его дискретным отсчетам, основанные на использовании цифровых фильтров. В исходную последовательность отсчетов сигнала вставляются дополнительные нулевые отсчеты. Новая полученная последовательность подается на интерполирующий цифровой фильтр, в котором нулевые отсчеты преобразуются в очень точно реконструированные отсчеты исходного сигнала. Затем для сглаживания и окончательного восстановления сигнал подается на простой аналоговый фильтр. Полученный в результате цифроаналогового преобразования звуковой сигнал, как правило, попадает в микшер звуковой карты.

0 некоторых проблемах, связанных с ЦАП/АЦП

Обычно шум квантования представляют как разность соответствующих значений реального и квантованного по уровню сигналов (рис. 1.8, а, б).

Такое представление не совсем верно.

На рис. 1.8, а на самом деле цифровой сигнал не показан. Ступенчатая линия — это отображение аналогового сигнала, восстановленного из цифрового с использованием интерполяции нулевого порядка. Если из исходного аналогового сигнала вычесть эту ступенчатую линию, то получится очень странная и некрасивая линия (рис. 1.8, б). Некоторые авторы пишут, что это и есть шум квантования. Но, во-первых, кто сказал, что нужно заменять цифровой сигнал непрерывными ступеньками, и почему именно ступеньками, а не наклонными отрезками прямых линий или кривыми? Во-вторых, в действительности мы имеем право сравнивать непрерывные и дискретные сигналы только в моменты, соответствующие дискретным отсчетам. Поэтому и шум квантования следует представлять последовательностью дискретных отсчетов (рис. 1.8, в).

Рис. 1.8. Иллюстрация процесса квантования сигнала (интерполяция нулевого порядка):



В теоретических работах для представления дискретных сигналов используют функцию отсчетов (дельта-функцию) — бесконечно большой по амплитуде и бесконечно короткий по времени импульс. Площадь дельта-функции равна единице. Разумеется, функции отсчетов в природе не существуют. На практике они заменяются прямоугольными импульсами малой длительности.

Если взять последовательность смещенных во времени функций отсчетов и умножить ее на ординаты кривой линии, соответствующей аналоговому сигналу, то получится дискретный по времени сигнал, который можно представить графически так, как показано на рис. 1.8, в. В данном случае это и есть шум квантования, представленный дискретными отсчетами.

Не существует и идеальных фильтров, с помощью которых можно было бы точь-в-точь восстановить аналоговый сигнал по его дискретным значениям. Однако в современных АЦП используются методы, позволяющие свести погрешности, обусловленные неидеальностью преобразования, к разумному минимуму.

На рис. 1.9, а показан исходный аналоговый сигнал и сигнал, восстановленный из цифрового с использованием интерполяции 1-го порядка (отсчеты соединяются отрезками прямых линий).

Видно, что разница между исходным и восстановленным сигналом (рис. 1.9, б) гораздо меньше, чем при использовании интерполяции нулевого порядка (рис. 1.8, а). А ведь в современных ЦАП используются гораздо более сложные алгоритмы восстановления аналогового сигнала.

Что касается цифрового шума квантования (рис. 1.8, в), бесспорно, при цифроаналоговом преобразовании он трансформируется в некий аналоговый шум. Вид этого шумового колебания будет зависеть от конкретного АЦП, но его уровень будет гораздо меньше, чем уровень шумового процесса, показанного на рис. 1.8, б.

Распространенная среди сторонников аналогового звука страшилка "Результат дискретизации ужасно отличается от исходного сигнала" основана именно на неадекватном представлении шума квантования (рис. 1.8, б).

Рис. 1.10. Квантование сигнала по уровню и искажения при клиппировании сигнала:



Из рис. 1.10 видно, что в случае превышения сигналом значения самого верхнего уровня квантования ("старшего" кванта), а также в случае, когда значение сигнала оказывается меньше нижнего уровня квантования ("младшего" кванта), т. е. при ограничении сигнала, возникают искажения. Они могут быть гораздо более заметными по сравнению с шумом квантования.

Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу.

Следует упомянуть еще об одном заблуждении. Иногда им грешат даже профессиональные звукорежиссеры. Они утверждают примерно следующее: "Поведение восстановленного сигнала в промежутках между отсчетами не определено, он может изменяться произвольным образом". Однако, говоря так, они забывают о том, что спектр аналогового сигнала, подвергающегося цифроаналоговому преобразованию, обязательно должен быть ограничен. Поэтому при аналого-цифровом преобразовании его значения между дискретными отсчетами не могут быть произвольными и поддаются однозначному восстановлению по этим отсчетам.

Довольно часто изготовители, доказывая преимущество своих звуковых карт, подчеркивают такое обстоятельство, как наличие у звуковой карты цифрового входа и/или выхода. Действительно, если звуковая карта имеет выход, на который сигналы поступают не в аналоговой (после ЦАП), а в цифровой форме, это позволяет уменьшить искажения, связанные с дополнительными преобразованиями при дальнейшей цифровой обработке сигнала вне звуковой карты.

В соответствии с концепцией виртуальной студии звукозаписи вся обработка должна выполняться средствами одного PC. С помощью этого же PC можно получить и конечный продукт — компакт-диск. ЦАП высокого качества нужен только лишь для мониторинга, т. е. для того, чтобы слышать происходящее в виртуальной студии. Наличие цифрового выхода в виртуальной студии дает преимущества только тогда, когда требуется выполнить запись на DAT или подключить высококачественные акустические мониторы, снабженные цифровым входом.

Наличие цифрового входа в виртуальной студии может быть актуальным в том случае, если вас не устраивает качество работы встроенного в звуковую карту АЦП и вы хотите использовать более качественный внешний АЦП. Кроме этого, цифровой вход может быть полезен, если требуется "перегнать" запись с DAT в PC.

Шум квантования. Как с ним бороться? Если для представления звука использовать 24- или 32-битные отсчеты, то о шуме квантования можно забыть (так он слаб). Да вот беда — основным потребительским аудиоформатом является формат компакт-дисков: 16 бит/44,1 кГц/стерео. Поэтому разрядность представления звуковых данных приходится понижать. Даже при 16-битном разрешении звука шум квантования неуловимо мал, тем не менее, он обладает одной пренеприятнейшей особенностью: этот шум коррелирован с полезным сигналом. Именно шум квантования принимает самое активное участие в формировании негативного образа цифрового звука в умах людей — он плоский, металлический, пластмассовый и т. п. Как только раньше ни называли 16-битный звук! Так было до появления специальных методов обработки цифрового звука, называемых дитерингом (dithering) и нойзшейшнгом (noise shaping). Суть дитеринга состоит в том, что до понижения разрядности к полезному сигналу подмешивается очень слабый специфичный шум. В результате шум квантования попросту забивается этим шумом, который в силу своих статистических свойств гораздо меньше действует на психику человека. Конечно, в результате получается более шумная запись, но шум этот, как и шум квантования, практически неуловим на слух.

Еще один метод борьбы с шумом квантования, нойзшейпинг, заключается в применении специальных алгоритмов округления значений звуковых отсчетов при понижении разрядности. После применения нойзшейпинга большая часть энергии шума квантования сосредоточена в области высоких частот, к которым человеческий слуховой аппарат наименее восприимчив. Обычно нойзшейпинг применяется совместно с дитерингом..

Есть еще комплекс проблем: транкейт (от truncate — усечь) — то, что раньше мы называли понижением разрядности цифрового звука. Был сигнал 24-битным, стал 16-битным — произошел транкейт. С одной стороны, понижение разрядности цифрового звука дело обычное. Стоило ли вводить специальный термин? Однако термином truncate обозначают целый комплекс проблем, возникающих при работе с цифровым звуком, разрядность которого больше 16. Прежде всего, это неконтролируемое вами понижение разрядности (оно происходит втайне от вас или вы просто не обратили на него внимания). Допустим, сигнал проходит через три соединенных последовательно цифровых устройства обработки звука. Пусть для их соединения используется интерфейс S/PDIF. Внешне все кажется нормально: три красивых прибора соединены стандартными кабелями, все работает. Что еще нужно? Но кто-то из людей, коммутирующих эти устройства между собой, не разобрался в том, что только первый и последний приборы данной цепочки 24-битные, а средний 16-битный. Эти приборы легко нашли между собой язык: каждый из 24-битных приборов при установлении связи по S/PDIF выяснил, что подключен к 16-битному устройству и переключился в соответствующий режим. В результате при передаче сигнала от первого устройства ко второму произошел транкейт, причем персонал студии этого даже и не заметил. А как вы уже знаете, шум квантования 16-битного сигнала — вещь не очень приятная. Если в процессе обработки фонограммы транкейт происходит неоднократно, то качество звучания будет постепенно понижаться.

Вы скажете, что у вас нет своей цифровой студии с оборудованием стоимостью в десятки тысяч долларов. Но проблема транкейта может подстерегать вас и в персональной студии звукозаписи на базе PC. Обработали свой 24-битный WAV-файл 16-битным plug-in-модулем реверберации — вот вам и транкейт.

Единственный способ борьбы со случайным транкейтом — внимательно читайте инструкции, поставляемые с оборудованием. Что же касается программ, plug-in-модулей в частности, то для контроля за ними существуют специальные утилиты.


Методы синтеза звуков. Синтезаторы и сэмплеры >>>

<<< Оглавление




Данный ресурс создан исключительно с целью помочь начинающим музыкантам создавать свою музыку.
Вы всегда можете добавить, изменить или опровергнуть информацию, размещенную здесь.
Главная    Полезные материалы    Программы для создания музыки    Учебники    Радио    Карта сайта
создание музыки основы создания музыки звуковая карта для создания музыки программа для создания музыки программа создания музыки на компьютере правила создания музыки сэмплы скачать бесплатные сэмплы скачать бесплатно программу создания музыки fl studio fruity loops виртуальное создание музыки VST плагины vst плагины скачать бесплатно уроки по созданию музыки скачать программу для создания музыки создание музыки скачать бесплатно создание музыки бесплатно создание электронной музыки создание электронной музыки на компьютере создание музыки на компьютере бесплатные программы для создания музыки бесплатные сэмплы создание транс музыки легкие программы для создания музыки синтезаторы для создания музыки создание музыки для новичков cubase создание музыки на компьютере обучение бесплатные VST плагины скачать создание музыки русская программа для создания музыки