Техника и технологии первичной обработки сигналов

⌛ 2019 год
👀 1859 просмотров
📌 1818 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Техника и технологии первичной обработки сигналов», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Техника и технологии первичной обработки сигналов», Word формат

Техника и технологии первичной обработки сигналов Курс лекций Новосибирск 2019 ОГЛАВЛЕНИЕ 1. АУДИОСИГНАЛЫ, ИХ ПАРАМЕТРЫ И ХАРАКТЕРИСТИКИ ................ 5 1.1 Аудиосигнал как случайный процесс ..................................................... 8 1.2 Законы распределения мгновенных значений и уровней звуковых сигналов ......................................................................................................... 11 1.3 Распределение выбросов и пауз аудиосигналов .................................. 13 1.4 Текущая, среднеминутная и долговременная мощности аудиосигналов ............................................................................................... 16 1.5 Спектральная плотность мощности ...................................................... 18 2. УСТРОЙСТВА ФОРМИРОВАНИЯ И ОБРАБОТКИ ЗВУКОВЫХ СИГНАЛОВ ........................................................................................................... 21 2.1 Классификация видов обработки (в зависимости от изменяемого параметра сигнала) ........................................................................................ 21 2.2 Динамическая обработка сигналов ....................................................... 22 2.3 Компандирование звуковых сигналов .................................................. 31 2.4 Комбинированные автоматические регуляторы .................................. 39 2.5 Влияние работы авторегуляторов на свойства звуковых сигналов ... 42 2.6 Частотная обработка сигналов............................................................... 49 2.7 Временная обработка звуковых сигналов ............................................ 71 2.8 Устройства звуковых эффектов (УЗЭ) ................................................ 80 3. СИСТЕМЫ ШУМОПОДАВЛЕНИЯ В УСТРОЙСТВАХ ЗВУКОЗАПИСИ95 3.1 Шумоподавление в устройствах звукозаписи...................................... 98 3.2 Устройство оптимального компандирования при магнитной звукозаписи .................................................................................................. 124 3.3 Способ записи на магнитную ленту со снижением искажений и расширением динамического диапазона .................................................. 125 4. ИЗМЕРЕНИЯ И КОНТРОЛЬ ПАРАМЕТРОВ АУДИОТРАКТОВ ........... 129 4.1 Измерители уровня звуковых сигналов .............................................. 129 4.2 Методика измерения основных параметров аудиотрактов .............. 136 4.2.1 Измерение неравномерности АЧХ............................................. 136 4.2.2 Измерение нелинейных искажений ........................................... 137 4.2.3 Измерение взвешенного шума.................................................... 139 4.2.4 Измерение защищенности от внятных переходных помех ..... 140 2 4.2.5 Измерение разности уровней на выходах каналов Л и П, образующих стереопару ....................................................................... 141 4.2.6 Измерение разности фаз в каналах Л и П, образующих стереопару .............................................................................................. 141 4.2.7 Оценка защищенности от продуктов перекрестной модуляции142 4.2.8 Контроль стереосигналов ............................................................ 143 5. ЦИФРОВОЕ ПРЕДСТАВЛЕНИЕ АУДИОСИГНАЛОВ ............................ 146 5.1 Дискретизация ....................................................................................... 146 5.2 Цифро-аналоговое преобразование звукового сигнала с передискретизацией .................................................................................... 154 5.3 Квантование ........................................................................................... 162 5.4 Кодирование .......................................................................................... 172 5.5 Компрессия цифрового звука или редукция аудиоданных .............. 179 6. СИСТЕМЫ ЗВУКОПЕРЕДАЧИ ................................................................... 190 6.1 Признаки качества звучания ................................................................ 190 6.2 Назначение и классификация системы звукопередачи ..................... 191 6.3 Одноканальные звуковые системы передачи .................................... 192 6.4 Двухканальные системы звукопередачи ............................................ 196 6.4.1 Обычная стереофоническая система ........................................ 196 6.4.2 Микрофонные системы ............................................................... 197 6.4.3 Локализация кажущегося источника звука ............................... 200 6.4.4 Локализация кажущегося источника звука в закрытом помещении ............................................................................................. 203 6.4.5 Методы расчета локализации кажущегося источника звука .. 203 6.4.6 Системы воспроизведения .......................................................... 205 6.4.7 Стереоамбиофонические системы звукопередачи ................... 209 6.4.8 Квазистереоамбиофонические системы .................................... 210 7. ПРОГРАММНЫЕ СРЕДСТВА ДЛЯ ОБРАБОТКИ ЦИФРОВОГО АУДИОСИГНАЛА ............................................................................................. 213 7.1 Классификация аудиоредакторов ........................................................ 213 7.2 Adobe Audition ....................................................................................... 218 7.2.1 Основные элементы интерфейса программы ........................... 218 7.2.2 Работа с аудиофайлами ............................................................... 224 7.2.3 Частотный (спектральный) анализ ............................................. 228 3 7.2.4 Создание эффектов ...................................................................... 231 4 1. АУДИОСИГНАЛЫ, ИХ ПАРАМЕТРЫ И ХАРАКТЕРИСТИКИ Качество звучания аудиоаппаратуры и программ звукового вещания оценивают по слуховому восприятию. Поэтому технические требования, предъявляемые к аппаратуре и каналу, определяют путем исследования закономерностей, связывающих субъективное ощущение звука с объективными, физическими характеристиками звука. Высота тона. Ощущение высоты тона связано с частотой звуковых колебаний. Постепенное увеличение частоты в области слышимых звуков от 20 до 20000 Гц вызывает изменение высоты тона от самого низкого (басового) до наиболее высокого. Изменение высоты тона на октаву соответствует изменению частоты вдвое. Слышимые звуки занимают диапазон приблизительно в 10 октав. В музыке используют сигналы, начиная с полутона. Полутон равен 1/12 октавы и соответствует изменению частоты в 1,054 раза (на 5,4%). Громкость звука. Ощущение громкости звука связано с амплитудой звукового колебания. Кроме амплитуды, громкость зависит от: - частоты колебания; - длительности воздействия звука; - чувствительности слуха к восприятию звуков разных частот. Чувствительность слуха максимальна в области частот от 500 до 5000 Гц. При длительном воздействии тона громкость несколько уменьшается. В соответствии с психофизиологическим законом Вебера-Фехнера громкость находится не в прямой, а примерно в логарифмической зависимости от амплитуды сигнала. Это обусловило введение логарифмических шкал. Понятие электрического уровня (в децибелах) вводят соотношением: N  10 lg P2 , P1 где Р1 и Р2 – сравниваемые значения электрической мощности. Это выражение можно заменить как N  20 lg U2 . U1 Если Р1 и Р2 , U1 и U2 – произвольные величины, то уровни называют относительными электрическими. Если нуль шкалы электрических уровней соответствует мощности Р0 = 1 мВт, то определенные таким образом уровни называют абсолютными электрическими. Приняв сопротивление нагрузки равным 600 Ом, получим значение напряжения, соответствующее нулю шкалы абсолютных 3 электрических уровней, U 0  10  600  0, 755 В . 5 Абсолютный электрический уровень в децибелах Na  10lg P U  20lg . P0 U0 Величины мощности бывают больше и меньше Р0. Поэтому абсолютные электрические уровни бывают положительными и отрицательными. Динамический диапазон аудиосигнала. Для определения понятия динамического диапазона необходимо ввести понятие квазимаксимального и квазиминимального напряжений. Квазимаксимальным (Uкв.макс) будем называть такое значение, вероятность превышения которого достаточно мала 0,01…0,02 (P(U  Uкв.макс) ≤ 0,010,02), а квазиминимальным (Uкв.мин) – такое, вероятность превышения которого, наоборот, достаточно велика 0,98…0,99 (P(U  Uкв.мин)  0,980,99). Тогда динамический диапазон электрического аудиосигнала Dc  20lg U кв.макс U U  20lg кв.макс  20lg кв.мин , U кв.мин U0 U0 где U0 = 0,775 В (напряжение на R = 600 Ом, на котором выделена мощность 1 мВт). Динамический диапазон различных видов аудиосигналов составляет от 25 дБ для речи диктора, до 118 дБ – для рок-музыки. Пик-фактор. Разность между квазимаксимальным (Nкв.макс) и усредненным (Nср) за длительный промежуток уровнями называют пикфактором: П  Nкв.макс  Nср Пик-фактор показывает, насколько ниже средний уровень по сравнению с его квазимаксимальным значением. Для музыкальных сигналов он может достигать 20 дБ и более, а для речевого сигнала в среднем составляет 12 дБ. Кроме динамического диапазона сигнала необходимо знать динамический диапазон канала передачи или тракта аппаратуры Dк: Dк  20 lg U ном  N1  N 2 . Uш Dк зависит от уровня шумов (Uш) в тракте и от номинального напряжения (Uном). N1 – уровень перекрытия помех и шумов, дБ (обычно около 20 дБ). N2 – допуск на перегрузку (3…6 дБ). Для неискаженной звукопередачи необходимо, чтобы Dк  Dс. В противном случае приходится сжимать Dс (обработка сигнала). Аудиосигнал, соответствующий речи или музыке, и передаваемый по цепям звукозаписывающей и звуковоспроизводящей аппаратуры, а также по цепям систем звукового и телевизионного вещания, представляет собой электрический сигнал, изменяющийся случайным образом. Т.е. это 6 случайный процесс, электрические величины которого непрерывно изменяются во времени. Если принять, что распределение уровней электрического аудиосигнала во времени подчиняется закону Гаусса, то отношение средней мощности (Р ср) сигнала к квазимаксимальной (Ркв.макс) можно найти из выражения: где Zмакс = (Nкв.макс /) = 2,05; (для вероятности 0,02); Zмин = (Nкв.мин /) = -2,05; (для вероятности 0,98);  – среднеквадратическое отклонение; (x) – значение интеграла вероятностей. Из выражения следует, что отношение Рср /Ркв.макс зависит только от значения Dс и от заданных вероятностей превышения квазимаксимального (Nкв.макс) и квазиминимального (Nкв.мин) уровней, определяющих нормированные отклонения Zмакс и Zмин. Рисунок 1.1 – Отношение Рср /Ркв.макс Зависимость изменения уровней мощности аудиосигналов от динамического диапазона Рср/Ркв.макс = f(Dс), полученная с помощью выше приведенного выражения, изображена на рисунке 1.1. Для Dс = 20…40 дБ, Рср/Ркв.макс изменяется в пределах 0,053…0,155, т.е. существенно меньше 1. При увеличении Dс это отношение еще меньше. Столь малое отношение средней мощности к максимальной свидетельствует о том, что режим номинальной мощности достигается лишь в течение незначительной части общего времени передачи. Это следует учитывать при разработке аппаратуры. 7 1.1 Аудиосигнал как случайный процесс Аудиосигналом называется колебание, соответствующее речи, музыке или другим звучаниям в диапазоне звуковых (слышимых) частот. Звуковое колебание, передаваемое по различным цепям (звукозаписи, звуковоспроизведения, обработки сигнала, трактам ЗВ и ТВ вещания) представляет собой электрический сигнал. Электрический аудиосигнал является случайным процессом. Графически он может быть изображен совокупностью реализаций (отрезков) случайных функций. Если каждая из них есть изменяющее во времени t напряжение U за определенный интервал наблюдения ТИН, то зависимость U(t) принято называть кривой изменения мгновенных значений аудиосигнала во времени (рисунок 1.2, а). Уровень аудиосигнала характеризует сигнал в определенный текущий момент времени и представляет собой выраженное в децибелах выпрямленное и усредненное за некоторый предшествующий промежуток времени напряжение сигнала U (t1 ) (черта сверху означает операцию усреднения во времени, t1 – момент времени), отнесенное к некоторой U  t1   .  U 0  условной величине U0, т.е. N Э  t1   20 lg  Здесь NЭ(t1) – уровень электрического звукового сигнала в момент времени t1. Аналогично можно определить уровень NЭ (t2) в момент времени t2 и т.д. Теоретически наиболее просто усреднять мгновенное значение выпрямленного напряжения с постоянным весовым коэффициентом. Математически эту операцию можно записать (для момента t1): 1 t1 U (t1)   |U (t )|dt . T t1 T Это выражение даст среднее за время Т значение модуля функции U(t), причем всем выпрямленным значениям U(t) приписывается один и тот же относительный вес, равный dt/T в интервале t1 – T…t1 (T – интервал усреднения) и нулю вне этого интервала (штрих линия на рисунке 1.2, б). Точно также можно найти U  t2  и т.д. Т.к. аудиосигнал является нестационарным случайным процессом, то полученные значения U  t1 ,U  t2 ,...,U  tn  окажутся разными, и мы получим зависимость изменения во времени среднего значения выпрямленного напряжения (рисунок 1.2, в). Форма этой зависимости определяется особенностями самого сигнала и внутренним интервалом усреднения. При Т→0 зависимость U  t  и U совпадают. U  t  тем меньше меняется во времени, чем больше Т. 8 Рисунок 1.2 – К понятию электрический аудиосигнал 9 Если существует минимальный интервал усреднения Т = Т0 , при достижении которого среднее значение выпрямленного сигнала не зависит от времени, т.е. если при ТТ0 выполняется U (t1)  U (t2 )  ...  U (tn ) то такой сигнал называется стационарным, а значение Т0 – его интервалом стационарности. По своей структуре аудиосигналы являются нестационарными случайными процессами. Иногда условие выполняется, но интервал Т0 составляет 2…3 мин., причем значение Т0 для речевых сигналов меньше, чем для музыкальных. Слуховое ощущение в каждый момент текущего времени (например, t 1) определяется не только примерными значениями сигнала в этот момент, но и более ранними его значениями. Последние оказывают тем меньшее влияние, чем больше они удалены в прошлое от текущего момента времени. Поэтому при определении уровня сигнала усреднение его выпрямленных мгновенных значений следует выполнять с переменным множителем веса, убывающим в направлении прошедшего времени. Подходящим приближением является весовая функция вида 1 T  t t  при t ≤ t1 ,   T   (t1  t )  exp  1 где  (t1 – t) = 0 при t t1; Т – время, характеризующее длительность «памяти» системы. При таком способе усреднения для момента времени t 1 среднее значение выпрямленного сигнала t1 U (t1 )    (t1 t )|U (t )|dt .  Взвешивание выпрямленных мгновенных значений аудиосигнала посредством весовой функции  (t1 – t) для момента времени t1 показано на рисунке 1.2, г. Изменяющееся во времени выпрямленное напряжение, усредненное за определенный промежуток времени с заданным множителем веса  (t1 – t) и выраженное в децибелах, называется динамическим уровнем аудиосигнала Nд(t), т.е. U (t )  , N д (t )  20 lg    U0  где t – текущее время. Записи динамических уровней называются уровнеграммами в отличие от записи временных зависимостей мгновенных значений. Значение уровня зависит: - от мгновенных значений сигнала; 10 - от временнóй зависимости множителя веса; - от длительности «памяти» Т измерительного устройства. 1.2 Законы распределения мгновенных значений и уровней звуковых сигналов Законы распределения p(x) (одномерная функция распределения) и W(x) (плотность вероятности) являются устойчивыми, если длительность реализации (выборки) превышает интервал стационарности T0 . Аудиосигнал в строгом понимании нестационарен. Речевой сигнал можно рассматривать как квазистационарный случайный процесс при интервале наблюдения (длительности анализа) Т ИН, превышающем 2…3 мин. Для музыкальных сигналов интервал стационарности T0 установить не удается. Для получения устойчивых законов распределения аудиосигналов разных жанров нужно увеличить время анализа (ТИН) до нескольких часов. Законы распределения p(x) и W(x), полученные для музыкальных сигналов даже при большом времени анализа, значительно зависят от исследуемого отрывка сигнала. На рисунке 1.3 приведены типичные экспериментальные результаты [1], полученные для речевого (рисунок 1.3, а) и музыкальных (рисунок 1.3, б) сигналов. По оси ординат отложено произведение плотности W(x) и среднеквадратического отклонения (т.е. W(x)·); по оси абсцисс – отношение его мгновенных значений x (например, напряжения) к . Последняя характеризует рассеяние значений случайных величин x около ее математического ожидания. Речевой сигнал имеет устойчивое распределение плотности вероятности мгновенных значений напряжения, симметричное по форме, одновершинное, подчиняющееся экспоненциальному закону. Рисунок 1.3 – Законы распределения p(x) и W(x) 11 Речевой сигнал имеет устойчивое распределение плотности вероятности мгновенных значений напряжения, симметричное по форме, одновершинное, подчиняющееся экспоненциальному закону. Для музыкальных сигналов разным типам звучаний (вокал, эстрадная музыка, симфоническая музыка) соответствуют сходные по форме зависимости (область 1, рисунок 1.3, б). Все они за редким исключением (кривая 2) имеют также экспоненциальный характер. Аппроксимация зависимостей (рисунок 1.3, кривая 1)  2 | x|   2 | x|  A B   , W ( x)  exp   exp      2 1   1  2 2  2  где x – мгновенное значение напряжения сигнала; 1, 2 – среднеквадратические отклонения; А и В – параметры распределения, причем А + В = 1. Параметры А, В, 1 и 2 изменяются в зависимости от характера исполняемого произведения (таблица 1). Таблица 1. Вид произведения Речь Симфоническая музыка А 0,57 0,65 В 0,43 0,35 1 1,3 1,2 2 0,26 0,23 Для сигналов типа хора с оркестром, эстрадных композиций, джазовой музыки наблюдается приближение к гауссовскому закону распределения.  x2  1 W ( x)  exp  2  .  2  2    Результаты экспериментальных исследований позволили вывести обобщенный закон распределения мгновенных значений музыкальных сигналов:    | x| q  q W ( x)  exp    , 1q2 1      2  q Здесь q – параметр, определяющий степень экспоненты симфоническая музыка; q = 2 – эстрадная и джазовая музыка). 1  1  2  3    :  – коэффициент;   q   q  Г – гамма-функция. 12 (q = 1 – Распределение уровней аудиосигналов во времени. Это распределение зависит от: - вида сигнала; - длительности времени анализа; - выбранной весовой функции усредняющего устройства При относительно малой длительности памяти Т эти зависимости уже были рассмотрены. Увеличение Т вызывает приближение закона распределения уровня к гауссовскому. На рисунке 1.4 приведена функция распределения уровней во времени, полученная экспериментально [1], при исследовании записанных на магнитной ленте музыкальных и речевых отрывков сигнала. Взвешивание мгновенных значений напряжения производилось посредством весовой функции  (t1 – t) при Т25мс. Отличие этой зависимости от гауссовской наблюдается лишь в области малых уровней, отличающихся от номинального значения (N=0 дБ) более чем на 35 дБ. Поэтому можно считать, что распределение уровней подчиняется гауссовскому закону.  N a  1 N P( N )  dN  exp 2  2     2  с параметрами а = -24 дБ;  = 10 дБ. Рисунок 1.4 – Функция распределения уровней во времени 1.3 Распределение выбросов и пауз аудиосигналов Выбросы. Зная функцию распределения уровней во времени можно получить представление об общем времени , в течение которого достигается или превышается то или иное значение уровня (рисунок 1.5). Однако нельзя определить, из какого числа отрезков это время складывается, и какие они по длительности. Это имеет большое практическое значение для аппаратуры: - усилителей (при выборе режима работы ламп или транзисторов большой мощности); 13 - ручных и автоматических регуляторов уровня. Рисунок 1.5 – Уровни аудиосигналов Экспериментальные данные [1], оценивающие с вероятностной точки зрения длительность непрерывного существования разных уровней для речевого и музыкальных сигналов, показаны на рисунке 1.6. Рисунок 1.6 – Экспериментальные данные для W() Nан./Nкв.макс= 0,98 – уровень анализа выбросов по отношению к квазимаксимальному. Под выбросом понимается уровень сигнала, превышающий заданный уровень Nанализа. Длительность выборки для речевого сигнала больше 3 минут. Для музыкальных сигналов обобщенные сведения для 4-х жанров, длительность каждого из отрывков не менее 2-х минут. W() – плотность вероятности длительности непрерывного существования (превышения) уровней, превышающих заданное значение Nан. (уровень анализа) в долях квазимаксимального значения Nкв.макс. По оси 14 абсцисс отложена длительность выброса , мс. За максимальный уровень анализа Nан. Принят наибольший уровень, полученный прибором со временем интеграции tи=10 мс и временем возврата tв=1,3 с. Диапазон изменения длительностей непрерывного существования уровней (выбросов) очень широк. Например, максимальная длительность выбросов, зафиксированная при уровне анализа, равном 5% от максимального значения, составляет для речевого сигнала примерно 1 с, для музыкального – до 4 с. Минимальное значение  не превышает единиц миллисекунд. Наибольшее значение W() независимо от жанра и Nан. наблюдалось для выбросов длительностью 12…17 мс. Хорошей аппроксимацией среднестатистических зависимостей W() при 0≤100 мс является гамма-распределение вида W ( )   где   ,  exp   2    – длительность выброса, с;  – параметр, определяемый отношением Nан./Nкв.макс; Nкв.макс – квазимаксимальный уровень (Рпревышен.=0,02);  – параметр, зависящий от Nан. и определяемый из условия   W ( )d 1  Таблица 2 – Пример значения параметров  и  Nан./Nкв.макс 0,2 0,0242  0,66  0,8 0,0195 0,73 Пользуясь выражением для W(), можно оценить вероятность Р() превышения длительностью выброса некоторого заданного значения .  P( )  1      . exp   d 2   Так расчет для  =10 мс и Nан./Nкв.макс=0,2 дает значение Р() = 0,6. Расчеты показывают, что вероятность существования уровней, близких к Nкв.макс, для 20 мс достаточно мала. Общее время существования уровней, близких к квазимаксимальным в основном складывается из кратковременных промежутков. Паузы. Под паузами понимается длительность выбросов, лежащих ниже определенного фиксированного уровня анализа (обычно Nкв.мин), превышающего на некоторое значение уровень помех. Хорошей аппроксимацией закона распределения длительностей пауз активной речи (художественное чтение, речь без подготовительного текста) является выражение: 15   t t  W (tn )   n 0      1   t t    exp  n 0   ,      0 – параметр масштаба; 0 – параметр формы; t0 – характеризует центр распределения (t0  tn); tn - длительность паузы. По данным эксперимента t0 = 0,2 с,  = 0,7, а  = 0,5 для группы студентов и  = 0,25 для группы общественных деятелей. Средние длительности пауз для этих групп 0,4 и 0,71 с. Плотность вероятности распределения пауз по длительности оказывается наибольшей в интервале 50…150 мс. Среднее время длительности пауз для активной речи существенно выше, чем для пассивной (чтение заранее подготовленного текста информационного характера), и составляет 55% от общего времени передачи (для студентов) и 47,5% для писателей и общественных деятелей. где 1.4 Текущая, среднеминутная и долговременная мощности аудиосигналов Пусть U() есть изменения во времени мгновенных значений звукового сигнала. Тогда его текущая мощность:  t   2 1 t P(t )   exp  U ( )d , T   T  где 1 t  – весовая функция, приписывающая более ранним значениям exp  T T сигнала тем меньший относительный вес, чем дальше они удалены в прошлое, равная 0 при   t; Т – длительность «памяти»; t – текущее время. Очевидно, что если P(t) – случайная функция, то можно говорить о плотности вероятности W(P) распределения текущей мощности во времени. Хорошей аппроксимацией закона распределения значений текущей мощности во времени являются выражения [1]: для речи – W ( P)  0,39 exp(P / P)  0,25 exp(5,7P / P) ; и для музыкальных сигналов – W ( P)  0,24 exp(P / P)  0,17 exp(4P / P) . Здесь P – среднее значение текущей мощности (т.е. математическое ожидание Р). Эти зависимости соответствуют экспериментальным данным. Установлено, что для большинства жанров звуковых сигналов наиболее вероятные значения текущей мощности лежат на 3дБ ниже долговременной средней мощности (исключение: эстрадная музыка и хор с оркестром, где   16 отклонение в обе стороны равновероятны). Поэтому при предварительной установке регуляторов уровня следует ориентироваться на значение P . Уровень среднеминутной мощности определяется отношением 2  U ср   Pср.мин  .мин  ,    10 lg N ср.мин  10 lg 2  P   U sin      где Usin – эффективное значение синусоидального напряжения (f=1000 Гц), равное Uкв.макс (Pпревыш.=0,02); Uср.мин – среднее значение напряжения за время анализа (Тан), равное 1 мин. Значения Nср.мин, полученные для большого числа разных по содержанию отрывков звуковых сигналов одноминутной длительности, образуют совокупность случайных чисел. Для них можно построить закон распределения среднеминутной мощности. На рисунке 1.7 представлено распределение уровней среднеминутной мощности звуковых сигналов программы «Радио России» [1]. По оси абсцисс отложен уровень среднеминутной мощности, вычисленный по отношению к мощности синусоидального сигнала, напряжение которого выбрано равным значению квазимаксимального напряжения, по оси ординат – вероятность превышения этих уровней. Это распределение аппроксимируется с достаточной для практики точностью законом Рэлея  N ср2 .мин   P( N ср.мин ) 1  exp  2  2    где  – параметр закона распределения. Рисунок 1.7 – Аппроксимация распределения среднеминутной мощности 17 Уровнем долговременной средней мощности называется выраженное в децибелах отношение мощности звукового сигнала, полученной в результате усреднения всех ее значений (например, Nср.мин) за все время передачи (например, вещательной программы в течение суток), к Ркв.макс. 1.5 Спектральная плотность мощности Если отрывок звукового сигнала пропустить через набор звуковых фильтров, охватывающих весь диапазон слышимых частот, то можно измерить для него плотности вероятности текущей мощности Wi(Pi) как в выделенных узких полосах Fi, так и в широкой (полной) F полосе W(P). Имея совокупность таких экспериментальных зависимостей W1(P1), W2(P2),…, Wn(Pn) и W(P), можно определить значения текущей мощности P1, P2,…, Pn, P, вероятность превышения которых составляет наперед заданное значение. Если последнее принять равным 0,02, то полученная совокупность значений P  Ni  10 lg i  P будет представлять собой распределение максимальных уровней текущей мощности для совокупности выделенных полос. Если же значение вероятности принять равным 0,5, то получим распределение средних значений уровней текущей мощности исследуемого отрывка сигнала. Если найденные значения Ni отнести к ширине выделенной полосы частот Fi, а далее, как и ранее, взять отношение  F Pi  , Ni'  10 lg    F  i P то определим уровень спектральной плотности максимальной (средней) мощности или распределение соответствующих уровней (максимальных, средних) по частоте для исследуемого отрывка сигнала. Спектральная плотность мощности показывает распределение уровней (максимальных или средних) по частоте для исследуемого отрывка сигнала. При определении распределения максимальных уровней вероятность их превышения берется 0,02, а при определении распределения средних уровней – 0,5. На рисунке 1.8 показаны среднестатистический суточный график спектральной плотности мощности одной из программ звукового вещания, полученный с учетом распределения программ разных жанров по длительности. Уровень спектральной плотности мощности уменьшается на низких (ниже 70 Гц) и верхних (выше 3000 Гц) частотах. 0 дБ соответствует значению максимальной спектральной плотности мощности, достигаемой в сигналах программы. 18 Рисунок 1.8 – Спектральная плотность мощности аудиосигнала Каждый отрезок аудиосигнала, даже достаточно большой длительности и соответствующий одному и тому же виду звучания, обладает своим индивидуальным спектром максимальных и средних значений мощности, своим распределением спектральной плотности мощности. Кроме того, применение необычных способов инструментовки произведения, характерное для современной музыки, а также электронных методов преобразования спектров сигналов и синтезаторов привело к расширению спектров сигналов. Психоакустические эксперименты показывают, что для высококачественной передачи музыки канал должен иметь полосу частот 30…15000 Гц. При этом отсутствие более высоких частот все же отчетливо замечается молодыми слушателями, музыкантами и, по их мнению, ухудшает качество восприятия. В студийной аппаратуре необходима полоса 20…20000 Гц. На рисунке 1.9 приведен диапазон спектров музыкальных сигналов. Рисунок 1.9 – Диапазон спектров музыкальных сигналов 19 ВОПРОСЫ К РАЗДЕЛУ 1 Что такое высота тона? Понятие динамического диапазона аудиосигнала. Понятие пик-фактора. Понятие уровня аудиосигнала. Вид распределения мгновенных значений аудиосигнала. Законы распределения уровней звуковых сигналов. Вид распределения плотности вероятности мгновенных значений напряжения речевого сигнала. 8. Понятие текущей, среднеминутная и долговременная мощности аудиосигналов. 9. Понятие долговременной мощности аудиосигналов. 10. Диапазон спектров музыкальных сигналов. 1. 2. 3. 4. 5. 6. 7. 20 2. УСТРОЙСТВА ФОРМИРОВАНИЯ И ОБРАБОТКИ ЗВУКОВЫХ СИГНАЛОВ Такие устройства предназначены для приведения технических и творческих параметров звуковых сигналов к некоторой форме, пригодной для решения технических и творческих задач. Под обработкой звуковых сигналов понимается целенаправленное воздействие на звуковой сигнал, при котором достигается требуемое изменение исходной звуковой информации. При этом изменению подвергаются все характеристики ЗС – спектральные, динамические, временные и структурные. При обработке ЗС могут решаться как чисто технические, так и художественные задачи. К техническим относятся задачи такого изменения звуковой информации, при котором достигается наилучшее техническое качество звучания программ в процессе записи, воспроизведения и передачи ЗС. Это – коррекция искажений, подавление шумов, согласование динамического диапазона ЗС с диапазоном пропускания звукового канала. Задачей художественной обработки является изменение характера звучания музыки и речи. Сюда относятся изменение спектра и его динамики, подбор оптимального соотношения между ЗС при их суммировании, изменение структуры и временных характеристик сигнала (длительности звучания, тональности), а также синтезирование, формирование и наложение специальных ЗС (реверберационного спектра, музыкальных созвучий, искусственных сигналов шумового и природного характеров), частотная модуляция, модуляция фазы, стереофоническая обработка с изменением ширины и глубины стереопанорамы, направление на кажущийся источник звука. Для художественных (в т.ч. и музыкальных) сигналов главной задачей обработки является обеспечение общего высокого качества. Для речевых сигналов – обеспечение разборчивости речи. 2.1 Классификация видов обработки (в зависимости от изменяемого параметра сигнала) 1. Динамическая обработка или по уровню сигнала. 2. Частотная обработка или по спектру сигнала. 3. Временная обработка. 4. Шумоподавление и спецэффекты. Все виды обработки можно разделить на линейные и нелинейные. Нелинейная обработка вносит в спектр сигнала составляющие, которых ранее там не было. Линейная обработка изменяет только какие-либо параметры входного сигнала, но не вносит новых частотных составляющих. 21 2.2 Динамическая обработка сигналов Под динамической обработкой сигналов понимают обработку, связанную с изменением динамического диапазона сигналов. Динамическая обработка осуществляется ручными и автоматическими регуляторами уровня. Ручные регуляторы используются для сжатия динамического диапазона сигналов звукорежиссерами. Однако время реакции звукорежиссера не менее 2 с, что приводит к погрешности в поддержании максимальных уровней музыкальных программ до  4 дБ относительно номинального уровня. Поэтому создано большое число различных устройств автоматической обработки уровней сигналов – авторегуляторов уровня (АРУР). Автоматические регуляторы уровня. Автоматические регуляторы уровня (АРУР) широко применяются в радиовещании и телевидении для обеспечения высокой стабильности уровней. Назначение АРУР: 1) поддержание нормированного значения квазимаксимальных уровней; 2) защита трактов записи и вещания от перегрузки (перемодуляции); 3) повышение средней мощности сигналов и разборчивости речевых передач; 4) уменьшение шумов и помех; 5) согласование динамических диапазонов сигнала и трактов вещания и записи-воспроизведения. Поэтому очень велико число типов АРУР в зависимости от назначения. Рассмотрим различные типы АРУР. Безинерционные ограничители уровня (пикосрезатель). В таких ограничителях уровня ограничению подвергаются мгновенные значения сигнала, превышающие некоторое заданное пороговое значение. При этом изменяется форма сигнала, и появляются большие нелинейные искажения. Поэтому такие ограничители не используют самостоятельно, а как дополнительные элементы (пикосрезатели), устанавливаемые в АРУР инерционного типа. Пикосрезатели не позволяют сигналу на выходе АРУР инерционного типа превышать нормированное значение сигнала более, чем на 1,5 дБ. Хотя при этом возникают нелинейные искажения, но они не ощущаются, так как длительность пиков срабатывания не превышает 1 мс. На рисунке 2.1 показан пример схемы такого ограничителя и напряжения на его выходе. Инерционные авторегуляторы. Это такие устройства, у которых изменение коэффициента передачи происходит не сразу после изменения сигнала на его входе, а с некоторым замедлением во времени. 22 Общей идеей всех АРУР инерционного типа является управление коэффициентом передачи регулятора реальным сигналом, поступающим на его вход (рисунок 2.2). Поэтому любой АРУР инерционного типа, обобщенная структурная схема которого приведена на рисунке, содержит как минимум два канала – основной и канал управления. Рисунок 2.1 – Схема ограничителя и напряжение на его выходе Рисунок 2.2 – АРУР инерционного типа В свою очередь, сигнал на вход канала управления поступает с входа или выхода устройства. В обоих случаях система регулирования является замкнутой. Для оценки инерционности АРУР введены две динамические (временные) характеристики: - срабатывания (установления); - восстановления. 23 Срабатыванием принято считать реакцию авторегулятора на увеличение уровня сигнала, а восстановлением – на его уменьшение. Время срабатывания – tср – это интервал между моментом, когда от источника начинает подаваться сигнал с уровнем на 6 дБ выше номинального значения, и моментом, когда выходной уровень уменьшится с 6 до 2 дБ по отношению к номинальному значению (рисунок 2.3). Рисунок 2.3 – Срабатывание и восстановление АРУР Время восстановления – tвос – это интервал времени между моментом, когда уровень сигнала от источника снижается с 6 дБ до номинального значения 0 дБ, и моментом, когда выходной уровень увеличивается от -6 до -2 дБ по отношению к номинальному значению. Выбор динамических параметров авторегуляторов определяется назначением конкретного типа АРУР и практическими соображениями. Например, для защиты от перегрузок теоретически tср должно быть бесконечно малым. Однако практически звуковые сигналы нарастают не мгновенно, а за 6120 мс для речи; для скрипки – 80120 мс. На слух нелинейные искажения импульсов короче 10 мс не ощущаются (свойство слуха). Поэтому для ограничителей уровня tср = 0,5…1 мс 24 Время восстановления ограничителей уровня из практических соображений tвос = 1,5 мс Ограничители уровня. Это такие инерционные АРУР, у которых коэффициент передачи остается постоянным до некоторого порогового значения входного сигнала, а затем начинает уменьшаться пропорционально увеличению уровня входного сигнала (рисунок 2.4). Рисунок 2.4 – Коэффициент передачи и амплитудная характеристика инерционного ограничителя Для ограничителей уровня нормируются диапазон ограничения D огр и степень превышения d. Dогр = Nвх.макс - Nвх.ном  20 дБ d = Nвых.макс - Nвых.ном  1 дБ Ограничитель состоит из основного канала и канала управления (рисунок 2.5). Рисунок 2.5 – Схема инерционного ограничителя 25 Основной канал включает входной и выходной усилители УЗЧ1 и УЗЧ2, а также регулируемый элемент РЭ. В канал управления входят усилитель УЗЧ3, детектор Д1, интегрирующая цепь ИЦ и усилитель постоянного тока УПТ. Пока на входе ограничителя напряжение меньше номинального значения, напряжение на выходе УЗЧ3 меньше запирающего опорного напряжения Uоп и диоды детектора закрыты. Канал управления не работает и ограничитель – в режиме усиления. Когда входное напряжение превышает номинальное значение, Uвх > Uвх.ном напряжение на выходе УЗЧ3 становится больше опорного Uоп, диоды детектора отпираются и через УПТ управляющее напряжение подается на управляющий вход регулируемого элемента РЭ. И чем больше напряжение на входе ограничителя, тем до большего напряжения заряжается конденсатор интегрирующей цепи и тем меньше становится коэффициент передачи К регулируемого элемента и всего ограничителя в целом (рисунок 2.4). С ростом входного напряжения за порогом срабатывания коэффициент передачи ограничителя начинает уменьшаться примерно по гиперболическому закону, и за счет этого напряжение на выходе ограничителя остается почти постоянным. Рисунок 2.6 – Амплитудные характеристики Автостабилизатор уровня. Предназначен для стабилизации уровней вещательных сигналов, что необходимо для выравнивания громкости звучания отдельных фрагментов. Принцип действия автостабилизатора аналогичен принципу действия ограничителя. Отличие заключается в том, что уровень номинального выходного напряжения автостабилизатора примерно на 5 дБ меньше номинального выходного уровня (Nвых.ном = 0 дБ) в то время как у ограничителя Nвых.ном = 0 дБ (рисунки 2.5, 2.6). Другие значения имеют и динамические параметры. Компрессор (сжиматель). Это устройство, коэффициент передачи которого возрастает по мере уменьшения уровня входного сигнала (рисунок 2.7). Действие компрессора приводит к: 26 - повышению средней мощности сигнала; - повышению громкости звучания обрабатываемого сигнала; - сжатию динамического диапазона сигнала. Различают речевые и музыкальные компрессоры. Рисунок 2.7 – Амплитудная характеристика компрессора В речевые компрессоры встраиваются пороговые шумоподавители для снижения шумов в паузах передачи. Параметры компрессора. 1. Диапазон сжатия или динамический диапазон по входу Dсж = Nвх.ном - Nвх.мин 2. Динамический диапазон по выходу d = Nвых.ном - Nвых.мин 3. Степень сжатия компрессора – разность динамических диапазонов по входу и выходу d = Dсж – d. Структурная схема речевого компрессора с шумоподавителем Параметры такого компрессора (см. рисунок 2.9): Dсж = N4 – N3, d = N4 - N3, d = Dсж – d Рисунок 2.8 – Структурная схема речевого компрессора с шумоподавителем 27 Для речевых компрессоров обычно время срабатывания tср = 1 мс; время восстановления tвос = 300 мс; степень сжатия d = 10 дБ. У шумоподавителей степень шумоподавления dш = N2 - N1 [дБ] Пороговые шумоподавители имеют параметры tср = 300 мс; tвос = 5 мс; dш = 1020 дБ. При отсутствии на входе компрессора полезного сигнала коэффициент передачи регулируемого элемента РЭ2 минимален, следовательно, коэффициент передачи всего устройства в целом также минимален (рисунок 2.9). Рисунок 2.9 – Амплитудная характеристика и коэффициент передачи компрессора с шумоподавителем За счет этого подавляются шумы в паузах передачи. Как только сигнал на входе превышает уровень N1 (Nвх > N1), срабатывает канал управления шумоподавителя КУШ, шумоподавитель увеличивает К до Кмакс. В результате все полезные сигналы с уровнями от N2 до N3 дополнительно усиливается (на 10 дБ). При дальнейшем росте входных сигналов от N3 до N4 срабатывает канал управления компрессора КУК, коэффициент передачи устройства начинает уменьшаться так, что при Nвх = Nвх.ном Nвых = Nвых.ном. При дальнейшем увеличении Nвх устройство переходит в режим ограничения. Музыкальные компрессоры обычно выполняют без пороговых шумоподавителей, но они позволяют оперативно изменять время восстановления (от 100 мс до 2 с) и степень сжатия сигналов (до 20 дБ). Компрессор с гистерезисным шумоподавлением. При работе речевых компрессоров даже при наличии пороговых шумоподавителей часто становится заметным дыхание дикторов. 28 Из рисунка 2.10 видно, что если порог шумоподавления N ш = -40 дБ, а уровень сигналов дыхания на входе компрессора N = -30 дБ (этот уровень не очень заметен), то на выходе компрессора он будет уже составлять N = -20 дБ, т.е. усилен на 10 дБ и сильно заметен на слух. Рисунок 2.10 – Принцип компрессии с гистерезисным шумоподавлением Для устранения этого недостатка компрессоров необходимо применять гистерезисный шумоподавитель. Принцип иллюстрируется на рисунке 2.10. Порог срабатывания шумоподавителя Nш  -30 дБ, а порог восстановления, который в обычном однопороговом шумоподавителе совпадает с порогом срабатывания, в гистерезисном (двухпороговом) шумоподавителе выбирается на 6…8 дБ ниже, т.е. примерно -38 дБ. Так как у большинства дикторов уровень дыхания не превышает -30 дБ, то эти сигналы теперь не подчеркиваются. А так как порог восстановления ниже, на уровне 38 дБ, то заметного на слух резкого ослабления реверберационных звуковых сигналов не происходит. Структурная схема компрессора с гистерезисным шумоподавителем (рисунок 2.11). ВУ – входное устройство; Аст – автостабилизатор; Ком – компрессор; РЭ ШП – регулирующий элемент шумоподавителя; ЛУ – линейный усилитель. 29 Канал управления состоит из К – компаратора; Д – детектора; ИЦ – интегрирующей цепи и двух потенциометров R1 и R2 (рисунок 2.11). Рисунок 2.11 – Структурная схема компрессора с гистерезисным шумоподавителем Гистерезисная характеристика получается в результате применения комбинированной регулировки: сигнал для восстановления шумоподавителя снимается с выхода устройства, а для срабатывания – с входа. С помощью резистора R1 можно выбирать порог срабатывания, R2 – порог восстановления шумоподавителя. Рисунок 2.12 – Амплитудная характеристика экспандера Экспандер (расширитель). Это устройство, коэффициент передачи которого уменьшается по мере уменьшения уровня входного сигнала (рисунок 2.12). Амплитудная характеристика экспандера обратна характеристике компрессора и компенсирует искажения, вносимые в сигнал компрессором. Система, состоящая из последовательно включенных компрессора и экспандера, называется компандером (рисунок 2.13) и используется для шумоподавления. 30 Рисунок 2.13 – Принцип компандирования 2.3 Компандирование звуковых сигналов Одним из способов, позволяющих наиболее полно использовать емкость С канала связи, является компандирование сигнала.  P  C  f  log 2 1 c  [бит/с],  Pш  f – передаваемая полоса f; Рс – средняя мощность сигнала; Рш – средняя мощность шумов. Смысл его в том, чтобы путем обработки увеличить среднюю мощность передаваемого сигнала. На входе канала динамический диапазон сигнала сжимается (компрессируется) до нужных пределов, а на выходе канала Dc – расширяется (экспандируется). Из рисунка 2.13 видно, что в результате сжатия минимальный уровень сигнала превосходит уровень шумов в канале. За счет этого после расширения отношение сигнал/шум, в том числе и для минимального сигнала, увеличивается. Nмин – Nш > Nмин – Nш Если поток информации источника сигнала превышает емкость канала, то часть информации теряется, что проявляется в виде искажений. Поэтому обработку сигнала, т.е. кодирование потока информации, следует проводить так, чтобы субъективное восприятие этих искажений было как можно меньше. В этих целях может использоваться фактор избыточности информации, поступающей от источника сигнала (психоакустические где 31 слуховые эффекты); тогда эффект компандирования состоит в том, что более заметные на слух искажения сигнала (шумы, фон) заменяются искажениями, воспринимаемыми на слух гораздо слабее. К последним относятся, например, переходные процессы нарастания и спада уровней сигнала. Искажения, свойственные системам компандирования: - искажения фронтов нарастания и спада уровней сигнала; - шумовая модуляция. Чем меньше емкость канала (пропускная способность) С, тем больше потери информации при передаче и, следовательно, больше искажения сигнала. На рисунке 2.14 показаны амплитудные характеристики сжимателя и расширителя. Рисунок 2.14 – Амплитудные характеристики сжимателя и расширителя. В процессе работы сжиматель вносит в сигнал искажения, которые расширитель должен скомпенсировать. Условия отсутствия нелинейных искажений в компандерной системе Поскольку в стационарном режиме при отсутствии искажений U вх.с  U вых. р , можно записать U вых. р U вх.с   U вх. р  р ,  1 1 U вых.с  с где р и с – коэффициенты расширения и сжатия. Поскольку при последовательном включении С и Р U вых.с  U вх. р , то условия отсутствия искажений в компандерной системе  c  p  1 Рассмотрим, как компандирование позволяет улучшить отношение сигнал-шум на выходе канала передачи. Воспользуемся для этого диаграммой уровней (рисунок 2.15). Пусть, например, динамический диапазон сигнала 60 дБ, а уровень шума Nш в канале передачи ниже максимально допустимого уровня сигнала (0 дБ) на 40 дБ. 32 Рисунок 2.15 – Схема и диаграммы работы компандера Следовательно, если передавать сигнал по каналу без обработки, то уровень шума в канале на 20 дБ превышает уровень слабых сигналов, и в процессе передачи они будут скрыты в шумах. Пусть в процессе передачи динамический диапазон сигнала сжимается. При с = 0,5 Dc.вых.сж = 30 дБ и сигнал в канале передаче займет шкалу уровней от 0 до -30 дБ, и минимальный его уровень окажется на 10 дБ выше уровня шума. В пункте приема расширитель восстановит исходный динамический диапазон, а уровень шума на выходе расширителя при прохождении слабых сигналов окажется на 20 дБ ниже уровня этих сигналов. Таким образом, применение компандера позволяет передать сигнал вещания по каналу, динамический диапазон которого меньше динамического диапазона самого сигнала. При этом выигрыш в отношении сигнал-шум составляет 10…13 дБ. Недостатком описанного компандера является появление на его выходе эффекта модуляции сигнала шумом. В компандере степень подавления шума определяется уровнем полезного сигнала. Максимальное шумоподавление имеет место в паузе и при слабых сигналах. При максимальных уровнях сигнала отношение сигнал-шум не меняется. Следовательно, уровень шума на выходе изменяется в такт с сигналом. При совпадении спектров сигнала и шума это обстоятельство не сказывается на восприятии, так как шум маскируется сигналом. Если же спектры не совпадают, то шум не маскируется сигналом и становится, как говорят, программно-модулированным. В частности, при передаче низкочастотных сигналов (бас) ВЧ-шум начинает изменятся по уровню в такт с этим НЧ-сигналом и поэтому оказывается особенно заметным. 33 Другим недостатком такого компандера является появление нелинейных искажений в переходных режимах (при срабатываниях и восстановлениях), вызванных несовпадением их частотных и фазовых характеристик, а также неоптимальным выбором постоянных времени цепей регулирования. Неоптимальный выбор связан с тем, что: во-первых: переходный процесс должен быть настолько коротким, чтобы при скачкообразном увеличении уровня входного сигнала не возникало выбросов, приводящих к перегрузке системы. Для выполнения этого требования постоянная времени цепи управления не должна превышать ¼ периода максимальной частоты сигнала, что при fмакс=20 кГц составляет 12,5 мкс; во-вторых: во избежание значительных нелинейных искажений НЧ составляющих сигнала скорость изменения коэффициента усиления должна быть достаточно малой и при допустимом коэффициенте нелинейных искажений 0,2% на f=20 Гц не должна быть больше 6 дБ/с. При диапазоне регулирования в 30 дБ это означает, что требуемое время восстановления составляет около 5 с. отношение времени восстановления к времени срабатывания 400000:1. Очевидно, что при таком большом отношении выбор постоянных времени подчиняется компромиссным соображениям отличным от оптимальных. Системы компандеров. 1. Аддитивная система (рисунок 2.16). Рисунок 2.16 – Аддитивная система компандера Сжатие и расширение динамического диапазона достигается благодаря тому, что на основной сигнал аддитивно накладывается дополнительный сигнал U1·H1(U1), величина которого изменяется в зависимости от основного сигнала. Реализуемые функции: 34 Y  1 H1(U1)U1, сжатие передача по каналу расширение ~ Y Y  S , ~ U 2  Y  S U 2  H 2 (U 2 ) , ~ U 2 U 2  H 2 (U 2 )  Y  S , ~ 1 U2   (Y  S ) . 1 H 2 (U 2 ) Для равенства сигналов на выходе (U2) и на входе (U1) должны быть удовлетворены следующие условия: - характеристики компрессора и экспандера должны быть идентичными, т.е. H1  H2 (и H1, H2  -1); - передача сигнала по каналу должна быть безыскаженной, т.е. ~ Y (t )  Y (t  t ) ; - должны быть ничтожны помехи S<100 мс, иначе качество звучания невысокое (теряется контрастность). Если t0 слишком велико (30 с), то возможны 38 длительные ослабления полезного сигнала (так, если после большого сигнала идут слабые, то их не будет слышно). Рисунок 2.21 – Переходные процессы в экспандере 2.4 Комбинированные автоматические регуляторы Комбинированные АРУ выполняют несколько операций регулирования. Их главное назначение – освободить звукорежиссера от выполнения чисто технических операций: поддержания постоянства квазипиковых или средних уровней, выравнивание уровней громкости речи и музыки и т.д. Тем самым внимание звукорежиссера в большей мере обращается на решение художественных задач. К комбинированным АРУ относятся: - АРУ «Норма» – автор Кузнецов Э.Б. (рисунок 2.22, 2.23); - АРИС – автоматический регулятор Исаичева; - Компэкс (компрессор-экпандер) – Великобритания; - Вокалстрессор – Великобритания. Рисунок 2.22 – АРУ «Норма» 39 АСТ – автоматический стабилизатор среднего уровня; Расш – расширитель; Огр – ограничитель; Шп – шумоподавитель; Пс – пикосрезатель (безинерционный). Рисунок 2.23 – Амплитудная характеристика АРУ «Норма» Первая и основная задача АРУ «Норма» – защита канала ЗВ от чрезмерных уровней, превышающих номинальный. Это достигается введением ограничителя максимальных уровней. Так как время срабатывания ограничителя не равно нулю (конечно), то могут возникать кратковременные выбросы уровня. Их устраняет безинерционный ограничитель – пикосрезатель. Для поддержания номинального уровня перед ограничителем включен автоматический стабилизатор уровня (АСТ). Это сделано для того, чтобы устранить погрешности регулирования уровней, допускаемые звукорежиссером и звукооператорами. Принцип действия автостабилизатора и ограничителя одинаковы, но номинальный выходной уровень АСТ на 5 дБ ниже, чем у ограничителя и динамические параметры у них разные – АСТ на речь не реагирует, а музыку ограничивает, выравнивает громкость звучания). 40 Действие АСТ приводит к выравниванию громкостей отдельных частей программы. В состав «Нормы» входит еще одно звено, условно названное расширителем (из-за участка а-б – вид характеристики, как у расширителя), которое увеличивает уровни слабых сигналов. Увеличивая уровни слабых сигналов, расширитель усиливает и помехи, имеющиеся (в отсутствии сигнала) в той части тракта, которая предшествует АРУ «Норма». Для их ослабления введен шумоподавитель. Он включен не на входе АРУ, а после ограничителя и расширителя. Это обеспечило стабильность его порога срабатывания. Важным является выбор временных (динамических) параметров: tср – времени срабатывания; tв – времени восстановления; порогов срабатывания звеньев, входящих в АРУ «Норма». Таблица 3 – Параметры звеньев АРУ «Норма» Звено АСТ РАСШ ОГР ШП tуст (или tср), с tвост , с 0,25 – 0,5 0,5 – 1,0 1–3 0,001 2 7,5 – 15 15 – 30 2–5 0,5 – 2 0,002 Порог срабатывания, дБ (относительно 0 дБ) от –5 до –20 от –33 до –38 от –42 до –44 АСТ имеет два диапазона регулирования t: tср = 0,25  0,5 с – для речевых; 0,5  1,0 с для музыкальных звучаний. Расширитель – порог выключения –18 дБ от Nвх.ном; величина подъема уровней регулируется от 0 до 12 дБ. Спад на участке с-d (выключение расширителя) происходит за 6-7 с и поэтому незаметен на слух. Существует целое семейство АРУ «Норма», содержащее несколько модификаций: «Норма ВМ» (вещательная моно); «Норма-стерео»; «Норма – ВТ» (вещательная и телевизионная); «Норма Р» (речевая); «Норма СМ» (стерео для местных радиодомов); «Норма Ц» (цифровая). Они различаются структурой и параметрами. Введению в действие такого сложного устройства, каким является АРУ «Норма», должен предшествовать тщательный подбор его динамических параметров и порогов срабатывания. Их значения зависят от области применения АРУ и характера звучания – запись, вещание, музыка, 41 художественное чтение, дикторская речь, воспроизведение старых фонограмм. Из зарубежных комбинированных АРУ заслуживает упоминания аппарат «Компэкс-2» – фирмы Аудио-Дизайн. Он содержит сжиматель, расширитель и ограничитель. При малых уровнях в нем как шумоподавитель действует расширитель, при средних – сжиматель, а при больших (U>Uном) – ограничитель максимальных уровней. На участке ограничения выходной уровень увеличивается не более чем на 1 дБ по сравнению с номинальным при возрастании входного уровня на 20 дБ. Время установления сжимателя изменяется ступенями от 0,25 мс до 25 мс, т.е. в 100 раз. Время восстановления автоматически изменяется в пределах 0,25…3,2 с в зависимости от динамического диапазона и скорости изменения уровня входного сигнала. Время установления расширителя имеет три значения: 0,02, 2 и 40 мс, время восстановления расширителя и ограничителя изменяется в тех же пределах, что и у сжимателя. Более совершенными, но и более сложными являются адаптивные АРУ. Они, как и комбинированные, решают несколько задач, причем действие тех или иных звеньев и динамические параметры регуляторов устанавливаются автоматически в зависимости от определяемых свойств сигналов ЗВ. Адаптивные АРУ являются как бы «мыслящими автоматами», анализирующими параметры сигналов ЗВ в пределах логической программы, заложенной в АРУ человеком. Адаптивные АРУ на основе действия анализаторов различных свойств сигналов как бы приспосабливаются к тому, чтобы наилучшим образом действовать при изменении интенсивностных, спектральных и временных свойств сигнала в пределах известных закономерностей. Известны адаптивные АРУ, действие которых меняется при смене речи музыкой, изменении спектра среднего уровня, соотношения между средними и квазипиковыми уровнями. От адаптивных отличают оптимальные АРУ, в которых регулирование осуществляется согласно принятому критерию качества. Однако понятие оптимальности несколько размыто, поскольку до сих пор нет строгого математического описания критерия оптимальности. 2.5 Влияние работы авторегуляторов на свойства звуковых сигналов Влияние работы компрессоров на восприятие энергетического спектра. Компрессор изменяет громкостные соотношения отдельных компонентов программ. Слух имеет неравномерную АЧХ, зависимую от громкости прослушивания. Поэтому влияние компрессора воспринимается как изменение громкости и изменение тембра. 42 При речевых дикторских передачах резкое изменение тембра может оказаться слишком заметным, неестественным и неприятным на слух. Для устранения этого используют компрессоры с фильтрами, которые имеют автоматически регулируемую АЧХ на НЧ и ВЧ. На рисунке 2.24 приведен пример АЧХ компрессора для двух значений входных уровней. Опыт эксплуатации подобных компрессоров показал, что введение частотной коррекции значительно сближает тембры звучания «сжатых» и «несжатых» сигналов. В каждый конкретный момент времени спектр сигнала сжатого компрессором с линейной (горизонтальной) АЧХ не изменяется, так как все частоты «поднимаются» на одно и то же значение. Таким образом, текущие спектры сжатого и несжатого сигналов остаются одинаковыми. Однако может проявляться слышимое изменение тембра, объясняемое свойствами слуха лучше слышать низкие частоты при большой громкости прослушивания. При этом долговременный усредненный спектр может изменяться, т.к. разные частотные составляющие, поступающие в разное время, изменяются компрессором на разное количество дБ. Рисунок 2.24 – АЧХ компрессора для двух значений входных уровней Уменьшение «С»-искажений с помощью авторегуляторов уровня. «С»-искажения или «шпук»-эффект проявляются чаще всего (при речевых передачах) на свистящих звуках «С», «Ц», «Ч» и др. Причины возникновения «С»-искажений. Большинство спектров речи и музыки имеют наибольшую плотность энергии в полосе частот от 200 до 2000 Гц и резкий спад ее при дальнейшем увеличении частоты. 43 Так как уровень шумов тракта «передатчик-приемник», «записьвоспроизведение» увеличивается с ростом частоты, то обычно для улучшения отношения сигнал-шум на передаче (в модуляторе) и при записи вводят предварительную коррекцию, поднимающую высокие частоты, а при приеме (воспроизведении) вводят фильтр с обратной (зеркальной) АЧХ к передаче. Так во все (МВ-ЧМ) УКВ передатчики была введена коррекция с постоянной времени 50 мкс. При этом уровень сигналов частоты 10 кГц усиливается по сравнению с низкими и средними частотами примерно на 10 дБ, а частоты 15 кГц – на 13,7 дБ. Выигрыш по шумам получается в связи с тем, что спектр речевого сигнала изменяется (рисунок 2.25, кривая 2). Она становится выше по отношению к уровню шумов. После коррекции в приемнике (при воспроизведении) сигнал из кривой 2 вновь преобразуется в кривую 1, а спектр шумов из прямой 3 превращается в кривую 4, т.е. уменьшается. В этом принципе уменьшения шумов заложена основная причина возникновения «С»-искажений, так как не была учтена возможность появления сигналов с другим характером спектра, а именно, с преобладанием ВЧ. Рисунок 2.25 – Спектры сигнала и шума и АЧХ трактов Свистящие сигналы имеют бимодальный характер распределения спектра, т.е. два максимума энергии. Так спектральные составляющие свистящих звуков в области ВЧ звукового диапазона (особенно в полосе 6-10 кГц), могут достигать значений уровней в области низких и средних частот и даже превосходить их. 44 При передаче таких сигналов их суммарный уровень с учетом коррекции в модуляторе (или в усилителе записи) становится больше номинального значения и в результате происходит перемодуляция передатчика (или НЧ при записи). После детектирования (воспроизведения) в спектре сигналов появляются новые разностные составляющие, находящиеся в низкочастотной части диапазона. Именно это придает звуку «С» (и ему подобным) неприятный взрывной хриплый характер. Меры борьбы с «С»-искажениями. 1. Система шумоподавления Dolby при изменении постоянной времени цепи коррекции от 50 до 25 мкс. Система должна быть и в приемниках. 2. Применение автокорректора, т.е. авторегулятора уровня с частотнозависимой обратной связью. Чем больше в исходном сигнале ВЧ составляющих, тем больший завал ВЧ осуществляет автокорректор. При спектре, близком к усредненному, автокорректор имеет линейную АЧХ. Этот принцип реализован в одной из модификаций авторегулятора «Норма». Влияние компрессоров на среднюю мощность. Понятие относительной средней мощности РОСМ – это отношение средней мощности реального звукового сигнала Р(t) к мощности гармонического сигнала номинального уровня Рном, полученное усреднением за определенный интервал времени (секунду, минуту, час и т.д.): P(t ) . P  ОСМ Pном Рассмотрим данные исследований зависимости относительного энергетического выигрыша А (прироста относительной средней мощности ОСМ) от величины сжатия и динамических параметров компрессора при обработке звуковых сигналов: - изменение времени срабатывания tср от 1 до 5 мс ОСМ сигналов остается практически постоянной; - изменение времени восстановления tв оказывает на ОСМ весьма незначительное влияние; - величина или степень сжатия (d = Dвх – Dвых) оказывает существенное влияние на ОСМ (рисунок 2.26). Улучшение соотношения громкости звучания «РЕЧЬ-МУЗЫКА». При чередовании речевых и музыкальных фрагментов, речь часто звучит намного тише музыки. Основная причина различной громкости звучания речи и музыки – это различная структура речевых и музыкальных сигналов. Речевой сигнал более импульсный. Во время речевых передач чередуются сигнал и пауза. Таким образом, речевые сигналы имеют больший пик-фактор (относительно 45 квазимаксимального уровня мощности к среднему), чем музыкальные. А от значения пик-фактора во многом зависит средняя громкость звучания передач. Рисунок 2.26 – ОСМ звуковых сигналов Сравнение уровнеграмм речевого и музыкальных фрагментов (эстрадная и симфоническая музыка) показывает, что при одинаковых квазипиковых уровнях средний уровень речи значительного ниже среднего уровня эстрадной музыки. Средние уровни речи и симфонической музыки близки (отличаются мало). Вторым фактором, влияющим на разность громкости звучания речи и музыки являются условия прослушивания (т.е. громкость прослушивания передач). Ухо по-разному воспринимает сигналы разных частот при различных уровнях громкости. При снижении уровней прослушивания в домашних условиях (особенно вечером) по сравнению со студией снижается чувствительность уха к сигналам низких частот, т.е. происходит дополнительное снижение громкости звучания речи по сравнению с музыкой. Для увеличения средней громкости речи необходимо: - применять компрессоры, которые увеличивают средний уровень речи примерно на 3 дБ (т.е. громкость увеличивается почти в 2 раза); недостатки:  искажение динамики звучания;  нарушение естественности звучания;  подчеркивание «придыхания» дикторов; - применять в дикторских микрофонных трактах специальные корректоры-фильтры оптимальной обработки речи; недостатки:  фильтр искажает тембр речи;  нарушает естественность звучания;  появление «С»-искажений; 46 - установление в выходных каналах ТФП (в вещательных пультах или пультах АЦ) авторегуляторов громкости. Влияние компрессоров на разборчивость речи. Сжатие динамического диапазона сигнала улучшает помехоустойчивость передачи, т.к. это ведет к повышению среднего значения коэффициента модуляции передатчика и средней мощности боковых полос, представляющих собой полезную излучаемую мощность, определяющую громкость приема. Например, если увеличить среднее значение коэффициента модуляции передатчика за счет компрессии с 0,2 до 0,4 (в два раза), то средняя мощность боковых полос возрастает в 4 раза. Такое «умощнение» передатчика происходит за счет улучшения его КПД (отношение мощности боковых полос к полной излучаемой мощности) при сохранении прежней максимальной мощности. На рисунке 2.27 приведена зависимость смысловой разборчивости речи на приемном конце от соотношения сигнал-помеха, получающаяся в случае предельного компрессирования сигналов (кривая 1) и без компрессии (кривая 2) (предельная компрессия – когда слабые звуки «подтягиваются» почти до уровня самых сильных; амплитудная характеристика таких компрессоров похожа на характеристику ограничителя (почти горизонтальная), причем ограничение начинается при уровнях, находящихся на 20-30 дБ ниже максимальных уровней, соответствующих громким звукам). Рисунок 2.27 – Зависимость смысловой разборчивости речи от с/ш Из графиков видно, что минимально допустимое при связи значение разборчивости 60% можно получить в случае предельной компрессии при отношении сигнал-помеха 6 дБ, в то время как при отсутствии компрессии отношение сигнал-помеха должно быть не менее 14 дБ. Таким образом, выигрыш в помехоустойчивости достигает 8 дБ. 47 Для радиовещания применять предельное компрессирование нельзя, так как при этом ухудшается качество звучания передач. Для радиовещания применяют меньшее сжатие (~ 10 дБ). При этом получается увеличение средней глубины модуляции передатчика примерно в 2 раза, несколько увеличивается разборчивость (при больших шумах) и остается высоким качество звучания речи. Влияние компрессора на слышимость «придыхания» диктора. Подчеркивание придыхания диктора, которое происходит при вдохе диктора во время пауз между предложениями, является важной технической задачей, т.к. эти сигналы становятся не просто заметными, а подчеркнутыми, неприятными на слух. Причина возникновения этого явления видна из рисунка 2.28. Рисунок 2.28 – Влияние компрессора на слышимость «придыхания» диктора Сигнал «придыхания» на входе компрессора с уровнем -30 дБ (для слушателей не заметен) за счет сжатия на выходе компрессора достигает 10 дБ. При таком уровне этот сигнал становится очень заметным, режет слух. Поэтому в речевых компрессорах с шумоподавителем порог срабатывания шумоподавителя выбирают в пределах -25…-28 дБ (уменьшаются шумы в паузах и «придыхания»). Величина сжатия выбирается d = 56 дБ. 48 Кроме того, речевые компрессоры должны иметь на входе еще одну цепь регулировки, обеспечивающую поступление на вход компрессора сигналов с нормированным уровнем. Это автостабилизатор уровня. Введение автостабилизатора способствует приближению работы авторегулятора к регулированию по громкости. Это объясняется соответствующим выбором его амплитудной характеристики и динамических параметров (рисунок 2.29). Рисунок 2.29 – Амплитудные характеристики Порог срабатывания автостабилизатора выбирается на несколько децибел ниже порога срабатывания ограничителя. Номинальный выходной уровень АСТ на 5 дБ ниже, чем номинальный выходной уровень ограничителя. Динамические параметры АСТ намного больше, чем у ограничителя: tсраб  300 мс, tвос  12 с. При таком выборе динамических параметров АСТ получаются следующие результаты регулирования уровней: - когда на вход АСТ поступают сигналы речи номинального уровня, то вследствие их малой интенсивности конденсатор интегрирующей цепи не успевает зарядиться, и на выходе АСТ сигнал превышает его установочный уровень (-5 дБ), т.е. они близки к 0 дБ; - если на вход АСТ поступает сигнал номинального уровня интенсивной музыки, то конденсатор полностью заряжается, и на выходе АСТ уровни сигналов не превышают -5 дБ; в этом и заключается идея регулирования громкости; - речевые сигналы передаются с номинальными квазипиковыми уровнями, а сигналы интенсивной музыки на 2-5 дБ меньше. 2.6 Частотная обработка сигналов Частотная или спектральная обработка звуковых сигналов осуществляется с помощью частотных корректоров в процессе передач, записей, сведения и сложного монтажа. 49 Частотные корректоры применяются звукорежиссерами для улучшения качества звучания отдельных исполнителей, получения специальных звуковых эффектов и уменьшения неравномерности АЧХ, возникшей из-за особых условий записи. - Улучшение качества звучания с помощью частотного корректора достигается, в частности, подъемом области спектра 2,5…3,5 кГц. Этим можно частично компенсировать у отдельных певцов недостаток верхней певческой форманты и тем самым улучшить «полетность» голоса, способность «прорезать» оркестр. - Влияние плохой дикции и дефектов речи неподготовленного участника передачи могут быть частично исправлены введением затухания в области НЧ, подавлением определенной области спектра режекторными фильтрами в средней части частотного диапазона или срезом высоких частот. - При записи вокально-инструментальной музыки корректоры АЧХ (особенно резонансные фильтры) позволяют подчеркнуть характерные особенности звучания инструментов, выделить их на фоне массированной оркестровки. - Необходимость в уменьшении неравномерности АЧХ возникает при музыкальном и речевом исполнении в случайных, акустически неприспособленных помещениях (там возникают нежелательные резонансы его объема, которые можно подавить). Эффективным методом использования корректоров спектральной обработки является деформация АЧХ не в прямом, а в дополнительном канале со смешиванием корректированного и некорректированного сигналов (рисунок 2.30). Рисунок 2.30 – Схемы корректоров спектральной обработки Соотношение между сигналами прямого и дополнительного каналов устанавливается регуляторами уровня (РУ). Типы частотных корректоров. 1. Фильтры подъема верхних частот. 2. Фильтры плавного подъема и спада НЧ и ВЧ. 50 3. Фильтры среза НЧ и ВЧ. 4. Фильтры присутствия («презенс»-фильтры). 5. Графические корректоры (эквалайзеры) и другие. Порядок фильтра – это число, показывающее наивысшую степень математического полинома, который аппроксимирует частотную характеристику этого фильтра. Термин “порядок фильтра” всего-навсего определяет конечную крутизну среза его АЧХ за пределами полосы пропускания (рисунок 2.31). “Одному порядку” фильтра соответствует конечная крутизна среза в 6дБ\октава. Т.е. если у вас фильтр, скажем, третьего порядка - то его конечная крутизна среза будет 6х3=18дБ/октава. Если четвертого - то 24дБ/октава, и так далее. Рисунок 2.31 – АЧХ ФНЧ Полоса пропускания рассматриваемого ФНЧ (Low-pass фильтра) - это полоса частот от самых низших (как бы от “нулевой частоты”) до той частоты, на которой коэффициент передачи фильтра уменьшится на 3дБ. Эта вторая частота (f0) называется частотой среза фильтра. (Так уж договорились “электронщики всего мира”, по умолчанию для удобства и взаимопонимания определять граничные частоты по уровню “-3дБ”.) В случае, если по какимлибо причинам бывает необходимо указать граничные частоты по другому уровню, то это всегда должно оговариваться. Если же особо не оговорено, то частота среза всегда определяется указанным выше образом. После нее коэффициент передачи фильтра более-менее равномерно уменьшается (спадает) со скоростью (крутизной), определяемой порядком фильтра. Здесь необходимо сделать небольшое пояснение. Говоря о крутизне среза АЧХ фильтра за пределами полосы пропускания, мы не зря сделали оговорку именно о конечной крутизне среза. В зависимости от типа фильтра, в окрестностях частоты среза эта величина может быть существенно иной. Для сравнения различных типов фильтров между собой на следующих рисунках приведены АЧХ фильтров Бесселя (рисунок 2.32), Баттерворта 51 (рисунок 2.33) и Чебышева (рисунок 2.34). Эти характеристики были рассчитаны для фильтров 4-го порядка с частотой среза в 1 кГц. Фильтры высоких порядков (как правило, выше второго) наиболее часто создаются путем каскадного (последовательного) соединения фильтров более низких порядков. В данном случае фильтры 4-го порядка созданы как обычно, путем последовательного соединения двух фильтровых звеньев второго порядка. Рисунок 2.32 – АЧХ фильтра Бесселя Рисунок 2.33 – АЧХ фильтра Баттерворта 52 Рисунок 2.34 – АЧХ фильтра Чебышева На этих рисунках отображены как АЧХ отдельных звеньев (пунктирные линии), так и суммарная АЧХ всего фильтра (сплошная линия). Очевидно, что фильтр Бесселя, с точки зрения именно (и только!) его фильтрующих свойств – выглядит наихудшим, а Чебышева – наилучшим. Однако - это только с этой точки зрения. Однако надо не только хорошо отфильтровать ненужное, но и максимально хорошо передать нужное. Вот с точки зрения именно передачи нужных сигналов – ситуация, что называется, “с точностью до наоборот”. АЧХ составляющих фильтры звеньев в фильтре Бесселя максимально гладкая, без выбросов. В фильтре же Чебышева имеется весьма значительный пик на АЧХ одного из звеньев. На первый взгляд, казалось бы – ну, и что тут такого? Подумаешь, выброс! Суммарная-то АЧХ, вроде, вполне приемлемая? Если бы так... Дело в том, что из-за этого пика на АЧХ при подаче на вход данного звена импульсного сигнала, или просто любого сигнала с крутым фронтом - схема начнет “звенеть”, т.е. в момент появления указанного фронта она будет сама генерировать постепенно затухающий сигнал с частотой, соответствующей положению этого пика на АЧХ звена. А ведь в исходном-то сигнале его нет! Да и просто, при подаче сигнала большой амплитуды, совпавшего по частоте с частотой этого пика, фильтр может элементарно перегрузиться и внести в сигнал тривиальнейшие искажения. Кроме этого, суммарная АЧХ фильтра Чебышева чисто принципиально всегда имеет неустранимые неравномерности (так называемые “пульсации”) в полосе пропускания. Они, конечно, могут быть несколько меньшими, чем в этом примере, но сути дела это не меняет. Фильтр же Баттерворта среди рассмотренных, наиболее распространенных в звукотехнике типов фильтров, занимает некоторое 53 промежуточное положение. Он имеет (при “прочих равных”) достаточно плоскую, без выбросов и пульсаций, АЧХ в полосе пропускания и вполне удовлетворительную крутизну среза АЧХ за пределами этой полосы. Благодаря этим своим свойствам он и получил наибольшее распространение в звуковой аппаратуре среди всех рассмотренных выше типов фильтров. На следующих рисунках показаны фазо-частотные характеристики, т.е. зависимость вносимого фильтром фазового сдвига от частоты (ФЧХ) для рассматриваемых нами фильтров - Бесселя (рисунок 2.35), Баттерворта (рисунок 2.36) и Чебышева (рисунок 2.37). Здесь видно, что ФЧХ фильтра Бесселя - самая ровная, Баттерворта – несколько менее ровная, но тем не менее сохраняющая монотонность (т.е. без изломов), Чебышевская же - и существенно неровная, и немонотонная, имеет довольно резкие изломы. Таким образом, если внимательно рассмотреть совокупность всех иллюстраций по фильтрам, то последует вывод, что фильтр с самой гладкой АЧХ - имеет и самую ровную ФЧХ, а с самой неравномерной АЧХ – будет иметь и самую плохую ФЧХ. Естественно, что это распространяется на все вообще, относящееся к фильтрам. Т.е. чем выше порядок фильтра, чем лучше его фильтрующие свойства (крутизна среза АЧХ) - тем хуже будет его ФЧХ. Рисунок 2.35 – ФЧХ фильтра Бесселя Возникает вопрос, к чему приводит неровная ФЧХ? Дело в том, что ФЧХ устройства самым непосредственным образом отображает его способность передавать форму сигналов - без изменения, с приемлемыми небольшими изменениями, или же вообще - исказив ее до полной неузнаваемости. Ведь если какая-либо цепь имеет нелинейную ФЧХ, то это значит, что различные частотные составляющие сигнала изменяются 54 (сдвигаются) по фазе по-различному, и как следствие – изменяется сама форма этого сигнала. Рисунок 2.36 – ФЧХ фильтра Баттерворта Рисунок 2.37 – ФЧХ фильтра Чебышева А в последнее время и в литературе, и в практике звукотехники все большее внимание уделяется как раз вопросам максимально точной передачи именно формы исходных сигналов – а, значит, и линейности ФЧХ. Заметим здесь, что речь идет именно о линейности ФЧХ, а не о том, чтобы она была плоской, как в случае АЧХ. Если ФЧХ – наклонная линия, но линейная, т.е. 55 прямая – то это означает, что весь сигнал всего-навсего задерживается на какой-то интервал времени, а это уже не имеет непосредственной связи с возможными его искажениями. Таким образом, различные типы фильтров – будут давать и различные результаты при их применении. И при выборе фильтра для своего конкретного применения вам необходимо в первую очередь решить, что именно будет главным? Если необходимо максимально хорошо передать сам сигнал, а качество собственно фильтрации – вторично, то необходим фильтр Бесселя. (Эта ситуация возникает, например, при конструировании акустических колонок. Ведь НЧ-излучатель по своей сути – это именно ФВЧ (Low-cut фильтр)). Если же важнейшим является именно качество фильтрации, а качество передачи самого сигнала особой роли не играет - то лучше применить фильтр Чебышева, и желательно более высокого порядка. Например - на радио, при выдаче в эфир сигнала с телефонной линии. При этом достаточно часто желательно даже применить одновременно два фильтра, ФВЧ и ФНЧ (Low-cut и High-cut). Фильтры плавного подъема и спада АЧХ. Такие фильтры позволяют звукорежиссеру изменять в широких пределах спектральные характеристики отдельных источников в области нижних и верхних частот звукового диапазона (рисунок 2.38). Рисунок 2.38 – АЧХ фильтров плавного подъема и спада Такие фильтры позволяют регулировать сигнал на крайних частотах до 20 дБ плавно или ступенями и тем самым добиваться естественного звучания при акустических дефектах студии, несовершенстве микрофонов или неудачном их расположении. С помощью таких фильтров можно подчеркнуть характерные оттенки исполнителей, изменить в значительной степени характер звучания, чтобы придать ему новизну и оригинальность. Субъективно применение любого фильтра воспринимается как изменение тембра первичного сигнала. 56 Фильтры среза (рисунок 2.39). Эти фильтры также позволяют изменить характер звучания. Можно создавать такие звуковые эффекты, как: - «разговор по телефону»; - «передача по радио»; и др. Чаще всего эти фильтры используют: - для ослабления НЧ фона (от освещения, блоков питания); - для ослабления ВЧ шума магнитной ленты; - для ослабления НЧ и ВЧ помехи при студийных записях и реставрации старых фонограмм. Рисунок 2.39 – АЧХ фильтров среза Фильтры присутствия («презенс»-фильтры). Обеспечивают эффект присутствия слушателей около исполнителя или исполнителя около слушателя. Эти фильтры позволяют подчеркнуть область средних частот, где расположены певческие и инструментальные форманты, что делает звучание певцов-солистов или отдельных инструментов более сочным и ярким, как бы выделенным из общей звуковой картины и приближенной к слушателю. Фильтры присутствия позволяют выделять относительно узкие участки спектра в диапазоне частот 700…4000 Гц при подъеме до 10 дБ (рисунок 2.40). Рисунок 2.40 – АЧХ фильтров присутствия 57 Резонансная частота фильтров выбирается с помощью переключателя. Чаще всего в качестве резонансных выбираются частоты: 0,7; 1,4; 2,0; 2,8; 4 кГц. Для подчеркивания сигнала солиста наиболее часто выделяют область частот около 2,8 кГц, так как тембральная яркость голоса определяется певческой формантой в области частот 2,8…3,2 кГц (форманта – максимальное значение спектрального распределения энергии звука). В современных пультах содержаться не только «презенс»-фильтры, но и «антипрезенс», позволяющие вырезать часть спектра (рисунок 2.41). Рисунок 2.41 – АЧХ «антипрезенс» - фильтров Графические корректоры (эквалайзеры) Эквалайзеры представляют собой совокупность полосовых фильтров, АЧХ которых приведены на рисунке 2.42. Рисунок 2.42 – АЧХ эквалайзера Усиление в каждой частотной полосе потенциометром или ступенями переключателя. 58 регулируется плавно Ручка управления потенциометра или переключателя перемещается продольно и выведена на лицевую панель графического корректора. Совокупность ручек на лицевой панели, на которой изображены сетка частот и величина введенной регулировки в децибелах, отображает установленную АЧХ. Это облегчает звукорежиссеру визуальный контроль и оценку введенной частотной коррекции (рисунок 2.43). Рисунок 2.43 – Лицевая панель графического корректора В студийной звукотехнике используются октавные, ⅔-октавные, ½-октавные и ⅓-октавные графические корректоры. В октавных ГК средняя частота каждого фильтра F0 отличается от средней частоты соседнего фильтра в 2 раза, т.е. на октаву. Вся полоса рабочих частот разбивается в октавных корректорах на 11 полос, в ⅔октавных – на 16, в ½-октавных – 20, в ⅓-октавных – на 31 полосу. Средние частоты октавного ГК: 16; 31,5; 6,3; 125; 250; 500 Гц; 1; 2; 4; 8; 16 кГц. На рисунке 2.44 представлена структурная схема ГК, в которой все фильтры включены параллельно. Рисунок 2.44 – Структурная схема параллельного ГК 59 На рисунке 2.45 показан пример последовательно-параллельного включения в ГК 16 полосовых фильтров. Рисунок 2.45 – Структурная схема последовательно-параллельного ГК Как уже говорилось, подавляющее большинство описанных выше эквалайзеров сконструировано по последовательному принципу построения. Наверняка у вас возник вопрос – а в чем разница (с точки зрения практикующего звукорежиссера) между этими двумя принципами, последовательным и параллельным? Основная, с этой точки зрения, разница – заключается в том, что эквалайзер, созданный по последовательному принципу, имеет симметричный отклик АЧХ на перемещение регулятора подъема/завала АЧХ (рисунок 2.46). Рисунок 2.46 – АЧХ эквалайзера последовательного принципа Иными словами, АЧХ регулятора, установленного на (к примеру) “+6дБ”, зеркально симметрична характеристике ослабления на “-6дБ” относительно уровня в 0дБ. Т.е. если вы на двух, последовательно 60 включенных, однотипных эквалайзерах установите: на одном из них “+6дБ”, а на другом “-6дБ” (при идентичных прочих параметрах) - то суммарная АЧХ будет линейной. В случае же с “параллельными” эквалайзерами – этого получить не удастся. Вспомним, что в таких эквалайзерах прямой сигнал – суммируется с сигналом, прошедшим сквозь полосовой фильтр. А что произойдет, если сложить или вычесть два сигнала с одинаковыми уровнями? Правильно, в первом случае - сигнал просто возрастет вдвое, т.е. на +6дБ, а вот во втором случае - уменьшится до нуля, т.е. затухание составит “минус бесконечность децибел”! Кроме этого, достаточно очевидного, факта – есть еще и другое различие. Из-за принципиально неизбежных фазовых сдвигов в цепях фильтрации сигналы после них суммируются с прямым и вычитаются из него по-разному. В силу этого – полоса частот, захватываемых регуляторами этого типа эквалайзеров, будет различна для регулировок “в плюс” и “в минус”. Причем для случая подъема АЧХ полоса частот буде шире (т.е. добротность эквалайзера - ниже), чем для завала (рисунок 2.47). Рисунок 2.47 – АЧХ “параллельного” эквалайзера Хотя, говоря реально, это скорее преимущество, чем недостаток. В самом деле, ведь на практике относительно редко возникает необходимость поднять очень уж узкий участок спектра, в то время как ослаблять – преимущественно приходится достаточно небольшие части звукового диапазона. Однако необходимость постоянно помнить о несимметричности АЧХ, и связанные с этим неудобства существенно ограничивают сферу применения этого типа эквалайзеров. А жаль, так как звук в таких эквалайзерах чисто принципиально может быть получен существенно более высокого качества, чем в последовательных. Ведь в них прямой сигнал проходит только один каскад – сумматор, благодаря чему подвергается 61 искажениям в гораздо меньшей степени, чем в обычных параметрических, где он вынужден проходить через абсолютно все цепи и каскады, имеющиеся в схеме! По своим возможностям ГК перекрывает возможности рассмотренных ранее корректоров. Рисунок 2.48 – АЧХ ПФ В некоторых, как правило дорогих моделях эквалайзеров, иногда применяются некоторые дополнительные “маленькие хитрости”, облегчающие и упрощающие работу с ними. Наиболее часто – встречается применение так называемого “принципа пропорционального Q”. Что же это такое? Если вы еще раз взглянете на рисунок 2.48, то увидите, что при расширении полосы частот, захватываемых эквалайзером, неизбежно будет увеличиваться и площадь, заключенная между кривой, обозначающей АЧХ, и осью абсцисс, т.е. возрастает мощность сигнала, попадающего в эту полосу и подвергающегося регулированию. В практическом применении это означает, что при расширении полосы регулирования – возрастает и субъективно воспринимаемая громкость звучания сигнала после эквалайзера. А это не очень-то и удобно. Вот применение принципа пропорционального Q – как раз и помогает избавиться от этого неудобства. Эквалайзеры, построенные по этому принципу, сохраняют постоянную площадь подынтегральной кривой, описанной выше, поддерживая этим постоянной субъективно воспринимаемую громкость в полосе частот, подвергающихся коррекции, и благодаря этому более удобны в работе. Осуществляется это путем уменьшения предельно-допустимой глубины регулировки тембра при расширении полосы частот, захватываемых эквалайзером. Бывают и еще некоторые отступления от канонической конструкции. Так, одной из фирм был разработан эквалайзер, у которого глубина регулировки АЧХ на крайних частотах звукового диапазона увеличивается, компенсируя этим снижение чувствительности нашего слуха на указанных частотах. По опубликованным отзывам, это тоже сильно повысило удобство работы с эквалайзером. Недостатки графического корректора: 62 - все фильтры имеют фиксированную полосу пропускания и частоту настройки; - при необходимости поднять усиление в интервале от 1000 до 5000 Гц придется манипулировать сразу несколькими движками; - взаимное влияние фильтров искажает АЧХ, нарисованную движками; - сложен и дорогостоящ в технической реализации. Параметрические эквалайзеры. Достоинства: - более гибкие; - более качественные; - меньше фильтров (обычно от 3-х до 5-и). АЧХ каждого фильтра в таком эквалайзере может изменяться в широких пределах. Регулируется: - частота настройки; - полоса пропускания фильтра; - коэффициент передачи. Например, подъем АЧХ в полосе 1000-5000 Гц в параметрическом эквалайзере можно реализовать с помощью всего одного фильтра, причем качество звука будет выше, чем в графическом эквалайзере. Недостатки: - сложнее управление; - нет наглядности. Область применения: - микшерные пульты; - в качестве микрофонных предусилителей; - в виде отдельных приборов. Часто применяют сочетание компрессора с эквалайзером и называют частотно-зависимым компрессором. Такой компрессор обрабатывает только определенную частотную полосу, а все остальное его как бы не касается. Частный случай такого компрессора – деэссер, сжимающий интервал, в котором сосредоточены основные частотные компоненты свистящих и шипящих звуков человеческой речи. Это уменьшает нежелательные «присвисты» при записи речевых программ или вокала. Несколько особняком стоит особый класс эквалайзеров, так называемых параграфических. Но не бойтесь, ничего особого нового или страшного в них нет! По своей сути – это гибрид из ПАРАметрического и ГРАФического эквалайзеров, отчего и произошло это весьма необычное название, поначалу многих повергающее в трепет. Такой эквалайзер – просто многополосный параметрический, но имеющий конструктивное исполнение части органов управления (а именно – регуляторов подъема/спада АЧХ) как у графического, в виде потенциометров с линейным перемещением их ручек (“движковых”). Благодаря своим огромным возможностям они позволяют получать практически любые требуемые вам виды АЧХ. Но из-за своей 63 сложности они весьма дороги, и в силу этого имеют относительно небольшое распространение, да и выпускаются параграфические эквалайзеры довольно ограниченным количеством фирм. В некоторых случаях (например, в кроссоверах, или дорогих пультах), в аппаратуре может быть предусмотрена возможность переключения крутизны среза фильтра, иногда – даже с возможностью переключения на выбранный вами тип фильтра, для лучшего приспособления к вашей конкретной ситуации. К сожалению, это встречается не так часто, как бы хотелось... И в заключение немного об “общих вопросах”, связанных с частотной коррекцией. Выше уже говорилось, что АЧХ и ФЧХ тесно связаны друг с другом. И относится это не только к фильтрам, как таковым, но и вообще к любым цепям передачи сигналов. Для всех минимально-фазовых цепей существует строгая взаимно-однозначная связь между АЧХ и ФЧХ. Говоря “минимально-фазовая цепь” – имеется в виду, что в этой цепи тракта нет особых звеньев, так называемых фазовращателей (не путать с кнопками для переворота фазы микрофонов!). Строго говоря, практически все электронные цепи, имеющиеся в звуковой аппаратуре, являются именно минимально-фазовыми. Исключениями являются, пожалуй, только устройства эффектов – фэйзеры. Вот они построены именно на основе фазовращателей. Что же следует из упомянутой связи между АЧХ и ФЧХ? Прежде всего то, что если вам известна АЧХ какого-либо устройства, то можно однозначно установить и его ФЧХ, и наоборот – по известной ФЧХ определить АЧХ. Т.е. если два устройства имеют строго одинаковые частотные характеристики, то они в обязательном порядке будут иметь и абсолютно идентичные фазовочастотные характеристики. И если какая-либо фирма заявляет, что ее эквалайзер “не крутит фазу” не верьте. Если, конечно, речь не идет об однополосном эквалайзере и о сдвиге фаз на основной частоте его регулирования. Вот только на однойединственной этой частоте, являющейся частотой резонанса электронной схемы, фазовый сдвиг между входным и выходным сигналом будет равен нулю. Правда, никакой заслуги разработчиков и изготовителей в этом нет, это – просто общее свойство всех резонансных цепей. Но, повторимся еще раз – только на этой частоте. Во всех других случаях – не бывает! То есть – теоретически, конечно, возможно создать подобное устройство, но для этого придется встроить в него огромное количество фазовращателей, но от прекрасного звука ничего не останется. Ведь каждый фазовращатель – это лишний активный элемент, транзистор или микросхема, а, значит, и неизбежно сопутствующее этому увеличение шумов и искажений. Не говоря уж о том, что такое устройство, скорее всего, будет физически нереализуемо. Ведь для перестройки частоты в эквалайзерах – и так, уже используются сдвоенные переменные резисторы, а если еще придется одновременно с этим изменять параметры энного количества 64 фазовращателей, то количество резисторов, сидящих на одной оси, может вообще превысить все разумные пределы! Конечно, на это можно возразить – то, что невозможно сделать в “аналоге”, возможно в “цифре”. В принципе, это верно. Но... Пожалуй, ни для кого не будет большим секретом тот довольно грустный факт, что качество чисто программных эквалайзеров, реализованных в различных компьютерных Plug-in – мягко говоря, оставляет желать лучшего. Не в последнюю очередь это связано с тем, что фактически любая программа является лишь математической моделью своего более-менее реального физического прототипа. А все частотно-избирательные цепи в звуковой аппаратуре относятся к классу так называемых IIR-фильтров, т.е. фильтров с бесконечной импульсной характеристикой (Infinite Impulse Response). Или, говоря проще, при подаче на вход любого частотноизбирательного устройства какого-либо внешнего воздействия - его выходной сигнал также будет длиться бесконечно. А как хорошо написали братья Стругацкие в известной книге – “познание бесконечности требует бесконечного количества времени”... Таким образом, чтобы строго смоделировать “в цифре” то, что “в аналоге” получается само собой, потребуется вычислитель с бесконечно большой вычислительной мощностью и с неограниченной же разрядной сеткой. А как мы все хорошо понимаем, это невозможно. Поэтому, чтобы получить реально работающие цифровые обработки - по необходимости приходится “урезать” вычислительные алгоритмы, сокращая объем вычислений до разумного минимума. Естественно, что это далеко не самым лучшим образом сказывается на главном результате, на получаемом звуке. А теперь - попробуйте себе представить, как в эти, и без того “обкромсанные” алгоритмы впихнуть еще и кучу вычислений для компенсации фазовых сдвигов. Похоже, в обозримом будущем не приходится всерьез рассчитывать на широкое и повсеместное внедрение “не крутящих фазу” эквалайзеров. Ведь сейчас хорошо звучащие цифровые эквалайзеры собираются с использованием доброго десятка (!) мощнейших DSP-процессоров типа SHAPC. И при этом они все же “крутят фазу”... Кроссоверы и контроллеры. Это – последние слаботочные устройства, находящиеся в конце звукоусилительного тракта, непосредственно перед оконечными усилителями. Различие между ними заключается, с точки зрения теории автоматического регулирования, в принципе реализации управляющего воздействия. Кроссоверы осуществляют управление по возмущению, т.е. являются устройствами с «прямым управлением», а настоящие контроллеры – по отклонению, т.е. с «обратным управлением». Рассмотрим эти два вида по отдельности. 65 Кроссовер (иногда в англоязычной литературе именуемый сокращенно х-over) – это хорошо всем известное устройство для разделения всего звукового спектра на несколько частотных полос – для того, чтобы можно было подавать низкочастотные сигналы только на НЧ-звено громкоговорителя, а высокочастотные сигналы – только на твиттеры. Тем самым, обеспечиваются условия для более качественной передачи звука, улучшаются и облегчаются условия работы громкоговорителей и оконечных усилителей мощности, уменьшаются интермодуляционные искажения в громкоговорителях и усилителях. Современные системы звукоусиления, зачастую оперирующие мощностями в десятки, а то и в сотни киловатт, имеют гораздо большее число полос разделения звукового сигнала. Сейчас не редкость кроссоверы на 4-5 полос, а то и больше. Однако, те времена, когда кроссовер был только кроссовером, и ничем больше, уже давно и навсегда канули в лету. Практически все они в настоящее время включают в себя множество дополнительных устройств: фазовращателей, лимитеров и многих других. Что же именно входит в состав такого современного «монстра-кроссовера»? Естественно, что основной элемент любого кроссовера – это сами фильтры, делящие звуковой сигнал на отдельные частотные полосы. Как правило, в большинстве выпускаемых универсальных кроссоверов эти фильтры – перестраиваемые, т.е. сам пользователь может установить необходимые именно ему границы отдельных полос и их количество. Все фильтры имеют два основных параметра – это вид передаточной характеристики, и крутизна среза АЧХ. Вид передаточной характеристики фильтра зависит от его типа и определяет АЧХ кроссовера в полосе пропускания. Это может быть фильтр Бесселя, Баттерворта, Чебышева, и др. Каждый из этих фильтров имеет свои достоинства и недостатки. Фильтр Бесселя, при прочих равных условиях, имеет наилучшие ФЧХ и импульсный отклик, но наихудшую избирательность. Фильтр Чебышева имеет наилучшую избирательность, но наихудшие переходную характеристику (импульсный отклик) и ФЧХ, а кроме этого – его АЧХ в полосе пропускания в принципе всегда имеет некоторую волнообразную неравномерность. Фильтр же Баттерворта имеет наилучшую из рассмотренных АЧХ и удовлетворительную ФЧХ, однако его селективные свойства несколько хуже, чем у фильтра Чебышева. Как правило, в серьезных кроссоверах изготовитель предлагает на выбор несколько АЧХ, а уж какую из них использовать – решать пользователю. Кроме вида передаточной характеристики, в большинстве устройств имеется и несколько вариантов крутизны среза АЧХ (за пределами полосы пропускания). Наиболее часто используемые величины – это 12, 18 и 24 дБ на октаву. 66 Крутизна среза в 12 дБ/октаву означает, что мощность сигнала, лежащего вне полосы пропускания кроссовера, будет уменьшаться в 16 раз на каждую октаву удаления от частоты среза, а 24 дБ/октаву – уже в 256 раз. Очевидно, что еще большее ослабление будет уже бессмыслицей. Кроме этого, многими замечено, что лучше всего звучат кроссоверы с умеренной крутизной, порядка 12 дБ/октава. Изо всех дополнительных устройств в кроссовере первое, что должно в нем присутствовать – это фазовращатели, что вызвано самим принципом работы кроссовера как частотно-избирательной цепи, т.е. фильтра. Любые фильтры имеют нелинейную фазо-частотную характеристику (ФЧХ), причем эта нелинейность наиболее велика вблизи граничных частот полосы. Для того чтобы уменьшить это нежелательное явление, во многих кроссоверах встроены фазовращатели. Они позволяют изменять фазу сигналов, лежащих вблизи частоты среза. Благодаря этому создается возможность существенно улучшить равномерность суммарной АЧХ всей системы по звуковому давлению. Это будет справедливо только в том случае, если АЧХ громкоговорителя, подключенного к выходу этой полосы частот, будет идеально линейной. Однако реальная АЧХ подавляющего большинства громкоговорителей похожа на все, что угодно, кроме желаемой прямой линии. Значит, необходимо предусмотреть и возможность не только разделения сигнала на отдельные полосы, но и коррекции АЧХ в отдельных полосах. И действительно, многие из современных кроссоверов такую возможность предоставляют. Причем в особо «навороченных» моделях это могут быть и параметрический, и графический корректоры, действующие одновременно или поочередно, по вашему выбору, - а для ВЧ-динамиков дополнительно иногда предусматривается и специальная коррекция АЧХ рупора. Итак – сигнал «порезан» на нужное число полос, они фазово выровнены, скорректированы по АЧХ. Однако этого иногда недостаточно. Современные РА-системы, как правило, имеют довольно большие размеры, и, вследствие этого, сигналы от различных громкоговорителей могут приходить к слушателям с задержкой относительно друг друга, что приведет к вызванной этим неравномерности суммарной АЧХ (вследствие неизбежной интерференции), и к ухудшению импульсного отклика всей системы в целом. Для того, чтобы этого избежать, в ряде моделей кроссоверов в некоторые их полосы встраиваются индивидуальные, регулируемые линии задержки для компенсации неодновременности прихода звука к слушателям от отдельных громкоговорителей. Кроме этого, давно замечено, что в ряде случаев более приятное звучание акустики получается при как бы «неправильном» подключении громкоговорителей различных полос, когда динамики в одной из полос включены в противофазе относительно других полос. Для того чтобы сделать 67 это возможным, иногда предусматривается возможность инверсии (переворота) фазы сигналов относительно других. Очевидна также необходимость индивидуальных регуляторов уровня выходного сигнала для каждой полосы. После кроссовера есть еще и усилитель мощности! Он может и сам перегрузиться до хрипа, да дорогие динамики сжечь! Так что, необходимо оснастить выходы кроссовера еще и лимитерами для предотвращения описанных случаев. Поэтому множество выпускаемых в настоящее время кроссоверов, действительно, оснащены лимитерами, а некоторые даже и компрессорами. Да иногда еще и раздельными, индивидуальными для каждой полосы! В итоге получается, что в таком «суперкроссовере» есть и собственно кроссовер, и фазовращатели, и эквалайзеры, и специальные корректоры, и лимитеры, да и многополосные компрессоры, по сути, тоже есть. Но в стремлении предоставить пользователю как можно больше возможностей (или в погоне за большой ценой) разработчики пошли еще дальше. И стали встраивать и вовсе даже «не-кроссоверные» устройства. Так, недавно одна из фирм объявила о создании целого «монстра», в котором, кроме всех вышеописанных узлов, встроен еще и автоматизированный графический эквалайзер с микрофонным входом и встроенным генератором розового шума. Такой эквалайзер сам настраивает во всей РА-системе линейную или любую другую требуемую АЧХ. Кроме этого, разработчики туда же установили еще и систему для подавления акустической обратной связи (Feedback Suppressor), и систему для дистанционного управления несколькими типами усилителей, и еще некоторые устройства. Конечно, называть такие сложные аппараты простым словом «кроссовер» уже не совсем правильно. Контроллеры. Все вышеописанные приборы универсальны, т.е. могут применяться с самыми различными типами и видами акустических систем. И в этом, наряду со множеством несомненных достоинств, кроется и ряд принципиально неустранимых недостатков. Во-первых, это довольно длительная процедура настройки. Здесь гибкость и универсальность проявляют свою оборотную сторону, ведь не так просто из множества возможных сочетаний параметров выбрать самый оптимальный их вариант. Во-вторых, всегда существует вероятность случайного ошибочного изменения установленных значений настроек, особенно в условиях «живой» концертной и гастрольной работы. В-третьих, практически ни один серийный кроссовер не позволяет работать с перекрытием полос. Имеющиеся же в некоторых моделях отдельные субвуферные выходы тоже полностью не решают эту проблему. И, наконец, что самое важное – ни один, даже самый «крутой» кроссовер, оснащенный и лимитерами, и вообще всем на свете, в принципе 68 не способен полностью, на все сто процентов, защитить сами динамики от перегрузок и, вследствие этого, выхода из строя. Да, лимитеры защищают усилители мощности от перегрузок, и вполне надежно, а вот акустику – увы! От всех перечисленных недостатков абсолютно свободны только именно настоящие контроллеры ( рис.2.49 ) , которые однако, весьма дороги. Кроме дороговизны, у них есть и еще один небольшой недостаток, а именно – некоторая «неуниверсальность». Все они являются узкоспециализированными, и каждый из них предназначен для работы с одним, строго определенным типом акустики. Впрочем, для большинства выпускаемых контроллеров имеется довольно широкий набор сменных модулей, обеспечивающих работу с различными акустическими системами. Итак – чем же настоящие контроллеры отличаются от сложных многофункциональных кроссоверов? Так как каждый контроллер предназначен для работы со вполне конкретной акустикой, то вполне естественно, что абсолютно никаких настроек не нужно. Всё, что требуется, - разделение полос, их частотная, амплитудная и временная коррекции – уже заранее заложено изготовителем, и пользователю не требуется прилагать ни малейших усилий для настройки системы! (Ну, кроме, возможно, подстройки общего характера звучания по своему вкусу…) Таким образом, при установке и настройке всей РА-системы экономится масса времени и усилий. Самое главное отличие настоящего контроллера от навороченного кроссовера – это как раз наличие тех самых нескольких дополнительных входов, которые являются управляющими. На них подается сигнал с выхода усилителя мощности, и именно этот сигнал и «видят» все схемы защиты. Таким образом, устраняется главное слабое место систем защиты обычных кроссоверов, которые просто реагируют на некий, довольно-таки «абстрактный» уровень электрического сигнала на своем выходе. В противоположность им, контроллер «видит» реальный уровень сигнала на выходе усилителя мощности, т.е. непосредственно тот сигнал, который поступает на сам громкоговоритель. Благодаря этому защита становится гораздо более надежной, так как никакие возможные изменения положения регуляторов оконечного усилителя мощности не изменяют условий работы схем защиты. Но не только этим интересны контроллеры. Если внимательно посмотреть на перечень параметров головок громкоговорителей, то там можно увидеть несколько, и весьма отличающихся друг от друга, различных цифр мощности. Как минимум, это будут долговременная (тепловая) мощность, и кратковременная (пиковая). Кроме них, иногда указывается и максимально допустимая амплитуда колебаний (ход) диффузора, ограниченная его конструкцией. Так вот, благодаря тому, что каждый контроллер предназначен для работы со вполне конкретной акустикой, он и может контролировать все эти параметры одновременно. 69 Рисунок 2.49 – Схема контроллера 1 – ВХОД СИГНАЛА 2 – НЧ-КАНАЛ 3 – НЧ-ЭКВАЛАЙЗЕР 4 – СХЕМА ЗАДЕРЖКИ 5 – ФВЧ 6 – ОГРАНИЧИТЕЛЬ ХОДА ДИФФУЗОРА 7 – ПИК-ЛИМИТЕР 8 – ТЕМПЕРАТУРНЫЙ ЛИМИТЕР 9 – НЧ-ВЫХОД 10 – ВЧ-КАНАЛ 11 – ВЧ-ЭКВАЛАЙЗЕР 12 – ФНЧ 13 – ПИК-ЛИМИТЕР 14 – ТЕМПЕРАТУРНЫЙ ЛИМИТЕР 15 – ВЧ-ВЫХОД 16 – НЧ-СИГНАЛ (С ВЫХОДА УСИЛИТЕЛЯ) 17 – ВЧ-СИГНАЛ (С ВЫХОДА УСИЛИТЕЛЯ) 18 – КОНТРОЛЛЕР ХОДА ДИФФУЗОРА 19, 21 – КОНТРОЛЛЕР ПИК-ЛИМИТЕРА 20, 22 – КОНТРОЛЛЕР ТЕМПЕРАТУРНОГО ЛИМИТЕРА Действительно, если настроить защитный лимитер в обычном кроссовере на допустимую долговременную мощность (предположим, что это каким-то образом удалось) – то получим существенное недоиспользование потенциала РА-системы по громкости, так как все пики при этом будут самым безжалостным образом срезаны. И абсолютно 70 напрасно, так как большинство современных громкоговорителей могут выдерживать весьма значительные кратковременные перегрузки, в ряде случаев – до десятикратной! Иначе говоря, добрая половина потенциально возможной громкости просто потеряется… В то же время, если по каким-либо причинам на НЧ-динамик попадет особо низкочастотная составляющая, то его диффузор может просто «вылететь» за пределы нормального рабочего хода, что приведет к выходу динамика из строя, и обычный лимитер в этом случае его не спасет. Поэтому в контроллерах имеется, как правило, не одна, а несколько защитных цепей лимитеров. Один лимитер реагирует на долговременную тепловую мощность (THERMAL), второй – на максимально допустимую пиковую (TRANSIENTS), третий – на ход диффузора (EXCURSION). Для ВЧ-громкоговорителей защита хода подвижной системы не очень актуальна, так как все они имеют крайне малые амплитуды перемещения, и поэтому защитные цепи для них имеют несколько упрощенную схему, по сравнению с НЧ-каналами. Кроме этого, в контроллерах, как правило, при отсутствии обратного сигнала от усилителя мощности (обрыв в линии, или авария самого усилителя), выходной сигнал для безопасности громкоговорителей мьютируется, так как контроллер в этом случае не может осуществлять полноценную защиту. В некоторых моделях контроллеров дополнительно имеется и настраиваемая динамическая коррекция АЧХ по кривым равной громкости (тон-компенсация), что помогает получить более плотный и комфортный звук. Таким образом, хороший контроллер позволяет полностью использовать весь потенциал РА-системы, и в то же время максимально защитить систему от всевозможных неприятностей, а потребителя – от необходимости тратить деньги на ремонт. К сожалению, широкое применение контроллеров сильно сдерживает их довольно-таки «кусачая» цена, которая даже для двухтрехполосных контроллеров начинается примерно с полутора-двух тысяч долларов… 2.7 Временная обработка звуковых сигналов В основе приборов, влияющие на временные характеристики сигналов лежат линии задержки. Они задерживают звуковой сигнал на определенное время, регулируемое в том или ином интервале. На основе временной задержки строятся устройства искусственной реверберации – ревербераторы. Ревербераторы и линии задержки используются: 1) для временной обработки сигналов в студиях звукозаписи и радиовещания; 2) в концертных залах для озвучивания больших площадей; 3) при искусственном моделировании пространственных эффектов и реверберации. 71 Основным элементом устройств временной обработки сигналов является линия задержки (ЛЗ). Линия задержки обеспечивает задержку звукового сигнала на определенный интервал времени и при самостоятельном использовании предназначена: 1) для изменения направления на кажущийся источник сигнала (при стереозаписи); 2) для выравнивания группового времени запаздывания звуковых сигналов от различных источников в студиях записи и задержек сигналов, приходящих к слушателю разными путями в озвучиваемых помещениях. Основной параметр ЛЗ – время задержки (зад) – в зависимости от конкретного применения изменяется от единиц миллисекунд до нескольких секунд. Большое значение имеет и динамический диапазон ЛЗ, поскольку она включается в студийный тракт, где ЛЗ имеет очень широкий динамический диапазон. По принципу действия ЛЗ делятся на: - акустические; - магнитофонные; - цифровые. Акустическая ЛЗ основана на использовании времени распространения звуковой волны в воздушной среде. Время задержки определяется расстоянием от громкоговорителя до микрофона, расположенных в трубке. Такая ЛЗ требует установки в тихих, акустически изолированных помещениях. Магнитофонная ЛЗ использует запись на кольцевой магнитной ленте с несколькими воспроизводящими головками. Время задержки зад определяется здесь расстоянием между зазорами головок записи и воспроизведения и скоростью движения ленты. Преимущество магнитофонных ЛЗ – легкость получения больших значений зад. Основные недостатки: - быстрый износ ленты и головок; - низкое отношение сигнал-шум. Цифровая ЛЗ (ЦЛЗ) основана на задержке цифрового сигнала, осуществляемой с помощью регистров сдвига или запоминающих устройств (ЗУ) с произвольной выборкой. Если ЗУ выполнено в виде регистра сдвига (т.е. цепочки триггеров), то цифровой сигнал продвигается по ней от входа к выходу, смещаясь за один такт на один шаг. зад – длительность задержки прямо пропорциональна числу триггеров в цепочке N и тактовому периоду Т 72  зад  N T  N, fT где fТ – тактовая частота. В зависимости от числовых значений этих параметров изменяется длительность задержки. Она может достигать нескольких десятков секунд. При использовании ЦЛЗ в аналоговом тракте на ее входе и выходе осуществляются аналого-цифровые и цифро-аналоговые преобразования ЗС. ЦЛЗ обеспечивает регулировку зад в широких пределах без существенных искажений задерживаемого сигнала и уже практически вытеснила ЛЗ на других физических принципах. Пример отечественной ЦЛЗ – типа Ф4288 – имеет два входа, восемь выходов и способна задерживать ЗС от 0 до 819,2 мс с шагом 0,1 мс. Искусственная реверберация (физические и психофизиологические основы). В восприятии звуков речи, музыки, натурных шумов большую роль играет послезвучание, отзвук, реверберация (reverberation – отражение). Реверберация – процесс спадания звуковой энергии. Ощущение полноты звучания, пространства помещения (зала, студии) зависит от длительности запаздывания (задержки) волн, отраженных от преград помещения (стен, потолка, пола), скорости их ослабления, направлений прихода к слушателю. Реверберация состоит в постепенном спаде с течением времени собственных резонансных колебаний воздушного объема помещения, возбужденных источником звука. Считается, что слышимое явление реверберации, ощущение отзвука, не определяется длительностью всего процесса реверберации, а лишь длительностью его начальной части (примерно 160 мс), и объясняют это тем, что при музыкальном исполнении (или звучании речи) слушатель на фоне звучания музыки или речи слышит лишь начальную часть отзвука. Остальная часть маскируется продолжающимся звучанием. Лишь в том случае, когда звучание обрывается внезапно, слушатель в паузе воспринимает весь спад отзвука до момента, когда отзвук начнет маскироваться шумом зала. Пространственная структура. Важное место в восприятии звуков принадлежит пространственной структуре реверберационного процесса. Она определяется размерами и формой помещения. После прихода в точку, где находится приемник звука (уши слушателя, микрофон) прямого звука через некоторые промежутки времени в эту точку начинают поступать запаздывающие сигналы, испытавшие одно, два, три или более отражений от препятствий – стен, потолка помещения. Для наилучшего восприятия необходимо, чтобы запаздывание звуков, испытавших одно, два, три отражения, составляло некоторые оптимальные значения, зависящие от вида звучания ( таблица 4 ). 73 Таблица 4 Время запаздывания (нс) Вид звучания Первые Вторые отражения отражения Музыка 20-30 35-50 Речь 10-15 15-25 Третьи отражения 50-70 25-45 Две стороны реверберации. 1) Спектр собственных частот помещения. 2) Пространственно-временная структура (пространственная сторона после микрофона теряется). Эти две стороны дополняют друг друга. Процесс реверберации описывают структурами спектра собственных резонансных колебаний и запаздывающих во времени и постепенно ослабевающих сигналов. Причины ослабления сигналов: 1. поглощение звуковой энергии преградами при каждом отражении звуковой волны от них; 2. поглощение энергии из-за вязких потерь в воздухе. Процесс реверберации отражается в координатах N = F1(f) – частотная область N = F2(t) – временная область N = F1(f) – описывает структуру спектра собственных (резонансных) частот (рисунок 2.50). Рисунок 2.50 – Структура спектра собственных частот Характеризуется уплотнением спектра собственных частот с увеличением частоты. N = F2(t) – структура запаздывающих сигналов (импульсного отклика) (рисунок 2.51). 74 Рисунок 2.51 – Структура запаздывающих сигналов Характеризуется уплотнением последовательности запаздывающих импульсов по мере увеличения запаздывания. В сходстве между структурой спектра собственных частот и последовательностью времени прихода запаздывающих сигналов проявляется взаимная связь между АЧХ линейной системы и ее откликом на импульсное возбуждение. Эту природную закономерность следует выполнять и при построении систем искусственной реверберации. Кроме того, необходимо моделировать время запаздывания первых отражений. Во всех залах, получивших оценку экспертов «пять с плюсом», время запаздывания между прямым звуком и первыми отражениями составляет 10…20 мс (первое значение для речи, второе – для музыки). Необходимость применения устройств искусственной реверберации при записи эстрадной и классической музыки. Разные составляющие ансамблевого звучания эстрадных коллективов – голоса солистов, партии отдельных инструментов, звучание оркестровых групп – записывают раздельно с помощью многоканальных магнитофонов. Микрофоны устанавливают перед каждым исполнителем. При этом микрофоны воспринимают только прямой звук, и реверберация, присущая помещению записи, практически не сказывается на звучании, что обедняет его. Звучание электронных инструментов (электронной гитары) записываются чисто электронным путем (без участия акустики студии). Классическую музыку также иногда приходится записывать, исключая влияние естественной реверберации. Так вынуждены поступать по двум причинам: во-первых, чтобы уменьшить влияние акустических помех, сопровождающих звучание оркестра, например, при трансляции из 75 концертного зала; во-вторых, чтобы можно было регулировать время реверберации для разных частей произведения или для разных произведений. При трансляции из концертного зала необходимо для выявления реверберации зала располагать микрофоны в средних рядах партера. Но при этом микрофоны воспримут и шумы, создаваемые слушателями (кашель, шелест листов программ, скрип кресел), иногда и уличные шумы, проникающие в зал. При размещении микрофонов непосредственно у эстрады акустические шумы будут сказываться меньше, так как уровень интенсивности звука вблизи оркестра примерно на 20 дБ выше, чем в средних рядах партера. Но реверберация зала при этом практически не скажется на звучании, ввиду того, что энергия прямого звука в этом случае существенно больше энергии запаздывающих звуков. Запись в пустом зале не всегда приемлема по экономическим соображениям, а также и потому, что в отсутствии слушателей время реверберации на 20-30% больше, чем в заполненном, и отличается от оптимального. Перечисленные обстоятельства заставляют пользоваться устройствами искусственной реверберации. Устройства искусственной реверберации. Ревербератор – устройство, создающее сигнал, имитирующий реверберацию в помещениях разного объема и конфигурации. Известны следующие устройства искусственной реверберации: - реверберационные камеры (эхо-камеры); - магнитные; - листовые; - пружинные; - цифровые. Эхо-камеры – это специальные помещения объемом 30…300 м3, стены, пол и потолок которого хорошо отражают звук. Во избежание резонансов объема и стоячих волн стены, пол и потолок не параллельны. Воздушный объем камеры возбуждается громкоговорителем, на который подается исходный сигнал. Реверберационный микрофон (или микрофоны) устанавливается так, чтобы принимать в основном многократно отраженный ЗС. Этот сигнал усиливается и подмешивается к исходному. Меняя соотношение между исходным и реверберационным сигналами, добиваются нужного звукового эффекта. Максимальное значение времени стандартной реверберации Тр=5…7 с. Из всех аналоговых систем искусственной реверберации эхо-камера обеспечивает звучание, наиболее близкое к реальному. Недостаток: акустические характеристики камеры не могут быть изменены, а иметь несколько камер с разным временем реверберации дорого. 76 Магнитный ревербератор. Построен на магнитофонный ЛЗ и имеет несколько (до восьми) звуковоспроизводящих головок, сигналы со всех головок смешиваются с соответствующим уменьшением уровня от первой к последней. Магнитный ревербератор обеспечивает изменение Тр от 0,5 до 5 с и более. Он малочувствителен к акустическим помехам в помещении. Недостатки: 1) плавание звука; 2) малый динамический диапазон; 3) тональная окраска отзвуков, обусловленная точной повторяемостью запаздывающих сигналов. Листовой ревербератор. Это тонкий лист (стальной или латунный) 0,1…0,5 мм, в котором для получения реверберации используют изгибные колебания. Размер (например, 1x2 м). Лист подвешен четырьмя углами на амортизированной раме. Колебания возбуждаются вибратором, представляющим собой электродинамический преобразователь с коническим острием, приваренным к листу. В качестве виброснимателя применяют пьезоэлектронный датчик из титанита бария, который помимо прямой бегущей волны изгиба снимает серию затухающих волн, отраженных от границ листа. В отличие от магнитного ревербератора, действие которого можно смоделировать одномерной системой, листовой ревербератор моделирует колебания в двумерном плане (в плоскости). Следовательно, листовой ревербератор делает картину затухания более естественной, характеризуемой трехмерными акустическими колебаниями в помещениях. Время реверберации изменяется простыми и надежными механическими средствами. Приближение стального листа к панели из микропористого звукопоглотителя усиливает затухание колебаний листа и, следовательно, уменьшает время реверберации; удаление от панели увеличивает время реверберации. Пружинный ревербератор основан на использовании скручивающих (крутильных) колебаний стальной пружины, к одному из концов которой прикрепляется возбудитель, а к другому – приемник колебаний. Величина времени реверберации регулируется изменением расстояния между поглотителем и пружиной и может изменятся от 1 до 5 с. Пружинные ревербераторы имеют худшие электроакустические характеристики, чем листовые и эхо-камеры, но малогабаритны. Магнитные, листовые и пружинные ревербераторы более гибки в эксплуатации, проще и дешевле реверберационных камер. Время реверберации с их помощью можно регулировать в больших пределах, но их действие сопровождается специфическими искажениями, а получаемый эффект не вполне равноценен естественной реверберации. При регулировании времени реверберации заметно изменяется частотная 77 характеристика времени реверберации, а ее форма отличается оптимальной частотной характеристики времени реверберации зала. от Электронные ревербераторы. Идея действия всех электронных ревербераторов очень проста. Она заключается в том, что к входному сигналу добавляется последовательность задержанных на разное время t и измененных численно в К раз его значений, что и определяет эффект реверберации. Реализация этой простой идеи наталкивается на значительные трудности. Необходимо избежать периодичности следования запаздывающих импульсов по мере увеличения времени задержки. Осуществление этих свойств в аналоговых ревербераторах достигается большим усложнением их схемы. Разработка ревербераторов была сложным делом, не всегда поддавалась анализу, и конструирование ревербераторов шло подчас чисто эмпирическим путем, граничащим с искусством. Хотя время реверберации в ревербераторах можно было изменять в больших пределах, но получаемый эффект не был вполне равноценен естественной реверберации. Цифровой ревербератор. Достигнутое понимание физической природы процесса реверберации и совершенствование вычислительной техники позволили моделировать процесс реверберации на цифровых ЭВМ. При этом моделируются: - временные процессы (расположение запаздывающих импульсов во времени, закономерности спада амплитуд запаздывающих сигналов); - частотные («резонирование» зала на ряде дискретных частот, расположенных достаточно плотно, причем плотность увеличивается с ростом частоты). Трудность создания цифровых ревербераторов – необходимость моделировать акустические процессы в реальном масштабе времени. Для высококачественной передачи музыки отсчеты должны следовать через каждые 30 мкс. За этот промежуток цифровая ЭВМ должна выполнить все операции по заданной программе и к моменту прихода следующего отсчета быть готова к выполнению нового цикла операций. Структура большинства универсальных цифровых ЭВМ мало подходила для операций со звуковыми сигналами. Более подходящими оказались специализированные мини-ЭВМ, обладающие большим быстродействием. Структурная схема цифрового ревербератора. Она подобна общей схеме (приведенной выше), но используется цифровая линия задержки, в качестве которой применяют ОЗУ (оперативное запоминающее устройство) в виде сдвигового регистра, а регулятор уровня представляет собой блок умножения числа, соответствующего отсчету сигнала, на число меньше единицы при уменьшении уровня и больше единицы при увеличении уровня. Кроме того, цифровой ревербератор содержит блоки регулирования АЧХ, что позволяет изменить тембр отзвука. 78 Обычно имеется возможность регулировать интервал между временем прихода прямого (незадержанного) сигнала и первыми отражениями, что эквивалентно изменению размеров моделируемого помещения. Изменяя соотношение уровней незадержанного и задержанных сигналов, имитируют изменение эквивалентной (эффективной) реверберации. Оператор может моделировать: - акустику помещения; - соотношение его геометрических размеров; - коэффициент поглощения преград. Для иммитации многократных отражений часть выходного напряжения сигнала вновь направляют на вход линии задержки, а для придания этому процессу нерегулярного характера сигнал ответвляют с разных выходов ЛЗ. Скорость спада регулируют изменением коэффициента передачи цепей обратной подачи. Управление АЦП, ЦАП и ОЗУ осуществляют с помощью тактового генератора. Схема (структурная) содержит (рисунок 2.52): - сумматоры (); - фильтры нижних частот (ФНЧ); - преобразователи АЦП и ЦАП; - оперативное запоминающее устройство (ОЗУ); - специализированная ЭВМ с формирователем адреса и импульсов синхронизации. Рисунок 2.52 – Структурная схема цифрового ревербератора Цепи обратной подачи содержат регуляторы уровня с затуханиями а1…аN. Длительность задержки t отображает длину пути, проходимого звуковой волной от источника до преграды, а значения затухания а1 регуляторов уровня – скорость спада уровня отраженных сигналов. Чтобы разрушить регулярность запаздывающих сигналов используют генератор тактовых импульсов со случайной выборкой. 79 Входной сигнал преобразуется АЦП с частотой дискретизации fд в двоичные числа и записывается в ячейки ОЗУ. ФНЧ служит для ограничения спектра звукового сигнала. Номер ячейки, в которой записывается число, определяется формирователем адресов и увеличивается на единицу с каждым новым отсчетом. После заполнения последней ячейки формирователь адреса переходит к первой. Такое ОЗУ подобно склеенной в кольцо магнитной ленте и потому называется кольцевым. Непосредственно перед новой записью из ячейки считывается хранившееся там число. Максимальная длительность задержки равна произведению количества ячеек в ОЗУ (К) на период дискретизации Тд=1/fд - t=K/fд. Используя более сложный формирователь адреса, за каждый период дискретизации можно считывать сразу из нескольких ячеек несколько чисел, задержанных на разное время. Такое устройство аналогично линии задержки с несколькими отводами. Дополняя ЛЗ цепями обратной подачи, строят цифровые ревербераторы. Достоинства цифровых ревербераторов: - высокая гибкость в регулировании параметров реверберации; - нечувствительность к внешним воздействиям (вибрациям, акустическим шумам); - высокая надежность (отсутствие движущейся части). Недостаток – высокая стоимость. Серийно изготавливаемые цифровые ревербераторы. Отечественные: 1) «Венец АЦ-01»; 2) «Лель РЦ»; 3) «7А-06». Зарубежные: 1) «DRE-2000»; 2) «Lexicon-200», «Lexicon-224»; 3) «EMT250». 2.8 Устройства звуковых эффектов (УЗЭ) УЗЭ широко применяются в процессе первичной обработки ЗС при записи и передаче вокальных и инструментальных произведений, а также при звучании электромузыкальных инструментов. Большинство УЗЭ, как и ревербераторы, основаны на смешивании прямого (незадержанного) сигнала с одним или несколькими его задержанными повторениями, но времена задержек изменяются здесь с различной скоростью и по различным законам. Некоторые способы образования большинства простейших ЗЭ иллюстрируются схемой рисунок 2.53. В простейшем случае, при коэффициентах g0=g1=g2=0, g3=1 и g0С=0 получаем задержку ЗС с регулируемым зад.3. 80 Рисунок 2.53 – Структура устройств звуковых эффектов Эффект «эхо» – имитация отражения от одной или нескольких поверхностей, расположенных на большом расстоянии. При отражении от одной поверхности: g0=g1=g0С=0, g0=1; g3 – регулируемое. Величина зад.3 должна быть не менее 50 мс, поскольку при меньшем значении два сигнала не различаются на слух. При подаче задержанного сигнала в цепь обратной связи устройства получают «многократное эхо», при g0С<1 – затухающее, при g0С>1 – нарастающее (звучание, не встречающееся в природе), зад.ОС – определяет период повторения. «Подчеркивание» сигнала – создается эффект увеличения громкости звучания без повышения выходной мощности. Достигается это добавлением к прямому ЗС сигналу сигнала с фиксированным зад, значение которого зависит от характера сигнала (например, 20 мс – для бас-гитары; 25-45 мс – для вокалиста; 100 мс – для хора и т.д.). При дальнейшем увеличении зад.3 появляется эффект дублирования. «Вибрато» – эффект типа гавайской гитары. Может быть получен периодическим изменением зад.2 по синусоидальному или «треугольному» закону с частотой единицы и доли Герц. «Дуэт» – один голос звучит, как два. Достигается суммированием прямого и задержанного сигналов. Величина задержки относительно медленно меняется по случайному закону в пределах 2…25 мс. 81 «Хор» – один голос, один инструмент звучит, как хор или оркестр однородных инструментов. Образуется аналогично эффекту «дуэта», но к прямому сигналу добавляется несколько задержанных сигналов, времена задержек изменяются независимо друг от друга. Эффекты «фейзинг» и «фленжинг» создают схожие специфические звучания типа «плавания» и «качания звука», как бы возникающего вокруг слушателя. Эффекты основаны на подавлении отдельных участков спектра ЗС, т.е. на создании неравномерной АЧХ с перемежающимися «впадинами» (нулевыми участками) и «горбами». Вокалстрессор. Буквальный перевод – подчеркиватель, выделитель пения. Обоснованием к применению вокалстрессора служат следующие обстоятельства. В спектре голосов певцов есть две частотные области с повышенным уровнем (певческие форманты). Высокая форманта обуславливает способность голоса переноситься вдаль, перекрывать звучание оркестра. Это объясняется тем, что частота этой форманты приходится на область наибольшей чувствительности слуха человека. Этим свойством обладают не только певческие голоса, но и музыкальные инструменты, даже не создающие большой акустической мощности (скрипки Амати, Гварнери, Страдивари). Вокалстрессор служит для изменения характера, обогащения звучания певческих голосов, выделения их на фоне звучаний музыкальных инструментов. Это фактически голосовой «протез». Вокалстрессор – это сочетание комбинированного АРУ и эквалайзера. Эквалайзер – многополосный регулятор АЧХ (27-30 частотных полос и пределы регулятора К - 20 дБ) позволяет наиболее точно имитировать певческие форманты. На нем легко реализуются фильтры присутствия (презенс-фильтры). Фильтр присутствия поднимает АЧХ в сравнительно узкой полосе частот. Высоту подъема АЧХ регулируют, а частоты обычно выбирают 0,7; 1,4; 2,1; 2,8; 4 Гц. Итак, вокалстрессор содержит: - расширитель – при малых входных уровнях – функции шумоподавления; - сжиматель – на средних уровнях; - ограничитель – при Uвх> Uвх.ном; - эквалайзер – для подбора формы АЧХ. Вокалстрессор F-769X-R (фирмы Аудио-Дизайн, Великобритания) имеет гибкую структуру, т.е. возможность соединять его основные звенья, сжиматель и эквалайзер, в различных сочетаниях. Выбор структуры зависит от вида звучания и вкусов звукорежиссера. 82 Параметры сжимателя и расширителя можно изменять в широких пределах. Для расширителя – два режима регулирования времени срабатывания: - ручной; - автоматический – tср устанавливается цифровым процессором, реагирующим на динамику изменения входного сигнала. Таблица 5 – Динамические параметры вокалстрессора Звено tср, мс Расширитель 25-400 (руч.) 100-1000 (авт.) Сжиматель 0,3; 1,5; 25 Ограничитель 0,2 tв, мс 0,1; 3; 40 151500 15 Коэффициент расширения Dрасш – от 1:1,2 до 1:10 Коэффициент сжатия Dсжимателя – от 1:1 до 20:1. КГ < 0,5% каждого из регуляторов. Генератор ВИБРАТО. Вибрато – это плавные, ритмичные пульсации голоса. Это результат периодического изменения интенсивности, частоты и спектра звука. Для слуха наиболее приятны пульсации с частотой 5-7 Гц. Пульсации делают голос живым, одухотворенным. Хорошее вибрато придает звуку певческого голоса большую уверенность и определенность. К вибрато прибегают и инструменталисты (скрипачи, виолончелисты, трубачи). Для уменьшения недостатков певческого или инструментального звучания пользуются особыми электронными устройствами – генераторами вибрато. Генератор вибрато – это мультивибратор или его цифровой аналог, колебания которого накладываются на исходный сигнал, как бы модулируют его по частоте (реже по амплитуде или по фазе). Этим создается окраска звучания, свойственная естественному вибрато. Частотный диапазон вибрато устанавливается в пределах от 4 до 7 Гц (чаще всего используют 6 Гц). Кроме изменения частоты предусматривается изменение интенсивности колебаний вплоть до полного исключения эффекта. Обязательно требование симметрии девиации. Асимметрия девиации вызывает ощущение изменения средней высоты тона. Желательно, чтобы при увеличении уровня сигнала (при увеличении громкости) величина девиации плавно возросла. Эксайтер. Это устройство преобразования спектра или синтезатор спектра. 83 Оно построено на основе цифрового процессора. Процессор на основе анализа низкочастотных составляющих спектра воссоздает их ВЧ гармоники. Тем самым спектр сигнала обогащается новыми составляющими и расширяется в сторону более высоких частот. Область применения эксайтера – реставрация старых фонограмм. С помощью эксайтера исходный спектр расширяют примерно вдвое. Пример эксайтера – AURAL-M-S фирмы «Афекс» (США). Старые фонограммы сильно зашумлены (высок уровень помех). Сигнал с монофонической фонограммы воспроизводится стереофоническим звукоснимателем. Обе стороны канавки грампластинки модулированы сигналом одинаково, следовательно, коррелированы. Механические неоднородности сторон канавки, обуславливающие шум, различны, не коррелированы. Анализирующее устройство выделяет коррелированные напряжения и подавляет некоррелированные. Это приводит к улучшению отношения сигнал/помеха. Устройства изменения высоты тона. Необходимость такого устройства вызвана технологией записи эстрадных исполнителей. Сначала готовят фонограмму оркестрового сопровождения, а затем пишут голос солиста (это исключает повторную запись оркестра при ошибках солиста). Но часто ко времени записи солиста его звуковой диапазон несколько меняется и акомпонимент необходимо транспортировать в иную тональность. Чтобы не повторять запись оркестра, электрический сигнал оркестровой фонограммы преобразуют аппаратурными средствами. Почему нельзя транспортировать спектр сигнала методом гетеродинирования, смещая частоту f1 исходного сигнала в ту или иную сторону с помощью вспомогательной частоты f2 f3 = f1 f2 Применение этого метода нарушает исходный гармонический строй. ПРИМЕР. Пусть исходный сигнал содержит частоты f и 2f (активное соотношение). При смещении на Δf получаются частоты f+Δf=f1 и 2f+Δf=f2, т.е. октавный интервал будет нарушен (f2≠2f1). То же случится со всеми другими музыкальными интервалами. Для устранения этого недостатка необходимо, чтобы смещение каждой частоты Δfi было пропорционально этой частоте fi. Выполнить это условие простыми аппаратурными средствами невозможно. Транспортирование звучания в иную тональность можно осуществить, изменив скорость движения фонограммы до значения V2 по сравнению с исходной скоростью записи V1. 84 Если V увеличить, то спектр сместится в область более высоких частот, если уменьшить - в область более низких частот. Соответственно изменится высота тона. Такая возможность имеется в современных монтажных магнитофонах. Достигается это питанием ведущего двигателя магнитофона от генератора с управляемой частотой. Однако при этом изменится длительность звучания: при изменении высоты звука на полтона - на 6% на тон - на 12% на два тона - на 26% Возможности такого способа хотя и ограничены, но пределы такого транспонирования звука практически вполне достаточны. Для изменения тональности без изменения длительности звучания используют магнитофон с вращающимся блоком головок или цифровое устройство - гармонайзер. Идея действия магнитофона с вращающимся блоком головок (рисунок 2.54): Рисунок 2.54 – Магнитофон с вращающимся блоком головок Чтобы понять принцип действия устройства, представим,что на ленте записаны импульсы, следующие с какой-то частотой. Если барабан неподвижен, то одна из головок будет считывать импульсы с той частотой, с какой они были записаны. Пусть барабан вращается по часовой стрелке, то головка как бы «догоняет» импульсы, записанные на фонограмме, и за прежний промежуток времени головки считают меньшее количество импульсов, т.е. их частота уменьшится. Если барабан с головками вращается против часовой стрелки (против направления движения фонограммы), то за тот же промежуток времени будет считано больше импульсов, чем при неподвижном барабане, т.е. частота 85 следования воспроизводимых импульсов увеличится по сравнению с исходной. Изменения частоты при постоянной скорости вращения барабана будут пропорциональны частоте записанных сигналов, и нарушения гармонического строя не произойдет. Описанный эффект получают сегодня с помощью цифровых устройств. Сигнал превращают в цифровую форму и записывают в ячейки памяти. При считывании выборок некоторые записанные значения повторяются, либо, наоборот, пропускаются. Результатом является повышение или понижение высоты тона воспроизводимых сигналов. Это и другие преобразования производятся гармонайзером. Гармонайзер – это многофункциональное программируемое цифровое устройство. Пример – Ультрагармонайзер H-3000 фирмы «Эвентайд»(США) выполняет: - cмещение спектра; - имитирует процесс реверберации; - осуществляет задержку сигнала; - другие спецэффекты (иллюзия звучания ударных инструментов в различных ритмах) и т.д. Упрощенная структурная схема ультрагармонайзера показана на рисунке 2.55. Рисунок 2.55 – Структурная схема ультрагармонайзера Управляют гармонайзером с помощью клавишной тастатуры. Помимо «жестких», готовых программ, можно ввести иные, свободные программы преобразований. Параметры преобразований изменяют дискретно или плавно. Набранные значения вводятся в программную память и индуцируются на табло. Используя гармонайзер, можно получить своеобразный эффект – «расщепление» голоса. Смещенный по высоте, например, на терцию (на два 86 тона) голос соединяют с несмещенным голосом и создают иллюзию исполнения произведения двумя солистами, дуэтом. С помощью гармонайзера имитируют ряд других эффектов: - высотное вибрато (своеобразную амплитудную модуляцию интенсивности звука); - тремоло (быструю смену звучания двух соседних по высоте тонов); - арпеджио («разорванные аккорды» подобные аккордам арфы); - одиночное и многократное эхо. Устройства изменения длительности звучания. Иногда возникает необходимость изменить длительность звучания. Это нужно для того, чтобы избежать излишних пауз между передачами или (что чаще) вместить передачу в промежуток времени, задуманной сеткой вещания. Если требуемые изменения невелики (6-12%), их можно получить изменением скорости движения фонограммы в магнитофоне. Изменение высоты звука при этом не замечаются слушателями. Большие возможности изменения длительности звучания дают цифровые методы. Фирмы-изготовители этих устройств скрывают примененные технические решения. В Германии такие устройства называют «растягиватель времени»- Zeitdehner. Идею растяжения или сжатия звучания во времени излагают так: На основе анализа записанных в цифровую память сигналов определяют частоты колебаний и добавляют или, наоборот, удаляют некоторое количество периодов колебаний. В лучших образцах таких устройств длительность звучания изменяется от половины до удвоенного значения первоначальной длительности. Виды приборов обработки звука Для начала, давайте распределим всю обработку на группы. Все приборы этого рода делятся на динамические процессоры и непосредственно эффект-процессоры. К динамическим относятся компрессоры, гейты, экспандеры, лимитеры, де-эссеры, параметрические и графические эквалайзеры и прочие инструменты, принцип работы которых строится на изменении громкости всего сигнала или какой-то его части. Сразу хочу внести ремарку: кто-то возразит против того, чтобы причислять эквалайзеры к динамическим процессорам. В чем-то они будут правы, ведь задача эквалайзера – в первую очередь работа со спектром, с частотами. Но, если вдуматься, любой эквалайзер для корректировки частоты использует повышение или понижение уровня громкости определенной полосы спектра, а именно это и подразумевает понятие «динамического процессора». Компрессоры, между тем, тоже бывают многополосные – с возможностью компрессировать звук только в определенном частотном диапазоне. Так что, считаю логичным включение эквалайзеров в эту группу. 87 Вторая группа – эффект-процессоры, или процессоры эффектов – это любая обработка, которая позволяет сделать наш микс шире, объемнее, интереснее, внести в звучание новые интересные элементы. Это ревербераторы, дилеи, хорусы, флэнжеры, фэйзеры, дабллеры, питчшифтеры, гармонайзеры и так далее. Именно о таких приборах и пойдет речь. Причины, по которым я пока что упускаю из вида динамическую обработку – простые. Во-первых, если динамическая обработка используется при записи – то это уже тема для разговора о довольно серьезной студии, которая может себе позволить тонкамеру с нейтральным звуком, дорогие микрофоны, предусилители и прочее звукозаписывающее оборудование. Во-вторых, если необходима динамическая коррекция в процессе трекинга/сведения – то для этих целей можно использовать плагины Вашей DSP-системы (например, TDM-плагины ProTools). Обычно такие плагины «съедают» не так много ресурсов, как модуляционная обработка или ревербераторы, поэтому их использование внутри системы вполне оправдано. Динамическая обработка обычно используется посредством включения ее в INSERT Вашего пульта (или соответствующие ячейки программного микшера). А хорусы, ревербераторы, дилеи и прочие эффекты – в стандартных случаях подключаются к каналам AUX железного или программного пульта, основной сигнал посылается на обработку ручкой SEND на каждом канале, и, уже обработанный, возвращается в микс через RETURN. В общем, строго говоря, в рамках этой статьи нас интересует все, что можно подмешать к основному сигналу через AUX-ы. Разновидности процессоров эффектов и типы эффектов А теперь разделим процессоры эффектов на еще более мелкие группы. Первая группа – пространственная обработка. Сюда относятся ревербераторы, симуляторы пространства, дилей-машины. То есть все, что позволяет нам сформировать трехмерную картину нашего микса, расширить его не только по панораме, но и вглубь, дать возможность услышать определенный инструмент в определенной точке относительно слушателя (пространственная локализация). Нужно обратить внимание, что такой алгоритм как дилей может использоваться и как элемент формирования пространства, и просто как эффект повтора. Вторая группа – модуляционные процессоры. Их работа, в основном, построена на изменении основных характеристик звука – частоты (высоты звучания), фазы сигнала и так далее. Самые распространенные модуляционные эффекты работают по принципу задержки сигнала относительно основного. Несколько слов о каждом из модуляционных эффектов. Хорус (chorus) – наиболее востребованный и любимый многими эффект, применяется для придания звуку объема, расширения стереобазы. Как я уже говорил, в основе его лежит задержка, правда в отличие от дилея – очень короткая (5-50 миллисекунд). Обычно сигнал задерживается не в одну линию, а в 2-3, иногда в 4. Нужно быть осторожным с эффектом хоруса – 88 порой кажется, что его хочется добавить все больше и больше, но результат может оказаться плачевным. Поскольку хорус, по сути, дублирует сигнал, это может привести к проблемам с фазой, и звук потеряет читаемость. Флэнжер (flanger) – также построен на принципе задержки сигнала (515 миллисекунд), но, в отличие от хоруса, эта задержка не постоянная. Из-за «плавающего» времени задержки возвращающийся сигнал вступает в своеобразное взаимодействие с основным. Этот эффект используется гораздо реже, чем хорус, ввиду его специфичности. А также, наверное, из-за слишком частого его использования в 70-80-е годы прошлого столетия, в результате чего звучание флэнжера перестало быть чем-то уникальным и удивительным. Фэйзер (phaser) – схож с флэнжером и хорусом, но задержанный сигнал в нем дополнительно проходит через фазовый фильтр, в результате чего сдвигается его фаза (отсюда и название). Кроме того, фэйзер имеет меньшее время задержки (1-5 миллисекунд). Питч-шифтер (pitch shifter) – изменяет частоту (высоту звучания) сигнала. При незначительном изменении частоты, после возвращения обработанного сигнала в микс, можно существенно обогатить звучание источника. Особенно это бывает актуально для обработки бэк-вокальных партий. Также с помощью питч-шифтера можно корректировать интонационные ошибки исполнителя, изменять высоту звучания какого-либо инструмента и так далее. Ансамбль (ensemble) – разновидность хоруса, с применением питчшифтера в линиях задержки для небольшого изменения их высоты. Результат – более насыщенное, богатое звучание. Эффект довольно характерный, с явным винтажным оттенком, так что сегодня, когда в цене минимализм, его также применяют нечасто. Гармонайзер (harmonizer) – эффект, получаемый посредством применения нескольких линий питч-шифтера, каждая из которых сильно изменяет высоту звучания сигнала. Его также называют «интеллектуальным питч-шифтером», так как он используется для автоматической гармонизации вокальной линии или инструментальной партии. Применение гармонайзера дает возможность превратить сольного исполнителя в хор. Иногда этот эффект используется на концертах, для имитации бэк-вокала, иногда в 89 студии для схожих целей. Если такой эффект как ансамбль позволяет получить, образно говоря, из одной скрипки – квартет скрипачей, играющих в унисон (с помощью микрорасстройки), то гармонайзер дает возможность полноценного гармонического (аккордового) заполнения, смещая частоту основного сигнала на интервалы. Обычно гармонайзер позволяет задать лад (диатонику), внутри которого происходят сдвиги, чтобы избежать неприемлемого движения голосов хроматическими интервалами. Модели недорогих процессоров эффектов Перейдем непосредственно к конкретным моделям процессоров эффектов. Для начала, нужно определиться, что именно нам потребуется. Для формирования пространства микса нам обязательно будет нужен хотя бы один ревербератор (reverb) и хотя бы один дилей (delay). Так как в большинстве своем студийные приборы рассчитаны на использование только одного эффекта единовременно, за каждый из этих пунктов должен отвечать отдельный прибор. Кроме того, в необходимый набор эффектов следует включить хорус, потому что он, помимо простого уплотнения и раскрашивания звука, позволяет также сделать запись более объемной, широкой, то есть – воздействовать на воспринимаемое пространство микса. Соответственно, нам может захотеться добавить какой-то изюминки в запись – для этого нужно иметь дополнительно хотя бы один прибор, из которого мы сможем брать различные модуляционные эффекты. Таким образом, для полноценной работы нам потребуется как минимум четыре процессора эффектов. Если Вы работаете в аналоге (выводите звук на аналоговый пульт), то Ваши возможности в какой-то мере ограничены ресурсами пульта, а именно – количеством ячеек ауксов. На больших пультах обычно не менее 6-8 ауксов, а на менее дорогих микшерах с меньшим количеством каналов – иногда их бывает 4, а иногда и вообще 2. На самом деле, даже двумя ауксами вполне можно обойтись, если Вам нужен просто качественно звучащий микс. Ведь модуляция – это украшение, и оно, скажем так, опционально, тогда как формирование пространства микса – задача первоочередная. Если Вы стеснены в количестве ауксов – значит, можно обойтись только одним ревербератором плюс одним дилеем. Нужно также учитывать, что процессоры бывают узконаправленные и мультирежимные. К примеру, часто встречаются приборы, заточенные только под реверберацию или только под линии задержки (дилеи). А бывает – наоборот, внутри одного девайса собрано много разных алгоритмов. Естественно, реверберация будет более высокого качества, если Вы ее будете получать из прибора, специально разработанного именно для этого алгоритма. Но это не значит, что при необходимости нельзя воспользоваться мультипроцессором для формирования пространства. Рассмотрим недорогие варианты обработки. Здесь и далее под словом «недорогие» я понимаю приборы, цена на которые на вторичном рынке не 90 превышает 500-600 долларов. Некоторые из упомянутых ниже приборов могут стоить и гораздо дешевле – 100-150 долларов. Ревербераторы Наличие качественной реверберации обычно отличает хорошую студию от «так себе». Многие опытные звукорежиссеры советуют в качестве недорогой рабочей лошадки модели Lexicon MPX500 и MPX550. Несмотря на то, что главной силой этих процессоров является реверберация, они также имеют на борту и другие эффекты, в том числе модуляцию, и даже некоторые алгоритмы динамической обработки (которая воздействует на обработанный сигнал либо на входящий звук еще до его обработки). Эти два инструмента незначительно отличаются друг от друга. Оба имеют возможность управления по MIDI, редактирования параметров обработки, цифровые и аналоговые интерфейсы для связи с внешним миром. Любой из этих приборов обычно можно купить примерно за 300-350 долларов, что, согласитесь, весьма разумно за хороший аппарат. Оба процессора имеют высоту 1U. Другой вариант приличной реверберации – Yamaha Rev5/Rev7. Ямаховские ревербераторы звучат иначе, не так как Лексиконы. Звук более насыщенный и теплый, зернистый. При этом нельзя сказать, что Lexicon хуже – просто это разные приборы, и при наличии тех и других – они будут применимы в разных контекстах. Стоимость Yamaha Rev7 на вторичном рынке составляет примерно 350-400 долларов, а Rev5 немного выше – около 450-500. И это отличный вариант заполучить в свое распоряжение интересную, качественную обработку. Оба прибора дают возможность редактирования различных параметров реверберации, и, несмотря на довольно почтенный возраст, имеют интерфейс MIDI, посредством которого этими параметрами можно управлять с компьютера. Любая из этих Ямах займет в Вашем рэке два юнита. Дилей-машины Среди недорогих дилей-машин встречаются весьма интересные приборы, которые находят свое место и в серьезных звукозаписывающих студиях. Одним из таких инструментов является американский Symetrix 606 91 – классический дилей в однорэковом корпусе. Обладает уникальным характером звучания, очень теплым и красивым. А благодаря наличию качественных фильтров и возможности модуляции сигнала – позволяет добиться очень насыщенного, объемного звучания. Прибор двухканальный, и Вы можете выбрать сами способ его использования – раздельные линии задержки (лево и право), либо взаимопроникающие сочетания двух каналов. В последнем случае можно навести много красоты из ничего, всего лишь используя один этот прибор. Инструмент легко рулится с лицевой панели, имеет интуитивное управление, а также MIDI. Его стоимость может варьироваться, да и попадается он в продаже нечасто. Лично мне несколько лет назад подфартило купить 606-й Симетрикс за 100 долларов, но вообще его стоимость обычно колеблется от 450 до 600 американских рублей. Roland SDE-330 – прибор из линейки dimensional (что означает «пространственный»). Стереофоническая версия серии SDE, топовой (и более ранней) моделью которой является SDE-3000A (правда, эта модель существенно дороже, особенно если учесть, что она монофоническая). 330-й звезд с неба не хватает, но с поставленными задачами может справиться весьма квалифицированно. Найти его можно за 300-350 долларов, и при грамотном обращении и умелой рулежке – он послужит Вам хорошую службу. Как и другие перечисленные выше модели, имеет MIDI. Кстати говоря, если Вам интересны корни 330-го – можно поискать также модели SDE-1000 или SDE-2000. От 3000-го их отличает меньшее время задержки, но для большинства задач они будут весьма актуальны. Думаю, что цены на эти приборы также будут не более 400 долларов. Правда, поскольку они тоже монофонические, для получения стереофонического эффекта нужно будет заиметь их парочку. Мультипроцессоры Мультипроцессоры (или Multi FX) – приборы, имеющие на борту много различных алгоритмов пространственной обработки, линий задержки, модуляции. Одним из самых дешевых вариантов качественного мультиэффект-процессора является старый американский прибор, который стал классикой и полюбился многим звукорежиссерам – Alesis Midiverb II. 92 Это однорэковый инструмент, на борту которого имеется всего 100 эффектов. При этом все эти эффекты не имеют возможности редактирования. Все пресеты разбиты на условные банки. С 1 по 49 ячейки содержат алгоритмы реверберации с различными настройками, далее по 10 фленжеров и хорусов, потом 20 дилеев и еще десяток различных спецэффектов. Таким образом, из существующих пресетов всегда можно подобрать близкий Вашему контексту. Самой вкусной стороной этого процессора эффектов является его цена – его можно купить всего лишь за 100-200 долларов, в зависимости от везения, состояния и прочих факторов. И, что интересно, за эти деньги Вы получаете очень достойное качество, плюс миди-интерфейс, с помощью которого можно переключать пресеты (хотя, это и вручную делается моментально). Как мне сказал один знакомый звукорежиссер, «этот прибор создан в то время, когда инструменты еще делались музыкантами для музыкантов» – как Вы понимаете, «для себя» всегда делается максимально качественно. Кстати, многие используют Midiverb II как ревербератор, потому что реверберационные пресеты звучат очень интересно, красиво и музыкально. Еще один отличный процессор эффектов с разными алгоритмами на борту – не вылезающий из райдеров многих звезд Yamaha SPX-990. Подороже, чем многие другие, он в хорошем состоянии может стоить и 600 долларов, и даже дороже. Но если поискать и покараулить – можно найти дешевле. По крайней мере, я как-то купил себе такой за 500 долларов. Особенно в этом приборе радуют хорусы и прочие модуляционные эффекты. Они мягкие, ласковые, и очень красивые. Любое электропиано, электрогитара на чистом звуке, пэды и другие гармонические инструменты обретают удивительно приятную для слуха окраску. Естественно, есть и любые другие эффекты – задержки, ревербераторы и разные комбинированные звуки. Кстати, реверберация весьма юзабельная для ритмсекции, и если с умом подходить к наруливанию звука (а возможности рулежки очень широкие), то получаются просто отличные шумовые хвосты для малого барабана, румы для всей установки и так далее. Конечно же, прибор оборудован MIDI. Если SPX-990 оказывается дороговатым – то есть и альтернатива – Yamaha SPX-90/SPX-90II. Более ранняя модель этой серии, она попроще, покондовее, имеет более зернистый звук, и для многих вещей подходит даже больше. К примеру, классические gated reverb (ревербератор с гейтом, эффект обрубания хвоста реверберации) являются своего рода стандартом 93 для малого барабана а-ля Фил Коллинз. Да и вообще, это отличный дешевый прибор, которому Вы всегда найдете применение. А купить его можно, думаю, долларов за 150-200. И он тоже имеет MIDI. Хотелось бы рассказать о еще одном неплохом приборе, которым я какое-то время пользовался для получения модуляционных эффектов. Это Roland SDX-330 – родной брат уже упоминавшегося дилея SDE-330. На самом деле, этих братьев было трое, третий – ревербератор SRV-330, все они принадлежат к серии dimensional. Мне с ревербератором иметь дела не приходилось, но по отзывам пользователей я знаю, что он не особо интересен. Однако, экспандер, о котором я говорю (SDX-330) – весьма достойный кандидат на место в рэке. Вообще, к модуляционным эффектам требования обычно не такие высокие, как к реверберации, и конечный результат в большей степени зависит от Ваших художественных задумок. Он имеет на борту самые различные пресеты модуляции – хорусы, флэнжеры, фэйзеры, различные их вариации, комбинации, и так далее. В общем – этот процессор эффектов заслуживает внимания, особенно учитывая его невысокую цену (в районе 350 долларов). ВОПРОСЫ К РАЗДЕЛУ 2 1. Каково назначение автоматических регуляторов уровня? 2. Принцип действия безынерционного ограничителя (пикосрезателя). Почему пикосрезатели не используют в звукотехнике в виде самостоятельных устройств? 3. Какие основные узлы входят в состав обобщенной схемы авторегулятора уровня? Основные функции, выполняемые этими узлами. 4. Понятие диапазона ограничения, сжатия, расширения. Каков физический смысл коэффициентов сжатия и расширения? 5. Почему в инерционном ограничителе максимальных уровней удается избежать ощутимых нелинейных искажений? 6. В чем заключается принцип действия ограничителя максимальных уровней? 7. Назначение компандерной системы. В чем заключается принцип действия сжимателя динамического диапазона? Какой из видов регулировки чаще всего используется в сжимателях? 8. Принцип действия расширителя динамическою диапазона. Почему в расширителях применяется только прямая регулировка? 9. Вид амплитудных характеристик сжимателя и расширителя. 10. Какие элементы автоматических регуляторов определяют их временные параметры? 11. Как нормируются временные параметры авторегуляторов? Определения времени срабатывания tcp и времени восстановления tв. 94 3. СИСТЕМЫ ШУМОПОДАВЛЕНИЯ В УСТРОЙСТВАХ ЗВУКОЗАПИСИ Качество звучания в ЗВ, звукозаписи, устройствах звукоусиления и связи ухудшают различные мешающие воздействия, именуемые помехами. По происхождению помехи разделяют на акустические и электрические. Электрические в свою очередь подразделяют на космические, атмосферные, промышленные, внутренние. Помехи также классифицируют по слуховому воздействию, виду спектра, длительности, диапазону частот. Различают: - сосредоточенную помеху с линейчатым спектром (например, фон I~ f = 50, 100, 150, 300 Гц), воспринимаемую как «гудение»; - помеху с широким непрерывным спектром, вызываемую чаще всего термическим (тепловым) движением носителей зарядов (например, электронов и проявляющуюся как шум); - импульсную помеху с широким спектром, но кратковременным воздействием, воспринимаемую как щелчки и потрескивания; - внятную переходную помеху с широким спектром, образующуюся при паразитных связях между цепями, по которым передаются речевые и музыкальные сигналы. Причины помех: 1. Недостаточная звукоизоляция помещений. 2. Пульсации выпрямленного тока в источниках питания, электрические «наводки» от цепей переменного тока. 3. Флуктуации электронов и других заряженных частиц в проводниках, резисторах, электронных приборах. 4. Посторонние электрические и магнитные поля, создаваемые трансформаторами, электродвигателями, цепями переменного тока, соседними цепями в многопарных кабелях. 5. Недостатки носителей записи, обусловленные неоднородностью магнитной ленты, граммпластинки, а также копир-эффект и модуляционный шум. 6. Посторонние источники в радиодиапазонах (другие радиостанции, атмосферные электрические разряды, промышленная, медицинская, бытовая электроаппаратура). Существует задача снижения уровня помех до такого значения, при котором они незаметны или мало заметны на слух даже в тихих местах звучания и в паузах. Часть помех снижают до приемлемого значения в местах их возникновения техническими мерами. Устройства и системы шумоподавления служат для борьбы с помехами, уже проникшими в аудиотракты или тракты ЗВ. Системы шумоподавления условно разделяют на три группы: 95 По признаку воздействия на характеристики (АЧХ или амплитудную). 1) 1ая группа – изменяет форму АЧХ тракта и соответственно спектр сигнала. 2) 2ая группа – регулирует динамический диапазон сигнала. 3) Смешанные устройства –регулирует и АЧХ и амплитудную характеристику. По признаку отсутствия или наличия регулирования во времени. Различают системы: статические; динамические; В статических системах воздействия на амплитудную или АЧХ неизменно во времени. В динамических системах оно зависит от интенсивности и спектра сигнала и помехи. Примером статической системы шумоподавления служит система предыскажений, когда в звуковой тракт вносят частотные искажения с целью такого изменения спектра сигнала на входе тракта, чтобы лучше противостоять помехам, воздействующим на тракт (рисунок 3.1). Возможность введения частотных предыскажений основывается на том, что формы огибающих спектров сигнала и помехи различны и не совпадают по частотам. Частотные предыскажения в области верхних частот широко применяется в механической и магнитной записи звука, в МКЗВ и соединительных линиях, в МВ-ЧМ радиовещании, в передатчиках ТПВ. Среднестатический выигрыш, создаваемый частотными предыскажениями, составляет 4…5 дБ. Рисунок 3.1 – Схема и спектры частотных предыскажений Иногда системы предыскажений вызывают возрастание нелинейных искажений, увеличение копирэффекта при магнитной записи, появление «Сискажений» при МВ-ЧМ радиовещании (проявляются на свистящих и шипящих звуках). Причина: разброс уровней натуральных звучаний музыкальных инструментов в областях НЧ и ВЧ достигает 30 дБ (большие уровни характерны для современных музыкальных ансамблей с электронными музыкальными инструментами и мощной ритмической группой). 96 Во избежание превышения номинального уровня при применении предыскажений уровни контролируют с помощью многополосного измерителя уровня и корректируют спектр сигнала вручную (это же при звукозаписи), либо включают (например, на вход передатчика МВ-ЧМ) устройство, анализирующее спектр и автоматически уменьшающее коэффициент передачи на верхних частотах при возникновении опасности перемодуляции (ограничители с переменным предыскажением). В силу особенностей слухового восприятия уменьшение уровня ЗС, например, с N1 до N2 , приводит к субъективному сужению полосы слышимых частот (рисунок 3.2). Рисунок 3.2 – Сужение полосы слышимых частот Можно соответственно сужать полосу пропускания и тем самым «отсекать» области частот, в которых содержатся помехи. Таким образом, сужение полосы пропускания тракта уменьшает влияние помех, частоты которых лежат вне спектра сигнала. Ограничение полосы бывает и динамическим, когда полоса пропускания устанавливается минимальной в паузе и при небольших уровнях сигнала. Желательно ограничивать полосу пропускания не только на верхних, но и на нижних частотах во избежание нарушения баланса громкостей низко- и высоко частотных составляющих ЗС. Для этой цели применяют управляемые фильтры, осуществляющие динамическое регулирование полосы пропускания (рисунок 3.3, 1 – малые уровни, 2 – средние, 3 – большие). Подробнее такие шумоподавители будут еще рассмотрены. Рисунок 3.3 – Схема и коэффициент передачи управляемого фильтра 97 3.1 Шумоподавление в устройствах звукозаписи Серьезный недостаток современных магнитофонов – высокий уровень шума (особенно при малых скоростях записи). Для борьбы с шумом применяются устройства шумоподавления. 1 Группа. Шумоподавители включаются только в тракт воспроизведения (и нет предварительной обработки сигнала при записи). Достоинство: возможность улучшать качество ранее записанных фонограмм. 2 Группа. Относятся устройства, требующие обработки сигнала как при записи, так и при воспроизведении. Эффект компенсации создается только при этом условии. Иначе искажения сигнала вместо шумоподавления. Шумоподавление в его исходном смысле – есть удаление шумов с уже готовых фонограмм. В этом случае сигнал обрабатывается только при воспроизведении, поэтому такие шумоподавители называются «односторонними» (singleended). Самым первым односторонним шумоподавителем был простейший блокиратор сигналов (noise-gate или гейт) в паузах фонограмм. Он действовал как простой выключатель – либо полностью пропускал входной сигнал на выход, либо просто же его подавлял. Во многих случаях он был полезен, но реального подавления шумов не осуществлял. Иногда даже наоборот, делал их субъективно более заметными – когда после абсолютной тишины (в паузе) начинало звучать тихое место фонограммы, на котором шумы как раз наиболее заметны. Поэтому в настоящее время гейты практически не применяются. Для борьбы с описанным эффектом были разработаны самые различные системы шумоподавления, в основном для прослушивания записей с магнитофонов. Типичной разработкой является динамический ограничитель шума – DHL (Dynamic Noise Limiter). Рассмотрим принцип действия шумоподавителя 1ой группы DNLдинамический ограничитель шума. Идея. Работа основана на учете следующего фактора: в спектре музыкальных сигналов содержание высокочастотных компонентов зависит от громкости. С уменьшением громкости сигналов относительное содержание ВЧ компонентов снижается. Так при очень низком уровне звукового сигнала (пианиссимо) ширина спектра, излучаемого большинством музыкальных инструментов не более 4.5 кГц. Поэтому для тихих звучаний при воспроизведении можно уменьшать полосу пропускания. При этом подавляются ВЧ компоненты шума. 98 При громком звучании полоса пропускания должна быть максимальна. Шум на выход попадает полностью, но он маскируется громким сигналом. АРУ дБ U2 - UВХ Uвых  РФ + 180 U1 Рисунок 3.4 – Структурная схема DNL. Входной сигнал поступает на расщепитель фазы (РФ). На его выходе два сигнала, сдвинутые по фазе на 180˚ . Сигнал U1(+) подается на сумматор непосредственно. Другой сигнал U2 – поступает на сумматор после обработки в цепи управления. Цепь состоит из: ФВЧ – подавляет составляющие сигнала ниже 4.5 кГц; Усилитель – усиливает ВЧ составляющие; АРУ – регулирует уровень ВЧ состава сигнала; Удлинитель – вносит затухание (компенсирует усиление усилителя). На выходе сумматора НЧ составляющие спектра сигнала в полосе до 4.5 кГц проходят по прямому каналу без изменений. Для ВЧ составляющих коэффициент передачи схемы зависит от уровня сигнала. Uвых= U1-U2=Uвх-U2 т.к. U1=Uвх В полосе до 4.5 кГц U2=0 и Uвых=Uвх (рисунок 3.5 а), Напряжение U1 пропорционально Uвх. В полосе выше 4.5 кГц зависимость U2 от Uвх имеет вид, представленный на рисунке 3.5 б. а) б) Рисунок 3.5 – Амплитудные характеристики трактов для U2 (а) и U1(б) 99 Графическим вычитанием представленную на рисунке 3.6. получаем зависимость Uвых от Uвх:, Рисунок 3.6 – Амплитудная характеристика DNL Из рисунка видно, что для сигналов с малым уровнем коэффициент передачи уменьшается, чем и определяется подавление шумов. Параметры DHL. - Пороговое значение U1, при котором начинает действовать шумоподавление на 38 дБ ниже Uном (соответствует нижней границе Dc). - Улучшение отношения с/ш на f=6 кГц ~ на 50 дБ, на f>10 кГц более чем на 20 дБ. Т.к. DHL включается только в тракт звуковоспроизведения, то он может использоваться со звукозаписывающей аппаратурой разных типов. DHL может использоваться для улучшения качества звучания старых фонограмм. DHL используется и в профессиональных системах для реставрации старых фондовых фонограмм. DHL подавляет только аддитивный шум (шум паузы, шум усилителей и внешние помехи). Динамический подавитель шума (DNR) (рисунок 3.7). Рисунок 3.7 – Структурная схема DNR 100 Динамический подавитель шума работает по принципу управляемого фильтра. В канал передачи включается фильтр НЧ 1го порядка с управляемой частотой среза в полосе от 800 Гц до 30 кГц. Граничная частота ФНЧ изменяется в зависимости от уровня сигнала (суммарного). Управляющий сигнал выделяется из суммарного (стереофонического) сигнала в полосе частот выше 6 кГц и зависит от его уровня. Выпрямитель уровня управляющего сигнала работает как пиковый детектор с постоянной времени срабатывания tср=0.5мс и постоянной времени восстановления tвос=50мс. Максимальное подавление шума около 14 дБ. При таком уровне сигнала (когда почти нет ВЧ составляющих) сигналы отфильтровываются фильтрами НЧ (т.е. их граничная частота понижается). Рассмотренные способы в иностранной литературе получили название некомплементарных. Несмотря на различные названия эти (DHL, DNR) и многие другие устройства шумоподавления работали примерно одинаково – ослабляли ВЧ составляющие сигнала, если их уровень в исходном сигнале был мал. Для прослушивания записей это давало приемлемый эффект, но не годилось для профессиональной работы (кому из звукорежиссеров понравится непредсказуемое изменение тембра фонограмм при записи или сведении?). Реальный прорыв в области шумоподавления был достигнут после изобретения шумоподавителя, в котором для уменьшения шумов применялся адаптивный фильтр, который изменял полосу своего пропускания в зависимости от спектра обрабатываемого сигнала. Наиболее известное отечественное устройство такого рода – это динамический фильтр «Маяк», которым оснащались некоторые советские магнитофоны. Западные производители начали выпуск таких устройств 20 лет тому назад и не прекращают сейчас в эпоху увлечения компьютерными обработками. В самом деле, ведь компьютеры не особо потаскаешь с собой на концерт, дискотеку и другие места, где может понадобиться шумоподавитель. Да и большинство программ не работают в реальном времени. Кроме того нужно учитывать капризность их операционных систем и самого программного обеспечения. Поэтому сбрасывать со счетов аналоговые шумоподавители рано. Итак – как же работает современный шумоподавитель, имеющий также общепринятое название денойзер (denoiser). Сердцем денойзера является особый фильтр, изменяющий полосу своего пропускания в зависимости от спектра обрабатываемого сигнала. Управляющая этим фильтром электронная схема постоянно анализирует входной сигнал. 101 На основе этого анализа схема перестраивает параметры фильтра так, что: - обеспечивает максимально благоприятные условия для передачи полезных составляющих сигнала; - максимально ослабляет его мешающие, шумовые компоненты. Практически все серийно выпускаемые денойзеры в качестве самого фильтра применяют только один фильтр – фильтр низких частот (ФНЧ или Lo-Pass). Он обрезает все высокочастотные помехи, которые лежат за пределами полосы частот, занимаемой полезным сигналом, и не маскируются им. Суть процесса маскировки иллюстрируется рисунком.3.8. Lnc, дБ Li=100 дБ 80 60 80 40 60 20 0.002 20 0.005 0.1 0.2 0.5 40 1 2 5 8 f, кГц Рисунок 3.8 – Зависимость уровня порога маскировки от частоты На этом рисунке приведены несколько колоколообразных кривых, показывающих величины маскировки в зависимости от величины тестового сигнала. В качестве него используется синусоидальный тон частотой 1000 Гц, а цифры на кривых – обозначают уровень тестового сигнала. Рассмотрим для примера одну из кривых – например ту, которая соответствует уровню тестового сигнала в 80 дБ, это вторая кривая сверху. Она показывает, что в описанных условиях все сигналы, лежащие ниже этой кривой, слухом не воспринимаются. Таким образом, сигнал помехи с частотой около 2 кГц и уровнем порядка 40 дБ, находящийся близко к тестовому, как бы «попадает в его тень» (полосу маскировки), и слухом не воспринимается. Если же сигнал помехи имеет частоту около 8 кГц и уровень всего в 10 дБ, то он уже не попадает в полосу маскировки, и будет вполне отчетливо восприниматься слухом. Однако этот сигнал помехи меньше уровня полезного сигнала (80 дБ) на целых 70 дБ. Поэтому столь малой величиной можно пренебречь. Т.е. в указанных уровнях, если пропустить суммарный сигнал сквозь ФНЧ с граничной частотой около 6 кГц - то, как следует из графика, шумов 102 мы не услышим вообще. Т.е. шумы присутствуют, но слух их не воспринимает. Поступить аналогично с низкочастотными составляющими шума нельзя. Кривые маскировки для частот, лежащих ниже полезной (на графике – они левее частоты тестового сигнала), имеют гораздо более резкий спад. На практике это означает, что частота среза фильтра, который ограничивал бы полосу пропускания снизу, должна быть гораздо ближе к частоте полезного сигнала, чем в ранее рассмотренном примере. Это влечет за собой неизбежное увеличение сложности управляющей схемы. Казалось бы, само по себе и не очень страшно, если не считать существенного удорожания прибора. Но, кроме точности управления фильтром по частоте, необходимо еще обеспечить и достаточное быстродействие, чтобы при быстро возникающем низкочастотном звуке его начальная часть (атака) не была бы «съедена» прибором. А вот это уже попросту невозможно, так как при большой скорости изменения АЧХ фильтра он будет сам вносить искажения в сигнал, поскольку скорость его перестройки становится уже сопоставимой со скоростью изменения низкочастотного сигнала, точнее – с его периодом. Все вышеизложенные причины и привели к тому, что во всех денойзерах отдельного фильтра для устранения (обрезки) НЧ-шумов нет. Таким образом, АЧХ денойзера имеет вид АЧХ НЧ-фильтра, частота среза которого тем выше, чем больше уровень входного сигнала, и чем выше наибольшая частота, присутствующая во входном сигнале (рисунок 3.9). L, дБ 120 100 80 40 10 -10 100 500 1000 5000 10000 f, кГц Рисунок 3.9 – АЧХ ФНЧ На рисунке 3.9 стрелкой показано направление изменения АЧХ при увеличении уровня и/или расширении спектра входного сигнала. В лучших моделях денойзеров, кроме собственно адаптивного фильтра, бывает добавлено еще и устройство для уменьшения шумов в паузах сигнала. Обычно это экспандер. 103 Работа всех компьютерных программ-денойзеров основана на разделении входного сигнала большим количеством узкополосных фильтров и подачи этих узкополосных сигналов на свои индивидуальные гейты. Затем выходы всех индивидуальных гейтов суммируются, и получается очищенный сигнал. Из принципа действия очевидна нереальность любой попытки изготовить такой денойзер в аналоговом виде (число индивидуальных полосовых фильтров и гейтов может составлять несколько десятков тысяч). Поэтому такие денойзеры существуют только в цифровом виде (воплощенных в «железе» или чисто программных). Основная проблема в таких шумоподавителях – это нереальное количество органов управления, т.е. задаваемых параметров. Выход был найден в том, что основные параметры гейтов устанавливаются автоматически. Перед началом работы программыденойзера на подлежащем обработке материале выбирается отрезок, не содержащий полезного сигнала, а только шумы. Этот образец шума и используется для настройки порогов гейтов. Программные денойзеры создают характерные искажения исходного сигнала (артефакты), связанные с разделением сигнала на большое количество очень узких полос. Вследствие поочередного исчезновения из звукового сигнала отдельных узких полос его составляющих (при работе гейтов), сигнал приобретает весьма характерный «фленджерный» призвук. Это явление принципиально не устранимо, но может быть сделано достаточно малозаметным. Компандерные системы шумопонижения. Вторая большая группа устройств шумопонижения предназначена, главным образом, для расширения динамического диапазона трактов записивоспроизведения, хотя иногда они применяются и в трактах приема-передачи – например, радиомикрофонов. В отличие от ранее рассмотренных, эти системы абсолютно ничего не изменяют в исходном сигнале. Они только улучшают условия передачи сигнала через тот тракт, в котором установлены. И уменьшить уровень шумов непосредственно в обрабатываемом ими сигнале нельзя. Это не означает, что нельзя улучшить отношение сигнал/шум на выходе тракта. В этом случае на входе тракта сигнал подвергается компрессированию, а на выходе – экспандированию. Оба этих процесса могут быть еще и частотнозависимыми. От объединения частей слов КОМПрессор и экспАНДЕР и родилось общее название таких систем – компандерные системы шумопонижения Компандер – это общее название устройств, применяемых для расширения динамического диапазона путем компрессии сигнала на входе и последующего экспандирования на выходе. 104 Недостатки компадерной системы: 1. Появление на выходе системы эффекта модуляции сигнала шумом, т.к. уровень шума на выходе изменяется в такт с сигналом. 2. Нелинейные искажения в переходных режимах из-за несовпадения частотных и фазовых характеристик К и Э и несовпадения их временных характеристик tср и tвос. Это ведет к искажению фронтов и спадов сигнала, что для музыкальных программ недопустимо. 3. При регулировке не учитываются мгновенные спектры сигнала и помехи. При большом различии спектров сигнала и шума изменение уровня шума одновременно с изменением сигнала может быть воспринято как возрастание шума  Uш↑, Uc↑ Kk min↑ Kэ max и воспринимается на слух как рост уровня шума, если спектры сигнала и шума не совпадают. При совпадении спектров сигнала и шума, последний маскируется сигналом (при НЧ сигнале ВЧ шум заметен) – эти недостатки в большей степени присущи частотнонезависимым системам компандирования – dbx. Система шумоподавления dbx (комплементарные широкополосные компандеры). В этой системе используется классический широкополосный компандер с коэффициентом 2, т.е. на входе системы (например, при записи) сигнал кодируется (компрессуется) с коэффициентом сжатия (Ratio) равным 2, а на выходе (при воспроизведении) – декодируется (разжимается, или экспандируется) с коэффициентом, обратным компрессованию, и равным 0.5. Таким образом, в сквозном тракте не происходит изменения амплитудных (как, впрочем, и иных) характеристик сигнала. В таких шумоподавителях степень увеличения отношения сигнал/шум зависит от уровня сигнала. Чем меньше сигнал, тем сильнее возрастает отношение сигнал/шум. Существуют две основные версии системы шумоподавления dbx, носящие названия «Тип 1» и «Тип 2». Различие у них только в полосе сигнала, который воспринимается управляющими схемами (детекторами) компрессора и экспандера. Тип 1 имеет наиболее широкополосный вход детектора, и предназначен для работы с катушечными магнитофонами на скоростях 38 и 76 см/с. Тип 2 предназначен для работы с более узкополосными трактами, вроде кассетных магнитофонов и телефонных линий. Однако ограничение полосы частот относится только к схемотехнике цепей управления, и никак не связано с собственно звуковым трактом. Важным качеством системы dbx является отсутствие явно выраженного порога срабатывания. Благодаря этому записи, сделанные с применением dbx без особых проблем воспроизводятся на других аппаратах. На рисунке 3.10 приведена структурная схема компандера dbx-II. 105 ПФ предкорректор Вых одной корректор канал Uвх Uвых 27Гц 20кГц детектор эф ф етив. значений 370Гц 1.59кГц частотное взвешивание Uу Uу 27Гц 10кГц 27Гц 20кГц 370Гц 1.59кГц частотное взвешивание детектор эф ф етив. значений Рисунок 3.10 – Структурная схема компандера dbx-II Коэффициент сжатия этого компандера равен 2. На входе включен полосовой фильтр с граничными частотами 27 Гц и 20 кГц. Далее следует фиксированный предкорректор верхних частот (граничные частоты 370 Гц и 1.59 кГц), который обеспечивает подъем уровня сигнала в области выше 2 кГц на 10 дБ. Эта мера позволяет понизить относительный уровень ВЧ шума в канале воспроизведения даже при небольшом сжатии. Для исключения перегрузки канала при больших сигналах верхних частот, в детекторе уровня имеется каскад взвешивания частотной характеристики (фильтр ВЧ с граничной частотой fгр = 48 кГц и частотный корректор, работающий в полосе от 440 Гц до 4.8 кГц). Уровень сигнала определяется двухполупериодным выпрямителем эффективных значений. Поскольку частота управляющего сигнала не меньше 50 Гц, то постоянные времени срабатывания и восстановления в этой цепи имеют значения не меньше 20 мс. Рисунок 3.11 – Амплитудная характеристика dbx 106 Коэффициент усиления управляемого усилителя в логарифмическом масштабе линейно связан с управляющим напряжением (Uу), что достигается каскадированным включением элементов схемы с взаимнообратными (логарифмической и антилогарифмической) характеристиками. Система преобразования dbx Type IV. Запатентованный алгоритм аналогово-цифрового преобразования, который объединяет некоторые характерные особенности цифрового преобразования и аналоговой записи в целях сохранения сущности аналогового сигнала при преобразовании в «цифру». dbx Type IV [3] позволяет не только использовать широкий динамический диапазон современных АЦП в линейной области, но и расширить его за счет нелинейной. dbx Type IV создает в верхней части диапазона, где системы аналогово-цифрового преобразования уже не могут обеспечивать линейного возрастания уровня сигнала, область перегрузки (Over Region) с логарифмической зависимостью. Этот дополнительный запас по перегрузке, который является естественным для аналоговой записи, при помощи системы dbx Type IV становится доступным и для «цифры», при этом соотношение сигнал/шум не понижается. Основное преимущество, благодаря которому компакт-диск, как новый носитель, успешно продвигался на рынке – особенная чистота звучания копии аналоговых записей, сделанных за предшествующий многолетний период. Это преимущество было обусловлено более широким, по сравнению с аналоговыми носителями, динамическим диапазоном. Стандартное соотношение сигнал/шум 16-битных систем записи звука – примерно 90 дБ. При аналоговой записи на профессиональную ленту, собственный динамический диапазон которой составляет всего 55 дБ, такого соотношения не удавалось добиться даже при помощи систем шумоподавления (в лучшем случае – 85 дБ). Преимущества цифровой техники в области звукозаписи известны: - выше соотношение сигнал/шум; - обеспечение произвольного доступа; - возможность многократного копирования без ухудшения качества сигнала. Тем не менее аналоговая запись обладает определенными првлекательными особенностями, которые особенно проявились в последнее время. Известно, что ленту можно «хорошенько нагрузить», не испортив при этом звучания. В технических характеристиках аналоговых магнитных лент реальный запас по перегрузке не публикуется, соответственно не может быть «законно» принят расчет. Соотношение сигнал/шум для аналоговой ленты вычисляется относительно максимального уровня записанного сигнала определенной частоты, при котором возникает определенное количество гармонических 107 искажений (THD). Обычно это уровень, при котором в сигнале частотой 1000 Гц коэффициент гармоник не превышает 3%. На практике же сигнал в пиках может превысить этот уровень на 5, 10 или даже 15 дБ без слышимых искажений. Конечно, при таком высоком уровне сигнала искажения тоже увеличиваются, но в данном случае они рассматриваются как эффект, называемый «насыщение ленты», звучание которого стало популярным в эпоху возрождения ламповой техники. Очевидно, что аналоговая запись позволяет на практике использовать более широкий динамический диапазон, нежели указано в технических характеристиках магнитной ленты. Очень часто при записи громких звучаний (например, барабана) в пиках, превышающих границу допустимых искажений на 15-20 дБ, они при воспроизведении звучат «красиво» (или приятно на слух). Поэтому при включении системы шумоподавления (увеличивает Dc на 20 дБ), динамический диапазон воспроизводимого сигнала составит не менее 90 дБ, что сравнимо с 16-битной «цифрой». В цифровых же системах перегрузки недопустимы (т.е. не допускают искажений, звучание которых может нравиться). При перегрузке АЦП порождают собственные побочные эффекты, и воспроизведение годится только для озвучения драки медведя с павианом. Это обстоятельство привело к тому, что уровень сигнала на всех этапах записи занижают, следовательно, динамический диапазон сигнала снижается. Цель создания dbx Type IV – обеспечить использование динамического диапазона, превышающего возможности самих аналогово-цифровых преобразователей и сберечь максимальное количество информации об аналоговом сигнале, которая затем кодируется с разрешающей способностью конкретного преобразователя. Идея работы системы dbx Type IV состоит в следующем: Разработчики из компании dbx использовали то, что цифровая система записи по сравнению с аналоговой имеет более широкую область возрастания линейного уровня записанного сигнала. Был создан алгоритм, позволяющий использовать верхние 4 дБ (обычно представленные в линейном соотношении с входным уровнем) для создания области, в которой уровень преобразованного сигнала представлен в логарифмическом соотношении. Это позволяет представить в пределах всего лишь четырех дБ фронты сигнала, уровень которых гораздо выше точки, где начинается область перегрузки. На рисунке 3.12 представлено изменение уровня преобразованного сигнала ниже и выше начала области перегрузки. Уровень преобразованного сигнала отложен по вертикали, а уровень входного сигнала – по горизонтали. Логарифмическое распределение сигнала начинается на 4 дБ ниже уровня 0 дБ по полной шкале, обычно применяемой в аналогово-цифровых преобразователях. 108 Рисунок 3.12 – Соотношение уровней сигнала до и после аналоговоцифрового преобразования с использованием системы dbx Type IV В так называемой «логарифмической области» сигнал, реальный уровень которого гораздо больше, распределяется в диапазоне 4 дБ. Этот прием подобен эффекту компрессования звука, появляющемуся при записи высокого уровня в аналоговом виде на магнитную ленту (из-за нелинейности кривой намагничивания). Эту аналогию иллюстрирует рисунок 3.13. Входные уровни показаны в левой части графика, а уровни преобразованного сигнала – в правой. Сигналы большого уровня плавно распределяются в области с диапазоном всего 4 дБ. Рисунок 3.13 – Уровни входного сигнала, распределенные по области перегрузки, созданной системой Type IV 109 Амплитуда Время Уровень перегрузки АЦП Амплитуда Время -Сигнал после прохождения АЦП Уровень перегрузки АЦП Амплитуда Полностью потерянная высокочастотная информация Высокочастотная составляющая Низкочастотная составляющая Уровень перегрузки АЦП Время Уровень перегрузки АЦП Полностью потерянная высокочастотная информация Рисунок 3.14 – Потеря ВЧ-информации, возникающая из-за прерывания А/Ц преобразования Уровень перегрузки АЦП Амплитуда 0 дБ Перераспределение уровня системой TYPE IV -4 Время -4 Перераспределение уровня системой TYPE IV Уровень перегрузки АЦП 0 дБ Рисунок 3.15 – ВЧ-составляющая сигнала сохранена 110 Еще одно преимущество логарифмического соотношения уровней, применяемого в системе Type IV – возможность сохранения высокочастотных деталей сигнала. Рисунки 3.14-3.15 иллюстрируют, что происходит с сигналом при перегрузке АЦП без применения системы Type IV. На рисунке 3.14 представлен входной сигнал, в котором присутствуют и высокочастотные, и низкочастотные составляющие. Если АЦП перегрузится, (рисунок 3.14), из сигнала выпадет непропорциональное, по сравнению с низкочастотными, количество высокочастотных составляющих. Чтобы проиллюстрировать ситуацию подробнее, на рисунке 3.14. низкочастотные и высокочастотные составляющие разделены. Рисунок поясняет, что при перегрузке АЦП низкочастотная часть сигнала исказиться, но сохранит большинство характеристик, зато высокочастотная составляющая будет потеряна полностью! На рисунке 3.15 показано, как применяемое в Type IV перераспределение информации позволяет сохранить ВЧ-составляющие. Уровень удерживается строго в зоне перегрузки, и никогда не выпадает из нее. Пунктирные линии показывают исходный уровень входного сигнала. Если напряжение входного сигнала ниже заданного областью перегрузки, перераспределения не происходит. Если исходное напряжение выше, то алгоритм Type IV прижимает пики сигнала, которые иначе, выходя за пределы полной шкалы, вызвали бы прерывания в А/Ц преобразовании. Именно таким образом Type IV сохраняет ВЧ-составляющие сигнала. Преимущество системы легко услышать, включая и выключая ее во время прослушивания звукового материала с большим количество пиков высокого уровня. При выключенном алгоритме слышны безобразные хрипы – звук перегруженного АЦП. При включенном алгоритме цифровое представление исходного сигнала будет более аккуратным и чистым. Разработчики позаботились о том, чтобы пользователь забыл о перегрузке своего АЦП, и, послушав его работу, понял, что Type IV – это не игра с уровнем шума. Просто система преобразования dbx Type IV – это грамотное сочетание наилучших аналоговых и цифровых методов обработки сигнала, позволяющее не просто использовать полный динамический диапазон звукового материала, но и поймать истинную сущность ЗВУКА. Известно, что эффективность действия устройств шумоподавления повышается, если спектр звуковых частот разделить на несколько сравнительно узкополосных участков и в каждой такой полосе частот регулирование коэффициента передачи производить раздельно, выбрав для этого более подходящие динамические параметры. Как показывает опыт, достаточно спектр полезного сигнала поделить на 3-4 части. Для порогового ШП чисто используют четырехполосную структуру, показанную на рисунке 3.16 со следующими полосами частот: 0…1.5 кГц; 1.5…3 кГц; 3…6 кГц и выше 6 кГц. В полосе частот 0…1.5 кГц, в которой 111 сосредоточена основная часть энергии звука, регулирование не производится. В остальных полосах осуществляется пороговое шумоподавление, причем динамические параметры выбираются в соответствии со свойствами сигнала в этих частотных полосах. Кроме этого, можно автоматически изменять границы каждой полосы при изменении спектра сигнала для повышения эффективности работы такого устройства. ФНЧ 0...1.5 ПФ 1.5...3 Пороговый ШП ПФ 1.5...3 ПФ 3...6 Пороговый ШП ПФ 3...6 ФВЧ >6 кГц Пороговый ШП ФВЧ >6 кГц Рисунок 3.16 – Четырехполосная структура шумоподавления Поэтому были созданы компандеры с переменной представители: Dolby-B и -C – для бытовой радиоаппаратуры; Dolby-A и -SR – для студийной аппаратуры. АЧХ. Их Общим признаком всех шумоподавителей Dolby является наличие в них основного канала звукопередачи и вспомогательной параллельной ветви, управляющей процессом шумоподавления. Уровень сигнала во вспомогательном канале намного ниже, чем в основном. Многополосные АРУ«Dolby» внедрены в устройства магнитной, механической и оптической записи, в радиовещание в диапазоне МВ-ЧМ. Системам ШП Dolby свойственны некоторые общие принципы: 1. Спектр записываемых (передаваемых) сигналов разделяется на несколько частей. 2. В каждой частотной полосе регулирование осуществляется независимо при наиболее подходящих динамических параметрах; 3. Выходной сигнал в каждой полосе формируется путем сложения или вычитания сигналов, прошедших основной нерегулируемый и дополнительный регулируемый тракты. 112 4. Преобразование уровней ведется не во всем динамическом диапазоне, а лишь в ограниченной его части – в области малых и средних уровней. Обобщенная структурная схема системы «Dolby-A» изображена на рисунке 3.17. основной тракт + +  дополнительный тракт(к) основной тракт  ТРАКТ - - инвертор дополнительный тракт(з) Рисунок 3.17 – Структурная схема системы «Dolby-A» N вх ,дБ -60 -20 -40 -20 1 3 -40 2 -60 N вых, дБ 1 – характеристики передающего звена 2 – характеристики приемного звена 3 – результирующая характеристика Рисунок 3.18 – Амплитудные характеристики Регулирование производится не во всем диапазоне входных уровней, а при сравнительно небольших уровнях. Это уменьшает заметность переходных процессов. При больших уровнях помехи маскируются сигналом. Входной сигнал распределяется по двум путям, причем в основном тракте он не регулируется, а в дополнительном подвергается регулированию с помощью сжимателя. Затем обе составляющие складываются в сумматоре. В результате сигналы большого уровня не претерпевают изменений, поскольку коэффициент передачи дополнительного тракта при больших входных сигналах мал. 113 При малых входных уровнях коэффициент передачи дополнительного тракта увеличивается, доля сигнала этого тракта относительно основного становится больше и уровень сигнала на выходе сумматора 1 возрастает. В приемной части системы сигнал с выхода поступает на сумматор через расширитель уже инвертированным и вычитается из общего сигнала, вследствие чего восстанавливается исходные соотношения уровней. Полная структурная схема системы «Dolby-A» приведена на рисунке 3.17. Y1 +  ТРАКТ +  Y2 + ФНЧ <80Гц ПФ 80...3000 ФВЧ >3000 ФВЧ >9000 инвертор Огр Сж Рас Огр Огр Сж Рас Огр Огр Сж Рас Огр Огр Сж Рас Огр ФНЧ <80Гц ПФ 80...3000 ФВЧ >3000 ФВЧ >9000 Рисунок 3.19 – Полная структурная схема системы «Dolby-A» Особенность дополнительных трактов та, что в них разделяется на четыре части с помощью фильтров, пропускающих полосы частот 30…80 Гц; 80…3000 Гц; 3000…20000 Гц и 9000…20000 Гц (рисунок 3.20). Рисунок 3.20 – Коэффициенты передачи дополнительных трактов Выбор полос предопределен спектром наиболее характерных шумов и помех и особенностями их восприятия слухом. 114 Таблица 6. ПОЛОСЫ Тип помехи ФНЧ 1 канал – фон переменного тока 50 Гц ПФ 2 канал – переходные помехи и помехи от копирэффекта 3 и 4 каналы – ВЧ модуляционные шумы и структурные помехи, ФВЧ обусловленные неоднородностью ферромагнитного слоя ленты В каждой из полос динамический диапазон сжимается и, соответственно, потом расширяется путем изменения коэффициента передачи только при уровнях, лежащих ниже определенного нормированного уровня Nнорм. Сигналы более высокого уровня проходят через систему без изменений. Для поддержания номинального уровня сигнала и устранения выбросов ЗС при его прохождении через сжиматели и расширители перед ними включены ограничители максимальных уровней. Улучшение отношения С/П в диапазоне частот 30- 15000 Гц составляет примерно 10 дБ, а на более высоких частотах 15 дБ. Аналогичная система ШП, но с несколько другими граничными частотами и без перекрытия полос, разработана фирмой «Телефункен». Эффективность регулирования в системе «Dolby-A» повышена за счет разделения звеньев, особенно если энергия сигнала сосредоточена в какойлибо одной полосе. Ввиду большого уровня сигнала в этой полосе нет регулирования, в других полосах сигнал мал, регулирование происходит эффективно, шум хорошо подавляется и отношение С/П растет. C Gш Gсхш f0 f  fрег f Рисунок 3.21 – Спектры шума и С х Ш Положительная сторона системы «Dolby-A» – подавление мультипликативной, модуляционной помехи, возникающей, например, из-за неконтакта при воспроизведении магнитной фонограммы. Эта помеха преобладает среди других помех тракта воспроизведения. В результате 115 воздействия модуляционного шума на колебания одной частоты f0 спектр воспроизводимого сигнала будет состоять из составляющей частоты f 0 , окруженной двумя боковыми полосами, форма которых повторяет форму спектра модуляционного шума, т.е. будет напоминать спектр амплитудномодулированного сигнала и занимать широкую полосу частот. Если часть этого спектра попадает в полосу того регулируемого звена, в котором уменьшается коэффициент передачи, то эта часть спектра будет подавлена. Дополнительный тракт системы «Dolby-A» универсален и используется дважды – при записи и воспроизведении. Поэтому искажения АЧХ и ФЧХ фильтрами при записи компенсируются искажениями обратного знака при воспроизведении. Это важное достоинство системы «Dolby-A». Но аппаратура этой системы сложна, содержит сотни полупроводниковых элементов (следовательно дорога) и применяется только в профессиональной аппаратуре. Для бытовой и профессиональной аппаратуры используют системы «Dolby-B» и «Dolby-C». «Dolby-B». В системе Dolby-B компрессирование сигнала со следующими особенностями: - во-первых, обрабатывается только высокочастотная составляющая входного сигнала; - во-вторых, обрабатываются только те сигналы, которые лежат ниже определенного порога. Эти особенности позволяют существенно уменьшить величину и заметность модуляционного шума. Все шумы наиболее заметны именно в высокочастотной области и, особенно при отсутствии в этом месте спектра составляющих полезного сигнала. А при такой ситуации выходной сигнал Dolby-B в области высоких частот как раз максимально ослаблен его экспандером, и шумы существенно ослаблены. А т.к. НЧ-сигналы компандером Dolby-B не обрабатываются вообще, то и модуляционный шум, как таковой, попросту отсутствует. При работе компандера в присутствии полезных ВЧ-сигналов шум очень хорошо маскируется ими, и крайне малозаметен. Наличие порога срабатывания позволяет не обрабатывать сигналы большого уровня, где гораздо заметнее различные побочные эффекты и артефакты, возникающие в процессе работы компандера. Способ шумоподавления, используемый в «Dolby-B» можно назвать управляемыми предыскажениями. «Dolby-B» содержит одно регулируемое и одно управляющее звено, действующее только в верхней части частотного диапазона, ширина которого изменяется в зависимости от уровня сигнала. 116 В системе используют управляемый ФВЧ, обеспечивающий «скользящую» характеристику сжатия, начиная с частоты 300 Гц. В этом диапазоне сосредоточены наиболее заметные структурные помехи магнитной ленты. На частотах выше 4 кГц уровень помех уменьшается примерно на 10 дБ. Как и в «Dolby- A», один и тот же дополнительный тракт используется и при записи, и при воспроизведении. Благодаря этому устраняются искажения, которые могли бы возникнуть из-за некомплементарности амплитудных характеристик и разных значений tу и tв сжимателя и расширителя. N , дБ 10 5 -5 -10 0.25 0.5 1 2 4 8 f, кГц Рисунок 3.22 – Спектр структурных помех магнитной ленты: Вых.тракта воспроиз. Вход Y1 Y2 к УЗ Y4 з ПК РЗ Y3 в Ey Y3 Рисунок 3.23 – Структурная схема системы «Dolby-B» 117 Рисунок 3.24 – АЧХ тракта записи системы «Dolby-B»: Рисунок 3.25 – АЧХ блока регулирования в процессе записи (З) и воспроизведения (В) Рисунок 3.26 – Амплитудные характеристики шумоподавления системы «Dolby-B» 118 При записи усилители Y1, Y2, Y4 образуют основной тракт. Напряжение с выхода Y1 поступает в дополнительный тракт, состоящий из предыскажающего контура ПК (ФВЧ), блока регулирования с РЗ, УЗ и усилителем Y3. Усиленное ступенью УЗ напряжение складывается на входе Y4 с напряжением основного тракта. При небольшом уровне сигнала и в его отсутствие коэффициент передачи РЗ близок к единице (кривая 1, рисунок 3.24). При увеличении уровня (кривая 2,3,4) коэффициент передачи РЗ спадает, и подъем коэффициента передачи уменьшается. При уровнях выше некоторого нормированного дополнительный тракт практически запирается и АЧХ основного тракта становится почти горизонтальный (кривая 4). При воспроизведении сигнал, поступающий от усилителя воспроизведения (УВ) магнитофона на вход, проходит Y1. Регулируемое звено вместе с УЗ образует цепь отрицательной обратной связи (ООС), охватывающий Y1. Глубина ООС зависит от частоты и уровня сигнала. Параметры системы шумоподавления выбирают такими, чтобы подъем АЧХ на ВЧ, имевший место при записи, полностью компенсировался бы при воспроизведении. Динамические параметры управляющей цепи выбирают такими: ty = 1…2 мс, tв = 100…150 мс. Шумоподавители типа «Dolby-B» разработаны для борьбы с ВЧ шумами, возникающими в бытовых магнитофонах и видеомагнитофонах с небольшой скоростью движения ленты. Кроме того шумоподавитель «Dolby-B» иногда используют при воспроизведении фонограмм, записанных без устройства шумоподавления. В этом случае он действует как управляемый восстанавливающий контур. Ослабление помех происходит ввиду уменьшения коэффициента передачи на ВЧ. Однако при этом он вносит частотные искажения при небольших уровнях сигнала. «Dolby-B» сравнительно недорог и выпускается в виде специализированной ИМС. В среднем подавление шумов в системе Dolby-B составляет около 10 дБ (в то время как для dbx – 30 дБ). «Dolby-C». В системе «Dolby-C» используют два включения цепочкой регулятора «Dolby-B». Оба действуют в одинаковых полосах частот, но их пороги срабатывания выбраны разными. Система действует начиная с частоты 100 Гц. На частоте 400 Гц отношение С/П улучшается примерно на 15 дБ, а в области частот 2…10 кГц улучшение отношения С/П составляет около 20 дБ. Система уменьшает выбросы уровня благодаря разделению сжатия сигналов разного уровня. 119 «Dolby-S». Применяется в бытовых устройствах (кассетных магнитофонах). В ней использованы идеи, осуществленные в «Dolby-B» и «Dolby-C» и некоторые новые принципы (упрощенный вариант системы Dolby-SR). В этой системе возможно некоторое шумоподавление в области НЧ, достигаются лучшие пространственные эффекты. Шумоподавитель «Dolby-SR». SR означает «спектральная запись». В этой системе сигналы записываются не «впрямую», а с учетом не только их уровня, но и спектрального состава. Рассмотрим всем хорошо известные кривые равной громкости на рисунке 3.27. Рисунок 3.27 – Кривые равной громкости Из всего их семейства нас будут интересовать только две, соответствующие максимальному и минимальному уровням слышимости. Очевидно, что все реально воспринимаемые звуки будут находиться в области, ограниченной этими двумя кривыми. Более громкие находятся за пределами болевого порога, а более тихие нам попросту не слышны (рисунок 3.28). Вот в соответствии с этим «окном слышимости» и построена работа системы Dolby-SR. При ее разработке было учтено, что самые низкочастотные и самые высокочастотные звуки, которые находятся по краям звукового диапазона, даже при довольно значительных их абсолютных уровнях, тем не менее, не будут слышны, или, если и будут слышны, то крайне незначительно. При обработке входного сигнала, помимо особого компрессования, Dolby-SR еще и изменяет его АЧХ – так, чтобы она максимально возможной мере совпадала с соответствующей кривой равной громкости. 120 Рассмотрим случай подъема среднечастотной области АЧХ для сигналов малого уровня. Рисунок 3.28 – «Окно слышимости» На рисунке 3.29 приведены две АЧХ – исходного сигнала (прямая пунктирная линия), и его же – после указанной обработки (верхняя пунктирная кривая). Рисунок 3.29 – АЧХ двух сигналов Теперь добавим к полученному рисунку АЧХ обработанного сигнала ровный широкополосный шум, т.е. имитируем прохождение сигнала через тракт записи-воспроизведения, где этот шум неизбежно появится. 121 На рисунке 3.30 двумя пунктирными линиями изображены два сигнала. Верхняя кривая – это спектр входного сигнала, преобразованный кодером системы Dolby-SR, а нижняя прямая – спектр шумов передающего тракта. Рисунок 3.30 – АЧХ сигнала и спектр шума А теперь посмотрим, что получится с нашими сигналами после восстановления на приемной стороне (на выходе Dolby-SR) исходной линейной АЧХ: Рисунок 3.31 – Линейная АЧХ+шум по минимальной из кривых На рисунке 3.31 верхняя пунктирная прямая изображает спектр записанного сигнала после его восстановления декодером Dolby-SR, а нижняя пунктирная кривая – это спектр шума тракта, получающийся после декодера. Для наглядности здесь же приведена низшая из кривых равной громкости, соответствующая порогу слышимости (сплошная кривая). 122 Видно, что, помимо восстановления исходного сигнала, при этом произошло и перераспределение спектра шумов. В области НЧ и ВЧ – уровень сигнала шума даже повысился! Казалось бы – парадокс! Нет, ведь из-за малой чувствительности слуха на краях диапазона мы эти шумы не услышим, и увеличение их абсолютного уровня никакого влияния на собственно звук не окажет. А вот в области средних частот, где чувствительность уха максимальна, шум стал значительно меньше, и благодаря этому общий уровень воспринимаемых ухом шумов значительно ослабится. Таков, вкратце, основной принцип работы системы Dolby-SR в той его части, которая касается изменения ею АЧХ тракта передачи в паре кодердекодер. Конечно, кроме изменения АЧХ в системе Dolby-SR, также производится и компрессование сигнала в кодере с последующим его экспандированием в декодере. Строго говоря, невозможно выделить в аппаратной реализации DolbySR отдельные корректоры АЧХ и отдельные компрессоры и экспандеры. Все эти функции выполняются одними и теми же узлами – частотнозависимыми компрессорами. Для этого фирма Dolby разработала особую конструкцию такого компрессора, который совмещен со скользящим фильтром, аналогичным применяемым в денойзерах. При его работе одновременно изменяется и АЧХ сигнала, и осуществляется его компрессия и экспандирование. Dolby-SR содержит три каскада компрессирования, причем в каждом из них входной сигнал разделяется на два полосных сигнала. Во всех каскадах сжатие производится на определенных уровнях сигнала (пороги уровней срабатывания -30, -48, -62 дБ). В первых двух каскадах граничная частота разделения сигнала лежит около 800 Гц, каскад с порогом –62 дБ обрабатывает сигналы лишь на частотах выше 800 Гц. Конечно, в реальных системах АЧХ не столь точно соответствуют кривым равной громкости, и имеют более гладкий, упрощенный характер. Но это не изменяет самой сути процесса, а точнее – того грустного факта, что все системы компандерного шумоподавления несовместимы между собой. И если в стенах одной студии это обычно не является проблемой, то при необходимости передать фонограмму в другое место возможно возникновение различных сложностей. Особенно это касается всех разновидностей систем Dolby, которые являются очень чувствительными к амплитуде сигнала, и при несоответствии опорных уровней Dolby в трактах записи и воспроизведения различных аппаратов может произойти непоправимое ухудшение звука. 123 3.2 Устройство оптимального компандирования при магнитной звукозаписи Устройство является средством компадерного шумоподавления в каналах записи – воспроизведения аналоговых сигналов. Канал записи. Отличительной особенностью такого устройства является запись-воспроизведение управляющего сигнала (для компрессоров К канала записи и экспандеров Э канала воспроизведения). ПФ ФСК Вход ПФ К  ГЗ1 УЗ 1 ФСК блок кодирования ГЗ2 М УЗ 2 Рисунок 3.32 – Схема канала записи С входа сигнал поступает на полосовые фильтры ПФ (число зависит от предъявляемых требований к качеству записи), которые делят сигнал на субполосы. В каждой субполосе осуществляется компрессия субсигнала. Процесс компандирования управляется в каждом канале специальными сигналами, формируемыми в ФСК (формирователь сигналов компрессии). Управляющие сигналы поступают в блок кодирования, который может осуществлять временное или частотное уплотнение сигналов компрессии. В модуляторе М осуществляется перенос спектра сигналов компрессии в диапазон частот вне полосы частот информационного сигнала. С выхода компрессоров сигналы суммируются и поступают на усилитель записи УЗ1 и затем в ГЗ1. Сигналы компрессии усиливаются УЗ2 и записываются головкой ГЗ2. Канал воспроизведения. Канал воспроизведения содержит: - Головки воспроизведения ГВ1 И ГВ2; - Усилители-формирователи У-Ф1 и У-Ф2; 124 - Полосовые фильтры ПФ по числу полос (каналов), частотные характеристики которых аналогичны характеристикам ПФ канала записи; - Экспандеры (Э) по числу полосовых каналов; - Сумматор Σ; - D-демодулятор; - Декодер-распределитель. ПФ Э ГВ1 У-Ф1 Э ПФ Вых  ГВ2 У-Ф2 D декодерраспределитель Рисунок 3.33 – Схема канала воспроизведения Сигналы с выхода декодера-распределителя в канале управления поступают на входы соответствующих экспандеров (в полосных каналах). Экспандеры восстанавливают в каждой субполосе соответствующий диапазон. Недостаток: требуется дополнительная дорожка для записи управляющих сигналов, но там небольшое количество информации и можно в цифровом виде. 3.3 Способ записи на магнитную ленту со снижением искажений и расширением динамического диапазона Принцип. Состоит в сравнении формы мгновенных значений напряжения записываемого сигнала с формой мгновенных значений тока в обмотке ГЗ и коррекции формы мгновенных значений тока для уменьшения их разницы. Механизм. Путем введения обратной связи в усилитель записи. На резисторе R (величина которого значительно меньше импенданса обмотки ГЗ) выделяется напряжение, форма которого совпадает с формой тока через обмотку ГЗ (выходной ток усилителя). Это напряжение поступает через цепь обратной связи на инверсный вход усилителя (УЗ), а на его прямой вход поступает записываемое напряжение. 125 Вх ГЗ УЗ ООС по току R Рисунок 3.34 – Схема введения обратной связи в усилитель записи На дифференциальных входах усилителя происходит сравнение (вычитание) форм напряжения записываемого сигнала и напряжения, соответствующего току через обмотку записи. Разностный сигнал зависит от сигнала отрицательной обратной связи по току, уменьшающего разницу форм посредством коррекции выходного сигнала усилителя. Любые отклонения формы тока в обмотке записи (и, следовательно, и остаточной индукции на магнитоносителе) от исходного входного сигнала на прямом входе УЗ уменьшаются независимо от причин их возникновения (частотная зависимость, нелинейные наводки, шумы, параметрические явления и т.п.). Т.е. схема снижает искажения. Недостатки такой схемы: 1. Обмотка ГЗ не заземлена; 2. Наличие в цепи ООС частотно-зависимого элемента (записывающей головки). Этих недостатков лишена схема с ООС и ПОС, приведенная на рисунке 3.35. R4 C R1 Вход R5 УЗ R2 ГЗ R3 Рисунок 3.35 – Схема с ООС и ПОС 126 Здесь резистор R5 – датчик сигнала обратной связи. Включен между выходом усилителя и обмоткой ГЗ. Усилитель охвачен цепью ООС по напряжению (с выхода на инверсный вход) через R3 и цепью ПОС по напряжению – обмотка ГЗ через C,R4 на прямой вход. Глубина ПОС равна глубине ООС. Для уменьшения потерь на резисторе R5, включенном последовательно с обмоткой, его величину следует выбрать в 10-100 раз меньше импенданса обмотки записи (импенданс - полное сопротивление Z= R 2  X 2 ). В случае равенства глубины ПОС по напряжению и ООС по напряжению ток в нагрузке не зависит от ее импенданса. (Механизм действия ПОС, допустим импенданс обмотки: ГЗ Z↓, Iвых↑, UR5↑, UZ↓, (Uвх2=Uвх+Uпос)↓, Uвых↓, Iвх↓). А т.к. импенданс ГЗ частотно зависим и нелинеен (частотная зависимость обусловлена индуктивным характером импенданса, а нелинейность – 1) вносимое магнитной лентой сопротивление, изменяющееся от мгновенных значений остатков старых записей, 2) неоднородности ленты, 3) нелинейной кривой намагничивания, 4) ее несимметричности.), то ток в нагрузке не будет зависеть от этих факторов. То есть схема реализует режим питания обмотки ГЗ от идеального преобразователя входное напряжение - выходной ток. Выбор величины резистора R5: 1 Z, то это уменьшает эффективность ПОС. 100 1 Если R5> Z , то велики потери мощности сигнала записи. 10 - Если R5< - Усилитель (УЗ) должен иметь подъем высоких частот, который может быть организован цепью предыскажений или частотно-зависимой обратной связью. Подъем ВЧ необходим в связи с тем, что при суммировании на обмотке ГЗ высоких частот записываемого сигнала с ВЧ смещением происходит их ослабление. Это приводит к появлению фазовых искажений в записываемом сигнале, а при перегрузке и НИ (гармонических, интермодуляционных, динамических). ВОПРОСЫ К РАЗДЕЛУ 3 1. Классификация помех по слуховому воздействию, виду спектра, длительности, диапазону частот. 2. Классификация систем шумоподавления по признаку воздействия на характеристики (АЧХ или амплитудную). 3. Система предыскажений. 4. Понятие о гейте. 5. DNL – динамический ограничитель шума. 6. Динамический подавитель шума (DNR). 127 7. Понятие о денойзере. 8. Недостатки компадерной системы 9. Система шумоподавления dbx (комплементарный широкополосный компандер). 10. Система преобразования dbx Type IV. 11. Общие принципы систем шумоподавления Dolby. 128 4. ИЗМЕРЕНИЯ И КОНТРОЛЬ ПАРАМЕТРОВ АУДИОТРАКТОВ 4.1 Измерители уровня звуковых сигналов Измерители уровня (ИУ) – приборы, предназначенные для отображения значений уровня ЗС в динамическом режиме. По ИУ производится установочная регулировка усиления во всех звеньях звукового тракта и оперативная регулировка уровня на пультах звукорежиссера. При этом добиваются, чтобы во всех точках тракта использовались ИУ с одинаковыми временными параметрами. В этом случае показания всех приборов в тракте будут идентичны. Измерители уровня звуковых сигналов бывают пиковые, квазипиковые, средних и минимальных значений. Для того, чтобы следить за короткими пиками ЗС, используются измерители квазипиковых уровней. Квазипиковый уровень – уровень огибающей амплитудных значений напряжения звукового сигнала, измеряемый с погрешностью, обусловленный временными характеристиками применяемого прибора. Номинальный уровень – уровень напряжения непрерывного синусоидального сигнала частотой 1000 Гц на входе измерителя, при котором показания равны 0 дБ (100%). Уровни напряжения стационарных звуковых сигналов можно измерять и вольтметрами. Однако вследствие инерционности эти приборы совершенно непригодны для контроля уровня сигналов звукового вещания и других нестационарных аудиосигналов. Время интеграции большинства вольтметров более 500 мс. А реальные сигналы ЗВ могут быть гораздо менее длительными, например длительность одного слога составляет в среднем примерно 200 мс. Поэтому вольтметры «не допоказывают» максимальные уровни речевых сигналов на 15…20 дБ и более. Для музыкальных произведений это значение зависит от характера музыки. Приборы для контроля уровней аудиосигналов должны регистрировать любые сигналы, как длительные, так и короткие. Их показания не должны зависеть от формы и полярности отдельных импульсов напряжения. В то же время от них не требуется очень высокой точности отсчета, да и ее невозможно получить, учитывая характер непрерывно изменяющихся сигналов. По назначению и диапазону отображаемых уровней квазипиковые ИУ разделены на два типа: Тип I – для оперативного контроля; Тип II – для эксплуатационного контроля. ИУ I типа используется в звукорежиссерских пультах и во всех основных аппаратных АСК (аппаратно-студийного комплекса). Шкала этих ИУ имеет большой диапазон 44…55 дБ и сравнительно 129 большие размеры – порядка 160 мм. Они обеспечивают высокую точность (вблизи номинального уровня 0.3 дБ) и хорошую стабильность показаний. ИУ II типа имеют шкалу 20…24 дБ и предназначены для отображения только верхней части динамического диапазона ЗС и используются в основном для установочных регулировок в трактах первичного и вторичного распределения программ ЗВ, иногда – в центральных и трансляционных аппаратных радиодомов и телецентров. В общем виде ИУ состоит из преобразователя, где измеряемый сигнал преобразуется в сигнал, адекватный контролируемой величине, и показывающего прибора (ПП), имеющего шкалу и указатель – стрелку, светящийся штрих или столбик. Параметры измерителей уровня. Так как измерители уровня предназначены и для контроля напряжения в трактах звуковой частоты, то к ним предъявляются те же технические требования, что и к обычным электронным приборам для измерения напряжения: нормируется чувствительность и входное сопротивление, тип шкалы и точность градуировки, рабочий диапазон частот и погрешность в зависимости от частоты, динамический диапазон и др. Но в отличие от обычных приборов ИУ контролирует уровни нестационарных сигналов. Поэтому основными техническими характеристиками для ИУ являются динамические (временные). Время интеграции tи – длительность одиночного радиоимпульса номинального уровня с частотой заполнения 5 кГц, при воздействии которого указатель показывающего прибора ИУ доходит до отметки 2 дБ (80%). tи характеризует способность ИУ отображать короткие выбросы ЗС. Для этого tи должно быть мало и измеряться миллисекундами. В соответствии со стандартом ГОСТ 21135 (измерители уровня квазипиковые…) tи установлено для ИУ обоих типов равным 5 мс. Более короткие пики превышают номинальный уровень, проходят в последующие звенья тракта и там могут исказиться. Это допустимо, поскольку срез (клиппирование) пиков ЗС короче 5…10 мс на слух незаметен. Время интеграции определяется по динамической характеристике (рисунок 4.1). В последнее время появились приборы (ИУ), которые запоминают и отображают максимальный уровень за достаточно большой интервал времени, одновременно отображая текущие значения уровня. Это облегчает работу оператора, освобождает его от необходимости вести непрерывное наблюдение за показаниями ИУ. В цифровых трактах, если не принять специальных мер, даже кратковременное превышение максимально допустимого уровня приводит к переполнению разрядной сетки в цифровых участках тракта и искажениям катастрофического характера. Поэтому для контроля за верхней границей 130 динамического диапазона ЗС в цифровых трактах созданы ИУ, способные отражать пики программы длительностью в 100 мкс и даже короче. Это уже приборы не квазипиковых, а пиковых значений. N, дБ tи=5мс -2 -4 -5 3 5 10 t имп, мс Рисунок 4.1 – Динамическая характеристика Время срабатывания tср – интервал времени между моментом подачи непрерывного гармонического сигнала частотой 1000 Гц номинального уровня на вход ИУ и тем моментом, когда указатель показывающего прибора доходит до отметки 1 дБ. У ИУ время срабатывания лежит в пределах 60…200 мс. При больших значениях могут наблюдаться расхождения во времени между слуховым восприятием уровня ЗС и его визуальным наблюдением по ИУ. При меньшем tср невозможно следить за перемещением указателя при возрастании уровня: указатель перескакивает с одной точки шкалы на другую, и оператор каждый раз вынужден заново фиксировать глаз на новом показании ИУ, что приводит к его излишнему утомлению. Следует отметить, что между требованием малого tи и относительно большого tср противоречия нет: в квазипиковых ИУ короткие пики запоминаются на время, достаточное для срабатывания указателя. Время возврата tв – интервал между моментом выключения непрерывного гармонического сигнала номинального уровня частотой 1000 Гц на входе ИУ и тем моментом, когда указатель показывающего прибора доходит до отметки 20 дБ (10%). Время возврата для ИУ обоих типов нормируется различно. Для приборов I типа оно должно составлять (1.70.3)с, для приборов II типа (31)с. Это объясняется их различным значением. Чем больше время возврата, тем более завышены показания ИУ для сигналов низкого уровня, следующих после сигналов высоких уровней. Показания приборов I типа со временем возврата 1.7с более точно отражают минимальные уровни и соответственно динамический диапазон 131 измеряемых уровней. Это очень важно, так как такие приборы предназначены прежде всего для звукорежиссеров, одной из основных функций которых является именно регулирование динамического диапазона передачи. Для ИУ II типа главным является фиксация квазимаксимальных уровней, обеспечение возможности определения по ним превышения номинального уровня (0 дБ). А это легче реализовать, когда время возврата сравнительно велико: 3…4 с. Кроме того относительное большое время возврата облегчает наблюдение за уровнем сигнала в динамике, делая перемещение указателя по шкале достаточно плавным. Переброс указателя  – это разность между максимальным показанием при скачкообразной подаче непрерывного гармонического сигнала на вход ИУ и его показанием в стационарном режиме, т.е. после успокоения подвижной системы. Переброс выражается в децибелах или процентах относительно показания в стационарном режиме. Размер переброса указателя показывающего прибора должен быть не более 1 дБ (12%). При бóльшем значении показания уровней оказываются слишком завышенными по сравнению с их действительным значением и, как следствие этого, недомодуляция передатчиков. N  +2 -2 a б в -4 -6 tср1 t tср2 tср3 Рисунок 4.2 – Динамическая характеристика подвижной системы показывающего прибора Если к ИУ приложить синусоидальный сигнал, уровень которого меняется скачком от нуля до Nуст, то стрелка начнет движение от положения покоя к стационарному положению по закону, определяемому свойствами подвижной системы показывающего прибора (рисунок 4.2). Это движение может быть либо колебательным (кривая а), либо апериодическим (в); возможен критический режим (б) (граничный). Наиболее равномерное и быстрое движение стрелки по шкале получается в колебательном режиме, близком к критическому. В этом случае стрелка даст один видимый глазом выброс показаний. 132 Динамический диапазон измеряемых уровней – является также важным параметром ИУ. Приборы I типа должны иметь большой динамический диапазон -40…4 дБ или –50…5 дБ. Участок шкалы -50…0 дБ называется рабочим, а 0…5 дБ – участком перегрузки. Приборы II типа имеют динамический диапазон -20…4 дБ. Шкалы ИУ обоих типов градуируются в децибелах и процентах относительно номинального уровня (иногда в децибелах и в вольтах эффективных). Область перегрузки выделяется обычно красным цветом. Для облегчения работы с ИУ его шкала вблизи «рабочего 0» растянута. Иногда в приборах растягивается шкала и в области минимальных значений уровня для того, чтобы избежать занижения уровней при работе вблизи нижней границы динамического диапазона. Погрешности ИУ. Так как ИУ предназначены для измерения нестационарных сигналов, то погрешности допускаются сравнительно большие. Так, основная погрешность ИУ вблизи отметки номинального уровня (0 дБ) допускается до 0.3 дБ т.е. 3.5%. С понижением уровня отклонения увеличиваются. Частотный диапазон ИУ. Он должен соответствовать частотному диапазону тракта, где устанавливаются ИУ. Однако чаще всего частотный диапазон ИУ выбирается в пределах 31.5…16000 Гц с неравномерностью не более 0.5 дБ. За пределами частотного диапазона не должно быть подъема АЧХ. Более того, рекомендуется обеспечить спад АЧХ с крутизной не менее 6 дБ на октаву. Номинальный входной уровень ИУ выбирается, исходя из существующей диаграммы уровней для точек тракта, к которым подключается ИУ. Рекомендуется выбирать номинальный уровень ИУ из следующих значений: 0 дБ (0.775 В); 6 дБ (1.55 В); 9 дБ (2.2 В); 12 дБ (3.1 В); 15 дБ (4.4 В). Входное сопротивление ИУ выбирают из тех соображений, чтобы при его подключении не происходило шунтирования контролируемой цепи. Если исходить из сопротивления нагрузки 600 Ом, то для выполнения этого условия необходимо обеспечить входное сопротивление не менее 6 кОм. У большинства современных ИУ входное сопротивление больше 10 кОм. Виды шкал ИУ. Гост рекомендует три характерных логарифмическую и S-образную. 133 вида шкалы: линейную, Линейная шкала бывает только у ИУ II типа. 20 40 60 0 0 0 0 0 -20 -15 -10 -8 -6 -4 80 -2 100 140% 0 0 1 2 +3 дБ Рисунок 4.3 – Линейная шкала Недостаток ее – небольшой диапазон измерений. Этот недостаток устраняется при логарифмической шкале. 0.3 1 3 10 -50 -40 -30 -20 30 100 -10 180% +5 дБ Рисунок 4.4 – Логарифмическая шкала Для получения логарифмической шкалы применяют преобразовательлогарифматор, который позволяет получать практически любой диапазон измерений. Однако при логарифмической шкале появляется другой недостаток – оказывается слишком сжатой область шкалы вблизи наиболее важной части – около отметки 0 дБ. S-образная шкала. Приборы с S-образной шкалой сочетают в себе достоинства первых двух: большой динамический диапазон измерений при достаточно растянутой области вблизи номинального уровня 0 дБ. 0.3 1 3 10 30 50 -50 -40 -30 -20 -10 -5 100 180% 00000 +5 дБ Рисунок 4.5 – S-образная шкала Рассмотрим структурные схемы ИУ. Структурная схема ИУ II типа приведена на рисунке 4.6. Вх ВУ УЗЧ Д ИЦ ПП дБ Рисунок 4.6 – Структурная схема ИУ II типа ВУ – входное устройство обеспечивает: 1) большое входное сопротивление; 2) симметричность входа; 3) регулировку чувствительности. 134 Симметричность нужна для того, чтобы подключить ИУ как к несимметричным, так и к симметричным контролируемым цепям. Раньше симметрия входа обеспечивалась входным трансформатором, сейчас чаще всего применяют операционный усилитель с дифференциальным включением. Регулировка чувствительности необходима для возможности подключения ИУ к точкам тракта с различным номинальным уровнем. УЗЧ – усилитель звуковых частот выполняет три основные функции: 1) Обеспечивает электрическую развязку детектора и контролируемой цепи, т.к. непосредственное подключение детектора к контролируемой цепи может вызвать большие нелинейные искажения; 2) Усиление сигналов до значения, необходимого для детектирования; 3) Обеспечивает низкое выходное сопротивление, которое входит в цепь заряда интегрирующей цепи (при большом выходном сопротивлении УЗЧ невозможно получить нужное время интеграции 5 мс). При использовании детектора на операционных усилителях последние две функции переходят непосредственно к детектору. Детектор в ИУ также имеет ряд особенностей. Он всегда выполняется по двухполупериодной схеме, т.к. вещательные сигналы могут быть несимметричными. При однополупериодном детектировании возможна ситуация, когда в тракте существует перегрузка, а ИУ этого не показывает (контролируется другой полупериод). Кроме этого, для детектирования используют по возможности линейный участок амплитудной характеристики. И, поскольку в квазипиковых ИУ постоянные времени разряда τр и заряда τз имеют соотношение τр≈1000τз, то примерно таким же должно быть и соотношение разрядного и зарядного сопротивлений: Rр=1000Rз. В противном случае трудно обеспечить требуемое малое (tи=5 мс), либо большое (tв=4 с) значение времени возврата. Интегрирующая цепь (ИЦ) является основным звеном, определяющим два самых важных динамических параметра: время интеграции и время возврата. ПП – показывающий прибор – магнитоэлектрический. По способу реализации и форме представления измеряемого сигнала различают аналоговые, аналого-цифровые и цифровые ИУ. Структурная схема аналогового ИУ I типа приведена на рисунке 4.7. ВУ УЗЧ Д ИЦ Вх ЛОГ УПТ ПП дБ Рисунок 4.7 – Структурная схема аналогового ИУ I типа 135 Отличается от предыдущей схемы наличием логарифматора и УПТ. Логарифматор – служит для расширения динамического диапазона измеряемых уровней. УПТ – усилитель постоянного тока служит для развязки показывающего прибора от логарифматора, т.к. показывающий прибор может потреблять заметную мощность. В зависимости от типа показывающего прибора ИУ I типа могут быть с логарифмическими и электронными ПП. Аналого-цифровой ИУ. ВУ ИЦ Д УЗЧ ЛОГ АЦП ПП Вх Рисунок 4.8 – Структурная схема аналогового ИУ I типа с ЛОГ и АЦП АЦП – преобразует сигнал в цифровую форму и подает его на ПП дискретного типа (набор светодиодов или газоразрядные шаговые дискретные индикаторы). Цифровой ИУ может иметь как цифровой, так и аналоговый вход. 4.2 Методика измерения основных параметров качества аудиотрактов 4.2.1 Измерение неравномерности АЧХ Измерение осуществляется по схеме [4] рисунок 4.9: ЗГ Т ЗГ - генератор звуковых частот, Р Т - измеряемый тракт или канал, Р - номинальное сопротивление нагрузки, В1 В2 В1, В2 - вольтметры. Рисунок 4.9 – Схема измерения неравномерности АЧХ На вход тракта (Т) подается от ЗГ синусоидальный измерительный сигнал с частотой 1000(800) Гц и уровнем на 21 дБ ниже номинального входного уровня. Его контролируют вольтметром В1. Напряжение на входе отсчитывается по вольтметру В2. 136 Затем на вход измеряемого тракта (канала) подают сигналы с указанным выше уровнем и частотами - 40, 63, 125, 250, 500, 1000(800), 2000, 4000, 8000, 10000 и 15000 Гц для каналов с полосой частот до 15 кГц; - 50, 63, 125, 250, 500, 1000(800), 2000, 4000, 6000 и 10000 Гц для каналов с полосой частот до 10 кГц; - 100, 125, 250, 500, 1000(800), 2000, 4000 и 6300 Гц для каналов с полосой частот до 6.4(6.3) кГц. При этом напряжение на входе должно поддерживаться с точностью не хуже 0.3ΔК (где ΔК – предельно допустимое отклонение коэффициента передачи испытуемого устройства в абсолютных единицах), но не более ±2.2 дБ. Неравномерность АЧХ определяют по формуле: ΔS=20lg(UF/U1000(800)) при отсчете выходного напряжения в вольтах или ΔS=NF-N1000(8000) при градуировке шкалы вольтметра в децибелах. Здесь UF(NF) – напряжение (уровень) выходного сигнала на измеряемой частоте, U1000(800) (N1000(8000)) – то же на частоте 1000(800) Гц. 4.2.2 Измерение нелинейных искажений В области низких и средних частот нелинейные искажения оцениваются методом коэффициента гармоник. Структурная схема измерения Кг показана на рисунке 4.10: ЗГ Т В Р ИНИ – измеритель нелинейных искажений (или анализатор спектра) ИНИ Рисунок 4.10 – Схема измерения нелинейных искажений На вход испытуемого тракта подается гармонический сигнал номинального уровня. Собственный коэффициент гармоник ЗГ не должен превышать величину, равную 0.3 Кгиу (Кгиу – ожидаемый коэффициент гармоник тракта). Измерения проводятся на частотах: - 40, 63, 125, 250, 500, 1000(800), 2000 и 4000 Гц для каналов с полосой воспроизводимых частот до 15 кГц; 137 - 100(63), 125, 500, 1000(8000), 2000 Гц для каналов с fв=6.4 и 10 кГц. При измерении нелинейных искажений в трактах с цифровой аппаратурой или с усилителями, работающими в ключевом режиме следует применять анализатор спектра. Величина Кг вычисляется по формуле: Кг= (U 22  U 32 ) / U12  100% , где U1, U2, U3 –величины напряжений синусоидальных составляющих на выходе измеряемого устройства. В каналах ЗВ, содержащих устройства частотного предыскажения (ПКВК), измерения проводят на частоте 800 Гц. В цифровых каналах ЗВ измерения проводят на частоте 2.1 кГц. Длительность непрерывной подачи сигнала не должна превышать 5 с. Метод коэффициента гармоник не позволяет оценить нелинейные искажения в области ВЧ, т.к. продукты нелинейности (гармонические составляющие) испытательного сигнала могут оказаться вне диапазона частот, воспроизводимого испытуемым устройством. Поэтому на ВЧ применяют метод разностного тона. Схема измерения НИ методом разностного тона приведена на рисунке 4.11. АС ЗГ1(F1)  ЗГ2(F2) Т В1 Р В2 Рисунок 4.11 – Схема измерения НИ методом разностного тона В качестве измерительного сигнала используется сумма двух равных по амплитуде синусоидальных колебаний с близкими частотами F1 и F2 (бигармонический сигнал). Такой сигнал получают на выходе линейного суммирующего устройства (Σ), к входу которого подключены два генератора звуковых частот ЗГ1 и ЗГ2, настроенных на частоты F1 и F2 соответственно. Выходное сопротивление сумматора не должно превышать нормированного значения внутреннего сопротивления источника сигнала. Амплитуду бигармонического сигнала устанавливают равной номинальному значению амплитуды входного сигнала. Для каналов и трактов с полосой частот до 15 кГц рекомендуется проводить измерения на частотах F1=12100 Гц и F2=12900 Гц. 138 На выходе измеряемого тракта, нагруженного на номинальное сопротивление нагрузки Р, последовательно измеряют напряжения частот F1, F2, F2-F1, 2F1-F2, 2F2-F1 с помощью анализатора спектра АС. Количественной мерой нелинейности являются коэффициенты К РТ 2 и третьего К РТ 3 порядков, определяемые по разностного тока второго формулам: К РТ 2 =[2 U F  F /( U F + U F )]·100% 2 2 1 1 К РТ 3 =[4( U 2 F  F + U 2 F  F )/3( U F + U F )]·100% 1 2 2 1 1 2 где U F и U F – значения напряжений составляющих бигармонического измерительного сигнала F1 и F2 на выходе тракта; – напряжения продуктов нелинейности U F F ; U 2F F ; U 2F F (комбинационных составляющих) с частотами F2-F1, 2F1-F2, 2F2-F1. 2 1 2 1 1 2 2 1 4.2.3 Измерение взвешенного шума (рисунок 4.12) Р1 – экранированное сопротивление (600±30)Ом, Р1 Т Р2 подключаемое к входу измеряемого тракта (может быть другой экранированный резистор, сопротивление которого должно быть ПС равным модулю полного сопротивления Рисунок 4.12 – Схема измерения электрического источника сигнала на средних взвешенного шума частотах). Р2 – эквивалент сопротивления нагрузки – подключается к выходу тракта. ПС - псофометр для измерения взвешенного шума (выполнен в соответствии с рекомендациями 468-4 МККР или Р.53 МККТТ). Такой псофометр снабжен специальным взвешивающим фильтром, ограничивающим частотный диапазон измеряемого шума (помехи). Рисунок 4.13 – АЧХ взвешивающего фильтра 139 Защищенность от взвешенного шума при отсчете напряжения псофометра в вольтах вычисляют по формуле А=20 lg(Uн/Uпш), где Uн – номинальное напряжение сигнала; Uпш – напряжение псофометрического шума. выходного При градуировке измерительного прибора в децибелах А=Nн-Nпш где Nн – номинальный уровень сигнала; Nпш – измеренный псофометрический уровень шума. При измерении невзвешенного шума взвешивающий фильтр псофометра отключают. 4.2.4 Измерение защищенности от внятных переходных помех Т1 – тракт, вносящий помеху; Т2 – испытуемый тракт; Рз – резистор – эквивалент выходного сопротивления источника сигнала Рисунок 4.14 – Схема измерения Выходы Т1 и Т2 (трактов) нагружают резисторами Р1 и Р2, сопротивления которых равны модулю полного электрического сопротивления реальной нагрузки на средних частотах. К входу тракта, подверженного влиянию, подключают экранированное сопротивление (600±30)Ом. На вход влияющего тракта Т1 от ЗГ подают синусоидальный сигнал частотой 1000(800)Гц и напряжением, соответствующим номинальному значению входного уровня. Значения напряжений на входе и выходе влияющего тракта контролируют вольтметрами В1 и В2 соответственно. Длительность подачи сигнала не должна превышать 5 с. Если в испытуемых устройствах имеются предыскажающие и восстанавливающие контуры ПК-ВК, допускается изменять частоту измерительного сигнала в зависимости от их характеристик. В трактах ПВ измерения выполняют на частоте 2000 Гц. 140 Уровень внятной переходной помехи на выходе тракта, подверженного влиянию, измеряют анализатором спектра АС или селективным вольтметром, настроенным на частоту испытательного сигнала. При градуировке шкалы измерительного прибора в вольтах защищенность от внятных переходных помех определяют по формуле: А=20lg(UН/Uвн.перех.) где Uн – номинальное напряжение сигнала; Uвн.перех – напряжение внятных переходных помех, измеренное АС или селективным вольтметром. При градуировке шкалы измерителя в децибелах А=Nн-Nвн.перех. В трактах, используемых для стереофонических передач, защищенность от внятной переходной помехи между каналами Л и П измеряют аналогичным образом, причем за влияющий тракт принимают по очереди канал Л и П. 4.2.5 Измерение разности уровней на выходах каналов Л и П, образующих стереопару Разность уровней определяют расчетным путем при сравнении АЧХ каналов Л и П: ΔN=Nвых Л-Nвых П где Nвых Л и Nвых П – уровни сигналов на выходах каналов Л и П при одинаковых значениях частот и уровней гармонических испытательных сигналов на входах этих каналов. Л Р1 ЗГ В2 П Р2 Рисунок 4.15 – Схема измерения 4.2.6 Измерение разности фаз в каналах Л и П, образующих стереопару Разность фаз на выходах каналов Л и П в трактах, используемых для стереофонических передач, измеряют при подаче на вход обоих каналов гармонического сигнала с уровнем на 21 дБ ниже номинального. Измерения проводят фазометром Ф на частотах 40, 1000(800) и 15000 Гц по схеме рисунок 4.16. 141 Рисунок 4.16 – Схема измерения разности фаз в каналах Л и П 4.2.7 Оценка защищенности от продуктов перекрестной модуляции Защищенность от продуктов внутриполосной перекрестной модуляции второго и третьего порядков (Fд΄) и внеполосной перекрестной модуляции первого и второго порядков (Fд) оценивают по следующей методике. Значения частот продуктов перекрестной модуляции определяют на основе следующих соотношений: Fд΄=fд-nFi; Fд = nfд±Fa; где Fд΄, Fд - частоты дискретизации; fд – частота дискретизации; Fi – частоты внутриполосных сигналов; Fa – частоты внеполосных паразитных сигналов; n – натуральный ряд чисел (1,2,3). Таблица 7 – Значения частот Fi и Fa при fд=32 кГц n 2 3 2 Fi, кГц 9 13 7 11 31 Fa, кГц 14 6 11 1 1 33 1 3 63 1 Ч ЗГ КСВ СВ СВ – селективный вольтметр, Ч – частотометр, КЗВ – канал звукового вещания (или аудиотракт). Рисунок 4.17 – Схема измерений 142 АС 65 1 На вход контролируемого тракта (КЗВ) от ЗГ подают гармонический измерительный сигнал с уровнем 0 дБ и погрешностью не хуже ±0.1 дБ. Коэффициент гармоник ЗГ не должен превышать 0.3 К г (Кг – номинальное значение коэффициента гармоник измеряемого канала ЗВ). Частота испытательного гармонического сигнала устанавливается с погрешностью не более 0.001 fd (0.1% от частоты дискретизации). Защищенность от продуктов внутриполосной А и внеполосной А´ перекрестной модуляции вычисляют по формулам А  N F '  N Fi ; д А'  N Fд  N Fa , где NF' , д N Fд – уровни продуктов внутриполосной и внеполосной перекрестной модуляции соответственно; N Fi – уровень внутриполосных измерительных сигналов; N Fa – уровень внеполосных измерительных сигналов. При градуировке шкалы измерительного прибора в вольтах А и А´ можно определять по формулам А=20lg( U Fд' / U Fi ); A´=20lg( U Fд / U Fa ); где U Fi – напряжение внеполосных измерительных сигналов; U Fa – напряжение внеполосных измерительных сигналов; U Fд , U Fд – напряжение продуктов перекрестной модуляции. 4.2.8 Контроль стереосигналов Объективный контроль стереосигналов ведут с помощью двух ИУ и стереогониометра или стереокоррелометра. Показания ИУ отображают соотношения уровней в правом и левом каналах стереопары. П Л Осц. У РУ У У РУ У Рисунок 4.18 – Стереогониометр Стереогониометр дает представление интенсивности сигналов П и Л. 143 о соотношении фаз и На две пары отклоняющих пластин осциллографической трубки подают сигналы П и Л. Если два одинаковых микрофона при записи расположены близко друг к другу, а источник звука находится от них на равном расстоянии, то выходные сигналы последних одинаковы и строго сфазированы. На экране трубки появится вертикальная черта. Ее длина изменяется в соответствии с изменениями интенсивности сигнала. Если напряжения (уровни) на выходах микрофонов не равны, наклон светящейся линии меняется. Если один из сигналов Л (или П) отсутствует, наклон прямой достигает 45º. Если микрофоны разнесены на некоторое расстояние и их напряжения сфазированы, экран покрывается сложным узором, имеющим эллипсообразную форму и вытянутым по вертикали. Если уровни различны, большая ось эллипса наклоняется влево или вправо. При противофазных напряжениях близко расположенных одинаковых микрофонов прямая на экране трубки приближается к горизонтальному положению, а при смеси сложных сигналов и разнесенных микрофонах возникают эллипсовидные фигуры, растянутые по горизонтали. Стереокоррелометр. Он позволяет судить только о правильности фазировки и совместимости сигналов П и Л. П У ОГР СД Л У ИЦ пп ОГР Рисунок 4.19 – Схема стереокоррелометра В этом приборе входные напряжения усиливаются, ограничиваются безынерционными ограничителями. Затем полученные меандры напряжения подаются на входы синхронного детектора СД, интегрирующую цепь ИЦ и стрелочный показывающий прибор ПП. Последний отображает коэффициент корреляции сигналов R, свидетельствующий о мере близости сигналов, независимо от их интенсивности. Удовлетворительной совместимости соответствует R=0.3 - 0.7. При отсутствии одного или обоих напряжений или, если напряжения не коррелированы, R=0. При равнофазных коррелированных сигналах R=+1. При противофазных коррелированных сигналах R=-1. 144 На рисунке приведено сопоставление показаний стереокоррелометра и стереогониометра. -1 1) 1 -1 1 -1 2) 1 -1 1 -1 4) 3) 1 -1 5) 1 6) Рисунок 4.20 – Сопоставление показаний стереокоррелометра и стереогониометра Приведены различные случаи соотношения сигналов: 1) В правом (или левом) тракте нет сигнала, КИЗ слева (или справа); 2) Интенсивности и фазы сигналов П и Л одинаковы, КИЗ – в середине базы, сигналы совместимы; 3) Интенсивности сигналов П и Л одинаковы, фазы противоположны, стереосигналы не совместимы; 4) Фазы сигналов нескольких источников близки, когерентны и совместимы; 5) Стереосигналы когерентны, но противоположны; 6) Смесь сигналов не когерентна или фазы стереосигналов сдвинуты на ±90º. Комбинация стереогониометра с коррелометром называется стереодисплеем. На его экране помимо эллипсовидных фигур, дающих информацию о содержании, имеется горизонтальная шкала, вдоль которой движется указатель в виде стрелки, показывающий разность фаз от 0º до 180º. ВОПРОСЫ К РАЗДЕЛУ 4 1. Понятие квазипикового уровеня. 2. Классификация измерителей уровня ( ИУ ) по назначению и диапазону отображаемых уровней. 3. Определения времени интеграции tи , времени возврата tв и переброса указателя . 4. Структура аналого-цифрового ИУ. 5. Методика измерения неравномерности АЧХ. 6. Методика измерения нелинейных искажений. 7. Методика измерения взвешенного шума. 8. Методика измерения защищенности от внятных переходных помех. 9. Оценка защищенности от продуктов перекрестной модуляции. 10. Контроль стереосигналов. 145 5. ЦИФРОВОЕ ПРЕДСТАВЛЕНИЕ АУДИОСИГНАЛОВ Рассмотрим подробно цифровое представление аналоговых звуковых сигналов. Для преобразования аналогового сигнала в цифровой последовательно выполняют три операции: дискретизацию аналогового сигнала во времени, квантование и кодирование. Д КВ Кодер Рисунок 5.1 – Схема АЦП 5.1 Дискретизация При дискретизации сигнал U(t) представляют последовательностью его значений (отсчетов) в дискретные моменты времени. В состав дискретизатора входит фильтр нижних частот (ФНЧ) и АИМмодулятор. ФНЧ ограничивает входной сигнал по полосе, что необходимо для отсутствия наложения спектров дискретизированного сигнала вокруг гармоник частоты дискретизации. Дискретизация осуществляется в АИМмодуляторе. Выходной сигнал модулятора представляет собой последовательность отсчетов U(iTд), отстоящих один от другого на интервал времени Tд, называется периодом дискретизации (рисунок 5.2). Рисунок 5.2 – Последовательность отсчетов Этот сигнал называется дискретным. Спектр такого сигнала (рисунок 5.3) содержит низкочастотную компоненту, совпадающую по форме со спектром входного сигнала, и высокочастотную компоненту, состоящую из ряда боковых полос, расположенных вокруг гармоник частоты дискретизации. Выходной сигнал АИМ-модулятора квантуется по уровню и кодируется. 146 ISI Fc fд 2fд f Рисунок 5.3 – Спектр дискретного сигнала Следует сразу остановится на входном ФНЧ, задачей которого является ограничение спектра входного сигнала. G(f) fмин fмакс fд/2 fд 2fд f Рисунок 5.4 – Наложение спектров Из рисунка 5.4 видно, что частотные компоненты входного сигнала, лежащие выше частоты fд/2 после дискретизации создают искажения сигнала (перекрытие спектров) и не могут быть разделены. Расчеты показывают, что затухание ФНЧ в области частот выше fд/2 должно быть больше 60 дБ (не следует забывать, что чем круче АЧХ, т.е. больше затухание в одной и той же полосе, то тем больше неравномерность ФЧХ фильтра в этой же полосе). Величина звукового сигнала может принимать непрерывное множество значений. Если в качестве элемента сигнала рассматривать короткий отрезок аудиосигнала, сравнимый с элементом дискретного сигнала, то можно сделать следующие выводы: - если значение элемента принадлежит континууму, то количество информации, переносимой сообщением конечной длины, может быть бесконечно большим; - однако понятие континуума значений к конечному элементу не применимо, а применимо только к элементам бесконечно большой длительности, что вытекает из следующих рассуждений: на коротком интервале времени в результате выброса шума одно из значений сигнала ошибочно принимается за другое. При увеличении времени 147 наблюдения вероятность такой ошибки уменьшается, однако эту вероятность нельзя свести к нулю на любом конечном отрезке времени. Конечный элемент несет конечное количество информации. Непрерывный сигнал, хотя, казалось бы, и принадлежит к континууму, а не к конечному множеству, несет лишь конечное количество информации, поэтому непрерывный сигнал, поскольку он имеет конечную информативность, может быть представлен дискретным сигналом. Ценность дискретного представления заключается в том, что, в отличие от непрерывного исходного сигнала, его можно передавать на любое заданное расстояние по каналу низкого качества при сколь угодно малых искажениях информации. Точная копия сигнала невозможна, но в ней и нет необходимости. Непрерывное множество можно лишь аппроксимировать дискретным. Для представления непрерывного сигнала необходимо иметь дискретные шкалы для двух величин – времени и уровня. Дискретизированный сигнал всегда можно считать амплитудномодулированной импульсной (АИМ) последовательностью (рисунок 5.2). Выходной сигнал АИМ-модулятора представляет собой последовательность отсчетов U(iTд), отстоящих один от другого на интервал времени Tд, называемый периодом дискретизации. Спектр такого сигнала помимо «несущего» колебания и его гармоник, содержит частоты, присутствующие в спектре модулирующей функции исходного сигнала. Отсчет функции U(t) или «дискрет» в момент времени t=τ есть ее мгновенное значение U(τ). Но поскольку идеальная дискретизация не может быть физически реализована, то дискрет – это мера величины сигнала, оцениваемая на коротком интервале времени, в пределах которого сигнал изменяется лишь на незначительную, пренебрежимо малую величину. Дискретизация может быть представлена как операция коммутации. Ключ периодически соединяет источник сигнала с какой-либо нагрузкой на относительно короткий отрезок времени через сравнительно большие промежутки времени. Хотя каждый отсчет должен оцениваться за пренебрежимо малое время, обычно необходимо хранить его значение в течение более продолжительного времени. Например, данный отсчет потребуется подать на кодер, который обычно выполняет не одну очень быструю операцию, а некоторую последовательность операций. Подобный процесс взятия отсчетов и их хранения основывается на заряде конденсатора до потенциала, равного величине отсчета; когда ключ разомкнут, этот заряд сохраняется благодаря очень медленной утечке через цепи с очень высоким сопротивлением. Процесс дискретизации с запоминанием представлен на рисунке 5.5: 148 Рисунок 5.5 – Дискретизация с запоминанием Два подхода к теории дискретизированных сигналов. Первый подход – дискретизация как модуляция. За исходную берут последовательность импульсов с частотой следования, равной частоте дискретизации, и рассматривают ее как своего рода несущее колебание, на котором полезный сигнал отображается в виде изменения величины импульсов. Рассмотрим пример. На рисунке 5.6 показан источник ЭДС И1, соединяемый через переключатель П с нагрузочным резистором. П m U1 U2 Рисунок 5.6 – Схема дискретизации Ключ осуществляет контакт периодически на короткое время, через относительно продолжительные интервалы времени (рисунок 5.7). ключ разомкнут ключ замкнут U1 t U2 t Рисунок 5.7 – Временные диаграммы Когда контакт замыкается, модулирующий сигнал U1 мгновенно подключается к нагрузке, создавая выходное напряжение U2, представляющее собой последовательность импульсов, огибающей которой является модулирующий сигнал U1. 149 Определим спектр модулированной последовательности импульсов. Последовательность переключающих импульсов можно рассматривать как сумму гармонических колебаний основной частоты ωс и постоянной составляющей:  ао+  a n cos n c t. n 1 Относительные амплитуды составляющих спектра зависят от длительности импульсов: при малой длительности спектр получается широким (рисунок 5.8). G 1 2 3 4 5 6 7 8 c GM c Рисунок 5.8 – Спектр модулированной последовательности импульсов Выходное колебание U2 находят умножением выражения, характеризующего модулирующий сигнал U1 на выражение, описывающее импульсную последовательность. Считая, что модулирующий сигнал является гармоническим колебанием с частотой ωm, и, умножая его на предыдущее выражение, получим  U2=aocosωmt+  n 1 ancosωmtcosnωct, или преобразуем к виду  U2=aocosωmt+  1 an[cos(nωc+ωm)t+cos(nωc-ωm)t]. 2 n 1 Таким образом, около гармоники импульсной последовательности в результате модуляции возникает пара боковых колебаний с частотами nωc±ωm. Второй подход – исходя из фундаментальных свойств сигнала. В 1933 году русский ученый Котельников показал, что сигнал с ограниченным по ширине спектром может быть полностью задан некоторым числом дискретных значений. В соответствии с теорией Котельникова неискаженная передача непрерывного сигнала, занимающего полосу частот 0…Fмакс, 150 последовательностью его отсчетов возможна в том случае, если частота дискретизации связана с максимальной частотой в спектре сигнала следующим соотношением: fd≥2Fмакс. Диапазон частот, воспринимаемых слухом человека, лежит в диапазоне 20 Гц…20 кГц. Однако в зависимости от требований к системе этот диапазон ограничивается. Так в телефонии достаточно обеспечить высокую артикуляцию и узнаваемость голоса собеседника. Для этого достаточно обеспечить полосу частот 300…3400 Гц. Поэтому частота дискретизации телефонного сигнала выбрана равной 8 кГц. При звуковом вещании требуется передача музыкальных программ и ее художественное воспроизведение. Для этого требуется полоса частот от 30 Гц до 15 кГц. Следовательно частота дискретизации (fд) должна быть не менее 30 кГц. Кроме того следует учитывать, что в системах связи сигналы звукового вещания (ЗВ) кодируются и передаются совместно с другими, в частности телефонными сигналами. Поэтому частота дискретизации сигнала ЗВ должна быть кратна частоте дискретизации телефонного сигнала. В противном случае в общей структуре цифрового потока системы связи невозможно обеспечить передачу сигналов ЗВ вместо нескольких телефонных. Поэтому в системах передачи (распределения) сигналов ЗВ частота дискретизации принята 32 кГц. В студийном и бытовом оборудовании (пультах, магнитофонах, проигрывателях) принята максимальная частота сигнала Fмакс=20 кГц. При этом удовлетворяются требования самых взыскательных слушателей, не накапливаются амплитудно-частотные искажения в основной полосе при многократной перезаписи с использованием аналоговых фильтров. В этом случае частота дискретизации принята равной 48 кГц. В лазерных проигрывателях и некоторых типах бытовых магнитофонов fд=44.1 кГц. Любой дискретизатор содержит на входе фильтр нижних частот (ФНЧ), задачей которого является ограничение спектра входного сигнала. G(f) fмин fмакс fд /2 fд 2f д f Рисунок 5.9 – Спектр дискретизированного сигнала 151 Из рисунка видно, что частотные компоненты входного сигнала, лежащие выше частоты fд/2 после дискретизации создают искажения сигнала (перекрытие спектров) и не могут быть разделены. Расчеты показывают, что затухание ФНЧ в области частот выше fд/2 должно быть больше 60 дБ (чем круче АЧХ, т.е. больше затухание в одной и той же полосе, то тем больше неравномерность ФЧХ фильтра в этой же полосе). Искажения при дискретизации. Теорема отсчетов требует трех невозможных вещей: 1) сигнала бесконечно большой длительности, с которого снимаются; 2) отсчеты бесконечно малой длительности, по которым восстанавливается исходный сигнал при помощи; 3) фильтра с бесконечно большим скатом частотной характеристики при бесконечно большом затухании вне полосы прозрачности. Реальные условия отличаются по всем этим трем пунктам. Наименее существенно отличие между реальными дискретизирующими импульсами и идеальными – с бесконечно малой длительностью. Общие характеристики системы весьма мало зависят от длительности отсчета, т.к. длительность дискретизирующего импульса составляет лишь малую долю от периода дискретизации (5% и менее). Более важное значение имеет различие между реальными и идеальными сигналами. Информативные сигналы должны изменяться случайным образом и иметь начало и конец, и это ведет к бесконечному расширению спектра. ФНЧ не может пропустить информативный сигнал без искажений и поэтому система с дискретизацией не может его точно воспроизвести. Однако можно оценить величину погрешности и рассчитать систему так, чтобы погрешность находилась в заданных пределах. Общепринятой мерой погрешности является среднеквадратичная ошибка. Если сигнал на входе системы есть S(t), а сигнал на выходе системы U(t), то мгновенная ошибка равна e(t)=S(t)-U(t), если считать, что задержка сигнала в системе равна нулю. Среднеквадратичная ошибка равна где S(ω) – спектр S(t), U(ω) – спектр U(t). 152 Эту ошибку можно рассматривать как мощность шума. Мощность шума можно вычислять исходя из представления сигналов либо во временной либо в частотной области. Мощность ошибки можно неограниченно уменьшать путем повышения частоты дискретизации. На рисунке 5.10 показан спектр дискретизированного сигнала если сигнал дискретизируется без предварительной фильтрации. Рисунок 5.10 – Спектр дискретизированного сигнала (а) и спектр НЧ сигнала (б) Спектр такого сигнала состоит из основного спектра и ряда боковых, которые перекрываются. На участке от 0 до fд/2 множество перекрывающихся спектров боковых выглядят как на рисунке 5.10 б. Ясно, что в данном случае основной спектр частот выделить посредством выходной фильтрации невозможно. Можно лишь произвести неполное разделение так, чтобы выходное колебание содержало большую часть мощности основного спектра и небольшую часть мощности боковых спектров. Поэтому здесь есть два источника ошибок: - неидеально передается сигнал основного спектра (искажения сигнала за счет фильтрации); - боковые спектры подавляются неполностью. Из рисунка 5.10 б видно, что величина мощности, равная мощности исходного сигнала на частотах выше fд/2, транспонируется в область частот ниже fд/2 и поэтому будет пропускаться выходным фильтром даже с прямоугольной частотной характеристикой. Это является источником независимой ошибки такой же величины как и ошибка за счет отфильтрования части полезного сигнала (на f< fд/2). 153 - ошибки 1го рода присущи входной и выходной фильтрации, и их невозможно избежать или уменьшить на значительную величину; - ошибки 2го рода можно уменьшить входной фильтрацией, которая способствует разделимости боковых спектров, но при такой фильтрации ошибка первого типа становится почти максимальной. 5.2 Цифро-аналоговое преобразование звукового сигнала с передискретизацией Проблема фильтрации при АЦП и ЦАП аудиосигналов состоит в следующем: 1. В тракте используются аналоговые усилители с ограниченной полосой пропускания и определенной нелинейностью передаточной характеристики. Поэтому, высокочастотные составляющие, содержащиеся в выходном сигнале ЦАП, при недостаточной фильтрации вызывают интермодуляционные искажения сигнала, заметные на слух. 2. Подавление сигнала ФНЧ на частоте, равной половине частоты дискретизации, должно быть не менее 60 дБ. Крутизна ската ФНЧ получается при этом очень высокой. Например, при полосе пропускания 22 кГц и частоте дискретизации 48 кГц подавление сигнала фильтром на частоте 24 кГц должно составить 60 дБ, т.е. на участке 2 кГц коэффициент передачи фильтра должен уменьшится в 1000 раз. Крутизна спада АЧХ ФНЧ при подавлении в полосе пропускания 60 дБ составит 120 дБ/октаву. Для достижения таких значений крутизны должны быть созданы ФНЧ 12го порядка. Недостатки таких фильтров: - большое число усилительных каскадов, используемых в ФНЧ (шумы и другие искажения сигнала); - сложность в построении; - требуются прецизионные пассивные компоненты и высококачественные усилители (стоимость велика); - для приемлемых габаритов, временной и температурной стабильности требуется изготавливать ФНЧ в виде гибридной ИМС (стоимость велика); - фильтр высокого порядка имеет существенно нелинейную фазовую характеристику, что приводит к искажениям импульсных сигналов. А реальный звуковой сигнал содержит достаточно резкие перепады уровня (ударные, клавишные, шумоподобные звуки). Поэтому такой ФНЧ вносит заметные на слух искажения, проявляющиеся в потере «прозрачности» звучания. Для 1) ослабления требований к аналоговым фильтрам кодеров и декодеров (АЦП и ЦАП) и для 2) борьбы с шумами квантования за счет перераспределения энергии шумов в расширенном интервале частот 154 используются методы преобразования частоты дискретизации при переводе звукового сигнала из аналоговой формы в цифровую и обратно. Методы и устройства цифрового формирования и преобразования сигналов приобрели в настоящее время огромное значение. Без них не мыслимо радиовещание, бытовая и профессиональная аудиотехника. ПРЕОБРАЗОВАНИЕ ЧАСТОТЫ ДИСКРЕТИЗАЦИИ Восходящие и нисходящие дискретные системы. 1. Восходящей дискретной системой (ВДС), называется система, частота дискретизации на выходе которой выше частоты дискретизации входного сигнала. 2. Нисходящей дискретной системой (НДС), называется система, частота дискретизации сигнала на выходе которой ниже частоты дискретизации входного сигнала. Каждая ВДС состоит из элемента, увеличивающего частоту дискретизации – экспандера частоты дискретизации (ЭЧД), находящегося на входе системы, и дискретного фильтра, выполняющего последующую обработку сигнала с выходной частотой дискретизации. Каждая НДС состоит из дискретного фильтра, выполняющего предварительную обработку входного сигнала с входной частотой дискретизации и элемента, уменьшающего частоту дискретизации – компрессора частоты дискретизации (КЧД), находящегося на выходе системы. На рисунке 5.11 показаны преобразования сигнала и спектра при АЦП с передискретизацией. В этом случае ФНЧ имеет плавную АЧХ с ФЧХ близкой к линейной. АЦП ведется на fд′=4fд (на учетверенной частоте дискретизации по сравнению с необходимой). Дециматор Ан.с. К1 ФНЧ (К1) АЦП G1 4fд 4fд 8fд f К fd 4fд 8fд f fд 2fд 3fд f Рисунок 5.11 – Преобразования сигнала и спектра при АЦП с передискретизацией 155 G2 fд G2 К2 G1 f ЦФНЧ (К2) Дециматор (это НДС) понижает частоту дискретизации, при этом цифровой ФНЧ предварительно фильтрует сигнал с тем, чтобы спектры не перекрывались. Цифровой ФНЧ имеет АЧХ периодичную с fд′=4fд. Реализовать ЦФНЧ с требуемым затуханием и линейной фазовой характеристикой позволяют нерекурсивные фильтры. Компрессор частоты дискретизации понижает fд′ до fд. Поэтому передача или запись цифровых сигналов ведется на обычной fд (например 32 или 48 кГц). На выходе канала передачи или при воспроизведении проблема решается с помощью интерполятора (ВДС) (рисунок 5.12). 3 fд Интерполято р 4 Э. д ЦФН 4 д f Ч f fд 2fд fд 2fд f ФН Ч( 3) К f Ан.с . К3 G5 G4 G3 5 4fд f f Рисунок 5.12 – Схема и спектры интерполятора (ВДС) Цифровой сигнал поступает из канала с частотой fд. Экспандер частоты дискретизации увеличивает ее до fд′=4fд. При этом спектр сигнала не изменяется. Цифровой ФНЧ убирает частотные компоненты сигнала, прилегающие к частотам fд, 2fд, 3fд, 5fд и т.д. Это позволяет сделать ФНЧ с весьма плавной АЧХ, т.к. затухание 60 дБ требуется обеспечить лишь на частотах ~4fд. Поэтому ФНЧ получается с линейной фазовой характеристикой. Экспандер частоты дискретизации (ЭЧД). ЭЧД, увеличивающий частоту дискретизации входного сигнала в m раз (m – целое число), представляет собой блок, преобразующий входной дискретный сигнал, описываемый решетчатой функцией X(kT′) (k=0,1,2…) с периодом повторения T, в выходной дискретный сигнал, описываемый функцией X*(nT′)=X( с периодом повторения T′= nT ) (n=0,1,2…) m T по алгоритму m x( n T) при n=0, m, 2m,…; m при других n. X*(nT′)= 156 Т.е. последовательность X*(nT′) получается из последовательности X(nT) путем ввода (m-1)-го нулевого отсчета между двумя последовательными входными отсчетами. На рисунке 5.13 показаны последовательности X(nT) и X*(nT′) на входе и выходе ЭДЧ при увеличении частоты дискретизации в 3 раза (m=3). Спектры входного и выходного X(kT) сигналов ЭДЧ связаны соотношением Gx* (e jT  )  Gx (e jmT  ) X*(kT') T=3T' t Таким образом выходной сигнал ЭЧД имеет тот же спектр, что и входной сигнал, т.е. спектр выходного сигнала периодичен со «старой» частотой дискретизации ωд= а не с частотой ωд´= T' t 2 , T 2 , как это обычно T имеет место для сигналов, дискретизации которых равен T´. интервал Рисунок 5.13 – Последовательности на входе и выходе ЭДЧ Модули спектров входного и выходного сигналов ЭДЧ при m=3 показаны на рисунке 5.14. Gx Gx* д=2/T  д=2/T'  Рисунок 5.14 – Модули спектров входного и выходного сигналов ЭДЧ Компрессор частоты дискретизации КДЧ. КДЧ, уменьшающий частоту дискретизации входного сигнала в m раз (m – целое), представляет собой ключ, который замыкается в моменты времени t=mnT+kT; k=0,1…m-1; n=0,1,2… т.е. из входного дискретного сигнала, описываемого решетчатой функцией X(nT), n=0,1,2… с периодом повторения T, берется только каждый m-й отсчет, т.е. получается выходной дискретный сигнал X*(pT′)=X*(pmT), p=0,1,2,…; 157 с периодом повторения T´=mT. Операция, выполняемая КЧД, часто называется прореживанием. На рисунке 5.15 показаны последовательности X(nT) и X*(pT′) на входе и выходе КЧД при уменьшении частоты дискретизации в 4 раза (m=4, k=2). Спектр выходного сигнала КЧД есть сумма спектров входного сигнала, сдвинутых относительно друг друга по оси частот ω на величину 2π/mT. Т.е. появляется наложение спектров. Рисунок 5.15 – Последовательности на входе и выходе КЧД Увеличение частоты дискретизации (интерполяция) сигнала. В цифровой обработке сигналов под интерполяцией понимается процесс, приводящий к формированию сигнала с повышенной частотой дискретизации y(nT) из сигнала x(pT)=x(pmT) при определенных ограничениях на временные и спектральные изменения исходного сигнала. Система увеличения частоты дискретизации (интерполяции) сигнала относится к классу восходящих дискретных систем. Простейшая ВДС состоит из экспандера fd и дискретного фильтра с передаточной функцией H(Z), Z=exp(jωT´), работающего на высокой частоте дискретизации (рисунок 5.16). Рисунок 5.16 – Простейшая ВДС На рисунке 5.17 показаны модули спектров сигналов X(t), X(nT´), АЧХ фильтра и модуль спектра выходного сигнала ПВДС при m=3. Предполагается, что сигнал X(pmT´) получен в результате дискретизации аналогового сигнала X(t) с ограниченным спектром (ω  [0,ωmax]), частота дискретизации fд´=1/T´=1/mT= ωmax/π. Спектры входного и 158 выходного сигнала ЭЧД равны, периодичны с частотой (нормированной) ωд*=1/m и связаны со спектром исходного аналогового сигнала X(t). Выходной сигнал ЭЧД обрабатывается «идеальным» ФНЧ с передаточной функцией H(Z), задачей которого является подавление «лишних» частотных составляющих спектра сигнала X*(nT), занимающих область частот ω [1/(2m);0.5], т.е. получение сигнала y(nT) с периодичным спектром с частотой ωд=1 (нормированной). Рисунок 5.17 – Модули спектров сигналов ПВДС при m=3 ФНЧ должен иметь коэффициент усиления m в полосе пропускания, определяемой шириной спектра исходного интерполируемого сигнала, и подавлять частотные составляющие спектра, лежащие в диапазоне [1/(2m);0.5]. Выводы: 1. ПВДС, содержащую ЭЧД и идеальный цифровой ФНЧ, можно рассматривать как совокупность идеального интерполятора и линейной системы с частотной характеристикой H  (e j 2 )  e i ( ) 2. Форма и спектр выходного сигнала ПВДС при интерполяции сигнала существенно зависят от типа используемого фильтра. При интерполяции используются рекурсивные и нерекурсивные цифровые фильтры. 159 Нерекурсивные фильтры НФ с передаточной функцией N 1 H ( Z )   bl Z l l 0 и линейной ФЧХ φ(ω)=-L2πω могут иметь нечетное и четное число отсчетов импульсной характеристики. В обоих случаях сохраняется как модуль спектра, так и форма входного сигнала, но во втором случае отсчеты входного сигнала не сохраняются. Рекурсивные фильтры и минимально-фазовые НФ обладают нелинейными ФЧХ и поэтому не сохраняют форму входного сигнала при интерполяции. Уменьшение частоты дискретизации (децимация) сигнала. Системы уменьшения частоты дискретизации сигнала относятся к классу нисходящих дискретных систем. Уменьшение частоты дискретизации сигнала X(nT) в m раз (m – коэффициент децимации) осуществляется компрессором частоты дискретизации (КЧД), формирующим сигнал y*(pT´) путем взятия только каждого m-го отсчета из последовательности X(nT), т.е. y*(pT´)=X(pmT), p=1,2,… Для предотвращения явления наложения спектров уменьшению частоты дискретизации предшествует, как правило, фильтрация децимируемого сигнала X(nT) дискретным фильтром с передаточной функцией H(Z). Схема децимации (ПНДС). Предположим, что спектр входного сигнала занимает полосу нормированных частот ω  [0;0.5]. Задача схемы – уменьшение fд в m раз с сохранением спектра, расположенного в полосе [0,ωmax]. Коэффициент децимации m ограничивается сверху условием ωmax<1/(2m). Рисунок 5.18 – Простейшая нисходящая дискретная система. На рисунке 5.19а показан модуль спектра входного сигнала. Заштрихованная область соответствует части спектра, подлежащей выделению. Входной сигнал X(nT) обрабатывается фильтром, назначение которого состоит в подавлении составляющих спектра в частотных диапазонах [ l 1 1 ] , (l  1) 2m 2m (l = 1,2,…,m-1), которые при последующем уменьшении fд в m раз попадут в частотный диапазон [0,1/2m]. 160 Рисунок 5.19 – Преобразования спектров в схеме децимации Идеализированная АЧХ фильтра нижних частот ПНДС должна удовлетворять требованиям 1 при ω  [0, ωmax] j2πω A(ω) =│H(e )│= 0 при ω  [θ, 0.5] где ωmax< θ ≤+ ωmax; θ=ωгз – граничная частота полосы задерживания фильтра. АЧХ фильтра показана на рисунке 5.17в. На рисунке 5.17г изображен модуль спектра выходного сигнала в случае θ=1/2m. Из рисунка 5.17г видно, что наложение спектров отсутствует, а так как в реальных условиях АЧХ фильтра аппроксимирует с определенной степенью точности, то такое наложение всегда имеет место. Требования к АЧХ фильтра значительно облегчаются, если Wmax  1 2m Так как при обработке аудиосигналов требуется сохранение фазовых соотношений между составляющими спектра входного сигнала в полосе частот [0, ωmax], в ПНДС целесообразно использовать нерекурсивный фильтр с линейной фазовой характеристикой. 161 5.3 Квантование Дискретизированный сигнал существует только в определенные моменты времени, но его уровень принадлежит непрерывному интервалу значений. Чтобы получить дискретное представление сигнала, каждому отсчету должна быть поставлена в соответствие некоторая дискретная мера уровня. Это можно сделать путем сравнения отсчета со шкалой, имеющей конечное число интервалов, и определение его, например средним значением того интервала, в который он попадает. Этот процесс называется квантованием. Другими словами квантование состоит в замене всех возможных мгновенных значений сигнала некоторыми разрешенными уровнями, т.е. каждое значение амплитуды импульса заменяется ближайшим к нему разрешенным значением. Расстояние между соседними разрешенными уровнями квантования называют шагом квантования. Нечто подобное квантованию мы осуществляем, часто того не осознавая, когда выражаем измеренную величину при помощи ограниченного числа значащих цифр. Процедуру квантования можно рассматривать как результат прохождения входного сигнала через нелинейное безынерционное устройство с амплитудной характеристикой ступенчатой формы (рисунок 5.20), которая называется шкалой квантования. Рисунок 5.20 – Амплитудная характеристика линейного квантователя Если в пределах шкалы шаг квантования остается постоянным, квантование называется линейным (или равномерным), квантование с неравными шагами квантования называется нелинейным (неравномерным) (рисунок 5.21). 162 Рисунок 5.21 – Амплитудная характеристика нелинейного квантователя Квантование сигналов сопровождается погрешностью, которая тем меньше, чем меньше шаг квантования. Разность между исходным и квантованным значениями сигнала является ошибкой квантования и часто называется шумом квантования (рисунок 5.22). Uвых Uвх ошибка квантования Uвх Рисунок 5.22 – Шум квантования 163 Разница между шумом квантования и другими шумами, действующими в аудиоаппаратуре и системах передачи сигналов заключается в том, что в отличие от последних шум квантования возникает в результате детерминированного нелинейного преобразования входного сигнала. Поэтому было бы правильнее говорить об искажениях, а не о шумах квантования. Характеристика квантования имеет две зоны: квантования при |Uвх|≤|Uогр| и ограничения при |Uвх|>|Uогр|. Зона квантования является рабочей областью характеристики. В ее пределах осуществляется квантование сигнала. Если мгновенное значение входного сигнала Uвх выйдет за пределы зоны квантования, то выходное напряжение будет оставаться неизменным и равным Uвых макс независимо от значения Uвх. Возникающие при этом искажения имеют характер безынерционного ограничения сигнала и считаются недопустимыми. Разность между исходным и ограниченным сигналами называют шумом ограничения. Мощность шумов квантования, отношение Pc/Pш кв. Определим значение мощности шума квантования для произвольной шкалы квантования. Пусть сигнал с плотностью вероятности распределения мгновенных значений W(U) подвергается квантованию в диапазоне мгновенных значений –Uогр до +Uогр (рисунок 5.15) с шагом δi, величина которого может изменяться. Из рисунка 5.23 видно, что вероятность появления сигнала с уровнем, лежащим в пределах i-го шага ui  i / 2 Pi=  W (u )du ≈W(ui)δi ui  i /2 где W(ui) – плотность вероятности напряжения сигнала в середине рассматриваемого интервала. Мгновенная мощность шумов квантования, развиваемая на сопротивлении 1 Ом, равна квадрату ошибки квантования, т.е. Pш.кв.мгн=(u-ui)2, а часть этой мощности шума, появляющейся при квантовании сигналов в пределах i-го шага, составляет ui  i / 2 Pш.кв.мгн=  (u  u ) W (u)du ≈ 121 W(u )δ 3i 2 i ui  i / 2 i Pш.кв.мгн.i≈δ i2 pi/12 Рисунок 5.23 – Распределение вероятности появления сигнала 164 Суммарная мощность шума квантования равна сумме составляющих от каждого шага: N 1 2  i pi Pш.кв.=  i 0 12 При равномерной шкале квантования, когда все δi равны, имеем Pш.кв=δ2/12 Отсюда следует важный вывод: при равномерном квантовании мощность шума квантования определяется исключительно шагом квантования. Шум квантования представляет собой случайный процесс с равномерным распределением в пределах –δ/2…+δ/2 (рисунок 5.24). Его плотность вероятности описывается выражением W(x)=1/δ W(x) Gx 1    2 2 x fd 2 f Рисунок 5.24 – Распределение шума квантования и его спектр Спектр шума квантования равномерный в полосе 0…fд/2. Шум квантования проявляется только при наличии сигнала. При отсутствии сигнала на входе АЦП можно было бы ожидать, что на выходе ЦАП шум будет полностью подавлен. Однако наличие теплового шума входных аналоговых блоков АЦП, нестабильность напряжения питания, переходные помехи от соседних каналов, дрейф постоянной составляющей в усилителях постоянного тока и действие других факторов приводят к тому, что самый низкий первый уровень квантования достигается даже при отсутствии сигнала на входе АЦП. На рисунке 5.25 изображен начальный участок шкалы квантования и показано, как входные шумы преобразуются в АЦП в квантованное колебание. На выходе ЦАП это квантованное колебание превращается в шум, называемой шумом паузы. Шум паузы менее равномерный, чем белый шум, характерный для аналоговых систем, и его часто называют гранулированным. Мощность шума паузы Pш.п=δ2/4 на 4.7 дБ больше шума квантования. 165 Рисунок 5.25 – Преобразование шумов в АЦП в квантованное колебание Определим отношение сигнал-шум на выходе квантующего устройства. Поскольку Pш.кв не зависит от уровня входного сигнала, с увеличением мощности входного сигнала Pс отношение Pс/Pш.кв линейно растет до тех пор, пока не возникают шумы ограничения. Наличие последних резко уменьшает помехозащищенность. Поэтому, как отмечено, система кодирования строится так, чтобы ограничения сигнала практически не возникало. Для этого порог ограничения квантующего устройства должен быть равен квазимаксимальному Uс.макс значению сигнала, т.е. Uогр= Uс.макс=kUср Здесь k – пик-фактор сигнала; Uср – среднеквадратичное значение сигнала. Число шагов квантования можно определить по известным Uогр и δ: n= 2 U огр 1  2  2 огр U огр  2 2 1U 1 k U ср  Pш.кв= 3 n2 3 n2 2 Поскольку на сопротивлении 1 Ом мощность сигнала Pс=U ср Pc 3n 2  2 или в децибелах Pш.кв k Pc n  20 lg  4.8 Pш.кв k m При m-разрядном кодировании n=2 . Pc  6m  20 lg k  4.8 Pш.кв У гармонического сигнала пик-фактор k  2 , и в этом случае 166 Pc  6m  1.8 Pш.кв У сигналов вещания пик-фактор зависит от жанра программы. В среднем считают, что он равен 13 дБ. Поэтому для вещательного сигнала Pc  6m  8.2 Pш.кв Это выражение не учитывает неодинаковой чувствительности слуха человека к составляющим шума разных частот, определяемой псофометрическим коэффициентом. С его учетом отношение сигнал-шум квантования уменьшается на 8.5 дБ для сигнала в полосе до 15 кГц и составляет Pc  6m  16.7 Pш.кв Неравномерное (нелинейное) квантование. При равномерном квантовании обеспечить высокую защищенность от шумов квантования для всех сигналов, в том числе и для самых слабых, можно только увеличив число разрядов на отсчет при кодировании. При этом отношение сигнал-шум линейно зависит от уровня входного сигнала, а требуемая скорость передачи оказывается весьма высокой. Для снижения скорости цифрового потока применяется неравномерное квантование, которое позволяет повысить отношение сигнал-шум квантования для слабых сигналов за счет уменьшения этого отношения для сильных сигналов. Очевидно, что значение Pс/Pш.кв должно оставаться достаточно высоким во всем диапазоне изменения уровней входного сигнала. Неравномерная шкала квантования при АЦП звуковых сигналов формируется путем использования: - мгновенного и - почти мгновенного компандирования. Мгновенное компандирование. Устройство, реализующее неравномерное квантование с использованием мгновенного компандирования, состоит из последовательно включенных компрессора К, квантующего устройства КУ с равномерной шкалой квантования и экспандера Э (рисунок 5.26). K КУ Э Рисунок 5.26 – Схема мгновенного компандирования Компрессор является здесь безынерционным устройством мгновенного действия с амплитудной характеристикой вида 167 Рисунок 5.27 – Амплитудная характеристика компрессора Выходной сигнал компрессора подвергается равномерному квантованию. Из рисунка 5.27 видно, что квантование выходного сигнала с равномерным шагом соответствует неравномерному квантованию входного сигнала. Экспандер включается на приемной стороне после цифро-аналогового преобразователя. Амплитудная характеристика экспандера обратна характеристике компрессии, и экспандер должен скомпенсировать нелинейные искажения, внесенные в сигнал компрессором. Т.е. коэффициенты передачи Кк и Кэ должны быть связаны соотношением Кк∙Кэ=1 Определим оптимальный закон компрессии, при котором отношение сигнал-шум квантования будет оставаться постоянным в наибольшем диапазоне изменения уровней входного сигнала. При некотором входном сигнале Uвх шаг неравномерного квантования 1 1 δн=δ =δ , tg  dU вых / dU вх где dUвых/dUвх – производная характеристики компрессии. Т.к. ранее было показано, что 2 Pш.кв= , 12 то при напряжении входного сигнала Uвх и соответствующему ему шаге квантования δн получаем Pc U2  12 вх2 Pш.кв н Отсюда видно, что отношение Pс/Pш.кв будет оставаться постоянным, если шаг квантования возрастает пропорционально напряжению входного сигнала. Такая шкала квантования называется пропорциональной. В этом случае U вх U вх dU вых   const н  dU вх 168 Решение полученного дифференциального уравнения описывает оптимальную характеристику компрессии Uвых=с∙ln(μUвх), где с и μ – постоянные интегрирования. При начальных условиях, определяемых видом характеристики компрессии: Uвых=0 при Uвх=0 и Uвых=Uвых.макс при Uвх=Uвх.макс; Устройство с амплитудной характеристикой вида Uвых=с∙ln(μUвх) физически нереализуемо, поскольку Uвых→-∞ при Uвх→0. Поэтому на практике используют два других закона компрессии, близкие к оптимальному. Квантование по μ-закону. U вых  U вых. макс ln(1   U вх / U вх. макс ) ln(1   ) где μ – коэффициент сжатия. Вид этой характеристики показан на рисунке 5.28. Отношения максимального шага квантования к минимальному при использовании μхарактеристики равно  макс  1   мин Чем выше значение μ, тем заметнее различие между δмакс и δмин. Выбор μ влияет на отношение Pc/Pш.кв. Увеличение μ улучшает Pc/Pш.кв для слабых сигналов и ухудшает для сильных. В телефонии μ=100. Для аудио-сигналов (например ЗВ) μ=15. Рисунок 5.28 – Амплитудные характеристики компрессора при различных μ Компрессия по А-закону. (для слабых сигналов логарифмическая функция заменяется линейной): 169 Здесь А – это число. Во многих системах передачи (многоканальных) А=87.6 при компрессии по А-закону. При этом сигналы, напряжение которых меньше Uвх.макс/А квантуются с постоянным шагом. В противном случае сигналы квантуются неравномерно по логарифмическому закону. При этом при А-законе характеристика отношения Pc/Pш.кв оказывается более плоской, чем при μ-законе, а абсолютные значения отношения Pc/Pш.кв при А- и μ-законе примерно равны, если равны выбранные значения А и μ. Практическая реализация неравномерного квантования с использованием аналогового компрессора сильно затруднена, т.к. при неидеальном выполнении условия (Кк∙Кэ=1) в выходном сигнале возникают нелинейные искажения. Подобрать характеристики К и Э сложно, поскольку К находится на передающей стороне канала, а Э – на приемной и одному К могут соответствовать несколько различных Э. Поэтому в системах кодирования отказываются от аналоговых компрессоров и переходят к цифровым, у которых плавная характеристика компрессии заменяется линейно-ломаной аппроксимирующей функцией. В зависимости от числа используемых сегментов при аппроксимации и вида закона компрессии линейно-ломаную характеристику компрессии обозначают буквой и двумя цифрами. Так, запись А87.6/13 означает, что используется аппроксимация по Азакону при А=87.6 с 13 аппроксимирующими сегментами (рисунок 5.29). Рисунок 5.29 – Амплитудная характеристика компрессора при А87.6/13 170 В пределах каждого сегмента шаг квантования постоянен, но при переходе от одного сегмента к другому изменяется в два раза. Число уровней квантования в пределах каждого сегмента постоянно. В таких компрессорах процедура квантования сводится к процедуре кодирования. Вначале определяется полярность сигнала и в зависимости от нее формируется символ первого разряда в кодовой группе. Затем кодируется в двоичном коде номер сегмента, в пределах которого находится уровень входного сигнала. Если, например, число сегментов для каждой полярности сигнала равно восьми (как при законе А87.6/13), то для кодирования номера сегмента нужны трехразрядные кодовые комбинации. Далее кодируется номер уровня входного сигнала в пределах сегмента. Если число таких уровней равно 64, то для кодирования номера уровня необходима шестиразрядная кодовая комбинация. Общее число разрядов в кодовом слове равно 10 (первый разряд определяет полярность сигнала, следующие три – номер сегмента и последние шесть – номер уровня в пределах сегмента). Почти мгновенное компандирование. При почти мгновенном компандировании вместо одной неравномерной шкалы квантования используют пять различных шкал с равномерным квантованием, но различным шагом. Выбор той или иной из них определяется максимальным уровнем кодируемого сигнала за время, равное 1 мс. Вид используемых характеристик квантования показан на рисунке 5.30. Рисунок 5.30 – Амплитудные характеристики компрессора при почти мгновенном компандировании Число шагов квантования у каждой из шкал одинаково и равно 512 для одной полярности сигнала. Следовательно, кодовые слова, соответствующие отсчетам сигнала, должны содержать m=10 разрядов (1 на полярность). Процедура кодирования в этом случае состоит в следующем: 171 1) 32 отсчета (при fд=32 кГц соответствует длительности сигнала в 1 мс) сигнала кодируется при минимально возможном шаге квантования. Это соответствует разрешающей способности кодирования в 14 разрядов на отсчет. 2) Получение 32 14разрядных слова запоминаются, а затем в зависимости от значения наибольшего из них четыре разряда из 14 отбрасываются. - При этом если отбрасываются 4 старших разряда, то сохраняется минимально возможный шаг квантования; - Отбрасывание одного младшего и трех старших разрядов соответствует увеличению шага квантования в два раза; - двух младших и двух старших – в 4 раза; - трех младших и одного старших – в восемь раз; - четырех младших – в 16 раз. Таким образом, при почти мгновенном компандировании шаг квантования зависит не от мгновенного значения сигнала, а от максимального в течение 1 мс. Допустимость этого определяется тем, что аудиосигнал в течение 1 мс изменяется сравнительно мало. Для обеспечения правильного восстановления абсолютного значения уровня сигнала на приемной стороне каждый блок из 32 слов сопровождается трехразрядной служебной комбинацией, определяющей, какая из шкал квантования использовалась при кодировании. 5.4 Кодирование В результате дискретизации и квантования получается дискретный сигнал (дискретен по уровню и во времени). Для передачи этого сигнала по проводнику или радиоканалу, а также для записи на ленту или диск он должен быть преобразован в другой вид. Этот процесс называется кодированием. На практике квантование и кодирование обычно объединяются в общем функциональном узле аппаратуры. Квантованный отсчет сигнала является элементом дискретного сигнала с большим числом значений, например, 64, 128, или более. Его можно передавать непосредственно по каналу только при условии, что уровень помех значительно ниже одного кванта. Цель кодирования – представить один элемент с большим основанием в виде группы элементов с малым основанием, так как последние лучше согласуются с параметрами канала передачи. Эта группа называется кодовым словом. Например, выборка, квантованная в один из 128 уровней, может быть представлена семиэлементной комбинацией двоичных символов. Каждый двоичный разряд имеет два значения уровня, а семь разрядов дают 27=128 комбинаций. Существует много способов установления однозначного соответствия между квантованными уровнями и кодовыми комбинациями. Один из 172 удобных способов – выражать порядковые номера квантованных уровней в виде двоичных чисел. n  am1 2 m1  am2 2 m2  ...  ao 2 o , где n – номер кодируемого уровня квантования; m – число разрядов в кодовой группе (слове); а – число, принимающее значение 0 или 1. Кодовая комбинация, соответствующая числу n, содержит передаваемые последовательно аm-1, am-2…ao. Необходимое число разрядов (длина кодового слова) для кодирования при заданном максимальном числе уровней шкалы квантования nмакс определяется из выражения m=log2nмакс. Если кодовая группа содержит m символов 0 или 1, то с помощью такого m-разрядного двоичного кода можно закодировать число до nмакс=2m. Несколько элементов кодовой комбинации кодирующее устройство (кодер) может генерировать одновременно (последовательно или параллельно). Их можно передавать последовательно по общему каналу, либо параллельно по индивидуальным каналам. Более распространенной является передача в последовательной форме. Для восстановления исходного сигнала необходимо выполнить обратную операцию, называемую декодированием. Декодер при подаче на его вход нескольких элементов кодовой комбинации преобразует ее в дискретный квантованный сигнал, являющийся наилучшим приближением к исходному отсчету. Сигнал, прошедший этапы дискретизации, квантования и кодирования, называется ИКМ-сигналом, а совокупность этих операций – импульснокодовой модуляцией (ИКМ). Двоичные символы, входящие в состав кодовых групп, называются битами. Они имеют разный вес. Наименьший вес имеет младший бит а о, несущий информацию об одном шаге квантования. Старший значащий бит аm-1 несет информацию о 2m-1 шагах квантования и имеет наибольший вес. Пусть, например, кодируется отсчет сигнала, имеющий уровень n=115, а шкала квантования содержит nмакс=256 отсчетов. В этом случае m=log2256=8 и число n записывается в двоичной системе следующим образом: n=0·27+1·26+1·25+1·24+0·23+0·22+1·21+1·20 Соответствующая кодовая комбинация имеет вид 01110011. Такой код называют натуральным. В цифровых системах связи и вещания распространены также симметричные коды, характеризуемые тем, что первый символ кодовой комбинации определяется полярностью кодируемого отсчета сигнала, а остальные символы несут информацию об абсолютном значении отсчета. Если кодируется сигнал положительной полярности, первым битом кодового слова является 1, а если отрицательной полярности, то 0. Разнополярные отсчеты, равные по абсолютному значению, различаются только первым символом в кодовом слове. 173 Последовательность m-разрядных кодовых слов является выходным сигналом аналого-цифрового преобразователя. Обычно при передаче и записи к выходному сигналу АЦП добавляется дополнительная информация, которая служит для повышения достоверности передачи и синхронизации. При этом кодовые слова, подвергаемые одновременной обработке, объединяются в блоки. Соответствующий данному коду порядок следования кодовых слов и отдельный символов в блоке называется форматом кода. Обратное преобразование цифрового сигнала в аналоговую форму осуществляет цифро-аналоговый преобразователь (ЦАП), состоящий из декодера и фильтра нижних частот. Простейшая схема передачи (или записи воспроизведения) с ИКМ показана на рисунке 5.31. Передача или запись Д К Канал Рг Прием или воспроизведение Рг Dk Рисунок 5.31 – схема передачи с ИКМ На передающей стороне основными операциями являются дискретизация и кодирование (последнее обычно включает и квантование). На приемной стороне регенерация искаженного сигнала и декодирование результирующей последовательности квантованных выборок (процедуры модуляции и демодуляции здесь не показаны). Для иллюстрации на рисунке 5.32 показаны виды сигналов, соответствующих различным этапам обработки и передачи (записи) для случая 4х-разрядного двоичного числового кода. Этот код используется для передачи 16 квантованных уровней. Передаваемые кодовые комбинации в данном случае занимают полные интервалы времени между соседними отсчетами; практически их можно передавать (записывать) либо таким способом, либо сжимать во времени в последовательности меньшей длительности и размещать в промежутках между другими сигналами такого же типа. В последнем случае по одному общему тракту с достаточно высокой скоростью передачи можно передать (записать) несколько сообщений. Эта операция называется временным уплотнением. На рисунке 5.32 показан случай передачи кодовой последовательности по каналу, ширина полосы пропускания которого ограничена и в котором присутствует шум, вызывающий случайные искажения сигнала. Запаздывание сигнала в канале для простоты не учитывается. Для получения регенерированной кодовой комбинации берут отсчеты принимаемого сигнала в середине каждого тактового интервала; поэтому регенерируемая последовательность задерживается относительно принимаемой на половину тактового интервала. 174 Декодирование можно осуществить только тогда, когда будут приняты все разряды данной комбинации, поэтому восстанавливаемые отсчеты дополнительно задерживаются относительно исходных на время, равное периоду дискретизации. 16 14 12 10 8 6 4 2 Шкала квантования передаваемая кодовая комбинация в г д а б 0011 0110 1100 1110 1001 0110 а=3 б=6 в=12 г=14 д=9 принимаемая кодовая последовательность порог регенерированная кодовая последовательность декодированные квантованные отсчеты Рисунок 5.32 – Преобразования сигналов в схеме с ИКМ Эти задержки достаточно малы. Значительно большую задержку и фазовые искажения вносит демодулирующий фильтр (на рисунке 5.32 не показан), который осуществляет интерполяцию между отсчетами. При построении упрощенной структурной схемы не учтена важная операция – идентификация разрядов кода. Эта операция осуществляется счетчиками, которые делят последовательность разрядов на комбинации требуемой длины. Чтобы эти счетчики группировали разряды одинаково, необходима их синхронизация, для чего периодически передается какая-либо легко идентифицируемая комбинация. Принципиальная особенность кодирования заключается в том, что кодированный сигнал с низким основанием кода r (например, 2) обладает 175 более высокой помехоустойчивостью, чем квантованная выборка этого сигнала с высоким основанием кода R (например, 128). Однако кодированный сигнал содержит большее число элементов, в общем случае logrR (или ближайшее большее целое число, если это значение оказывается дробным). Для передачи этих элементов требуется соответственно более широкая полоса частот. Поэтому двоичное кодирование наиболее выгодно в тех случаях, когда канал передачи характеризуется высоким уровнем шумов, но имеет достаточно широкую полосу частот. Коды. Кодом называется множество комбинаций, которые, будучи взяты по порядку, соответствуют множеству уровней. Комбинацией (кодовым словом) называется группа элементов сигнала, например, двоичные разряды, которые в совокупности определяют отсчетное значение исходного сигнала; в случае ИКМ они определяют уровень, представляющий собой порядковый номер интервала на шкале квантования, в который попадает отсчетное значение исходного сигнала. В системе ИКМ над сообщением осуществляются три основных операции, которые могут влиять на выбор кода, а именно: кодирование, цифровая передача и декодирование. Методы кодирования и декодирования налагают ограничения на порядок, в котором комбинации распределяются по уровням, но не на ансамбль используемых комбинаций. Тракт передачи ограничивает виды последовательностей разрядов, которые можно передать (например ограничение ансамбля комбинаций). Поскольку ограничения, налагаемые кодированием, передачей и декодированием, являются независимыми, они часто оказываются несовместимыми. Так может возникнуть необходимость получить некоторый код (назовем его А), удобный для кодирующего устройства. Однако он не пригоден для передачи по каналу связи, поэтому его преобразуют цифровыми методами в код B, который лучше согласован с каналом. Наконец, если для кодов A и B не существует простых методов декодирования, то может понадобиться еще одно цифровое преобразование – в код С. Мы рассматриваем двоичные числовые коды – наиболее известные представители более широкого класса весовых кодов. У двоичных кодов веса разрядов есть степень числа 2. Расстоянием между кодовыми комбинациями называется число разрядов, в которых они различаются, например комбинации 110101 и 101010 имеют расстояние равное 5. Это расстояние принято еще называть расстоянием Хэмминга. Избыточностью кода называется отношение числа неиспользуемых комбинаций ко всему объему кода. 176 Введение в код определенной избыточности требуется для обнаружения и исправления ошибок, возникающих при передаче по каналу связи из-за наличия помех и искажений. Для введения избыточности цифровой сигнал разделяется на блоки, в которые, кроме полезной информации о звуковом сигнале, включаются дополнительные символы обнаружения и исправления ошибок. Перед обратным цифро-аналоговым преобразованием эти блоки подвергаются цифровой обработке, в процессе которой обнаруживаются и исправляются пораженные ошибкой символы в блоке. Исправление ошибок – задача гораздо более сложная, чем обнаружение, и требует введения в сигнал существенно большей избыточности. Из теории кодирования известно, что код обладает тем лучшей способностью к исправлению ошибок, чем больше различаются кодовые слова. Минимальное расстояние между кодовыми словами данного кода называется кодовым (d). Величина d является основным показателем корректирующей способности кода. В теории помехоустойчивого кодирования показано, что для обнаружения ошибок кратности q кодовое расстояние должно составлять d≥q+1. Для исправления ошибок кратности q необходимо, чтобы d≥2q+1. Процедура исправления ошибок состоит в том, что комбинация, принятая ошибочно, заменяется той, принадлежащей коду, расстояние до которой оказывается наименьшим. Отсюда ясно, что чем больше кратность ошибки, которую необходимо исправить, тем больше должна быть избыточность, которую необходимо вносить в передаваемый сигнал. Кроме того, требуемая избыточность тем больше, чем больше символов кодовой группы необходимо защитить от ошибок. Поэтому с учетом заметности искажений в системах передачи сигналов звукового вещания обычно защищают от ошибок пять-шесть старших разрядов, а также служебные комбинации, определяющие использованную шкалу квантования при почти мгновенном компандировании. Ошибки в младших разрядах, если частота их появления не слишком велика, достаточно обнаруживать и маскировать. Выбор способа обнаружения ошибок, метода маскирования ошибок или помехоустойчивого кодирования зависит как от среднего значения вероятности ошибки, так и от законов их группирования. Поэтому в студийном оборудовании, устройствах звукозаписи, каналах передачи методы повышения достоверности оказываются различными. Обнаружение ошибок. Наиболее часто используется принцип четности, состоящий в том, что в каждое кодовое слово дополнительно вводится один символ 0 или 1, причем такой, чтобы количество единиц в слове было четным. При приеме выделяются кодовые слова, и в каждом из них подсчитывается число единиц. Нечетное число будет означать наличие ошибки при передаче. 177 Если ошибка обнаружена, то далее происходит ее маскирование, которое состоит в замене искаженного отсчета другим отсчетом, минимально отличающимся от истинного. Применяют два способа маскирования: экстраполяцию нулевого порядка либо интерполяцию первого порядка. Экстраполяция – искаженный отсчет заменяется предыдущим. Интерполяция – искаженный отсчет определяется как среднее арифметическое предыдущего и последующего отсчетов. Исправление ошибок. В качестве исправляющих распространены блочные линейные (m,k) коды, у которых передаваемая последовательность символов разделена на блоки, содержащие одинаковое число символов. Из общего числа m символов в блоке k символов являются информационными, а r=m-k – проверочными. Информационные символы занимают k первых позиций в блоке, проверочные – последние m-k. Проверочные символы формируются в результате выполнения некоторых линейных операций над информационными символами, в частности являются суммой по модулю 2 различных сочетаний информационных символов. Особенностью линейного кода является то, что сумма (и разность) входящих в код кодовых слов также является кодовым словом, принадлежащим этому коду. Корректирующие коды характеризуются избыточностью, которая определяется относительным увеличением блока из-за введения в него дополнительной информации для достижения заданной корректирующей способности. Количественно избыточность кода определяется выражением: R=(m-k)/m Циклические коды – разновидность линейных кодов, у которых циклическая перестановка символов любой комбинации приводит к образованию комбинаций этого кода. Цикличность позволяет уменьшить емкость памяти устройств кодирования и исправления ошибок. Пример циклических кодов: БЧХ (Боуза-Чоудхори-Хоквингема) и РС (Рида-Соломона). Метод перемежения символов. В аппаратуре записи сигналов могут появиться пакеты ошибок длиной в сотни разрядов. Исправить ошибки такой кратности практически невозможно. Поэтому для борьбы с ними используется специальный способ формирования сигнала, позволяющий превратить ошибки большой кратности во множество одиночных ошибок. Способ этот называется перемежением информации. 178 Строка 1 – исходная последовательность кодовых слов по 8 символов в каждом. Перед записью порядок следования символов в последовательности изменяется (строка 2) (в начале 1е разряды записываются, затем вторые, третьи и т.д.). После воспроизведения порядок символов восстанавливается. Тогда, если при записи возникает пакет ошибок (*) (например 7 букв подряд), то в отсутствие перемежения искажаются символы с а7 по б5 подряд. Если пакет ошибок возникает у сигнала, подвергнутого перемежению, то после деперемежения (операция обратная перемежению) пакет ошибок превращается в последовательность одиночных ошибок. 5.5 Компрессия цифрового звука или редукция аудиоданных Целью компактного представления аудиосигналов является снижение скорости цифрового потока, либо уменьшение количества данных при записи аудиосигналов. За последние десятилетия разработаны различные алгоритмы сжатия аудиоданных, некоторые из которых получили широкое практическое применение (например, алгоритм MUSICAM в стандарте MPEG ISO/EC 11172-3 Layer 3, ATSC-AC-3(Dolby AC-3)), другие находятся в стадиях либо исследования, либо внедрения. При первичном цифровом представлении высококачественных звуковых сигналов суммарная скорость цифрового потока оказывается достаточно большой (при fd=48 кГц и разрешении 16 бит/отсчет) – 768 кбит/с на один сигнал, что требует суммарной пропускной способности канала связи при передаче равной 3.84 Мбит/с. Человек способен сознательно обрабатывать только около 100 бит/с информации. Поэтому можно говорить о присущей первичным цифровым ЗС избыточности. Важной проблемой при цифровом представлении ЗС является сокращение имеющейся в них статистической и психофизической избыточности. Это позволяет уменьшить скорость цифрового потока при кодировании ЗС до предельно возможной величины, при которой шумы, помехи и искажения остаются еще незаметными на слух. Статистическая избыточность. 1) Сокращение статистической избыточности базируется на учете свойств самих звуковых сигналов. Она обусловлена наличием корреляционной связи между соседними отсчетами звукового сигнала при его дискретизации. Для ее уменьшения применяют достаточно сложный алгоритм обработки. При их использовании потери информации нет, однако исходный сигнал оказывается представленным в более компактной форме, требующей меньшего количества бит при его передаче. Наиболее часто для этой цели используют так называемые «ортогональные преобразования». 179 Оптимальным с этой точки зрения является преобразование КаруненаЛоэва, но его реализация требует значительных вычислительных затрат. Незначительно ему уступает по эффективности модифицированное дискретное косинусное преобразование (МДКП). Для него разработаны быстрые вычислительные алгоритмы. 2) Уменьшить скорость цифрового потока позволяют также методы кодирования, учитывающие статистику звуковых сигналов, например, вероятности появления уровней разной величины. Примером такого учета являются коды Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются кодовыми словами большой длины. В наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты звукового сигнала, а коэффициенты МДКП, кроме того, при кодировании коэффициентов МДКП часто используются кодовые таблицы Хаффмана. Но устранение статистической избыточности звуковых сигналов все же не приводит к значительному уменьшению скорости цифрового потока (в конечном итоге удается уменьшить пропускную способность канала связи лишь на 15-25 % по сравнению с ее исходной величиной). И после устранения статистической избыточности скорость цифрового потока при передаче высококачественных звуковых сигналов и возможности человека по их обработке при слуховом восприятии отличаются на несколько порядков. Это свидетельствует также о существенной психоакустической избыточности первичных звуковых сигналов и, следовательно, о возможности ее уменьшения. Психофизическая избыточность. 1) Если известно, какие части ЗС ухо воспринимает, а какие нет (вследствие маскировки), то нужно выделить и затем передать по каналу связи лишь те части сигнала, которые ухо способно воспринять, а неслышимые составляющие сигнала можно отбросить. 2) При АЦП сигналы можно квантовать с возможно меньшим разрешением (большим шагом) так, чтобы шумы квантования, изменяясь по величине с изменением уровня сигнала, не становились бы слышимыми. Наиболее перспективными оказались методы, учитывающие следующие свойства слуха: - деление слышимого диапазона частот слуховыми анализаторами на критические полоски слуха (24 полоски в диапазоне 20-20000 Гц). Слух сравнивает полезный сигнал и мешающий шум в пределах критических полос слуха, оценивая порог слышимости; - маскировка, предмаскировка и послемаскировка (характеризуют динамические свойства слуха) – показывают изменение во времени относительного порога слышимости, когда маскирующий и маскируемый (полезный) сигнал звучат не одновременно. 180 Однако после устранения психоакустической избыточности точное восстановление формы временной функции звукового сигнала при декодировании оказывается уже невозможным. Учет всех этих свойств слуха позволяет сильно сократить общее число бит (количество информации), требуемое для цифрового представления ЗС. За счет устранения психофизической избыточности можно уменьшить требуемое для высококачественной передачи (записи) количество цифровых аудиоданных более чем в 10 раз. Новейшие исследования в области компрессии цифровых аудиоданных привели к появлению новых методов кодирования: - MUSICAM - ASPEC - ATRAC Разработаны европейские стандарты MPEG-1, MPEG-2, MPEG-4, а также американский стандарт ATSC-AC-3. В стандартах MPEG имеется несколько профилей и уровней компрессии. Профили определяют область применения алгоритма, а уровни – степень компрессии цифровых данных (Layer-1, Layer-2 и Layer-3). Практическое применение методы компактного цифрового представления звуковых сигналов нашли 1) в европейской системе цифрового радиовещания DAB; 2) в американской ATSC-AC-3 (Dolby AC-3); 3) в сетях ISDN. Достигнуты скорости цифрового потока на выходе кодера с компрессией данных 32…192 кбит/с на канал (уменьшена приблизительно в 25 раз по сравнению с ее исходной величиной 1.5 Мбит/с). Несмотря на значительное разнообразие алгоритмов компрессии цифровых аудиоданных, структура кодера, реализующего такой алгоритм обработки сигналов, может быть представлена в виде обобщенной схемы так, как это показано на рис. 5.33. 181 Рисунок 5.33 – Обобщенная структурная схема кодера с компрессией цифровых аудиоданных В блоке временной и частотной сегментации исходный звуковой сигнал s{n) разделяется на субполосные составляющие и сегментируется по времени. Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так называемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя психоакустическую энтропию сигнала. После сегментации субполосные сигналы нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки ЗС, а соответствующие им коэффициенты МДКП. Обычно при компрессии цифровых аудиоданных используется энтропийное кодирование, при котором одновременно учитываются как свойства слуха человека, так и статистические характеристики звукового сигнала. Однако основную роль при этом играют процедуры устранения психоакустической избыточности. Учет закономерностей слухового восприятия звукового сигнала выполняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого субполосного сигнала рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они еще маскируются полезным сигналом данной субполосы. Блок динамического распределения битов (рис.6.12) в 182 соответствии с требованиями психоакустической модели для каждой субполосы кодирования выделяет такое минимально возможное их число, при котором уровень искажений, вызванных квантованием, не превышал бы порога их слышимости, рассчитанного психо акустической моделью. В современных алгоритмах компрессии используются также специальные процедуры в форме итерационных циклов, позволяющие управлять величиной энергии искажений квантования в субполосах при недостаточном числе доступных для кодирования битов. Для обеспечения правильного декодирования компрессированных сигналов, кроме кодовых слов отсчетов ЗС или соответствующих им коэффициентов МДКП (основная аудиоинформация), к декодеру передается также и определенная дополнительная информация. После кодирования цифровые потоки основной и дополнительной информации форматируются. При этом наиболее важная часть цифровых данных подвергается помехоустойчивому кодированию (CRC-код). Психоакустические основы компрессии цифровых аудиоданных. Учет психоакустических закономерностей слухового восприятия определяет качество систем кодирования с компрессией цифровых данных. Ключевыми моментами при разработке любой психоакустической модели являются: 1. вид ортогонального преобразования; 2. алгоритм обработки коэффициентов преобразования (БПФ или МДКП) с целью максимально возможного уменьшения числа учитываемых спектральных составляющих; 3. выбор аппроксимирующих функций для учета явления маскировки включая проблему суммирования индивидуальных кривых маскировки; 4. процедура расчета глобального порога маскировки для спектральной выборки сигнала. Известны в основном три психоакустические модели: NMR (Noise to Mask Ratio – отношение сигнал/маска), PAQM – Perceptual Audio Qualiti Measure, PERCEVAL – PerCeptual EVALion. Наибольшее распространение пока получила модель NMR, в которой учитываются абсолютный порог слышимости и явление маскировки в частотной области. Это позволяет частично устранить при передаче части звукового сигнала не важные для слухового восприятия – Redundanz und Irrelevanz. Рассмотрим основные свойства слуха, лежащие в основе NMR-модели. Абсолютный порог слышимости. Это минимальное значение звукового давления, которое способно еще воспринять человеческое ухо при отсутствии мешающих звуков. Обычно его выражают в дБ по отношению к стандартной величине звукового давления po=2·10-5 Па. Чувствительность слуха к восприятию отдельных спектральных составляющих в очень сильной степени зависит от частоты (рисунок 5.34, нижняя пунктирная кривая). Очевидно, что те спектральные компоненты полезного сигнала, которые лежат ниже абсолютного порога слышимости, кодировать и передавать не следует. 183 Рисунок 5.34 – Зависимость порога слышимости тона при его маскировке узкополосным шумом Относительный порог слышимости. Известно, что порог слышимости одного сигнала изменяется в присутствии другого сигнала. Это явление носит название маскировки. Этот феномен также поясняет рисунок 5.34 (все кривые, кроме нижней), на котором приведен полученный путем субъективно-статистических экспертиз порог слышимости тона NПС, маскируемого узкополосным белым шумом с уровнем звукового давления NШ, равном 20, 40, 60, 80 и 100 дБ. Маскирующий шум имеет полосу частот Δf=160 Гц, среднюю частоту 1000 Гц. Все эти пять кривых имеют максимум на средней частоте узкополосного шума Fo=1000 Гц. Отметим некоторые общие особенности кривых маскировки. - с увеличением средней частоты маскирующего шума диапазон частот, где проявляется маскировка, становится тем шире, чем больше уровень маскирующего сигнала NШ; - в точках максимумов кривые маскировки достигают уровней, отличающихся в меньшую сторону от соответствующего уровня маскирующего сигнала на 4 дБ; - кривые маскировки несимметричны, они имеют крутой спад в сторону нижних частот и пологий спад в сторону высоких частот. Спектральные компоненты, лежащие ниже относительного порога слышимости слухом не воспринимаются, поэтому их также можно не передавать на приемную сторону системы при кодировании. Понятие критической полосы слуха или частотной группы слуха. Если в качестве полезного сигнала выступает тон, а в качестве 184 маскирующего – узкополосный шум, центральная частота которого равна частоте тонального сигнала, и если полоса частот маскирующего шума ΔF расширяется, то оказывается, что при достижении некоторого значения ΔF=ΔFЧГ величина порога слышимости тона перестанет изменяться. Это значение полосы ΔFЧГ и называют частотной группой слуха. Значение ΔFЧГ зависит от частоты F (рисунок 5.35). На частотах ниже 500 Гц ширина частотной группы постоянна и составляет около 100 Гц. В области частот выше 500 Гц она возрастает пропорционально частоте, при этом ΔFЧГ=0.2F. В диапазоне частот от 20 Гц до 16 кГц размещаются 24 частотные группы слуха с шириной от 100 Гц в низкочастотной части и до 4…6 кГц в высокочастотной части спектра. Слух сравнивает полезный сигнал и мешающий шум по интенсивности в пределах критических полос слуха, оценивая порог слышимости. Маскировка во временной области. Это явление характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости, когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки (изменение порога слышимости после сигнала высокого уровня) и предмаскировки (изменение порога слышимости перед приходом сигнала максимального уровня). Ширина частотной группы слуха, Гц 6000 4000 2000 20 100 1000 10000 Частота, кГц Рисунок 5.35 – Зависимость ширины критической полосы слуха (частотной группы слуха) от средней частоты Так, громкое звуковое событие маскирует восприятие более тихих звуков, которые начинаются несколько раньше, т.е. опережают сигнал высокого уровня на интервал времени –30…20 мс (явление предмаскировки) или позже, т.е. запаздывают по времени на 0…120 мс (явление послемаскировки). При этом имеет значение: - формы спектров ЗС; - их уровни; 185 - их временная последовательность; - тон это или широкополосный сигнал. Послемаскировка (или постмаскировка). Явление постмаскировки описывается экспоненциальной функцией вида: BM (t )  1.0  1 t  arctg ( ) 1.35 13.2  T 0.25 где BM(t) – нормированное значение коэффициента послемаскировки; T – длительность маскирующего сигнала, в мс; t – текущее время, мс. Зависимости BM(t) показаны на рисунке 5.36. По оси абсцисс отложено текущее время t в мс, по оси ординат – нормированные значения коэффициента послемаскировки. Параметром кривых является длительность T маскирующего сигнала. Видно, что послемаскировка проявляется на интервале времени равном 100…200 мс. Предмаскировка проявляется на значительно более коротком временном интервале. Он обычно составляет около 10 мс. Длительность предмаскировки в очень сильной степени зависит от особенностей индивидуума. Чаще всего именно по этим двум причинам явление предмаскировки не учитывается. Нормированное значение коэффициента постмаскировки, 1 BM 0.8 0.6 4 0.4 5 6 3 0.2 2 1 50 150 100 200 250 Текущее время, t 1 – T=5 мс; 2 – T=10 мс; 3 – T=50 мс; 2– T=100 мс; 5 – T=200 мс; 6 – T=3000 мс. Рисунок 5.36 – Зависимость номинального значения коэффициента постмаскировки от значений текущего времени: Глобальный порог маскировки. В психоакустической модели цифровой сигнал разбивается на субполосы. Для каждой субполосы кодирования рассчитывается допустимое значение уровня шумов 186 квантования (так называемое отношение сигнал/маска SMR), при котором они еще маскируются полезным сигналом и не замечаются слухом. Результат таких вычислений для одного аудиофрейма показан на рисунке 5.37. Верхний рисунок (а) представляет собой выраженную в дБ энергию сигнала выборки в каждой из субполос кодирования. На нижнем рисунке (б) изображены уровень глобального порога маскировки в субполосах психоакустического анализа (кривая вверху) и гистограмма, показывающая максимально-допустимое значение шумов квантования в субполосах кодирования, при котором они еще маскируются полезным сигналом выборки. После этого биты распределяются для субполосных сигналов так, что уровень шумов квантования не превысил бы найденные допустимые значения в каждой из 32 полос. Результат распределения бит для этого же аудиофрейма представлен на рисунке 5.38. Цифры на гистограмме – это число бит, которые следует выделить для кодирования субполосных отсчетов в каждой из полос кодирования, чтобы не был бы превышен глобальный порог маскировки. а) N, дБ 96.00 76.80 57.60 38.40 19.20 0.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Номер полосы кодирования, n N, дБ глоб.порог маскировки б) допустимое значение шумов квантования 75.40 50.27 37.70 25.13 12.57 0.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Номер полосы кодирования, n Рисунок 5.37 – Энергия сигнала выборки (а) и глобальный порог маскировки в полосах психоакустического анализа (верхняя кривая) и в полосах кодирования (гистограмма). 187 Число бит при кодировании субполосных отсчетов для выборки звукового сигнала Bit 6 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 6 4 4 4 3 3 3 2 3 2 2 2 2 2 3 3 3 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 7 Номер полосы кодирования, n Рисунок 5.38 – Гистограмма распределения бит при кодировании субполосных отсчетов для выборки звукового сигнала в функции от номера полосы кодирования (психоакустическая модель 1 стандарта ISO/IEC 11172-3 или 13818-3, Layer 2) Искажения при компрессии цифровых данных. В психоакустических моделях стандартов MPEG не учтены: 1) механизм временной маскировки сигналов; 2) механизм пространственной демаскировки источников звука, составляющих стереопанораму как по фронту, так и по глубине; 3) особенности восприятия реверберационных составляющих стереофонических сигналов. Именно эти механизмы пространственного слуха играют наиболее важную роль при стереовоспроизведении, они определяют восприятие основных признаков качества стереофонического звучания, таких как пространственное впечатление, прозрачность звучания, естественность и богатство тембров инструментов и голосов, восприятие акустической атмосферы первичного помещения (концертный зал, студия) и т.п. Предварительные сравнительные прослушивания показали, что компрессия цифровых аудиоданных неизбежно сопровождается следующими искажениями: - стереопанорама становится более плоской; - ее пространственная структура нарушается; - исчезают звуковые планы; - кажущиеся источники звука смещаются относительно их истинного положения; - теряются индивидуальные признаки звучания, свойственные однотипным инструментам в группе; - нарушается реверберационный фон каждого из них, возникает ощущение, что отдельные музыкальные инструменты записаны в разных акустических помещениях; - теряются индивидуальные признаки первичного помещения записи. 188 Появление этой совокупности искажений приводит к снижению качества звучания, которое отчетливо отмечается слушателями. Для устранения этих искажений прежде всего необходимо выявить причины их появления, понять их природу и сущность. Только после этого можно будет найти методы для их уменьшения или маскирования – либо путем изменения самой процедуры компрессии цифровых аудиоданных при кодировании, либо путем дополнительной обработки стереофонических сигналов после их декодирования. ВОПРОСЫ К РАЗДЕЛУ 5 1. Какие операции необходимы для преобразования аналогового сигнала в цифровой? 2. Что такое – дискретизация аналогового сигнала? 3. Что входит в состав дискретизатора? 4. Назначение фильтр нижних частот (ФНЧ) на входе дискретизатора. 5. Что собой представляет выходной сигнал дискретизатора? 6. Какие искажения возникают при дискретизации? 7. Что такое квантование дискретизированного сигнала? 8. Какое квантование называется линейным (или равномерным)? 9. Мощность шумов квантования. 10. Процесс кодирования при преобразовании аналогового сигнала в цифровой. 11. Что такое форматом кода? 12. На чем базируется сокращение статистической избыточности звуковых сигналов? 13. На чем базируется сокращение психофизиологической избыточности звуковых сигналов? 14. С какой целью уменьшают избыточность звуковых сигналов? 15. Что такое маскировка звукового сигнала во временной области? 16. Для чего в психоакустической модели цифровой сигнал разбивается на субполосы? 17. Искажения при компрессии цифровых данных. 18. Понятие глобального порога маскировки. 19. Понятия предмаскировки и послемаскировки. 189 6. СИСТЕМЫ ЗВУКОПЕРЕДАЧИ 6.1 Признаки качества звучания Пусть имеется некоторое помещение для прослушивания различных звуковых сигналов рисунок 6.1. И.З. - источники звука Рисунок 6.1 – Помещение прослушивания Звуковые волны от источников звуков, расположенных на сцене, приходят к ушам слушателя по разным путям. Прежде всего приходят прямые звуковые волны - которые распространяются по кратчайшему пути. Вслед за ними приходит множество отраженных лучей – отзвуков. Совокупность отзвуков образует реверберационный процесс. Благодаря реверберации звучание источников звука в помещении обогащается в тембровом отношении, а также определяет акустические свойства помещения: гулкость, объемность, прозрачность звучания и т.п. Отраженные звуковые сигналы приходят к слушателям с разных направлений и со сдвигом во времени относительно друг друга. Это уменьшает маскирующее действие друг на друга отдельных источников звука (ИЗ), действующих в зале, а стало быть это улучшает восприятие отдельного ИЗ по основным параметрам: расположению в пространстве, тембру, гулкости и т.д. Сложные звуковые сигналы, поступающие к левому и правому ушам слушателя, не тождественны: они имеют различную временную структуру, различные пространственные (т.е. отличаются по интенсивности) и спектральные характеристики. Эта пара сигналов, поступающая на вход ушных раковин, называется бинауральной. Бинауральная пара звуковых сигналов определяет всю совокупность ощущений слушателя, свойственных естественному прослушиванию. Основными признаками качества звучания являются: 1. Пространственность, объемность, протяженность звучания. Ощущение расположения отдельных ИЗ в разных точках пространства как по фронту, так и по глубине. Место расположения ИЗ может быть легко 190 локализовано в пространстве, однако число одновременно воспринимаемых фронтальных направлений и звуковых планов по глубине невелико – два, три. 2. Прозрачность или раздельность звучания. Определяется способностью слушателя выделять и раздельно воспринимать ИЗ на фоне общего звукового поля в помещении. 3. Естественность и богатство тембров ИЗ. 4. Музыкальное равновесие или баланс громкостей отдельных составляющих общего звукового поля. 5. Восприятие акустической обстановки помещения, зала, свойственных ему особенностей – гулкость, объемность и т.д. 6.2 Назначение и классификация системы звукопередачи Звуковая система передачи является составной частью более сложных аппаратных комплексов, предназначенных для возможно более полной передачи совокупности звуковых ощущений из первичного помещения, где формируется ИЗ, во вторичное – помещение прослушивания. Содержит два разомкнутых и разнесенных в пространстве звуковых тракта (тракт передачи и тракт приема). Акустика обоих помещений сильно отличается друг от друга. Даже аппаратура высокого класса и совершенные каналы не могут донести до слушателя все пространственно-временные особенности первичного звукового поля. Поэтому на современном этапе развития техники электроакустическая передача звукового поля рассматривается как материал для активной творческой переработки звукорежиссером. Любая звуковая система передачи должна предоставлять возможность звукорежиссеру из исходного множества первичных звуковых сигналов {xi(t)}N сформировать новое звуковое поле, которое в принципе может не походить на исходное, но обеспечивает полноценное восприятие передачи в том виде, как ее задумал режиссер. Обобщенная структурная схема системы звукопередачи представлена на рисунке 6.2. 1 1 2 xi(t) 1 Ф Гр.1 В Сл Р Гр.N N b=N' Рисунок 6.2 – Схема системы звукопередачи 191 Здесь xi(t) – первичные исходные звуковые сигналы. Множество таких сигналов по N-каналам подается на устройство формирования – Ф. Каждый первичный сигнал формирует на приемной стороне свой источник звука – кажущийся источник звука (КИЗ), являющийся составной частью сложного звукового поля. Ф – совокупность устройств для формирования и обработки звуковых сигналов в общем случае состоит из: регуляторов уровня, компараторов и смесительных устройства; ПКУ – панорамно-кодирующие устройства, содержащие регуляторы направлений и протяженности стереопанорамы, ревербераторы, регуляторы АЧХ и т.д.. Большая часть этих устройств входит в пульт звукорежиссера. р – число раздельных каналов передачи звуковых сигналов на приемную сторону (р<2) каналов воспроизведения (СВ), к ним относятся стереоамбиофонические системы; биноуральные системы; матричные системы звукопередачи. - Многоканальные системы (р>2). 6.3 Одноканальные звуковые системы передачи Обычная монофоническая система звукопередачи. Эта система содержит один канал воспроизведения. На передающей стороне из множества ИЗ формируется одноканальный сигнал. Он содержит как прямые звуковые сигналы так и реверберирующие компоненты или отраженные сигналы. Все исходные ИЗ при воспроизведении оказываются «сжатыми в одну точку». Пространственная перспектива отсутствует. Восприятие акустической обстановки первичного помещения наихудшая. Оценка времени реверберации происходит, но со значительной погрешностью. Однако система очень проста (рисунок 6.3), поэтому получила широкое распространение. 192 ИЗ Сл М Рисунок 6.3 – Одноканальная звуковые системы передачи Система объемного звучания. В отличие от предыдущей, содержит несколько пространственно разнесенных громкоговорителей, излучающих тождественные сигналы (рисунок 6.4). Создается образ звучащего пространства. Исходные ИЗ как бы размыты, разлиты в окружающем пространстве. Четкой локализации источников звука нет. В этой системе стереопанорамы как таковой не возникает. ИЗ К.П. Рисунок 6.4 – Система объемного звучания Моноамбиофоническая система. Имеет один или несколько громкоговорителей, которые питаются через линию задержки и аттенюаторы. При числе громкоговорителей больше одного b>1 часть громкоговорителей питается непосредственно из канала передачи. Только здесь как бы к основному сигналу подмешиваются дополнительные, «отраженные» сигналы, прошедшие линию задержки и аттенюаторы. Суммирование происходит в специальном устройстве или непосредственно в объеме помещения рисунок 6.5. ИЗ К.П.  A1  B A2 L2 Рисунок 6.5 – Моноамбиофоническая система 193 С помощью линии задержки и аттенюаторов и соответствующего расположения громкоговорителей частично воссоздается пространственная структура реверберационного процесса первичного помещения на начальном его участке. Изменением времени задержки и уровней сигналов можно добиться оптимальной гулкости, объемности звучания, свойственных концертному залу. Возможен оперативный перенос слушателей в помещения с различными акустическими свойствами. Псевдостереофонические системы. В этих системах на передающей стороне формируется двухканальный стереофонический сигнал. Для этого на передающей стороне используются стереомикрофоны. С их выходов сигналы подаются на блок функциональных преобразований (БФП1). Из этих сигналов формируется монофонический сигнал М(t)=Л(t)+П(t-Δτ). Этот сигнал и подается в канал связи. Одновременно сигналы стереопары и монофонический сигнал подаются на блоки формирования управляющих сигналов, на выходе которых формируются сигналы управления (UЛ(t) и UП(t)). Последние тем или иным способом передаются на приемную сторону рисунок 6.6. П(t) П(t БФУС1 UП(t) ФП1 Л'(t) П'(t) ЛЗ л п  М Л(t) БПФ1 M(t) К.П. БФУС2 UЛ(t) БПФ2 Гр.1 Гр.2 ФП2 Рисунок 6.6 – Псевдостереофоническая система Сигналы управления имеют вид: UЛ(t)=QЛ(t)/QЛ+П(t); UП(t)=QП(t-Δτ)/QЛ+П(t). Здесь QЛ(t), QП(t), QЛ+П(t) – огибающие сигналов стереопары и монофонического Л(t), П(t) и М(t); Δτ – время задержки в ЛЗ. Тракт воспроизведения содержит два блока функциональных преобразований (ФП1, ФП2), с помощью которых формируются сигналы воспроизводимых громкоговорителями. Л´(t)= QЛ(t)·UЛ+П(t); П´(t)= QП(t-Δτ)·UЛ+П(t). Здесь UЛ+П(t) – высокочастотная мультипликативная составляющая сигнала М(t). Сигналы Л´(t), П´(t) – имеют огибающие исходных сигналов 194 Л(t) и П(t). При их воспроизведении возникает пространственная звуковая панорама, частично напоминающая исходную. Однако КИЗ в ней четко не разделены в пространстве, возможно их произвольное перемещение. Можно оценивать положение КИЗ и по интенсивности сигналов Л(t) и П(t) в полосах частот, определяющих пространственную локализацию ИЗ, например, 500…1000 и 1000…2000 Гц. Если сигналы в этих полосах превышают определенный уровень, то вырабатывается сигнал управления. Значение сигнала управления зависит от превышения этого порога. В этом случае функциональные преобразователи будут представлять собой перестраиваемые частотный корректоры и набор перестраиваемых фильтров. В такой системе оказываются распределенными по фронту не отдельные КИЗ, а спектральные составляющие ИЗ, поэтому такая стереофония называется спектральной. Один и тот же ИЗ может восприниматься слушателями в разных местах линии базы системы воспроизведения в зависимости от того, какие частоты он создает в данный момент – ВЧ или НЧ. Сформировать четкие, компактные КИЗ в требуемой точке пространства в этих системах невозможно. П'(t) ИЗ Гр.2 Л'(t) К.П. Гр.1 Р Рисунок 6.7 – Квазистереофоническая система В квазистереофонических системах рисунок 6.7 на передающей стороне формируется полноценный монофонический сигнал, который на передающей стороне с помощью ревербератора (Р) преобразуется в несколько сигналов, излучаемых разнесенными в пространстве громкоговорителями. В простейшем случае два (b=2). Здесь наличие реверберационных сигналов, излучаемых одним громкоговорителем, частично восстанавливается пространственная структура исходного сигнала. Однако эта система не способна донести до слушателей информацию о расположении отдельных ИЗ по фронту и глубине. Возникает ощущение звучащего объема, отдельные КИЗ имеют значительную протяженность. 195 6.4 Двухканальные системы звукопередачи 6.4.1 Обычная стереофоническая система Такая система имеет два независимых канала передачи рисунок 6.8. 1 2 xi(t) Гр.2 П(t) ПКУ Л(t) К.П. n СУ С Гр.1 Рисунок 6.8 – Обычная стереофоническая система В этой системе из исходного множества первичных сигналов {xi(t)}N формируются сигналы стереопары Л(t), П(t), которые передаются по двум каналам связи и воспроизводятся с помощью стереоусилителей и двух громкоговорителей или стереофонической системы воспроизведения (СВ). Никакие дополнительные преобразования над сигналами стереопары на приемной стороне не выполняются. Декодирование сигналов Л(t) и П(t) осуществляется непосредственно в слуховом аппарате слушателя. Сигналы стереопары воспроизводятся с помощью одинаковых громкоговорителей, разнесенных в пространстве на некотором расстоянии от слушателя. Система воспроизведения может быть выполнена по совмещенной схеме – когда оба громкоговорителя объединены в одном корпусе (40…15000 Гц); по комбинированной – в которой Н.Ч. (40…150 Гц) излучатели левый и правый громкоговорителей объединены, а Ср.Ч. и В.Ч. излучатели выполнены в виде отдельных выносных элементов, имеющих сравнительно малые размеры. Комбинированные системы воспроизведения могут выполняться в одном корпусе или в виде отдельных конструкций, не привязанных к самому приемному устройству. В последние годы получили распространение СВ, имеющие общий канал сверхнизких частот (СНЧ), соответствующие им громкоговорители называются Сабвуферы («Subwoofer»). Работают они в полосе частот от 20…25 до 80…125 Гц, а два разнесенных громкоговорителя стереосистемы работают в полосе от 125 до 18000…20000 Гц. На передающей стороне сигналы стереопары формируются по следующему правилу: N Л (t )   a1i (t )  xi (t  1i ) ; i 1 N П (t )   a2i (t )  xi (t   2i ) . i 1 196 Здесь а1i, а2i и Δτ1i, Δτ2i – пары коэффициентов кодирования и временные сдвиги для i-го исходного сигнала xi(t), формирующего при воспроизведении i-й источник звука стереопанорамы. Значения этих параметров однозначно определяют местоположение i-го звукового образа на линии базы громкоговорителей. При воспроизведении звукового сигнала на приемной стороне положение ИЗ (азимут) будет оцениваться слушателем на основе сигналов, пришедших из громкоговорителей. А они будут иметь разные уровни (ΔL) и в общем случае сдвинуты во времени относительно друг друга. ИЗ будет располагаться вдоль линии базы громкоговорителей в зависимости от значения ΔL и Δτ. Формирование сигналов Л(t), П(t) на передающей стороне выполняется с помощью ПКУ, или/и микрофонных систем типа АВ, XY и MS. ПКУ входит в состав пульта звукорежиссера. Состоит из регулятора направления, в который входят – операционные усилители, фильтры, линии задержки, фазовращатели. Они и обеспечивают получение требуемых значений коэффициентов а1i, а2i и Δτ1i, Δτ2i. 6.4.2 Микрофонные системы Микрофоны в помещении по отношению к ИЗ могут быть размещены самым различным способом: - либо разнесены на некоторое расстояние относительно друг друга, и все ориентированы на ИЗ; - либо находятся в одной точке, при этом микрофоны направлены на ИЗ и имеют, как правило, различные диаграммы направленности (ДН); - либо часть микрофонов направлена на ИЗ, а один из микрофонов в сторону зала. Широкое распространение получили следующие микрофонные системы АВ, XY и MS. Система АВ. Содержит два одинаковых микрофона М1 и М2, разнесенные на некоторое расстояние рисунок 6.7. И 1  И Y  r2 x r 2 Y   r1 M1 -0.3 +0.3 M2 X Bm а) б) Рисунок 6.9 – Система АВ (а) и ДН микрофона (б) В общем случае микрофоны могут иметь разные ДН, а их акустические оси могут быть ориентированы не параллельно. Расстояния от микрофонов 197 до ИЗ – r1 и r2. Разность уровней сигналов (ΔL) на выходе микрофонов будет определяться: - осевой чувствительностью микрофонов (Е1, Е2); - диаграммой направленности микрофонов Д1, Д2; характеристикой направленности ИЗ в направлении на микрофоны Ди  Д  Д L  20 lg  E 2 и  Д 2 / Е1  и  Д 1  ; r2 r1   - расстояниями r1 и r2 до ИЗ. Если Д1=Д2=Ди=1, Е1=Е2 и при симметричном расположении координат XY: ΔL=20lg(r1/r2) – для сферической волны. Если координата x≠0, выходные сигналы микрофонов сдвинуты во времени на Δτ (r1≠r2):   r1  r2 / cз , [c]. Здесь сз – скорость звука в воздухе. В этой системе ΔL и Δτ будут определять оценку азимута КИЗ. Основное влияние на характер перемещения КИЗ на приемной стороне, в этой системе оказывает временной фактор Δτ. Поэтому говорят о временной стереофонии. При перемещении ИЗ вдоль линии I-I слева направо до x1=-0.3(м), величина Δτ>1мс, слушатель будет локализовать КИЗ в области левого громкоговорителя. При смещении ИЗ от x=-0.3(м) до x=+0.3(м) величина Δτ изменяется в пределах ±1(мс), что приведет к перемещению КИЗ из позиции левого громкоговорителя в позицию правого громкоговорителя. При дальнейшем перемещении положение КИЗ не изменится. Ширина зоны, где возможна качественно правильная локализация ИЗ, весьма мала. Увеличение расстояния до источника (Y) и уменьшение базы Bm микрофонов этот недостаток уменьшают. Но тогда ослабевают прямые сигналы и появляются трудности в передаче протяженных ИЗ (например больших ансамблей и т.п.), т.к. крайние ИЗ оказываются очень далеко расположенными от микрофонов, нарушается баланс громкостей ИЗ, составляющих стереопанораму. При большом значении базы, наоборот, наблюдается провал КИЗ, расположенных посередине. В системе АВ затруднено выполнение требования совместимости: сумма сигналов Л(t)+П(t) не дает полноценный монофонический сигнал. Практически база микрофонов выбирается в пределах ВМ=0.2…1.5(м). Улучшить результаты можно за счет применения направленных микрофонов. Дополнительно появляется разность в уровнях сигналов на выходе микрофонов (ΔL), что дает более точную локализацию КИЗ. Система XY. Содержит два микрофона, расположенных на одной вертикальной оси так, что их оси образуют некоторый угол ψ в горизонтальной плоскости (рисунок 6.9,б). Диаграммы направленности этих 198 микрофонов одинаковы и имеют форму «восьмерки», «кардиоиды», или «гиперкардиоиды». Чаще всего Ψ=90°…120°. Например для характеристик направленности типа «восьмерки» разность в уровнях будет определяться так: E cos(  / 2) L  20 lg 2 , Δτ=0. E1 cos(   / 2) Для «кардиоиды» получим: E (1  cos(  / 2)) L  20 lg 2 , Δτ=0. E1 (1  cos(   / 2)) Здесь: φ – угол между осью Y и направлением на источник; Е1, Е2 – осевые чувствительности микрофонов. В системе микрофонов XY сигналы стереопары отличаются только по уровню. Поэтому говорят об интенсивностной стереофонии. При движении ИЗ вдоль оси X влево или вправо от Y вдоль линии I-I величина ΔL пропорционально изменяется |x|. Система обладает хорошей совместимостью. Наиболее точно информацию об азимутальном положении ИЗ передает система XY при ДН микрофонов типа «восьмерки». В системе XY реальное прямолинейное движение ИЗ при воспроизведении превращается в криволинейное. Возникают искажения в передаче глубины: крайние КИЗ кажутся расположенными дальше вглубь от линии базы громкоговорителей по сравнению с ИЗ, расположенными ближе к центру базы. Система MS. (M – Mittel – середина; S – Suite – сторона, нем.). Содержит два совмещенных в одном корпусе микрофона с разными диаграммами направленности. Л(t) и П(t) сигналы получаются путем попарного сложения и вычитания сигналов на выходах микрофонов (M и S) с помощью суммарно-разностного преобразователя (СРП). Если М1 имеет «круговую» ДН, а М2 – «восьмерку», то напряжения на выходах микрофонов М1 и М2 будут определяться так: UM=E1p0cosφ/y, US=E2p0cosφ·cos(φ+90º)/y. Здесь: cosφ/y=1/r характеризует изменение звукового давления с расстоянием; p1 – эффективное звуковое давление, развиваемое ИЗ на расстоянии 1(м). После усиления сигналы поступают на СРП: 1 (U M  U S )  E1 2 1 П (t )  (U M  U S )  E2 2 Л (t )  p0 1 1 cos [  cos(  90)] y 2 2 p0 1 1 cos [  cos(  90)] y 2 2 199 при Е1=Е2=Е0 1  cos(  90) , Δτ=0. 1  cos(  90) По своим характеристикам система очень близка к системе микрофонов Тогда: L  20 lg( П / Л )  20 lg XY. Использование одиночных микрофонных систем АВ, XY и MS не в состоянии передать полную информацию об акустических особенностях студии, расположении отдельных ИЗ в пространстве, прозрачности звучания ИЗ и т.д. А дает только частичное представление о расположении ИЗ по линии базы, но не по глубине! Передача полной пространственной информации – наиболее важное требование, которое в значительной степени определяет качество стереовоспроизведения. При этом наиболее важными являются следующие требования: - ИЗ должны быть равномерно распределены в пределах всей базы громкоговорителей и частично в глубину; число основных направлений, выделяемых слушателями, не должно превышать пяти. Число звуковых «планов», т.е. градаций по глубине (удаленности ИЗ) – три-пять; - звучание отдельных КИЗ должно быть сбалансировано по громкости в пределах всей базы громкоговорителей; - движение источников звука должно быть по возможности равномерным. 6.4.3 Локализация кажущихся источников звука Передача всей полноты пространственной информации, при стереофонии, возможна пока звуковые образы, составляющие стереопанораму, разнесены в пространстве, а реверберационные продолжения сигналов стереопары различны. При этом решающее значение играют механизмы образования и локализации КИЗ. Рассмотрим установку, показанную на рисунке 6.10, состоящую из двух одинаковых каналов, содержащих регулируемые аттенюатор (ΔL), линию задержки (Δτ), перестраиваемые фильтры K(F) и усилители мощности. Слушатель находится на оси симметрии двух громкоговорителей на некотором расстоянии от линии базы (В). Если сигналы громкоговорителей не имеют различий (Δτ=0, ΔL=0), то они сливаются в один звуковой образ, который будет расположен по середине линии базы громкоговорителей. Этот звуковой образ будет кажущимся и его появление возможно, если излучаемые сигналы будут статистически связаны, коррелированны. Если коэффициент корреляции между каналами будет уменьшаться, то КИЗ локализуется все менее четко, его протяженность увеличивается, и при коэффициенте корреляции R(Δτ) сигналов Л(t) и П(t) меньше 0.05…0.15 наступает разрыв КИЗ на два действительных ИЗ (гр.1 и гр.2). Локализация КИЗ означает - оценка азимута и расстояния до ИЗ. Последнее оценивается довольно плохо! Оценка азимута КИЗ зависит от временных (Δτ≠0) и 200 интенсивностных различий (ΔL≠0) между сигналами, достигающими ушей слушателя. дБ Гр.2 ЛЗ L  X КИЗ K(F) l22  l21 В U Сл l12 l11 y Гр.1 Рисунок 6.10 – Стереосистема состоящая из двух одинаковых каналов Введение интенсивностной разности (при ΔL≠0, Δτ=0) сопровождается перемещением КИЗ из центра в сторону громкоговорителя, излучающего сигнал большей мощности. Однако при ΔL≥12…16 (дБ) КИЗ локализуются в позиции громкоговорителя, излучающего бóльшую мощность, и дальнейшее увеличение разности не приводит к его перемещению. Величина смещения КИЗ от изменения ΔL зависит нелинейно, хотя и близко к линейной зависимости, и, кроме того, изменяется при изменении расстояния между слушателями и базой громкоговорителей. При временной стереофонии (при ΔL=0, Δτ≠0) КИЗ смещается в сторону громкоговорителя, излучающего опережающий сигнал. Перемещение КИЗ с увеличением Δτ носит монотонный характер для сигналов, спектральные мощности которых не имеют ярко выраженных неоднородностей распределения энергии по частоте. При увеличении Δτ от 0 до 0.8…1.2 (мс) наблюдается быстрое перемещение КИЗ до 80% расстояния от центра базы до громкоговорителя, излучающего опережающий сигнал. Дальнейшее увеличение ведет к медленному перемещению КИЗ в области от 80% до 100% расстояния от центра базы до громкоговорителя. При Δτ=30…150 (мс) происходит разрыв КИЗ на два действительных ИЗ. Для сигналов, спектры которых имеют ряд энергетических пиков, зависимость смещения КИЗ носит ярко выраженный индивидуальный характер. Увеличение временной разности сопровождается уменьшением корреляции между Л(t) и П(t), что приводит к ухудшению четкости локализации. С ростом Δτ в звучании появляется гулкость, растет протяженность КИЗ. Рост КИЗ происходит при уменьшении R(Δτ) до 0.050.15. Если Δτ≠0, ΔL≠0, то оценка азимута КИЗ будет определяться этими двумя факторами. Здесь возможна компенсация сдвига КИЗ за счет Δτ изменением разности уровней ΔL сигналов стереопары и наоборот. 201 Совместное действие временных и энергетических факторов сопровождается следующими явлениями: 1) При Δτ<3…4 (мс) формируются четкие и компактные КИЗ: протяженность – 10…20 (см) и не изменяется с введением ΔL. Формируются устойчивые слуховые образы. 2) При Δτ<7…15 (мс) локализация КИЗ затруднена. С ростом Δτ начинает изменяться протяженность КИЗ, особенно с введением ΔL. Это область почти устойчивого формирования КИЗ. 3) При Δτ<100…200 (мс) протяженность КИЗ возрастает, вплоть до размера базы громкоговорителей, наблюдается распад КИЗ на два действительных источника звука при определенных соотношениях ΔL, Δτ. Область неустойчивого формирования КИЗ. 4) При Δτ>100…200 (мс) формирование единого КИЗ невозможно. Все это характерно для речевого сигнала. Качественно картина не меняется и для других сигналов. Точно так же асимметричное положение слушателя не изменяет существенно картину, рисунок 6.11. При асимметричном расположении слушателя происходит искажение в локализации КИЗ. Особенно сильно смещаются КИЗ центральной части стереопанорамы, крайние менее. Смещение происходит в сторону громкоговорителя, к которому смещен слушатель. Пространственные искажения максимальны, если слушатель находится напротив громкоговорителя. Большая часть стереопанорамы локализуется в области этого громкоговорителя, остальные же – в области дальнего громкоговорителя. Нарушается баланс громкостей КИЗ, ухудшается прозрачность звучания. Гр.1 1 2 КИЗ x+ 3 Сл Гр.2 Рисунок 6.11 – Асимметричное положение слушателя Во всем выше сказанном не учитывалось наличие отраженных сигналов в закрытом помещении т.е. реверберационный процесс в закрытом помещении. Наличие реверберации практически не сказывается на определении азимута КИЗ, но приводит к увеличению протяженности последнего (снижается корреляция между сигналами Л(t) и П(t)), что снижает точность локализации КИЗ. 202 6.4.4 Локализация КИЗ в закрытом помещении В горизонтальной плоскости человек может определить направление на ИЗ с точностью 3-4%. Точность будет определяться расстоянием между ушами. В вертикальной плоскости точность 20%. Благодаря наличию двух ушей человек «воспринимает поперечные размеры источника», а также его «глубину». Слушатель легко определяет местоположение отдельных ИЗ в массе источников, его координаты [{xi(t)}N]. В помещении слушатель определяет направление на ИЗ за счет прямых лучей. Слух отделяет прямые звуки от первых реверберационных продолжений. Часть первых отраженных сигналов, следующих за прямыми, подавляются слуховой системой – в интервале времени от 1.5 до 30-50 (мс). При больших временных сдвигах сигналы уже потеряли корреляцию с основными сигналами, и подавление их слуховым аппаратом не происходит. Отраженные сигналы, в этом случае, воспринимаются как помехи. 6.4.5 Методы расчета локализации КИЗ Известно много методов оценки азимута КИЗ: закон «синусов»; корреляционные, энергетические, волновые методы. Для примера рассмотрим корреляционный метод оценки. Направление на КИЗ (азимут) в этой модели совпадает с угловым положением максимума функции взаимной корреляции Rвз(φ) бинауральной пары сигналов, воспринимаемые микрофонами MЛ и MП, расположенными в области ушей искусственной головы (рисунок 6.12). Рисунок 6.12 – Корреляционный пеленгатор бинауральной пары (а) и rлок (б) 203 ax(t) – сигнал на выходе левого громкоговорителя; aqx(t-Δτ) – сигнал на выходе правого громкоговорителя; lij – расстояния от громкоговорителей до ушей слушателя. В общем случае функция взаимной корреляции может быть найдена так:  / 2 1 Rвз ( )  Л (t )  П (t )  Л (t )  П (t )dt . T / 2 Если сигнал П(t) отличается по мощности в q раз и запаздывает на величину (Δτ) от сигнала Л(t), то функция Rвз(φ) пары сигналов, воспринимаемых микрофонами М1 и М2: Rвз ( )  r1 ( 11 )  r2 ( 22 )  r3 ( 12 )  r4 ( 21 ) . l l l12 l11  ;  21   21   12  21  12 ; где:  11   12   11  cз cз cз cз 12  11   22  l11 l22 l l  ;  22   21   22  21  22 . cз cз cз cз - временные разности соответствующих пар бинауральных сигналов. Они являются функцией угла (φ). φ – угол поворота искусственной головы (азимут КИЗ), относительно медианной плоскости Первое слагаемое r1(Δτ11) – представляет собой функцию, характеризующую воздействие сигналов левого громкоговорителя Гр.1 на левое (1) и правое (2) уши слушателя. Второе – r2(Δτ22) – тоже самое воздействие, но правого громкоговорителя Гр.2. Третье слагаемое r3(Δτ12) – результат воздействия сигнала громкоговорителя Гр.1 на левое ухо (1), а сигнала громкоговорителя Гр.2 – на правое ухо. Четвертое слагаемое r4(Δτ21) – результат перекрестного воздействия сигналов громкоговорителей соответственно на правое и левое ухо слушателя громкоговорителей Гр.1 и Гр.2. Функция взаимной корреляции сигналов Л(t) и П(t) может быть измерена с помощью корреляционного пеленгатора, рисунок 7.12. Δτi,j – есть временные разности соответствующих сигналов, поступающие от громкоговорителей (Гр.1 и Гр.2) на левое и правое уши слушателя. Они являются функцией угла φ поворота микрофонов (или искусственной головы) влево-вправо относительно центра в горизонтальной плоскости. При повороте будут меняться длины l11, l12, l22, l21, а следовательно, и соответствующие им задержки, а это вызовет изменение функции Rвз(φ). Зависимость Rвз=f(φ) называется функцией локализации rлок, максимум которой совпадает с направлением на источник звука. Если сигналы, излучаемые громкоговорителями, близки к белому шуму в полосе частот от ω1 до ω2, тогда их функция взаимной корреляции будет определяться так: 204  a q 2 cos(   ) R( )    2 2 Здесь Δω=ω2-ω1 – полоса частот; ω0=(ω1+ω2)/2 – средняя частота сигнала. Суммарный сигнал, воспринимаемый левым ухом Л(t)=ax(t-τ11)+aqx(tΔτ-τ21), и правым ухом П(t)=ax(t-τ12)+aqx(t-Δτ-τ22). Расчетные выражения для вычисления составляющих – r1(Δτ11), r2(Δτ22), r3(Δτ12-Δτ), r4(Δτ21-Δτ) аналогичны приведенному выше выражению (1). Разница состоит в том, что для каждой из них существует свое максимальное значение, определяемое амплитудами исходных сигналов и равное: a2Δω/2 для r1(Δτ11); a2q2Δω/2 для r2(Δτ22); a2qΔω/2 для r3(Δτ12-Δτ) и r4(Δτ21-Δτ) и свой временной сдвиг, указанный в скобках. При высокой средней частоте (f0>1000 Гц) полосы шума каждого из слагаемых R(Δτ), вычисленное с помощью выражения (1), становится многозначным ввиду быстрого изменения сомножителя cos(ω0Δτ). Ее главный максимум уже не совпадает с направлением на КИЗ. Однако, т.к. в слуховой системе происходит выделение огибающей сигнала, то при f0>1000…1500 Гц: sin 2 R' ( )  a 2 q  sin( / 2 , 2  / 2 Тогда функция локализации имеет четкий максимум, а угловое положение максимума совпадает с направлением на КИЗ. 6.4.6 Системы воспроизведения Любую систему воспроизведения (СВ), т.е. форму расположения громкоговорителей (Гр.) относительно слушателей можно охарактеризовать коэффициентом пространственности (прозрачности) γ и областью уверенной локализации звуковых образов ОУЛ. ОУЛ – совокупность точек, охватывающих все возможные места локализации КИЗ для данной стереофонической системы звукопередачи СЗП. Для обычной СЗП с числом каналов р=2 ОУЛ представляет собой линию, соединяющую левый и правый громкоговорители, а γ=0.1…0.13. Для многоканальных стереофонических систем ОУЛ имеет форму сложной поверхности (купола), опирающегося на громкоговорители. Для монофонической системы коэффициент прозрачности γ=0.01. СВ типа «квадрат». В этой системе слушатель (Сл) находится в центре квадрата, образованного СВ, рисунок 6.13. Если работает только передняя пара громкоговорителей ЛФ и ПФ (обычная стереосистема). Разрешающая способность слуховой пеленгации КИЗ составляет Δφ=6º, независимо от размеров базы громкоговорителей, если 1.83 дБ КИЗ локализуется слушателем в непосредственной близости от громкоговорителя, излучающего бóльший уровень сигнала. Только при ΔL≥6 дБ возникает уверенная локализация КИЗ в позиции громкоговорителя, т.о. уверенная локализация КИЗ на линии боковых баз невозможна. Область уверенной локализации звуковых образов в системе «квадрат» имеет вид купола, опирающегося на громкоговоритель и имеющего значительные «вырывы» справа и слева на поверхности купола. Высота купола примерно равна расстоянию от центра симметрии до любого из громкоговорителей, а коэффициент прозрачности γ=28/92≈0.3. Число раздельно передаваемых направлений локализации КИЗ ~28. - Если уровень одного из громкоговорителей превышает уровень каждого из остальных на ~15 дБ, то КИЗ локализуется в позиции громкоговорителя, излучающего максимальный сигнал. - Если любые три громкоговорителя излучают сигналы одинакового уровня, а четвертый не работает, то локализация КИЗ невозможна. СВ типа «ромб». В этой системе слушатель расположен в центре ромба, образованного громкоговорителями СВ. В этой системе возможна уверенная локализация звуковых образов в пределах всей азимутальной плоскости. 206 Рисунок 6.14 – СВ типа «ромб» При работе пар громкоговорителей: Л, Ф (П, Ф) или Л, Т (П, Т) оказывается, что при ΔL=0 КИЗ кажется смещенным в сторону фронтального громкоговорителя (Ф) для фронтальной пары, или тылового громкоговорителя (Т) для тыловой пары громкоговорителей. Локализация в центре для каждой пары громкоговорителей возможна, если уровень сигнала, излучаемого фронтальным громкоговорителем (Ф) на 3 дБ, а тылового громкоговорителя (Т) на 5 дБ меньше, чем боковых громкоговорителей (Л или П). Для смещения КИЗ в позицию громкоговорителя (Ф) необходимо иметь разницу ΔLФЛ(ΔLФП)~12 дБ, а для смещения КИЗ в позицию громкоговорителя (Т) – ΔLТЛ(ΔLТП)~8…9 дБ. Для перемещения КИЗ в положение (Л) или (П) громкоговорителей требуется обеспечить разницу в уровнях сигналов: ΔLЛФ(ΔLФП)≈15…17 дБ; ΔLЛТ(ΔLТП)~20 дБ. Разрешающая способность слуховой пеленгации КИЗ в системе «ромб» не постоянна и изменяется в пределах. Δφ≈5º…10º во всей азимутальной плоскости, а коэффициент прозрачности γ=0.52. СВ типа «трапеция». Здесь слушатель находится на одинаковом расстоянии от громкоговорителей, рисунок 6.15. Рисунок 6.15 – СВ типа «трапеция» 207 В выше рассмотренных системах основным недостатком является приближенность стереопанорамы к слушателю, что создает ощущение зажатости звуком и, как следствие этого, недостаточная протяженность фронтальной части стереопанорамы, которая может быть использована звукорежиссером для размещения КИЗ. В системе типа «квадрат» асимметричное расположение слушателя несколько спасает положение. При этом слушатель находится от линии базы тыловых громкоговорителей на расстоянии ~0.09 В). В этом случае ОУЛ имеет максимальный размер, уверенная и четкая локализация КИЗ на границу области, включая и пары боковых громкоговорителей. При этом увеличивается фронтальная протяженность стереопанорамы. В системе типа «трапеция» расстояние от слушателя до пар громкоговорителей ЛФ, ЛТ и ПФ, ПТ может быть разное – l1≠l2. Это приводит к появлению временного сдвига между сигналами этих пар громкоговорителей ΔτЛФ, ЛТ, что изменяет положение КИЗ, при определенном значении ΔLЛФ,ЛТ=const, (если изменять длину l2 или l1). При работе пары громкоговорителей ЛФ и ЛТ. Если Δτ=0 (l2=l1) и ΔLЛФ,ЛТ=0 (дБ), КИЗ локализуется слушателем практически в центре базы боковой пары громкоговорителей. Увеличение расстояния l2>l1 при ΔL=0 вызывает смещение КИЗ в сторону фронтального громкоговорителя, а уменьшение – в сторону тылового громкоговорителя. Когда l1=l2, φ=160º…170º; ψ=60º получаются четкие и компактные КИЗ и максимальная ОУЛ. В системе «трапеция» угловая разрешающая способность локализации КИЗ для фронтальной базы громкоговорителей Δφ≈4º; для боковых 8º и для тыловых 7º, а коэффициент прозрачности γ=0.6. СВ типа «треугольник». Рисунок 6.16 – СВ типа «треугольник» Чаще всего l2=l1, а слушатель смещен к тыловым громкоговорителям. Можно уменьшить число громкоговорителей до трех, заменив ЛФ и ПФ одним громкоговорителем, и при этом обеспечить локализацию КИЗ в пределах всей азимутальной плоскости. Величина сигнала тыловых громкоговоритей будет влиять на локализацию КИЗ на линии боковых баз. Действительно, если менять расстояние от слушателя до тылового (ЛТ или ПТ громкоговорителя, то появится временная разность ΔτЛФ(ΔτПФ) между 208 парами громкоговорителей, (или менять ΔL при одинаковых расстояниях). КИЗ уверенно локализуется в позиции громкоговорителей, если ΔLЛФ,ЛТ~24 дБ. Если расстояние от слушателя до всех громкоговорителей одинаково, то получается максимум ОУЛ. Большая часть стереопанорамы находится перед слушателем. Разрешающая способность локализации КИЗ Δφ≈5º-8º, а γ=0.58. 6.4.7 Стереоамбиофонические системы звукопередачи Такие системы имеют следующие особенности: если в предыдущих системах предполагалось, что Л(t) и П(t) сигналы стереопары имеют примерно одинаковые соотношения энергий прямых и отраженных сигналов, то в этих системах вместо двух одинаковых микрофонов используются микрофонные системы XY, AB (М1, М2) или их сочетания рисунок 6.17. Объем помещения V=12300 м3, время реверберации Т500≈1.8 с 5 M1 ЛD ПD 19   Л'D П'D Л(t)=Л'D+k1(Л'R-П'R)  П(t)=П'D+k1(П'R-Л'R)  Гр.1 Гр.2 M2 ПR ЛR   Л'D-П'D+ 2k1(Л'R-П'R) K1 A1 A2  P Рисунок 6.17 – Стереоамбиофоническая система звукопередачи С помощью этих микрофонных групп происходит разделение всей воспринимаемой информации на две части – левую и правую – отдельно для прямых (Лd и Пd) и отраженных (ЛR и ПR) звуковых сигналов. В системе микрофонов АВ расстояние между тыловыми микрофонами выбирается достаточно большим по сравнению с фронтальной парой. Благодаря этому воспринимаемые ими сигналы оказываются некоррелированными, что способствует их независимому восприятию и уменьшает мешающее действие отраженных сигналов – уменьшается взаимная маскировка. Сигналы стереопары Лd и Пd подаются на регулируемые линии задержки Δτ, на выходе которых образуются задержанные сигналы Лd´ и Пd´. Сигналы ЛR и ПR подаются на вычитатель и затем их уровень изменяется с помощью 209 регулируемого аттенюатора. Тогда на выходе последнего присутствует сигнал: (ЛR´-ПR´)k1, где коэффициент k1=0÷1. Далее преобразованные сигналы, прямые и отраженные, подаются на сумматоры левого и правого каналов передачи. На входе которых формируются сигналы стереопары по следующему правилу: Л(t)=Лd´+k1(ЛR´-ПR´), П(t)=Пd-k1(ЛR´-ПR´)= Пd´+ k1(ПR´-ЛR´). Отраженный сигнал разностный в правом канале инвертируется с помощью фазовращателя на π. Таким образом по каналам связи передаются Лd´ и Пd´ сигналы, воспринимаемые стереомикрофоном М1 , к которым в определенном соотношении добавляются разностные сигналы, полученные на выходах микрофона М2. На приемной стороне сигналы Л(t) и П(t) стереопары воспроизводятся фронтальной парой громкоговорителей. Добавление в эти сигналы, в определенном соотношении реверберирующих звуков обогащает звучание фронтальной пары громкоговорителей, делает воспринимаемые тембры более богатыми. Тыловые пары громкоговорителей ориентированы на пространственное рассеяние звуковой энергии и питаются разностным сигналом: k2[(Лd´-Пd´)+2k1(ЛR´-ПR´)] в противофазе, т.к. сигнал правого громкоговорителя питается через фазовращатель π . Эта пара громкоговорителей содержит преимущественно энергию отраженных звуков, воспринимаемых стереомикрофоном М2. Включение в цепь тыловых громкоговорителей дополнительной линии задержки Δτ1, ревербераторы, а также частотного корректора, существенно расширяет возможности системы: повышает объемность, прозрачность звучания, позволяет осуществить оперативное изменение акустической атмосферы первичного помещения. Стереоамбиофонические системы способны донести до слушателей информацию акустической атмосферы первичного помещения и о пространственном размещении ИЗ по фронту и глубине, с сохранением уверенной и четкой локализации КИЗ в пределах базы фронтальных громкоговорителей. 6.4.8 Квазистереоамбиофонические системы В этой системе так же прямые звуки и отраженные, на передающей стороне формируются разными отдельными микрофонами. Но здесь микрофоны не стереофонические, а, как правило, одиночные монофонические. Но ориентированы так, что один воспринимает в основном прямой звук, а другой отраженные сигналы (рисунок 6.18). На рисунке представлены два возможных варианта квазистереоамбиофонической системы. Микрофоны имеют требуемую ДН и расположены соответствующим образом в помещении, чтобы улавливать только прямые или только отраженные сигналы. Если включен только микрофон М1 рисунок 6.18 а, то для слушателей КИЗ будут находится в позиции Гр.1, или посередине базы Гр.1 и Гр.2, если 210 схема 6.18,б. При включении второго микрофона М2 слушателям кажется, что КИЗ «вышел из Гр.1 и занял значительное пространство перед ним» рисунок 6.18 а. Однако четкой локализации нет, весь комплексный сигнал звучит как единый объемный звуковой образ. Но здесь лучше передается акустическая атмосфера первичного помещения. 1 Л(t) M1 2 П(t) M2 3 a) M1 A1 M2 А' D АD BD  B'R А' D-B'R C Р П A2 1 А' D+B'R 2 3 4 б) 2B'R AЗ B''R  -B''R Рисунок 6.18 – Квазистереоамбиофонические системы С этой точки зрения лучшие результаты дает вторая система, но т.к. между микрофонами М1 и М2 может быть значительное расстояние, то это приводит к возникновению «эха». Для устранения этого эффекта в цепь усиления М1 включается линия задержки (ЛЗ). Которая позволяет плавно менять задержку между сигналами АD и ВR от 0…35 (мс). Сигналы далее подбираются по уровню с помощью регулируемых аттенюаторов А1, А2 и подаются на суммарно-разностный преобразователь. Полученные на его выходах суммарный и разностный сигналы подаются в каналы связи. В помещении прослушивания имеются четыре громкоговорителя. На фронтальные подаются сигналы, полученные на выходах СРП. Кроме того они подаются на вычитатель, на выходе которого получается сигнал 2В´R, содержащий только реверберирующий сигнал микрофона М2. Громкоговорители 1 и 2 излучают как прямые, так и отраженные звуки, но отраженные в противофазе ВR´(- ВR´)), громкоговорители 3 и 4 излучают только реверберирующий сигнал. Для усиления иллюзии диффузности звучания они питаются в противофазе. Такое включение способствует 211 созданию эффекта окружения, звук как бы приходит из всех направлений. Аттенюатором А3 устанавливается оптимальное соотношение уровней сигналов фронтальных и тыловых громкоговорителей. Как и в предыдущем случае, слушатель получает достаточно полное представление о размерах ИЗ по фронту и глубине; хорошо передается акустическая атмосфера первичного помещения (размеры, гулкость, специфическая окраска звучания и т.д.). Однако четкой локализации КИЗ нет! ВОПРОСЫ К РАЗДЕЛУ 6 1. Пояснить понятия - пространственность, объемность, протяженность звучания. 2. Как классификацируются системы звукопередачи? 3. Состав системы MS. 4. В чем заключается локализация кажущихся источников звука? 5. Сущность бинауральной системы звукопередачи. 6. Суть иммитации звучания двух кажущихся громкоговорителей процессором. 7. Для чего используется управляемая декодирующая матрица в матричных системах с адаптацией каналов воспроизведения? 8. Где происходит «окончательная оценка» азимута КИЗ? 9. Что называют синтезаторами пространственного звучания? 10. Сущность универсального формата систем звукопередачи. 212 7. РЕДАКТОРЫ ЦИФРОВОГО АУДИО 7.1 Классификация аудиоредакторов Программное обеспечение, предназначенное для записи, редактирования и обработки звуковой информации в цифровом представлении называется аудиоредактором или волновым редакторам, которое является связующим звеном между операционной системой и звуковой картой компьютера. Функциональные возможности программ непрерывно расширяются и могут отличаться в зависимости от их предназначения. Простейшие аудиоредакторы имеют ограниченные возможности по редактированию звука, а также могут поддерживать небольшое число форматов представления цифровой аудиоинформации. Профессиональные редакторы обработки звука могут поддерживать мультитрековые режимы работы, синхронизировать визуальную информацию с аудио, поддерживать профессиональные звуковые платы, иметь расширенный набор кодеков и плагинов. В большинстве программ в основном окне аудиосигнал представлен в последовательности отчетов, объединенных огибающей линией, называемой волновой формой. Основные задачи аудиоредакторов – запись и воспроизведение звука, преобразование его уровня, динамического диапазона, спектрального состава (АЧХ) звука, фазовых характеристик, фильтрация, шумоподавление. Также в составе аудиоредакторов присутствуют различные приборы контроля параметров. Большинство профессиональных аудиоредакторов отличаются лишь интерфейсом и некоторыми возможностями. Существует большое множество современных аудиоредакторов, это такие программы как: WaveLab. Профессиональное кроссплатформенное приложение от создателей технологии VTS, которая позволяет обрабатывать звук в режиме реального времени. WaveLab – многоканальный редактор, который позволяет эффективно работать со звуком в HD-качестве: редактировать файлы, осуществлять монтаж, сводить треки, записывать звук. Поддерживает все основные и популярные аудиоформаты: MP3, MP2, WAV, OGG, FLAC, AIF и звуковые дорожки видеофайлов. Помимо стандартного функционала (мультитрекинг, монтаж, анализ), незаменимого при создании качественной радиопередачи или подкаста, имеет большое количество дополнительных функций: запись CD/DVD, накладывание эффекта и последующее его прослушивание в реальном времени (можно подключить до 10 плагинов), пакетную обработку, возможность создания многоканальных композиций аудиостандарта DVD. Отличительная черта продуктов Steinberg – особый формат OST (Original Sound Quality), который сжимает цифровой звук без потерь в 213 качестве. Редактор легко синхронизируется с другими приложениями и плагинами от Steinberg, поэтому его возможности весьма разнообразны. Sound Forge Pro. Многофункциональная кроссплатформенная программа с широким спектром различных инструментов, которая получила признание у многих звукорежиссеров, продюсеров и музыкантов. Приложение распознает почти все известные аудиоформаты, в том числе и довольно редкие – такие как Raw Audio, Macintosh AIFF, Sony Perfect Clarity Audio (PCA), Macromedia Flash (SWF), Sony Media Wave 64 (W64), а также некоторые видеоформаты. Маркеры, волновые формы, размеры/цвет окон и другие элементы интерфейса могут настраиваться и сохраняться по желанию пользователя. Функционал Sound Forge Pro включает в себя все необходимое для создания высококачественного аудиоконтента: большое количество разнообразных фильтров и эффектов, возможность создания звуковых петель и потоковых медиафайлов, инструменты ремастеринга и восстановления старых записей и так далее. Nero WaveEditor. Специфический инструмент для создания длительных миксов. Как и любой продукт Nero, программа предназначена для записи готовых дорожек на оптические диски, впрочем, всегда можно экспортировать готовый проект в дорожку в WAV-формате. Добавление треков в интерфейс производится простым перетаскиванием. Если «покопаться» в настройках программы, то в ее «дебрях» меню можно обнаружить синтезатор, регулятор ударных и микшер. Последний инструмент довольно неплох, однако «не дотягивает» до уровня профессиональных решений вроде Traktor Pro. Nero SoundTrax. Еще один продукт от известного разработчика Nero. У этих двух приложений есть даже общая черта – они оба поддерживают DirectX/VST-эффекты. На этом их схожесть заканчивается. Nero WaveEditor – классический аудиоредактор с поддержкой компрессии в формат mp3PRO и набором из 20 встроенных эффектов. В утилиту интегрирован эквалайзер, шумовой шлюз и караоке-фильтр. Отметим наличие специальных алгоритмов для оптимизации звучания определенных инструментов (например, ударных). mp3DirectCut. Компактное приложение, предназначенное для работы с отрезками треков. С его помощью часто делают рингтоны для мобильных телефонов. Из дополнительных функций утилиты – только возможность плавно увеличить или приглушить громкость воспроизведения. Free Audio Editor. Аудиоредактор практически идентичный вышеописанному mp3DirectCut, только с поддержкой большего количества форматов аудиосигнала и с возможностью аудиоконвертера. Отсутствие пакетного режима преобразования, приводит к тому, что при перекодировании большого числа файлов нужно будет каждый раз загружать объекты в интерфейс приложения. Sound Normalizer. Специализированная утилита для нормализации громкости треков путем изменения амплитуды всех звуковых колебаний, за 214 счет этого «на выходе» получается аудиофайл без потери качества. Приложение поддерживает функцию пакетного преобразования, включает режим предварительного прослушивания предлагаемых изменений. Sound Normalizer может работать со многими популярными форматами (FLAC, MP3, WAV, OGG и другие), утилиту можно применять в роли аудиоконвертера. WavePad. Кроссплатформенное профессиональное приложение доступное как в бесплатной, так и в платной расширенной версии – WavePad Master’s Edition для Windows и Mac. Бесплатная версия предназначена исключительно для домашнего использования в некоммерческих целях. Аудиоредактор работает с MP3 или WAV, но поддерживает и другие форматы – OGG, FLAC, AIF, AU, AM, VOX, WMA, Real Audio, GSM, M4A, MIS и другие. В программе присутствует стандартный редакторский функционал – обрезание, склеивание, удаление, копирование, вставка, тишина и так далее. И базовый набор эффектов – эквалайзер, эхо, реверберация, обратное проигрывание, envelope, усиление звука. Дополнительно отметим инструмент снижения шума, который может работать в двух режимах — автоматическом и ручном. Есть возможность оставлять закладки для отложенной работы с треками, осуществлять поиск по аудио, производить спектральный анализ (FFT), изменять голос, реставрировать записи (осуществлять подавление шума и устранение треска). Пакетная обработка позволяет конвертировать большое количество файлов за один клик или, например, применять к ним эффекты. В общем, функционал довольно широкий, всего не перечислить, к тому же существует большой выбор дополнительных утилит, которые можно установить отдельно: для сведения звуковых дорожек, записи на CD, конвертации, а при необходимости – даже элементарного редактирования видео. GoldWave. Довольно функциональное приложение, которое обладает не только отличным функционалом для обработки уже имеющихся записей, но и опцией захвата звука с разных источников (включая звуки с других программ). Приложение содержит функцию пакетного конвертирования, позволяет синтезировать речь, может расширять возможности за счет «фирменных» дополнений или сторонних плагинов. AVS Audio Editor. Приложение для редактирования аудиодорожек с возможностью импорта объектов с Audio CD. Программу часто используют для изменения голоса, в нее включены пресеты для преобразования речи. Поддерживается три вида визуализации звуковых колебаний – спектральный вид, огибающая форма и волновой индикатор. Остальные функции AVS Audio Editor идентичны большинству подобных решений: инструменты для обрезки треков, набор эффектов и возможность звукозаписи. Audacity. Один из самых простых, но при этом достаточно функциональных кроссплатформенных аудиоредакторов, который отлично подойдет для новичков. В этом бесплатном приложении есть все, что необходимо для обработки аудиозаписей. С его помощью можно резать 215 треки, копировать фрагменты, убирать ненужные части и вокал, поднимать уровень звука, накладывать эффекты. Программу можно использовать для записи (есть таймер), оцифровки аналоговых носителей, а также в качестве конвертера. Работать можно сразу на нескольких дорожках, есть поддержка VST-плагинов, которые помогают значительно расширить спектр возможностей по обработке звука. Импорт и экспорт файлов поддерживается в форматах MP3, WAV, OGG Vorbis, FLAC, AIFF и AU. Можно также использовать сторонние библиотеки, импортировать файлы MPEG, WMA, GSM, M4A/M4R (AAC), AC3 и так далее. Приложение доступно для Microsoft Windows, Linux, Mac OS X, FreeBSD. Есть у программы и свои минусы – отсутствие возможности наложить эффект в реальном времени и поддержки драйверов ASIO, которые обеспечивают низкий уровень задержки при передаче аудиопотока. У Audacity также есть портативная версия Audacity Portable, с помощью которой можно редактировать, накладывать эффекты, изменять скорость воспроизведения и тон, удалять шумы, плюс использовать встроенные фильтры вроде реверса и усиления/затухания звука. Как и полная версия, портативная поддерживает большинство популярных форматов. Выпущенный в 2000 году аудиоредактор получил особую популярность среди подкастеров – его даже рекомендовали для записи и монтажа подкастов создатели проекта Russian Podcasting. Adobe Audition. Кроссплатформенная программа для микширования и звукового монтажа. Программу отличает достаточно удобный пользовательский интерфейс, который можно гибко настраивать и сохранять в качестве шаблона – для разных проектов можно задать разные параметры. Помимо стандартного функционала, у программы имеется широкий выбор продвинутых инструментов для создания ремиксов и корректировки продолжительности композиций, синтеза речи, записи с отчетом времени. Пользователю также доступно редактирование диапазона частот, обнаружение паттернов биений и ритмов для соответствующего установления начальных и конечных точек, расширенная поддержка автоматизации радиопередач и многое другое. Этот аудиоредактор открывает бескрайние возможности для экспериментов в области саунддизайна и создания эффектных звуковых ландшафтов. Новые версии программы также позволяют производить автоматическое резервное копирование в Adobe Creative Cloud. Сравнительная характеристика описанных аудиоредакторов представлена в таблице 7.1. 216 Таблица 7.1 – Сравнительная характеристика аудиоредакторов № 1 2 3 4 5 6 Программа WaveLab Sound Forge Pro Nero SoundTrax mp3DirectCut Free Audio Editor Sound Normalizer 7 8 WavePad Nero WaveEditor 9 10 11 12 GoldWave AVS Audio Editor Audacity Adobe Audition Выше среднего Да Да Да Выше среднего Да Да Да Обработка звука из Лицензия видеофайла Да Платная Платная Да Нетребователен Нет Да Нет Нет Бесплатно Нетребователен Нет Нет Нет Нет Бесплатно Нетребователен Нет Да Нет Нет Бесплатно Средне Нет Нет Нет Нет Платная Средне Да Да Нет Да Бесплатно для домашних ПК Средне Нет Да Нет Нет Бесплатно Средне Нет Да Нет Нет Средне Нет Да Да Да Средне Да Да Да Нет Бесплатно с ограничениями/платно Бесплатно с ограничениями/платно Бесплатно Требователен Да Да Да Да Платная Требование к ресурсам ПК Поддержка Мультитрековый Звукозапись плагинов режим 217 7.2 Adobe Audition 7.2.1 Основные элементы интерфейса программы Программа Adobe Audition предназначена для работы с оцифрованным звуком, т.е. аналоговые звуковые волны должны быть предварительно преобразованы (сэмплированы) в последовательность двоичных цифровых отсчетов. Такое преобразование осуществляется в аналого-цифровом преобразователе (АЦП). В результате работы АЦП получается цифровой образ звука, – то, что по-английски называется Waveform (волновая форма). Волновые формы хранятся на жестком диске в файлах различных форматов. Чаще всего это файлы с расширением имени WAV. Таким образом, когда вы "собираете" в Adobe Audition аудиокомпозицию, WAV-файлы служат стандартными элементарными блоками, кирпичиками [9]. В Adobe Audition есть два принципиально различных режима работы: редактирование отдельных волновых форм и совместное мультитрековое редактирование совокупности волновых форм. У каждого из режимов есть свое главное меню и свое главное окно: Edit Waveform View и Multitrack View – два различных по назначению звуковых редактора, объединенных в функциональный комплекс (рисунок 7.1). Операции редактирования, выполняемые в режиме Edit Waveform View (подобные вырезке, вставке и обработке эффектами), по своей сути являются разрушающими, и при сохранении файла, изменения вносятся непосредственно в волновую форму. Редактирование, выполненное в Multitrack View (перенос, состыковка волновых форм, изменение громкости, панорамы, параметров эффектов реального времени и т. п.), является неразрушающим. Во многих музыкальных редакторах, имеющих средства обработки аудиоданных, предусмотрены два варианта использования эффектов: применение эффекта в реальном времени и пересчет звуковых данных. Первый вариант удобнее, поскольку при регулировании параметров эффекта результат можно в тот же момент оценить на слух. Однако для этого требуется высокопроизводительный компьютер. Применение эффекта путем пересчета позволяет обрабатывать звуковые данные с помощью относительно "слабого" компьютера, но процесс обработки может продолжаться десятки минут. Основной способ применения эффектов в режиме Edit Waveform View – пересчет звуковых данных. Полноценный режим реального времени в Edit Waveform View не предусмотрен. Однако замена режима реального времени все же имеется. В окне эффекта доступна кнопка Preview (предварительное прослушивание, проба в реальном времени). Результаты изменений параметров эффекта будут слышны немедленно. В отличие от настоящего режима реального времени, при предварительном прослушивании можно пользоваться только одним эффектом. 218 а) б) Рисунок 7.1 – Главное окно программы а) в режиме Edit Waveform View б) в режиме Multitrack View Переключение между режимами Edit Waveform View и Multitrack View осуществляется с помощью выбора соответствующего индикатора на панели (рисунок 7.2). Помимо основных двух режимов, также в Adobe Audition имеется и третий – работа с CD-диском. Рисунок 7.2 – Переключение между режимами Маркер отображается пунктирной желтой линией, указывает то место (то время) в волновой форме, с которого начнется воспроизведение. Указатель текущей позиции отображается сплошной линией, существует и 219 виден только в динамическом режиме. Он указывает на графическом изображении волновой формы то место, воспроизведение которого происходит в текущий момент времени. В левой нижней части окна расположена панель управления (Transport) (рисунок 7.3). Рисунок 7.3 – Панель Transport С помощью кнопок этой панели осуществляется управление записью, воспроизведением и отображением волновых форм. (Stop) – кнопка остановки записи или воспроизведения. После нажатия этой кнопки указатель текущей позиции возвратится к маркеру. Следующий сеанс записи или воспроизведения начнется с точки расположения маркера. (Play) – кнопка включения режима воспроизведения. Может быть воспроизведен только тот фрагмент волновой формы, который отображен на экране. После достижения указателем текущей правой границы экрана воспроизведение прекратится, а указатель текущей позиции возвратится к маркеру. Если имеется выделенный фрагмент волновой формы, то воспроизведен будет только он, а по окончании воспроизведения указатель текущей позиции возвратится началу выделенного фрагмента. (Pause) – кнопка временной остановки записи или воспроизведения. После остановки указатель текущей позиции останется на том месте, где его застало нажатие этой кнопки. Повторное нажатие кнопки приведет к продолжению воспроизведения (записи). (Play to End) – еще одна кнопка включения режима воспроизведения. Может быть воспроизведена вся волновая форма, а не только ее часть, отображенная на экране или выделенная. (Play Looped) – кнопка включения режима циклического воспроизведения. Воспроизведение начнется с позиции маркера. Когда указатель текущей позиции дойдет до правого края отображенного на экране фрагмента волновой формы, не прекратится, а продолжится с его левого края. Если имеется выделенный фрагмент, циклически будет воспроизводиться только он. (Go to Beginning) – кнопка перемещения маркера к началу волновой формы. (Rewind) – кнопка «обратной перемотки». Если программа находится в состоянии Stop, то нажатие этой кнопки приведет к 220 перемещению маркера в направлении начала волновой формы. Причем, однократное нажатие кнопки вызовет перемещение маркера на один шаг. Если кнопку нажать и удерживать, маркер будет перемещаться до тех пор, пока не дойдет до начала волновой формы или пока не будет отпущена кнопка Rewind. (Fast Forward) – кнопка ускоренной перемотки вперед. За исключением направления перемотки эта кнопка ничем не отличается от кнопки Rewind. (Go to End) – кнопка перемещения маркера к концу волновой формы. (Record) – кнопка включения режима записи. На рабочем поле отображено графическое изображение (осциллограмма) звукового сигнала – волновая форма. Вид монофонической волновой формы показан на рисунке 7.4. Рисунок 7.4 – Волновая форма звукового сигнала Над волновой формой расположена диаграмма, светлый прямоугольник которой обозначает отображаемую область. Перемещая этот прямоугольник с помощью мыши, можно «перематывать» волновую форму. Если вся диаграмма светлого цвета, значит, в окне отображается вся волновая форма. Размер прямоугольника относится к размеру всей диаграммы так же, как и длительность отображаемого фрагмента к длительности всей волновой формы. При щелчке правой кнопкой мыши на этой диаграмме появится контекстное меню, с помощью которого управлять масштабом отображения волновой формы (рисунок 7.5). Если выбрать команду Zoom In, то масштаб отображения волновой формы будет увеличен, если Zoom Out – уменьшен. Выбор Zoom Full 221 приведет к тому, что на экране будет отображаться полностью вся волновая форма. Рисунок 7.5 – Контекстное меню диаграммы отображаемой области С помощью двух оставшихся команд контекстного меню можно изменять расположение самой диаграммы: над рабочим полем главного окна (Above Display) или под ним (Bellow Display). Если фрагмент волновой формы выделен, то на диаграмме информация о его протяженности и расположении относительно всей волновой формы отображается в виде серого прямоугольника. Масштабом отображения волновой формы по вертикали и горизонтали можно управлять с помощью инструментов панели Zoom (рисунок 7.6) Рисунок 7.6 – Панель Zoom Масштаб отображения волновой формы по горизонтали задается при помощи кнопок: (Zoom In Horizontally) – увеличить масштаб. (Zoom Out Horizontally) – уменьшить масштаб. (Zoom Out Full Both Axis) – отобразить всю волновую форму. (Zoom to Selection) – увеличить масштаб так, чтобы на экране отображался весь выделенный фрагмент волновой формы. (Zoom Into Left Edge of Selection) – увеличить масштаб и отобразить на экране левую границу выделенного фрагмента. (Zoom Into Right Edge of Selection) – увеличить масштаб и отобразить на экране правую границу выделенного фрагмента. 222 Для изменения масштаба отображения волновой формы по вертикали предназначены кнопки (Zoom In Vertically) и (Zoom Out Vertically). В нижней части окна расположена панель Selection/View (рисунок 7.7). Рисунок 7.7 – Панель Selection/View Панель состоит из шести полей ввода. Эти поля ввода организованы в таблицу, содержащую две строки и три столбца. В верхней строке (Selection) отображаются (и могут быть отредактированы) временные параметры выделенного фрагмента волновой формы, а в нижней (View) – фрагмента волновой формы, отображаемого на экране. Левый столбец (Begin) соответствует начальному моменту фрагмента волновой формы, средний (End) – конечному. В правом столбце (Length) содержится информация о протяженности фрагмента. Для того чтобы точно задать позицию маркера, необходимо щелкнуть левой кнопкой мыши на поле ввода, находящемся на пересечении строки Selection и столбца Begin, сделав это поле ввода доступным для редактирования. Введите необходимое число и нажмите . Чтобы определить границы выделенного участка с высокой точностью, нужно задать их в полях ввода, находящихся на пересечении строки Selection и двух столбцов: Begin – левая граница выделенного фрагмента волновой формы End – правая граница выделенного фрагмента волновой формы Можно задать левую границу фрагмента и его протяженность. Для этого предназначены поля ввода, сосредоточенные в столбце Length. Для установки маркера нужно щелкнуть на рабочем поле главного окна только один раз. Если же щелкнуть два раза, то выделится тот фрагмент волновой формы, который отображается в окне программы. Для того, чтобы выделить часть этого фрагмента (еще более короткий участок фонограммы), нужно подвести указатель мыши к позиции, соответствующей началу (или концу) фрагмента, и нажать ее левую кнопку. Не отпуская кнопку, подвести указатель мыши к концу (или началу) фрагмента. Отпустить кнопку. Результат проделанной работы будет напоминать картинку, представленную на рисунке 7.8. 223 Рисунок 7.8 – Выделенный фрагмент волновой формы 7.2.2 Работа с аудиофайлами Рассмотрим некоторые основные команды меню File (рисунок 7.10). Рисунок 7.10 – Меню File 224 New – создание новой волновой формы. Команда Open открывает звуковой файл. При этом на экране появляется окно диалога Open, изображенное на рисунке 7.11. Кроме элементов, традиционных для окон открытия файлов в любых Windows-приложениях, это окно содержит дополнительные поля, о которых следует упомянуть. Рисунок 7.11 – Окно диалога Open В раскрывающемся списке Recent Folders перечислены те каталоги (папки), к которым обращались ранее, открывая файлы. Для того чтобы быстро перейти от одного каталога к другому, достаточно выбрать, в этом списке необходимую строку. Если установлен флажок Show File Information, то будет отображаться информация о формате выделенного звукового файла, продолжительности его звучания и объеме памяти, занятой им. Если установлен флажок AutoPlay, тогда при выделении звуковых файлов в раскрывающемся списке Recent Folders они будут воспроизводиться. Выделенный файл можно также прослушать, нажав кнопку Play. При включенной опции Don't ask for further details не будет запрашивать сведения о представлении звуковых данных в формате неизвестного ему типа, а будет считать, что файл имеет такой же формат, как и предыдущий загруженный. В раскрывающемся списке Тип файлов выбирается тип звукового файла. Adobe Audition умеет работать с различными форматами звукового файла (рисунок 7.12). 225 Рисунок 7.12 – Типы аудио форматов Adobe Audition Программа может загружать один за другим сразу несколько звуковых файлов. Для этого в окне Open File нужно выделить имена всех необходимых файлов и нажать кнопку Open. Помеченные файлы по очереди будут загружены в программу. Каждый из них разместится на отдельной странице главного окна программы (рисунок 7.13). Рисунок 7.13 – Панель Files Следующая команда меню File – Open As... (Открыть как...) аналогична предыдущей, за исключением того, что в процессе загрузки звуковые данные, хранящиеся в выбранном файле, можно конвертировать в другой формат (задать новую частоту дискретизации, разрядность и количество каналов) с помощью окна изображенного на рисунке 7.14. 226 Рисунок 7.14 – Окно диалога Open File(s) As Команда Close закрывает редактируемый файл, вернее, она освобождает память программы от редактируемой волновой формы. Программа возвращается в исходное состояние. Команда Close All закрывает все файлы всех сессий. Команда Save сохраняет редактируемый файл на диске с тем же именем, с которым он был загружен с диска. Команда Save As сохраняет файл с именем, определенным пользователем. После вызова этой команды появляется окно диалога Save As (рисунок 7.15), которое содержит стандартные элементы управления, но имеет две особенности. 227 Рисунок 7.15 – Окно диалога Save As Первая особенность – наличие кнопки Options. После ее нажатия появляется окно, которое имеет различный вид для звуковых файлов различных форматов. Для некоторых форматов кнопка Options недоступна. Опции дополнительного окна также бывают разными: например, предназначенными для выбора способа сжатия звуковой информации. Вторая особенность – наличие флажка Save extra non-audio information (Сохранять дополнительную незвуковую информацию). Если он установлен, то в звуковом файле, кроме спецификации формата и самой волновой формы, будет записана такая информация, как, например, название композиции, сведения об авторских правах и многое другое. Командой Save Selection в файле сохраняется только выделенный фрагмент волновой формы. Команда Save All сохраняет все открытые на данный момент аудиозаписи. Команда Close закрывает открытую активную аудиозапись без сохранения изменения, а Close All закрывает все открытые в программе аудиозаписи. 7.2.3 Частотный (спектральный) анализ Для частотного анализа требуется открыть меню Windows и в выпадающем списке выбрать Frequency Analysis. Окно диалога частотного (спектрального) анализатора звука Frequency Analysis показано на рисунке 7.16. При открытии окна Frequency Analysis, происходит предварительный расчет спектра короткого фрагмента волновой формы, начало которого совпадает с позицией маркера. Если же выделен фрагмент волновой формы (или даже вся волновая форма), анализируется выборка сигнала, расположенная посередине выделенного фрагмента. Но на основании выборки невозможно получить полное представление о спектре сигнала. Чтобы произвести спектральный анализ всего выделенного звукового фрагмента (или всей волновой формы), нужно нажать кнопку Scan celection. Спустя некоторое время после завершения расчета спектра изображение изменится. Расчет производится раздельно для правого и левого каналов. На графике кривые спектрограмм для разных каналов отображаются разными цветами. По горизонтальной оси откладывается частота в герцах, по вертикальной – уровень компонентов сигнала на этой частоте. При установленном флажке LinearView горизонтальная ось размечается в линейном масштабе. Так удобнее рассматривать весь спектр в целом, включая и его высокочастотную область. Если этот флажок сброшен, то по горизонтали устанавливается логарифмический масштаб. Это позволяет в деталях наблюдать низкочастотную часть спектра. Для сравнения на 228 рисунке 7.17 при логарифмической шкале по оси частот показан спектр того же самого сигнала, для которого на рисунке 7.16 выбран линейный масштаб. Рисунок 7.16 – Окно анализатора спектра Рисунок 7.17 – Спектр сигнала при логарифмическом масштабировании оси частот 229 Слева под шкалой частот располагается поле, в котором отображаются данные о значениях спектральной функции сигналов правого и левого канала для той частоты, на которую в данный момент указывает курсор мыши. Сказанное справедливо при условии, что курсор находится в пределах координатного поля. При перемещении курсора значения параметров изменяются. Если курсор находится вне пределов координатного поля, то значения трех отображаемых параметров не меняются, причем они соответствуют той частоте, при которой курсор, покидая координатное поле, пересек его границу. В поле, расположенном правее рассмотренного, показаны частоты спектральных составляющих сигналов левого и правого каналов, в окрестностях которых сосредоточена максимальная энергия (частоты максимальных пиков на графике). В правом верхнем углу окна расположена группа Hold, включающая в себя 4 разноцветные кнопки. Если не нажата ни одна из кнопок, то огибающие спектральных функций сигналов правого и левого каналов отображаются линиями разного цвета. Если нажата хотя бы одна кнопка, то огибающие спектральных функций сигналов правого и левого каналов отображаются различными оттенками одного и того же цвета. В левом нижнем углу окна расположен раскрывающийся список, предназначенный для выбора одного из 5 стилей отображения спектральной функции. 1. Lines – отображается только огибающая спектральной функции. 2. Area (Left on top) – отображается и огибающая спектральной функции и ее заполнение: область координатной плоскости, находящаяся под огибающей, залита цветом, спектр сигнала левого канала отображается в верхнем слое рисунка, правого – в нижнем. 3. Area (Right on top) – отображается и огибающая спектральной функции и ее заполнение, спектр сигнала правого канала отображается в верхнем слое рисунка, левого – в нижнем. 4. Bars (Left on top) – заполнение спектральной функции отображается в виде вертикальных полосок. Спектр сигнала левого канала отображается в верхнем слое рисунка, правого – в нижнем. 5. Bars (Right on top) – заполнение спектральной функции отображается в виде вертикальных полосок. Спектр сигнала правого канала отображается в верхнем слое рисунка, левого – в нижнем. Кнопка Advanced увеличивает число доступных опций окна. Дополнительно появятся: - Поле Reference_dBFS - Раскрывающийся список FFTSize - Безымянный раскрывающийся список, предназначенный для выбора типа весовой функции 230 - Кнопка Copy to Clipboard, позволяющая в текстовом формате переслать значения частот и соответствующие им значения спектральной функции в буфер обмена В поле Reference_dBFS можно задать величину смещения графика спектра по вертикали относительно нулевого уровня. В раскрывающемся списке FFTSize предусмотрено несколько стандартных значений размера выборки для БПФ, а в раскрывающемся списке, расположенном правее, – различные вариации этого преобразования. Предел изменения частоты по горизонтальной оси в окне устанавливается автоматически. Он зависит от частоты дискретизации анализируемой волновой формы. Так, например, если анализируется волновая форма с частотой дискретизации 22,05 кГц, то максимальная частота, отображаемая в окне, составит 11 кГц. Так как в соответствии с теоремой Котельникова высшая из достоверно измеряемых спектральных составляющих располагается на частоте, вдвое меньшей по сравнению с частотой дискретизации. 7.2.4 Создание эффектов Эффект Chorus проявляется как эффект исполнения одного и того же звука или всей партии не одним инструментом или голосом, а несколькими. Искусственно выполненный эффект является моделью звучания настоящего хора. С одной стороны, голоса певцов и звуки инструментов при исполнении одинаковой ноты должны звучать одинаково, и к этому стремятся и музыканты, и дирижер. Но из-за индивидуальных различий источников звук все равно получается разным. В пространстве, тракте звукоусиления и в слуховом аппарате человека эти слегка неодинаковые колебания взаимодействуют, образуются так называемые биения. Спектр звука обогащается и, самое главное, течет, переливается. Можно считать, что предельным случаем Chorus является одновременное звучание слегка отличающихся по частоте двух источников – унисон. Унисон был известен задолго до появления синтезаторов. Разница в частотах образуется естественным путем из-за невозможности идеально одинаково настроить струны инструмента. Вот именно наличие этой разницы в частотах голосов певцов или инструментов и служит причиной красивого звучания унисона (для двух голосов) или Chorus (для голосов, числом более двух). Существует довольно много разновидностей алгоритмов Chorus. Но все они сводятся к тому, что: 1. Исходный сигнал разделяется на два или несколько каналов. 2. В каждом из каналов спектр сигнала сдвигают по частоте на определенную для каждого канала величину (частотные сдвиги очень малы, они составляют доли герца). 3. Сигналы, полученные таким способом, складывают. 231 Chorus – это один из способов создания эффекта присутствия, т. е. выделения голоса певца или звука инструмента на фоне аккомпанемента. В Adobe Audition команда Effects › Modulation › Chorus открывает диалоговое окно эффекта Chorus (рисунок 7.18). Рисунок 7.18 – Диалоговое окно эффекта Chorus В Adobe Audition применяется метод прямого моделирования эффекта Chorus: из каждого исходного голоса формируются новые голоса, звучание которых отличается от оригинала за счет неглубокой модуляции частоты и сдвига по времени, а также за счет псевдослучайного интонирования Пространственную протяженность и даже некоторую объемность эффекту придает наличие обратной связи в алгоритме обработки. В панели Characteristics сосредоточены опции, определяющие параметры эффекта. В поле Voices указывается количество голосов, участвующих в формировании эффекта Chorus. Для управления параметрами Chorus служат следующие регуляторы:  Delay Time – максимальное временное рассогласование (задержка) голосов.  Delay Rate – частота модуляции задержки. 232 Feedback – глубина обратной связи.  Spread – дополнительная задержка каждого голоса (до 200 мс).  Modulation Depth – глубина вибрато (модуляции по частоте).  Modulation Rate – частота вибрато. В панели Stereo Width находятся опции, от которых зависят стереофонические свойства эффекта. Если флажок Average Left & Right Channel Input снят, то исходные сигналы левого и правого каналов будут обрабатываться эффектом по отдельности. Существовавший до обработки стереообраз звука претерпит минимальные искажения. При установленном флажке сформируется некий усредненный стереообраз, т. к. обрабатываться будет смесь канальных сигналов. По сути дела, сначала программа сформирует моносигнал, а затем придаст ему стереофоничность за счет разноса отдельных голосов по панораме. При установленном флажке Add Binaural Cues в сформированный сигнал добавляются задержки, разные для правого и левого каналов, тогда голоса, исходящие из различных точек панорамы, будут появляться в различные моменты времени. Расположенные ниже рассмотренных флажков регулятор Stereo Field и предназначен для выбора протяженности эффекта на стереопанораме (ширины стереополя). Если ползунок находится в положении Narrow (введено число 0), все голоса будут помещены в центр стереопанорамы. При установке ползунка в положение 50% все голоса расположатся на панораме равномерно слева направо. Если для параметра, определяющего протяженность стереоэффекта, выбирать значения больше 50%, то по мере перемещения ползунка вправо голоса начнут перемещаться к крайним точкам панорамы: «левые» голоса переместятся еще левее, а «правые» – правее. Если ползунок находится в положении Wide (значение параметра составляет 100%), все левые голоса помещены в крайнюю левую точку, правые – в крайнюю правую точку. В группе Output Level сосредоточены регуляторы и поля вода, с помощью которых можно выбрать пропорцию смешивания обработанного эффектом (Wet) и исходного (Dry) сигналов. Если установить флажок Highest Quality, то для реализации эффекта будет использован алгоритм, обеспечивающий более высокое качество (меньший уровень искажений), однако время, необходимое для вычислений, возрастет. В выпадающем списке Effect Preset можно выбрать стандартные установки. Необходимость в эффекте Delay возникла с началом применения стереофонии. Сама природа слухового аппарата человека предполагает в большинстве ситуаций поступление в мозг двух звуковых сигналов, отличающихся временами прихода. Если источник звука находится «перед глазами»: на перпендикуляре к линии, проходящей через уши, то прямой  233 звук от источника достигает обоих ушей в одно и то же время. Во всех остальных случаях расстояния от источника до ушей различны, поэтому либо одно, либо другое ухо воспринимает звук первым. Delay применяется, прежде всего, в том случае, когда запись голоса или акустического музыкального инструмента, выполненную с помощью единственного микрофона, «встраивают» в стереофоническую композицию. Этот эффект служит основой технологии создания стереозаписей. Но можно применять Delay и для получения эффекта однократного повторения какихлибо звуков. Этот эффект реализуется с помощью устройств, способных осуществлять задержку акустического или электрического сигнала. Таким устройством чаще всего служит цифровая линия задержки, представляющая собой цепочку из элементарных ячеек – триггеров задержки. Принцип действия триггера задержки сводится к следующему: двоичный сигнал, поступивший в некоторый тактовый момент времени на его вход, появится на его выходе не мгновенно, а только в очередной тактовый момент. Общее время задержки в линии тем больше, чем больше триггеров задержки включено в цепочку, и тем меньше, чем меньше тактовый интервал (чем больше тактовая частота). В качестве цифровых линий задержки можно использовать запоминающие устройства. В звуковых редакторах Delay реализуется программным (математическим) путем за счет изменения относительной нумерации отсчетов исходного сигнала и его копии. Есть разновидности задержки, при которых формируются несколько задержанных на различное время копий сигнала. Обратимся к команде Effects › Delay and Echo › Delay, которая открывает диалоговое окно эффекта Delay (рисунок 7.19). Рисунок 7.19 – Диалоговое окно эффекта Delay 234 В группах Left Channel и Right Channel находятся элементы настройки задержки для каждого стереоканала. С помощью регулятора Delay Time или непосредственно в поле ввода, расположенном справа от него, вы можете задать время задержки (в миллисекундах). Аналогичные элементы интерфейса, под названием Mix, позволяют задавать в процентах уровень задержанного сигнала, добавляемого в исходный. Состояние флажка Invert определяет, будет ли подмешиваемый сигнал инвертирован по фазе. Традиционно для Adobe Audition в окне этого эффекта имеется список предварительных установок Effect Preset. Следующий и более сложный эффект – Echo. Основное отличие этого эффекта от простой задержки состоит в том, что задержанные копии сигнала подвергаются дополнительной обработке – изменяется их спектр. Звук, обработанный эффектом Echo, более натурален по сравнению со звуком, обработанным эффектом Delay. В природе эхо образуется в результате переотражения звуковых волн от препятствий (домов, стен помещения, гор и т. п.). Различные спектральные составляющие звука (как и любого другого волнового явления, например, света) по-разному отражаются от препятствий. Чем ниже частота (больше длина волны), тем легче волна преодолевает препятствия, огибая его. Высокочастотной волне, наоборот, очень сложно преодолеть любую, даже самую простую преграду. Такая волна не проходит сквозь препятствие, а отражается от него и частично поглощается, превращаясь в конечном счете, в тепловую энергию. Но нельзя упускать из вида и тот факт, что высокочастотные звуковые волны при распространении в воздухе затухают быстрее низкочастотных. Подводя итог этим рассуждениям, можно предположить, что эхо содержит смещенный во времени исходный сигнал, у которого будут ослаблены и низкие, и высокие частоты. Как именно они изменятся – зависит уже от конкретных условий распространения звука (расстояние до препятствия, его материал и т. п.). С помощью диалогового окна эффекта Echo (рисунок 7.20) можно смоделировать эти условия. Окно открывается командой Effects › Delay and Echo › Echo. В группах Left Channel и Right Channel находятся элементы настройки задержки для каждого стереоканала. Регулятор Delay задает время (в миллисекундах), на которое будет задержан сигнал. Регулятор Feedback задает уровень задержанного сигнала (в процентах относительно исходного сигнала). Регулятор Echo Level задает уровень, с которым эхо будет подмешиваться к исходному сигналу. Группа Successive Echo Equalization представляет собой эквалайзер, с помощью которого можно изменять спектр задержанного сигнала. При установленном флажке Lock Left/Right соответствующие регуляторы левого и правого каналов объединяются. 235 Рисунок 7.20 – Диалоговое окно эффекта Echo Если установить флажок Echo Bounce, то звучание эха будет акцентировано. Группа Effect Presets содержит список предустановок для различных видов эха. В основу звуковых эффектов Flanger и Phaser также положена задержка сигнала. Чем эти эффекты отличаются от Delay? В аналоговых устройствах эффекты реализуются при помощи гребенчатых фильтров, имеющих амплитудно-частотную характеристику (АЧХ) такого же вида. Гребенчатые фильтры могут строиться на линиях задержки. Характерная форма АЧХ создается за счет сдвига фазы при распространении сигнала в линии задержки и сложения реализаций задержанного сигнала. Меняя параметры гребенчатого фильтра, можно в значительной степени изменять первоначальный тембр звука. Гребенчатая АЧХ фильтра обусловлена тем, что для некоторых частот задержанные копии сигнала складываются в фазе и поэтому усиливаются, для других частот – в противофазе и поэтому взаимоуничтожаются. Периодическая структура АЧХ определяется периодическим характером составляющих аудиосигнала (синусоид). Delay имитирует эффект неодновременного восприятия мозгом человека звуковых сигналов, поступающих через уши. Эффект повторного звучания может быть вызван и распространением звука от источника к приемнику различными путями. И в том, и в другом случае время задержки остается постоянным. Если же какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться равной частоте переданного звука. Это не что иное, как проявление эффекта Доплера. Итак, реальные музыкальные звуки при распространении претерпевают не только расщепление на несколько волн с различными задержками, но и неодинаковое для различных спектральных составляющих изменение частот. 236 И Flanger, и Phaser имитируют (каждый по-своему) проявления взаимного перемещения упомянутых трех элементов: источника, приемника и отражателя звука. По сути дела, оба эффекта представляют собой сочетание задержки звукового сигнала с частотной или фазовой модуляцией. Разница между ними чисто количественная. Flanger отличается от Phaser тем, что для первого эффекта время задержки копии (или времена задержек копий) и изменение частот сигнала значительно большее, чем для второго. Упомянутые количественные отличия эффектов приводят и к отличиям качественным: во-первых, звуки, обработанные ими, приобретают различные акустические и музыкальные свойства, во-вторых, эффекты реализуются разными техническими средствами. Значения времен задержек, характерные для Flanger, существенно превышают период звукового колебания, поэтому для реализации эффекта используют многоразрядные и многоотводные цифровые линии задержки. С каждого из отводов снимается свой сигнал, который в свою очередь подвергается частотной модуляции. Для Phaser, наоборот, характерно очень маленькое время задержки. Оно столь мало, что оказывается сравнимым с периодом звукового колебания. При столь малых относительных сдвигах принято говорить уже не о задержке копий сигнала во времени, а о разности их фаз. Если эта разность фаз не остается постоянной, а изменяется по периодическому закону, то мы имеем дело с эффектом Phaser. Так что можно считать Phaser предельным случаем Flanger. Но если внимательно прочитать еще раз этот абзац, то можно увидеть, что Phaser – это не что иное, как фазовое вибрато. Диалоговое окно эффекта Flanger (рисунок 7.21) открывается командой Effects › Modulation › Flanger. С помощью ползункового регулятора Mix: Dry – Wet, в зависимости от режима, заданного в группе Mode), устанавливается соотношение смешиваемых сигналов исходного и обработанного звука. Регуляторы Initial Delay Time и Final Delay Time соответственно задают начальное и конечное запаздывание «плывущего» звука за один полупериод «плавания». Звуки левого и правого стереоканалов могут задерживаться по-разному. Ползунком регулятора Stereo Phasing задают разность фаз для стереоканалов. Регулятор Feedback определяет глубину обратной связи. В группе Mode можно задать различные комбинации трех режимов с помощью флажков:  Inverted – инвертирование обработанного сигнала;  Special EFX – микширование сигналов (специальный режим);  Sinusoidal – отставание обработанного сигнала от исходного по синусоидальному закону. Если этот режим не задан (флажок снят), то отставание будет изменяться от начального значения до конечного (и в обратную сторону) по линейному закону. Регулятор Modulation Rate задаются параметры обработанного сигнала – частота и общее количество таких циклов. 237 Рисунок 7.21 – Диалоговое окно эффекта Flanger Так же, имеется пополняемый список предварительных установок Effect Presets. Реверберация (Reverb) относится к наиболее интересным и популярным звуковым эффектам. Сущность реверберации состоит в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные временные интервалы. Этим реверберация напоминает Delay. Отличие заключается в том, что при реверберации число задержанных копий сигнала может быть значительно больше, чем при Delay. Теоретически число копий может быть бесконечным. Кроме того, при реверберации чем больше время запаздывания копии сигнала, тем меньше ее амплитуда (громкость). Эффект зависит от того, каковы временные промежутки между копиями сигнала и какова скорость уменьшения уровней их громкости. Если промежутки между копиями малы, то получается собственно эффект реверберации – возникает ощущение объемного гулкого помещения, звучание музыкальных инструментов становится сочным, объемным, с богатым тембровым составом, голоса певцов приобретают напевность, а присущие им недостатки становятся малозаметными. Если промежутки межу копиями велики (более 100 мс), то правильнее говорить не об эффекте реверберации, а об эффекте «эхо». Интервалы между соответствующими звуками при этом становятся различимыми. Звуки перестают сливаться, кажутся отражениями от удаленных преград. Пусть, например, первичный аудиосигнал, излученный акустической системой, представляет собой короткий импульс. Акустическая система 238 расположена на сцене зала. Первым ушей слушателя достигает прямой звук. Этот сигнал приходит к слушателю по кратчайшему пути. Поэтому интенсивность его больше, чем интенсивности других сигналов. Прямой сигнал несет информацию только о расположении источника звука справа или слева от слушателя. Несколько отстав от прямого сигнала, к слушателю приходят ранние (первичные) отражения. Эта составляющая звукового поля претерпевает одно-два отражения от ограждающих поверхностей (стен, пола, потолка). Взаимодействуя с ограждающими поверхностями, звуковая волна не только отражается от них, но и отдает им часть своей энергии (энергия расходуется на нагрев поверхностей). Поэтому интенсивность ранних отражений меньше (но ненамного) интенсивности прямого сигнала. Ранние отражения проявляются как ясно различимые эхо-сигналы. Временные промежутки между ними достаточно велики, т. к. велики разности длин путей, по которым сигналы доходят до слушателя. Например, волна может отразиться от боковой или от тыльной стены. Возможно, что часть волн, относящихся к ранним отражениям, испытают не одно, а несколько отражений. Ранние отражения содержат в себе информацию не только о месте расположения исполнителя, но и о размерах помещения. Именно ранние отражения вносят наибольший вклад в пространственное ощущение акустики зала. К ранним отражениям относят те копии первичного сигнала, которые отстают от прямого сигала не более чем на 60 мс. Вторичные и последующие (поздние) отражения – это звуковые волны, многократно отраженные от каждой из поверхностей. По мере увеличения числа переотражений интенсивность аудиосигнала заметно уменьшается. Кроме того, изменяется спектральный состав звуковых колебаний. Дело в том, что из-за различий в конфигурации отражающих поверхностей и в свойствах материалов покрытий разные спектральные составляющие аудиосигнала отражаются неодинаково. Какие-то из них поглощаются сильнее, поэтому затухают быстрее. По мере возрастания номеров вторичных отражений они рассеиваются, их число увеличивается. Постепенно они перестают восприниматься как отдельные звуки, сливаются в один сплошной постепенно затухающий отзвук. Это и есть собственно реверберация. Теоретически затухание звука длится бесконечно. На практике для того, чтобы можно было сравнивать между собой различные реверберационные процессы (а, главное, – реверберационные свойства помещений), введено понятие времени реверберации. Время реверберации – это время, за которое уровень реверберирующего сигнала уменьшается на 60 дБ. Основным элементом, реализующим эффект реверберации, является устройство, создающее эхо-сигнал. Интересна история развития таких устройств. Наряду с эхо-камерами для имитации реверберации использовали стальные пластины, точнее, довольно-таки большие по размеру листы. 239 Колебания в них вводили и снимали с помощью устройств, по конструкции и принципу действия похожих на электромагнитные головные телефоны. Реверберация здесь была не трехмерной, а плоской, сигнал имел характерный металлический призвук. В середине 60-х годов прошлого века для получения эффекта реверберации стали применять пружинные ревербераторы. С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, в ней возбуждаются механические колебания, которые с задержкой достигают второго конца пружины, связанного с датчиком. Эффект повторения звука обусловлен многократным отражением волн механических колебаний от концов пружины. Качество звука в пружинном ревербераторе чрезвычайно низкое. Пружина воспринимает любые колебания воздуха и пола, между акустической системой и пружиной существует практически неустранимая обратная связь, звук имеет ярко выраженную «металлическую» окраску, время реверберации не регулируется. На смену этим несовершенным устройствам пришли ревербераторы магнитофонные. Принцип формирования эхо-сигнала в магнитофонных ревербераторах состоит в том, что исходный сигнал записывается на ленту записывающей магнитной головкой, а через время, необходимое для перемещения данной точки ленты к воспроизводящей головке, считывается ею. Через цепь обратной связи уменьшенный по амплитуде задержанный сигнал вновь подается на запись, что и создает эффект многократного отражения звука с постепенным затуханием. Качество звука определяется параметрами магнитофона. Недостаток магнитофонного ревербератора заключается в том, что при приемлемых скоростях протяжки ленты удается получить только эффект эха. Для получения собственно реверберации требуется либо еще сильнее сблизить магнитные головки (чего не позволяет сделать их конструкция), либо значительно увеличить скорость движения ленты. С развитием цифровой техники и появлением интегральных микросхем, содержащих в одном корпусе сотни и тысячи цифровых элементов задержки, появилась возможность создавать высококачественные цифровые ревербераторы. В таких устройствах сигнал может быть задержан на любое время, необходимое как для получения реверберации, так и для получения эха. Ревербератор отличается от цифрового устройства, реализующего Delay, только тем, что содержит обратную связь (feedback), необходимую для формирования затухающих повторений сигнала. Такие ревербераторы широко используются сейчас музыкантами и звукорежиссерами. Цепь обратной связи отсылает часть сигнала с выхода обратно в линию задержки, тем самым получается повторяющееся эхо. Коэффициент обратной связи должен быть меньше единицы, иначе каждое новое эхо будет возрастать по уровню, а не затухать, может получиться эффект, подобный самовозбуждению акустической системы. 240 Диалоговое окно эффекта Reverb (рисунок 7.22) открывается командой Effects › Reverb › Reverb. Рисунок 7.22 – Диалоговое окно эффекта QuickVerb В панели Characteristics располагаются следующие ползунковые регуляторы и поля ввода:  Decay Time – время реверберации (в миллисекундах);  Pre-Delay Time – время нарастания реверберации (возникновения звука, отраженного от удаленных на различные расстоянии предметов);  Diffusion – время затухания высокочастотных составляющих спектра звука из-за их поглощения средой распространения и отражающими препятствиями;  Perception – характер реверберации: o Absorbent – размытый звук, отраженный от множества предметов; o Reflective – отраженный звук, больше похожий на эхо. В панели Output Level задаются параметры микширования исходного (Dry) и обработанного эффектом реверберации (Wet) сигналов. Установленный флажок Sum Left and Right Inputs позволяет объединять сигналы стереоканалов в один, а затем производить расчет реверберации и последующее микширование обработанного и исходного (стереофонического) сигналов. При этом расчет выполняется в два раза быстрее, но исходный стереообраз звука разрушается. В списке Effect Preset предусмотрен набор вариантов реверберации: имитация акустических свойств различных помещений, популярные алгоритмы искусственной реверберации. 241 Универсальная реверберация Full Reverb используется в Adobe Audition для того, чтобы в деталях моделировать акустическое пространство. Эффект обладает некоторыми уникальными возможностями:  реалистичное моделирование сигналов ранних отражений;  изменение размеров и акустических свойств имитируемого помещения;  моделирование любого материала отражающей поверхности;  изменение поглощающих свойств пространства внутри помещения;  коррекция частотного спектра сигнала реверберации с использованием трехполосного параметрического эквалайзера. Команда Effects › Reverb › Full Reverb открывает окно Full Reverb (рисунок 7.23). Рисунок 7.23 – Вкладка General Reverb диалогового окна Full Reverb 242 Сначала рассмотрим опции окна эффекта, общие для всех вкладок. В группе Output Level имеются следующие элементы управления, которые регулируют:  Dry – уровень необработанного сигнала;  Wet (reverb) – уровень сигнала, обработанного эффектом;  Wet (early reflections) – уровень ранних отражений. Установленный флажок Include Direct задает сдвиг фаз звуковых колебаний в левом и правом каналах в целях согласования направлений прихода ранних отражений сигнала с положением источников звука на стереопанораме. Установленный флажок Sum Left and Right Inputs задает объединение левого и правого каналов источника звука перед обработкой эффектом с целью сокращения времени вычислений. Стереообраз источника звука при этом разрушается. Список Effect Preset содержит готовые схемы эффекта. Нажав кнопку Save a new preset, вы откроете окно диалога, в котором следует указать имя нового пресета. Для удаления выделенного пресета из списка следует нажать кнопку Delete this preset. Рассмотрим вкладку Reverb Settings. В панели Reverberation располагаются следующие ползунковые регуляторы и поля ввода:  Decay Time – время реверберации (в миллисекундах);  Pre-Delay Time – время нарастания реверберации (возникновения звука, отраженного от удаленных на различные расстоянии предметов);  Diffusion – время затухания высокочастотных составляющих спектра звука из-за их поглощения средой распространения и отражающими препятствиями;  Perception – характер реверберации: o Absorbent – размытый звук, отраженный от множества предметов; o Reflective – отраженный звук, больше похожий на эхо. В панели Early Reflections располагаются следующие ползунковые регуляторы и поля ввода:  Room Size – объем помещения в кубических метрах;  Dimension – отношение ширины помещения к длине;  Left/Right Location – точка локализации источника звука на стереопанораме;  High Pass Cutoff – частота среза фильтра, пропускающего высокие частоты. Set Reverb Based on Room Size, если флажок установлен – автоматическое согласование общих параметров реверберации с параметрами ранних отражений, помещения и среды распространения. Вкладка Coloration окна Full Reverb представлена на рисунке 7.24. 243 Рисунок 7.24 – Вкладка Coloration диалогового окна Full Reverb График на вкладке Coloration – амплитудно-частотная характеристика (АЧХ) фильтра, через который пропускается сигнал реверберации. По горизонтальной оси отложены значения частоты, по вертикальной – значения АЧХ в децибелах. По сути дела, фильтр представляет собой трехполосный параметрический эквалайзер. Для редактирования формы графика вы можете использовать следующие элементы управления:  ползунковый горизонтальный регулятор 1 – частота среза фильтра, управляющего прохождением низкочастотных спектральных составляющих;  ползунковый горизонтальный регулятор 2 – центральная частота (частота резонанса) полосового фильтра; 244     ползунковый горизонтальный регулятор 3 – частота среза фильтра, управляющего прохождением высокочастотных спектральных составляющих; три вертикальных ползунковых регулятора, расположенных правее графика, – уровни усиления/ослабления сигнала каждым их трех фильтров параметрического эквалайзера; поле Q – добротность полосового фильтра. Чем больше эта величина, тем острее резонансный пик у полосового фильтра (тем уже его полоса пропускания); поле ms – время реверберации высокочастотных составляющих сигнала (чем меньше эта величина по сравнению с общим временем реверберации, тем быстрее в обработанном сигнале затухнут высокочастотные составляющие). ВОПРОСЫ К РАЗДЕЛУ 7 1. 2. 3. 4. 5. 6. 7. 8. 9. Основные аудиоредакторы и их различия. Чем отличаются редакторы Waveform и Multitrack? Управление масштабом отображения волновой формы. Анализ спектра сигнала. Эффект Chorus. Эффект Delay. Эффект Echo. Эффект Flanger. Эффект Reverb. 245