Справочник Автор24
Статьи от экспертов
Информатика
Исследование статистических характеристик речевого сигнала при наличии шумов

Исследование статистических характеристик речевого сигнала при наличии шумов

Замечание 1

Исследование статистических характеристик речевого сигнала при наличии шумов — это оценка уровня искажений сигнала при тестировании алгоритмов кодирования речевого сигнала, исследовании разнообразных передающих систем.

Введение

Самым главным ресурсом в сетях передачи данных может считаться уровень пропускной способности каналов связи. Кроме возрастания наибольшей пропускной способности каналов связи и их количества может считаться очевидно, что просто необходимо оптимизировать работу уже имеющихся. К примеру, используя алгоритмы сжатия, но следует заметить, что для любого случая самым оптимальным алгоритмом (с позиций вычислительной сложности, коэффициента сжатия и тому подобное) может стать свой, оригинальный алгоритм.

Характерной чертой сжатия звука считается субъективность ее восприятия людьми. Это одновременно предоставляет возможность исключения незначительной информации из сигнала, но, при этом, может усложнить алгоритм сжатия.

Для достижения максимального коэффициента сжатия при незначительных субъективных потерях качества, следует учитывать основные законы его восприятия. Этой проблемой занимается психоакустика. Когда используются психоакустические свойства для сжатия, то традиционные методы оценки качества уже могут не подойти. Так, к примеру, соотношение сигнал-шум может стать фактически бесполезным, так как, сжатие выполняется без учета тех составляющих, которые не воспринимаются человеком. Это означает, что при оценке качества следует принимать во внимание характеристики слуховых аппаратов людей.

Исследование статистических характеристик речевого сигнала при наличии шумов

В общем случае речевым сигналом в телекоммуникационных системах является процесс, который выполняет функцию трансляции речевых сообщений. Такие процессы делятся на следующие категории:

акустические процессы,
механические процессы,
электрические процессы,
иные типы процессов.

Речевое сообщение, как правило, формируется в человеческом мозге, а далее оно преобразуется в сигналы нервной системы, которые управляют артикуляционными движениями речевых органов. В свою очередь такие движения призваны управлять выработкой речевых сигналов в тракте, образующем речь. Речеобразующий тракт включает в свой состав ларингальные, фарингальные, ротовые и носовые полости, объемы и упругость стенок которых могут изменяться во времени. Колебания конфигурации речеобразующего тракта в процессе формирования звуков речи должны воздействовать на движущуюся через тракт акустическую волну. Сформированные сигналы поступают в окружающее пространство в форме акустических сигналов, а затем акустические сигналы в тракте передачи телекоммуникационной системы должны быть преобразованы в электрические сигналы.

Далее сигналы могут быть подвержены разным модификациям, оставаясь при этом электрическими. В одном случае электрический сигнал подвергается усилению и непосредственно передается в электроакустический преобразователь, в другом случае после совокупности преобразований его формы, таких как, модуляция и демодуляция, квантование, кодирование, компандирование и тому подобное, в итоге также обычно преобразуются в акустический сигнал. Но этот сигнал может оставаться цифровым, к примеру, при осуществлении распознавания речи.

Акустические сигналы, воздействуя на барабанную перепонку уха, преобразуются в механические сигналы, а уже во внутреннем ухе преобразуются в сигналы нервной системы. Эти сигналы в центральной нервной системе подвергаются расшифровке, и в итоге восстанавливается изначальное сообщение. Часто это сообщение может иметь отличия от исходного, что может быть вызвано искажениями в системах связи.

На практике трансляция речевых сообщений по электрической связи осуществляется при помощи цифрового отображения, обработки и отправки по каналу связи речевого сигнала, представленного в форме электрических колебаний. В таком варианте речь является колебаниями сложного формата, зависящими от произносимых слов, тембра голоса, интонации, пола и возраста того, кто говорит. Под частотным речевым диапазоном понимается ширина полосы частот, которую занимает речевой сигнал.

Слуховой аппарат людей способен воспринимать звуки, частота которых расположена в границах от 20 до 22 000 Гц. Но, при этом, чувствительность уха человека может быть разной на разных частотах. Частотный диапазон речи человека расположен примерно в диапазоне от 100 до 8000 Гц. Наличие порога слышимости выступает как основа для формирования алгоритмов сжатия звука с потерями.

Помимо этого, для оптимального сжатия звука учитываются следующие свойства органов человеческого слуха:

частотное маскирование,
временное маскирование.

Частотное (слуховое) маскирование воздействует в том случае, когда нормально слышимый звук покрывается иным громким звуком, имеющим близкую частоту. На рисунке ниже в схематичном виде показаны маскирующий и маскируемый звуки.

Рисунок 1. Маскирующий и маскируемый звуки. Автор24 — интернет-биржа студенческих работ

Слышимый (маскирующий) звук способен приподнимать порог слышимости в своей окрестности (порог слышимости при маскировании). В итоге звук, изображенный пунктирной линией, может стать не слышимым, так как, он оказывается замаскированным более громким звуком. Данное свойство применяется при сжатии. Сигналы, которые соответствуют таким звукам можно просто удалить из общего массива данных, так как, они все равно не будут слышны.

Частотное маскирование может зависеть от частоты сигнала. Оно варьируется от 100 Гц на низких слышимых частотах до 4000 Гц на высоких частотах. То есть, область слышимых частот можно разделить на ряд критических полос, в границах которых снижается чувствительность уха человека.

Временное маскирование может наблюдаться, когда громкому звуку с частотой f по времени предшествует или идет за ним менее громкий звук близкой частоты (а также при одновременном звуке близкой частоты). Маскировка предшествующего звука может проявляться на интервале не более 10 мс, однако последующий звук может быть маскирован на интервале от 100 до 200 мс.

Дата написания статьи: 22.06.2022

Не хватило информации в статье?

Закажи работу по теме Исследование статистических характеристик речевого сигнала при наличии шумов

Оставляя свои контактные данные и нажимая «Найти эксперта», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.