Мел-спектральные коэффициенты

На данный момент в теории восприятия акустического сигнала человеком выделяют следующие четыре основных психоакустических принципа: абсолютный порог слышимости, критические диапазоны частот, частотное и временное маскирование [27].

Абсолютный порог слышимости определяется как количество энергии в одном тоне, необходимое для того чтобы звук был услышан в абсолютной тишине. Зависимость порога слышимости от частоты была определена экспериментально на основании серии тестов |57| и показана на рис. 2.5. Порог слышимости в тишине хорошо аппроксимируется следующей функцией:

где / — частота (Гц).

Частотное маскирование заключается в том, что человеческий слух не воспринимает акустический сигнал при наличии близко расположенного (по частоте) сигнала большей мощности — маскирующего сигнала. В зависимости от типа маскирующего сигнала различают тон- маскирование и шум-маскирование. В первом случае тональный сигнал (тон), расположенный в центре критического диапазона, маскирует шум вне границ критической полосы частот; в результате спектр шума оказывается ниже порога, определяемого интенсивностью тонального сигнала. Во втором случае роли маскирующего и маскируемого сигналов меняются местами.

Кроме эффекта частотного маскирования существует также эффект временного маскирования, заключающийся в том, что человеческий слух не воспринимает сигналы с низкой интенсивностью, как за некоторое

Зависимость порога слышимости от частоты

Рис. 2.5. Зависимость порога слышимости от частоты

время перед, так и после сигналов с большой интенсивностью. Длительность этого эффекта составляет около 5 мс перед сигналом большой интенсивности. После сигнала с большой интенсивностью этот интервал изменяется от 50 до 300 мс в зависимости от уровня и длительности маскирующего сигнала.

Критические диапазоны частот связаны с процессом выполнения спектрального анализа человеческим ухом. В ряде исследований [57] было показано, что «аналого-цифровое преобразование» звука происходит во внутреннем ухе вдоль плоскости мембраны. Различные области в улитке, каждая из которых содержит нейтральные рецепторы, настроены на различные диапазоны частот. Эмпирические исследования позволили создать современное представление о критических диапазонах, каждый из которых соответствует своей области в улитке. С экспериментальной точки зрения критическая полоса частот может быть определена как полоса частот, на которой субъективно можно выделить резкие изменения в звуковом сигнале. Воспринимаемая громкость узкополосного источника звукового сигнала при постоянном уровне звукового давления остается постоянной даже в том случае, если полоса частот будет расширена до критической, после чего громкость начнет усиливаться. Порог обнаружения узко полосного источника звукового сигнала между двумя маскирующими тонами остается постоянным до тех пор, пока область частотного разделения между двумя тонами будет лежать в пределах критической полосы частот. Для среднего слушателя критическая полоса BWe может быть аппроксимирована следующим выражением:

Данная функция является непрерывной, однако на практике удобно представлять ухо как дискретный набор полосовых фильтров. Расстояние в одну критическую полосу представляется как «один барк». Для того чтобы преобразовать частоты из шкалы Герц в шкалу Барк z(f ), как правило, используется функция

Наиболее часто используемой для дискретного набора фильтров является мел-шкала m(f), являющаяся аппроксимацией функции *(/):

В табл. 2.1 приведены значения частот 20 критических диапазонов для барк- и мел-спектральных шкал.

Основная идея мел-спектрального преобразования состоит в моделировании особенностей человеческого слуха, описанных как критические полосы [27|. Для вычисления мел-спектральных коэффициентов по сегменту речевого сигнала с помощью преобразования Фурье вычисляется спектр сигнала Si, г — 0,1,..., [у]. Затем из этого спектра вычисляется мел-спектр но следующей формуле (см. рис. 2.6):

где rriji — амплитудно-частотная характеристика j-го фильтра, выражается через величины a,j — начало j-й критической полоски (см. табл. 2.1) следующим образом:

Схема фильтров, используемых для вычисления мел-спектров

Рис. 2.6. Схема фильтров, используемых для вычисления мел-спектров

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >