УДК 534. 782. 001:621. 39
А. Н. Продеус, канд. техн. наук, Л. Б. Дронжевская, В. А. Климков,
Д. А. Шагитова
Моделирование алгоритмов формантно-модуляционного метода оценивания разборчивости речи
Произведены аналитические и экспериментальные исследования алгоритмов формантно-модуляционного метода оценивания разборчивости речи.
Analytical and experimental researches of algorithms of a formant-modulation method of speech intelligibility estimation are made.
Ключевые слова: алгоритм, оценивание разборчивости речи, формантно-модуляционный метод.
Введение
Предложенный в работах [1, 2] новый инструментальный метод оценивания разборчивости речи был назван «формантно-модуляционным», поскольку предполагалось, что он объединит лучшие качества формантного [3] и модуляционного [4, 5] методов. Так, от формантного метода была сохранена идея вычисления вероятности правильного понимания элементов речи (фонем, слогов, слов, фраз), поскольку вероятностный подход облегчает сопоставление результатов инструментального и субъективного анализа. А от модуляционного метода заимствована идея применения модулированного тестового сигнала, что позволяет учесть влияние как шумовой, так и реверберационной помехи, на разборчивость речи. Идея такого объединения методов представляется весьма конструктивной, поскольку позволяет справиться с большим недостатком формантного метода – трудностью учета влияния реверберационной помехи на разборчивость речи.
К сожалению, в отечественной литературе уделено незаслуженно малое внимание тому изящному способу, с помощью которого в модуляционном методе учитывают влияние реверберационной помехи. А в зарубежных работах нам не удалось найти сведений о погрешности соответствующих измерений. Поэтому одна из целей данной работы состоит в восполнении указанного пробела.
Другой целью работы является экспериментальная проверка правильности высказанного в работах [1, 2] предположения о возможности объединения лучших качеств формантного и модуляционного методов.
1. Формантно-модуляционный метод
При акустической экспертизе помещения с использованием инструментальных (объективных) методов оценивания разборчивости речи, в определенной точке помещения (местоположение диктора) излучают тестовый сигнал EMBED Equation. 3 , а в иной точке помещения (местоположение аудитора) принимают сигнал EMBED Equation. 3 , который затем подвергают специальной обработке, вычисляя один или несколько числовых параметров, характеризующих разборчивость речи в данном помещении [3-6].
В помещении с импульсной характеристикой (ИХ) EMBED Equation. 3 , характеризующей реверберацию, при наличии мешающего шума EMBED Equation. 3 , в точке приема наблюдается сигнал EMBED Equation. 3 :
EMBED Equation. 3 .
(1)
При использовании формантно-модуляционного метода [1, 2], как и в формантном методе [3], вычисляют артикуляционную разборчивость EMBED Equation. 3 :
EMBED Equation. 3 . (2)
где EMBED Equation. 3 - вероятность пребывания формант в EMBED Equation. 3 -той полосе частот; EMBED Equation. 3 - коэффициент восприятия речи; EMBED Equation. 3 - эффективный уровень ощущения речевого сигнала в EMBED Equation. 3 -той полосе частот EMBED Equation. 3 .
Отличие в том, что если в форматном методе используют тестовый сигнал EMBED Equation. 3 в виде стационарного случайного процесса (ССП), спектр мощности которого подобен долговременному спектру речи, а затем оценивают EMBED Equation. 3 в соответствии с соотношением:
EMBED Equation. 3 , (3)
где EMBED Equation. 3 - парциальное отношение сигнал-шум, EMBED Equation. 3 и EMBED Equation. 3 - соответственно дисперсии стационарных сигнала и шума в EMBED Equation. 3 -той полосе частот, в формантно-модуляционном методе для оценивания EMBED Equation. 3 предлагается использовать иной способ, применяющийся в модуляционном методе и позволяющий учесть наличие реверберационной помехи [4, 5].
Согласно этому способу, используют тестовый сигнал EMBED Equation. 3 в виде нестационарного случайного процесса (НСП), дисперсия которого EMBED Equation. 3 модулирована по гармоническому закону с частотой модуляции EMBED Equation. 3 :
EMBED Equation. 3 , (4)
EMBED Equation. 3 . (5)
EMBED Equation. 3 , (6)
где EMBED Equation. 3 - ССП с дисперсией EMBED Equation. 3 и со спектром мощности, повторяющим форму долговременного спектра речи; EMBED Equation. 3 - символ математического ожидания.