Детектор голосовой активности в задаче определения типа акустического шума
Аннотация
Исследуется возможность повышения точности автоматической классификации акустических шумов, находящихся в аддитивной смеси с речевыми сигналами, за счёт применения детектора голосовой активности. Рассматриваются классификаторы акустических шумов на основе моделей гауссовых смесей и метода опорных векторов. В обоих случаях в качестве признаков речевых сигналов используются мел-частотные кепстральные коэффициенты. Для проведения исследования реализовано два детектора голосовой активности. Первый основан на сравнении логарифма энергии сигнала в окне с порогом. Он выступает в качестве идеализированного детектора, так как в рамках исследования при проведении разметки сигналов использует незашумленный сигнал, недоступный в большинстве реальных задач. Второй основан на применении мел-частотных кепстральных коэффициентов и меры спектральной плоскостности в качестве признаков входного сигнала и моделей гауссовых смесей в качестве классификатора.
На стадии обучения классификаторов рассматривается три сценария: отсутствие предобработки, выделение неречевых фрагментов с использованием порогового детектора голосовой активности, выделение неречевых фрагментов с использованием детектора голосовой активности на основе моделей гауссовых смесей. Аналогичные сценарии осуществляются и на стадии тестирования. Приводятся результаты сравнения работы двух классификаторов типа шума для предложенных сценариев. Демонстрируется возможность повышения точности классификации шумов за счёт детектирования голосовой активности.