Розмір шрифта:
РОЗРОБКА ERP-ЗАСТОСУНКУ ДЛЯ ДІАРИЗАЦІЇ МОВЛЕННЄВИХ КОМАНД
Остання редакція: 2021-12-08
Анотація
Авторами розроблено консольний додаток для діаризації мовних сигналів на мові python. В основу додатка покладено попередньо створена загальна схема голосової біометрії GMM+i-vec+DNN. Точність діаризації для нашого додатку на вибірці 80 зразків 40-ка різних дикторів склала 93%. Щодо швидкості, то середня тривалість обробки голосу при навчанні системи склала 22 секунди (оброблювалося файл з вимовою тривалістю 20 секунд).
Ключові слова
діаризація; розпізнавання диктора
Посилання
1. Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. Москва: Изд-во "Радио и связь", 2004. - 164 с.
2. Keshet J., Bengio S. Automatic Speech and Speaker Recognition. Large Margin and Kernel Methods. Wiley, 2009, - 257 p.
3. Столбов М.Б., Кассу А.-Р.М. Цифровая обработка речевых сигналов.
Повний текст:
PDF