КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, Молодь в науці: дослідження, проблеми, перспективи (МН-2022)

Розмір шрифта: 
РОЗРОБКА ERP-ЗАСТОСУНКУ ДЛЯ ДІАРИЗАЦІЇ МОВЛЕННЄВИХ КОМАНД
Артем Володимирович Матіящук, Юлія Ярославівна Таранюк

Остання редакція: 2021-12-08

Анотація


Авторами розроблено консольний додаток для діаризації мовних сигналів на мові python. В основу додатка покладено попередньо створена загальна схема голосової біометрії GMM+i-vec+DNN. Точність діаризації для нашого додатку на вибірці 80 зразків 40-ка різних дикторів склала 93%. Щодо швидкості, то середня тривалість обробки голосу при навчанні системи склала 22 секунди (оброблювалося файл з вимовою тривалістю 20 секунд).

Ключові слова


діаризація; розпізнавання диктора

Посилання


1. Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. Москва: Изд-во "Радио и связь", 2004. - 164 с.


2. Keshet J., Bengio S. Automatic Speech and Speaker Recognition. Large Margin and Kernel Methods. Wiley, 2009, - 257 p.


3. Столбов М.Б., Кассу А.-Р.М. Цифровая обработка речевых сигналов.


Повний текст: PDF