КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, Молодь в науці: дослідження, проблеми, перспективи (МН-2024)

Розмір шрифта: 
РОЗРОБКА МЕТОДУ РОЗПІЗНАВАННЯ УКРАЇНСЬКОГО МОВЛЕННЯ МЕДИЧНОГО СПРЯМУВАННЯ З ПЕРЕТВОРЕННЯМ АУДІОЗАПИСІВ У ТЕКСТ
Олег Володимирович Бісікало, Петро Олександрович Петрук

Остання редакція: 2023-12-13

Анотація


У роботі здійснено детальний аналіз методів розпізнавання українського медичного мовлення та перетворення аудіозаписів у текст. Дослідження охоплює визначення ключових понять, впливаючих на процес розпізнавання, та розробку технічного завдання для створення нового програмного засобу. Представлено архітектуру програмного забезпечення, включаючи графічний інтерфейс та модулі обробки мовлення, з використанням Python та сучасних технологій. Розкрито методику автоматизації збору датасету, що включає понад 2000 унікальних аудіозаписів, та описано високу точність розпізнавання медичних текстів за допомогою реалізованої системи з використанням моделі Whisper та техніки LoRA. Ефективність системи підтверджено через експериментальну апробацію та використання метрики WER.

Ключові слова


розпізнавання українського медичного мовлення; перетворення аудіозапису у текст; обробка природної мови; розробка програмного забезпечення; автоматизація збору датасету; LoRA; Whisper; WER

Повний текст: PDF