Розмір шрифта:
РОЗРОБКА МЕТОДУ РОЗПІЗНАВАННЯ УКРАЇНСЬКОГО МОВЛЕННЯ МЕДИЧНОГО СПРЯМУВАННЯ З ПЕРЕТВОРЕННЯМ АУДІОЗАПИСІВ У ТЕКСТ
Остання редакція: 2023-12-13
Анотація
У роботі здійснено детальний аналіз методів розпізнавання українського медичного мовлення та перетворення аудіозаписів у текст. Дослідження охоплює визначення ключових понять, впливаючих на процес розпізнавання, та розробку технічного завдання для створення нового програмного засобу. Представлено архітектуру програмного забезпечення, включаючи графічний інтерфейс та модулі обробки мовлення, з використанням Python та сучасних технологій. Розкрито методику автоматизації збору датасету, що включає понад 2000 унікальних аудіозаписів, та описано високу точність розпізнавання медичних текстів за допомогою реалізованої системи з використанням моделі Whisper та техніки LoRA. Ефективність системи підтверджено через експериментальну апробацію та використання метрики WER.
Ключові слова
розпізнавання українського медичного мовлення; перетворення аудіозапису у текст; обробка природної мови; розробка програмного забезпечення; автоматизація збору датасету; LoRA; Whisper; WER
Повний текст:
PDF