Остання редакція: 2025-04-25
Анотація
Дослідження присвячено задачі автоматичного визначення авторства україномовного тексту на основі методів машинного навчання. Запропоновано підхід, що передбачає формалізацію синтаксичних ознак, отриманих в результаті аналізу речень. Сформовано набір із 11 структурних характеристик, які дозволяють кількісно описати стиль автора на рівні синтаксису. Для розв’язання задачі атрибуції використано багатошаровий перцептрон, навчання якого здійснюється на основі витягнутих ознак. Експериментальні результати, отримані на корпусі творів трьох українських авторів, підтверджують ефективність запропонованого підходу та демонструють високу точність класифікації за умови належної попередньої обробки даних.
Ключові слова
Посилання
1. Бісікало О. В., Голуб С.В., Стовбчатий, М.М. «Застосування методів машинного навчання для визначення авторства україномовного тексту, » в Матеріали конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2020)», Вінниця, 2020. [Електронний ресурс]. Режим доступу: https://conferences.vntu.edu.ua/index.php/mn/mn2020/paper/view/8567. Дата звернення: Груд. 2019. – 6 с.
2. Могир М. С. Визначення автора тексту з використанням глибокого навчання : магістерська дис. – Київ : НТУУ "КПІ ім. Ігоря Сікорського", 2020. – [Електронний ресурс]. – Режим доступу: https://ela.kpi.ua/items/a3314c2a-f3ad-4d42-b677-4a904ddbe149
3. Зеленько Ю., Парамонов А. Програмний засіб ідентифікації автора тексту та виявлення емоційного контексту // Молодий вчений. – 2019. – №11(75). – С. 29–33.
4. Hu Z. та ін. DeepStyle: User Style Embedding for Authorship Attribution of Short Texts. – arXiv preprint arXiv:2103.11798, 2021. – [Електронний ресурс]. – Режим доступу: https://arxiv.org/abs/2103.11798
5. Scikit-learn: Machine Learning in Python. – [Електронний ресурс]. – Режим доступу: https://scikit-learn.org
6. Шкура Я. О. Нейромережева комп’ютерна система розпізнавання авторства тексту : бакалавр. проєкт / Я. О. Шкура ; Національний технічний університет України "КПІ ім. Ігоря Сікорського". – Київ, 2023. – [Електронний ресурс]. – Режим доступу: https://ela.kpi.ua/items/0ae61f78-4aa6-4829-b007-679cd4b9fd75
7. Подшиваленко Б. О. Методи машинного навчання розв’язання задачі ідентифікації текстів : кваліфікаційна робота. – Харків : ХНУРЕ, 2021. – [Електронний ресурс]. – Режим доступу: https://openarchive.nure.ua/entities/publication/4632bfe1-9b18-4f0d-9b95-0f5934b50f2e.