КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, 
Молодь в науці: дослідження, проблеми, перспективи (МН-2026)

Розмір шрифта: 
ПОРІВНЯЛЬНИЙ АНАЛІЗ ІМОВІРНІСНИХ МОДЕЛЕЙ У ЗАДАЧАХ КЛАСИФІКАЦІЇ ТОНАЛЬНОСТІ
Дмитро Сергійович Трухін, Сергій Олександрович Жуков

Остання редакція: 2026-05-15

Анотація


Роботу присвячено порівняльному дослідженню двох варіантів наївного Байєсівського класифікатора — мультиноміальної (MultinomialNB) та бернулліївської (BernoulliNB) моделей — у задачі автоматичної класифікації тональності текстових відгуків покупців. Реалізовано повний ML-пайплайн на датасеті Amazon Reviews: попередня обробка тексту (токенізація, лемматизація, видалення стоп-слів), TF-IDF та бінарна векторизація з біграмами, підбір параметра згладжування Лапласа методом GridSearchCV. Проведено порівняльний аналіз моделей за метриками Accuracy та F1-score, побудовано матриці помилок та визначено найбільш інформативні слова для кожного класу тональності

Ключові слова


аналіз тональності тексту, наївний Байєсівський класифікатор, MultinomialNB, BernoulliNB, TF-IDF, обробка природної мови, Amazon Reviews, Python, Scikit-learn.

Посилання


1. Amazon Reviews Dataset. Kaggle, 2021. URL: https://www.kaggle.com/datasets/kritanjalijain/amazon-reviews

2. Bird S., Klein E., Loper E. Natural Language Processing with Python. O'Reilly Media, 2009. URL: https://www.nltk.org/book/

3. Pedregosa F. та ін. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 2011. Vol. 12. P. 2825–2830

4. McCallum A., Nigam K. A Comparison of Event Models for Naive Bayes Text Classification. AAAI-98 Workshop on Learning for Text Categorization. 1998. P. 41–48

5. Концевой А., Бісікало О. Моделі глибокого навчання для вирішення задачі класифікації текстової інформації. Інформаційні технології та комп'ютерна інженерія. 2022. Т. 55, № 3. С. 13–20

Повний текст: PDF