Остання редакція: 2026-01-21
Анотація
Робота присвячена проблемі автоматизованого виявлення шахрайських (фішингових) веб-сайтів. Розроблено програмний модуль мовою Python, який здійснює аналіз лексичних характеристик URL-адрес для класифікації посилань на безпечні та шкідливі. Як основний алгоритм класифікації обрано метод "Випадкового лісу" (Random Forest). Проведено навчання моделі на відкритих наборах даних та оцінено її ефективність. Результати дослідження показали, що запропонований підхід дозволяє виявляти фішингові атаки з високою точністю в режимі реального часу, не покладаючись виключно на "чорні списки".
Ключові слова
Посилання
1.James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning: with Applications in R. New York : Springer, 2021. URL: https://www.statlearning.com/ .
2.User Guide: 1.10. Decision Trees & Random Forests [Electronic resource] / Scikit-learn Developers. 2024. URL: https://scikit-learn.org/stable/modules/tree.html .
3.Saha I., Sarma D., Chakma R. J. Phishing Attacks Detection using Machine Learning Approach. arXiv preprint. 2020. arXiv:2009.11116. URL: https://arxiv.org/pdf/2009.11116 .
4.Гнатюк С. О., Кіндзерський В. В. Сучасні методи виявлення фішингових атак. ResearchGate. 2021. URL: https://www.researchgate.net/publication/338685858_MODERN_METHODS_OF_PHISHING_ATTACKS_DETECTION .