КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, 
Молодь в науці: дослідження, проблеми, перспективи (МН-2026)

Розмір шрифта: 
ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ АНАЛІЗУ ТА ПЕРЕДБАЧЕННЯ ФІШИНГОВИХ САЙТІВ МЕТОДАМИ МАШИННОГО НАВЧАННЯ
Данил Олександрович Литвиненко

Остання редакція: 2025-12-08

Анотація


Анотація

Робота присвячена створенню інформаційної технології передбачення фішингових сайтів методами машинного навчання для підвищення рівня кібербезпеки користувачів. Використано методи машинного навчання та аналізу даних у середовищі Kaggle з використанням Python. На основі датасету "Web Page Phishing Dataset" побудовано низку моделей, а саме: Logistic Regression, Decision Tree, Random Forest, Gradient Boosting Trees, XGBoost Model, LightGBM Model, ExtraTrees Model та K-Nearest Neighbors Model (KNN). Серед цих моделей обрано оптимальну за балансом між точністю передбачення та швидкістю ідентифікації. Розроблену технологію можна впровадити в браузерні розширення або антивірусне програмне забезпечення для автоматизованого моніторингу та захисту користувачів від фішингових загроз.

 

Abstract

This work is devoted to the creation of information technology for predicting phishing sites using machine learning methods to improve user cybersecurity. Machine learning and data analysis methods were used in the Kaggle environment using Python. Based on the “Web Page Phishing Dataset,” a number of models were built, namely: Logistic Regression, Decision Tree, Random Forest, Gradient Boosting Trees, XGBoost Model, LightGBM Model, ExtraTrees Model, and K-Nearest Neighbors Model (KNN). Among these models, the one with the optimal balance between prediction accuracy and identification speed was selected. The developed technology can be implemented in browser extensions or antivirus software for automated monitoring and protection of users from phishing threats.

 


Ключові слова


інформаційна технологія, фішинг, машинне навчання, кібербезпека, передбачення.

Посилання


  1. Гуржій. С.В.  Організаційно-технічний аспект протидії фішингу. Науковий журнал з проблем інформаційного права, правової інформатики, інформаційної і національної безпеки, інформації в інших галузях прав. 2023. № 3(46). DOI: https://doi.org/10.37750/2616-6798.2023.3(46).287251
  2. Наука про дані: машинне навчання та інтелектуальний аналіз даних: електронний навчальний посібник комбінованого (локального та мережевого) використання [Електронний ресурс] / В. Б. Мокін, М. В. Дратований – Вінниця: ВНТУ, 2024. – 258 с. – Режим доступу: https://docs.vntu.edu.ua/card.php?id=8163
  3. FERNANDO DANIEL. Web Page Phishing Dataset. 2024. [Електронний ресурс] – Режим доступу: https://www.kaggle.com/datasets/danielfernandon/web-page-phishing-dataset/data?select=web-page-phishing.csv
  4. Литвиненко Д. Web Phishing Analysis. 2025. [Електронний ресурс] – Режим доступу: https://www.kaggle.com/code/linean/web-phishing-analysis
  5. Alnemari S, Alshammari M. Detecting Phishing Domains Using Machine Learning. Applied Sciences. Applied Sciences. 2023. Vol. 13 (8). P. 4649. DOI: https://doi.org/10.3390/app13084649

Повний текст: PDF