Розмір шрифта:
ВИКОРИСТАННЯ МАШИННОГО НАВЧАННЯ ДЛЯ ПРОГНОЗУВАННЯ ЯКОСТІ АТМОСФЕРНОГО ПОВІТРЯ МІСТА ВІННИЦІ
Остання редакція: 2026-05-11
Анотація
Анотація
Дану роботу присвячено розробці інтелектуальної системи прогнозування концентрації дрібнодисперсного пилу PM2.5 атмосферного повітря міста Вінниці з використанням ансамблевих методів машинного навчання. В рамках дослідження сформовано автоматизований ETL-пайплайн для збору та передобробки даних, здійснено розвідувальний аналіз часових рядів, побудовано та навчено ансамбль моделей градієнтного бустингу (LightGBM, XGBoost, CatBoost) із байєсівською оптимізацією гіперпараметрів. Найкраща модель LightGBM досягла коефіцієнта детермінації R² = 0.90 на горизонті t+1 та R² = 0.45 на горизонті t+24, що підтверджує ефективність запропонованого підходу.
APPLICATION OF MACHINE LEARNING TO PREDICT AIR QUALITY IN THE CITY OF VINNYTSIA
Abstract
This paper presents an intelligent system for forecasting PM2.5 fine particulate matter concentration in the atmospheric air of Vinnytsia city using ensemble machine learning methods. The study encompasses the development of an automated ETL pipeline for data collection and preprocessing, exploratory time series analysis, and training of a gradient boosting ensemble (LightGBM, XGBoost, CatBoost) with Bayesian hyperparameter optimization. The best-performing LightGBM model achieved R² = 0.90 at the t+1 forecast horizon and R² = 0.45 at t+24, confirming the effectiveness of the proposed approach.
Дану роботу присвячено розробці інтелектуальної системи прогнозування концентрації дрібнодисперсного пилу PM2.5 атмосферного повітря міста Вінниці з використанням ансамблевих методів машинного навчання. В рамках дослідження сформовано автоматизований ETL-пайплайн для збору та передобробки даних, здійснено розвідувальний аналіз часових рядів, побудовано та навчено ансамбль моделей градієнтного бустингу (LightGBM, XGBoost, CatBoost) із байєсівською оптимізацією гіперпараметрів. Найкраща модель LightGBM досягла коефіцієнта детермінації R² = 0.90 на горизонті t+1 та R² = 0.45 на горизонті t+24, що підтверджує ефективність запропонованого підходу.
APPLICATION OF MACHINE LEARNING TO PREDICT AIR QUALITY IN THE CITY OF VINNYTSIA
Abstract
This paper presents an intelligent system for forecasting PM2.5 fine particulate matter concentration in the atmospheric air of Vinnytsia city using ensemble machine learning methods. The study encompasses the development of an automated ETL pipeline for data collection and preprocessing, exploratory time series analysis, and training of a gradient boosting ensemble (LightGBM, XGBoost, CatBoost) with Bayesian hyperparameter optimization. The best-performing LightGBM model achieved R² = 0.90 at the t+1 forecast horizon and R² = 0.45 at t+24, confirming the effectiveness of the proposed approach.
Ключові слова
машинне навчання; PM2.5; градієнтний бустинг; передобробка даних; часові ряди; прогнозування якості повітря
Посилання
1. Шмундяк Д. О., Мокін В. Б., Крижановський Є. М. Системний аналіз стану атмосферного повітря регіону, з урахуванням впливу аномалій : монографія. Вінниця : ВНТУ, 2025. 169 с.
2. Ахмадіанфар І. та ін. Towards intelligent air quality forecasting using integrated machine learning framework with variational mode decomposition and catboost feature selection. Scientific Reports. 2026. DOI: 10.1038/s41598-025-33785-y.
3. Мокін В. Б., Дратований М. В. Наука про дані: машинне навчання та інтелектуальний аналіз даних. Навчальний посібник. Вінниця : ВНТУ, 2024. С. 89–128.
4. Джеймс Г., Віттен Д., Хасті Т., Тібшірані Р.
Деревоподібні методи. An Introduction to Statistical Learning. Springer, Cham, 2023. P. 331–342. DOI: 10.1007/978-3-031-38747-0_8.
5. Сібінді Р., Мвангі Р. В., Вайтіту А. Г. A boosting ensemble learning based hybrid light gradient boosting machine and extreme gradient boosting model for predicting house prices. Engineering Reports. 2023. Vol. 5, Iss. 4. DOI: 10.1002/eng2.12599.
2. Ахмадіанфар І. та ін. Towards intelligent air quality forecasting using integrated machine learning framework with variational mode decomposition and catboost feature selection. Scientific Reports. 2026. DOI: 10.1038/s41598-025-33785-y.
3. Мокін В. Б., Дратований М. В. Наука про дані: машинне навчання та інтелектуальний аналіз даних. Навчальний посібник. Вінниця : ВНТУ, 2024. С. 89–128.
4. Джеймс Г., Віттен Д., Хасті Т., Тібшірані Р.
Деревоподібні методи. An Introduction to Statistical Learning. Springer, Cham, 2023. P. 331–342. DOI: 10.1007/978-3-031-38747-0_8.
5. Сібінді Р., Мвангі Р. В., Вайтіту А. Г. A boosting ensemble learning based hybrid light gradient boosting machine and extreme gradient boosting model for predicting house prices. Engineering Reports. 2023. Vol. 5, Iss. 4. DOI: 10.1002/eng2.12599.
Повний текст:
PDF