Розмір шрифта:
Дослідження впливу аномальних значень на точність бустингових моделей прогнозування гетероскедастичних часових рядів
Остання редакція: 2026-06-20
Анотація
Досліджено задачу оцінювання впливу аномальних значень на точність прогнозування гетероскедастичних часових рядів бустинговими EGARCH-моделями з LSTM і без неї. Запропоновано підхід до локальної корекції аномального спостереження шляхом його заміни на сусіднє значення ряду перед навчанням моделей. На прикладі аналізу процесу поширення пилу Сахари в атмосферному повітрі за даними Української мережі громадського моніторингу якості повітря «Eco City» показано, що усунення одного екстремального значення дозволило підвищити коефіцієнт детермінації (R2) прогнозу з 0,97 до 0,99, що свідчить про високу чутливість моделі до аномальних спостережень та доцільність їх попереднього оброблення.
INVESTIGATION OF THE IMPACT OF ANOMALOUS VALUES ON THE ACCURACY OF BOOSTING EGARCH MODELS FOR FORECASTING HETEROSCEDASTIC TIME SERIES
The problem of assessing the impact of anomalous values on the forecasting accuracy of heteroscedastic time series using boosting EGARCH models with and without LSTM is investigated. An approach for the local correction of an anomalous observation by replacing it with a neighboring value in the series prior to model training is proposed. Using the analysis of the Sahara dust transport process in atmospheric air based on data from the Ukrainian public air quality monitoring network Eco City, it is shown that removing a single extreme value increased the coefficient of determination (R²) of the forecast from 0.97 to 0.99. This result indicates the high sensitivity of the studied models to anomalous observations and confirms the feasibility of their preliminary preprocessing.
INVESTIGATION OF THE IMPACT OF ANOMALOUS VALUES ON THE ACCURACY OF BOOSTING EGARCH MODELS FOR FORECASTING HETEROSCEDASTIC TIME SERIES
The problem of assessing the impact of anomalous values on the forecasting accuracy of heteroscedastic time series using boosting EGARCH models with and without LSTM is investigated. An approach for the local correction of an anomalous observation by replacing it with a neighboring value in the series prior to model training is proposed. Using the analysis of the Sahara dust transport process in atmospheric air based on data from the Ukrainian public air quality monitoring network Eco City, it is shown that removing a single extreme value increased the coefficient of determination (R²) of the forecast from 0.97 to 0.99. This result indicates the high sensitivity of the studied models to anomalous observations and confirms the feasibility of their preliminary preprocessing.
Ключові слова
прогнозування часового ряду; гетероскедастичний процес; аномальні значення; бустинг; громадський моніторинг якості атмосферного повітря; Eco City; time series forecasting; heteroscedastic process; anomalous values; boosting; public air quality monitoring
Посилання
Копняк В. Є., Мокін В. Б., Жуков С. О., Варчук І. В., Скринник Т. В., Метод бустингу гетероскедастичних моделей для прогнозування концентрацій пилу Сахари в атмосферному повітрі України, Наукові праці ВНТУ [Електронний ресурс]. Вип. 2, Лип 2024. Режим доступу: doi https://doi.org/10.31649/2307-5376-2024-2-28-38
«Eco City» Громадський моніторинг стану якості повітря, 2025 [Електронний ресурс] – Режим доступу до ресурсу: https://reborn.eco-city.org.ua/
Mokin Vitalii, Shmundiak Dmytro, Kopniak Volodymyr. Air Quality Monitoring from EcoCity, May 2024, Kaggle Dataset. URL: https://www.kaggle.com/datasets/vbmokin/air-quality-monitoring-from-ecocity
Наука про дані: машинне навчання та інтелектуальний аналіз даних : електронний навчальний посібник комбінованого (локального та мережевого) використання [Електронний ресурс] / В. Б. Мокін, М. В. Дратований – Вінниця : ВНТУ, 2024. – 258 с. – Режим доступу: https://docs.vntu.edu.ua/card.php?id=8163.
Системний аналіз стану атмосферного повітря регіону, з урахуванням впливу аномалій : монографія / Д. О. Шмундяк, В. Б. Мокін, Є. М. Крижановський. – Вінниця : ВНТУ, 2025 - 169 с.
Копняк В. Є. Мокін В. Б. Порівняння моделей LSTM та GRU для прогнозування залишків у бустинговій гетероскедастичній EGARCH-моделі. Міжнародна науково-практична інтернет-конференція «Молодь в науці: дослідження, проблеми, перспективи», 15-16 червня 2025 року (МН-2025). https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25752/21234
Копняк В. Ю., Мокін В. Б. Структурний аналіз процесу поширення пилу Сахари в атмосферному повітрі міста Вінниці. LV Всеукраїнська науково-технічна конференція підрозділів Вінницького національного технічного університету: Науково-технічна конференція факультету інтелектуальних інформаційних технологій та автоматизації, Вінниця, 24-27 березня 2026 року. https://conferences.vntu.edu.ua/index.php/all-fksa/all-fksa-2026/paper/view/28839/23511
«Eco City» Громадський моніторинг стану якості повітря, 2025 [Електронний ресурс] – Режим доступу до ресурсу: https://reborn.eco-city.org.ua/
Mokin Vitalii, Shmundiak Dmytro, Kopniak Volodymyr. Air Quality Monitoring from EcoCity, May 2024, Kaggle Dataset. URL: https://www.kaggle.com/datasets/vbmokin/air-quality-monitoring-from-ecocity
Наука про дані: машинне навчання та інтелектуальний аналіз даних : електронний навчальний посібник комбінованого (локального та мережевого) використання [Електронний ресурс] / В. Б. Мокін, М. В. Дратований – Вінниця : ВНТУ, 2024. – 258 с. – Режим доступу: https://docs.vntu.edu.ua/card.php?id=8163.
Системний аналіз стану атмосферного повітря регіону, з урахуванням впливу аномалій : монографія / Д. О. Шмундяк, В. Б. Мокін, Є. М. Крижановський. – Вінниця : ВНТУ, 2025 - 169 с.
Копняк В. Є. Мокін В. Б. Порівняння моделей LSTM та GRU для прогнозування залишків у бустинговій гетероскедастичній EGARCH-моделі. Міжнародна науково-практична інтернет-конференція «Молодь в науці: дослідження, проблеми, перспективи», 15-16 червня 2025 року (МН-2025). https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25752/21234
Копняк В. Ю., Мокін В. Б. Структурний аналіз процесу поширення пилу Сахари в атмосферному повітрі міста Вінниці. LV Всеукраїнська науково-технічна конференція підрозділів Вінницького національного технічного університету: Науково-технічна конференція факультету інтелектуальних інформаційних технологій та автоматизації, Вінниця, 24-27 березня 2026 року. https://conferences.vntu.edu.ua/index.php/all-fksa/all-fksa-2026/paper/view/28839/23511
Повний текст:
PDF