Остання редакція: 2024-12-08
Анотація
Періодичні часові ряди зустрічаються в багатьох аспектах нашого життя. Прикладами періодичних часових рядів є показники атмосферного повітря, показники фінансових ринків, метеорологічні параметри, тощо. Через це аналіз та прогнозування періодичних часових рядів є розповсюдженим та досить цікавим науковим напрямком. Одними з основних проблем при моделюванні періодичних часових рядів є визначення параметрів сезонності цього ряду, а також ідентифікація та усунення аномальних значень, які можуть суттєво впливати на точність прогнозування. У даній роботі проведено порівняний аналіз розроблених моделей та підходів прогнозування показнику стану атмосферного повітря за реальними даними мережі громадського моніторингу якості атмосферного повітря EcoCity. Наведено опис методу ідентифікації параметрів сезонності часового ряду, що базується на декомпозиції ряду. Наведено підхід пошуку локальних у часі аномалій в часовому ряду за виділення окремих півхвиль цього ряду. Результати роботи описаних моделей застосовано для прогнозування показника пилу PM2.5 однієї з станцій моніторингу якості повітря у Вінницькій області. Для автоматизації процесу прогнозування застосовувалась мова програмування Python, а сам програмний код реалізовано у системі Kaggle – веб-платформи від компанії Google для інженерів машинного навчання. Для прогнозування використовувалась модель для роботи з часовими рядами Prophet. Було наведено порівняльну таблицю точності прогнозу моделі Prophet з налаштуваннями за замовчуванням та з різними комбінаціями наборів аномальних значень та налаштувань сезонності. Дослідження та аналіз показав, що застосування як комбінації, так і окремо кожної розробленої моделі дозволяє зменшити помилку прогнозу для показника якості атмосферного повітря. У порівнянні з точністю роботи моделі Prophet з параметрами за замовчуванням, для найкращого з варіантів вдалось зменшити значення помилки за показником MAE на 30%, а за показником RMSE – на 21%. Це продемонструвало, що дані методи є ефективними для аналізу та прогнозування часових рядів, в тому числі безпосередньо часових рядів показників стану атмосферного повітря.
Ключові слова
Посилання
Shumway, Robert & Stoffer, David. (2011). Time Series Analysis and Its Applications With R Examples. 10.1007/978-1-4419-7865-3.
Terence C. Mills, Chapter 3 - ARMA Models for Stationary Time Series, Editor(s): Terence C. Mills, Applied Time Series Analysis, Academic Press, 2019, Pages 31-56, ISBN 9780128131176, https://doi.org/10.1016/B978-0-12-813117-6.00003-X.
Dr. Shikha Gaur. “Global forecasting of COVID-19 USING ARIMA BASED FB-PROPHET”. International Journal of Engineering Applied Sciences and Technology, 2020 Vol. 5, Issue 2, ISSN No. 2455-2143, Pages 463-467.
Sean J Taylor, Benjamin Letham, Forecasting at scale, PeerJ Preprints, 5, 2017, https://doi.org/10.7287/peerj.preprints.3190v2
Д. О. Шмундяк і В. Б. Мокін, «Метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду на основі адаптивної декомпозиції», Вісник ВПІ, вип. 6, с. 46–56, Груд. 2023.
Dmytro Shmundiak and Vitalii Mokin, “Adaptive decomposition for harmonics and anomalies” Kaggle Notebook. [Electronic resource]. Available: https://www.kaggle.com/code/dimashmundiak/adaptive-decomposition-for-harmonics-and-anomalies. Accessed:05.10.2024.
Д. О. Шмундяк і В. Є. Копняк, «Метод ідентифікації локальних аномалій значень показників стану довкілля з використанням декомпозиції на півхвилі», Вісник ВПІ, вип. 1, с. 88–100, Лют. 2024.
Omar, Salima & Ngadi, Md & Jebur, Hamid & Benqdara, Salima. (2013). Machine Learning Techniques for Anomaly Detection: An Overview. International Journal of Computer Applications. 79. 10.5120/13715-1478.
Markus M. Breunig, Hans-Peter Kriegel, Raymond T. Ng, and Jörg Sander. 2000. LOF: identifying density-based local outliers. SIGMOD Rec. 29, 2 (June 2000), 93–104. https://doi.org/10.1145/335191.335388
Sklearn. API Reference – Available: https://scikit-learn.org/stable/modules/classes.html. Accessed: 05.10.2024