КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, КУСС-2022

Розмір шрифта: 
ПРОГНОЗУВАННЯ ЧАСОВИХ РЯДІВ З ВИКОРИСТАННЯМ МАСИВІВ ІНДИКАТОРІВ У PYTHON
Владислав Кабачій, Артур Гунько

Остання редакція: 2022-11-01

Анотація


    Часовий ряд – це серія точок даних, проіндексованих  у хронологічному порядку. Прогнозування часових рядів є застосування моделі для прогнозування майбутніх значень на основі раніше спостережених значень. Питання розробки нових підходів задля вирішення задачі прийняття рішень на фінансових часових рядах є актуальними на сьогодні, особливо за використанням інтелектуальних технологій.

    Постановка задачі. Вхідні дані, представленні у вигляді дата-сетів, в які входять також масиви показників індикаторів. Крім того відомі моменти за певний проміжок часу, в які було б бажано прийняти те чи інше рішення. Необхідно створити підхід, базуючись на методах прогнозування часових рядів і за використанням бібліотек Python, та навчити нейронну мережу прогнозувати майбутні значення на основі даних в реальному часі: цінових вимірів та набору значень індикаторів.

   Для розв’язання задачі застосуємо систему прийняття рішень, що дозволяє інтегрувати інтелектуальні технології. Пакет MetaTrader використовується для зручного та швидкого отримання біржової інформації в Python. Отримані таким чином дані можна використовувати для статистичних обчислень і машинного навчання. Python, як сучасна мова програмування, майже одразу зарекомендувала себе лідером у розробці методів машинного навчання. На сьогодні застосування різних модулів, бібліотек все більше поширюється у багатьох сферах. Для фінансової сфери, зокрема для прогнозування фінансових часових рядів, використовується ряд бібліотек: Pandas, NumPy, Scikit-learn, XGBoost.

    Pandas – програмна бібліотека призначена для маніпулювання даними та їхнього аналізу. Вона є вільним програмним забезпеченням, що випускається за ліцензією BSD. Ця назва походить від терміну «панельні дані» (англ. panel data), який в економетрії позначає багатовимірні структуровані набори даних.  Дана бібліотека задовольняє потреби у обробці часових рядів, так як має для цього ряд функцій. Методи, що можуть бути розглянуті під час прогнозування часових рядів: наївний підхід, просте середнє, ковзне середнє, просте експоненційне згладжування, метод лінійного тренду Холта, метод Холта-Вінтер, ARIMA.

   При тестуванні прогнозування із тестовими даними були отримані позитивні результати, що демонструють ефективність підходу із застосуванням інтелектуальних технологій.

   Висновки. Поєднання бібліотек StatsModels та Pandas демонструють задовільні результати прогнозування. Зручність роботи з DataFrame форматом відіграє велику роль у правильному застосуванні різних методів та у перспективі надає змогу поєднати дані з часовими індикаторами.