КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, 
Контроль і управління в складних системах (КУСС-2024)

Розмір шрифта: 
СИНТЕЗ СТАТИСТИЧНО ОПТИМАЛЬНОГО ДАТАСЕТУ ДЛЯ НАВЧАННЯ НЕЙРОННОЇ МЕРЕЖІ
Володимир Михайлович Дубовой

Остання редакція: 2025-01-28

Анотація


Для керування складними нелінійними системами все ширше використовують інтелектуальні технології, зокрема, на основі нейронних мереж. Проте навчання таких нейронних контролерів ускладнюється відсутністю на стадії створення системи розмічених датасетів для керованих об’єктів. У цій роботі досліджується модельно-орієнтоване навчання нейроконтролера і створення первинного навчального датасету на основі імітаційної моделі системи. Для цього поставлена і розв’язана задача синтезу оптимальної статистики вхідних даних імітаційної моделі за критерієм мінімуму середніх втрат. Задача генерування датасету з заданими статистичними характеристиками для навчання контролера динамічної системи керування ускладнюється тим, що необхідно одночасно забезпечити як необхідний багатовимірний розподіл ймовірностей у просторі реалізацій векторного впливу на систему, так і його кореляційну структуру у часі. Функцією втрат обрана середня квадратична похибка нейроконтролера. Усереднення здійснюється як по множині реалізацій, так і у часі для врахування динаміки системи. Імітаційна модель децентралізованої системи створена на платформі Scilab/Xcos з використанням попередньо створеної бібліотеки блоків для моделювання розподілених систем. Задача генерування датасету з заданими розподілом ймовірностей і кореляційною структурою розв’язується шляхом генерування некорельованого рівномірно розподіленого датасету з наступним нелінійним динамічним перетворенням. Одночасне отримання заданої виду статистичного розподілу і кореляційної структури отримується ітераційним шляхом з поступовим наближенням до необхідного результату.

 

DOI: https://doi.org/10.31649/mccs2024.1-04


Ключові слова


навчання нейронної мережі; синтез датасету; статистична оптимальність

Посилання


[1] V. Dubovoi, M. Yukhimchuk, V. Kovtun, K. Grochla. Functional Dependability of    Distributed Control of Multi-zone Objectsunder Failures Conditions. In IEEE Access, vol. 12, pp. 95736-95749, 2024, doi: 10.1109/ACCESS.2024.3421380.


[2] Xin Huang, Han Lin Shang. Nonlinear autocorrelation function of functional time series (2022) DOI: https://doi.org/10.21203/rs.3.rs-1592981/v1


[3] Boyd S, El Ghaoui L., Feron E., BalakrDuffy, Daniel. (2018). Random Number Generation and Distributions. 819-852. 10.1002/9781119170518.ch26.


[4] Liu, Mengwei & Reed, Patrick & Anderson, C.. (2021). Stochastic Synthetic Data Generation for Electric Net Load and Its Application. 10.24251/HICSS.2021.383.


[5] Salim, Omar & Dorrah, Hassen & El-kahawy, Mahmoud. (2018). A Novel Algorithm to Generate Synthetic Data for Continuous-State Stationary Stochastic Process (Wind Data Application). 333-338. 10.1109/MEPCON.2018.8635270.


[6] Wonseok Yang, Woochul Nam/ Data synthesis method preserving correlation of features. Volume 122, 2022, 108241


[7] Kang, Yanfei & Hyndman, Rob & Li, Feng. (2019). GRATIS: GeneRAting TIme Series with diverse and controllable characteristics. 10.48550/arXiv.1903.02787.


[8] Nicklas Javergard, Rainey Lyons, Adrian Muntean1 and Jonas Forsman. Preserving correlations: A statistical method for generating synthetic data. arXiv:2403.01471v1 [cs.LG] 3 Mar 2024


[9] Kai Vahldiek, Libing Zhou, Wenfeng Zhu and Frank Klawonn. Development of a Data Generator for Multivariate Numerical Data with Arbitrary Correlations and Distributions. 2021,Intelligent Data Analysis,25(4) pp.789-807; DOI:10.3233/IDA-205253.


[10] Cavalcante, Charles & Mota, joão & Romano, João. (2004). Polynomial expansion of the probability density function about Gaussian mixtures. Machine Learning for Signal Processing XIV - Proceedings of the 2004 IEEE Signal Processing
Society Workshop. 163 - 172. 10.1109/MLSP.2004.1422970.


[11] Gambaro, A.M. Exponential expansions for approximation of probability distributions. Decisions Econ Finan (2024). https://doi.org/10.1007/s10203-024-00460-2


[12] Birrell, Jeremiah & Katsoulakis, Markos & Pantazis, Yannis. (2022). Optimizing Variational Representations of Divergences and Accelerating Their Statistical Estimation. IEEE Transactions on Information Theory. 10.1109/TIT.2022.3160659.


Повний текст: PDF