Остання редакція: 2026-06-17
Анотація
У тезах досліджено проблему відновлення пропусків у малих вибірках технічних даних. На основі комплексного бенчмаркінгу продемонстровано критичну вразливість багатометричних та регресійних алгоритмів відновлення даних (MICE, KNN) до дефіциту інформації. Обґрунтовано необхідність застосування альтернативних непараметричних підходів для збереження структурної репрезентативності даних при оцінюванні станів систем.
ANALYSIS OF TRADITIONAL METHODS OF GAP RECOVERY IN SMALL DATA SAMPLES
Abstracts:
The abstract investigates the problem of filling gaps in small samples of technical data. Based on comprehensive benchmarking, the critical vulnerability of multimetric and regression imputation algorithms (MICE, KNN) to information deficit is demonstrated. The necessity of applying alternative nonparametric approaches to preserve the structural representativeness of data when evaluating system states is substantiated.
Ключові слова
Посилання
1. Kovtun V., Grochla K., Al-Maitah M., Aldosary S., Kozachko O. Entropy-extreme concept of data gaps filling in a small-sized collection. Egyptian Informatics Journal. 2025. Vol. 29. Article 100621. DOI: https://doi.org/10.1016/j.eij.2025.100621
2. Kovtun V., Altameem T., Al-Maitah M., Kempa W. Entropy-metric estimation of the small data models with stochastic parameters. Heliyon. 2024. Vol. 10, № 2. Article e24708.
3. Luo H., Zhang P., Su J., Zheng D. Evaluation of subsurface soil water content estimate methods: Maximum entropy vs. exponential filter. Journal of Hydrology. 2024. Vol. 643. Article 132007. DOI: https://doi.org/10.1016/j.jhydrol.2024.132007