Остання редакція: 2024-10-08
Анотація
В роботі представлено теоретичне обґрунтування і програмне забезпечення ефективного методу ідентифікації даних в інтелектуальних системах управління, який базується на використанні етапів кластеризації і класифікації об’єктів, представлених їх параметричним описом. Автором запропоновано метод кластеризації даних з фіксацією граничних точок кластера за принципом знаходження їх поверхневого натягу. Застосування даного методу кластерного аналізу дозволяє підвищити ефективність ідентифікації об’єктів в системах управління з використанням класифікатора типу SVM. Класифікатор типу SVM (Support Vector Machine – метод опорних векторів) на разі є найбільш досконалим і за рахунок використання узагальнених вирішувальних функцій здатний оперувати як з лінійними, так і з нелінійно розподіленими зображеннями об’єктів в просторі параметрів. На сьогодні є відомою значна кількість методів і алгоритмів кластерного аналізу. Їх можна поділити на класичні, що ґрунтуються на загальному алгоритмі Фу К. С., і новітні, засновані на врахуванні природи і структури даних та мети їх використання. За приклади таких методів можна навести такі: k- внутрішньо групових середніх (k-means), на основі щільності (DBSCAN), середнього зсуву (Mean-Shift), з використанням гаусових моделей сумішей (GMM), методи ієрархічної агломеративної кластеризації (HAC). Спільним їхнім недоліком є те, що вони формують кластери точок у просторі параметрів, проте не фіксують їхні граничні точки. Остання характеристика (наявність маркованих граничних точок кластера) є дуже корисною при побудові класифікаторів, що реалізують задачу ідентифікації об’єктів. В даній роботі автор запропонував і теоретично обґрунтував метод кластеризації з визначенням поверхневих точок по аналогії з фізичним принципом поверхневого натягу рідини.
В роботі розроблено алгоритм для реалізації даного методу, а також програмне забезпечення на мові Python у вигляді додатку ClusterBorderFinder. На розроблену програму отримано авторське свідоцтво.
Ключові слова
Посилання
[1] Биков М. М. Основи інтелектуальних технологій. Частина 2. Технології машинного навчання : електронний навчальний посібник комбінованого (локального та мережного) використання [Електронний ресурс] / Биков М. М., Ковтун В. В., Грищук Т. В., Вінниця, ВНТУ, 2024, 153 с.
[2] M. Abadi, P. Barham, J. Chen, et al., "TensorFlow: A system for large-scale machine learning", Communications of the ACM, vol. 62, no. 10, pp. 22-35, Oct. 2019. doi: 10.1145/3360324.
[3] Y. Bengio, A. Courville, and P. Vincent, "Representation learning: A review and new perspectives," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 35, no. 8, pp. 1798-1828, Aug. 2020. doi: 10.1109/TPAMI.2019.2903152.
[4] І. Гаврилюк і М. Дубчак, "Алгоритми і методи машинного навчання для класифікації даних у сучасних інформаційних системах", Вісник Київського національного університету імені Тараса Шевченка, вип. 12, с. 24-31, червень 2022.
[5] Биков, М. М. Основи інтелектуальних технологій. Частина 1. Технології розпізнавання : електронний навчальний посібник комбінованого (локального та мережного) використання [Електронний ресурс] / Биков М. М., Ковтун В. В., Гаврилюк В. О., Вінниця, ВНТУ, 2023, 229 с.
[6] M. Ester, H.-P. Kriegel, J. Sander, and X. Xu, "A density-based algorithm for discovering clusters in large spatial databases with noise," in Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD), San Francisco, CA, USA, 2020, pp. 226-231.
[7] С. Іванченко, О. Ткаченко, і Ю. Петренко, "Методи кластеризації даних у великих масивах інформації", Науковий вісник Національного університету біоресурсів і природокористування України, вип. 23, с. 98-104, квітень 2021.
[8] О. Мельник і В. Карпенко, "Моделі класифікації даних у задачах аналітики великих даних," Інформаційні технології та комп'ютерна інженерія”, вип. 32, с. 17-23, жовтень 2022.
[9] Биков М.М., Волоський Б.О. Розробка ефективного класифікатора даних в інтелектуальних системах управління [Електронний ресурс] / М.М. Биков, Б.О. Волоський // Матеіали ХLIX науково-технічної конференції підрозділів ВНТУ, Вінниця, 27-28 квітня 2020 р.,Електр. текст. дані., 2020. Режим доступу: https://conferences.vntu.edu.ua/index.php/all-fksa/all-fksa-2020/paper/view/9730 ,
[10] Биков М.М., Бушин Д.О. Розробка ефективного класифікатора для автоматизованої системи допуску персоналу на виробництві. Матеріали Міжнародної наук.-техн. Конференції “Молодь в науці: дослідження, проблеми, перспективи (МН-2024)”, [Електронний ресурс]. Режим доступу: https://conferences.vntu.edu.ua/index.php/mn/mn2024/paper/view/21460атеріали