РОЗРОБКА КЛАСИФІКАТОРА ЗОБРАЖЕНЬ ДЛЯ ШВИДКОГО ПОШУКУ У ВЕЛИКИХ БАЗАХ ДАНИХ

Анатолій Іванович Поворознюк; Валерій Володимирович Філатов; Ганна Євгенівна Філатова

КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання,
Контроль і управління в складних системах (КУСС-2024)

Анатолій Іванович Поворознюк, Валерій Володимирович Філатов, Ганна Євгенівна Філатова

Остання редакція: 2025-01-15

Анотація

Стрімке збільшення обсягу інформації в Інтернеті потребує розроблення дієвих методів для її оперативної обробки в інформаційних системах. Зокрема, важливим аспектом є кластеризація новинної інформації не лише з урахуванням морфологічного аналізу текстів, але й візуального контенту. Це створює актуальну задачу кластеризації зображень, що супроводжують текстову інформацію на різних веб ресурсах, таких як новинні портали, соціальні мережі, інформаційні сайти та інші. Саме кластеризація зображень дозволяє ефективніше структурувати великі обсяги даних та спростити процес пошуку потрібної інформації. Предметом цього дослідження є створення класифікатора зображень, який є малочутливим до швидкого зростання обсягу інформації в базах даних. Це особливо важливо в умовах, коли кількість інформації збільшується з високою швидкістю, і потрібно швидко та ефективно обробляти великі масиви даних. Мета дослідження полягає в тому, щоб підвищити продуктивність процесу пошуку ідентичних зображень у великих базах даних, де швидкість додавання нової інформації може сягати 10-12 тисяч зображень на добу. Це вимагає розробки спеціалізованого класифікатора зображень, який зможе забезпечити швидку та точну кластеризацію, незважаючи на інтенсивний ріст обсягу інформації. Для досягнення цієї мети використовуються різні сучасні методи, зокрема математичне моделювання, пошук зображень на основі їхнього контенту, методи обробки зображень, а також методи прийняття рішень. Одним з основних інструментів, застосованих у дослідженні, є двовимірне дискретне косинусне перетворення, яке дозволяє ефективно кодувати зображення та знижувати обсяги даних без втрати важливої інформації. Результати дослідження демонструють, що розроблений класифікатор зображень дійсно є малочутливим до збільшення кількості інформації в базах даних. Проведений аналіз властивостей класифікатора показав, що запропоноване рішення забезпечує високу швидкість обробки даних та мінімальні вимоги до обчислювальної потужності. Експерименти довели, що кластеризація зображень за допомогою даного підходу є досить швидкою і малозатратною з точки зору обсягу використовуваних ресурсів. Розроблений класифікатор може значно підвищити ефективність роботи інформаційних систем, зокрема в умовах постійного зростання інформаційних потоків, що робить його важливим інструментом для обробки великих баз даних зображень.

DOI: https://doi.org/10.31649/mccs2024.5-15

Ключові слова

інформаційні системи; пошук зображень на основі контенту; класифікатор зображень; великі бази даних; двовимірне дискретне косинусне перетворення

Посилання

[1] О. А. Амонс, Ю. О. Янов, та І. О. Безпалий, "Кластеризація документів на основі статистичної близькості термів", Вісник НТУУ «КПІ» Інформатика, управління та обчислювальна техніка, №49, 2008, с. 55-62.

[2] О. М. Верес, Я. П. Кісь, В. А. Кугівчак, та І. В. Рішняк, "Вибір методів для пошуку однакових або схожих зображень", Вісник Національного університету Львівська політехніка, Серія: Інформаційні системи та мережі, № 887, 2018, с. 43-50.

[3] К. С. Смеляков, А.С. Чуприна, Д. Л. Сандркін, Є. В. Вакулік, та Є. М. Дроб, "Розробка інваріантної моделі цифрового зображення для швидкого пошуку у сховищах даних", Збірник наукових праць Харківського національного університету Повітряних Сил, № 2(68), 2021, с. 108-15.

[4] К. С. Смеляков, Д. Л. Сандркін, Д. О. Товчиречко, Є. В. Вакулік, та Є. М. Дроб, "Розробка методу швидкого пошуку цифрового зображення у сховищах даних", Системи обробки інформації, № 2(165), 2021, с. 54-63.

[5] F. A. A. Salih, and A. A. Abdulla, "An Efficient Two-layer based Technique for Content-based Image Retrieval", UHD Journal of Science and Technology, № 5(1), 2021, p. 28-40.

[6] Xiaoqing Li, Jiansheng Yang, and Jinwen Ma, "Recent developments of content-based image retrieval (CBIR)",Neurocomputing, Volume 452, 2021, p. 675-689.

[7] A. Sezavar, H. Farsi, and S. Mohamadzadeh, "Content-based image retrieval by combining convolutional neural networks and sparse representation", Multimedia Tools and Applications, vol. 78(15), 2019, p. 20895-20912.

[8] M. K. Alsmadi, "Content-based image retrieval using color, shape and texture descriptors and features", Arabian Journal for Science and Engineering, vol. 45(4), 2020, p. 3317–3330.

[9] N. Sampathila, and R. J. Martis, "Computational approach for content-based image retrieval of K-similar images from brain MR image database", Expert Syst., vol. 39, 2022, e12652.

[10] Junjie Cai, Qiong Liu, Francine Chen, Dhiraj Joshi, and Qi Tian, "Scalable Image Search with Multiple Index Tables". in Proceedings of International Conference on Multimedia Retrieval (ICMR '14), Association for Computing Machinery, New York, NY, USA, 2014, p. 407-410.

[11] S. Cheng, L. Wang, and A. Du, "An Adaptive and Asymmetric Residual Hash for Fast Image Retrieval," in IEEE Access, vol. 7, 2019, p. 78942-78953.

Повний текст: PDF

КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, Контроль і управління в складних системах (КУСС-2024)

Анотація

Ключові слова

Посилання

КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання,
Контроль і управління в складних системах (КУСС-2024)