Розмір шрифта:
РОЗРОБКА КЛАСИФІКАТОРУ ЗОБРАЖЕНЬ ДЛЯ ШВИДКОГО ПОШУКУ У ВЕЛИКИХ БАЗАХ ДАНИХ
Остання редакція: 2024-10-10
Анотація
Стрімке збільшення обсягу інформації в Інтернеті потребує розроблення дієвих методів для її оперативної обробки в інформаційних системах. Зокрема, важливим аспектом є кластеризація новинної інформації не лише з урахуванням морфологічного аналізу текстів, але й візуального контенту. Це створює актуальну задачу кластеризації зображень, що супроводжують текстову інформацію на різних веб ресурсах, таких як новинні портали, соціальні мережі, інформаційні сайти та інші. Саме кластеризація зображень дозволяє ефективніше структурувати великі обсяги даних та спростити процес пошуку потрібної інформації. Предметом цього дослідження є створення класифікатора зображень, який є малочутливим до швидкого зростання обсягу інформації в базах даних. Це особливо важливо в умовах, коли кількість інформації збільшується з високою швидкістю, і потрібно швидко та ефективно обробляти великі масиви даних. Мета дослідження полягає в тому, щоб підвищити продуктивність процесу пошуку ідентичних зображень у великих базах даних, де швидкість додавання нової інформації може сягати 10-12 тисяч зображень на добу. Це вимагає розробки спеціалізованого класифікатора зображень, який зможе забезпечити швидку та точну кластеризацію, незважаючи на інтенсивний ріст обсягу інформації. Для досягнення цієї мети використовуються різні сучасні методи, зокрема математичне моделювання, пошук зображень на основі їхнього контенту, методи обробки зображень, а також методи прийняття рішень. Одним з основних інструментів, застосованих у дослідженні, є двовимірне дискретне косинусне перетворення, яке дозволяє ефективно кодувати зображення та знижувати обсяги даних без втрати важливої інформації. Результати дослідження демонструють, що розроблений класифікатор зображень дійсно є малочутливим до збільшення кількості інформації в базах даних. Проведений аналіз властивостей класифікатора показав, що запропоноване рішення забезпечує високу швидкість обробки даних та мінімальні вимоги до обчислювальної потужності. Експерименти довели, що кластеризація зображень за допомогою даного підходу є досить швидкою і малозатратною з точки зору обсягу використовуваних ресурсів. Розроблений класифікатор може значно підвищити ефективність роботи інформаційних систем, зокрема в умовах постійного зростання інформаційних потоків, що робить його важливим інструментом для обробки великих баз даних зображень.
Ключові слова
інформаційні системи, пошук зображень на основі контенту, класифікатор зображень, великі бази даних, двовимірне дискретне косинусне перетворення