Остання редакція: 2024-12-22
Анотація
У роботі досліджується застосування системи управління базами даних PostgreSQL у контексті систем повторної ідентифікації людини, що базуються на технологіях комп'ютерного зору. Зважаючи на зростаючу потребу в ефективному зберіганні та обробці великомасштабних векторних даних, отриманих за допомогою глибоких нейронних мереж, постає питання оптимізації баз даних для швидкого та точного співставлення векторних ознак осіб. У роботі розглядаються особливості зберігання високорозмірних векторних представлень у PostgreSQL із використанням розширення pgvector, яке надає можливість ефективного пошуку за близькістю векторів з використанням метрик косинусової подібності та евклідової відстані.
Проведено детальний експериментальний аналіз продуктивності PostgreSQL при виконанні операцій пошуку найближчих сусідів (k-NN пошуку) на основі векторних ознак, отриманих з відкритого датасету Market-1501. Порівняно швидкодію та точність PostgreSQL з іншими популярними СУБД, такими як MySQL та MongoDB, при використанні аналогічних методів зберігання та індексування даних. Результати дослідження демонструють, що PostgreSQL із розширенням pgvector забезпечує значно кращу продуктивність, досягаючи в середньому часу виконання запитів 35 мс та пропускної здатності 285 запитів за секунду, що перевищує показники MySQL та MongoDB.
Крім того, використання PostgreSQL сприяє підвищенню точності повторної ідентифікації, що підтверджується вищими значеннями метрики mAP (78% проти 72% у MySQL та 70% у MongoDB). Обговорюються фактори, які впливають на продуктивність системи, такі як ефективність індексування, оптимізація запитів та використання системних ресурсів. Розглядаються можливості масштабування PostgreSQL для обробки ще більших обсягів даних та інтеграції з іншими інструментами для покращення продуктивності.
Отримані результати підтверджують доцільність використання PostgreSQL у системах повторної ідентифікації людини, що може мати практичне значення для розробки високопродуктивних та масштабованих систем безпеки та моніторингу. Подальші дослідження можуть бути спрямовані на оптимізацію алгоритмів пошуку та інтеграцію з передовими технологіями машинного навчання для покращення точності та швидкодії системи.
Ключові слова
Посилання
[1]. PostgreSQL Documentation [Електронний ресурс]. – Режим доступу: https://www.postgresql.org/docs/.
[2]. pgvector: Embeddings and vector similarity for PostgreSQL [Електронний ресурс] / GitHub Repository. – Режим доступу: https://github.com/pgvector/pgvector.
[3]. Zhao L., Liu X., Wang M. Large-Scale Similarity Search with PostgreSQL for Efficient Multimedia Retrieval // Proceedings of the 2020 IEEE International Conference on Big Data (Big Data), 10–13 грудня 2020 р., Атланта, США. – 2020. – С. 1476–1485. DOI: 10.1109/BigData50022.2020.9378193.
[4]. Hermans A., Beyer L., Leibe B. In Defense of the Triplet Loss for Person Re-Identification [Електронний ресурс] // arXiv preprint. – arXiv:1703.07737. – 2017. – Режим доступу: https://arxiv.org/abs/1703.07737.
[5]. Johnson J., Douze M., Jégou H. Billion-scale similarity search with GPUs // IEEE Transactions on Big Data. – 2019. – Т. 7, №3. – С. 535–547. DOI: 10.1109/TBDATA.2019.2921572.
[6]. Kvyetnyy R., Kotsiubynskyi V., Kyrylenko O., Kolesnytskyj O., Dumenko V., Kotyra A., Mussayeva D., Abilkaiyr N. Using multiple optical cameras for correspondence identification between objects in the fields of view // Proceedings of SPIE. Optical Fibers and Their Applications 2023. Bellingham : SPIE, 2023. Vol. 12985, 129850A. DOI: https://doi.org/10.1117/12.3022791.
[7]. Sun Y., Zheng L., Yang Y., Tian Q., Wang S. Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional Baseline) // Proceedings of the European Conference on Computer Vision (ECCV), 8–14 вересня 2018 р., Мюнхен, Німеччина. – 2018. – С. 480–496. DOI: 10.1007/978-3-030-01237-3_29.
[8]. Faiss: A library for efficient similarity search and clustering of dense vectors [Електронний ресурс] / Facebook AI Research. – Режим доступу: https://github.com/facebookresearch/faiss.
[9]. He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 27–30 червня 2016 р., Лас-Вегас, США. – 2016. – С. 770–778. DOI: 10.1109/CVPR.2016.90.
[10]. Zheng L., Shen L., Tian L., Wang S., Wang J., Tian Q. Scalable Person Re-identification: A Benchmark // Proceedings of the IEEE International Conference on Computer Vision (ICCV), 7–13 грудня 2015 р., Сантьяго, Чилі. – 2015. – С. 1116–1124. DOI: 10.1109/ICCV.2015.133.