Остання редакція: 2025-12-10
Анотація
У роботі було розроблено інформаційну технологію розпізнавання продуктів харчування на основі архітектури згорткової нейронної мережі Mask R-CNN. Навчання проводилось за допомогою стохастичного градієнтного спуску по мінібатчам на швидкостях навчання 1E-4, 1E-5 та 1E-6 протягом 12 000, 3 000 та 7 000 ітерацій відповідно. Програмна реалізація інформаційної технології здійснена на мові програмування Python з використанням бібліотек NumPy, Pandas та Matplotlib. Набір даних для навчання та тестування програми містив приблизно 19 000 зображень, на яких присутні 186 класів продуктів харчування. Розроблена програма розпізнавання продуктів харчування має порівняно з аналогом збільшену на 7% влучність розпізнавання сегмента та збільшену на 3% влучність розпізнавання рамки.
Ключові слова
Посилання
- О. К. Колесницький, Є. В. Янковський, І. К. Денисов, І. Р. Арсенюк «Виявлення озброєних людей у відеопотоці з використанням згорткових нейронних мереж», Оптико-електронні інформаційно-енергетичні технології, Том 46, № 2 (2023), С. 76-83. DOI https://doi.org/10.31649/1681-7893-2023-46-2-76-83, Режим доступу: https://oeipt.vntu.edu.ua/index.php/oeipt/article/view/665/62
- Y. Wu, A. Kirillov, F. Massa, W.-Y. Lo, and R. Girshick. Detectron2. [Електронний ресурс] – Режим доступу: https://github.com/facebookresearch/detectron2, 2019
- A. Gupta, P. Dollar, and R. Girshick. Lvis: A dataset for large vocabulary instance segmentation. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), June 2019.