КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, Молодь в науці: дослідження, проблеми, перспективи (МН-2024)

Розмір шрифта: 
Застосування нейронних мереж та бібліотеки Keras для розпізнавання цифр на зображеннях
Олексій Андрійович Козловський

Остання редакція: 2024-05-19

Анотація


У статті розглянуто застосування нейронних мереж та бібліотеки Keras для розпізнавання рукописних цифр на основі даних MNIST. Основна мета полягає у демонстрації побудови моделі, процесу її тренування та оцінки точності. Було використано нейронну мережу з трьома прихованими шарами, причому вихідний шар використовує функцію активації Softmax для класифікації цифр. Дані були нормалізовані для стабільнішого та швидшого навчання моделі. Тренування моделі проводилось на тренувальній та валідаційній вибірках, а оцінка точності — на тестовій вибірці. Модель досягла високої точності розпізнавання на рівні 97%. Обговорено основні фактори, що вплинули на успіх моделі, зокрема архітектура мережі, нормалізація даних та використання оптимізатора Adam. Запропоновані напрями подальших досліджень включають використання більш складних архітектур нейронних мереж та експерименти з різними гіперпараметрами.

The article discusses the application of neural networks and the Keras library for recognizing handwritten digits based on the MNIST dataset. The primary goal is to demonstrate the construction of the model, its training process, and the evaluation of accuracy. A neural network with three hidden layers was used, with the output layer employing the Softmax activation function for digit classification. The data was normalized for more stable and faster model training. The model was trained on training and validation sets and evaluated on a test set. The model achieved a high recognition accuracy of 97%. The main factors contributing to the model's success were discussed, including network architecture, data normalization, and the use of the Adam optimizer. Proposed future research directions include using more complex neural network architectures and experimenting with different hyperparameters.


Ключові слова


Штучний Інтелект; Нейронні мережі; Розпізнавання

Посилання


1. F. Chollet, "Deep Learning with Python," 2nd ed. Greenwich, CT, USA: Manning Publications Co., 2021.

2. L. Deng, "The MNIST Database of Handwritten Digit Images for Machine Learning Research," IEEE Signal Processing Magazine, vol. 29, no. 6, pp. 141-142, Nov. 2012.

3. M. Abadi et al., "TensorFlow: A System for Large-Scale Machine Learning," in 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16), 2016, pp. 265-283.

4. A. Geron, "Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow", O’Reilly, third edition, 2023.

5. A. Glassner, "Deep Learning A Visual Approach", No Starch Press, Inc., San Francisco, 2021.


Повний текст: PDF