Остання редакція: 2025-12-11
Анотація
Запропонована технологія оптичного розпізнавання поєднує методи попередньої обробки зображень, сегментації та класифікації символів із застосуванням згорткових нейронних мереж і шаблонних алгоритмів. Розроблений програмний засіб забезпечує підвищену стійкість до шумів, деформацій та дефектів друку, що дозволяє покращити точність відтворення текстової інформації у порівнянні з традиційними OCR-системами.
Optical Character Recognition Tools for Distorted Printed Characters in Text Documents
Abstracts:The proposed technology integrates image preprocessing, segmentation, and symbol classification methods using convolutional neural networks and template-based algorithms. The developed software demonstrates increased robustness to noise, deformations, and printing defects, resulting in higher text reconstruction accuracy compared to traditional OCR systems.
Ключові слова
Посилання
Шелестов А. Ю. Методи та засоби оптичного розпізнавання текстової інформації / А. Ю. Шелестов // Вісник Національного технічного університету України «КПІ». — Серія «Інформатика, управління та обчислювальна техніка». — 2017. — № 65. — С. 88–94.
Afzal M. Z., Kölsch A., Ahmed S., Liwicki M. Deep learning-based document segmentation and recognition: a survey // Pattern Recognition. — 2019. — Vol. 86. — P. 106–132.
Xiao-Feng Wang, Zhi-Huang He, Kai Wang, Yi-Fan Wang, Le Zou, Zhi-Ze Wu. A survey of text detection and recognition algorithms based on deep learning technology. 2023, Neurocomputing, p. 126702. [Електронний ресурс]. – Режим доступу: https://doi.org/10.1016/j.neucom.2023.126702.
What’s New in Tesseract OCR. Google Developers. [Електронний ресурс]. – Режим доступу: https://opensource.google/projects/tesseract .
Deep Learning for OCR: A Comprehensive Guide. PapersWithCode. [Електронний ресурс]. – Режим доступу: https://paperswithcode.com/task/optical-character-recognition .