КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, 
Молодь в науці: дослідження, проблеми, перспективи (МН-2026)

Розмір шрифта: 
Засоби оптичного розпізнавання спотворених друкованих символів текстових документів
Олександр Вікторович Перестюк, Мартинюк Тетяна Борисівна, Микола Андрійович Очкуров

Остання редакція: 2025-12-11

Анотація


Запропонована технологія оптичного розпізнавання поєднує методи попередньої обробки зображень, сегментації та класифікації символів із застосуванням згорткових нейронних мереж і шаблонних алгоритмів. Розроблений програмний засіб забезпечує підвищену стійкість до шумів, деформацій та дефектів друку, що дозволяє покращити точність відтворення текстової інформації у порівнянні з традиційними OCR-системами.

 

 

Optical Character Recognition Tools for Distorted Printed Characters in Text Documents

Abstracts:The proposed technology integrates image preprocessing, segmentation, and symbol classification methods using convolutional neural networks and template-based algorithms. The developed software demonstrates increased robustness to noise, deformations, and printing defects, resulting in higher text reconstruction accuracy compared to traditional OCR systems.


Ключові слова


оптичне розпізнавання тексту; спотворені друковані символи; попередня обробка зображень; згорткові нейронні мережі; OCR; optical character recognition; distorted printed symbols; image preprocessing; convolutional neural networks; OCR

Посилання


Шелестов А. Ю. Методи та засоби оптичного розпізнавання текстової інформації / А. Ю. Шелестов // Вісник Національного технічного університету України «КПІ». — Серія «Інформатика, управління та обчислювальна техніка». — 2017. — № 65. — С. 88–94.

 

Afzal M. Z., Kölsch A., Ahmed S., Liwicki M. Deep learning-based document segmentation and recognition: a survey // Pattern Recognition. — 2019. — Vol. 86. — P. 106–132.

 

Xiao-Feng Wang, Zhi-Huang He, Kai Wang, Yi-Fan Wang, Le Zou, Zhi-Ze Wu. A survey of text detection and recognition algorithms based on deep learning technology. 2023, Neurocomputing, p. 126702. [Електронний ресурс]. – Режим доступу: https://doi.org/10.1016/j.neucom.2023.126702.

 

What’s New in Tesseract OCR. Google Developers. [Електронний ресурс]. – Режим доступу: https://opensource.google/projects/tesseract .

 

Deep Learning for OCR: A Comprehensive Guide. PapersWithCode. [Електронний ресурс]. – Режим доступу: https://paperswithcode.com/task/optical-character-recognition .


Повний текст: PDF