КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, 
Молодь в науці: дослідження, проблеми, перспективи (МН-2026)

Розмір шрифта: 
ПІДХОДИ ДО ПОБУДОВИ СИСТЕМ ОБРОБКИ СТРУКТУРОВАНИХ ТА НЕСТРУКТУРОВАНИХ ДАНИХ
Михайло Володимирович Міняйло, Дмитро Олександрович Середа

Остання редакція: 2026-04-17

Анотація


Розглянуто підходи до побудови систем обробки даних з урахуванням їх типу: структурованих, напівструктурованих та неструктурованих. Проаналізовано особливості зберігання та обробки JSON-відповідей зовнішніх API, а також документів у форматах PDF та DOCX. Наведено порівняльну характеристику інструментів обробки для кожного типу даних та запропоновано уніфіковану конвеєрну архітектуру (pipeline) для обробки різнорідних даних у рамках єдиної системи.

 

 

APPROACHES TO BUILDING SYSTEMS FOR PROCESSING STRUCTURED AND UNSTRUCTURED DATA


Abstract:

Approaches to building data processing systems are considered with regard to data types: structured, semi-structured, and unstructured. The features of storing and processing JSON responses from external APIs, as well as PDF and DOCX documents, are analyzed. A comparative description of processing tools for each data type is provided, and a unified pipeline architecture for heterogeneous data processing within a single system is proposed.


Ключові слова


структуровані дані; неструктуровані дані; JSON; REST API; обробка документів; Apache Tika; конвеєр даних; напівструктуровані дані.

Повний текст: PDF