Розмір шрифта:
МОДЕЛЮВАННЯ СИСТЕМИ ЗБОРУ НОВИННОГО КОНТЕНТУ ДЛЯ АНАЛІЗУ РИТОРИКИ ПУБЛІЧНИХ ОСІБ
Остання редакція: 2025-06-14
Анотація
У роботі проведено порівняльний аналіз двох основних підходів до збирання новинного контенту – пакетної та потокової моделі. Здійснено вибір оптимальної моделі з урахуванням затримки, повноти даних і навантаження на систему. На основі формалізованих критеріїв доведено доцільність використання batch-моделі в задачах із невисокою частотою оновлення новин. Представлено аналітичну формулу зваженої ефективності моделі, що дозволяє адаптивно обирати архітектурне рішення під конкретні потреби системи моніторингу публічної риторики.
Ключові слова
веб-скрапінг; риторика; новини; batch-модель; потокова модель; системи підтримки рішень
Посилання
1. Alieinyk V. Factors of the growing role of mass communication as a tool for shaping political consciousness in the modern world // Society and Security. 2024. № 4(4). С. 3–13. URL: https://doi.org/10.26642/sas-2024-4(4)-3-13 (дата звернення: 03.06.2025).
2. Roberts H. та ін. Media Cloud: Massive Open Source Collection of Global News on the Open Web // Proceedings of the International AAAI Conference on Web and Social Media. 2021. Т. 15. С. 1034–1045. URL: https://doi.org/10.1609/icwsm.v15i1.18127 (дата звернення: 04.06.2025).
3. Shahrivari S. Beyond Batch Processing: Towards Real-Time and Streaming Big Data // Computers. 2014. Vol. 3. P. 117–129. DOI: https://doi.org/10.3390/computers3040117.
2. Roberts H. та ін. Media Cloud: Massive Open Source Collection of Global News on the Open Web // Proceedings of the International AAAI Conference on Web and Social Media. 2021. Т. 15. С. 1034–1045. URL: https://doi.org/10.1609/icwsm.v15i1.18127 (дата звернення: 04.06.2025).
3. Shahrivari S. Beyond Batch Processing: Towards Real-Time and Streaming Big Data // Computers. 2014. Vol. 3. P. 117–129. DOI: https://doi.org/10.3390/computers3040117.
Повний текст:
PDF