Розмір шрифта:
РОЗРОБКА ІНТЕРАКТИВНОГО ВЕБ-ДОДАТКУ «ІНТЕЛЕК-ТУАЛЬНИЙ ЕКЗАМЕНАТОР» НА ОСНОВІ LLM ТА API GROQ
Остання редакція: 2026-05-27
Анотація
Анотація
У роботі представлено розробку інформаційної технології для автоматизації процесу створення пере-вірочних тестів на основі довільного навчального матеріалу. Запропоновано архітектуру веб-додатка, що забезпечує вилучення тексту з різних джерел (PDF, HTML-сторінки) та його обробку за допомогою вели-ких мовних моделей родини LLaMa через платформу API Groq. Описано механізм динамічного парсингу відповідей ШІ за допомогою регулярних виразів для формування інтерактивного інтерфейсу на базі фрей-мворку Streamlit. Проведене тестування підтвердило високу швидкість генерації завдяки використанню LPU-процесорів та виявило специфіку токенізації україномовного контенту в умовах обмежень безкош-товних тарифів API.
Abstract
The paper presents the development of an information technology for automating the process of creating check tests based on arbitrary educational material. A web application architecture is proposed that ensures text extraction from various sources (PDF, HTML pages) and its processing using large language models of the LLaMa family via the Groq API platform. A mechanism for dynamic parsing of AI responses using regular expressions to form an interactive interface based on the Streamlit framework is described. The testing confirmed the high speed of generation due to the use of LPU processors and revealed the specifics of tokenization of Ukrainian-language content under the conditions of free API rate limits.
У роботі представлено розробку інформаційної технології для автоматизації процесу створення пере-вірочних тестів на основі довільного навчального матеріалу. Запропоновано архітектуру веб-додатка, що забезпечує вилучення тексту з різних джерел (PDF, HTML-сторінки) та його обробку за допомогою вели-ких мовних моделей родини LLaMa через платформу API Groq. Описано механізм динамічного парсингу відповідей ШІ за допомогою регулярних виразів для формування інтерактивного інтерфейсу на базі фрей-мворку Streamlit. Проведене тестування підтвердило високу швидкість генерації завдяки використанню LPU-процесорів та виявило специфіку токенізації україномовного контенту в умовах обмежень безкош-товних тарифів API.
Abstract
The paper presents the development of an information technology for automating the process of creating check tests based on arbitrary educational material. A web application architecture is proposed that ensures text extraction from various sources (PDF, HTML pages) and its processing using large language models of the LLaMa family via the Groq API platform. A mechanism for dynamic parsing of AI responses using regular expressions to form an interactive interface based on the Streamlit framework is described. The testing confirmed the high speed of generation due to the use of LPU processors and revealed the specifics of tokenization of Ukrainian-language content under the conditions of free API rate limits.
Ключові слова
Ключові слова: інтелектуальний екзаменатор; великі мовні моделі; LLaMa; API Groq; Streamlit; автома-тизація тестування; обробка природної мови.
Посилання
1. Jurafsky D. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition / D. Jurafsky, J. H. Martin. – 3rd ed. draft. – Stanford University, 2023. – 600 p.
2. Touvron H. LLaMA: Open and Efficient Foundation Language Models / H. Touvron, T. Lavril, G. Izacard et al. // arXiv preprint arXiv:2302.13971. – 2023. – 14 p.
3. Streamlit Documentation — Official Website. URL: https://docs.streamlit.io/
4. Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web / R. Mitchell. – 2nd ed. – O'Reilly Media, 2018. – 308 p.
5. Groq Cloud API Documentation — Official Website. URL: https://console.groq.com/docs/
6. Дадиверін В. В., Бісікало О. В. Аналіз та імплементація ідеї навчання великих мовних моделей за ана-логією з дитячим когнітивним розвитком. – Вчені записки Таврійського національного університету імені В.І. Вернадського, Серія: Технічні науки, Том 36 (75) № 4 2025, Частина 2. – СС.103-109. – ISSN 2663-5941.
7. Омельченко, В.; Бісікало, О. Удосконалення великих мовних моделей формальними засобами оцінки сенсу текстової інформації. ВНТКП ВНТУ. Факультет інтелектуальних інформаційних технологій та авто-матизації, Ukraine, mar. 2026. Available at: . Date accessed: 10 Mar. 2026.
2. Touvron H. LLaMA: Open and Efficient Foundation Language Models / H. Touvron, T. Lavril, G. Izacard et al. // arXiv preprint arXiv:2302.13971. – 2023. – 14 p.
3. Streamlit Documentation — Official Website. URL: https://docs.streamlit.io/
4. Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web / R. Mitchell. – 2nd ed. – O'Reilly Media, 2018. – 308 p.
5. Groq Cloud API Documentation — Official Website. URL: https://console.groq.com/docs/
6. Дадиверін В. В., Бісікало О. В. Аналіз та імплементація ідеї навчання великих мовних моделей за ана-логією з дитячим когнітивним розвитком. – Вчені записки Таврійського національного університету імені В.І. Вернадського, Серія: Технічні науки, Том 36 (75) № 4 2025, Частина 2. – СС.103-109. – ISSN 2663-5941.
7. Омельченко, В.; Бісікало, О. Удосконалення великих мовних моделей формальними засобами оцінки сенсу текстової інформації. ВНТКП ВНТУ. Факультет інтелектуальних інформаційних технологій та авто-матизації, Ukraine, mar. 2026. Available at: . Date accessed: 10 Mar. 2026.
Повний текст:
PDF