Адаптивне управління контекстом у RAG-системах для персоналізованих AI-асистентів
Loading...
Date
item.page.orcid
item.page.doi
item.page.thesis.degree.name
item.page.thesis.degree.level
item.page.thesis.degree.discipline
item.page.thesis.degree.department
item.page.thesis.degree.grantor
item.page.thesis.degree.advisor
item.page.thesis.degree.committeeMember
Journal Title
Journal ISSN
Volume Title
Publisher
Харків : Харківський національний університет імені В. Н. Каразіна
Abstract
Метою кваліфікаційної роботи є розробка системи адаптивного управління контекстом, яка динамічно формує діалоговий контекст у RAG- архітектурі, забезпечуючи баланс між історією діалогу та зовнішніми знаннями з урахуванням персональних характеристик користувача. Об'єкт дослідження – процес управління діалоговим контекстом у RAG- системах для персоналізованих AI-асистентів. Предмет дослідження – методи та алгоритми адаптивного формування контексту з урахуванням історії діалогу, профілю користувача та специфіки предметної області. Розроблено архітектуру системи з чотирма компонентами та реалізовано алгоритм динамічного балансування. Програмна реалізація використовує FastAPI, PostgreSQL з pgvector, Redis та OpenAI API. Експериментальна оцінка на 100 діалогових сесіях показала покращення релевантності та coherence на 13%, економію токенів на 22%. Область застосування – розробка персоналізованих AI-асистентів, систем підтримки клієнтів та віртуальних консультантів на основі великих мовних моделей.
The purpose of the qualification work is to develop an adaptive context management system that dynamically forms dialogue context in RAG architecture, ensuring a balance between dialogue history and external knowledge taking into account personal user characteristics. The object of research is the process of dialogue context management in RAG systems for personalized AI assistants. The subject of research is methods and algorithms for adaptive context formation taking into account dialogue history, user profile, and domain specifics. A system architecture with four components was developed and a dynamic balancing algorithm was implemented. The software implementation uses FastAPI, PostgreSQL with pgvector, Redis, and OpenAI API. Experimental evaluation on 100 dialogue sessions showed improvements in relevance and coherence by 13%, token savings of 22%. The field of application is the development of personalized AI assistants, customer support systems, and virtual consultants based on large language models.
The purpose of the qualification work is to develop an adaptive context management system that dynamically forms dialogue context in RAG architecture, ensuring a balance between dialogue history and external knowledge taking into account personal user characteristics. The object of research is the process of dialogue context management in RAG systems for personalized AI assistants. The subject of research is methods and algorithms for adaptive context formation taking into account dialogue history, user profile, and domain specifics. A system architecture with four components was developed and a dynamic balancing algorithm was implemented. The software implementation uses FastAPI, PostgreSQL with pgvector, Redis, and OpenAI API. Experimental evaluation on 100 dialogue sessions showed improvements in relevance and coherence by 13%, token savings of 22%. The field of application is the development of personalized AI assistants, customer support systems, and virtual consultants based on large language models.
Description
Науковий керівник: Бакуменко Ніна Станіславівна, кандидат технічних наук, доцент ЗВО кафедри комп’ютерних систем та робототехніки
Keywords
TECHNOLOGY::Information technology::Computer science, retrieval-augmented generation, управління контекстом, персоналізація, великі мовні моделі, діалогові системи, векторний пошук, компресія історії, AI-асистенти, RAG-архітектура, адаптивні алгоритми, context management, personalization, large language models, dialogue systems, vector search, history compression, AI assistants, RAG architecture, adaptive algorithms
Citation
Супрун, Андрій Сергійович. Адаптивне управління контекстом у RAG-системах для персоналізованих AI-асистентів : кваліфікаційна робота здобувача другого (магістерського) рівня : спеціальність 123 – Комп’ютерна інженерія : освітня програма «Комп’ютерна інженерія» / А. С. Супрун ; наук. кер. Н. С. Бакуменко. – Харків : Харківський національний університет імені В. Н. Каразіна, 2025. – 91 с.
