Мультимодальна платформа для аналізу та пошуку даних на основі RAG-архітектури

dc.contributor.authorФіліп’єв, Євген Володимирович
dc.contributor.authorFilipiev, Y. V.
dc.date.accessioned2026-02-04T18:25:35Z
dc.date.issued2025
dc.descriptionНауковий керівник: Бакуменко Ніна Станіславівна, кандидат технічних наук, доцент кафедри комп’ютерних систем та робототехніки
dc.description.abstractМетою магістерської роботи – підвищення якості інформаційного пошуку в неструктурованих текстових масивах шляхом застосування як готових, так розробки нових методів інформаційного пошуку, які допоможуть подолати лексичний розрив між запитом та релевантними документами. Об'єкт дослідження – процеси семантичного пошуку та генерації відповідей у системах доповненої генерації на основі великих мовних моделей. Предмет магістерської роботи – методи та алгоритми гібридного семантичного пошуку документів із застосуванням генерації гіпотетичних документів та механізму пізньої взаємодії ColBERT. Область застосування – інтелектуальні системи пошуку та аналізу текстових даних. Розроблений підхід може бути інтегрований у корпоративні системи управління знаннями, платформи технічної підтримки з автоматизованими відповідями, освітні середовища з адаптивним контентом, а також використаний у дослідницьких проектах з обробки природної мови.
dc.description.abstractThe purpose of the qualification work is to develop a multimodal platform for data analysis and retrieval based on RAG architecture. The object of the research is the processes of semantic search and response generation in retrieval–augmented generation systems based on large language models. The subject of the research is the methods and algorithms of hybrid semantic document retrieval that combine Dense and Sparse approaches with HyDE hypothetical document generation and ColBERT late interaction mechanism to improve result relevance in RAG systems. The problem addressed in the thesis is to improve information retrieval quality by transitioning from homogeneous methods to hybrid approaches using hypothetical document generation and multi–level ranking. This makes it possible to bridge the semantic gap between user queries and relevant documents, reduce lexical mismatch impact, and improve search precision and recall. Scope – intelligent text data search and analysis systems. The developed approach can be integrated into corporate knowledge management systems, technical support platforms with automated responses, educational environments with adaptive content, and used in natural language processing projects.
dc.identifier.citationФіліп'єв, Євген Володимирович. Мультимодальна платформа для аналізу та пошуку даних на основі RAG-архітектури : кваліфікаційна робота здобувача другого (магістерського) рівня : спеціальність 123 – Комп’ютерна інженерія : освітня програма «Комп’ютерна інженерія» / Є. В. Філіп'єв ; наук. кер. Н. С. Бакуменко. – Харків : Харківський національний університет імені В. Н. Каразіна, 2025. – 98 с.
dc.identifier.urihttps://ekhnuir.karazin.ua/handle/123456789/24472
dc.language.isouk
dc.publisherХарків : Харківський національний університет імені В. Н. Каразіна
dc.subjectTECHNOLOGY::Information technology::Computer science
dc.subjectRAG
dc.subjectRetrieval-Augmented Generation
dc.subjectгенеративні мовні моделі
dc.subjectсемантичний пошук
dc.subjectBM25
dc.subjectDense
dc.subjectColBERT
dc.subjectHyDE
dc.subjectгіпотетичні документи
dc.subjectмікросервісна архітектура
dc.subjectgenerative language models
dc.subjectsemantic search
dc.subjectlate interaction
dc.subjecthypothetical documents
dc.subjectmicroservice architecture
dc.titleМультимодальна платформа для аналізу та пошуку даних на основі RAG-архітектури
dc.typeOther

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
2025_кв_роб_маг_КІ_Філіп_єв Євген.pdf
Розмір:
4.25 MB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
8.17 KB
Формат:
Item-specific license agreed upon to submission
Опис: