Методи та моделі керування ієрархічними інтелектуальними агентами на основі великих мовних моделей у задачах планування та навігації

Омельченко, Ігор Валерійович; Omelchenko, I. V.

Методи та моделі керування ієрархічними інтелектуальними агентами на основі великих мовних моделей у задачах планування та навігації

Файли

Omelchenko_diss.pdf (5,17 MB)

Дата

2026

Автори

Омельченко, Ігор Валерійович

Omelchenko, I. V.

Видавець

Харків : Харківський національний університет імені В. Н. Каразіна

Анотація

Дисертаційна робота присвячена вирішенню актуальної науково-прикладної задачі сучасної галузі штучного інтелекту—забезпечення автономної навігації та взаємодії агентів із динамічними середовищами. У роботі розроблено інформаційну технологію для проєктування та навчання автономних ієрархічних агентів, які базуються на великих мовних моделях (LLM). У роботі представлено архітектуру ієрархічного агента, яка включає модуль планування на основі великої мовної моделі та рефлексивну пам’ять. Запропоновано метод рефлексивної адаптації агента, який базується на автоматичному виявленні помилок планування в історії епізодів та генерації коригувальних правил природною мовою. Проаналізовано вплив мовних інструкцій на показники ефективності агента у двовимірному середовищі Minigrid. Покращено процес планування дій агента шляхом використання методу декодування з обмеженням граматики.
The dissertation is dedicated to solving an important scientific and applied problem in artificial intelligence field: ensuring autonomous navigation and agent interaction within dynamic environments. The work develops an information technology (framework) for the design and training of autonomous hierarchical agents based on Large Language Models (LLMs). The dissertation presents a hierarchical agent architecture that includes an LLM-based planning module and reflective memory. A method for reflective agent adaptation is proposed, based on the automatic detection of planning errors within the episode history and the subsequent generation of corrective rules in natural language. The influence of linguistic instructions on agent performance metrics is analyzed within the 2DMinigrid environment. The agent’s action planning process is enhanced through the integration of grammar-constrained decoding.

Опис

Науковий керівник: Струков Володимир Михайлович, кандидат технічних наук, доцент кафедри математичного моделювання та аналізу даних Кваліфікаційна наукова праця на правах рукопису

Ключові слова

TECHNOLOGY::Information technology, SOCIAL SCIENCES::Statistics, computer and systems science, штучний інтелект, глибоке навчання, нейронні мережі, машинне навчання, стохастична градієнтна оптимізація, навчання з підкріпленням, обробка природної мови, велика мовна модель, transformer, промпт, інтерпретованість, прийняття рішень, агент, віртуальне середовище, Minigrid, artificial intelligence, deep learning, neural networks, machine learning, stochastic gradient optimization, reinforcement learning, natural language processing, large language model, prompt, interpretability, decision making, agent, virtual environment

Бібліографічний опис

Омельченко, І. В. Методи та моделі керування ієрархічними інтелектуальними агентами на основі великих мовних моделей у задачах планування та навігації : дис. … д-ра філософії : спец. 122 – Комп’ютерні науки : галузь знань 12 – Інформаційні технології / Омельченко Ігор Валерійович ; Харк. нац. ун-т ім. В. Н. Каразіна. – Харків, 2026. – 174 с.

URI

https://ekhnuir.karazin.ua/handle/123456789/25783

Колекції

12 Інформаційні технології

Повна інформація про документ
Google Scholar

Методи та моделі керування ієрархічними інтелектуальними агентами на основі великих мовних моделей у задачах планування та навігації

Файли

Дата

Автори

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

URI

Колекції

Підтвердження

Рецензія

Додано до

Згадується в