Методи та моделі керування ієрархічними інтелектуальними агентами на основі великих мовних моделей у задачах планування та навігації

Вантажиться...
Ескіз

Дата

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Харків : Харківський національний університет імені В. Н. Каразіна

Анотація

Дисертаційна робота присвячена вирішенню актуальної науково-прикладної задачі сучасної галузі штучного інтелекту—забезпечення автономної навігації та взаємодії агентів із динамічними середовищами. У роботі розроблено інформаційну технологію для проєктування та навчання автономних ієрархічних агентів, які базуються на великих мовних моделях (LLM). У роботі представлено архітектуру ієрархічного агента, яка включає модуль планування на основі великої мовної моделі та рефлексивну пам’ять. Запропоновано метод рефлексивної адаптації агента, який базується на автоматичному виявленні помилок планування в історії епізодів та генерації коригувальних правил природною мовою. Проаналізовано вплив мовних інструкцій на показники ефективності агента у двовимірному середовищі Minigrid. Покращено процес планування дій агента шляхом використання методу декодування з обмеженням граматики.
The dissertation is dedicated to solving an important scientific and applied problem in artificial intelligence field: ensuring autonomous navigation and agent interaction within dynamic environments. The work develops an information technology (framework) for the design and training of autonomous hierarchical agents based on Large Language Models (LLMs). The dissertation presents a hierarchical agent architecture that includes an LLM-based planning module and reflective memory. A method for reflective agent adaptation is proposed, based on the automatic detection of planning errors within the episode history and the subsequent generation of corrective rules in natural language. The influence of linguistic instructions on agent performance metrics is analyzed within the 2DMinigrid environment. The agent’s action planning process is enhanced through the integration of grammar-constrained decoding.

Опис

Науковий керівник: Струков Володимир Михайлович, кандидат технічних наук, доцент кафедри математичного моделювання та аналізу даних Кваліфікаційна наукова праця на правах рукопису

Бібліографічний опис

Омельченко, І. В. Методи та моделі керування ієрархічними інтелектуальними агентами на основі великих мовних моделей у задачах планування та навігації : дис. … д-ра філософії : спец. 122 – Комп’ютерні науки : галузь знань 12 – Інформаційні технології / Омельченко Ігор Валерійович ; Харк. нац. ун-т ім. В. Н. Каразіна. – Харків, 2026. – 174 с.

Підтвердження

Рецензія

Додано до

Згадується в