Порівняння ефективності алгоритмів машинного навчання для виявлення автоматизованих облікових записів (ботів) в онлайн спільнотах

dc.contributor.authorДанилов, Володимир Максимович
dc.contributor.authorDanylov, Volodymyr
dc.date.accessioned2025-07-11T07:28:03Z
dc.date.issued2025-06
dc.descriptionНауковий керівник: Сузікова Олена Геннадіївна, кандидат психологічних наук, старший викладач кафедри прикладної математики
dc.description.abstractУ сучасних умовах розвитку соціальних мереж і онлайн-спільнот зростає загроза поширення автоматизованих облікових записів (ботів), які здатні імітувати поведінку реальних користувачів, маніпулювати громадською думкою та порушувати цілісність інформаційного простору. Метою цієї бакалаврської роботи є розробка та експериментальна перевірка ефективного методу виявлення ботів на основі мультимодальної трансформер архітектури, який забезпечує високу точність розпізнавання сучасних типів ботів із мінімізацією помилкових спрацьовувань. У роботі поставлено такі завдання: 1. Провести аналіз еволюції методів виявлення ботів, від правилозалежних систем до сучасних гібридних рішень із використанням глибокого навчання. 2. Дослідити особливості застосування трансформер-архітектур і BERT подібних моделей для аналізу текстової активності користувачів та їх переваги у виявленні ботів. 3. Розробити мультимодальну модель, що інтегрує текстові дані, часові патерни активності та метадані профілів, з використанням спеціалізованих механізмів уваги для аналізу часових залежностей. 4. Розробити процедури попередньої обробки, аугментації та балансування даних для подолання дисбалансу класів. 5. Провести експериментальне дослідження на стандартних наборах даних, порівняти результати з існуючими методами виявлення ботів та оцінити обчислювальну складність запропонованої моделі. 6. Розробити рекомендації щодо практичного застосування методу у реальних системах. Об’єктом дослідження є процес виявлення автоматизованих облікових записів у соціальних мережах, предметом – алгоритми машинного навчання, зокрема мультимодальні трансформери для аналізу поведінки користувачів. У роботі використано методи глибокого навчання (трансформер-архітектури, механізми самоуваги), обробки природної мови, аналізу часових рядів та графових структур соціальних зв’язків. Наукова новизна полягає в запропонованій архітектурі мультимодальної трансформер-моделі з інтеграцією текстових, часових і структурних ознак разом із спеціалізованими механізмами уваги для виявлення характерних для ботів часових патернів. Практична значущість роботи полягає в можливості інтеграції розробленого методу в системи модерації контенту, кібербезпеки та електронної комерції для покращення якості виявлення ботів і зниження економічних збитків, пов’язаних зі зловмисною активністю.
dc.description.abstractIn the current environment of social networks and online communities, there is a growing threat of the proliferation of automated accounts (bots) that can imitate the behavior of real users, manipulate public opinion, and violate the integrity of the information space. The purpose of this bachelor's thesis is to develop and experimentally test an effective bot detection method based on a multimodal transformer architecture that provides high accuracy in recognizing modern types of bots while minimizing false positives. The paper sets the following tasks: 1. To analyze the evolution of bot detection methods, from rule-based systems to modern hybrid solutions using deep learning. 2. To investigate the peculiarities of using transformer architectures and BERT-like models to analyze users' text activity and their advantages in detecting bots. 3. To develop a multimodal model that integrates text data, temporal activity patterns, and profile metadata, using specialized attention mechanisms to analyze time dependencies. 4. Develop data preprocessing, augmentation, and balancing procedures to overcome class imbalances. 5. Conduct an experimental study on standard datasets, compare the results with existing bot detection methods, and evaluate the computational complexity of the proposed model. 6. To develop recommendations for the practical application of the method in real systems. The object of the study is the process of detecting automated accounts on social networks, and the subject is machine learning algorithms, in particular multimodal transformers for analyzing user behavior. The study uses methods of deep learning (transformer architectures, self-attention mechanisms), natural language processing, time series analysis, and graph structures of social connections. The scientific novelty lies in the proposed architecture of a multimodal transformer model integrating textual, temporal, and structural features along with specialized attention mechanisms to detect temporal patterns characteristic of bots. The practical significance of the work lies in the possibility of integrating the developed method into content moderation, cybersecurity, and e-commerce systems to improve the quality of bot detection and reduce economic losses associated with malicious activity.
dc.identifier.citationДанилов, В. М. Порівняння ефективності алгоритмів машинного навчання для виявлення автоматизованих облікових записів (ботів) в онлайн спільнотах : кваліфікаційна робота бакалавра : спеціальність 113 «Прикладна математика» : освітньо-професійна програма «Прикладна математика» / В. М. Данилов ; наук. кер. О. Г. Сузікова. – Харків : Харківський національний університет імені В. Н. Каразіна, 2025. – 128 с.
dc.identifier.urihttps://ekhnuir.karazin.ua/handle/123456789/22363
dc.language.isouk
dc.publisherХарків : Харківський національний університет імені В. Н. Каразіна
dc.subjectMATHEMATICS::Applied mathematics
dc.subjectавтоматизований обліковий запис
dc.subjectбот
dc.subjectмультимодальний трансформер
dc.subjectBERT
dc.subjectмеханізм уваги
dc.subjectглибоке навчання
dc.subjectвиявлення ботів
dc.subjectсоціальні мережі
dc.subjectautomated account
dc.subjectbot
dc.subjectmultimodal transformer
dc.subjectBERT
dc.subjectattention mechanism
dc.subjectdeep learning
dc.subjectbot detection
dc.subjectsocial networks
dc.titleПорівняння ефективності алгоритмів машинного навчання для виявлення автоматизованих облікових записів (ботів) в онлайн спільнотах
dc.title.alternativeComparison of the effectiveness of machine learning algorithms for detecting automated accounts (bots) in online communities
dc.typeOther

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Кваліфікаційна робота бакалавра Данилов В.М..pdf
Розмір:
4.44 MB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
3.42 KB
Формат:
Item-specific license agreed upon to submission
Опис: