Порівняння ефективності алгоритмів машинного навчання для виявлення автоматизованих облікових записів (ботів) в онлайн спільнотах
| dc.contributor.author | Данилов, Володимир Максимович | |
| dc.contributor.author | Danylov, Volodymyr | |
| dc.date.accessioned | 2025-07-11T07:28:03Z | |
| dc.date.issued | 2025-06 | |
| dc.description | Науковий керівник: Сузікова Олена Геннадіївна, кандидат психологічних наук, старший викладач кафедри прикладної математики | |
| dc.description.abstract | У сучасних умовах розвитку соціальних мереж і онлайн-спільнот зростає загроза поширення автоматизованих облікових записів (ботів), які здатні імітувати поведінку реальних користувачів, маніпулювати громадською думкою та порушувати цілісність інформаційного простору. Метою цієї бакалаврської роботи є розробка та експериментальна перевірка ефективного методу виявлення ботів на основі мультимодальної трансформер архітектури, який забезпечує високу точність розпізнавання сучасних типів ботів із мінімізацією помилкових спрацьовувань. У роботі поставлено такі завдання: 1. Провести аналіз еволюції методів виявлення ботів, від правилозалежних систем до сучасних гібридних рішень із використанням глибокого навчання. 2. Дослідити особливості застосування трансформер-архітектур і BERT подібних моделей для аналізу текстової активності користувачів та їх переваги у виявленні ботів. 3. Розробити мультимодальну модель, що інтегрує текстові дані, часові патерни активності та метадані профілів, з використанням спеціалізованих механізмів уваги для аналізу часових залежностей. 4. Розробити процедури попередньої обробки, аугментації та балансування даних для подолання дисбалансу класів. 5. Провести експериментальне дослідження на стандартних наборах даних, порівняти результати з існуючими методами виявлення ботів та оцінити обчислювальну складність запропонованої моделі. 6. Розробити рекомендації щодо практичного застосування методу у реальних системах. Об’єктом дослідження є процес виявлення автоматизованих облікових записів у соціальних мережах, предметом – алгоритми машинного навчання, зокрема мультимодальні трансформери для аналізу поведінки користувачів. У роботі використано методи глибокого навчання (трансформер-архітектури, механізми самоуваги), обробки природної мови, аналізу часових рядів та графових структур соціальних зв’язків. Наукова новизна полягає в запропонованій архітектурі мультимодальної трансформер-моделі з інтеграцією текстових, часових і структурних ознак разом із спеціалізованими механізмами уваги для виявлення характерних для ботів часових патернів. Практична значущість роботи полягає в можливості інтеграції розробленого методу в системи модерації контенту, кібербезпеки та електронної комерції для покращення якості виявлення ботів і зниження економічних збитків, пов’язаних зі зловмисною активністю. | |
| dc.description.abstract | In the current environment of social networks and online communities, there is a growing threat of the proliferation of automated accounts (bots) that can imitate the behavior of real users, manipulate public opinion, and violate the integrity of the information space. The purpose of this bachelor's thesis is to develop and experimentally test an effective bot detection method based on a multimodal transformer architecture that provides high accuracy in recognizing modern types of bots while minimizing false positives. The paper sets the following tasks: 1. To analyze the evolution of bot detection methods, from rule-based systems to modern hybrid solutions using deep learning. 2. To investigate the peculiarities of using transformer architectures and BERT-like models to analyze users' text activity and their advantages in detecting bots. 3. To develop a multimodal model that integrates text data, temporal activity patterns, and profile metadata, using specialized attention mechanisms to analyze time dependencies. 4. Develop data preprocessing, augmentation, and balancing procedures to overcome class imbalances. 5. Conduct an experimental study on standard datasets, compare the results with existing bot detection methods, and evaluate the computational complexity of the proposed model. 6. To develop recommendations for the practical application of the method in real systems. The object of the study is the process of detecting automated accounts on social networks, and the subject is machine learning algorithms, in particular multimodal transformers for analyzing user behavior. The study uses methods of deep learning (transformer architectures, self-attention mechanisms), natural language processing, time series analysis, and graph structures of social connections. The scientific novelty lies in the proposed architecture of a multimodal transformer model integrating textual, temporal, and structural features along with specialized attention mechanisms to detect temporal patterns characteristic of bots. The practical significance of the work lies in the possibility of integrating the developed method into content moderation, cybersecurity, and e-commerce systems to improve the quality of bot detection and reduce economic losses associated with malicious activity. | |
| dc.identifier.citation | Данилов, В. М. Порівняння ефективності алгоритмів машинного навчання для виявлення автоматизованих облікових записів (ботів) в онлайн спільнотах : кваліфікаційна робота бакалавра : спеціальність 113 «Прикладна математика» : освітньо-професійна програма «Прикладна математика» / В. М. Данилов ; наук. кер. О. Г. Сузікова. – Харків : Харківський національний університет імені В. Н. Каразіна, 2025. – 128 с. | |
| dc.identifier.uri | https://ekhnuir.karazin.ua/handle/123456789/22363 | |
| dc.language.iso | uk | |
| dc.publisher | Харків : Харківський національний університет імені В. Н. Каразіна | |
| dc.subject | MATHEMATICS::Applied mathematics | |
| dc.subject | автоматизований обліковий запис | |
| dc.subject | бот | |
| dc.subject | мультимодальний трансформер | |
| dc.subject | BERT | |
| dc.subject | механізм уваги | |
| dc.subject | глибоке навчання | |
| dc.subject | виявлення ботів | |
| dc.subject | соціальні мережі | |
| dc.subject | automated account | |
| dc.subject | bot | |
| dc.subject | multimodal transformer | |
| dc.subject | BERT | |
| dc.subject | attention mechanism | |
| dc.subject | deep learning | |
| dc.subject | bot detection | |
| dc.subject | social networks | |
| dc.title | Порівняння ефективності алгоритмів машинного навчання для виявлення автоматизованих облікових записів (ботів) в онлайн спільнотах | |
| dc.title.alternative | Comparison of the effectiveness of machine learning algorithms for detecting automated accounts (bots) in online communities | |
| dc.type | Other |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Кваліфікаційна робота бакалавра Данилов В.М..pdf
- Розмір:
- 4.44 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 3.42 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис:
