Математичне моделювання пандемії ковід-19 методами аналізу "великих даних"
Дата
2024-06
Назва журналу
Номер ISSN
Назва тому
Видавець
Харків : Харківський національний університет імені В.Н. Каразіна
Анотація
В основі цієї роботи лежить кластеризація європейських країн на основі даних про захворюваність на COVID-19 з 2020 по 2022 роки, які містять кількість нових випадків на мільйон населення та загальну кількість випадків на мільйон населення. Основними методами кластеризації, які використовуються в дослідженні, є модифікації метода k-середніх на основі евклідової метрики та відстані Махаланобіса, які були розглянуті як швидша альтернатива до методу найближчого сусіда. Результати підтвердили важливість географічної близькості країн, виділяючи при цьому незвичайні сполуки географічно віддалених країн, які неодноразово з’являлися в різних результатах кластеризації.
This paper is dedicated to the clusterization of European countries based on their COVID-19 morbidity data from 2020 to 2022, which include the number of new cases per million population as well as the total number of cases per million population. The main methods of clusterization used in the research are the variations of k-means clustering based on Euclidean metrics and Mahalanobis distance, which were tested as a faster alternative to the nearest neighbor method. The results confirmed importance of geographic vicinity proximity while showing the unexpected combinations of geographically distant countries that repeatedly appeared in different clusterizations.
This paper is dedicated to the clusterization of European countries based on their COVID-19 morbidity data from 2020 to 2022, which include the number of new cases per million population as well as the total number of cases per million population. The main methods of clusterization used in the research are the variations of k-means clustering based on Euclidean metrics and Mahalanobis distance, which were tested as a faster alternative to the nearest neighbor method. The results confirmed importance of geographic vicinity proximity while showing the unexpected combinations of geographically distant countries that repeatedly appeared in different clusterizations.
Опис
Ключові слова
MATHEMATICS::Applied mathematics, кластерний аналіз, метод k-середніх, відстань Махаланобіса, cluster analysis, k-means clustering, Mahalanobis distance
Бібліографічний опис
Фальченко, Іван Русланович. Математичне моделювання пандемії ковід-19 методами аналізу "великих даних" : кваліфікаційна робота першого (бакалаврського) рівня вищої освіти : спеціальність 113 «Прикладна математика» :освітньо-професійна програма «Прикладна математика» / І.Р. Фальченко ; науковий керівник Н.М. Кізілова. – Харків : Харківський національний університет імені В.Н. Каразіна, 2024. – 59 с.