Харківський національний університет імені В. Н. Каразіна Факультет математики і інформатики Кафедра прикладної математики Кваліфікаційна робота освітньо-кваліфікаційний рівень: бакалавр на тему «Закономірності динаміки хвиль пандемії Ковід-19 в країнах Європи» Виконала: студентка групи МП41 ІV курсу (перший бакалаврський рівень) спеціальності 113 «Прикладна математика» освітньої програми «Прикладна математика» Шилкунова Аріна Олександрівна Керівник: доктор фіз.-мат. наук , професор кафедри прикладної математики Кізілова Наталія Миколаївна Рецензент: кандидат фіз.-мат. наук, доцент кафедри теоретичної та прикладної інформатики Меняйлов Євген Сергійович Харків – 2024 рік 2 АНОТАЦІЯ Шилкунова А.О. «Закономірності динаміки хвиль пандемії Ковід- 19 в країнах Європи» Дана дипломна робота присвячена аналізу закономірностей поширення COVID-2019 у Європі з акцентом на виявлення та порівняння патернів кожної з п’яти хвиль пандемії. У рамках дослідження проводиться кореляційний аналіз даних з використанням методів статистичного аналізу. ABSTRACT Shylkunova A.A."Patterns of the Dynamics of COVID-19 Waves in European Countries" This thesis is dedicated to analyzing the patterns of COVID-2019 spread in Europe with a focus on identifying and comparing the patterns of each of the five waves of the pandemic. The study includes a correlation analysis of the data using statistical analysis methods. 3 ЗМІСТ АКТУАЛЬНІСТЬ ТЕМИ ........................................................................................ 4 АНАЛІЗ ЛІТЕРАТУРИ ........................................................................................... 6 ПОСТАНОВКА ЗАДАЧІ ........................................................................................ 8 МАТЕРІАЛИ ТА МЕТОДИ ................................................................................... 9 1. Аналіз гіпотез. ................................................................................................. 9 2. Порівняння поведінка хвиль COVID-2019 між країнами. ........................ 14 3. Візуалізація роботи цього алгоритму на парі «Україна-Польща». .......... 18 РЕЗУЛЬТАТИ ........................................................................................................ 24 ВИСНОВКИ ........................................................................................................... 26 ДЖЕРЕЛА .............................................................................................................. 28 ДОДАТКИ .............................................................................................................. 30 4 АКТУАЛЬНІСТЬ ТЕМИ Інфекційні захворювання належать до найбільш розповсюджених причин смерті по всьому світу, перевищуючи всі військові конфлікти за своєю смертельністю. Наприклад, пандемія "іспанки" у 1918–1919 роках забрала понад 50 мільйонів життів, а щорічні епідемії грипу забирають до 35 000 життів щороку. Пандемії та епідемії мають серйозний вплив на економіки країн у короткостроковій та довгостроковій перспективі [11]. Боротьба з поширенням інфекцій включає заходи, такі як карантин, підготовка медичних установ, ізоляція заражених та відстеження контактів, що потребує значних ресурсів охорони здоров'я, людських ресурсів та фінансових витрат. Епідемії також можуть призвести до зменшення податкових надходжень та збільшення витрат, особливо в країнах з низьким рівнем доходу. Економічні наслідки включають не лише втрату робочої сили через захворювання та смертність, але й порушення в транспортній сфері, закриття підприємств, обмеження в торгівлі та переміщеннях, а також закриття кордонів. Вивчення інфекційних захворювань розпочалося з роботи Джона Граунта в його книзі 1662 року "Природні та політичні спостереження над списками померлих", де він аналізував причини смерті на основі щотижневих записів про смертність у Лондоні та розробив метод оцінки ризиків смертності від різних захворювань. Зараз тисячі вчених продовжують його справу, але вже в боротьбі з новою епідемією COVID-2019, яка охопила світ 4 роки тому. Для мінімізації шкоди багато дослідників було залучено до вивчення різних явищ, пов'язаних з COVID-19. Сучасні дослідження в галузі аналізу даних спрямовані на вивчення способів ранньої діагностики COVID-19, визначення груп ризику людей на основі аналізу статистики, прогнозування тяжкості 5 перебігу захворювання, а також визначення дат зниження приросту кількості хворих. Руйнівний соціально-економічний вплив пандемії COVID-19 у найближчі роки відчуватиметься найбільш гостро у всьому світі. Аналіз даних про коронавірус дозволяє краще зрозуміти особливості пандемії, її наслідки та ефективність втручань. Це допомагає приймати обґрунтовані рішення та розробляти стратегії стримування та подолання пандемії. Аналітичні дослідження можуть стати одним із напрямків керування ризиками, які несе COVID-19. 6 АНАЛІЗ ЛІТЕРАТУРИ Засновниками теорії кореляції [1] вважаються англійські біометрики Ф. Гальтон (1822–1911) і К. Пірсон (1857–1936). Термін "кореляція" означає відношення, відповідність. Уявлення про кореляцію як про взаємозв'язок випадкових змінних лежить в основі статистичної теорії кореляції - вивчення залежності варіації ознаки від оточуючих умов. Деякі ознаки виступають у ролі впливових (факторних), інші - ті, на які впливають, результативних[4]. У кореляційних зв'язках між зміною факторної і результативної ознаки немає повної відповідності. У складній взаємодії знаходиться сама результативна ознака. Тому результати кореляційного аналізу мають значення у даному контексті, а інтерпретація цих результатів у загальному вигляді потребує побудови системи кореляційних зв’язків [7]. Вони характеризуються множиною причин і наслідків, і за допомогою них встановлюється тенденція зміни результативної ознаки при зміні величини факторної ознаки. Кореляційний зв'язок - це частковий випадок статистичного зв'язку, що використовується при встановленні тісноти залежності між явищами, процесами, об'єктами. Необхідність боротьби з пандемією COVID-19 об'єднала науково- дослідні зусилля вчених усього світу. Це глобальне випробування стало каталізатором для численних міжнародних співпраць, інтенсивного обміну знаннями та ресурсами. Вчені з різних країн і континентів об'єднали свої зусилля, щоб спільно розробити ефективні стратегії для контролю та подолання поширення вірусу. Для нашого дослідження важливими є наступні наукові роботи: В дослідження [13] вдалося оцінити зв'язок між випадками захворювання COVID-19 і індексом багатомірної бідності (ІББ) у місті Манісалес (Колумбія) й представити результати розвідницького аналізу. Це дослідження має велике значення для розуміння того, як соціально-економічні фактори впливають на поширення пандемії. Використання індексу 7 багатомірної бідності як одного з ключових показників дозволяє глибше зрозуміти, які групи населення є найбільш вразливими до вірусу. Це знання може бути використане для розробки цільових заходів і політик, спрямованих на зниження рівня захворюваності серед найбільш уразливих верств населення. Оскільки кореляційні методи забезпечують важливі інструменти для наукових досліджень, дозволяючи вченим швидко та ефективно аналізувати великі масиви даних, виявляти ключові тенденції та взаємозв'язки, цінними для нашої роботи є стаття індонезійських учених Школи прикладних наук Університету Телком [14]. У центрі дослідження - аналіз випадків COVID-19 у 137 країнах на основі кореляції Спірмена й Кендалла та їх групування за рівнем кореляції по парах. В результаті на основі високих показників кореляції, 39 країн були зібрані в одну групу при використанні метода Спірмена, та 27 країн – при використанні методу Кендалла. З усіх країн, які спостерігалися, Непал, Шрі Ланка, Камбоджа, В'єтнам та Австралія мають найнижче значення кореляції, що означає, що в цих країнах кількість підтверджених випадків не буде швидко зростати. Група дослідників Уханьского університету [15] проаналізувала клінічні й біохімічні параметри між легкими й важкими пацієнтами, що допомогло виявити важких або критичних пацієнтів на ранній стадії; кореляцію критичності захворювання із клінічними особливостями й біохімічними маркерами периферичної крові. У зазначеному дослідженні граничні значення для пацієнтів у критичному стані були розраховані за допомогою кривої ROC. Загалом, дослідження, проведені на міжнародному рівні, підтверджують важливість міждисциплінарного підходу та використання новітніх технологій у боротьбі з пандемією COVID-19. Результати цих досліджень є цінним джерелом для подальших наукових розробок та створення ефективних стратегій боротьби з пандеміями на глобальному рівні. 8 ПОСТАНОВКА ЗАДАЧІ Метою дипломної роботи є всебічний аналіз закономірностей поширення COVID-2019 у Європі з акцентом на виявлення та порівняння патернів кожної з п'яти хвиль пандемії. У межах дослідження буде проведено детальний кореляційний аналіз даних, що включає використання підходів статистичного аналізу. Для досягнення поставленої мети передбачається виконання таких завдань: Аналіз та підготовка даних щодо поширення COVID-2019 за період кожної з п'яти хвиль пандемії для двадцяти обраних країн Європи. Дані включатимуть кількість нових випадків та смертність. Застосування методів описової статистики для первинного аналізу даних, що включає розрахунок середніх значень, стандартних відхилень та інших статистичних показників. Проведення кореляційного аналізу з використанням коефіцієнта парної кореляції Пірсона з метою оцінки ступеня взаємозв'язку між показниками поширення COVID-2019 у різних країнах. Побудова графіків залежності, діаграм розсіювання та полів кореляції для візуалізації результатів аналізу. Порівняння результатів аналізу кожної пари країн із метою виявлення загальних і специфічних патернів поширення вірусу у різні хвилі пандемії. 9 МАТЕРІАЛИ ТА МЕТОДИ 1. Аналіз гіпотез. Для аналізу даних було використано програмне забезпечення Excel. Було обрано 20 країн: Албанія, Хорватія, Греція, Румунія, Франція, Велика Британія, Іспанія, Португалія, Італія, Німеччина, Швейцарія, Австрія, Швеція, Норвегія, Фінляндія, Данія, Польща, Україна, Литва, Словаччина; Було проаналізовано дані кількості нових випадків захворювання та смертності від COVID-19 у країнах Європи за 2020-2023 роки. При відборі факторів кореляційного аналізу важливо враховувати, що він ґрунтується на причинно-наслідкових зв'язках. При побудові багатофакторної кореляційної моделі варто відібрати фактори, які мають найбільший вплив з коефіцієнтом парної кореляції [10]. У цьому дослідженні в якості основних гіпотез висунуті наступні: 1) Існує лінійний зв’язок між кількістю хворих та середнім віком населення. 2) Існує лінійний зв’язок між кількістю померлих та середнім віком населення. 3) Існує лінійний зв’язок між кількістю хворих та щільністю населення в різних країнах. 4) Існує лінійний зв’язок між смертністю та екологічною ситуацією в різних країнах(індекс EPI)[12] 5) Існує лінійний зв’язок між смертністю та рівнем релігійності в різних країнах 6) Існує лінійний зв’язок між смертністю та кількістю мігрантів в різних країнах 7) Існує лінійний зв’язок між кількістю хворих та часткою населення, яка користується безпечними послугами питної води (%) в різних країнах.[3] 10 8) Існує лінійний зв’язок між смертністю та стандартизованої за віком поширеності гіпертонії в різних країнах. 9) Існує лінійний зв’язок між кількістю хворих та щільністю лікарів в різних країнах. 10) Існує лінійний зв’язок між кількістю хворих та кількістю вакцинованих в різних країнах. 11) Існує лінійний зв’язок між смертністю та імовірністю смерті від будь-якого з серцево-судинних захворювань, раку, діабету, хронічних респіраторних захворювань в різних країнах. Для створення алгоритму перевірки гіпотез необхідно аналізувати кожну з передбачених гіпотез окремо. Метод кореляції використовується для наочного представлення взаємозв'язку між показниками. Для цього будується графік у прямокутній системі координат, де на осі Y відображаються індивідуальні значення результативного показника, а на осі X - індивідуальні значення факторного показника. Цей метод застосовний для розрахунку кореляції для всіх гіпотез, які будуть представлені в роботі. Спочатку розглянемо означення коваріації та коефіцієнту кореляції [2]: cov(X, Y) = 𝑀[(𝑋 − 𝑀(𝑋))(𝑌 − 𝑀(𝑌))] = 𝑀(𝑋𝑌) − 𝑀(𝑋)𝑀(𝑌) r = r(𝑋, 𝑌) = cov(X,Y) σX∗σY = 𝑀[(𝑋−𝑀(𝑋))(𝑌−𝑀(𝑌))] σX∗σY , де σX, σY-середні квадратичні відхилення, які можна обчислити за формулою: σX = √ ∑ (xi−x̅)2n i=1 n ; σY = √ ∑ (yi−y̅)2n i=1 n ; Тепер приступаємо до обчислень (надалі розглядаємо вибіркові оцінки): Спочатку обчислюється коваріація , де x і y - індивідуальні значення факторної та результативної ознаки відповідно. cov(X, Y) = XY̅̅̅̅ − X̅ ∗ Y̅ 11 cередньовибіркове значення для X: Х̅ = 1 n ∑ xi n i=1 cередньовибіркове значення для Y: �̅� = 1 n ∑ yi n i=1 Потім розраховується коефіцієнт кореляції, який є показником ступеня тісноти зв'язку між ознаками. Цей коефіцієнт приймає значення від -1 до +1 і оцінюється відповідно до шкали Чеддока [8]. Після порівняння коефіцієнта з шкалою визначається ступінь зв'язку між ознаками. Таблиця 1. Шкала Чеддока Підрахуємо лінійний коефіцієнт кореляції за формулою: r = cov(X, Y) σX ∗ σY Для перевірки нульової гіпотези про рівність нулю генерального коефіцієнта кореляції за конкуруючою гіпотезою H1 : 𝑟 ≠ 0 , потрібно обчислити величину випадкової помилки. Для цього будемо використовувати критерій Стьюдента[2]. Для нього tnabl обчислюється як: tnabl = rxy √n − 2 √1 − rxy 2 rxy- це обчислений вибірковий коефіцієнт кореляції, n - кількість спостережень у вибірці. Тіснота зв’язку Значення коефіцієнта кореляції при наявності Прямого зв’язку Оберненого зв’язку Слабка 0,1-0,3 (-0,1)-(-0,3) Помірна 0,3-0,5 (-0,3)-(-0,5) Помітна 0,5-0,7 (-0,5)-(-0,7) Висока 0,7-0,9 (-0,7)-(-0,9) Дуже висока 0,9-0,99 (-0,9)-(-0,99) 12 За таблицею критичних точок розподілу Стьюдента, для заданого рівня значущості 𝑞 та числа ступенів свободи k = n – 2, необхідно знайти 𝑡𝑘;𝑞 за таблицею Стьюдента. Якщо значення |tnabl| < 𝑡𝑘;𝑞 ,то робимо висновок про статистичну незначущість коефіцієнта кореляції. Якщо |tnabl| > 𝑡𝑘;𝑞, то відхиляємо нульову гіпотезу. Тоді отримане значення коефіцієнта кореляції вважається значущим. Розглянемо результати перевірки гіпотези номер 11 о залежності між смертністю від COVID та імовірністю смерті від будь-якого з серцево- судинних захворювань, раку, діабету, хронічних респіраторних захворювань в різних країнах. Спочатку підрахуємо вибіркове середнє для стовпчиків B,C,D. Рис 1. Дані, які було використано Отримаємо наступні значення: X̅ = 0.26, Y̅ =12.84, XY̅̅̅̅ =3.58 Одержимо коваріацію та середні квадратичні відхилення : cov(X, Y) = 0.256, σX=0.092, σY=4.74 Тепер отримаємо лінійний коефіцієнт кореляції : rxy = 0.584 13 В даному випадку tnabl = 3.055, що більше ніж 𝑡18;0.05 = 2.1. Тому на рівні значущості 𝑞 = 0.05 відхиляємо основну гіпотезу Н0, приймаємо Н1 і робимо висновок про статистичну значущість коефіцієнту кореляції. Важливо зазначити, що імовірність смерті між була розрахована з використанням показників смертності від певної причини в кожній 5-річній віковій групі та стандартних методів таблиці життя. Оцінки отримано з оцінки глобального здоров’я ВООЗ (GHE). Рис 2. Графік залежності між смертністю від COVID та імовірністю смерті від будь-якого з серцево-судинних захворювань, раку, діабету, хронічних респіраторних захворювань в різних країнах. Рис 3. Поле кореляції За шкалою Чеддока rxy = 0.584 свідчить про помітний прямий зв’язок. Аналогічнім чином було розглянуто інші гіпотези. 0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 Probability of dying from any of CVD, cancer, diabetes, CRD total deathes per millliom % 0 5 10 15 20 25 30 35 40 45 50 0,00 5,00 10,00 15,00 20,00 25,00 30,00 14 2. Порівняння поведінки хвиль COVID-2019 між країнами. Розглянемо алгоритм: 1) Визначили дати початку, закінчення та піка для кожної хвилі. Отримали наступну таблицю: Таблиця 2. Фрагмент таблиці «Дати початку, закінчення та піку для кожної хвилі пандемії» Country WaveStart Peak WaveEnd WaveNumber France 02.03.2020 13.04.2020 02.08.2020 1 03.08.2020 22.11.2020 16.07.2021 2 17.08.2021 15.02.2022 21.06.2022 3 22.06.2022 24.07.2022 29.09.2022 4 30.09.2022 05.01.2023 03.03.2023 5 Romania 28.03.2020 06.12.2020 02.03.2021 1 03.03.2021 25.04.2021 31.07.2021 2 01.08.2021 05.11.2021 12.01.2022 3 13.01.2022 21.02.2022 15.06.2022 4 16.06.2022 11.08.2022 11.11.2022 5 Austria 15.03.2020 15.04.2020 17.07.2020 1 18.07.2020 08.12.2020 29.07.2021 2 30.07.2021 07.12.2021 21.01.2022 3 22.01.2022 03.04.2022 11.06.2022 4 12.06.2022 15.10.2022 03.03.2023 5 2) Для розрахунку Коефіцієнта Пірсона для пар країн застосовуємо 2 таблиці new_deaths_smoothed_per_milion та попередньою таблицю, що містить інформацію про дати початку, закінчення та піку для кожної хвилі пандемії. Для подальшої реалізації алгоритму була застосована мова програмування Java. 15 Починаємо алгоритм зі зчитування та початкової підготовки даних: 3) Найтісніший зв'язок у двох взаємопов'язаних рядах виникає, якщо зсунути один ряд відносно другого на період лагу [6]. Тому при наявності відставання в розвитку двох взаємопов'язаних показників необхідно зсунути рівні одного ряду відносного другого на деякий проміжок часу, що дасть змогу одержати більш правильну оцінку ступеня тісноти кореляційного зв'язку. Тому будемо розглядати обидва випадки: без зсуву та зі зсувом. a) Розрахунок без зсуву: Знаходимо список країн, що беруть участь у аналізі Знаходимо дати пізнього старту та раннього закінчення хвилі для кожної пари країн І фільтруємо new_deaths дані по знайденому проміжку. 16 За відфільтрованими даними підраховуємо коефіцієнт Пірсона і записуємо в структуру даних для зберігання b) Розрахунок зі зсуву: Перейменовуємо колонки для зручності: Об'єднуємо дані для кожної пари за номером хвилі. Знаходимо різницю між значенням піків та отримуємо зсув, відштовхуючись від того, у якої країни пік був пізніше. Для країни, у якої пік був пізніше, перенесемо дату початку та кінця хвилі на значення, знайденого зсуву. 17 Знаходимо дати пізнього старту та раннього закінчення хвилі для даної пари країн Аналогічно з датами початку та кінця хвилі робимо зсув для всіх інших значень для країни, у якої пік був пізніше. Фільтруємо дані по знайденому проміжку (пізній старт – раннє закінчення) Підраховуємо коефіцієнт Пірсона і записуємо в структуру даних. 18 3. Візуалізація роботи цього алгоритму на парі «Україна-Польща». В якості прикладу розглянемо пару Україна – Польща. Візьмемо дані для нових випадків захворювання . В першу чергу, для явної візуалізації, побудуємо графік смертності від часу для обох країн одразу. Після чого можна знайти піки для кожної хвилі та різницю у часі між ними. Тепер можливо зробити зсув, щоб піки співпадали. Рис 4. Графік нових випадків, побудований для України і Польщі одночасно. Для кожної хвилі побудовано діаграму розсіювання по осі Х відкладено кількість нових випадків COVID-2019 за період хвилі у Польщі, а по осі Y – в Україні. Графіки будуються без зсуву та зі зсувом, у програмному забезпечені Origin, що дозволяє одразу знайти коефіцієнт Пірсона. 19 I Хвиля: Рис.5. Перша хвиля, без зсуву. Рис.6. Перша хвиля, зі зсувом 23 дні. 20 Для кожної наступної хвилі робимо таким самим чином. II Хвиля: Рис.7. Друга хвиля, без зсуву. Коефіцієнт Пірсона в даному випадку більше ніж 0,9, значить немає необхідності робити зсув. III Хвиля: Рис.8. Третя хвиля, без зсуву. 21 Рис.9. Третя хвиля, зі зсувом 34. IV Хвиля: Рис.10. Четверта хвиля, без зсуву. Аналогічно до другої хвилі, значення коефіцієнту більше ніж 0,9, зсув не робимо. 22 V Хвиля: Рис.11. П’ята хвиля, без зсуву. Рис.12. П’ята хвиля, зі хсувом 22 дні. 23 Отримуємо графік із зсувом: Рис 13. Графік нових випадків, побудований для України і Польщі одночасно, з зсувом кожної хвилі. 24 РЕЗУЛЬТАТИ № Назва гіпотези Результат 1. Існує лінійний зв’язок між кількістю хворих та середнім віком населення. rxy = 0.53 2. Існує лінійний зв’язок між кількістю померлих та середнім віком населення. rxy = 0.39 3. Існує лінійний зв’язок між кількістю хворих та щільністю населення в різних країнах. rxy = 0.28 4. Існує лінійний зв’язок між смертністю та екологічною ситуацією в різних країнах (індекс EPI) rxy = 0.1 5. Існує лінійний зв’язок між смертністю та рівнем релігійності в різних країнах rxy = 0.58 6. Існує лінійний зв’язок між смертністю та кількістю мігрантів в різних країнах rxy = 0.42 7. Існує лінійний зв’язок між кількістю хворих та часткою населення, яка користується безпечними послугами питної води (%) в різних країнах. rxy = 0.46 8. Існує лінійний зв’язок між смертністю та стандартизованої за віком поширеності гіпертонії в різних країнах. rxy = 0.46 9. Існує лінійний зв’язок між кількістю хворих та щільністю лікарів в різних країнах. rxy = 0.42 10. Існує лінійний зв’язок між кількістю хворих та кількістю вакцинованих в різних країнах. rxy = 0.65 11. Існує лінійний зв’язок між смертністю та імовірністю смерті від будь-якого з серцево-судинних захворювань, раку, діабету, хронічних респіраторних захворювань в різних країнах. rxy = 0.58 Для гіпотез 1,5,7,8,10,11 на рівні значущості 𝑞 = 0.05 відхиляємо основну гіпотезу Н0, приймаємо Н1 і робимо висновок про статистичну значущість коефіцієнту кореляції r. За шкалою Чеддока для гіпотез 1,5,10,11 значення r свідчить про помітний прямий зв’язок, для гіпотез 7,8 – про помірний прямий зв’язок. 25 Для гіпотез 2,3,4,6,9 с довірчою ймовірністю 𝛼 = 0.95 приймаємо основну гіпотезу Н0 про те, що 𝑟 = 0, і робимо висновок про статистичну незначущість коефіцієнту кореляції r. Також було отримано 10 таблиць (додаток 1-10) для кожної хвилі в обох випадках : з зсувом та без зсуву. Було розраховано середнє значення коефіцієнтів для п’яти хвиль. Рис 14. Середнє арифметичне коефіцієнтів парної кореляції за п’ять хвиль для кожної пари країн зі зсувом 26 ВИСНОВКИ На основі порівняльного аналізу поведінки хвиль у різних країнах можна зробити такі висновки: На початкових етапах (перша хвиля) коефіцієнт парної кореляції приймає високі значення навіть без зсувів. Це може бути обумовлено непідготовленістю суспільства до зіткнення з вірусом із настільки високою швидкістю поширення. З початком другої хвилі в більшості країн пройшов (або проходить) період вакцинації і вживаються різні заходи протидії COVID- 19, що сильно впливає на показник смертності. Також важливо враховувати, що в деякій групі країн ще не закінчилася перша хвиля, тоді як в іншій вже триває друга. Внаслідок цього можна помітити значне зниження коефіцієнта кореляції для кожної окремої пари країн. Однак, все ще можна виділити пари з досить високим коефіцієнтом кореляції, незважаючи на вищезазначені фактори. Для цього є кілька можливих причин: географічне положення та схожі кліматичні умови або ж схожа політика боротьби з пандемією, включаючи вид вакцини, яка мала найбільше поширення в тій чи іншій державі. Результати, отримані для четвертої хвилі без зсувів, найскладніше піддаються інтерпретації через велику кількість невідповідностей щодо дат початку четвертої хвилі та закінчення третьої. Однак якщо розглянути дані, отримані в результаті зсуву піків, можна помітити високу ступінь кореляції між рядом країн. Кількість нових смертей від захворювання значно зменшилася, сплески були не такими агресивними, і пандемія пішла на спад. Під час аналізу п'ятої хвилі були отримані найнижчі коефіцієнти кореляції, скоріш за все це обумовлено тим, що різниця в часових проміжках для п'ятої хвилі у різних країнах колосальна. На основі аналізу висунутих гіпотез не можна зробити висновки про високу ступінь кореляції між соціально-політичними, екологічними факторами і смертністю від COVID-19 (або ж кількістю нових випадків), однак 27 при оцінці ризиків і розробці заходів протидії подібному інфекційному захворюванню їх потрібно враховувати для більш ефективної боротьби з пандемією. 28 ДЖЕРЕЛА [1] Thomas J. Archdeacon. Correlation and Regression Analysis: A Historian's Guide. Univ of Wisconsin Press, 1994. 352 с. [2] Турчин В.М. Теорія ймовірностей та математична статистика. Основні поняття, приклади, задачі. – Дніпропетровськ, ІМА-прес, 2014. – 556 с. [3] Research and data to make progress against the world’s largest problems. [Electronic resource]. Available: https://ourworldindata.org [4] Н. М. Кізілова. Навчально-методичне видання Методи аналізу «Великих даних». Харківський національний університет імені В.Н. Каразіна. 2021. [5] Hélio Amante Miot. Correlation analysis in clinical and experimental studies. Jornal Vascular Brasileiro. 2018. [6] James D. Miller. Statistics for Data Science. Packt Publishing. 2017. [7] Cramer H. Mathematical methods of statistics. Princeton University Press. 1946. [8] Kendall, M.G. and Stuart, A. The Advanced Theory of Statistics. Volume 3: Design and Analysis, and Time-Series. London : Charles Griffin. 1976. [9] Kendall, M.G. and Stuart, A. The Advanced Theory of Statistics. Volume 2: Inference and Relationship. Hafner Publishing Co. 1967. [10] Dekking F.M., Kraaikamp C., Lopuhaa H.P.,Meester L.E. A Modern Introduction to Probability and Statistics. Understanding Why and How. Springer Science & Business Media. 2005. [11] Lora Jones, Daniele Palumbo & David Brown. Coronavirus: How the pandemic has changed the world economy. BBC News. 2021. [12] Environmental Performance Index, 2022 Release (1950 – 2022). Available: https://sedac.ciesin.columbia.edu/data/set/epi-environmental-performance- index-2022 [13] Vladimir Henao-Cespedes, Yeison Alberto Garcés-Gómez, Silvia Ruggeri, Tatiana María Henao-Cespedes. Relationship analysis between the spread of COVID-19 and the multidimensional poverty index in the city of Manizales, Colombia. Science direct. 2021. https://ourworldindata.org/ https://pubmed.ncbi.nlm.nih.gov/?term=Miot%20HA%5BAuthor%5D https://sedac.ciesin.columbia.edu/data/set/epi-environmental-performance-index-2022 https://sedac.ciesin.columbia.edu/data/set/epi-environmental-performance-index-2022 29 [14] Tora Fahrudin, Dedy Rahman Wijaya, Anak Agung Gde Agung. COVID-19 Confirmed Case Correlation Analysis Based on Spearman and Kendall Correlation. International Conference on Data Science and Its Applications. 2020. [15] Dan Wang, Ruifang Li, Juan Wang, Qunqun Jiang, Chang Gao, Juan Yang, Lintong Ge, Qing Hu. Correlation analysis between disease severity and clinical and biochemical characteristics of 143 cases of COVID-19 in Wuhan, China: a descriptive study. BMC Infect Dis. 2020. https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Dan-Wang-Aff1 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Ruifang-Li-Aff1 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Juan-Wang-Aff2 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Qunqun-Jiang-Aff3 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Chang-Gao-Aff1 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Juan-Yang-Aff1 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Juan-Yang-Aff1 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Lintong-Ge-Aff1 https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-020-05242-w#auth-Qing-Hu-Aff1 30 ДОДАТКИ Додаток 1. Коефіцієнт парної кореляції для першої хвилі Додаток 2. Коефіцієнт парної кореляції для другої хвилі Додаток 3. Коефіцієнт парної кореляції для третьої хвилі Додаток 4. Коефіцієнт парної кореляції для четвертої хвилі 31 Додаток 5. Коефіцієнт парної кореляції для п’ятої хвилі Додаток 6. Коефіцієнт парної кореляції для першої хвилі зі зсувом Додаток 7. Коефіцієнт парної кореляції для другої хвилі зі зсувом Додаток 8. Коефіцієнт парної кореляції для третьої хвилі зі зсувом 32 Додаток 9. Коефіцієнт парної кореляції для четвертої хвилі зі зсувом Додаток 10. Коефіцієнт парної кореляції для п’ятої хвилі зі зсувом