Використання топологічного аналізу даних для клінічних досліджень: виявлення прихованих закономірностей за допомогою машинного навчання на основі графів
Дата
2024-05
Назва журналу
Номер ISSN
Назва тому
Видавець
Харків : Харківський національний університет імені В.Н. Каразіна
Анотація
Розглянуто класичний підхід до аналізу даних клінічних досліджень, а також розповсюджені сучасні методи кластерного та топологічного аналізу даних. Проведено розрахунковий експеримент з аналізу даних реального клінічного дослідження. Цей процес включав очищення, підготовку та адаптацію даних шляхом побудови комбінованої метрики. Крім того, було проведено багатовимірне масштабування для проектування даних і виконано топологічний аналіз з використанням методу стійкої гомології. Завдяки цьому були отримані діаграми стійкості та побудовані відповідні графи, які допомогли ідентифікувати та провести порівняльний аналіз основних спільнот. Запропоновано більш широко використовувати топологічний аналіз даних в розвідувальному аналізі клінічних досліджень, оскільки навіть базові його методи показують хороші результати.
The classical approach to analyzing clinical trial data, as well as common modern methods of cluster and topological data analysis are considered. A computational experiment involving the analysis of a real clinical trial's data is conducted. This process included data cleaning, preparation, and adaptation through the construction of a combined metrics. Furthermore, a multidimensional scaling to project the data and performed topological analysis using persistent homology. This led to the creation of persistence diagrams and corresponding graphs, which helped identify and comparatively analyze the main communities. The findings suggest that topological data analysis, even at its basic level, is highly effective and should be utilized more extensively in the exploratory analysis of clinical trials.
The classical approach to analyzing clinical trial data, as well as common modern methods of cluster and topological data analysis are considered. A computational experiment involving the analysis of a real clinical trial's data is conducted. This process included data cleaning, preparation, and adaptation through the construction of a combined metrics. Furthermore, a multidimensional scaling to project the data and performed topological analysis using persistent homology. This led to the creation of persistence diagrams and corresponding graphs, which helped identify and comparatively analyze the main communities. The findings suggest that topological data analysis, even at its basic level, is highly effective and should be utilized more extensively in the exploratory analysis of clinical trials.
Опис
Ключові слова
MATHEMATICS::Applied mathematics, кластерний аналіз, топологічний аналіз даних, виявлення спільнот, cluster analysis, topological data analysis, identification of communities
Бібліографічний опис
Остапчук, Сергій Анатолійович. Використання топологічного аналізу даних для клінічних досліджень: виявлення прихованих закономірностей за допомогою машинного навчання на основі графів : кваліфікаційна робота здобувача вищої освіти другого (магістерського) рівня : спеціальність 113 «Прикладна математика» : освітньо-наукова програма «Прикладна математика» / С.А. Остапчук ; наукові керівники К.В. Стєпанова, Д.В. Булаєнко – Харків : Харківський національний університет імені В.Н. Каразіна, 2024. – 45 с.