Інтегрований аналіз та прогнозування цін автострахування на основі алгоритмів машинного навчання та статистичного аналізу
Вантажиться...
Дата
2023-12
Назва журналу
Номер ISSN
Назва тому
Видавець
Харків : Харківський національний університет імені В.Н. Каразіна
Анотація
У даній роботі проведено аналіз та підготовку даних, тренування моделі, вивчення механізмів роботи та порівняння результатів різних алгоритмів машинного навчання та механізмів градієнтного бустингу задля прогнозування цін на автострахування та аналізу її залежностей. У роботі присутній огляд методів градієнтного бустингу в задачах прогнозування цін на автострахування. Проведено порівняння ефективності моделей градієнтного бустингу XGBoost, LightGBM та CatBoost. Для визначення впливу географічного положення на ціни автострахування виконується збір та обробка геоданих. Здійснена ідентифікація ключових факторів, що впливають на ціни страховки. Практичне застосування розроблених методів обумовлено тренуванням моделей і аналізом їх результативності. Аналіз та визначення важливості різних ознак у прогнозуванні цін на автострахування здійснюється за допомогою методів SHAP, Permutation Importance та інших.
In the current work, data analysis and preparation, model training, study of work mechanisms and comparison of the results of different machine learning algorithms and gradient boosting mechanisms for predicting auto insurance prices and analyzing its dependencies have been carried out. The work includes an overview of gradient boosting methods in the problems of predicting auto insurance prices. A comparison of the efficiency of gradient boosting models XGBoost, LightGBM and CatBoost was carried out. Geodata collection and processing are performed to determine the impact of geographic location on auto insurance prices. Key factors affecting insurance prices have been identified. The practical application of the developed methods is due to the training of models and the analysis of their effectiveness. Analysis and determination of the importance of various features in predicting auto insurance prices is carried out using SHAP, Permutation Importance and other methods.
In the current work, data analysis and preparation, model training, study of work mechanisms and comparison of the results of different machine learning algorithms and gradient boosting mechanisms for predicting auto insurance prices and analyzing its dependencies have been carried out. The work includes an overview of gradient boosting methods in the problems of predicting auto insurance prices. A comparison of the efficiency of gradient boosting models XGBoost, LightGBM and CatBoost was carried out. Geodata collection and processing are performed to determine the impact of geographic location on auto insurance prices. Key factors affecting insurance prices have been identified. The practical application of the developed methods is due to the training of models and the analysis of their effectiveness. Analysis and determination of the importance of various features in predicting auto insurance prices is carried out using SHAP, Permutation Importance and other methods.
Опис
Ключові слова
MATHEMATICS::Applied mathematics, машинне навчання, градієнтний бустинг, machine learning, gradient boosting
Бібліографічний опис
Резуненко, Сергій Олександрович. Інтегрований аналіз та прогнозування цін автострахування на основі алгоритмів машинного навчання та статистичного аналізу : кваліфікаційна робота здобувача вищої освіти другого (магістерського) рівня : спеціальність 113 «Прикладна математика» : освітньо-професійна програма «Прикладна математика» / С.О. Резуненко ; науковий керівник К.В. Стєпанова. – Харків : Харківський національний університет імені В.Н. Каразіна, 2023. – 35 с.