Mémoires d'Actuariat
Utilisation d’arbres de régression pour la prédiction de coûts automobiles
Auteur(s) CLEMENT M.
Société Prim’Act
Année 2022
Résumé
Dans un contexte de concurrence forte, il est souhaitable pour un assureur de proposer des tarifs attractifs. Les assureurs automobiles étant couramment amenés à travailler avec des experts, un des aspects qu’ils peuvent piloter est le choix des réseaux d’experts avec lesquels ils travaillent. Ces derniers participent en effet à la détermination des coûts de sinistres survenus. Ce mémoire se concentre sur ce dernier point : l’objectif est de trouver un modèle qui permette de prédire au mieux le coût des sinistres tout en permettant la mesure de l’influence du réseau d’experts intervenu. La base de l’étude regroupe des sinistres automobiles provenant de trois assureurs ayant eu recours à deux réseaux d’experts différents. Pour répondre à l’objectif de l’étude plusieurs méthodes de modélisation sont étudiées. Premièrement, un modèle linéaire généralisé (GLM) est appliqué. Dans un second temps, des modèles à structures arborescentes, réputés pour leur lisibilité et facilité de compréhension, sont étudiés : le modèle CART et le modèle MOB. Les résultats des trois modèles étudiés précédemment sont ensuite confrontés à ceux d’un modèle connu pour ses performances de prédiction : le modèle XGBoost. Ce modèle est alors analysé à l’aide d’outils agnostiques, dans le but de trouver des moyens d’améliorer les performances de prédiction du modèle MOB, notamment par l’introduction de facteurs d’interactions. Le modèle MOB ainsi complété apparait alors comme le modèle le plus adapté pour répondre aux objectifs de l’étude ici présentée.
Abstract
In a context of strong competition, it is desirable for an insurer to offer attractive rates. Since automobile insurers are often required to work with experts, one of the aspects they can control is the choice of the expert network they work with. The latter are involved in determining the costs of claims incurred. This thesis focuses on this last point: the objective is to find a model which allows to predict the cost of the claims incurred as well as possible while allowing the measurement of the influence of the network of experts intervened. The database of the study gathers automobile claims from three insurers using two different networks of experts. To meet the objective of the study, several modeling methods are studied. First, a generalized linear model (GLM) is applied. Second, tree-structured models, known for their readability and ease of understanding, are studied: the CART model and the MOB model. The results of the three models studied previously are then compared with those of a model known for its prediction performances: the XGBoost model. This model is then analyzed using agnostic tools, in order to find ways to improve the prediction performance of the MOB model, in particular by introducing interaction factors. The MOB model thus completed appears to be the most suitable model to meet the objectives of the study presented here.
Mémoire complet
Auteur(s) CLEMENT M.
Société Prim’Act
Année 2022
Résumé
Dans un contexte de concurrence forte, il est souhaitable pour un assureur de proposer des tarifs attractifs. Les assureurs automobiles étant couramment amenés à travailler avec des experts, un des aspects qu’ils peuvent piloter est le choix des réseaux d’experts avec lesquels ils travaillent. Ces derniers participent en effet à la détermination des coûts de sinistres survenus. Ce mémoire se concentre sur ce dernier point : l’objectif est de trouver un modèle qui permette de prédire au mieux le coût des sinistres tout en permettant la mesure de l’influence du réseau d’experts intervenu. La base de l’étude regroupe des sinistres automobiles provenant de trois assureurs ayant eu recours à deux réseaux d’experts différents. Pour répondre à l’objectif de l’étude plusieurs méthodes de modélisation sont étudiées. Premièrement, un modèle linéaire généralisé (GLM) est appliqué. Dans un second temps, des modèles à structures arborescentes, réputés pour leur lisibilité et facilité de compréhension, sont étudiés : le modèle CART et le modèle MOB. Les résultats des trois modèles étudiés précédemment sont ensuite confrontés à ceux d’un modèle connu pour ses performances de prédiction : le modèle XGBoost. Ce modèle est alors analysé à l’aide d’outils agnostiques, dans le but de trouver des moyens d’améliorer les performances de prédiction du modèle MOB, notamment par l’introduction de facteurs d’interactions. Le modèle MOB ainsi complété apparait alors comme le modèle le plus adapté pour répondre aux objectifs de l’étude ici présentée.
Abstract
In a context of strong competition, it is desirable for an insurer to offer attractive rates. Since automobile insurers are often required to work with experts, one of the aspects they can control is the choice of the expert network they work with. The latter are involved in determining the costs of claims incurred. This thesis focuses on this last point: the objective is to find a model which allows to predict the cost of the claims incurred as well as possible while allowing the measurement of the influence of the network of experts intervened. The database of the study gathers automobile claims from three insurers using two different networks of experts. To meet the objective of the study, several modeling methods are studied. First, a generalized linear model (GLM) is applied. Second, tree-structured models, known for their readability and ease of understanding, are studied: the CART model and the MOB model. The results of the three models studied previously are then compared with those of a model known for its prediction performances: the XGBoost model. This model is then analyzed using agnostic tools, in order to find ways to improve the prediction performance of the MOB model, in particular by introducing interaction factors. The MOB model thus completed appears to be the most suitable model to meet the objectives of the study presented here.
Mémoire complet