Mémoires d'Actuariat

Modélisation tarifaire d'une garantie Tempête pour les contrats habitations grâce à l'open data
Auteur(s) PERRINGAUX A.
Société Generelai France
Année 2024
Confidentiel jusqu'au 22/11/2026

Résumé
Ce mémoire propose une nouvelle méthode pour améliorer la tarification du risque de tempête dans les contrats d'assurance habitation. Avec l'augmentation des sinistres climatiques, cette tâche est devenue essentielle. La méthode utilise des données géospatiales et des caractéristiques des bâtiments pour mieux estimer la prime. L'utilisation des données publiques (open data) est un atout majeur pour améliorer la précision des modèles de tarification. Ces données incluent des informations sur les bâtiments et les terrains, ce qui est crucial pour identifier les zones à risque. Les données proviennent de sources variées comme la Base de Données Nationale des Bâtiments (BDNB), ERA5 et des images aériennes. L'open data permet de réduire les coûts de collecte et d'adapter les modèles à différents contextes géographiques. La méthode utilise d'abord des modèles linéaires pour estimer la fréquence et le coût des sinistres. Ces modèles sont ensuite enrichis par des techniques de machine learning, comme le Random Forest, pour intégrer des variables météorologiques. Un zonier géographique est créé pour segmenter le territoire en zones de risque homogènes. L'optimisation de ce zonier repose sur le calibrage de plusieurs paramètres pour équilibrer précision et robustesse. Chaque configuration est testée avec des métriques de performance comme le coefficient de Gini et l'erreur quadratique moyenne (RMSE). Les résultats montrent une amélioration significative de la précision de la tarification. Par exemple, le coefficient de Gini passe de 0,58 à 0,63, indiquant une meilleure identification des zones à risque élevé. Cette cartographie permet aux assureurs d'adapter leur tarification et de réduire l'incertitude financière liée aux sinistres tempêtes. En conclusion, cette approche est prometteuse pour la gestion des risques climatiques. Elle utilise pleinement les données open data et les techniques de machine learning. Bien qu'elle soit appliquée ici au risque de tempête, elle pourrait être étendue à d'autres risques climatiques comme la grêle.

Abstract
This thesis proposes a new method to improve windstorm risk pricing in home insurance contracts. With the increase in climate-related claims, this task has become essential. The method uses geospatial data and building characteristics to better estimate the premium. The use of public data (open data) is a major asset for improving the accuracy of risk pricing models. This data includes information on buildings and land, which is crucial for identifying risk areas. The data comes from various sources such as the National Building Database (BDNB), ERA5, and aerial images. Open data helps reduce data collection costs and adapt models to different geographical contexts. The method first uses linear models to estimate the frequency and cost of claims. These models are then enhanced by machine learning techniques, such as Random Forest, to integrate weather variables. A geographical zoning system is created to segment the territory into homogeneous risk zones. The optimization of this zoning system is based on calibrating several parameters to balance precision and robustness. Each configuration is tested with performance metrics such as the Gini coefficient and the Root Mean Square Error (RMSE). The results show a significant improvement in pricing accuracy. For example, the Gini coefficient increases from 0.58 to 0.63, indicating a better identification of high-risk areas. This mapping allows insurers to adjust their pricing and reduce financial uncertainty related to windstorm claims. In conclusion, this approach is promising for managing climate risks. It fully utilizes open data and machine learning techniques. Although it is applied here to windstorm risk, it could be extended to other climate risks such as hail.