Mémoires d'Actuariat

Améliorer la détection de la fraude à l'assurance automobile en Inde grâce à des modèles d'apprentissage statistique
Auteur(s) ROUGIER C.
Société Generali
Année 2024

Résumé
La fraude met en péril le fonctionnement même de l’assurance en augmentant artificiellement le montant des primes à collecter et les décorrélant du risque réel assuré. La fraude fait l’objet de nombreux dispositifs de lutte et de surveillance au sein des marchés européens de l’assurance automobile. Dans le contexte indien, la priorité a longtemps été donnée au développement du chiffre d’affaires, dans un climat de croissance forte. Et en même temps, la concurrence entre acteurs entraîne aussi une pression pour un règlement rapide des sinistres- ce délai est en effet une information qui a un impact fort sur le marché de l’assurance automobile en Inde. L’objectif de ce mémoire est d’identifier si des modèles d’apprentissage statistiques peuvent améliorer la détection de la fraude aux sinistres automobiles en Inde. Ce mémoire s’attache dans un premier temps, à décrire ce contexte si particulier qu’est le marché de l’assurance automobile en Inde, en se basant sur des comparaisons avec le marché français des années 2019/2020 pré-Covid ou passé (années 1950-1980). La notion de fraude sera ensuite définie et explicitée. Puis nous expliquerons les fondements des modèles d’apprentissage statistique utilisés, leur mise en œuvre et leurs résultats par rapport aux méthodes actuelles, basées sur l’expertise métier. Cette étude confirme en outre l’intérêt des forêts aléatoires XGBoost dans la détection de la fraude.

Abstract
Fraud jeopardizes the very functioning of insurance by artificially increasing the amount of premiums to be collected and decorrelating them from the actual insured risk. Fraud fighting measures have been widely implemented within the European automobile insurance markets. In the Indian context, priority has long been given to developing turnover, in a climate of robust growth. And at the same time, competition between players also leads to pressure for rapid settlement of claims - this delay is indeed information that has a strong impact on the automobile insurance market in India. The objective of this thesis is to identify whether Machine Learning models can improve the detection of automobile claims fraud in India. This thesis firstly aims at describing the very specific context of Indian car insurance market, based on comparisons with the French market in the years 2019/2020 pre-Covid or past (1950s-1980s). The concept of fraud will then be defined and explained. Finally, we will explain the foundations of the statistical learning models used, their implementation and their results compared to current methods, based on business expertise. This study further confirms the value of XGBoost random forests in fraud detection.

Mémoire complet