Tribune : Big data et assurances, la partie cachée de l’iceberg (Partie 2)

Cette tribune a été rédigée par Amine Benhenni, Data Scientist et responsable scientifique du Kernix Lab autour des questions Big Data, et Luc Truntzler, directeur associé d’Inbenta. Elle vous est proposée en deux parties.

Cliquez ici pour relire la première partie

L’assurance et la donnée non structurée

Le secteur des assurances est particulièrement fourni en documents, témoignant de l’ensemble des interactions avec les clients. Il s’agit là tout simplement d’une mine d’or qui peut servir à différents usages propres d’une part, et compléter avantageusement les informations des données structurées pour caractériser efficacement les profils des clients.

Chronique-Big-Data-1

Ainsi, les questions, recherches, commentaires, emails, réclamations formulées par les assurés donnent un accès privilégié à la voix de l’assuré. Cette data est déjà disponible et ne demande qu’à être traitée, analysée et exploitée pour fournir des informations cruciales sur les intentions et les ressentis des clients.

Par exemple, une analyse adéquate des déclarations de sinistres et des demandes d’indemnité ainsi qu’un pré-traitement des conclusions d’experts peuvent permettre d’optimiser les traitements, en faisant passer rapidement les cas simples et en signalant les cas complexes et suspicieux qui nécessitent une attention particulière.

Certains mots ou certaines expressions peuvent être des indicateurs pertinents de la gravité ou non d’une situation (présence d’une ambulance, emplacement de blessures, etc) ou rapidement les causes possibles d’un dégâts, (rupture de canalisation, événement météorologique, …). Il faut toutefois garder en tête que la simple recherche de mots-clés n’est pas toujours suffisante, et que des approches plus sophistiquées sont nécessaires pour prendre en compte correctement le contexte, et qui permettent de distinguer les phrases suivantes :
une ambulance a été utilisée pour le transport…”
le transport s’est fait sans ambulance…”
ce qu’un moteur de recherche par mots-clés n’est pas capable de faire.

Toutes ces informations peuvent ensuite être réinjectées dans des algorithmes de classification, et de détection de fraude. Ces derniers s’en trouveront grandement améliorés et seront d’autant plus performants qu’ils disposent de données spécifiques et contextuelles sur les cas à traiter.

Traitement des questions des assurés

Suite à la précédente vague 2.0 qui a ouvert les vannes au déferlement de verbatims client dans l’écosystème digital des assureurs, la donnée non-structurée grandit chaque jour de plus en plus, à un rythme bien plus important que la donnée structurée.

Sur ces canaux digitaux que sont les sites web, réseaux sociaux et applications mobiles, le traitement de la voix de l’assuré permet principalement d’apporter des réponses automatiques et pertinentes aux questions formulées par les assurés.

Pour traiter ces questions en langage naturel, les technologies utilisées sont des technologies de traitement automatique du langage. Il s’agit selon Gartner, de la technologie, avec les objets connectés, la plus attendue cette année :

Chronique-Big-Data-3

L’internet des objets et le traitement automatique des questions en langage naturel au top des technologies attendues

Les technologies de Traitement Automatique du Langage permettent à travers des analyses sémantiques d’exploiter efficacement ces fameuses données non structurées, ces verbatims client, et leur donner un sens (le mot sémantique est dérivé du grec σημαντικός (sêmantikos) = “signifié”, “sens”). Cette technologie palie concrètement aux problèmes de moteur de recherche par mots clefs illustrés ci-dessus.

Les avancées dans les technologies de traitement automatique du langage, à l’interface entre linguistique et intelligence artificielle, se sont considérablement accélérées ces dernières années. Couplées à d’autres innovations technologiques (comme les objets connectés), ou à l’intégration de nouvelles pratiques (personnalisation des contrats en “temps réel”), elles seront responsables d’un bouleversement majeur à venir dans le secteur des assurances pour les prochaines années.