Tribune : Big data et assurances, la partie cachée de l’iceberg (Partie 1)

Le secteur des assurances a toujours été un pionnier dans l’usage et l’exploitation des données. A tous les niveaux d’activités du secteur, depuis le développement des offres et des contrats, en passant par les études de risques, la gestion des cas complexes et des fraudes, le marketing, etc. Aujourd’hui le secteur se modernise davantage sous l’impulsions du Big Data ; mais attention derrière ce mot se cachent deux types de data bien distinctes.

Cette tribune a été rédigée par Amine Benhenni, Data Scientist et responsable scientifique du Kernix Lab autour des questions Big Data, et Luc Truntzler, directeur associé d’Inbenta. Elle vous est proposée en deux parties.

La deuxième partie est à lire ici

Axa Drive, Youdrive de Direct Assurance, Conduite connectée d’Allianz, Pulse O2 d’Axa/Withings… ces derniers mois, les applications lancées par les assureurs autour du big data font l’actualité.
Tout le monde comprend aisément l’intérêt du big data, véritable mine d’or pour l’assureur qui permet d’une part à l’actuaire d’exercer son métier avec toujours plus d’indicateurs et d’autre part aux conseillers de connaitre davantage leur portefeuille client et pousser des propositions commerciales des plus attractives et personnalisées.

Après la vague 2.0 autour des applications sociales et communautaires, la vague 3.0 autour de la collecte et traitement de données client bat désormais son plein notamment avec le développement des objets connectés.

Les applications envisagées se concentrent principalement sur ce qu’on appelle la donnée structurée, qui obéit à des schémas simples et clairs, avec des champs clairement identifiés. Par exemple, il s’agit de données démographiques comme l’âge ou le salaire, ou pour nos objets connectés, d’une distance parcourue avec sa voiture ou avec ses chaussures, ou encore la tension prise avec sa montre connectée, la perte de calories calculée avec son Pulse 02..

Or le Big Data, c’est aussi et surtout des données non-structurées, soient toutes ces données dont l’information n’est pas spécialement organisée pour nos outils d’extraction, que l’on retrouve sous diverses formes et différents supports. Celles-ci incluent toutes les données sous forme de documents et de textes, mais aussi l’ensemble des médias (images, illustrations, vidéos).

Depuis un rapport de Merryl Lynch sur l’information en entreprise, il est dorénavant admis que les données non-structurées correspondent à 80% de l’ensemble des données exploitables par une entreprise. Notons que ce rapport date de 1998 et que notre internet moderne, avec ses emails et ses médias sociaux était inexistant.

Bien que majoritaire, nous constatons chaque jour avec amertume que la donnée non-structurée est généralement l’enfant pauvre des politiques d’innovation au sein des différents groupes qui se jettent dans la course aux Big Data.

Lire la suite de cette tribune