Skip to main content

2 Mai, 2019

Comment une image Google Street View de votre maison prédit votre risque d’accident de voiture

Comment une image Google Street View de votre maison prédit votre risque d’accident de voiture

Les compagnies d’assurance, les banques et les organismes de soins de santé peuvent améliorer considérablement leurs modèles de risque en analysant les images des maisons des assurés, affirment les chercheurs.

Google Street View est devenu un moyen étonnamment utile d’en apprendre davantage sur le monde sans y entrer. Les gens l’utilisent pour planifier leurs voyages, pour explorer des destinations de vacances et pour traquer virtuellement amis et ennemis.

Mais les chercheurs ont trouvé des utilisations plus insidieuses. En 2017, une équipe de chercheurs a utilisé les images pour étudier la répartition des types de voitures aux États-Unis, puis a utilisé ces données pour déterminer la composition démographique du pays. Il s’avère que la voiture que vous conduisez est un indicateur étonnamment fiable de votre niveau de revenu, de votre éducation, de votre profession et même de votre façon de voter aux élections.

Aujourd’hui, un groupe différent est allé encore plus loin. Łukasz Kidziński Kidziński à l’Université de Stanford en Californie et Kinga Kita-Wojciechowska à l’Université de Varsovie en Pologne ont utilisé des images Street View des maisons des gens pour déterminer la probabilité qu’ils soient impliqués dans un accident de voiture. Ce sont des renseignements précieux qu’une compagnie d’assurance pourrait utiliser pour fixer les primes.

Le résultat soulève d’importantes questions sur la façon dont les renseignements personnels peuvent s’échapper d’ensembles de données apparemment inoffensifs et si les organisations devraient pouvoir les utiliser à des fins commerciales.

Données d’assurance

La méthode des chercheurs est simple. Ils ont commencé par un ensemble de données de 20.000 enregistrements de personnes ayant souscrit une assurance automobile en Pologne entre 2013 et 2015. Celles-ci ont été choisies au hasard dans la base de données d’une compagnie d’assurance dont le nom n’a pas été divulgué.

Chaque dossier comprenait l’adresse du titulaire de la police et le nombre de demandes d’indemnisation qu’il a présentées au cours de la période de 2013 à 2015. L’assureur a également partagé sa propre prévision des sinistres futurs, calculée à l’aide de son modèle de risque de pointe qui tient compte du code postal de l’assuré et de l’âge, du sexe, de l’historique des sinistres, etc. du conducteur.

La question que Lukasz Kidziński et Kinga Kita-Wojciechowska ont examinée est de savoir s’ils pouvaient faire une prédiction plus précise en utilisant une image Google Street View de la maison de l’assuré.

Pour le savoir, les chercheurs ont entré l’adresse de chaque titulaire de police dans Google Street View et téléchargé une image de la résidence. Ils ont classé cette habitation selon son type (maison individuelle, maison mitoyenne, immeuble d’habitation, etc.), son âge et son état. Enfin, les chercheurs ont procédé à une analyse numérique de cet ensemble de données pour voir comment il était corrélé à la probabilité qu’un titulaire de police présente une demande de règlement.

Les résultats sont quelque peu surprenants. Il s’avère que la résidence d’un titulaire de police est un prédicteur étonnamment bon de la probabilité qu’il présente une demande de règlement. « Nous avons constaté que les caractéristiques visibles sur l’image d’une maison peuvent être prédictives du risque d’accident de voiture, indépendamment des variables classiques telles que l’âge ou le code postal, » disent Kidziński et Kita-Wojciechowska.

Lorsque ces facteurs sont ajoutés au modèle de risque de pointe de l’assureur, ils améliorent son pouvoir prédictif de 2 %. Pour mettre cela en perspective, le modèle de l’assureur est meilleur qu’un modèle nul de seulement 8 % et repose sur un ensemble de données beaucoup plus vaste qui comprend des variables comme l’âge, le sexe et l’historique des sinistres.

La technique de Google Street View a donc le potentiel d’améliorer considérablement la prédiction. Et le travail actuel n’est qu’une preuve de principe. Les chercheurs affirment que sa précision pourrait être améliorée en utilisant des ensembles de données plus vastes et une meilleure analyse des données.

Consentement éclairé

L’approche des chercheurs soulève un certain nombre de questions importantes sur la manière dont les données personnelles devraient être utilisées. Les assurés polonais pourraient être surpris d’apprendre que leur adresse personnelle a été introduite dans Google Street View pour obtenir et analyser une image de leur résidence.

Une question intéressante est de savoir s’ils ont donné leur consentement éclairé à cette activité et si une compagnie d’assurance peut utiliser les données de cette manière, étant donné les lois européennes strictes en matière de confidentialité des données. « Le consentement donné par les clients à l’entreprise pour stocker leurs adresses ne signifie pas nécessairement un consentement pour stocker des informations sur l’apparence de leurs maisons, » disent Kidziński et Kita-Wojciechowska.

Et l’approche pourrait ouvrir une boîte de Pandore de l’analyse des données. Si les compagnies d’assurance peuvent en bénéficier, pourquoi pas d’autres entreprises ? « L’industrie de l’assurance pourrait être rapidement suivie par les banques, car il existe une corrélation prouvée entre les modèles de risque d’assurance et la notation du risque de crédit « , disent Kidziński et Kita-Wojciechowska.

La capacité de recueillir, d’analyser et d’exploiter l’information s’est considérablement accrue au cours des dernières années. Cette capacité a dépassé la compréhension qu’ont la plupart des gens de ce qui est possible avec leurs données, et elle a certainement dépassé la vitesse à laquelle une loi peut être adoptée pour la contrôler.

Bien sûr, Google n’est pas la seule entreprise à collecter des images au niveau de la rue. « Une telle pratique, cependant, soulève des inquiétudes quant à la confidentialité des données stockées dans Google Street View accessible au public, Bing Maps Streetside de Microsoft, Mapillary, ou des ensembles de données privés équivalents comme CycloMedia, » disent Kidziński et Kita-Wojciechowska.

Ce type de travail est susceptible de soulever la question de savoir si ces entreprises devraient être en mesure de collecter et de stocker ces images. En Allemagne, où la protection de la vie privée est une question importante dans le débat public, Google est déjà interdit de collecter des images Street View. Ce n’est peut-être pas le dernier endroit à introduire une telle interdiction.

https://www.technologyreview.com/s/613432/how-a-google-street-view-image-of-your-house-predicts-your-risk-of-a-car-accident/

https://arxiv.org/abs/1904.05270