Cette technique d'analyse des données consiste à repérer les informations – portant sur la situation familiale, la situation professionnelle, l'adresse, les ressources, le nombre d'enfants à charge – communes à un certain nombre de dossiers. L'ensemble de ces caractéristiques constitue un modèle. Le « scoring » permet ensuite d'évaluer le degré de similitude entre les dossiers de nos allocataires et le modèle.
Le « data mining » a été expérimenté entre 2004 et 2006 dans cinq organismes, dont la caisse d'allocations familiales de Bordeaux. Dans cette ville, 300 contrôles ont été réalisés sur la base d'un modèle global. Les taux de régularisation sont passés de 30 % à 40 %. Nous sommes en train de tester dans dix-sept organismes des modèles plus perfectionnés, mais fondés sur l'observation des indus et non sur celle des indus frauduleux.
Il y a un an, toujours à Bordeaux, des fraudes aux aides au logement ont été détectées par d'autres techniques. Nous avons réussi à remonter la piste de personnes qui avaient déposé une multitude de dossiers dans plusieurs organismes, y compris en région parisienne, après nous être rendu compte que l'une d'entre elles, dont le numéro d'inscription au répertoire n'était pas certifié, avait produit un faux acte de naissance.