Contrôle des ayants droits de la CNAF à partir de leurs données personnelles
Question posée le 7 février 2023 :
M. Aurélien Saintoul interroge M. le ministre des solidarités, de l'autonomie et des personnes handicapées à propos de l'utilisation de la technique d'exploration de données, ou datamining, par la Caisse nationale des allocations familiales. Cette technique prétend automatiser l'identification d'une erreur au sein d'une grande quantité de données. Depuis 2010, la CNAF utilise un algorithme de notation de ses allocataires fonctionnant à partir de données administratives les concernant. Cette technique est censée mesurer les risques d'erreurs ou les fraudes dans le dossier d'un allocataire. Plus ce « risque » est élevé, plus la probabilité que celui-ci soit contrôlé augmente. L'ancien directeur général de la CNAF déclarait en juin 2022 que l'exploration de données était devenue « la première source de détection des dossiers destinés au contrôle ». Néanmoins, les algorithmes sont défaillants et portent en eux les biais de ceux qui les codent. Dans ce cas précis, une enquête de France Info nous apprenait le 9 décembre 2022 que le fait de bénéficier de plusieurs prestations était de nature à fausser l'algorithme. Si les variations de ressources ou les changements dans une situation familiale sont des évènements communs, ils peuvent tromper l'algorithme, entraîner un contrôle et même une suspension préventive des versements. Dès lors, cette situation suscite de nombreuses interrogations. Des journalistes et des associations ont tenté d'obtenir le code de l'algorithme utilisé par la CNAF. Selon France Info, le score de risque est d'emblée plus élevé pour les personnes les plus précaires et une circulaire interne de la CNAF datée de 2012 recommandait de « cibler les personnes nées hors de l'Union européenne ». Comment fonctionne cet algorithme ? Prend-il en compte des données subsidiaires ou discriminantes ? Malgré des erreurs manifestes et des facteurs de notation troubles, ce système place les contrôleurs dans la quasi-obligation de détecter des irrégularités dans les dossiers au score fortement élevé. En conséquence, il aimerait savoir comment M. le ministre contrôle cette pratique de la CNAF, s'il peut garantir qu'elle ne discrimine ni socialement ni ethniquement les ayants droits dans le pays, s'il est en mesure de fournir le code de l'algorithme dans un langage intelligible et s'il peut fournir une liste claire et complète des variables qui déterminent le score de risque d'un allocataire.