En tant que géomaticiens, nous sommes souvent amenés à mener des analyses comparatives grâce aux données géographiques. Ces comparaisons peuvent concerner des territoires distincts à un instant donné, ou bien l’évolution d’un même territoire dans le temps.
Néanmoins, les analyses comparatives posent de nombreux questionnements méthodologiques. Pour ce qui est des analyses multi-temporelles, la question de l'évolution des méthodes de conception des données est primordiale. Il s'agit d'une problématique majeure en télédétection : lorsqu'on cherche à comparer des images produites avec des satellites différents, les différences en termes de résolutions spatiale et spectrale complexifient l'analyse et la comparaison.
Le millésime 2022 de la base Filosofi
Cette année, un nouvel exemple est venu illustrer ces problématiques. Il touche à des données référentielles, déjà traitées, où la conception des données n'est pas toujours connue par les réutilisateurs.
Il s'agit de la base FILOSOFI de l'INSEE, incontournable dans les analyses socioéconomiques des territoires en France. Cette année 2025, les données de la base Filosofi pour le millésime 2022 tardent à être publiées et il n'est pas certain que cette base de données soit disponible de sitôt. En effet, après quelques temps où les réutilisateurs ont été laissés dans le flou, l'INSEE a finalement publié sur la page de la base Filosofi un message d'explication :
« Le millésime 2021 de Filosofi est le dernier disponible. La production du millésime 2022 qui aurait dû être diffusé début 2025 ne pourra avoir lieu en raison d’une qualité statistique insuffisante des sources. Le dispositif Filosofi repose sur le concept de ménage fiscal qui nécessite notamment de rattacher les foyers fiscaux faisant une déclaration de revenus à un logement. La suppression de la taxe d'habitation pour les résidences principales oblige à avoir recours à d’autres sources pour réaliser cette opération. Les sources fiscales pour 2022 n’ont pas permis de réaliser correctement cette étape avec une qualité statistique suffisante. »
Ainsi, l'INSEE n'a pas été en mesure (pour le moment) de produire une donnée d'une aussi bonne qualité que les années précédentes, du fait de la disparition de leur source de données.
Quelles leçons tirer de cet incident ?
Premièrement, en tant que géomaticiens, mais cela vaut globalement pour toute personne travaillant à partir de données, il est de notre responsabilité de nous interroger sur les méthodes de production des données qu'on utilise. Il vaut mieux ne pas tirer de conclusions d'analyses où les données utilisées ne sont pas comparables. Deuxièmement, bien que l'accès aux données référentielles (IGN, INSEE…) semble une évidence, et qu'elles se sont montrées disponibles depuis plusieurs années, ces sources peuvent se révéler subitement indisponibles à cause de dysfonctionnements divers pendant le travail conséquent (et souvent invisible) que ces données nécessitent. Dernièrement, les sources de données des géomaticiens peuvent être très diverses et des évolutions qui semblent n'avoir rien à voir avec les données géographiques à première vue peuvent affecter notre capacité à mobiliser des données dans nos analyses géographiques.
Sources :
Dimitrov, V. (2025, avril 7). Comment les données locales des revenus des ménages ont-elles pu disparaître ? La Gazette des Communes. https://www.lagazettedescommunes.com/978988/comment-les-donnees-locales-des-revenus-des-menages-ont-elles-pu-disparaitre/?abo=1
Revenus localisés sociaux et fiscaux | Insee. (s. d.). Consulté 12 juin 2025, à l’adresse https://www.insee.fr/fr/metadonnees/source/serie/s1172