Retour au journal
Article·30 juin 2026·5 min de lecture

Comparer les données du registre Sirene et INSEE: méthode fiable.

Guide opérationnel pour cartographier les champs, choisir la granularité et contrôler les écarts entre Sirene (API/fichiers) et autres sorties INSEE.

Ce que vous comparez vraiment: Sirene (INSEE), niveaux et statuts

Sirene est le répertoire administratif géré par l’INSEE. Le SIREN identifie l’unité légale avec 9 chiffres; le SIRET identifie un établissement avec 14 chiffres (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).

Ne comparez pas une ligne d’unité légale avec une ligne d’établissement. L’unité légale décrit l’entité juridique; l’établissement décrit un lieu d’exercice rattaché à cette entité (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).

La diffusion passe notamment par l’API Sirene V3 et par la Base Sirene Open Data (sources: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06); data.gouv.fr — Base Sirene Open Data (consultée 2026-06)). Pour les fichiers open data, consignez aussi la licence de réutilisation associée à vos exports (source: Etalab — Licence Ouverte v2.0 (2017)).

Avant tout rapprochement, fixez la clé de comparaison: SIREN pour comparer des unités légales, SIRET pour comparer des établissements. Ce choix détermine les doublons acceptables.

Contrôlez les champs d’état avant de mesurer un écart. etatAdministratifUniteLegale prend les valeurs A ou C; etatAdministratifEtablissement prend les valeurs A ou F (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)).

Les activités NAF existent aux deux niveaux. activitePrincipaleUniteLegale décrit l’activité de l’entité; activitePrincipaleEtablissement décrit l’activité du lieu. Utilisez le premier champ pour une analyse d’entreprises, le second pour une analyse de sites (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)).

Cartographier les champs: table de correspondance prête à l’emploi

Utilisez cette correspondance sans fusionner les niveaux unité légale et établissement.

Besoin métierChamp Sirene à lireRègle de rapprochement
IdentitédenominationUniteLegale, ou nom pour une personne physique; sigleUniteLegale si présentAssimiler à la raison sociale. Coupler avec le sigle pour limiter les homonymies entre structures proches.
ActivitéactivitePrincipaleUniteLegale et activitePrincipaleEtablissementLe code NAF de l’entreprise peut différer de celui du site. Pour l’activité exercée localement, privilégier l’établissement.
TemporalitédateCreationUniteLegale et dateDebut de l’établissementdateCreationUniteLegale marque la naissance de l’entreprise; dateDebut doit être interprété comme le début de la période courante de l’établissement.
LocalisationlibelleVoieEtablissement, codePostalEtablissement, libelleCommuneEtablissementConcaténer ces champs pour former l’adresse postale utilisée dans les contrôles d’adresse.
EffectifstrancheEffectifsUniteLegaleLire une classe d’effectifs, pas un nombre exact. Interpréter la valeur comme un intervalle documenté dans Sirene (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)).

Pour comparer deux fichiers, alignez chaque ligne sur son identifiant d’établissement lorsque l’adresse, l’activité locale ou la période de l’établissement doivent primer (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).

Méthode de comparaison fiable: du choix de granularité au contrôle des écarts

  1. Fixer la granularité. Choisissez l’unité légale si la métrique porte sur des entreprises. Choisissez l’établissement si elle porte sur des lieux d’activité. Une jointure au SIREN regroupe les établissements rattachés à une même entreprise; une jointure au SIRET conserve le niveau établissement (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).
  2. Verrouiller les clés de jointure. Normalisez les identifiants avant import: SIREN sur 9 chiffres et SIRET sur 14 chiffres (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)). Conservez les zéros non significatifs. Pour les rapprochements Sirene, préférez ces identifiants aux rapprochements par raison sociale, enseigne ou adresse.
  3. Aligner la fenêtre de dates. Comparez des extractions portant sur la même fenêtre de création pour les unités légales, ou sur la même période de référence pour les établissements. Ce cadrage réduit les écarts pouvant venir de dates d’extraction différentes (sources: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06); data.gouv.fr — Base Sirene Open Data (consultée 2026-06)).
  4. Filtrer l’état administratif. Pour mesurer le parc actif, excluez les entités closes: C pour les unités légales cessées et F pour les établissements fermés (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)). Journalisez séparément les changements de statut observés entre deux extractions.
  5. Classer les divergences. Journalisez chaque écart avec un type unique: identité, activité, adresse ou statut. Ce classement distingue un problème systématique de mapping d’un écart ponctuel sur une seule fiche.

Pièges récurrents qui faussent les comparaisons (et comment les corriger)

  • Transfert de siège: pour suivre la continuité juridique, rapprochez d’abord les lignes sur le SIREN, puis contrôlez le SIRET du siège comme attribut variable.
  • Multi-établissements: une unité légale peut exploiter plusieurs établissements. Le code NAF du siège ne décrit pas toujours l’activité du site opérationnel ciblé; choisissez le niveau établissement pour une campagne locale, le niveau SIREN pour une analyse juridique.
  • Adresses: les écarts d’adresse viennent souvent de la casse, des accents, des abréviations et de la ponctuation. Avant comparaison, normalisez les libellés: majuscules, suppression des accents, ponctuation harmonisée, types de voie standardisés.
  • Fenêtre temporelle: un écart transitoire peut apparaître si l’API et le fichier complet sont extraits à des dates différentes. Notez la date d’extraction de chaque source et comparez uniquement des jeux alignés.
  • Homonymies: des dénominations très proches peuvent désigner des entreprises distinctes. Le nom seul ne doit pas servir de clé; exigez le SIREN pour l’unité légale ou le SIRET pour l’établissement.

Valider une liste de nouvelles entreprises: check-list opérationnelle

Check-list de contrôle

  • Isolez les créations avec dateCreationUniteLegale récente et etatAdministratifUniteLegale = A. Ce duo écarte les unités légales cessées après immatriculation (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)).
  • Travaillez au niveau siège avec etablissementSiege = true. Pour dater la période courante du siège, contrôlez dateDebut.
  • Segmentez les zones avec codeCommuneEtablissement. Utilisez codePostalEtablissement seulement si votre ciblage suit la distribution postale, pas le découpage communal.
  • Évitez l’intitulé de commune comme clé de filtre. Préférez le code commune pour rapprocher des fichiers extraits à des dates différentes.
  • Qualifiez le secteur avec activitePrincipaleEtablissement. Ce champ est plus adapté à une liste commerciale locale que l’activité déclarée au seul niveau de l’unité légale.
  • Gardez le siren comme clé maître dans votre base. En cas de transfert de siège, archivez les siret successifs du siège pour conserver l’historique sans créer de doublon d’unité légale.

Avant diffusion, exportez les champs siren, siret, dateCreationUniteLegale, etatAdministratifUniteLegale, etablissementSiege, dateDebut, codeCommuneEtablissement et activitePrincipaleEtablissement.

Premier fichier offert

Recevez les nouvelles entreprises
de votre zone chaque semaine.

Configuration en 2 minutes. Sans carte bancaire. Annulation en 1 clic.

← Tous les articles du journal