Ce que vous comparez vraiment: Sirene (INSEE), niveaux et statuts
Sirene est le répertoire administratif géré par l’INSEE. Le SIREN identifie l’unité légale avec 9 chiffres; le SIRET identifie un établissement avec 14 chiffres (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).
Ne comparez pas une ligne d’unité légale avec une ligne d’établissement. L’unité légale décrit l’entité juridique; l’établissement décrit un lieu d’exercice rattaché à cette entité (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).
La diffusion passe notamment par l’API Sirene V3 et par la Base Sirene Open Data (sources: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06); data.gouv.fr — Base Sirene Open Data (consultée 2026-06)). Pour les fichiers open data, consignez aussi la licence de réutilisation associée à vos exports (source: Etalab — Licence Ouverte v2.0 (2017)).
Avant tout rapprochement, fixez la clé de comparaison: SIREN pour comparer des unités légales, SIRET pour comparer des établissements. Ce choix détermine les doublons acceptables.
Contrôlez les champs d’état avant de mesurer un écart. etatAdministratifUniteLegale prend les valeurs A ou C; etatAdministratifEtablissement prend les valeurs A ou F (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)).
Les activités NAF existent aux deux niveaux. activitePrincipaleUniteLegale décrit l’activité de l’entité; activitePrincipaleEtablissement décrit l’activité du lieu. Utilisez le premier champ pour une analyse d’entreprises, le second pour une analyse de sites (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)).
Cartographier les champs: table de correspondance prête à l’emploi
Utilisez cette correspondance sans fusionner les niveaux unité légale et établissement.
| Besoin métier | Champ Sirene à lire | Règle de rapprochement |
|---|---|---|
| Identité | denominationUniteLegale, ou nom pour une personne physique; sigleUniteLegale si présent | Assimiler à la raison sociale. Coupler avec le sigle pour limiter les homonymies entre structures proches. |
| Activité | activitePrincipaleUniteLegale et activitePrincipaleEtablissement | Le code NAF de l’entreprise peut différer de celui du site. Pour l’activité exercée localement, privilégier l’établissement. |
| Temporalité | dateCreationUniteLegale et dateDebut de l’établissement | dateCreationUniteLegale marque la naissance de l’entreprise; dateDebut doit être interprété comme le début de la période courante de l’établissement. |
| Localisation | libelleVoieEtablissement, codePostalEtablissement, libelleCommuneEtablissement | Concaténer ces champs pour former l’adresse postale utilisée dans les contrôles d’adresse. |
| Effectifs | trancheEffectifsUniteLegale | Lire une classe d’effectifs, pas un nombre exact. Interpréter la valeur comme un intervalle documenté dans Sirene (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)). |
Pour comparer deux fichiers, alignez chaque ligne sur son identifiant d’établissement lorsque l’adresse, l’activité locale ou la période de l’établissement doivent primer (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).
Méthode de comparaison fiable: du choix de granularité au contrôle des écarts
- Fixer la granularité. Choisissez l’unité légale si la métrique porte sur des entreprises. Choisissez l’établissement si elle porte sur des lieux d’activité. Une jointure au SIREN regroupe les établissements rattachés à une même entreprise; une jointure au SIRET conserve le niveau établissement (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)).
- Verrouiller les clés de jointure. Normalisez les identifiants avant import: SIREN sur 9 chiffres et SIRET sur 14 chiffres (source: INSEE — Définitions et méthodes: SIREN, SIRET, unité légale, établissement (consultée 2026-06)). Conservez les zéros non significatifs. Pour les rapprochements Sirene, préférez ces identifiants aux rapprochements par raison sociale, enseigne ou adresse.
- Aligner la fenêtre de dates. Comparez des extractions portant sur la même fenêtre de création pour les unités légales, ou sur la même période de référence pour les établissements. Ce cadrage réduit les écarts pouvant venir de dates d’extraction différentes (sources: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06); data.gouv.fr — Base Sirene Open Data (consultée 2026-06)).
- Filtrer l’état administratif. Pour mesurer le parc actif, excluez les entités closes:
Cpour les unités légales cessées etFpour les établissements fermés (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)). Journalisez séparément les changements de statut observés entre deux extractions. - Classer les divergences. Journalisez chaque écart avec un type unique: identité, activité, adresse ou statut. Ce classement distingue un problème systématique de mapping d’un écart ponctuel sur une seule fiche.
Pièges récurrents qui faussent les comparaisons (et comment les corriger)
- Transfert de siège: pour suivre la continuité juridique, rapprochez d’abord les lignes sur le SIREN, puis contrôlez le SIRET du siège comme attribut variable.
- Multi-établissements: une unité légale peut exploiter plusieurs établissements. Le code NAF du siège ne décrit pas toujours l’activité du site opérationnel ciblé; choisissez le niveau établissement pour une campagne locale, le niveau SIREN pour une analyse juridique.
- Adresses: les écarts d’adresse viennent souvent de la casse, des accents, des abréviations et de la ponctuation. Avant comparaison, normalisez les libellés: majuscules, suppression des accents, ponctuation harmonisée, types de voie standardisés.
- Fenêtre temporelle: un écart transitoire peut apparaître si l’API et le fichier complet sont extraits à des dates différentes. Notez la date d’extraction de chaque source et comparez uniquement des jeux alignés.
- Homonymies: des dénominations très proches peuvent désigner des entreprises distinctes. Le nom seul ne doit pas servir de clé; exigez le SIREN pour l’unité légale ou le SIRET pour l’établissement.
Valider une liste de nouvelles entreprises: check-list opérationnelle
Check-list de contrôle
- Isolez les créations avec
dateCreationUniteLegalerécente etetatAdministratifUniteLegale = A. Ce duo écarte les unités légales cessées après immatriculation (source: INSEE API Sirene V3 — Documentation officielle (consultée 2026-06)). - Travaillez au niveau siège avec
etablissementSiege = true. Pour dater la période courante du siège, contrôlezdateDebut. - Segmentez les zones avec
codeCommuneEtablissement. UtilisezcodePostalEtablissementseulement si votre ciblage suit la distribution postale, pas le découpage communal. - Évitez l’intitulé de commune comme clé de filtre. Préférez le code commune pour rapprocher des fichiers extraits à des dates différentes.
- Qualifiez le secteur avec
activitePrincipaleEtablissement. Ce champ est plus adapté à une liste commerciale locale que l’activité déclarée au seul niveau de l’unité légale. - Gardez le
sirencomme clé maître dans votre base. En cas de transfert de siège, archivez lessiretsuccessifs du siège pour conserver l’historique sans créer de doublon d’unité légale.
Avant diffusion, exportez les champs siren, siret, dateCreationUniteLegale, etatAdministratifUniteLegale, etablissementSiege, dateDebut, codeCommuneEtablissement et activitePrincipaleEtablissement.