Retour au journal
Article·26 mai 2026·4 min de lecture

Meilleures pratiques pour utiliser les données du registre Sirene.

Méthodes opérationnelles: normalisation SIREN/SIRET/NAF, dédoublonnage, suivi des changements et activation multi‑canal, dans le respect CNIL et de la Licence Ouverte.

Normaliser SIREN, SIRET, raisons sociales et NAF pour matcher juste

Le SIREN identifie l’unité légale avec 9 chiffres; le SIRET identifie un établissement avec 14 chiffres, car il concatène SIREN et NIC (source: INSEE — Base Sirene 2026). Utilisez donc le SIREN comme clé d’entité et le SIRET comme clé d’adresse ou d’opération.

Une même société peut avoir plusieurs établissements. Séparer SIREN et SIRET évite de fusionner à tort siège, agence et point de vente.

Appliquez trim, suppression des doubles espaces, casse homogène et normalisation des accents. Séparez la forme juridique de la dénomination: “SARL MARTIN SERVICES” devient forme “SARL” et nom “MARTIN SERVICES”.

Uniformisez le NAF, aussi appelé code APE, au format 4 chiffres + 1 lettre (source: INSEE — Base Sirene 2026). Ajoutez un mapping vers sections et divisions pour regrouper les activités proches sans perdre le code fin.

Harmonisez les libellés de voie, les compléments et les codes postaux à 5 chiffres (source: INSEE — Base Sirene 2026). Exemple: “AV”, “avenue” et “Av.” doivent produire une même valeur canonique avant matching.

Mettre en place un delta Sirene fiable pour capter les événements

Interrogez l’API Sirene en mode incrémental avec les champs de date de dernier traitement disponibles sur les unités légales et les établissements. Stockez le curseur de reprise après chaque extraction réussie, avec la requête utilisée et l’horodatage d’appel (source: INSEE — API Sirene documentation (consulté 2026-05)).

Classez le delta en immatriculation, changement d’adresse, modification de code NAF ou cessation. Pour chaque ligne, conservez la source API, l’horodatage de collecte et l’identifiant SIREN ou SIRET concerné.

Versionnez chaque fiche SIREN/SIRET. Comparez les champs avant/après: adresse, activité NAF, état administratif, dénomination. Diffusez seulement les écarts qualifiés.

Transformez chaque classe en règle: création récente = priorité commerciale, cessation = désactivation, déménagement = enrichissement et validation de l’adresse.

Journalisez les rejets, par exemple un SIRET invalide. Relancez avec backoff en cas d’échec technique. Alertez quand le volume d’événements s’écarte nettement du comportement habituel.

Licences et RGPD: ce que vous pouvez faire avec Sirene

Sirene est réutilisable sous Licence Ouverte 2.0: copie, modification, redistribution et usage commercial sont permis, avec mention de paternité et de mise à jour (source: Etalab — Licence Ouverte 2.0 (2017)).

La base peut afficher le nom d’un entrepreneur individuel. Dès qu’un nom identifie une personne, traitez-le comme donnée personnelle: minimisez les champs collectés, limitez les accès, sécurisez les exports et fixez une durée de conservation documentée.

Les e-mails, téléphones ou adresses enrichis hors Sirene doivent garder leur provenance: fournisseur, date d’import, finalité, base légale et preuve d’information. Sans cette trace, suspendez l’activation du contact.

L’e-mail est possible si le message vise l’activité professionnelle du destinataire, l’informe clairement de l’usage de ses données et propose un droit d’opposition simple (source: CNIL — Prospection commerciale B2B (consulté 2026-05)).

Avant campagne, conservez une source identifiable, délivrez une information loyale et enregistrez l’opposition sur le canal concerné (source: CNIL — Prospection commerciale B2B (consulté 2026-05)).

Tenez un registre de traitement indiquant données Sirene, enrichissements, finalités, destinataires, sécurité et durées. Centralisez l’opt-out par SIREN, SIRET et contact, puis répercutez-le sur e-mail, téléphone et courrier avant chaque export.

Scoring et segmentation Sirene orientés activation

Le score d’activation combine quatre signaux Sirene: date d’immatriculation pour la récence, état administratif actif, code NAF et zone géographique (source: INSEE — Base Sirene 2026). Traitez le statut actif comme critère bloquant; les autres champs classent l’urgence commerciale.

Les tranches d’effectifs indiquent la taille probable du compte; la catégorie juridique distingue artisans, sociétés commerciales, associations ou administrations (source: INSEE — Base Sirene 2026). Affectez l’effort commercial selon le coût du canal: vente directe pour les comptes structurés, automatisation pour les volumes diffus.

Mappez chaque code NAF vers vos ICP métiers: bâtiment, santé, restauration, services aux entreprises. Excluez les divisions non ciblées avant l’activation pour éviter des messages hors contexte.

Créez quatre segments opérationnels: nouveaux inscrits, changements récents, entreprises multi-établissements et sièges sociaux. Reliez chaque segment à un canal: courrier pour une adresse vérifiée, e-mail B2B si la base légale est validée, audience publicitaire pour élargir la couverture. Fixez un SLA de fraîcheur par canal et suspendez les envois quand le delta Sirene signale une cessation.

Qualité, stockage et gouvernance: un socle qui dure

Reliez chaque établissement à son siège pour éviter qu’une cessation locale masque les autres sites actifs. La déduplication doit d’abord consolider l’entreprise, puis traiter les établissements.

Imposez une clé technique immuable pour chaque ligne chargée. Une cessation devient un soft-delete daté; une correction crée une nouvelle version. Aucun flux Sirene ne doit écraser un état antérieur sans trace.

L’équipe interne doit garder la main sur la déduplication, les versions et les contrôles d’activation.

Premier fichier offert

Recevez les nouvelles entreprises
de votre zone chaque semaine.

Configuration en 2 minutes. Sans carte bancaire. Annulation en 1 clic.

← Tous les articles du journal