Retour au journal
Article·11 mai 2026·5 min de lecture

Guide pour utiliser les données Sirene sur les nouvelles entreprises.

Mode d’emploi opérationnel pour extraire, filtrer et exploiter les nouvelles entreprises dans Sirene, du fichier quotidien à l’API, avec contrôles qualité et conformité RGPD/CNIL.

Filtrer les nouvelles entreprises dans Sirene: fichiers quotidiens vs API

Le filtre de création dépend du niveau observé. Pour une entreprise, utilisez dateCreationUniteLegale. Pour un établissement, utilisez periodeEtablissement.dateDebut, qui date le début de la période courante de l’établissement.

Chargez d’abord le Stock mensuel Sirene pour obtenir une base complète. Ce stock sert de photographie de départ avant les mises à jour.

Appliquez ensuite les Fichiers quotidiens SIREN/SIRET publiés par l’INSEE sur data.gouv.fr. Ils portent les variations par jour ouvré.

Pour isoler les unités actives, ajoutez etatAdministratifUniteLegale:A ou excluez etatAdministratifUniteLegale:C. Pour limiter les doublons liés aux établissements secondaires, filtrez etablissementSiege=true lorsque la prospection vise l’entreprise et non chaque site.

Exemple API Sirene V3, selon la documentation INSEE: q="dateCreationUniteLegale:[2026-04-01 TO 2026-05-08] AND etatAdministratifUniteLegale:A". Ce filtre retourne les unités légales créées dans l’intervalle et encore actives.

dateDernierTraitementUniteLegale n’est pas une date de création. Ce champ signale un traitement INSEE récent; l’utiliser comme critère de nouveauté crée des faux positifs.

Champs Sirene à maîtriser pour une segmentation fiable

Le SIREN identifie l’unité légale, donc l’entreprise. Le SIRET identifie un établissement précis. Pour un courrier B2B national, filtrez plutôt le siège; pour une tournée locale, travaillez au niveau établissement.

Dans Sirene, le bon niveau de segmentation dépend du canal: entreprise pour une cible nationale, établissement pour une action terrain.

Statut de diffusion et ciblage B2B

Le champ statutDiffusionUniteLegale doit être contrôlé avant toute réutilisation. La valeur N interdit la rediffusion des données personnelles de personnes physiques; cette obligation doit bloquer l’export ou masquer les champs concernés.

natureJuridiqueUniteLegale sert à cibler par forme juridique. Exemple: 5710 correspond à une SAS. categorieEntreprise aide à filtrer par taille, notamment pour distinguer des cibles PME, ETI ou grandes entreprises quand le champ est renseigné.

Activité et territoire

activitePrincipaleUniteLegale décrit l’activité NAF de l’entreprise. activitePrincipaleEtablissement décrit celle d’un site. Testez les deux filtres: un siège et un établissement opérationnel peuvent produire des résultats sectoriels différents.

Pour la géographie, combinez codePostalEtablissement, libelleCommuneEtablissement, codeDepartement et codeRegion. Cette combinaison évite les sélections trop larges et permet des campagnes par ville, département ou région.

Pipeline opérationnel en 5 étapes: de la donnée brute au flux quotidien prêt à prospecter

Chargez le Stock SIREN/SIRET INSEE comme référentiel complet. Indexez siren en clé primaire et siret en index secondaire, car une entreprise peut porter plusieurs établissements.

Ingérez les Fichiers quotidiens Sirene comme delta, publiés par l’INSEE sur data.gouv.fr. Validez l’intégrité par hash calculé et compte de lignes, puis journalisez la date d’application.

Nettoyez les champs d’adresse avec une RNVP ou la Base Adresse Nationale. Cette étape fiabilise l’acheminement postal, le rattachement géographique et les filtres par zone.

Dédupliquez d’abord par siren. Si plusieurs établissements apparaissent au même moment, conservez en priorité l’enregistrement avec etablissementSiege=true pour éviter les doublons commerciaux.

Filtrez par code NAF, zone géographique et forme juridique. Excluez statutDiffusion=N. Tracez pour chaque ligne la source, la date, la base légale RGPD et le droit d’opposition.

Point de contrôle minimal: aucun SIREN sans date de chargement, aucun SIRET sans SIREN rattaché, aucun contact exploité sans trace RGPD conforme aux articles 6, 14 et 21.

Choisir le canal: ce que les champs Sirene permettent (et ne permettent pas)

Sirene ne fournit ni emails ni téléphones, dans l’API V3 comme dans les fichiers quotidiens INSEE. Ces données doivent venir d’un enrichissement externe: site web, WHOIS ou annuaires professionnels.

CanalChamps Sirene utilisablesLimite opérationnelleRègle d’activation
PostalAdresse de l’établissement ou du siège, avec statutDiffusion=OUne adresse diffusible peut générer des NPAILancez une RNVP avant routage; elle réduit nettement les plis non distribués.
Email B2BDénomination, NAF et localisation pour segmenter l’offreAucun email dans SireneEnrichissez hors Sirene; basez la prospection sur l’intérêt légitime, avec opt-out visible.
PhoningNAF et zone géographique pour prioriser les appelsAucun numéro dans SireneVérifiez la source du numéro; évitez les mobiles manifestement personnels et respectez l’opposition au démarchage hors usage pro.
TerrainAdresse, géocodage et code NAFSirene ne classe pas les tournées commercialesGéocodez les créations, puis priorisez les zones à forte densité par activité NAF.

Pour l’email B2B, les règles CNIL 2024 imposent une information claire et un moyen simple de s’opposer. Les adresses manifestement personnelles doivent être écartées du ciblage.

Pour le porte-à-porte, croisez les coordonnées géocodées avec le NAF. Une tournée dédiée aux créations de restauration, par exemple, se construit quartier par quartier plutôt que sur une commune entière.

Conformité et licence: réutiliser Sirene sans risque (CNIL, Légifrance, Etalab)

Licence et diffusion

La Licence Ouverte 2.0 d’Etalab autorise la réutilisation libre de Sirene, y compris commerciale, sous condition de paternité. Dans chaque export ou tableau de bord, affichez: Source: INSEE – Sirene, mise à jour du JJ/MM/AAAA.

Ne rediffusez pas une donnée personnelle rattachée à une unité légale avec statutDiffusionUniteLegale=N. Ce statut impose de limiter la diffusion publique, même si la donnée figure dans votre base interne.

Prospection B2B et RGPD

Pour un usage commercial B2B, documentez l’intérêt légitime comme base légale, conformément à l’article 6(1)(f) du RGPD. Informez les personnes au premier contact, selon l’article 14.

Chaque email B2B doit indiquer l’identité de l’émetteur, la finalité, et un lien de désinscription actif. La CNIL exige aussi un ciblage pertinent; la prospection B2C n’est pas couverte ici.

Minimisation et conservation

Conservez uniquement les champs utiles: SIREN, SIRET, date de création, activité, adresse professionnelle et statut de diffusion, si nécessaires. Fixez une durée de conservation, puis supprimez ou archivez.

Inscrivez le traitement au registre: source INSEE, finalité, base légale, catégories de données, durée, destinataires et procédure d’opposition RGPD art. 21.

Premier fichier offert

Recevez les nouvelles entreprises
de votre zone chaque semaine.

Configuration en 2 minutes. Sans carte bancaire. Annulation en 1 clic.

← Tous les articles du journal