Méthodologie

Informations et données d’Expert’Eco

Note méthodologique sur les données

Les données publiées dans Expert’Eco sont extraites d’une base de données créées par le Conseil Supérieur de l’Ordre des Experts-Comptables et appeléeStatexpert.

Ci-après des informations sur la provenance et la définition des données.

Ces éléments sont importants à lire pour comprendre les informations données par Expert’Eco.

Quelques rappels sur le contenu et le fonctionnement de Statexpert

Objectif du projet

L’objectif de Statexpert est de produire des indicateurs macroéconomiques et microéconomiques sectoriels, nationaux et régionaux et de fournir des statistiques géolocalisées correspondant aux besoins statistiques anonymes.

Statexpert une base de données unique des informations comptables et sociales des entreprises. Aucune autre base de données ne dispose d’une telle richesse d’information ou s’en approche

Schéma de fonctionnement

Les données permettant de générer les statistiques sont issues des flux passant par un portail déclaratif. Ces flux proviennent des logiciels de comptabilité utilisés par les cabinets d’expertise comptable pour traiter les dossiers de leurs clients.

Présentation de Statexpert

La richesse de Statexpert tient à :

  • L’universalité des données
    • Tous les régimes fiscaux (BIC, BNC, BA, IS)
    • Toutes les entreprises (sociétés, entreprises personnelles, associations…) y compris pour les entreprises qui ne déposent pas leurs comptes au greffe
  • La fraicheur des données
    • Les données sont disponibles en temps réel (quelques jours après les déclarations fiscales et sociales)
    • Données annuelles, trimestrielles, mensuelles
  • La confidentialité des données
    • Les informations disponibles mais sont anonymisées

Sources

Statexpert exploite les données issues des déclarations suivantes:

  • DUCS mensuelles et trimestrielles (non exploitées à ce jour par Expert’Eco)
  • TVA mensuelles et trimestrielles
  • TDFC

Le périmètre des informations est national.

Grille de lecture

Les données analysées

Les informations proviennent donc de sources différentes. Cela a un impact très lourd sur les analyses que l’on peut en tirer.

Les données mensuelles & trimestrielles

Les données relatives à l'activité et aux investissements sont issues des déclarations de TVA.

  • Les données mensuelles concernent les entreprises dont le chiffre d'affaires dépasse 783 K€ pour les activités de ventes et fourniture de logement ou 236 K€ pour les activités de services, compte tenu des seuils fiscaux en matière de déclaration de TVA.
  • Toutefois, les entreprises peuvent opter pour une déclaration mensuelle de TVA alors même qu’elles ne sont pas légalement tenues à de telles obligations.
  • En pratique, une part importante des entreprises présentes dans la base Statexpert réalisent un chiffre d’affaires inférieur à 250 K€.

Plus précisément :

  • Le chiffre d'affaires correspond au chiffre d'affaires total HT déclaré sur les déclarations de TVA
  • Les investissements correspondent à la base HT reconstituée à partir de la TVA sur immobilisations déclarées sur les déclarations de TVA (taux retenu : 20%)

Important ! Les données diffusées au trimestre correspondent à la compilation des données mensuelles de la période et des données purement trimestrielles. Ainsi, les données relatives au chiffre d’affaires du 1er trimestre 2015 correspondent à la consolidation des données issues des déclarations de janvier, février et mars 2015 (pour les entreprises qui déclarent leur chiffre d’affaires au mois par exemple) ainsi que des données relatives aux déclarations trimestrielles du 1er trimestre 2015.

Le fichier des données trimestrielles cumulent deux sources de données :

  • Les données déclarées mensuellement, donc trois déclarations par entreprise sur le trimestre
  • Les données déclarées trimestriellement, donc une seule déclaration par entreprise sur le trimestre

Dès lors, le nombre d’entreprises et l’effectif des entreprises ne peuvent pas s’additionner directement. En effet, les données mensuelles doivent être retraitées et divisées par trois pour obtenir une valeur moyenne sur le trimestre. Cette valeur est ensuite additionnée à la donnée trimestrielle.

Les périodes comparées

Pour tenir compte des variations saisonnières, les données du mois et/ou du trimestre analysé sont comparées aux données :

  • du mois (ou du trimestre précédent)
  • de l'avant-dernier mois (ou trimestre)
  • du même mois (ou trimestre) de l’année précédente.

La variation présentée dans les tableaux compare les chiffres du mois et/ou du trimestre analysé avec ceux du même mois et/ou du trimestre de l’année précédente. Les évolutions présentées seront des évolutions en glissement annuel.

L'échantillon et la notion de périmètre comparable

Les entreprises réalisant moins de 20 K€ ou plus de 50 M€ de chiffre d’affaires sont systématiquement exclues de l’échantillon.

Afin de réaliser des analyses économiques exploitables, toutes les données sont gérées à périmètre comparable.

Autrement dit, pour les données relatives au chiffre d’affaires, l'échantillon retenu correspond aux entreprises ayant établi une déclaration de TVA sur la période analysée ET sur la même période de l’année précédente :

  • Une entreprise ayant établi une déclaration de TVA pour le mois de mars 2015 ne sera donc conservée que si elle a également établi une déclaration pour le mois de mars 2014
  • A l’inverse, une entreprise qui aurait établi une déclaration de TVA en mars 2015, mais pas en mars 2014, serait exclue de l’analyse.
  • les données trimestrielles sont traitées selon le même principe.

Autrement dit, l’échantillon ne comprend donc :

  • aucune entreprise créée sur la période. Les entreprises nouvellement créées ne seront intégrées dans l’échantillon que lorsqu’elles présenteront des données pour chacune des périodes comparées.
  • aucune entreprise disparue sur la période.

Concrètement, ce choix méthodologique signifie :

  • que l’analyse porte sur les entreprises pérennes sur la période analysée ; celles qui représentent le coeur de l’activité
  • que les retournements de tendances, que ce soit à la hausse ou à la baisse, sont lissés :
  • à la hausse dans la mesure où les entreprises créées ne sont pas analysées
  • à la baisse dans la mesure où les entreprises disparues ne sont pas analysées.

La méthodologie retenue est donc différente de celle utilisée par l’INSEE pour le calcul du PIB. L’organisme de statistique retient, en effet, les créations et les disparitions car il sait identifier les entreprises effectivement créées ou disparues.

Pour l’INSEE, une création de société aura donc un impact positif sur le chiffre d’affaires de son secteur et, in fine, de l’ensemble de l’économie française. A l’inverse, une disparition de société aura un impact négatif sur ces indicateurs.

Pour Statexpert, les entreprises entrées ou sorties au cours de la période sont éliminées de l’analyse.

Cette méthodologie est la seule possible dans la mesure où il nous est impossible de faire la différence entre :

  • une entreprise effectivement créée et une entreprise qui se mettrait à utiliser un des portails déclaratifs participant au projet
  • une entreprise effectivement disparue et une entreprise qui, pour une raison ou pour une autre, arrêterait d’utiliser un des portails déclaratifs participant au projet : changement de portail, changement d’expert-comptable…

Le périmètre comparable est recalculé tous les mois à partir des données de la période. Ainsi, une entreprise exclue sur une période peut parfaitement être intégrée dans le périmètre comparable du mois suivant.

Traitements des données

Compte tenu de la diversité des sources (plusieurs milliers de cabinets d’EC contribuent à alimenter les données de Statexpert), les informations doivent être filtrées pour éliminées les erreurs et incohérences.

La liste des filtres mis en place sur les TVA

Toutes les entreprises répondant à l’un des critères suivants ont été exclues de l’analyse :

Filtres Applicables à : Explication
Chiffre d’affaires = 0 Au moins 3 des 4 périodes analysées 1  
Chiffre d’affaires cumulé > 14 M€ 3 dernières périodes analysées 2 Les entreprises de plus de 50 M€ de chiffres d’affaires annuel sont exclues de l’analyse
Chiffre d’affaires cumulé < 5 K€ 3 dernières périodes analysées 3 Les entreprises de moins de 20 K€ de chiffres d’affaires annuel sont exclues de l’analyse
Variation du chiffre d’affaires entre M et M-12 inférieure à 0,2 Entreprises dont le chiffre d’affaires mensuel est supérieur à 50 K€ sur la période M-12 Les entreprises sont les variations du chiffre d’affaires sont anormalement élevées entre deux périodes ont été exclues de l’analyse. Afin de ne pas exclure des petites entreprises en forte croissance (ou en forte baisse), seules les structures présentant un chiffre d’affaires supérieur à 50 k€ sont concernées par ce filtre (sur la période M-12 pour les entreprises dont le chiffre d’affaires s’effondre, sur la période M pour celles dont le chiffre d’affaires explose).
Variation du chiffre d’affaires entre M et M-12 supérieur à 5 Entreprises dont le chiffre d’affaires mensuel est supérieur à 50 K€ sur la période M Les entreprises sont les variations du chiffre d’affaires sont anormalement élevées entre deux périodes ont été exclues de l’analyse. Afin de ne pas exclure des petites entreprises en forte croissance (ou en forte baisse), seules les structures présentant un chiffre d’affaires supérieur à 50 k€ sont concernées par ce filtre (sur la période M-12 pour les entreprises dont le chiffre d’affaires s’effondre, sur la période M pour celles dont le chiffre d’affaires explose).

 

Les blocages complémentaires « manuels »

Au-delà des filtres mécaniques et logiques, dans certaines circonstances, certaines entreprises seront exclues de l’analyse de manière manuelle.

C’est notamment le cas pour les entreprises qui ont un poids très élevés par rapport au périmètre auquel elles appartiennent :

  • Des entreprises qui surpondèrent les résultats d’ensemble d’une région ou d’un département. Autrement dit, une entreprise pourrait être exclue de l’analyse du département A, alors qu’une entreprise présentant exactement les mêmes données serait conservée pour l’analyse du département B.
  • Des entreprises qui surpondèrent les résultats d’ensemble d’un secteur d’activité. Autrement dit, une entreprise pourrait être exclue de l’analyse du secteur X, alors qu’une entreprise présentant exactement les mêmes données serait retenue pour l’analyse du secteur Y.

Une entreprise qui est sortie de la base par le biais d’un filtre ou d’un blocage manuel est exclue de l’ensemble des analyses de la période.

L’analyse des données issues de Statexpert : quelques évidences qu’il est bon de rappeler

Les données présentées dans le cadre de Statexpert sont issues des déclarations faites par les experts-comptables utilisant les services d’une plateforme déclarative pour le compte de leurs clients.

Les secteurs suivis

Au-delà des analyses nationales, régionales et départementales, Statexpert propose une analyse pour certains secteurs d’activité.

Le groupe de travail au sein de l'ordre des Expert-Comptable a fait le choix de ne pas retenir les secteurs traditionnels. C'est pourquoi, 16 secteurs ont été déterminés par le groupe de travail.

Les 16 secteurs identifiés ne couvrent pas la totalité des codes NAF. De même, deux secteurs se « chevauchent » en partie : le secteur HCR et le secteur tourisme (le premier étant, en partie, inclus dans le second). Demander la définition des codes NAF des secteurs.

  • 1. Mois M, mois M-1, mois M-2 et mois M-12
  • 2. Mois M, mois M-1 et mois M-2
  • 3. Mois M, mois M-1 et mois M-2