Méthodologie
Contribuables Associés vous explique comment est recensé le nombre de « mots » de 20 codes législatifs français, sur la période 2000-2025.
Pourquoi le nombre de mots ?
Notre expert, Christophe Eoche-Duval, spécialiste de la volumétrie normative, a pu par ses différents travaux reconnus, mettre en évidence que ce n’est plus le nombre de pages du Journal officiel, ou le nombre de textes juridiques (somme des lois, ordonnances, décrets, arrêtés…), ou le nombre d’article des textes juridiques qui peuvent mesurer de manière fiable l’indice du volume du droit applicable ainsi que de son inflation, c’est le critère du comptage du nombre de « mots » de la somme de tous les textes en droit «consolidé » (expression synonyme de « droit en vigueur »).
Source des données
Les données ont été obtenues grâce à l’API Légifrance, un outil numérique officiel fourni par le gouvernement français (services de Matignon) via la plateforme PISTE (Plateforme d’Intégration et de Services pour les Téléprocédures). Une API, ou « interface de programmation d’application », est une sorte de pont informatique qui permet de récupérer automatiquement des informations depuis une base de données en ligne, ici les textes de lois hébergés sur Légifrance. Pour chaque code étudié et chaque année, une requête spécifique a été envoyée à l’API, demandant la version complète du texte en vigueur à une date donnée. L’API renvoie alors le texte sous une forme structurée, incluant les titres, les sections et les articles. Ce processus automatisé permet de collecter des informations fiables et à jour directement depuis la source officielle, sans avoir à consulter manuellement les versions papier ou les sites web.
Codes législatifs étudiés
Il existe 77 codes légaux. Le droit codifié représentait 46,39% du droit français en vigueur en janvier 2025, mais Vigie Normes se limite à un panel de codes. Le fichier inclut 20 codes juridiques majeurs de la législation française, couvrant divers domaines du droit. Ces codes sont les suivants :
– Code général des impôts
– Code de la consommation
– Code de l’action sociale et des familles
– Code de la santé publique
– Code de l’environnement
– Code pénal
– Code civil
– Code de la construction et de l’habitation
– Code de l’urbanisme
– Code du travail
– Code de commerce
– Livre des procédures fiscales
– Code de l’entrée et du séjour des étrangers et du droit d’asile
– Code de la sécurité sociale
– Code rural et de la pêche maritime
– Code de procédure pénale
– Code général des collectivités territoriales
– Code de l’éducation
– Code de la sécurité intérieure
– Code monétaire et financier
Les dates
Le décompte a été effectué pour chaque code au 25 janvier de chaque année, de 2000 à 2025. Cette date annuelle a été choisie comme point de référence pour observer l’évolution des textes sur une période de 26 ans. Pour chaque année, le texte retenu est celui en vigueur à minuit le 25 janvier (première minute de la journée).
Pourquoi le 25 du mois civil ?
Ce sont les informaticiens de Matignon qui ont eux-mêmes fixé le comptage à cette date, purement conventionnelle, et depuis 2019, parce que le choix du 1er du mois (voire du 15 ou du 30) aurait présenté l’inconvénient que de nombreux textes entrent ou sortent en vigueur à une date fixe du mois civil. Cela aurait faussé le décomptage des textes en vigueur, comparables d’un mois sur l’autre. Cette date du « 25 » est au contraire statistiquement neutre.
Méthode de comptage des « mots »
Pour chaque code et chaque année :
1. Le texte intégral a été récupéré via l’API Légifrance, incluant :
– Le titre principal du code (ex. « Code civil »).
– Les titres des sections et sous-sections (ex. « Titre Ier : Des droits civils »).
– Le contenu des articles législatifs, précédé du mot « Article » et de leur numéro (ex. « Article 1 »).
2. Le texte brut a été extrait en supprimant les balises informatiques (comme le HTML) pour ne conserver que les mots lisibles.
3. Le nombre de mots a été calculé en comptant chaque groupe de caractères séparé par des espaces. Par exemple :
– « Article 1 Les lois » compte 4 mots.
– Les mots avec apostrophes (ex. « l’article ») sont considérés comme un seul mot.
Résultat
Le fichier Excel produit contient une colonne « Année » (de 2000 à 2025) et une colonne pour chacun des 19 codes, avec le nombre de mots correspondant à chaque date. Ce tableau permet de suivre l’évolution de la longueur des textes législatifs sur la période étudiée.
Remarque
Le comptage inclut les titres, les numéros d’articles et le mot « Article », ce qui peut légèrement différer d’autres méthodes qui excluraient ces éléments. De plus, la date exacte (25 janvier à minuit) est basée sur le temps universel (UTC), ajusté pour correspondre à l’heure de Paris. Cette méthode, appuyée sur l’API Légifrance, offre une mesure cohérente et reproductible de la taille des principaux codes juridiques français sur plus de deux décennies.
Comment estimer le nombre global de mots, textes non codifiés inclus ?
Selon les données Légifrance, au 5 mai 2025, le droit codifié (les 77 codes) représente 46,39 % du stock de l’ensemble du droit applicable à cette date. Légifrance évalue la part du droit non codifié (53,61%) à 117.773 textes non codifiés, dont l’inflation est symétrique, ce qui permet à notre expert, Christophe Eoche-Duval, d’évaluer un volume global de mots, codifiés et non codifiés. Contrairement à la croissance des mots des 77 codes, ce volume est une estimation.