🔢 Une loi qui défie l'intuition
Prends un annuaire, les superficies des pays, les montants de milliers de factures, les cours de bourse, les longueurs des fleuves… Dans chacun de ces nombres, regarde uniquement le premier chiffre significatif (le 1 de 1789, le 3 de 0,0345, le 7 de 712).
Intuitivement, tu t'attends à ce que chaque chiffre de 1 à 9 apparaisse une fois sur neuf, soit ≈ 11,1 %. Faux. Dans la réalité, le chiffre 1 apparaît dans ≈ 30 % des cas, et le chiffre 9 dans à peine ≈ 5 %. C'est la loi de Benford.
🎛️ Teste-la toi-même
Choisis un jeu de nombres ci-dessous. Le code génère ≈ 1000 valeurs, extrait leur premier chiffre et trace l'histogramme (barres violettes). La courbe dorée pointillée est la prédiction théorique de Benford. Regarde comme certaines collent parfaitement… et une non.
📊 Fréquence du premier chiffre
Barres = données réelles · courbe dorée = loi de Benford théorique
Verdict
…
📜 Newcomb, 1881 : des tables de logarithmes usées
L'astronome et mathématicien Simon Newcomb remarque en 1881 un détail étrange. À l'époque, on calcule à l'aide de gros livres de tables de logarithmes. Newcomb observe que les premières pages de ces livres — celles qui commencent par 1 — sont bien plus cornées et noircies que les dernières.
Conclusion : les gens cherchent bien plus souvent le logarithme de nombres commençant par 1 que par 9. Newcomb énonce alors la formule, mais sans preuve ; son article passe inaperçu.
🔬 Benford, 1938 : 20 000 nombres
En 1938, le physicien Frank Benford (chez General Electric) redécouvre le phénomène et le teste sur plus de 20 000 valeurs issues de sources totalement différentes : surfaces de rivières, populations de villes, constantes physiques, numéros d'adresses, masses atomiques… Toutes obéissent à la même loi. Elle porte désormais son nom.
📐 La formule
La probabilité que le premier chiffre significatif soit d (avec d de 1 à 9) vaut :
P(d) = log₁₀(1 + 1/d)
Ce qui donne :
- 1 → 30,1 % 2 → 17,6 % 3 → 12,5 %
- 4 → 9,7 % 5 → 7,9 % 6 → 6,7 %
- 7 → 5,8 % 8 → 5,1 % 9 → 4,6 %
La somme fait bien 100 %, car log₁₀(2/1) + log₁₀(3/2) + … + log₁₀(10/9) = log₁₀(10) = 1.
🧠 L'intuition : tout se passe sur une échelle logarithmique
Pourquoi le 1 gagne ? Imagine un nombre qui grandit régulièrement, disons un placement à intérêts composés partant de 100 €. Pour passer de 100 à 200 (premier chiffre = 1), il faut doubler son argent. Mais pour passer de 900 à 1000 (premier chiffre = 9), il suffit de gagner 11 %.
Le nombre passe donc beaucoup plus de temps dans la zone « commence par 1 » que dans la zone « commence par 9 ». Sur une échelle logarithmique (où l'on regarde la mantisse de log₁₀), l'intervalle [1 ; 2[ occupe log₁₀2 ≈ 30 % de la décade, contre log₁₀(10/9) ≈ 4,6 % pour [9 ; 10[.
C'est aussi la seule loi invariante par changement d'échelle : que tu comptes en euros, en dollars, en mètres ou en pieds, multiplier tous les nombres par une constante ne change pas la répartition des premiers chiffres. Cette propriété d'invariance force mathématiquement la loi de Benford.
🕵️ Application n°1 : détecter la fraude
Voilà l'usage le plus spectaculaire. Quand un fraudeur invente des chiffres (fausses factures, faux relevés comptables, fausse déclaration fiscale), son cerveau a tendance à répartir les premiers chiffres de façon trop uniforme — il met « au hasard » autant de 7 et de 8 que de 1 et de 2.
Or de vraies données comptables suivent Benford. Un écart trop net entre la distribution observée et la courbe théorique est un signal d'alarme. Cette technique est utilisée par :
- les administrations fiscales (l'IRS américaine, des fiscs européens) pour repérer les déclarations truquées ;
- les experts-comptables et auditeurs (l'analyse Benford est intégrée à de nombreux logiciels d'audit) ;
- la justice : des fraudes comptables ont été détectées et même utilisées comme indice devant les tribunaux.
🗳️ Application n°2 : élections et données scientifiques
La loi a été invoquée pour repérer d'éventuels bourrages d'urnes (les nombres de voix par bureau de vote devraient suivre une forme de Benford), pour détecter des résultats scientifiques fabriqués, ou des manipulations dans des données macroéconomiques nationales. Attention toutefois : elle ne s'applique pas à n'importe quoi, et un écart à Benford est un indice, pas une preuve.
⚠️ Pourquoi l'aléatoire uniforme ne suit PAS Benford
Dans la simulation, le bouton « Aléatoire uniforme » donne un histogramme presque plat qui s'écarte nettement de la courbe dorée. C'est normal : si tu tires des nombres au hasard uniformément entre 1 et un million, chaque premier chiffre est à peu près équiprobable.
Benford n'apparaît que pour des données qui s'étalent sur plusieurs ordres de grandeur (de l'unité au milliard) et résultent souvent de processus multiplicatifs (croissances, intérêts, tailles de populations). Un tirage uniforme borné, lui, vit sur une seule échelle : il n'a aucune raison de privilégier le 1.