Accueilretour

La loi de Benford

Sémantique

Logique

Infini

Mesure

Probas

Nombres

Physique


Il n'y a pas si longtemps, pour effectuer précisément et rapidement une multiplication, on utilisait une table de logarithmes. Dans un petit livret, on recherchait les logarithmes des nombres à multiplier. Puis on les ajoutait, et on se servait de la table pour trouver le nombre correspondant au logarithme ainsi déterminé.

Quelqu'un remarqua un jour que les pages du début des tables de logarithmes étaient plus usées que celles de la fin. Il ne s'agit pourtant pas d'un mauvais roman dont on ne lit que le début. Pourquoi, des nombres pris au hasard commenceraient-ils plus volontiers par un petit chiffre (1 ou 2) que par 7, 8 ou 9 ? Ceci va à l'encontre de l'argument, logique mais naïf, selon lequel un chiffre pris au hasard a autant de chances de valoir 1 que 9.

Mais qu'en est-il des premiers chiffres des nombres figurant dans un grand ensemble de données (pouvant être considérées comme aléatoires) ? En 1938, le physicien Frank Benford étudia le phénomène de façon empirique sur 20 groupes de nombres mesurant des quantités des plus variées (superficie des lacs, poids moléculaires de certains composés...). Il parvint à la conclusion étonnante que les valeurs avaient effectivement plus de chance de commencer par un petit chiffre. Il énonça la loi des nombres anormaux, connue malgré tout sous le nom de loi de Benford (p désignant la probabilité) :

pn = p(1er chiffre = n) = log10(n+1) − log10(n).

Les valeurs obtenues sont les suivantes :

n 1 2 3 4 5 6 7 8 9
pn 0,301 0,176 0,125 0,097 0,079 0,067 0,058 0,051 0,045

1 est plus de 6 fois plus probable que 9 !..

Depuis sa découverte, la loi de Benford a été testée avec succès sur des milliers de jeux de données, et aussi démontrée rigoureusement dans le cas de données vraiment aléatoires.

Essayons d'illustrer la preuve (difficile) avec les numéros des maisons dans une rue. Si la rue ne compte que 9 maisons, tous les premiers chiffres sont évidemment équiprobables. Mais si la rue a 19 maisons, le 1er chiffre est 1 dans 11 cas sur 19. Plus généralement :

  • les premiers chiffres ne sont équirépartis que lorsque la rue compte 9, 99, 999... 10n−1 maisons : autant dire "presque jamais'' ;
  • la distribution des premiers chiffres se modifie en fonction du nombre des maisons de manière bizarre et irrégulière, mais pas impossible à calculer. La moyenne des fluctuations ainsi obtenues conduit à la loi de Benford.
Mais la longueur des rues suit elle aussi cette même loi ! En développant cette idée, on prouve que la loi de Benford est scalante, càd indépendante de l'échelle : peu importe l'unité dans laquelle les données seront mesurées. Cette invariance d'échelle intègre la loi de Benford à la théorie du chaos.

Maintenant, plus personne n'utilise des tables de logarithmes. Il est amusant de se demander s'il serait encore possible de découvrir la loi de Benford de nos jours.


Cette présentation est tirée du livre de I. Stewart : L'univers des nombres, Belin 2000, pp. 57-61.