Le mystère de Zipf-Mandelbrot

library-488677_640La loi de Zipf est une loi étrange qui prédit que, dans un livre, le mot le plus fréquent est deux fois plus fréquent que le suivant, qui lui même est deux fois plus cité que le troisième et ainsi de suite. Mandelbrot l’a généralisé et…les citations des références à la fin des articles de Wikipedia suivent cette étrange loi. L’analyse a été faite dans le cadre d’un projet de recherche sur les corrélations entre l’écrit et la psychologie cognitive. En voici les résultats.

Pour ce projet, nous avons analysé plus de 600000 publications scientifiques ou références citées dans Wikipedia. La courbe suivante représente la proportion de publication citées n fois ou plus.

Capture d’écran 2016-07-05 à 19.17.19

Comme nous pouvons le constater, la distribution suit une loi de Zipf-Mandelbrot, presque parfaitement (l’échelle est logarithmique).

Capture d’écran 2016-07-05 à 19.17.06

Une présentation détaillée des résultats de cette étrangeté est disponible dans la bibliographie.

Voici également les éditeurs les plus présents

Capture d’écran 2016-07-05 à 19.17.35

Ainsi que la répartition par année de publication.

Capture d’écran 2016-07-05 à 19.17.52

On y voit bien l’accélération de la fin des années 1990, et les deux guerres mondiales.

 

Télécharger cet article au format PDF ou ePub

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.