Wikipédia:Prévisions

Un article de Wikipédia, l'encyclopédie libre.

Cette page a pour rôle d'estimer l'évolution du contenu de Wikipédia. Plusieurs études peuvent êtres présentées pour un même thème, aucune manière de calculer des prévisions n'étant reine. Ces estimations ne sont pas exhaustives et ne garantissent pas leur justesse, cependant, elles sont réalisées à rôle consultatif et informatif pour pouvoir mieux anticiper l'avenir de l'encyclopédie.

Les études sont numérotées par ordre chronologique de publication sur cette page.


Sommaire

[modifier] Évolution du nombre d'articles

[modifier] Étude 1

[modifier] Méthode utilisée

Cette étude statistique se base sur l'évolution de mois en mois du nombre d'articles de l'année 2005 pour la retranscrire sur 2006. Les évolutions de l'année 2005 sont donc reprises pour calculer les évolutions des mêmes mois de l'année suivante. Après avoir calculé l'évolution du nombre d'articles pendant un mois donné, on calcule l'évolution de cette augmentation par rapport au mois précédent. Ainsi, si le nombre d'articles a augmenté de 9,46% au cours du mois de mars 2005 et qu'il a augmenté de 9,31% au cours du mois d'avril 2005, l'évolution de l'augmentation sera de -1,58% sur le mois d'avril. C'est en reprenant les évolutions des augmentations de 2005, que l'on calcule la hausse du nombre d'articles pour les mois à venir.

[modifier] Tableau de données


Prévisions

Constats
Mois Nombre
d'articles
Coefficient
d'évolution
Évolution Évolution
de l'augmentation
Nombre
d'articles
Différence
Prévision/Constat

Évolutions durant l'année passée :
Mar 2005 86 466 1.0946 9.46 %
Avr 2005 94 645 1.0931 9.31 % -1.5 %
Mai 2005 103 459 1.0845 8.45 % -9.24 %
Jui 2005 112 202 1.1034 10.34 % 22.36 %
Jul 2005 123 807 1.1451 14.51 % 40.33 %
Aoû 2005 141 775 1.1016 10.16 % -42.8 %
Sep 2005 156 180 1.0918 9.18 % -9.64 %
Oct 2005 170 515 1.0738 7.38 % -19.6 %
Nov 2005 183 101 1.0806 8.06 % 9.2 %
Déc 2005 197 863 1.0877 8.77 % 8.8 %
Jan 2006 215 225 1.0823 8.23 % -6.1 %
Fév 2006 232 939 1.0639 6.39 % -22.3 %

Estimations d'évolution pour les mois à venir :
Mar 2006 247 833 1.0639 6.39 % 0.0 %
Avr 2006 263 669 1.0629 6.29 % -1.5 % 263 123 - 546
Mai 2006 280 254 1.05709 5.71 % -9.24 % 278 098 - 2 156
Jui 2006 295 985 1.0685 6.85 % 22.36 % 294 229 - 1 756
Jul 2006 316 659 1.0980 9.8 % 40.33 % 320 314 + 3 655
Aoû 2006 347 697 1.056 5.6 % -42.8 % 337 027 - 10 670
Sep 2006 367 168 1.0506 5.06 % -9.64 % 353 661 - 13 507
Oct 2006 385 745 1.0406 4.06 % -19.6 % 369 435 - 16 310
Nov 2006 401 406 1.0443 4.43 % 9.2 % 385 604 - 15 802
Déc 2006 419 188 1.0481 4.81 % 8.8 %
Jan 2007 439 350

[modifier] Graphique

[modifier] Conclusion

La Wikipédia en français devait atteindre les 300 000 articles pour l'ouverture de la Coupe du monde 2006 (objectif tenu le 4 juin) et a fêté ses 400 000 le 27 novembre 2006. L'année 2007, quant à elle, devrait commencer avec près de 440 000 articles.

[modifier] Évolution de la qualité

[modifier] Étude 2

[modifier] Méthode utilisée

Sur le bistro, un débat opposait les partisans de la création d'ébauches et ceux qui prétendaient vouloir limiter les nouveaux articles pour augmenter la qualité moyenne de Wikipédia.


J'ai mis au point un petit modèle (faux, évidemment), avec trois types d'articles :

  • « ébauche » (et N1 le nombre d'articles correspondants),
  • « normal » (et N2 le nombre d'articles correspondants),
  • « article de qualité » (et N3 le nombre d'articles correspondants).


La qualité moyenne de Wikipédia est déterminée ainsi :

Q = \frac{N_1 + 2 * N_2 + 3 * N_3}{N_1 + N_2 + N_3}

Arbitrairement, j'ai fixé au départ N1 = 100 000, N2 = 150 000 et N3 = 250.


Chaque jour, une quantité E d'ébauches est créée, une proportion P1 d'ébauches deviennent des articles normaux, et une proportion P2 des articles normaux deviennent des articles de qualité. J'ai considéré qu'en moyenne, il fallait un an pour une ébauche pour passer à un statut normal (P1 = 1 / 365), et qu'à l'heure actuelle, on avait un « article de qualité » de plus chaque jour (P2 = 1 / 150 000) (c'est surestimé, mais ces d'articles ne comptent presque pas dans le modèle, donc c'est pas grave).

[modifier] Graphique

Dans le graphique ci-dessous, une variation de qualité positive correspond à une augmentation de la qualité. Le nombre d'ébauches par jour sont :

  • E = 0,
  • E = 200,
  • E = 500 et
  • E = 1000.
Modèle d'évolution de la qualité moyenne de Wikipédia.

Image:WP evol bistro 120306.png

[modifier] Conclusion

On est tous intéressés par l'augmentation de la qualité moyenne de Wikipédia. Évidemment, on pourrait interdire la création de nouveaux articles (E = 0), la qualité augmenterait. Mais elle augmenterait certainement moins vite que si l'on permettait la création d'un petit nombre d'articles, etc. Si on crée trop d'ébauches par jour, la qualité moyenne va baisser : quelle horreur ! Sauf que, dans quelques temps, ces ébauches risquent de s'améliorer, et vont augmenter la qualité de croissance globale de l'encyclopédie.

Au final, malgré toutes les imprécisions du modèle, je pense que ça clarifie les choses : il existe un compromis entre la qualité à court terme (stopper les « entrées » pour les améliorer) et la qualité à long terme (favoriser la création d'articles faibles, qui sont suceptibles de participer à la qualité de Wikipédia dans un lointain futur). À noter que les choix intermédiaires sont probablement les plus mauvais.

Il n'y a pas de méthode parfaite pour analyser la qualité de l'encyclopédie. La tienne est toutefois plus que discutable. Partir du principe que la création d'un article dégrade la qualité d'ensemble, je trouve cela gonflé. Une ébauche de trois lignes pertinentes est parfois plus bénéfique qu'un article de dix paragraphes bâclé. La qualité d'un article est impossible à mesurer statistiquement. Elle se juge, et nous sommes les seuls à avoir une capacité de jugement. Il ne faut pas trop compter sur les ordinateurs pour relire les articles à notre place.

[modifier] Voir aussi

Pronostics sur le nombre d'articles de Wikipédia
50 000 100 000 200 000 250 000 300 000
400 000 500 000 600 000 700 000 1 000 000
Historique Prévisions Statistiques
Autres langues