Utilisateur:EdC/Statistiques-1

Un article de Wikipédia, l'encyclopédie libre.

Sommaire

[modifier] 100 pages au hasard classées par ordre de fréquentation: Introduction

J'ai tiré 100 pages au hasard, et chacun des articles, je les ai évalués avec cet outil de comptage, sur les mois de février, mars et avril 2008 - (avant février, il ne marchait pas). Et puis, je les ai classés. Si le tirage au hasard est vraiment aléatoire, et que le nombre total des articles est de 600 000, on peut dire que chacun des cent articles tirés au hasard représente un contingent de 6000 articles. J'ai conservé scrupuleusement tous les articles tirés au sort, à l'exception de 2 ou 3 pages d'homonymies que j'ai rejetées.

Il faut donc lire, par exemple, à la troisième ligne: « L'article Programmation orientée objet a eu 3723 visites en mars 2008. »

On déduit très vite de ce tableau aussi que :

  • 50% environ des articles ont plus de 100 accès mensuels
  • 35% ont plus de 200 accès
  • 14%, plus de 500 accès,
  • 10%, plus de 1000 accès.
  • 6%, plus de 2000 accès.

Difficile de s'aventurer à tirer des conclusions à l'intérieur de ces 6% qui représentent quelque 36 000 articles, car on ne dispose plus que de 6 tirages qui représentent ces 36 000 articles.

Si l'estimation que je fais plus bas (#Calcul du nombre de visites totales mensuelles) de 350 millions de visites mensuelles sur la wiki française est correcte, on peut dire que c'est environ 2% des articles, soit 12 000 qui assurent 50% du trafic,ou 33% des articles, soit 200 000, qui en assurent 90%.

En fait l'objectif poursuivi en faisant ce tirage au sort un peu fastidieux était d'abord d'avoir une information qualitative sur ce qui passionne les foules et ce qui les passionne moins, surtout ce qui les passionne moins d'ailleurs, puisque ce tirage de 100 pages au hasard avait très peu de chances de tomber sur l'un des 1000 premiers articles qui reçoivent chacun au moins 25 000 visites par jour. Il faut donc lire ce tableau ligne par ligne.

[modifier] 100 pages au hasard classées par ordre de fréquentation: Le détail

Titre de l'article Commentaire févr-08 mars-08 avr-08
1 Brûlure   5538 5323 5530
2 RAW_(format_d'images)   4621 4200 3606
3 Programmation_orientée_objet informatique 4549 3723 3445
4 Georges_de_Lydda Martyr chrétien (Saint-Georges) 2960 3114 3881
5 Stade_du_miroir concept psychanalitique 2476 3000 2869
6 Disiz_la_Peste rappeur 2220 2300 2551
7 Centre de rétention administrative en France   1758 1546 1253
8 Ewa_Sonnet Chanteuse de charme polonaise 1598 1435 1042
9 Injecteur   1249 1118 1221
10 The_Rose Film 1979 1304 1017 1171
11 Heart_of_Midlothian_FC club de foot écossais 685 491 591
12 Deepak Chopra Gourou de la santé né en 1947 557 566 583
13 13 fantômes film 2001 526 606 561
14 Traffic_(groupe) Groupe de Rock britannique 538 623 520
15 América_Móvil Entreprise mexicaine 276 673 493
16 Henri_Ier_de_Montmorency connétable de France 388 466 397
17 Émondage taille des arbres 281 374 478
18 Renault_VESTA_2 voiture 291 564 273
19 Aravane_Rezaï Joueuse de tennis 482 278 293
20 Plateau_des_Guyanes   353 356 322
21 Geneviève_Tabouis journaliste morte en 1985 344 281 332
22 Système_éducatif_australien   323 308 244
23 État_tampon   257 274 225
24 Bataille_de_Vauchamps Bataille de France, 1814 213 233 202
25 Méthode_Zoé Série télévisée américaine 150 203 285
26 Pablo_Gargallo sculpteur espanol mort en 1935 187 224 194
27 Jour_du_Non fête nationale grecque 179 212 178
28 Commission régionale du patrimoine et des sites   155 184 213
29 Grande_Loge_mixte_universelle Obédience maçonnique 207 161 172
30 Grammaire_du_malais-indonésien   159 171 175
31 Muriel_Spark Romancière britannique 153 220 131
32 Antoine_Bonifaci Footballeur, né en 1931 207 198 61
33 Kelli_Williams actrice américaine née en 1970 167 149 150
34 Allentown_(Pennsylvanie)   149 181 119
35 Till l'Espiègle (Richard Strauss)   140 146 158
36 Anciennes_communes_de_la_Drôme liste 154 154 129
37 Institut_de_technologie_agroalimentaire Institut québecquois 137 161 136
38 Marek_Kamiński Exporateur polonais né en 1962 132 136 96
39 Les_Zetlaskars_et_la_Trompida Groupe de musique angevin 99 94 136
40 Uri_Dan réalisateur israélien né en 1935 87 120 111
41 Michael_Ball Footballeur anglais 117 94 105
42 Bertincourt Commune française 87 132 96
43 Geert_Mak Journaliste Hollandais 107 100 106
44 Varberg Ville de Suède 93 110 103
45 (55565) 2002 AW197 Objet transneptunien 111 92 101
46 Gilles_Segal acteur de cinéma né en 1932 116 72 109
47 JavaFX_Mobile plateforme informatique 74 101 84
48 TelecityRedbus chaine de datacenter 83 80 95
49 Riederalp Commune du Valais (Suisse) 100 93 64
50 Chez_moi_(album) Album de Serge Lama 97 72 66
51 Mehdi_Mérabet Joueur de Rugby à XV 71 83 74
52 Ivan_Asen_Ier Empereur bulgare 1189 73 69 65
53 Vandoies Commune italienne 59 81 67
54 Saint-Hilaire-du-Maine Commune française, 664 hab 60 66 79
55 Mont_Somma Ancien volcan 55 70 76
56 L'Annexe Série télé 1993 71 70 54
57 1626_en_littérature   64 71 50
58 Chris_Bachalo dessinateur de comic-book 5 107 68
59 Richard_Coulas Joueur de Rugby à XV 64 52 62
60 Springtime_(Silly_Symphony) Walt Disney 1929 59 60 58
61 Antoine-Augustin_Renouard Libraire né en 1765 50 54 71
62 Salvador_Moncada Scientifique, mari de Marie-Esmeralda de Belgique 64 61 48
63 Spud Artiste de musique électronique 61 49 62
64 Fangatau_(commune)   35 73 54
65 Miriam_Louisa_Rothschild Enthomologiste britannique 60 28 63
66 Comté_de_Baltimore   44 49 56
67 Limnophyton Plante 58 42 49
68 TÉLUQ Télé-université québecquoise 49 46 53
69 Studentersamfundet_i_Trondheim Assoc. Étudiante norvégienne 49 54 45
70 Ateas Roi scythe 44 41 62
71 Jean_Glucq Personnage vers 1700 47 55 44
72 Meurcé Commune de la Sarthe 43 57 38
73 Gerald_Edwin_Hamilton_Barrett-Hamilton Mammalogiste britannique mort en 1914 46 46 41
74 Bataille_de_Dinwiddie_Court_House Bataille guerre de Sécession 0 74 56
75 Yves_d'Évreux Explorateur né en 1577 28 51 50
76 Isoxys Petit arthropode 44 43 41
77 Enonkoski Municipalité finlandaise. 37 42 42
78 Evaristo_Márquez_Contreras Sculpteur espagnol mort en 1996 50 36 34
79 Élie Bayol coureur automobile né en 1912 42 44 32
80 Joseph Victor Aubernon homme politique né en 1782 48 36 34
81 Zhu_Wen_(écrivain) écrivain chinois 38 46 32
82 Rabbi Eliezer ben Hyrcanos Sage du Talmud 1er siècle 33 37 44
83 Hervé_Hadmar Réalisateur né en 1963 46 26 41
84 Henri Debluë écrivain né en 1924 31 35 47
85 Bert_Kalmar Scénariste américain né en 1884 41 36 33
86 Comté_de_Benzie Comté du Michigan 44 38 25
87 Union_d'Oujgorod fait historico-religieux, 1646 31 31 45
88 Robert_Dinesen Réalisateur de cinéma danois 37 37 30
89 Vayelekh section hebdomadaire de la Torah 33 42 28
90 Victor_Ivanovitsch_Motschulsky Entomologiste russe XIXe siècle 34 32 32
91 Agnes_von_Zahn-Harnack féministe allemande 37 29 28
92 Jules-César_Boulenger historien 17e siècle 34 30 29
93 Comté_de_Jinyun division administrative chinoise 32 26 33
94 Conus_mercator Mollusque 25 29 25
95 Mirja_Lehtonen Fondeuse finlandaise 23 21 34
96 Cyrtodactylus seribuatensis Variété de gecko 22 27 21
97 Stronmaus Dieu de Donjon et Dragon 19 21 27
98 Pseudanthias_rubrizonatus Espèce de poissons 17 19 29
99 Colli_del_Trasimeno_Cabernet_Sauvignon vin rouge italien 23 17 17
100 Ter'angreal objet du jeux "La Roue du Temps" 2 1 1
  Moyenne   393 388 377

[modifier] Calcul du nombre de visites totales mensuelles

Pour calculer le nombre de vistes mensuelles, j'ai eu recours à une page à laquelle on avait accés jusqu'au mois de novembre 2007 et qui s'appelait wikichart et qui donnait les 1000 articles les plus consultés. J'en avais sauvegardé une page du mois de novembre. A cette époque, l'outil commençait à déconner, c'est-à-dire qu'il intégrait sur octobre et novembre à la fois, ce qui n'est pas très génant. Le chiffre absolu des accés par article était complètement érroné, mais le pourcentage de ce que représentait l'article était à peu près correct.

En intégrant tous ces pourcentages, on arrivait à 17.65% pour les 1000 articles les plus lus.

Pour évaluer le nombre total d'accés mensuel, j'ai sélectionné dans le top 1000 de novembre 20007 six articles que j'estimais peu soumis aux variations saisonnières, ni Sébastien Chabal, ni Guy Môquet, mais des valeurs sûres et stables (Voir tableau ci-dessous) et je les ai évaluées sur les mois de février-mars-avril 2008, la même période que mon tirage des cents pages au hasard.

Titre de l'article % Nov. 07

Moy.

Fev-mar-avr 08

Cerveau 0.0070% 26632
Mer_Méditerranée 0.0071% 5269
Simone_de_Beauvoir 0.0071% 24697
Lyon 0.0140% 44143
Charlemagne 0.0129% 34677
Martin Luther King 0.0099% 65568
Total 0.06% 200987
Extrapolation 100% 346528736

C'est ainsi qu'on arrive à une évaluation de 350 millions d'accès mensuels sur l'ensemble de la wiki française.

[modifier] Conclusion

Reprenons quelques résultats:

  • Nombre d'accés mensuels : 350 millions
  • Les mille articles les plus lus représentent 17.65% des accès
  • Environ 2% des articles (12 000) représentent 50% des accès.
  • Le tiers des articles (200 000) représentent 90% des accès.
  • 10% des articles (60 000) ont au moins 1000 visites par mois.

[modifier] Voir aussi