Utilisateur:EdC/Statistiques-1
Un article de Wikipédia, l'encyclopédie libre.
Sommaire |
[modifier] 100 pages au hasard classées par ordre de fréquentation: Introduction
J'ai tiré 100 pages au hasard, et chacun des articles, je les ai évalués avec cet outil de comptage, sur les mois de février, mars et avril 2008 - (avant février, il ne marchait pas). Et puis, je les ai classés. Si le tirage au hasard est vraiment aléatoire, et que le nombre total des articles est de 600 000, on peut dire que chacun des cent articles tirés au hasard représente un contingent de 6000 articles. J'ai conservé scrupuleusement tous les articles tirés au sort, à l'exception de 2 ou 3 pages d'homonymies que j'ai rejetées.
Il faut donc lire, par exemple, à la troisième ligne: « L'article Programmation orientée objet a eu 3723 visites en mars 2008. »
On déduit très vite de ce tableau aussi que :
- 50% environ des articles ont plus de 100 accès mensuels
- 35% ont plus de 200 accès
- 14%, plus de 500 accès,
- 10%, plus de 1000 accès.
- 6%, plus de 2000 accès.
Difficile de s'aventurer à tirer des conclusions à l'intérieur de ces 6% qui représentent quelque 36 000 articles, car on ne dispose plus que de 6 tirages qui représentent ces 36 000 articles.
Si l'estimation que je fais plus bas (#Calcul du nombre de visites totales mensuelles) de 350 millions de visites mensuelles sur la wiki française est correcte, on peut dire que c'est environ 2% des articles, soit 12 000 qui assurent 50% du trafic,ou 33% des articles, soit 200 000, qui en assurent 90%.
En fait l'objectif poursuivi en faisant ce tirage au sort un peu fastidieux était d'abord d'avoir une information qualitative sur ce qui passionne les foules et ce qui les passionne moins, surtout ce qui les passionne moins d'ailleurs, puisque ce tirage de 100 pages au hasard avait très peu de chances de tomber sur l'un des 1000 premiers articles qui reçoivent chacun au moins 25 000 visites par jour. Il faut donc lire ce tableau ligne par ligne.
[modifier] 100 pages au hasard classées par ordre de fréquentation: Le détail
N° | Titre de l'article | Commentaire | févr-08 | mars-08 | avr-08 |
1 | Brûlure | 5538 | 5323 | 5530 | |
2 | RAW_(format_d'images) | 4621 | 4200 | 3606 | |
3 | Programmation_orientée_objet | informatique | 4549 | 3723 | 3445 |
4 | Georges_de_Lydda | Martyr chrétien (Saint-Georges) | 2960 | 3114 | 3881 |
5 | Stade_du_miroir | concept psychanalitique | 2476 | 3000 | 2869 |
6 | Disiz_la_Peste | rappeur | 2220 | 2300 | 2551 |
7 | Centre de rétention administrative en France | 1758 | 1546 | 1253 | |
8 | Ewa_Sonnet | Chanteuse de charme polonaise | 1598 | 1435 | 1042 |
9 | Injecteur | 1249 | 1118 | 1221 | |
10 | The_Rose | Film 1979 | 1304 | 1017 | 1171 |
11 | Heart_of_Midlothian_FC | club de foot écossais | 685 | 491 | 591 |
12 | Deepak Chopra | Gourou de la santé né en 1947 | 557 | 566 | 583 |
13 | 13 fantômes | film 2001 | 526 | 606 | 561 |
14 | Traffic_(groupe) | Groupe de Rock britannique | 538 | 623 | 520 |
15 | América_Móvil | Entreprise mexicaine | 276 | 673 | 493 |
16 | Henri_Ier_de_Montmorency | connétable de France | 388 | 466 | 397 |
17 | Émondage | taille des arbres | 281 | 374 | 478 |
18 | Renault_VESTA_2 | voiture | 291 | 564 | 273 |
19 | Aravane_Rezaï | Joueuse de tennis | 482 | 278 | 293 |
20 | Plateau_des_Guyanes | 353 | 356 | 322 | |
21 | Geneviève_Tabouis | journaliste morte en 1985 | 344 | 281 | 332 |
22 | Système_éducatif_australien | 323 | 308 | 244 | |
23 | État_tampon | 257 | 274 | 225 | |
24 | Bataille_de_Vauchamps | Bataille de France, 1814 | 213 | 233 | 202 |
25 | Méthode_Zoé | Série télévisée américaine | 150 | 203 | 285 |
26 | Pablo_Gargallo | sculpteur espanol mort en 1935 | 187 | 224 | 194 |
27 | Jour_du_Non | fête nationale grecque | 179 | 212 | 178 |
28 | Commission régionale du patrimoine et des sites | 155 | 184 | 213 | |
29 | Grande_Loge_mixte_universelle | Obédience maçonnique | 207 | 161 | 172 |
30 | Grammaire_du_malais-indonésien | 159 | 171 | 175 | |
31 | Muriel_Spark | Romancière britannique | 153 | 220 | 131 |
32 | Antoine_Bonifaci | Footballeur, né en 1931 | 207 | 198 | 61 |
33 | Kelli_Williams | actrice américaine née en 1970 | 167 | 149 | 150 |
34 | Allentown_(Pennsylvanie) | 149 | 181 | 119 | |
35 | Till l'Espiègle (Richard Strauss) | 140 | 146 | 158 | |
36 | Anciennes_communes_de_la_Drôme | liste | 154 | 154 | 129 |
37 | Institut_de_technologie_agroalimentaire | Institut québecquois | 137 | 161 | 136 |
38 | Marek_Kamiński | Exporateur polonais né en 1962 | 132 | 136 | 96 |
39 | Les_Zetlaskars_et_la_Trompida | Groupe de musique angevin | 99 | 94 | 136 |
40 | Uri_Dan | réalisateur israélien né en 1935 | 87 | 120 | 111 |
41 | Michael_Ball | Footballeur anglais | 117 | 94 | 105 |
42 | Bertincourt | Commune française | 87 | 132 | 96 |
43 | Geert_Mak | Journaliste Hollandais | 107 | 100 | 106 |
44 | Varberg | Ville de Suède | 93 | 110 | 103 |
45 | (55565) 2002 AW197 | Objet transneptunien | 111 | 92 | 101 |
46 | Gilles_Segal | acteur de cinéma né en 1932 | 116 | 72 | 109 |
47 | JavaFX_Mobile | plateforme informatique | 74 | 101 | 84 |
48 | TelecityRedbus | chaine de datacenter | 83 | 80 | 95 |
49 | Riederalp | Commune du Valais (Suisse) | 100 | 93 | 64 |
50 | Chez_moi_(album) | Album de Serge Lama | 97 | 72 | 66 |
51 | Mehdi_Mérabet | Joueur de Rugby à XV | 71 | 83 | 74 |
52 | Ivan_Asen_Ier | Empereur bulgare 1189 | 73 | 69 | 65 |
53 | Vandoies | Commune italienne | 59 | 81 | 67 |
54 | Saint-Hilaire-du-Maine | Commune française, 664 hab | 60 | 66 | 79 |
55 | Mont_Somma | Ancien volcan | 55 | 70 | 76 |
56 | L'Annexe | Série télé 1993 | 71 | 70 | 54 |
57 | 1626_en_littérature | 64 | 71 | 50 | |
58 | Chris_Bachalo | dessinateur de comic-book | 5 | 107 | 68 |
59 | Richard_Coulas | Joueur de Rugby à XV | 64 | 52 | 62 |
60 | Springtime_(Silly_Symphony) | Walt Disney 1929 | 59 | 60 | 58 |
61 | Antoine-Augustin_Renouard | Libraire né en 1765 | 50 | 54 | 71 |
62 | Salvador_Moncada | Scientifique, mari de Marie-Esmeralda de Belgique | 64 | 61 | 48 |
63 | Spud | Artiste de musique électronique | 61 | 49 | 62 |
64 | Fangatau_(commune) | 35 | 73 | 54 | |
65 | Miriam_Louisa_Rothschild | Enthomologiste britannique | 60 | 28 | 63 |
66 | Comté_de_Baltimore | 44 | 49 | 56 | |
67 | Limnophyton | Plante | 58 | 42 | 49 |
68 | TÉLUQ | Télé-université québecquoise | 49 | 46 | 53 |
69 | Studentersamfundet_i_Trondheim | Assoc. Étudiante norvégienne | 49 | 54 | 45 |
70 | Ateas | Roi scythe | 44 | 41 | 62 |
71 | Jean_Glucq | Personnage vers 1700 | 47 | 55 | 44 |
72 | Meurcé | Commune de la Sarthe | 43 | 57 | 38 |
73 | Gerald_Edwin_Hamilton_Barrett-Hamilton | Mammalogiste britannique mort en 1914 | 46 | 46 | 41 |
74 | Bataille_de_Dinwiddie_Court_House | Bataille guerre de Sécession | 0 | 74 | 56 |
75 | Yves_d'Évreux | Explorateur né en 1577 | 28 | 51 | 50 |
76 | Isoxys | Petit arthropode | 44 | 43 | 41 |
77 | Enonkoski | Municipalité finlandaise. | 37 | 42 | 42 |
78 | Evaristo_Márquez_Contreras | Sculpteur espagnol mort en 1996 | 50 | 36 | 34 |
79 | Élie Bayol | coureur automobile né en 1912 | 42 | 44 | 32 |
80 | Joseph Victor Aubernon | homme politique né en 1782 | 48 | 36 | 34 |
81 | Zhu_Wen_(écrivain) | écrivain chinois | 38 | 46 | 32 |
82 | Rabbi Eliezer ben Hyrcanos | Sage du Talmud 1er siècle | 33 | 37 | 44 |
83 | Hervé_Hadmar | Réalisateur né en 1963 | 46 | 26 | 41 |
84 | Henri Debluë | écrivain né en 1924 | 31 | 35 | 47 |
85 | Bert_Kalmar | Scénariste américain né en 1884 | 41 | 36 | 33 |
86 | Comté_de_Benzie | Comté du Michigan | 44 | 38 | 25 |
87 | Union_d'Oujgorod | fait historico-religieux, 1646 | 31 | 31 | 45 |
88 | Robert_Dinesen | Réalisateur de cinéma danois | 37 | 37 | 30 |
89 | Vayelekh | section hebdomadaire de la Torah | 33 | 42 | 28 |
90 | Victor_Ivanovitsch_Motschulsky | Entomologiste russe XIXe siècle | 34 | 32 | 32 |
91 | Agnes_von_Zahn-Harnack | féministe allemande | 37 | 29 | 28 |
92 | Jules-César_Boulenger | historien 17e siècle | 34 | 30 | 29 |
93 | Comté_de_Jinyun | division administrative chinoise | 32 | 26 | 33 |
94 | Conus_mercator | Mollusque | 25 | 29 | 25 |
95 | Mirja_Lehtonen | Fondeuse finlandaise | 23 | 21 | 34 |
96 | Cyrtodactylus seribuatensis | Variété de gecko | 22 | 27 | 21 |
97 | Stronmaus | Dieu de Donjon et Dragon | 19 | 21 | 27 |
98 | Pseudanthias_rubrizonatus | Espèce de poissons | 17 | 19 | 29 |
99 | Colli_del_Trasimeno_Cabernet_Sauvignon | vin rouge italien | 23 | 17 | 17 |
100 | Ter'angreal | objet du jeux "La Roue du Temps" | 2 | 1 | 1 |
Moyenne | 393 | 388 | 377 |
[modifier] Calcul du nombre de visites totales mensuelles
Pour calculer le nombre de vistes mensuelles, j'ai eu recours à une page à laquelle on avait accés jusqu'au mois de novembre 2007 et qui s'appelait wikichart et qui donnait les 1000 articles les plus consultés. J'en avais sauvegardé une page du mois de novembre. A cette époque, l'outil commençait à déconner, c'est-à-dire qu'il intégrait sur octobre et novembre à la fois, ce qui n'est pas très génant. Le chiffre absolu des accés par article était complètement érroné, mais le pourcentage de ce que représentait l'article était à peu près correct.
En intégrant tous ces pourcentages, on arrivait à 17.65% pour les 1000 articles les plus lus.
Pour évaluer le nombre total d'accés mensuel, j'ai sélectionné dans le top 1000 de novembre 20007 six articles que j'estimais peu soumis aux variations saisonnières, ni Sébastien Chabal, ni Guy Môquet, mais des valeurs sûres et stables (Voir tableau ci-dessous) et je les ai évaluées sur les mois de février-mars-avril 2008, la même période que mon tirage des cents pages au hasard.
Titre de l'article | % Nov. 07 |
Moy. Fev-mar-avr 08 |
Cerveau | 0.0070% | 26632 |
Mer_Méditerranée | 0.0071% | 5269 |
Simone_de_Beauvoir | 0.0071% | 24697 |
Lyon | 0.0140% | 44143 |
Charlemagne | 0.0129% | 34677 |
Martin Luther King | 0.0099% | 65568 |
Total | 0.06% | 200987 |
Extrapolation | 100% | 346528736 |
C'est ainsi qu'on arrive à une évaluation de 350 millions d'accès mensuels sur l'ensemble de la wiki française.
[modifier] Conclusion
Reprenons quelques résultats:
- Nombre d'accés mensuels : 350 millions
- Les mille articles les plus lus représentent 17.65% des accès
- Environ 2% des articles (12 000) représentent 50% des accès.
- Le tiers des articles (200 000) représentent 90% des accès.
- 10% des articles (60 000) ont au moins 1000 visites par mois.
[modifier] Voir aussi
- Loi de Pareto (80/20)
- Loi de Zipf
- Lois scalantes