Discuter:Loi de Benford

Un article de Wikipédia, l'encyclopédie libre.

[modifier] Discussion récupérée de l'oracle

<humour gras>Ô Racles moi le fond de la gorge avec ton *** en passant par mon ***</Humour très très très gras> et pendant ce temps là dis moi si tu connais cette théorie qui dit que s'il on prend une suite de nombres ( "utiles", pas généré par un algo pseudo-aléatoire ou tirés au 421, exemple : une page de calcul, les comptes d'une entreprise ou d'un particulier...) et que l'on fait des statistiques sur les chiffres on trouvera plus de 1 que de 2, plus de 2 que de 3, plus de 3 que de 4...jusqu'à neuf. Il parraitrait que les services fiscaux se servent de ça pour trouver les comptes trafiqués ( ou faire peser une lourde présomption). Si j'en avais le courage, je ferais l'essai sur mes comptes.--Lisaël causer 6 septembre 2005 à 22:55 (CEST)

Pour une vérif. facile de la loi : vous faite un script pour récupérer la liste des tailles de tout vos fichiers sur le disque dur de votre ordinateur, (sur mon PC : plusieurs centaines de milliers donc c'est qd mm pas mal du point de vue statistique comme série de données). Vous copiez ça dans votre tableur préféré, et hop ça vous sortira la superbe courbe de la loi de bendford. Si vous êtes un geek, vous vous amuserez à étudier la distribution, de la 2ème, ... nième décimale. Enjoy!
Sur mes comptes, ça marche pas : y'a que cinq chiffres d'écrit. :D — Poulpy 6 septembre 2005 à 23:09 (CEST)
C'est la Loi de Benford. D'après l'article de la wikipédia francophone elle est utilisée aux Etats Unis. D'après l'article de la wikipédia anglophone, elle pourrait être utilisé dans divers domaines. (Il ne mentionne pas d'utilisation avérée). D'après Ted Hill, dans un article publié dans Scientific American, [...] recent applications include testing of mathematical models, design of computers, and detection of fraud in tax returns. Ce qui se traduit par des applications récentente de la Loi de Benford comprennent le test de modèles mathématique, la conception d'ordinateur et la détection de fraudes aux impôts. --Xavier Combelle 6 septembre 2005 à 23:46 (CEST)
On a des preuves tangibles que la loi de Benford est utilisée par l'IRS ? — Poulpy 7 septembre 2005 à 00:02 (CEST)

Merci, cette question me tarabustait depuis un certain temps. Pour les non anglophone, on apprend dans l'article suscité ( en un mot, je ne met pas de cochoncetés dans chacun de mes posts tout de même ) on apprend dans l'article cité précédemment, disais-je avant d'être interrompu, que cette loi s'aplique dans le désordre au nombres dans les articles du reader's digest, la liste de la masse atomique des éléments, la liste des populations des 3000 comtés américains, la taille des fleuves, les stats de la ligue de baseball, et ce sans jamais avoir été prouvée ou même expliquée!<envolée lyrique>Quand je pense que certain nient la magie, que dis-je la magie, la mystique du nombre et la poésie des mathématiques après ça!</envolée lyrique> --Lisaël causer 7 septembre 2005 à 00:04 (CEST)

Ouais. L'auteur de l'article a pris les données qui convenaient, quoi. :) — Poulpy 7 septembre 2005 à 00:09 (CEST)

C'est sûr même :) Je ne voudrais pas casser la magie (si en fait, mais je dois le faire discrètement) -> en:Benford's law. Il y a tout un chapitre "Explanation", "Applications" and "limitations". Pour reciter l'article : Strictly speaking, only a set of numbers chosen at random (from a given probability distribution) is sure to obey the law. Ce n'est qu'une loi probabiliste qui dépend de notre façon de compter, tout bêtement. (Na !) 7 septembre 2005 à 15:15 (CEST) Vlad2i поговорить / أن يتحدّث

Il y a eu une news là-dessus, dans le numéro Juillet-août 2005 de la revue La Recherche, intitulée : Robert Azencott, « La statistique à la rescousse du fisc ». Enro 8 septembre 2005 à 09:07 (CEST)


Ce paradoxe est très connu et son origine est remarquable : en consultant un livre de tables de logaritmes (à une époque, pas si éloignée, où l'on n'utilisait pas de calculettes !), un scientifique s'est aperçu que les pages étaient d'autant plus sales qu'elles étaient proches du début du livre. On aurait pu trouver une explication facile pour un roman — on commence à le lire pluis on abandonne plus ou moins rapidement —, mais pas pour des logaritmes, où, a priori, tous les nombres doivent apparaître avec la même probabilité. Le génie du chercheur a été d'en déduire une loi qui est que la probabilité d'apparition d'un chiffre est inversement proportionnelle à son rang. Cette loi est si fréquente que des joueurs de foire l'utilisent pour parier... et gagner, au grand étonnement des badauds. Airelle 8 septembre 2005 à 19:18 (CEST)

Hum sans vouloir te vexer, ce n'est (1) pas un paradoxe, (2) les tables de logarithmes sont utilisées principalement pour les chiffres petits, après on compose, ceci expliquant cela (3) l'apparition n'est pas à proprement parler proportionnelle à son rang (4) ce n'était pas d'ailleurs à proprement parler un chercheur (5) ce n'est pas à proprement parler une loi, c'est une remarque empirique qui ne se vérifie qu'en présence de conditions données (non, je ne suis pas un négationniste ! :P) 8 septembre 2005 à 22:05 (CEST) Vlad2i поговорить / أن يتحدّث
Moi pas vexé : j'ai employé le terme de paradoxe dans son acception originelle de « contraire à l'opinion commune » ; bien qu'empirique, on parle bien de la « loi de Benford » ; les entrées des tables de logarithmes sont triées du plus petit nombre vers le plus grand, du moins celles que j'ai eues entre les mains ; il me semble que Newcomb — qui a révélé ce paradoxe, popularisé par la suite par Benford — était bien chercheur, astrophysicien, je crois (en tout cas, il cherchait dans des tables de logarithmes ! ;-) ; en revanche, je n'aurais pas dû écrire « inversement proportionnel » : j'ai rédigé ça de mémoire (Allô, hisse !) et je ne savais plus si c'était hyperbolique, inversement logarithmique, curvilinéaire ou autre. Comme je n'avais pas le temps de chercher dans mes documents ni de faire une régression, je me suis dit que l'idée y serait et que les gens comprendraient plus facilement. Bien que ce ne soit pas un article, je m'en veux de mon laxisme et m'efforcerai de répondre moins vite la prochaine fois ! :o) Airelle 9 septembre 2005 à 18:48 (CEST)
"ce n'est pas à proprement parler une loi," ah non? qu'est quoi alors? "c'est une remarque empirique qui ne se vérifie qu'en présence de conditions données ", oui, donc c'est... une loi. Au même titre que les lois de la gravitation, de désintégration radioactive, allométriques (ces dernières inexpliquées jusqu'à récemment et totalement empiriques). Après je peux me tromper, hein, j'ai jamais qu'un bac+5 en sciences - tu me diras, pour ce que ça vaut de nos jours...
"(2) les tables de logarithmes sont utilisées principalement pour les chiffres petits"... désolé de te contredire, mais les tables de log ne sont en fait... plus du tout utilisées! pourquoi pas un régle à calcul pendant qu'on y est!!! (pour ceux qui savent encore ce que c'est). Et oui! c'est ça le progrès... on utilise aujourd'hui des calculateur électronique : les ordinateurs, etc :-)
"ce n'est (1) pas un paradoxe" effectivement, c'est un paradoxe (para-doxa), puisqu'on s'attendrait à ce que la répartition de la première décimale de n'importe quelle série de chiffre soit la même pour tous les chiffres ce qui n'est pas le cas, et va donc à l'encontre du sens commun.
81.243.234.8 16 octobre 2005 à 15:03 (CEST)

[modifier] Statistiques ?

Bonsoir Godix. Tu as enlevé cet article de la catégorie Statistiques. Pourtant, cette loi semble née d'une observation statistique, elle est utilisée ainsi et elle est facilement observable par une expérience de cet type (je l'ai fait !). Pourrais-tu argumenter ton choix, s'il te plait ? LyricV (d) 8 janvier 2008 à 20:47 (CET)

euh oui en fait il y a une sous catégorie loi de probabilité qui fait partie de la catégorie statistique. Je ferai peut être une sous catégorie loi de probabilité (statistiques) si c'est utile mais je ne le pense pas vu qu'en pratique on se sert d'un peu toutes les lois de proba en stats. En pratique c'est pour essayer de clarifier un peu la catégorie statistique qui n'est pas vraiment exploitable en l'état car elle contient bien trop d'articles donc j'essaye de faire un classement par sous catégories qui seraient un peu moins grosses. godix (d) 8 janvier 2008 à 20:54 (CET)
D'accord. Bon courage. LyricV (d) 8 janvier 2008 à 20:59 (CET)