Discussion Utilisateur:Salebot/Journal/Modifications suspectes

Un article de Wikipédia, l'encyclopédie libre.

Sommaire

[modifier] Coordination

Va falloir trouver un moyen pour organiser et coordonner cette page, sinon, ca va vitre etre le bordel. Maloq causer 30 avril 2008 à 17:38 (CEST)

Peut-être commencer par ne plus signer mais simplement rayer ce qui a été vérifié ? Wanderer999 ° me parler ° 30 avril 2008 à 17:45 (CEST)
Un sectionnement par jour serait aussi pas mal pour éviter les pages de modifications trop lourdes et avoir accès à un sommaire. Kropotkine_113 30 avril 2008 à 17:51 (CEST)

Suggestions en vrac:

  • une section par heure me semble plus judicieux pour eviter les conflits
  • faire un modèle {{truc}} pour raccourcir le wikicode

en gros, salebot met {{truc|numero_du_diff|titre|non}}
ce qui donne en rednu

12h34 : Utilisateur:Salebot/Test

Le checker met {{truc|numero_du_diff|titre|rv ~~~~}}
Ce qui rend:

12h34 : Utilisateur:Salebot/Test rv Maloq causer 30 avril 2008 à 18:11 (CEST)

Maloq causer 30 avril 2008 à 18:11 (CEST)

Bon le modèle est mis en place mais il y a deux problèmes dans l'appel du modèle par Salebot :

  1. le modèle est appelé avec 3 paramètres or quatre sont obligatoires et un facultatif. Il suffit de retoucher le modèle pour en supprimer un,
  2. il faudrait d'après user:phe faire un appel explicite du paramètre {{{3}}} pour l'url sinon ça ne marche pas. Exemple :
    {{modification suspecte|1 mai 2008 à 12:36 (CEST)|annonce de mort|3=[http://fr.wikipedia.org/w/index.php?title=Uchronie&diff=29160093&oldid=29025583&rcid=29276311 Uchronie]|}}.
    Ça il faut voir avec Gribeco pour le code du bot.

Kropotkine_113 1 mai 2008 à 12:49 (CEST)

Je corrigerai ça ce soir ; en attendant il faut corriger les entrées du bot à la main, désolé :p --Gribeco (d) 1 mai 2008 à 17:04 (CEST)

[modifier] Faux positifs : fiction

Il y a beaucoup de faux positifs de fiction. Serait-il possible d'exclure les catégories "Roman", "Film", "fiction"... Merci. --MGuf 2 mai 2008 à 18:56 (CEST)

Ainsi peut-être que les pages où il y a « mort » dans le titre, comme « Mer morte » et tout et tout... rv1729 4 mai 2008 à 09:00 (CEST)

[modifier] Semi-protection ?

Ne serait-il pas judicieux de semi-protéger cette page ? p-e 4 mai 2008 à 07:52 (CEST)

Fait Revertez si désaccord. Wanderer999 ° me parler ° 4 mai 2008 à 07:57 (CEST)
Salebot n'est pas admin. Si ? Il fait comment pour éditer la page ? Mort de rire Ludo Bureau des réclamations 4 mai 2008 à 10:46 (CEST)
Oups j'ai rien dit, c'est juste semi-protégé. Désolé. Ludo Bureau des réclamations 4 mai 2008 à 10:49 (CEST)
Mmmh, les semi-protections préventives c'est une bonne idée maintenant ? (:Julien:) 4 mai 2008 à 11:20 (CEST)
Sur une page destinée à surveiller des vandalismes (pas une page de l'encyclopédie au sens article), ça me parait logique non ? La protection préventive (complète) existe pour de nombreux modèles. p-e 4 mai 2008 à 11:30 (CEST)
Pour la logique je sais pas, jamais eu de vandalisme sur cette page donc j'ai du mal à me faire une idée. De plus rien n'interdit aux IPs de faire de la lutte contre le vandalisme. Les modèles c'est différents, ils sont appelés souvent donc un vandalisme peut avoir de fortes répercussions, ici c'est juste une page. (:Julien:) 4 mai 2008 à 12:38 (CEST)
En fait, n'importe qui peut rayer une ligne et à moins de scruter l'historique, c'est un peu facile de faire une modif, de voir le signalement de Salebot dans les RC et de rayer la ligne : c'est le souci que j'avais en faisant cette proposition, mais je ne m'y accrocherai pas outre mesure p-e 4 mai 2008 à 12:43 (CEST)
Idem, et j'ai rarement vu d'IP lutter activement contre le vandalisme. Sourire Wanderer999 ° me parler ° 5 mai 2008 à 03:03 (CEST)
Ce qui est sûr c'est qu'en semi protégeant tu n'en verras jamais. Kropotkine_113 6 mai 2008 à 10:18 (CEST)

Déprotégé, alea jacta est p-e 6 mai 2008 à 10:36 (CEST)

[modifier] Faux positifs

Le contrôle se fait actuellement sur les mots "mort" et "deces", ne pourrait-on pas filtrer davantage en ajoutant +" le" ?
En effet, lorsqu'un vandale met en ligne une fausse annonce de décès, le comportement classique est de mettre une date :

  • "Bidule, mort le 5 mai 2008" ou "Bidule décédé le 5 mai 2008"
  • Variantes : "Bidule mort/décédé à Paris le 5 mai 2008"

A la limite, le contrôle pourrait se faire si le mot "mort" ou "deces" est suivi de "le", "en" ou "à".

Qu'en pensez-vous ? Chanoz (d) 5 mai 2008 à 17:16 (CEST)

Je ne vois pas l'intérêt a priori de restreindre le champ de recherche et que faire des phrases comme "mort hier", "mort des suites d'une longue maladie" etc ? Kropotkine_113 6 mai 2008 à 10:20 (CEST)
En fait l'intérêt premier est de trouver des moyens de limiter le nombre de faux positifs. Ils représentent plus de 80 % des entrées ! Et quand il y a trop de faux positifs dans une liste de suivi, plus personne au final n'aura le courage de faire ce suivi.
Si on réfléchit à la syntaxe qu'utilisera un internaute pour annoncer une fausse mort, je pense que dans la quasi-totalité des cas, il utilise les termes ["mort(e)"/"meurt"/"decede(e)"] suivi, dans la même phrase (donc avant le premier "." suivant), d'un précision sur la date, qui commence nécessairement par "le" ou "en".
Je ne sais pas comment traduire cela en langage (Perl ?) pour Salebot, mais je pense que prendre en compte une syntaxe plus précise de ce type réduirait grandement le nombre de faux positifs, et ne passera pas à côté de grand chose (sachant que si un utilisateur veut contourner l'action du bot, il trouvera toujours moyen de le faire).Chanoz (d) 6 mai 2008 à 11:00 (CEST)
Est-ce que quelqu'un ne juge pas bonne cette modification de script pour Salebot ?, ou avez-vous d'autres idées pour réduire le nombre de faux positifs ? Il faut aussi voir ce qui est techniquement possible de faire sur une recherche de syntaxe précise. Chanoz (d) 7 mai 2008 à 10:15 (CEST)
Non, je ne crois pas opportun de restreindre en fonction de la syntaxe, ne serait qu'en raison des fautes d'orthographe ou de coquille possible. Et je ne crois pas qu'on puisse lister toutes les possibilités d'imagination des vandales. En revanche, restreindre le champs en fonction des catégories : [[Catégorie:Décès en xxxx]], avec éventuellement ne pas exclure les "décès depuis 1980" ; exclure également, par le moyen des catégories, les fictions (film, romans, jeu vidéo, BD...). --MGuf 9 mai 2008 à 09:45 (CEST)
Euh, oui, mais tu crois que les vandales prenent le temps de rajouter la Catégorie:Décès en 2008, pour mieux se faire repérer ? — Delhovlyn — (CinéNiavlys) « ... » contribs?, le 9 mai 2008 à 17:26 (CEST)
Arf ! Non, ils n'iront sûrement pas faire ça. A MGuf : bonne idée d'exclure les articles de certaines catégories. Par contre, quand tu évoques les fautes d'orthographe et les coquilles possibles, elles passent déjà à travers si tu regardes le script de Salebot : il suffit que le vandale écrive "descédé le" pour que Salebot ne le repère pas. Tu ne trouves pas que la grande quantité de faux positifs rend plus laborieuses les vérifications ? Chanoz (d) 10 mai 2008 à 03:40 (CEST)
  • Explications : Si Salebot repère une modif de mort sur... mettons Marie Curie, on sait bien qu'elle est morte, pas de problème, la vérification est vite faite, c'est probablement une petite intervention d'une IP sur l'article. Mais s'il s'agit de Eugénie Buffet, beaucoup moins de chance qu'on sache qui c'est : il faut vérifier. Or, ces deux personnes sont dans la Catégorie:Décès en 1934. À mon avis, on peut exclure de la liste de Salebot tous les articles dans les catégories Catégorie:Décès en -842 à Catégorie:Décès en 1979. En laissant dans la liste les catégories Catégorie:Décès en 1880 à Catégorie:Décès en 2008.
  • Par contre, à propos de : "A la limite, le contrôle pourrait se faire si le mot "mort" ou "deces" est suivi de "le", "en" ou "à" : non. Déjà qu'on passe à coté de celui qui écrit "descede", il ne faut pas louper celui qui va écrire "mort dan son bin", "mort quand il a eu un accident".... --MGuf 10 mai 2008 à 10:21 (CEST)
Ok sur le contrôle sur la catégorie. Mais va-t-on de cette façon exclure beaucoup d'articles du contrôle de Salebot ? Comme Eugénie Buffet est morte en 34 et a déjà la catégorie "décès en 34", il y a peu de chance qu'un utilisateur rajoute une nouvelle fois le mot "mort" dans l'article. Ou alors dans un contexte qui n'a rien à voir avec le décès de la personne.
Il faut réfléchir plus en avant à l'exclusion de catégories : en effet, une annonce de mort n'est réellement problématique que si elle intervient sur un article directement relatif à une personne. Si sur l'article "Histoire le la Chine", un vandale rajoute "Pascal Sevran est mort", je ne crois pas qu'il y aura des conséquences sur des proches de PS car ils iraient alors vérifier sur l'article de PS lui-même. Pour moi l'idée serait de faire une liste des catégories où l'on peut être sûr qu'elle n'auront aucune raison d'être mises sur un article concernant une personne. mais le critère est délicat et je pense que ca ne diminuera pas beaucoup le nombre de faux positifs.
Pour le deuxième point, je vois bien la difficulté. Mon raisonnement était le suivant : si un vandale met qu'une personne est morte mais ne met pas de date, un lecteur verra qu'il y a quelquechose qui cloche. Je prends un exemple. Un utilisateur écrit : "Nicolas Sarkozy (...), mort hier." ou "mort dans son bain". Le lecteur qui passe derrière, lisant cela, trouvera bizarre que si on annonce que la personne est morte, on ne donne même pas la date du décès ! Ce que je veux dire c'est que la formulation ne fait pas sérieuse quand elle ne comprend pas une date. Or, le danger avec les vandales qui annoncent une fausse mort, c'est qu'ils rédigent cela d'une façon usuelle, avec une date, de telle façon que les lecteurs qui ouvrent ensuite la page y croient, et s'émeuvent de cette disparition s'il s'agit de proches. Ce n'est pas celui qui met "George Bush a été tué par un terroriste irakien" qui m'inquiète, c'est celui qui écrirait : "Jeanne Moreau, décédée le 9 mai 2008".
Si on tient absolument à ce que Salebot détecte y compris les annonces de mort sans aucune date, alors je pense qu'il est nettement plus important qu'il détecte aussi et surtout les annonces de décès avec date mais avec faute d'orthographe, car celles-là je les trouve bien plus dangereuses pour les lecteurs. Il faudrait dans ce cas allonger la liste des chaînes de caractères détectées. Chanoz (d) 10 mai 2008 à 11:32 (CEST)

[modifier] test en "live"

Bonjour,

je voulais voir l'action du bot, et je suis surpris que cette modif [1] n'apparaisse pas sur la page de suivi (bien qu'il s'agisse d'une vraie annonce de décès). Est-ce parce que la modif vient d'un utilisateur enregistré ? Chanoz (d) 5 mai 2008 à 17:38 (CEST)

Oui. Pour l'instant, le bot ne regarde que les modifs d'IP. Je compte étendre la détection aux comptes récents, mais il faut que je crée une base de données pour ça. --Gribeco (d) 5 mai 2008 à 22:03 (CEST)
Le plus simple ne serait-il pas d'étendre le contrôle à tous les comptes ? Après tout, il est facile pour quelqu'un qui a créé un compte de l'utiliser même une semaine ou un mois plus tard pour faire de fausses annonces. Pas de retours pour ma proposition au dessus visant à limiter les faux positifs ? Chanoz (d) 6 mai 2008 à 10:15 (CEST)
On peut s'en sortir avec une définition large de "nouvel utilisateur". Il y a 30 000 modifications par jour environ, ça fait beaucoup de texte à lire pour un bot... ---Gribeco (d) 9 mai 2008 à 01:06 (CEST)

[modifier] Validation du diff

On pourrait pas trouver un moyen simple, type case à cocher, pour valider un diff ? C'est assez laborieux de chercher la ligne à valider lorsqu'il y en a beaucoup et que la validation est faite en discontinue (quelques lignes sont barrées, pas d'autres...). Peut-être faudrait-il un robot pour effacer les lignes validées ? Dans l'état actuel du fonctionnement je me vois mal confirmer plus de 5 modifications suspectes. --Yelkrokoyade (d) 8 mai 2008 à 20:58 (CEST)

Ah, tiens, avec une extension javascript dans un monobook, c'est peut-être possible... --Gribeco (d) 9 mai 2008 à 01:07 (CEST)
Question de béotien complet en matière de bot : cocher marquer comme n'étant pas un vandalisme la version suspecte ne pourrait pas permettre à un bot de rayer la ligne tout seul ? On peut en rêver, non ? ;-) p-e 9 mai 2008 à 09:13 (CEST)
Si, mais c'est une fonction réservée aux admins, je crois. --Gribeco (d) 9 mai 2008 à 16:14 (CEST)
Oui, je ne savais plus si c'était admins ou enregistrés, mais dans ce cas pourquoi ne pas le permettre qd même sans exclure l'autre manière de procéder, vu que ça n'est qu'une simple extension de ce pouvoir exorbitant ;-) qu'ont déjà les admins, et que ça n'a pour seule conséquence que de faire gagner un peu de temps à ces derniers ? p-e 10 mai 2008 à 08:20 (CEST)

[modifier] Faille ?

Cette modification n'a pas été vue par ce « sale bot » mais a été relevée par un lecteur qui l'a signalée sur OTRS... ©éréales Kille® | Speak to me* | en ce 9 mai 2008 à 00:19 (CEST)

Zut, un bug dans le parser des deltas. Erreur corrigée, merci. --Gribeco (d) 9 mai 2008 à 01:51 (CEST)
De rien ;) ton bot est bien pratique ! ©éréales Kille® | Speak to me* | en ce 9 mai 2008 à 11:33 (CEST)


Attention certains utilisateurs (visiblement récemment enregistrés) continuent à jouer avec l'annonce du décès de Pascal Sevran : [2].Chanoz (d) 10 mai 2008 à 03:56 (CEST)

[modifier] Quelques faux négatifs en moins

Serait-il possible que le bot ne note pas les articles qui, contenant les chaînes de caractères litigieuses, contiennent cependant également les chaînes suivantes ?

  • "[[Catégorie:Roman "
  • "[[Catégorie:Film "
  • "[[Catégorie:Commune "
  • "[[Catégorie:Feuilleton "
  • "[[Catégorie:Personnage "
  • "[[Catégorie:Pièce "
  • "[[Catégorie:Tableau "
  • "[[Catégorie:Liste "
  • "[[Catégorie:Décès en 1"

Histoire d'alléger un peu le nombre de faux négatifs..
Chanoz (d) 12 mai 2008 à 10:42 (CEST)

J'ai corrigé la liste. "Catégorie:Décès en 1(...)" inclue tous les décès avant 2000, donc très peu susceptible d'être une fausse annonce. --Markov (discut.) 12 mai 2008 à 10:56 (CEST)
Fonction ajoutée au bot. Ce sont des faux positifs : des modifs rapportées comme positives par le bot, mais qui ne sont pas des vandalismes. --Gribeco (d) 8 juin 2008 à 01:10 (CEST)

[modifier] validation

J'ai modifié le modèle. Il suffit d'indiquer votre commentaire en paramètre 5 et le texte sera rayé --Hercule Discuter 15 mai 2008 à 12:30 (CEST)

Ah merci, c'était fastidieux de rajouter les <s> ... Un exemple de l'utilisation du modèle : [3] (|5="commentaire" et hop la ligne est barrée)--Grook Da Oger 20 mai 2008 à 14:18 (CEST)

[modifier] Balance énergie/utilité

Vu la vitesse ou Salebot ajoute des lignes, j'ai peur qu'il n'épuise l'énergie des contributeurs. Je n'ai pas tenté de faire des statistiques concernant le nombre de vandalisme ou erreur que ce nouveau programme a permis de détecter. Avez vous l'impression que l'idée est viable ? --Grook Da Oger 15 mai 2008 à 17:55 (CEST)

Une fois les faux positifs réduits il sera viable. C'est sur actuellement il remonte trop de faux. --Hercule Discuter 15 mai 2008 à 18:51 (CEST)
Ça serait chouette, mais je ne sais pas si c'est faisable, que les contributions revertées soit automatiquement rayées de la liste ... il arrive très souvent, quand on arrive en retard, que la modif soit déjà revertée par qlq qui suivait la page ou les RC, du coup un click pour rien --Grook Da Oger 20 mai 2008 à 14:20 (CEST)

[modifier] Faciliter le travail de suivi

En fait, faire un paragraphe par diff repéré par Salebot se révèle être une fausse bonne idée. Ca rend la page interminable et le suivi encore moins lisible.Chanoz (d) 28 mai 2008 à 13:34 (CEST)

Pour moi, l'intérêt est d'éliminer rapidement les faux positifs : il suffit de cliquer sur l'onglet modifier de la section et de la blanchir. --Gribeco (d) 28 mai 2008 à 18:44 (CEST)
La page est vraiment interminable avec toutes ces sections ! Pour éliminer rapidement les faux positifs, il suffit désormais de changer le numéro dans le modèle, c'est désormais assez rapide. Autrement, avec une telle longueur, ca risque de décourager tout ceux qui voudraient assurer le suivi de la page. Ne peux-tu pas revenir à l'ancien format ?
D'autre part, les exclusions de chaînes proposées plus haut (en fontion des catégories) sont-elles implémentables ? Ca diminuerait un peu les faux positifs... Chanoz (d) 30 mai 2008 à 16:30 (CEST)
Bon, je reviens au format court. Pour les chaînes, il faut que je bidouille le moteur de détection, le bot ne regarde que les diffs pour l'instant (les catégories sont normalement dans la partie inchangée de l'article, il ne les voit pas). --Gribeco (d) 31 mai 2008 à 03:56 (CEST)
Ok. Par contre, c'était bien le diff directement affiché dans une boîte quand il est court, ca permet de cliquer moins souvent sur le lien. En plus, même lorsque le diff n'est pas affiché, le <pre></pre> permet un retour à la ligne qui facilite la lecture dans la boîte de modification.Chanoz (d) 1 juin 2008 à 02:31 (CEST)

Il serait bon de réaliser une petite aide pour l'utilisation du modèle, à afficher en haut de la page par exemple. --Hercule Discuter 1 juin 2008 à 02:42 (CEST)

Je propose que les lignes soient directement supprimées une fois que le diff a été vérifié. Ca permet de clarifier la page. Chanoz (d) 1 juin 2008 à 02:44 (CEST)