Filtrage d'Internet

Un article de Wikipédia, l'encyclopédie libre.

Le filtrage d'internet est un ensemble de techniques visant à limiter l'accès à certains sites normalement accessibles sur le réseau Internet. Voir Internet et la censure pour la légitimité de ces techniques.

Sommaire

[modifier] Objectifs

Cette limitation d'accès peut avoir différents buts :

  • contrôle parental, pour protéger les enfants contre des contenus inappropriés ;
  • bornes de démonstration en accès public ;
  • restrictions d'un accès d'entreprise à un usage professionnel ;
  • filtrage gouvernemental.

Selon l'objectif visé le filtrage peut se faire sur le poste client (par exemple avec un logiciel appelé censorware) ou en amont, par exemple chez le FAI, ou également sur un routeur dans le cas d'un réseau local (le routeur est alors en général une passerelle du réseau local).

[modifier] Aspects techniques

[modifier] Filtrage IP et DNS

Les technologies employées peuvent être le blocage IP par routeur et la redirection DNS. Le filtrage peut être fait sur des adresses de machines, sur des noms de domaine, ou bien sur des numéros de port correspondant à des protocoles connus pour la communication distribuée entre applications. Le filtrage peut être réalisé avec des pare-feu ou des proxys.

[modifier] Filtrage par mots-clefs

Le mécanisme de filtrage empêche l'accès aux pages dont l'adresse et/ou le texte contiennent certains mots : les « liste noire » comprennent par exemple des mots relatifs à la sexualité, au jeu en ligne ou au racisme. La méthode comporte le risque d'un taux élevé de faux positifs (par exemple, si une entreprise veut interdire les sites pornographiques à ses employés et que, pour cela, elle interdit l'accès aux pages contenant des mots relatifs à la sexualité, elle risque aussi de bloquer l'accès à des informations médicales).

[modifier] Blocage de certains sites

Des sites identifiés par nom de domaine ou numéro IP peuvent être mis sur « liste noire ». La liste des sites interdits peut aussi contenir des sites qui n'ont pas de contenu indésirable mais qui permettent de contourner le filtrage en servant d'intermédiaires lors de la connexion aux sites bloqués : il s'agit par exemple des anonymiseurs (spécialement conçus dans ce but), mais aussi des sites de traduction en ligne, par exemple (qui, si on leur fournit l'URL d'une page à traduire, se comportent comme des anonymiseurs). Le cache des moteurs de recherche joue le même rôle, mais son accès est moins souvent bloqué.

[modifier] Le projet PRINCIP

La Plateforme pour la recherche, l'identification et la neutralisation des contenus illégaux et préjudiciables sur l'Internet, à laquelle participent plusieurs laboratoires européens, cherche principalement à détecter automatiquement les textes racistes, en s'appuyant sur des règles plus complexes que la simple recherche de mots-clefs :

  • l'identification de morphèmes comme peupl- qui apparaissent principalement dans les textes racistes ;
  • l'étude de l'environnement des mots qui, comme « immigration », apparaissent aussi bien dans les textes racistes que dans les textes antiracistes ;
  • des critères purement techniques comme la police de caractères utilisée ou la présence d'une image de fond (ce qui évoque les méthodes de détection de spam).

[modifier] Voir aussi

[modifier] Liens externes

[modifier] Quelques logiciels de filtrage internet