Aspirateur de site web

Un article de Wikipédia, l'encyclopédie libre.

Pour l’article homonyme?, voir Aspirateur

Un aspirateur de site web est un type de logiciel qui télécharge toutes les données contenues par un site web pour les sauvegarder sur un support de mémoire local de l'utilisateur (typiquement, son disque dur), ce qui permet de consulter les pages correspondantes sans être connecté à Internet.

Sommaire

[modifier] Description

Le principe de ce type de logiciel repose sur l'analyse des pages web du site à récupérer : un index des éléments composant chacune d'elles est établi (texte HTML de la page, images, sons, vidéos, animations, etc.) et la profondeur d'analyse peut être paramétrée pour télécharger plus ou moins de fichiers, selon qu'ils se trouvent ou non sur le même site par exemple.

Une fois ces fichiers enregistrés sur le disque dur, l'ouverture d'un fichier HTML dans un navigateur s'accompagne du chargement des éléments associés.

Cette pratique peut être utilisée pour effectuer une copie de sauvegarde d'un site (ou créer un site miroir), pour importer des éléments à publier par ailleurs ou encore pour archiver des pages qui, enregistrées sur une unité de sauvegarde (disque externe, clé USB, etc.), pourront ensuite être consultées sur un ordinateur dépourvu de connexion à Internet.

[modifier] Aspects juridiques

Ces logiciels sont inégalement appréciés des concepteurs de sites web et des webmasters dans la mesure où ils faussent les statistiques de visite et peuvent contribuer à violer les droits d'auteurs et les droits liés à la propriété intellectuelle. Ils peuvent aussi consommer abusivement les ressources du serveur web.

Il faut d'abord qualifier ce qui peut être du droit d'auteur. Ainsi, en France, les plaquettes à caractère commercial ne revêtent pas de qualification susceptible d'être prohibée par le Code de la propriété intellectuelle, puisque leur nature même est d'être largement répandue.[réf. nécessaire]

La loi Godfrain du 5 janvier 1988 ne couvre que les systèmes d'informations faisant l'objet d'une protection technique. Ainsi, l'aspiration de l’arborescence d'un site ne sera pas considérée comme une attaque informatique en droit français au sens de l’article 323-1 du Nouveau Code Pénal si aucune mesure technique d'interdiction d'accès n'a été mis en place (exemple : fichier robots.txt) sauf si cette exploration entrave le fonctionnement « normal » dudit système[1]. Alors, il serait condamnable au sens de l'article 462-3 de cette même loi[2].

[modifier] Notes et références de l'article

  1. Loi n° 88-19 du 5 Janvier 1988 (Loi Godfrain)
  2. Aspiration de site web, Avocat Online

[modifier] Voir aussi

[modifier] Logiciels

[modifier] Articles annexes